您好,欢迎来到年旅网。
搜索
您的当前位置:首页一种表格文档图像中字符提取方法[发明专利]

一种表格文档图像中字符提取方法[发明专利]

来源:年旅网
专利内容由知识产权出版社提供

专利名称:一种表格文档图像中字符提取方法专利类型:发明专利

发明人:王俊峰,高琳,姬郁林,李虹申请号:CN201310148624.3申请日:20130426公开号:CN103258198A公开日:20130821

摘要:本发明涉及图像处理、计算机视觉技术领域,具体涉及一种表格文档图像中字符提取方法,包括以下步骤:通过边缘检测与Hough变换算法提取出图像中的线段;根据线段的方向分布估计整幅图像的倾斜角度,对图像进行倾斜校正;对水平和垂直方向上的线段进行连接,定位出表格的单元格;针对每个单元格,采用最大类间方差方法进行图像二值化,分割出单元格中的整行字符,通过滑动窗口法提取出单元格中的每个字符;根据单元格框线的统计特征,对字符的笔画缺失进行恢复。本发明具有较好的灵活性,能够有效处理字符间粘连以及字符与表格线重叠的情况,大大减少粘连和重叠问题对OCR字符识别的影响。

申请人:四川大学

地址:610065 四川省成都市武侯区一环路南一段24号

国籍:CN

代理机构:成都信博专利代理有限责任公司

代理人:舒启龙

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务