电子文档处理系统.doc
约45页DOC格式手机打开展开
电子文档处理系统,页数:45 字数:16612摘要: 作为信息的最重要载体,电子文档处理的研究引起人们极大的兴趣。在任何文档处理系统中,预处理极为重要,其效果好坏会严重地影响其它模块的工作。特别是灰度图像二值化效果的好坏,对识别效果以及其后的一切处理都有相当大的影响。原因之一是,任何物理传感输入都是灰度图像,文档处理系统的大多数模块却仅...
内容介绍
此文档由会员 20023286 发布
页数:45 字数:16612
摘要:
作为信息的最重要载体,电子文档处理的研究引起人们极大的兴趣。在任何文档处理系统中,预处理极为重要,其效果好坏会严重地影响其它模块的工作。特别是灰度图像二值化效果的好坏,对识别效果以及其后的一切处理都有相当大的影响。原因之一是,任何物理传感输入都是灰度图像,文档处理系统的大多数模块却仅仅处理二值图像,图像二值化是必不可少的。此外,图像二值化本身也是数字图像处理中重要的基本问题。
本文首先介绍完整的文档处理系统以及其预处理模块,然后将重点放在二值化问题上,给出图像阈值化方法的综述,并对全局阈值化、局部动态阈值化等方法的优点和缺点给出评价。本文尤其针对灰度变化比较复杂的文档图像,提出了一种改进的动态阈值化算法,并以仿真实验与以往的全局方法进行了比较,证实所发展新方法的优势。本文对该新算法在具体应用中会遇到的问题也做了估计,并提出解决相应问题的基本原则。
目录
摘要: 2
第一章 文档图像预处理概述 4
1.1 文档图像处理系统介绍 4
1.2 文档图像预处理 5
1.2.1 彩色图像转换为灰度图像,以及灰度图像的二值化 5
1.2.2 图像方向的自动检测与倾斜校正 6
1.2.3 版面结构理解 7
参考文献 9
第二章 传统的图像阈值化方法介绍 10
2.1 图像分割与图像阈值化概述 10
2.2 全局阈值选取方法 11
2.2.1 直方图与直方图变换方法 11
2.2.2 最大类间方差法(ostu方法) 13
2.2.3 最小误差法 14
2.2.4 概率松弛法(Relaxation) 15
2.2.5 最大熵方法 16
2.2.5.1 Shannon关于熵的定义 17
2.2.5.2 Pun的最大熵方法 17
2.2.5.3 Kapur,Sahoo和Wong的方法 19
2.2.5.4 Abutaleb的二维熵算法 19
2.2.5.5 Pal和Bhandari的条件熵方法 21
2.3 局部阈值方法与动态阈值选取 24
2.3.1 Chow和Kaneko的方法 26
2.3.2 Yanowitz和Bruckstein的方法 26
2.3.3 Sauvola和Pietikäinen的方法 27
参考文献 29
第三章 改进的算法:直接局域二值化方法 30
3.1 问题的提出 30
3.2 对问题的分析及解决方案的提出 32
3.3 直接局域二值化方法 32
3.3.1 将图像划分成为子区域 33
3.3.2 使用改进的条件熵方法进行阈值化 35
3.4 算法效果比较 41
参考文献 44
第四章 总结与展望 45
关键词:预处理,灰度图像,二值化,阈值
参考文献
[1] Pal,N.R.,Bhandari,D., “Image thresholding”. Signal Processing , 1993,33(2),pp.139-158
[2] C. K. Chow and T. Kaneko, "Automatic detection of the left ventricle from cineangiograms", Computers and Biomedical Research, , 1972,vol. 5, pp. 388—410
[3] J.Sauvola,M.Pietikäinen, “Adaptive document image binarization”, Pattern Recognition ,2000(33), pp. 225-236
摘要:
作为信息的最重要载体,电子文档处理的研究引起人们极大的兴趣。在任何文档处理系统中,预处理极为重要,其效果好坏会严重地影响其它模块的工作。特别是灰度图像二值化效果的好坏,对识别效果以及其后的一切处理都有相当大的影响。原因之一是,任何物理传感输入都是灰度图像,文档处理系统的大多数模块却仅仅处理二值图像,图像二值化是必不可少的。此外,图像二值化本身也是数字图像处理中重要的基本问题。
本文首先介绍完整的文档处理系统以及其预处理模块,然后将重点放在二值化问题上,给出图像阈值化方法的综述,并对全局阈值化、局部动态阈值化等方法的优点和缺点给出评价。本文尤其针对灰度变化比较复杂的文档图像,提出了一种改进的动态阈值化算法,并以仿真实验与以往的全局方法进行了比较,证实所发展新方法的优势。本文对该新算法在具体应用中会遇到的问题也做了估计,并提出解决相应问题的基本原则。
目录
摘要: 2
第一章 文档图像预处理概述 4
1.1 文档图像处理系统介绍 4
1.2 文档图像预处理 5
1.2.1 彩色图像转换为灰度图像,以及灰度图像的二值化 5
1.2.2 图像方向的自动检测与倾斜校正 6
1.2.3 版面结构理解 7
参考文献 9
第二章 传统的图像阈值化方法介绍 10
2.1 图像分割与图像阈值化概述 10
2.2 全局阈值选取方法 11
2.2.1 直方图与直方图变换方法 11
2.2.2 最大类间方差法(ostu方法) 13
2.2.3 最小误差法 14
2.2.4 概率松弛法(Relaxation) 15
2.2.5 最大熵方法 16
2.2.5.1 Shannon关于熵的定义 17
2.2.5.2 Pun的最大熵方法 17
2.2.5.3 Kapur,Sahoo和Wong的方法 19
2.2.5.4 Abutaleb的二维熵算法 19
2.2.5.5 Pal和Bhandari的条件熵方法 21
2.3 局部阈值方法与动态阈值选取 24
2.3.1 Chow和Kaneko的方法 26
2.3.2 Yanowitz和Bruckstein的方法 26
2.3.3 Sauvola和Pietikäinen的方法 27
参考文献 29
第三章 改进的算法:直接局域二值化方法 30
3.1 问题的提出 30
3.2 对问题的分析及解决方案的提出 32
3.3 直接局域二值化方法 32
3.3.1 将图像划分成为子区域 33
3.3.2 使用改进的条件熵方法进行阈值化 35
3.4 算法效果比较 41
参考文献 44
第四章 总结与展望 45
关键词:预处理,灰度图像,二值化,阈值
参考文献
[1] Pal,N.R.,Bhandari,D., “Image thresholding”. Signal Processing , 1993,33(2),pp.139-158
[2] C. K. Chow and T. Kaneko, "Automatic detection of the left ventricle from cineangiograms", Computers and Biomedical Research, , 1972,vol. 5, pp. 388—410
[3] J.Sauvola,M.Pietikäinen, “Adaptive document image binarization”, Pattern Recognition ,2000(33), pp. 225-236