摘 要
对于图像处理来说,在实时系统里对一个既有图像又有文字的文档进行数据压缩时, 人们都希望能够用最适合的压缩算法, 使得压缩后的文件最小, 而解压缩后能够尽可能还原到原型。但实际上, 文档里的图像和文字具有不同的特征, 使得一种压缩算法很难对两者都具有最好的效果。这时候就产生了把图文进行分离的要求。图文分离后, 将分离出来的文字图像用文字识别软件进行识别, 标志文字坐标, 再以字符流的方式传输。而图像用合适的压缩算法加以压缩, 最后在终端将文字叠加在解压缩后的图像上。这样既大大减少了传输的数据量, 也保证了较高的质量。
本文采用了两种算法针对不同的文档图进行处理,对于以表格为主的文档图,本文采用了数学形态学中的膨胀和腐蚀算法,首先采用合适的结构元素,对原图进行适当的膨胀和腐蚀,最后进行条件膨胀,准确地分离出了文档中的文字和表格图像。对于以图片为主的文档图,本文对原图进行X轴和Y轴的投影,又分别对投影图做了求导运算,最终准确地分离出了文档中的图片和文字。
关键字:图像处理;数学形态学;膨胀;腐蚀;投影;图文分离论文的研究内容
本论文首先从数学形态学理论入题,研究了数学形态学的基本运算和相关性质,然后讨论了数学形态学在图文分析领域中的实际应用。本文研究的图文分析就是先对所要研究的图文进行二值化处理,对处理后的研究图文进行数学形态学的处理,最终实现图文的完整的分离。
本文的主要研究工作:
第一章主要介绍了图文分离的研究背景和意义,介绍了数学形态学的发展史,对数学形态学在图文分离中的作用得到了认识。
第二章主要介绍了介绍了数学形态学,包括二值化、膨胀、腐蚀等运算,介绍了本文所研究的算法,并进行了实现。
第三章用MATLAB进行了仿真,并对仿真结果进行了分析。