中文文本自动查错.doc

约11页DOC格式手机打开展开

中文文本自动查错,5000余字基于互信息的摘要本文介绍有关互信息的概念和理论,讨论了从语料库提取汉字互信息的方法,并且构造了基于汉字互信息的算法,将算法编写程序调试通过,给出了部分查错实例。关键词二元接续关系互信息abstract this dissertation int...
编号:10-30834大小:593.50K
分类: 论文>计算机论文

内容介绍

此文档由会员 Facebook 发布

中文文本自动查错 5000余字

基于互信息的中文文本自动查错

摘要 本文介绍有关互信息的概念和理论,讨论了从语料库提取汉字互信息的方法,并且构造了基于汉字互信息的中文文本自动查错算法,将算法编写程序调试通过,给出了部分查错实例。
关键词 中文文本自动查错 二元接续关系 互信息

Abstract This dissertation introduced some concepts and theories about Mutual Information. Then discussed the method of how to pick up Mutual Information form sentences-base. At last, construct the Auto-Error-Check Algorithm of Chinese Text based on Mutual Information and compile th


目 录
1. 概述 3
1.1 问题提出 3
1.2 研究状况及方法 3
1.2.1 基于规则的查错方法 3
1.2.2 基于统计的查错方法 3
1.2.3 待校对文本常见错误分析 3
1.3 本文研究思路 4
2. 基于互信息的自动查错方法 4
2.1 互信息知识库的构造 4
2.1 数据结构设计 4
2.2 互信息计算算法设计 5
2.2 使用互信息数据进行文本查错 7
2.2.1 基于互信息的文本查错算法描述 7
2.2.2 基于互信息的文本查错算法流程图 8
2.2.3 程序设计实现和实验结果 8
3.实验实例 9
4. 结论 10
5. 致谢 11
6. 参考文献 11
7. 附录 11




部分参考文献


《基于二元接续关系检查的字词级自动查错方法》
张仰森 丁冰青《中文信息学报》第15卷第3期
《中文信息处理与现代汉语研究》
许嘉璐 中国语文2000年第6期(总第279期)
《语料库语言学》黄昌宁 李涓子 商务印书馆 2002年4月第1版