基于互信息的中文文本自动查错.doc
约11页DOC格式手机打开展开
基于互信息的中文文本自动查错,6600多字11页摘要本文介绍有关互信息的概念和理论,讨论了从语料库提取汉字互信息的方法,并且构造了基于汉字互信息的中文文本自动查错算法,将算法编写程序调试通过,给出了部分查错实例。关键词中文文本自动查错二元接续关系互信息abstract this dissertation introduc...
内容介绍
此文档由会员 cnlula 发布
基于互信息的中文文本自动查错
6600多字 11页
摘要 本文介绍有关互信息的概念和理论,讨论了从语料库提取汉字互信息的方法,并且构造了基于汉字互信息的中文文本自动查错算法,将算法编写程序调试通过,给出了部分查错实例。
关键词 中文文本自动查错 二元接续关系 互信息
Abstract This dissertation introduced some concepts and theories about Mutual Information. Then discussed the method of how to pick up Mutual Information form sentences-base. At last, construct the Auto-Error-Check Algorithm of Chinese Text based on Mutual Information and compile the program to get some examples.
Keyword Auto-Error-Check of Chinese Texts Duality of Sequences Mutual Information
目 录
1. 概述 3
1.1 问题提出 3
1.2 研究状况及方法 3
1.2.1 基于规则的查错方法 3
1.2.2 基于统计的查错方法 3
1.2.3 待校对文本常见错误分析 3
1.3 本文研究思路 4
2. 基于互信息的自动查错方法 4
2.1 互信息知识库的构造 4
2.1 数据结构设计 4
2.2 互信息计算算法设计 5
2.2 使用互信息数据进行文本查错 7
2.2.1 基于互信息的文本查错算法描述 7
2.2.2 基于互信息的文本查错算法流程图 8
2.2.3 程序设计实现和实验结果 8
3.实验实例 9
4. 结论 10
5. 致谢 11
6. 参考文献 11
7. 附录 11
参考文献
《基于词二元接续的中文文本自动查错的研究》
王虹 张仰森《贵州大学学报》(自然科学版)第18卷第1期
《基于二元接续关系检查的字词级自动查错方法》
张仰森 丁冰青《中文信息学报》第15卷第3期
6600多字 11页
摘要 本文介绍有关互信息的概念和理论,讨论了从语料库提取汉字互信息的方法,并且构造了基于汉字互信息的中文文本自动查错算法,将算法编写程序调试通过,给出了部分查错实例。
关键词 中文文本自动查错 二元接续关系 互信息
Abstract This dissertation introduced some concepts and theories about Mutual Information. Then discussed the method of how to pick up Mutual Information form sentences-base. At last, construct the Auto-Error-Check Algorithm of Chinese Text based on Mutual Information and compile the program to get some examples.
Keyword Auto-Error-Check of Chinese Texts Duality of Sequences Mutual Information
目 录
1. 概述 3
1.1 问题提出 3
1.2 研究状况及方法 3
1.2.1 基于规则的查错方法 3
1.2.2 基于统计的查错方法 3
1.2.3 待校对文本常见错误分析 3
1.3 本文研究思路 4
2. 基于互信息的自动查错方法 4
2.1 互信息知识库的构造 4
2.1 数据结构设计 4
2.2 互信息计算算法设计 5
2.2 使用互信息数据进行文本查错 7
2.2.1 基于互信息的文本查错算法描述 7
2.2.2 基于互信息的文本查错算法流程图 8
2.2.3 程序设计实现和实验结果 8
3.实验实例 9
4. 结论 10
5. 致谢 11
6. 参考文献 11
7. 附录 11
参考文献
《基于词二元接续的中文文本自动查错的研究》
王虹 张仰森《贵州大学学报》(自然科学版)第18卷第1期
《基于二元接续关系检查的字词级自动查错方法》
张仰森 丁冰青《中文信息学报》第15卷第3期