中文文本自动校队中的语料库技术研究.doc

约25页DOC格式手机打开展开

中文文本自动校队中的语料库技术研究,2.4万字 25页摘要语料库语言学是当代计算机学语言学中经验主义论取得显著成效从而在计算机语言学领域占有一定的优势地位的新学科方向。语料库是自然语言处理领域的基础性资源,因此语料库建设和研究就成为计算机语言学的重要工作之一。本文是研究中文文本中语料库的建立与设计。我们采用手工或软件形式...
编号:10-31652大小:218.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 刘丽 发布

中文文本自动校队中的语料库技术研究
2.4万字 25页


摘要


语料库语言学是当代计算机学语言学中经验主义论取得显著成效从而在计算机语言学领域占有一定的优势地位的新学科方向。语料库是自然语言处理领域的基础性资源,因此语料库建设和研究就成为计算机语言学的重要工作之一。本文是研究中文文本中语料库的建立与设计。我们采用手工或软件形式获得语料库,并用对语料库进行加工整理。


关键词:文本自动校对、语料库、索引。




Abstract
Corpus Linguistic, a successful empirical methodology, now is a prevailed newtrend in Computational Linguistic field. Corpus is fundamental resource for Natural Language Processing. So some theory and method in different with rational methodology is required that means the construction and research on corpus issue is the basic of Computational Linguistic. This paper attempts to research into corpus for Chinese text. We adopt the handicraft or software form the winning Corpus, and counteract to Corpus proceeds process the sorting.


Keywords: Chinese Proofreading, corpus, index.



参考文献

[1] 易蓉湘,何克抗 “计算机汉语文稿校对系统” 计算机研究与发展 1997.5.Vol 34.No5。
[2] 许嘉璐 “中文信息处理技术现状及相关语言文字研究” 软件世界 1996.4 P13-20.