西文自动摘要软件的开发.doc
约36页DOC格式手机打开展开
西文自动摘要软件的开发,western autosummary software development1.2万字 36页 原创作品,已通过查重系统目录第一章 绪 论71.1 课题背景与意义71.2 国内外研究现状81.3 主要研究内容与特点81.4 论文的组织结构9第二章 系统开发工具及关键技术92.1eclipse工...
内容介绍
此文档由会员 马甲线女神 发布
西文自动摘要软件的开发
Western AutoSummary software development
1.2万字 36页 原创作品,已通过查重系统
目 录
第一章 绪 论 7
1.1 课题背景与意义 7
1.2 国内外研究现状 8
1.3 主要研究内容与特点 8
1.4 论文的组织结构 9
第二章 系统开发工具及关键技术 9
2.1 Eclipse工具 9
2.2 java语言 10
2.3 Ik分词器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社会可行性 11
3.2 经济可行性 11
3.3 技术可行性 12
第四章 软件需求分析 12
4.1 开发背景 12
4.2 设计目标与原则 12
4.3 性能需求分析 13
4.4 技术难点 14
第五章 软件设计 14
5.1 设计思想 14
5.2 模块设计 14
5.2.1 预处理模块 15
5.2.2 分词模块 15
5.2.3 统计模块 15
5.2.4 提取摘要模块 16
5.2.5 输出摘要模块 17
第六章 软件实现 17
6.1 西文自动摘要软件流程 17
6.2 各功能模块实现 17
6.2.1 预处理模块 19
6.2.2 分词模块 22
6.2.3 统计模块 24
6.2.4 提取摘要模块 27
6.2.5 输出摘要模块 29
第七章 总结与展望 33
7.1 论文完成情况 33
7.2 以后要做的工作 33
致谢 34
参考文献 35
摘 要 自动摘要是计算机语言学和情报科学共同关注的课题其本质是信息的挖掘和信息的浓缩。从理论上讲对自动摘要的研究将有助于探讨人类理解、概括自然语言文本并从中获取知识的认识模型。自动摘要被认为是计算机实现自然语言理解的重要标志之一。从应用角度讲在文献电子化和工nternet迅速发展的今天自动摘要软件的使用将大幅度降低编制摘要的成本缩短文摘的出版周期为人们廉价、迅速和准确地获得所需要的信息提供方便。本文设计的西文自动摘要软件采用自动摘录原文中句子方法它将文本视为句子的线性序列将句子视为词的线性序列。然后通过计算句子的权值对原文中的所有句子按权值高低降序排列权值最高的若干句子被确定为文摘句然后将所有文摘句按照它们在原文中的出现顺序输出。系统基于Eclipse平台开发实现。该系统直接在计算机上进行文章摘要的自动生成要实现的功能就是给定一个文档后经过统计分析给出文档的摘要句并依照原文顺序依次输出。系统力求摘要句抓住原文的核心内容语句连贯不遗漏题。
关键词:自动摘要 线性序列 权值 文摘句
Western AutoSummary software development
1.2万字 36页 原创作品,已通过查重系统
目 录
第一章 绪 论 7
1.1 课题背景与意义 7
1.2 国内外研究现状 8
1.3 主要研究内容与特点 8
1.4 论文的组织结构 9
第二章 系统开发工具及关键技术 9
2.1 Eclipse工具 9
2.2 java语言 10
2.3 Ik分词器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社会可行性 11
3.2 经济可行性 11
3.3 技术可行性 12
第四章 软件需求分析 12
4.1 开发背景 12
4.2 设计目标与原则 12
4.3 性能需求分析 13
4.4 技术难点 14
第五章 软件设计 14
5.1 设计思想 14
5.2 模块设计 14
5.2.1 预处理模块 15
5.2.2 分词模块 15
5.2.3 统计模块 15
5.2.4 提取摘要模块 16
5.2.5 输出摘要模块 17
第六章 软件实现 17
6.1 西文自动摘要软件流程 17
6.2 各功能模块实现 17
6.2.1 预处理模块 19
6.2.2 分词模块 22
6.2.3 统计模块 24
6.2.4 提取摘要模块 27
6.2.5 输出摘要模块 29
第七章 总结与展望 33
7.1 论文完成情况 33
7.2 以后要做的工作 33
致谢 34
参考文献 35
摘 要 自动摘要是计算机语言学和情报科学共同关注的课题其本质是信息的挖掘和信息的浓缩。从理论上讲对自动摘要的研究将有助于探讨人类理解、概括自然语言文本并从中获取知识的认识模型。自动摘要被认为是计算机实现自然语言理解的重要标志之一。从应用角度讲在文献电子化和工nternet迅速发展的今天自动摘要软件的使用将大幅度降低编制摘要的成本缩短文摘的出版周期为人们廉价、迅速和准确地获得所需要的信息提供方便。本文设计的西文自动摘要软件采用自动摘录原文中句子方法它将文本视为句子的线性序列将句子视为词的线性序列。然后通过计算句子的权值对原文中的所有句子按权值高低降序排列权值最高的若干句子被确定为文摘句然后将所有文摘句按照它们在原文中的出现顺序输出。系统基于Eclipse平台开发实现。该系统直接在计算机上进行文章摘要的自动生成要实现的功能就是给定一个文档后经过统计分析给出文档的摘要句并依照原文顺序依次输出。系统力求摘要句抓住原文的核心内容语句连贯不遗漏题。
关键词:自动摘要 线性序列 权值 文摘句