垂直搜索引擎关键技术研究与应用.doc

  
约108页DOC格式手机打开展开

垂直搜索引擎关键技术研究与应用,3.99万字71页包括外文翻译,原创作品,通过查重系统 摘要搜索引擎作为人们获取internet上信息的主要手段,是信息检索领域研究的热门课题。近年来,随着网上资源的急剧攀升,人们所熟知的通用的全文搜索引擎已经越来越不能满足人们的需求了,所以垂直搜索引擎便成为了一个热门研究领域。垂直搜索引...
编号:99-583728大小:3.21M
分类: 论文>计算机论文

内容介绍

此文档由会员 第二波打卡 发布

垂直搜索引擎关键技术研究与应用

3.99万字 71页 包括外文翻译,原创作品,通过查重系统

摘 要
搜索引擎作为人们获取Internet上信息的主要手段,是信息检索领域研究的热门课题。近年来,随着网上资源的急剧攀升,人们所熟知的通用的全文搜索引擎已经越来越不能满足人们的需求了,所以垂直搜索引擎便成为了一个热门研究领域。垂直搜索引擎是针对某一特殊领域、特定人群使用的搜索引擎,具有很强的领域相关性,能够实现相关的、专业的、实时的搜索。
本文首先介绍了垂直搜索引擎的研究背景和研究现状,同时介绍了垂直搜索引擎的概念以及它与通用搜索引擎的区别。
接下来,介绍了本体领域的基本知识,构建本体的方法,并且选用protégé 4.3构建了小麦领域本体。并对Web爬取、索引和检索、查询扩展中的相关技术和算法进行了介绍。主要包括多线程技术和HtmlParser解析;Lucene倒排索引及Lucene的评分系统。检索模型中的TF-IDF权重以及Jena解析本体文件等内容。
最后,本文设计和实现了一个针对小麦领域的垂直搜索系统,将本体领域的相关知识以及在信息检索方面的应用来优化垂直搜索引擎,以查询拓展的方式来增强关键字搜索。系统完成后,进行了实验和分析,得到了满意的效果。


关键词:垂直搜索引擎;本体;OWL;Lucene;Jena