个性化搜索引擎的设计与实现.doc
约28页DOC格式手机打开展开
个性化搜索引擎的设计与实现,28页共计18268字摘 要随着internet技术的迅速发展,网络提供给人们的信息量越来越大。搜索引擎作为人们在www上查找、获取信息的重要手段之一,在各个领域都已得到了广泛的应用。为了给用户提供个性化的查询服务,个性化搜索引擎孕育而生。经过众多研究者的不懈努力,个性化搜索引擎技术已取得了一些进展。本文针对目前搜索引...
内容介绍
此文档由会员 bfxqt 发布
28页共计18268字
摘 要
随着Internet技术的迅速发展,网络提供给人们的信息量越来越大。搜索引擎作为人们在WWW上查找、获取信息的重要手段之一,在各个领域都已得到了广泛的应用。为了给用户提供个性化的查询服务,个性化搜索引擎孕育而生。经过众多研究者的不懈努力,个性化搜索引擎技术已取得了一些进展。本文针对目前搜索引擎存在的不足以及当前用户个性化查询的要求,在深入研究搜索引擎及相关技术的基础上,设计了一个基于用户兴趣挖掘的个性化搜索引擎模型。本文的主要工作是:
(1)个性化模型的研究与实现本文深入分析了个性化搜索的特点,研究了搜索引擎及相关技术,设计了一个基于用户兴趣挖掘的个性化模型。该模型从用户的历史访问页面中提取用户的兴趣特征,将兴趣相同的页面进行归类,并将用户兴趣按类管理;本文构建了用户兴趣树来动态地存储用户兴趣,并通过短期兴趣和长期兴趣相结合的方式来描述用户兴趣特征;为了及时地反映用户的兴趣变化,本文采用了基于遗忘机制的兴趣更新算法。
(2)个性化搜索引擎(除个性化模型外)其他模块的研究与实现本文还研究了与个性化搜索引擎相关的其他模块,包括:中文分词、查询扩展、网络蜘蛛、索引建立与更新以及结果排序。在综合考虑了技术的实现难度和用户个性化查询要求的基础上,本文给出了以上各模块的实现算法。
(3)通过实验证明了本文设计的个性化搜索引擎的有效性。实验内容包括两方面:个性化模型的建立和个性化的搜索。
目 录
摘 要 IV
关键词 IV
ABSTRACT V
KEY WORDS V
1 前言 1
1.1 研究背景 1
1.2 个性化搜索引擎的意义 1
1.3 个性化搜索引擎主要的研究问题 1
2 搜索引擎概述 2
2.1 个性化搜索引擎 2
2.2 搜索引擎工作原理 2
2.3 个性化搜索引擎系统模型 3
2.4 未来搜索引擎的发展趋势 4
3 个性化搜索引擎相关技术 5
3.1 信息抽取技术 5
3.2 LUCENE检索工具包 5
3.3 中文分词技术 6
3.4 自动聚类技术 6
3.5 用户行为分析 7
4 个性化搜索引擎的总体设计 7
4.1 系统需求分析及总体设计 7
4.2 系统功能及架构设计 8
4.3 系统流程设计 8
4.4 系统数据库设计 12
5 个性化搜索引擎的具体实现 13
5.1 模块设计 13
5.2 用户界面模块 14
5.3 搜索模块 16
5.4 搜索结果优化模块 19
5.5 系统运行结果及示例 21
6 总结 22
参考文献: 22
致 谢 23
关键词
个性化模型,用户兴趣挖掘,用户兴趣树
参考文献:
[2]李爱明.个性化搜索引擎用户模型研究 武汉:华中师范大学,2007.
[3]张波.个性化Web搜索系统研究 .秦皇岛:燕山大学,2006.
[4]庞杰.搜索引擎技术的研究与实现 .上海:上海交通大学,2006.
[5]李沛环.基于Lucene的搜索引擎的设计和优化 .吉林:吉林大学,2008.
[6]种梅.元搜索引擎中的关键技术研究 .山东:山东师范大学,2008
[7]霍长青.个性化元搜索引擎研究与设计 .山东:山东科技大学,2006.
[8]许文.HTML网页土题信息抽取方法研究 .北京:北京机械工业学院,2007.
[9]刘清.基于SVM的网络文本分类问题研究与应用 .南昌:南昌大学,2007.
[10]卢效峰,郑权.基于用户行为分析的搜索引擎模型 .北方工业大学学报,2004
[11]张恒,屈景辉,张亮.网页文本信息提取及结果评价 微计算机应用,2007.9.
[12]费魏,黄如花.基于用户行为分析的搜索引擎优化策略 图书情报工作,2005,10(49):75一77
[13]刘涛.用于文本分类和文本聚类的特征选择田 .武汉:南开大学,2004.
[14]冯刚.基于JZEE的多语种元搜索引擎的研究与实现 成都:电子科技大学,
[16]王玲,穆志纯,郭辉一种基于聚类的支持向量机增量学习算法.北京科技人学学报,2007
[17]何世林.基于JAVA技术的搜索引擎研究与实现 .成都:西南交通大学,2006.
[18]张恒,屈景辉,张亮.网页文本信息提取及结果评价 .微计算机应用,2007.9.
[19]PQi He,PKuiyuChang,Ee-peng Lim.Analyzing Feature Trajeetories for Event
Detection •Proeeedings of the 30th Annual International ACM SIGIR Conference on
Researeh and Development in Information Retrieval,2007.6:35一37.
[20]WangDeqing,ZhangHui,ZhaoLiPing A clustering algorithm of no-word-segmentation for
Chinese seareh engine results[C].3rd International Conference on Semantics,Knowledge,
And Grid,SKG2007,2007:258一261.
[21]KumarHarshit,Kang Sanggil.Another face of seareh engine[C].Web seareh API’s.Lecture
Notes in Computer Science,v5027LNAI,New Frontiers in Applied Artifieial Intelligence-
2lst International Conference on Industrial,Engineering and Other Applications of Applied
Intelligent Systems,IEA/AIE2008,Proceedings,2008:311一320.
[22]Yuanyu一Yu,LuoXue一Chao.A measurement method of search engine retrieve Performance
Based user Path mode[J].Tien Tzu Hsueh Pao/Acta Eleetronica Siniea,2008.5(36):969一973.
[23]Liu Chunshuang,Zhang Zhiqiang,Xie Xiaoqin,et al.Evaluation of meta-search engine
Merge algorithms[C].Proceedings ICICSE2008一2008 International Conference on Internet
Computing in Seience and Engineering,2008:9一14.
摘 要
随着Internet技术的迅速发展,网络提供给人们的信息量越来越大。搜索引擎作为人们在WWW上查找、获取信息的重要手段之一,在各个领域都已得到了广泛的应用。为了给用户提供个性化的查询服务,个性化搜索引擎孕育而生。经过众多研究者的不懈努力,个性化搜索引擎技术已取得了一些进展。本文针对目前搜索引擎存在的不足以及当前用户个性化查询的要求,在深入研究搜索引擎及相关技术的基础上,设计了一个基于用户兴趣挖掘的个性化搜索引擎模型。本文的主要工作是:
(1)个性化模型的研究与实现本文深入分析了个性化搜索的特点,研究了搜索引擎及相关技术,设计了一个基于用户兴趣挖掘的个性化模型。该模型从用户的历史访问页面中提取用户的兴趣特征,将兴趣相同的页面进行归类,并将用户兴趣按类管理;本文构建了用户兴趣树来动态地存储用户兴趣,并通过短期兴趣和长期兴趣相结合的方式来描述用户兴趣特征;为了及时地反映用户的兴趣变化,本文采用了基于遗忘机制的兴趣更新算法。
(2)个性化搜索引擎(除个性化模型外)其他模块的研究与实现本文还研究了与个性化搜索引擎相关的其他模块,包括:中文分词、查询扩展、网络蜘蛛、索引建立与更新以及结果排序。在综合考虑了技术的实现难度和用户个性化查询要求的基础上,本文给出了以上各模块的实现算法。
(3)通过实验证明了本文设计的个性化搜索引擎的有效性。实验内容包括两方面:个性化模型的建立和个性化的搜索。
目 录
摘 要 IV
关键词 IV
ABSTRACT V
KEY WORDS V
1 前言 1
1.1 研究背景 1
1.2 个性化搜索引擎的意义 1
1.3 个性化搜索引擎主要的研究问题 1
2 搜索引擎概述 2
2.1 个性化搜索引擎 2
2.2 搜索引擎工作原理 2
2.3 个性化搜索引擎系统模型 3
2.4 未来搜索引擎的发展趋势 4
3 个性化搜索引擎相关技术 5
3.1 信息抽取技术 5
3.2 LUCENE检索工具包 5
3.3 中文分词技术 6
3.4 自动聚类技术 6
3.5 用户行为分析 7
4 个性化搜索引擎的总体设计 7
4.1 系统需求分析及总体设计 7
4.2 系统功能及架构设计 8
4.3 系统流程设计 8
4.4 系统数据库设计 12
5 个性化搜索引擎的具体实现 13
5.1 模块设计 13
5.2 用户界面模块 14
5.3 搜索模块 16
5.4 搜索结果优化模块 19
5.5 系统运行结果及示例 21
6 总结 22
参考文献: 22
致 谢 23
关键词
个性化模型,用户兴趣挖掘,用户兴趣树
参考文献:
[2]李爱明.个性化搜索引擎用户模型研究 武汉:华中师范大学,2007.
[3]张波.个性化Web搜索系统研究 .秦皇岛:燕山大学,2006.
[4]庞杰.搜索引擎技术的研究与实现 .上海:上海交通大学,2006.
[5]李沛环.基于Lucene的搜索引擎的设计和优化 .吉林:吉林大学,2008.
[6]种梅.元搜索引擎中的关键技术研究 .山东:山东师范大学,2008
[7]霍长青.个性化元搜索引擎研究与设计 .山东:山东科技大学,2006.
[8]许文.HTML网页土题信息抽取方法研究 .北京:北京机械工业学院,2007.
[9]刘清.基于SVM的网络文本分类问题研究与应用 .南昌:南昌大学,2007.
[10]卢效峰,郑权.基于用户行为分析的搜索引擎模型 .北方工业大学学报,2004
[11]张恒,屈景辉,张亮.网页文本信息提取及结果评价 微计算机应用,2007.9.
[12]费魏,黄如花.基于用户行为分析的搜索引擎优化策略 图书情报工作,2005,10(49):75一77
[13]刘涛.用于文本分类和文本聚类的特征选择田 .武汉:南开大学,2004.
[14]冯刚.基于JZEE的多语种元搜索引擎的研究与实现 成都:电子科技大学,
[16]王玲,穆志纯,郭辉一种基于聚类的支持向量机增量学习算法.北京科技人学学报,2007
[17]何世林.基于JAVA技术的搜索引擎研究与实现 .成都:西南交通大学,2006.
[18]张恒,屈景辉,张亮.网页文本信息提取及结果评价 .微计算机应用,2007.9.
[19]PQi He,PKuiyuChang,Ee-peng Lim.Analyzing Feature Trajeetories for Event
Detection •Proeeedings of the 30th Annual International ACM SIGIR Conference on
Researeh and Development in Information Retrieval,2007.6:35一37.
[20]WangDeqing,ZhangHui,ZhaoLiPing A clustering algorithm of no-word-segmentation for
Chinese seareh engine results[C].3rd International Conference on Semantics,Knowledge,
And Grid,SKG2007,2007:258一261.
[21]KumarHarshit,Kang Sanggil.Another face of seareh engine[C].Web seareh API’s.Lecture
Notes in Computer Science,v5027LNAI,New Frontiers in Applied Artifieial Intelligence-
2lst International Conference on Industrial,Engineering and Other Applications of Applied
Intelligent Systems,IEA/AIE2008,Proceedings,2008:311一320.
[22]Yuanyu一Yu,LuoXue一Chao.A measurement method of search engine retrieve Performance
Based user Path mode[J].Tien Tzu Hsueh Pao/Acta Eleetronica Siniea,2008.5(36):969一973.
[23]Liu Chunshuang,Zhang Zhiqiang,Xie Xiaoqin,et al.Evaluation of meta-search engine
Merge algorithms[C].Proceedings ICICSE2008一2008 International Conference on Internet
Computing in Seience and Engineering,2008:9一14.