搜索引擎的分布式查询接口.doc
约41页DOC格式手机打开展开
搜索引擎的分布式查询接口,全文45页约18000字 论述翔实摘要如果问二十世纪末互联网产业里哪一块风头最盛,发展最快,那我们会毫不犹豫的说:“of course,是搜索引擎!”。google的异军突起,使人们不禁想起上世纪80年代微软的崛起及其对整个pc世界的深远影响。我们有理由相信,搜索引擎必将深刻而久远的改变我们的生...
内容介绍
此文档由会员 棉花糖糖 发布
搜索引擎的分布式查询接口
全文45页 约18000字 论述翔实
摘要
如果问二十世纪末互联网产业里哪一块风头最盛,发展最快,那我们会毫不犹豫的说:“Of course,是搜索引擎!”。Google的异军突起,使人们不禁想起上世纪80年代微软的崛起及其对整个PC世界的深远影响。我们有理由相信,搜索引擎必将深刻而久远的改变我们的生活和思维。
本论文共分五章,其中第一章介绍了搜索引擎技术及结构;第二章进入主题,讨论了分布式查询接口的原理、作用、功能;第三和第四章分别详细探讨了查询接口的两大功能,查询结点管理和本地缓存。第五章是性能测试。
希望通过我们的论文,能对您学习搜索引擎技术有所帮助。有志于从事网络软件开发的读者相信也可以从中得到借鉴。
关键词 搜索引擎,分布式,查询接口,Berkeley DB,Chttpd
Abstract
What is the fast growing and eye-catching field of Internet Industry in late 20th century? Every one should say without hesitance,” Of course, it’s the search engine!” With Google’s sudden rise and explosive development, we would thought of the far-reaching impress brought up by the grow up of the Microsoft in 1980s. There is a fundamental reason we could say that the Search Engine will bring profound and long-range changes to our thoughts and lives.
Five chapters this article is composed of, with--
Chapter one: Search Engine’s technique and the structure;
Chapter two: the Elements and the Function of the distributed query interface, which we would like to focus our remarks briefly on, as the key point of the paper.
Chapter three: query node management
Chapter four: local buffer
Chapter five: performance test
Keywords Search Engine distributed query interface Berkeley DB,Chttpd
目录
摘要 I
Abstract II
第1章 绪论 1
1.1 搜索引擎简介 1
1.1.1 搜索引擎分类 1
1.1.2 搜索引擎结构 3
1.2 主流搜索引擎 5
1.3 C/S结构的分布式数据库系统实现 9
1.3.1 C/S结构的数据库应用系统的组成 9
1.3.2 典型的C/S结构 9
1.4 本章小结 11
第2章 分布式查询接口的原理 13
2.1 分布式查询与分布式数据库系统 13
2.1.1 分布式数据库系统的概念 13
2.1.2 分布式数据库系统的优缺点 13
2.1.3 分布式查询的概念 14
2.1.4 查询代价的估算 14
2.2 分布式查询接口的概念和功能 14
2.2.1 接口的概念 14
2.2.2 分布式查询接口的概念 15
2.2.3 分布式查询接口的功能 15
2.3 HTTP协议简介 15
2.3.1 HTTP请求方式 16
2.3.2 Chttpd简介 16
2.3.3 Chttpd自定义的http头部 17
2.4 本章小结 17
第3章 查询结点管理 19
3.1 结点管理功能介绍 19
3.1.1 查询结点的功能 19
3.1.2 通过接口访问查询结点 19
3.1.3 结点管理的任务 19
3.2 结点数据结构 20
3.2.1 访问结点需要的信息 20
3.2.2 结点数量的限制 20
3.2.3 结点的存储方式 20
3.2.4 结点数据结构的实现 20
3.3 结点管理功能 21
3.3.1 增加查询结点 21
3.3.2 删除查询结点 22
3.3.3 遍历查询结点 23
3.3.4 选择单个查询结点 25
3.4 本章小结 26
第4章 本地缓存管理 27
4.1 缓存管理介绍 27
4.1.1 缓存作用简介 27
4.1.2 缓存的内容 27
4.2 缓存管理的实现 27
4.2.1 Berkeley DB介绍 27
4.2.2 记录替换算法 30
4.3 缓存性能测试 31
4.4 本章小结 32
第5章 查询接口性能测试 33
5.1 测试程序的命令行格式 33
5.2 不同查询次数下的性能表现 33
5.3 多个用户下的性能表现 34
结论 35
参考文献 36
致谢 37
附录 搜索引擎的结构图 38
部分参考文献
11 徐宝文 张卫丰 搜索引擎与信息获取技术 清华大学出版社2003
12 霍克 金丽华 Internet通用搜索引擎检索指南 辽宁科学技术出版社 2003
13 王以和 涂小平 分布式数据库系统 电子工业出版社1988
14 陈建荣 分布式数据库设计导论 清华大学出版社1992
15 周龙骧 分布式数据库管理系统实现技术 科学出版社 1998
全文45页 约18000字 论述翔实
摘要
如果问二十世纪末互联网产业里哪一块风头最盛,发展最快,那我们会毫不犹豫的说:“Of course,是搜索引擎!”。Google的异军突起,使人们不禁想起上世纪80年代微软的崛起及其对整个PC世界的深远影响。我们有理由相信,搜索引擎必将深刻而久远的改变我们的生活和思维。
本论文共分五章,其中第一章介绍了搜索引擎技术及结构;第二章进入主题,讨论了分布式查询接口的原理、作用、功能;第三和第四章分别详细探讨了查询接口的两大功能,查询结点管理和本地缓存。第五章是性能测试。
希望通过我们的论文,能对您学习搜索引擎技术有所帮助。有志于从事网络软件开发的读者相信也可以从中得到借鉴。
关键词 搜索引擎,分布式,查询接口,Berkeley DB,Chttpd
Abstract
What is the fast growing and eye-catching field of Internet Industry in late 20th century? Every one should say without hesitance,” Of course, it’s the search engine!” With Google’s sudden rise and explosive development, we would thought of the far-reaching impress brought up by the grow up of the Microsoft in 1980s. There is a fundamental reason we could say that the Search Engine will bring profound and long-range changes to our thoughts and lives.
Five chapters this article is composed of, with--
Chapter one: Search Engine’s technique and the structure;
Chapter two: the Elements and the Function of the distributed query interface, which we would like to focus our remarks briefly on, as the key point of the paper.
Chapter three: query node management
Chapter four: local buffer
Chapter five: performance test
Keywords Search Engine distributed query interface Berkeley DB,Chttpd
目录
摘要 I
Abstract II
第1章 绪论 1
1.1 搜索引擎简介 1
1.1.1 搜索引擎分类 1
1.1.2 搜索引擎结构 3
1.2 主流搜索引擎 5
1.3 C/S结构的分布式数据库系统实现 9
1.3.1 C/S结构的数据库应用系统的组成 9
1.3.2 典型的C/S结构 9
1.4 本章小结 11
第2章 分布式查询接口的原理 13
2.1 分布式查询与分布式数据库系统 13
2.1.1 分布式数据库系统的概念 13
2.1.2 分布式数据库系统的优缺点 13
2.1.3 分布式查询的概念 14
2.1.4 查询代价的估算 14
2.2 分布式查询接口的概念和功能 14
2.2.1 接口的概念 14
2.2.2 分布式查询接口的概念 15
2.2.3 分布式查询接口的功能 15
2.3 HTTP协议简介 15
2.3.1 HTTP请求方式 16
2.3.2 Chttpd简介 16
2.3.3 Chttpd自定义的http头部 17
2.4 本章小结 17
第3章 查询结点管理 19
3.1 结点管理功能介绍 19
3.1.1 查询结点的功能 19
3.1.2 通过接口访问查询结点 19
3.1.3 结点管理的任务 19
3.2 结点数据结构 20
3.2.1 访问结点需要的信息 20
3.2.2 结点数量的限制 20
3.2.3 结点的存储方式 20
3.2.4 结点数据结构的实现 20
3.3 结点管理功能 21
3.3.1 增加查询结点 21
3.3.2 删除查询结点 22
3.3.3 遍历查询结点 23
3.3.4 选择单个查询结点 25
3.4 本章小结 26
第4章 本地缓存管理 27
4.1 缓存管理介绍 27
4.1.1 缓存作用简介 27
4.1.2 缓存的内容 27
4.2 缓存管理的实现 27
4.2.1 Berkeley DB介绍 27
4.2.2 记录替换算法 30
4.3 缓存性能测试 31
4.4 本章小结 32
第5章 查询接口性能测试 33
5.1 测试程序的命令行格式 33
5.2 不同查询次数下的性能表现 33
5.3 多个用户下的性能表现 34
结论 35
参考文献 36
致谢 37
附录 搜索引擎的结构图 38
部分参考文献
11 徐宝文 张卫丰 搜索引擎与信息获取技术 清华大学出版社2003
12 霍克 金丽华 Internet通用搜索引擎检索指南 辽宁科学技术出版社 2003
13 王以和 涂小平 分布式数据库系统 电子工业出版社1988
14 陈建荣 分布式数据库设计导论 清华大学出版社1992
15 周龙骧 分布式数据库管理系统实现技术 科学出版社 1998