分布式代理技术的文件搜索系统设计.doc
约24页DOC格式手机打开展开
分布式代理技术的文件搜索系统设计, 本文共计24页,7562字;中文提要在信息时代的今天,数据的抓取和挖掘是一种非常重要的手段,而搜索引擎是一种最具特色的网络信息工具。搜索引擎一般由三部分组成:搜索代理、数据库、人机界面。其中搜索代理,即所谓的机器人程序,用于在互联网上漫游、探索并将所发现的网络资源清单存入数据库以供搜索...
内容介绍
此文档由会员 李娇娇 发布
分布式代理技术的文件搜索系统设计
本文共计24页,7562字;
中文提要
在信息时代的今天,数据的抓取和挖掘是一种非常重要的手段,而搜索引擎是一种最具特色的网络信息工具。搜索引擎一般由三部分组成:搜索代理、数据库、人机界面。其中搜索代理,即所谓的机器人程序,用于在互联网上漫游、探索并将所发现的网络资源清单存入数据库以供搜索,是系统中最具有智能成分的一部分,由于互联网信息量之大,一般需要采用很多的搜索代理来协同探索。本文主要就搜索代理展开研讨,对于多个搜索代理协通工作的情形进行分析与讨论,为分布式代理系统提供一种高效、安全、可靠的解决方案。
关键词
FTP文件,分布式,代理,搜索引擎,数据采集
Abstract
At today of information ages, the data gathering is a important side of information processing, and search engine is a kind of useful tools to get information from Internet. Search engine is generally constituted by three parts: The data gathering agent, database and the user interface. Among them the agent, also named robots,
参考文献
著作
1、 谢希仁,计算机网络(第4版)[M],电子工业出版社,2003
2、 Andrew S. Tanenbaum,分布式系统原理与范型[M],清华大学出版社,2002
论文
1、 黄华,杨德志,张建刚,分布式文件系统[J],中国科学院计算技术研究所论文,2003
其它
1、 IETE, FTP文件传输协议参考,RFC 0959,1985
本文共计24页,7562字;
中文提要
在信息时代的今天,数据的抓取和挖掘是一种非常重要的手段,而搜索引擎是一种最具特色的网络信息工具。搜索引擎一般由三部分组成:搜索代理、数据库、人机界面。其中搜索代理,即所谓的机器人程序,用于在互联网上漫游、探索并将所发现的网络资源清单存入数据库以供搜索,是系统中最具有智能成分的一部分,由于互联网信息量之大,一般需要采用很多的搜索代理来协同探索。本文主要就搜索代理展开研讨,对于多个搜索代理协通工作的情形进行分析与讨论,为分布式代理系统提供一种高效、安全、可靠的解决方案。
关键词
FTP文件,分布式,代理,搜索引擎,数据采集
Abstract
At today of information ages, the data gathering is a important side of information processing, and search engine is a kind of useful tools to get information from Internet. Search engine is generally constituted by three parts: The data gathering agent, database and the user interface. Among them the agent, also named robots,
参考文献
著作
1、 谢希仁,计算机网络(第4版)[M],电子工业出版社,2003
2、 Andrew S. Tanenbaum,分布式系统原理与范型[M],清华大学出版社,2002
论文
1、 黄华,杨德志,张建刚,分布式文件系统[J],中国科学院计算技术研究所论文,2003
其它
1、 IETE, FTP文件传输协议参考,RFC 0959,1985