网页机器人论文设计.doc

约27页DOC格式手机打开展开

网页机器人论文设计,2.6万字27页 摘要 网页机器人是搜索引擎的一部分,要了解它就要从了解搜索引擎入手。所谓搜索引擎, 就是一种指能够自动对www 资源建立索引或进行主题分类, 并通过查询语法为用户返回匹配资源的系统。随着互联网规模的飞速增长,高效、准确地获得包含用户所需信息的网页,日益成为需要迫切解决的问题。搜索引擎是解决这一问题的一...
编号:10-4078大小:167.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 刘丽 发布

2.6万字 27页
摘要
网页机器人是搜索引擎的一部分,要了解它就要从了解搜索引擎入手。所谓搜索引擎, 就是一种指能够自动对WWW 资源建立索引或进行主题分类, 并通过查询语法为用户返回匹配资源的系统。随着互联网规模的飞速增长,高效、准确地获得包含用户所需信息的网页,日益成为需要迫切解决的问题。搜索引擎是解决这一问题的一个有效方法。互联网上使用的搜索引擎很多, 像Google、Info seek、Lycos、Yahoo、百度等都是网络上非常著名的搜索引擎站点, 这些搜索引擎所采用的技术和实现的方法各有其特点。本文论述了网页机器人的工作原理,设计了一个小型的机器人程序,用VB实现了Web文档的下载、超链接提取、新超链接的可用性判断。为提高网页机器人的效率使用了WinInet API中的HTTP函数。对网站建设和信息采集工具的开发具有一定的参考价值。
Abstract
The author discussed the work principle of the Web Robot and designed a small scaled Web Robot program with VB, which can download the web pages from the websites,find out the hyperlinks from the web pages and test the availability of the new hyperlinks. To improve the efficiency of the Web Robot,the designer used the HTTP functions within the WinInet API .The paper is valuable for constructing a website and developing a Information Retrieval tool.

Key Words:Web Robot;Search Engine; Information Retrieval

目 录
第一章 绪论
第二章网页机器人设计
2.1网页机器人的基本工作原理
2.2网页机器人的搜索策略
2.3媒体文件内容的提取
2.4网页的更新周期
2.5网页机器人设计中应注意的问题
2.6 HTTP协议
第三章 系统设计与相关技术
3.1系统设计概况
3.1.1系统设计的总体目标
3.1.2系统设计开发环境
3.2 程序整体流程图
3.3 网页下载流程
3. 4 实现网页下载的方法
3.5 链接的提取
3.6数据库设计
第四章 测试分析
4.1软件测试平台
4.2测试结果
4.3分析结果
第五章 总结
致谢
参考文献