基于spider技术的搜索引擎的实现.doc

约6页DOC格式手机打开展开

基于spider技术的搜索引擎的实现,基于spider技术的搜索引擎的实现页数:5字数:4112【内容提要】本文介绍了基于spider技术的搜索引擎的核心实现--内容分析与查询。该核心采用了相关的信息处理和人工智能技术,提出了逐词扫描最大匹配法对网页内容进行切词处理,以及以用户“点击率”的观点对网页进行排名,从而解决了查询速度慢和准确度低的实际问题,满足了...
编号:10-62707大小:67.00K
分类: 论文>其他论文

内容介绍

此文档由会员 cnlula 发布

基于SPIDER技术的搜索引擎的实现


页数:5 字数:4112


【内容提要】本文介绍了基于SPIDER技术的搜索引擎的核心实现--内容分析与查询。该核心采用了相关的信息处理和人工智能技术,提出了逐词扫描最大匹配法对网页内容进行切词处理,以及以用户“点击率”的观点对网页进行排名,从而解决了查询速度慢和准确度低的实际问题,满足了用户对搜索引擎又快又准的迫切要求。

【关键词】SPIDER技术、搜索引擎、逐词扫描最大匹配法、点击率

ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more