基于spider技术的搜索引擎的实现.doc
约6页DOC格式手机打开展开
基于spider技术的搜索引擎的实现,基于spider技术的搜索引擎的实现页数:5字数:4112【内容提要】本文介绍了基于spider技术的搜索引擎的核心实现--内容分析与查询。该核心采用了相关的信息处理和人工智能技术,提出了逐词扫描最大匹配法对网页内容进行切词处理,以及以用户“点击率”的观点对网页进行排名,从而解决了查询速度慢和准确度低的实际问题,满足了...
内容介绍
此文档由会员 cnlula 发布
基于SPIDER技术的搜索引擎的实现
页数:5 字数:4112
【内容提要】本文介绍了基于SPIDER技术的搜索引擎的核心实现--内容分析与查询。该核心采用了相关的信息处理和人工智能技术,提出了逐词扫描最大匹配法对网页内容进行切词处理,以及以用户“点击率”的观点对网页进行排名,从而解决了查询速度慢和准确度低的实际问题,满足了用户对搜索引擎又快又准的迫切要求。
【关键词】SPIDER技术、搜索引擎、逐词扫描最大匹配法、点击率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more
页数:5 字数:4112
【内容提要】本文介绍了基于SPIDER技术的搜索引擎的核心实现--内容分析与查询。该核心采用了相关的信息处理和人工智能技术,提出了逐词扫描最大匹配法对网页内容进行切词处理,以及以用户“点击率”的观点对网页进行排名,从而解决了查询速度慢和准确度低的实际问题,满足了用户对搜索引擎又快又准的迫切要求。
【关键词】SPIDER技术、搜索引擎、逐词扫描最大匹配法、点击率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more