基于文本的web图片搜索引擎的研究.doc
约65页DOC格式手机打开展开
基于文本的web图片搜索引擎的研究,65页共计39501字摘要本文研究工作是针对web图片搜索引擎的应用背景,以构建大型web图片搜索引擎为目标,提出基于文本检索方式的web图片搜索引擎设计方案。文中介绍和研究了一系列与web图片搜索引擎相关的技术,包括网页抓取、相关性排序(vsm和lsi)、信息提取、信息索引等,这些技术将被应用到文中提出的系统设计方案...
内容介绍
此文档由会员 bfxqt 发布
65页共计39501字
摘 要
本文研究工作是针对Web图片搜索引擎的应用背景,以构建大型Web图片搜索引擎为目标,提出基于文本检索方式的Web图片搜索引擎设计方案。
文中介绍和研究了一系列与Web图片搜索引擎相关的技术,包括网页抓取、相关性排序(VSM和LSI)、信息提取、信息索引等,这些技术将被应用到文中提出的系统设计方案中。
本文重点地研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对真实数据进行实验和分析的基础上,提出了若干关键技术,用于系统的设计,现归纳如下:
1) 本文提出的方法通过细致地分析HTML文件的标记、标记、网页标题、网页的超链接文本、图片URL、标记、关联的和结构、
摘 要
本文研究工作是针对Web图片搜索引擎的应用背景,以构建大型Web图片搜索引擎为目标,提出基于文本检索方式的Web图片搜索引擎设计方案。
文中介绍和研究了一系列与Web图片搜索引擎相关的技术,包括网页抓取、相关性排序(VSM和LSI)、信息提取、信息索引等,这些技术将被应用到文中提出的系统设计方案中。
本文重点地研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对真实数据进行实验和分析的基础上,提出了若干关键技术,用于系统的设计,现归纳如下:
1) 本文提出的方法通过细致地分析HTML文件的标记、标记、网页标题、网页的超链接文本、图片URL、标记、关联的和结构、