信息检索论文.doc
约5页DOC格式手机打开展开
信息检索论文,页数 5字数 5071 摘要 “信息”已成为今天使用频率最高的词汇之一。搜索引擎“搜狐”上查到的32217个网站,2444525张网页;inforseek上71418个网站,13376974张网页。获取信息、评价信息、使用信息的能力,已经是信息社会劳动者必须掌握的终身技能。教育专家们在20年前就宣布,面向2...
内容介绍
此文档由会员 天缘 发布
信息检索论文
页数 5 字数 5071
摘要
“信息”已成为今天使用频率最高的词汇之一。搜索引擎“搜狐”上查到的32217个网站,2444525张网页;Inforseek上71418个网站,13376974张网页。获取信息、评价信息、使用信息的能力,已经是信息社会劳动者必须掌握的终身技能。教育专家们在20年前就宣布,面向21世纪的学生,除了要接受传统的阅读、写作教育外,还必须具备一定的信息素质。为此,美国 “信息素质全国论坛”将45项评价标准列为全国教育总目标的评价内容。
大约在4000年前,人类就开始有了信息组织和信息检索的活动。典型的一个例子是书的目录。因为信息的 范围最终会超出一本书或多本书的容纳空间,因此需要建立特殊的信息结构,保障对存储数据的快速存储。一种普便使用的用于快速检索的数据结构是索引(index),即选择一组词或概念,并通过指针与相关信息(或对象)关联。索引是现代信息检索系统的核心,他提供快速的对数据的存取,加快查询处理任务。
多个世纪以来,索引是手工方式产生的,形成分类的的层次。事实上,现在的许多图书馆仍然在使用这样的分类层次来对收藏的资料进行分类。通常这种层次是从图书馆科学的领域出发,根据人的主观来设计。现在,计算机技术的发展使得自动构建大型索引成为可能。自动索引技术为查询提供的支持更多地是与系统本身相关,与用户需要的相关程度就低一些,于是,就产生了两种不同的检索策略,既以计算机为中心的和以人为中心的信息检索。
对于以计算机为中心的观点,信息检索问题主要是建立有效的索引,高性能地处理用户的查询,开发排序算法以改善查询应答子集的“质量”。对于以人为中心的观点,信息检索问题主要是研究用户的行为,理解他们的主要需求,根据这些需求改进和完善检索系统的组织和操作。那么,根据以人为中心的观点,基于关键字的查询处理就不是一种好的检索策略。
参考文献
《哈罗德图书馆业务常用词汇》第5版
页数 5 字数 5071
摘要
“信息”已成为今天使用频率最高的词汇之一。搜索引擎“搜狐”上查到的32217个网站,2444525张网页;Inforseek上71418个网站,13376974张网页。获取信息、评价信息、使用信息的能力,已经是信息社会劳动者必须掌握的终身技能。教育专家们在20年前就宣布,面向21世纪的学生,除了要接受传统的阅读、写作教育外,还必须具备一定的信息素质。为此,美国 “信息素质全国论坛”将45项评价标准列为全国教育总目标的评价内容。
大约在4000年前,人类就开始有了信息组织和信息检索的活动。典型的一个例子是书的目录。因为信息的 范围最终会超出一本书或多本书的容纳空间,因此需要建立特殊的信息结构,保障对存储数据的快速存储。一种普便使用的用于快速检索的数据结构是索引(index),即选择一组词或概念,并通过指针与相关信息(或对象)关联。索引是现代信息检索系统的核心,他提供快速的对数据的存取,加快查询处理任务。
多个世纪以来,索引是手工方式产生的,形成分类的的层次。事实上,现在的许多图书馆仍然在使用这样的分类层次来对收藏的资料进行分类。通常这种层次是从图书馆科学的领域出发,根据人的主观来设计。现在,计算机技术的发展使得自动构建大型索引成为可能。自动索引技术为查询提供的支持更多地是与系统本身相关,与用户需要的相关程度就低一些,于是,就产生了两种不同的检索策略,既以计算机为中心的和以人为中心的信息检索。
对于以计算机为中心的观点,信息检索问题主要是建立有效的索引,高性能地处理用户的查询,开发排序算法以改善查询应答子集的“质量”。对于以人为中心的观点,信息检索问题主要是研究用户的行为,理解他们的主要需求,根据这些需求改进和完善检索系统的组织和操作。那么,根据以人为中心的观点,基于关键字的查询处理就不是一种好的检索策略。
参考文献
《哈罗德图书馆业务常用词汇》第5版