面向水利元数据的动态分面搜索引擎设计.doc

  
约70页DOC格式手机打开展开

面向水利元数据的动态分面搜索引擎设计, 2.86万字70页 原创作品,通过查重系统 摘要传统的水利数据检索以关键字搜索为主。但是水利行业随着信息化的发展,各级部门都积累了大量的数据,由于各部门采集手段、采集时间、处理方式的不同导致水利数据呈现异构的特征。用户需要在短时间内从海量的异构水利元数据中查找出自己所需要的数据,已...
编号:99-583719大小:2.75M
分类: 论文>计算机论文

内容介绍

此文档由会员 第二波打卡 发布

面向水利元数据的动态分面搜索引擎设计

2.86万字 70页 原创作品,通过查重系统


摘要

传统的水利数据检索以关键字搜索为主。但是水利行业随着信息化的发展,各级部门都积累了大量的数据,由于各部门采集手段、采集时间、处理方式的不同导致水利数据呈现异构的特征。用户需要在短时间内从海量的异构水利元数据中查找出自己所需要的数据,已经不是简单的关键字检索所所能够满足的。在大多数情况下,用户对被搜索的水利对象没有预先地认识,而海量的搜索结果可能会淹没用户。分面搜索是利用物体的多维度属性,将搜索结果进行聚类,它能够使用户快速地熟悉被搜索对象的关键属性,并能够引导用户对搜索结果进行筛选。它的出现解决了传统搜索方法的不足,并为大量数据的信息检索奠定了基础。
如何将最有意义的分面推荐给用户是本文研究的重点内容。传统的分面推荐方法主要依据覆盖率、分布熵、相关性。本文提出了利用保持率来推荐分面,通过保持率衡量分面值和分面之间的相关性,将保持率和覆盖率相结合设计出一个公式来计算分面得分的分值,根据分值的大小推荐分面。
本文利用自行设计的算法,开发了一个面向水利元数据的动态分面搜索引擎。该搜索引擎能够通过关键字准确地检索出相关水利对象,并为用户推荐合适的分面。通过采集长江水利委员会数据资源的元数据建立资源目录,对本文所设计的系统进行实验分析。


关键词:水利数据;分面搜索;关键字搜索;分面推荐;覆盖率;相关性;分布熵;保持率