csv向rdf数据转换器的设计与实现.doc

  
约65页DOC格式手机打开展开

csv向rdf数据转换器的设计与实现,csv向rdf数据转换器的设计与实现2.65万字65页 包括外文翻译,原创作品,通过查重系统摘要近期,国际万维网联盟(w3c)(以下文中皆简称w3c)已经将其电子政务与语义网行动进行合并,启动了数据行动计划,其目的是为了创建数据网(the web of data)。表列数据(tabular data)是现实世界中一类非...
编号:99-583650大小:979.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 第二波打卡 发布

CSV向RDF数据转换器的设计与实现

2.65万字 65页 包括外文翻译,原创作品,通过查重系统

摘 要
近期,国际万维网联盟(W3C)(以下文中皆简称W3C)已经将其电子政务与语义网行动进行合并,启动了数据行动计划,其目的是为了创建数据网(the Web of Data)。表列数据(tabular data)是现实世界中一类非常重要的数据,在表列数据中最典型的是逗号分隔值(Comma-Separated Values CSV)数据。CSV格式虽然简单实用,但是难以表达世系(provenance)、数据域含义等元数据(metadata)或标注(annotations)信息。所以将CSV数据转化为RDF数据对于语义数据的完整表达有重要的作用。同时对于创建数据网(the Web of Data),提高面向数据网的大数据(Big Data)智能分析与处理性能也有着重要的意义。
本文致力于研究CSV向RDF数据转化器的设计与实现。 主要工作包括:
(1) CSV数据的解析与提取:文章选用的是符合核心表列数据模型(core tabular data model)和符合带标注的表列数据模型(annotated tabular data model)的CSV文件作为输入文件,解析提取相应的表列数据作为生成RDF三元组的输入数据。
(2) 元数据文件的解析与提取:文章选用的是符合W3C规范的JSON格式的元数据描述文件,通过本文设计的解析方法,解析提取相应的元数据描述信息作为生成RDF三元组的输入数据。
(3)RDF三元组的生成:文章根据W3C对于生成RDF数据的规范,设计生成方法,结合提前解析提取的表列数据和元数据生成相应的RDF数据。
通过以上工作,本文得出以下结论:
(1)设计实现的CSV向RDF生成器生成的RDF数据是符合W3C的规范要求的。
(2) 本文设计的各类解析算法和生成算法是有效的。


关键词:CSV;元数据;RDF。