2014年3月27日,W3C的Web上的逗号分隔值工作组(CSV on the Web Working Group)发布了两份标准草案的标准草案,这是这两份草案首次向公众公开征求意见(First Public Working Draft),也是W3C在大数据时代下开展的阶段性工作。
- Web上的CSV用例及需求(CSV on the Web: Use Cases and Requirements):该文档收集了一组基于CSV格式在Web上发布数据的用例,作为工作组开展工作的基础。据观察,在Web上发布的大量数据都是表格数据(tabular data),它们中很多采用IETF定义的逗号分隔值文件格式 (CSV,RFC 4180)的发布。工作组希望开发一组技术,帮助依赖于数据的应用程序在使用这些公布在Web上的、基于CSV或其他类似格式的表格数据时,获得访问数据及互操作能力。文档公布了一批工作组认为具有代表性的用例,给出了使用CSV等表格数据的典型场景,展示了现有技术在这些场景中的不足和局限性。文档也列举了一组根据这些用例梳理后的技术需求,指导工作组后续标准的研发工作。
- Web上的表格数据及元数据模型(Model for Tabular Data and Metadata on the Web):该文档给出了一个关于表格数据(tabular data)的基本的数据模型(信息集,infoset),以及寻找和定位元数据的不同方法。该工作组章程中提到的其中一个目标就是提供一个元数据词汇表(metadata vocabulary),并提供一组标准方法,帮助应用程序找到所需的元数据。该文档还包括一些表格数据格式的最佳实践,及其到数据模型的以映射,以及对IETF CSV语法格式(RFC 4180)的贡献等非形式化的信息。
更多信息,请参阅W3C的数据标准计划(Data Activity)。设立于2013年11月的W3C数据标准计划合并了原来的语义Web标准计划(Semantic Web Activity)、电子政府标准计划(e-Government Activity),并新增了Web数据最佳实践工作组(Data on the Web Best Practices WG)、Web上的逗号分隔值(CSV on the Web)两个工作组。更多信息,请参阅W3C的领域、标准计划及工作组。
评论已关闭