2016年8月30日,W3C的Web数据最佳实践工作组(Data on the Web Working Group)发布了Web数据最佳实践(Data on the Web Best Practices)候选推荐标准,向公众征集参考实现。
该文档提供了可以在Web上公开或非公开地共享各种(政府、科研、商业等)数据的建议。其潜在的目标是实现数据智能,进而最大化数据发掘与重复使用的可能性。将URIs用作为标识符和多址接入选择项是提供各种各样元数据的关键,提供了与Web数据出版及使用相关的最佳实践。Web数据本身应该能够被发现和检索,并被人类和机器所理解。数据也有很多种用途,不仅可以被数据的拥有者使用,也可以被外部第三方使用。数据在何处以某一方式被哪一方所使用也应当能够被发现和检索,这也是公认的数据发布者的努力。遵循这些最佳实践将促进数据发布者(publisher)与使用者(consumer)之间的互操作。
工作组同时发布了数据质量词汇表(Data Quality Vocabulary)和数据集使用词汇表(Dataset Usage Vocabulary)两份工作组备案(group note)作为对Web最佳实践候选推荐标准文档的辅助。
上述三份文档都是Web数据最佳实践工作组章程(Charter)中所声明的任务:
1.建设开放的数据生态系统,促进开发者与数据发布者之间的沟通
2.为数据发布者提供指导,通过数据管理方式提高一致性,从而加强对数据的重复使用
3.无论开发者选择使用何种技术,在开发者中间建立他们对数据的信任,推动潜在创新
值得注意的是,由欧洲委员会(European Commission)资助的Share-PSI项目与上述工作密切相关,该项目发布了一系列高水平的政策性最佳实践(Best Practices)以及公共部门在线信息共享指南(guides)。虽然这部分文档主要针对欧洲,然而其中用于多语言多语境的建议也将广泛适用于世界范围。
更多内容,请参阅英文原文。