一、论文关联数据的定义
论文关联数据是指通过基础研究、应用研究、试验开发等产生的用于支撑学术论文发表的数据,以及通过观测监测、考察调查、检验检测等方法取得并用于形成论文图表、支撑论文研究结论的原始数据及其衍生数据。
二、论文关联数据共享的意义
论文关联数据,是论文研究成果和结论的重要佐证。论文关联数据的共享,具有如下重要意义:(1)提升研究的可验证性和透明度;(2)提升科技论文的受关注度和影响力;(3)促进数据的重复使用,节省人力物力,有助于科学家聚焦于创新研究;(4)论文数据作为一种新型学术成果,将促进学科领域间的创新合作和人才培养,推进开放式科学实践。
三、论文关联数据的类型及共享要求
基于数据的不同类型,须采取相应的共享要方式:(1)用于直接支撑论文结论的数据,必须共享;(2)为开展论文课题研究而产生的且反映在论文中的数据,或为开展论文课题研究而进行重复使用或分析的数据,鼓励共享;(3)为开展论文课题研究从实验或观察中得到的原始的、未加工的且未反映在论文中的数据,自愿共享。
涉及科研伦理、敏感信息、保密信息或共享数据将损害第三方合法权益等情况的数据不宜共享。对于不宜共享的数据,若已进行不可逆的脱敏处理或因其他合法合理的原因可以共享的,数据作者提供脱敏声明或其他证明文件后可以共享。
四、数据标准和格式
论文关联数据的共享,原则是不限制数据格式。但从数据可重用、可长期访问等方面考虑,建议作者优先采用下表所列的推荐格式。
若所选数据文件格式尚不在下表中,本刊推荐作者从以下三个方面自行评估数据文件的可重用和长期可持续访问情况:
1. 采用的文件格式是领域内的常用格式;
2. 采用的文件格式有开放的规范或标准;
3. 采用的文件格式独立于特定的软件、开发人员或供应商。
若所选数据文件须使用特定且非通用软件来打开、使用,作者须同时提供相关软件的名称、使用方式等信息。
|
文件类型
|
推荐格式
|
非首选格式推荐
|
|
纯文本文件
|
Unicode text(.txt)
|
Non-Unicode text(.txt)
|
|
标签语言文件
|
XML(.xml)
HTML(.html)
Related files: .css, .xslt, .js, .es
|
SGML(.sgml)
|
|
文本文档
|
PDF/A(.pdf)
|
ODT(.odt)
MS Word Microsoft Word(.doc, .docx)
Rich Text File (.rtf)
PDF (.pdf)
|
|
RDF
|
RDF/XML (.rdf)
Trig (.trig)
Turtle (.ttl)
NTriple (.nt)
JSON-LD
|
|
|
电子数据表
|
CSV(.csv) ODS(.ods)
|
MS Excel (.xls, .xlsx)
PDF/A (.pdf)
OOXML(.doc, .docx)
|
|
数据库文件
|
SQL(.sql)
SIARD (.siard)
DB tables (.csv)
|
MS Access (.mdb, .accdb) (v.2000 or later)
dBase (.dbf v.7 or later)
HDF5 (.hdf5, .he5, .h5)
|
|
统计数据
|
SPSS Portable (.por)
STATA (.dta)
DDI (.xml)
Data and setup (.csv +.txt)
R
|
SPSS (.sav)
SAS (.7dat, .sd2, .tpt)
|
|
光栅图片
|
JPEG (.jpg, .jpeg)
TIFF (.tif, .tiff)
PNG (.png)
JPEG 2000 (.jp2)
DICOM (.dcm)
|
|
|
0矢量图片
|
SVG (.svg)
|
Adobe Illustrator (.ai)
EPS (.eps)
CDR (.cdr)
WMF/EMF (.wmf, .emf)
|
|
音频文件
|
BWF (.bwf)
MXF (.mxf)
Matroska (.mka)
FLAC (.flac)
|
WAVE (.wav)
MP3 (.mp3)
AAC (.aac, .m4a)
AIFF (.aif, .aiff)
OGG(.ogg)
|
五、数据存储与方式
作者须将论文关联数据提交至数据存储库进行存储,本刊优先推荐的数据存储库为:科学数据银行Science Data Bank(ScienceDB)。
在数据存储库中提交的数据,会获得数据唯一标识(如CSTR、DOI),该标识用于查询和访问相关数据。
六、数据的提交
(一)数据提交流程
这里以科学数据银行Science Data Bank (ScienceDB)为例,介绍数据提交的流程。
1. 平台注册与登录:作者可选择数据存储库平台账户注册登录,也可选择存储库平台支持的第三方用户认证登录。
2. 数据提交与修改:作者通过数据提交入口,创建一个新的数据,此时数据即被分配唯一标识(CSTR和DOI)和私有访问链接。作者在此流程中填写元数据信息、上传数据文件、选择开放共享方式等信息,此时作者可以暂存草稿并进行信息更改,直至提交。数据提交后,若数据审核方反馈了修改意见,用户则需要对数据进行修改,直至数据通过审核。 数据发布前,数据仅可通过私有访问链接、匿名私有链接进行编辑部审稿等内部传播。
3. 数据发布与传播:数据审核通过并发布后,数据唯一标识生效,数据可在平台、传播索引平台被检索到,可复制数据唯一标识(CSTR和DOI)用于数据分享与传播。
4. 数据更新:数据一旦发表,如需追加文件或进行数据更新操作,作者需重新发起数据新版本的创建,并对更新信息进行提交。与旧版本一样,用户更新信息需要审核后才能发布。
(二)数据提交时间
作者应在录用阶段完成论文关联数据的提交。
七、数据共享方式
数据共享的方式有两种:直接共享和有条件共享。作者可根据实际需要二选一。
(一)直接共享
作者提交的论文关联数据,一旦通过评审,将即刻发布,即元数据和数据文件开放给公众访问获取。
(二)有条件共享
有条件共享分如下两种情况:
1. 数据保护期后获取:作者提交的论文关联数据可设置保护期。保护期内,公众仅能访问数据的元数据,而无法下载获取数据文件。保护期过后,数据自动转为开放获取状态,公众可访问获取其元数据和数据文件。
2. 依申请获取:作者提交的论文关联数据因特殊原因不宜开放共享,数据使用者须向作者提出数据访问申请,得到作者授权或同意后,才能获取数据文件。对于不宜开放共享的数据,作者应当向本刊提供相关情况的书面说明和相关证明材料。
八、数据权益管理
(一)对于数据提交者
作者应当确认其有权提交数据。数据相关知识产权由原权利主体享有,不会转移至本刊。
(二)对于数据使用者
数据使用者须根据作者选择的数据使用许可协议对数据进行使用。
作者可选择的数据使用许可协议包括但不限于:CC0(弃权)、CC-BY 4.0(署名)、CC BY-SA 4.0(署名-以相同方式共享)、CC BY-NC 4.0(署名-非商用)、CC BY-NC-SA 4.0(署名-非商用-以相同方式共享)、CC BY-ND 4.0(署名-不得传播衍生作品)、CC BY-NC-ND 4.0(署名-非商用-不得传播衍生作品)和ODbL(署名-以相同方式共享-保持开放,此协议适用于大规模数据集或数据库)。CC协议完整版请查看:https://creativecommons.org/about/cclicenses/;ODbL协议完整版请查看:https://opendatacommons.org/licenses/odbl/1-0/。
为了更好地传播和共享论文关联数据,本刊推荐作者使用CC-BY 4.0许可协议。
九、数据审核
本刊对作者提交的论文关联数据进行形式审核,主要审核数据是否已上传、上传的数据是否可访问、是否已提交数据可用性声明(如要求提供)等内容。
十、数据可用性声明
《数据可用性声明》是对论文关联数据是否可获取以及具体获取方式的说明文件或文字,主要包括论文关联数据的存储方式、访问链接等内容。《数据可用性声明》有助于提高研究的透明度和可重复性,对论文结论的重复验证、数据重用、科研诚信等均具有重要意义。
《数据可用性声明》应当包括以下内容:数据的存储方式及访问链接、数据的唯一标识符(如有)、打开或使用数据的软件或工具名称。若论文关联数据为不宜共享的数据,应当明确说明并给出访问数据的具体条件及方式。
作者应将《数据可用性声明》附于论文正文之后、参考文献之前。
《数据可用性声明》模板如下,供作者参考:
(一)一般模板:
本论文的关联数据(CSTR:31253.11.sciencedb.01092,DOI:10.11922/sciencedb.01092)可在科学数据银行数据库(https://cstr.cn/31253.11.sciencedb.01092,https://doi.org/10.11922/sciencedb.01092)中访问获取。
(二)需特殊软件工具打开的数据:
本论文的关联数据(CSTR:31253.11.sciencedb.01092,DOI:10.11922/sciencedb.01092)可在科学数据银行数据库(https://cstr.cn/31253.11.sciencedb.01092,https://doi.org/10.11922/sciencedb.01092)中访问获取,该论文关联数据的打开软件为(软件名称,示例:Sandboxie)。
(三)依申请获取的数据:
本论文的关联数据因涉及(不宜公开共享的原因,示例:可能存在的潜在利益冲突)为不宜公开共享的数据,可依据合理理由通过申请获取,申请链接:(https://cstr.cn/31253.11.sciencedb.25151,https://doi.org/10.57760/sciencedb.25151)。
(四)无法共享的数据:
本论文的关联数据因(无法共享的原因,示例:涉及个人隐私数据)无法共享。
(五)无论文关联数据:
本篇论文(无论文关联数据的原因,示例:是在理论和数学方法内进行的),不产生或分析任何数据,因此无论文关联数据。
十一、数据的引用
论文关联数据作为作者的知识劳动成果应当得到尊重和认可,使用论文关联数据时需要在参考文献中对其进行规范的引用。
本刊要求的数据标引格式如下:作者. 标题[DS/OL]. 版本. 存储地址. 出版年份[引用日期]. 解析地址. 唯一标识符.
示例:Di Li, Pei Wang, Weiwei Zhu, et al. A bimodal burst energy distribution of a repeating fast radio burst source[DS/OL]. V3. Science Data Bank, 2023[2024-11-19]. https://cstr.cn/31253.11.sciencedb.01092. CSTR: 31253.11.sciencedb.01092.