学术英文资源站

数据可用性声明撰写指南:

数据可用性声明撰写指南:开放科学背景下的英文表达

自2020年起,《自然》(Nature)与《科学》(Science)两大期刊已先后将**数据可用性声明(Data Availability Statement, DAS)**列为投稿必备要件,违反者直接退回修改。据STM协会(国际科技与医学出版商协会)2023年发布的《开放科学现状报告》,全球已有超过78%的学术…

自2020年起,《自然》(Nature)与《科学》(Science)两大期刊已先后将数据可用性声明(Data Availability Statement, DAS)列为投稿必备要件,违反者直接退回修改。据STM协会(国际科技与医学出版商协会)2023年发布的《开放科学现状报告》,全球已有超过78%的学术期刊在投稿系统中要求作者提交DAS,而2018年这一比例仅为34%。与此同时,中国国家自然科学基金委员会(NSFC)在2023年更新的《科研诚信管理办法》中明确要求受资助项目在发表论文时须附数据可获取说明。对于中国研究生与科研人员而言,用英文撰写一份符合国际期刊规范的DAS,已不再是“加分项”,而是投稿前的硬性门槛

数据可用性声明的核心要素

一份合格的DAS需回答三个问题:数据存在哪里、如何获取、有无限制。根据Taylor & Francis 2022年发布的《数据共享作者指南》,标准DAS应包含数据存储位置(如Zenodo、Figshare、GenBank)、访问方式(公开/受限/按需申请)、以及唯一标识符(DOI或存取号)。若数据因隐私或专利原因无法公开,必须明确说明豁免理由,而非直接省略该声明。

以生物医学领域为例,Nature Portfolio 2023年修订的编辑政策要求:基因序列数据必须提交至NCBI(GenBank、SRA或dbGaP),并在DAS中列出对应的BioProject ID。社会科学领域则常使用ICPSR或OSF平台。无论学科,DAS的英文表达均需避免模糊措辞,如“Data available upon request”已被多家期刊认定为“不可接受”的表述(PLOS ONE 2021年数据政策更新)。

常见英文模板与学科适配

不同学科对DAS的措辞要求差异显著。**Elsevier 2023年《期刊作者指南》**归纳了四类通用模板,按开放程度从高到低排列:

  • 完全开放:“The datasets generated during and/or analysed during the current study are available in the [Repository Name] repository, [DOI/URL].”
  • 受控访问:“The data that support the findings of this study are available from [Third Party Name] but restrictions apply to the availability of these data, which were used under license for the current study, and so are not publicly available.”
  • 按需申请:“Data are available from the authors upon reasonable request and with permission of [Institution/Committee].”
  • 无数据可用:“No datasets were generated or analysed during the current study.”

地球科学领域AGU(美国地球物理学会)2022年政策要求所有数据必须附有永久数字对象标识符(DOI),并推荐使用Zenodo或PANGAEA。而在心理学领域APA(美国心理学会)2021年《期刊文章报告标准》强调需在DAS中明确说明数据是否可被复制,并建议附上分析代码的访问链接

常见错误与规避策略

中国作者在撰写DAS时最常犯的三大错误,根据Elsevier 2023年对5000篇中国投稿的文本分析,包括:

  1. 使用被动模糊语态:如“Data can be obtained from the corresponding author”未明确获取方式。修正策略:改为主动明确句,如“The corresponding author will provide the data upon request within 2 weeks.”
  2. 遗漏唯一标识符:约62%的投稿中DAS未包含DOI或存取号。Crossref 2022年数据注册指南规定,所有公开数据需在注册中心获取永久DOI
  3. 混淆数据与材料:将代码、问卷、实验设备清单混入DAS,而期刊要求单独列出。Nature Protocols 2023年投稿清单明确将“Data Availability”与“Code Availability”分为两个独立章节。

数据存储库的选择与引用格式

选择学科公认的存储库是DAS撰写的前提。**NIH(美国国立卫生研究院)2023年《数据管理与共享政策》**要求受资助项目必须使用FAIR(可发现、可访问、可互操作、可重用)原则认证的存储库。常用平台包括:

  • 通用型:Zenodo(CERN运营,支持任何学科,提供DOI)、Figshare(支持版本控制,引用格式预设)
  • 生命科学:GenBank(NCBI,核苷酸序列)、PRIDE(蛋白质组学)、BioImage Archive(图像数据)
  • 社会科学:ICPSR(密歇根大学,调查数据)、OSF(开放科学框架,支持预注册与数据绑定)
  • 地球科学:PANGAEA(环境数据)、EarthChem(地球化学数据)

在DAS中引用时,必须使用期刊指定的引用格式。例如,**Springer Nature 2023年《数据政策》**要求采用“Author(s), Dataset title, Repository name, Version, Identifier (DOI)”格式,而非自由文本。

期刊政策差异与投稿前核对

不同期刊对DAS的格式与位置要求不一。Taylor & Francis 2023年《期刊政策数据库》显示,约45%的期刊要求DAS置于“Declarations”章节末尾,35%要求单独成段,20%要求嵌入“Methods”部分末尾。投稿前务必查阅期刊官网的“Author Guidelines”中关于Data Policy的专门页面。

PLOS ONE为例,其2024年更新政策强制要求所有作者在提交时填写一份结构化DAS模板,包括:数据是否公开、存储库名称、存取号、数据使用限制。而Elsevier旗下的《细胞》系列期刊则要求DAS必须包含“Data S1”或“Table S1”等补充文件引用。**Wiley 2022年《数据共享作者指南》提醒:若数据存储在私人服务器或机构网站,期刊可能要求提供数据管理计划(DMP)**作为补充材料。

数据可用性声明的语法与词汇规范

英文DAS需遵循学术写作的精确性与一致性。根据剑桥大学出版社2023年《学术写作指南》,DAS应使用一般现在时描述数据当前状态,使用过去时描述生成过程。常见词汇选择包括:

  • 公开访问:publicly available, freely accessible, openly shared
  • 限制访问:restricted access, embargoed, proprietary
  • 按需提供:available upon reasonable request, provided under licence
  • 永久存储:archived, deposited, curated

避免使用“will be uploaded”或“will be made available”等将来时态,除非数据尚未公开且有明确时间表。**IEEE 2023年《数据政策》**特别指出:若数据在投稿时处于embargo期,必须注明“Data will be publicly available from [date] via [repository]”。

跨学科案例:从基因组学到田野调查

不同学科对DAS的措辞密度差异显著。以基因组学为例,Nature Genetics 2023年发表的一篇论文的DAS为:“Whole-genome sequencing data have been deposited in the European Genome-phenome Archive (EGA) under accession code EGAS00001007234. The raw sequencing reads are available under restricted access due to patient consent agreements.” 该声明包含存储库名称、存取号、限制原因。

而在人类学田野调查中,American Anthropologist 2022年的一篇文章的DAS为:“Interview transcripts and field notes are archived at the University of Oxford’s Research Archive (ORA) under DOI 10.5287/ora.123456. Access to sensitive materials is granted upon request to the institutional ethics committee.” 这里体现了对隐私数据的合规处理。

物理学领域Physical Review Letters 2023年则要求:“The data that support the findings of this study are openly available in the High Energy Physics Data Repository at https://doi.org/10.7483/OPENDATA.HEP.12345.” 注意此处直接使用完整URL而非仅引用DOI。

FAQ

Q1:数据可用性声明必须放在论文的哪个位置?

答案:根据Springer Nature 2023年《期刊作者指南》,约70%的期刊要求DAS置于“Declarations”章节(Acknowledgements之后、References之前),20%要求放在“Methods”末尾,10%允许放在Supplementary Materials中。投稿前务必查阅目标期刊的Author Guidelines,部分期刊(如PLOS ONE)提供在线填写界面,DAS不写入正文。

Q2:如果数据涉及第三方版权,DAS该怎么写?

答案:**Elsevier 2022年《数据许可指南》**建议采用如下措辞:“The data used in this study were obtained from the [Third Party Name] under a data use agreement. The authors do not have permission to share the data directly. Requests for access should be directed to [Third Party Contact].” 同时需在参考文献中列出第三方数据的原始来源。约35%的期刊(如《柳叶刀》系列)要求附带数据使用许可的PDF作为补充文件。

Q3:数据尚未公开,但论文已接收,DAS能否写“待公开”?

答案:**Taylor & Francis 2023年《数据政策更新》**允许在DAS中使用embargo措辞,但必须注明具体公开日期。例如:“The datasets will be made publicly available on [date] via [repository]. Until then, data are available from the corresponding author upon reasonable request.” 注意embargo期一般不超过12个月,否则期刊可能要求提供机构批准的延期证明。约8%的期刊(如《自然·通讯》)不接受任何形式的embargo。

参考资料

  • STM Association. (2023). The STM Report: Open Science and Publishing Trends 2023.
  • National Natural Science Foundation of China (NSFC). (2023). Scientific Research Integrity Management Measures.
  • Taylor & Francis. (2022). Author Guide to Data Sharing and Data Availability Statements.
  • PLOS ONE. (2021). Data Policy Update: Requirements for Data Availability Statements.
  • Unilink Education. (2023). International Journal Submission Database: Data Policy Compliance Metrics.