1. 1
データの再利用を促進する
オープンアクセス・オープンデータジャーナル
Scientific Data: An open access and open data publication
to facilitate reproducible research
日本人類遺伝学会・遺伝子治療合同大会ランチョンセミナー
Hideya KAWAJI
RIKEN Preventive Medicine & Diagnosis Innovation Program (PMI)
RIKEN Advanced Center for Computing and Communication (ACCC)
kawaji@gsc.riken.jp
Editorial Board Member, Scientific Data
scientificdata@nature.com
3. … can be more productive by sharing
3
Raw data
interpretation
Hypothesis,idea
4. Get Credit for Sharing Your Data
Publications will be indexed and citeable.
引用可能な形で、査読を経た論文としてデータを公開できるため、研究データの登録や共有に対するクレジットが
得られる
Open-access
Creative Commons licenses (CC-BY/CC-BY-NC) for the main Data
Descriptor. Each publication supported by CCO metadata.
全てのユーザーが出版されたデータ記述とデータセットを利用可能
Focused on Data Reuse
All the information others need to reuse the data; no interpretative
analysis, or hypothesis testing
他者がデータを再利用するのに必要な情報のみ出版;分析や仮説検証などを含まない
Peer-reviewed
Rigorous peer-review focused on technical data quality and reuse value
データが該当する研究コミュニティーで標準的な形式・内容かどうかに焦点を当て、データの品質と再利用性につい
て厳格な査読を行う
Promoting Community Data Repositories
Not a new data repository; data stored in community data repositories
本誌は新しいデータリポジトリではなく、データセット自体は各研究コミュニティーに認知されたリポジトリを利用 する
ので、リポジトリ活用も促進する
5. Get credit.
The ‘Data Descriptor’ article
Detailed descriptions of the methods and technical analyses supporting
the quality of the measurements. Does not contain tests of new scientific
hypotheses
実験やデータ収集の質を保障する技術的分析や方法の詳細な記述。新たな科学的仮説の検証は含まない。
Sections:
• Title
• Abstract
• Background & Summary
• Methods
• Technical Validation
• Data Records
• Usage Notes
• Figures & Tables
• References
• Data Citations
6. Scientific Data – launched May 2014
Article type:
Peer-reviewed “Data Descriptor”.
Editorial team
Managing Editor (Andrew Hufton)
Editorial Curator (Varsha Khodiyar)
Honorary Academic Editor (Susanna Sansone, Oxford)
Advisory Panel and Editorial Board
Open access article processing charge
$1,000 USD / £650 GBP / €750 for each accepted article
6
Open access.
7. Data reuse
Example: Datasets not described in
existing publications
Experimental metadata
or
structured component
(in-house curated,
machine-readable
metadata with each
article)
Article or
narrative
component
(PDF and HTML)
8. Peer-reviewed
Peer review at Scientific Data
Focuses on:
• Completeness (can others reproduce?)
完全性(データを他者が再現し再利用できるか?)
• Consistency (were community standards followed?)
一貫性(コミュニティーの報告基準に従っているか?)
• Integrity (are data in the best repository?)
整合性(データは適切なリポジトリに登録されているか?)
• Experimental rigour and technical quality
(were the methods sound?)
実験の厳密さと技術的品質(実験方法は有効か?)
Does not focus on:
• Perceived impact/importance 予測されるインパクトや重要性
• Size/complexity of data データの規模や複雑さ
with community.
9. Example: Expand on previous publication
• Genome resequencing data released
to GenBank & ENA
• Mapped QTLs released as
Supplementary Material
• Phenotypic data (195 assays) with
richer methods descriptions
• Genotyping array data via
ArrayExpress
• Haplotype dosages (>10GB)
• Remapping of all data to the newest
Rat genome version
10. The role of data journals/papers
• Credit/incentive for researchers to publish data
クレジットを得ることが、研究者がデータを公開するインセンティブに
• Mechanism to publish data not associated with a traditional
publication 従来の出版物には無かった、データ公開のための機能を提供する
• Full peer review and curation of data enables reuse and helps
compliance with community/funder expectations
データの査読とキュレーションによってデータを再利用可能なものとすると同時に、コミュニティと助成金提供者の期待と一致させる
• Make datasets more visible an discoverable
データセットの可視性と発見可能性を高める
• Narrative helps understanding of methodological details
説明的記述がデータ収集や実験方法など詳細の理解を助ける
• Important part of NPG’s initiative to increase reproducibility
(via Data Descriptors in Scientific Data)
Scientific DataのData Descriptorの場合、研究の再現・再利用を促すというNPGのイニシアティブにおいて中心的役割を担う
10