SlideShare a Scribd company logo
1 of 10
Download to read offline
1 
データの再利用を促進する 
オープンアクセス・オープンデータジャーナル 
Scientific Data: An open access and open data publication 
to facilitate reproducible research 
日本人類遺伝学会・遺伝子治療合同大会ランチョンセミナー 
Hideya KAWAJI 
RIKEN Preventive Medicine & Diagnosis Innovation Program (PMI) 
RIKEN Advanced Center for Computing and Communication (ACCC) 
kawaji@gsc.riken.jp 
Editorial Board Member, Scientific Data 
scientificdata@nature.com
Our research... 
2 
Raw data 
interpretation 
Hypothesis,idea
… can be more productive by sharing 
3 
Raw data 
interpretation 
Hypothesis,idea
Get Credit for Sharing Your Data 
Publications will be indexed and citeable. 
引用可能な形で、査読を経た論文としてデータを公開できるため、研究データの登録や共有に対するクレジットが 
得られる 
Open-access 
Creative Commons licenses (CC-BY/CC-BY-NC) for the main Data 
Descriptor. Each publication supported by CCO metadata. 
全てのユーザーが出版されたデータ記述とデータセットを利用可能 
Focused on Data Reuse 
All the information others need to reuse the data; no interpretative 
analysis, or hypothesis testing 
他者がデータを再利用するのに必要な情報のみ出版;分析や仮説検証などを含まない 
Peer-reviewed 
Rigorous peer-review focused on technical data quality and reuse value 
データが該当する研究コミュニティーで標準的な形式・内容かどうかに焦点を当て、データの品質と再利用性につい 
て厳格な査読を行う 
Promoting Community Data Repositories 
Not a new data repository; data stored in community data repositories 
本誌は新しいデータリポジトリではなく、データセット自体は各研究コミュニティーに認知されたリポジトリを利用 する 
ので、リポジトリ活用も促進する
Get credit. 
The ‘Data Descriptor’ article 
Detailed descriptions of the methods and technical analyses supporting 
the quality of the measurements. Does not contain tests of new scientific 
hypotheses 
実験やデータ収集の質を保障する技術的分析や方法の詳細な記述。新たな科学的仮説の検証は含まない。 
Sections: 
• Title 
• Abstract 
• Background & Summary 
• Methods 
• Technical Validation 
• Data Records 
• Usage Notes 
• Figures & Tables 
• References 
• Data Citations
Scientific Data – launched May 2014 
Article type: 
Peer-reviewed “Data Descriptor”. 
Editorial team 
Managing Editor (Andrew Hufton) 
Editorial Curator (Varsha Khodiyar) 
Honorary Academic Editor (Susanna Sansone, Oxford) 
Advisory Panel and Editorial Board 
Open access article processing charge 
$1,000 USD / £650 GBP / €750 for each accepted article 
6 
Open access.
Data reuse 
Example: Datasets not described in 
existing publications 
Experimental metadata 
or 
structured component 
(in-house curated, 
machine-readable 
metadata with each 
article) 
Article or 
narrative 
component 
(PDF and HTML)
Peer-reviewed 
Peer review at Scientific Data 
Focuses on: 
• Completeness (can others reproduce?) 
完全性(データを他者が再現し再利用できるか?) 
• Consistency (were community standards followed?) 
一貫性(コミュニティーの報告基準に従っているか?) 
• Integrity (are data in the best repository?) 
整合性(データは適切なリポジトリに登録されているか?) 
• Experimental rigour and technical quality 
(were the methods sound?) 
実験の厳密さと技術的品質(実験方法は有効か?) 
Does not focus on: 
• Perceived impact/importance 予測されるインパクトや重要性 
• Size/complexity of data データの規模や複雑さ 
with community.
Example: Expand on previous publication 
• Genome resequencing data released 
to GenBank & ENA 
• Mapped QTLs released as 
Supplementary Material 
• Phenotypic data (195 assays) with 
richer methods descriptions 
• Genotyping array data via 
ArrayExpress 
• Haplotype dosages (>10GB) 
• Remapping of all data to the newest 
Rat genome version
The role of data journals/papers 
• Credit/incentive for researchers to publish data 
クレジットを得ることが、研究者がデータを公開するインセンティブに 
• Mechanism to publish data not associated with a traditional 
publication 従来の出版物には無かった、データ公開のための機能を提供する 
• Full peer review and curation of data enables reuse and helps 
compliance with community/funder expectations 
データの査読とキュレーションによってデータを再利用可能なものとすると同時に、コミュニティと助成金提供者の期待と一致させる 
• Make datasets more visible an discoverable 
データセットの可視性と発見可能性を高める 
• Narrative helps understanding of methodological details 
説明的記述がデータ収集や実験方法など詳細の理解を助ける 
• Important part of NPG’s initiative to increase reproducibility 
(via Data Descriptors in Scientific Data)  
Scientific DataのData Descriptorの場合、研究の再現・再利用を促すというNPGのイニシアティブにおいて中心的役割を担う 
10

More Related Content

Similar to 141122 sci data-japan_nov2014

Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018
Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018 Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018
Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018 Yasuhiro Murayama
 
Cytoscape Ecosystem Presentation at DBCLS Kashiwa
Cytoscape Ecosystem Presentation at DBCLS KashiwaCytoscape Ecosystem Presentation at DBCLS Kashiwa
Cytoscape Ecosystem Presentation at DBCLS KashiwaKeiichiro Ono
 
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築Yasuyuki Minamiyama
 
2008 icse-granularity in software product lines
2008 icse-granularity in software product lines2008 icse-granularity in software product lines
2008 icse-granularity in software product linesn-yuki
 
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けてMasahito Nose
 
Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用KAMURA
 
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object DetectionEfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detectionharmonylab
 
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)Ikki Ohmukai
 
20100422集合知と専門家
20100422集合知と専門家20100422集合知と専門家
20100422集合知と専門家Tomoaki Watanabe
 
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"SIGSTJ
 
39th MTG in NIBIO
39th MTG in NIBIO39th MTG in NIBIO
39th MTG in NIBIOMaori Ito
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation libraryKouta Shiobara
 
Linked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試みLinked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試みShun Shiramatsu
 

Similar to 141122 sci data-japan_nov2014 (20)

研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割
 
Sgepss2013 koyama
Sgepss2013 koyamaSgepss2013 koyama
Sgepss2013 koyama
 
20151029 CODATA
20151029 CODATA20151029 CODATA
20151029 CODATA
 
データ共有基盤の構築に向けて
データ共有基盤の構築に向けてデータ共有基盤の構築に向けて
データ共有基盤の構築に向けて
 
Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018
Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018 Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018
Slides by Y. Murayama at Earth & Planetary Sscience session at JOSS2018
 
Cytoscape Ecosystem Presentation at DBCLS Kashiwa
Cytoscape Ecosystem Presentation at DBCLS KashiwaCytoscape Ecosystem Presentation at DBCLS Kashiwa
Cytoscape Ecosystem Presentation at DBCLS Kashiwa
 
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築
研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築
 
2008 icse-granularity in software product lines
2008 icse-granularity in software product lines2008 icse-granularity in software product lines
2008 icse-granularity in software product lines
 
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
 
20151028koyama
20151028koyama20151028koyama
20151028koyama
 
Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
 
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object DetectionEfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detection
 
050830 openforum
050830 openforum050830 openforum
050830 openforum
 
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
 
20100422集合知と専門家
20100422集合知と専門家20100422集合知と専門家
20100422集合知と専門家
 
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
 
39th MTG in NIBIO
39th MTG in NIBIO39th MTG in NIBIO
39th MTG in NIBIO
 
Kspin20121201 kobayashi
Kspin20121201 kobayashiKspin20121201 kobayashi
Kspin20121201 kobayashi
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation library
 
Linked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試みLinked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試み
 

141122 sci data-japan_nov2014

  • 1. 1 データの再利用を促進する オープンアクセス・オープンデータジャーナル Scientific Data: An open access and open data publication to facilitate reproducible research 日本人類遺伝学会・遺伝子治療合同大会ランチョンセミナー Hideya KAWAJI RIKEN Preventive Medicine & Diagnosis Innovation Program (PMI) RIKEN Advanced Center for Computing and Communication (ACCC) kawaji@gsc.riken.jp Editorial Board Member, Scientific Data scientificdata@nature.com
  • 2. Our research... 2 Raw data interpretation Hypothesis,idea
  • 3. … can be more productive by sharing 3 Raw data interpretation Hypothesis,idea
  • 4. Get Credit for Sharing Your Data Publications will be indexed and citeable. 引用可能な形で、査読を経た論文としてデータを公開できるため、研究データの登録や共有に対するクレジットが 得られる Open-access Creative Commons licenses (CC-BY/CC-BY-NC) for the main Data Descriptor. Each publication supported by CCO metadata. 全てのユーザーが出版されたデータ記述とデータセットを利用可能 Focused on Data Reuse All the information others need to reuse the data; no interpretative analysis, or hypothesis testing 他者がデータを再利用するのに必要な情報のみ出版;分析や仮説検証などを含まない Peer-reviewed Rigorous peer-review focused on technical data quality and reuse value データが該当する研究コミュニティーで標準的な形式・内容かどうかに焦点を当て、データの品質と再利用性につい て厳格な査読を行う Promoting Community Data Repositories Not a new data repository; data stored in community data repositories 本誌は新しいデータリポジトリではなく、データセット自体は各研究コミュニティーに認知されたリポジトリを利用 する ので、リポジトリ活用も促進する
  • 5. Get credit. The ‘Data Descriptor’ article Detailed descriptions of the methods and technical analyses supporting the quality of the measurements. Does not contain tests of new scientific hypotheses 実験やデータ収集の質を保障する技術的分析や方法の詳細な記述。新たな科学的仮説の検証は含まない。 Sections: • Title • Abstract • Background & Summary • Methods • Technical Validation • Data Records • Usage Notes • Figures & Tables • References • Data Citations
  • 6. Scientific Data – launched May 2014 Article type: Peer-reviewed “Data Descriptor”. Editorial team Managing Editor (Andrew Hufton) Editorial Curator (Varsha Khodiyar) Honorary Academic Editor (Susanna Sansone, Oxford) Advisory Panel and Editorial Board Open access article processing charge $1,000 USD / £650 GBP / €750 for each accepted article 6 Open access.
  • 7. Data reuse Example: Datasets not described in existing publications Experimental metadata or structured component (in-house curated, machine-readable metadata with each article) Article or narrative component (PDF and HTML)
  • 8. Peer-reviewed Peer review at Scientific Data Focuses on: • Completeness (can others reproduce?) 完全性(データを他者が再現し再利用できるか?) • Consistency (were community standards followed?) 一貫性(コミュニティーの報告基準に従っているか?) • Integrity (are data in the best repository?) 整合性(データは適切なリポジトリに登録されているか?) • Experimental rigour and technical quality (were the methods sound?) 実験の厳密さと技術的品質(実験方法は有効か?) Does not focus on: • Perceived impact/importance 予測されるインパクトや重要性 • Size/complexity of data データの規模や複雑さ with community.
  • 9. Example: Expand on previous publication • Genome resequencing data released to GenBank & ENA • Mapped QTLs released as Supplementary Material • Phenotypic data (195 assays) with richer methods descriptions • Genotyping array data via ArrayExpress • Haplotype dosages (>10GB) • Remapping of all data to the newest Rat genome version
  • 10. The role of data journals/papers • Credit/incentive for researchers to publish data クレジットを得ることが、研究者がデータを公開するインセンティブに • Mechanism to publish data not associated with a traditional publication 従来の出版物には無かった、データ公開のための機能を提供する • Full peer review and curation of data enables reuse and helps compliance with community/funder expectations データの査読とキュレーションによってデータを再利用可能なものとすると同時に、コミュニティと助成金提供者の期待と一致させる • Make datasets more visible an discoverable データセットの可視性と発見可能性を高める • Narrative helps understanding of methodological details 説明的記述がデータ収集や実験方法など詳細の理解を助ける • Important part of NPG’s initiative to increase reproducibility (via Data Descriptors in Scientific Data)  Scientific DataのData Descriptorの場合、研究の再現・再利用を促すというNPGのイニシアティブにおいて中心的役割を担う 10