Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Ddbj all ver3

5,536 views

Published on

Registration method of next generation sequencer data

Published in: Science
  • Be the first to comment

  • Be the first to like this

Ddbj all ver3

  1. 1. DRAへのデータ登録 登録までの流れ 1. DRAアカウントの取得 --- 3 2. DRA登録のイメージ --- 6 3. BioProjectの登録 --- 12 4. BioSampleの登録 --- 25 5. DRAへの登録 --- 43 6. 備考 --- 55
  2. 2. 注意1:アスタリスク (*)は、必須項目です。 注意4:すべて入力は英語です。 登録前の注意点 注意2:この資料は、必須項目についてのみ解説しています。 optionalな部分については、補足説明していません。 注意5:より詳細な内容は、DRA Handbookをご覧ください。 注意3:この資料は、Illumina MiSeqを用いた標準的なアンプリ コン解析と微生物ドラフトゲノム解析のデータを登録する と仮定して作製しています。
  3. 3. 1. DRAアカウントの取得
  4. 4. DRAアカウントの取得 ① 登録ポータルD-wayにアクセスします。 ② クリック ③ 必須項目を記入し、 クリック ④ 入力した内容を 確認し、クリック 入力されたアドレス宛に確 認メールが送信されます。 メールに記載されている URLを選択します。 ⑤ パスワードを設定し、 "Set"をクリック アカウントの仮登録完了! 次に所属と公開鍵を登録します。
  5. 5. 所属と公開鍵の登録 Center Full Name: 組織名を入力し,提示される候補 から選択します。 組織名を記入後、"Updata"をクリック Center Nameが登録されると、下部に "Public Key" が表示されます。公開鍵ファイルを参照し、 [Register public key] で公開鍵を登録します。 公開鍵の作成方法は、DDBJの"公開鍵/秘密鍵 ペアの生成"や京都大学学術情報メディアセン ターをご覧ください。
  6. 6. 2. DRA登録のイメージ
  7. 7. DRA登録のイメージ メタデータ ランデータ 関連付け ・シークエンスデータ *.fastq ・サブミッション情報 Submission ・研究情報 Study(=BioProject) ・サンプル情報 Sample(=BioSample) ・実験情報 Experiment ・ラン情報 Run プロジェクト データ ・研究情報 BioProject ・サンプル情報 BioSample 関連付け ① BioProjectとBioSampleの登録 ② ランデータをDDBJのサーバに転送③ サンプル情報とデータの関連付け
  8. 8. Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq 異なる16地点の土壌からDNA抽出を行い、SSU rRNAアンプリコン解析を行った場合 BioSampleBioSampleBioSampleBioSample BioProject BioSampleBioSampleBioSampleBioSample BioSampleBioSampleBioSampleBioSample BioSampleBioSampleBioSampleBioSample 1つのBioSampleに対し、それぞれ ExperimentとRunを1つずつ関連付けます。 メタデータの構成の具体例 その1
  9. 9. 異なる4地点の土壌からDNA抽出を行い、4つの biological or technical replicateで SSU rRNAアンプリコン解析した場合 BioSampleBioSampleBioSampleBioSample BioProject ExperimentExperimentExperimentExperiment Run Run Run Run *.fastq *.fastq *.fastq *.fastq x 4 1つのBioSampleに対し、それぞれ ExperimentとRunを4つずつ関連付け ます。 メタデータの構成の具体例 その2
  10. 10. メタデータの構成の具体例 その3 1種類のバクテリアのドラフトゲノム解読を1種類のライブラリーを用いて行った場合 BioSample BioProject Experiment Run *.fastq 1つのBioSampleに対し、それぞれ ExperimentとRunを1つずつ関連付けます。
  11. 11. 1種類のバクテリアのドラフトゲノム解読を2種類のライブラリーを用いて行った場合 BioSample BioProject Experiment Run *.fastq 1つのBioSampleに対し、それぞれ ExperimentとRunを2つずつ関連付けます。 Experiment Run *.fastq メタデータの構成の具体例 その4
  12. 12. 3. BioProjectの登録
  13. 13. BioProjectの作成 D-wayにログインすると、以下のような画面が表示されます。 ① クリック ② クリックして、新しいプロジェクトIDを作成 ③ 作成されたIDをクリック
  14. 14. BioProjectの登録 – SUBMITTER – 記入後、クリック Name: 氏名を記入します。 E-mail: メールアドレスを記入します。 Submitting organization: 所属名を記入します。 Data release: データ公開の有無を選択します。
  15. 15. BioProjectの登録 – GENERAL INFO – Project title: プロジェクト名を記入します。 Description: 研究目的や実験手法を記述しま す。第三者がデータを解釈するこ とができるように十分な量(100文 字以上)の情報を記入します。 記入後、クリック
  16. 16. BioProjectの登録 – PROJECT TYPE – アンプリコン解析とドラフトゲノム解析によって BioProjectの登録方法が異なります。
  17. 17. BioProjectの登録 – PROJECT TYPE – アンプリコン解析の場合
  18. 18. BioProjectの登録 –アンプリコン解析– Project data type: Metagenomeを選択します。 記入後、クリック Objective: Raw Sequence Readsを選択 します。 名称 選択項目 Sample scope Environment Material Genome Capture Targeted Locus/Loci Methodology Sequencing
  19. 19. BioProjectの登録 –アンプリコン解析– Environmental sample name: Taxonomy Browserの中から、 適切な項目を選択し、記入します。 Environmental sample description: サンプル情報の詳細を記入します。 記入後、クリック
  20. 20. BioProjectの登録 – PROJECT TYPE – ドラフトゲノム解析の場合
  21. 21. BioProjectの登録 –ドラフトゲノム解析– Project data type: Genome Sequencingを 選択します。 選択後、クリック Objective: Raw Sequence Readsを 選択します。 名称 選択項目 Sample scope 単離された微生物の場合、 Monoisolateを選択します。 Material Genome Capture whole Methodology Sequencing
  22. 22. BioProjectの登録 –ドラフトゲノム解析– Organism name: 生物種名を記入する。Taxonomy IDは 自動的に対応したIDが記載されます。 記入後、クリック
  23. 23. BioProjectの登録 –PUBLICATION– 記入後、クリック Publication: 既に論文が受理されていれば、 記入することができる(任意)。
  24. 24. BioProjectの登録 –OVERVIEW– 最後に[Submit]ボタンをクリックした後、D-way上で修正は出来ません。 修正される場合は、メール(bioproject@ddbj.nig.ac.jp) で申請する必 要があります。アノテータが査定を行ってから、BioProject ID を発行す るため、少しお時間がかかります。 内容確認後、クリック
  25. 25. 4. BioSampleの登録
  26. 26. BioSampleの登録 D-wayにログインすると、以下のような画面が表示されます。 ① クリック ② クリックして、新しいプロジェクトIDを作成 ③ 作成されたIDをクリック BioSampleの作成
  27. 27. 記入後、クリック Name: 氏名を記入します。 E-mail: メールアドレスを記入します。 Submitting organization: 所属名を記入します。 BioSampleの登録BioSampleの登録 -SUBMITTER-
  28. 28. BioSampleの登録 選択後、クリック Hold / Release: データ公開の有無を選択します。 BioSampleの登録 –GENERAL INFO-
  29. 29. BioSampleの登録 アンプリコン解析とドラフトゲノム解析によって BioSampleの登録方法が異なります。 BioSampleの登録 –SAMPLE TYPE-
  30. 30. BioSampleの登録 アンプリコン解析の場合 BioSampleの登録 –SAMPLE TYPE-
  31. 31. BioSampleの登録 Core Package: Survey related Marker Sequences を選択します。 Environmental package: どのような環境中のサンプルを 採取したかを選択します。 選択後、クリック BioSampleの登録 -SAMPLE TYPE-
  32. 32. BioSampleの登録 ドラフトゲノム解析の場合 BioSampleの登録 -SAMPLE TYPE-
  33. 33. BioSampleの登録 Core Package: バクテリアのドラフトゲノム解析の場合は、 Cultured Bacterial/ Archaeal Genomic Sequences を選択します。 Environmental package: 自動的にNo packageが選択されます。 選択後、クリック BioSampleの登録 -SAMPLE TYPE-
  34. 34. BioSampleの登録 ① クリック ③ 次項以降の情報を参考に表計算ソフト上で必須項 目を記入し、「テキスト(タブ区切り)」形式で保存します。 ② ダウンロードされたファイルを「Excel」や「Numbers」 などの表計算ソフトで開きます。 ④ 保存したファイルを選択します。 ⑤ 選択後、クリック BioSampleの登録 -ATTRIBUTES-
  35. 35. 注意9:必須ではない空欄項目列は、削除せずにそのまま残します。 BioSampleの登録 注意6:1地点から、biological replicate 3反復とった場合は、BioSampleの登録は1つで良いが、 異なる3地点から、biological replicate 3反復とった場合は、1つのBioSample登録内に3つの Sampleを登録する必要があります。 注意7:アスタリスク(*)は、必須項目です。登録するサンプルによって、必須項目が異なります。 注意8:必須項目でも該当しない場合やわからない場合は、 "NA"や"unknown"と記入することが できます。 BioSampleの登録 -ATTRIBUTES-の注意点 例) 削除しない。
  36. 36. BioSampleの登録BioSampleの登録 -ATTRIBUTES- 名称 内容 例 sample_name sample name は登録者がサンプルに付け た任意のIDです。 Soli_1、Water_2 sample_title サンプルタイトルは、サンプルをよく表す簡 潔なものを記入します。 Sapporo_soli_1、Tokyo_soli_2 organism Taxonomy Browser (メタゲノム解析用)や Taxonomy Browser (ドラフトゲノム解析用) の中から、適切な項目を選択します。 soil metagenome 、 fish gut metagenome、Escherichia coli K-12 taxonomy_id organismに対応したtaxonomy_idを記入し ます。 410658、1602388 collection_date サンプルを採取した日付 を記入します。 2008-01-23T19:23:10 、 2008- 01-23
  37. 37. BioSampleの登録BioSampleの登録 -ATTRIBUTES- 名称 内容 例 env_biome サンプルに関する広い生態学的な環境を記 入します。biomeの中から適切な項目を探し、 記入します。 grassland biome, desert biome, woodland biome env_feature 周辺の空間へ強い影響を及ぼしている実体 を環境を記入します。environmental feature の中から適切な項目を探し、記入します。 grassland soil, woodland env_material ここでは、質量や体積、環境に含まれる媒体 の他の部分を表す。environmental material の中から適切な項目を探し、記入します。 farm soil, underground water, marine mud geo_loc_name サンプルを得た地域を記入します。 Japan:Kanagawa, Atsugi, The Sagami River
  38. 38. BioSampleの登録BioSampleの登録 -ATTRIBUTES- 名称 内容 例 lat_lon サンプルが採取された位置の地理的座標 を記入します。小数点以下の数字は分秒で はなく小数で記入します。 "47.94 N 28.12 W", "45.0123 S 4.1234 E" project_name 全体のプロジェクトを記載した簡潔な名称 を記入します。 Genome analysis of **** depth 地表表面からの距離を記入します。 one meters below ground elev 標高を記入します。 324 m isol_growth_con dt 単離や生育条件の詳細を記載している pubmed ID、DOIあるいはURLを記入します。 PMID: ********** ref_biomaterial Primary publication か primary genome report のpubmed ID、DOIあるいはURLを記 入します。 doi: *************** num_replicons 真核生物の核ゲノム、微生物のゲノムにお けるレプリコンの数、セグメント化されたウィ ルスにおけるセグメントの数を記入します。 1
  39. 39. BioSampleの登録 内容確認後、クリック 登録した内容が、表示されます。 BioSampleの登録 -ATTRIBUTES-
  40. 40. BioSampleの登録 記入後、クリック Publication: 既に論文が受理されていれば、 記入することができます(任意)。 BioSampleの登録 –PUBLICATION-
  41. 41. BioSampleの登録 記入後、クリック Comments: DDBJスタッフに対してコメントがあ れば記入します(任意)。 BioSampleの登録 –COMMENTS-
  42. 42. BioSampleの登録 -OVERVIEW- 最後に[Submit]ボタンをクリックした後、D-way上で修正は出来ません。 内容を変更する場合は、メール(biosample@ddbj.nig.ac.jp) にて、お知 らせてください。アノテータが査定を行ってから、BioSample IDが発行さ れるため、少しお時間がかかります。 内容確認後、クリック
  43. 43. 5. DRAへの登録 ※ BioProjectとBioSample IDの取得が完了していないと、DRAに登録できません。
  44. 44. メタデータの作成 ① クリック ② "Create new Submission"クリックし、 新しいSubmissionを作成します。 ③ 作成されたSubmissionを選択します。 ④ Submissionを編集します。
  45. 45. シークエンスデータのアップロード 弊社が送付した生データ(*.fastq)をDDBJのサーバに転送します。 データは、作成したSubmission ID名の下に保存します。 転送方法はDRA Handbookをご覧ください。 ※ BioProjectとBioSample IDの取得とシークエンスデータ(Run data)のアップロードが完了 していないと、このあとのデータ登録ができません。
  46. 46. Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq Run Experiment *.fastq メタデータのイメージ ~おさらい~ 異なる16地点からそれぞれ1サンプル毎 に解析した場合 BioSampleBioSampleBioSampleBioSample BioProject 異なる4地点からそれぞれ4つの biological or technical replicateを解析した場合 BioSampleBioSampleBioSampleBioSample BioProject BioSampleBioSampleBioSampleBioSample BioSampleBioSampleBioSampleBioSample BioSampleBioSampleBioSampleBioSample ExperimentExperimentExperimentExperiment Run Run Run Run *.fastq *.fastq *.fastq *.fastq x 4 1つのBioSampleに対し、ExperimentとRunを 1つずつ関連付けます。 1つのBioSampleに対し、ExperimentとRunを 4つずつ関連付けます。
  47. 47. メタデータの作成 -Submission- Center Name, Lab Name: アカウント作成時に登録したCenter が記入されています。Lab Nameには、 詳細な所属を記入します。 Submitter: 氏名とE-mailアドレスを記入します。 Hold Until: データ公開日の設定します。最長 2年後まで設定することができます。 記入後、クリック 申請者を追加することができます
  48. 48. メタデータの作成 -Study- BioProject ID: BioProjectを登録しないと、ここに表示されません。登録には数日 かかります、お早目にBioProjectを登録することをお勧め致します。 選択後、クリック
  49. 49. メタデータの作成 -Sample- BioSample ID: Ctrlキーを押しながらクリックすると、複数のBioSample IDを選択可能で す。BioSampleを登録しないと、ここに表示されません。登録には数日 かかります、お早目にBioSampleを登録することをお勧め致します。 選択後、クリック
  50. 50. メタデータの作成 -Experiment- Library Name: 任意のライブラリー名を記入し ます。 Library Source: ライブラリー構築に用いた試料。アンプリコン解析 (Metagenomic)、ドラフトゲノム解析(Genomic)を選択します。 Library Selection: ライブラリー作成時に用いたサンプルの選別や濃縮方法。 アンプリコン解析(PCR)、ドラフトゲノム解析(RANDOM)を 選択します。 Library Strategy: ライブラリーの構築手法。 アンプリコン解析(AMPLICON)、 ドラフトゲノム解析(WGS)を 選択します。 Instrument: シークエンサの機種の選択。 Illumina MiSeqを選択します。 Spot Type: リード構成の選択。 paired (FR)を選択します。 次項に続く 作成したlibrary数分だけ"Experiment"を作成する。
  51. 51. メタデータの作成 -Experiment- Spot Length: Paired-end リードの合計の長さ。アンプリコン解 析(502), ドラフトゲノム解析(602)と記入します。 Nominal Length: ライブラリーのインサート長。アンプリコン解析(600), ドラフトゲノム解析(800)を記入します。 BioSample Used: Experimentに対応している BioSample IDを記入します。 選択後、"Run"をクリック
  52. 52. メタデータの作成 -Run- Experimentと同じ数だけRunを作成し、 それぞれ1対1に対応させます。 対応させた後、クリック
  53. 53. メタデータの作成 -Run- Run/Analysis contains files: fastqデータが、どのRunに対応するの か選択します。 File Type: generic_fastq を選択します。 MD5 Checksum: 弊社が提供した文字列を記入します。 ② 最後に"Submit"をクリック ① 項目を記入後、"Save"する Run/Analysis: Runが選択され ます。
  54. 54. メタデータの作成 "Validate data files"をクリックすると、登録したメタデータの 内容とランデータが一致しているか確認作業が始まります。 しばらく経った後、"data_error"が発生した場合は、[Stop validation] をクリックして、Validation 処 理を停止します。メタデータのエラー箇所を修正後、再アップロードし、再度validationを開始しま す。エラーの原因がわからない方は、DRAチーム(trace@ddbj.nig.ac.jp)へご連絡ください。 Statusの内容 new :メタデータの投稿前 metadata_submitted :メタデータが投稿された data_validating :データファイルのValidation中 data_error :データファイルのValidation エラー submission_validated :メタデータとデータファイルのValidationが完了 completed :アクセッション番号が発行された confidential :非公開 public :公開
  55. 55. 5. 備考
  56. 56. Runデータの数が多く、対応付けが困難な場合 "Experiment"と"Run"のメタデータは、表計算ソフトで記入し、それをインポートすることができます。 ダウンロードしたファイルをそれぞれ表計算ソ フトで開き、必須項目を記入します。保存は、 「テキスト(タブ区切り)」形式で行います。 ※必須ではない空欄項目列は、削除せずに そのまま残します。 ※ い く つ か の 項 目 を 手 入 力 し た 後 、 "Download TSV file"でダウンロードすると入力 形式がわかりやすくなります。 その後、「タブ区切り」で保存したデータを参 照すれば、インポートすることができます。 "Experiment"の入力時 "Run"の入力時 "Experiment"と"Run"の対応付け時

×