Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

次世代シーケンス解析サーバーReseq解析マニュアル

3,032 views

Published on

アメリエフ株式会社・次世代シーケンス解析サーバーのReseq解析マニュアルです。

Published in: Health & Medicine
  • Be the first to comment

次世代シーケンス解析サーバーReseq解析マニュアル

  1. 1. 次世代シーケンス解析サーバーReseq解析GUIマニュアル v. 3.0 Copyright © Amelieff Co. Ltd. All Rights Reserved.
  2. 2. 次世代シーケンス解析サーバーのご紹介本サーバーは、次世代シーケンスデータ解析において一般的に用いられている公開ソフトを中心に構成されています。  複数サンプルを指定して自動的に解析  解析結果をわかりやすくレポートそれでは、解析手順をご紹介します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 2
  3. 3. サーバーの起動とログインサーバーの電源がOFFの時は、電源ボタンを押して起動して下さい。 ※通常サーバーの電源は切らないようにしてください 上記ログイン画面が表示されたらユーザー名と パスワードを入力してログインして下さい。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 3
  4. 4. 端末の起動デスクトップ上でマウスを右クリックしてください。メニューの「端末の中に開く」をクリックすると、端末が起動します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 4
  5. 5. 解析の準備ここでは、データ解析を/home/user/analysis で実行します。以下のコマンドを打って、analysisディレクトリを作成します。 $ cd ← 自分のホームディレクトリへ移動 $ mkdir analysis ← 解析用のanalysisディレクトリを作成 $ cd analysis/ ← 作成したanalysisディレクトリへ移動 cp コマンドを用いて、解析したいFastqファイルを analysisディレクトリにコピーします。$ cp /home/share/example/reseq/SRR077861_*.fastq /home/user/analysis ※ディレクトリとはWindowsにおけるフォルダと同じ意味です。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 5
  6. 6. 解析の実行 tsvファイルを作成し、 端末内に以下のコマンドを入力し解析を実行します。$ ls -l ← コピーができたかどうかの確認$ python -u /usr/local/src/amelieff/reseq/reseq.py -s 1 -l SRR077861.tsv -g hg19 -a > log 2>&1 & ← Reseq 解析プログラムの実行  詳細は別紙 「Reseq解析フロー」をご覧ください。  -a オプションを外すとannoverをご利用になれます。 詳細は「マニュアル別紙 Annovar事前準備」をご覧ください。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 6
  7. 7. 実行状況の確認方法(1) 実行中のジョブの確認端末内で、topコマンドを入力すると実行中のジョブが確認できます。 $ top右の例ではuser の bwaジョブが流れています。このtop画面を終了するときは、qを押します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 7
  8. 8. 実行状況の確認方法(2) 出力ファイル・ディレクトリの確認デスクトップのuserのホーム →analysis の順にクリックします。ディレクトリが5つ、サマリーファイル(SRR077861.log)が1つできていることを確認します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 8
  9. 9. 実行状況の確認方法(3) サマリーファイルの確認 得られたサマリーファイル(SRR077861.log)を windowsパソコンにコピーし、Excelで開きます。サマリーファイルには、5つの解析項目の開始・終了時間と実行結果の情報が記載されています。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 9
  10. 10. 実行状況の確認方法(3) サマリーファイルの詳細サマリーファイルのヘッダーには、解析の基本情報が書かれます。 ########################################### #RESEQ PIPELINE START: 2012/12/19-13:17:43 ① # file = SRR077861.tsv ② # genome = hg19 ③ # bed = /home/genome/hg19/ccds.bed ④ ① 解析を始めた時間 ② 解析の対象となるFastqファイルのリスト ③ 解析に使用するリファレンスゲノム ④ 集計を行うターゲット領域 (濃縮キットを使用した場合は販売元にお問い合わせください) Copyright © Amelieff Co. Ltd. All Rights Reserved. 10
  11. 11. 実行状況の確認方法(3)サマリーファイルの詳細:Step1(QC結果)## Step1:1_qcNum Sample Start End Time(sec) SRR077861 2012/12/19-13:17:43 2012/12/19-13:17:54 10 Info Result [SRR077861_1.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%) ① [SRR077861_1.clean.fastq.gz]Pass_bases/Total_bases 765303/769187(99.50%) ② [SRR077861_2.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%) [SRR077861_2.clean.fastq.gz]Pass_bases/Total_bases 766170/769287(99.59%) ① 全リードのうち、クオリティ・フィルタリングをパスしたリードの割合 ② 全塩基のうち、クオリティ・フィルタリングをパスした塩基の割合 Copyright © Amelieff Co. Ltd. All Rights Reserved. 11
  12. 12. 実行状況の確認方法(3) サマリーファイルの詳細: Step2(Mapping結果)## Step2-4:2_mapping,3_realignment,4_snv/indel,5_annotation# sample = SRR077861Step Process Start End Time(sec) 2 Mapping 2012/12/19-13:17:54 2012/12/19-13:18:08 13 Info Result Mapped_reads/Pass_reads 16768/17282(97.03%) ① After_duplicate_reads_removed 16691 ② Target_num 25504 ③ Target_size 937613923 ④ No_covererd_target_num 25503,99.9% ⑤① クオリティ・フィルタリングをパスしたリードのうち、マッピングされたリードの割合② 重複リードを除外した後のリード数③ 実行時に指定したターゲット領域に含まれる領域数 (未指定の場合はCCDSの領域数)④ ターゲット領域の大きさ(未指定の場合はCCDSの大きさ)⑤ リードが1本もマッピングされなかったターゲット領域の数と割合 Copyright © Amelieff Co. Ltd. All Rights Reserved. 12
  13. 13. 実行状況の確認方法(3) サマリーファイルの詳細:Step2~3(Mapping~Realignment結果) Average_depth(x1) 21.7 (x10) 82.8 (x30) 118.7 ① (x50) 141.9 Coverage(x1) 0.00% Coverage(x10) 0.00% Coverage(x30) 0.00% ② Coverage(x50) 0.00% ① カバレージ X 以上のターゲット領域上の平均カバレージ ② カバレージ X 以上でカバーされているターゲット領域の割合 3 Realignment 2012/12/19-13:18:08 2012/12/19-13:35:26 1038 Regions_local_realignment 76 ③ ③ ローカルリアライメントを行った領域の数 Copyright © Amelieff Co. Ltd. All Rights Reserved. 13
  14. 14. 実行状況の確認方法(3) サマリーファイルの詳細:Step4~5(SNV/Indel~Annotate結果)4 SNV/Indel 2012/12/19-13:35:26 2012/12/19-14:25:12 29855 Annotate 2012/12/19-14:25:12 2012/12/19-14:39:52 880 SNV 31 ① Indel 2 ② Filtered_SNV 17 ③ Filtered_Indel 2 ④ # All_Process_End ⑤ ① 検出されたSNV数 ② 検出されたInsertion/Deletion数 ③ クオリティのフィルタリングをパスしたSNV数 ④ クオリティのフィルタリングをパスしたInsertion/Deletion数 ⑤ 1つのサンプルの解析が全て終了 Copyright © Amelieff Co. Ltd. All Rights Reserved. 14
  15. 15. QC結果確認 Fastqファイル毎にQCの レポートが出力されます。 analysisディレクトリの 1_qc → tmp → SRR077861_1_QCleaner → SRR077861_1.clean_fastqc → fastqc_report.html の順にクリックします。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 15
  16. 16. QC結果確認ウェブブラウザでFastQCの結果を確認できます。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 16
  17. 17. SNV/Indel検出結果の確認 analysisディレクトリの 5_annotation → SRR077861_small_snpEff_ summary.html の順にクリックします。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 17
  18. 18. SNV/Indel検出結果の確認ウェブブラウザでSNV/Indelの集計結果を確認できます。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 18

×