SlideShare a Scribd company logo
1 of 10
2016年度第3回
バイオインフォマティクス実習
HTSeqでマッピングしたシーケンスタグのカウント
前回
• bowtieを使ってSRR1805875のデータ(サイズを縮小)をマッピング
• sam→bam形式にフォーマット変換
• データのソートとインデックスファイルの作成
• IGVで可視化
今回
• HTSeqを使ってタグを計測→タグ数の数値データを取得する
• プログラム言語Pythonを実行する
Python
• グイド・ヴァンロッサムが開発した汎用プログラム言語の一つ
• 標準ライブラリや様々な用途に使える専用の解析用ライブラリが充
実している
ウィンドウズPCでの実行
• cygwin をインストール時にpythonのパッケージをチェック
• 実習室用PCにはインストール済み
cygwinコンソール上で実行できます
Pythonのパッケージ管理
• Pipによるパッケージの管理
get-pip.pyの最新バージョンをダウンロード
get-pip.pyを保存したディレクトリで
その後はコンソール上でpipコマンドでパッケージをインストールできる
Cygwin X
$ python get-pip.py
Cygwin X
$ pip install [パッケージ名]
HTSeqのインストール
• numpy ライブラリのインストール
• HTSeqのインストール
Cygwin X
$ pip install numpy
Cygwin X
$ pip install htseq
annotation file の取得
https://sourceforge.net/projects/ngsonestop/files/annotation/
からmm10.gtf.gzをダウンロード
で解凍
Cygwin X
$gunzip mm10.gtf.gz
chr1 unknown stop_codon 3216022 3216024 . - . gene_id "Xkr4"; gene_name "Xkr4"; p_id "P1
chr1 unknown CDS 3216025 3216968 . - 2 gene_id "Xkr4"; gene_name "Xkr4"; p_id "P1
chr1 unknown CDS 3421702 3421901 . - 1 gene_id "Xkr4"; gene_name "Xkr4"; p_id "P1
chr1 unknown exon 3421702 3421901 . - . gene_id "Xkr4"; gene_name "Xkr4"; p_id "P1
染色体 データの種類 feature 開始 終了 score ストランド コドン ID
GTF ファイルフォーマット:9項目
HTSeqによるタグ数のカウント
• htseq-countコマンド
htseq-count マッピング後のsamファイル名 アノテーション用gtfファイル名 > 出力ファイル名
Cygwin X
$htseq-count part_SRR1805875.sam mm10.gtf > part_SRR1805875_count.txt
まとめ
• python のインストールと実行
• HTSeqのインストール
• HTSeqでマッピングしたシーケンスタグをカウント

More Related Content

Similar to 2016年度 第3回バイオインフォマティクス実習

Pythonを取り巻く開発環境 #pyconjp
Pythonを取り巻く開発環境 #pyconjpPythonを取り巻く開発環境 #pyconjp
Pythonを取り巻く開発環境 #pyconjp
Yoshifumi Yamaguchi
 
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
genroku
 

Similar to 2016年度 第3回バイオインフォマティクス実習 (20)

PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729
 
Pythonを取り巻く開発環境 #pyconjp
Pythonを取り巻く開発環境 #pyconjpPythonを取り巻く開発環境 #pyconjp
Pythonを取り巻く開発環境 #pyconjp
 
Ossで作成するチーム開発環境
Ossで作成するチーム開発環境Ossで作成するチーム開発環境
Ossで作成するチーム開発環境
 
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
 
ひとりドキュメント担当の仕事を楽しむ
ひとりドキュメント担当の仕事を楽しむひとりドキュメント担当の仕事を楽しむ
ひとりドキュメント担当の仕事を楽しむ
 
GitHub Codespaces と Azure でつくる、エンタープライズレベルの開発環境
GitHub Codespaces と Azure でつくる、エンタープライズレベルの開発環境GitHub Codespaces と Azure でつくる、エンタープライズレベルの開発環境
GitHub Codespaces と Azure でつくる、エンタープライズレベルの開発環境
 
210728 mpy
210728 mpy210728 mpy
210728 mpy
 
GitHub最新情報キャッチアップ 2023年6月
GitHub最新情報キャッチアップ 2023年6月GitHub最新情報キャッチアップ 2023年6月
GitHub最新情報キャッチアップ 2023年6月
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
 
Sphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjpSphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjp
 
高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果
 
Keep a diary
Keep a diaryKeep a diary
Keep a diary
 
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
Webブラウザで使える文献Web API取得結果のスプレッドシート化 ~ Google Colab始めました ~
 
ドキュメントの継続的改善―Sphinxを使いながら
ドキュメントの継続的改善―Sphinxを使いながらドキュメントの継続的改善―Sphinxを使いながら
ドキュメントの継続的改善―Sphinxを使いながら
 
Goでかんたんソースコードの静的解析
Goでかんたんソースコードの静的解析Goでかんたんソースコードの静的解析
Goでかんたんソースコードの静的解析
 
読書会のすすめ
読書会のすすめ読書会のすすめ
読書会のすすめ
 
Wacode5thでのpython講義資料
Wacode5thでのpython講義資料Wacode5thでのpython講義資料
Wacode5thでのpython講義資料
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
 
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
 

More from Jun Nakabayashi

More from Jun Nakabayashi (20)

2019第5回バイオインフォマティクス実習
2019第5回バイオインフォマティクス実習2019第5回バイオインフォマティクス実習
2019第5回バイオインフォマティクス実習
 
2019年第4回バイオインフォマティクス実習
2019年第4回バイオインフォマティクス実習2019年第4回バイオインフォマティクス実習
2019年第4回バイオインフォマティクス実習
 
2019bioinformaticsstudyno3
2019bioinformaticsstudyno32019bioinformaticsstudyno3
2019bioinformaticsstudyno3
 
2014年度 第5回バイオインフォマティクス実習
2014年度 第5回バイオインフォマティクス実習2014年度 第5回バイオインフォマティクス実習
2014年度 第5回バイオインフォマティクス実習
 
2014年度 第4回バイオインフォマティクス実習
2014年度 第4回バイオインフォマティクス実習2014年度 第4回バイオインフォマティクス実習
2014年度 第4回バイオインフォマティクス実習
 
2014年度 第3回バイオインフォマティクス実習
2014年度 第3回バイオインフォマティクス実習2014年度 第3回バイオインフォマティクス実習
2014年度 第3回バイオインフォマティクス実習
 
2014年度 第2回バイオインフォマティクス実習
2014年度 第2回バイオインフォマティクス実習2014年度 第2回バイオインフォマティクス実習
2014年度 第2回バイオインフォマティクス実習
 
2014年度 第1回バイオインフォマティクス実習
2014年度 第1回バイオインフォマティクス実習2014年度 第1回バイオインフォマティクス実習
2014年度 第1回バイオインフォマティクス実習
 
2015年度 第2回バイオインフォマティクス実習
2015年度 第2回バイオインフォマティクス実習2015年度 第2回バイオインフォマティクス実習
2015年度 第2回バイオインフォマティクス実習
 
2015年度 第1回バイオインフォマティクス実習
2015年度 第1回バイオインフォマティクス実習2015年度 第1回バイオインフォマティクス実習
2015年度 第1回バイオインフォマティクス実習
 
2016年度 第5回バイオインフォマティクス実習
2016年度 第5回バイオインフォマティクス実習2016年度 第5回バイオインフォマティクス実習
2016年度 第5回バイオインフォマティクス実習
 
2016年度 第4回バイオインフォマティクス実習
2016年度 第4回バイオインフォマティクス実習2016年度 第4回バイオインフォマティクス実習
2016年度 第4回バイオインフォマティクス実習
 
2016年度 第2回バイオインフォマティクス実習
2016年度 第2回バイオインフォマティクス実習2016年度 第2回バイオインフォマティクス実習
2016年度 第2回バイオインフォマティクス実習
 
2016年度 第1回バイオインフォマティクス実習
2016年度 第1回バイオインフォマティクス実習2016年度 第1回バイオインフォマティクス実習
2016年度 第1回バイオインフォマティクス実習
 
2017年度 第5回バイオインフォマティクス実習
2017年度 第5回バイオインフォマティクス実習2017年度 第5回バイオインフォマティクス実習
2017年度 第5回バイオインフォマティクス実習
 
2017年度 第4回バイオインフォマティクス実習
2017年度 第4回バイオインフォマティクス実習2017年度 第4回バイオインフォマティクス実習
2017年度 第4回バイオインフォマティクス実習
 
2017年度 第3回バイオインフォマティクス実習
2017年度 第3回バイオインフォマティクス実習2017年度 第3回バイオインフォマティクス実習
2017年度 第3回バイオインフォマティクス実習
 
2017年度 第2回バイオインフォマティクス実習
2017年度 第2回バイオインフォマティクス実習2017年度 第2回バイオインフォマティクス実習
2017年度 第2回バイオインフォマティクス実習
 
2017年度 第1回バイオインフォマティクス実習
2017年度 第1回バイオインフォマティクス実習2017年度 第1回バイオインフォマティクス実習
2017年度 第1回バイオインフォマティクス実習
 
2018年度 第5回バイオインフォマティクス実習
2018年度 第5回バイオインフォマティクス実習2018年度 第5回バイオインフォマティクス実習
2018年度 第5回バイオインフォマティクス実習
 

2016年度 第3回バイオインフォマティクス実習