Submit Search
Upload
はじめてのLinux
•
7 likes
•
4,550 views
A
Amelieff
Follow
2012年12月15日に開催した、アメリエフ株式会社・第19回勉強会「SNPデータ解析入門(第一部)・はじめてのLinux~コンパウンドヘテロを探してみよう~」のスライドです。
Read less
Read more
Health & Medicine
Report
Share
Report
Share
1 of 24
Recommended
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
Hiroki Itô
JaLTER 公開シンポジウム2015「生物・生態系情報の統合と時系列データの解析~生物や生態系の変化を読み解く~」における発表ファイル
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
Genaris Omics, Inc.
2015年7月1〜3日に開催されたNGS現場の会第4回研究会の、モーニング教育セッション(3日目)で行われた発表。 Linux・コマンドラインが使えなくても、NGSデータ解析ができる環境を自分で構築することを目標としたセッション。手元にあるWindows/Mac端末上でGalaxy ( https://usegalaxy.org/ )が使えるように設定する方法、およびUGENE ( http://ugene.unipro.ru/ )というWindows/Macにインストールできる汎用NGSデータ解析ツール(無料)を紹介する。
データ解析入門
データ解析入門
Takeo Noda
社内勉強会で作成したデータ解析に関する資料です。
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
Insight Technology, Inc.
昨今、データベース技術は、多様な広がりを見せています。中でも時系列データベースは、サーバーのメトリクスやセンサーデータなど、身近なものから得られる時系列のデータの扱いに長けています。本セッションでは、最近ホットな時系列DBであるInfluxDBおよびTelegraf,Grafana,Kapacitorを用い、実際の環境構築からユーザ定義関数による時系列データの異常検知の可視化まで、全ての流れをセッション内でお見せします。
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
Deep Learning JP
2022/9/2 Deep Learning JP http://deeplearning.jp/seminar-2/
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
gree_tech
MIRU2018 のチュートリアルで発表された資料です。 https://sites.google.com/view/miru2018sapporo/%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0/%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
『データ解析におけるプライバシー保護』勉強会
『データ解析におけるプライバシー保護』勉強会
MITSUNARI Shigeo
1, 2, 6章
SNPデータ解析入門
SNPデータ解析入門
Amelieff
2012年12月15日に開催した、アメリエフ株式会社・第19回勉強会「SNPデータ解析入門(第二部)」のスライドです。
Recommended
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
Hiroki Itô
JaLTER 公開シンポジウム2015「生物・生態系情報の統合と時系列データの解析~生物や生態系の変化を読み解く~」における発表ファイル
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
Genaris Omics, Inc.
2015年7月1〜3日に開催されたNGS現場の会第4回研究会の、モーニング教育セッション(3日目)で行われた発表。 Linux・コマンドラインが使えなくても、NGSデータ解析ができる環境を自分で構築することを目標としたセッション。手元にあるWindows/Mac端末上でGalaxy ( https://usegalaxy.org/ )が使えるように設定する方法、およびUGENE ( http://ugene.unipro.ru/ )というWindows/Macにインストールできる汎用NGSデータ解析ツール(無料)を紹介する。
データ解析入門
データ解析入門
Takeo Noda
社内勉強会で作成したデータ解析に関する資料です。
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
Insight Technology, Inc.
昨今、データベース技術は、多様な広がりを見せています。中でも時系列データベースは、サーバーのメトリクスやセンサーデータなど、身近なものから得られる時系列のデータの扱いに長けています。本セッションでは、最近ホットな時系列DBであるInfluxDBおよびTelegraf,Grafana,Kapacitorを用い、実際の環境構築からユーザ定義関数による時系列データの異常検知の可視化まで、全ての流れをセッション内でお見せします。
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
Deep Learning JP
2022/9/2 Deep Learning JP http://deeplearning.jp/seminar-2/
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
gree_tech
MIRU2018 のチュートリアルで発表された資料です。 https://sites.google.com/view/miru2018sapporo/%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0/%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
『データ解析におけるプライバシー保護』勉強会
『データ解析におけるプライバシー保護』勉強会
MITSUNARI Shigeo
1, 2, 6章
SNPデータ解析入門
SNPデータ解析入門
Amelieff
2012年12月15日に開催した、アメリエフ株式会社・第19回勉強会「SNPデータ解析入門(第二部)」のスライドです。
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
Yamato OKAMOTO
ResNetに代表されるSkip Connectionについて理論と有効性をまとめました。
エンジニアも知っておきたいAI倫理のはなし
エンジニアも知っておきたいAI倫理のはなし
Yasunori Nihei
AIを扱うエンジニアを対象に、AI倫理関連の世の中の動向を紹介します。 本資料は、DeNAとMobility Technologiesが合同で実施している社内技術交流会での発表資料を一部修正したものです。
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews, Inc.
広告システムを全く知らなかった私が約2ヶ月弱の開発期間で初期バージョンをローンチ、アーキテクチャも日々変更していき、あれから1年が経過しました。 SmartNews Adsは一般的な広告配信サーバとは異なる特徴をいくつか持っています。今回は運用型広告と純広告型の配信サーバのアーキテクチャを中心に、個人の裁量でどのように設計し、何を採択し、どのように変更していったのかを可能な限り公開し、発生した障害(課題)も晒しながらポストモーテムをします。
経済学のための並列分散処理1
経済学のための並列分散処理1
Masa Kato
経済学のための並列分散処理1
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
機械学習におけるコード設計のベストプラクティスについて
機械学習モデルのサービングとは?
機械学習モデルのサービングとは?
Sho Tanaka
機械学習モデルのサービングについて
僕とヤフーと時々Teradata #prestodb
僕とヤフーと時々Teradata #prestodb
Yahoo!デベロッパーネットワーク
暗号技術の実装と数学
暗号技術の実装と数学
MITSUNARI Shigeo
九州大学談話会「IMI Colloquium」 https://www.imi.kyushu-u.ac.jp/seminars/view/3001
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
Satoshi Shimazaki
インフラエンジニアなら知っておきたいストレージのはなし @OSC 2012 Nagoya
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
機械学習モデルを作成する際のコード設計についての解説
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
西岡 賢一郎
2021/0925の機械学習の社会実装勉強会で発表した資料です。
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
智文 中野
機械学習プロフェッショナルシリーズ輪読会
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
Deep Learning JP
2018/12/7 Deep Learning JP: http://deeplearning.jp/seminar-2/
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
DeNA
DeNA TechCon 2017の登壇資料です。
InfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdb
Naotoshi Seo
潜在クラス分析
潜在クラス分析
Yoshitake Takebayashi
第一回精神科診断学セミナー
統計的因果推論勉強会 第1回
統計的因果推論勉強会 第1回
Hikaru GOTO
クローズドで行われた統計的因果推論の勉強会資料です。対象者は理系ではない経営学系の統計学エンドユーザーでした。
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
Kouhei Sutou
みなさんはApache Arrowを知っていますか? 普段データを処理している人でも今はまだ知らない人の方が多いかもしれません。しかし、数年後には「データ処理をしている人ならほとんどの人が知っている」となるプロダクトです。(そうなるはずです。) Apache Arrowはメモリー上でデータ処理するときに必要なもの一式を提供します。たとえば、効率的なデータ交換のためのデータフォーマット、CPU/GPUの機能を活用した高速なデータ操作機能などです。 一部のデータ処理ツールではすでにApache Arrowを使い始めています。たとえば、Apache SparkはApache Arrowを活用することでPySpark(PythonからApache Sparkを使うためのモジュール)とのやりとりを高速化しています。データ量によっては10倍以上も高速になります。(リンク先の例では20秒→0.7秒と約30倍高速になっています。) この講演ではApache Arrowの概要だけでなく最新情報も紹介します。この講演を聞くことでApache Arrowのことを網羅的に把握できます。 Apache Arrowはデータ処理ツールが共通で必要なもの一式を提供するので、より多くのツールがApache Arrowを活用し、より多くの人がApache Arrowの開発に参加すると、より多くの人が豊かになります。Apache ArrowはOSSなのでだれでも自由に活用したり開発に参加したりできます。Apache Arrowのことを知ってOSSならではの「共有するほど豊かになる」アプローチに参加しましょう!
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
2023/7/20 Deep Learning JP http://deeplearning.jp/seminar-2/
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Taro Tezuka
Describes the Beta and Dirichlet distribution. ベータ分布とディリクレ分布について説明します。
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
Amelieff
2015年2月14日に開催した第41回バイオインフォマティクス勉強会、および21日に開催した第42回バイオインフォマティクス勉強会の「フリーソフトではじめるNGS解析入門〜Exomeシーケンスからクリニカルシーケンスまで〜」の資料を、一部修正して、「公開データベース活用編」として公開いたします。
NGS速習コース:UNIXの基礎の理解/Linux導入
NGS速習コース:UNIXの基礎の理解/Linux導入
Takeru Nakazato
バイオインフォマティクス人材育成カリキュラム(次世代シークエンサ) 速習コース 1-3 UNIXの基礎の理解/Linux導入 http://bit.ly/ngs2014 付録: コマンド集: http://data.dbcls.jp/~nakazato/presentation/nbdcngslec.linux.140925.pdf エディタのキーバインド集: http://data.dbcls.jp/~nakazato/presentation/nbdcngslec.editor.pdf
More Related Content
What's hot
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
Yamato OKAMOTO
ResNetに代表されるSkip Connectionについて理論と有効性をまとめました。
エンジニアも知っておきたいAI倫理のはなし
エンジニアも知っておきたいAI倫理のはなし
Yasunori Nihei
AIを扱うエンジニアを対象に、AI倫理関連の世の中の動向を紹介します。 本資料は、DeNAとMobility Technologiesが合同で実施している社内技術交流会での発表資料を一部修正したものです。
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews, Inc.
広告システムを全く知らなかった私が約2ヶ月弱の開発期間で初期バージョンをローンチ、アーキテクチャも日々変更していき、あれから1年が経過しました。 SmartNews Adsは一般的な広告配信サーバとは異なる特徴をいくつか持っています。今回は運用型広告と純広告型の配信サーバのアーキテクチャを中心に、個人の裁量でどのように設計し、何を採択し、どのように変更していったのかを可能な限り公開し、発生した障害(課題)も晒しながらポストモーテムをします。
経済学のための並列分散処理1
経済学のための並列分散処理1
Masa Kato
経済学のための並列分散処理1
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
機械学習におけるコード設計のベストプラクティスについて
機械学習モデルのサービングとは?
機械学習モデルのサービングとは?
Sho Tanaka
機械学習モデルのサービングについて
僕とヤフーと時々Teradata #prestodb
僕とヤフーと時々Teradata #prestodb
Yahoo!デベロッパーネットワーク
暗号技術の実装と数学
暗号技術の実装と数学
MITSUNARI Shigeo
九州大学談話会「IMI Colloquium」 https://www.imi.kyushu-u.ac.jp/seminars/view/3001
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
Satoshi Shimazaki
インフラエンジニアなら知っておきたいストレージのはなし @OSC 2012 Nagoya
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
機械学習モデルを作成する際のコード設計についての解説
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
西岡 賢一郎
2021/0925の機械学習の社会実装勉強会で発表した資料です。
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
智文 中野
機械学習プロフェッショナルシリーズ輪読会
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
Deep Learning JP
2018/12/7 Deep Learning JP: http://deeplearning.jp/seminar-2/
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
DeNA
DeNA TechCon 2017の登壇資料です。
InfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdb
Naotoshi Seo
潜在クラス分析
潜在クラス分析
Yoshitake Takebayashi
第一回精神科診断学セミナー
統計的因果推論勉強会 第1回
統計的因果推論勉強会 第1回
Hikaru GOTO
クローズドで行われた統計的因果推論の勉強会資料です。対象者は理系ではない経営学系の統計学エンドユーザーでした。
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
Kouhei Sutou
みなさんはApache Arrowを知っていますか? 普段データを処理している人でも今はまだ知らない人の方が多いかもしれません。しかし、数年後には「データ処理をしている人ならほとんどの人が知っている」となるプロダクトです。(そうなるはずです。) Apache Arrowはメモリー上でデータ処理するときに必要なもの一式を提供します。たとえば、効率的なデータ交換のためのデータフォーマット、CPU/GPUの機能を活用した高速なデータ操作機能などです。 一部のデータ処理ツールではすでにApache Arrowを使い始めています。たとえば、Apache SparkはApache Arrowを活用することでPySpark(PythonからApache Sparkを使うためのモジュール)とのやりとりを高速化しています。データ量によっては10倍以上も高速になります。(リンク先の例では20秒→0.7秒と約30倍高速になっています。) この講演ではApache Arrowの概要だけでなく最新情報も紹介します。この講演を聞くことでApache Arrowのことを網羅的に把握できます。 Apache Arrowはデータ処理ツールが共通で必要なもの一式を提供するので、より多くのツールがApache Arrowを活用し、より多くの人がApache Arrowの開発に参加すると、より多くの人が豊かになります。Apache ArrowはOSSなのでだれでも自由に活用したり開発に参加したりできます。Apache Arrowのことを知ってOSSならではの「共有するほど豊かになる」アプローチに参加しましょう!
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
2023/7/20 Deep Learning JP http://deeplearning.jp/seminar-2/
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Taro Tezuka
Describes the Beta and Dirichlet distribution. ベータ分布とディリクレ分布について説明します。
What's hot
(20)
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
エンジニアも知っておきたいAI倫理のはなし
エンジニアも知っておきたいAI倫理のはなし
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
経済学のための並列分散処理1
経済学のための並列分散処理1
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
機械学習モデルのサービングとは?
機械学習モデルのサービングとは?
僕とヤフーと時々Teradata #prestodb
僕とヤフーと時々Teradata #prestodb
暗号技術の実装と数学
暗号技術の実装と数学
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
インフラエンジニアなら知っておきたいストレージのはなし@OSC 2012 Nagoya
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
[DL輪読会]Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval ...
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
DeNAの動画配信サービスを支えるインフラの内部 #denatechcon
InfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdb
潜在クラス分析
潜在クラス分析
統計的因果推論勉強会 第1回
統計的因果推論勉強会 第1回
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Viewers also liked
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
Amelieff
2015年2月14日に開催した第41回バイオインフォマティクス勉強会、および21日に開催した第42回バイオインフォマティクス勉強会の「フリーソフトではじめるNGS解析入門〜Exomeシーケンスからクリニカルシーケンスまで〜」の資料を、一部修正して、「公開データベース活用編」として公開いたします。
NGS速習コース:UNIXの基礎の理解/Linux導入
NGS速習コース:UNIXの基礎の理解/Linux導入
Takeru Nakazato
バイオインフォマティクス人材育成カリキュラム(次世代シークエンサ) 速習コース 1-3 UNIXの基礎の理解/Linux導入 http://bit.ly/ngs2014 付録: コマンド集: http://data.dbcls.jp/~nakazato/presentation/nbdcngslec.linux.140925.pdf エディタのキーバインド集: http://data.dbcls.jp/~nakazato/presentation/nbdcngslec.editor.pdf
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
Amelieff
アメリエフ株式会社・第23回勉強会「miRNAデータ解析入門」のスライドです。
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
Amelieff
2016年5月20日に大阪(第44回)で、27日に東京(第45回)で開催したバイオインフォマティクス勉強会で発表したスライド資料です。
NGS現場の会第2回_アメリエフ株式会社_がんExome解析
NGS現場の会第2回_アメリエフ株式会社_がんExome解析
Amelieff
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
Genaris Omics, Inc.
次世代シーケンシング(NGS=Next Generation Sequencing)についての、初心者向けセッションの配布資料です。(2013年9月)
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
Amelieff
2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドです。
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料
Aya Takeda
次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアル
Amelieff
アメリエフ株式会社・次世代シーケンス解析サーバーのReseq解析マニュアルです。 ▼Reseq解析受託はこちら▼ https://amelieff.jp/commissioned/reseq/
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
Amelieff
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
Amelieff
2014年12月18日に開催した、アメリエフ株式会社・第40回勉強会「フリーソフトではじめるChIP-seq&メチル化データ解析入門」のMethyl-seq編のスライドです。 【2014/12/24 訂正】 ・下記のスペルミスを訂正いたしました。 誤:PMBC → 正:PBMC ・12枚目のスライドで、bsmapのコマンド引数にbamファイルが書かれていなかったので、追記しました。
Exome解析入門
Exome解析入門
Amelieff
2012年7月7日に開催した、アメリエフ株式会社・第14回勉強会「Exome解析入門」のスライドです。
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
Amelieff
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
Amelieff
2014年12月18日に開催した、アメリエフ株式会社・第40回勉強会「フリーソフトではじめるChIP-seq&メチル化データ解析入門」のChIP-Seq編のスライドです。
Viewers also liked
(14)
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
NGS速習コース:UNIXの基礎の理解/Linux導入
NGS速習コース:UNIXの基礎の理解/Linux導入
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
NGS現場の会第2回_アメリエフ株式会社_がんExome解析
NGS現場の会第2回_アメリエフ株式会社_がんExome解析
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料
次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアル
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
Exome解析入門
Exome解析入門
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
はじめてのLinux
1.
はじめてのLinux ~コンパウンドヘテロを探してみよう~
Copyright © Amelieff Co. Ltd. All Rights Reserved.
2.
L i n
u x と は UNIX互換のサーバー向けOS(オペレーティングシステム)である つまり、多人数で同時に利用し、 常時稼働していることを想定したコンピューター 基本的には、70~80年代のコンピューターはUNIXしか存在せず、 個人でも利用できるようにビルゲイツがUNIXを参考にしてMS-DOSを開発 PCが誕生 UNIXは権利問題などで、一般人の手の届かない存在となったため、 LinusがUNIXを参考にして、PCで動く独自OSを開発 Copyright © Amelieff Co. Ltd. All Rights Reserved. 2
3.
な ぜ L
i n u x を 使 う 必 要 が あ る の か その1:解析ツールの問題 バイオインフォマティクスで使用する解析ツールの多くは、Linux用に作成されている 大多数の解析ツールを使用することができる 新しいツールが出た時、すぐに自分で試す事ができる その2:大量データの扱い 次世代シーケンシンスデータの様に、大きなデータは、Excel等で見る事が難しい 自分の思い通りにデータの可視化や加工ができる その3:繰り返し操作の簡易化 「Primerを数百個作りたい」「数万個の配列がどの遺伝子に当たるのか確認したい」 という時、同じ作業を何度も繰り返す事は、難しい 繰り返し作業を自動化する事ができる Copyright © Amelieff Co. Ltd. All Rights Reserved. 3
4.
コ マ ン
ド と は 特定の文字列を入力してコンピュータに与える命令のこと Linuxでの作業は基本的にコマンドを用いて行われる ここにコマンドを入力します 「$」、「#」は実際には入力しません ユーザー名 ホスト名 現在いる場所 Copyright © Amelieff Co. Ltd. All Rights Reserved. 4
5.
コ マ ン
ド 操 作 1 現在の作業場所を確認するときは、pwdを使います $ pwd Enter ※実際に入力するコマンドを黄色い四角で示します 実行結果を灰色の四角で示します /home/demo/デスクトップ Copyright © Amelieff Co. Ltd. All Rights Reserved. 5
6.
コ マ ン
ド 操 作 1 現在いる場所にあるモノを確認するときは、ls -lを使います $ ls -l Enter ※ :スペースを入れます デスクトップ上にテキストファイルを確認することができます Copyright © Amelieff Co. Ltd. All Rights Reserved. 6
7.
コ マ ン
ド 操 作 1 ファイルを開くときは、lessを使います $ less ファイル名 このようにテキストが開きます (例) fruit.txtを開きます テキストを閉じるときは、 q を入力します ファイルの行数を数えるときは、wc -lを使います $ wc -l ファイル名 行数が表示されます Copyright © Amelieff Co. Ltd. All Rights Reserved. 7
8.
コ マ ン
ド 操 作 1 ファイルの行を並び換えるときは、sortを使います $ sort ファイル名 $ sort fruit.txt I like banana. I like apple. I like banana. fruit.txtに対して I like banana. I like apple. sortを実行します I like banana. I like cherry. I like cherry. fruit.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 8
9.
コ マ ン
ド 操 作 1 重複する行をユニークにするときは、uniqを使います $ uniq ファイル名 I like banana. $ uniq fruit.txt I like banana. I like banana. fruit.txtに対して I like apple. I like apple. uniqを実行します I like cherry. I like cherry. fruit.txt 行の出現回数を数えるときは、-cを使います $ uniq –c fruit.txt $ uniq –c ファイル名 2 I like banana. 1 I like apple 1 I like cherry Copyright © Amelieff Co. Ltd. All Rights Reserved. 9
10.
コ マ ン
ド 操 作 1 コマンドの出力を別のコマンドに振り分けるときは、 | (パイプ)を使います コマンドとコマンドの間に入力します 左側のコマンドの出力結果を、右のコマンドに入力することができます (例)fruit.txtに対してuniqを実行して、得られた行数を数えます I like banana. $ uniq fruit.txt | wc -l I like banana. 3 I like apple. I like cherry. fruit.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 10
11.
コ マ ン
ド 操 作 1 コマンドの出力をファイルに振り分けるときは、>(リダイレクト)を使います 左側のコマンドの処理結果を、右のファイルに書き出すことができます (例)fruit.txtに対してuniqを実行して、得られた行数をuniq_fruit.txtへ書き出します I like banana. $ uniq fruit.txt > uniq_fruit.txt I like banana. I like apple. I like cherry. fruit.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 11
12.
問 題
次 の 実 行 結 果 を 得 る に は ど う し た ら 良 い で し ょ う apple $ ??? apple banana apple banana cherry cherry banana Question.txt 【選択肢】 (1) $ uniq sort Question.txt (2) $ sort Question.txt | uniq (3) $ uniq Question.txt | sort (4) $ sort uniq Question.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 12
13.
コ ン パ
ウ ン ド ヘ テ ロ と は 同一遺伝子上の2つの異なる場所でヘテロ接合体の変異を有する場合を指します (例) ① 遺伝子A ② 父 父 母 母 子 子 ①父と子の共通変異 ②母と子の共通変異 Copyright © Amelieff Co. Ltd. All Rights Reserved. 13
14.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す ファイルを確認します $ less benkyoukai.txt #から始まるヘッダー行が確認できます カラム名 説明 1 Func ゲノム領域の機能 2 Gene 遺伝子 3 dbSNP135 既知の変異リスト 4 Chr 染色体番号 5 Pos 位置情報 6 REF リファレンスゲノムの塩基 7 ALT 全サンプルのALTの塩基 8 PAT_geno 父サンプルの遺伝子型(homo/hetero/.) 9 MAT_geno 母サンプルの遺伝子型(homo/hetero/.) 10 CHI_geno 子サンプルの遺伝子型(homo/hetero/.) wc -lコマンドで行数を確認します $ wc –l benkyokai.txt 942 benkyokai.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 14
15.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す ファイルの行頭を確認するときは、headコマンドを使います $ head ファイル名 $ head benkyokai.txt ファイルの末尾を確認するときは、tailコマンドを使います $ tail ファイル名 $ tail benkyokai.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 15
16.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す 次の条件で絞り込みを行います ① 遺伝子A ② 1 exonicのみに絞り込む 父と子はhetero、母は変異なし 2 母と子はhetero、父は変異なし 父 1 2 母 子 ① ② Copyright © Amelieff Co. Ltd. All Rights Reserved. 16
17.
コ マ ン
ド 操 作 2 行単位でデータを加工するときは、 awkを使います データを1行ずつ読み込み、各列に対して様々な処理を行うことができるコマンドです $ awk ’条件文{実行文} ’ ファイル名 (例) 全ての行の2列目を出力する $ awk ’{print $2} ’ ファイル名 【awkの変数】 $数字: 0の場合は、処理を行っている行全体を指す。 1以上の場合、指定したファイルの列番号を指す 例 $0 → 処理を行っている行全体 $0 $1 $2 ・・ $1 → 1列目、$2→2列目、$3→・・・ 行数:NR : NR → 現在読み込んでいる行数 NF → 現在読み込んでいる行の列数 列数:NF Copyright © Amelieff Co. Ltd. All Rights Reserved. 17
18.
コ マ ン
ド 操 作 2 Funcに含まれる要素の確認を行います $ awk ’!/^#/ {print $1}’ benkyokai.txt |sort|uniq -c 40 UTR3 16 UTR5 2 downstream 530 exonic 1 exonic;splicing 27 intergenic 277 intronic 36 ncRNA_exonic 8 ncRNA_intronic 2 splicing 2 upstream 【コマンドの説明】 ! : 直後の条件文を否定する ^ : 行頭を表す Copyright © Amelieff Co. Ltd. All Rights Reserved. 18
19.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す genoカラムに含まれる要素の確認を行います $ awk ’!/^#/ {print $8}’ benkyokai.txt |sort|uniq -c 301 . 356 hetero 284 homo exonicに絞りこみます $ awk ’/^#/ || $1==“exonic”{print $0}’ benkyokai.txt > exonic.txt 【コマンドの説明】 || : 条件文を「or」で結合する $1==”パターン” : 一列目が””内のパターンにマッチする場合 Copyright © Amelieff Co. Ltd. All Rights Reserved. 19
20.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す 父と子がheteroで、母に変異がない行を絞りこみます $ awk ’/^#/ || $8==“hetero” && $9==“.” && $10==“hetero” {print $0}’ exonic.txt > pat_chi.txt 【コマンドの説明】 && : 条件文を「and」で結合する 母と子がheteroで、父に変異がない行を絞りこみます $ awk ’!/^#/ && $8==“.” && $9==“hetero” && $10==“hetero” {print $0}’ exonic.txt > mat_chi.txt 2つのファイルを結合します。ファイルの結合にはcatコマンドを使います。 $ cat pat_chi.txt mat_chi.txt > combind.txt Copyright © Amelieff Co. Ltd. All Rights Reserved. 20
21.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す 結合したファイルの2列目(遺伝子)をユニークにして、登場回数を数えます 2回以上登場した(2つ以上の変異を持つ)遺伝子をファイルに出力します $ awk ’!/^#/ {print $2}’ combind.txt |sort|uniq –c |awk ‘$1>=2 {print}’ > gene.txt 3 CEP104 2 CHD5 6 EPHA8 2 GPR153 5 LUZP1 3 MEGF6 4 MYOM3 2 NADK 3 NPHP4 3 PIK3CD 2 PTCHD2 3 SYTL1 Copyright © Amelieff Co. Ltd. All Rights Reserved. 21
22.
コ ン パ
ウ ン ド ヘ テ ロ を 探 す リストアップした遺伝子上の変異を出力します パターンにマッチする行を抜き出すために、grepを使います $ grep ’パターン ’ ファイル名 $ grep ’NADK’ combind.txt exonic NADK rs7407 chr1 Copyright © Amelieff Co. Ltd. AllC 1684472 Rights Reserved. T hetero . hetero exonic NADK rs4751 chr1 1686040 G T . hetero hetero 下記の条件を満たしていることを確認します コンパウンドヘテロを見つけることが出来ました Copyright © Amelieff Co. Ltd. All Rights Reserved. 22
23.
ま と め
Linuxを使う利点 • エクセルで開けないデータサイズの大きなファイルも扱うことができる • 繰り返し操作が簡単に行える • 汎用性の高いファイル操作が行える • 最先端のツールを扱った研究が行える ファイルの加工に用いたLinuxコマンド less : ファイルの中身を確認します head : ファイルの行頭を出力します tail : ファイルの末尾を出力します wc –l : 行数を数えます grep : 指定した検索パターンにマッチする行を出力します sort : 行を並べ替えます uniq : 重複行を確認します awk : 行単位でデータを加工します | : 左のコマンドの出力を右のコマンドに振り分けます > : 左のコマンドの出力を右のファイルへ書き出します Copyright © Amelieff Co. Ltd. All Rights Reserved. 23