SlideShare a Scribd company logo
1 of 2
Download to read offline
BWA
Сайт: http://bio-bwa.sourceforge.net/
На сервере программа находится в /storage/labnas/NGS/3/bwa-0.6.1
Возможно, в процессе работы пригодится визуализатор Tablet http://
bioinf.scri.ac.uk/tablet/download.shtml
Третье домашнее задание
0. Разобраться с BWA
Для прикладывания длинных ридов используйте BWA-SW.
1. Статистика ридов 454.
С помощью BWA посчитать следующие статистики для ридов:
● Покрытие генома (график, процент покрытого генома, среднее покрытие)
● Распределение длин indel’ов
● Распределение зависимости количества indel’ов от длины гомополимерного
участка (участок состоящий из одного типа нуклеотидов, например
АААААААА)
● Зависимость качества нуклеотидов
○ при ошибочно вставленном нуклеотиде
○ при замене
● Таблица частот замен/вставок/удалений
ReadReference A C G T _
А -
C -
G -
T -
_ -
Статистики реализуйте так, как вы считаете разумным.
2*. Исправление вставок и удаление в ридах 454 по ридам Illumina.
Задание, которое можно сделать вместо 1.
С помощью BWA и ридов Illumina попытаться исправить вставки и удаления в
ридах 454. Оценить качество исправлений с помощью референсного генома.
Для тестирования удобно пользоваться референсным геномом, но итоговая
программа должна принимать на вход только файлы с ридами.
Данные:
Папка: /storage/labnas/NGS/3/
Данные: 454.fastq
Тестовый геном: test.fasta
Референсный геном: reference.fasta
*Illumina: illumina_left.fastq, illumina_right.fastq

More Related Content

Viewers also liked (7)

Ngs 1
Ngs 1Ngs 1
Ngs 1
 
Slides 3
Slides 3Slides 3
Slides 3
 
Seminar mol biol_1_spring_2013
Seminar mol biol_1_spring_2013Seminar mol biol_1_spring_2013
Seminar mol biol_1_spring_2013
 
Vvedenie v bioinformatiku_2
Vvedenie v bioinformatiku_2Vvedenie v bioinformatiku_2
Vvedenie v bioinformatiku_2
 
Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)
 
Graph genome
Graph genome Graph genome
Graph genome
 
Biotech autumn2012-02-ngs2
Biotech autumn2012-02-ngs2Biotech autumn2012-02-ngs2
Biotech autumn2012-02-ngs2
 

More from BioinformaticsInstitute

Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsBioinformaticsInstitute
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...BioinformaticsInstitute
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкBioinformaticsInstitute
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр ПредеусBioinformaticsInstitute
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...BioinformaticsInstitute
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...BioinformaticsInstitute
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)BioinformaticsInstitute
 

More from BioinformaticsInstitute (20)

Nanopores sequencing
Nanopores sequencingNanopores sequencing
Nanopores sequencing
 
A superglue for string comparison
A superglue for string comparisonA superglue for string comparison
A superglue for string comparison
 
Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphs
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днк
 
Knime & bioinformatics
Knime & bioinformaticsKnime & bioinformatics
Knime & bioinformatics
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
 
Biodb 2011-everything
Biodb 2011-everythingBiodb 2011-everything
Biodb 2011-everything
 
Biodb 2011-05
Biodb 2011-05Biodb 2011-05
Biodb 2011-05
 
Biodb 2011-04
Biodb 2011-04Biodb 2011-04
Biodb 2011-04
 
Biodb 2011-03
Biodb 2011-03Biodb 2011-03
Biodb 2011-03
 
Biodb 2011-01
Biodb 2011-01Biodb 2011-01
Biodb 2011-01
 
Biodb 2011-02
Biodb 2011-02Biodb 2011-02
Biodb 2011-02
 
Ngs 6
Ngs 6Ngs 6
Ngs 6
 
Ngs 4
Ngs 4Ngs 4
Ngs 4
 
Ngs 2
Ngs 2Ngs 2
Ngs 2
 
Ngs 1 2
Ngs 1 2Ngs 1 2
Ngs 1 2
 

Ngs 3 0

  • 1. BWA Сайт: http://bio-bwa.sourceforge.net/ На сервере программа находится в /storage/labnas/NGS/3/bwa-0.6.1 Возможно, в процессе работы пригодится визуализатор Tablet http:// bioinf.scri.ac.uk/tablet/download.shtml Третье домашнее задание 0. Разобраться с BWA Для прикладывания длинных ридов используйте BWA-SW. 1. Статистика ридов 454. С помощью BWA посчитать следующие статистики для ридов: ● Покрытие генома (график, процент покрытого генома, среднее покрытие) ● Распределение длин indel’ов ● Распределение зависимости количества indel’ов от длины гомополимерного участка (участок состоящий из одного типа нуклеотидов, например АААААААА) ● Зависимость качества нуклеотидов ○ при ошибочно вставленном нуклеотиде ○ при замене ● Таблица частот замен/вставок/удалений ReadReference A C G T _ А - C - G - T - _ - Статистики реализуйте так, как вы считаете разумным. 2*. Исправление вставок и удаление в ридах 454 по ридам Illumina.
  • 2. Задание, которое можно сделать вместо 1. С помощью BWA и ридов Illumina попытаться исправить вставки и удаления в ридах 454. Оценить качество исправлений с помощью референсного генома. Для тестирования удобно пользоваться референсным геномом, но итоговая программа должна принимать на вход только файлы с ридами. Данные: Папка: /storage/labnas/NGS/3/ Данные: 454.fastq Тестовый геном: test.fasta Референсный геном: reference.fasta *Illumina: illumina_left.fastq, illumina_right.fastq