Оценка на качествотоОценка на качеството
на налични геномнина налични геномни
последователности напоследователности на
Oryza sativaOryza sativa
Иван Попов, Валерия СимеоноваИван Попов, Валерия Симеонова
АБИ, май 2010АБИ, май 2010
Основна идеяОсновна идея
 Да се използват силно консервативниДа се използват силно консервативни
известни последователности за оценка наизвестни последователности за оценка на
правилното секвениранеправилното секвениране
 Проста статистическа оценка – х грешки на уПроста статистическа оценка – х грешки на у
нуклеотидануклеотида = x/y= x/y честота на грешките причестота на грешките при
секвениранетосеквенирането
Знаем че ...Знаем че ...
 Интроните започват и завършват сИнтроните започват и завършват с
динуклеотиди играещи роля при сплайсингадинуклеотиди играещи роля при сплайсинга
 Те са инвариантни – 5`Те са инвариантни – 5`GT & AGGT & AG3`3`..
Съществува и рядко срещан вариант – 5`Съществува и рядко срещан вариант – 5`ATAT
& AC& AC3`3`..
ДаннитеДанните –– геномът на оризагеномът на ориза
 NCBI Nucleotide (www.ncbi.nlm.nih.gov)NCBI Nucleotide (www.ncbi.nlm.nih.gov)
 Plant Genome DatabasePlant Genome Database (www.plantgdb.org)(www.plantgdb.org)
 Двете копия ще се преглеждат едновременноДвете копия ще се преглеждат едновременно
и резултатите ще се валидират съси резултатите ще се валидират със
сравняване на двете копия.сравняване на двете копия.
 Дава възможност да се определи качеството иДава възможност да се определи качеството и
на двете копияна двете копия
Сравнение ...Сравнение ...
 С резултатите от подобна оценка направенаС резултатите от подобна оценка направена
за референтен геном на чиста линияза референтен геном на чиста линия
мишки с високо покритиемишки с високо покритие::
Wesche, P.L., Gaffney, D.J., Keightley, P.D.Wesche, P.L., Gaffney, D.J., Keightley, P.D.
(2004)(2004) DNA sequence error rates inDNA sequence error rates in
Genbank records estimated using theGenbank records estimated using the
mouse genome as referencemouse genome as reference.. DNA sequenceDNA sequence
15(5/6): 362-64.15(5/6): 362-64.
Благодаря за вниманието!Благодаря за вниманието!
Въпроси и предложения?Въпроси и предложения?
Благодаря за вниманието!Благодаря за вниманието!
Въпроси и предложения?Въпроси и предложения?

Sequencing quality

  • 1.
    Оценка на качествотоОценкана качеството на налични геномнина налични геномни последователности напоследователности на Oryza sativaOryza sativa Иван Попов, Валерия СимеоноваИван Попов, Валерия Симеонова АБИ, май 2010АБИ, май 2010
  • 2.
    Основна идеяОсновна идея Да се използват силно консервативниДа се използват силно консервативни известни последователности за оценка наизвестни последователности за оценка на правилното секвениранеправилното секвениране  Проста статистическа оценка – х грешки на уПроста статистическа оценка – х грешки на у нуклеотидануклеотида = x/y= x/y честота на грешките причестота на грешките при секвениранетосеквенирането
  • 3.
    Знаем че ...Знаемче ...  Интроните започват и завършват сИнтроните започват и завършват с динуклеотиди играещи роля при сплайсингадинуклеотиди играещи роля при сплайсинга  Те са инвариантни – 5`Те са инвариантни – 5`GT & AGGT & AG3`3`.. Съществува и рядко срещан вариант – 5`Съществува и рядко срещан вариант – 5`ATAT & AC& AC3`3`..
  • 4.
    ДаннитеДанните –– геномътна оризагеномът на ориза  NCBI Nucleotide (www.ncbi.nlm.nih.gov)NCBI Nucleotide (www.ncbi.nlm.nih.gov)  Plant Genome DatabasePlant Genome Database (www.plantgdb.org)(www.plantgdb.org)  Двете копия ще се преглеждат едновременноДвете копия ще се преглеждат едновременно и резултатите ще се валидират съси резултатите ще се валидират със сравняване на двете копия.сравняване на двете копия.  Дава възможност да се определи качеството иДава възможност да се определи качеството и на двете копияна двете копия
  • 5.
    Сравнение ...Сравнение ... С резултатите от подобна оценка направенаС резултатите от подобна оценка направена за референтен геном на чиста линияза референтен геном на чиста линия мишки с високо покритиемишки с високо покритие:: Wesche, P.L., Gaffney, D.J., Keightley, P.D.Wesche, P.L., Gaffney, D.J., Keightley, P.D. (2004)(2004) DNA sequence error rates inDNA sequence error rates in Genbank records estimated using theGenbank records estimated using the mouse genome as referencemouse genome as reference.. DNA sequenceDNA sequence 15(5/6): 362-64.15(5/6): 362-64.
  • 6.
    Благодаря за вниманието!Благодаряза вниманието! Въпроси и предложения?Въпроси и предложения?
  • 7.
    Благодаря за вниманието!Благодаряза вниманието! Въпроси и предложения?Въпроси и предложения?