1. Спектральное секвенирование
ДНК и РНК
Проект по созданию и коммерциализации
устройства для секвенирования одиночных мо-
лекул ДНК и РНК на основе комбинации методов
оптической спектроскопии и технологий микро-
электроники.
Контакты: Владислав Трошин
vladislav.troshin@gmail.com
8 (929) 509 44 89
2. Создание спектро-секвенатора ДНК и РНК
– что это за проект? Что вообще такое
секвенатор?
Если не вдаваться в подробности, то можно гово-
рить, что развитие и функционирование всех живых
организмов, включая человека, определяют молекулы
нуклеиновых кислот ДНК и РНК. Эти молекулы со-
стоят из последовательности отдельных «букв» ну-
клеотидов и этими «буквами» записано то, как будет
выглядеть живой организм, как развиваться, как и чем
будет болеть, сколько сможет прожить.
Попробуйте представить живую клетку, как город
с огромным количеством устройств, работающих в
унисон для самоподдержания этого города, для взаи-
модействия с окружающим миром, для самостоятель-
ной диагностики и самостоятельного воспроизвод-
ства в случае поломки, для производства энергии и
т.д. В основе работы этого города лежит компьютер.
Операционная система такого компьютера и все не-
обходимые для работы файлы зашифрованы последо-
вательностью нуклеотидов в молекулах ДНК и РНК.
В этих молекулах собрана информация о том, как
и из чего будет собрана эта клетка, т.е. из каких белков
(устройств) она будет построена, как и в какое вре-
мя делать эти белки, откуда брать информацию для
создания этих белков. Это набор некоторых инструк-
ций. Вот часть текста с определённой информацией,
с помощью неё синтезируем тот или иной белок, по-
том другой, но уже из другого места текста, а про-
изводство третьего белка начинаем в другое время и
только в строго определённом количестве. В ДНК и
РНК записана структура клетки, и то, как этой клет-
кой управлять. Это компьютер. Очень совершенный,
он может не только самостоятельно работать, но и сам
управлять своей работой.
Хотя это совершенная и очень сложная система,
но любой сбой может привести к неправильной ра-
боте клетки. Поэтому надо знать последовательность
этих инструкций. Расшифровать последовательность
нуклеотидов для понимания работы клетки, найти
ошибки — найти причины многих болезней.
Для расшифровки последовательностей нуклео-
тидов в ДНК и РНК нужно специальное устройство.
Представьте… молекула ДНК имеет диаметр всего 2
нм, а отдельные нуклеотиды всего 0.34 нм. У челове-
ка 2x3000000000 нуклеотидов. Это 2.4 метра, а ведь
кроме всей информации в ДНК (генотипе) человека
есть ещё и механизмы для её считывания и управле-
ния синтезом белков, основанные на РНК, так называ-
емый транскриптом. И эту последовательность надо
как-то прочитать. Собственно, устройства для чтения
последовательности ДНК и РНК называют секвенато-
рами или генетическими анализаторами. От англий-
ского слова sequence —последовательность.
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TTG A CGA T AA
A AG A GGT A GC TT AG A CG CA TC AA
GG T
3. ДНК
дезоксирибонуклеиновая
кислота
ДНК — (Дезоксирибонуклеиновая
кислота, Deoxyribonucleic acid,
DNA) нуклеиновая кислота,
содержащая генетическую
программу развития и
функционирования почти всех
известных живых организмов.
Последовательности в ДНК с
наследственной информацией
называются генами. Многие
другие последовательности в
ДНК выполняют структурные и
регуляторные функции по
прочтению генетической
информации.
1.65 м
Основная роль ДНК в клетках —
долговременное хранение
информации о структуре РНК и
белков.
Молекулы ДНК состоят из
последовательностей
нуклеотидов, состоящих в свою
очередь из фосфатных групп,
сахара (дезоксирибоза) и
азотистых оснований (аденин,
гуанин, цитозин, тимин).
Последовательности в ДНК с
наследственной информацией
называются генами. Многие
другие последовательности в
ДНК выполняют структурные и
регуляторные функции по
прочтению генетической
информации.
1. Диаметр ДНК — 1.98 нм.
2. Шаг между отдельными
основаниями — 0.34 нм.
3. Шаг двойной спирали — 3.4 нм.
4. На один виток — 10 оснований.
5. “Скелет” ДНК и РНК составляет
сахаро-фосфатный остов.
2.04 м
В человеском теле по разным оценкам около 100
триллионов клеток.
Если все нуклеотиды человека (примерно 6000000000
в одной клетке) выложить в одну линию, то общая
длина будет почти в 45 раз больше, чем максимальное
расстояние от Солнца до Нептуна (последняя планета
Солнечной системы — 4553946490 км).
Длина последовательности всех
нуклеотидов ДНК из одной
соматической клетки человека
около 2.04 м. Средний рост
человека около 1.65 м.
4. РНКрибонуклеиновая
кислота
РНК - (рибонуклеиновая кислота,
ribonucleic acid, RNA) нуклеиновая
кислота, одна из основных
биологических макромолекул
(вместе с ДНК, углеводами и
белками), основа всех известных
живых организмов.
РНК выполняет в живых
организмах различные функции
(перенос информации,
кодирование белков, катализ и
т.д.).
Молекулы РНК состоят из
последовательностей
нуклеотидов, состоящих в свою
очередь из фосфатных групп,
сахара (рибоза) и азотистых
оснований (аденин, гуанин,
цитозин, урацил).
A
1. Транскрипция — синтез
молекулы РНК на основе
молекулы ДНК (перенос
информации с ДНК на РНК).
2. Трансляция — синтез белка из
аминокислот на молекуле
матричной РНК.
3. Белки — основные компоненты
всех живых организмов, они
участвуют в большинстве
жизненных процессво клетки.
Белки осуществляют обмен
веществ и энергетические
превращения. Белки входят в
состав клеточных и внеклеточных
структур.
4. Жизнь всех существующих
организмов могут поддерживать
только клетки.
Транскриптом
—
механизм для считывания
информации с ДНК и
управления синтезом
белков.
Секвенатор ДНК/РНК или генетический анализатор
—
(от англ. sequence — последовательность, DNA sequencer, genetic analyzer,
DNA sequenator) класс устройств для определения нуклеотидной
последовательности молекул ДНК или РНК. Принцип работы секвенаторов
ДНК основан на различных принципах и технологиях. Результатом работы
такого устройства является символьное описание последовательности
отдельных нуклеотидов в молекуле ДНК или РНК.
5. 1865. Мендель открыл законы генетики
1860
1980
1970
1950
1960
1990
1870
2010
2000
Некоторые даты
1953. Уотсон и Крик открыли, что ДНК имеет
структру двойной спирали
1966. Холли, Корана и Ниренберг
расшифровали генетический код
1977. Сэнгер, Берг и Гильберт разработали
первые методы секвенирования
1997. Определена последовательность
генома кишечной палочки
2000. Определена последовательность
генома мухи дрозофилы
1990. Старт проекта “Геном человека”
2003. Завершение проекта “Геном человека”
2001. Предвариетельный “Геном человека”
2004. Публикация “Генома человека”
2005. Первые NGS системы
2007. Первый персональный геном человека
2009. Первая карта метилирования ДНК человека
6. Как такие устройства работают?
Представьте. Вы заходите в тёмную комнату, в
комнате надо найти стул. Можно, конечно, искать его
на ощупь, но проще включить свет и увидеть стул.
Хуже, если сначала надо найти выключатель, но вот
если и он подсвечивается, то всё ни так уж и плохо.
Так же и с секвенированием ДНК. Его надо просто
«увидеть». Кстати, ещё Ричард Фейнман говорил об
этом в знаменитой лекции «Там внизу много места» в
части про исследования ДНК.
Все современные секвенаторы работают по этому
принципу. ДНК каким-либо образом подсвечивают.
Для этого пользуются различными особенностями
ДНК. Например, если у нас есть одна цепочка ДНК,
то при добавлении отдельных нуклеотидов в опреде-
лённых условиях сформируется вторая цепочка. А
если эти нуклеотиды сделать чуть-чуть другими, так
что бы они могли светится при некоторых условиях,
то свет от такого нуклеотида уже можно увидеть в
микроскоп. Большинство современных секвенаторов
— особые микроскопы, которые позволяют видеть
присоединение таких нуклеотидов к ДНК. Новые
«полупроводниковые» секвенаторы работают на по-
хожем принципе, только вместо света они измеряют
другие характеристики, например, изменение кислот-
ности раствора при присоединении нуклеотидов.
Конечно, свет от одной молекулы очень-очень
слабый, но для решения этой проблемы пользуются
способностью ДНК в некоторых условиях самостоя-
тельно копироваться. ПЦР-амплификация – полиме-
разная цепная реакция при которой с одной молекулы
ДНК можно получить миллионы копий. Если сделать
много таких копий, то получившегося света будет до-
статочно для того, чтобы определить факт присоеди-
нения нуклеотидов.
Если для каждого нуклеотида сделать свой цвет,
то можно увидеть где и какой именно нуклеотид при-
соединился. Для прочтения основных А, Т, Г, Ц нуж-
но четыре цвета. Для прочтения последовательности
нужно добавлять такие нуклеотиды перебором. Прав-
да, для работы достаточно одного цвета, но использо-
вание нескольких упрощает решение задачи.
К сожалению, такой метод работает только для
коротких участков ДНК. 100-1000 оснований. Очень
редко больше. На фоне 3000000000 пар оснований —
это очень мало. Если взять более длинный участок
– начинаются ошибки. Поэтому ДНК сначала надо
«разрезать» на отдельные фрагменты и таких фраг-
ментов должно быть не менее 3-х миллионов. Этот
процесс называется подготовкой «библиотеки».
Весь процесс выглядит следующим образом.
Из клеток выделяют ДНК. Разрезают на небольшие
фрагменты. Обычно после этого идет несколько ста-
дий по постепенному превращению материала из
клетки в материал пригодный для секвенирования.
Так как потери на каждой стадии велики, то в конце
процесса нужно увеличить число копий молекул ДНК
(часто в 1000-1000000 раз). Потом полученные не-
большие фрагменты прикрепляют к чему-либо. Это
обычно специализированный чип, на его поверхности
«островками» нанесён специальный препарат, ДНК
прикрепляется к этому препарату, или шарики микро-
скопических размеров к которым прикрепляется ДНК
на поверхности, которые потом помещают в ячейки
на чипе. Дальше опять нужно увеличить число копий
фрагментов молекул в месте их прикрепления. Весь
чип промывают раствором с определённым модифи-
цированным нуклеотидом и смотрят где светится.
Отмывают от остатков раствора и опять вносят в чип
раствор с меченым нуклеотидом, но уже другим. И так
множество раз, пока не будут пройдена все последо-
вательность множества фрагментов. Информацию о
прочитанных фрагментах, как кусочки пазла, объеди-
няют в единую картину на мощных компьютерах. Это
так называемые NGS секвенаторы, или секвенаторы
следующего поколения (Next Generation Sequencing).
A T
A T
AT
G C
G C
GC
GC
GC
GC
T A
T A
T A
7. NGS
секвенаторы
Next-Generation Sequencing —
следующее поколение устройств
для секвенирования, секвенаторы,
предназначенные для
секвенирования полных геномов
организмов в разумные сроки и по
разумной стоимости. Их работа
основана на различных принципах
и технологиях. К NGS можно
отнести секвенаторы второго,
третьего и последующих
поколений.
1. Клетки выделяют из человека.
2. Из множества клеток выделяют
ДНК или РНК.
3. Двойную цепочку ДНК
разделяют.
4. Одиночные цепочки ДНК делят
на фрагменты.
5. Увеличивают количество копий
фрагментов с помощью
полимеразной цепной реакции.
6. Фрагменты прикрепляют к
поверхности чипа.
7. Обычно проводят
дополнительное увеличение копий
фрагментов ДНК уже на
поверхности чипа.
8. Для визуализации
присоединения нуклеотидов
используют модифицированные
нуклеотиды. При присоединении к
ДНК происходит свечение.
9. Перебором добавляют меченые
нуклеотиды. Присоеденяются
нуклеотиды только в особом
порядке, в таком же как и в
начальной цепи - в этом и есть вся
основа секвенирования.
10. Каждому цвету соответсвует
свой нуклеотид (можно
использовать и один цвет).
Последовательность цветов
совпадает с последовательностью
нуклеотидов.
A T
A T
A T
G C
G C
GC
GC
GC
GC
T A
T A
T A
A T
G C
G C
A T
A T
G C
G C
A
A
A
G
G
C
C
C
C
T
T
T
A
G
G
A
A
G
G
A
C
C
C
T
T
T
A
A
G
G
C
G
A
G
A
A
G
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
A
C
C
T
T
T
G
G
T
C
A
C
G
C
T
T
T A
A
C
G
C
T
T A
T A
A
A
C
G
C
T
T A
T A
G
A
C
G
C
T
T A
T A
G
T A
C
G
C
T
T A
T A
G
T
C
A GCT T TC
Второе поколение секвенаторов
появилось в 2005 году. Для
увеличения скорости
секвенирования в приборах
второго поколения используется
секвенирование большого числа
молекул ДНК параллельно.
Независимо от технологии
используется фиксация
небольших фрагментов ДНК на
каком-либо субстрате (миллионы
нитей).
К промежуточному поколению
секвенаторов относятся
полупроводниковые секвенаторы
(в качестве сигнала с молекулы
ДНК при присоединении
нуклеотида является
детектирование возникшего иона
водорода, т.е. изменение pH),
технология массивов участков
ДНК при этом сохраняется.
Секвенаторы третьего поколения
могут быть основаны на
совершенно различных
технологиях. Общая особенность
секвенаторов третьего поколения -
возможность проведения
секвенирования одиночных
молекул ДНК (SMS — Single
Molecule Sequence).
Проблемы технологии:
1-3. ДНК и РНК выделяют из
множества клеток. Результат
секвенирования — усредненная
информация. РНК нужно
первоначально преобразовать в
ДНК. Очень трудно получить
надежную информацию из одной
клетки.
4-9. Технология увеличения числа
молекул ДНК приводит ко
множеству ошибок и имеет ряд
ограничений.
4-6. Использование ферментов
приводит к накоплению ошибок.
9-10. Необходимо использование
модифицированных нуклеотидов.
6-10. Нет возможности определять
химически разновидности
составных частей ДНК/РНК.
8. Если такие устройства уже есть, то за-
чем создавать новое?
С 2005 года в мире различные компании произве-
ли и установили уже несколько тысяч устройств. Их
используют учёные и медики. Постепенно секвенато-
ры с высокой производительностью становятся более
доступными. Уже проведено секвенирование ДНК
множества людей. Но у существующих технологий
есть некоторые недостатки.
ДНК или РНК для секвенирования существующи-
ми методами требуется много, поэтому его выделяют
из множества клеток. Из-за этого наше представле-
ние о последовательности ДНК и РНК в одиночных
клетках очень приблизительное. В каждой клетке че-
ловека набор РНК может быть очень разным. К тому
же для РНК нужно не только провести секве-
нирование, но и подсчитать количество
каждой молекулы. Если ДНК только
по две копии в каждой клетке, то
количество разных молекул РНК в
одной клетке может различаться
на несколько порядков. И, ког-
да РНК выделяют из множества
клеток и считают каждый тип
молекулы, то получается какая-
то усреднённая величина, кото-
рой не существует ни в одной из
исходных клеток. Но и ДНК может
быть разным, например, ДНК из ра-
ковой и соседней здоровой клетки мо-
жет отличатся. Эти отличия — мутации.
Они произошли в клетке и сделали её раковой.
Небольшое различие, иногда всего на несколько ну-
клеотидов, но этого достаточно для развития болезни.
А на существующих секвенаторах это трудно увидеть,
потому что для этого требуется работа с индивидуаль-
ными молекулами РНК/ДНК из индивидуальных кле-
ток, что в данный момент делать сложно. Если при
работе с ДНК уже можно приблизиться к этому, то с
РНК это значительно сложнее.
Опять же, при копировании неизбежно проис-
ходят ошибки. Попробуйте переписать один и тот же
большой текст множество раз. Опечатки, ошибки, т.е.
копии будут чуть-чуть отличатся. Получается: каз-
нить нельзя помиловать. Для обычного текста это
может быть не очень большой проблемой – понять
смысл можно и по контексту, но вот, например, ком-
пьютерная программа скорее всего перестанет рабо-
тать. Несколько миллиардов букв и всего несколько
ошибок. А на практике число ошибок при секвени-
ровании достигает нескольких процентов. Кстати, это
очень усложняет работу с РНК/ДНК из индивидуаль-
ных клеток, исходного материала мало и нужно очень
много копий.
Кроме того, используется много различных фер-
ментов для подготовки ДНК для секвенирования по
существующим технологиям. Все они приводят к
различным ошибкам. Там чуть больше отрезано, там
чуть другой фрагмент. С чем-то фермент вообще ра-
ботать не может...
Есть и другая очень серьезная проблема. На са-
мом деле всем известные нуклеотиды А, Ц, Г, Т/У это
только основа генетического кода. В реальности всё
сложнее. У них существуют различные химические
модификации. То есть, к ним могут быть присоедине-
ны различные химические группы. И таких модифи-
каций только сейчас известно более 200…
Каждая из таких модификаций име-
ет свою функцию в геноме и генотипе
человека. Ошибка может быть не
только в том, что вместо Ц прочи-
тали А, но и в том, что прочитали
просто Ц без его модификации.
В клетке была модификация
основания, сделали копию, про-
вели секвенирование ДНК, а
получили просто основание. Со-
временные технологии позволяют
считывать только основные моди-
фикации. Есть технологии для про-
чтения отдельных модификаций, но это
увеличивает количество необходимых опе-
раций по подготовке ДНК к секвенированию.
Если представить, что обычные основания — это
просто корни слов, а их модификации это приставки,
суффиксы, окончания, предлоги и т.д. А прочитать мо-
жем только корни. Например, фразу «хорош… день»,
вместо «хороший день», ещё можно понять, а вот во
фразе «если ключ ген очень быстр яв опухол котор
сложн леч» надо угадывать смысл.
Очень серьезная проблема связана с секвенирова-
нием РНК. Ни одна современная технология не умеет
этого делать, если не превратить РНК в ДНК. А это
очень важно. Например, часть работы по интерпре-
тированию информации с ДНК в белок осуществляет
транскриптом — сложный совокупный механизм для
переноса информации с помощью РНК. Ошибки в
функционировании этого механизма тоже могут при-
вести к болезням. Получается, что с ДНК человека
всё нормально, а болезнь началась.
9. Проблемы
существующих технологий
секвенирования
Проблема определения
модификаций ДНК и РНК
Все современные технологии
секвенирования (оптические и
полупроводниковые) позволяют
считывать только
последовательность основных 4
нуклеотидов (A, T/U, G, C в ДНК и
РНК). В действительности, в ДНК
и РНК присутствуют более 200
различных модификаций этих
нуклеотидов, каждая со своей
биологической функцией.
Ни одна из существующих
технологий не может считать
последовательность модификаций
нуклеотидов.
A T
A T
A T
G C
G C
GC
GC
GC
GC
T A
T A
T A
Прочтено:
А может быть:
Есть технологии для прочтения
отдельных модификаций, но это
увеличивает количество
необходимых операций по
подготовке ДНК к секвенированию.
Усреднение информации
Все современные технологии
позволяют получить только
усредненную информацию со
множества копий ДНК из
множества клеток, тогда как
генетические механизмы даже
двух соседних клеток могут
различаться (например, различие
нервной клетки и клетки стенки
сосуда, или даже двух соседних
нервных клеток).
Выделить ДНК и/или РНК и их
надежно проанализировать из той
единственной клетки, что привела
к образованию опухоли
невозможно.
Например
1. Клетки человека размножаются
делением.
2. Нормальные клетки не могут
делиться без ограничений —
программируемая клеточная
смерть или апоптоз останавливает
бесконечное деление.
3. У раковых клеток такого
ограничения нет.
4. Бесконтрольное деление клеток
приводит к образованию опухоли.
Все начинается с одной клетки.
5. Человек болен…
Рак может быть вызван
перерождением всего одной
клетки. Ни одна из современных
технологий не позволяет понять
какой именно и почему…
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TT AG A CG CA TC AA
A AG A GGT A GC TTG A CGA T AA
A AG A GGT A GC TT AG A CG CA TC AA
GG T
Для секвенирования
нужна сложная обработка
ДНК и РНК
Все современные технологии
секвенирования используют
дополнительные нуклеотиды,
метки, амплификацию и другие
методы, которые вводят
количественные ошибки и
артефакты.
Секвенирование РНК
Ни одна из существующих
технологий не позволяет
полноценно проводить
секвенирование РНК без его
трансформации в ДНК. Это
усложняет технологию и приводит
к большому числу ошибок.
A AG AGT ACT AG A CG C CA
A AG A?T AC? ?G A CG C CA
A AG A?T AC? ?G A CG C ?A
A AG A?T AC? ?G ? CG C ?A
A AG A?T ?C? ?G ? CG C ?A
С каждой стадией
увеличивается число
ошибок
10. Ваш проект направлен на решение этих
проблем?
Да. Конечно, часть этих проблем уже пытаются
решить в других компаниях. Есть несколько устройств
в которые заложена возможность секвенирования ин-
дивидуальных молекул ДНК и РНК, но фактически
это совершенствование существующих технологий.
Меченые нуклеотиды, составление «библиотек» и т.д.
Мы предлагаем немного другую технологию.
Сейчас говорят о «пост-оптическом этапе» в секве-
нировании из-за появления «полупроводниковых»
секвенаторов, но мы считаем, что оптические методы
не исчерпали себя, а просто нужен другой подход. Не
изменять части ДНК или РНК — это не позволит в
принципе считывать все возможные модификации, а
использовать их собственные свойства.
Каким образом?
Мы предлагаем использовать для
секвенирования методики оптической
спектроскопии. Спектр — распре-
деление какой-либо физической
величины. Сейчас для секвениро-
вания в большинстве устройств ис-
пользуют различные флуоресцент-
ные метки, у них тоже есть спектр
флуоресценции, но для работы по
существующим технологиям доста-
точно факта свечения каким-то опреде-
лённым цветом. Весь спектр не нужен, да
и он не несёт необходимой информации. Но
можно использовать другой эффект. Это комбинаци-
онное или Рамановское рассеяние света. Тут нет не-
обходимости использовать метки. Комбинационное
рассеяние можно наблюдать на самом ДНК или РНК.
А сам спектр содержит в себе всю необходимую ин-
формацию о химическом составе молекулы. Какие в
молекуле основания, какие у них модификации. Да, у
этого подхода есть две основные проблемы — слиш-
ком слабый сигнал и малое разрешение, но если ис-
пользовать различные алгоритмы получения спектров
и специализированные устройства и структуры, то
можно обойти ограничения классической оптики и
получить гораздо более высокое разрешение.
Эффект комбинационного или Рамановского рас-
сеяния света — это один из примеров квантовой при-
роды вещества и света. Молекулы не только атомы
химических элементов, собранные вместе, но и то,
как они соединены друг с другом, какие между ними
химические связи. А за химические связи между от-
дельными атомами вещества отвечают электроны.
Т.е. атомные ядра и электроны взаимодействующие
между собой по определённым правилам. С квантами
света — фотонами отвечают именно электроны. Это
взаимодействие тоже может проходить только по не-
которым правилам.
Можно привести такую грубую аналогию рассея-
нию света. Если взять купюру и поменять её на дру-
гую того же номинала, то ничего не изменится. Так же
и со светом, если свет поглотят электроны молекулы,
а потом излучат его с той же частотой, то это Рэлеев-
ское рассеяние света. Если же на купюру с опреде-
лённым номиналом купить что-то, то можно получить
сдачу набором купюр меньшего номинала. Т.е. энер-
гия рассеянного света уменьшится. По аналогии с на-
бором купюр в сдаче получается и набор фотонов с
меньшей энергией – спектр. Для каждой химической
связи свой пик (купюра) в спектре. Весь набор пи-
ков описывает набор химических связей в молекуле,
а значит мы можем узнать, что это за молекула.
Это комбинационное или рамановское рас-
сеяние света.
Слабое комбинационное рассея-
ние от одиночных молекул, напри-
мер, можно усилить на металлах.
Усиление происходит на частицах
золота и серебра, да и других ме-
таллах, но подходят только те, ко-
торые не окисляются на воздухе.
Совмещение с методами сканирую-
щей зондовой микроскопии или исполь-
зование специальных микроэлектронных
устройств позволяет обойти и ограничение по
разрешению, хотя при этом фактически дифракцион-
ный предел остаётся.
Получается новая технология. По этой техноло-
гии берём молекулы ДНК или РНК, получаем с их
участков спектры комбинационного рассеяния и рас-
шифровываем их. Не только основные модификации
нуклеотидов, но их варианты, или комплекс ДНК с
другим соединением.
Например, молекула ДНК расположена у сере-
бряной частицы с размером в несколько нанометров.
При облучении этого места лазером можно получить
спектр с молекулы ДНК. На частице металла проис-
ходит усиление сигнала (т.н. плазмонный резонанс),
этот сигнал уже можно зафиксировать и расшифро-
вать, а если есть информация о местоположении ча-
стицы, то и можно понять к какому участку ДНК этот
сигнал и эта последовательность относится.
11. Спектральное секвенирование
разработка технологии
При комбинационном
(Рамановском) рассеянии
происходит изменение частоты
света. Чем сложнее устроено
вещество, тем более
разнообразное изменение частоты
можно увидеть.
Большинство органических
веществ имеет спектр
комбинационного (Рамановского)
рассеяния - КР. Каждое вещество
имеет свой спектр КР.
Зная этот спектр, можно понять с
какого соединения он получен.
1. Рэлеевское рассеяние.
2. Комибнационное рассеяние
(Стоксово). Происходит с
уменьшением частоты
рассеянного света.
3. Комбинационное рассеяние
(Анти-Стоксово). Происходит с
увеличением частоты рассеянного
излучения, но оно гораздо слабее
Стоксова рассеяния.
В общем виде спектр ДНК или
РНК состоит из спектров
составляющих эти молекулы
частей. Для расшифровки
последовательности азотистых
оснований в нуклеиновой кислоте
необходимо знать, какому
основанию соответствует тот или
иной пик в общем спектре. В
зависимости от числа различных
оснований в участке ДНК, с
которого получают спектр,
различным будет и общий спектр с
молекулы.
Усиление конаблюдается на
многих металлах.Окисление
поверхности ослабляет сигнал и
вносит спектры оксидов.
Самый интенсивный сигнал можно
получить на частицах меди,
серебра и золота.
Если знать место нахождения
частицы, то тогда известны и
точные координаты усиления.
Таким образом, получается
"увеличение" разрешения
методики.
Э
н
е
р
г
и
я
N
H
H
N
N
N
N
O
H
G
Гуанин
N
N O
H
O
H3
C
T
Тимин
N
N
N
N
NH2
A
Аденин
N
N
NH2
O
C
Цитозин
G
T
A
C
A
T
G
C
Взаимодействие фотонов с
электронами молекул
В общих спектрах, полученных
методами классической или
конфокальной спектроскопии,
собраны отдельные спектры от
450-1500 нуклеотидов. Это
затрудняет расшифровку
нуклеотидной последовательности
ДНК. Поэтому необходимы другие
методы получения спектров.
Необходимо увеличение
“разрешения” и интенсивности
излучения
29
Cu
79
Au
47
Ag
Si/SiO2
Если упрядочить множество
частиц на специализированном
чипе с микроскопическими
каналами можно одновременно
получать спектры с множества
участков ДНК.
12. Почему именно чипы?
Сам эксперименты по наблюдению таких эффек-
тов можно проводить во многих хороших лаборато-
риях, но для создания пригодного для практической
работы устройства нужны технологии микроэлектро-
ники. Надо сделать так, чтобы этот эффект наблюдал-
ся одновременно в нескольких тысяч мест, с тысяч
частиц. Нужно как-то перемещать ДНК (например,
с помощью микрофлюидных устройств – чип с ми-
кроскопическими каналами для перемещения жид-
костей). И все это должно быть упорядочено, иметь
размеры от нескольких микрон до нескольких на-
нометров, это надо иметь возможность сделать. Т.е.
необходимо оборудование для разработки и произ-
водства опытных образцов чипов, специалисты по
дизайну чипов и т.д.
Это кажется, что сложно сделать такое
устройство, но, например, чип в совре-
менных полупроводниковых секвена-
торах мало отличается от чипа в ма-
трице камеры сотового телефона.
Он также работает по технологии
КНОП (CMOS), просто с допол-
нительными слоями со специфи-
ческими свойствами. А те же
микроканальные устройства уже
больше десяти лет используются в
системах диагностики.
Зачем вообще нужно секвени-
ровать ДНК и РНК?
Существует множество направлений. Прежде
всего это медицина, знание генетической последова-
тельности и механизма работы генов необходимо для
определения причин, нахождения способов лечения
и профилактики многих заболеваний. Кроме самой
генетической информации необходимо понимание
процессов её использования в организме. Отдельное
и быстро развивающееся направление современной
медицинской генетики – эпигенетика. Многие забо-
левания вызваны не только ошибками в генетическом
коде, но и его «интерпретацией» в организме челове-
ка, в отдельных клетках, ошибками переноса инфор-
мации из ДНК посредством РНК.
Сюда относятся: наследственные генетические
заболевания, предрасположенность к раку, диабету,
болезни Паркинсона, восприимчивость к бактериаль-
ным и вирусным инфекциям, предрасположенность к
наркомании и другим зависимостям. Получение ин-
формации о генетической последовательности людей
позволяет создавать такие конечные продукты, как
рекомендации по образу жизни, осуществлять под-
бор лекарственных препаратов и их дозировки, соз-
давать индивидуальные химические, биохимические
или генетические препараты (например, генетическая
терапия), индивидуальное лечение онкологических
заболеваний, создание как индивидуальных, так и
массовых вакцин, сывороток от вирусных и бактери-
альных инфекций.
Определение генетической последовательности
возбудителей заболеваний человека позволяет раз-
рабатывать более эффективные лекарственные пре-
параты. Например, изучение бактерий, устойчивых к
основным типам антибиотиков, или создание новых
противовирусных препаратов, определение особен-
ностей и путей распространения генов болезнетвор-
ных организмов. Поиск ключа к решению про-
блемы лечения некоторых ретровирусных
заболеваний (например, ВИЧ), создание
вакцин от ещё не возникших вирусов
(например, создание вакцин от новых
типов гриппа или вирусов, создан-
ных в лаборатории).
Информация о генотипах мно-
жества людей в совокупности со
статистическими данными по ме-
дицинским показателям позволяет
определить закономерности и вероят-
ность развития тех или иных заболеваний
сейчас или в будущем, определить пути рас-
пространения инфекции и получить информацию, не-
обходимую для предотвращения эпидемий.
Создание искусственных организмов или модель-
ных культур клеток, бактерий и вирусов позволит
ускорить поиск (скрининг) новых лекарств, изучать
взаимодействия препаратов, модельных человеческих
клеток и возбудителей заболеваний в лабораторной
среде.
Современная медицина основана в основном на
статистических данных. Назначение лечения, ход
протекания болезней определяются сравнением со-
стояния больных с ранее известными данными. Но
этот подход не всегда приводит к излечению человека.
Часто требуется совершенно иной подход в каждом
конкретном случае. Наличие в распоряжении врачей
доказательного метода для назначения индивидуаль-
ного лечения позволит помочь многим людям.
Si/SiO2
13. Применение секвенирования
основные направления
A T
A T
A T
G C
G C
GC
GC
GC
GC
T A
T A
T A
Медицина
Знание генетической последовательности и
механизма работы генов необходимо для
определения причин, нахождения способов
лечения и профилактики многих заболеваний.
Кроме самой генетической информации
необходимо понимание процессов её
использования в организме. Отдельное и
быстро развивающееся направление
современной медицинской генетики –
эпигенетика. Многие заболевания вызваны не
только ошибками в генетическом коде, но и
его «интерпретацией» в организме человека,
в отдельных клетках, ошибками переноса
информации из ДНК посредством РНК.
Сюда относятся: наследственные
генетические заболевания,
предрасположенность к раку, диабету,
болезни Паркинсона, восприимчивость к
бактериальным и вирусным инфекциям,
предрасположенность к наркомании и другим
зависимостям.
Определение генетической
последовательности возбудителей
заболеваний человека позволяет
разрабатывать более эффективные
лекарственные препараты. Например,
изучение бактерий, устойчивых к основным
типам антибиотиков, или создание новых
противовирусных препаратов, определение
особенностей и путей распространения генов
болезнетворных организмов. Поиск ключа к
решению проблемы лечения некоторых
ретровирусных заболеваний (например, ВИЧ),
создание вакцин от ещё не возникших
вирусов (например, создание вакцин от новых
типов гриппа или вирусов, созданных в
лаборатории).
Информация о генотипах множества людей в
совокупности со статистическими данными по
медицинским показателям позволяет
определить закономерности и вероятность
развития тех или иных заболеваний сейчас
или в будущем, определить пути
распространения инфекции и получить
информацию, необходимую для
предотвращения эпидемий.
Персональная медицина
Современная медицина основана в основном
на статистических данных. Назначение
лечения, ход протекания болезней
определяются сравнением состояния
больных с ранее известными данными. Этот
подход не всегда приводит к излечению
человека. Часто требуется совершенно иной
подход в каждом конкретном случае. Наличие
в распоряжении врачей доказательного
метода для назначения индивидуального
лечения позволит помочь многим людям.
Лечение на основе генетической информации
может дать вероятность возникновения
заболеваний в будущем. Диагностика
заболеваний, связанных с уже
произошедшими и активными изменениями
(например, наличие рака на ранних стадиях).
Биотехнология
Информация о генетической
последовательности живых организмов уже
сейчас используется в сельском хозяйстве и
биотехнологии, генетической инженерии.
Создание новых сортов продовольственных и
технических культур с новыми
характеристиками, развитие отрасли
биотоплива (например, создание культур с
более высоким содержанием сахара для
получения топлива), переработка отходов
(отходы органического происхождения),
ликвидация последствий разливов нефти,
борьба с заболеваниями животных и
растений, создание новых культур дрожжей и
бактерий для различных биотехнологических
процессов (например, получение кормовых
белков, синтез органических веществ и
материалов, и т.д.), поиск новых генов с не
описанными ранее свойствами для
применения в биотехнологии, создание
культур клеток и бактерий для синтеза
лекарственных препаратов.
36.6°
37°
14. Отдельное направление персональной медицины
– лечение на основе генетической информации (может
дать вероятность возникновения того или иного забо-
левания в будущем) и лечение на основе данных об
экспрессии генов (процесс от считывания информа-
ции с ДНК до получения продуктов в клетке на осно-
ве этой информации) в настоящий момент. В случае
анализа экспрессии генов - диагностика заболеваний,
связанных с уже произошедшими и активными изме-
нениями (например, наличие рака на ранних стадиях).
На рынке уже представлены некоторые компании
с продуктами для персональной медицины, их генети-
ческие тесты уже прошли все стадии проверки, кли-
нические тесты и доступны на рынке.
Секвенирование востребовано и в
биотехнологии. Информация о ге-
нетической последовательности
живых организмов уже в на-
стоящее время используется
в сельском хозяйстве и био-
технологии, генетической
инженерии.
Это создание новых
сортов продовольствен-
ных и технических куль-
тур с новыми характери-
стиками, развитие отрасли
биотоплива (например, соз-
дание культур с более высо-
ким содержанием сахара для
получения топлива), переработка
отходов (отходы органического проис-
хождения), ликвидация последствий разли-
вов нефти, борьба с заболеваниями животных и расте-
ний, создание новых культур дрожжей и бактерий для
различных биотехнологических процессов (напри-
мер, получение кормовых белков, синтез органиче-
ских веществ и материалов, и т.д.), поиск новых генов
с не описанными ранее свойствами для применения в
биотехнологии, создание культур клеток и бактерий
для синтеза лекарственных препаратов.
Насколько такая технология востребо-
вано рынком?
Уже сейчас рынок секвенаторов составляет око-
ло 2-х миллиардов долларов в год. Общая капитали-
зация компаний, занятых разработкой и производ-
ством устройств для секвенирования,
превышает 10 миллиардов долларов.
С 2005 года продано несколько тысяч
устройств. Прогнозируется рост до 6-8
миллиардов в год к 2015 году. И это
только рынок устройств. Сами устрой-
ства, расходные материалы, обслужи-
вание и т.д. Рынок, который использует
результаты секвенирования (напри-
мер, для создания тестов на заболе-
вания), да и стоимость других биоме-
дицинских исследований, связанных
с секвенированием, гораздо больше.
Капитализация некоторых компаний,
занимающихся разработками в области секвенирова-
ния, уже достигла нескольких миллиардов долларов.
Многие крупные компании инвестируют в разработки
в области секвенирования.
Какая ситуация у этой
технологии с интеллекту-
альной собственностью?
Будут ли проблемы с па-
тентами других ком-
паний?
Предложенная нами
технология не является
прямым развитием су-
ществующих технологий
секвенирования. Соответ-
ственно, нет необходимости
использовать их патенты. Так
как сейчас работы в этой обла-
сти проводит множество компа-
ний, от специально созданных под
такие задачи до крупных биотехнологи-
ческих корпораций и таких гигантов, как IBM
и Intel, то некоторые противостоящие патенты могут
быть. Непосредственно по нашей технологии точно
таких же патентов нет.
15. Рынок NGS секвенирования
основные данные
NGS секвенаторы
Первые модели появились на рынке в 2005
году.
Стоимость от 50000 до 1000000 USD
Карта распределения NGS секвенаторов по странам мира.
Более 2000 устройств.
По данным: omicsmaps.com
175
146
883
221
94 92 86
47 46 44 39 36 31 31 27 26 23 21 18 16 15 14 14 13 12 11 10
1000
10000
100000
1000000
10000000
100000000
09.2001
03.2002
09.2002
03.2003
10.2003
01.2004
04.2004
07.2004
10.2004
01.2005
04.2005
07.2005
10.2005
01.2006
04.2006
07.2006
10.2006
01.2007
04.2007
07.2007
10.2007
01.2008
04.2008
07.2008
10.2008
01.2009
04.2009
07.2009
10.2009
01.2010
04.2010
07.2010
10.2010
01.2011
04.2011
07.2011
01.2012
Стоимость секвенирования генома человека, USD.
По данным: genome.gov/sequencingcosts/
2012 2015
2 млрд. USD
6 млрд. USD
Объем рынка
секвенирования
(устройства и расходные
материалы)
16. Когда будет выпущено устройство для
секвенирования?
Как и в случае с другими новыми технологиями,
в случае разработки новой технологии секвенирова-
ния сложно дать точную дату выхода этой технологии
на рынок. Мы ориентируемся на срок в 3 года. Это
оптимальное время для такого уровня разработок. Но,
к сожалению, многое зависит от финансирования.
Какаястоимостьбудетутакогоустрой-
ства?
Пока мы оцениваем стоимость такого устройства
в 500-800 тысяч долларов США. Это средний диапа-
зон цен для такого класса устройств. Учитывая каче-
ственное отличие информации, получаемой по этой
технологии, то вполне конкурентная цена. Но над сни-
жением цены мы тоже будем работать, так как ниша
«настольных» секвенаторов нас тоже интересует.
Какие специалисты будут задействова-
ны в проекте?
Прежде всего это биохимики. Тех-
нология разрабатывается под их за-
дачи. Они определяют основное
техническое задание на разработ-
ку этой технологии, они же будут
принимать результат, консульти-
ровать в ходе работы, разрабаты-
вать методики работы по этой тех-
нологии.
Разработкой технологии по тех-
ническому заданию будут заниматься
специалисты по дизайну микрочипов,
микроскопии и спектроскопии, инженеры-
электронщики, инженеры-программисты.
Так как проект подразумевает создание коммер-
ческого устройства в обязательном порядке, то есте-
ственно это будут и специалисты по коммерциали-
зации технологий, специалисты по продвижению
сложной наукоёмкой продукции.
Насколько безопасен этот проект?
Проект направлен на разработку технологии и
приборостроение. Работа с биологическими объек-
тами, представляющими какую-либо опасность, не
подразумевается. Для разработки предлагаемой тех-
нологии это создаст только дополнительные затраты
и трудности, да и это совершенно не нужно для разра-
ботки технологии. Мы будем работать с ДНК и РНК,
но в том виде когда эти молекулы представляют собой
просто химические
вещества. Такие об-
разцы может купить
любая компания или
даже физическое
лицо. Например,
в России есть не-
сколько компаний,
которые официаль-
но продают стан-
дартные образцы
нуклеиновых кис-
лот.
Сами собой ДНК и РНК не представляют опас-
ности. Любая пища, например, банальное яблоко,
содержит огромное количество ДНК и РНК. В чело-
веческом организме чужое ДНК и РНК просто разру-
шается. Для того, чтобы специально созданное ДНК
или РНК (а это не самая простая задача и такими тех-
нологиями обладает далеко не каждое развитое
государство) принесло вред, оно должно
быть в бактерии или в вирусе. Синте-
зировать ДНК или РНК, заниматься
разведением бактерий или вирусов
мы вообще не собираемся.
С чужим ДНК и РНК мы
сталкиваемся постоянно. Оно по-
ступает с пищей, нас окружают
бактерии и вирусы, с человеком в
симбиозе живет огромное количе-
ство микроорганизмов (масса бакте-
рий в среднестатистическом человеке
может достигать килограмма — бакте-
риальных клеток в человеке больше чем соб-
ственных человеческих, но они сильно меньше).
Что касается самой технологии, то прежде все-
го любую технологию можно использовать разными
способами. Уже в мире существует несколько тысяч
секвенаторов, все развитые государства имеют хотя
бы по одному устройству. Контролировать исполь-
зование каждого такого устройства практически не-
возможно. Использование таких устройств могут по-
зволить себе только государства и крупные компании.
Нужен определенный уровень знаний для использова-
ния технологий секвенирования, серьезные затраты.
Так что, использование таких технологий во многом
определяется политическими причинами.