Глубокое секвенирование позволит однозначно диагностировать и лечить онкологические и другие серьезные заболевания

текст: Сергей Муреев, PhD, Институт молекулярной биологии университета Квинсленда, Австралия

Некоторое время назад ученые, работающие в области диагностики и терапии рака, обнаружили, что при многих формах лейкемии гены, ответственные за раковую трансформацию клеток, не содержат мутаций в последовательности своей ДНК и почти не отличаются от генов здоровых клеток. На Международной конференции по проблемам рака, прошедшей в мае этого года в Брюсселе, были представлены сходные наблюдения и в отношении других форм онкозаболеваний.

"Достаточно посмотреть на собственное лицо. Волосы, глаза, кожа, губы — все эти элементы состоят из клеток, несущих одну и ту же генетическую информацию. Тогда откуда такие различия?" — иронизирует основатель хьюстонского Центра эпигенетической раковой терапии Жан-Пьер Исса, один из провозвестников современной эпигенетики. Термин "эпигенетика" был введен в середине прошлого века для объяснения описанного феномена: как единственная исходная клетка в процессе пролиферации и дифференцировки образует морфологически и функционально отличные друг от друга ткани и органы.

Первый шаг к объяснению был сделан около четверти века назад: выяснилось, что в клетках разных тканей молекулы ДНК — носителя всей наследственной информации — по-разному помечены метильными группами, состоящими из углерода в ковалентной связке с тремя атомами водорода (-СН3). Метилированные участки ДНК неактивны, что и вызывает ткане-специфическую мозаичность в наборе белков. Недавно выяснилось, что мозаичность оркестрована гораздо сложнее: для упаковки хромосомальной ДНК человека в ядро размером в тысячную долю миллиметра нить ДНК общей длиною 2м (!) и толщиной 2.4 нм накручивается на ~30 миллионов катушек, состоящих из белков — гистонов. Было обнаружено, что гистоны, по аналогии с метильными группами в ДНК, содержат разнообразные химические метки, разные сочетания которых определяют так называемый гистоновый код. В зависимости от кода катушки могут ослаблять либо усиливать натяжение ДНК-нити, включая или выключая различные гены в различных клетках.

В 1953 году усилиями ученых из разных областей было показано, что молекула ДНК состоит из двух цепей, подобно одежной молнии. Каждая цепь несет миллионы "зубцов", но всего четырех типов: два "больших", исторически обозначаемых A и G, и два "маленьких" — T и C. Последовательность зубцов четырех типов и определяет последовательность гена и соответствующего ему белка. "Зубцы" (основания), однако, не цепляются друг за друга в произвольном порядке, а становятся строго: А только напротив Т и G только напротив C — или наоборот, "застегивая" обе цепи друг на дружку так, что большое основание ("зубец") оказывается всегда напротив маленького, комплементарного ему, поддерживая правильную геометрию ДНК-молекулы. Изложенный принцип комплементарности обеспечивает точную достройку одной цепи по другой и, таким образом, равное распределение наследственной информации при делении клетки. Немногим позже Северо Охоа и Артур Корнберг показали, что двуцепочечная ДНК служит матрицей для построения точной, но только одноцепочечной копии молекулы РНК. Уже в 1958 году на основе экспериментов французских ученых (Парди, Жакоба и Моно) Фрэнсис Крик выдвигает важный принцип передачи информации в биологических системах: от ДНК до белка, через РНК (и этим подводит структурно-функциональную базу под гипотезу гена, предложенную в начале XX века основоположником генетики Томасом Морганом). В биологии почти на полвека поселяется концепция о ДНК как о гигантском хранилище генов, кодирующих белки по формуле "один ген — один белок"; при этом молекулам РНК отводится лишь скромная вспомогательная роль простого посредника между ними. Белковым же молекулам отдается главенствующая роль в определении фенотипического и поведенческого разнообразия жизненных форм, подразумевающая, что эволюционное совершенствование организмов (от бактерии к человеку) есть, по сути, следствие усложнения белковых ансамблей, по принципу "новый белок — новая функция". Больше 30 лет потребовалось, чтобы понять, что это далеко не так.

Узнать, что за белковые ансамбли закодированы в "черном ящике" ДНК разных организмов, можно, установив последовательность миллиардов оснований ("зубцов") во всей ДНК клетки (геном). Несовершенство методов секвенирования растянуло процесс прочтения первых геномов на десятки лет: от простого вирусного, завершенного в 1976-м, до генома человека — в 2003. Период открытий второй половины ХХ века сменился этапом углубления в клеточный микромир, успешность которого целиком определяется качеством инструментов и продвинутостью технологий.

В последние годы секвенирование достигает высот технической эстетики, когда на миниатюрной подложке белок-фермент, подобно собачке на молнии, движется по одной цепи ДНК, достраивая вторую из свободных оснований ("зубцов"), помеченных четырьмя разными цветовыми метками для A, T, G и C. Такая технология позволяет уловить вспышки разного цвета (в зависимости от встраивающегося в комплементарную цепь основания) и по цветовому штрих-коду установить всю последовательность. Метод становится автоматическим, высокопараллелизованным, быстрым (неделя на геном) и дешевым (цена снизилась в 100 тысяч раз).

Сенсация не заставила себя ждать: с появлением геномных библиотек 190 организмов разной сложности выяснилось, что у человека, крошечного червя Caenorhabditis elegans и растения Arabidopsis одно и тоже количество генов — примерно 20 тысяч, при этом белок-кодирующие гены составляют у человека лишь около 1% всего генома, тогда как остальные 99% представлены молчащей ДНК. По утверждению ведущего специалиста постгеномной эры Джона Маттика, именно наивысшему содержанию молчащей ДНК человек обязан высоким уровнем собственного развития. Но главным достижением явилось понимание, что емкость изменчивости значительно превосходит емкость генов.

Дыхание молчащего генома научное сообщество расслышало лишь несколько лет назад, когда обнаружилось, что он активно продуцирует сотни тысяч белок-некодирующих — молчащих — молекул РНК разных типов: микро (piRNA, siRNA), малые (miRNA), а также РНК-гиганты (lncRNA). Молекула РНК уникальна: точная копия нуклеотидной последовательности ДНК, но однонитевая с менее жесткой структурой, РНК, в отличие от линейной строго двуцепочечной ДНК, способна замыкаться сама на себя, приобретая вид диковинных 3D-структур, но в точном соответствии с цифровой последовательностью оснований ("зубцов"). Таким образом, одна и та же молекула может как по правилу комплементарности взаимодействовать с ДНК, носителем цифровой информации в клетке, так и, благодаря поверхностным выступам и ямкам, специфически связываться с белками, носителями аналоговой информации.

Комбинирование аналогового и цифрового в одной молекуле, по выражению профессора Маттика, и позволяет некодирующим РНК осуществлять высокоуровневую интегративную регуляцию генной экспрессии. Так, белки-модификаторы, связываясь со структурными мотивами регуляторных РНК по аналоговому принципу, доставляются к строго комплементарному участку ДНК и в составе ДНК-РНК гибрида метилируют ДНК, переписывают гистоновый код или же в составе РНК-РНК гибрида расщепляют белок-кодирующие РНК — феномен, известный под названием РНК-интерференции.

Понимание того, что в основе эпигенетического разнообразия лежат миллионы регуляторных молчащих РНК, стало главным открытием последних лет.

Появление глубокого секвенирования, одновременно происходящего в миллионах микролунок на миниатюрной подложке, в 2005-м дало возможность установить последовательность каждой(!) отдельной молекулы РНК внутри клетки и увенчалось тысячекратным всплеском публикаций в 2010 году. Выяснилось, к примеру, что наивысшее разнообразие регуляторных РНК приходится на головной мозг, их сложнейший ансамбль лежит в основе памяти, поведения и когнитивных функций человека. Болезни и расстройства нервной системы корнями уходят в мир малых некодирующих РНК. Сенсацию произвела обзорная публикация в журнале Nature в марте этого года, показавшая, что большинство раковых и хронических заболеваний, а также — склонность к инфекционным заболеваниям могут иметь эпигенетические причины.

"Эпигенетические изменения обратимы, и в этом большое преимущество эпигенетики перед генетикой", — говорит доктор Мукеш Верма, завотделом эпигенетики в Национальном институте рака в Бетесде, метафорически сопоставляя их с легкоманипулируемым софтом и неизменным хардом. Глубокое секвенирование дает все предпосылки для развития индивидуальной эпигенетики — воссоздания качественной и количественной картины всего разнообразия регуляторных РНК индивида. Последнее, по сути, позволит оцифровать норму и патологию. По характерному штрих-коду можно будет однозначно диагностировать и проводить точную комплексную РНК-терапию раковых и других заболеваний.

1. Taby, R. & Issa, J. P. Cancer epigenetics. CA Cancer J Clin 60, 376-392, doi:10.3322/caac.20085 (2010).

2. Henikoff, S. Histone modifications: combinatorial complexity or cumulative simplicity? Proc Natl Acad Sci U S A 102, 5308-5309, doi:10.1073/pnas.0501853102 (2005).

3. Shendure, J. & Ji, H. Next-generation DNA sequencing. Nat Biotechnol 26, 1135-1145, doi:10.1038/nbt1486 (2008).

4. Birney, E. et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature 447, 799-816, doi:10.1038/nature05874 (2007).

5. Core, L. J., Waterfall, J. J. & Lis, J. T. Nascent RNA sequencing reveals widespread pausing and divergent initiation at human promoters. Science 322, 1845-1848, doi:10.1126/science.1162228 (2008).

6. Mattick, J. S., Amaral, P. P., Dinger, M. E., Mercer, T. R. & Mehler, M. F. RNA regulation of epigenetic processes. Bioessays 31, 51-59, doi:10.1002/bies.080099 (2009).

7. Taft, R. J., Pang, K. C., Mercer, T. R., Dinger, M. & Mattick, J. S. Non-coding RNAs: regulators of disease. J Pathol 220, 126-139, doi:10.1002/path.2638 (2010).

8. St Laurent, G., 3rd & Wahlestedt, C. Noncoding RNAs: couplers of analog and digital information in nervous system function? Trends Neurosci 30, 612-621, doi:10.1016/j.tins.2007.10.002 (2007).

9. Siomi, H. & Siomi, M. C. On the road to reading the RNA-interference code. Nature 457, 396-404, doi:10.1038/nature07754 (2009).

10. Satterlee, J. S. et al. Noncoding RNAs in the brain. J Neurosci 27, 11856-11859, doi:10.1523/jneurosci.3624-07.2007 (2007).

11. Brower, V. Epigenetics: Unravelling the cancer code. Nature 471, S12-13, doi:10.1038/471S12a (2011).

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...