Весной 2022 года ученые представили почти полную непрерывную версию прочтения человеческого генома. Но в ней оставалось одно белое пятно — мужская Y-хромосома, полностью прочитать которую до этого не удавалось. В декабре для предварительного просмотра была выложена статья международного консорциума, закрывающая этот пробел. Соавтором этой работы стал ученый из СПбГУ Иван Александров. В интервью «Собака.ru» он рассказал о том, что достижение даст для медицины, исследований старения мужчин, борьбы с раком и изучения эволюции.
Иван Александрович, расскажите о расшифровке генома человека? Это ведь большой проект, который длится уже более 30 лет.
Я бы даже сказал, что это несколько проектов. Впервые об этом заговорили в конце 1980-х годов, тогда были большие споры нужно ли это делать вообще или нет, возможно или невозможно. Многие сомневались в успешности затеи и настаивали, что это лишняя трата сил и ресурсов ученых.
В итоге пошли по компромиссному пути — расшифровали не весь геном, а те его участки, которые были тогда наиболее интересны. Это были области ДНК, в которые входят гены, то есть сравнительно длинные уникальные участки ДНК, они составляют примерно 90% генома. Результаты этой работы были опубликованы в 2003 году. И довольно быстро все споры о том, надо это было делать или нет оказались быстро забыты. Потому что произошел гигантский прогресс!
А что именно это дало человечеству?
Знания о всех генах, которые есть в ДНК человека и их окружении. На основе этой работы ученые стали собирать гигантские базы для последующих исследований. Одна из них — UK-Biobank, в ней хранятся данные сотен тысяч людей.
У этих людей брали образцы ДНК, а заодно подробно спрашивали о том, бывают ли у них мигрени, есть ли тенденция к повышенному давлению, есть ли проблемы с зубами и даже хорошо ли они спят по ночам. И теперь ученые всего мира исследуют эти базы данных, пытаясь выявить закономерности, как изменение в том или ином гене связаны с жалобами, которые есть у этих людей.
То есть все новости о том, что ученые нашли «ген бессонницы» или «ген ожирения» идут оттуда?
Не всегда напрямую, но да. У ученых могли быть какие-то предположения, допустим, они замечали, что у людей, которые плохо спят по ночам, как-то отличается один из белков в организме. Однако настоящие статистические, проверенные данные о том, что тот или иной участок генома связан с бессонницей, теперь основываются именно на этих базах данных. И все это было бы невозможно без публикации большей части генома человека в 2003 году.
Как не были бы возможны и многочисленные эволюционные исследования, за которые в этом году была дана Нобелевская премия биологу Сванте Паабо, который работает с геномами неандертальцев, денисовцев и других древних людей.
Но почему тогда до сих пор появляются новости о том, что геном человека продолжают читать?
Как я уже сказал, в 2000-х годах был расшифрован не весь геном. В этом прочтении оставались «дырки» (примерно 10%), которые было невозможно расшифровать в то время.
А что это за области?
Это так называемые тандемные повторы. Если вы помните, в ДНК есть четыре вида нуклеотидов, органических соединений из которых и состоит наш геном. Они обозначаются на схемах четырьмя буквами. Эти буквы могут выстраиваться в длинные оригинальные последовательности из сотен и тысяч символов. Так устроены гены, которые в таком виде повторяются в наших хромосомах очень редко или даже не повторяются ни разу.
Но гены составляют не всю нашу ДНК, а лишь ее часть. Остальное заполнено повторами, о которых я сказал выше. Это короткие последовательности в пару сотен или несколько тысяч «букв»-нуклеотидов, которые могут повторяться в хромосоме несколько тысяч раз подряд. Вот их-то как раз в 2000-е годы и не получалось прочитать.
А в чем была сложность?
Тут нужно сказать несколько слов о том, как вообще читают ДНК. После того как мы взяли образец, мы выделяем из клеток ДНК. Во время этого процесса она рвется на множество частей, которые затем необходимо прочитать и заново собрать в той последовательности, как они были.
Я помню один биоинформатик рассказывал мне, как проходит эта работа. Он говорил: «Представьте себе комнату в которой хранились несколько копий полного собрания сочинений Ленина. Потом в этой комнате произошел взрыв, после которого вы пытаетесь заново составить это полное собрание сочинений, сравнивая обрывки из разных копий, чтобы понять, в какой последовательности располагались буквы на каждой странице».
Да, неплохая метафора. Так вот, раньше ученые могли читать такие обрывки длиной до тысячи букв-нуклеотидов. Если вы находили два фрагмента, в которых 200 букв полностью совпадали, то вы понимали, что это один и тот же фрагмент хромосомы, только оборванный с разных краев. Вы могли наложить их друг на друга «склеить» и искать следующий фрагмент, который бы хотя бы на 200 символов пересекался бы с уже собранным. И снова, и снова. Как пазл. Все это, конечно, делается не вручную, а с помощью специальных программ, они так и называются ассемблеры, то есть сборщики.
Когда у вас длинные неповторяющиеся последовательности все это хорошо работает, но вот когда у вас какой-то фрагмент повторяется несколько тысяч раз подряд, ассемблер не складывает его как длинную последовательность, а просто считает, что это одинаковые кусочки одного и того же места и не выстраивает их в длинную цепочку. Повторы коллапсируют. Правильно прочитать массивы повторов получилось только сейчас, когда у нас появились возможности расшифровывать огромные куски ДНК в десятки и сотни тысяч букв зараз. В результате весной международной группе ученых удалось опубликовать полное прочтение всех хромосом гаплоидного генома с Х-хромосомой, а сейчас мы представили последний кусочек — Y-хромосому. Кстати в этой работе большую роль сыграли мои коллеги из СПбГУ. Они как раз разрабатывали новые программы-ассемблеры и программы для проверки качества собранной последовательности повторов, которые сделали эту работу возможной.
А зачем эти фрагменты с повторами вообще читать?
Чтобы лучше понимать, как устроен наш геном. К примеру, мужская Y-хромосома, которую нам как раз и удалось прочитать — это одно сплошное такое трудное место. Она состоит из повторов на две трети! То есть до сегодняшнего момента мы не понимали, как выглядит большая часть хромосомы, которая отвечает за пол человека. Многое было известно, но полную картину мы получили только сейчас.
Кроме того, именно эти фрагменты важны для понимания эволюции. Дело в том, что мутации в генах происходят довольно редко, значимых изменений может не наблюдаться в течение сотни тысяч лет. А вот в повторах они как раз случаются сравнительно часто — это самая быстро эволюционирующая часть ДНК. Поэтому они информационно в этом смысле куда богаче и исследователям эволюции теперь предстоит собрать хороший урожай на этом поле, который позволит лучше понять, как менялся человек за последние десятки и сотни тысяч лет.
А для чего еще важно это исследование?
Как мы уже проговорили Y-хромосома определяет пол человека. Грубо говоря мужчина — это человек, у которого есть Y-хромосома. Знание о том, как она устроена, важно для понимания процесса определения пола. Ведь далеко не у всех видов это происходит таким же образом как у человека.
Во-вторых, есть еще одна важная вещь. Давно известно, что в старости в отдельных клетках иногда теряются Y-хромосомы. Это происходит примерно у каждого пятого пожилого мужчины. Чаще всего их недостает в клетках крови. Причем на тех самых огромных базах генетических данных, о которых мы говорили в начале, было показано, что потеря Y-хромосом связана с меньшей продолжительностью жизни.
Кроме того, Y-хромосом часто не находят у мужчин в клетках опухолей. Не исключено, что их потеря связана с вероятностью возникновения и тяжестью рака. Но это пока все предположения...
И чтобы их подтвердить или опровергнуть как раз и нужна была полностью расшифрованная Y-хромосома?
Естественно. Дело в том, что у разных человеческих популяций, например этнических групп, Y-хромосома очень сильно различается. Поэтому возникает вопрос, вдруг какие-то эволюционные события, которые происходят в этом участке генома как раз и приводят к тому, что у части людей Y в старости теряется. Ведь такое происходит только с 20% мужчин, а не со 100%. Это еще необходимо проверить, но такая гипотеза первой приходит в голову.
А не могли бы вы рассказать о своей роли в исследовании?
Я отвечал за анализ центромер, собственно я всю свою научную карьеру ими и занимаюсь. Что это такое — хромосому часто рисуют в виде бантика, так вот узелок посередине этого бантика и есть центромера. Именно к этому месту во время деления клетки крепятся специальные микротрубочки, которые растаскивают удвоившиеся хромосомы по двум новым клеткам. Если эти трубочки как-то плохо прикрепились, то в одну из клеток может попасть лишняя хромосома, из-за этого, в частности, возникает синдром Дауна.
Собственно эти центромеры опять же состоят из повторов. Поэтому мы с коллегами решали, как их можно правильно сложить и потом посмотреть, что получилось. Кстати результат нашей работы теперь может увидеть любой желающий на специальном сайте, где прочитанные нами хромосомы полностью визуализированы, а разные повторы обозначены разными цветами. Вы можете увидеть общую картину, а можете приблизить какой-то участок или даже посмотреть на отдельные последовательности нуклеотидов.
Ваша работа на этом завершена?
Нет. Дело в том, что мы пока решили только упрощенную задачу - собрали гаплоидный набор хромосом. То есть одну копию каждой хромосомы. Для этого использовали специальную клеточную линию. Однако у живых людей каждая хромосома имеет две копии, и они могут немножечко друг от друга отличаться. Поэтому нашей следующей задачей является сборка именно такого полноценного генома, с двумя версиями каждой хромосомы.Когда мы научимся делать такую сборку, руки генетиков будут развязаны.
Плюс я работаю с родственным консорциумом, который взял на себя задачу каталогизировать разнообразие человеческих геномов. Они планируют расшифровать не какой-то единичный геном, а взять образцы у 350 человек разных этнических групп и сделать полные сборки этих геномов, которые потом можно будет сравнить. Эта задача еще лет на 10 вперед, если имеется в виду не только сравнить, но и переварить результаты этого сравнения, сделать выводы.
А зачем это нужно?
Это нужно потому что люди, как оказывается, очень разные (смеется). Усредненный геном не объясняет всего разнообразия биохимических и биофизических феноменов, которые происходят в нашем теле. Почему у представителей разных этносов отличаются, к примеру, результаты медицинских анализов? Все это необходимо изучить. Я уже могу сказать, что центромеры у людей разного происхождения очень сильно отличаются, не исключено, что это имеет определенные медицинские последствия.
Комментарии (0)