Аллели регуляторных областей ДНК повлияли на поведение транскрипционных факторов

Аллели регуляторных областей ДНК повлияли на поведение транскрипционных факторов

Российские ученые разработали аккуратный алгоритм для поиска аллель-специфичного связывания транскрипционных факторов и собрали самую большую в мире базу таких событий. Случаев, когда замена в регуляторном участке ДНК оказалась важна для управляющих транскрипцией белков, оказалось порядочно — около полумиллиона, и для многих независимо показана клиническая важность. Работа опубликована в журнале Nature Communications.

Активность работы ДНК — сколько белка будет производиться с того или иного участка и при каких условиях — зашита в ней самой. Помимо кодирующих белки генов там есть и регуляторные участки, — посадочные площадки для соответствующих управляющих белков, называемых факторами транскрипции. Приземление на площадку такого белка меняет активность подшефного гена или даже группы генов. Для исследования комплексов белок:площадка существует технология ChIP-Seq, она позволяет создать карту посадочных площадок, оценить активность их использования или сравнить например работу белка-фактора транскрипции у больных и здоровых.

Как и у белок-кодирующих генов у регуляторных последовательностей ДНК есть свои варианты-аллели. Отличие всего на одну-две буквы-нуклеотида может кардинально изменить способность белка узнавать эту площадку и садиться на нее, и это влечет за собой изменение активности генов. На практике большой коллекции таких событий нет, и изучают их не очень активно из-за сложностей обработки данных. Посчитать на основании эксперимента ChIP-Seq соотношение белков, выбравших первый или второй вариант вариант площадки довольно легко, но дальше начинаются проблемы. В клеточных линиях например — обычном материале для экспериментов — может быть нарушена плоидность. Вместо стандартных пар «материнской и отцовской» хромосом, гомолоогичных хромосом может быть и три и больше. В результате на основании ChIP-Seq трудно понять чем обусловлено поведение белка — плохим соединением с одним из вариантов площадки или многократным копированием другого варианта. Кроме того, для раковых образцов типично копирование не целой хромосомы, а отдельных ее кусков.

Группа ученых из Института белка РАН и Института общей генетики РАН придумала, как узнать об аллельных предпочтениях транскрипционных факторов без предварительных знаний о плоидности образца и сделала по ним самую большую на сегодняшний день базу данных ADASTRA (Allelic Dosage-corrected Allele-Specific human Transcription factor binding sites). В основу ее легла стандартизированная обработка более семи тысяч экспериментов ChIP-Seq. Благодаря такому большому количеству данных исследователям удалось поймать больше полумиллиона событий, когда транскрипционный фактор по-разному использовал одну и ту же площадку в зависимости от ее варианта.

Чтобы разделить вклад копийности и аллельных предпочтений транскрипционного фактора для конкретной площадки на ДНК авторы придумали смотреть на нее в контексте других разновариантных площадок поблизости. Посчитав для них доли случаев, когда белок связался с одной или другой аллелью, можно определить общий тренд, который и будет отражать копийность ДНК на этом участке. Выбивающиеся из этого тренда значения будут наоборот говорить о предпочтениях белка.

Для одиночного регуляторного участка разделить вклад копийности и предпочтений белка непросто. По результатам эксперимента ChIP-Seq мы можем посчитать то, сколько раз белок связался с одним или другим вариантом ДНК, вернее, соотношение этих чисел. Но при этом мы не можем разделить случаи, когда белок любит один вариант ДНК в два раза больше (соотношение 2:1) и когда ему все равно, но один из вариантов встречается в два раза чаще другого. Но если на площадках вокруг или по всему геному соотношение тоже примерно 2:1, то, скорее всего, дело в копийности, а не предпочтениях белка.

Понимание предпочтений транскрипционных факторов — помимо фундаментальной важности — может оказаться полезным и для лечения болезней. Из-за замен в регуляторных областях важные гены могут работать некорректно даже при отсутствии мутаций в кодирующих областях. Выяснилось, что среди регулируемых таким образом генов примерно 90% генов базы ClinVar, имеющих клиническое значение. Кроме того, по независимым данным GWAS, многие замены в регуляторных участках, меняющие поведение белков-транскрипционных факторов, оказались связаны с теми или иными болезнями, от онкологических до аутоиммунных.

Сравнительно недавно ученые начали находить в геноме не просто одиночные регуляторные площадки, а целые батареи генных активаторов, лежащих друг за другом. Их количество и качество влияют на активность генов, отвечающих за клеточную идентичность, в том числе и онкогенов. Скорее всего, они играют не последнюю роль во многих раках, но пока описаны лишь для небольшого их числа, например для рака головы и шеи.

Самые свежие новости медицины на нашей странице в Вконтакте

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>