Исследователи расширяют и обновляют ресурс проекта «1000 геномов», используя секвенирование всего генома

Прочитано: 203 раз(а)


Семь лет назад проект «1000 геномов» (1kGP) опубликовал ресурс с открытым доступом, основанный главным образом на данных полногеномного секвенирования (WGS) с низким охватом 2504 человек из 26 популяций, представляющих пять континентальных регионов мира, что сделало его первым крупным масштабные усилия WGS по составлению каталога генетических вариаций человека.

Теперь исследователи из Нью-Йоркского центра генома (NYGC) в сотрудничестве с группами Массачусетской больницы общего профиля, Йельского университета и Консорциума структурных вариаций генома человека (HGSVC) расширили ресурс 1kGP, включив в него почти все трио родителей и детей в коллекцию вместе с оригинальными образцами и секвенировали их с высоким охватом с помощью инструментов Illumina NovaSeq. Исследование, опубликованное в Cell , представляет собой всесторонний анализ данных WGS с высоким охватом расширенной когорты 1kGP, которая теперь состоит из 3202 образцов, включая 602 трио.

«Когорта проекта «1000 геномов» — такой ценный ресурс, что мы посчитали, что сообществу было бы полезно обновить секвенирование с помощью последней версии технологии краткого считывания, добавив при этом богатство ранее пропущенных семейных образцов». объяснил Майкл Зоди, доктор философии, научный руководитель отдела вычислительной биологии в NYGC и старший автор исследования.

Используя самые современные методы и алгоритмы, исследователи из NYGC секвенировали ДНК, полученную из линий лимфобластоидных клеток (LCL; т. е. иммортализованных человеческих В-клеток из периферической крови) из расширенной когорты до целевой глубины 30-кратного охвата генома. Затем группа выполнила вызов вариантов одиночных нуклеотидов (SNV) и коротких вставок и делеций (INDEL), который состоит из идентификации вариантов сайтов из данных последовательности относительно эталонного генома человека и генотипирования обнаруженных вариантов сайтов во всех образцах в когорте.

Кроме того, группа доктора Майкла Тальковски из Гарвардской медицинской школы, Института Броуда и Массачусетской больницы общего профиля в сотрудничестве с группой доктора Айры Холл из Йельского университета и Медицинской школы Вашингтонского университета, а также из HGSVC обнаружила и генотипировали полный набор структурных вариантов (SV) в 3202 образцах 1kGP, интегрировав несколько аналитических подходов.

В целом, исследование показывает значительное улучшение как мощности обнаружения, так и точности вариантов вызовов, особенно среди редких SNV, а также INDEL и SV, охватывающих частотный спектр, которые ранее были недоступны при секвенировании с низким охватом.

Важным аспектом исходного ресурса 1kGP является его использование в качестве справочной панели для импутации вариантов, т. е. статистического вывода о ненаблюдаемых генотипах в разреженных выборках на основе массивов на основе группировок вариантов, которые обычно наследуются вместе в популяции, полученной из эталона. панель, которая способствовала проведению многочисленных полногеномных ассоциативных исследований (GWAS). Теперь, с расширением исходного ресурса, команда обновила эталонную панель импутации, чтобы включить больше вариантов, обнаруженных с помощью WGS с высоким охватом и трио-семейств.

«Новая панель вменения включает в себя больше сайтов, особенно гораздо больше распространенных INDEL и SV, тем самым увеличивая количество вариантов, доступных для GWAS, что, учитывая большой размер эффекта вариации, отличной от SNV, вероятно, позволит обнаружить новые генетические ассоциации, которые помогите определить причинный вариант», — объясняет Марта Бирска-Бишоп, доктор философии, старший научный сотрудник по биоинформатике в NYGC и соавтор исследования.

Все необработанные данные о последовательностях и наборы вызовов вариантов были немедленно опубликованы после завершения секвенирования через несколько репозиториев геномных данных, включая Международный ресурс образцов генома (IGSR), который поддерживается соавторами из Европейского института биоинформатики в Европейской лаборатории молекулярной биологии. (ЭМБЛ-ЭБИ).

«Наша цель состоит в том, чтобы этот общедоступный ресурс служил эталоном для будущих популяционных генетических исследований и разработки методов», — добавляет Сюефан Чжао, доктор философии, научный сотрудник Центра геномной медицины Массачусетской больницы общего профиля и соавтор исследования. автор.

Эти данные уже вызвали интерес у сообщества генетиков и геномиков. Это, вероятно, будет продолжаться в течение многих лет благодаря полностью открытому характеру образцов 1kGP, которые, в отличие от большинства новых проектов WGS, разрешены для публичного распространения генетических данных без ограничений доступа или использования.

Исследователи расширяют и обновляют ресурс проекта «1000 геномов», используя секвенирование всего генома



Новости партнеров