Исследователи разработали статистические инструменты, называемые полигенными показателями риска (PRS), которые могут оценить риск отдельных заболеваний с сильными генетическими компонентами, таких как болезни сердца или диабет. Однако данные, на основе которых строятся ССБ, часто ограничены в разнообразии и объеме. В результате PRS менее точны при применении к группам населения, которые демографически отличаются от данных обучения PRS.
Новый подход к оценке, представленный в «Клеточной геномике» и разработанный исследователями из Института Броуда Массачусетского технологического института и больницы общего профиля Гарварда и Массачусетса (MGH), использует комплексный подход для создания более точных и информативных PRS.
Удачно названный PRSmix из-за его способности «смешивать» все ранее разработанные PRS для данного признака, этот подход генерирует оценки, которые оценивают риск генетического заболевания пациента более точно, чем PRS, полученные на основе отдельных исследований.
«Основная проблема с PRS заключается в том, что они выводятся для одной популяции, а затем широко применяются с предположением, что оценки могут быть обобщены», — объяснил Прадип Натараджан, соответствующий автор исследования. Натараджан является ассоциированным членом Инициативы Броуда по сердечно-сосудистым заболеваниям и директором отдела профилактической кардиологии MGH. «Общая мотивация этой работы — лучше выявлять людей, которые преждевременно подвергаются высокому риску наследственных заболеваний».
При применении к ряду заболеваний PRSmix в среднем был на 20% точнее при прогнозировании риска для данного признака по сравнению с отдельными PRS. Улучшения сохранились в двух группах предков, что позволяет предположить, что оценки PRSmix могут быть более применимы к различным группам населения.
Хотя PRSmix предлагает заметные улучшения в оценке генетического риска, область применения инструмента ограничена только генетическими вариантами, которые напрямую связаны с данным признаком.
«Большинство PRS специфичны для конкретных признаков. Например, если вы хотите предсказать риск ишемической болезни сердца, большинство моделей используют данные, полученные только по ишемической болезни сердца. Но мы знаем, что на клинический риск влияет больше факторов, чем просто генетические варианты. связаны с сердечно-сосудистыми заболеваниями», — сказал Буу Труонг, первый автор исследования. Труонг — специалист по вычислительной биологии в лаборатории Броуда в Натараджане и доктор философии. студент лаборатории Прайса Гарвардской школы общественного здравоохранения им. Т.Ч.Чана. «Если мы соберем больше генетической информации , насколько более точными могут быть наши PRS?»
Чтобы ответить на этот вопрос, команда разработала дополнительный подход под названием PRSmix+, который объединяет все существующие PRS для данного признака, а также все PRS для связанных признаков, таких как болезни сердца и уровни липидов.
Учитывая влияние перекрестных признаков, PRSmix+ показал даже большее улучшение точности, чем PRSmix. Например, оценки риска ишемической болезни сердца с помощью PRSmix+ представляют собой увеличение точности в 3,27 раза по сравнению с ранее разработанными комбинированными методами.
PRSmix+ также учитывает плейотропные варианты или отдельные варианты, которые влияют на несколько признаков и могут помочь выявить ранее нераспознанные связи. Например, возраст начала менопаузы и риск ишемического инсульта на первый взгляд кажутся не связанными, но PRSmix+ выявил связь между ними.
«Мы бы не узнали об этом, если бы не провели беспристрастное сканирование», — сказал Труонг.
Несмотря на предсказательные способности PRSmix+, команда заявила, что все еще существуют сценарии, в которых исследователям следует выбрать вместо этого PRSmix. PRSmix+ имеет более длительное время работы, поскольку учитывает больше генетических показателей и, следовательно, должен включать гораздо больше данных, чем PRSmix. Кроме того, PRSmix+ лишь немного превзошел PRSmix в прогнозировании некоторых наследственных признаков, таких как рост. Для исследователей, изучающих наследуемые черты, PRSmix может обеспечить аналогичную точность прогнозирования за меньшее время, чем PRSmix+. Для исследователей, заинтересованных в клинической полезности, PRSmix+ может оказаться лучшим вариантом.
Доступный алгоритм
Чтобы гарантировать, что PRSmix постоянно собирает самую актуальную генетическую информацию, платформа PRSmix общедоступна на AnVIL, репозитории данных на платформе обмена биомедицинскими данными Terra, а также в виде пакета R. «Этот рабочий процесс позволяет любому использовать платформу для создания PRS для своих собственных исследований», — сказал Труонг. «Пользователь может просто загрузить файл на Терру. Ему не нужно выполнять сложную вычислительную работу». AnVIL включает контрольные точки на протяжении всего рабочего процесса, чтобы помочь пользователям всех уровней квалификации избежать вычислительных ошибок.
На данный момент этот доступный подход оказывается успешным. «Несколько человек уже использовали пакет R и сообщили, что он дал гораздо лучшие результаты, чем результаты отдельных исследований», — сказал Труонг.
Доступный рабочий процесс PRSmix в сочетании с потенциальной клинической полезностью PRSmix+ делает структуру PRS команды более удобной для использования как исследователями, так и врачами.
«Поскольку мы думаем о внедрении PRS в клинику, нам необходимо предвидеть, что показатели в разных системах здравоохранения будут различаться в зависимости от разных групп людей и условий, в которых расположены медицинские учреждения», — сказал Натараджан. «Теперь у нас есть метод, который обеспечивает основу для обучения и повторной калибровки и использует всю доступную на данный момент информацию для получения наилучшего возможного результата в этом наборе данных».