ПОЛНОГЕНОМНЫЕ АССОЦИАТИВНЫЕ ИССЛЕДОВАНИЯ (GWAS): ТЕХНОЛОГИИ, РАЗВИТИЕ И ЗНАЧЕНИЕ В СОВРЕМЕННОЙ ГЕНЕТИКЕ

WHOLE-GENOME ASSOCIATION STUDIES (GWAS): TECHNOLOGIES, DEVELOPMENT, AND SIGNIFICANCE IN MODERN GENETICS
Цитировать:
ПОЛНОГЕНОМНЫЕ АССОЦИАТИВНЫЕ ИССЛЕДОВАНИЯ (GWAS): ТЕХНОЛОГИИ, РАЗВИТИЕ И ЗНАЧЕНИЕ В СОВРЕМЕННОЙ ГЕНЕТИКЕ // Universum: химия и биология : электрон. научн. журн. Абдуллаев А.А. [и др.]. 2025. 5(131). URL: https://7universum.com/ru/nature/archive/item/19978 (дата обращения: 05.12.2025).
Прочитать статью:
DOI - 10.32743/UniChem.2025.131.5.19978

 

АННОТАЦИЯ

Данная обзорная статья рассматривает суть и эволюцию полногеномных ассоциативных исследований (GWAS), их роль в изучении генетических основ заболеваний и признаков, а также вклад в развитие точной медицины. Рассматриваются технологические подходы к генотипированию, крупные международные проекты и базы данных, поддерживающие GWAS. Особое внимание уделено ограничениям методов GWAS, таким как недостаточная представленность неевропейских популяций и необходимость проведения исследований в изолированных группах. Также обсуждается значение создания собственных генетических ресурсов в Центральной Азии для устранения глобального генетического дисбаланса. Статья подчеркивает потенциал GWAS в поиске терапевтических мишеней и разработке персонализированных стратегий лечения

ABSTRACT

This review article explores the essence and evolution of genome-wide association studies (GWAS), their role in investigating the genetic basis of diseases and traits, and their contribution to the advancement of precision medicine. It discusses genotyping technologies, major international projects, and databases that support GWAS. Particular attention is given to the limitations of GWAS methods, such as the underrepresentation of non-European populations and the need for studies in isolated groups. The importance of developing local genetic resources in Central Asia is also highlighted as a way to address global genetic imbalance. The article emphasizes the potential of GWAS in identifying therapeutic targets and developing personalized treatment strategies.

 

Ключевые слова: GWAS, полногеномные ассоциативные исследования, SNP, биобанк, генетические маркеры.

Keywords: GWAS, genome-wide association studies, SNP, biobank, genetic markers.

 

Введение

Полногеномные ассоциативные исследования представляют собой один из наиболее эффективных инструментов современной генетики для выявления связи между генетическими вариантами и различными признаками или заболеваниями. За последние годы GWAS позволили существенно продвинуться в понимании молекулярных механизмов сложных заболеваний и заложили основу для развития персонализированной медицины. Однако, несмотря на достигнутые успехи, остаются нерешенными важные вопросы, связанные с интерпретацией полученных данных, ограниченной представленностью различных популяций, а также необходимостью улучшения технологических и аналитических подходов.

Целью данного обзора является обобщение современных знаний о полногеномных ассоциативных исследованиях, рассмотрение их методологических основ, достижений и ограничений, а также обсуждение перспектив применения GWAS для развития прецизионной медицины, с особым акцентом на необходимость проведения исследований в Центральной Азии.

В данной статье будет рассмотрено:

-эволюция и развитие GWAS как научного направления;

-основные достижения GWAS в медицине и биологии

-роль крупных биобанков и международных проектов в реализации GWAS

-существующие ограничения и пути их преодоления;

-перспективы интеграции GWAS в практику персонализированного здравоохранения.

-используемые технологии генотипирования и методы анализа данных;

-крупные исследовательские ресурсы GWAS 

-значение проведения GWAS в популяциях Центральной Азии для восполнения глобального генетического дисбаланса.

Материалы и методы

Обзор GWAS исследований, был выполнен в соответствии с международными рекомендациями [1, 2].

Поиск литературы осуществлялся в электронных базах данных PubMed и BioRxiv, последний поиск был проведён 5 апреля 2025 года. В качестве ключевых слов использовались: «GWAS» и «Genetic Association Studies/GWAS», «Genome Wide Association Studies/GWAS», «GWAS database», «GWAS biobank». Ограничения по языку, дате публикации и статусу публикации не применялись.

Финальный поисковой запрос для базы данных PubMed выглядел следующим образом:

((«Genome-wide association studies»[All Fields]) OR (GWAS[All Fields]) OR (GWAS[MeSH Terms]) OR («GWAS database»[All Fields]) OR (GWAS biobank [All Fields]) OR («Genetic Variation»[MeSH Terms]) OR («Microarray Array Sequence Analysis»[MeSH Terms]) OR («Genotyping Techniques»[MeSH Terms]) OR («Genetic Association Studies»[MeSH Terms])).

Результаты и их обсуждение

Эра геномных открытий: роль GWAS в расшифровке наследственной природы заболеваний. С развитием современных высокопроизводительных геномных технологий стало возможным осуществлять широкомасштабные геномные исследования, который измеряют и анализируют вариации на уровне ДНК в разрезе целого генома.

Как известно, после разработки методов секвенирования произошел прорыв в области изучения молекулярно-генетических основ многих заболеваний. Появилось целое направление исследований – полногеномный поиск ассоциаций (GWAS- genome-wide association studies), это обзорное исследование (обычно популяционное) которое заключается в сборе клинических, генетических и прочих данных в различных популяциях и при помощи биоинформатических и статистических ресурсов оценивается связь того или иного генетического варианта с фенотипом (рост, вес,  различные нейтральные признаки и т.д.) или с клиническим фенотипом (заболевания). В основном, GWAS сфокусирован на ассоциации между геномными однонуклеотидными полиморфизмами -SNPs (single nucleotide polymorphisms) и заболеваниями человека.

Такое исследование может включать от сотен тысяч до миллионов SNPs, выборку от 1000 до сотен тысяч человек, десятки фенотипических и клинических параметров и другие данные такие как пол, возраст, привычки, образ жизни и т.д.

Благодаря крупномасштабным скоординированным усилиям был реализован Международный проект HapMap [3], который был сосредоточен в первую очередь на характеристике SNPs. Проект HapMap идентифицировал большую часть общих вариаций среди 11 субпопуляций человека и заложил основу для GWAS [4, с. 789].

В настоящее время проведено более 5700 GWAS для более чем 3300 признаков [5, с. 1339], и стремление к большей статистической мощности привело к тому, что размеры выборки GWAS превысили миллион участников [6,7], что позволило определить многочисленные ассоциированные и воспроизводимые варианты многих наследственных признаков.

Наибольшее количество GWAS исследований проведено в Великобритании, США и некоторых других странах. Например, в Великобритании было проведено более 660 GWAS на 22,5млн людей, в США свыше 2,5тыс исследований на 11 млн людей [8].

Путем GWAS, идентифицируются единичные SNPs, которые обуславливают небольшой процент риска заболевания. Объединение информации о большом количестве SNPs, в рамках всего генома, помогает определить их общий вклад в риск развития заболевания или ответа на лекарственную терапию. Исследователи могут использовать информацию, полученную при помощи GWAS для более точного предсказания, какая превентивная стратегия лечения будет оптимальна среди той или иной группы людей, что является важным этапом в точной медицине.

Недавнее изучение 4155 GWAS по 558 признакам и включавшее свыше 1,74 млн SNPs, показало, что 236,638 имеют достоверную связь минимум с одним признаком на уровне генома с очень высокой статистической достоверностью (P<5x10-8). Показано, что локусы покрывают более половины генома и 90% из них перекрываются с локусами нескольких признаков и имеют плейотропный эффект. Было обнаружено, что потенциальные причинные SNPs богато представлены в кодирующих и фланкирующих областях генов, а также регуляторных элементах. Плейотропный эффект распространен не равномерно в геноме и больше представлен на 1, 5, 11, 12, 15, 17, 20 и 22 хромосомах. Также выявлено, что почти 90% вариантов расположено в некодирующих областях генома, включая межгенные (34.3%) и интронные (43.6%) SNPs [5, с. 1339].

Таким образом, становится очевидным, что GWAS позволяют идентифицировать отдельные SNPs, ассоциированные с риском заболеваний, но каждый из них обычно объясняет лишь незначительную часть генетического вклада. Только за счёт объединения данных по миллионам SNPs становится возможным выявить более полную картину генетической предрасположенности и реакции на лечение, что критически важно для развития точной медицины.

GWAS и биобанки.

В Великобритании проведённое GWAS с участием более полумиллиона добровольцев, позволило идентифицировать генетические маркеры, связанные с шизофренией, колитами, сердечно-сосудистыми заболеваниями, раком, диабетом, депрессивными изменениями, болезнью Крона, метаболическими заболеваниями и многими другими заболеваниями. Более того, эти данные заложили основу создания «Биобанк Великобритании» (UK Biobank) [9]. UK Biobank — это масштабное проспективное эпидемиологическое исследование, включающее около 500 000 добровольцев из Великобритании в возрасте от 40 до 69 лет на момент набора с 2006 по 2010 год. Участники предоставили обширные данные о здоровье, образе жизни, а также биологические образцы, включая кровь и мочу. С 2017 года генетическая информация участников стала доступна для исследований, что значительно расширило возможности для проведения исследований ассоциаций на уровне всего генома.

В рамках UK Biobank было проведено множество GWAS, направленных на выявление генетических факторов, связанных с различными заболеваниями и признаками. Например, исследование, опубликованное в Nature Neuroscience, использовало данные UK Biobank для проведения GWAS по 3 144 фенотипам нейровизуализации, что позволило выявить новые генетические ассоциации, связанные со структурой и функцией мозга [10, с.737].

Лаборатория Neale провела GWAS по 7 221 фенотипу среди шести континентальных групп предков в UK Biobank, предоставив обширные сводные статистические данные для исследовательского сообщества (nealelab.is/uk-biobank).

Кроме того, проект Pan-UKBB провел пан-генетический анализ данных UK Biobank, включив более разнообразные группы предков, что повысило мощность и потенциал для новых открытий [11].

Эти исследования подчеркивают ценность UK Biobank как ресурса для проведения GWAS, способствующих пониманию генетической архитектуры сложных признаков и заболеваний, а также развитию персонализированной медицины.

Американскими ученными было проведены исследования GWAS и идентифицированы генетические маркеры, связанные с диабетом [12,13], болезнями сердца [14, с. 163, 15 с. 2039], раком [16, с. 692], аутоиммунными заболеваниями [17], наркоманией и различными вредными пристрастиями [18], болезнью Альцгеймера [19], Паркинсона [20,21, с. 27] и другими заболеваниями.

В Японии исследования GWAS проводились с участием более 200 тысяч добровольцев. В результате были выявлены генетические маркеры, связанные с сердечно-сосудистыми заболеваниями, раком, ожирением, диабетом, предрасположенностью к заболеваниям глаукомой, аллергическим ринитом, депрессивными изменениями, болезнью Крона, астмой, колитом, псориазом, шизофренией, атопическим дерматитом, болезнями обмена веществ и многими другими. В результате этого масштабного исследования был создан Японский биобанк [22, с. 669].

China Biobank, известный как China Kadoorie Biobank (CKB), представляет собой крупномасштабное проспективное когортное исследование, включающее более 512 000 взрослых из 10 географически разнообразных регионов Китая, проведенное в период с 2004 по 2008 год. Основной целью CKB является изучение генетических и экологических факторов, влияющих на развитие хронических заболеваний, таких как сердечно-сосудистые заболевания, рак и диабет [23]. В рамках CKB были проведены обширные исследования, включая генотипирование более 100 000 участников с использованием специально разработанных Axiom-микрочипов. Эти данные позволили провести многочисленные исследования ассоциаций на уровне всего генома (GWAS) для выявления генетических вариантов, связанных с различными заболеваниями и признаками в китайской популяции.

Одно из таких исследований, опубликованное в Communications Biology в марте 2024 года, выявило четыре новых локуса, связанных с храпом, путем проведения GWAS на основе данных CKB. Эти локусы были картированы на гены SLC25A21, межгенный регион WDR11 и FGFR, NAA25, ALDH2 и VTI1A. Результаты подчеркнули роль структурных аномалий верхних дыхательных путей, а также дисфункции кардио-метаболических и транспортных систем в развитии храпа [24, с. 305].

Кроме того, CKB предоставляет открытый доступ к сводной статистике GWAS через платформу PheWeb, позволяя исследователям анализировать генетические ассоциации с различными фенотипами в китайской популяции (pheweb.ckbiobank.org).

В исследованиях GWAS, проводимых в рамках Qatar Genome Programme, приняли участие более 6000 представителей местного населения. Исследование выявило 45 клинически значимых первых комплексных генетических ассоциаций для данного региона [25, с. 202]. Qatar Genome Programme это национальный популяционный исследовательский проект, направленный на изучение генетического состава населения Катара и других арабских популяций с целью внедрения прецизионной медицины и персонализированного здравоохранения в национальную систему здравоохранения

Исследование генетических детерминантов диабета 2 типа: В 2024 году было проведено GWAS с участием 11 436 человек (2 765 случаев диабета и 8 671 контроль). Были подтверждены 93 ранее известные локуса, связанные с диабетом, и выявлен новый локус между генами APOBEC3H и CBX7, специфичный для катарской популяции. Эти исследования подчеркивают значимость Qatar Genome Programme в изучении генетической архитектуры заболеваний в ближневосточных популяциях и способствуют развитию прецизионной медицины в регионе [26].

Теперь, когда известны надежные генетические ассоциации для различных фенотипов, ученые столкнулись со следующей большой проблемой: интерпретацией этих ассоциаций в биологическом и геномном контексте.

Существующие ограничения GWAS. Несмотря на такое бурное развитие, вокруг полногеномного поиска ассоциаций в течение всего времени его существования ведутся споры. Многие ученые считают неперспективной саму идею GWAS. Дело в том, что GWAS не способен регистрировать редкие мутации, поэтому его результаты достоверны только в рамках концепции «common disease - common variants», постулирующей, что предрасположенность к широко распространенным заболеваниям определяется аллелями высокополиморфных генов. Если же считать, что такие заболевания являются результатом мутаций в редких аллелях, то GWAS-анализ становится бессмысленным.

Некоторые исследователи утверждают, что, поскольку многие локусы, выявленные GWAS, вызывают небольшое увеличение риска заболевания и объясняют лишь часть наследуемости, их вклад в заболевание не может быть столь важным. Однако по мере того, как все больше локусов преобразуются в биологические функции, появляется все больше свидетельств того, что сила ассоциации локуса GWAS не пропорциональна его биологической важности. Поскольку углубленное картирование локусов GWAS требует взаимодействия групп ученых на междисциплинарном уровне для интеграции широкого спектра знаний и данных, разрыв между генетиками и не-генетиками постепенно сокращается.

Предыдущие GWAS показали, что на большинство признаков влияют тысячи вариантов SNP [27], которые по отдельности представляют очень небольшой риск, и часто связаны с другими признаками [5] и коррелируют как с вариантами, оказывающими эффект, так  и нейтральными вариантами, которые физически близки в результате неравновесия по сцеплению [28], что усложняет прямые биологические и причинно-следственные выводы [29, с. 41]. Кроме того, генетические ассоциации могут различаться у разных популяций, что усложняет прямое сравнение между группами индивидуумов. Некоторые из этих ограничений препятствуют получению однозначных выводов о биологическом значении результатов GWAS, иногда ограничивая их полезность для получения механистического понимания или использования в качестве отправной точки для разработки лекарств [30, с. 5].

Еще одним важным недостатком является по-прежнему не достаточная представленность лиц неевропейского происхождения, в то время как крупномасштабные усилия GWAS были непропорционально сосредоточены на популяциях европейского происхождения.

К 2025 году, по оценкам глобального ресурса мониторинга GWAS исследований - GWAS Diversity Monitor [31,32], свыше 86,5% всех исследований, включенных в каталог NHGRI-EBI GWAS, охватывают когорты европейского происхождения, за которыми следуют 12% азиатского происхождения и в совокупности всего 1,5% африканцев, афроамериканцев, афро-карибцев, латиноамериканцев и других популяций (рис. 1), причем на сегодняшний день абсолютно не проводилось GWAS в Центрально-азиатском регионе, включая разнообразную узбекскую популяцию.

Таким образом, видно, что большинство исследований генетических ассоциаций с заболеваниями было проведено на европейцах. Этот европейский уклон имеет важные последствия для прогнозирования риска заболеваний в глобальном масштабе.

Отсутствие представления различных популяций не только ограничивает возможность переноса результатов GWAS между популяциями, но и может привести к неравному доступу к клинической помощи, основанной на генетических исследованиях. Чтобы изменить эту евроцентричность, необходимы дополнительные инициативы (локальные и международные проекты), такие как исследование PAGE, H3Africa.  Проект вариации генома Африки и GenomeAsia 100k, которые существенно расширят возможности GWAS для медицины. 

Это создает дисбаланс в представлении о генетической предрасположенности к заболеваниям в разных этнических группах, что может ограничивать точность персонализированной медицины для недостаточно изученных популяций. Таким образом, существует необходимость в проведении GWAS-исследований на более широком этническом уровне для формирования более репрезентативной базы данных.

Рисунок 1. Сравнительное количество GWAS среди популяций. Распределение общего объема проведенных полногеномных исследований ассоциаций среди популяций мира (согласно базе GWAS Diversity Monitor, [31])

 

Для менделевских заболеваний патогенный вариант обычно вызывает болезнь независимо от популяции, в которой он встречается (рис. 2) (табл. 1). Однако в некоторых случаях, таких как сцепленная с X-хромосомой недостаточность G6PD (глюкозо-6-фосфатдегидрогеназа) или фавизм, заболевание проявляется только при специфическом воздействии окружающей среды (например, употребление бобов вызывает гемолитическую анемию) или дефицит альфа-1-антитрипсина (AATD) – аутосомно-кодоминантное заболевание, вызванное мутациями в гене SERPINA1, может привести к развитию эмфиземы легких, но только у курильщиков или при воздействии загрязненного воздуха. У людей с дефицитом AAT, не подвергающихся таким воздействиям, заболевание может не проявляться (табл1). В таблице 1 приведены несколько заболеваний, проявляющихся как вне зависимости от внешних факторов, так и исключительно при воздействии.

Учитывая различные эволюционные истории, в разных популяциях одна и та же болезнь может быть обусловлена разными мутациями в одном и том же гене (аллельная гетерогенность).

В рамках проекта HapMap также были получены обширные карты неравновесия по сцеплению (LD - Linkage disequilibrium), свойства SNP, которые лежат на одной хромосоме и совместно наследуются при передаче хромосомы в популяции. Люди диплоидны, имеют две копии каждой хромосомы (за исключением X и Y), и события рекомбинации разрывают смежные участки SNP на хромосоме во время мейоза, при формировании зародышевых клеток. В последующих поколениях внутри популяции повторяющиеся события рекомбинации, распределенные по каждой хромосоме, производят участки аллелей, которые коррелируют друг с другом.

Разнообразие причинных мутаций может усложнять диагностику и лечение. Способность воспроизводить генетические ассоциации в различных популяциях может зависеть от нескольких факторов. Одним из них являются различия в неравновесном сцеплении между этническими группами, что влияет на то, насколько хорошо причинные варианты улавливаются тег-снипами (tagSNPs), идентифицированными в одной популяции (рис. 3). Маркеры, находящиеся в LD с вариантами риска у европейцев, могут не находиться в LD в других популяциях, поскольку паттерны LD отражают разные демографические истории, которые варьируются в глобальном масштабе.

Современные люди произошли в Африке примерно 300 000 лет назад и мигрировали за её пределы около 80 000 лет назад. В Африке сохранялись более крупные и структурированные популяции, что привело к разнообразным паттернам LD на всём континенте [33, с. 1035]. Напротив, миграция из Африки привела к узкому демографическому горлышку, за которым последовали серии оснований новых популяций по мере распространения современных людей по миру. В результате у неафриканских популяций наблюдаются более протяжённые регионы LD, точная структура которых определяется их демографической историей (рис. 3). Эти различия в LD между популяциями делают межэтническое картирование особенно полезным для идентификации вариантов риска.

 

Рисунок 2. Размеры эффекта варианта влияющие на возможность воспроизведения ассоциаций генотип-фенотип между популяциями. (адаптировано из Sirugo и соавторы, 2019 [34, с 26])

 

Роль размера эффекта в воспроизводимости (передаваемости) — моногенные (менделевские) заболевания с большим размером эффекта будут вызывать болезнь независимо от популяции. Напротив, генетические ассоциации со сложными признаками, на которые влияют несколько генов с умеренным размером эффекта (олигогенные), с меньшей вероятностью будут передаваться между популяциями. Наконец, для состояний, на которые влияют многие гены (полигенные) с небольшими размерами эффекта, передаваемость может быть ограниченной. Во всех случаях, если риск оценивается с помощью тег-SNP, степень LD будет влиять на воспроизводимость в разных популяциях.

 

Рисунок 3. Различия в неравновесном сцеплении, влияющие на возможность воспроизведения ассоциаций генотип-фенотип между популяциями (адаптировано из Sirugo и соавторы, 2019 [34, с. 26])

 

Роль различий LD в воспроизводимости (верхняя часть). Один общий причинный вариант может быть помечен разными SNP в разных популяциях; (нижняя часть) причинные варианты различаются между популяциями (аллельная гетерогенность) и помечаются разными SNP (сплошные линии) или тем же SNP, но с более слабым LD (пунктирная линия). В любом случае, тег-SNP, полученные из одной популяции (например, европейской), могут быть недостаточными для воспроизведения ассоциаций в других исследуемых популяциях.

Помимо этого, прекрасным подходом, обладающим рядом преимуществ, является проведение GWAS в популяциях, которые стали изолированными вследствие эффектов основателя — таких как географические или культурные барьеры, — оставались изолированными в течение длительного времени и имели ограниченный генетический обмен с соседними популяциями [48, с. 371].

Таблица 1.

Примеры Менделевских заболеваний, проявляющихся как вне зависимости, так и при условии воздействия внешних факторов

Заболевание

Ген

Хромосома

Мутация

Проявление

Ссылка

Болезни, проявляющиеся независимо от внешних факторов

Муковисцидоз

CFTR

7

ΔF508

Нарушение функции лёгких и поджелудочной железы

(Lukacs & Verkman, 2012) [35,с.81]

Серповидноклеточная анемия

HBB

11

Glu6Val

Хроническая анемия, боль, повреждение органов

(Bender & Carlberg, 1993) [36]

Гемофилия A

F8

X

Инверсия IVS22

Нарушение свёртываемости крови

(Luna-Záizar et al., 2018) [37]

Болезнь Хантингтона

HTT

4

CAG-повторы

Нейродегенерация, двигательные и психические расстройства

(Caron et al., 1993) [38]

Ахондроплазия

FGFR3

4

Gly380Arg

Низкорослость, непропорциональное телосложение

(Placone & Hristova, 2012) [39]

Синдром Марфана

FBN1

15

Миссенс-мутации

Высокий рост, проблемы с сердцем и зрением

 

Болезнь Тея-Сакса

HEXA

15

1278insTATC

Нейродегенерация, слепота, судороги

(Dietz, 1993) [40]

Болезни, проявляющиеся при воздействии внешних факторов

Недостаточность G6PD (фавизм)

G6PD

X

Различные мутации

Гемолитическая анемия при употреблении бобов или при воздействии определённых лекарств

(Luzzatto et al., 2020) [42, с.1225]

Фенилкетонурия (PKU)

PAH

12

Различные мутации

Умственная отсталость и судороги при потреблении продуктов, содержащих фенилаланин (мясо, молочные продукты, орехи)

(Arnold & Vockley, 1993) [43]

Гемохроматоз

HFE

6

C282Y, H63D

Цирроз печени, диабет, кардиомиопатия при высоком потреблении железа или частых гемотрансфузиях

(Hanson et al., 2001) [44, с.193]

Порфирия

Различные

Разные

Различные мутации

Фотосенсибилизация, боли в животе, неврологические нарушения при воздействии лекарств, алкоголя, голодания, солнца

(Sardh & Barbaro, 1993) [45]

Дефицит альфа-1-антитрипсина (AATD)

SERPINA1

14

Различные мутации

Эмфизема лёгких у курильщиков или при воздействии загрязнённого воздуха

(Stoller et al., 1993) [46]

Лактозная непереносимость (приобретённая форма)

LCT

2

Различные мутации

Диарея, вздутие, боли в животе при употреблении молочных продуктов

(Anguita-Ruiz et al., 2020) [47]

 

Одним из ключевых преимуществ является то, что функциональные варианты, которые в других популяциях встречаются крайне редко, могут присутствовать в изолированных популяциях с более высокой частотой. Благодаря этому такие популяции обеспечивают большую статистическую мощность при изучении ассоциаций с подобными вариантами [49, 50, с. 477, 51].

Характерная для изолированных популяций длинно-дистанционная связь по сцеплению (LD) повышает точность импутации и общую эффективность GWAS по сравнению с аналогичными по размеру не изолированными когортами [52, с. 1068, 53, с. 853, 54, с. 1140], особенно если даже небольшое количество представителей изолированной популяции включено в эталонную панель.

Ввиду высокой степени родства внутри изолированных популяций, в GWAS часто используется подход, основанный на линейных смешанных моделях.

Изолированные популяции, как правило, характеризуются высокой генетической однородностью из-за потери аллелей при узких «генетических горлышках», что может повысить мощность burden-тестов за счёт уменьшения доли нейтральных вариантов [55].

Однако открытия, сделанные в изолированных популяциях, бывает трудно воспроизвести в других популяциях, если изучаемый вариант слишком редок. Тем не менее, другие варианты, затрагивающие те же гены, могут служить дополнительной поддержкой. Например, варианты, вовлекающие APOA5, ассоциированные с уровнем триглицеридов в сардинской популяции [56, с. 1272], могут быть подтверждены другими вариантами, ассоциированными с инфарктом миокарда в других европейских популяциях [55].

GWAS - инструмент для поиска терапевтических мишеней.

GWAS, ставшие возможными благодаря наличию эталонного генома человека [4, с 787, 58], представляют собой современную попытку сопоставить коллективную генетическую архитектуру с распространёнными заболеваниями. С момента проведения первого GWAS в 2005 году применение этого метода позволило выявить варианты риска для различных заболеваний, включая возрастную макулярную дегенерацию [59, с. 419], воспалительные заболевания кишечника (ВЗК) [60, 61, с. 596, 62, с. 979], сахарный диабет 2 типа [63,64] и многие другие. Например, GWAS позволили обнаружить более 200 локусов риска ВЗК, охватывающих широкий спектр биологических процессов, включая врождённый и приобретённый иммунитет, аутофагию и проницаемость эпителия [65, с. 89].

В настоящее время идентификация терапевтических мишеней с использованием данных GWAS остаётся сложной и относительно неэффективной задачей, главным образом потому, что ассоциации с SNP часто не указывают напрямую на оптимальные терапевтические мишени или на сложные механизмы, лежащие в основе патогенеза заболевания [66, с. 110]. Наличие причинных SNP в некодирующих областях генома является одной из основных преград для функционального понимания механизмов заболевания [67, с. 337]. Исследования показали, что широко распространённые ассоциации с SNP, обладающие малыми эффектами, в совокупности могут вносить значительный вклад в наследуемость сложных признаков, таких как шизофрения [68, с. 1385] и рост [69, с.139]. Эти повсеместные генетические сигналы по всему геному, воздействующие напрямую на гены, могут распространяться через взаимосвязанную сеть регуляции генов и влиять на функции генов, связанных с заболеваниями [70, с. 1177]. Также было показано, что гены-хабы, взаимодействующие со многими другими генами, находятся под действием негативного эволюционного отбора [71, с. 14, 72, 73, с. 134], что указывает на потенциал использования топологии сетей в сочетании с генетическими сигналами при поиске терапевтических мишеней. Такая «омнигенная» точка зрения заставляет нас задуматься о том, как можно преобразовать повсеместные генетические сигналы в эффекты на уровне генетических сетей.

Открытия, сделанные в генетических исследованиях, представляют собой крайне ценный ресурс для поиска лекарственных препаратов. В трансляционной медицине с применением GWAS были выявлены генетические ассоциации с аутоиммунными заболеваниями. Например, была выявлена корреляция между вариантом гена PADI4 и вероятностью заболевания ревматоидным артритом. Это открытие помогло объяснить механизм возникновения заболевания: продукт гена PADI4 (фермент пептидил аргинин дезаминаза) преобразует остатки определенных белков в цитруллин, вызывая иммунный ответ на цитруллинированные белки. Понимание этого механизма в итоге привело к разработке ингибиторов PAD, позволяющих справиться с заболеванием заболеванием [74, с. 90]. Другим примером мишеней при ревматоидном артрите, поддержанных GWAS, включает IL6R (сарилумаб, тоцилизумаб), а при повышенном уровне липопротеинов низкой плотности - HMGCR (статины) [75, с. 1336, 76, с. 707].

Терапевтические мишени с генетическим обоснованием более чем в 2 раза чаще достигают успеха в клинических испытаниях [77,78, с. 856]. Яркий пример — ассоциация между миссенс-вариантом с потерей функции в гене IL23R и болезнью Крона, что указывает на потенциальную пользу блокировки IL-23 [62, с 979, 79, с. 658, 80, с. 1461, 81]. Препараты, нацеленные на рецептор IL-23, включая устекинумаб и рисанкизумаб, недавно были одобрены FDA для лечения болезни Крона после успешного прохождения клинических испытаний [82–84, с. 1946].

Несмотря на то, что эти примеры ясно показывают ценность генетических ассоциаций заболеваний для разработки лекарств, точное определение причинных генов, способствующих риску заболевания по данным GWAS, остаётся сложной задачей, так как большинство обнаруженных вариантов находятся в некодирующих регионах генома [85, с. 10, 87, с. 1190]. Хотя наблюдается тенденция, что ближайший к варианту ген часто является причинным, это не является правилом, поскольку генетические варианты могут влиять на признаки на больших расстояниях в геноме [88, с. 8955]. Кроме того, это наблюдение может быть предвзятым в сторону хорошо охарактеризованных генов, которые находятся в центре сигнала генетической ассоциации [89, с. 1527].

Для предсказания причинных генов применяются различные подходы, включая выбор ближайшего гена, предсказание патогенности варианта, эпигенетические взаимодействия и интеграцию молекулярных количественных признаков (molQTL), таких как экспрессионные QTL (eQTL). Метод менделевской рандомизации (MR), объединяющий данные GWAS и molQTL, может помочь в установлении причинно-следственных связей и определить направление влияния, но может быть искажен из-за дисбаланса сцепления (LD) [90, с. 91, 92, с. 1]. В то же время, методы колокализации позволяют определить, разделяют ли сигналы molQTL и GWAS один и тот же причинный вариант в определённой локусе [93, 94, с. 1245]. Хотя такие методы могут связать генетические вариации с изменениями экспрессии генов в конкретных тканях или типах клеток, они часто являются плейотропными и могут влиять на экспрессию нескольких генов в пределах одного локуса [89, с. 1527, 95, 96]. Они также могут влиять на экспрессию в разных тканях и типах клеток, что снижает их полезность для определения патогенных клеточных типов [95, 97, с. 605, 98, с. 648]. Кроме того, значительная доля GWAS-локусов не показывает eQTL-сигналов, что может быть связано с отсутствием данных по релевантным клеточным типам или биологическим контекстам, либо с тем, что варианты влияют на риск заболевания через другие механизмы, такие как сплайсинг [95,99, с 74970,100]. Несмотря на эти сложности, eQTL-данные успешно применяются для идентификации причинных генов [101, с. 3065, 102, с. 371]. Более того, новые подходы к приоритизации, такие как оценки Locus to Gene (L2G) от Open Targets, показали, что включение информации о молекулярных признаках действительно повышает эффективность выявления релевантных генов [89, с. 1527].

Технология проведения генотипирования для GWAS

Классические генетические исследования неэффективны для обнаружения каждого SNP из-за их большого количества и незначительного вклада в заболевание. Современные широкомасштабные геномные технологии позволяют анализировать сотни тысяч SNP, экспрессию генов в патологически измененных тканях, выявляя изменения в количестве мРНК, которые коррелируют с терапевтическим ответом, клиническим исходом или стадией болезни.

Основными технологиями применяемыми при GWAS являются: 1. ДНК-микрочипы или микроматрицы (DNA microarray). 2. Cеквенирование всего генома (WGS-whole genome sequencing), 3. Секвенирование всего экзома (WES-whole exome sequencing).  Каждый из них имеют свои преимущества и недостатки.

Полногеномные ассоциативные исследования обычно включают целевое генотипирование специфических и предварительно отобранных известных вариантов с использованием микрочипов, тогда как исследования секвенирования всего экзома и секвенирования всего генома направлены на захват всех представленных генетических вариаций. Строго говоря, как исследования WES, так и исследования WGS также применяются для GWAS, хотя в литературе термин «GWAS» в основном относится к полногеномным исследованиям распространенных вариантов на ДНК-микрочипах и иногда считается отдельным от исследований WGS и WES.

Сегодня ДНК-микрочипы позволяют одновременно анализировать тысячи генов, предоставляя уникальные возможности для изучения генетического вклада в сердечно-сосудистые заболевания [103, с. 911].

Самыми распространенными коммерческими технологиями микрочипов являются Affymetrix и Illumina. Однако, технология ДНК-микроматриц от Illumina является одной из самых передовых и широко применяется для GWAS исследований.

Суть технологии заключается в нанесении в микроячейки размером несколько микрон, ДНК зондов специфичных каждому SNP.  Достижения в инженерии и химии, в значительной степени обусловленные разработками коммерческих производителей микрочипов, позволили создать высокоплотные олигонуклеотидные микрочипы с 105–106 зондами на одной микроматрице [104, с. 291] (рис. 4). Они изготавливаются с использованием таких технологий, как фотолитография и струйная печать и работают на основе принципа гибридизации. Комплементарная ДНК или РНК, содержащая исследуемую последовательность, избирательно связывается с этими зондами, как показано на рис. 5.

 

Рисунок 4. ДНК-микрочип содержит сотни тысяч наноячеек, где прикреплены ДНК-зонды, с которыми происходит гибридизация и последующая детекция связавшихся ДНК-мишеней

 

Рисунок 5. Принцип гибридизации, применяемой в технологии ДНК-микроматриц

 

Полученные флуоресцентные профили затем считываются прибором и преобразуются в последовательности, которые при помощи биоинформатических программ проходят несколько этапов обработки формируя генетический профиль каждого образца.

В некоторых GWAS исследованиях проводят генотипирование с использованием сразу двух или трех технологий (рис. 6).

 

Рисунок 6. Распределение полногеномных исследований ассоциаций, представленных в базе GWAS Catalog по использованным технологиям генотипирования

 

Базы GWAS исследований

Базы данных GWAS это ценные ресурсы, содержащие результаты ассоциаций между миллионами генетических вариантов и множеством признаков: от болезней до биомаркеров и поведенческих черт.

Эти базы позволяют исследователям осуществлять: 1. Поиск генетических факторов заболеваний; 2. Определять, какие SNP ассоциированы с определёнными заболеваниями (например, диабетом, раком, шизофренией); 3. Изучить популяционные различия (сравнить аллели риска в разных этносах); 4. Найти новые мишени для диагностики или терапии; 5. Разрабатывать полигенные риск-профили (PRS)— суммарное генетическое влияние десятков или сотен SNP на развитие заболевания у конкретного человека; 6. Функциональная аннотация генов и SNP; 7. Узнать, как SNP влияет на экспрессию генов (eQTL-анализ); 8. Посмотреть, затрагивает ли он регуляторные участки (промоторы, энхансеры и т. д.).

GWAS Central (ранее база данных вариаций генома человека, содержащая информацию о генотипе и фенотипе) представляет собой сводную базу данных результатов исследований генетических ассоциаций, как больших, так и малых. База активно собирает наборы данных из общедоступных проектов и поощряет прямую отправку данных научным сообществом.

На данный момент, GWAS Central содержит 72.5 млн значений P (P-values) по результатам более чем 5000 исследований, в которых были изучены свыше 7.4 млн уникальных генетических маркеров и 1700 уникальных фенотипов [105, с. 986].

GWAS ATLAS. Представляет собой базу данных общедоступных сводных статистических данных GWAS. Каждый GWAS можно просмотреть с помощью манхэттенского графика, локусов риска, результатов MAGMA (т.е. основанных на генах), наследуемости SNP и генетических корреляций с другими GWAS в базе данных [5, с 1339]. Это много-организменная база данных, включает информацию по >40 видам. Содержит сотни тысяч ассоциаций между SNP и фенотипическими признаками.

Все данные тщательно отобраны и аннотированы вручную из научных публикаций и других авторитетных источников и содержит перекрестные ссылки на Ensembl, NCBI, UniProt, dbSNP и др.

 Поиск можно проводить по виду, признаку, хромосоме, гену, SNP, публикации и другим параметрам.

GWAS Catalog. Кураторская коллекция опубликованных исследований GWAS, созданная в сотрудничестве между NHGRI и EMBL-EBI [106, с. 998]. Каталог NHGRI-EBI GWAS представляет собой FAIR-базу знаний*, предоставляющую подробные, структурированные, стандартизированные и совместимые данные GWAS с более чем 200 000 пользователям в год из академической науки, здравоохранения и промышленности. Каталог содержит ассоциации между вариантами и признаками, а также сопроводительные метаданные для более 45 000 опубликованных GWAS по более чем 5000 человеческим признакам. Более 40 000 полных наборов данных со сводной статистикой P-значений [107]. Более того, база содержит информацию о 7200 опубликованных исследований и 800 тысяч маркеров с очень высокой статистической (p<5x10-8) степенью ассоциации с признаками.

Примечание: *FAIR (Findable, Accessible, Interoperable, Reusable) – Находимость, Доступность, Совместимость и Повторное использование. Эти принципы разработаны для оптимизации управления и обмена научными данными, особенно в биоинформатике и медицинских исследованиях [108].

OpenGWAS (IEU OpenGWAS Project) — это крупномасштабный открытый ресурс, разработанный командой Integrative Epidemiology Unit (IEU) при Университете Бристоля (Великобритания). Предоставляет свободный доступ к тысячам сводных статистических наборов данных GWAS. Содержит более 42,000 наборов данных о генетических ассоциациях. Включает удобные инструменты визуализации и API-интерфейс для программного взаимодействия. Позволяет исследователям легко искать, извлекать и анализировать данные GWAS, используя интуитивный веб-интерфейс. Поддерживает различные типы анализа, включая менделевскую рандомизацию, что делает его ценным ресурсом для эпидемиологических и биомедицинских исследований [109].

Краткая информация о наиболее популярных и доступных для исследователей ресурсах данных GWAS представлена в табл. 2

Таким образом, базы данных GWAS представляют собой неоценимый ресурс современной генетики, объединяя огромные массивы данных о взаимосвязи между миллионами генетических вариантов и широким спектром признаков — от клинических заболеваний до физиологических параметров и поведенческих особенностей. Благодаря этим базам, исследователи получили возможность не только выявлять генетические факторы заболеваний, но и анализировать популяционные различия, функциональные последствия мутаций, строить полигенные риск-профили и выявлять новые терапевтические мишени.

Таблица 2.

Краткая информация о наиболее популярных базах данных GWAS доступных исследователям

Название базы

Описание

Тип данных

Виды

Инструменты и функции

Сайт

GWAS Catalog

Кураторская база данных от EBI и NHGRI, включает опубликованные SNP-фенотип ассоциации у человека.

SNP-фенотип ассоциации, p-value, OR

Человек

Поиск по SNP, гену, заболеванию, визуализация, экспорт

https://www.ebi.ac.uk/gwas/

OpenGWAS

Открытая база данных, содержащая сводную статистику GWAS, предназначена для MR и других анализов.

Сводная статистика, beta, SE, p-value

Человек

API, загрузка, MR инструменты, визуализация

https://gwas.mrcieu.ac.uk/

GWAS Central

Интегрирует данные из различных GWAS-источников, поддерживает визуализацию и сравнение.

Фенотипические и геномные ассоциации, визуализация

Человек

Поиск по публикациям, фильтрация, сравнительный анализ

https://www.gwascentral.org/

PheWAS Catalog

Каталог ассоциаций SNP с множеством фенотипов на основе электронных медицинских записей.

SNP → множественные фенотипы (ICD-9/10)

Человек

Поиск по SNP и фенотипам, интерактивные графики

https://phewascatalog.org/

GWAS Atlas

Содержит данные GWAS для человека, растений и животных; поддерживает агрогенетику и сравнительный анализ.

Межвидовые GWAS-ассоциации

Человек, растения, животные

Мультивидовой поиск, фильтрация по признакам

https://ngdc.cncb.ac.cn/gwas/

API - интерфейс для программного доступа к данным, MR- Менделевская рандомизация, позволяет оценить причинную связь между фактором (например, холестерином) и заболеванием, используя генетические варианты как естественные «рандомизаторы», OR -отношение шансов, beta - оценка эффекта генетического варианта на признак, SE – стандартная ошибка, ICD-9/10 - международные классификации болезней по ВОЗ

 

В азиатском регионе очень мало стран, которые провели GWAS на основе численности населения. Популяционные исследования GWAS в Центральной Азии ещё не проводились.

В формировании населения Узбекистана, который расположен в Средней Азии, в связи с его расположением на Шелковом пути и колонизацией населением других стран, происходила связь между локальной популяцией и различными популяциями Европы и Азии. Проведение популяционного исследования GWAS в Узбекистане для определения генетической идентичности важно не только в Азии, но и в глобальном масштабе, и это исследование будет первым среди стран Центральной Азии. В результате реализации популяционных исследований GWAS в Узбекистане можно получить точные результаты генетических диагнозов внутри данной популяции, повысить эффективность геномной и таргетной медицины, получить столь необходимую информацию о генетических вариантах, этиологии и молекулярных генетический патогенез различных заболеваний в популяции. Это, в свою очередь, очень важно для близких по происхождению популяций к узбекской популяции, и для исследований GWAS, проводимых в глобальном масштабе. В результате проведения подобных исследований в Узбекистане можно будет определить генетические особенности, принадлежащие нашему населению. Изучая, чем отличается население Узбекистана от других популяций, можно заранее диагностировать те или иные заболевания и найти необходимые мишени для применения таргетной терапии.

Полногеномные ассоциативные исследования за последние два десятилетия сыграли революционную роль в понимании генетической архитектуры сложных заболеваний и признаков. Они позволили выявить тысячи генетических вариантов, ассоциированных с различными фенотипами, и заложили фундамент для развития персонализированной медицины. Вместе с тем, анализ выявил ряд существенных ограничений: малую объяснённую долю наследуемости, сложности в интерпретации ассоциаций, а также недостаточное участие в исследованиях представителей неевропейских популяций, в том числе Центральной Азии.

Развитие технологий высокопроизводительного секвенирования, расширение репрезентативности популяций и интеграция мультиомных данных открывают новые перспективы для повышения точности GWAS и лучшего понимания молекулярных механизмов заболеваний. Особое значение приобретает проведение собственных национальных GWAS-проектов в странах с недостаточно изученными популяциями, таких как популяции Центральноазиатского региона. Это позволит не только восполнить пробелы в глобальных генетических данных, но и создаст научную основу для внедрения прецизионной медицины, ориентированной на специфику локальных популяций.

Заключение

Таким образом, GWAS остаются одним из наиболее мощных инструментов современной генетики, требующим дальнейшего развития, интернационализации и интеграции с новыми подходами для максимальной реализации их потенциала в науке и клинической практике.

Финансирование

Работа выполнена в рамках базового финансирования Министерства высшего образования науки и инноваций Республики Узбекистан и фундаментального проекта FL-8323102086 «Расширенное геномное исследование узбекской популяции и изучение распространения клинически значимых аллельных вариантов в геноме».

 

Список литературы:

  1. Institute of Medicine (US) Committee on Standards for Systematic Reviews of Comparative Effectiveness Research Finding What Works in Health Care: Standards for Systematic Reviews. Finding What Works in Health Care. // Washington
  2. Liberati A., Altman D.G., Tetzlaff J., Mulrow C., Gøtzsche P.C., Ioannidis J.P.A., Clarke M., Devereaux P.J., Kleijnen J., Moher D. The PRISMA statement for reporting systematic reviews and meta-analyses of studies that evaluate
  3. The International HapMap Project // Nature. – 2003. – Vol. 426.
  4. International HapMap Consortium. The International HapMap Project // Nature. – 2003. – Vol. 426. – P. 789–796.
  5. Watanabe K., Stringer S., Frei O., et al. A global overview of pleiotropy and genetic architecture in complex traits // Nat Genet. – 2019. – Vol. 51. – P. 1339–1348.
  6. Ie J., Je S., K W., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer’s disease risk // Nature Genetics. – 2019. – Vol. 51.
  7. Jj L., R W., A O., et al. Gene discovery and polygenic prediction from a genome-wide association study of educational attainment in 1.1 million individuals // Nature Genetics. – 2018. – Vol. 50.
  8. Mc M., C R. A scientometric review of genome-wide association studies // Communications Biology. – 2019. – Vol. 2.
  9. C B., C F., D P., et al. The UK Biobank resource with deep phenotyping and genomic data // Nature. – 2018. – Vol. 562.
  10. Smith S.M., Douaud G., Chen W., et al. An expanded set of genome-wide association studies of brain imaging phenotypes in UK Biobank // Nat Neurosci. – 2021. – Vol. 24. – P. 737–745.
  11. Karczewski K.J., Gupta R., Kanai M., et al. Pan-UK Biobank GWAS improves discovery, analysis of genetic architecture, and resolution into ancestry-enriched effects. – 2024.
  12. Xue A., Wu Y., Zhu Z., et al. Genome-wide association analyses identify 143 risk variants and putative regulatory mechanisms for type 2 diabetes // Nat Commun. – 2018. – Vol. 9. – Article 2941.
  13. Christiansen C.E., Arathimos R., Pain O., Molokhia M., Bell J.T., Lewis C.M. Stratified genome-wide association analysis of type 2 diabetes reveals subgroups with genetic and environmental heterogeneity // Hum. Mol. Genet. – 20
  14. Shah S., Henry A., Roselli C., et al. Genome-wide association and Mendelian randomisation analysis provide insights into the pathogenesis of heart failure // Nat Commun. – 2020. – Vol. 11. – Article 163.
  15. Walsh R., Jurgens S.J., Erdmann J., Bezzina C.R. Genome-wide association studies of cardiovascular disease // Physiol Rev. – 2023. – Vol. 103. – P. 2039–2055.
  16. Sud A., Kinnersley B., Houlston R.S. Genome-wide association studies of cancer: current insights and future perspectives // Nat Rev Cancer. – 2017. – Vol. 17. – P. 692–704.
  17. Gerussi A., Soskic B., Asselta R., Invernizzi P., Gershwin M.E. GWAS and autoimmunity: What have we learned and what next // J Autoimmun. – 2022. – Vol. 133. – Article 102922.
  18. Hatoum A.S., Colbert S.M.C., Johnson E.C., et al. Multivariate genome-wide association meta-analysis of over 1 million subjects identifies loci underlying multiple substance use disorders // Nat Ment Health. – 2023. – Vol. 1. –
  19. L B., Re T. Genome-wide association studies in Alzheimer’s disease // Human Molecular Genetics. – 2009. – Vol. 18.
  20. Fp G., Jj K., Mb M., et al. The Parkinson’s Disease Genome-Wide Association Study Locus Browser // Movement Disorders: Official Journal of the Movement Disorder Society. – 2020. – Vol. 35.
  21. Kim J.J., Vitale D., Otani D.V., et al. Multi-ancestry genome-wide association meta-analysis of Parkinson’s disease // Nat Genet. – 2024. – Vol. 56. – P. 27–36.
  22. Ishigaki K., Akiyama M., Kanai M., et al. Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases // Nat Genet. – 2020. – Vol. 52. – P. 669–679.
  23. Rg W., Iy M., K L., et al. Genotyping and population characteristics of the China Kadoorie Biobank // Cell Genomics. – 2023. – Vol. 3.
  24. Zhu Y., Zhuang Z., Lv J., et al. A genome-wide association study based on the China Kadoorie Biobank identifies genetic associations between snoring and cardiometabolic traits // Commun Biol. – 2024. – Vol. 7. – P-305.
  25. Thareja G., Al-Sarraj Y., Belkadi A., Almotawa M., Suhre K., Albagha O.M.E. Whole genome sequencing in the Middle Eastern Qatari population identifies genetic associations with 45 clinically relevant traits // Nat Commun. – Р-202
  26. Aa E., Sm T., Ui U., et al. Genome-wide association study and trans-ethnic meta-analysis identify novel susceptibility loci for type 2 diabetes mellitus // BMC Med. Genomics. – 2024. – Vol. 17.
  27. Holland D., Frei O., Desikan R., et al. Beyond SNP heritability: Polygenicity and discoverability of phenotypes estimated with a univariate Gaussian mixture model // PLoS Genet. – 2020. – Vol. 16. – Article e1008612.
  28. Slatkin M. Linkage disequilibrium--understanding the evolutionary past and mapping the medical future // Nat Rev Genet. – 2008. – Vol. 9. – P. 477–485.
  29. Uffelmann E., Posthuma D. Emerging methods and resources for biological interrogation of neuropsychiatric polygenic signal // Biol Psychiatry. – 2021. – Vol. 89. – P. 41–53.
  30. Visscher P.M., Wray N.R., Zhang Q., et al. 10 years of GWAS discovery: biology, function, and translation // Am J Hum Genet. – 2017. – Vol. 101. – P. 5–22.
  31. Home - GWAS Diversity Monitor
  32. Mills M.C., Rahal C. A scientometric review of genome-wide association studies // Commun Biol. – 2019. – Vol. 2. – Article 9.
  33. Tishkoff S.A., Reed F.A., Friedlaender F.R., et al. The genetic structure and history of Africans and African Americans // Science. – 2009. – Vol. 324. – P. 1035–1041.
  34. Sirugo G., Williams S.M., Tishkoff S.A. The missing diversity in human genetic studies // Cell. – 2019. – Vol. 177. – P. 26–31.
  35. Lukacs G.L., Verkman A.S. CFTR: folding, misfolding and correcting the ΔF508 conformational defect // Trends Mol Med. – 2012. – Vol. 18. – P. 81–91.
  36. Bender M.A., Carlberg K. Sickle cell disease // In: Adam M.P., Feldman J., Mirzaa G.M., Pagon R.A., Wallace S.E., Amemiya A., eds. GeneReviews®. – Seattle (WA): University of Washington, Seattle, 1993.
  37. Luna-Záizar H., González-Alcázar J.Á., Evangelista-Castro N., et al. F8 inversions of introns 22 and 1 confer a moderate risk of inhibitors in Mexican patients with severe hemophilia A. Concordance analysis and literature revie
  38. Caron N.S., Wright G.E., Hayden M.R. Huntington disease // In: Adam M.P., Feldman J., Mirzaa G.M., Pagon R.A., Wallace S.E., Amemiya A., eds. GeneReviews®. – Seattle (WA): University of Washington, Seattle, 1993.
  39. Placone J., Hristova K. Direct assessment of the effect of the Gly380Arg Achondroplasia mutation on FGFR3 dimerization using quantitative imaging FRET // PLoS One. – 2012. – Vol. 7. – Article e46678.
  40. Dietz H. FBN1-related Marfan syndrome // In: Adam M.P., Feldman J., Mirzaa G.M., Pagon R.A., Wallace S.E., Amemiya A., eds. GeneReviews®. – Seattle (WA): University of Washington, Seattle, 1993.
  41. Frisch A., Colombo R., Michaelovsky E., Karpati M., Goldman B., Peleg L. Origin and spread of the 1278insTATC mutation causing Tay-Sachs disease in Ashkenazi Jews: genetic drift as a robust and parsimonious hypothesis // Hum Ge
  42. Luzzatto L., Ally M., Notaro R. Glucose-6-phosphate dehydrogenase deficiency // Blood. – 2020. – Vol. 136. – P. 1225–1240.
  43. Arnold G, Vockley J: Phenylalanine Hydroxylase Deficiency. In: Adam MP, Feldman J, Mirzaa GM, Pagon RA, Wallace SE, Amemiya A, editors. GeneReviews®. Seattle (WA): University of Washington, Seattle, 1993.
  44. Hanson E.H., Imperatore G., Burke W. HFE gene and hereditary hemochromatosis: a HuGE review // Human Genome Epidemiology. Am J Epidemiol. – 2001. – Vol. 154. – P. 193–206.
  45. Sardh E., Barbaro M. Acute intermittent porphyria // In: Adam M.P., Feldman J., Mirzaa G.M., Pagon R.A., Wallace S.E., Amemiya A., eds. GeneReviews®. – Seattle (WA): University of Washington, Seattle, 1993.
  46. Stoller J.K., Hupertz V., Aboussouan L.S. Alpha-1 Antitrypsin Deficiency // In: Adam M.P., Feldman J., Mirzaa G.M., Pagon R.A., Wallace S.E., Amemiya A., eds. GeneReviews®. – Seattle (WA): University of Washington, Seattle, 199
  47. Anguita-Ruiz A., Aguilera C.M., Gil Á. Genetics of lactose intolerance: an updated review and online interactive world maps of phenotype and genotype frequencies // Nutrients. – 2020. – Vol. 12. – Article 2689.
  48. Hatzikotoulas K., Gilly A., Zeggini E. Using population isolates in genetic association studies // Brief Funct Genomics. – 2014. – Vol. 13. – P. 371–377.
  49. Xue Y., Mezzavilla M., Haber M., et al. Enrichment of low-frequency functional variants revealed by whole-genome sequencing of multiple isolated European populations // Nat Commun. – 2017. – Vol. 8. – Article 15927.
  50. Chheda H., Palta P., Pirinen M., et al. Whole-genome view of the consequences of a population bottleneck using 2926 genome sequences from Finland and United Kingdom // Eur. J. Hum. Genet. – 2017. – Vol. 25. – P. 477–484.
  51. Lim E.T., Würtz P., Havulinna A.S., et al. Distribution and medical impact of loss-of-function variants in the Finnish founder population // PLoS Genet. – 2014. – Vol. 10. – Article e1004494.
  52. Kong A., Masson G., Frigge M.L., et al. Detection of sharing by descent, long-range phasing and haplotype imputation // Nat Genet. – 2008. – Vol. 40. – P. 1068–1075.
  53. Palin K., Campbell H., Wright A.F., Wilson J.F., Durbin R. Identity-by-descent-based phasing and imputation in founder populations using graphical models // Genet Epidemiol. – 2011. – Vol. 35. – P. 853–860.
  54. Glodzik D., Navarro P., Vitart V., et al. Inference of identity by descent in population isolates and optimal sequencing studies // Eur J Hum Genet. – 2013. – Vol. 21. – P. 1140–1145.
  55. E Z., Al G., T H. Insights into metabolic disease from studying genetics in isolated populations: stories from Greece to Greenland // Diabetologia. – 2016. – Vol. 59.
  56. Sidore C., Busonero F., Maschio A., et al. Genome sequencing elucidates Sardinian genetic architecture and augments association analyses for lipid and blood inflammatory markers // Nat Genet. – 2015. – Vol. 47. – P. 1272–1281.
  57. Do R., Stitziel N.O., Won H.-H., et al. Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction // Nature. – 2015. – Vol. 518. – P. 102–106.
  58. Jc V., Md A., Ew M., et al. The sequence of the human genome // Science (New York, NY). – 2001. – Vol. 291.
  59. Haines J.L., Hauser M.A., Schmidt S., et al. Complement factor H variant increases the risk of age-related macular degeneration // Science. – 2005. – Vol. 308. – P. 419–421.
  60. Rh D., Kd T., Sr B., et al. A genome-wide association study identifies IL23R as an inflammatory bowel disease gene // Science (New York, NY). – 2006. – Vol. 314.
  61. Rioux J.D., Xavier R.J., Taylor K.D., et al. Genome-wide association study identifies new susceptibility loci for Crohn disease and implicates autophagy in disease pathogenesis // Nat Genet. – 2007. – Vol. 39. – P. 596–604.
  62. Liu J.Z., van Sommeren S., Huang H., et al. Association analyses identify 38 susceptibility loci for inflammatory bowel disease and highlight shared genetic risk across populations // Nat Genet. – 2015. – Vol. 47. – P. 979–986.
  63. Demenais F., Kanninen T., Lindgren C.M., et al. A meta-analysis of four European genome screens (GIFT Consortium) shows evidence for a novel region on chromosome 17p11.2-q22 linked to type 2 diabetes // Hum. Mol. Genet. – 2003.
  64. Guan W., Pluzhnikov A., Cox N.J., Boehnke M., International Type 2 Diabetes Linkage Analysis Consortium. Meta-analysis of 23 type 2 diabetes linkage studies from the International Type 2 Diabetes Linkage Analysis Consortium
  65. Van Limbergen J., Wilson D.C., Satsangi J. The genetics of Crohn’s disease // Annu Rev Genomics Hum Genet. – 2009. – Vol. 10. – P. 89–116.
  66. Timpson N.J., Greenwood C.M.T., Soranzo N., Lawson D.J., Richards J.B. Genetic architecture: the shape of the genetic contribution to human traits and disease // Nat Rev Genet. – 2018. – Vol. 19. – P. 110–124.
  67. Farh K.K.-H., Marson A., Zhu J., et al. Genetic and epigenetic fine mapping of causal autoimmune disease variants // Nature. – 2015. – Vol. 518. – P. 337–343.
  68. Loh P.-R., Bhatia G., Gusev A., et al. Contrasting genetic architectures of schizophrenia and other complex diseases using fast variance-components analysis // Nat Genet. – 2015. – Vol. 47. – P. 1385–1392.
  69. Shi H., Kichaev G., Pasaniuc B. Contrasting the genetic architecture of 30 complex traits from summary association data // Am J Hum Genet. – 2016. – Vol. 99. – P. 139–153.
  70. Boyle E.A., Li Y.I., Pritchard J.K. An expanded view of complex traits: from polygenic to omnigenic // Cell. – 2017. – Vol. 169. – P. 1177–1186.
  71. Battle A., Mostafavi S., Zhu X., et al. Characterizing the genetic basis of transcriptome diversity through RNA-sequencing of 922 individuals // Genome Res. – 2014. – Vol. 24. – P. 14–24.
  72. Mähler N., Wang J., Terebieniec B.K., Ingvarsson P.K., Street N.R., Hvidsten T.R. Gene co-expression network connectivity is an important determinant of selective constraint // PLoS Genet. – 2017. – Vol. 13. – Article e1006402.
  73. Josephs E.B., Wright S.I., Stinchcombe J.R., Schoen D.J. The Relationship between Selection, Network Connectivity, and Regulatory Variation within a Population of Capsella grandiflora // Genome Biol Evol. – 2017. – Vol. 9. – P.134
  74. Goulielmos G.N., Zervou M.I., Myrthianou E., Burska A., Niewold T.B., Ponchel F. Genetic data: The new challenge of personalized medicine, insights for rheumatoid arthritis patients // Gene. – 2016. – Vol. 583. – P. 90–101.
  75. Eyre S., Bowes J., Diogo D., et al. High-density genetic mapping identifies new susceptibility loci for rheumatoid arthritis // Nature Genetics. – 2012. – Vol. 44. – P. 1336–1340.
  76. Teslovich T.M., Musunuru K., Smith A.V., et al. Biological, clinical, and population relevance of 95 loci for blood lipids // Nature. – 2010. – Vol. 466. – P. 707–713.
  77. King E.A., Davis J.W., Degner J.F. Are drug targets with genetic support twice as likely to be approved? Revised estimates of the impact of genetic support for drug mechanisms on the probability of drug approval // PLoS Genet.
  78. Nelson M.R., Tipney H., Painter J.L., et al. The support of human genetic evidence for approved drug indications // Nat Genet. – 2015. – Vol. 47. – P. 856–860.
  79. Reay W.R., Cairns M.J. Advancing the use of genome-wide association studies for drug repurposing // Nat Rev Genet. – 2021. – Vol. 22. – P. 658–671.
  80. Duerr R.H., Taylor K.D., Brant S.R., et al. A genome-wide association study identifies IL23R as an inflammatory bowel disease gene // Science. – 2006. – Vol. 314. – P. 1461–1463.
  81. Pidasheva S., Trifari S., Phillips A., et al. Functional studies on the IBD susceptibility gene IL23R implicate reduced receptor function in the protective genetic variant R381Q // PLoS ONE. – 2011. – Vol. 6. – Article e25038.
  82. Peyrin-Biroulet L., Ghosh S., Lee S.D., et al. Effect of risankizumab on health-related quality of life in patients with Crohn’s disease: results from phase 3 MOTIVATE, ADVANCE and FORTIFY clinical trials // Aliment Pharmacol T
  83. Ferrante M., Panaccione R., Baert F., et al. Risankizumab as maintenance therapy for moderately to severely active Crohn’s disease: results from the multicentre, randomised, double-blind, placebo-controlled, withdrawal phase 3
  84. Feagan B.G., Sandborn W.J., Gasink C., et al. Ustekinumab as Induction and Maintenance Therapy for Crohn’s Disease // New England Journal of Medicine. – 2016. – Vol. 375. – P. 1946–1960.
  85. Ober C., Yao T.-C. The genetics of asthma and allergic disease: a 21st century perspective // Immunol Rev. – 2011. – Vol. 242. – P. 10–30.
  86. Valette K., Li Z., Bon-Baret V., et al. Prioritization of candidate causal genes for asthma in susceptibility loci derived from UK Biobank // Commun Biol. – 2021. – Vol. 4. – Article 700.
  87. Maurano M.T., Humbert R., Rynes E., et al. Systematic localization of common disease-associated variation in regulatory DNA // Science. – 2012. – Vol. 337. – P. 1190–1195.
  88. Claussnitzer M., Dankel S.N., Kim K.-H., et al. FTO obesity variant circuitry and adipocyte browning in humans // N. Engl. J. Med. – 2015. – Vol. 373. – P. 895–907.
  89. Mountjoy E., Schmidt E.M., Carmona M., et al. An open approach to systematically prioritize causal variants and genes at all published human GWAS trait-associated loci // Nat Genet. – 2021. – Vol. 53. – P. 1527–1533.
  90. Davey Smith G., Hemani G. Mendelian randomization: genetic anchors for causal inference in epidemiological studies // Hum. Mol. Genet. – 2014. – Vol. 23. – P. R89–R98.
  91. Richardson T.G., Hemani G., Gaunt T.R., Relton C.L., Davey Smith G. A transcriptome-wide Mendelian randomization study to uncover tissue-dependent regulatory mechanisms across the human phenome // Nat Commun. – 2020. – Vol. 11.
  92. Smith G.D., Ebrahim S. “Mendelian randomization”: can genetic epidemiology contribute to understanding environmental determinants of disease? // Int J Epidemiol. – 2003. – Vol. 32. – P. 1–22.
  93. Giambartolomei C., Vukcevic D., Schadt E.E., et al. Bayesian test for colocalisation between pairs of genetic association studies using summary statistics // PLoS Genet. – 2014. – Vol. 10. – Article e1004383.
  94. Hormozdiari F., van de Bunt M., Segrè A.V., et al. Colocalization of GWAS and eQTL Signals Detects Target Genes // Am J Hum Genet. – 2016. – Vol. 99. – P. 1245–1260.
  95. GTEx Consortium, Laboratory, Data Analysis & Coordinating Center (LDACC)—Analysis Working Group, Statistical Methods groups—Analysis Working Group, et al. Genetic effects on gene expression across human tissues // Nature. – 201
  96. Ndungu A., Payne A., Torres J.M., van de Bunt M., McCarthy M.I. A multi-tissue transcriptome analysis of human metabolites guides interpretability of associations based on multi-SNP models for gene expression // Am J Hum Genet.
  97. Liu X., Finucane H.K., Gusev A., et al. Functional Architectures of Local and Distal Regulation of Gene Expression in Multiple Human Tissues // The American Journal of Human Genetics. – 2017. – Vol. 100. – P. 605–616.
  98. The GTEx Consortium, Ardlie K.G., Deluca D.S., et al. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans // Science. – 2015. – Vol. 348. – P. 648–660.
  99. Connally N.J., Nazeen S., Lee D., et al. The missing link between genetic association and regulatory function // Elife. – 2022. – Vol. 11. – Article e74970.
  100. Mostafavi H., Spence J.P., Naqvi S., Pritchard J.K. Limited overlap of eQTLs and GWAS hits due to systematic differences in discovery. – 2022. – 2022.05.07.491045.
  101. Lessard S., Gatof E.S., Beaudoin M., et al. An erythroid-specific ATP2B4 enhancer mediates red blood cell hydration and malaria susceptibility // J Clin Invest. – 2017. – Vol. 127. – P. 3065–3074.
  102. Smemo S., Tena J.J., Kim K.-H., et al. Obesity-associated variants within FTO form long-range functional connections with IRX3 // Nature. – 2014. – Vol. 507. – P. 371–375.
  103. Moric-Janiszewska E., Hibner G. Microarray analysis in cardiac arrhythmias: a new perspective? // Pacing Clin Electrophysiol. – 2013. – Vol. 36. – P. 911–917.
  104. Gresham D., Dunham M.J., Botstein D. Comparing whole genomes using DNA microarrays // Nat Rev Genet. – 2008. – Vol. 9. – P. 291–302.
  105. Beck T., Rowlands T., Shorter T., Brookes A.J. GWAS Central: an expanding resource for finding and visualising genotype and phenotype data from genome-wide association studies // Nucleic Acids Res. – 2023. – Vol. 51. – P. D986
  106. Cerezo M., Sollis E., Ji Y., et al. The NHGRI-EBI GWAS Catalog: standards for reusability, sustainability and diversity // Nucleic Acids Res. – 2025. – Vol. 53. – P. D998–D1005.
  107. E S., A M., A A., et al. The NHGRI-EBI GWAS Catalog: knowledgebase and deposition resource // Nucleic Acids Research. – 2023. – Vol. 51.
  108. Wilkinson M.D., Dumontier M., Aalbersberg I.J.J., et al. The FAIR guiding principles for scientific data management and stewardship // Sci Data. – 2016. – Vol. 3. – Article 160018.
  109. Elsworth B., Lyon M., Alexander T., et al. The MRC IEU OpenGWAS data infrastructure // bioRxiv. – 2020.
Информация об авторах

д-р биол. наук., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

DSc., Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

мл. науч. сотр., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

JRA, Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

д-р биол. наук., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

DSc., Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

PhD, Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

PhD, Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

мл. науч. сотр., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

JRA, Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

мл. науч. сотр., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

JRA, Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

стажёр-исследователь, Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

JR, Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

д-р биол. наук, проф., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

DSc, Prof., Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

д-р биол. наук, проф., Центр передовых технологий при Министерстве высшего образования, науки и инноваций, Республика Узбекистан, г. Ташкент

DSc, Prof., Center for Advanced Technologies under the Ministry of Higher Education, Science and Innovation, Uzbekistan, Tashkent

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-55878 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ларионов Максим Викторович.
Top