МОЛЕКУЛЯРНАЯ И КЛЕТОЧНАЯ БИОЛОГИЯ
Анеуплоидией принято считать потерю или приобретение копии целой хромосомы или ее района. Уже на ранних стадиях развития она, как правило, приводит к фатальным последствиям, включая гибель организма и пороки/аномалии развития. Длительное время предполагалось, что именно нарушение баланса генов приводит к выраженным эффектам как на клеточном, так и на организменном уровне, негативно сказываясь на формировании организма. Было показано, что возникший вследствие анеуплоидии дисбаланс генов индуцирует протеотоксический и метаболический стресс в клетке, ее замедленную пролиферацию, нестабильность ее генома, оксидативный стресс и пр. Однако для некоторых организмов была описана толерантность к анеуплоидиям, которая даже могла способствовать возникновению у них адаптивных преимуществ (например, резистентность к антибиотикам у патогенных штаммов грибов). Вероятно, значимым фактором является сложность тканевой и органной организации особей конкретного вида. К анеуплоидии преимущественно более толерантны полиплоидные организмы и виды, относительно недавно прошедшие полногеномную дупликацию. Особое внимание в обзоре уделено рассмотрению анеуплоидий половых хромосом человека. Помимо первичных эффектов или цис-эффектов (изменение количества транскриптов генов, находящихся на анеуплоидной хромосоме), анеуплоидия может вызывать вторичные или транс-эффекты (изменение уровня экспрессии генов, расположенных на других хромосомах). Результаты исследований последних лет заставили по-новому взглянуть на влияние анеуплоидии на структурно-функциональную организацию генома, транскриптом и протеом как клетки, так и целого организма. Несмотря на то что при анеуплоидии уровень экспрессии для большинства генов коррелирует с измененным числом копий генов в клетке, были описаны случаи дозовой компенсации, при которой уровень транскриптов генов, расположенных на анеуплоидной хромосоме, оставался неизменным. В обзоре приводятся результаты последних исследований, посвященных изучению компенсаторных механизмов дозовой компенсации изменения количества продуктов генов на посттранскрипционных и пострансляционных уровнях, снижающих негативный эффект анеуплоидии на гомеостаз клетки, а также влиянию экстрахромосом на пространственную организацию генома, изменению паттернов экспрессии генов вследствие ее наличия. Кроме того, отдельно обсуждаются варианты сегментных анеуплоидий и изменения числа копий участков генома. Рассмотрено не только значение их состава, но также его локализация в хромосоме и в разных компартментах интерфазного ядра. Решение поднятых вопросов может внести большой вклад в совершенствование цитогеномной диагностики и в создание необходимой базы данных для корректной интерпретации выявленных случаев и сегментной анеуплоидии, и варьирующих по числу копий участков генома.
Проблема интерпретации результатов генетического анализа пациентов, страдающих наследственными сердечно-сосудистыми заболеваниями, по-прежнему сохраняет свою актуальность. На сегодняшний день клиническое значение около 40 % вариантов в генах, ассоциированных с наследственными сердечно-сосудистыми заболеваниями, остается неясным, что приводит к необходимости использования новых подходов для оценки патогенетического вклада этих вариантов. Совместное применение технологии индуцированных плюрипотентных стволовых клеток и редактирования их генома с помощью системы CRISPR/ Cas9 считается наиболее перспективным способом выяснения патогенности генетических вариантов.
Ранее в нескольких генетических скринингах пациентов с гипертрофической кардиомиопатией был выявлен вариант с неясным клиническим значением в гене MYH7, p.Met659Ile (c.1977G>A). В настоящем исследовании данная однонуклеотидная замена с помощью системы CRISPR/Cas9 была исправлена в индуцированных плюрипотентных стволовых клетках, полученных от носителя этого генетического варианта. В результате получены и охарактеризованы с использованием стандартного набора методов две линии индуцированных плюрипотентных стволовых клеток (ICGi019-B-1 и ICGi019-B-2). Линии индуцированных плюрипотентных стволовых клеток с исправленным вариантом p.Met659Ile (c.1977G>A) в гене MYH7 имели характерную для плюрипотентных клеток человека морфологию, экспрессировали маркеры плюрипотентного состояния (транскрипционные факторы OCT4, SOX2, NANOG и поверхностный антиген SSEA-4), были способны давать производные трех зародышевых листков при спонтанной дифференцировке и сохраняли нормальный кариотип (46,XY). В линиях индуцированных плюрипотентных стволовых клеток ICGi019-B-1 и ICGi019-B-2 не обнаружено нецелевой активности системы CRISPR/Cas9. Поддержание плюрипотентного состояния и нормального кариотипа, а также отсутствие нецелевой активности системы CRISPR/Cas9 в линиях индуцированных плюрипотентных стволовых клеток с исправленным вариантом p.Met659Ile (c.1977G>A) в гене MYH7 позволят использовать полученные линии в качестве изогенного контроля для дальнейших исследований патогенности данного генетического варианта и его влияния на развитие гипертрофической кардиомиопатии.
ГЕНЕТИКА РАСТЕНИЙ
Персик (Prunus persica (L.) Batsch) – одна из основных сельскохозяйственных плодовых косточковых культур семейства розоцветных. Современная селекция направлена на улучшение качества плодов, расширение сроков их получения, создание сортов с устойчивостью к неблагоприятным условиям среды и снижение общих затрат на производство культивируемых сортов. При этом селекция персика – долгий процесс: от гибридизации родительских форм до получения плодоносящих деревьев проходит 10–15 лет. Исследования сор тов персика как доноров желаемых признаков начались с 1980-х годов. Первый вариант генома персика был представлен в 2013 г., и его появление способствовало определению и локализации локусов, с последующим обнаружением генов-кандидатов, под чьим контролем находится хозяйственно ценный признак. Развитие методов NGS ускорило продвижение подходов, основанных на применении диагностических ДНК-маркеров. К таким подходам, позволяющим ускорять процессы классической селекции, относятся маркер-ориентированная селекция и геномная селекция. Для того чтобы разработать ДНК-маркеры, ассоциированные с изучаемыми свойствами, необходимо провести предварительное картирование локусов, контролирующих хозяйственно ценные признаки, создать карты сцепления. Работы по пангеному показали необходимость анализировать большее количество образцов, так как до сих пор не хватает данных для нахождения полиморфных областей генома. Развиваются подходы использования SNP-чипов и методов генотипирования через секвенирование (GBS, genotyping-by-sequencing). В последние годы для обнаружения локусов генома, ассоциированных с хозяйственно ценными признаками, активно применяется метод полногеномного анализа ассоциаций (GWAS, genome-wide association studies), для использования которого требуется скрининг больших выборок сортов по сотням и тысячам SNP. Цель настоящего обзора – систематизация и обобщение основных достижений в области геномных исследований персика за последние 40 лет: построение карт сцепления и физических карт, получение различных молекулярных маркеров, полногеномное секвенирование для персика, а также описание существующих работ полногеномных исследований ассоциаций с маркерами SNP высокой плотности. Этот обзор обеспечивает теоретическую основу для проведения GWAS с целью выявления высокоэффективных маркеров хозяйственно ценных признаков для персика и развития геномной селекции этой культуры.
Индекс желтизны – важный параметр качества сортов твердой пшеницы, связанный с содержанием каротиноидов в зерне и уровнем их деградации в процессе его переработки и определяющий желтый цвет продуктов, получаемых из твердой пшеницы. Применение молекулярно-генетических маркеров генов, влияющих на содержание каротиноидов, позволяет быстро идентифицировать ценные для селекции генотипы для ускоренного создания новых высококачественных отечественных сортов твердой пшеницы. Целью работы стало изучение отечественного генофонда твердой пшеницы с помощью молекулярных маркеров генов синтеза (Psy-A1) и деградации (Lpx-B1) желтых пигментов в зерне. С использованием двух маркеров гена фитоенсинтазы Psy-A1 (PSY1-A1_STS и YP7A-2) и трех маркеров локуса липоксигеназы Lpx-B1 (Lpx-B1.1a/1b, Lpx-B1.1с и Lpx-B1.2/1.3) впервые были исследованы 54 сорта твердой пшеницы, 38 из которых охарактеризованы по уровню содержания желтых пигментов в зерне. Аллельное разнообразие изученных отечественных сортов твердой пшеницы по генам фитоенсинтазы Psy-A1 и липоксигеназы Lpx-B1 оказалось достаточно низким. Наиболее распространенными в выборке были аллельные варианты Psy-A1l по маркеру PSY1-A1_STS и Psy-A1d по маркеру YP7A-2, выявленные у 51 образца и ассоциированные с высокими значениями индекса желтизны. По маркерам локуса Lpx-B1 в выборке преобладал гаплотип II, связанный со средней активностью липоксигеназы, который был идентифицирован у 43 образцов. Гаплотип III, ассоциированный с низкой активностью фермента, выявлен только у трех озимых сортов (Дончанка, Гелиос и Леукурум 21). Несмотря на преобладание аллельных вариантов, связанных с повышенным содержанием каротиноидов и средней активностью липоксигеназы, исследуемые образцы имели различный уровень содержания желтых пигментов – от низкого до высокого.
ИММУНИТЕТ И ПРОДУКТИВНОСТЬ РАСТЕНИЙ
Лен (Linum usitatissimum) – важная сельскохозяйственная культура, выращиваемая для получения волокна и масла. Лен используют для производства красок, линолеума, в пищевой промышленности, для производства одежды и композитных материалов. Значительный экономический ущерб при выращивании льна наносит фузариозное увядание, вызываемое грибом Fusarium oxysporum f. sp. lini. Споры гриба могут долгое время сохраняться в почве, поэтому получение устойчивых к заражению сортов имеет большое значение.
Здесь мы использовали данные об устойчивости 297 образцов льна из коллекции Федерального научного центра лубяных культур в Торжке (Россия) к заражению сильнo вирулентным изолятом гриба MI39 в 2019–2021 гг. Устойчивость генотипа к заражению оценивали путем вычисления индекса DSI – нормализованной пропорции генотипов с одинаковыми симптомами болезни. Для поиска районов генома льна, ассоциированных с устойчивостью, использовали программу IIIVmrMLM в режиме Single_env. Модель IIIVmrMLM была разработана для устранения методологических недостатков в выявлении всех типов взаимодействий между аллелями, генами и средой и для несмещенной оценки их генетических эффектов. Поскольку это мультилокусная MLM-модель, она оценивает эффекты всех генов, а также эффекты всех взаимодействий одновременно. Всего было найдено 111 QTN, из которых 34 были локализованы в последовательности известного гена или расположены во фланкирующих районах на расстоянии, не превышающем 1 т. п. н. Гены, в которые попадали обнаруженные варианты, были связаны с устойчивостью к абиотическим и биотическим стрессам, с ростом и развитием корня, побега и цветка. Десять из найденных QTN картировались в областях ранее идентифицированных QTL, контролирующих синтез пальмитиновой, олеиновой и других жирных кислот. QTN Chr1_1706865/ Chr1_1706872 и QTN Chr8_22542741 маркируют районы, идентифицированные нами ранее при поиске ассоциаций программой GAPIT. Для всех найденных QTN был подтвержден аллельный эффект: произведен тест Манна–Уитни, который подтвердил значимые различия между значением DSI у носителей референсного и альтернативного аллеля. Увеличение в генотипе числа аллелей с негативным эффектом приводит к статистически значимому уменьшению величины DSI для всех трех лет тестирования. Группы сортов с большим количеством аллелей, уменьшающих индекс DSI, имели наилучшую устойчивость. Всего из коллекции было выбрано пять сортов, для которых число аллелей, уменьшающих величину DSI, не превышало число аллелей с обратным эффектом по всем трем годам. Эти сорта могут быть использованы в дальнейшем в селекционных программах
Пшеница является чрезвычайно важным и предпочтительным источником питания человека во многих регионах земного шара. Получение биофортифицированных сортов мягкой пшеницы с окрашенным зерном, которое, как известно, содержит целый ряд биологически активных соединений, в том числе антоциа ны, фенольные соединения, витамины и минералы, отражает общемировую тенденцию на увеличение разнообразия и повышение качества рациона путем разработки и внедрения разнообразных продуктов функционального питания. В настоящей работе описаны генетические системы, регулирующие биосинтез и накопление антоцианов в перикарпе и алейроновом слое, присутствие которых придает зерну фиолетовую, голубую и черную окраску. Обзор посвящен систематизации информации об особенностях качественного и количественного содержания антоцианов, растворимых и нерастворимых фенольных кислот в зерне пшеницы с различной окраской, а также показателях антиоксидантной активности спиртовых экстрактов зерна в зависимости от содержания антоцианов и фенольных соединений. Огромным количеством исследований подтверждено, что данные соединения являются антиоксидантами и соединениями с противовоспалительной активностью и их употребление вносит важный вклад в профилактику ряда социально значимых заболеваний человека. Употребление продуктов из окрашенного зерна злаков может способствовать дополнительному обогащению рациона людей биологически активными соединениями наряду с привычными источниками антиоксидантов. Отдельное внимание в обзоре уделено описанию достижений отечественных селекционеров, усилия которых в этой области позволили получить ряд перспективных сортов и линий с окрашенным зерном, которые могут послужить основой создания рынка биофортифицированных диетических продуктов питания в России и увеличения экспортного потенциала рынка зерна.
ГЕНЕТИКА НАСЕКОМЫХ
Ядрышко – это крупная безмембранная субъядерная структура, где происходит биогенез рибосом. Однако известно все больше данных о том, что ядрышко выполняет и другие функции в клетке. Помимо того, что в ядрышке происходят активный синтез и процессинг рРНК, оно является компартментом, на периферии которого локализованы репрессированные участки генома. Таким образом, наряду с ядерной ламиной ядрышко выступает центром организации гетерохроматина. Исследования на клетках человека и дрозофилы показали, что снижение количества отдельных ядрышковых белков приводит к изменениям в морфологии ядрышка, организации гетерохроматина и декластеризации центромер. Данная работа посвящена изучению влияния мутаций в гене Novel nucleolar protein 3 (Non3) D. melanogaster на организацию хроматина в ядре. Ранее было показано, что делеция части гена Non3 приводит к эмбриональной летальности, а снижение количества белка NON3 – к замедлению онтогенеза и формированию Minute-подобного фенотипа у взрослых мух. В настоящей работе мы продемонстрировали, что мутации в гене Non3 супрессируют эффект положения мозаичного типа и увеличивают частоту мейотической рекомбинации. Общее количество классических маркеров гетерохроматина, белка HP1 и модификации гистона H3K9me2, в мозгах и слюнных железах личинок мутантов Non3 существенно не отличается от контроля, согласно оценке вестернблот анализом. Иммуноокрашивание антителами к HP1 и H3K9me2 также не выявило значительного изменения в количестве и паттерне локализации этих белков в прицентромерных районах политенных хромосом слюнных желез. Изучив локализацию белка HP1 у мутантов по гену Non3 с помощью метода DamID (DNA adenine methyltransferase identification), мы также не обнаружили значимых отличий в распределении белка по сравнению с контролем. В гемоцитах мутантов Non3 мы наблюдали изменение морфологии ядрышка и размера области, выявляемой антицентромерными антителами, но это не сопровождалось декластеризацией центромер и отхождением их от периферии ядрышка. Таким образом, белок NON3 важен для формирования/функционирования ядрышка и необходим для правильной упаковки хроматина, однако точный механизм участия NON3 в данных процессах требует дальнейшего изучения.
Локус achaete-scute (achaete-scute complex, AS-C) занимает около 90 т. п. н. и содержит множественные энхансеры. Локальная экспрессия генов achaete и scute в пронейральных кластерах имагинальных дисков Drosophila melanogaster приводит к формированию детерминированного рисунка макрохет у взрослых мух. Большое многообразие легко анализируемых видимых фенотипов, прямая связь между отдельными регуляторными элементами и развитием конкретных щетинок сделали этот локус классическим модельным объектом генетики развития. Одним из самых известных AS-C является аллель sc8, возникший в результате инверсии In(1)sc8. Дистальная точка разрыва этой инверсии лежит между генами ac и sc, проксимальная – в прицентромерном гетерохроматине хромосомы Х, в блоке сателлита 1.688. Гетерохроматиновое положение точки разрыва поднимало вопрос о роли эффекта положения мозаичного типа в нарушении нормальной работы локуса у носителей инверсии, но были получены противоречивые результаты. Ранее мы обнаружили, что в одном из стоков линии, несущей In(1)sc8, спонтанно возникла вторичная инверсия In(1)19EHet, которая переносит большую часть гетерохроматина от гена ac в локус, соответствующий району 19E политенной Х-хромосомы. В настоящей статье мы показали, что инверсия In(1)19EHet приводит к полному восстановлению числа задних супраалярных и частичному – дорзо-центральных щетинок, наблюдаемых у мух исходной линии In(1) sc8. Точно такое же восстановление паттерна щетинок мы увидели при введении в линию с инверсией In(1) sc8 модификатора эффекта положения – мутации Su(var)3-906. Введение же в линию с инверсией мутации по гену Rif1 – консервативного фактора, определяющего позднюю репликацию и недорепдикацию ДНК в клетках D. melanogaster, не приводит к восстановлению нормального паттерна щетинок. Наши данные указывают на то, что фенотип мух – носителей инверсии In(1)sc8, связанный с нарушением развития щетинок, определяется эффектом гетерохроматина на дистальную часть локуса и может использоваться для проверки влияния различных факторов на вызываемый гетерохроматином эффект положения гена. Еще одно фенотипическое проявление In(1) sc8 – снижение доли самцов в потомстве – оказалось независимым от соседства дистальной части AS-C с гетерохроматином. Этот фенотип также не восстанавливался на фоне мутации в гене Rif1.
ГЕНЕТИКА ЧЕЛОВЕКА
Великий Болгар – один самых значительных средневековых городов Восточной Европы, до монгольского завоевания был крупным административным центром Волжской Булгарии, а после 1236 г. некоторое время выполнял функции столицы Золотой Орды. Исторические, археологические и палеоантропологические данные свидетельствуют о смешанном составе населения этого города в XIII–XV вв., однако вклад тех или иных этнических групп в его генетическую структуру остается не вполне ясным, и до сих пор отсутствуют генетические данные для этой группы средневекового населения. Мы впервые с применением методов масштабного параллельного секвенирования определили полногеномные последовательности у трех жителей Великого Болгара, погребенных в первой половине XIV в. у так называемой Греческой палаты. Среднее покрытие исследованных геномов составило от х0.5 до х1.5, что позволило определить генетический пол индивидов (двое мужчин и одна женщина) и провести популяционно-генетический анализ. Были подтверждены аутентичность исследованной ДНК и низкий уровень контаминации, а также определены гаплогруппы митохондриальной ДНК всех трех индивидов и гаплогруппы Y-хромосомы двух индивидов мужского пола. Для проведения сравнительного популяционно-генетического анализа нами задействованы опубликованные ранее данные геномного секвенирования более 2.7 тыс. образцов ДНК представителей современных и древних популяций. Анализ полногеномных данных трех индивидов из Великого Болгара с использованием однородительских маркеров (митохондриальной ДНК и Y-хромосомы) и аутосомных маркеров показал генетическую гетерогенность исследованной группы населения. По результатам геномного анализа с применением аутосомных маркеров и метода главных компонент (PCA) и f4-статистики нами выявлена генетическая связь одного индивида (женщины) с современными финно-угорскими народами Волго-Уральского региона. Геномный анализ двух других индивидов предполагает их армянское происхождение и свидетельствует о существовании потока мигрантов с территории Кавказа или Анатолии. Полученные результаты хорошо согласуются с данными археологии и палеоантропологии, а также существенно дополняют их в части реконструкции вклада автохтонного населения в формирование популяционной структуры средневековых жителей Болгара.
Одним из основных этиологических факторов развития рака шейки матки является инфицирование вирусом папилломы человека (ВПЧ). При этом риск развития злокачественного процесса увеличивается с ростом вирусной нагрузки. Целью данного исследования было изучение уровня транскрипции генов репарации ДНК и контроля клеточного цикла в эпителиальных клетках цервикального канала женщин с клинически значимой вирусной нагрузкой при ВПЧ-инфекции. Материалом для исследования послужили образцы ДНК и РНК, выделенные из эпителиальных клеток. Всего было проанализировано 107 образцов: 55 женщин были ВПЧ-положительными (с клинически значимой вирусной нагрузкой – более 103 геномов ВПЧ на 100 тыс. клеток человека), контрольную группу составили 52 ВПЧ-отрицательные женщины. Все женщины были старше 30 лет. Уровень транскрипции генов APEX1, ERCC2, CHEK2, TP53, TP73, CDKN2A, SIRT1 определяли с помощью ОТ-ПЦР. Показано, что частота обнаружения транскриптов генов APEX1 и ERCC2 была повышена в группе женщин с клинически значимой вирусной нагрузкой. Уровень транскрипции всех исследованных генов не различался между контрольной группой и группой ВПЧ-инфицированных женщин. Однако установлено, что уровень транскрипции генов TP53 и TP73 снижается с ростом вирусной нагрузки. В контроле выявлена корреляция между уровнями транскрипции генов, участвующих в обеспечении функционирования белка p53. Увеличение вирусной нагрузки при инфицировании ВПЧ связано с изменением коэкспрессии генов репарации ДНК и контроля клеточного цикла.
МЕДИЦИНСКАЯ ГЕНЕТИКА
Преждевременное половое созревание (ППС, OMIM 176400, 615346) – заболевание, которое вызвано преждевременной реактивацией гипоталамо-гипофизарно-гонадной оси. В определении сроков полового созревания ведущую роль играют генетические, эпигенетические и экологические факторы. В последние годы варианты в генах KISS1, KISS1R, MKRN3 и DLK1 были идентифицированы как генетические причины ППС.
Гены MKRN3 и DLK1 являются импринтированными, в связи с чем эпигенетические модификации, такие как метилирование ДНК, изменяющее экспрессию данных генов, также могут рассматриваться в качестве причины ППС. Цель настоящего исследования – определение индекса метилирования центров импринтинга генов DLK1 и MKRN3 у девочек с клинической картиной ППС. Анализ индекса метилирования центров импринтинга генов DLK1 и MKRN3 проводили в группе из 45 девочек (возраст 7.2 ± 1.9 года) с клинической картиной ППС и нормальным кариотипом методом таргетного массового параллельного секвенирования после обработки ДНК бисульфитом натрия. Контрольная группа состояла из девочек без ППС (n = 15, возраст 7.9 ± 1.6 года). Различий по возрасту между группами не выявлено (p > 0.8). Анализ индекса метилирования центров импринтинга генов DLK1 и MKRN3 не показал различий между пациентами с ППС и контрольной группой. Группа пациентов с изолированным адренархе имела повышенный индекс метилирования центра импринтинга гена MKRN3 (72 ± 7.84 против 56.92 ± 9.44 %, p = 0.005). В группе пациентов с центральным ППС 3.8 % пациентов имели пониженный индекс метилирования центра импринтинга гена DLK1 и 11.5 % – гена MKRN3. Таким образом, показано, что не только генетические варианты, но и нарушение индекса метилирования центров импринтинга генов DLK1 и MKRN3 могут быть причиной ППС.
Длинные некодирующие РНК (lncRNA) и микроРНК (miRNA) играют важную роль во всех биологических процессах, включая адипогенез, липидный обмен и инсулиновый ответ. Анализ экспрессии lncRNA и miRNA в висцеральной жировой ткани человека может способствовать более глубокому пониманию их роли в развитии метаболических нарушений. Исследование направлено на изучение уровней экспрессии lncRNA (ASMER1, SNHG9, P5549, P19461 и GAS5) и miRNA (miR-26A, miR-222, miR-221 и miR-155) в висцеральной жировой ткани у людей с абдоминальным ожирением (n = 70) по сравнению с уровнями их экспрессии у лиц без абдоминального ожирения (n = 31) методом количественной ПЦР в реальном времени. Среди протестированных miRNA уровень экспрессии miR-26A был снижен в висцеральной жировой ткани у людей с ожирением. Среди изученных lncRNA GAS5 показал значительное повышение уровня экспрессии у пациентов с ожирением и сахарным диабетом 2-го типа (СД2) (n = 10) по сравнению с лицами с ожирением без СД2 (n = 60). Уровни экспрессии GAS5 показали слабую отрицательную корреляцию (p < 0.05, rs = 0.25) с уровнями miR-155 только у пациентов с ожирением. Положительная корреляция (p < 0.01, rs = 0.92) между SNHG9 и GAS5 была обнаружена в группе людей без ожирения, с уменьшением коэффициента корреляции у пациентов с ожирением (p < 0.01, rs = 0.67). Кроме того, уровни miR- 26A и miR-155 умеренно коррелировали в группе без ожирения (p < 0.05, rs = 0.47) и демонстрировали слабую корреляцию у пациентов с ожирением (p < 0.05, rs = 0.26). Наши результаты показали, что у пациентов с абдоминальным ожирением наблюдаются повышенные уровни экспрессии miR- 26A в висцеральной жировой ткани и слабая корреляция между экспрессией GAS5 и SNHG9 по сравнению с лицами без абдоминального ожирения.
БИОИНФОРМАТИКА И СИСТЕМНАЯ БИОЛОГИЯ
Быстро накапливающийся массив геномных данных – секвенированных геномов сельскохозяйственных растений – позволил получить обширные результаты по геномному прогнозированию и выявлению ассоциаций однонуклеотидных полиморфизмов с фенотипическими признаками. Во многих случаях для обнаружения новых связей фенотипов с генотипами предпочтительно использовать методы машинного обучения, глубокого обучения и искусственного интеллекта, в особенности объяснимого, способные распознавать сложные закономерности. Вручную было отобрано 80 источников, при этом ограничения по дате выхода не ставилось, основной интерес представляла оригинальность предлагаемого подхода или модификации для применения в задаче геномного прогнозирования. В статье рассмотрены модели для геномного прогнозирования, сверточные нейронные сети, объяснимый искусственный интеллект и большие языковые модели. Уделено внимание подходам к дополнению данных, переносу знаний, методам снижения размерности и гибридным методам. Приведен пример современного способа кодирования больших геномных данных в искусственные изображения, преимуществом которых являются наглядная визуализация и возможность использования известных моделей для извлечения признаков. Исследования в области модельно-специфичных и модельно-независимых методов интерпретации решения моделей представлены тремя основными категориями: зондирование, возмущение и суррогатная модель. В рассмотренных примерах отражены основные современные тренды в изучаемой области. Отмечены растущая роль больших языковых моделей, в том числе основанных на трансформерах, для обработки генетического кода, а также разрабатываемые методы аугментации данных. Дополнительным преимуществом применения языковой модели может стать возможность формулировать запросы на близком к естественному языке и получать ответы за относительно короткое время. Среди гибридных подходов выделена перспективность сочетания моделей машинного обучения и моделей развития растений на основе биофизических и биохимических процессов. Поскольку методы машинного обучения и искусственного интеллекта находятся в фокусе внимания как специалистов в различных прикладных областях, так и фундаментальных ученых, а кроме того, вызывают общественный резонанс, количество посвященных этим темам работ имеет взрывной рост.
Генетическое разнообразие биологических объектов, таких как популяции, виды и сообщества, является важнейшим источником информации для понимания их структуры и функционирования. Однако многие экологические и эволюционные проблемы возникают изза того, что наборы данных содержат относительно небольшое количество выборок, что затрудняет использование традиционных методов анализа. В связи c этим наше исследование предлагает новый подход, основанный на глубоком обучении, для решения одной из самых актуальных задач эволюционной биологии – поиска баланса между половым и бесполым размножением. Половое размножение часто приводит к нарушению выгодных комбинаций генов, которые были отобраны в процессе эволюции. С другой стороны, бесполое размножение позволяет организмам быстрее размножаться без участия самцов, эффективно поддерживая полезные генотипы. Исследование посвящено изучению закономерностей сосуществования полового и бесполого размножения в рамках одного вида. Мы разработали специальную сверточную модель нейронной сети, предназначенную для анализа динамики популяций, которые демонстрируют смешанные репродуктивные стратегии в изменяющихся условиях. Эта модель позволяет оценить долю потомков репродуктивного размножения, если эта доля остается постоянной в течение достаточного периода времени, в популяциях, состоящих из постоянного числа организмов, с использованием мультиаллельных признаков, таких как микросателлитные повторы. Результаты показали, что модель с точностью 0.99 оценивает соотношение репродуктивных режимов, эффективно справляясь с трудностями, связанными с небольшими выборками. Более того, когда размерность обучающего набора данных соответствует фактическим данным, модель быстрее достигает минимальной ошибки, что подчеркивает важность подбора структуры набора данных для точности предсказаний. Эта работа вносит значительный вклад в понимание динамики репродуктивной стратегии в эволюционной биологии, демонстрируя потенциал глубокого обучения для улучшения анализа генетических данных. Наши результаты открывают двери для будущих исследований, посвященных тонкостям генетического разнообразия и способам размножения в изменчивых экологических условиях, подчеркивая важность современных вычислительных методов в эволюционных исследованиях.