Preview

Вавиловский журнал генетики и селекции

Расширенный поиск
Том 30, № 2 (2026)
Скачать выпуск PDF

МОЛЕКУЛЯРНАЯ И КЛЕТОЧНАЯ БИОЛОГИЯ

163-180 72
Аннотация

Для оценки возможности интеграции в реципиентный геном гемопоэтических стволовых клеток экстраклеточных фрагментов двуцепочечной ДНК был сконструирован сложно составленный субстрат, состоящий из целого М13F-AluI-M13R фрагмента и двух его производных, появляющихся после гидролиза рестриктазами EcoRI и HindIII: M13F-AluI-EcoRI и М13R-AluI-HindIII. В субстрате была представлена последовательность полилинкера плазмиды pBlueScript+, отсутствующая в геноме человека, которая обрамляла клонированный по сайту EcoRV AluI фрагмент человека. Клетки костного мозга человека были обработаны ДНК сконструированного сложно составленного субстрата, и с учетом времени репарации пангеномных одноцепочечных разрывов из клеток выросших колоний получены препараты метафазных пластинок. Проведенная FISH выявила специфические сигналы свечения. Одновременно ДНК, выделенная из колоний, полученных из клеток костного мозга, обработанных сложно составленным субстратом, была секвенирована. Проведено два раунда секвенирования: полногеномное и селективное после таргетной гибридизации на металлических бусах. Полученные результаты свидетельствуют, что гомологичный обмен между экстрахромосомальной и хромосомной ДНК возможен. Также возможна интеграция в геном по механизму однонитевого отжига, с участием микрогомологий. Обнаружены интермедиаты с одним концом фрагмента, интегрированным в геном по участку микрогомологии, и другим концом фрагмента, свободно свисающим в межхромосомное пространство. Проведена прямая оценка возможности интеграции TAMRA-меченых фрагментов двуцепочечной ДНК человека и E. coli в реципиентный геном на модели клеток костного мозга человека. Обнаружено, что специфические сигналы гомологичной ДНК распределены по телу хромосом (модель клеток костного мозга человека). Сигналы негомологичной ДНК E. Coli преимущественно сконцентрированы в центромерных районах хромосом. Соотношение количества полученных ридов с элементами интеграции и сигналов FISH предполагало существование прочного взаимодействия экстраклеточных фрагментов и ДНК хромосом. В экспериментах показано, что линейная плазмидная ДНК после интернализации в гемопоэтические стволовые клетки формирует кольцо мономера. Интернализованная во внутриклеточное пространство экстраклеточная плазмидная ДНК выделяется совместно с ДНК хромосом после жестких процедур очистки и фракционирования. Этот факт предполагает существование прочного кольцевого ассоциата ДНК плазмиды и ДНК хромосом, сформированного без участия белкового каркаса в форме закольцованной хромосомной нити.

181-193 59
Аннотация

Наивные плюрипотентные стволовые клетки (ПСК) человека – новый многообещающий инструмент биомедицинских исследований, открывающий доступ к ранним программам эмбрионального развития и прорывным решениям задач регенеративной медицины. Препятствием на пути к эффективному внедрению наивных ПСК в биомедицину является отсутствие возможности получать длительно культивируемые генетически и эпигенетически стабильные линии наивных ПСК. Ранее было заявлено, что культуральная среда HENSM позволяет индуцировать и длительно поддерживать линии наивных плюрипотентных стволовых клеток человека. В рамках данной работы мы проверили возможность получать стабильные линии наивных ПСК с использованием среды HENSM. С помощью среды HENSM мы успешно перевели линию ICGi022-A (K7-4Lf) праймированных индуцированных плюрипотентных стволовых клеток (ИПСК) здорового донора в наивное состояние. Наивные ИПСК растут в форме сфероподобных колоний как на питающем слое клеток, так и без него. Полученные клетки сохранили экспрессию ключевых факторов плюрипотентности и одновременно активировали транскрипционную программу наивных ПСК, включающую экспрессию эндогенных ретровирусных элементов, генов-маркеров раннего эпибласта и генов, ассоциированных с тотипотентностью. Наивная линия ИПСК была способна дифференцироваться в производные трех первичных зародышевых листков, а также давать производные трофобласта. При культивировании наивных ИПСК в низкоадгезивных условиях наблюдалось спонтанное формирование трехмерных структур – бластоидов, морфологически напоминающих ранние бластоцисты человека. Х-хромосома, имевшая нарушения в неактивном статусе в исходной линии клеток, реактивировалась в наивных клетках и восстанавливала нормальное неактивное состояние при повторном переводе наивных клеток в праймированное состояние. Важно отметить, что наивные ИПСК продемонстрировали низкую способность к прямой направленной дифференцировке в эндотелиоциты, однако их компетентность давать зрелые эндотелиальные производные восстанавливалась после их возврата к праймированному состоянию, достигая эффективности, сопоставимой с таковой у исходных праймированных ИПСК. Таким образом, полученная линия наивных ИПСК обладает значительным потенциалом для исследования ранних стадий эмбриогенеза и других биомедицинских приложений, включая моделирование заболеваний. Тем не менее при длительном культивировании с использованием среды HENSM наивная линия ICGi022-A оказалась кариотипически нестабильной. Поскольку риск кариотипических аберраций при поддержании наивных ПСК сохраняется, в дальнейшем для получения надежных, кариотипически стабильных линий наивных плюрипотентных клеток необходимо совершенствование условий культивирования.

ГЕНЕТИКА И СЕЛЕКЦИЯ РАСТЕНИЙ

194-204 71
Аннотация

Исследована генетическая структура по пяти ISSR-маркерам у 44 особей в выборках из восьми ценопопуляций (ЦП) Caragana jubata (Pall.) Poir. в горных условиях Центральной Азии – на Западном Памире и Внутреннем Тянь-Шане (Кыргызстан) и в Южной Сибири – на Алтае (Республика Алтай), Западном (Республика Тыва) и Восточном (Республика Бурятия) Саяне. Вид изучен в диапазоне географических расстояний, составляющих более 2.5 тыс. км и в диапазоне абсолютных высот 1570–3680 м. Caragana jubata занесена в Красные книги восьми субъектов Российской Федерации. Цель настоящей работы – выявление генетического разнообразия и гетерогенности в ЦП C. jubata в зависимости от их географической и высотной приуроченности в горах Центральной Азии и Южной Сибири. Исследования показали, что в ненарушенных местонахождениях изученные ЦП этого вида характеризовались высокими параметрами численности особей и занимали площадь более 100 м2. Практически в каждой изученной нами выборке из ЦП C. jubata (кроме представителей из ЦП7) обнаружено наличие генотипов, содержащих уникальные фрагменты ДНК. Наибольшая доля (75 %) таких генотипов установлена в выборке из ЦП3 (Внутренний Тянь-Шань, хр. Тескей-Ала-Тоо, абсолютная высота 2550 м). Нами не найдено уникальных фрагментов в генотипах у особей из исследованной выборки в ЦП7 (Западный Саян, Республика Тыва). Возможная причина – антропогенное воздействие на растения в данном местонахождении. Выявленное преобладание внутрипопуляционной генетической изменчивости над межпопуляционной в выборках из восьми изученных ЦП C. jubata может свидетельствовать об устойчивости представителей этого вида в пределах исследованных нами частей ареала.

205-211 71
Аннотация

Изменчивость геномов клеточных органелл – хлоропластов и митохондрий – является немаловажной компонентой общей изменчивости генома растений. Получено большое количество данных о сравнительных особенностях организации последовательностей органельных ДНК для различных групп растений. В настоящей работе представлены новые оригинальные данные об изменчивости геномов митохондрий и хлоропластов у сои (Glycine max (L.) Merr.), важной хозяйственной и пищевой культуры, широко возделываемой на территории Центральной Европы, в том числе и в Республике Беларусь. Рабочей гипотезой нашего исследования изначально стало предположение: возможно, особенности изменчивости последовательности или структуры ДНК органелл сои определяют способность одних сортов выступать в роли лучших материнских родителей, а других – быть лучшими отцовскими формами. Получены новые полные нуклеотидные последовательности хлоропластного и митохондриального геномов 46 образцов культурной сои с применением метода секвенирования нового поколения (NGS) на платформе Illumina. Выполнено комплексное биоинформатическое сравнительное исследование внутривидовой изменчивости геномов органелл у 46 сортов сои разнообразного географического происхождения. Выявлены полиморфные локусы геномов. Данные об изменчивости ДНК верифицированы секвенированием по Сэнгеру. Спектр изменчивости органельных ДНК, исследованных методом полногеномного секвенирования сортов сои, представлен тремя гаплотипами хлоропластной ДНК (С1–С3) и пятью гаплотипами митохондриальной ДНК (М1–М5). Обнаружен сравнительно низкий уровень внутривидовой изменчивости геномов органелл у G. max. Хлоропластный геном сои обладал меньшим уровнем изменчивости последовательности, чем митохондриальный. Разработан набор ДНК-маркеров к полиморфным локусам геномов органелл, позволяющий дифференцировать сорта сои на плазматипы. Методом ПЦР с последующим секвенированием по Сэнгеру дополнительно изучено 90 образцов сои из коллекции. Низкий уровень внутривидовой изменчивости геномов органелл у G. max подтвержден на расширенной группе образцов. Большая часть коллекции была представлена тремя плазматипами – С1/М1, С2/М2 и С1/М3. 46 полных последовательностей хлоропластной ДНК помещено в NCBI GenBank. Гипотеза влияния ДНК органелл на комбинационную способность различных сортов в настоящее время не подтверждена. Требуются более детальное изучение механизмов ядерно-цитоплазматического взаимодействия, поиск ядерных маркеров, влияющих на экспрессию цитоплазматических генов.

212-221 46
Аннотация

В реализации защитного ответа растений принимают участие стрессовые фитогормоны – салициловая и жасмоновая кислоты. Повышение содержания этих соединений при инфицировании растений патогенами приводит к активации сигнальных путей, в конечном итоге изменяющих экспрессию генов и синтез белков, среди которых выделяется группа индуцируемых, связанных с патогенезом белков (PR). Для оценки активации этих сигнальных путей используются фитогормон-зависимые, так называемые маркерные гены. В настоящей работе выявлены и охарактеризованы экспрессирующиеся в корнях гороха гены маркерных для салицилатного сигналинга белков PR-1. Проанализировано влияние салициловой кислоты и метилжасмоната на их экспрессию. Показано, что в корнях гороха ген Psat1g156240, кодирующий PR-1, входит в число наиболее значительно экспрессирующихся генов. Салициловая кислота не вызывала изменение экспрессии этого гена, в то же время он индуцировался метилжасмонатом через 24 ч. Анализ экспрессии других генов, кодирующих белки PR-1, показал, что салицилат не влиял на их экспрессию через 24 и 72 ч. При анализе экспрессии генов хитиназ и хитиназа-подобных белков первые не проявляли специфичность ответа на действие салицилата и метилжасмоната, за исключением гена Psat1g131280, экспрессия которого повышалась через 24 и 72 ч при действии метилжасмоната. Гены хитиназа-подобных белков, Psat1g147600, Psat1g147560, Psat1g149120, практически не экспрессировались в корнях гороха контрольного варианта и специфично индуцировались салициловой кислотой. Гены β-1,3-глюканаз не индуцировались исследованными фитогормонами в корнях. Полученные результаты позволили определить конкретные гены, кодирующие хитиназа-подобные белки, экспрессия которых индуцируется салициловой кислотой. Эти гены могут быть использованы для оценки активации салицилат-зависимого сигнального пути в корнях гороха.

222-232 60
Аннотация

Мутационные изменения служат основным источником разнообразия в селекции растений. Данное исследование было сосредоточено на выявлении стабильных мутантных линий риса. Четырнадцать мутантных линий и четыре обычных сорта риса были оценены в рандомизированном посеве с тремя повторениями в трех регионах Ирана (Решт, Чапарсар и провинция Фарс) в течение двух вегетационных сезонов 2015 и 2016 гг. Все статистические анализы выполнены с использованием пакета R ‘metan’ (multi-environment trial analysis). Однофакторный ANOVA показал значимые генотипические эффекты для всех признаков. Тесты отношения правдоподобия (LRT) подтвердили значимые эффекты среды и взаимодействия генотип–среда (GEI) для всех признаков. Первые три главные компоненты определяли 68.13, 14.46 и 9.76 % вариаций GEI соответственно. Визуализация тепловой карты для выраженности урожайности и WAASB (взвешенное среднее абсолютных баллов на основе наилучшего линейного несмещенного прогноза, BLUP) позволила выделить генотипы G3, G9, G6, G12 и G5 как высокоурожайные и стабильные. Анализ с помощью индекса мультипризнаковой стабильности (MTSI), разработанный для выявления сильных и слабых сторон генотипов, отобрал только генотипы G7, G5 и G1. С использованием параметра гармонического среднего относительной производительности генотипических значений (HMRPGV) были отмечены пять лучших генотипов – G5, G12, G7, G2 и G1. Высокая выраженность признаков у некоторых мутантов демонстрирует, что мутационные изменения могут эффективно создавать значительное генетическое разнообразие. В частности, генотипы G12, G5 и G9 имели явное преимущество перед другими генотипами и могут быть использованы для последующей селекции или для создания сорта. Однако только генотип G5 был отобран с учетом индекса MTSI на основе всех признаков и, следовательно, может быть использован в дальнейшем селекционном процессе или для создания сорта.

ГЕНЕТИЧЕСКАЯ ИНЖЕНЕРИЯ

233-240 49
Аннотация

Lens culinaris Medik. (чечевица) – важная сельскохозяйственная культура из семейства бобовых, но модификация ее генома редко используется для создания новых сортов. Вероятно, это связано с низкой эффективностью существующих протоколов трансформации. Как правило, разработка универсальных, независимых от генотипа протоколов получения трансгенных растений зависит, среди прочего, от возможности образования существенного количества трансгенных клеток in vitro. В настоящем исследовании мы предприняли попытку адаптировать разработанный ранее для другого бобового протокол агробактериальной трансформации для получения трансгенной каллусной ткани у L. culinaris. Чтобы оценить эффективность трансформации, мы выбрали две независимые репортерные системы: бета-глюкуронидазу и зеленый флуоресцентный белок. С помощью этих систем мы нашли оптимальный тип экспланта для создания каллусной ткани чечевицы, экспрессирующей рекомбинантную ДНК. Мы также оценили влияние гигромицина, одного из распространенных селективных агентов, на количество трансгенной ткани в развивающихся трансформированных эксплантах L. culinaris. Согласно нашим результатам, протокол трансформации, который обычно применяется для эксплантов листьев Medicago truncatula Gaertn., может быть использован и для получения трансгенных каллусов из верхушек побегов L. culinaris. Экспланты из апексов побегов продемонстрировали более высокую первичную эффективность трансформации по сравнению с эксплантами из корней, стеблей и листьев. Кроме того, экспланты разных типов, культивируемые на среде без гигромицина, образовывали значительно меньше каллусов, экспрессирующих репортерные гены, по сравнению с эксплантами, выращиваемыми на среде с гигромицином. Это подтверждает возможность использования гигромицина в качестве эффективного селективного агента для чечевицы. В ходе нашего анализа мы также обнаружили GUS-подобное окрашивание в каллусах, не содержащих плазмид для экспрессии гена GUS, что можно объяснить так называемой внутренней GUS-подобной активностью, которая была описана в предыдущих исследованиях. Эти данные могут быть полезны для дальнейшей разработки эффективных и универсальных протоколов трансформации и редактирования генома L. culinaris.

241-249 54
Аннотация

У высших растений L-галактозный путь является основным путем биосинтеза витамина С (аскорбата, Аск), последний этап которого связан с функционированием электрон-транспортной цепи митохондрий. Помимо основного цитохромного пути, электрон-транспортная цепь растений содержит альтернативный путь через альтернативную терминальную оксидазу (АОХ). Вовлечение АОХ способствует синтезу Аск, поэтому предполагается, что подавление альтернативного пути в условиях дефицита Аск может привести к снижению жизнеспособности растений. В связи с этим была поставлена цель – рассмотреть последствия нокаутирования в растениях Arabidopsis thaliana одновременно двух генов: АОХ1а, наиболее стресс-индуцибельного гена АОХ, и VTC2, гена ключевого фермента L-галактозного пути синтеза Аск. Для этого проведено скрещивание двух линий A. thaliana с Т-ДНК инсерцией в целевых генах и получены гибридные линии. Изучены характеристики семян первого (F1) и второго (F2) поколений. Семена F1 отличались более крупными размерами по сравнению с родительскими линиями, что могло быть следствием гетерозиса. В поколении F2 в результате самоопыления растений F1 сформировались семена, значительно варьирующие по размерам, в том числе группа мелких семян, имеющих дегенеративные морфологические отклонения. Большинство мелких семян не прорастало или погибало на стадии появления проростка. Генотипирование этих семян с помощью ПЦР установило отсутствие нормальных копий АОХ1а и VTC2 в геноме, что указывает на появление летальной мутации при одновременном нокауте обоих генов. Обсуждаются причины летального исхода двойного нокаута. Одной из генетических причин, по-видимому, стало взаимодействие мутаций (неаллельных генов). На физиологическом уровне, возможно, возникли необратимые нарушения дыхания, в том числе из-за влияния в линии vtc2 криптической мутации. Для подтверждения данных гипотез требуются дальнейшие исследования. В целом полученные результаты свидетельствуют о жизненно важном совместном функционировании альтернативного и L-галактозного путей биосинтеза Аск и могут быть полезны для развития генно-инженерных приемов управления синтезом витамина С в растениях.

МЕДИЦИНСКАЯ ГЕНЕТИКА

250-258 48
Аннотация

Характеристикой глобальной генетической общности признаков человека считается их генетическая корреляция. Ее основной механизм – плейотропия, проявляющаяся на различных уровнях. Наиболее интересна плейотропия на уровне генов, поскольку именно они являются фундаментальными функциональными единицами генома. Используя результаты полногеномного анализа ассоциаций 324 болезней, находящиеся в открытом доступе, мы отобрали группу из 45 болезней, в которой каждая пара показала значимую генетическую корреляцию. Эти болезни принадлежали 10 нозологическим категориям. Поиск генов с плейотропными эффектами осуществляли с помощью трех подходов: полногеномного анализа ассоциаций на уровне гена; выбора однонуклеотидных полиморфизмов (SNP) внутри кодирующей части гена, значимо ассоциированных хотя бы с двумя болезнями; и метаанализа сигналов ассоциации SNP со всеми болезнями с последующей идентификацией независимых локусов и приоритизации генов в них. Для всех отобранных таким образом генов мы провели биоинформатический анализ. Всего было идентифицировано 167 плейотропных генов, вовлеченных в контроль 39 болезней. Наиболее плейотропными в нашем исследовании были гены LPA, TCF7L2, SLC22A3, FES, CDKN2B и APOE, каждый из которых контролировал семь-девять болезней. Мы провели биоинформатический анализ всех генов и показали, что найденные нами для 39 болезней плейотропные гены участвуют в контроле еще 501 заболевания. Полученные данные указывают на высокую плейотропную способность этих генов, которая обеспечивается их участием в различных биологических процессах, таких как поддержание гомеостаза, межклеточная сигнализация, регуляция клеточной пролиферации, транспорт веществ и каталитическая активность, а также выполнением ими различных молекулярных функций, в частности связывания с сигнальными рецепторами. Таким образом, мы показали, что 87 % болезней, представляющих полносвязную группу, имеют общие гены с хотя бы еще одной болезнью. Это свидетельствует о том, что генетические корреляции между болезнями в значительной степени обусловлены плейотропными эффектами генов.

259-266 51
Аннотация

Метформин является препаратом первого выбора для лечения сахарного диабета второго типа, однако более чем у 30 % пациентов не достигается оптимальный гликемический контроль. Лежащие в основе этого феномена регуляторные механизмы и ассоциированные генетические варианты остаются неизученными. Накопленные данные свидетельствуют о том, что ключевую роль в определении фенотипической вариабельности играют функциональные генетические варианты, в особенности регуляторные однонуклеотидные полиморфизмы (rSNP), непосредственно влияющие на уровень экспрессии генов. Полногеномный поиск таких функциональных вариантов и выявление их фенотипических последствий – актуальная научная задача. Ранее на основе результатов биоинформатического анализа аллель-специфической экспрессии и профиля распределения активирующих гистоновых модификаций в мононуклеарных клетках периферической крови человека нами была сформирована оригинальная панель из 14 796 rSNP, локализованных в промоторах 5132 генов. Целью настоящей работы был поиск в нашей панели rSNP вариантов, потенциально связанных с регуляцией процессов глюконеогенеза в печени, в том числе под действием монотерапии метформином, с помощью анализа независимых релевантных полногеномных данных. Анализировали 1196 генов, экспрессия которых в гепатоцитах человека изменялась под влиянием метформина АМФК-зависимым образом, а также 115 генов, вовлеченных в глюконеогенез и/или его регуляцию, согласно данным генных онтологий. Для функциональной аннотации использовали инструменты свободного программного обеспечения R и базы данных STRING (v.11). В результате анализа был выделен ряд генов, которые, вероятно, играют особую роль в механизмах действия метформина и индивидуальной чувствительности к препарату, в промоторных районах которых нами были картированы rSNP. Функциональный анализ обогащения выявил вовлеченность этих генов в ключевые сигнальные пути, ассоциированные также с осложнениями сахарного диабета второго типа. Для шести генов (ARPP19, ATF4, NR3C1, PFKFB3, TCF7L2 и WDR5) экспрессия не только тесно связана с регуляцией глюконеогенеза, но также может модулироваться в гепатоцитах под действием метформина. Мы предполагаем, что rSNP в промоторах генов ферментов, участвующих в глюконеогенезе, и транскрипционных факторов могут играть существенную роль в механизмах формирования индивидуального ответа на терапию метформином.

267-273 46
Аннотация

Полиморфизм гена транспортера серотонина имеет большое значение в регуляции серотонинергической системы, влияющей на настроение и регуляцию эмоций и поведения. В исследовании была проведена запись 128-канальной электроэнцефалограммы и взяты образцы буккального эпителия у 53 добровольцев (32 женщины). Аллели La, Lg и S были определены методом полимеразной цепной реакции. Целью работы было изучение особенностей коннективности дефолтной сети мозга, измеренной с помощью электрофизиологических данных состояния покоя, в зависимости от полиморфизма гена транспортера серотонина. Локализация источников биоэлектрической активности коры мозга осуществлялась методом формирователя пучка. Сравнение групп носителей LaLa генотипа и носителей одного из аллелей S или Lg было выполнено с помощью Т-контраста показателей коннективности, рассчитанных между узлами дефолтной сети мозга и остальным мозгом. Обнаружено, что для носителей S или Lg аллеля характерна повышенная коннективность дефолтной сети мозга со зрительной ассоциативной корой и со структурами, образующими задний узел дефолтной сети мозга, а также повышенная коннективность заднего узла дефолтной сети мозга с правой парагиппокампальной извилиной, что может предрасполагать к возникновению и/или поддержанию навязчивых мыслей. У носителей LaLa генотипа по сравнению с носителями S или Lg аллеля была выше коннективность переднего узла дефолтной сети мозга с правой вентромедиальной лобной корой, с медиальной лобной извилиной и с задней поясной корой, являющейся структурой заднего узла дефолтной сети мозга. Также у носителей LaLa генотипа по сравнению с носителями S или Lg аллеля была выше коннективность заднего узла дефолтной сети мозга с кластером, охватывающим правую дорсолатеральную префронтальную кору. Можно предположить, что увеличение коннективности дефолтной сети мозга со структурами мозга (дорсолатеральная и вентромедиальная префронтальная кора), участвующими в процессах когнитивной регуляции, способствует регуляции процессов дефолтной сети мозга, связанных с автобиографическими воспоминаниями.

ПОПУЛЯЦИОННАЯ ГЕНЕТИКА

274-283 54
Аннотация

Комплекс Formica picea, или черный болотный муравей, широко распространен по всему северу Евразии, от Испании и Ирландии до побережья Тихого океана и Тибета, примерно между 35 и 66.5° северной широты. Ранее считалось, что он состоит из одного или двух видов (F. picea и F. candida). Однако молекулярный анализ показал, что в него входят три криптических вида. Один из них – F. picea из Европы, другой – F. candida, известный исключительно из Киргизии, а третий, временно обозначенный как Formica sp., обитает на востоке Евразии: от Китая до Камчатки. До сих пор было неизвестно, каково распределение F. picea и Formica sp. в Сибири, пересекаются ли их ареалы. Мы изучили образцы этого комплекса из Сибири с использованием митохондриальной ДНК и обнаружили, что их ареалы перекрываются. Ареал Formica sp. охватывает юг Западной Сибири, включая Алтай, на восток – до Тихоокеанского побережья. Филогеографической структуры не обнаружено, что указывает на недавнее расселение из одного источника. Мы нашли мало образцов F. picea в Сибири, это свидетельствует, что здесь этот вид встречается редко. Самая восточная находка вида была сделана в Забайкальском крае. F. Picea обитает на торфяных болотах в пределах равнин и травяных сообществах выше линии леса в европейских горах; на Алтае – в горных степях, а в Забайкалье – на влажных участках у речных берегов. Formica sp. Предпочитает сухие степи и низкие берега рек, но избегает болот. Таким образом, оказалось, что F. picea и Formica sp. Отличаются генетически, имеют разные ареалы и биотопические предпочтения по местообитаниям. Это свидетельствует в пользу того, что Formica sp. можно считать отдельным видом.

БИОИНФОРМАТИКА И СИСТЕМНАЯ БИОЛОГИЯ

284-292 33
Аннотация

Вопрос о воспроизводимости эволюционных процессов имеет в первую очередь фундаментальное значение, однако с развитием методов моделирования эволюционных процессов на компьютерных многоуровневых моделях ответ на этот вопрос необходим для прояснения статуса получаемых прогнозов. Экспериментальное получение ансамблей эволюционных исходов для последующей статистической обработки на реальных биологических системах представляется неосуществимым. В то же время прогнозы, сгенерированные многоуровневыми компьютерными моделями, вследствие их сложности и зависимости результатов моделирования от множества параметров с трудом поддаются интерпретации. Данная работа направлена на выявление общих свойств эволюционирующих систем с помощью простой эвристической модели, построенной на прозрачных общих принципах и представлениях о ключевых свойствах биологических систем, значимых для эволюционного процесса. Аге ты, претерпевающие эволюционные изменения, являются рекуррентными нейронными сетями с четко определенной структурой, заданной функцией и определенным правилом модификации структуры в направлении максимальной приспособленности. Отдельный экземпляр нейронной сети, формируемой в ходе эволюционного процесса, назван нейросетевым модельным объектом (НМО). В работе проведены вычислительные эксперименты по генерации ансамблей структур НМО, выполняющих заданную функцию, и проанализированы закономерности распределения НМО в структурном пространстве. Этот анализ подтверждает наличие функциональной симметрии структуры НМО, выполняющих одну и ту же функцию. Оценены устойчивость и воспроизводимость индивидуальных эволюционных траекторий. Показано, что при определенных ограничениях, приводящих к редукции сложности структуры НМО (аналог – узкая экологическая специализация), финальные структуры НМО могут быть близки, но не идентичны. Это позволяет говорить о неточном воспроизведении эволюции структуры на фоне функциональной эквифинальности. Тем не менее можно утверждать, что в общем случае сама способность к эволюционным изменениям реализуется при избыточности потенциальной сложности структуры над функциональной сложностью и автоматически влечет за собой множественность эволюционных исходов, основанную на том, что одна и та же функция может реализовываться различными, но функционально инвариантными структурами.

293-298 37
Аннотация

Развитие технологий высокопроизводительного секвенирования и методов анализа больших данных создает устойчивую потребность в повторном анализе накопленной в открытых репозиториях гетерогенной информации. Серьезной проблемой при этом остается преобладание свободного текстового описания биологических экспериментов, что затрудняет продуктивный поиск, систематизацию и дальнейшее использование соответствующих наборов данных. Прогресс в области искусственного интеллекта, особенно в развитии методов обработки естественного языка (natural language processing, NLP), обуславливает новые методологические возможности для эффективного решения этой задачи. Интегрированная система баз данных Entrez, поддерживаемая Национальным центром биотехнологической информации США (NCBI), предоставляет развитый и надежный доступ как к исходным данным секвенирования, так и к сопутствующей метаинформации, включающей детальное описание параметров экспериментов, через программный интерфейс (application programming interface, API). Это позволяет идентифицировать и загружать данные секвенирования и соответствующие им метаданные с описаниями экспериментов, используя поиск по ключевым словам и различным терминам, таким, например, как имена генов, в репозиториях; преобразовывать и систематизировать текстовые описания с применением современных NLP-методов и обеспечивать исследователям структурированную информацию для интеграции в локальные базы данных и форматированный перечень ссылок для загрузки исходных данных. Программный пакет Alembic предлагает комплексное решение для поиска и загрузки данных, автоматизируя все указанные этапы. Платформа использует клиент-серверную архитектуру и предназначенa для локальной установки. Для анализа биомедицинских текстов, сопровождающих данные секвенирования, в Alembic интегрированы современные алгоритмы искусственного интеллекта на основе архитектуры трансформеров. В частности, используется имеющаяся в открытом доступе платформа AIONER, обученная на данных репозитория PubMed с помощью модели PubMedBERT. Такой подход обеспечивает эффективное распознавание именованных сущностей (named entity recognition, NER) биомедицинского характера (гены, заболевания и др.), предоставляя пользователю структурированные результаты поиска по ключевым словам. Формируемый пакетом список дает возможность исследователю анализировать результаты, отбирать наиболее релевантные наборы данных и получать всю необходимую информацию (включая исходные данные) для создания локального репозитория, ориентированного на конкретную исследовательскую задачу. В отличие от имеющихся аналогов, Alembic является универсальным решением для интеграции данных из репозиториев открытого доступа и работы с разнородными типами данных секвенирования.

ВЫСОКОПРОИЗВОДИТЕЛЬНОЕ СЕКВЕНИРОВАНИЕ

299-310 57
Аннотация

Секвенирование РНК (РНК-сек) – высокочувствительный метод анализа транскриптома, позволяющий одновременно оценивать экспрессию тысяч генов и выявлять паттерны экспрессии в различных условиях. Существующее разнообразие форматов данных РНК-сек, методов нормализации и подходов к статистической обработке результатов затрудняет сопоставление данных разных исследований и снижает воспроизводимость анализа. В настоящей работе представлен автоматизированный пайплайн PipeSeq, объединяющий стандартные этапы обработки данных РНК-сек – от загрузки (SRA Toolkit), выравнивания прочтений на референсный геном (HISAT2) и сборки транскриптов (StringTie) до подсчета транскриптов (FeatureCounts) и статистического анализа дифференциальной экспрессии генов в различных экспериментальных условиях (DESeq2). Программа PipeSeq имеет простой визуальный интерфейс, поддерживает многопоточность и формирует готовые для анализа тепловые карты экспрессии генов и отчеты в форме таблиц и графиков. Функциональность пайплайна продемонстрирована на трех наборах пакетов сырых данных секвенирования РНК клеток зеленой водоросли Chlamydomonas reinhardtii, доступных в открытой базе данных NCBI SRA. Результаты этих экспериментов были использованы для анализа дифференциальной экспрессии генов C. reinhardtii, кодирующих факторы транскрипции семейства GATA, в различных световых условиях культивирования. Полученные методами in silico данные верифицированы методом полимеразной цепной реакции в реальном времени с обратной транскрипцией (ОТ-ПЦР-РВ) по 12 генам GATA, что позволило выдвинуть предположения об их функциях, а также оценить степень согласованности между массовым (РНК-сек) и таргетным (ОТ-ПЦР-РВ) подходами. Результаты нашего исследования показали, что методы секвенирования РНК и ОТ-ПЦР-РВ выявляют схожие направления изменения экспрессии генов, но демонстрируют различия по оценке степени размера эффекта и чувствительности, что подчеркивает необходимость совместного применения двух подходов. Таким образом, программа PipeSeq представляет собой инструмент для проведения полного цикла биоинформатического анализа данных РНК-сек, дает возможность обрабатывать данные ОТ-ПЦР-РВ и выполнять сравнительный статистический анализ полученных результатов.

311-320 65
Аннотация

В последние годы метагеномный подход, основанный на высокопроизводительном секвенировании, находит все большее применение в диагностике вирусных инфекций растений. Этот метод позволяет изучить видовой состав вирусов, ассоциированных с исследуемым растением, и в том числе обнаружить ранее не описанные виды, охарактеризовать их популяционно-генетическую структуру и разработать генетические тестсистемы для рутинной диагностики. Проведение фитосанитарного мониторинга с использованием метагеномного подхода может способствовать определению этиологии неизвестных заболеваний растений, что особенно важно для предотвращения распространения таких патогенов, как вирусы. Кроме того, с учетом невозможности элиминации вирусов растений в полевых условиях комплексная диагностика с помощью высокопроизводительного секвенирования становится эффективным инструментом как в целях соблюдения карантинного законодательства при ввозе импортного материала, так и для получения отечественного посадочного материала высоких категорий. При этом с каждым годом высокопроизводительное секвенирование становится более доступным: расширяется как приборно-техническая, так и аналитическая база. В настоящем обзоре систематизированы ключевые подходы к анализу вирома растений с помощью высокопроизводительного секвенирования. В основной части статьи описаны этапы проведения анализа: от сбора образцов до биоинформатической обработки данных, ее валидации и интерпретации. Подробно рассмотрены особенности современных платформ секвенирования и факторы, влияющие на качество чтения, в том числе контаминация. Охарактеризованы три взаимодополняющих подхода для обработки биоинформатических данных: картирование чтений на референсные последовательности вирусов; сборка и аннотация контигов; таксономическая классификация чтений без дополнительной сборки. Особое внимание уделено необходимости тщательной интерпретации результатов с учетом как биоинформатического анализа, так и валидации идентификации молекулярно-генетическими методами. Обзор будет полезен как для исследователей и специалистов, не имеющих опыта работы с высокопроизводительным секвенированием, так и для тех, кто использовал этот инструмент для выполнения других задач.

ЦИФРОВОЕ ФЕНОТИПИРОВАНИЕ

321-329 49
Аннотация

Современные исследования в области агробиотехнологий все чаще опираются на методы автоматизированной фиксации и интерпретации морфофизиологических и спектральных характеристик растений – направление, известное как цифровое фенотипирование. Этот подход направлен на обнаружение устойчивых различий между генотипами, культивируемыми в неидентичных условиях среды. Ранее был предложен StatFaRmer – инструмент с открытым кодом, совершенствующийся в рамках настоящей работы для комплексного анализа временных фенотипических наборов данных, преимущественно ориентированный на изучение сельскохозяйственных культур, таких как соя (Glycine max). Разработанный инструмент реализует автоматизированные процедуры предобработки данных, включая синхронизацию временны’ х меток между образцами и устранение шумовых артефактов и выбросов. Эти функции особенно актуальны для многомесячных экспериментов, связанных с оценкой параметров роста, колебаний площади фотосинтетического аппарата или других биометрических показателей. Поддержка стандартизированных форматов данных (XLSX, CSV) обеспечивает совместимость с распространенными системами фенотипирования, упрощая кроссплатформенную интеграцию. Таким образом, инструмент может поддерживать интеграцию с популярными HTPP-платформами (например, Traitmill, HyperAIxpert, Plant Accelerator), что позволяет использовать данные, полученные из различных источников, в едином аналитическом конвейере. Для экспериментов с соей StatFaRmer предоставляет настраиваемый дисперсионный анализ (ANOVA) с визуализацией диагностических параметров (нормальность распределения, гомогенность дисперсий) и оценкой значимости эффектов между пользовательскими группами. Пример применения включает сравнение параметров роста 20 сортов сои в условиях контролируемого стресса: инструмент автоматически агрегировал данные с неравномерной частотой измерений (от 1 часа до 3  суток), идентифицировал аномалии в динамике удлинения гипокотиля и рассчитал статистическую значимость различий между группами (p < 0.01). Инструмент протестирован на масштабных наборах данных (более 2000 измерений на эксперимент). StatFaRmer реализован в виде веб-приложения на платформе Shiny с пошаговыми инструкциями для установки и запуска в ОС Windows и Linux. Все этапы обработки – от первичных данных до итоговых графиков – документируются, что обеспечивает прозрачность анализа и соответствие требованиям воспроизводимости исследований. Таким образом, StatFaRmer предлагает специализированное решение для статистической верификации гипотез в цифровом фенотипировании сои, сокращая время на подготовку данных и минимизируя риски ошибок при работе с нестационарными временными рядами.

330-338 60
Аннотация

При анализе структуры урожая пшеницы неоднократно показано, что его выраженность зависит от продуктивности колоса. Основные характеристики колоса, которые связаны с продуктивностью, это прежде всего масса 1000 зерен, число зерен и колосков в колосе, его размеры, наличие/отсутствие остей и другие. В современных генетических исследованиях для идентификации локусов, контролирующих признаки продуктивности колоса, требуется морфометрия сотен и тысяч колосьев. С другой стороны, современные коллекции генетических ресурсов содержат тысячи образцов, которые также требуют своего детального описания. Все это обусловливает необходимость развития цифровых технологий описания признака колоса пшеницы, которые могут быть достигнуты на основе методов анализа изображений. Эти методы позволяют автоматически получать значения набора признаков, которые могут служить основой формирования цифровых коллекций растений. В настоящей работе предложено цифровое описание колоса пшеницы на основе характеристик, полученных как вручную, так и на основе анализа цифровых изображений, а также характеристик растений, у которых был взят колос. Эти данные положены в основу обновленной версии базы данных SpikeDroidDB (http://spikedroid.biores.cytogen.ru/). Цифровое описание колоса состоит из двух блоков. Блок загружаемых данных содержит описание растения и включает 5  таблиц: коллекция, сортообразец (год выращивания (вегетация), посевной номер, таксономическую информацию и др.), место выращивания, характеристики колоса растений, оцененные экспертом вручную (длину, ширину фронтальной и боковой проекций, тип и цвет колоса и др.). Блок извлекаемых характеристик включает признаки колоса, полученные в результате цифрового фенотипирования, и состоит из шести таблиц: характеристики контура колоса на изображении; характеристики модели четырехугольников, компоненты цвета колоса, доминантные цвета колоса, текстурные характеристики колоса на изображении. Было проведено выделение наиболее наглядных и информативных характеристик колоса, которые позволили сформировать цифровой паспорт колоса, включающий признаки размера, формы и цвета, определенные на основе анализа цифровых изображений. Проведено сравнение признаков, формирующих цифровой паспорт, у двух видов пшеницы, T. aethiopicum и T. carthlicum. Показано, что признаки цифрового паспорта позволяют наглядно представить модель колоса, а также выявить достоверно различающиеся параметры (цвет колоса и остей, округлость фронтальной проекции колоса). В интерфейс базы данных также добавлена возможность пакетной загрузки данных о характеристиках растения и колоса, а также их изображений.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2500-3259 (Online)