Preview

Вавиловский журнал генетики и селекции

Расширенный поиск

Оригинальный русский текст: https://vavilovj-icg.ru/2023-year/27-7/

 

Том 27, № 7 (2023)
Скачать выпуск PDF (English)
https://doi.org/10.18699/VJGB-23-83

КОМПЬЮТЕРНАЯ ГЕНОМИКА

 
728-736 395
Аннотация

Ранее было показано, что уровень экспрессии генов человека положительно коррелирует с аффинностью ТВР к промоторам этих генов. В свою очередь, однонуклеотидные полиморфизмы (SNP) в промоторах генов человека могут влиять на аффинность белка TBP к ДНК и, как следствие, на экспрессию генов. В ИЦиГ СО РАН разработан метод предсказания аффинности TBP к промоторам генов на основе трехшагового механизма связывания, включающего скольжение ТВР по ДНК, остановку ТВР в месте связывания, фиксацию комплекса ТВР–промотор за счет изгиба спирали ДНК. Метод показал высокую корреляцию теоретических предсказаний с измеренными значениями при многократной экспериментальной проверке независимыми группами исследователей. На основе этой модели в ИЦиГ СО РАН ранее были разработаны веб-сервисы SNP_TATA_Z-tester и SNP_TATA_Comparator, позволяющие вычислять статистическую оценку вызванного SNP изменения аффинности связывания TBP с промотором гена человека и прогнозировать изменение экспрессии, которые могут быть связаны с генетической предрасположенностью к заболеваниям или фенотипическими особенностями организма. В настоящей работе проведена интеграция в единой базе данных информации об однонуклеотидных полиморфизмах в промоторах генов человека, полученной путем автоматической экстракции из различных гетерогенных источников данных, а также результатов оценки аффинности TBP к промотору с использованием трехшаговой модели связывания и оценки их влияния на экспрессию генов для промоторов дикого типа и промоторов с однонуклеотидным полиморфизмом. Показана возможность использования базы данных Human_SNP_TATAdb для аннотации и выявления кандидатных SNP-маркеров заболеваний. Представлены результаты полногеномного анализа данных, включая особенности распределения генов по количеству транскриптов, распределение SNP, влияющих на аффинность TBP к ДНК по позициям внутри промоторов, а также закономерности, связывающие между собой аффинность TBP к промотору, специфичность сайта связывания TBP с промотором и другие характеристики промоторов. Результаты полногеномного анализа показали, что аффинность TBP к промотору и специфичность его сайта связывания статистически связаны с другими характеристиками промоторов, важными для функциональной классификации промоторов и исследования особенностей дифференциальной экспрессии генов.

 
737-745 780
Аннотация

Развитие технологий секвенирования нового поколения открыло новые возможности для генотипирования различных организмов, включая растения. Метод генотипирования путем секвенирования (GBS) применяется для идентификации генетической изменчивости и более быстрого генотипирования образцов, а также является более экономически эффективным методом в сравнении с полногеномным секвенированием.  GBS продемонстрировал свою надежность и гибкость для ряда видов и популяций растений. Этот метод был применен для генетического картирования, выявления молекулярных маркеров, геномной селекции, в исследовании генетического разнообразия, идентификации сортов, а также в исследованиях в области биологии  охраны природы и эволюционной экологии. Однако сокращение времени и стоимости секвенирования привело к необходимости разработки качественного биоинформатического анализа для постоянно расширяющегося количества секвенированных данных. Для этих целей были разработаны биоинформатические конвейеры анализа данных, полученных методом GBS. Вследствие схожести этапов обработки существующие конвейеры в основном различаются комбинацией программных пакетов, специфически подобранных для обработки данных как для определенных, так и для любых организмов. Несмотря на качественно подобранные пакеты программ, конвейеры имеют некоторые недостатки, например отсутствие возможности автоматизации процесса расчета (каждый этап нужно запускать вручную), что значительно снижает скорость исследования. В большинстве конвейеров отсутствует возможность автоматической установки всех необходимых программных пакетов, а также нет возможности отключения ненужного или пройденного этапа. В настоящей работе нами был разработан биоинформатический конвейер GBS-DP для анализа данных, полученных методом GBS. Конвейер применим для любых видов организмов. Реализация конвейера на платформе Snakemake позволила полностью автоматизировать процесс расчета и установки необходимых программных пакетов. Конвейер позволяет обрабатывать большие объемы данных (более 400 образцов).

СИСТЕМНАЯ КОМПЬЮТЕРНАЯ БИОЛОГИЯ

 
746-754 335
Аннотация

Выявление механизмов генетического контроля формирования пространственных структур остается одной из актуальных задач биологии развития. Для ее решения используются как экспериментальные, так и теоретические подходы и методы, в том числе методология генных сетей, а также методы математического и компьютерного моделирования. Реконструкция и анализ генных сетей, обеспечивающих становление признака, позволяют интегрировать существующие экспериментальные данные, выявить ключевые звенья и внутрисетевые связи, обеспечивающие функционирование сетей. Для получения динамических характеристик исследуемых систем, предсказания их состояния и поведения привлекаются методы математического и компьютерного моделирования. Одним из примеров пространственной морфологической структуры является щетиночный рисунок дрозофилы со строго определенным расположением на голове и теле мухи его составляющих – механорецепторов (внешних сенсорных органов). Механорецептор развивается из единственной родительской клетки (РКСО), которая выделяется из клеток эктодермы имагинального диска. Ее отличает от окружения наибольшее содержание пронейральных белков (ASC) – продуктов комплекса пронейральных генов achaete-scute (AS-C). Статус РКСО обеспечивается реконструированной нами ранее генной сетью, ключевым объектом которой является комплекс генов AS-C. Контроль активности комплекса осуществляется ее подсетью – центральным регуляторным контуром в составе семи генов (AS-C, hairy, senseless (sens), charlatan (chn), scratch (scrt), phyllopod (phyl), extramacrochaete (emc)) и одноименных белков. Кроме того, в состав центрального регуляторного контура входят вспомогательные белки Daughterless (DA), Groucho (GRO), Ubiquitin (UB) и Seven-in-absentia (SINA). В работе приведены результаты компьютерного моделирования различных режимов функционирования контура. Показано, что клетка детерминируется как РКСО при повышении содержания ASC примерно в два с половиной раза относительно уровня в клетках окружения. Выявлена иерархия влияния мутаций в генах контура на динамику накопления белков ASC. Наиболее значим главный компонент центрального регуляторного контура – AS-C. Мутации, снижающие содержание ASC более чем на 40 %, приводят к запрету выделения родительской клетки сенсорного органа.

 
755-767 351
Аннотация

Инфекционное заболевание, вызванное вирусами иммунодефицита человека первого типа (ВИЧ-1), остается серьез ной угрозой здоровью людей. Существующий подход к лечению ВИЧ-1 основан на применении высокоактивной антиретровирусной терапии, имеющей побочные эффекты для здоровья и высокую стоимость. Для практической медицины актуальной является задача поиска методов функционального лечения, связанных с интенсификацией иммунного контроля размножения вирусов и заражения клеток-мишеней с последующим снижением уровня вирусной нагрузки и восстановления иммунного статуса. Исследования в области иммунотерапии ВИЧ-1 находятся на стадии концептуальной разработки в силу сложности совокупности процессов, регулирующих динамику инфекции и иммунного ответа. По этой причине чрезвычайно актуальным является использование методов математического моделирования динамики ВИЧ-1 инфекции для теоретического анализа возможностей снижения вирусной нагрузки путем воздействия на иммунную систему без применения антивирусной терапии. Целью исследования было изучение, во-первых, свойств би-, мультистабильности и гистерезиса на примере содержательной модели ВИЧ-1 инфекции, которая описывает важнейшие блоки процессов взаимодействия вирусов и организма человека, а именно: распространение инфекции в продуктивно и латентно зараженных клетках, появление мутантов и развитие Т-клеточного иммунного ответа, и, во-вторых, возможностей перевода клинической картины заболевания из более тяжелого состояния в более легкое. В данной работе проведен численный анализ условий существования стационарных решений математической модели ВИЧ-1 инфекции для наборов параметров, отвечающих фенотипически различным вариантам течения инфекционного заболевания. Для этого использованы разработанные авторами методы бифуркационного анализа моделей, представляющих собой системы обыкновенных дифференциальных уравнений и дифференциальных уравнений с запаздыванием. В качестве бифуркационного параметра рассматривается константа скорости активации макрофагов. Определены области в пространстве параметров модели, в частности, для скорости активации клеток врожденного иммунитета (макрофагов), при которых имеют место свойства би-, мультистабильности и гистерезиса, и исследованы особенности кинетики перехода между устойчивыми положениями равновесия. В целом результаты бифуркационного анализа модели ВИЧ-1 инфекции формируют теоретическую основу для разработки комбинированных иммунотерапевтических воздействий для лечения ВИЧ-1. Результаты проведенного исследования модели ВИЧ-1 инфекции для параметров процессов, отвечающих разным фенотипам динамики заболевания (типичное, длительно не прогрессирующее и быстро прогрессирующее), указывают на то, что для эффективного функционального лечения больных ВИЧ-инфекцией требуется развитие персонализированного подхода, учитывающего как свойства популяции квазивидов ВИЧ-1, так и иммунный статус пациента.

 
768-775 681
Аннотация

Послеоперационный делирий (ПОД) является серьезным осложнением, приводящим к нарушению когнитивных функций пациентов, увеличению длительности госпитализации, а также повышению расходов на лечение пациента. Проблема ранней диагностики ПОД приобретает особую важность в случае кардиохирургических операций, поскольку частота развития такого осложнения у некоторых категорий пациентов превышает 50 %. Известно, что в развитие ПОД большой вклад вносят нейровоспаление, дисбаланс нейромедиаторов, нарушение нейроэндокринной регуляции и межнейрональных связей, однако молекулярно-генетические механизмы ПОД у пациентов, перенесших кардиохирургические операции, а также метаболомные диагностические маркеры, до сих пор плохо изучены. В данной работе с помощью метода высокоэффективной жидкостной хроматографии с масс-спектрометрической детекцией (ВЭЖХ-МС/МС) был проведен анализ содержания ряда сфингомиелинов в плазме крови пациентов старше 65 лет, взятой после операции на сердце в условиях искусственного кровообращения. Найдено четыре статистически значимо различающихся по содержанию сфингомиелина у пациентов с ПОД по сравнению с пациентами, у которых не развился ПОД (контрольная группа). С помощью реконструкции генных сетей, описывающих генетическую регуляцию пути метаболизма сфинголипидов, определены 82 регуляторных белка, из которых 47 – регуляторы экспрессии генов, кодирующих ферменты метаболического пути, и 35 – регуляторы активности, деградации и транспорта ферментов данного пути. Анализ перепредставленности заболеваний, с которыми ассоциированы эти регуляторные белки, показал, что регуляторы можно разбить на две группы, ассоциированные с сердечно-сосудистыми патологиями и с нервно-психическими заболеваниями соответственно. Регуляторы, ассоциированные с сердечно-сосудистыми патологиями, ожидаемо связаны с воздействием на ткани миокарда во время операции. Сделано предположение, что нарушение функции регуляторов, ассоциированных с нервно-психическими заболеваниями, может специфически обусловливать развитие ПОД после кардиохирургической операции. Таким образом, выявленные регуляторные гены могут представлять основу для планирования дальнейших экспериментов по изучению нарушений на уровне экспрессии данных генов, а также нарушения функции кодируемых ими белков у пациентов с ПОД. Идентифицированные значимые сфинголипиды могут рассматриваться как потенциальные маркеры послеоперационного делирия.

 
776-783 407
Аннотация

В репликации генома вируса гепатита С (ВГС) участвуют как вирусные, так и хозяйские белки. Терапевтические подходы, основанные на подавлении активности неструктурных вирусных белков NS3, NS5A, NS5B, проходят клинические испытания разных уровней. Однако быстрые мутационные процессы вирусного генома и приобретение лекарственной устойчивости остаются одними из главных препятствий в борьбе с ВГС. 

Идентификация и исследование клеточных факторов, участвующих в репликации РНК ВГС, а также регуляция вирусом их экспрессии важны для понимания механизмов репликации вируса и разработки эффективных подходов противовирусной терапии. Известно, что белок PREB, связывающий регуляторный элемент пролактина, и цитозольная фосфолипаза А2 гамма (PLA2G4C) играют важную роль в формировании платформ репликации РНК ВГС, а также в функционировании вирусной репликазы. Экспрессия генов PREB и PLA2G4C значительно увеличена в присутствии ВГС, но механизмы ее регуляции вирусными белками до сих пор не изучены. В данной работе с применением технологии текст-майнинга, реализованной в программно-информационной системе ANDSystem, реконструированы генные сети регуляции экспрессии генов человека PREB и PLA2G4C белками ВГС. На основании анализа генных сетей мы выдвинули гипотезы о регуляторных эффектах белков ВГС на функции хозяйских факторов в результате белок-белковых взаимодействий. Среди вирусных белков наибольшее количество регуляторных связей выявлено у вирусной протеазы NS3. Предположительно NS3 в результате белок-белкового взаимодействия подавляет активность транскрипционного фактора NOTCH1, что обусловливает активацию экспрессии PREB и PLA2G4C. Анализ генных сетей и данных о дифференциальной экспрессии генов в присутствии ВГС позволил нам также выдвинуть гипотезы о регуляции вирусом экспрессии транскрипционных факторов, сайты связывания которых находятся в районах генов PREB и PLA2G4C, и действии этих транскрипционных факторов на регуляцию транскрипции PREB и PLA2G4C. Полученные результаты могут быть использованы при планировании исследований по изучению молекулярно-генетических механизмов взаимодействия вирус–хозяин и поиска потенциальных мишеней для разработки лекарств против ВГС.

 
784-793 513
Аннотация

Гепатоцеллюлярная карцинома (ГЦК) – распространенный тяжелый тип рака печени, характеризующийся крайне агрессивным течением и низкой выживаемостью. Известно, что нарушения регуляции активации апоптоза являются одной из ключевых особенностей, свойственной большинству раковых клеток, что определяет фармакологическую индукцию апоптоза как важную стратегию терапии рака. Компьютерный дизайн химических соединений, способных целевым образом регулировать внешний сигнальный путь индукции апоптоза, представляет перспективный подход для создания новых эффективных средств терапии рака печени и других онкологических заболеваний. Однако в настоящее время большинство исследований посвящено фармакологическим воздействиям на внутренний (митохондриальный) путь апоптоза, тогда как внешний путь, индуцируемый посредством клеточных рецепторов смерти, остается вне поля зрения. Аберрантное метилирование генов наряду с инфекцией вирусом гепатита С считаются важными факторами риска развития ГЦК. Реконструкция генных сетей, описывающих молекулярные механизмы взаимодействия аберрантно метилированных генов с ключевыми участниками внешнего пути апоптоза, а также пути их регуляции белками вируса гепатита С, может дать важную информацию при поиске фармакологических мишеней. В настоящей работе были предложены 13 критериев приоритизации потенциальных фармакологических мишеней для создания лекарств против гепатокарциномы, модулирующих внешний путь апоптоза. В основу критериев легли показатели структурно-функциональной организации реконструированных с использованием ANDSystem генных сетей ГЦК, внешнего пути апоптоза и регуляторных путей взаимодействия «вирус – внешний путь апоптоза» и «аберрантное метилирование генов – внешний путь апоптоза». Список наиболее приоритетных 100 генов-мишеней, ранжированных согласно рейтингу приоритизации, оказался статистически значимо ( p-value = 0.0002) обогащен известными фармакологическими мишенями, одобренными FDA, что указывает на корректность примененного метода приоритизации. Среди перспективных потенциальных фармакологических мишеней могут быть представлены шесть генов-кандидатов (JUN, IL10, STAT3, MYC, TLR4 и KHDRBS1), занимающих высокое положение в ранжированном списке согласно результатам приоритизации. 

 
794-806 504
Аннотация

Животные модели, используемые в биомедицинских исследованиях, в настоящее время охватывают практически весь известный спектр заболеваний человека. База знаний RatDEGdb по дифференциально экспрессирующимся генам (ДЭГ) крысы как модельного объекта в биомедицинских исследованиях представляет собой коллекцию опубликованных данных по экспрессии генов у крыс разных линий, предназначенных для изучения артериальной гипертонии, болезней пожилого возраста, психопатологических состояний и других заболеваний человека. Текущий выпуск RatDEGdb содержит 25 101 ДЭГ, представляющих 14 320 уникальных генов крысы, которые изменяют уровень транскрипции в 21 ткани 10 генетических линий крысы в качестве моделей 11 заболеваний человека согласно 45 оригинальным научным статьям. Новшество RatDEGdb по сравнению с другими биомедицинскими базами данных заключается в курируемой аннотации отклонений ДЭГ крысы как модельного объекта с использованием независимых клинических данных об однонаправленных изменениях экспрессии гомологичных генов, выявленных у людей при различных патологиях. Собранные ДЭГ крыс были аннотированы однонаправленными изменениями экспрессии гомологичных им генов человека у больных людей относительно здоровых. К настоящему времени выпуск RatDEGdb содержит 94 873 такие аннотации для 321 гена человека при 836 заболеваниях согласно 959 оригинальным научным статьям, найденным в текущем выпуске базы данных PubMed. Представленная база знаний может быть интересна в первую очередь специалистам по генетике человека, молекулярным биологам, клиницистам и генетическим консультантам, а также специалистам в области биофармацевтики, биоинформатики и персонализированной геномики. RatDEGdb является общедоступной  (https://www.sysbio.ru/RatDEGdb).

СТРУКТУРНАЯ КОМПЬЮТЕРНАЯ БИОЛОГИЯ И ФАРМАКОЛОГИЯ

 
807­-814 399
Аннотация

На сегодняшний день разработан широкий спектр производных и аналогов нуклеиновых кислот. Некоторые из них нашли применение при решении научно-­исследовательских задач и задач биомедицины. Детальная информация о свойствах таких соединений является основой их эффективного использования. Одну из наиболее значимых физико-­химических характеристик олигонуклеотидов – термодинамическую стабильность их дуплексов с ДНК и РНК – можно рассчитывать лишь для некоторых производных нуклеиновых кислот: LNA, мостиковых олигонуклеотидов и PNA. Существующие подходы основаны на анализе экспериментальных данных и построении прогностических моделей. Проводятся пилотные исследования, направленные на разработку методов прогнозирования свойств нуклеиновых кислот с использованием методов компьютерного моделирования, основанные только на знании структуры олигомеров. В данной работе исследована применимость метода взвешенных гистограмм (WHAM) при анализе зонтичной выборки для расчета термодинамических параметров формирования ДНК­дуплексов: изменения энтальпии ∆H°, энтропии ∆S° и свободной энергии Гиббса          ∆G37° . Отработана процедура расчета гибридизационных свойств олигодезоксирибонуклеотидов с использованием метода взвешенных гистограмм. Подобраны оптимальные параметры проведения моделирования и расчета термодинамических параметров. На примере представительной выборки из 21 олигонуклеотида длиной от 4 до 16 нт и долей G/C пар от 14 до 100 % показана возможность расчета ∆H°, ∆S° и ∆G         37° . Ошибки расчета термодинамических параметров составляют 11.4, 12.9 и 11.8 % соответственно, а температура плавления прогнозируется со средней ошибкой 5.5 °С. Такая высокая точность расчетов сопоставима с экспериментальной и с другими прогностическими методами расчета энергии комплексообразования. В настоящей работе впервые систематически исследовано применение метода WHAM для расчета энергии формирования ДНК­дуплексов. Полученные результаты показывают потенциальную возможность достоверного расчета гибридизационных свойств новых, в том числе еще не синтезированных производных нуклеиновых кислот. Это открывает новые горизонты для рационального дизайна конструкций на основе нуклеиновых кислот для решения задач биомедицины и биотехнологии.

ЭВОЛЮЦИОННАЯ КОМПЬЮТЕРНАЯ БИОЛОГИЯ

 
815­-819 718
Аннотация

Рак – сложное и гетерогенное заболевание, характеризующееся накоплением генетических изменений, которые приводят к неконтролируемому росту и пролиферации клеток. Эволюционная динамика играет решающую роль в возникновении и развитии раковых опухолей, формируя гетерогенность и адаптивность раковых клеток. С точки зрения теории эволюции опухоли представляют собой сложные экосистемы, которые развиваются в процессе микроэволюции под воздействием генетических мутаций, эпигенетических изменений и факторов микроокружения опухолей. Такая динамичная природа опухолей создает значительные проблемы для эффективного лечения рака, и ее понимание необходимо для разработки эффективных и персонализированных методов лечения. Раскрывая механизмы, определяющие гетерогенность опухоли, исследователи могут выявить ключевые генетические и эпигенетические изменения, которые способствуют прогрессированию опухоли и устойчивости к лечению. Эти знания позволяют разрабатывать инновационные стратегии воздействия на конкретные клоны опухоли, минимизируя риск рецидива и улучшая результаты лечения пациентов. Для изучения эволюционной динамики рака ученые используют широкий спектр экспериментальных и вычислительных подходов. Традиционные экспериментальные методы включают в себя геномное профилирование, такое как секвенирование нового поколения и флуоресцентная гибридизация in situ, и позволяют выявлять соматические мутации, изменения числа копий генов и структурные перестройки в геномах раковых опухолей. Помимо того, методы одноклеточного секвенирования стали мощным инструментом для изучения внутриопухолевой гетерогенности и отслеживания клональной эволюции. На основании экспериментальных данных разрабатываются вычислительные модели и алгоритмы для моделирования и анализа эволюции рака. Эти модели объединяют данные из различных источников для предсказания закономерностей роста опухоли, выявления драйверных мутаций и построения эволюционных деревьев развития раковых клеток. В настоящей работе мы поставили задачу описать существующие на сегодняшний день подходы к изучению эволюционной динамики развития рака и теории ее возникновения.

 

 
820­-828 502
Аннотация

В настоящее время активно исследуются механизмы, регулирующие развитие различных патологий и их эволюционную динамику. Эпигенетические механизмы, такие как метилирование, играют значимую роль в эволюционных процессах, поскольку их изменения гораздо быстрее отражаются на фенотипе, чем результаты мутагенеза. В данном исследовании мы предприняли попытку разработать алгоритм для выявления дифференциально метилированных областей, связанных с метаболическим синдромом, которые изменили свое метилирование у человека при переходе от охоты и собирательства к оседлой жизни. Применение существующих методов полногеномного бисульфитного секвенирования ограничено для древних образцов из­за их низкого качества и фрагментации, и подход к получению профилей метилирования охотников­собирателей значительно отличается от подходов, используемых для современных тканей. В этой работе мы валидировали DamMet – алгоритм, реконструирующий древние метиломы. Применение DamMet к геномам неандертальца и денисовца показало средний уровень корреляции с профилями метилирования, опубликованными ранее, а также продемонстрировало занижение уровня метилирования реконструированных профилей в среднем на 15–20 %. Также мы разработали новый алгоритм на языке Python, позволяющий сравнивать метиломы в древних и современных образцах, не смотря на отсутствие профилей метилирования современных образцов костной ткани в контексте ожирения. Такой анализ подразумевает двухступенчатую обработку данных, где на первом этапе происходит идентификация тканеспецифичных областей метилирования и их фильтрация, а на втором этапе осуществляется непосредственно поиск дифференциально метилированных регионов в заданных областях, ассоциированных с интересую щим исследователя заболеванием. В результате использования алгоритма на тестовых данных мы обнаружили 38 дифференциально метилированных регионов, ассоциированных с ожирением, большая часть которых принадлежала промоторным областям, и разработанный пайплайн показал достаточную эффективность в их поиске. Эти результаты подтверждают возможность восстановления профилей метилирования в древних образцах и их сравнения с современными метиломами. Также обсуждаются возможности дальнейшего развития методологии и внедрения нового шага, позволяющего изучать дифференциально метилированные позиции, связанные с эволюционными процессами. 

 
829-838 530
Аннотация

Гены рецепторов клеточной поверхности составляют существенную долю генома человека (более тысячи генов) и выполняют важную роль в генных сетях. Рецепторы клеточной поверхности – это трансмембранные белки, которые взаимодействуют с различными молекулами (лигандами), находящимися во внеклеточном пространстве, что приводит к активации путей сигнальной трансдукции в клетке. Для рецепторов клеточной поверхности известно большое количество экзогенных лигандов различного происхождения, включая лекарственные препараты, что и определяет интерес к их исследованию с точки зрения биомедицины. Аппетит (стремление животного организма потреблять пищу) – один из самых примитивных инстинктов, способствующих выживанию. Однако приобретенный в ходе эволюции механизм приспособления к неблагоприятным факторам в условиях стабильного поступления питательных веществ оказался избыточным, в связи с чем ожирение стало одной из самых серьезных проблем общественного здравоохранения в XXI веке. Патологические состояния человека, характеризующиеся нарушениями аппетита, включают как гиперфагию, неминуемо приводящую к ожирению, так и нервную анорексию, индуцированную психосоциальными стимулами, и снижение аппетита, связанное с воспалительными, нейродегенеративными и онкологическими заболеваниями. Понимание эволюционных механизмов развития болезней человека, особенно связанных с изменениями образа жизни, произошедшими в течение последних 100–200 лет, имеет как фундаментальное, так и прикладное значение. Особенно важно установить взаимосвязи между эволюционными характеристиками генов в генных сетях и устойчивостью этих сетей к изменениям, вызванным мутациями. Цель данной работы – выявление особенностей эволюции генов рецепторов клеточной поверхности человека, участвующих в регуляции аппетита, с использованием филостратиграфического индекса PAI (phylostratigraphic age index) и индекса эволюционной изменчивости DI (divergence index). Были проанализированы индексы PAI и DI для 64 генов человека, кодирующих рецепторы клеточной поверхности, ортологи которых участвовали в регуляции аппетита у модельных видов животных. Оказалось, что в рассматриваемом наборе генов содержится повышенное количество генов, имеющих одинаковый филостратиграфический возраст (PAI = 5, этап дивергенции позвоночных), и почти все эти гены (28 из 31) относятся к суперсемейству рецепторов, сопряженных с G-белком. По-видимому, синхронизированное эволюционирование такой многочисленной группы генов (31 из 64 генов) связано с формированием у первых позвоночных мозга как отдельного органа. При исследовании распределения генов из этого же набора по значениям индексов DI была выявлена существенная обогащенность генами с низким DI. При этом восемь генов (GPR26, NPY1R, GHSR, ADIPOR1, DRD1, NPY2R, GPR171, NPBWR1) характеризовались экстремально низким значением DI (менее 0.05), что указывает на существенную их подверженность стабилизирующему отбору. Обнаружено также, что группа генов с низким DI обогащена генами, тканеспецифически экспрессирующимися в мозге. В частности, к группе генов, тканеспецифически экспрессирующихся в мозге, относится GPR26, имеющий самое низкое значение DI. Ввиду того, что эндогенный лиганд для рецептора GPR26 пока не выявлен, этот ген представляется чрезвычайно интересным объектом для дальнейшего теоретического и экспериментального исследования. Выявленные нами особенности распределения генов рецепторов клеточной поверхности по эволюционным индексам PAI и DI являются отправной точкой для дальнейшего анализа эволюционных характеристик генной сети регуляции аппетита в целом.

 
839-850 368
Аннотация

Пандемия коронавирусной инфекции, вызванная вирусом SARS-CoV-2, которой человечество противостояло с использованием новейших достижений науки, оставила после себя в том числе обширные генетические данные. Ежедневно начиная с конца 2019 г. в мире собирались образцы геномов вируса, что предоставляет возможность детально проследить его эволюцию с момента возникновения до настоящего времени. Накопленная статистика результатов экспресс-тестирования показала, что число подтвержденных случаев заражения SARS-CoV-2 составило не менее 767.5 млн (9.5 % нынешнего населения Земли без учета бессимптомников), а число секвенированных геномов вируса – более 15.7 млн (что составляет чуть более 2 % от общего числа заразившихся). Эти новые данные потенциально несут в себе информацию о механизмах изменчивости и распространения вируса, его взаимодействия с иммунной системой человека, об основных параметрах, характеризующих механизмы развития пандемии, и многое другое. В этой статье мы анализируем пространство возможных вариантов генетических последовательностей SARS-CoV-2 как с математической точки зрения, так и с учетом биологических ограничений, присущих этой системе (основанных на общебиологических знаниях и учитывающих особенности данного конкретного вируса). Для этого мы разработали программное обеспечение, способное загружать и анализировать нуклеотидные последовательности SARSCoV-2 в формате FASTA, определять позиции 5’ и 3’ UTR, число и расположение неидентифицированных нуклеотидов (“N”), осуществлять выравнивание относительно референсной последовательности посредством вызова предназначенных для этого программ, определять мутации, делеции и вставки, а также рассчитывать различные характеристики геномов вирусов с заданным шагом по времени (дни, недели, месяцы и т. д.). Полученные данные свидетельствуют о том, что, несмотря на кажущееся математическое многообразие возможных вариантов изменения вируса во времени, коридор эволюционной траектории, которым прошел коронавирус, представляется достаточно узким. Это дает основание полагать, что он в некоторой степени детерминирован, что позволяет надеяться на возможность моделирования эволюции коронавируса.

МЕТОДЫ ГЛУБОКОГО МАШИННОГО ОБУЧЕНИЯ ДЛЯ БИОИНФОРМАТИКИ И СИСТЕМНОЙ БИОЛОГИИ

 
851-858 387
Аннотация

В настоящее время разработка объективных методик для оценки уровня стресса является чрезвычайно актуальной задачей прикладной нейронауки. Анализ электроэнцефалограммы (ЭЭГ), записанной в условиях выполнения заданий на самоконтроль поведения, может служить основой для разработки тестовых методик, позволяющих классифицировать людей по уровню стресса. Хорошо известно, что одним из следствий медитационной практики является выработка у участников навыков произвольного контроля над собственным ментальным состоянием за счет повышенной концентрации внимания на самом себе. На фоне медитационной практики часто происходит снижение общего уровня тревожности и стресса. Целью нашего исследования было разработать, обучить и протестировать сверточную нейронную сеть, способную классифицировать людей на группы участвующих или не участвующих в медитационной практике на основе анализа вызванных потенциалов головного мозга, записанных при выполнении заданий парадигмы стоп-сигнал. Были разработаны четыре архитектуры неглубоких сверточных сетей, которые были обучены и протестированы на выборке из 100 человек (51 медитатор и 49 не-медитатор). В дальнейшем все структуры были дополнительно протестированы на независимой выборке в 25 человек. Установлено, что структура, использующая одномерный сверточный слой, который объединяет слой и двуслойную полностью подключенную сеть, показала наилучшие результаты работы в имитационных тестах. Однако эта модель была часто подвержена переобучению из-за ограничения размера отображения набора данных. Явление переобучения было смягчено при помощи изменения структуры и масштаба модели, параметров сети инициализации, регуляризации, случайной деактивации (dropout) и гиперпараметров скрининга перекрестной проверки. В итоге нами получена модель, которая показала 82 % точность в классификации людей на подгруппы. Можно ожидать, что использование таких моделей окажется эффективным методом для оценки уровня стресса и предрасположенности к тревожным и депрессивным расстройствам в других группах испытуемых.

 
859-868 429
Аннотация

Пигментный состав оболочек семян растений влияет на такие важные их свойства, как устойчивость к действию патогенов, прорастание на корню, а также механическая прочность. У ячменя (Hordeum vulgare L.) темная окраска зерен может быть обусловлена синтезом и накоплением двух групп пигментов. Голубая и фиолетовая окраска зерна связана с синтезом антоцианов. Серую и черную окраску придают пигменты меланины. Данные пигменты могут накапливаться в оболочках зерна независимо либо совместно, поэтому визуально определить, накопление каких именно пигментов придает темный цвет зерна, затруднительно. Для точного определения наличия/отсутствия пигментов используются химические и генетические методы, которые дороги и трудоемки. Поэтому создание нового метода для быстрой оценки наличия определенных пигментов в зерновке является актуальной задачей, решение которой поможет при исследовании механизмов генетического контроля пигментного состава зерна. Настоящая работа посвящена разработке метода оценки пигментного состава зерен ячменя на основе анализа цифровых изображений с помощью алгоритмов компьютерного зрения и машинного обучения. Разработан протокол съемки для получения двумерных цифровых цветных изображений зерен. С использованием данного протокола получено 972 изображения для 108 образцов ячменя. Каждый образец мог содержать пигменты антоцианы и/или меланины. Для точного определения содержания пигментного состава образцов применялись химические методы. Для предсказания пигментного состава зерна на основе изображений было разработано четыре модели, основанных на методах компьютерного зрения и сверточных нейронных сетях различной архитектуры. Лучшую производительность на отложенной выборке показала модель сети U-Net, основанная на топологии EfficientNetB0 (значение параметра «точность» составило 0.821).

ЭКОЛОГИЧЕСКАЯ КОМПЬЮТЕРНАЯ БИОЛОГИЯ

 
869-877 515
Аннотация

В начале статьи обсуждается уровень необходимой феноменологичности сложных моделей. При работе со сложными системами, к которым, безусловно, относятся живые организмы и экологические системы, с необходимостью приходится использовать феноменологическое описание. Приведена иллюстрация феноменологического подхода, который ухватывает наиболее существенные даже не закономерности, а общие принципы или паттерны взаимодействий, причем конкретные значения параметров не могут быть вычислены из первых принципов, а определяются эмпирически. Также эмпирически и прагматически выбирается соответствующая интерпретация. Однако для моделирования более широкого круга ситуаций возникает необходимость понижать уровень феноменологии, переходить на более детальное описание системы, вводя взаимодействие между выделенными элементами системы. Формулируются требования к модели системы, совмещающей экологический, метаболический и генетический уровни описания клеточной культуры. Разработана математическая модель динамики кворум-эффекта в процессе роста накопительной культуры люминесцентных бактерий при разных концентрациях питательного субстрата. Модель содержит четыре блока, описывающие экологический, энергетический, кворумный и люминесцентный аспекты развития культуры. Модель продемонстрировала хорошее соответствие экспериментальным данным, полученным в ходе выполнения работы. При анализе модели отмечены три странности в поведении культуры, которые, предположительно, могут изменить представление о некоторых процессах, имеющих место при развитии культуры люминесцентных бактерий. Полученные результаты позволяют предположить наличие некоторой дополнительной системы контроля люминесцентной реакции через пути синтеза ФМН · Н2 или алифатического альдегида. В этом случае обобщенное описание вклада энергетического метаболизма в люминесценцию только через АТФ является слишком сильным упрощением. В результате анализа результатов сопоставления модельной динамики с экспериментом возникло расхождение между измеряемой в эксперименте концентрацией субстрата (пептона) и его эффективным действием на рост популяции бактерий. Это расхождение, по-видимому, указывает на то, что пептон не является ведущим субстратом и рост лимитируют биогены, содержащиеся в дрожжевом экстракте, концентрация которого в этих экспериментах не изменялась. Отмеченные расхождения между ожиданиями и результатами обработки экспериментальных данных вместе с предположениями о причинах этих расхождений задают направление дальнейших экспериментальных и теоретических исследований механизмов кворум-эффекта в культуре люминесцентных бактерий. 

 
878-883 271
Аннотация

Целью исследования было сравнить методы количественного анализа, применявшиеся на ранних этапах создания прототипов замкнутых систем, с современными подходами анализа данных. В качестве примера рассмотрена математическая модель устойчивого сосуществования двух микроводорослей в смешанной проточной культуре, предложенная Болсуновским и Дегерменджи в 1982 г. Модель построена на основе детального теоретического описания взаимодействия видов и субстрата (в данном случае освещенности). Возможность управления соотношением видов позволяет регулировать ассимиляционный коэффициент (AQ), т. е. отношение поглощенного углекислого газа к выделенному кислороду. Задача управления ассимиляционным коэффициентом системы жизнеобеспечения до сих пор актуальна, микроводоросли рассматриваются как перспективные генераторы кислорода и в современных работах. При этом акцент в них сделан на эмпирических методах моделирования, в частности на анализе больших данных; также работы не выходят за пределы задачи управления монокультурой микроводорослей. В настоящем исследовании мы обращаем внимание на три результата, по нашему мнению, удачно дополняющих современные методы. Во-первых, модель позволяет использовать результаты экспериментов с монокультурами, во-вторых, предсказывает преобразование данных к виду, удобному для дальнейшего анализа, в том числе для вычисления AQ. В-третьих, модель позволяет гарантировать устойчивость полученного приближения и в дальнейшем искать решение как малую поправку эмпирическими методами.

 
884-889 200
Аннотация

Свет, испускаемый люминесцентными бактериями, может служить уникальным природным каналом передачи информации о процессах внутри отдельной клетки. При наличии высокочувствительного оборудования можно получить распределение клеток бактериальной культуры по интенсивности свечения, которая коррелирует с количеством люциферазы в клетках. При выращивании на богатых питательных средах интенсивность свечения отдельных клеток ярко светящихся штаммов люминесцентных бактерий Photobacterium leiogna thi и Ph. phosporeum достигает 104–105 квантов/с. Сигнал такой интенсивности может быть зарегистрирован с помощью чувствительного фотометрического оборудования. Все эксперименты проводились с бактериальными клонами – генетически однородными популяциями. Получена типичная динамика распределения светящихся бактериальных клеток по интенсивности свечения на различных стадиях периодического выращивания культуры в жидкой среде. Для описания экспериментальных распределений была построена феноменологическая модель, которая связывает излучение бактериальной клетки с историей событий на молекулярном уровне. Предложенная феноменологическая модель с минимальным числом подстроечных параметров (1.5) обеспечивает удовлетворительное описание сложного процесса формирования распределения клеток по интенсивности свечения на разных стадиях роста бактериальной культуры. Это может свидетельствовать о том, что структура модели описывает некоторые существенные процессы реальной системы. Поскольку в процессе деления все клетки проходят стадию отсоединения всех регуляторных молекул от молекулы ДНК, результирующие распределения можно отнести не только к люциферазе, но и к другим белкам конститутивного (и не только) синтеза. 

КОМПЬЮТЕРНАЯ БИОЛОГИЯ РАСТЕНИЙ

 
890-897 353
Аннотация

Для изучения механизмов роста и развития необходимо анализировать динамику распределения регуляторов по ткани во времени и пространстве и учитывать их влияние на клеточную динамику внутри ткани. Растительные гормоны являются основными регуляторами динамики клеток в тканях растений; они образуют градиенты и максимумы и контролируют молекулярные процессы в зависимости от концентрации. Мы представляем DyCeModel, программный инструмент, реализованный в среде MATLAB для одномерного моделирования ткани с динамическим клеточным ансамблем, где изменения концентрации гормона (или другого активного вещества) в клетках описываются обыкновенными дифференциальными уравнениями. Мы применили DyCeModel для моделирования динамики клеток в меристемах растений с различной клеточной структурой и продемонстрировали, что DyCeModel помогает выявить взаимосвязь между концентрацией гормонов и поведением клеток. Инструмент визуализирует ход моделирования и предоставляет видео, полученное в ходе расчета. Важно отметить, что инструмент способен автоматически подбирать параметры, подгоняя распределение концентраций веществ, предсказанное в модели, к экспериментальным данным, полученным по изображениям с микроскопа. Примечательно, что DyCeModel позволяет строить модели для различных типов меристем растений на основе одних и тех же обыкновенных дифференциальных уравнений, используя для каждой меристемы специфические входные характеристики. Эффективность инструмента продемонстрирована путем моделирования влияния распределения ауксина и цитокинина на формирование паттерна ткани в двух типах ниш стволовых клеток Arabidopsis thaliana: апикальных меристемах корня и побега. Полученные модели представляют собой перспективный фреймворк для дальнейшего изучения роли контролируемых гормонами генных регуляторных сетей в динамике клеток.

ТЕХНИЧЕСКАЯ БИОИНФОРМАТИКА

 
898-­905 319
Аннотация

Современная исследовательская работа в биологии нередко требует усилий одной или нескольких групп исследователей. Часто это группы специалистов из смежных областей, которые генерируют и обмениваются данными разных форматов и размеров. Без применения современных подходов автоматизации работы и версионирования данных (когда данные от разных сотрудников сохраняются в разные моменты времени) коллективная работа быстро переходит в неуправляемый хаос. В настоящем обзоре приведен ряд информационных систем, предназначенных для решения озвученных задач. Их применение для организации научной деятельности позволяет управлять потоком действий и данных, добиваясь работы всех участников с актуальной информацией, и решением вопроса воспроизводимости как экспериментальных, так и вычислительных результатов. Описаны методики по организации потоков данных в рамках работы коллектива, принципы по организации метаданных и онтологий. Рассмотрены информационные системы Trello, Git, Redmine, SEEK, OpenBIS и Galaxy. Описана их функциональность и сфера использования. Выбирая те или иные инструменты, важно понимать цель внедрения, определить набор задач, которые они должны решать, и исходя из этого формулировать требования и отслеживать применение рекомендаций на местах. 

Задачи по созданию структуры онтологий, метаданных, схем хранения данных и программных систем являются ключевыми для коллектива, который решился на проведение работ по автоматизации оборота данных. Не всегда возможно внедрить такие системы целиком, но все же следует стремиться к этому через поэтапное внедрение принципов по организации данных и задач с освоением отдельных программных инструментов. Следует отметить, что системы Trello, Git и Redmine проще в использовании, настройке и поддержке для малых исследовательских групп. В то же время SEEK, OpenBIS и Galaxy более специфичные, их применение целесообразно в случае, если возможностей простых систем уже недостаточно.

МОЛЕКУЛЯРНАЯ И КЛЕТОЧНАЯ БИОЛОГИЯ

 
906-915 474
Аннотация

Культивируемые клетки яичника китайского хомячка (CHO) наиболее часто используются для синтеза рекомбинантных белков в биофармацевтическом производстве. При получении стабильных клеточных линий-продуцентов локус интеграции трансгена в геном оказывает большое влияние на уровень его экспрессии (явление, известное как эффект положения гена). Соответственно, поиск локусов генома, обеспечивающих высокий уровень продукции белков, является актуальной практической задачей. В данной работе мы использовали метод TRIP для исследования влияния локального окружения хроматина на активность трансгенов, встроенных в разные локусы генома культивируемых клеток CHO. С этой целью репортерные конструкции, кодирующие белок eGFP под контролем четырех разных промоторов, были стабильно встроены в геном клеток CHO при помощи транспозона piggyBac. При этом каждый отдельный трансген содержал уникальную метку – ДНК-штрихкод. Полученная трансгенная поликлональная популяция клеток была культивирована в течение месяца без какой-либо селекции. Далее при помощи присутствующих в конструкциях штрихкодов и высокопроизводительного секвенирования были определены сайты локализации трансгенов в геноме, измерена их представленность в популяции, а также транскрипционная активность. Всего удалось полностью охарактеризовать около 640 трансгенов, более-менее равномерно распределенных по всем хромосомам клеток CHO. Более половины трансгенов оказались полностью молчащими. Наиболее активные трансгены выявлены в окрестностях геномных сайтов инициации транскрипции – в промоторных и 5’-некодирующих районах генов. Наибольшей активностью обладали трансгены, несущие полноразмерный промотор гена EF-1α китайского хомячка. Трансгены с укороченным вариантом этого же промотора, а также трансгены с промотором мышиного гена PGK (mPGK) были соответственно в среднем в 10 и 19 раз менее активны. В целом в результате данной работы выявлены сочетания локусов генома культивируемых клеток CHO и промоторных элементов, которые обеспечивают разные уровни транскрипционной активности модельной репортерной конструкции.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2500-3259 (Online)