ГЕНЕТИКА НАСЕКОМЫХ
Статьи
Цель работы – разработка, валидация и применение подходов приоритетного скрининга точковых полиморфизмов в эксперименте полногеномного аллелотипирования 16 когорт человека, составленных из больных и здоровых индивидов, по схеме «случай –контроль» на основе пулированных выборок. Генотипирование произведено на платформе Illumina Omni1S, имеющей 1,2 млн маркеров на планшете, выборки в среднем составили 200 человек. При сравнении частот аллелей между когортами патологических и контрольных выборок выявляли наборы полиморфизмов, достоверно отличающиеся друг от друга по частоте. Установлено, что выборки больных индивидов показывают систематические, устойчивые отклонения от здоровых по числу достоверно отличающихся полиморфизмов, дисперсия интенсивности аллелей между повторами одной когорты меньше таковой при случайном выборе пар разных когорт.
В клинической практике часто используют показатели липидного обмена. К его нарушениям (дислипидемии) относят повышение уровня общего холестерина (ОХС), триглицеридов (ТГ), а также изменение ряда других показателей, являющихся результатом нарушения синтеза, транспорта и расщепления липопротеинов. Клиническая значимость метаболических нарушений, объединенных рамками дислипидемии, ассоциируется, в первую очередь, с высоким риском развития сердечно-сосудистых заболеваний, сахарного диабета второго типа и ожирения. Исследована связь SNP следующих генов: G-2548A в промоторной области гена лептина (LEP), A223G в 4-м экзоне гена рецептора лептина (LEPR), Т495G в 8-м интроне гена липопротеинлипазы (LPL), C34G в 8-м экзоне гена ядерного рецептора (PPARG), с нарушениями липидного обмена, и показан их кумулятивный эффект в развитии дислипидемии.
С целью систематизации информации о генах, участвующих в регуляции массы тела и пищевого поведения, была сформирована компиляция, включающая 424 гена, полученных (а) по данным из экспериментальных и обзорных статей, (б) из базы OMIM, (в) по данным мета-анализа экспериментов по полногеномному поиску ассоциаций. Четыре гена из компиляции (BDNF, MC4R, PCSK1, POMC) подтверждены всеми тремя источниками данных и рассматриваются как наиболее значимые в системе регуляции массы тела (приоритет 1). Выявлены группы, включающие 3 и 29 генов, подтвержденных двумя из трех источников данных (приоритет 2). Идентифицированы метаболические и сигнальные пути, участвующие в регуляции массы тела, которые можно считать потенциальными мишенями для фармакологических воздействий. Обнаружены районы хромосом человека, содержащие близкорасположенные гены из компиляции, содержащие в числе других гены, внесенные в компиляцию только по данным мета-анализа экспериментов по полногеномному поиску ассоциаций (ETV5, MIR148A, NFE2L3, TMEM160), что может помочь интерпретировать функции этих генов. К числу двенадцати генов из компиляции, наименее толерантных к мутациям, отнесены гены LRP1, LRP5, RAI1, FASN, LYST, RPTOR, DGKD, LRP1B, NCOA1, ADCY3.Компиляция может быть полезна как источник информации о генах-кандидатах, значимых для оценки риска развития ожирения и разработки фармакологических подходов к коррекции избыточной массы тела.
Развитие in vitro технологий привело к появлению новых экспериментальных данных о связывании белков с ДНК, которые накапливаются в базах данных и используются при исследовании механизмов регуляции экспрессии генов и разработке компьютерных методов распознавания сайтов связывания в геномах про- и эукариот. Однако пока не ясно, насколько in vitro селектированные последовательности отражают истинную структуру природных сайтов связывания транскрипционных факторов (ТФ). С использованием Кульбака–Лейблера критерия расстояний проведено сравнение сходства частотных матриц сайтов связывания ТФ, построенных на основе выборок искусственно селектированных последовательностей и природных сайтов. Показано, что для 80 % ТФ (из числа исследованных) наблюдается высокое сходство коровых последовательностей природных и искусственных сайтов. Для 20 % ТФ их in vitro селектированные последовательности имеют в коровой структуре сайта более широкий спектр допустимых значимых нуклеотидов, не встречающихся среди природных сайтов. Методом весовых матриц проведена оценка оптимальной длины последовательностей ДНК, включающих природные сайты связывания, при которой удается достичь максимальной точности их распознавания. Обнаружено, что примерно для 80 % ТФ (из исследованных) оптимальная для распознавания длина сайта связывания значительно превышает длину коровой последовательности и длину in vitro селектированных сайтов. Выявленные особенности in vitro селектированных сайтов связывания ТФ накладывают определенные ограничения на их использование при разработке компьютерных методов распознавания потенциальных сайтов в геномных последовательностях.
У растений этилен участвует как в регуляции процессов развития, так и в ответе на стрессовые воздействия. Сигнал с рецепторов этилена активирует гены одного из самых больших семейств транскрипционных факторов, APETALA2/ETHYLENE RESPONSE FACTORs (ERFs). Сайты связывания ERF транскрипционных факторов содержат специфический GCCGCC-мотив и называются GCC-боксами. В настоящей работе две компьютерные программы для предсказания сайтов связывания транскрипционных факторов (oPWM и SiteGA) применены для анализа последовательностей экспериментально подтвержденных GCC-боксов. Распознаны GCC-боксы и исследовано их распределение в геноме Arabidopsis thaliana L. Проведены функциональная аннотация распознанных GCC-боксов и анализ их роли в ответе на фитогормон этилен.
В связи с появлением и активным использованием ДНК-микрочипов при решении различных задач в медицине, биоинформатике и молекулярной биологии усилилась потребность в алгоритмах Data Mining, способных обрабатывать задачи, в которых число анализируемых объектов на порядки меньше числа описывающих признаков. Однако большинство из существующих ныне алгоритмов изначально не предназначено для решения подобных сложных, плохо обусловленных задач. Нами разработан подход, основанный на идее конкурентного сходства, который позволяет разрабатывать алгоритмы, лучше приспособленные для этих целей. Одним из таких алгоритмов является предложенный нами алгоритм FRiS-GRAD, который одновременно решает задачу распознавания и задачу выбора системы информативных признаков. Эффективность его работы проиллюстрирована на различных медицинских задачах в сравнении с наиболее популярными алгоритмами выбора информативных признаков и распознавания.
Многие современные исследования изучают важную характеристику гена – эффективность его экспрессии. Как известно, она определяется на уровнях транскрипции, трансляции, посттрансляционной модификации и др. В работе представлена программа EloE (Elongation Efficiency), сортирующая гены организма в порядке уменьшения их предполагаемой скорости элонгации трансляции на основе анализа их нуклеотидных последовательностей. Полученные теоретические данные достоверно коррелируют с доступными экспериментальными данными по экспрессии генов различных организмов, например S. cerevisiae и H. pylori. Также программа выявляет предпочтительные кодоны в геноме организма и строит распределение стабильности потенциальных вторичных структур в районах 5´- и 3´-концов мРНК. Программа может быть использована для предварительной оценки уровня экспрессии генов исследуемого организма, экспериментальные данные для которого еще не доступны. Результаты работы EloE могут быть переданы в сторонние программные инструменты, которые моделируют искусственные генетические конструкции для генно-инженерных экспериментов.
Сравнивали транскрипционную активность генов в почках гипертензивных крыс НИСАГ и нормотензивных крыс WAG для определения генов-кандидатов стресс-зависимой артериальной гипертензии, которые достоверно экспрессируются в почках только одной из двух сравниваемых линий. Анализ экспрессии генов проведен на микрочипах Illumina (USA). При анализе транскрипционной активности генов в корковом веществе почек выявлено три гена (Klk1, Klk1c10 и Kng1), имеющих отношение к функционированию калликреин-кининовой системы. Все три гена достоверно экспрессировались в почках нормотензивных крыс, в почках гипертензивных крыс их экспрессия не детектировалась. Снижение уровня экспрессии этих генов и гена Gucy1a3 у гипертензивных крыс позволяет предполагать ослабление функции калликреин-кининовой системы у крыс НИСАГ, что может нарушать гемоциркуляцию в почечных тельцах и способствовать развитию гипертензии. В мозговом веществе почек функциональная аннотация генов, достоверно экспрессирующихся только у одной из двух сравниваемых линий, показала различия в экспрессии генов регуляции иммунного ответа.
Одной из причин гибели нейронов головного и спинного мозга при заболевании боковым амиотрофическим склерозом является образование внутриклеточных белковых агрегатов, вызванных мутациями в гене SOD1. Ранее показано, что продолжительность жизни пациентов отрицательно коррелирует с термостабильностью мутантных форм белка SOD1, носителями которых они были. В настоящей работе сделано предположение, что усиливать агрегацию мутантов SOD1 может не только дестабилизация структуры белка за счет разрушения водородных связей, но также возникновение новых водородных связей, стабилизирующих патогенную конформацию мутанта. Методом молекулярной динамики оценено время существования водородных связей в белке. Установлено, что корреляция этой оценки с продолжительностью жизни пациентов (R = 0,89, p < 0,00001) оказалась существенно сильнее корреляции, полученной ранее на основе анализа термостабильности мутантов.
В работе представлены результаты реконструкции и анализа генной сети циркадных часов млекопитающих. Применение методов теории графов позволило провести анализ структуры генной сети и выделить центральную компоненту регуляции циркадного ритма, которая включает базовые регуляторные контуры, проходящие через ключевой элемент циркадных часов –белок Clock/Bmal1. Использование кластерного анализа позволило выявить подсистемы, имеющие четкую биологическую интерпретацию и участвующие в функционировании циркадных часов путем взаимодействия с центральной компонентой. Такая структурная модель, включающая центральную компоненту и взаимодействующие с ней функциональные подсистемы, может быть основой для построения математической модели динамики генной сети регуляции циркадного ритма.
Из-за разнообразия взаимодействий сообщества живой материи, от бактериальных колоний до человеческих сообществ, имманентно более сложны, нежели ансамбли частиц в неживой природе. Одним из проявлений внутри- и межгрупповых взаимодействий в социуме являются сети соавторства научных публикаций. В нашей работе рассмотрена такая сеть для новосибирского научного сообщества в области биологии и медицины. Используя базу данных PubMed, мы построили сеть и рассчитали ее статистические характеристики. Распределение организаций по научной активности оказывается распределением с толстым хвостом и подчиняется так называемому закону Парето: 83 % публикаций и 75 % авторов принадлежат примерно 20 % самых активным организациям. Сравнение сетей последних показывает, что сети вузов обладают более выраженным ядром, нежели сети научно-исследовательских институтов. Проведен анализ «демографической» структуры ныне активных авторов. Показано, что значительную долю составляют авторы с коротким публикационным стажем, а дефицит авторов наблюдается cреди впервые опубликованных в 1991–997 гг. В целом, динамика сети оказывается нестационарной с сохранением тенденции к повышению активности.
Разработана система, которая позволяет моделировать симпластный рост ткани линейного листа и в вычислительных экспериментах генерировать паттерны клеточной структуры ткани. Для этого мы модифицировали формализм дифференциальных L-систем и в этом формализме описали динамическую модель симпластного роста с учетом биомеханики. В качестве примера приведены результаты вычислительного эксперимента для клеток, которые росли симпластно в прямоугольном листе, и клеток, которые росли свободно. Распределения размеров клеток при свободном и симпластном росте значимо различаются.
У растений различают ди-, три-, тетра-, пента- или полиархную структуру центрального цилиндра корня. Вид симметрии отражает характерное взаимное расположение пучков сосудистых тканей флоэмы и ксилемы на поперечном срезе корня. Механизмы формирования различных типов симметрий в структуре центрального цилиндра остаются недостаточно исследованными. Предполагается, что процесс дифференцировки запускается и контролируется фитогормоном ауксином, который выступает в роли морфогена (Sachs, 1969). В работе представлена модель, описывающая транспорт ауксина через одноклеточный слой клеток поперечного среза корня. Изучены стационарные распределения концентраций гормона ауксина, которые могут устанавливаться в поперечном слое клеток. Показано, что нелинейные процессы регуляции транспорта ауксина способны обеспечить существование неравномерных распределений его концентраций, несущих целевую морфогенетическую информацию о диархной структуре цилиндра корня. Однако целевые морфогенетические поля всегда сосуществуют с равномерными распределениями, в которых морфогенетическая информация отсутствует. Полученные результаты свидетельствуют в пользу гипотезы о том, что одним из механизмов формирования целевого распределения концентрации ауксина в клетках поперечного слоя корня может быть неравномерный поток ауксина соответствующей конфигурации из побега в корень.
Расположенная в кончике корня апикальная меристема растения – один из удобных объектов исследования организации ниши стволовых клеток. В апикальной меристеме корня митотически слабо активные клетки покоящегося центра соседствуют с активно делящимися клетками, которые теряют эту способность на определенном расстоянии от покоящегося центра. Известно, что важную роль в регуляции формирования такой структуры играют фитогормоны ауксин и цитокинин, однако конкретные механизмы поддержания ее в динамике пока неизвестны. В работе предложена математическая модель, которая обобщает экспериментальные данные о распределении ауксина и цитокинина вдоль продольной оси корня и их роли в регуляции клеточного цикла. Минимальный механизм регуляции клеточного цикла ауксином и цитокинином, лежащий в основе модели, позволил продемонстрировать in silico самоорганизацию меристематической зоны корня в градиентах концентраций этих веществ.
Метод масс-спектрометрии −один из физических методов исследования протеомов различных организмов, позволяющий решать как задачи идентификации биологических макромолекул, так и секвенирования пептидных цепочек в случаях, когда нет информации о геномах либо эта информация крайне ограничена. В настоящее время существует множество компьютерных программ для поддержки исследований в этой области. Тем не менее, несмотря на высокую активность, имеется только незначительный прогресс в создании программпозволяющих решать задачи de novo секвенирования для циклических пептидов, к которым относятся наиболее эффективные антибиотики, противоопухолевые агенты, иммунодепрессанты, токсины и множество пептидов с неизвестными функциями, синтезируемые в клетке по нерибосомальному пути. Предложен эффективный алгоритм для решения задачи секвенирования циклических пептидов, который позволяет восстанавливать последовательности большой (до 160 аминокислотных остатков) длины.
Одним из ключевых путей снижения себестоимости биотехнологического производства является разработка для культивирования микроорганизмов дешевых субстратов, не конкурирующих с продуктами питания. В статье проанализированы возможности использования коммерчески доступных препаратов с целлюлозолитической активностью для осахаривания биомассы мискантуса сорта Сорановский – новой технической культуры, внесенной в реестр сельскохозяйственных культур РФ в 2013 г., в сравнении с осахариванием биомассы других травянистых растений –канареечника тростниковидного, кендыря ланцетовидного и сиды гермафродитной. Для ферментативного гидролиза были использованы коммерчески доступные препараты целлюлаз грибного происхождения: ксиланаза из Thermomyces lanuginosus, целлюлаза из Aspergillus niger, целлобиаза и целлюлаза из Pen. verruculosum. Ферментативному гидролизу предшествовала предобработка щелочной перекисью. Самой легко гидролизуемой из исследованных нами оказалась биомасса канареечника. Различными комбинациями ферментов удалось добиться 100-процентной конверсии в пересчете на массу гидролизуемых компонентов, что соответствует 70 % конверсии в пересчете на биомассу для всех образцов биомассы.
Saccharomyces cerevisiae является наиболее подходящим и используемым организмом для промышленного получения биоэтанола из сахаров, так как дрожжи имеют высокие темпы роста, ферментации и наработки этанола в анаэробных условиях, а также они устойчивы к высоким концентрациям этанола и низким значениям pH. Наиболее перспективным источником сахаров считается лигноцеллюлозная биомасса. Сахара, полученные из лигноцеллюлозной биомассы, являются смесью гексоз и пентоз. Однако используемые штаммы S. cerevisiae слабо приспособлены к сбраживанию пентасахаридов, в связи с чем необходима оптимизация метаболизма существующих в настоящее время продуцентов биоэтанола, направленная на использование пентасахаров. В работе представлен обзор существующих в мире подходов, разработанных для решения этой задачи с помощью рекомбинантных штаммов S. cerevisiae.
В статье рассмотрены теоретические вопросы биологического окисления углеводородов нефти от алканов до полициклических ароматических углеводородов. Показаны механизмы биохимических процессов разложения компонентов нефти и сделан обзор данных, представленных в популярных базах данных. Подробно описаны результаты исследований микробных сообществ естественных нефтепроявлений кальдеры Узон. Впервые изучены экофизиологические характеристики микроорганизмов нефтедеструкторов, выделенных из термальных источников нефтепроявлений кальдеры Узон.
Современные тенденции использования ДНК в нано- и биотехнологиях ставят задачу разработки новых методов анализа молекул ДНК на основе развивающейся приборной базы. Нами разработан метод мягкой неразрушающей абляции для перевода молекул ДНК в аэрозольную фазу при помощи терагерцевого излучения. В настоящей работе с помощью диффузионного спектрометра аэрозолей были проведены измерения размеров наночастиц ДНК в газовой фазе. Изменения, происходящие с ДНК в газовой фазе, были визуализированы при помощи атомно-силовой микроскопии (АСМ). Сопоставление измерений диффузионных размеров аэрозольных частиц плазмиды pUC18 и измерений с применением АСМ дает основания предполагать, что в газовой фазе происходит процесс конденсации молекул ДНК. Построена модель согласно закономерностям, предложенным современными представлениями о процессе конденсации ДНК и формирования глобулы. Теоретические расчеты хорошо совпали с экспериментальными результатами. Экспериментально оцененная персистентная длина ДНК в газовой фазе составила около 0,5 нм, что свидетельствует об отсутствии распределенного заряда на поверхности ДНК в газовой фазе и неионизирующем характере терагерцевого излучения. Исследование конформационных состояний ДНК в газовой фазе позволит расширить знания о закономерностях компактизации ДНК в естественных и искусственных условиях.
Elymus L. – род семейства Poaceae, включает исключительно полиплоидные виды. Виды рода распространены на всех континентах, не менее половины встречаются в Евразии, которая считается местом происхождения рода. Тем не менее видовое разнообразие, генетические особенности отдельных видов и их эволюционные взаимосвязи во многих частях Евразии, в частности на Дальнем Востоке Российской Федерации, до сих пор не исследованы. В связи с этим представляется перспективным изучение эволюционных взаимоотношений видов, произрастающих в данном регионе. В ходе работы проанализированы имеющиеся в базах данных последовательности двух ядерных генов и внутренних транскрибируемых спейсеров генов рибосомных РНК некоторых видов Elymus, встречающихся на Дальнем Востоке. Выявлено, что ядерные гены более пригодны для установления филогении на межвидовом уровне. В работе также показано, что последовательности гена waxy, принадлежащие различным гапломам, демонстрируют заметные различия и в силу этого могут быть использованы в качестве маркера для установления геномной конституции видов Elymus. Наконец, систематическое положение E. Kamczadalorum как отдельного вида было подтверждено.
Путь биосинтеза триптофана (ПБТ) универсален у большинства известных организмов, хотя и отсутствует у животных и некоторых эубактерий. У растений этот путь консервативен, но для разных видов наблюдается различное количество паралогов ферментов,участвующих в этом пути. В настоящей работе исследована возможная роль изменения числа паралогов ПБТ в процессе эволюции. Для этого проведена идентификация паралогов ферментов этого пути в известных полногеномных последовательностях и оценена статистическая связь между числом паралогов ПБТ и сложностью организмов. Показано, что сложность организмов достоверно коррелирует с числом гомологов ферментов синтеза триптофана у растений как для всех гомологов ферментов этого пути суммарно, так и для гомологов трех из шести ферментов этого пути ASA/ASB, PAI и IGPS. Выявленные зависимости могут быть обусловлены тем, что рост сложности организации растений и увеличение числа гомологов ферментов синтеза триптофана являются механизмами эволюционной адаптации к изменчивым условиям наземной среды обитания.
Three high-performance versions of the Haploid Evolutionary Constructor program are presented (http://evol-constructor.bionet.nsc.ru). The software was designed for simulating the functioning and evolution of microbial communities. These high-performance versions are to be run on systems with shared and distributed memory, using CPU and/or GPU. Almost linear acceleration has been achieved on clusters and multi-core CPU. On GPU systems, the simulation time was reduced to several minutes (dozens of hours on CPU).