Том 25, № 1 (2021)
Скачать выпуск
PDF (English)
БИОИНФОРМАТИКА И СИСТЕМНАЯ КОМПЬЮТЕРНАЯ БИОЛОГИЯ
7-17 772
Аннотация
В настоящее время самой распространенной моделью поиска сайтов связывания транскрипционных факторов (ССТФ) в пиках ChIP-seq является позиционная весовая матрица (position weight matrix, PWM). Но эта модель не учитывает взаимосвязи между частотами встреч нуклеотидов в разных позициях ССТФ, поэтому не способна гарантировать определение всех возможных структурных вариантов ССТФ. На сегодняшний день уже предложены альтернативные модели, например BaMM и InMoDe, которые учитывают такие взаимосвязи. Однако применение этих моделей обычно сводилось к сравнению их точности с точностью традиционной модели PWM, тогда как анализ совместной встречаемости и относительного расположения ССТФ разных моделей в пиках не производился. В нашей работе мы предлагаем конвейер программ MultiDeNA, позволяющий сочетать разные модели de novo поиска ССТФ для выявления структурной гетерогенности ССТФ в данных ChIP-seq. Разработанный конвейер включает этапы построения моделей на основе заданного набора пиков, оценки точности распознавания моделей с помощью перекрестных тестов, выбора порогов, сканирования пиков ChIP-seq и классификацию пиков по результатам сканирования. С применением конвейера нами проведен анализ 22 экспериментов ChIP-seq для ТФ FOXA2 с помощью четырех моделей: PWM, diPWM, BaMM и InMoDe. Показано, что сочетание моделей позволяет существенно увеличить общее количество распознанных пиков (на 26.3 %) по сравнению с применением только PWM; при этом основной вклад в распознавание внесла модель BaMM. В значительной доле пиков разные модели распознают совпадающие ССТФ; однако для моделей PWM, diPWM, BaMM и InMoDe медианы доли пиков, которые содержали ССТФ только одной модели, составили 1.08, 0.49, 4.15 и 1.73 % соответственно. Таким образом, совокупность ССТФ FOXA2 не описывается полностью только одной моделью, что свидетельствует о наличии структурной гетерогенности в ССТФ у FOXA2.
18-29 1536
Аннотация
Полногеномные и полноэкзомные технологии секвенирования играют важную роль в исследованиях генетических аспектов патогенеза различных заболеваний. Широкое применение методов полногеномного и полноэкзомного анализа ассоциаций позволяет идентифицировать множество вариантов геномной изменчивости (ГИ), ассоциированных с заболеваниями. Эта информация накапливается в базах данных GWAS central, GWAS catalog, OMIM, ClinVar и др. Большинство вариантов, идентифицированных методикой полногеномного анализа ассоциаций, располагается в некодирующих областях генома человека. По данным проекта ENCODE, доля участков в геноме человека, потенциально задействованных в регуляции транскрипции, во много раз превышает долю кодирующих областей. Таким образом, геномная изменчивость в некодирующих областях генома может повышать предрасположенность к заболеваниям, нарушая функционирование различных регуляторных элементов (промоторов, энхансеров, участков, определяющих 3D структуру хроматина и т. д.). Однако идентификация механизмов влияния патогенных вариантов ГИ на риск развития заболеваний затруднена ввиду большого разнообразия регуляторных элементов. В обзоре рассмотрены молекулярно-генетические механизмы влияния патогенных вариантов ГИ на экспрессию генов. При этом внимание сосредоточено на транскрипционном уровне регуляции как ключевой стадии, запускающей последовательность этапов экспрессии любого гена. Пусковым событием, опосредующим влияние патогенного варианта ГИ на уровень экспрессии гена, может быть, например, изменение функциональной активности сайтов связывания транскрипционных факторов или уровня метилирования ДНК, что, в свою очередь, отражается на функциональной активности промоторов или энхансеров. Выявление регуляторных эффектов полиморфных локусов невозможно без тесной интеграции современных экспериментальных подходов с компьютерным анализом больших массивов генетических данных, получаемых на основе омиксных технологий. В обзоре кратко описаны наиболее известные открытые полногеномные информационные ресурсы, содержащие данные, полученные на основе омиксных технологий, в том числе: ресурсы, накапливающие сведения о состоянии хроматина и участках его связывания с транскрипционными факторами, выявленными с помощью технологии ChIP-seq; ресурсы по геномным локусам, для которых на основе данных ChIP-seq выявлено аллель-специфичное связывание с транскрипционными факторами; а также ресурсы, содержащие предсказанные in silico данные о потенциальном влиянии геномной изменчивости на сайты связывания транскрипционных факторов.
30-38 1221
Аннотация
Реконструкция транскриптома de novo – важная стадия биоинформатического анализа данных RNA-seq, которая позволяет получить последовательности транскриптов, присутствующих в изучаемом биологическом образце. Наличие точной и полной последовательности транскриптома организма, в свою очередь, является необходимым условием для дальнейшей работы с данными RNA-seq. Биоинформатическим сообществом было создано множество программ-сборщиков для реконструкции транскриптома из коротких прочтений RNA-seq. Сборщики позволяют проводить как de novo реконструкцию транскриптома, так и реконструкцию, основанную на картировании коротких прочтений RNA-seq на последовательность референсного генома организма. Большинство de novo сборщиков, работающих с данными RNA-seq, применяют технологию реконструкции последовательностей методом графов де Брёйна. Однако детали их работы могут существенно различаться, поэтому различия могут встречаться и в результатах. Некоторые авторы рекомендуют для получения более полной и качественной сборки использовать гибридную сборку транскриптома – подход, основанный на комбинации результатов работы нескольких сборщиков. Преимущество такого подхода было продемонстрировано в ряде исследований по анализу транскриптомов на платформе Illumina. Нами предложен гибридный подход по созданию сборок транскриптома ячменя Hordeum vulgare изогенной линии Bowman и двух почти изогенных линий, полученных на основе Bowman и контрастных по окраске колоса, используя данные, полученные при секвенировании матричной РНК на платформе IonTorrent. В данном подходе применяются несколько индивидуальных сборщиков: Trans-ABySS, rnaSPAdes и Trinity. Были оценены некоторые показатели, характеризующие полноту и точность сборки: доля обнаруженных в сборке известных транскриптов ячменя, доля задействованных в сборке прочтений из библиотек RNA-seq, значение критерия BUSCO. По совокупности этих показателей метасборки демонстрируют более высокое качество полученного транскриптома по сравнению с индивидуальными сборщиками.
39-45 826
Аннотация
Активный полярный транспорт гормона растений ауксина, осуществляемый его транспортерами, – ключевое звено в формировании и поддержании распределения ауксина, которое, в свою очередь, определяет морфогенез растения. Пластичность распределения ауксина в большой степени реализуется через молекулярно-генетическую регуляцию им экспрессии транспортеров семейства PIN-FORMED (PIN) белков. Регуляция ауксином экспрессии чувствительных к нему генов происходит через ARF-Aux/IAA-зависимый сигнальный путь. Однако неизвестно, какие ARF-Aux/IAA белки участвуют в регуляции ауксином экспрессии генов PIN. У Arabidopsis thaliana семейства белков PIN, ARF и Aux/IAA многочисленны, возможны различные комбинации представителей этих семейств в реализации сигнального пути, что создает сложность для понимания механизмов этого процесса. Использование данных высокопроизводительного секвенирования транскриптомов, индуцированных ауксином (RNA-Seq), делает возможным обнаружение генов-кандидатов, участвующих в регуляции экспрессии белков PIN. Мы разработали алгоритм метаанализа ауксин-индуцированных транскриптомов, с помощью которого отобрали гены, изменяющие свою экспрессию в ответе на ауксин вместе с PIN1, PIN3, PIN4, PIN7, и предсказали возможные регуляторы ARF-Aux/IAA сигнального пути для каждого из дифференциально экспрессирующихся PIN. Применяя сравнительный анализ, мы определили общие и специфичные аспекты в регуляторных контурах, исследуемых PIN. Реконструкция генных сетей и их оценка показали возможные взаимодействия между генами и послужили дополнительным подтверждением большинства сигнальных путей, полученных в метаанализе. С помощью комплексного подхода мы предсказали, что регуляция ауксином экспрессии PIN происходит через несколько ARF-Aux/IAA регуляторных контуров, опосредованных комбинацией ARF4, ARF10 и IAA4, IAA12, IAA17, IAA18 и IAA32. Часть из них являются специфичными при формировании ауксинового ответа с участием отдельных белков PIN, тогда как другие – общими для нескольких белков PIN. Разработанный алгоритм метаанализа можно применять для решения других задач поиска регуляторов экспрессии генов с привлечением полногеномных данных.
46-56 767
Аннотация
Филостратиграфический анализ – это подход к исследованию эволюции генов, позволяющий определить время возникновения генов за счет анализа филогенетических деревьев организмов, обладающих ортологичными к исследуемому генами. Такой анализ может открыть важные этапы в эволюции как организма в целом, так и групп функционально связанных генов, в частности генных сетей. В дополнение к исследованию времени возникновения гена изучается уровень его генетической изменчивости и то, какому типу отбора подвержен ген по отношению к наиболее близкородственным организмам. С помощью приложения Orthoscape были проанализированы генные сети из базы данных KEGG Pathway, Human Diseases, ассоциированные с заболеваниями человека. Выявлено, что большинство генов, описанных в генных сетях, подвержены стабилизирующему отбору, обнаружена высокая достоверная корреляция между временем возникновения гена и уровнем генетической изменчивости, которой он подвержен, – чем моложе ген, тем выше уровень генетической изменчивости. Было также показано, что среди проанализированных генных сетей наибольшая доля эволюционно молодых генов обнаружена в сетях, связанных с заболеваниями иммунной системы (65 %), а эволюционно древних генов – в сетях, ответственных за формирование зависимостей человека от веществ, вызывающих привыкание к химическим соединениям (88 %); генные сети, связанные с развитием инфекционных заболеваний, вызванных паразитами, достоверно обогащены эволюционно молодыми генами, а генные сети, ответственные за развитие специфических типов рака, – эволюционно древними генами.
57-63 1347
Аннотация
Cеквенирование генома организма – важный этап в его генетических исследованиях. Расшифровка геномной последовательности открывает широкие возможности для изучения строения структуры хромосом, распределения повторенных и кодирующих последовательностей, идентификации и аннотации генов. При исследовании сельскохозяйственных растений это позволяет анализировать функции генов, разрабатывать маркеры для поиска ассоциаций с фенотипическими признаками. При решении этих задач геном вида часто представлен последовательностью одного организма (так называемым референсным геномом). В последнее время, однако, появляется много свидетельств в пользу того, что большие структурные изменения генома, включая вариации числа копий генов и вариации наличия/отсутствия генов, преобладают в сельскохозяйственных культурах, играют ключевую роль в генетическом определении агрономически важных признаков и приводят к значительным вариациям функционального набора генов и генного состава у представителей одного вида. Такие структурные вариации не могут быть представлены на основе одной лишь референсной последовательности и описываются исходя из концепции пангенома. Пангеном – это информация о полном наборе генов таксона, среди которых можно выделить набор универсальных генов, общих для всех представителей таксона, и вариабельных генов, которые являются частично или полностью специфичными для его представителей. Анализ пангеномов дает более точное понимание генетического разнообразия генофонда. Технологии секвенирования и анализа пангеномов позволяют обеспечить возможность масштабного изучения геномных вариаций, доступ к более широкому спектру геномных данных в селекционных программах и помогут ускорить селекцию культурных растений для создания сортов со стабильно высокой урожайностью и устойчивостью к стрессам. В работе представлен краткий обзор исследования пангеномов сельскохозяйственных растений, описаны их структурные особенности, методы и программы биоинформатического анализа пангеномных данных.
64-70 836
Аннотация
Определение количественного содержания хлорофиллов в листьях растений по их спектрам отражения – важная задача как при мониторинге состояния естественных и промышленных фитоценозов, так и в лабораторных исследованиях нормальных и патологических процессов в ходе роста растения. Применение для этих целей методов машинного обучения является перспективным, поскольку они позволяют «автоматически» строить решающие правила для получения результата (модель предсказания), а исследователю (для повышения качества предсказания) остаются модификация предикторов и выбор множества параметров метода. В статье приведены результаты построения решающих правил алгоритмом случайного леса (random forest) для предсказания суммарной концентрации хлорофиллов a и b по спектрам отражения листьев растений в видимом и инфракрасном (ИК) диапазонах длин волн. Набор данных взят из открытых источников. Они включали 276 образцов листьев 39 видов растений. При этом 181 образец получен при анализе листьев белого клена (Acer pseudoplatanus L.). Спектр отражения представлен в диапазоне 400–2500 нм с шагом 1 нм. Обучение происходило на 85 % образцов A. pseudoplatanus L., оценка качества предсказания – на оставшихся 15 % образцов этого вида (валидационная выборка). Построено шесть моделей на основе алгоритма случайного леса с разными предикторами. Подбор управляющих параметров осуществляли при помощи перекрестной проверки на пяти разбиениях. Предикторами первой модели выступали имеющиеся значения по спектру отражения без какой-либо обработки с нашей стороны. После проведения анализа этой модели были выбраны диапазоны длин волн предикторов для оставшихся пяти моделей. Лучшие предсказания имеют модели с разностной производной спектра отражения в видимом диапазоне длин волн. Модель с первой производной спектра отражения в диапазоне 400–800 нм с шагом 1 нм брали для сравнения с моделью других авторов. Этой моделью выступает функциональная зависимость с двумя неизвестными параметрами, подбираемыми методом наименьших квадратов, и двумя коэффициентами отражения, выбор которых описывается в настоящей статье. Сравнение результатов предсказаний модели с применением алгоритма случайного леса проводили как на валидационной выборке клена, так и на выборке из других видов растений. В первом случае предсказания метода на основе случайного леса имели меньшую оценку среднеквадратического отклонения. Во втором случае предсказания этого метода были с большой ошибкой при малых значениях хлорофилла, в то время как сторонний метод имел приемлемые предсказания. В статье приводятся анализ результатов и рекомендации по применению этого метода машинного обучения для оценки количественного содержания хлорофиллов в листьях.
71-81 1078
Аннотация
Внутривидовая классификация культурных растений необходима для эффективного сохранения биологического разнообразия видов, изучения их происхождения, определения филогении и проведения межвидовой гибридизации при селекции. Современные возделываемые виды пшениц произошли от трех диких диплоидных предков в результате гибридизации и нескольких раундов удвоения геномов и представлены ди-, тетра- и гексаплоидными видами. Поэтому идентификация плоидности пшениц и определение их геномного состава являются одними из основных этапов их классификации на основе визуального анализа фенотипических признаков колоса. Цель работы – исследование морфологических характеристик колосьев полиплоидных видов пшеницы методами высокопроизводительного фенотипирования. Выполнено фенотипирование количественных характеристик колоса 17 видов пшеницы (595 растений, 3348 изображений), включая восемь тетраплоидных: Triticum aethiopicum, T. dicoccoides, T. dicoccum, T. durum, T. militinae, T. polonicum, T. timopheevii, T. turgidum и девять гексаплоидных: T. compactum, T. aestivum (в том числе изогенная линия сорта Новосибирская 67 АНК-23), T. antiquorum, T. spelta (включая стародавний сорт T. spelta Rother Sommer Kolben), T. petropavlovskyi, T. yunnanense, T. macha, T. sphaerococcum, T. vavilovii. Морфология колоса описана на основе девяти количественных признаков, включающих форму, размер и остистость. Признаки были получены в результате анализа цифровых изображений с помощью программы WERecognizer. Кластерный анализ растений по характеристикам формы колоса и сравнение их распределений у тетра- и гексаплоидных видов показали более высокую вариабельность признаков у гексаплоидных видов по сравнению с тетраплоидными. При этом сами виды в пространстве характеристик колоса формируют два кластера. К первому относятся преимущественно гексаплоидные виды, за исключением одного тетраплоидного, дикорастущего T. dicoccoides, ко второму – тетраплоидные, за исключением трех гексаплоидных, T. compactum, T. antiquorum, T. sphaerococcum, и i:АНК-23. Показано, что морфологические характеристики колосьев для гекса- и тетраплоидных видов, полученные на основе компьютерного анализа изображений, демонстрируют различия, которые в дальнейшем могут быть использованы для разработки методики эффективной классификации растений по плоидности и их видовой принадлежности в автоматическом режиме.
82-91 983
Аннотация
Разработан алгоритм анализа чувствительности и идентифицируемости математических моделей распространения эпидемии COVID-19 в Новосибирской области, основанных на системах дифференциальных уравнений и законе действующих масс. Основу алгоритма составляет анализ матрицы чувствительности методами дифференциальной и линейной алгебры, показывающей степень зависимости неизвестных параметров моделей от заданных измерений. В результате работы алгоритма выявляются наименее и наиболее чувствительные к измерениям параметры, что способствует построению регуляризующего алгоритма решения задачи идентификации параметров для построения более точных сценариев развития эпидемии в регионе. Анализ чувствительности математических моделей распространения коронавирусной инфекции COVID-19 показал, что параметр контагиозности вируса устойчиво определяется по количеству ежедневно выявляемых заболевших, критических и вылечившихся больных. С другой стороны, прогнозируемая доля госпитализированных больных, находящихся в критическом состоянии и требующих подключения аппарата ИВЛ, а также коэффициент смертности определяются гораздо менее устойчиво. Для построения более реалистичного прогноза необходимо добавить дополнительную информацию о процессе (например, о количестве ежедневных случаев госпитализации). Задачи уточнения идентифицируемых параметров по дополнительной информации о количестве выявленных, критических и смертельных случаев в Новосибирской области были сведены к задачам минимизации соответствующих целевых функционалов. Задача минимизации была решена с помощью метода дифференциальной эволюции, широко используемого в задачах стохастической глобальной оптимизации. Показано, что более общая камерная модель, состоящая из семи обыкновенных дифференциальных уравнений, описывает основную тенденцию распространения коронавирусной инфекции, чувствительна к пикам выявленных случаев, однако некачественно описывает небольшие статистики (количество ежедневных критических, смертельных случаев), что может приводить к ошибочным выводам. Более подробная агентно-ориентированная математическая модель, учитывающая поведение отдельных агентов, позволяет улавливать небольшие шумы в данных и строить сценарии развития распространения эпидемии в регионе.
92-100 985
Аннотация
Идея о том, что хронический механический стресс, который испытывают клетки мозга при повышенном внутричерепном давлении, артериальной гипертензии или вследствие травмы, может быть одним из факторов риска в развитии нейродегенеративных заболеваний, появилась еще в 90-е годы прошлого столетия и поддерживается в настоящее время. Однако молекулярно-генетические механизмы реализации событий, ведущих от механического воздействия на клетки к нарушению пластичности синапсов и последующему изменению поведения, когнитивных способностей и памяти, не ясны. В настоящем обзоре рассмотрены существующие данные о молекулярно-генетических механизмах регуляции локальной трансляции и актинового цитоскелета в активированном синапсе, играющих центральную роль в формировании различных видов пластичности синапса и долговременной памяти, и возможных путях влияния механического стресса на их состояние. Обсуждается роль mTOR сигнального каскада, РНК-связывающего белка FMRP, белка CYFIP1, взаимодействующего с FMRP, семейства малых ГТФаз и WAVE регуляторного комплекса в регуляции инициации локальной трансляции и перестроек актинового цитоскелета в дендритных шипиках активированного синапса. Приводятся факты, свидетельствующие о том, что в условиях хронического механического стресса возможна аберрантная активация mTOR сигнального каскада и WAVE регуляторного комплекса через сенсор механических сигналов – регуляторный фактор YAP/TAZ, следствием которой могут быть нарушения активности системы локальной трансляции, а также связанных с ними механизмов регуляции формирования F-актиновых филаментов и структуры дендритных шипиков. Это может быть одной из причин развития различных неврологических патологий, включая аутистические расстройства и эпилептическую энцефалопатию. Высказывается оригинальная гипотеза, согласно которой одной из возможных причин синаптопатий может быть нарушение стабильности протеома, связанное с гиперактивностью mTOR и формированием сложных динамических режимов синтеза белков de novo в ответ на стимуляцию синапса, в том числе и в условиях хронического механического стресса.
БИОТЕХНОЛОГИЯ
101-107 730
Аннотация
Транс-сплайсинг у эукариот – это процесс созревания ядерных пре-мРНК, когда две различные молекулы РНК соединяются с помощью структур сплайсосомы по механизму, схожему с цис-сплайсингом. У различных таксонов низших эукариот наиболее распространенный тип транс-сплайсинга – сплайс-лидерный (СЛ) транс-сплайсинг, при котором одинаковая последовательность, происходящая от коротких малых ядерных РНК молекул, называемых СЛ РНК, присоединяется к 5’-концам различных непроцессированных пре-мРНК. Одна из функций СЛ транс-сплайсинга состоит в процессировании полицистронных молекул пре-мРНК, транскрибируемых с оперонов, когда транскрипция нескольких генов осуществляется как одна молекула пре-мРНК. Однако лишь часть генов, подвергающихся транс-сплайсингу, содержится в оперонах, что говорит о том, что у СЛ транссплайсинга должны быть и другие, менее изученные, функции. Регенерирующие плоские черви являются информативными модельными организмами, хранящими ключи к пониманию механизмов регуляции стволовых клеток и их дифференцировки во время регенерации и при гомеостазе. Их способность к регенерации – следствие деления и дифференцировки соматических стволовых клеток, называемых необластами, которые присутствуют у взрослых особей. Macrostomum lignano – модельный плоский червь, в исследованиях на котором в последние годы достигнут существенный технологический прогресс, включая разработку метода трансгенеза. Сплайс-лидерный транс-сплайсинг ранее не был детально изучен у M. lignano, хотя известно, что значительная часть генов M. lignano подвергается этому типу транс-сплайсинга. В настоящей работе мы осуществили первое обширное исследование СЛ транс-сплайсинга у M. lignano. Повторно проанализировав геномные и транскриптомные данные M. lignano, мы оцениваем, что 30 % его генов подвергаются СЛ транс-сплайсингу, 15 % расположены в оперонах, а почти 40 % находятся в оперонах и проходят через СЛ транс-сплайсинг. Мы провели аннотацию и охарактеризовали последовательность СЛ РНК и консервативных мотивов цис- и транс-сплайсинга. Обнаружено, что большинство генов, подвергающихся СЛ транс-сплайсингу, эволюционно консервативны и значительно перепредставлены в генах, специфичных для необластов. Наши результаты предполагают важную роль СЛ транс-сплайсинга в регуляции функционирования необластов у M. lignano.
108-116 1134
Аннотация
Инфекциям различных видов паразитических плоских червей подвержены сотни миллионов человек по всему миру. Как острые, так и хронические инфекции в отсутствие лечения с высокой частотой приводят к развитию тяжелых патологий и даже к смерти. Данные о снижении эффективности некоторых важных противогельминтных лекарственных препаратов и развитии резистентности к ним вынуждают исследователей искать альтернативные соединения. Паразитические плоские черви обладают сложным жизненным циклом, трудоемки и дорогостоящи в разведении, а также имеют ряд приспособлений, осложняющих работу с ними стандартными молекулярно-биологическими методами. Напротив, эволюционно близкородственные паразитическим плоским червям свободноживущие виды плоских червей лишены вышеописанных трудностей, что делает их перспективными альтернативными модельными объектами для поиска и исследования гомологичных генов. В этом обзоре мы описываем применение базального свободноживущего плоского червя Macrostomum lignano в качестве такой модели. M. lignano обладает большим набором удобных биологических и экспериментальных особенностей, таких как быстрое время репродукции, дешевизна и легкость в лабораторном разведении, оптическая прозрачность тела, облигатное половое размножение, аннотированные геномные и транскриптомные сборки, а также доступность современных молекулярных методов исследования, включая трансгенез, генный нокдаун с помощью РНК-интерференции и гибридизацию in situ. Все это делает M. lignano пригодным для применения самых современных подходов «прямой» и «обратной» генетики, таких как транспозонный инсерционный мутагенез и методы направленного редактирования генома с использованием системы CRISPR/Cas9. Благодаря растущему количеству доступных сборок геномов и транскриптомов различных видов паразитических плоских червей новые знания, полученные в исследованиях на M. lignano, могут быть легко транслированы на паразитических плоских червей с применением современных биоинформационных подходов сравнительной геномики и транскриптомики. В подтверждение этому мы приводим результаты нашего биоинформационного поиска и анализа гомологичных генов M. lignano и паразитических плоских червей, которые позволили определить список перспективных генов-мишеней для дальнейшего исследования.
117-124 743
Аннотация
Существует ряд наследственных заболеваний человека, причиной которых является экспансия тандемных повторов. К ним относятся миотоническая дистрофия первого типа, болезнь Хантингтона, заболевания, ассоциированные с ломкой Х-хромосомой. Синдром ломкой Х-хромосомы – наиболее распространенная причина наследственной умственной отсталости у человека. На сегодняшний день причины развития экспансии остаются неисследованными. Важная особенность протяженных повторов – их способность формировать альтернативные вторичные структуры ДНК. Существуют гипотезы, объясняющие природу нестабильности повторов, однако все они предполагают возникновение устойчивых вторичных структур ДНК на различных этапах клеточного цикла. Источником нестабильности считаются нарушения в различных процессах метаболизма ДНК (репликация, репарация и рекомбинация), вызванные образованием вторичных структур. Однако ни одна из гипотез до конца не подтверждена и, видимо, не является единственно верной. Вероятно, в различных типах клеток и на определенных стадиях клеточного цикла источником нестабильности выступает множество процессов. В настоящей работе мы предлагаем экспериментальную систему для изучения вклада транскрипции и ассоциированной с ней репарации в нестабильность повтора (CGG)n, поскольку это наименее изученный механизм возникновения нестабильности. Однако предложенные модели могут учитывать вклад и других процессов метаболизма ДНК, например репликации, что делает полученные системы универсальными и применимыми в разных исследованиях. Нами были созданы трансгенные клеточные линии, несущие повтор нормальной и премутантной длины под тетрациклининдуцируемым промотором. Один тип линий содержит плазмиду с экзогенным повтором, интегрированным в геном посредством транспозона Sleeping Beauty, в другой клеточной линии вектор поддерживается в виде эписомы благодаря ориджину репликации SV40. Такие трансгенные клеточные линии могут служить экспериментальной системой для поиска причин нестабильности и создания терапевтических средств. Кроме того, был разработан критерий для оценки нестабильности экзогенного (CGG)n повтора в геноме трансгенных клеточных линий, расчет которого не зависит от эффективности синтеза протяженных повторов.
125-134 2135
Аннотация
В настоящей работе мы рассматриваем прогресс в изучении и модификации субтилизиновых протеаз. Несмотря на длительное время применения микробиальных протеаз и значительное число работ, посвященных их исследованию, поиск новых генов протеаз, создание продуцентов и развитие методов их применения остаются актуальными, о чем говорит высокий уровень цитирования публикаций, описывающих протеазы и их продуценты. На данный класс ферментов приходится максимальный объем производства промышленных белков в мире, что объясняет большой интерес к нему. Это говорит о чрезвычайно высокой важности получения собственных технологий их производства. В статье представлены сведения о классификации субтилизинов, истории их открытия и дальнейших работ по оптимизации их свойств. Дан обзор классов субтилизиновых протеаз и родственных им ферментов. Проанализированы проблемы поиска и отбора субтилаз из природных штаммов различных микроорганизмов, пути и особенности их модификации и используемые при этом методы генетической инженерии. Детально изучены методы оптимизации продукции промышленных субтилаз у различных штаммов, касающихся важнейших аспектов культивирования: состава среды, времени культивирования, влияния температуры и pH. Приводятся результаты последних исследований по техникам культивирования – глубинному и твердофазному культивированию. На основании рассмотренных литературных данных можно заключить, что в настоящее время практически не применяются нативные, т. е. обнаруженные в природе ферменты, в связи с решающими преимуществами, предоставляемыми белками, модифицированными при помощи генной инженерии и обладающими улучшенными свойствами: термостабильностью, общей устойчивостью к детергентам и специфической – к различным окислителям, высокой активностью в разных диапазонах температур, независимостью от ионов, стабильностью в отсутствие кальция и т. д. Большинство субтилизиновых протеаз синтезируется в штаммах-продуцентах, относящихся к разным видам рода Bacillus. В то же время ведутся работы по адаптации синтеза этих ферментов в других микроорганизмах, в частности дрожжей Pichia pastoris.
ISSN 2500-3259 (Online)