Системная компьютерная биология

Аннотация
Аннотация. Сосудистая система является результатом ароморфоза, который позволил растениям успешно освоить сушу. За счет нее осуществляется проведение воды, минеральных и органических соединений, обеспечивается эффективное сообщение между органами, а также выполняется функция механической опоры. Процесс формирования сосудистой системы – общепринятый объект фундаментальных исследований в области биологии развития растений. В частности, ранние этапы развития сосудистой системы корня модельного растения Arabidopsis thaliana представляют собой яркий пример самоорганизации бисимметричного (имеющего две плоскости симметрии) паттерна распределения фитогормонов, который направляет детерминацию клеток сосудистой системы. В процессе формирования сосудистой системы корня можно выделить четыре этапа: 1) детерминацию (спецификацию) клеток-предшественников проваскулярной меристемы на ранних стадиях эмбриогенеза; 2) рост и разметку проваскулярной меристемы зародыша; 3) постэмбриональное поддержание инициалей (стволовых клеток) сосудистой системы в апикальной меристеме корня; 4) конечную специализацию (дифференцировку) их дочерних клеток. Анатомические детали развития сосудистой системы A. thaliana давно известны и подробно описаны, однако наши знания о молекулярно-генетических механизмах этого процесса все еще ограничены. В последние годы сделано несколько важных открытий, проливающих свет на регуляцию самых ранних событий, предшествующих дифференцировке клеток сосудистой системы. В настоящем обзоре мы обобщаем данные о молекулярно-генетических механизмах, определяющих направление клеточной дифференцировки в элементы сосудистой системы корня у A. thaliana. Первая часть обзора посвящена описанию гистогенеза сосудистой системы корня. Далее мы реконструируем последовательность регуляторных событий, которые лежат в основе этого гистогенеза и обусловливают развитие предшественников инициалей сосудистой системы у зародыша и организацию инициалей сосудистой системы в корне проростка.
Ключевые слова: меристема; ксилема; флоэма; (про)камбий; фитогормоны; ауксин; цитокинин; Arabidopsis thaliana.
Для цитирования: СидоренкоА.Д., Омельянчук Н.А., Землянская Е.В. Молекулярные механизмы детерминации клеток сосудистой системы корня Arabidopsis thaliana L. Вавиловский журнал генетики и селекции. 2022;26(8): 721-732. DOI 10.18699/VJGB-22-88
Аннотация
Аннотация. Вирус гепатита С (ВГС) считается фактором риска для возникновения гепатоцеллюлярной карциномы (ГЦК). Известно, что большую роль в молекулярно-генетических механизмах вирус-индуцированного онкогенеза играют эпигенетические изменения. Аберрантное метилирование ДНК служит медиатором эпигенетических изменений, которые тесно связаны с патогенезом ГЦК, и признано биомаркером для его ранней диагностики. С помощью ANDSystem проведены реконструкция и оценка статистической значимости путей потенциальной регуляции вирусными белками ВГС 32 генов человека, гиперметилированных при ГЦК. Среди исследованных генов были как онкосупрессоры, так и проопухолевые гены, идентифицированных по данным полногеномного анализа метилирования ДНК. Реконструированы регуляторные пути, включающие белок-белковые взаимодействия, регуляцию экспрессии генов, регуляцию активности, стабильности и транспорта белков. Среди статистически значимых оказались пути регуляции экспрессии. Показано, что восемь из десяти белков ВГС являются участниками данных путей. Белок ВГС NS3 был вовлечен в наибольшее число регуляторных путей. NS3 связан с регуляцией пяти генов-онкосупрессоров, что может свидетельствовать о его центральной роли в патогенезе ГЦК. Анализ реконструированных путей показал, что при ингибировании транскрипционных факторов в результате связывания с вирусными белками, экспрессия ряда онкосупрессоров (WT1, MGMT, SOCS1, P53) подавлялась, тогда как экспрессия других (RASF1, RUNX3, WIF1, DAPK1) активировалась. Таким образом, с помощью реконструкции генных сетей показано, что вирусные белки гепатита С способны влиять не только на статус метилирования генов-онкосупрессоров, но и на их транскрипционную регуляцию. Полученные результаты могут быть использованы при поиске фармакологических мишеней для разработки новых средств против ГЦК, индуцированной ВГС.
Ключевые слова: гепатоцеллюлярная карцинома; вирус гепатита С; регуляция экспрессии; гиперметилирование; регуляторные пути; генные сети; биоинформатика.
Для цитирования: Антропова Е.А., Хлебодарова Т.М., Деменков П.С., Вензель А.С., Иванисенко Н.В., Гавриленко А.Д., Иванисенко Т.В., Адамовская А.В., Ревва П.М., Лаврик И.Н., Иванисенко В.А. Компьютерный анализ особенностей регуляции гиперметилированных маркерных генов гепатокарциномы вирусными белками гепатита С. Вавиловский журнал генетики и селекции. 2022;26(8):733-742. DOI 10.18699/VJGB-22-89
Аннотация
Аннотация. L-Валин – одна из девяти аминокислот, которые не могут быть синтезированы de novo высшими организмами и должны поступать с пищей. Эта аминокислота не только служит строительным материалом для белков, но также регулирует белковый и энергетический обмен и участвует в нейротрансмиссии. L-Валин используется в пищевой и фармацевтической промышленности, медицине и косметике, но в первую очередь в качестве кормовой добавки для животных. Добавление L-валина в корм отдельно или в смеси с другими незаменимыми аминокислотами позволяет использовать корма с меньшим содержанием сырого белка, повышает качество и количество мяса свиней и цыплят-бройлеров, а также улучшает репродуктивные функции сельскохозяйственных животных. Несмотря на то что рынок L-валина постоянно растет, в нашей стране эта аминокислота пока не производится. В современных условиях создание штаммов-продуцентов и организация производства L-валина для России особенно актуальны. Один из наиболее часто используемых базовых микроорганизмов для создания продуцентов аминокислот наряду с Escherichia coli – почвенная бактерия Corynebacterium glutamicum. Обзор посвящен анализу основных стратегий разработки продуцентов L-валина на базе C. glutamicum. Рассмотрены различные аспекты биосинтеза L-валина у коринебактерий: биохимия, стехиометрия и регуляция процесса, ферменты и соответствующие им гены, системы экспорта и импорта, связь биосинтеза L-валина с центральным метаболизмом клетки. Выявлены ключевые генетические элементы для создания штаммов-продуцентов на основе C. glutamicum. Описано использование метаболической инженерии для усиления реакций биосинтеза L-валина и уменьшения образования побочных продуктов. Показаны перспективы усовершенствования штаммов с точки зрения повышения их продуктивности и улучшения технологических характеристик. Информация, представленная в обзоре, может быть использована при получении продуцентов других аминокислот с разветвленной боковой цепью – L-лейцина и L-изолейцина, а также D-пантотената.
Ключевые слова: Corynebacterium glutamicum; L-валин; метаболическая инженерия; штамм-продуцент.
Для цитирования: Шереметьева М.Е., Ануфриев К.Э., Хлебодарова Т.М., Колчанов Н.А., Яненко А.С. Рациональная метаболическая инженерия Corynebacterium glutamicum для продукции L-валина. Вавиловский журнал генетики и селекции. 2022;26(8):743-757. DOI 10.18699/VJGB-22-90
Аннотация
Аннотация. Периодические процессы функционирования широкого класса генных сетей с хорошей точностью описываются предельными циклами многомерных систем дифференциальных уравнений кинетического типа. Такие системы, часто называемые в литературе динамическими, составляются по схемам положительных и отрицательных связей между компонентами моделируемых сетей. Искомые функции в уравнениях описывают зависимость от времени концентраций этих компонент. При планировании вычислительных экспериментов с подобными математическими моделями полезно предварительно описать качественное поведение ансамблей траекторий соответствующих динамических систем, в частности оценить области максимального правдоподобия начальных данных, исследовать обратные задачи идентификации параметров, особые точки этих систем, локализовать в фазовых портретах положение циклов, в том числе предельных, стратифицировать фазовые портреты на подобласти с качественно различным поведением траекторий и т.п. Такой априорный геометрический анализ рассматриваемых моделей генных сетей полностью аналогичен хрестоматийному разделу начальных курсов математики «Исследование функций и построение графиков», в котором описываются методы наглядного представления поведения кривых, определяемых уравнениями. В настоящей статье в фазовых портретах динамических систем, моделирующих функционирование кольцевых генных сетей, конструируются двумерные поверхности, инвариантные относительно сдвигов вдоль траекторий, – ансамбли траекторий. Просматривается естественная аналогия с классической конструкцией аналитической механики – с поверхностями уровня интегралов движения (энергия, импульс и др.). Такие поверхности образуют слоения в фазовых портретах динамических систем гамильтоновой механики. В отличие от задач механики, для рассматриваемых нами моделей генных сетей слоения, образуемые инвариантными поверхностями, имеют особенности, все их слои содержат на своих границах предельные циклы. Описание фазовых портретов динамических систем в терминах их стратификаций и ансамблей их траекторий позволит строить более реалистичные модели генных сетей с использованием аппарата статистической физики и теории стохастических дифференциальных уравнений.
Ключевые слова: осцилляции; положительные и отрицательные связи; модели генных сетей; фазовые портреты; инвариантные области и поверхности; инвариантные слоения; отображение Пуанкаре; теорема Гробмана–Хартмана; теорема Фробениуса–Перрона.
Для цитирования: ГолубятниковВ.П., Акиньшин А.А., Аюпова Н.Б., Минушкина Л.С. Стратификации и слоения в фазовых портретах моделей генных сетей. Вавиловский журнал генетики и селекции. 2022;26(8):758-764. DOI 10.18699/VJGB-22-91
Аннотация
Аннотация. В статье представлены результаты исследования, направленного на поиск ковариат для учета деятельности имплицитных когнитивных процессов в условиях функционального покоя испытуемых и при демонстрации им собственного или чужого лица в совместном анализе данных ЭЭГ-эксперимента. Предлагаемый подход основан на анализе динамики мышц лица испытуемого по видео. В пилотном исследовании приняли участие 18 здоровых добровольцев. В эксперименте испытуемые, сидя перед экраном, последовательно закрывали глаза (три пробы по 2 минуты) и открывали их (также три пробы между периодами закрытых глаз) либо перед пустым экраном, либо перед экраном с демонстрацией видеозаписи их собственного лица или лица незнакомого им человека такого же пола, что и участник. У всех испытуемых регистрировали ЭЭГ, ЭКГ и вели запись видео лица. В работе решали отдельную подзадачу эксперимента: апробацию методики оценки динамики активности мышц лица испытуемых по их видео с открытыми глазами для получения ковариат, которые можно включать в последующую обработку совместно с ЭЭГ-коррелятами в нейрокогнитивных экспериментах с парадигмой, не предполагающей выполнение активных когнитивных заданий (resting-state conditions). Показано, что пол испытуемого, статус экрана (пустой, собственное/чужое лицо), номер пробы связаны с различиями в мимической активности лица и могут выступать искомыми ковариатами. Сделан вывод, что анализ динамики мимической активности по видео с открытыми глазами может быть дополнительным методом в нейрокогнитивных исследованиях для изучения имплицитных когнитивных процессов, связанных с восприятием изображения себя и другого, в парадигме функционального покоя.
Ключевые слова: нейрокогнитивные исследования; свое и чужое лицо; ЭЭГ-корреляты; ковариаты; имплицитные когнитивные процессы; самовосприятие.
Для цитирования: Савостьянов А.Н., Вергунов Е.Г., Сапрыгин А.Е., Лебедкин Д.А. Апробация технологии оценки мимики лиц для изучения динамики функциональных состояний человека в ЭЭГ-парадигме покоя. Вавиловский журнал генетики и селекции. 2022;26(8):765-772. DOI 10.18699/VJGB-22-92
Аннотация
Аннотация. В настоящее время возможность спрогнозировать результат развития системы – залог успешного функционирования системы. Повышение качества и объема информации, усложнение ее представления, необходимость обнаруживать скрытые связи делают неэффективным, а чаще всего невозможным, применение классических статистических методов прогнозирования. Среди разнообразных методов прогнозирования особое место занимают методы, основанные на использовании искусственных нейронных сетей. Задачей нашей работы является создание нейронной сети, прогнозирующей риск возникновения депрессии у человека, с помощью данных, полученных при использовании системы тестирования показателей моторного контроля. Стоп-сигнал парадигма (ССП) – это экспериментальный метод, позволяющий оценить способность человека активировать целенаправленные движения или подавлять движения, ставшие неадекватными внешним условиям. В современной медицине ССП чаще всего применяется для диагностики двигательных нарушений, таких как болезнь Паркинсона или последствия инсульта. Мы предположили, что ССП может служить основой для выявления риска развития аффективных заболеваний, включая депрессию. В разрабатываемой нами нейронной сети предполагается комбинирование таких поведенческих показателей, как количество пропущенных ответов, количество правильных ответов, среднее время, количество верных торможений после появления стоп-сигнала. Такой набор показателей обеспечит повышенную точность прогнозирования наличия депрессии у человека. Реализованная в работе искусственная нейронная сеть позволяет по данным, полученным с помощью фиксации реакции на стимулы со стоп-сигналом, диагностировать риск возникновения депрессии. Разработана архитектура и реализована система тестирования показателей моторного контроля у человека, затем протестирована в реальных экспериментах. Проведено сравнение нейросетевых технологий и методов математической статистики. Реализована нейронная сеть для диагностирования риска возникновения депрессии по данным ССП. На примере данных с экспертной оценкой на наличие депрессии и результатов, полученных при использовании системы тестирования показателей моторного контроля, продемонстрирована эффективность нейронной сети (с точки зрения точности).
Ключевые слова: стоп-сигнал парадигма; искусственная нейронная сеть; система тестирования; риск возникновения депрессии; машинное обучение.
Для цитирования: Зеленских М.О., Сапрыгин А.Е., Таможников С.С., Рудыч П.Д., Лебедкин Д.А., Савостьянов А.Н. Разработка нейронной сети для диагностики риска возникновения депрессии по экспериментальным данным стоп-сигнал парадигмы. Вавиловский журнал генетики и селекции. 2022;26(8):773-779. DOI 10.18699/VJGB-22-93

Эволюционная компьютерная биология

Аннотация
Аннотация. Создание компьютерных моделей, имитирующих работу нервных систем живых организмов с учетом их морфологии и электрофизиологии, – один из важных и перспективных разделов вычислительной нейробиологии. При наличии возможности стремятся моделировать не только нервную систему, но и тело, мышцы, сенсорные системы и виртуальную трехмерную физическую среду, в которой можно наблюдать поведение организма и которая обеспечивает его сенсорные системы адекватными потоками данных, изменяющимися в ответ на движение организма. Для системы из сотен или тысяч нейронов еще можно надеяться задать необходимые параметры и получить функционирование нервной системы, более-менее сходное с таковым для живого организма, как, например, в недавней работе по моделированию головастика Xenopus. Однако наибольший интерес, как практический, так и фундаментальный, представляют организмы, обладающие зрением, более сложной нервной системой и, соответственно, значительно более развитыми когнитивными способностями. Определить структуру и параметры нервных систем таких организмов представляется исключительно сложной задачей. Более того, они изменяются с течением времени, в том числе под воздействием воспринимаемых ими потоков сенсорных сигналов и полученного жизненного опыта, включая последствия собственных действий при тех или иных обстоятельствах. Зная структуру нервной системы и число образующих ее нервных клеток хотя бы приблизительно, можно попытаться оптимизировать начальные параметры модели посредством искусственной эволюции, в процессе которой виртуальные организмы будут взаимодействовать и выживать – каждый под управлением собственной версии нервной системы. Помимо этого, эволюционировать могут и правила, по которым мозг изменяется на протяжении жизни организма. Данная работа посвящена созданию нейроэволюционного симулятора, способного осуществлять одновременное функционирование виртуальных организмов, обладающих зрительной системой, которые взаимодействуют между собой. Приведены расчеты, показывающие, сколько вычислительных ресурсов требуется для работы моделей физического тела организма, нервной системы и виртуальной среды обитания, а также определена производительность симулятора на современной настольной вычислительной системе в зависимости от числа одновременно моделируемых организмов.
Ключевые слова: нервная система; зрительная система; виртуальный организм; популяция; компьютерное моделирование; нейроэволюционный симулятор.
Для цитирования: Девятериков А.П., Пальянов А.Ю. Программная система на основе 3D симулятора для моделирования эволюции в популяции организмов, обладающих зрительной системой. Вавиловский журнал генетики и селекции. 2022;26(8):780-786. DOI 10.18699/VJGB-22-94
Аннотация
Аннотация. Фосфолипазы A2 (PLA2) способны гидролизовать sn-2 положение глицерофосфолипидов для высвобождения жирных кислот и лизофосфолипидов. Ферменты семейства фосфолипазы A2 широко распространены и присутствуют в большинстве клеток и тканей млекопитающих, выполняя функции регулятора метаболизма, поддержания мембранного гомеостаза, производства липидных медиаторов, ремоделирования мембран, активации воспалительных реакций. Соответственно, нарушение PLA2-регулируемого липидного метаболизма часто приводит к различным заболеваниям. В настоящем исследовании были систематически собраны и описаны 29 генов PLA2 в геноме человека на основе анализа литературных данных и изучения последовательностей. Анализ локализации генов PLA2 в геноме человека показал, что они расположены на 12 хромосомах человека и некоторые из них образуют кластеры. Оценка значений величины RVIS (оценка толерантности генов к мутациям, которые накапливаются в популяции человека) демонстрирует, что гены фосфолипаз A2 типа G4, входящие в один из двух наиболее крупных кластеров (четыре гена), наиболее толерантны к мутациям. Напротив, пониженную толерантность к мутациям имеют локализованные вне кластеров гены, кодирующие фосфолипазы A2 типа G6 (фосфолипазы A2 G6B, G6F, G6C, G6A). Мы проанализировали также связи между фосфолипазами A2 и заболеваниями человека по литературным данным, в результате чего выявлены связи 24 генов PLA2 со 119 заболеваниями, относящимися к 18 группам. Описано 229 связей «болезнь–ген» фосфолипазы A2. Показано, что белки фосфолипаз A2 типов G4, G2 и G7 вовлечены в наибольшее число заболеваний по сравнению с другими типами PLA2. С наибольшим числом типов PLA2 были связаны три группы заболеваний: новообразования, болезни системы кровообращения и болезни эндокринной системы. Филогенетический анализ показал, что общее происхождение устанавливается только для секреторных PLA2 (G1, G2, G3, G5, G10 и G12). Остальные типы PLA2 (G4, G6, G7, G8, G15 и G16) можно считать эволюционно независимыми. В результате проведенного анализа установлено, что наиболее толерантные к мутациям фосфолипазы A2 у человека (типы G4, G2 и G7) вовлечены в наибольшее количество групп заболеваний.
Ключевые слова: фосфолипаза А2; глицерофосфолипиды; заболевания человека.
Для цитирования: ТурнаевИ.И., Бочарникова М.Е., Афонников Д.А. Фосфолипазы A2 человека: функциональный и эволюционный анализ. Вавиловский журнал генетики и селекции. 2022;26(8):787-797. DOI 10.18699/VJGB-22-95
Аннотация
Аннотация. Принято считать, что при доместикации пищевых растений отбор шел на урожайность, технологичность переработки в продукты питания, устойчивость к патогенам и стрессовым воздействиям окружающей среды. При этом также могли оцениваться вкусовые качества продуктов питания растительного происхождения и их ценность для здоровья. Однако неясно, проводил ли человек в прошлом наряду с положительным отбором на полезные свойства растений одновременно отбор против таких вредоносных свойств, как способность вызывать аллергические реакции. Этот вопрос становится все более актуальным по мере роста аллергизации населения как вызова современной медицине. В связи с этим селекционерами уже ведутся интенсивные исследования по созданию гипоаллергенных форм пищевых растений. В этой работе рассмотрены альбумин, глобулин и β-амилаза мягкой пшеницы Triticum aestivum L. (1753), идентифицированные ранее как мишени для атак иммуноглобулинов класса Е человека. Нашей целью было найти на геномном уровне следы отрицательного отбора в прошлом против гипераллергенности трех белков (альбумин, глобулин и β-амилаза) при одомашнивании предковых форм современных пищевых растений. Для этого мы сфокусировали поиск на сайте связывания ТАТА-связывающего белка (ТВР) как локализованном в узком районе [–70; –20] относительно старта транскрипции, консервативном, необходимом для первичной инициации транскрипции и наиболее изученном регуляторном сигнале в геномах эукариот. Ранее нами был создан свободно доступный веб-сервис Plant_SNP_ TATA_Z-tester для оценки величин равновесной константы диссоциации (KD) комплексов ТВР с проксимальными промоторами генов растений по их последовательностям ДНК длиной 90 п.о. В настоящей работе с его помощью проанализированы 363 последовательности ДНК промоторов генов 43 видов растений. Обнаружено, что пищевые растения, в сравнении с непищевыми, характеризуются достоверно более низкой аффинностью ТBP к проксимальным промоторам их генов, гомологичных генам глобулина, альбумина и β-амилазы мягкой пшеницы как пищевых аллергенов (p < 0.01, Z-критерий Фишера). Это свидетельствует об отборе при доместикации пищевых растений в прошлом на снижение уровня данных аллергенных белков. Ключевые слова: пищевые аллергены; альбумин; глобулин; β-амилаза; ген; промотор; мягкая пшеница Triticum aestivum L. (1753); растения; TATA-связывающий белок; TATA-бокс; доместикация; отбор; оценки in silico.
Для цитирования: Вишневский О.В., Чадаева И.В., Шарыпова Е.Б., Хандаев Б.М., Золотарева К.А., Казачек А.В., Пономаренко П.М., Подколодный Н.Л., Рассказов Д.А., Богомолов А.Г., Подколодная О.А., Савинкова Л.К., Землянская Е.В., Пономаренко М.П. Промоторы генов, кодирующих β-амилазу, альбумин и глобулин пищевых растений в сравнении с непищевыми, характеризуются более низкой аффинностью к ТАТА-связывающему белку: in silico анализ. Вавиловский журнал генетики и селекции. 2022;26(8):798-805. DOI 10.18699/VJGB-22-96

Компьютерная геномика

Аннотация
Abstract. The development of next generation sequencing (NGS) methods has created the need for detailed analysis and control of each protocol step. NGS library preparation protocols may include steps with incorporation of various service sequences, such as sequencing adapters, primers, sample-, cell-, and molecule-specific barcodes. Despite a fairly high level of current knowledge, during the protocol development process researches often have to deal with various kinds of unexpected experiment outcomes, which result either from lack of information, lack of knowledge, or defects in reagent manufacturing. Detection and analysis of service sequences, their distribution and linkage may provide important information for protocol optimization. Here we introduce FastContext, a tool designed to analyze NGS read structure, based on sequence features found in reads, and their relative position in the read. The algorithm is able to create human readable read structures with user-specified patterns, to calculate counts and percentage of every read structure. Despite the simplicity of the algorithm, FastContext may be useful in read structure analysis and, as a result, can help better understand molecular processes that take place at different stages of NGS library preparation. The project is open-source software, distributed under GNU GPL v3, entirely written in the programming language Python, and based on well-maintained packages and commonly used data formats. Thus, it is cross-platform, may be patched or upgraded by the user if necessary. The FastContext package is available at the Python Package Index (https://pypi. org/project/FastContext), the source code is available at GitHub (https://github.com/regnveig/FastContext).
Key words: next generation sequencing; NGS; adapters; patterns search; read analysis.
For citation: Viesná Е., Fishman V. FastContext: A tool for identification of adapters and other sequence patterns in next generation sequencing (NGS) data. Vavilovskii Zhurnal Genetiki i Selektsii=Vavilov Journal of Genetics and Breeding. 2022;26(8):806-809. DOI 10.18699/VJGB-22-97
Аннотация
Abstract. Many plants and animals have symbiotic relationships with microorganisms, including bacteria. The interactions between bacteria and their hosts result in different outcomes for the host organism. The outcome can be neutral, harmful or have beneficial effects for participants. Remarkably, these relationships are not static, as they change throughout an organism’s lifetime and on an evolutionary scale. One of the structures responsible for relationships in bacteria is O-antigen. Depending on the characteristics of its components, the bacteria can avoid the host’s immune response or establish a mutualistic relationship with it. O-antigen is a key component in Gram-negative bacteria’s outer membrane. This component facilitates interaction between the bacteria and host immune system or phages. The variability of the physical structure is caused by the genomic variability of genes encoding O-antigen synthesis components. The genes and pathways of O-polysaccharide (OPS) synthesis were intensively investigated mostly for Enterobacteriaceae species. Considering high genetic and molecular diversity of this structure even between strains, these findings may not have caught the entire variety possibly presented in non-model species. The current study presents a comparative analysis of genes associated with O-antigen synthesis in bacteria of the Oxalobacteraceae family. In contrast to existing studies based on PCR methods, we use a bioinformatics approach and compare O-antigens at the level of clusters rather than individual genes. We found that the O-antigen genes of these bacteria are represented by several clusters located at a distance from each other. The greatest similarity of the clusters is observed within individual bacterial genera, which is explained by the high variability of O-antigens. The study describes similarities of OPS genes inherent to the family as a whole and also considers individual unique cases of O-antigen genetic variability inherent to individual bacteria.
Key words: O-antigen gene clusters; lipopolysaccharide genes; comparative analysis; O-antigen; Oxalobacteraceae; Massilia; Collimonas; Janthinobacterium; saccharide gene cluster.
For citation: Afonnikova S.D., Komissarov A.S., Kuchur P.D. Unique or not unique? Comparative genetic analysis of bacterial O-antigens from the Oxalobacteraceae family. Vavilovskii Zhurnal Genetiki i Selektsii=Vavilov Journal of Genetics and Breeding. 2022;26(8):810-818. DOI 10.18699/VJGB-22-98
Аннотация
Аннотация. МикроРНК – это малые некодирующие РНК, которые регулируют экспрессию генов на посттранскрипционном уровне в цитоплазме, и, таким образом, играют важную роль в большом числе биологических процессов. Последние исследования обнаружили присутствие последовательностей микроРНК не только в цитоплазме, но и внутри митохондрий. Такие микроРНК (так называемые митомиры, mitomiRs) могут иметь ядерное или митохондриальное происхождение, при этом для некоторых из них установлена роль в регулировании функций митохондриальных генов, а для большинства – она пока неизвестна. Выявление нуклеотидных сигналов, уникальных для митомиров, может помочь определить эту роль. В нашей работе составлена выборка экспериментально обнаруженных митомиров человека, мыши и крысы. С целью выделения сигналов, которые могут быть ответственны за функционирование митомиров и за их транспортировку в митохондрии или из них, осуществлен контекстный анализ для полученных последовательностей митомиров. Для трех видов в группе данных митомиры/не-митомиры и в группе всех микроРНК из базы miRBase выявлены статистически перепредставленные 8-буквенные мотивы (уровень значимости p<0.01, с учетом поправки Бонферрони на множественность сравнения). Для этих мотивов обнаружены закономерности их локализации в функционально значимых участках для разных типов микроРНК. Для рассматриваемой группы митомиры/не-митомиры также обнаружены статистически значимые особенности нуклеотидного состава последовательностей микроРНК возле границ разрезания комплексами Drosha/Dicer (критерий независимости χ2 Пирсона для первых трех позиций микроРНК с уровнем значимости p<0.05). Наблюдаемые частоты нуклеотидов, предположительно, могут указывать на наличие у митомиров (в сравнении с не-митомирами) более однородного разрезания прай-миРНК комплексом Drosha при формировании 5’-конца последовательностей. Результаты работы могут быть полезными для выявления сигналов, принимающих участие в возникновении, процессинге и функциях митомиров. Ключевые слова: микроРНК; пре-миРНК; митомир; митохондрия.
Для цитирования: Вишневский О.В., Ворожейкин П.С., Титов И.И. Контекстные сигналы в митохондриальных микроРНК млекопитающих. Вавиловский журнал генетики и селекции. 2022;26(8):819-825. DOI 10.18699/VJGB-22-99
Аннотация
Аннотация. Многие научные статьи стали доступны в цифровом виде, что позволяет запрашивать данные статей и, в частности, автоматически собирать метаданные, включая данные об аффилиации. Это, в свою очередь, можно использовать для количественных оценок научной области, например для идентификации организаций и анализа графа соавторства этих организаций для извлечения базовой структуры науки. В настоящей работе рассмотрена область исследования микроРНК, а именно граф соавторства организаций и анализ его эволюции. Чтобы решить проблему вариативности написания названия организаций, был предложен алгоритм сортировки логических векторов признаков k-mer/n-gram. В нем используется тот факт, что содержание аффилиации довольно консистентно для одной и той же организации. Для учета ошибок написания и других артефактов названия организации в поле метаданных аффилиации наш подход преобразует упоминание организации внутри аффилиации в K-Mer (n-gram) булевый вектор присутствия. Далее векторы всех аффилиаций из набора данных лексикографически сортируются, образуя группы упоминаний организаций. Таким подходом был кластеризован набор данных аффилиаций в области исследования микроРНК и определены названия уникальных организаций, что позволило построить граф соавторства на уровне научных организаций. С помощью этого графа показано, что рост области исследования микроРНК контролируется архитектурой малого мира сети научных организаций и испытывает степенной рост с показателем степени 2.64±0.23 для числа организаций в соответствии с диаметром сети, предлагая модель роста новых научных направлений. Скорость публикации первой статьи по микроРНК у организации при ее взаимодействии с другой организацией, уже публиковавшейся в этой области, аппроксимируется как 0.184±0.002 год–1.
Ключевые слова: k-mer; n-gram; миРНК; электронная библиотека; соавторство организаций; малый мир.
Для цитирования: ФирсовА.Б., Титов И.И. Свойства малого мира научных организаций определяют динамику публикационной активности в области миРНК. Вавиловский журнал генетики и селекции. 2022;26(8):826-829. DOI 10.18699/VJGB-22-100

Все статьи в формате pdf