Разработчик
ФГБНУ ФИЦ ИЦиГ СО РАН
Авторы
Пронозин А.Ю., Афонников Д.А.
Краткая характеристика
Программа представляет собой инструмент для сборки и анализа пан-транскриптома — совокупности всех РНК-транскриптов, присутствующих у представителей данного вида. Алгоритм работы состоит из трех основных этапов: сборки транскриптома с использованием трех различных методов, объединения полученных результатов в единую сборку с разделением транскриптов на кодирующие и некодирующие и финальная сборка и анализ пан-транскриптомов для мРНК и днРНК. Для работы программе требуются библиотеки, полученные в результате секвенирования, референсный геном с аннотацией, а также наборы известных мРНК и днРНК. Итоговым результатом работы является собранный пан-транскриптом исследуемого вида. Он состоит из двух проанализированных частей (кодирующей и некодирующей) и включает в себя как известные, так и новые последовательности мРНК и днРНК с их аннотацией.
Области возможного использования
Программа может быть использована для сборки траснкриптомов, а также биоинформатического анализа днРНК в геномах любых организмов.
Степень готовности разработки к практическому применению
Программа готова к практическому применению. Доступ к данным возможен по запросу.
Возможный технический и (или) экономический эффект
Улучшенная автоматизация процесса расчета, возможность поиска новых последовательностей днРНК и мРНК, более точные подход к выявлению днРНК.
Сравнительные характеристики с известными разработками
На сегодняшний день существует достаточное количество программ направленных на сборку пан-геномов и пан-транскриптомов. Однако большинство из них созданы для узких задач. Например, PGAP осуществляет масштабный поиск генов, проводит функциональную аннотацию, обогащение кластеров ортологичных генов терминами онтологии, но не производит саму сборку пан-генома. Пакет программ PpsPCP разработан для идентификации вариаций наличия/отсутствия генов (PAV) в пан-геномах, но не позволяет проводить анализ ортологичных генов. Программа panX позволяет идентифицировать кластеры ортологичных генов. Но не позволяет проводить оценку состава пан-генома на основе экспрессии генов в различных организмах. Более тогда, не одна программа не позволяет предсказывать и анализировать днРНК в масштабах пан-транскриптома.
Предложенная нами программа PTA позволяет собирать пан-транскриптом любых организмов с нуля, проводить его разделение на кодирующую и некодирующую части. Это дает возможность пользователям независимо оценить как мРНК так и днРНК. Также программа проводит сборку транскриптома сразу тремя независимыми сборщиками (Trinity, Spades, Trinity-GG). Это позволяет компенсировать недостатки отдельных сборщиков, улучшая общее качество сборки.
Защита разработки
Свидетельство о регистрации №2026619210 зарегистрирована в Реестре ПрЭВМ 01.04.2026, Бюл. № 4, дата поступления заявки: 2026617577 19.03.2026
