Программный комплекс для поиска мотивов в данных полногеномного картирования сайтов связывания транскрипционных факторов ChIP-seq (SiteGA)

Разработчик

ФГБНУ ФИЦ ИЦиГ СО РАН

Авторы

Левицкий В.Г., Цуканов А.В.

Краткая характеристика

Программный комплекс (ПК) предназначен для поиска мотивов, представляющих сайты связывания транскрипционных факторов (ТФ), на основе набора пиков ChIP-seq. ПК производит поиск модели для картирования мотивов, включающей набор локально-позиционированных динуклеотидов, расположенных в пределах участков длины мотива в пиках и расположения этих участков в пиках. ПК содержит блоки перекрестных тестов для выбора параметров модели, обучения модели, установки её порогов, сканирования тестовой ДНК.

Области возможного использования

ПК может быть использован в биоинформатике для картирования в геномной ДНК сайтов связывания, не соответствующих результатам применения традиционных моделей поиска мотивов.

Степень готовности разработки к практическому применению

ПК готов к практическому применению.

Возможный технический и (или) экономический эффект

Выявление неизвестных ранее сайтов связывания транскрипционных факторов (белков, регулирующих экспрессию генов на этапе транскрипции).

Сравнительные характеристики с известными разработками

Оценки точности распознавания сайтов показывала, что в целом метод SiteGA уступает традиционному методу позиционно-весовых матриц (ПВМ). Однако, распознанные методом SiteGA сайты имеют структуру, значительно отличающуюся от таковой для метода ПВМ, поэтому совместное применение методов SiteGA и ПВМ позволяет полнее охарактеризовать природное разнообразие сайтов.

Защита разработки

Свидетельство о регистрации № 2021616695, зарегистрирована в Реестре баз данных 26.04.2021.