«Программный комплекс для переноса позиций SNP-маркеров между различными версиями геномных сборок (SNPfix)»

Разработчик

ФГБНУ ФИЦ ИЦиГ СО РАН

Авторы

Афонникова С.Д., Киселёва А.А., Леонова И.Н., Салина Е.А.

Краткая характеристика

Программный комплекс (ПК) предназначен для переноса позиций однонуклеотидных полиморфизмов (SNP) с одной геномной сборки на другую, включая геномы близкородственных видов любых организмов, для которых доступны последовательности генома. ПК включает три основных этапа. На первом этапе по координатам SNP в исходной геномной сборке, формируется FASTA‑файл с последовательностями, фланкирующими каждый SNP. На втором этапе эти последовательности выравниваются на целевой геном с использованием BLAST, при этом для каждого маркера выбирается наиболее надежное выравнивание. По результатам выравнивания вычисляются новые позиции SNP относительно целевой сборки. В результате работы программа формирует текстовый файл с новыми позициями SNP. Для запуска ПК необходимы исходная и целевая геномные сборки, а также файл с координатами SNP в формате «Название маркера», «Хромосома», «Позиция».

Области возможного использования

ПК может быть использован в биоинформатике и генетике.

Степень готовности разработки к практическому применению

Программа готова к практическому применению. Доступ к программе возможен по запросу.

Возможный технический и (или) экономический эффект

SNPfix позволяет автоматизировать перенос координат SNP между геномными сборками, что значительно сокращает время обработки по сравнению с ручной перекодировкой или переписыванием скриптов под каждый чип или сборку. Унифицированный алгоритм позволяет использовать данные устаревших микрочипов на обновленных геномных сборках.

Сравнительные характеристики с известными разработками

По сравнению с SNPLift (https://github.com/enormandeau/snplift), SNPfix компактнее, поддерживает межвидовой перенос координат и имеет унифицированный Nextflow‑интерфейс. В отличие от UCSC LiftOver (https://genome.ucsc.edu/cgi-bin/hgLiftOver) и CrossMap (https://crossmap.sourceforge.net/), SNPfix автоматически генерирует последовательности, фланкирующие позицию SNP, и не требует предварительно подготовленных файлов, содержащих результат попарного выравнивания двух геномных сборок на уровне координат, что особенно ценно при работе с новыми сборками.

Защита разработки

Свидетельство о регистрации № 2026616205 , зарегистрирована в Реестре баз данных 04.03.2026, Бюл. № 3, Номер и дата поступления заявки: 2026614097 16.02.2026.