«Программа для обработки данных, полученных генотипированием путем секвенирования (ГПС-ОД) / (GBS-DP)»

Разработчик

ФГБНУ ФИЦ ИЦиГ СО РАН

Авторы

Пронозин А.Ю., Афонников Д.А., Салина Е.А.

Краткая характеристика

Программа GBS-DP предназначена для поиска и анализа однонуклеотидных полиморфизмов на основе данных, полученных генотипированием путем секвенирования (ГПС). Программа проводит предварительную обработку данных, поиск полиморфизмов, кластеризацию и построение филогенетического дерева исследуемых образцов на основе обнаруженных полиморфизмов. Входные данные программы включают сырые прочтения образцов, полученные методом ГПС и рефересный геном исследуемого организма. Результатами работы программы GBS-DP являются статистические характеристики библиотек сырых прочтений, список выявленных полиморфизмов для проанализированных библиотек (однонуклеотидные, делеции/вставки и т.д), данные по генетическому разнообразию проанализированных образцов (диаграмма главных компонент и филогенетическое дерево).

Области возможного использования

Программа может быть использована для биоинформатического анализа данных ГПС.

Степень готовности разработки к практическому применению

Программа готова к практическому применению.

Возможный технический и (или) экономический эффект

Улучшенная автоматизация процесса расчета, возможность быстрого расчета большого объема данных.

Сравнительные характеристики с известными разработками

Существующие конвейеры имеют схожую схему анализа данных: (1) проверка качества сырых прочтений, (2) демультиплексирование данных, (3) картирование на геном, (4) поиск полиморфизмов. Вследствие схожести этапов обработки данных, существующие конвейеры в основном отличаются комбинацией программ.  Подобные комбинации программ должны учитывать различные геномные характеристики, такие как количество выявленных полиморфизмов, сложность генома, степень гетерозиготности, доля повторяющихся последовательностей во всем геноме. Таким образом, для некоторых конвейеров комбинации программ и их параметры подобраны для определенных организмов, в остальных конвейерах используются универсальные параметры для любых организмов. Вследствие постоянного роста количества секвенированных библиотек конвейеры должны предоставлять возможность обработки большого объема данных — более 400 образцов за один запуск. Также важным аспектом конвейеров является автоматизация процесса обработки и простота установки данной программы. Биоинформатический конвейер GBS-DP разработан для анализа данных, полученных методом ГПС. Конвейер применим для любых видов организмов. Конвейер позволяет обрабатывать большие объемы данных (более 400 образцов) и реализован с помощью программного менеджера.

Защита разработки

Свидетельство о регистрации № 2023665263, зарегистрирована в Реестре баз данных 13.07.2023, Бюл. № 7 , Заявка №  2023664117 , дата поступления заявки:  04.07.2023.