Программа для оценки значимости обогащения длины перекрывания двух полногеномных разметок (ОДПР/AreaSonic)

Разработчик

ФГБНУ ФИЦ ИЦиГ СО РАН

Авторы

Левицкий В.Г.

Краткая характеристика

Программа AreaSonic предназначена для оценки значимости обогащения длины перекрывания двух полногеномных разметок. Входные данные программы включают две полногеномные разметки в формате bed, и указание на выпуск полного генома. Программа рассчитывает вероятность того, что наблюдаемая длина перекрывания двух разметок является следствием случайных причин. Программа содержит блок оценки расчёта длины перкрывания двух разметок, блок генерации пермутации одной разметки, и блок расчёта значимости перекрывания. Сначала программа вычисляет наблюдаемую длину перекрывания входных разметок. Затем производится первая итерация алгоритма, которая включает пермутацию одной из разметок. Пермутация включает случайные перестановки всех участков разметки и спейсеров между ними. В конце итерации вычисляется длина перекрвания двух разметок, не тронутой и тронутой пермутацией. По множеству итераций подсчитывается средняя длина перекрывания и её среднеквадратичное отклонение. По этим двум величинам на основе модели ожидаемого нормального распределения длины перекрывания разметок оценивается значимость обогащения длины перекрывания двух входных разметок.

Области возможного использования

Программа может быть использована  в биоинформатике и генетике для выявления обогащения отдельных мотивов или для поиска обогащённых мотивов с помощью подхода de novo.

Степень готовности разработки к практическому применению

Программа готова к практическому применению.

Возможный технический и (или) экономический эффект

Экономия средств при анализе результатов полногеномных экспериментов.

Сравнительные характеристики с известными разработками

В работе https://doi.org/10.1093/nar/gky474 представлено несколько аналогов, однако эти модели существенно более грубы, чем модель AreaSonic. В работе https://doi.org/10.1093/bioinformatics/btz810 представлена схожая модель, однако она использует более сложную модель негативного биномиального распределения. Обе работы были опубликованы позднее публикаций по применению модели AreaSonic https://doi.org/10.1371/journal.pone.0157147 и http://dx.doi.org/10.2174/1389202917666160512164913.

Защита разработки

Свидетельство о регистрации №2023660669, зарегистрирована в Реестре ПрЭВМ 23.05.2023. Номер и дата поступления заявки: 2023619070 10.05.2023 Бюл. № 6.