Разработчик
ФГБНУ ФИЦ ИЦиГ СО РАН
Авторы
Иванисенко Т.В., Деменков П.С., Иванисенко В.А.
Краткая характеристика
Разработанная программа предназначена для автоматизированного предсказания взаимосвязей между парами вершин графа на основании их эмбеддинга. Под эмбеддингом подразумевается векторное представление каждой пары, содержащее данные о типах вершин, их окружении, а также статистические значения (p—value) их совместного упоминания в научной литературе. Прогнозирование выполняется программой с помощью бинарного классификатора, являющегося нейронной сетью — многослойным перцептроном.
Результат работы программы представляет собой число в диапазоне от нуля до единицы, отражающее вероятность наличия взаимодействия между рассматриваемой парой узлов. Ноль указывает на полное отсутствие взаимодействия, а единица, наоборот, демонстрирует максимальную вероятность наличия ассоциативной связи между парой.
Программа позволяет проводить быстрый масштабный анализ больших графов, размеры которых могут достигать сотен тысяч узлов и более, за непродолжительное время. При этом программа не требует больших вычислительных ресурсов, все рассчёты могут выполняться на процессоре обычного персонального компьютера.
Области возможного использования
Программа может быть использована в следующих областях:
- биология и биотехнологии — для выявления и анализа взаимосвязей между
- биологическими объектами (генами, белками, метаболитами и т.д.), включая предсказание новых взаимодействий, информация о которых в литературе отсутствует;
- биомедицина — для изучения молекулярных механизмов развития заболеваний, поиска новых мишеней для терапии;
- фармакология — для предсказания побочных эффектов лекарственных препаратов, основанного на анализе взаимодействий компонентов препарата с биомолекулами;
- химия — для моделирования химических реакций и прогнозирования свойств новых соединений, а также в других областях, связанных с анализом больших графов.
Степень готовности разработки к практическому применению
Программа готова к практическому применению.
Возможный технический и (или) экономический эффект
Основной экономический эффект от внедрения разработанной программы заключается в сокращении временных и финансовых затрат на исследование взаимосвязей; повышении скорости и точности прогнозирования по сравнению с другими существующими методами; возможности анализа больших объемов данных за приемлемое время, без необходимости использования дорогостоящего оборудования; снижение рисков, связанных с непредсказуемыми нежелательными эффектами (например, при дизайне новых штаммов промышленно значимых микроорганизмов-продуцентов); повышение эффективности процессов за счет использования более точной информации о взаимосвязях объектов.
Сравнительные характеристики с известными разработками
Среди аналогов программы «ЭНДИнтерПредикт», обладающих частично схожим функционалом, можно выделить программы для реконструкции ассоциативных генных сетей. Например, систему «ANDSystem», (https://www-bionet.sscc.ru/andvisio/#!/app/about). При этом, в виду того, что взаимосвязи в ассоциативной сети ANDSystem устанавливаются на основе автоматического анализа текстов, а также внешних баз данных, данная система не может быть использована для предсказания новых, ранее неизвестных взаимодействий. Кроме того, «ЭНДИнтерПредикт» позволяет работать с графами произвольной природы, в то время как ANDSystem ориентирован на анализ молекулярно-биологических взаимодействий. Другим примером является пакет «GraphSAGE» (https://github.com/williamleif/graphsage-simple), ориентированной на обучение представлений вершин графа и предсказания их свойств, включая взаимодействия на основе этой информации. В отличие от «GraphSAGE», нейронная сеть в программе «ЭНДИнтерПредикт» дополнительно использует информацию о со-встречаемости объектов в литературе, что обеспечивает ей более высокую точность предсказаний.
Защита разработки
Свидетельство о госрегистрации № 2023681900 , дата регистрации 19.10.2023.