Программа для расчета значений совместной встречаемости пар биологических объектов из онтологии ЭНДСистем в текстах рефератов научных публикаций (ЭНДМатч / ANDMatch)

Патентообладатель: ФГБНУ «ФИЦ ИЦиГ СО РАН»

Авторы:

Иванисенко В.А., Деменков П.C., Иванисенко Т.В.

Краткая характеристика:

Программа предназначена для расчёта значений совместной встречаемости пар биологических объектов из онтологии ANDSystem в текстах рефератов научных публикаций. Расчет частоты встречаемости для каждой пары объектов формируется из значений всех текстов рефератов, где данные объекты встречаются, а также числа отдельных предложений текстового корпуса с их совместным упоминанием. Программа работает более чем с 18 млн. биологических единиц из онтологии ANDSystem, разделенных на 13 типов: белки, гены, клеточные линии, клеточные компоненты, заболевания, лекарства, побочные действия лекарств, метаболиты, микроРНК, молекулярные функции, организмы, фенотипы, и биологические пути. Подробнее…

Области возможного использования:

Информация о ассоциативных взаимодействиях, получаемая на основе разработанной программы, может иметь широкий спектр применения при решении различных задач генетики, фармакологии, биоинформатики, а также других областей биологии и биомедицины.

Степень готовности разработки к практическому применению:

Программа готова к практическому применению.

Возможный технический и (или) экономический эффект

Основной экономический эффект от внедрения разработанной программы заключается в автоматизации процесса реконструкции ассоциативных генных сетей посредствам установления новых взаимодействий между биологическими объектами из онтологии. В частности, данная программа может иметь широкое применение при решении задач поиска ассоциаций между молекулярно-генетическими объектами и реконструкции ассоциативных генных сетей, что является одной из стадий при интерпретации экспериментальных данных, поиска новых лекарственных мишеней. Кроме того, применение информации об ассоциативных взаимосвязях между биологическими объектами из онтологии является важным шагом при разработке систем интеллектуального поиска релевантной научной литературы.

Сравнительные характеристики с известными разработками

В качестве примеров программ, обладающих схожестью функционала с данной разработкой, можно привести системы реконструкции ассоциативных генных сетей STRING (https://string-db.org), Pathway Studio (https://www.pathwaystudio.com), и ANDSystem (https://www-bionet.sscc.ru/and/cell) разработанную в ИЦиГ СО РАН. При этом главным преимуществом нашей программы по сравнению с STRING и Pathway Studio, является использование уникальной онтологии, позволяющей осуществлять расчет совстречаемости для 13 различных типов биологических объектов, в то время как, например, в STRING используется всего один тип – белки. В то же время несмотря на то, что система ANDSystem использует такую же онтологию, как и разработанная программа, различие заключается в другом подходе к установлению взаимосвязей между объектами, так используемый нами метод на основе совстречаемости позволяет выявлять значительно большее количество ассоциативных взаимодействий, чем подход на основе правил и шаблонов, реализованный в ANDSystem.

Патентная защита разработки: Свидетельство о регистрации № 2021664006, зарегистрирована в Реестре ПрЭВМ 27.08.2021, дата поступления заявки: 17.08.2021.