Новый ИИ от Сколтеха предсказывает опасные мутации в белках с высокой точностью


Прорыв в предсказании мутаций

scientificrussia.ru
Фото: scientificrussia.ru

Ученые Сколтеха, МФТИ и их индийские партнеры разработали инновационный подход для создания систем искусственного интеллекта. Эти системы способны точно определять, какие изменения в структуре белков могут нанести вред организму.

Сложности изучения белков

Белки, состоящие из тысяч аминокислот, формируют сложные трехмерные структуры. Пока не существует полного понимания правил, по которым происходит сворачивание белка из его линейной последовательности. Из-за этого определение структуры требует трудоемких методов: компьютерного моделирования или кристаллографии с использованием мощных рентгеновских установок.

Такие подходы не позволяют эффективно прогнозировать последствия генетических "опечаток". Поиск значимых мутаций остается медленным и дорогостоящим процессом.

Инновационный подход BorodaTM

Совместная работа российских и индийских исследователей привела к созданию методики, использующей искусственный интеллект для анализа белковых мутаций. Ее ядро – система машинного обучения BorodaTM.

Как поясняет Петр Попов из Сколтеха, ключевая идея – комбинирование данных об аминокислотной последовательности (1D) и трехмерной структуре белков (3D). Это позволяет выявлять мутации в мембранных белках, напрямую связанные с развитием заболеваний.

Принцип работы ИИ

BorodaTM анализирует как линейную, так и пространственную структуру известных белков, классифицируя мутации на полезные, нейтральные и вредные, и выявляя закономерности. Алгоритм учитывает не только положение мутации в ДНК, но и ее влияние на физико-химические свойства белка: гидрофильность, полярность, количество водородных связей и общую стабильность молекулы. Это обеспечивает высокую скорость и точность обучения для прогнозирования эффектов мутаций в новых белках.

Успешное тестирование

Для демонстрации возможностей BorodaTM ученые сосредоточились на трансмембранных белках. Эти молекулы, встроенные в клеточные мембраны, критически важны для передачи сигналов, а их повреждения часто приводят к тяжелым болезням.

Обучение системы проводилось на данных о примерно 72 таких белках, включающих 400 вредных и 150 безопасных мутаций. Несмотря на относительно небольшой объем данных, BorodaTM достигла впечатляющей точности в 72% при прогнозировании характера произвольных мутаций.

Перспективы развития

Уже сейчас BorodaTM демонстрирует превосходство над другими ИИ-системами в анализе трансмембранных белков. Исследователи уверены, что расширение обучающей выборки мутаций и белков позволит значительно повысить точность алгоритма. Аналогичная адаптация поможет устранить текущее отставание в работе с растворимыми белками.

Этот прорывной подход открывает путь к более быстрому и экономичному поиску патогенных мутаций, а также к обнаружению полезных генетических вариаций, что сулит большие перспективы для биомедицины.

Изображение: rost9/Фотобанк RU.123.RF

Источник: scientificrussia.ru

Популярные новости