МФТИ представил Un-ViTAStereo: революция в стереозрении роботов

«Сбер» перешел на российское решение для анализа кода — Источник: www.cnews.ru/

Свежую технологию стереозрения Un-ViTAStereo, представленную интернациональной группой ученых из МФТИ, ждет большое будущее! Она вычисляет дистанцию до объектов, обходясь без затратных лидаров и ручной разметки для обучения. Показав удивительную точность там, где современные алгоритмы "слепнут": у гладких стен, в густой листве или тумане, технология открывает новые горизонты для безопасности автономных машин и роботов.

Как мы и машины видим глубину

Наш мозг каждую секунду создает 3D-карту мира, сравнивая изображения от левого и правого глаза. Стереосистемы машин работают похоже, используя камеры и алгоритмы вместо глаз и мозга.

Традиционные сложности

Но старые методы часто дают сбои. На идеально белой стене или участках с повторяющимся узором алгоритмам не хватает визуальных различий для корректного сопоставления изображений. Ручная разметка расстояний выручает, но весьма ограниченно.

Решение: умный наставник Depth Anything V2

Новый фреймворк преодолевает барьеры! Его секрет – "наставник" Depth Anything V2. Эта модель оценивает относительную глубину по одному изображению, распознавая тени, перспективу и наложение объектов, безошибочно определяя, что ближе, а что дальше. Алгоритм учит стереосистему, отбирая только те ее предсказания, которые совпадают с подсказками Depth Anything V2, постоянно повышая точность.

Три шага к безупречной карте глубины

Работа системы включает три ключевых этапа: 1. Алгоритм DDCV (Оценки диспаратности) проверяет каждый пиксель на соответствие подсказкам "наставника", помечая их цветом (верно/ошибка). 2. Функция потерь LDR (Локальное ранжирование глубины) находит "зеленые" пиксели-маяки вокруг ошибок и корректирует неточные точки. 3. Алгоритм DDS (Двойная функция потерь сглаживания диспаратности) выстраивает четкие контуры: убирает шум на однородных участках и сохраняет детали на границах, следуя указаниям "наставника".

Убедительные результаты на KITTI 2015

Тестирование на стандартных датасетах подтвердило феноменальное превосходство Un-ViTAStereo! На сложном тесте для беспилотников KITTI 2015 частота грубых ошибок упала до всего 5%. Это означает снижение количества опасных ошибок в определении расстояния до объектов (таких как бордюр или пешеход) на впечатляющие 23% во время движения.

Будущее: самообучение и супер-точность

Un-ViTAStereo – это только старт! Ученые намерены создать на ее основе самообучающуюся нейросеть, адаптирующуюся к любым условиям: городским улицам или заводским цехам. Плюс, использование редких, но сверхточных замеров лидаров в качестве "супер-маяков" обещает еще более высокую точность в будущем.

Источник: biz.cnews.ru

МФТИ представил Un-ViTAStereo: революция в стереозрении роботов

Как мы и машины видим глубину

Традиционные сложности

Решение: умный наставник Depth Anything V2

Три шага к безупречной карте глубины

Убедительные результаты на KITTI 2015

Будущее: самообучение и супер-точность

Другие новости:

Популярные новости