
Свежую технологию стереозрения Un-ViTAStereo, представленную интернациональной группой ученых из МФТИ, ждет большое будущее! Она вычисляет дистанцию до объектов, обходясь без затратных лидаров и ручной разметки для обучения. Показав удивительную точность там, где современные алгоритмы "слепнут": у гладких стен, в густой листве или тумане, технология открывает новые горизонты для безопасности автономных машин и роботов.
Как мы и машины видим глубину
Наш мозг каждую секунду создает 3D-карту мира, сравнивая изображения от левого и правого глаза. Стереосистемы машин работают похоже, используя камеры и алгоритмы вместо глаз и мозга.
Традиционные сложности
Но старые методы часто дают сбои. На идеально белой стене или участках с повторяющимся узором алгоритмам не хватает визуальных различий для корректного сопоставления изображений. Ручная разметка расстояний выручает, но весьма ограниченно.
Решение: умный наставник Depth Anything V2
Новый фреймворк преодолевает барьеры! Его секрет – "наставник" Depth Anything V2. Эта модель оценивает относительную глубину по одному изображению, распознавая тени, перспективу и наложение объектов, безошибочно определяя, что ближе, а что дальше. Алгоритм учит стереосистему, отбирая только те ее предсказания, которые совпадают с подсказками Depth Anything V2, постоянно повышая точность.
Три шага к безупречной карте глубины
Работа системы включает три ключевых этапа: 1. Алгоритм DDCV (Оценки диспаратности) проверяет каждый пиксель на соответствие подсказкам "наставника", помечая их цветом (верно/ошибка). 2. Функция потерь LDR (Локальное ранжирование глубины) находит "зеленые" пиксели-маяки вокруг ошибок и корректирует неточные точки. 3. Алгоритм DDS (Двойная функция потерь сглаживания диспаратности) выстраивает четкие контуры: убирает шум на однородных участках и сохраняет детали на границах, следуя указаниям "наставника".
Убедительные результаты на KITTI 2015
Тестирование на стандартных датасетах подтвердило феноменальное превосходство Un-ViTAStereo! На сложном тесте для беспилотников KITTI 2015 частота грубых ошибок упала до всего 5%. Это означает снижение количества опасных ошибок в определении расстояния до объектов (таких как бордюр или пешеход) на впечатляющие 23% во время движения.
Будущее: самообучение и супер-точность
Un-ViTAStereo – это только старт! Ученые намерены создать на ее основе самообучающуюся нейросеть, адаптирующуюся к любым условиям: городским улицам или заводским цехам. Плюс, использование редких, но сверхточных замеров лидаров в качестве "супер-маяков" обещает еще более высокую точность в будущем.
Источник: biz.cnews.ru





