Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института опубликовали описание новой технологии компьютерного зрения. Детально ее представят на конференции по обучению роботов в Цюрихе, в октябре. Но уже сегодня понятно, что это прорыв – такого робота не нужно учить распознавать образы классическим методом.
Ученые отказались от идеи загружать в память робота данные об объектах, которые он потом пытается «увидеть» в окружающем мире. Вместо этого машина принципиально абстрагирована от своего окружения, она воспринимает все вокруг как трехмерные модели из взаимосвязанных точек. Робот сам сканирует предмет, строит его модель, записывает данные себе в память и присваивает им ярлык. Ему неважно, что это такое на самом деле, но он это уже осмотрел и готов отыскать вновь.
Самое важное в том, что робот видит не образ объекта, а оперирует его математической моделью, которую можно разделить на части, изменить их параметры, взглянуть под разными углами и т.д. И поэтому он может «увидеть» аналогичные объекты, даже если они развернуты, частично скрыты, перекрашены, поломаны и т.д. Он по-прежнему не знает их свойств, не понимает, что с ними делать и как использовать эту информацию, но ведь на данном этапе речь идет всего лишь о системе зрения, а не новой платформе.
На самом деле обучать подобного робота все же нужно, если мы хотим поручить ему работу. Например, чтобы собирал стол из досок, а не создавал доски из уже готового стола. Однако ему не надо будет рассказывать, где в мастерской лежат доски и крепеж – увидев их однажды, он сможет отыскать нужные предметы самостоятельно.