Алгоритм Google научился распознавать объекты на видео

13 марта 2017

«Найди мне ролик с такой же смешной собакой». Запущенный в режиме бета-тестирования сервис Google Cloud Video Intelligence предложит уточнить: начать поиск по породе песика, его размеру, длине шерсти или глупому выражению мордочки? Для новой системы это не набор пикселей на картинке, а сложный и важный объект. Как и все остальное в данном видео.

Новый сервис построен на основе проекта Tensorflow с использованием принципов машинного обучения. Цель – научиться распознавать любой видео-контент по его содержимому, чтобы впоследствии вести эффективный поиск по соответствующим запросам. Будь то мелкие, специализированные фрагменты или крупные фильмы целиком.

То, что изначально было цельным видеоизображением, после обработки разделяется на массив индивидуальных объектов с именными и глагольными метками. Им присваивается вес или ранг, в процентном выражении, который формируется на основе сравнений со схожими запросами. Информация берется из обычных поисковых запросов, а результат проверки используется для повышения релевантности новых выдач.

Чем точнее расставлены метки, тем выше шанс найти нужное видео, но в Google тактично умалчивают о механизмах контроля этого процесса. Напротив, со слов ведущего специалиста корпорации по машинному обучению, Фей Фей Ли, данный API предназначен для крупного бизнеса, медиахолдингов и обслуживающих сервисов. Тем, кому нужен эффективный способ управления контентом. В своих, сугубо коммерческих целях, разумеется.

В текущем формате новшество никак не подходит для реализации в пользовательских продуктах, повседневных приложениях. Слишком громоздкое и «глуповатое». Однако лиха беда начало и сама технология поиска по видео-контенту, наверняка станет ключевым инструментом работы в Интернете уже в ближайшем будущем.

Алгоритм Google научился распознавать объекты на видео

Читайте также