Умная камера Яндекса распознаёт и анализирует изображения с помощью искусственного интеллекта и технологий компьютерного зрения. journal.sovcombank.ru www.mvideo.ru
В основе работы — нейросеть Visual Language Model (VLM). vc.ru Она умеет распознавать отдельные детали на изображении, а также понимает их общий контекст, то есть взаимосвязь этих деталей между собой. vc.ru
Некоторые функции умной камеры и их описание:
- Поиск по изображению. vc.ru Можно задать любой вопрос о картинке или её отдельном фрагменте. vc.ru Умная камера понимает, о чём её спрашивают, и адресует вопрос в «Поиск с Нейро». vc.ru Он изучает всю релевантную информацию в интернете и готовит один ёмкий ответ со ссылками на источники. vc.ru
- Решение математических задач. vc.ru Нужно сфотографировать с помощью умной камеры упражнение в учебнике или написанный от руки пример. vc.ru Нейросети справляются с задачами уровня средней школы: подсказывают, как определять значения неизвестных в уравнениях или находить решения для неравенств с переменной. vc.ru
- Мгновенный перевод. vc.ru Можно сфотографировать этикетку товара и понять, что на ней написано. vc.ru Нейросети понимают и адаптируют игру слов из оригинального текста, например, на фотографиях рекламных слоганов или газетных заголовков. vc.ru
- Распознавание и сканирование текста. vc.ru Умная камера сканирует текст с изображений и сохраняет в печатном виде. vc.ru Его можно редактировать, копировать, вставлять в другие документы или сообщения. vc.ru
- Сканер QR-кода. vc.ru Умная камера распознаёт QR-коды любого формата — нужно выбрать режим «Поиск» и навести смартфон, после чего пользователь сможет перейти по сформированной ссылке. vc.ru