«Процессы ускорились и преобразились»

Александр Леви — о FineScanner AI

Обозреватель «Коммерсантъ FM» Александр Леви рассказывает о новом сервисе компании ABBYY.

Фото: finescanner.com

Фото: finescanner.com

Нейронные сети на вооружении мобильного приложения уже скоро станут обыденностью. А пока еще работа искусственного интеллекта способна впечатлить на контрасте «до технологии и после». Казалось бы, у компании ABBYY уже был сканер документов, работающий с помощью камеры смартфона и собственных алгоритмов распознания текста. Но теперь процессы ускорились и преобразились.

Новый продукт FineScanner AI способен мгновенно отыскать все картинки, на которых имеются хоть какие-то буквы. В моем случае из галереи в четыре с лишним тысячи фотографий приложение моментально отобрало около 500 изображений. Сверить вручную, не пропущено ли что, довольно сложно. Но вот найти в выборке лишние, то есть картинки вовсе без текста, было легко. Таких насчитал три. Получается, что погрешность алгоритма в этом случае меньше 1%. Похвально.

Зачем вообще надо заниматься поиском текста в фотографиях? В некоторых профессиональных сферах это простой, доступный и эффективный способ работы с информацией. Например, в медицине, науке, консалтинге. И, конечно, распознание букв, цифр и символов само по себе не является главной целью пользователей FineScanner AI. Часто требуемый конечный результат — трансформация картинки с текстом в электронный документ конкретного формата. А для этого приложению нужно не только отлично распознавать символы, но и оценивать положение сканируемого объекта в пространстве, его тип, а также побочную информацию, вроде качества освещения, его природу, посторонние предметы в кадре. Все это требует одновременной работы с большим количеством данных. Вот тут нейронные сети со своей способностью быстро самообучаться как раз и выручают.

Еще одно преимущество нового сервиса ABBYY — работа в офлайн-режиме. Без доступа к интернету FineScanner AI рекогносцирует документы на 63 языках. Отличное решение для тех, кого, например, волнует строгая конфиденциальность. При работе в Wi-Fi-сети лингвистическая база приложения вырастает больше чем в три раза, почти до 200 языков.

Новости из мира высоких технологий смотрите на нашем сайте в разделе Hi-Tech.

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...