Системы распознавания текста - обзор

Обновлено: 11.07.2022


2022. SETERE OCR - отечественный аналог ABBYY FineReader



Программу для OCR-распознавания текста ABBYY FineReader еще недавно тоже можно было назвать отечественной, но еще за месяц до войны компания ABBYY отозвала все свои продукты из Реестра отечественного ПО ради того, чтоб сфокусироваться на зарубежных рынках. Зато, теперь у нас в реестре есть SETERE OCR - система оптического распознавания текста, которая после последнего релиза (по словам разработчиков) стала близкой к реализации полного функционала ABBYY FineReader. SETERE OCR позволяет пользователям распознавать текст на 190 языках, проверять грамматику, работает с PDF и сканами. А главное преимущество программы - в том, что она работает не на вражеском Windows (который скоро перестанет обновляться в России), а на отечественных Линуксах - Astra Linux и РЕД ОС.


2022. FineReader и другие продукты Abbyy перестали быть российским ПО



Всемирно известная российская софтверная компания Abbyy удалила почти все свои продукты из Реестра отечественного ПО. В числе потерь реестра — программа для распознавания текста Abbyy FineReader, ПО для потокового ввода данных Abbyy FlexiCapture, сканер визиток Abbyy Business Card Reader, решение для создания снимков областей экрана Abbyy Screenshot Reader, ПО для создания мобильных приложений Abbyy Mobile OCR Engine и др. Компания по собственной инициативе подала заявку об исключении продуктов, потому что передала права на продукты своим американским юрлицам. Вероятно, это сделано чтоб не попасть под санкции.


2019. Яндекс запустил сервис для распознавания лиц и изображений



В арсенале платформы Яндекс.Облако появился сервис Yandex Vision для анализа изображений при помощи машинного обучения. Например, при помощи сервиса компании могут распознавать тексты архивов и искать по ним данные, переводить тексты с изображений и модерировать контент пользователей. Бизнесу Yandex Vision может пригодиться для сканирования однотипных документов и занесения их в систему документооборота, например, по ключевым словам. Сервис также ищет лица людей на изображении и выделяет их прямоугольниками, но пока не распознает — с помощью этой функции нельзя находить похожие лица или идентифицировать личность. Яндекс уже определился с ценами на распознавания текста: 120 руб за 1000 картинок в месяц. Обнаружение лиц - пока бесплатно. Подобный сервис уже предоставляют Mail.ru и FindFace.


2014. Электронный Архив Этлас внедрен в Казахстане

Компания «Этлас-Софт» совместно со специалистами ТОО «Приречное ЛА» запустили в промышленную эксплуатацию электронный архив документов, созданный на платформе архива «ЭТЛАС». В процессе внедрения системы электронного архива ЭТЛАС на первом этапе были созданы группы пользователей и назначены права доступа к документам, была сформирована структура архива. Заказчиком были настроены правила автоматического наименования, размещения и нумерования документов, была настроена процедура резервного копирования базы данных и базы документов. На втором этапе была выполнена работа по сканированию и заведению документов в систему с использованием модуля автораспознавания текста, что позволило в разы ускорить процесс заполнения архива. Внедрение системы Этлас значительно упростило доступ к данным компании. Теперь сотрудники и руководство компании всегда имеют возможность получить необходимые данные, находясь как на рабочем месте, так и у себя дома или в командировке в любой точке мира.


2011. OPTIMA-WorkFlow избавит от архивной пыли

Компания Optima software (ГК Optima) представляет новые решения — «Электронный архив» и «Архив бумажных документов» на платформе OPTIMA-WorkFlow. Решение «Электронный архив» на платформе OPTIMA-WorkFlow предназначено для централизованного хранения документов организации в электронном виде. Типовое решение обеспечивает гарантированную сохранность документов, накопление корпоративной Базы знаний, автоматизированный картотечный учет электронных документов, поиск документов по реквизитам и содержанию, а также защиту информации от несанкционированного доступа. В типовое решение «Электронный архив» входит пакет программных приложений для потокового сканирования, распознавания и привязки документов, что позволит организациям перевести текущий бумажный архив в электронный вид с наименьшими затратами времени. Типовое решение «Архив бумажных документов» предназначается для автоматизации деятельности архивных служб организации в соответствии с требованиями ЕГСДОУ, ВНИИДАД и Росархива. Решение обеспечивает классификацию документов, формирование дел/томов архивного хранения, проведение экспертизы ценности, передачу документов в государственный архив, выдачу (выемку) документов и возврат их на архивное хранение, формирование сводных описей/актов на уничтожение и т. д.


2010. ABBYY FineReader 10 Corporate Edition: распознавать документы в локальной сети компании станет ещё удобнее

Компания ABBYY, ведущий мировой разработчик технологий оптического распознавания документов, ввода данных и лингвистического программного обеспечения, объявляет о выходе ABBYY FineReader 10 Corporate Edition, новой версии знаменитой программы для распознавания документов (OCR), которая предназначена для использования в малом и среднем бизнесе. По сравнению с ABBYY FineReader 9 в новой версии существенно улучшено качество распознавания документов со сложной структурой – контрактов, таблиц, журнальных статей с текстами поверх картинок, графиками и рисунками. Гораздо проще считываются и переводятся в нужные форматы изображения низкого качества. Новая версия ABBYY FineReader для корпоративных пользователей включает все возможности ABBYY FineReader 10 Professional Edition и ряд дополнительных функций для удобства работы в локальной сети компании.