Топ 10: Системы распознавания и извлечения данных из документов
Обновлено: 29.11.2022 |
Машинное обучение позволяет создать нейросети для автоматической классификации отсканированных документов (например, паспортов, прав, обращений клиентов, резюме соискателей) или электронных документов, а также для извлечения структурированных данных из них. Примеры использования распознавания документов для бизнеса приведены ниже.
См. также: Топ 10: СЭД системы
См. также: Топ 10: СЭД системы
2022. Microsoft представила платформу ИИ-процессинга данных из документов

Два года назад Microsoft представила сервис SharePoint Syntex, который использует искусственный интеллект для автоматизации извлечения и классификации данных из документов на основе существующих сервисов SharePoint. Теперь этот сервис превратился в самостоятельную платформу Microsoft Syntex, которая содержит набор инструментов для автоматизированного распознавания документов, включая аннотирование файлов и извлечение данных. Syntex считывает, помечает и индексирует содержимое документов (будь то цифровые или физические) и делает эти данные доступным для поиска и использования в приложениях Microsoft 365, а также помогает управлять жизненным циклом данных с помощью инструментов безопасности и архивирования.
2022. Основанная россиянами платформа автоматизации политик безопасности Clausematch привлекла $10,8 млн

Стартап Clausematch, развивающий технологии для финансового рынка, поднял раунд финансирования $10,8 млн от фондов Lytical Ventures и Flashpoint. В общей сложности Clausematch уже привлекла около $20 млн. Clausematch в 2012 году основали Евгений Лиходед и Андрей Докучаев. Компания разрабатывает платформу для организации рабочего процесса и совместной работы, предназначенную для оптимизации управления политиками и нормативными изменениями в организации. Платформа компании использует машинное обучение, чтобы помочь отделам нормативно-правового регулирования, юридическим, финансовым, операционным и отделам рисков в автоматизации оценки воздействия, оптимизации внедрения нормативных изменений и совместной работы над документами, позволяя клиентам стандартизировать и автоматизировать внутренние процессы и рабочие процессы между командами, снизить затраты, ускорить внедрение и обеспечить соответствие требованиям. Сейчас стартап дислоцируется в Лондоне.
2022. В Эльбе появилось распознавание документов в браузере

Теперь пользователи онлайн бухгалтерии Эльба смогут автоматически распознавать входящие документы можно не только в мобильном приложении, но и в браузере. Эльба распознает счета, акты, накладные и УПД в формате документов (PDF, DOC и DOCX) и фотографий (JPEG и PNG). Достаточно загрузить файл в разделе Документы → Входящие. Если документ состоит из нескольких страниц, выберите сразу все и подождите пару минут, пока Эльба его распознает. Когда распознавание закончится, зайдите в документ, проверьте данные и сохраните.
2021. Directum выпустил облачный AI-сервис по 100%-ному распознаванию документов Inbox

Новый AI-сервис по 100%-ному распознаванию, который входит в состав интеллектуальной системы Directum Ario One, берет обработку входящего документопотока на себя. Сотруднику достаточно отсканировать документы и загрузить их для дальнейшей обработки. На этом его участие в оцифровке завершается. Интеллектуальные механизмы Directum Ario распознают текст, классифицируют документы по типам и извлекают из содержимого факты. На основании обработанной информации формируется и отправляется задание на проверку верификаторам. Квалифицированные облачные операторы проверяют результаты машинной обработки и при необходимости дозаполняют нераспознанные реквизиты. В целях безопасности они не видят всего объема данных, так как информация передается им частями.
2021. Directum запускает крауд-проект на разработку AI-решения для анализа договоров

Компания Directum приглашает инвесторов в проект разработки полнофункционального интеллектуального инструмента «Цифровой ассистент юриста». Участники получат скидку 20% на готовое решение и бесплатную пользовательскую лицензию. Подать заявку на участие можно до 31 августа 2021 года.
2021. Интеллектуальные сервисы Directum Ario теперь в облаке

Полнофункциональные AI-сервисы для обработки данных Directum Ario стали доступны в облачной поставке. SaaS-модель снижает порог подключения для клиентов, а варианты подписки на дополнительные пакеты по 5, 10, 15, 20 и 25 тысяч документов в месяц позволяют гибко масштабировать мощности под потребности компании. Возможности интеллектуальных сервисов в облаке предусматривают классификацию и извлечение фактов для 6 видов документов (входящие письма, акты выполненных работ, счета на оплату, счета-фактуры, универсальные передаточные документы, товарные накладные) в стандартной поставке с опцией дополнительного обучения Directum Ario на других типах документов.
2021. Directum запустил сервис интеллектуального извлечения данных из документов

Компания Directum еще 2 года назад выпустила систему для извлечения данных из документов Ario - которая с помощью машинного обучения парсит данные из различных сканов (договоров, заявок, обращений...) и заносит их в ECM систему Directum. Теперь компания представила сервис Directum Ario One, который может заносить извлеченные данные через Web API в любую информационную систему, используемую в вашей компании. Directum Ario One позволяет исключить участие человека даже на этапе верификации данных. При настройке можно задать значения, по которым корректность классификации и точность извлечения будут определяться автоматически. На их основании система верифицирует данные сама, а ответственный получит уведомление об успешной обработке.
2020. На Google Cloud появился ИИ-сервис для извлечения данных из документов и форм
Google запустил на своей облачной платформе новый когнитивный API-сервис Document AI, который позволяет автоматически извлекать информацию, содержащуюся в цифровых и печатных документах, с помощью машинного обучения. Предполагается использование двух процессоров общего назначения, первый - для обычных документов, второй - для анкет/форм. Есть также специализированные процессоры для финансовой документации, например, можно обрабатывать заявки на выдачу ссуд или счета-фактуры. Главными конкурентами Google в этом сегменте являются компания Amazon, которая предлагает подобный сервис Textract на AWS, а также Microsoft со своим инструментом Form Recogniser.
2020. 1С:БизнесСтарт позволяет создавать документы по их фото

Теперь пользователи сервиса 1С:БизнесСтарт могут создавать счета, счета-фактуры, акты и накладные легко и удобно прямо по их фотографии или скану! Для распознавания документа достаточно его отсканировать или сфотографировать специальным мобильным приложением. Сделать это можно в программе 1С:БизнесСтарт в меню Документы (либо Покупки) - Загрузить из скана (фото).
2020. В СБИС появилось ИИ-распознавание первичных документов
В бухгалтерском модуле системы управления бизнесом СБИС появилась функция автоматического ввода/распознавания первичных документов. Она работает на технологии машинного обучения и позволяет распознавать товарные накладные (ТОРГ-12), УПД, счета-фактуры и авансовые отчеты. Достаточно отсканировать документ или сфотографировать с помощью смартфона и добавить картинку в систему. Она сама добавит документ в базу и извлечет из него данные (контагентов, номенклатуру товаров, затраты...). Разработчики обещают высокую точность распознавания даже на нечетких снимках. Многостраничные документы - тоже поддерживаются.
2019. В СЭД Кодекс:Документооборот появился модуль искусственного интеллекта

АО «Центр компьютерных разработок» представил модуль искусственного интеллекта для СЭД Кодекс: Документооборот. Он служит для автоматической классификации обращений согласно Справочнику ОТК. Данное решение базируется на технологиях машинного обучения и нейросетях, анализирует текст документа, ранее поданные аналогичные обращения, территорию с которой прислано обращение, какие вопросы содержит письмо и т.д. На основании такого анализа строится предположение, что письмо принадлежит определённой тематической категории, должно быть рассмотрено специалистом, ответственным за данное направление или переправлено в соответствующее ведомство.
2019. ABBYY запустила сервис распознавания документов в мобильном браузере

Компания ABBYY создала сервис для распознавания изображений документов в мобильном браузере Mobile Web Capture. Он пригодится компаниям, которые используют онлайн формы для получения заявок и заказов от клиентов. Сервис позволяет сэкономить им время - вместо заполнения многочисленных полей, клиент может быстро сосканировать права или паспорт, и сервис распознает данные и заполнит поля самостоятельно. Причем, он легко интегрируется с онлайн формой и работает в мобильном браузере, т.е. пользователю не нужно устанавливать дополнительное приложение.
2019. Amazon выпустила ИИ-альтернативу Abbyy FineReader
Ровно 10 лет назад компания ABBYY запустила онлайн сервис распознавания текста FineReader Online. Теперь подобный сервис есть и у Amazon - Amazon Textract. Однако, прогресс не стоит на месте, и амазоновский сервис уже умеет не только распознавать текст, но и понимать структуру документа (с помощью ИИ). Например, он учитывает и корректно обрабатывает колонтитулы, колонки, таблицы, заполненные формы и даже определяет некоторые форматы данных (имя, номер паспорта, номер социального страхования). Конечно, компанию ABBYY этим не удивить. Они сами собаку съели на технологиях искусственного интеллекта. Их движок уже умеет даже извлекать смысл из документов.
2019. Microsoft представила сервисы для распознавания рукописного текста и заполненных форм

Microsoft представила несколько новых когнитивных сервисов на своей облачной платформе Azure Machine Learning. Во-первых, это подарки для компаний, имеющих дело с документами, формами и служебными записками с рукописным текстом. Сервисы Ink Recognizer и Form Recognizer позволяют переводить все эти бумажки в цифровой текст и данные. Сервис Conversation Transcription - переводит в текст диалоги по телефону с распознаванием автора каждой фразы. К сожалению, это все пока только на английском. Еще один новый сервис Personalizer позволяет подбирать персонализированные рекомендации для посетителей сайта или интернет-магазина на основании поведенческих факторов. Кроме того, Microsoft представила новый визуальный конструктор для создания моделей машинного обучения. Теперь даже маркетологи смогут поиграться. Нужно всего лишь загрузить базу данных и указать, какой параметр требуется спрогнозировать.
2018. Abbyy Finereader научился распознавать смысл документов при помощи ИИ
Компания Abbyy сделала шаг от распознавания буковок и слов к распознаванию смысла сканируемых документов. Зачем это нужно? Чтобы автоматизировать процессы ввода бумажных документов в информационные системы (авто-классификации документов, распознавания полей и таблиц, переноса данных из этих полей в структурированную базу данных). Новый движок ABBYY FineReader Engine 12 умеет это делать с помощью технологий обработки естественного языка и машинного обучения. Конечно, для реализации интеллектуального ввода документов не достаточно просто купить программу FineReader - нужно заказать у Abbyy индивидуальный проект.