Проверка документов на подлинность | Проверка подлинности паспортов в компании Dbrain

Проверка
подлинности документов:
как мы это делаем

Алгоритмы Dbrain — быстрый и безопасный инструмент для распознавания документов. С гарантированной точностью они извлекают данные из паспортов, водительских удостоверений, СТС, ПТС, чеков, страховок и любых других документов, — даже если они сфотографированы или отсканированы некачественно.

Как происходит распознавание документов

Система состоит из набора микросервисов, каждый из которых берет на себя отдельный этап распознавания. Такая структура не требует значительных мощностей для работы решения, повышая при этом его производительность. Алгоритм распознает один документ и вносит данные в CRM-систему за 10 секунд.

Схема работы системы выглядит так:

Алгоритм классификации

определяет, сколько документов на изображении и к какому типу они относятся.

Алгоритм поиска полей

находит поля с требуемой информацией — у паспорта и водительского удостоверения они расположены по-разному. Это помогает нейросети правильно разрезать изображение и отправить каждый фрагмент на распознавание.

Алгоритм выравнивания

находит границы документа и устраняет искажения на картинке.

Алгоритм OCR

распознает данные, подготовленные разметчиком, и переводит их в цифровой вид.

Алгоритм проверки и дораспознавания

ищет ошибки, которые могли возникнуть при распознавании, и исправляет их.

Какие документы распознает алгоритм

Последняя версия алгоритма Dbrain распознает главную страницу паспорта РФ, загранпаспорта РФ, паспортов Киргизии, Таджикистана и Узбекистана, водительское удостоверение, СНИЛС, ИНН, СТС, ПТС, банковские карты, полисы ОМС и другие документы — полный список здесь.

Система умеет проверять документы на предмет подделки, точно сверяет селфи клиента с фотографией на паспорте и распознает специфические символы. Например, это подписи и печати на документах — алгоритм проверяет, что они соответствуют установленному образцу и находятся в нужных местах.

Распознавание рукописного текста

Сервис умеет распознавать рукописный текст: это помогает работать с пропиской и другими документами, заполненными от руки. Если текст виден плохо, нейросети помогают люди — пользователи сервиса Human in the loop.

Работники сервиса — квалифицированные разметчики крауд— платформы «Яндекс.Толока». Они дополняют работу нейросети, исключая возможные ошибки. Комбинация работы алгоритма и человека повышает точность распознавания с 85% до 99% во всех текстах, включая рукописные. Посмотрите ролик, как это работает.

Безопасность

Алгоритм не сохраняет и не передает личные данные клиентов на обработку третьим лицам. Информация попадает на сервера Dbrain в анонимизированном виде: каждый документ сначала разбивается на отдельные поля. Восстановить по ним документ целиком невозможно.

Во время обработки Dbrain хранит отдельные поля документов в оперативной памяти и удаляет их сразу после возвращения ответа клиенту. При работе с клиентами из России используются только сервера на территории Российской Федерации.

Безопасность решения Dbrain подтверждена заключением юридической фирмы, которая входит в тройку крупнейших в мире компаний в области работы с персональными данными. Меморандум подтверждает соответствие деперсонализации требованиям 152–ФЗ «О персональных данных» от 27.07.2006 г.

Как происходит интеграция

Dbrain подключается через простой программный интерфейс. Это REST API, стандарт, который позволяет интегрироваться с любой современной корпоративной системой.

Решение работает с разными типами платформ: его можно внедрить в мобильное приложение, сайт компании или в оборудование для обслуживания клиентов в оффлайн- отделениям: тонкий клиент или мобильную кассу. Интеграция решения занимает несколько часов, для начала работы клиенту достаточно ввести уникальный ключ.

Вы можете бесплатно протестировать алгоритм — запросить демо можно по ссылке .