На нашем сайте используются cookie–файлы, в том числе сервисов веб–аналитики (Яндекс.Метрика и top.mail.ru). Используя сайт, вы соглашаетесь на обработку персональных данных при помощи cookie–файлов. Подробнее об обработке персональных данных вы можете узнать в Политике конфиденциальности

OCR и антифрод в МФО: как снизить риск займов на чужие документы

Для МФО скорость обработки заявки почти всегда напрямую связана с выручкой. Чем быстрее клиент получает решение, тем выше шанс, что он дойдет до выдачи. Но у этой скорости есть обратная сторона: если проверка документов построена слабо, компания быстрее пропускает не только хороших заемщиков, но и мошеннические заявки.

Один из самых частых рисков - заем на чужие или поддельные документы. Человек загружает паспорт, фото, справку или другой файл, система быстро принимает данные, менеджер не успевает заметить проблему, а дальше компания уже работает не с клиентом, а с убытком.

OCR помогает решить первую часть задачи: быстро считать данные из документа. Но в МФО этого мало. Здесь важно не просто распознать текст, а понять, можно ли этому документу доверять.

Почему для МФО это критично

В микрофинансовом бизнесе решение по заявке часто принимается за минуты. Клиент заполняет анкету, прикладывает документы, проходит проверку и ждет ответ. Если процесс долгий, он может уйти к другой компании. Если процесс слишком простой, возрастает риск фрода.

Поэтому задача МФО не в том, чтобы заменить проверку скоростью. Задача в другом: сделать проверку быстрой, но не слепой.
Документ должен проходить несколько уровней контроля:
  • корректно ли распознаны данные;
  • совпадают ли они с анкетой;
  • нет ли признаков редактирования;
  • не использовался ли этот документ раньше;
  • соответствует ли документ требованиям компании;
  • нужно ли отправлять заявку на ручную проверку.
Именно здесь OCR становится не отдельной функцией, а частью антифрод-процесса.

Где чаще всего появляется риск

Заем на чужой паспорт

Самый понятный сценарий: мошенник использует чужой документ или фото документа. Иногда это украденный скан, иногда фото из переписки, иногда документ, найденный в открытых источниках или купленный в слитой базе.

Если система просто считывает ФИО, серию, номер и дату рождения, она может не увидеть проблему. Формально данные есть. Поля заполнены. Заявка выглядит полной.

Но для МФО важно проверить больше: как выглядит сам документ, совпадает ли лицо с селфи, нет ли повторов по данным, устройству, телефону, карте или другим признакам.

Поддельные или измененные документы

Документ может быть не полностью поддельным. Часто меняют только часть данных: дату рождения, номер, адрес, срок действия, фото, сумму дохода, реквизиты.

Для человека такие изменения не всегда заметны, особенно если поток заявок большой. Менеджер смотрит быстро, глаз устает, качество фото разное. Система может проверить документ стабильнее: найти подозрительные зоны, сравнить логику полей, обратить внимание на нетипичные признаки.

Несовпадения в анкете и документах

Отдельная зона риска - когда в анкете указано одно, а в документе другое. Например, клиент вручную вводит ФИО, дату рождения или паспортные данные, но в загруженном документе система видит расхождения.

Иногда это обычная ошибка. Иногда - попытка пройти проверку с чужими данными. В обоих случаях такую заявку лучше не пропускать автоматически.

Повторные заявки под разными данными

Мошенник может отправлять несколько заявок, меняя телефон, почту, карту или часть персональных данных. Если документы проверяются только вручную, такие связи легко пропустить.

Автоматическая обработка помогает быстрее находить повторы и похожие документы. Это не отменяет скоринг, но дает ему больше качественных сигналов.

Что дает OCR на первом этапе проверки

OCR считывает текст с фото, скана или PDF-документа. Для МФО это уже снимает часть ручной работы: сотруднику не нужно перепечатывать паспортные данные, номер документа, дату выдачи, адрес или другие поля.

Хороший OCR особенно полезен, когда документы приходят в разном качестве:
  • фото сделано на телефон;
  • документ снят под углом;
  • есть блики;
  • часть текста плохо видна;
  • файл загружен в виде скана или PDF;
  • клиент отправил неидеальное изображение, но данные все еще можно распознать.

В результате заявка быстрее попадает в обработку, а данные сразу можно передать в CRM, скоринг или внутреннюю систему МФО.
Но на этом возможности простой OCR-проверки заканчиваются. Она отвечает на вопрос: «Что написано в документе?»
Для антифрода нужен следующий вопрос: «Можно ли этому документу верить?»

Почему одного OCR недостаточно

OCR может распознать текст даже в документе, который был изменен. Он может корректно считать ФИО, серию паспорта или дату рождения, но не понять, что часть изображения была отредактирована.
Для МФО это принципиальный момент.

Если система ограничивается только распознаванием текста, она помогает ускорить ввод данных, но не закрывает риск фрода. Мошенническая заявка может пройти дальше просто потому, что все поля заполнены и формально выглядят корректно.
Поэтому в финансовых сценариях OCR лучше использовать вместе с IDP и антифрод-логикой.

IDP - это более широкий подход к обработке документов. Система не только распознает текст, но и понимает структуру документа, выделяет нужные поля, проверяет связи между ними и помогает принять решение, что делать с заявкой дальше.

Как работает связка OCR, IDP и антифрода

В Dbrain мы смотрим на документ не как на картинку с текстом, а как на источник данных для принятия решения. Особенно если речь идет о МФО, где ошибка на входе может быстро превратиться в финансовый риск.

Распознавание документа

Сначала система определяет тип документа и считывает данные. Например, паспорт, справка, договор, выписка или другой файл, который используется в процессе проверки заемщика.

На этом этапе важно не только извлечь текст, но и сделать это стабильно: с разных форматов, фотографий, сканов и файлов разного качества.

Извлечение и проверка полей

После распознавания система выделяет конкретные поля: ФИО, дату рождения, серию и номер документа, дату выдачи, код подразделения, адрес, реквизиты и другие данные.

Дальше эти данные можно автоматически сверять с анкетой клиента и внутренними правилами МФО. Например, если в анкете одна дата рождения, а в документе другая, заявка получает флаг для проверки.

Поиск несостыковок

Антифрод начинается там, где система не просто читает данные, а ищет логику.

Например:
  • ФИО в анкете не совпадает с ФИО в документе;
  • дата рождения не соответствует возрастным ограничениям;
  • номер документа уже встречался в другой заявке;
  • документ выглядит как повторно загруженный файл;
  • в разных документах указаны разные данные по одному человеку;
  • часть полей заполнена странно или не соответствует ожидаемому формату.
Не каждое расхождение означает мошенничество. Но каждое такое расхождение должно быть замечено до выдачи, а не после.

Проверка признаков подделки

Документ может выглядеть нормальным на первый взгляд, но иметь следы вмешательства: разные шрифты, неестественные зоны, подозрительное качество отдельных фрагментов, признаки редактирования или несоответствие между частями изображения.

Такие проверки особенно важны, когда клиент загружает фото или скан, а не проходит очную идентификацию. В онлайне у МФО меньше контроля над тем, как был получен документ. Значит, больше контроля должно быть внутри самой проверки.

Передача результата в скоринг

Финальное решение обычно принимает не OCR и не одна антифрод-проверка. Решение принимает общая система оценки риска.

Но OCR и IDP дают этой системе качественные данные:
  • какие поля извлечены;
  • где есть расхождения;
  • какие документы вызывают сомнения;
  • какие заявки можно пропустить автоматически;
  • какие лучше отправить на ручную проверку;
  • какие стоит отклонить по правилам компании.

Так МФО не ломает текущий процесс, а усиливает его.

Что получает МФО

Главный результат - меньше ручной рутины и больше контроля на входе.
Команда не тратит время на перепечатывание данных из паспорта. Проверяющие специалисты не смотрят все заявки подряд с одинаковым вниманием. Вместо этого система помогает разделить поток: простые заявки идут быстрее, подозрительные попадают на дополнительную проверку.

Для бизнеса это дает несколько эффектов.
Первый - скорость. Клиент быстрее получает решение, а сотрудники меньше заняты однотипными действиями.
Второй - качество данных. В скоринг и CRM попадает не то, что менеджер успел вручную ввести, а структурированные данные, извлеченные из документа.

Третий - снижение риска. Подозрительные документы, расхождения и повторы видны раньше.
Четвертый - более понятный процесс. По каждой заявке можно видеть, какие данные были распознаны, какие проверки сработали и почему заявка ушла дальше или попала на ручную проверку.

Как внедрять такую проверку без лишней нагрузки на команду

Самая частая ошибка - пытаться сразу автоматизировать все. В реальности лучше начинать с самого рискованного и массового участка.

Для МФО это обычно первичная проверка документов в заявке. Сначала можно автоматизировать распознавание паспорта и сверку ключевых полей с анкетой. Затем добавить проверку повторов, признаков редактирования, связей между документами и дополнительные правила для скоринга.

Важно не выбрасывать ручную проверку полностью. В хорошей схеме она остается, но используется точечно. Не на каждую заявку, а там, где система видит риск или не уверена в результате.

Так автоматизация не создает хаос внутри процесса. Она постепенно снимает нагрузку с команды и помогает проверять заявки быстрее.

Вывод

Для МФО OCR - это не просто удобный способ распознать паспортные данные. Это первый слой защиты от ошибок и фрода.

Но сам по себе OCR не решает задачу антифрода. Он читает документ. А МФО нужно больше: понять, настоящий ли документ, совпадают ли данные, нет ли следов подделки, не используется ли один и тот же документ в разных заявках.

Поэтому сильнее работает связка OCR, IDP и антифрод-проверок. Она помогает ускорить обработку заявок, снизить ручную нагрузку и внимательнее смотреть на рискованные документы до того, как компания примет решение о выдаче займа.

В Dbrain мы как раз решаем эту задачу: помогаем компаниям извлекать данные из документов, проверять их и встраивать результат в реальные бизнес-процессы. Для МФО это особенно важно, потому что каждая лишняя минута влияет на конверсию, а каждая пропущенная мошенническая заявка - на деньги.