Главный разворот (стр. 2-3)

  • Форма введена в 1997 году, до этого момента выдавался паспорт СССР
  • Распознаём как машинопечатный, так и рукописный вариант паспорта
  • Распознаём фотографии, сканы, скриншоты
  • Обрабатываем многостраничные файлы в форматах PDF и DJVU
  • Отделяем документы от фона — бабушкиных ковров и узорчатых скатертей
  • Поправляем повёрнутые и зеркально отражённые документы

Извлекаем данные из некачественных фото:
  • обрезанных;
  • смазанных;
  • бликующих;
  • с наложением посторонних предметов.

С 1 июля 2011 года в паспорте печатают машиночитаемую зону. В ней закодированы следующие поля:
  • ФИО
  • Дата рождения
  • Дата выдачи
  • Код подразделения
  • Пол
  • Серия и номер

Все поля, кроме ФИО в паспорте покрыты контрольными суммами. При совпадении результатов распознавания с контрольной суммой сервис гарантирует корректные результаты распознавания. В ответ попадают именно они. Если контрольные суммы не совпали, а также для ФИО сервис выбирает то поле, которое лучше читается — не закрыто посторонними предметами или бликами.

Сервис считывает серию и номер с 3 и 4 страницы и отдаёт в ответ те поля, которые лучше читаются

Когда сервис испытывает проблемы с чтением поля «место выдачи» он подтягивает текст этого поля из расширенной версии справочника соответствий кода подразделения и места выдачи. Так мы повышаем точность извлечения поля «Паспорт выдан». Поэтому сервис выдаёт корректный результат даже в ситуациях, когда поле полностью нечитабельно. Этот функционал можно отключить (но мы не рекомендуем).

Coming soon:

  • возвращаем фотографию лица из паспорта
  • возвращаем подпись
  • Список полей
Прописка (стр 5-12)
  • Сервис ищет самый свежий штамп на изображении
  • Сервис различает оба вида штампов:
  • Регистрация по адресу
  • Снятие с регистрации
  • Нейросеть извлекается данные как из печатных, так и из рукописных штампов. Из штампа о регистрации нейросеть вытаскивает:
  • регион
  • район
  • город
  • посёлок
  • улицу
  • дом
  • квартиру
  • Результаты нейросети дополняются через сервис dadata.ru. Если дополнить не получилось, сервис возвращает только поля из нейросети.
  • Из штампа о снятии регистрации сервис вытаскивает только дату
  • Список полей
Воинская обязанность (стр 13)
  • Извлекаем только серию-номер документа
Семейное положение (стр 14-15)
  • Извлекаем только серию-номер документа
Дети (стр 16-17)
  • Извлекаем только серию-номер документа
Ранее выданные документы (стр 18-19)
  • Извлекаем только серию-номер документа
Форзац (стр 1, 20)
  • Только классификация
Распознаваемые поля