Главный разворот (стр. 2-3)- Форма введена в 1997 году, до этого момента выдавался паспорт СССР
- Распознаём как машинопечатный, так и рукописный вариант паспорта
- Распознаём фотографии, сканы, скриншоты
- Обрабатываем многостраничные файлы в форматах PDF и DJVU
- Отделяем документы от фона — бабушкиных ковров и узорчатых скатертей
- Поправляем повёрнутые и зеркально отражённые документы
Извлекаем данные из некачественных фото:
- обрезанных;
- смазанных;
- бликующих;
- с наложением посторонних предметов.
С 1 июля 2011 года в паспорте печатают машиночитаемую зону. В ней закодированы следующие поля:
- ФИО
- Дата рождения
- Дата выдачи
- Код подразделения
- Пол
- Серия и номер
Все поля, кроме ФИО в паспорте покрыты
контрольными суммами. При совпадении результатов распознавания с контрольной суммой сервис гарантирует корректные результаты распознавания. В ответ попадают именно они. Если контрольные суммы не совпали, а также для ФИО сервис выбирает то поле, которое лучше читается — не закрыто посторонними предметами или бликами.
Сервис считывает серию и номер с 3 и 4 страницы и отдаёт в ответ те поля, которые лучше читаются
Когда сервис испытывает проблемы с чтением поля «место выдачи» он подтягивает текст этого поля из расширенной версии
справочника соответствий кода подразделения и места выдачи. Так мы повышаем точность извлечения поля «Паспорт выдан». Поэтому сервис выдаёт корректный результат даже в ситуациях, когда поле полностью нечитабельно. Этот функционал можно отключить (но мы не рекомендуем).
Coming soon:- возвращаем фотографию лица из паспорта
- возвращаем подпись
- Список полей
Прописка (стр 5-12)
- Сервис ищет самый свежий штамп на изображении
- Сервис различает оба вида штампов:
- Регистрация по адресу
- Снятие с регистрации
- Нейросеть извлекается данные как из печатных, так и из рукописных штампов. Из штампа о регистрации нейросеть вытаскивает:
- регион
- район
- город
- посёлок
- улицу
- дом
- квартиру
- Результаты нейросети дополняются через сервис dadata.ru. Если дополнить не получилось, сервис возвращает только поля из нейросети.
- Из штампа о снятии регистрации сервис вытаскивает только дату
- Список полей
Воинская обязанность (стр 13)
- Извлекаем только серию-номер документа
Семейное положение (стр 14-15)
- Извлекаем только серию-номер документа
Дети (стр 16-17)
- Извлекаем только серию-номер документа
Ранее выданные документы (стр 18-19)
- Извлекаем только серию-номер документа
Форзац (стр 1, 20)