Технология Оптическое распознавание символов (OCR) превращает изображения текста — сканы, фотодокументы, рукописи — в машинно-читаемый текст.
Однако простой OCR часто ограничен: не распознаёт структуру документа, теряет контекст, плохо справляется с неформатированными или рукописными формами.
По этой причине развивается направление, в котором
OCR становится лишь одним из компонентов более сложной системы, работающей с пониманием, извлечением и автоматизацией.