Google-docs

OCR с помощью Документов Google — превращайте изображения в цифровой текст

Документы Google могут выполнять оптическое распознавание текста для цифровых изображений. Вы можете загрузить изображение, содержащее напечатанный текст (например, факсимильный документ или отсканированную вырезку из газеты), в свою учетную запись Google Docs, и оно превратит это изображение в цифровой текст, который вы сможете копировать и искать.
В следующем примере Документы Google успешно извлекли весь текст со страницы отсканированной книги и преобразовали его в редактируемый документ.

Функция OCR также может извлекать текст из зашумленных изображений, хотя распознанный текст не очень точен и форматирование документа теряется.
Если вы разработчик, вы можете добавить параметр ocr=true в свой запрос на загрузку, и Документы Google автоматически просканируют это изображение на предмет текстовых шаблонов. Вы также можете загружать изображения в Google Docs без параметра OCR, но в этом случае изображение будет преобразовано в новый документ Word без OCR.
Как и Google Docs, Google Search также включает функции OCR, но разница в том, что, хотя Google Docs может извлекать текст из изображений, OCR в Google Search работает только с отсканированными файлами PDF.