Já aconteceu com você de ter que editar o texto contido em um arquivo PDF protegido ou em fotos de uma apresentação em PowerPoint?
Acontece frequentemente.
Um modo para extrair o texto de imagens e PDFs é por utilizar um programa ou serviço de OCR.
Um destes serviços gratuitos e online é o site Free OCR.
O serviço funciona como um scanner virtual com função de reconhecimento de caracteres.
Basta fazer o upload do arquivo para ver, em seguida, um campo de texto com o conteúdo transcrito.
O Free OCR é uma ótima opção para reconhecimento de caracteres. Ele faz o serviço gratuitamente e com bastante eficiência. Nos testes com uma página capturada por um scanner não apresentou praticamente nenhum erro de reconhecimento. O serviço suporta textos em 29 idiomas. O ponto fraco é que os arquivos, que podem estar em JPG, TIF, GIF, PDF e BMP não podem exceder 2 MM ou ter mais do que 5 mil pixels de altura ou largura. Também não pode ser feito mais de dez uploads por hora.
COMPARTILHARO Free OCR não preserva as imagens. Depois de executado o trabalho, é preciso copiar o texto para um programa para edição e salvamento.