Converta documentos escaneados em texto – Google OCR

Existem dois tipos de documentos PDF – os que são criados quando enviamos arquivos para impressão e aqueles criados quando escaneamos páginas de um livro, documentos, revistas, etc.
Os motores de busca do Google sempre indexaram esses arquivos PDF, mas agora eles também conseguem reconhecer o texto embutido em PDFs gerados pelo escaneamento de documentos de papel via software OCR.
Este é um documento escaneado e esta é a visualização em texto html do mesmo documento, convertido pelo Google.
Convertendo PDFs escaneados em texto
Se você tem muitos arquivos PDF escaneados em seu computador e não tem um OCR, veja o que você pode fazer para converter seus documentos em texto que possa ser lido, copiado ou editado no computador.

Crie uma pasta em seu site (algo como xyz.com.br/pdf) e faça o upload de todos as imagens PDF para este diretório. Agora crie uma página pública que tenha links para todos esses arquivos PDF. Espere até o Google indexar seu material.
Quando seus arquivos já estiverem aperecendo nas buscas, digite a seguinte sequência:

“site:xyz.com.br/pdf filetype:pdf”

Você verá seus documentos PDF convertidos em formato HTML.

COMPARTILHAR

14 Comentários

  1. NELSON DOUGLAS DA SILVA 27 de junho, 2009
  2. Maria 3 de julho, 2009
  3. Carlos Alberto 22 de fevereiro, 2010
  4. Helena 2 de março, 2010
  5. lidya 22 de abril, 2010
  6. likirey 12 de fevereiro, 2011
  7. tais 30 de março, 2011
  8. claudia 12 de abril, 2011
    • caca roussef 7 de junho, 2011
  9. angela maria da silva 29 de maio, 2011
  10. FILIPE ABREU EUSÉBIO 23 de junho, 2011
    • Dany 17 de julho, 2011
  11. Elaine 5 de maio, 2012
    • Diêgo Bastos 25 de novembro, 2012

Comentar