Converta documentos escaneados em texto – Google OCR

Por | Em 1 de novembro de 2008 | Categoria: Dicas e Tutoriais | 14 Comentários

Existem dois tipos de documentos PDF – os que são criados quando enviamos arquivos para impressão e aqueles criados quando escaneamos páginas de um livro, documentos, revistas, etc.

Os motores de busca do Google sempre indexaram esses arquivos PDF, mas agora eles também conseguem reconhecer o texto embutido em PDFs gerados pelo escaneamento de documentos de papel via software OCR.

Este é um documento escaneado e esta é a visualização em texto html do mesmo documento, convertido pelo Google.

Convertendo PDFs escaneados em texto
Se você tem muitos arquivos PDF escaneados em seu computador e não tem um OCR, veja o que você pode fazer para converter seus documentos em texto que possa ser lido, copiado ou editado no computador.

Crie uma pasta em seu site (algo como xyz.com.br/pdf) e faça o upload de todos as imagens PDF para este diretório. Agora crie uma página pública que tenha links para todos esses arquivos PDF. Espere até o Google indexar seu material.

Quando seus arquivos já estiverem aperecendo nas buscas, digite a seguinte sequência:

“site:xyz.com.br/pdf filetype:pdf”

Você verá seus documentos PDF convertidos em formato HTML.


Arquivado na Categoria: Dicas e Tutoriais

Sobre o Autor ()

EDUARDO TETERA - CEO da Tetera Consultoria & Idiomas. Editor do Portal Tetera.

Comentários (14)

Trackback URL | Feed RSS dos Comentários

  1. NELSON DOUGLAS DA SILVA disse:

    Boa tarde senhores !

    Pretendo converter textos escaneados em formato PDF, para circular na web.
    Tenho todas as condições em HARDWARE(scanner, impressora etc)e tb. muita vontade de aprender. No entanto esbarro no quesito : “COMO FAZER” !!!
    Gostaria de esclarecer as dúvidas:
    1. Tenho que convertê-los em OCR?
    2. Tenho que instalar um programa específico?
    3. Qual o nome ?
    4. Ao escanear e salvá-lo em formato OCR,será mantida, a formatação,os caracteres como se fosse uma foto do original ?

    Favor passar roteiro de procedimentos.

    Grato,

    Nelson Douglas da Silva

    NELSON DOUGLAS DA SILVA

  2. Maria disse:

    Olá
    Baixei o programa OCR,instalei no PC, mas eu não soube usar.
    Por favor, alguém tem como esplicar como é que usa?
    Agradeço desde já.
    Atenciosamente
    Maria

  3. Carlos Alberto disse:

    Tenho 150 folhas digitadas em doc Word.Escaniei todas e me mandaram por e-mail.Não consigo abrir como doc Word. Como fazer isso.
    Me ajudem!
    Obrigado.

  4. Helena disse:

    Preciso converter meus arquivo em OCR.

    Como devo fazer?

  5. lidya disse:

    Não existe esse formato!!!
    OCR – é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem. Habitualmente OCR é um software, programa
    Por exemplo, você pode utilizar abbyy finereader que não só converte PDF em doc e txt, mais permite transformar imagems do textos feitos com celular ou câmara digital ou escaneados em textos editáveis. Mais tem uma aplicação – screenshot reader – é muito fácil de usar e tambem transforma imagems.
    Eu adoro esse programma já que tem excelente precisão!
    Ou, mais fácil, pode usar PDF transformer que converte só documentos de pdf em doc, xls

  6. likirey disse:

    Concordo, o Finereader é muito bom!

  7. claudia disse:

    meu DEUS não tenho muita experiencia em computador ,preciso de ajuda pois tenho que mandar uns documento que eu escaniei para o msm da advogada e não tenho a menor ideia de como fazer. se houver ALGUEM de bom coração que possa me mandar como eu faço eu agradeço.

  8. angela maria da silva disse:

    tenho 17 documentos em espera e nao consigo dectar para
    a liberaçao da minha impressora como que eu faço me explica
    passo a passo por favor. obrigado. angela

  9. FILIPE ABREU EUSÉBIO disse:

    Tenho algumas páginas do meu documento escaneado no sistema PDF e pretendo levar-lo ao Word para aalgumas alterações necessária:
    O que devo fazer?
    Alguém que me possa ajudar a fazer-lo.Obrigado.

  10. Elaine disse:

    tenho impressora hp, scaniei foto e a foto sai em pdf e abre com adobe reader e não passar no facebook o que posso fazer, alguem pode me auxiliar, obrigada

Deixe uma resposta

O seu endereço de email não será publicado