Tecnologia

Google já encontra texto em documentos escaneados e PDF

O scanner é uma ferramenta e tanto.
Todos os dias são publicados documentos escaneados na web — desde relatórios oficiais do governo até ensaios acadêmicos de gosto duvidoso. Estes arquivos contêm imagens de textos, em vez do texto em si.
O interessante é que estes documentos tem algo em comum: alguém, em algum lugar, achou que estes textos são valiosos o bastante a ponto de compartilhar com o mundo.
Antigamente, documentos escaneados raramente eram incluídos nos resultados das buscas do Google e não se podia ter certeza do seu conteúdo. O que se conseguia, de vez em quando, eram pistas baseadas nas referências ao documento — você conseguia resultados para sua pesquisa com um título mas sem o velho snippet resumindo o conteúdo do arquivo.
Hoje, felizmente, as coisas mudaram. A busca do Google já consegue aplicar a tecnologia de OCR em qualquer documento escaneado que estiver indexado no formato PDF da Adobe. Coisa boa, hein?
Para ver o novo sistema funcionando, clique nas busca abaixo. Note o resumo dos documentos nos resultados da pesquisa, junto com o texto inteiro apresentado após o link ‘View as HTML’ link:
[Manual de Configuração Rápida do Monitor a Cores Dell™ E151FP]
[thinkgeek bluetooth-headset-instructions]
[portal da pesquisa Manual usuário]

0 Comments

  1. Olá
    Baixei o programa OCR, instalei no meu PC. quando foi na ora de usar eu não soube usar. Alguém gostaria de me ajudar me explicando como se usa esse programa?
    Agradeço desde já.
    Atenciosamente
    Maria

  2. Oi Eduardo,
    Como assim, salvar em formato OCR?
    Aí é que vem o problema eu não sei salvar no OCR.
    Por favor se possivel me explique um pouco como é
    que salva. OK?
    Fico muito agradecida

Deixe um comentário

O seu endereço de e-mail não será publicado.