O que é tecnologia OCR e para que serve?

Anterior Próximo

O que é OCR e o que esta tecnologia faz exatamente?
Camila
Camila, a tecnologia conhecida como OCR (Optical Character Recognition, em inglês) faz o que seu nome já diz: é capaz de reconhecer um arquivo PDF e converter a imagem em milhares de palavras.
Você também pode utilizar um programa OCR para extrair as palavras de um texto escaneado.
Google OCR
Já que o arquivo PDF nada mais é que uma imagem com palavras embutidas — essas palavras podem, então, ser indexadas e encontradas nas buscas, de modo que esses documentos passam a ser mais facilmente encontrados.
Por isso, utilizando tecnologia OCR o Google já encontra texto em documentos escaneados
e consegue ler o que está escrito em arquivos PDF.

Este é um passo importante na missão do Google de tornar todas as informações no mundo acessíveis e úteis.

Há muito tempo os motores de busca já vinham indexando arquivos salvos como PDF, mas os documentos escaneados são bem mais difíceis de ser lidos por um computador. Escanear é o contrário de imprimir.
A impressão transforma palavras digitais em texto no papel, enquanto o escaneamento faz uma imagem digital do texto que está no papel. Assim você pode guardar o documento e visualizá-lo no computador.

Anterior Próximo

3 Comentários

Pingback: Google já encontra texto em documentos escaneados e PDF 31 de outubro, 2008
Pingback: Converta documentos escaneados em texto - Google OCR 1 de novembro, 2008
Anônimo 11 de março, 2009

hum…
Empougante
Mais nao é interessante

Responder
Eduardo Tetera 12 de março, 2009

Obrigado pela participação.

Responder
Thalita 1 de setembro, 2011

Google docs é muito fácil pra usar mais para reconcer os grandes volumes de documentos prefiro usar abbyy fienreader. trabalha com muito formatos como djvu e html e conserva a formatação do texto original

Responder
Pingback: Como funcionam os mecanismos de busca da Web? | brnbrn1984 5 de setembro, 2013

Veja mais

3 Comentários

Comentar Cancelar Resposta