Google Docs introduce reconocimiento OCR para reconocer texto en PDFs ...

Iniciado por Novlucker, 22 Junio 2010, 14:38 PM

0 Miembros y 1 Visitante están viendo este tema.

Novlucker

Google Docs introduce reconocimiento OCR para reconocer texto en PDFs y en imágenes

Google acaba de añadir una opción interesante en su suite ofimática online: la posibilidad de poder subir una imagen o un archivo PDF al servicio y que éste pueda reconocer los caracteres utilizando el sistema de reconocimiento OCR y convertirlos en un documento editable.

El reconocimiento de caracteres OCR es un sistema que seguro que os suena si tenéis un escáner: detecta caracteres a partir de una imagen y los convierte a texto plano, de modo que podemos por ejemplo escanear un libro y transcribirlo automáticamente sin tener que copiarlo nosotros a mano. Google sencillamente ha trasladado este sistema de reconocimiento en Google Docs.

De todos modos los resultados, tras probar la conversión de un PDF a un documento editable, no es que sean ideales. La conversión omite todas las imágenes, y si quieres transcribir un PDF con ilustraciones pasarás a tener un texto plano (que no siempre es correcto) sin retornos de línea ni las ilustraciones. Menos da una piedra, pero esperemos que Google poco a poco vaya mejorando esta funcionalidad.

Fuente:http://www.genbeta.com/actualidad/google-docs-introduce-reconocimiento-ocr-para-reconocer-texto-en-pdfs-y-en-imagenes
Contribuye con la limpieza del foro, reporta los "casos perdidos" a un MOD XD

"Hay dos cosas infinitas: el Universo y la estupidez  humana. Y de la primera no estoy muy seguro."
Albert Einstein