¿Sacar el texto que muestra de una imagen?

Iniciado por Orb, 24 Febrero 2015, 21:00 PM

0 Miembros y 1 Visitante están viendo este tema.

Orb

Quizás veáis esta pregunta un poco estúpida , pero la verdad es que me suena de ver algo similar , o el proceso contrario.

Mi pregunta es si hoy en día existe algún método por el cual de por ejemplo , si le saco una foto a la libreta de mi cuaderno , poder pasar todo lo que se visualiza en esa imagen a texto plano , siempre y cuando sea perfectamente visualizable y entendible

Un saludo y gracias¡

#!drvy

La idea en si es OCR. Hay algunas implementaciones que son bastante capaces.

Saludos

okik

Pues como te han respondido más arriba con un OCR. El sofware de los escáneres disponen de OCR. Creo que todos o casi todos.

Hay programas muy buenos completos diseñados especialmente para ello como el Omnipage.

Pero es importante que la imagen fotografiada sea clara sin zonas borrosas. Además debe ser letra de máquina, no manual. Porque cada persona tiene una letra particular y reconocer eso es muy complicado.


Eleкtro

#3
También hay que tener en cuenta que un gran porcentaje de aplicaciones recurren al motor OCR Tesseract, que fue y seguramente sigue siendo la solución open-source más extendida universálmente (al ser la mejor opción gratuita), y se basan en los algoritmos que éste utiliza, pero existen otros OCR más sofisticados que puedes encontrar en aplicaciones/librerías comerciales.

EDITO: Y también se debe tener en cuenta que, si el algoritmo OCR y/o aplicación lo permite, se debe especificar el lenguaje de origen del texto a reconocer para aumentar la probabilidad de éxito de la conversión, pues no es lo mismo utilizar los patrones del lenguaje Inglés, que del Castellano.

Cita de: Orb en 24 Febrero 2015, 21:00 PMexiste algún método por el cual de por ejemplo , si le saco una foto a la libreta de mi cuaderno , poder pasar todo lo que se visualiza en esa imagen a texto plano , siempre y cuando sea perfectamente visualizable y entendible

Perfectamente visualizable y entendible es altamente improbable, pues hay que comprender que siempre existirá un margen de error en la traducción, margen que aumentará por la cantidad total de texto-en-imagen que quieras convertir a texto plano y otros factores que favorecerán o desfavorecerán al reconocimiento de texto, debido a la propia naturaleza del ser humano por el amplio abanico existente en la escritura a mano (hand-writting) y las variaciones personales de cada individuo, el reconocimiento resulta complejo para "una máquina" que está limitada por la lógica empleada de un algoritmo de reconocimiento óptico de texto (OCR) en concreto.

Saludos!