Cambiar la codificación de un pdf

Iniciado por user-marcos, 11 Julio 2015, 19:35 PM

0 Miembros y 1 Visitante están viendo este tema.

user-marcos

Buena señores soy el pesao de los pdf. Gracias al mensaje anterior he podido realizar la conversión, después de preparar el algoritmo para convertir más de 15000 ficheros html, me doy cuenta que están decodificados, ¿Sabéis como puede cambiarlos utf8?
Un saludo.   

Slava_TZD

#1
iconv -f iso-8859-1 -t utf-8 Cambiarlacodificacióndeunpdf.html -o Cambiarlacodificacióndeunpdf.UTF8.html

El charset original en el ejemplo es iso-8859-1 pero puede variar según de donde estés bajando los htmls, puedes sacarlo con file:

file -bi file.html

Saludos


The fact is, even if you were to stop bombing us, imprisoning us, torturing us, vilifying us, and usurping our lands, we would continue to hate you because our primary reason for hating you will not cease to exist until you embrace Islam.