Buena señores soy el pesao de los pdf. Gracias al mensaje anterior he podido realizar la conversión, después de preparar el algoritmo para convertir más de 15000 ficheros html, me doy cuenta que están decodificados, ¿Sabéis como puede cambiarlos utf8?
Un saludo.
iconv -f iso-8859-1 -t utf-8 Cambiarlacodificacióndeunpdf.html -o Cambiarlacodificacióndeunpdf.UTF8.html
El charset original en el ejemplo es iso-8859-1 pero puede variar según de donde estés bajando los htmls, puedes sacarlo con file:
file -bi file.html
Saludos