Convertir PDFs a text usando Python

Iniciado por valrojo, 7 Abril 2020, 13:36 PM

0 Miembros y 1 Visitante están viendo este tema.

valrojo

Tengo que cconvertir un PDF a text usando Python, el profesor nos ha dicho que utilicemos esta sentecia:
Código (python) [Seleccionar]
python3 pdf2txt.py document1.pdf > text.txt
pero a mi me sale el siguiente error: SyntaxError: invalid syntax

Para ello he utilizado python3.8

Shell Root

Por eso no duermo, por si tras mi ventana hay un cuervo. Cuelgo de hilos sueltos sabiendo que hay veneno en el aire.

valrojo


tincopasan

Citarel profesor nos ha dicho que utilicemos esta sentecia:
Código
bueno, estás esperando que te hagamos la tarea, que es muy simple, pero...

Citarpero a mi me sale el siguiente error: SyntaxError: invalid syntax

¿y qué código has realizado para ello?

valrojo

Es mi primera vez programando. Solo quiero saber cual es el error, no que me lo solucionéis.

@XSStringManolo

Cita de: valrojo en  7 Abril 2020, 13:36 PM
Tengo que cconvertir un PDF a text usando Python, el profesor nos ha dicho que utilicemos esta sentecia:
Código (python) [Seleccionar]
python3 pdf2txt.py document1.pdf > text.txt
pero a mi me sale el siguiente error: SyntaxError: invalid syntax

Para ello he utilizado python3.8

Por si no entiendes el comando te lo explico:

python3 es el intérprete de python3.

pdf2txt.py es el programa que convierte un pdf a texto.

document1.pdf es el pdf que quieres convertir.

> text.txt es donde se guardará el resultado del comando anterior.

Me da a mi que el programa está escrito en Python2.
Instala python2 y ejecútalo así:
python pdf2txt.py document1.pdf > text.txt

No conozco el programa pero si no te va el output prueba con:
python pdf2txt.py document1.pdf -o text.txt

No entiendo mucho cual es la finalidad del ejercicio. No tendrás que escribir tu la utilidad pdf2txt.py en lugar de usar una existente?