[python] procesar html

lnvisible · 28 Mayo 2011, 21:44 PM

Hola.

Quiero procesar html en python, no estoy segura de si quiero pasarlo a objetos python como con amara, si quiero usar xml.dom que viene ya de serie con python o si quiero usar xquery o xpath para extraer los valors.

De lo que estoy segura es de que no quiero aprender las cuatro cosas para luego ver que no me vale, o que otra es mejor o que he perdido el tiempo, o que no se. $:-\$
¿que es lo mejor y lo que deberia aprender?

Quiero algo que sea facil, estandar y potente. Lo quiero todo

GRacias!!

PD: ah!!

uso python3, amara no me vale por eso, pero puede que haya otras cosas iguales

LeXeL · 31 Mayo 2011, 21:50 PM

Pues como yo lo veo puedes usar Regex o Beatifull soup:
-regex viene predeterminado en python con la libreria re
- y beatifull soup pues hace el trabajo.

miralos y dime que tal

lnvisible · 11 Junio 2011, 15:55 PM

regex es muy complicado, puede haber cosas en varias líenas.

beautifull soup lo vi hace mucho y es muy bueno, pero no tanto para python3.

Creo que usaré dom, al menos es estándar. $:-\$

Test Foro de elhacker.net SMF 2.1

[python] procesar html

lnvisible

LeXeL

lnvisible