Test Foro de elhacker.net SMF 2.1

Programación => Programación General => Java => Mensaje iniciado por: soyderiver2007 en 19 Julio 2011, 01:54 AM

Título: Parsear html desde en java
Publicado por: soyderiver2007 en 19 Julio 2011, 01:54 AM
Hola, alguien me podría ayudar, necesito extraer los párrafos de un archivo con extensión html, el tag para los párrafos es "p". espero que alguien me pueda ayudar muchas gracias, saludos.
Título: Re: Parsear html desde en java
Publicado por: Leyer en 19 Julio 2011, 02:35 AM
Prueba asi

Código (java) [Seleccionar]
    Pattern p = Pattern.compile("<p>(.*?)</p>");
    Matcher m = p.matcher(html);
    while (m.find()) System.out.println(m.group(1));


Un saludo.
Título: Re: Parsear html desde en java
Publicado por: soyderiver2007 en 26 Julio 2011, 23:08 PM
Muchas gracias Leyer, ya lo hice utilizando Jsoup. Igual lo voy a probar Saludos.
Título: Re: Parsear html desde en java
Publicado por: athlit en 28 Septiembre 2011, 14:23 PM
Leyer era justo lo que andaba buscando. En un par de lineas obtengo lo que hacía con muchas muchas más......

Gracias por compartir.

Un saludo.
Título: Re: Parsear html desde en java
Publicado por: Debci en 29 Septiembre 2011, 00:36 AM
Si quieres profundizar mas este tema, te recomiendo que visites este (http://www.programacion.com/articulo/expresiones_regulares_en_java_127) link.

Son expresiones regulares y con ellas se pueden hacer barbaridades!


Saludos
Título: Re: Parsear html desde en java
Publicado por: athlit en 29 Septiembre 2011, 09:04 AM
Pues te lo agradezco mucho, ayer estuve buscando por ahí para entender el patrón que pusiste, y aprender más a cerca de las expresiones regulares. No tuve mucho éxito.

Gracias por el link!