Cualquier cosa hasta un "<" en RE????

Iniciado por Hanlly, 4 Enero 2012, 22:38 PM

0 Miembros y 1 Visitante están viendo este tema.

Hanlly

hola! :) buenas a tod@s

Soy nuevo en Elhacker... :P


tengo una pregunta.... (obviamente, no?? :P) y es k... como puedo representar en python (con la libreria de Expresiones regulares(re)) Cualkier cosa hasta k aparezca un "<"???

por ejemplo, tengo esto en un codigo fuente de una pagina web:

<p>Titulo Original: The Cutting Edge: Fire and Ice<br />GENERO: Romance | Comedia | Drama<br />PAIS: Estados Unidos<br />DURACION: 90 Minutos<br />AÑO: 2010<br />DIRECTOR: Stephen Herek<br />GUION: Holly Brix<br />INTERPRETES: Brendan Fehr, Francia Raisa, Marcela Pizarro, Russell Yuen, Stephen Amell, Zhenhu Han<br />PRODUCTOR: Craig Roessler, Sara Berrisford, Hudson Hickman<br />Código:  http://www.imdb.com/title/tt1600058/</p>


entonces, Como puedotomar desde Titulo Original, hasta Ice? (sin k el "<" aparezca...)

estaba probando con esto:

titulo=re.search("(T.tulo Original|T.TULO ORIGINAL): .*<", source).group()

Pero es que me toma TODO el codigo hasta la parte final...osea, la linea completa evitando los ultimos 3 caracteres ("/p>")...

No puedo usar .{rango} ya que separa un conjunto de paginas donde habla de peliculas, y los nombres de todas las peliculas no estan TODOS en un rango de caracteres valido... ya k si pongo uno pequeño, me salta con el error de atributo: a NoneType no se le asigna el atributo Group y si pongo uno muy grande, me toma la parte de genero....

Algun Script k me tome todos los datos de una vez por y para todas???


Espero respuestas,ayuda.... lo k sea.. gracias :)