Parsear HTML ayuda !!!

Iniciado por TrashAmbishion, 7 Julio 2012, 14:44 PM

0 Miembros y 1 Visitante están viendo este tema.

TrashAmbishion

Hola amigos pues eso ando buscando algun code para aprender a parsear un HTML... lo que ando tratando de hacer es cargar un CAPTCHA en un PictureBox... gracias cualquier ayuda... Les dejo algo que encontre pero no se hacerlo funcionar...

http://www.codeproject.com/Articles/19407/HTML-Parsing-using-NET-Framework

Salu2

Anvil

\\::_--__!!ss"1122

TrashAmbishion

Cita de: Anvil en  7 Julio 2012, 21:36 PM
Checa este proyecto:

https://htmlagilitypack.codeplex.com/

Excelente, ya habia oido de ella pero tampoco lograba hacerla funcionar pero bueno Google bastante hasta que encontre un ejemplo sencillo y explicativo de como usar los NODOs..

Ahora hay un problema la web que trato de parsear se carga en IEFRAME y me da error con el HTMLAGILITY... estuve pensando en usar algun componente como el Webbrowser que me deje una ves que este cargada la pagina completa acceder al codigo HTML y hacer la busqueda cruda...

??? Que crees??

Anvil

¿por que no entras directo al iframe?
\\::_--__!!ss"1122

TrashAmbishion

Cita de: Anvil en  8 Julio 2012, 16:51 PM
¿por que no entras directo al iframe?

Cuando llamo a la pag principal, tiene este IEFRAME con el cod..

  <frameset border="0" framespacing="0" bordercolor="#0" rows="*,0%" frameborder="NO" cols="*">
    <frame id="mainFrame" name="mainFrame" marginwidth="0" marginheight="0" src="msn_files/index.htm">
    <frame id="rcvFrame" name="rcvFrame" marginwidth="0" marginheight="0" src="" noresize="noresize">
  </frameset><noframes></noframes>

y en el index.html tiene otro IEFRAME

   <frameset border="0" framespacing="0" bordercolor="#0" rows="*,0%" frameborder="NO" cols="*">
        <frame id="mainFrame" name="mainFrame" marginwidth="0" marginheight="0" src="index_data/sms.htm">
         <frame id="rcvFrame" name="rcvFrame" marginwidth="0" marginheight="0" src="msn_files/index.htm" noresize="noresize">
   </frameset><noframes></noframes>

y esa vendria siendo la ultima pagina sms.html pero no me deja entrar directoo..