Error al capturar texto de pagina web VB.NET 2008

Iniciado por LuckyLucciano, 11 Julio 2013, 02:00 AM

0 Miembros y 1 Visitante están viendo este tema.

LuckyLucciano

Hola El Benjo , te molesto por ultima vez en este hilo para decirte felizmente que pude resolverlo. Si bien lo resolví de una forma que no era la planteada en este hilo (usando webclient), una solución es una solución!!!

Lo que hice fue hacer un webcontrol y dos backgroundworkers, uno abre la página cada x cantidad de segundos, el otro lee el código HTML cada x cantidad de segundos... esto antes me tiraba un error de invalidcastexception al intentar leer el codigo, pero leyendo un poco me entere que ese tipo de accesos al objeto hay que hacerlos en el evento doworkcompleted.

Bueno, nada, agradecerte infinitamente por tu tiempo y tu conocimiento, sos un groso!

El Benjo

Me halagas, pero aquí hay gente que es mucho mejor. Si no me crees échale un vistazo (si no lo has hecho) al concurso de aplicaciones que se está llevando a cabo en este mismo foro:

http://foro.elhacker.net/programacion_general/ehndev_2013_concurso_de_desarrollo_de_aplicaciones_hilo_oficial-t391786.0.html

Y qué bueno que pudiste encontrar la solución tú mismo, esa creo que es la mejor forma de aprender.

Suerte.
www.es.neftis-ai.com

Sí hay un mejor lenguaje de programación y es ese con el que puedes desarrollar tus objetivos.

Eleкtro

Habría sido genial que hubiesen encontrado una solución usando requests.

Aunque no he comentado nada al respecto pero la verdad es que este tema me interesa bastante y estuve probando varias cosas para conseguir resolverlo,
desde permitir headers inseguros en la aplicación (activar los unsafeheaders) para corregir el problema de los headers, pero siempre se queda colgado con la url de shoutcast,
también estuve indagando en dos sources de dos proyectos de Shoutcast en CodeProject, pero eran streamrippers y no obtenian la información necesaria, es más estan un poco obsoletos,
Me llegué a mirar decenas de resultados en todo Google pero parece que nadie en todo el mundo tiene idea de como corregir el problema principal de los headers con la url de shoutcast, siempre se comenta los unsafeheaders, pero los unsafeheaders no sirven para este problema.

...Lo dicho, estaría muy bien que un experto en la materia diese una solución más sutil que usar un webbrowser.

@LuckyLucciano
Me alegro de que lo hayas conseguido.

Saludos








El Benjo

Eso que comentas, elektro, sería muy interesante y creo que la manera que se me viene a la mente para resolverlo, sería analizando como trabaja el webbroser, pero tendríamos que analizar su código o el código de un browser de código abierto como Mozilla (supongo que es código abierto).

La otra forma que se me ocurre para resolverlo sería analiznado la manera en que devuelve información shoutcast y crear un control que emule el protocolo en cuestión (imagino que HTTP) o demás protocolos que hicieran falta.

¿Tú qué opinas?
www.es.neftis-ai.com

Sí hay un mejor lenguaje de programación y es ese con el que puedes desarrollar tus objetivos.

Eleкtro

#14
Cita de: El Benjo en 14 Julio 2013, 05:32 AM¿Tú qué opinas?
No soy quien para opinar sobre protocolos, el nivel web no es lo mio xD.

Lo que si tengo claro es que los headers hay que eliminarlos y agregar los de Shoutcast, al menos eso es lo que he visto hacer por ahí, pero con eso no parece ser suficiente para requerir la información del "Status" del server.

Saludos!








ciru3

Se que pasó mucho tiempo desde el ultimo post, pero quería hacer saber que tenía un problema similar con un página, y logré solucionarlo agregando un user-agent. Por ejemplo, yo he agregado:
httpRequest.UserAgent = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"

Y con eso el servidor me responde correctamente. Espero que les sirva.