Extraer información de una web

Iniciado por 4nc3str4l, 14 Agosto 2013, 12:59 PM

0 Miembros y 1 Visitante están viendo este tema.

4nc3str4l

Hola a todos,

Llevo un tiempo buscando la manera de extraer información de un apartado de una web especifico para así poder ver los datos a través del tiempo.

Ejemplo de lo que quiero hacer:

Imaginad que quiero extraer el numero de gente conectados al foro de la página del hacker.net (no es el caso) y solo quiero guardar ese numero, no otra cosa.
(Es información pública, nada de hacking)

Como podría hacerlo? (solo la parte de extraer la información adecuada, guardarlo en un fichero de texto y tal eso ya sé cómo hacerlo)

Muchas gracias a todos de antemano ! sois todos geniales.


# "Saber romper medidas de seguridad no hacen que seas hacker, al igual que saber hacer un puente en un coche no te convierte en un ingeniero de automoción"
-- Eric Raymond

kokaroto

#1
Si sabés PHP podrías hacer un script que se ejecute cada cierto tiempo con cronjobs, con el mismo PHP leer el HTML de la página y con expresiones regulares llegar al número de usuarios y guardarlo en un archivo de texto.

También con python aunque no sabría como hacer para que se ejecute solo.

navegante2013

La verdad eso es muuuuuy facl, yo tengo una aplicación que obtiene datos de cualquier página web, esta información o datos luego se los puede guardar en un archivo de texto o una BBDD de datos, este proceso lo utilizo para:

1.- Obtener las Ultimas Noticias del dia
2.- Obtener el estado del tiempo y reporte de temperatura
3.- Información de la Wikipedia
4- Información del RAI Diccionario de la Real Academia Española
5.- Lista de enlaces de una consulta en Google
6.- Resultados de juegos , deportes
7.- Valores de cotozaciones de monedas.

etc

[youtube=640,360]https://www.youtube.com/watch?v=_Fsy1Zdy1-o[/youtube]

Saludos
Nadie conoce lo que se puede llegar a alcanzar o conseguir, sino hasta que se decide dar el primer paso.