Spider php o python

Iniciado por SCU, 1 Junio 2013, 19:44 PM

0 Miembros y 1 Visitante están viendo este tema.

SCU

Saludos, estoy llevando a cabo un proyecto y necesito crear una aplicación web que consulte periódicamente archivos publicados en unas pocas páginas web, y los descargue al servidor, para ello me han dicho que existe una librería php que permite crear consultas como si fuesen consultas a bases de datos, pero no me han dicho más sobre el tema.

Me podéis echar una mano?

Muchas gracias!
9Pilon13Gate14Gas16Pylon...cibernetics&...¿?¿?¿?FUCK! scout scout scout!

~ Yoya ~

Lo que intentas hacer, se llama Minería de datos

Para parsear los datos en PHP, puedes utilizar la librería PHP Simple HTML Dom Parser. Te recomiendo si tienes duda similares, lo publiques en la sección de PHP, así tendrás mas colaboración ya que estas en la sección equivocada. Tambien puedes utilizar Expresiones Regulares para parsear los datos pero si no la conoces sera un poco confuso entender y muchas veces obtendrás algunos bug, así que te lo recomiendo como ultima opción para parsear muchos datos de un documento HTML.

Saludos.
Mi madre me dijo que estoy destinado a ser pobre toda la vida.
Engineering is the art of balancing the benefits and drawbacks of any approach.

#!drvy

#2
Citarpara ello me han dicho que existe una librería php que permite crear consultas como si fuesen consultas a bases de datos

No es exactamente una libreria...  YQL. http://developer.yahoo.com/yql/
http://developer.yahoo.com/yql/guide/yql-code-examples.html

Saludos

SCU

Wo! muchas gracias a los dos! tanto por corregirme a la hora de elegir sitio para la publicación como por los dos aportes! esto me ayuda a orientar un poco mi trabajo, que andaba bastante desorientado.

Gracias!
9Pilon13Gate14Gas16Pylon...cibernetics&...¿?¿?¿?FUCK! scout scout scout!

SCU

Por cierto, estoy en fase de documentación pero el proyecto lo tengo que comenzar a implementar en septiembre, cuando lo tenga lo publicaré en el foro y nos vamos a reir bastante XD
9Pilon13Gate14Gas16Pylon...cibernetics&...¿?¿?¿?FUCK! scout scout scout!