Test Foro de elhacker.net SMF 2.1

Programación => Desarrollo Web => Mensaje iniciado por: colcrt en 19 Septiembre 2019, 02:06 AM

Título: [pregunta] como puedo extraer estos datos de google
Publicado por: colcrt en 19 Septiembre 2019, 02:06 AM
hola, me disculpo si este tema no va a aqui;
veran quiero extraer estos datos estadisticos de partidos deportivos y que gogle presenta pero lo intente haciendo web scraping pero google no lo deja facil pensaba quizas mediante php si alguno me pudiera ayudar con algun ejemplo o api me seria de gran ayuda

olvide poner la url  :xD

https://www.google.com/search?biw=1280&bih=913&ei=ULaCXZOWHoGWr7wP5pqa-AU&q=champions+league&oq=shampion&gs_l=psy-ab.3.0.0i67i70i253j0i67j0i10l8.6617.23205..24298...14.1..4.364.7540.3j0j4j20......0....1..gws-wiz.....0..0i71j0j0i131j0i22i30.HG1S2619vVM#sie=m;/g/11h_1r6xxt;2;/m/0c1q0;dt;fp;1;; (https://www.google.com/search?biw=1280&bih=913&ei=ULaCXZOWHoGWr7wP5pqa-AU&q=champions+league&oq=shampion&gs_l=psy-ab.3.0.0i67i70i253j0i67j0i10l8.6617.23205..24298...14.1..4.364.7540.3j0j4j20......0....1..gws-wiz.....0..0i71j0j0i131j0i22i30.HG1S2619vVM#sie=m;/g/11h_1r6xxt;2;/m/0c1q0;dt;fp;1;;)
Título: Re: [pregunta] como puedo extraer estos datos de google
Publicado por: @XSStringManolo en 19 Septiembre 2019, 09:58 AM
Código (php) [Seleccionar]
$data = file_get_contents("https://www.google.com/search?q=uefa");

Así obtienes el Codigo Fuente en un string. Yo reduciría el código pillando solo desde donde pone Liga de Campeones de la UEFA hasta el último resultado
Despues quitas todas las etiquetas y ya solo te quedan cadenas como:Fin Madrid 4 Bayern 0
Es sencillo con contadores por etiqueta, condicionales y bucles, no te hace falta más. Pero tendrás que picar algo de código.


Lo malo es que Google te muestra pocos resultados. Es una competición internacional, seguro que si buscas encuentras alguna página pequeña de un periodico, la web de una radio con toda la tabla o algo así que te sea muy fácil de scrapear.




Mod: Obligatorio el uso de etiquetas GeSHi.