Pillar una linea del codigo fuente de otra web

Iniciado por GrogxSystem, 19 Agosto 2016, 14:46 PM

0 Miembros y 1 Visitante están viendo este tema.

GrogxSystem

Les cuento,  quiero captar un link que va canviando en una web, por ejemplo whatsapp, el link de descarga va cambiando por cada version.
Lo intente con file_get_contents pero al ser un link dentro de una etiqueta ( <a> ) no me funciono.

Me han dicho que se hace con un script pero no he encontrado nada, ayudenme porfavor

GrogxSystem :rolleyes:

z3nth10n

Buenas GrogxSystem,

primero, esto debería ir en PHP.

segundo, prueba con alguna librería de parseado de DOM como esta: http://simplehtmldom.sourceforge.net/

Un saludo.

Interesados hablad por Discord.

ivandiaz

Lo que estas buscando se llama web scrapping. Aca tenes uno muy usado que esta en python
http://scrapy.org/

WHK

#3
Primero necesitas obtener el enlace de descarga, eso lo logras con expresión regular: <a.*?href="(.*?)" y preg_math despues de tener el enlace obtienes el contenido con file_get_contents.

Enlaces de ayuda:
http://php.net/manual/es/function.preg-match-all.php
http://php.net/manual/es/function.file-get-contents.php
http://boozox.net/php/manual-completo-y-sencillo-de-expresiones-regulares-en-php/
http://regexr.com/

Saludos.