Ocultar IP

Iniciado por user-marcos, 10 Agosto 2016, 01:33 AM

0 Miembros y 1 Visitante están viendo este tema.

user-marcos

Hola, quiero hacer scraping, legitimo, pero se que el sistema me va acabar baneando la ip. He mirado sistemas para ocultar la ip, como usar proxy. Como sólo lo voy a usar dos días he mirado algunas webs, gratuitas, pero la idea de pasar un servidor interpuesto me genera muchas dudas.
He pensado una alternativa y es usar una servidor compartido que tengo:
Código (php) [Seleccionar]

<?php
echo file_get_contents($_GET['url']);
?>


Esto funciona bien, pero presiento que voy acabar tumbando el servidor.
¿Alguien se le ocurre una alternativa?, ¿Me recomiendan usar un proxy?
Voy a usar linux y c++

engel lex

Puedes usar tor proxy y abrir instancias en simultaneo
El problema con la sociedad actualmente radica en que todos creen que tienen el derecho de tener una opinión, y que esa opinión sea validada por todos, cuando lo correcto es que todos tengan derecho a una opinión, siempre y cuando esa opinión pueda ser ignorada, cuestionada, e incluso ser sujeta a burla, particularmente cuando no tiene sentido alguno.

user-marcos

Llevo mirándolo 4 horas, pero no consigo que me funcione, si alguien tiene/conoce alguna guía se lo agradecería.

[u]nsigned

Lo mejor es usar un Linux, instalar e iniciar el servicio tor y luego llamar a tu script con proxychains. Lo bueno de tor es que podes crear un cronjob que cada x minutos reinicie el service renovando tu IP.


No hay atajo ante la duda, el misterio se hace aquí...
Se hace carne en cada uno, el misterio es existir!

user-marcos

Si yo sólo uso linux, y cron también estoy acostumbrado voy a probar a usar proxychains, porque no me han baneado, pero me han puesto captchas.

[u]nsigned

Entonces tenes el conocimiento suficiente para usar TOR por consola.

Por casualidad lo que querés hacer es un crawler o data minning? Porque en ese caso te recomiendo usar la libreria PHP Simple HTML DOM Parser.

No hay atajo ante la duda, el misterio se hace aquí...
Se hace carne en cada uno, el misterio es existir!

user-marcos

Está es mi mejor amiga,  PHP Simple HTML DOM Parser.
Lo que tengo pensado hacer es con c++ descargarlo todo y con PHP procesarlo. Porque más de una vez después de procesar online con php o algo me ha salido mal o quiero coger más cosas, mejor guardar y luego procesar. Voy instalar ya proxychains haber si consigo que funcione.

[u]nsigned

Como estas en Linux, yo te recomendaría que directamente uses wget para descargar, no reinventes la rueda amigo ;)

Citar$ proxychains wget http://url.com

Saludos!

No hay atajo ante la duda, el misterio se hace aquí...
Se hace carne en cada uno, el misterio es existir!

user-marcos

Lo acabo de instalar y configurar, "funcioana" he probado el wget con varias web, pero percisamente la que quiero me rechaza la petición.

Petición HTTP enviada, esperando respuesta... 503 Service Unavailable
2016-08-10 19:01:24 ERROR 503: Service Unavailable.

Es gracioso que esta web esté tan bién protegida, cuando ellos son los primeros en hacer scraping para ajustar sus precios.

user-marcos

Muchas gracias por vuestras respuestas. El wget lo bloquea pero con un navegador no.

$ proxychains lynx -source https://web.com > file.html