cómo descargar una url?

Iniciado por kinos, 22 Junio 2010, 21:37 PM

0 Miembros y 1 Visitante están viendo este tema.

kinos

Hola:

   Estoy intentando descargar el código fuente de una url pero no me deja me sale este error.

Citarjava.io.IOException: Server returned HTTP response code: 403 for URL:......

El problema es que debe de usar cookies o algo por seguridad. Además no es una página estática, sino que es así http://www.dominioddd.com/lalaala?p=1&z=2

¿cómo podría hacerlo? tendría que engañarlo poniendo headers del mozilla para que crea que es un navegador o algo? tendría que enviarle alguna cookie... algun valor...?

bizco

lee sobre el protocolo http.

kinos

#2
ya he leido aguna cosa pero me gustaría saber que tengo que hacer.

¿Tendría que añadir información de este tipo?

Citarhttp://www.youtube.com/



GET / HTTP/1.1

Host: www.youtube.com

User-Agent: Mozilla/5.0 (X11; U; Linux i686; es-ES; rv:1.9.1.2) Gecko/20100400 Suse/11.2 () Firefox/3.4.2

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

Accept-Language: es-es,es;q=0.8,en-us;q=0.5,en;q=0.3

Accept-Encoding: gzip,deflate

Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Keep-Alive: 300

Connection: keep-alive

Cookie: use_hitbox=3d11d5cb2b3e40e368f83f82e88170a4dAEAAAAx; VISITOR_INFO1_LIVE=gGVgFC-0ULo; PREF=f1=50000000; GEO=cce3217b0e999b351e067808ee1fa979cwsAAAAzRVNS1b0dTCEL7Q==; __utma=27069237.193890743.1277234155.1277234155.1277234155.1; __utmc=27069237; __utmz=27069237.1277234155.1.1.utmcsr%3D(direct)%7Cutmccn%3D(direct)%7Cutmcmd%3D(none); watched_video_id_list=856d176f1f0e9e43005ac5f260b1e80cWwEAAABzCwAAAFJ1U1Y4NWk1NzRF



HTTP/1.1 200 OK

Date: Tue, 22 Jun 2010 20:05:03 GMT

Server: Apache

X-Content-Type-Options: nosniff

Content-Encoding: gzip

Expires: Tue, 27 Apr 1971 19:44:06 EST

X-YouTube-MID: sWkFSZzctYUFHdmdYNHpGSnNyby1xeVdBVlAyZzRjT04tOFk2dFYzSk43NGhYX0FBeEx3M0Vn

Cache-Control: no-cache

Content-Length: 14130

Content-Type: text/html; charset=utf-8


bizco

depende de la pagina, si es un formulario, si este es GET O POST..... depende de muchas cosas. como te digo lee sobre el protocolo http y dale un ojo a la pagina para saber que y como necesitas enviarlo.