volcar código fuente a txt (Python-Bach)

Iniciado por Caparroni, 24 Abril 2016, 11:25 AM

0 Miembros y 1 Visitante están viendo este tema.

Caparroni

Buenas gente,  necesito un script que me vuelque el código fuente de la web que se le indique a un documento txt, he estado probando con batch: Con el comando Wget, pero no me funciona o se instala mal :/, también he probado en python 3.4 con 'urllib', pero no me aclaro, todas las guías que he encontrado son de urllib2 o urllib3, los cuales no he logrado encontrar para windows,  agradecería cualquier idea y mas aun unasolución xD, salu2

tincopasan

sería bueno que por lo menos pongas un código, digas que problemas te da y ahí los que saben te ayudarán mejor, en vez de esperar todo servido.

Caparroni

Haber, no tengo código que volcar,  solo he encontrado 2 formas de hacerlo y ninguna me funciona, el comando Wget  (para descargar archivos de internet mediante "batch") el cual directamente no me funciona el instalador, y urllib2 (python) el cual para windows solo se encuentra la primera versión, urllib a secas, no pido todo servido, solo una idea o solución


1   import urllib3
2   url = "http://foro.elhacker.net/index.php"
3   http = urllib3.PoolManager(timeout=5.0)
4   r = http.urlopen('GET', url)
5   htmltext=r.read()

Con urllib3 creo que seria de ese modo

engel lex

si no te revisas la documentación no vas a llegar a ningún lado... estás mezclando urllib2 y 3

lee la documentación oficial... https://pypi.python.org/pypi/urllib3

allí más simple el ejemplo no es posible
El problema con la sociedad actualmente radica en que todos creen que tienen el derecho de tener una opinión, y que esa opinión sea validada por todos, cuando lo correcto es que todos tengan derecho a una opinión, siempre y cuando esa opinión pueda ser ignorada, cuestionada, e incluso ser sujeta a burla, particularmente cuando no tiene sentido alguno.

tincopasan

por lo que dices quedan más dudas que otra cosa:
"urllib2 (python) el cual para windows solo se encuentra la primera versión, urllib a secas, no pido todo servido, solo una idea o solución"
urllib2(python 2.x)
urllib "a secas"(python 3.x)
"1   import urllib3
2   url = "http://foro.elhacker.net/index.php"
3   http = urllib3.PoolManager(timeout=5.0)
4   r = http.urlopen('GET', url)
5   htmltext=r.read()

Con urllib3 creo que seria de ese modo"

¿lo probaste? ¿que error te da? ¿no es el resultado esperado?

supongo que estás copiando scripts sin tener ni la mínima idea de que hacen, ni buscando demasiada info.

¿que versión de python usas? en fin
batch no uso por que es demasiado límitado.
en python 3 con urllib sería algo así lo que buscas:

Código (python) [Seleccionar]

import urllib.request
url = "http://www.google.com.ar"
respuesta = urllib.request.urlopen(url)
pagina = str(respuesta.read())
print(pagina)
archivo= open('codigo.txt','w')
archivo.write(pagina)


en "san google" aparece en muchas páginas info, aunque sí más que todo en python 2.7 y no lo uso.

Caparroni

Perfecto Tincopasan, es justamente lo que intentaba hacer, uso python 3, como has dicho en "san google" sale mucha info, pero casi toda de urllib 2 ya he buscado creeeme T.T,  y urllib3 no podía ponerlo en windows , perdonen por mi incompetencia ante estos temas, soy nuevo en python y estoy lleno de dudas, enserio muchas gracias por vuestro tiempo