[Python]Comprobar si hay actualizaciones en elhacker.net

braulio-- · 5 Mayo 2009, 22:04 PM

He hecho este code para comprobar si hay actualizaciones en elhacker.net, es para windows, pero se puede adaptar a linux con cambiar una sola linea.

Código (python) [Seleccionar]

import urllib2,os
def obtenercode():
  web = urllib2.urlopen("http://elhacker.net")
  code=web.read()
  return code
try:
 archivo=open("ultimapagina.html","rw")
 archivodos=open("nuevo.txt","w")
 archivodos.write(obtenercode())
 archivodos.close()
 archivodos = open("nuevo.txt","r")
 if  archivodos.readlines()==archivo.readlines():
   archivodos.close()
   os.system("del /f nuevo.txt")
   print "No ha habido ninguna actualizacion"
   raw_input()
 else :
   print "Hay alguna actualizacion"
   archivo.write(obtenercode())
   raw_input()
   exit(0)
except :
 print "No existe la pagina ultimapagina.html, asi que se guardara la pagina"
 archivo = open("ultimapagina.html","w")
 archivo.write(obtenercode())
 print "Fichero guardado. Adios"
 archivo.close()
 exit(0)

-Saludos.

Novlucker · 5 Mayo 2009, 22:24 PM

Un poco de python

Entiendo que esto es para la web de elhacker.net verdad?
Como la solicitud a la página es en el mismo momento en que realizas la comparación podrías ver de que la misma sea on the fly, ya que no es necesario crear el archivo "nuevo.txt"

Y por otra parte veo que se realiza la comparación, pero nunca guardas la nueva página, es decir, revisas que haya una de antes y de haberlo lo comparas, pero luego eliminas el "nuevo.txt" y el "ultimapagina.html" queda igual, así que la próxima comparación sera contra el mismo archivo

Saludos

Shrick · 5 Mayo 2009, 23:47 PM

Si esa es la metodología pillar el fuente copiarlo en un archivo después, al de unos dias vuelves ha hacer lo mismo y haces una comparación byte a byte haber si hay algo nuevo y si lo hay pues se anuncia y pista. Yo el urllib todavía no lo he utilizado aunque pienso utilizarlo porque lo veo muy útil y sencillo, sin embargo los de python todavia tienen que implementar correctamente el SSL para entrar en páginas de HTTPS, que por desgracia aun les queda camino, existe la librería M2Crypto que te permite hacer lo mismo, sin embargo, esta carente de documentación y uno se harta de tener que leerse todo el code y entenderlo.

braulio-- · 7 Mayo 2009, 21:52 PM

Source modificado para que guarde la pagina cuando actualice, no lo he probado pero supongo que funcionará.

Test Foro de elhacker.net SMF 2.1

[Python]Comprobar si hay actualizaciones en elhacker.net

braulio--

Novlucker

Shrick

braulio--