script actualización pagina web con phantomjs

Iniciado por zaico, 16 Enero 2017, 19:36 PM

0 Miembros y 1 Visitante están viendo este tema.

zaico

Necesito recibir alertas instantáneas cada vez que haya una actualización en la siguiente pagina:
wzdig.pbc.gov.cn:8080/dig/ui/search.action?hl=zh-CN&sr=score+desc&q=铁&rp=&advepq=铁&advoq=&adveq=&ext=&advtime=2&advrange=text%26title
Esta utiliza javascript para mostrar el contenido, por lo tanto tenía pensado utilizar phantomjs para extraer el código y compararlo mas tarde con "watch". Pero primero quiero poder extraer el código html, por lo que por ahora tengo algo así:
$ phantomjs get.js http://wzdig.pbc.gov.cn:8080/dig/ui/advsearch.action > page.html


Siendo get.js:

var system = require('system');
var page = require('webpage').create();

var system = require('system');
var page = require('webpage').create();

// Imitate a real browser
page.viewportSize = { width: 1440, height: 900 };
page.settings.userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36";

// Called every time a page is loaded
page.onLoadFinished = function(){

   // If the real page with search controls is loaded
   // then get page.content and exit
   var inputCount = page.evaluate(function(){
       return document.querySelectorAll("h3").length;//encabezado noticia
   });

   if(inputCount > 0) {
       console.log(page.content);
       phantom.exit();
   }

};

El caso es que no me guarda el código html, mientras que el compañero que me está ayudando dice que si. El código me parece correcto¿que puede estar fallando?

Gracias de antemano!

EDITO: parece que el problema está en enviar el html a page.html sin pasarlo funciona. De todas formas ahora el problema es que me reedirige a http://wzdig.pbc.gov.cn:8080/dig/ui/search.action en vez de a la web que me interesa. Es decir como si hiciera una búsqueda en blanco.