Scripting para content Grabber

Iniciado por Reevo, 18 Agosto 2019, 14:00 PM

0 Miembros y 1 Visitante están viendo este tema.

Reevo

Buenas!

Creo que este es el hilo más apropiado para poner mi duda, así que ahi voy con ello.

Llevo un par de días utilizando content Grabber. Se trata de un programa que sirve para scrapear sitios webs de forma sencilla (su panel te permite hacer prácticamente todo de forma muy visual).
Tiene unas opciones más avanzadas donde permite para las diferentes acciones o comandos que ejecuta, ejecutar un script (permite regex, c# y otro más).

Me gustaría si alguien es capaz de ayudarme con eso. He estado probando regex y no he conseguido dar con la forma de hacerlo correctamente. C# no me asusta (he programado cosillas en C++) así que también es algo que me plantearía como opción posible.

Sabeis de algún sito donde pueda mirar documentación para hacer esto? Lo que me gustaría es, teniendo un input de html limpio -sin estilo en linea - borrar determinadas etiquetas según lo extrae (como <div> o <span>). Todo lo que he probado hasta el momento no me ha servido :(

Gracias!

engel lex

si es con regex y tiene opción de sustitución seria algo como

\<.+?\>

y el sustituto seria vacío (nada)
El problema con la sociedad actualmente radica en que todos creen que tienen el derecho de tener una opinión, y que esa opinión sea validada por todos, cuando lo correcto es que todos tengan derecho a una opinión, siempre y cuando esa opinión pueda ser ignorada, cuestionada, e incluso ser sujeta a burla, particularmente cuando no tiene sentido alguno.