Hola. Tengo un código para descargar el código fuente de una página, y que de ahí extraiga todas las direcciones URL que encuentre:
curl -s --url "$URLBase" | sed 's/^.*http/http/' | grep "http://kuro.hanyuu.net/" | cut -d'"' -f1 > $HOME/Links.txt
El problema es que en la lista de enlaces, incluye unos que empiezan por "URL/data/preview/", y esos no me interesan.
Probé con:
grep "http://kuro.hanyuu.net/*g*"
y añadirgrep [image|jpeg]
para que solo obtuviese las que tuviesen esa coincidencia, pero no funcionan.
¿Algún ejemplo que me permita detectar si la URL incluye "/data/preview/"?
Gracias de antemano.
Pues entonces, intenta formular una expresión regular que realice las acciones que necesites, por ejemplo,
http:\/\/(.*\.(net|com|org))
La verdad es que soy un poco negado para esto de las RegExp... XD
¿Cómo debería aplicarlo a la línea que tengo?
Gracias por el tiempo ;)
Bueno, al final lo solucioné, era fallo mío XD
Además, debía usar egrep para que me detectase las ExpReg:
egrep 'http://kuro.hanyuu.net/image/(.*)|jpeg(.*)/'
Gracias.