[SOLUCIONADO] [Bash] Problemas con grep en una URL

Iniciado por aaronduran2, 16 Noviembre 2010, 11:18 AM

0 Miembros y 1 Visitante están viendo este tema.

aaronduran2

Hola. Tengo un código para descargar el código fuente de una página, y que de ahí extraiga todas las direcciones URL que encuentre:

curl -s --url "$URLBase" | sed 's/^.*http/http/' | grep "http://kuro.hanyuu.net/" | cut -d'"' -f1 > $HOME/Links.txt

El problema es que en la lista de enlaces, incluye unos que empiezan por "URL/data/preview/", y esos no me interesan.
Probé con:
grep "http://kuro.hanyuu.net/*g*"y añadirgrep [image|jpeg] para que solo obtuviese las que tuviesen esa coincidencia, pero no funcionan.

¿Algún ejemplo que me permita detectar si la URL incluye "/data/preview/"?

Gracias de antemano.

Shell Root

Pues entonces, intenta formular una expresión regular que realice las acciones que necesites, por ejemplo,
Código (javascript) [Seleccionar]
http:\/\/(.*\.(net|com|org))
Por eso no duermo, por si tras mi ventana hay un cuervo. Cuelgo de hilos sueltos sabiendo que hay veneno en el aire.

aaronduran2

La verdad es que soy un poco negado para esto de las RegExp... XD

¿Cómo debería aplicarlo a la línea que tengo?

Gracias por el tiempo ;)

aaronduran2

Bueno, al final lo solucioné, era fallo mío XD

Además, debía usar egrep para que me detectase las ExpReg:

egrep 'http://kuro.hanyuu.net/image/(.*)|jpeg(.*)/'

Gracias.