Test Foro de elhacker.net SMF 2.1

Programación => Scripting => Mensaje iniciado por: aaronduran2 en 16 Noviembre 2010, 11:18 AM

Título: [SOLUCIONADO] [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 16 Noviembre 2010, 11:18 AM
Hola. Tengo un código para descargar el código fuente de una página, y que de ahí extraiga todas las direcciones URL que encuentre:

curl -s --url "$URLBase" | sed 's/^.*http/http/' | grep "http://kuro.hanyuu.net/" | cut -d'"' -f1 > $HOME/Links.txt

El problema es que en la lista de enlaces, incluye unos que empiezan por "URL/data/preview/", y esos no me interesan.
Probé con:
grep "http://kuro.hanyuu.net/*g*"y añadirgrep [image|jpeg] para que solo obtuviese las que tuviesen esa coincidencia, pero no funcionan.

¿Algún ejemplo que me permita detectar si la URL incluye "/data/preview/"?

Gracias de antemano.
Título: Re: [Bash] Problemas con grep en una URL
Publicado por: Shell Root en 17 Noviembre 2010, 04:21 AM
Pues entonces, intenta formular una expresión regular que realice las acciones que necesites, por ejemplo,
Código (javascript) [Seleccionar]
http:\/\/(.*\.(net|com|org))
Título: Re: [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 19 Noviembre 2010, 19:45 PM
La verdad es que soy un poco negado para esto de las RegExp... XD

¿Cómo debería aplicarlo a la línea que tengo?

Gracias por el tiempo ;)
Título: Re: [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 20 Noviembre 2010, 23:58 PM
Bueno, al final lo solucioné, era fallo mío XD

Además, debía usar egrep para que me detectase las ExpReg:

egrep 'http://kuro.hanyuu.net/image/(.*)|jpeg(.*)/'

Gracias.