Ayuda para crear un pequeño script

Iniciado por 0x22, 16 Diciembre 2021, 19:16 PM

0 Miembros y 1 Visitante están viendo este tema.

0x22

Buenas a todos  ::)
Estoy probando unas cosas y me gustaría hacer un script que me automatice las cosas porque hacerlo manual es un royo
Necesito un script que lo que haga es sacar la direccion url de un .txt
Por ejemplo digamos que tengo esto en un .txt
aaaaaaaaaaaaaaaaaadsvasdrnafdjsadiq293nafnsjanmfsjahttps://www.2138jsanujsa.comafmjsax
asdnj823hq4uhaunsdq848hans.mp4()7https://92934jdnacxz.com
Hay alguna forma de crear un script que lo que haga sea de ese .txt sacar las urls de https:// hasta el .mp4 y .com para no tener que buscar en todo el texto los links?
Se que puede sonar una tonteria pero es algo bastante importante en un "trabajo" que estoy haciendo para no tener que estar tantas veces buscando el link en todo el texto
Agradecería mucho si alguien me ayudase

Mohicano

#1
Ni siquiera necesitas desarrollar un script. Puedes usar cualquier editor de texto con soporte de búsqueda de caracteres mediante expresiones regulares (RegEx) para poder hacer una captura de todas las urls en el texto, y por último cortar, o copiar y pegar todas las coincidencias encontradas.

De todas formas, y si lo prefieres, puedes utilizar el motor Regex de tu lenguaje de programación favorito para desarrollar ese script.

Una expresión regular con este patrón de captura: "http.+?\.[a-Z]{3}", en el texto que has mostrado, capturará estos 2 elementos:
(Sólo el dominio)

Si necesitas algo más preciso puedes adaptar el patrón de captura a tus necesidades, y puedes buscar ejemplos más sofisticados en Google...
https://stackoverflow.com/questions/3809401/what-is-a-good-regular-expression-to-match-a-url

PD: Ten en cuenta que, según el lenguaje de programación que vayas a utilizar, hay pequeñas diferencias de sintaxis en el uso de expresiones regulares. El ejemplo que puse es compatible con Python, y los ejemplos de la url de arriba se supone que todos deberían ser compatibles con javascript.

0x22

Cita de: Mohicano en 16 Diciembre 2021, 20:30 PM
Ni siquiera necesitas desarrollar un script. Puedes usar cualquier editor de texto con soporte de búsqueda de caracteres mediante expresiones regulares (RegEx) para poder hacer una captura de todas las urls en el texto, y por último cortar, o copiar y pegar todas las coincidencias encontradas.

De todas formas, y si lo prefieres, puedes utilizar el motor Regex de tu lenguaje de programación favorito para desarrollar ese script.

Una expresión regular con este patrón de captura: "http.+?\.[a-Z]{3}", en el texto que has mostrado, capturará estos 2 elementos:
(Sólo el dominio)

Si necesitas algo más preciso puedes adaptar el patrón de captura a tus necesidades, y puedes buscar ejemplos más sofisticados en Google...
https://stackoverflow.com/questions/3809401/what-is-a-good-regular-expression-to-match-a-url

PD: Ten en cuenta que, según el lenguaje de programación que vayas a utilizar, hay pequeñas diferencias de sintaxis en el uso de expresiones regulares. El ejemplo que puse es compatible con Python, y los ejemplos de la url de arriba se supone que todos deberían ser compatibles con javascript.
Me podrias decir algun editor de texto que soporte el Regex?

0x22

Lo acabo de encontrar como, gracias por la ayuda   ;)

Danielㅤ

#4
Hola, solo comentar que la expresión regular que dejó el compañero Mohicano es limitada, esa regex solamente buscará dominios que tengan 3 letras en la extensión del dominio y tampoco toma en cuenta el segundo punto de la extensión de un dominio, por ejemplo con un dominio argentino fallaría:

https://ejemplo.com.ar

no solamente dominios de mí país, sino también de otros por ejemplo:

https://ejemplo.com.br
https://ejemplo.com.mx
https://ejemplo.co
https://ejemplo.cl
https://ejemplo.com.pe
https://ejemplo.com.ve
https://ejemplo.es
etc.

Además solamente busca dominios sin parámetros.

Tampoco busca patrones de dominios con subdominios, que pasaría si alguna URL tiene subdominio?, también fallaría por ejemplo:

https://foro.ejemplo.com

no la encontrará.


Saludos
¡Regresando como cual Fenix! ~
Bomber Code © 2021 https://www.bombercode.net/foro/

Ayudas - Aportes - Tutoriales - Y mucho mas!!!

0x22

Cita de: Danielㅤ en 16 Diciembre 2021, 22:19 PM
Hola, solo comentar que la expresión regular que dejó el compañero Mohicano es limitada, esa regex solamente buscará dominios que tengan 3 letras en la extensión del dominio y tampoco toma en cuenta el segundo punto de la extensión de un dominio, por ejemplo con un dominio argentino fallaría:

https://ejemplo.com.ar

no solamente dominios de mí país, sino también de otros por ejemplo:

https://ejemplo.com.br
https://ejemplo.com.mx
https://ejemplo.co
https://ejemplo.cl
https://ejemplo.com.pe
https://ejemplo.com.ve
https://ejemplo.es
etc.

Además solamente busca dominios sin parámetros.

Tampoco busca patrones de dominios con subdominios, que pasaría si alguna URL tiene subdominio?, también fallaría por ejemplo:

https://foro.ejemplo.com

no la encontrará.


Saludos
Lo he notado al buscar y me va fatal, me puedes pasar tu una mejor?