Eliminar caracteres no alphanumericos excepto algunos

Iniciado por rulogarcillan, 16 Enero 2015, 18:01 PM

0 Miembros y 1 Visitante están viendo este tema.

rulogarcillan

Muy buenas lo primero es presentarme, un saludo a toda la gente. Estoy empezando con python y no me conozco apenas los modulos basicos a si que ando perdido cn esto.

Tengo una cadena de texto la cual quiero eliminar caracteres basura, extraños como cuadraditos, y simblos raros.
Código (python) [Seleccionar]

import re

cadena = re.sub('[^0-9a-zA-Z]+', '', cadena)


Con esto me lo hace pero me quita @, comas, puntos / y esos si me gustaría mantenerlos....

Alguna solución sencilla?

gracias de antebrazo

rulogarcillan

#1
Muy novato lo mio joder

Código (python) [Seleccionar]
textoO = re.sub('[^0-9a-zA-Z\/@+\-:,|#]+', '', textoO)

Eleкtro

Hola

( ¿porque utilizas el botón de citar?, tienes un botón para insertar código. )

Lo que necesitas aprender es más bien la utilización y el comportamiento de las expresiones regulares (RegEx), en Python.

La expresión que has mostrado se puede simplificar:
Código (python) [Seleccionar]
textoO = re.sub('[^\w\/@+\-:,|#]+', '', textoO)

Saludos