Expresiones regulares en Java

Iniciado por SeC, 3 Abril 2010, 20:14 PM

0 Miembros y 1 Visitante están viendo este tema.

SeC

Bueno esta publicación consiste en un básico ejemplo del uso de expresiones regulares en java. Ademas ya que estoy comenzando en este lenguaje recuerdo ese dicho de: "Enseñando/compartiendo se aprende", así es que vamos allá:

¿ Que son las expresiones regulares ?

CitarUna expresión regular, a menudo llamada también patrón, es una expresión que describe un conjunto de cadenas sin enumerar sus elementos. Por ejemplo, el grupo formado por las cadenas Handel, Händel y Haendel se describe mediante el patrón "H(a|ä|ae)ndel".

Citado de: Wikipedia

¿ Que necesitamos para usar expresiones regulares en Java ?

En Java a partir del JDK 1.4 se nos proporciona el paquete java.util.regexp el cual está formado por dos clases, que explicaré a continuación, la clase Matcher y la clase Pattern .


Las cuales incluiremos en nuestro programa de la siguiente manera:

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  


Algunos métodos interesantes de la clase "Matcher":

int end(int group)  

Devuelve el índice del último carácter más 1 de la coincidente con la expresión regular.

boolean find()  

Busca en la cadena de texto a analizar a partir del último matching, la secuencia de caracteres que puede concordar con la expresión regular

boolean find(int start)  

Lo mismo que find() , pero empieza a buscar a partir de un índice que le es dado como parámetro.

String group()  

Devuelve la cadena que ha sido aceptada por la expresión regular.

String group (int group)  

Es el equivalente en perl a $n. Es decir, si tenemos una expresión regular tal que : “((a)(b)(c))”, group(2) sería a.


Algunos métodos interesantes de la clase "Pattern":

static Pattern compile (String expreg)  

Crea un patrón a partir de la expresión regular dada por expreg.

static Pattern compile(String regex, int flags)  

Crea un patrón a partir de la expresión expreg teniendo en cuenta los flags. Los flags son opciones que se incluyen para tener un trato especial cuando se este trabajando con la expresión regular.
Ejemplo: si quiero que no me distinga entre mayúsculas y minúsculas, tendré que añadir el flag Pattern.CASE_INSENSITIVE.

int flags ()  

Devuelve los flags asociados a la expresión regular o patrón.

Matcher matcher(CharSequence input)  

Realizará el tratamiento del patrón sobre el texto que se le pase como entrada.

static boolean matches(String regex, CharSequence input)  

La utilidad de este método es que permite la no utilización de un matcher para indicar si una expresión regular puede albergar una cadena o parte de esta.

String pattern()  

Devuelve la expresión regular asociada al objeto Pattern sobre el que estemos trabajando.

String [] split (CharSequence input)  

Tiene el mismo significado que en Perl;es decir, dado un patrón, te crea un array de String con las diferentes cadenas en las que se ha dividido.


El ejemplo

Código (java) [Seleccionar]

import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
 
public class regexpjava { 
 
       public static void main(String[] args) { 
 
           Pattern pat=null; 
           Matcher mat=null; 
           String texto="<title>Hola soy el titulo</title>"; 
           pat=Pattern.compile("<title>(.*?)</title>"); 
           mat=pat.matcher(texto); 
           System.out.println("Texto \t\t\t: "+texto); 
           if(mat.find()){ 
 
               System.out.println("Expresion regular \t: <title>(.*?)</title>"); 
               System.out.println("Match! \t\t\t: "+mat.group(1)); 
           } 
       } 
}


La salida sería la siguiente:

CitarTexto                    : <title>Hola soy el titulo</title>  
Expresion regular   : <title>(.*?)</title>  
Match!                   : Hola soy el titulo  

Bueno creo que el ejemplo es mas que entendible, como para no explicarlo, cualquier cosa aquí estamos.

Referencias:
java.util.regex
java.util.regex.Pattern
java.util.regex.Matcher
BPSMind
Educad a los niños y no sera necesario castigar a los hombres - Pitagoras.

leogtz

Me ha servido, aunque no se parece mucho a Perl, para sacar el disco, la ruta y el nombre de un archivo he tenido que hacer esto:

      pat = Pattern.compile("([a-zA-Z]:)/(.*)/(.*)");


Y en Perl hice:

Código (perl) [Seleccionar]
#!/usr/bin/perl
use warnings;
use strict;
my $file = 'c:\windows\system32\nc.exe';
print "Archivo : $file\n";
my ($disco, $ruta, $nombre, $extension) = ($file =~ m/^(\w+\:\\)(.*)\\(.*)\.(.*)$/);
print "Disco : $disco\n";
print "Ruta : $ruta\n";
print "Nombre : $nombre\n";
print "Extensión : $extension\n";


No me ha gustado para nada, me quedo con Perl.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com

Debci

Esto me puede valer para mi lenguaje de programación.

Saludos y gracias por el aporte.


Hearts

Para trabajar en profundidad con las expresiones, deberían buscar sobre JFlex y CUP.

salu2

Debci

Cita de: Hearts en  3 Abril 2010, 22:47 PM
Para trabajar en profundidad con las expresiones, deberían buscar sobre JFlex y CUP.

salu2
Voy a mirarlo haber que tal.
Gracias.

Saludos

Debci

Disculpen el doble post, peor tengo un problema, que no se a que deriva .s
Tengo este codigo con estas expresiones:

Código (java) [Seleccionar]
String texto="if[4 < 1];"; 
pat=Pattern.compile("if[(.*?)];");


Y no devuelve nada, como es que no encuentra la expresión?
He utilizado mi analizador de expresiones para resolverlo pero si no uso el <></> en la expresión no lo coje, espero que sepan a que se deve.

Saludos