Eliminar líneas de texto contenidas.

Iniciado por MA40, 16 Octubre 2016, 22:59 PM

0 Miembros y 1 Visitante están viendo este tema.

MA40

Hola.

Tengo un archivo de texto con miles de líneas que debo depurar.

Ya he encontrado la forma de eliminar las líneas duplicadas, o sea, si dos o más líneas de texto son exactamente iguales, las elimina dejando sólo una, ahí no hay problema.

Pero también hay muchas líneas en el archivo que están contenidas en otras líneas y que deberían ser eliminadas y no sé cómo hacerlo.

Por ejemplo, estas dos líneas:

abc def
abc def ghi

La primera línea está contenida en la segunda, debe de ser eliminada y que quede sólo la segunda, así con cientos de líneas.

¿Hay alguna forma de hacerlo ya? ¿O tendré que hacer un programa específico para ello (con la consiguiente pérdida de tiempo)?

Un saludo.
¿Qué sucedería si se enfrentara una fuerza imparable contra un muro inamovible?
Visita Ediciones MA40 - Libros clásicos de ajedrez y este blog de ajedrez
ChessFaucet.com - Gana bitcoins jugando al ajedrez contra el ordenador