Hola chicos verán quiero hacer un proyecto el cual identifique secuencias de palabras de un documento y verifique si estas palabras se encuentran en otro documento (para poder ver si se trata de una copia o no), la idea es que trate de identificar secuencias grandes, que estructura de datos me recomendarían para poder realizar esto?, Saludos
PD: Yo había pensado utilizar un arbol heap, pero no se si sea la mejor opción.
¿Podrías explicar a que te refieres con "secuencia de palabras"?
Y detallar ¿Cómo pretendes identificar que un documento es una copia de otro? ¿Imagino si tiene la misma cantidad de palabras? ¿Las mismas palabras?
Salu2s