[Colabora] Desarrollo de mi algoritmo

Iniciado por Psyke1, 13 Junio 2012, 01:20 AM

0 Miembros y 1 Visitante están viendo este tema.

Psyke1

Voy a hacer una función que resuma un texto, para ello había pensado:



  • Comprobar que hay una correcta ortografía con esto.
    • Guardar oraciones en arrays y buscar palabras más repetidas (omitiendo artículos, preposiciones y demás usando un motor de análisis sintáctico) y dar prioridad a las oraciones dónde salgan éstas.
    • Identificar títulos.
    • Identificar palabras con mayúsculas.
    • Utilizar sinónimos en las palabras no principales.
    • Acortar enumeraciones largas que acaben en "etc" o "..."

    Información relevante:

    Poned ideas, fragmentos de algoritmos o documentación interesante. :)

    DoEvents! :P

79137913

HOLA!!!

Identifica titulos
Identifica oraciones antes de : lo que te ayudara a saber si se va  a definir  o enumerar algo

GRACIAS POR LEER!!!
"Como no se puede igualar a Dios, ya he decidido que hacer, ¡SUPERARLO!"
"La peor de las ignorancias es no saber corregirlas"

79137913                          *Shadow Scouts Team*

raul338

Creo que haria falta un motoro de "analisis sintactico" y ahí identificar las palabras, obtener su posible raiz y bueno, detectar adjetivos, sustantivos, verbos, etc a partir de una lista corta

Elemental Code

alguien sabia que word tiene autoresumen?

capas que podes ver como lo hace :P
Digo, no se, me parece :P

I CODE FOR $$$
Programo por $$$
Hago tareas, trabajos para la facultad, lo que sea en VB6.0

Mis programas

Psyke1

Cita de: Elemental Code en 13 Junio 2012, 18:47 PM
alguien sabia que word tiene autoresumen?

capas que podes ver como lo hace :P
Digo, no se, me parece :P
Hola Elemental, sí, claro que lo sabía. El problema es los autoresumenes del Word dejan mucho que desear y creo que entre todos y pensando un poco podemos hacer algo mejor.  :)

DoEvents! :P

Oblivi0n

Para hacer esto necesitas un analizador lexico-sintático, sería relativamente fácil distinguir las palabras, pero llegar a reconocer titulos, nombres etc etc puede llegar a tener mucha complejidad

Yoghurt

#6
Calamares!... Yo tenía un archivo de texto con las palabras en español sacadas (robadas por mi) de un traductor y estaban las palabras del diccionario indicando si eran sustantivos, adjetivos, etc. Eso ayudaría bastante, veré si lo encuentro en algun CD porque se me ha echo trizas el disco duro de mi notebook, a propósito Vendo ese Notebook que es un HP Mini....

A todo esto:
mmm... estuve revisando y nop, lo perdí. Pero recordé de donde salió, de una distribución de linux, ubuntu para ser exactos con un paquete de diccionario. Seguro te servirá muchísimo ojear en aquellos archivos. Suerte!.

LO ENCONTRE! Tube que instalar algunos paquetes.. blah blah blah... Bueno, lo tengo. Es un archivo de diccionario español con 56.338 lineas (palabras) en formato texto plano recien sacado "calentito" lleno de información sobre si cada palabra es; Verbo, Adjetivo, Sustantivo, etc.. Luce más o menos así:

...
perseguible/S
perseguidor/PS
perseguir/IOQWYZoqz
persevante/S
perseverancia/S
perseverante/MS
perseverar/LPSVWX
...


>>> Dime si te sirve y veo donde lo subo <<<