CONCLUSIONES
1.- El increible crecimiento de la producción documental ha obligado a desarrollar
herramientas que permitan procesar la información de una forma eficiente. Para ello
se han creado sistemas de producción automática de resúmenes que permiten a los usuarios
procesar y representar el contenido de los documentos de forma pertinente y fiable.
2.- Actualmente las investigaciones llevadas a cabo han derivado en dos líneas de trabajo
fundamentales, a la hora de obtener los resúmenes de forma automática. Podemos diferenciar
dos tipos de resúmenes, por extracción y por abstracción.
3.- El procesamiento del lenguaje natural va dirigido a solucionar la ambigüedad del lenguaje
natural a través de técnicas informáticas. Con ello se pretende solucionar problemas en varios
niveles (morfosintáctico, sintáctico, semántico y contextual).
4.- Los métodos de representación del conocimiento en la generación automática de resúmenes
se encuadra en tres grandes grupos: los métodos de extracción basados en la estructura
superficial, los métodos de sumarización a medio camino entre el resumen y el extracto, y los
métodos gráficos y relacionales.
5.- El proceso de evaluación permite clarificar el resultado más o menos óptimo de la producción
automática de resúmenes. Sin embargo es un procedimiento complejo, que está condicionado por lapropia complejidad de la tarea de resumen (que se puede aplicar no solo al resumen automático
sino también al manual).
6.- Hemos comprobado que la investigación en la generación automática de resúmenes va paralela a la investigación sobre Procesamiento de Lenguaje Natural (PLN).Las investigaciones han experimentado un incremento significativo en la última década y en estos momentos arroja resultados
prometedores, podemos, afirmar que en el futuro la investigación está garantizada .Los grandes proyectos americanos (TIDES) y europeos (Proyecto WordNet) continúan buscando mejoras en los resultados.
Sin embargo , hay que señalar que casi la totalidad de la investigación es en lengua inglesa pues cualquier sistema que pretenda trabajar sobre la información semántica de un documento precisa un módulo de desambigüación del sentido de las palabras(WSD), los recursos léxicos ,las ontologías están orientadas a la desambiguación del sentido delas palabras en ingles . Además los numerosos recursos supone mayores facilidades en la fase de evaluación de resultados .
Este es el handicap de la investigación en lengua española. Y por ello en las universidades españolas la investigación en este campo es en ingles.
Sin embargo, la aparición de diferentes WordNets, dentro del proyecto EurowordNet, permitirá el desarrollo de aplicaciones que podrán incorporar módulos de WSD en español y un avance en los próximos años para la investigación desde las universidades lengua española.