CONCLUSIONES

1.- El increible crecimiento de la producción documental ha obligado a desarrollar

herramientas que permitan procesar la información de una forma eficiente. Para ello

se han creado sistemas de producción automática de resúmenes que permiten a los usuarios

procesar y representar el contenido de los documentos de forma pertinente y fiable.

2.- Actualmente las investigaciones llevadas a cabo han derivado en dos líneas de trabajo

fundamentales, a la hora de obtener los resúmenes de forma automática. Podemos diferenciar

dos tipos de resúmenes, por extracción y por abstracción.

3.- El procesamiento del lenguaje natural va dirigido a solucionar la ambigüedad del lenguaje

natural a través de técnicas informáticas. Con ello se pretende solucionar problemas en varios

niveles (morfosintáctico, sintáctico, semántico y contextual).

4.- Los métodos de representación del conocimiento en la generación automática de resúmenes

se encuadra en tres grandes grupos: los métodos de extracción basados en la estructura

superficial, los métodos de sumarización a medio camino entre el resumen y el extracto, y los

métodos gráficos y relacionales.

5.- El proceso de evaluación permite clarificar el resultado más o menos óptimo de la producción

automática de resúmenes. Sin embargo es un procedimiento complejo, que está condicionado por lapropia complejidad de la tarea de resumen (que se puede aplicar no solo al resumen automático

sino también al manual).

6.- Hemos comprobado que la investigación en la generación automática de resúmenes va paralela a la investigación sobre Procesamiento de Lenguaje Natural (PLN).Las investigaciones han experimentado un incremento significativo en la última década y en estos momentos arroja resultados

prometedores, podemos, afirmar que en el futuro la investigación está garantizada .Los grandes proyectos americanos (TIDES) y europeos (Proyecto WordNet) continúan buscando mejoras en los resultados.

Sin embargo , hay que señalar que casi la totalidad de la investigación es en lengua inglesa pues cualquier sistema que pretenda trabajar sobre la información semántica de un documento precisa un módulo de desambigüación del sentido de las palabras(WSD), los recursos léxicos ,las ontologías están orientadas a la desambiguación del sentido delas palabras en ingles . Además los numerosos recursos supone mayores facilidades en la fase de evaluación de resultados .

Este es el handicap de la investigación en lengua española. Y por ello en las universidades españolas la investigación en este campo es en ingles.

Sin embargo, la aparición de diferentes WordNets, dentro del proyecto EurowordNet, permitirá el desarrollo de aplicaciones que podrán incorporar módulos de WSD en español y un avance en los próximos años para la investigación desde las universidades lengua española.

PAGINA PRINCIPAL