Introducción
Ante la ingente cantidad de información almacenada en formato electrónico, hablamos tanto de documentación científica como no científica, tal es el caso de Internet , que podemos considerarla como una potente base de datos con un crecimiento diario espectacular de documentos , pensamos en bases de datos de documentación científica o revistas electrónicas especializadas , se ha creado la necesidad de disponer de herramientas que permitan a los usuarios procesar y representar el contenido de los documentos de forma pertinente y fiable.
Las investigaciones en tecnologías de la información van dirigidas a solucionar estos problemas:
La obtención , filtrado , clasificación y extracción de información son ámbitos prioritarios en el campo de la tecnología lingüística y del Procesamiento del Lenguaje Natural (PLN).
Un problema común es la existencia de múltiples documentos sobre un mismo tema, por lo que sería útil poder destacar y/o resumir las similitudes y diferencias de la información contenida en los documentos de una forma que satisfaga las necesidades de los usuarios(1). Siendo imprescindible conseguir una adecuada representación del contenido.
La premura del tiempo y los costos elevados que derivan de su ejecución, ante la inmediatez y la productividad exigidos en la sociedad de la información permiten desarrollar de forma urgente un sistema de producción automática de resúmenes.
Diferenciamos dos tipos de resumen como resultado de la combinación de las metodológicas para la representación textual son:
Resúmenes por extracción ,consiste en una colección de términos, frases o párrafos significativos que son considerados representativos del texto original y que responden a unos criterios determinados.
Resúmenes por abstracción, consiste en un documento de nueva redacción como fruto del tratamiento automatizado de la información del documento original y para ello se precisa la conjugación de varias técnicas que pertenecen aún al campo de la investigación básica, y con resultados poco satisfactorios.