SweSum Project
SWESUM PROJECT
SweSum es un proyecto sueco creado por Martin Hassel y Hércules Dalianis que permite la traducción de textos en danés, inglés, francés, alemán , noruego, español y sueco.
SweSum es accesible a través de internet a través de la URL: http://swesum.nada.kth.se/index-eng.html
Los métodos de resúmen utlizados son:
·Se etiquetó en HTML el texto de un periódico sueco etiquetando solo los comandos de formato del texto.
El resumidor se escribe en Perl que es un cordón (según los autores) excelente que procesa idiomas.
·Desde el texto procesado se tiene el texto del periódico donde las frases que están al principio se presupone que contienen más información. De esta manera se calcula un factor de Posición donde se da más peso a las frases del principio del documento que a las del final.
La fórmula es : 1/ n donde n es el número de línea , llamado Básico.
·Las etiquetas HTML indican frases con mayor peso(texto intrépido) que las que contienen menos etiquetas, ya que los diarios titulan etiquetando. El texto intrépido también indica un cambio nuevo párrafo.
·A las frases con datos numéricos se les da una cuenta o puntuación más alta que sin valores numéricos.
·Se anotan frases que contienen palabras clave de frecuencia lata (tf). Para encontrar estas palabras se necesita usar un diccionario de clases de palabras. Todo el parámetro se normaliza y se pone en una función de combinación para obtener la cuenta o peso total de cada frase dentro del texto.
CUENTA TOTAL: Peso posición Peso intrépido + Peso numérico + Peso Clave
El usuario de Swesum también puede introducir sus propias palabras clave en el sistema y elegir el tamaño del resumen.
Evaluación del sistema:
Se usó una prueba de campo dentro del armazón (Tecnología del Idioma Humano). Se dieron a los estudiantes 10 textos de artículos con el propósito de ver cuanto un texto puede resumirse sin perder coherencia o información importante.
La prueba se realizó leyendo el texto resumido y dando a SweSum la cantidad de texto original que les gustaría en el resumen, anotando en una encuesta cuando la coherencia estaba rota o se perdía información.
De esta prueba se concluyó que el sistema funcionaba, al menos, tan bien como los resumidores en inglés con una coherencia de información del 30%.
El uso de SweSum se explica de manera detallada en el apartado de productos de este trabajo.