3.- TESAURO

3.1 -Definiciones:

Tesauro proviene de la palabra inglesa thesaurus que Peter Mark definió en 1852 como “Colección de palabras y frases ordenadas, no en orden alfabético, como están en un diccionario, sino de acuerdo con las ideas que representan. Es decir, que se tiene la idea , y hay que buscar la palabra o palabras que se ajusten exactamente a esa idea”. Esta definición servirá de base para las sucesivas acepciones y uso del término thesaurus.

En 1976 se publicarán los manuales de la UNESCO, donde se definen los tesauros, según su función y su estructura como:

- Según su función: Instrumento de control terminológico usado para trasladar desde un lenguaje natural de los documentos, los descriptores a un sistema lingüístico.
- Según su estructura: Vocabularios controlados y dinámicos de términos relacionados semántica y genéricamente, que cubren un dominio específico del conocimiento.

Una definición más reciente es la que da la norma UNE 50-106, de 1989 que define tesauro como “Un vocabulario de un lenguaje de indización controlado, donde éste es una serie de términos extraídos del lenguaje natural y utilizados para representar de forma breve los temas de los documentos, organizado formalmente, con objeto de hacer explícitas las relaciones a priori entre conceptos”

De todas esta serie de definiciones, clásicas o recientes, de tesauros, se deduce que, para que se considere como tal, debe cumplir las siguientes condiciones:

- ser un lenguaje especializado
- estar normalizado en un proceso post-controlado
- las unidades lingüísticas que lo componen, por tratarse de léxicos dedicados a un tema concreto, adquieren la categoría de términos convertidos en palabras clave, por cuanto que determinan el tema de que trata un documento.
- Estas palabras claves se relacionan entre si, jerárquicamente, de forma asociativa o por semejanza de equivalencia
- Los procesos de relación se podrán realizar con métodos de pre-coordinación o post-coordinación
- Se trata de lenguajes terminológicos, usados con fines documentarios, por lo que se convierten en lenguajes documentales utilizados en procesos de indización o clasificación para la recuperación de información.
- Deben permitir la introducción o supresión de términos para mantener su actualidad constante
- Deben servir para convertir el lenguaje natural, de los documentos, ambiguo y libre, en un lenguaje concreto, normalizado, apta para controlar la información contenida en el documento
- Han de servir de anexo de unión entre el documento y el usuario, donde el documentalista es el eslabón fundamental

3.2- EVOLUCIÓN HISTÓRICA

Existe un “teoría de tesauros” que dice que todo empezó por el aumento de temas, conocidos y de nueva creación que aparecía en la cada vez más abundante literatura, de todo tipo: los sistemas jerárquicos no daban la respuesta adecuada a la demanda de información. Las bibliotecas y centros de documentación se quedaban obsoletos y eran infrautilizados, por lo que había que buscar una solución.
La solución vino dado por quienes pensaron que la cuestión estaba en encontrar nuevos sistemas de clasificación que permitiesen más flexibilidad en el tratamiento de los temas contenidos en los documentos. Se pensó que la ordenación alfabética de los temas, dejaba lagunas a la hora de intercambiar sus relaciones. Lo que se hizo fue mirar hacia atrás en documentos que presentaban estructuras sistemáticas en la ordenación de los conceptos que albergaban, pero ahora había que saber si esta idea era aplicable a procesos documentales.
De esta forma surgieron los primeros métodos de clasificación utilizando conceptos sacados de los propios documentos, sin conexión previa. Recibieron el nombre de Thesaurus.

Parece ser que a mediados de los años 50, cuando Howerton y Helen Brown, cada uno por separado, utilizaron por primera vez la palabra “thesaurus”. Este hecho coincidió con el desarrollo del Sistema Uniterm, elaborado por Mortimer Taube y dado a conocer en 1951. Aquí los términos, que determinan los conceptos, eran unidades lingüísticas simples, el fue el primero en utilizar la denominación palabra-clave para designar aquellas que determinaban el contenido de los documentos. Estableció una categoría de estas palabras claves, unas eras las principales, que llamo descriptores, y otras eran sus sinónimas. En el proceso de búsqueda de información era cuando se podían combinar los conceptos, usándole sistema booleano y se obtenía la información deseada.

Al parecer este sistema no satisfacía a la mayoría, sobre todo a aquellos que manejaban temas muy concretos y menor volumen de documentos. Es por esto por lo que en 1494 Calvin N.Moores, da a conocer su sistema Zator, donde las palabras clave podían ser términos compuestos o simples. De esta forma se hacía posible la combinación en la fase de construcción del sistema clasificatorio.

Con los descriptores se construían índices, por lo que al proceso de obtener aquellas palabras de los documentos, se le llamo indizar.

Se puede decir que una vez asentadas las bases, los primeros tesauros, formalmente construidos, aparecen a partir de 1960, por ejemplo el Thesaurus de la Armed Service Technical Information Agency . Comienza así una etapa en que la preocupación se centra en la construcción de tesauros, sin embargo, no será hasta los años 70 cuando empiece a haber un gran número de nuevos tesauros.

- En 1967 se creó un grupo de trabajo en la República Federal Alemana, para construir un tesauro para la industria química.

- Entre 1969 y 1970 se publicó THE PRECIS Index System que servirá de guía para la confección de la bibliografía británica.

- En 1967 se creó el TEST (Tesaurus of Engineering and Scientific Terms) que fue la base en la que se apoyó el Reino Unido para construir su BRistish Standard 5723.

El hecho de que se fuese desarrollando el campo de la informática y aparecieran en el mercado ordenadores cada vez más manejables y económicos, potenció la automatización de las ciencias de la documentación, y este fue el motivo del auge que se dejó sentir en los tesauros.


En España, en el ámbito referido a los estudios teóricos sobre tesauros, hasta la década de los años 80 no se ha producido gran actividad en este campo.
Se puede destacar por ejemplo, la creación de las cátedra de Lingüísticas Documental y de Teledocumentación en las Facultades de la Información y de las Facultades y Escuelas de Biblioteconomía y Documentación FUINCA con su promoción y estudio de las bases de datos ha potenciado el uso y estudio de los tesauros..

Otra actividad destacada, es la elaboración de la norma UNE 50-160, traducida de ISO 2788.


3.3- CLASIFICACIÓN

En cuanto al ámbito del tema que abarcan los tesauros pueden ser:

Generales

Especializados


Multidisciplinares

Monodisciplinares


Principales

Auxiliares

En cuanto a la disposición del tema o temas tratados:

Alfabéticos

Sistemáticos o Temáticos


Jerárquicos

Facetados


Gráficos


Jerárquicos

Facetados


Gráficos


Alfabética

Sistemática

Gráfica


Macrotesauros: Contiene diferentes temas relacionados entre sí, pero dispuesto en apartados diferentes


Microtesauros: Un macrotesauro está compuesto de varios microtesauros que están relacionados entre sí por referencias cruzadas

 

3.4- ESTRUCTURA DE LOS TESAUROS

Al estudiar la estructura interna de un tesauro, parece importante poner de manifiesto la diferencia que existe entre éste y una lista de términos o de encabezamiento de materias. Los tres documentos son vocabularios, lenguajes terminológicos, especiales y especializados, cuyas unidades básicas están constituidas por palabras normalizadas generalmente referidas a un tema concreto del conocimiento. La diferencia estriba en que la lista de términos, no contiene otra relación entre ellos que la propia ordenación alfabética de sus mismos términos. Por otra parte, la línea de encabezamientos de materia, los términos que la componen se hallan relacionados en sí mismo, entre sí. En un tesauro, los términos simples o compuestos, se hallan relacionados entre sí de forma que permiten su combinación en un proceso de post-coordinación, son por tanto, más flexibles en sí mismos y su actualización es más dinámica y rápida.

Los componentes principales de los tesauros son las palabras claves, que no tienen por qué representar a una sola palabra, en realidad lo que representan era un concepto y éste podía expresarse por una palabra o por varias. A las palabras claves aisladas se les llama identificadores, ya que ayudan a identificar un documento

Los términos que componen el tesauro serán:

- simples
- compuestos
- identificadores
- indicadores de función


Si tenemos en cuenta la importancia de los términos, serán:

- principales
- secundarios


Según la relevancia de los términos serán:

- descriptores preferentes
- equivalentes no-preferentes


3.4.1-RELACIONES ENTRE TÉRMINOS

Una de las características de los tesauros es que los términos se conecten unos con otros, según indicaciones establecidas por su propio significado, de manera que unos nos conduzcan a otros. Por ello, lo más práctico es organizarlos en familias o grupos, donde se tengan en cuentas las afinidades semánticas.

Si las familias se organizan en grupos donde figure un término superior-genérico y unos términos de menor contenido de significado, términos de menor contenido de significado, términos subordinados-específicos, habremos establecido una relación jerárquica de mayor a menor y de menor a mayor

P.E centro urbano
                  municipio
                  distrito
                  barrio

Si las familias se organizan por asociación de ideas a nivel horizontal donde no se puede establecer una jerarquía, pero sí unas relaciones semánticas, se hablará de relación asociativa y los términos serán relacionados entre sí.

P.E mobiliario
         ------------->> Carpintería

3.4.2- NOTACIONES

Siguiendo los acuerdos internacionales se han adoptado notaciones alfabéticas, con subíndices en su caso, para designar las relaciones entre términos. Estas notaciones se colocan siempre precediendo al término al que hacen referencia.

NA: Nota de Aplicación. En inglés se usan las siglas SN (Scope Note)

USE: Indica el descriptor – término preferente- que se elige entre varios términos sinónimos o cuasisinónimos.

ÚP (Usado Por): Indica el términos equivalente- no preferente. En inglés se usan las siglas UF (Use For)

TC:(término cabecera): Se aplica a los términos que identifican el nombre de la clase más amplia a la que pertenece el concepto específico; se emplea algunas veces en la selección alfabética de los tesauros.En inglés se usan las siglas TT (Top Term)

TG: Término Genérico. En inglés se usan las siglas BT (Broader Term)

TE: Término Específico. En inglés se usan las siglas NT (Narrower Term)

TR: Término Relacionado. En inglés se usan las siglas RT (Related Term)

En cuanto a la tipología de la escritura, es costumbre en los tesauros escribir el descriptor o término preferente con mayúsculas y los términos equivalentes o términos no preferentes con minúsculas. Los términos relacionados se escriben también con mayúsculas.

3.5- CONFECCIÓN

En principio, un tesauro se necesita para indizar los documentos y como consecuencia, hará falta el mismo tesauro para recuperar la información. En muchos centros o servicios de documentación, usan bases de datos y redes de información externas, de las cuales disponen sus tesauros oficiales. Para caso en que no se necesario manejar tesauros muy complicados y voluminosos, lo mejor es construir un tesauro que se adapte a las necesidades de los centros o servicios de documentación.
Siempre que se tenga que usar un tesauro en un servicio de información, lo primero que habrá que hacer es saber si ya existe alguno para el campo de aplicación en cuestión Para ello se debe consultar la abundante bibliografía sobre el tema. En el caso en que ya exista un tesauro sobre nuestro campo de trabajo, habremos de comprobar en qué medida puede ser utilizado por nosotros o al menos en que medida puede servirnos de guía.

Consideraciones que se deben tener en cuenta:

1- Consideraciones de tipo interno

- Tema principal
- Temas secundarios
- Ámbito de los temas
- Grado de precisión
- Número de los documentos
- Clases de documentos
- Tipos de datos contenidos en los documentos
- Tipos de documentos: primarios o secundarios
- Fuentes de provenencia de los documentos
- Aumento progresivo de los documentos en el tiempo
- Necesidades de actualización

2- Consideraciones de tipo externo

- Características del centro: interno o externo
- Clase de centro: privado o público
- Tipo de centro: especializado o general
- Forma del trabajo con el usuario: indirecta o directa
- Sistema de trabajo: manual o mecanizado
- Personal con el que se cuenta: especializado o auxiliar
- Características de los usuarios
- Tipo de consulta
- Volumen de consultas
- Grado de crecimiento de las consultas
- Previsión de crecimiento del propio centro
- Sistema de financiación

Por último, las condiciones generales que debe cumplir un tesauro para las necesidades concretas en cada caso son:

- General y multidisciplinar (incluso multilingüe)
- General y monodisciplinar

- Especializado, debe ser muy concreto
- Exhaustivo, considerando la mayor cantidad posible de términos y todas las relaciones posibles

- Específico, con un número reducido de términos y todas las relaciones posibles
- Genérico, con un número reducido de términos y pocas relaciones entre ellos.

3.6- PRESENTACIÓN DE UN TESAURO

Una vez que ya se tienen los términos elegidos y se han establecido las relaciones entre ellos, el paso siguiente es pensar en la forma en que se han de presentar para su mejor uso.
A primera vista parece que una ordenación alfabética de los términos principales con sus términos relacionados colocados debajo, indicando con la notación correspondiente, la forma de relación, puede ser suficiente para localizarlos y saber de ellos todo lo necesario. Es verdad que en la mayoría de los casos basta esta forma de presentación, sin embargo, la experiencia ha demostrado que, en gran número de ocasiones, es preciso ordenar los términos, según aquellas familiar que habíamos construido al principio. Es decir, se deben distribuir en clases que proporcionen una visión de conjunto del tema.

Por otra parte, una representación gráfica de los términos y sus relaciones ayuda a comprender su ordenación y facilita el uso del tesauro.

Así pues, se han de considerar tres tipos de representaciones de tesauros:

1. presentación
2. presentación en grupos o clases, es decir, semántica
3. presentación gráfica