3.1 -Definiciones:
Tesauro proviene de la palabra inglesa thesaurus que Peter Mark definió en 1852 como “Colección de palabras y frases ordenadas, no en orden alfabético, como están en un diccionario, sino de acuerdo con las ideas que representan. Es decir, que se tiene la idea , y hay que buscar la palabra o palabras que se ajusten exactamente a esa idea”. Esta definición servirá de base para las sucesivas acepciones y uso del término thesaurus.
En 1976 se publicarán los manuales de la UNESCO, donde se definen los tesauros, según su función y su estructura como:
- Según su función: Instrumento de control terminológico usado para trasladar desde un lenguaje natural de los documentos, los descriptores a un sistema lingüístico.
- Según su estructura: Vocabularios controlados y dinámicos de términos relacionados semántica y genéricamente, que cubren un dominio específico del conocimiento.
Una definición más reciente es la que da la norma UNE 50-106, de 1989 que define tesauro como “Un vocabulario de un lenguaje de indización controlado, donde éste es una serie de términos extraídos del lenguaje natural y utilizados para representar de forma breve los temas de los documentos, organizado formalmente, con objeto de hacer explícitas las relaciones a priori entre conceptos”
De todas esta serie de definiciones, clásicas o recientes, de tesauros, se deduce que, para que se considere como tal, debe cumplir las siguientes condiciones:
- ser un lenguaje especializado
- estar normalizado en un proceso post-controlado
- las unidades lingüísticas que lo componen, por tratarse de léxicos dedicados a un tema concreto, adquieren la categoría de términos convertidos en palabras clave, por cuanto que determinan el tema de que trata un documento.
- Estas palabras claves se relacionan entre si, jerárquicamente, de forma asociativa o por semejanza de equivalencia
- Los procesos de relación se podrán realizar con métodos de pre-coordinación o post-coordinación
- Se trata de lenguajes terminológicos, usados con fines documentarios, por lo que se convierten en lenguajes documentales utilizados en procesos de indización o clasificación para la recuperación de información.
- Deben permitir la introducción o supresión de términos para mantener su actualidad constante
- Deben servir para convertir el lenguaje natural, de los documentos, ambiguo y libre, en un lenguaje concreto, normalizado, apta para controlar la información contenida en el documento
- Han de servir de anexo de unión entre el documento y el usuario, donde el documentalista es el eslabón fundamental
3.2- EVOLUCIÓN HISTÓRICA
Existe
un “teoría de tesauros” que dice que todo empezó por
el aumento de temas, conocidos y de nueva creación que aparecía
en la cada vez más abundante literatura, de todo tipo: los sistemas jerárquicos
no daban la respuesta adecuada a la demanda de información. Las bibliotecas
y centros de documentación se quedaban obsoletos y eran infrautilizados,
por lo que había que buscar una solución.
La solución vino dado por quienes pensaron que la cuestión estaba
en encontrar nuevos sistemas de clasificación que permitiesen más
flexibilidad en el tratamiento de los temas contenidos en los documentos. Se
pensó que la ordenación alfabética de los temas, dejaba
lagunas a la hora de intercambiar sus relaciones. Lo que se hizo fue mirar hacia
atrás en documentos que presentaban estructuras sistemáticas en
la ordenación de los conceptos que albergaban, pero ahora había
que saber si esta idea era aplicable a procesos documentales.
De esta forma surgieron los primeros métodos de clasificación
utilizando conceptos sacados de los propios documentos, sin conexión
previa. Recibieron el nombre de Thesaurus.
Parece ser que a mediados de los años 50, cuando Howerton y Helen Brown, cada uno por separado, utilizaron por primera vez la palabra “thesaurus”. Este hecho coincidió con el desarrollo del Sistema Uniterm, elaborado por Mortimer Taube y dado a conocer en 1951. Aquí los términos, que determinan los conceptos, eran unidades lingüísticas simples, el fue el primero en utilizar la denominación palabra-clave para designar aquellas que determinaban el contenido de los documentos. Estableció una categoría de estas palabras claves, unas eras las principales, que llamo descriptores, y otras eran sus sinónimas. En el proceso de búsqueda de información era cuando se podían combinar los conceptos, usándole sistema booleano y se obtenía la información deseada.
Al parecer este sistema no satisfacía a la mayoría, sobre todo a aquellos que manejaban temas muy concretos y menor volumen de documentos. Es por esto por lo que en 1494 Calvin N.Moores, da a conocer su sistema Zator, donde las palabras clave podían ser términos compuestos o simples. De esta forma se hacía posible la combinación en la fase de construcción del sistema clasificatorio.
Con los descriptores se construían índices, por lo que al proceso de obtener aquellas palabras de los documentos, se le llamo indizar.
Se puede decir que una vez asentadas las bases, los primeros tesauros, formalmente construidos, aparecen a partir de 1960, por ejemplo el Thesaurus de la Armed Service Technical Information Agency . Comienza así una etapa en que la preocupación se centra en la construcción de tesauros, sin embargo, no será hasta los años 70 cuando empiece a haber un gran número de nuevos tesauros.
- En 1967 se creó un grupo de trabajo en la República Federal Alemana, para construir un tesauro para la industria química.
- Entre 1969 y 1970 se publicó THE PRECIS Index System que servirá de guía para la confección de la bibliografía británica.
- En 1967 se creó el TEST (Tesaurus of Engineering and Scientific Terms) que fue la base en la que se apoyó el Reino Unido para construir su BRistish Standard 5723.
El hecho de que se fuese desarrollando el campo de la informática y aparecieran en el mercado ordenadores cada vez más manejables y económicos, potenció la automatización de las ciencias de la documentación, y este fue el motivo del auge que se dejó sentir en los tesauros.
En España, en el ámbito referido a los estudios teóricos
sobre tesauros, hasta la década de los años 80 no se ha producido
gran actividad en este campo.
Se puede destacar por ejemplo, la creación de las cátedra de Lingüísticas
Documental y de Teledocumentación en las Facultades de la Información
y de las Facultades y Escuelas de Biblioteconomía y Documentación
FUINCA con su promoción y estudio de las bases de datos ha potenciado
el uso y estudio de los tesauros..
Otra actividad destacada, es la elaboración de la norma UNE 50-160, traducida de ISO 2788.
3.3- CLASIFICACIÓN
En cuanto al ámbito del tema que abarcan los tesauros pueden ser:
Generales Especializados |
Multidisciplinares Monodisciplinares |
Principales |
En
cuanto a la disposición del tema o temas tratados:
Alfabéticos |
Jerárquicos |
Jerárquicos |
Alfabética |
Macrotesauros: Contiene diferentes temas relacionados entre sí, pero dispuesto en apartados diferentes |
3.4- ESTRUCTURA DE LOS TESAUROS
Al estudiar la estructura interna de un tesauro, parece importante poner de manifiesto la diferencia que existe entre éste y una lista de términos o de encabezamiento de materias. Los tres documentos son vocabularios, lenguajes terminológicos, especiales y especializados, cuyas unidades básicas están constituidas por palabras normalizadas generalmente referidas a un tema concreto del conocimiento. La diferencia estriba en que la lista de términos, no contiene otra relación entre ellos que la propia ordenación alfabética de sus mismos términos. Por otra parte, la línea de encabezamientos de materia, los términos que la componen se hallan relacionados en sí mismo, entre sí. En un tesauro, los términos simples o compuestos, se hallan relacionados entre sí de forma que permiten su combinación en un proceso de post-coordinación, son por tanto, más flexibles en sí mismos y su actualización es más dinámica y rápida.
Los componentes principales de los tesauros son las palabras claves, que no tienen por qué representar a una sola palabra, en realidad lo que representan era un concepto y éste podía expresarse por una palabra o por varias. A las palabras claves aisladas se les llama identificadores, ya que ayudan a identificar un documento
Los términos que componen el tesauro serán:
-
simples
- compuestos
- identificadores
- indicadores de función
Si tenemos en cuenta la importancia de los términos, serán:
-
principales
- secundarios
Según la relevancia de los términos serán:
- descriptores preferentes
- equivalentes no-preferentes
3.4.1-RELACIONES ENTRE TÉRMINOS
Una de las características de los tesauros es que los términos se conecten unos con otros, según indicaciones establecidas por su propio significado, de manera que unos nos conduzcan a otros. Por ello, lo más práctico es organizarlos en familias o grupos, donde se tengan en cuentas las afinidades semánticas.
Si las familias se organizan en grupos donde figure un término superior-genérico y unos términos de menor contenido de significado, términos de menor contenido de significado, términos subordinados-específicos, habremos establecido una relación jerárquica de mayor a menor y de menor a mayor
P.E
centro urbano
municipio
distrito
barrio
Si las familias se organizan por asociación de ideas a nivel horizontal donde no se puede establecer una jerarquía, pero sí unas relaciones semánticas, se hablará de relación asociativa y los términos serán relacionados entre sí.
P.E
mobiliario
------------->> Carpintería
3.4.2- NOTACIONES
Siguiendo los acuerdos internacionales se han adoptado notaciones alfabéticas, con subíndices en su caso, para designar las relaciones entre términos. Estas notaciones se colocan siempre precediendo al término al que hacen referencia.
NA: Nota de Aplicación. En inglés se usan las siglas SN (Scope Note)
USE: Indica el descriptor – término preferente- que se elige entre varios términos sinónimos o cuasisinónimos.
ÚP (Usado Por): Indica el términos equivalente- no preferente. En inglés se usan las siglas UF (Use For)
TC:(término cabecera): Se aplica a los términos que identifican el nombre de la clase más amplia a la que pertenece el concepto específico; se emplea algunas veces en la selección alfabética de los tesauros.En inglés se usan las siglas TT (Top Term)
TG: Término Genérico. En inglés se usan las siglas BT (Broader Term)
TE: Término Específico. En inglés se usan las siglas NT (Narrower Term)
TR: Término Relacionado. En inglés se usan las siglas RT (Related Term)
En cuanto a la tipología de la escritura, es costumbre en los tesauros escribir el descriptor o término preferente con mayúsculas y los términos equivalentes o términos no preferentes con minúsculas. Los términos relacionados se escriben también con mayúsculas.
3.5- CONFECCIÓN
En
principio, un tesauro se necesita para indizar los documentos y como consecuencia,
hará falta el mismo tesauro para recuperar la información. En
muchos centros o servicios de documentación, usan bases de datos y redes
de información externas, de las cuales disponen sus tesauros oficiales.
Para caso en que no se necesario manejar tesauros muy complicados y voluminosos,
lo mejor es construir un tesauro que se adapte a las necesidades de los centros
o servicios de documentación.
Siempre que se tenga que usar un tesauro en un servicio de información,
lo primero que habrá que hacer es saber si ya existe alguno para el campo
de aplicación en cuestión Para ello se debe consultar la abundante
bibliografía sobre el tema. En el caso en que ya exista un tesauro sobre
nuestro campo de trabajo, habremos de comprobar en qué medida puede ser
utilizado por nosotros o al menos en que medida puede servirnos de guía.
Consideraciones
que se deben tener en cuenta:
1- Consideraciones de tipo interno
- Tema principal
- Temas secundarios
- Ámbito de los temas
- Grado de precisión
- Número de los documentos
- Clases de documentos
- Tipos de datos contenidos en los documentos
- Tipos de documentos: primarios o secundarios
- Fuentes de provenencia de los documentos
- Aumento progresivo de los documentos en el tiempo
- Necesidades de actualización
2-
Consideraciones de tipo externo
- Características del centro: interno o externo
- Clase de centro: privado o público
- Tipo de centro: especializado o general
- Forma del trabajo con el usuario: indirecta o directa
- Sistema de trabajo: manual o mecanizado
- Personal con el que se cuenta: especializado o auxiliar
- Características de los usuarios
- Tipo de consulta
- Volumen de consultas
- Grado de crecimiento de las consultas
- Previsión de crecimiento del propio centro
- Sistema de financiación
Por
último, las condiciones generales que debe cumplir un tesauro para las
necesidades concretas en cada caso son:
- General y multidisciplinar (incluso multilingüe)
- General y monodisciplinar
-
Especializado, debe ser muy concreto
- Exhaustivo, considerando la mayor cantidad posible de términos y todas
las relaciones posibles
-
Específico, con un número reducido de términos y todas
las relaciones posibles
- Genérico, con un número reducido de términos y pocas
relaciones entre ellos.
3.6- PRESENTACIÓN DE UN TESAURO
Una
vez que ya se tienen los términos elegidos y se han establecido las relaciones
entre ellos, el paso siguiente es pensar en la forma en que se han de presentar
para su mejor uso.
A primera vista parece que una ordenación alfabética de los términos
principales con sus términos relacionados colocados debajo, indicando
con la notación correspondiente, la forma de relación, puede ser
suficiente para localizarlos y saber de ellos todo lo necesario. Es verdad que
en la mayoría de los casos basta esta forma de presentación, sin
embargo, la experiencia ha demostrado que, en gran número de ocasiones,
es preciso ordenar los términos, según aquellas familiar que habíamos
construido al principio. Es decir, se deben distribuir en clases que proporcionen
una visión de conjunto del tema.
Por otra parte, una representación gráfica de los términos y sus relaciones ayuda a comprender su ordenación y facilita el uso del tesauro.
Así pues, se han de considerar tres tipos de representaciones de tesauros:
1.
presentación
2. presentación en grupos o clases, es decir, semántica
3. presentación gráfica