AGROVOC


4.1 AGROVOC : propuesta de un Servicio de Ontología para mejorar el acceso a la información agraria


Internet ofrece una plataforma potencial para el acceso mundial a la información, pero hay una serie de cuestiones importantes que deben afrontarse para poder aprovechar plenamente este potencial.
Por la misma naturaleza de la arquitectura de la Web, la información sobre asuntos similares está dispersa entre muchos servidores diferentes de todo el mundo, pero hay pocos instrumentos para integrar la información conexa de distintas fuentes. Como consecuencia de ello, frecuentemente es muy difícil encontrar las cosas en la Web.
Estos problemas pueden resolverse solamente si se adoptan medidas para establecer, normas, vocabularios, orientaciones y reglas adecuados para facilitar la integración de datos de distintas procedencias y proceder a un efectivo intercambio de datos.
En el sector agropecuario existen ya muchos vocabularios controlados bien establecidos y autorizados, como el Tesauro Multilingüe AGROVOC de la FAO, el Tesauro CAB y AgNIC, Tesauro de la National Agricultural Library de los Estados Unidos. Sin embargo, para que estos instrumentos semánticos sean plenamente eficaces en Internet, es necesario reevaluar el enfoque tradicional de los "tesauros" y avanzar hacia una técnica más moderna que se adapte mejor al entorno de Internet, como el desarrollo de "ontologías".
Una forma de conceptualizar el "servicio de ontología" es como un tesauro mejorado, es decir, un tesauro definido como instrumento que fija el vocabulario de una determinada materia. Tanto si se desea describir un recurso determinado de información como si se quiere recuperarlo de Internet, se enfrenta uno con el mismo problema de qué término o términos transmiten la información semántica exacta sobre el recurso. Por ejemplo, sin la ayuda de un vocabulario controlado se puede dudar si utilizar el término "coche", "automóvil" o "vehículo" para realizar una determinada búsqueda en Internet. Sin embargo, con un tesauro, se puede avisar al buscador que debe utilizarse "automóvil" en lugar de "coche", que "vehículo" es un término más amplio que "automóvil" y que, por lo tanto, debe utilizarse en un contexto diferente. La mayor precisión semántica de la terminología tendrá una influencia directa en la medida en que puede encontrarse la información pertinente.
Un servicio de ontología lleva este marco conceptual un paso más adelante estructurando los términos más formalmente y proporcionando relaciones entre conceptos más ricas que las ofrecidas normalmente en los tesauros. Mediante la definición formal de los términos y una descripción más precisa de las relaciones entre ellos, se facilitará al usuario un entorno contextual más rico en el que hacer evaluaciones de la pertinencia y uso.
Respondiendo a este nuevo enfoque de la gestión de los vocabularios, el proyecto AOS (Servicio de Ontología Agraria) funcionará como instrumento que ayude a estructurar y normalizar la terminología agraria en múltiples idiomas para uso de cualquier número de sistemas diferentes en todo el mundo.
Los objetivos principales de AOS son proporcionar un marco para:

· Indizar mejor los recursos, incrementará la eficiencia y la coherencia;
· recuperar mejor los recursos aumentando la funcionalidad para acceder a ellos;
· incrementar la interacción dentro de la comunidad agraria.

Estos objetivos se consiguen ayudando a los socios de la comunidad a construir una guía ontológica. Esta es un sistema semántico que contiene términos, sus definiciones y la especificación de las relaciones entre dichos términos. Puede entenderse como una enciclopedia mejorada que facilita todas las relaciones básicas inherentes en una ella, pero que además define y permite la creación de relaciones más formales, más específicas y más fuertes. Una guía ontológica retoma y estructura todo el conocimiento en un área, y por ello, recupera el significado de todos los conceptos específicos de ese área. Esta información llega posteriormente a los usuarios a través de herramientas (índices, compilaciones) adaptadas por las guías ontológicas.

Una vez construido, el Servicio de Ontología Agraria como referencia para la terminología y las interrelaciones, debemos comunicar el desarrollo de esta referencia con cuantos sistemas de organización del conocimiento (KOSs) en el ámbito agrario sean posibles. Un KOS es cualquier tipo de sistema que trata de clasificar la información dentro de unos límites, como pueda ser un sitio de la red, un dominio, un "network", o cualquier otro tipo de entorno.
Ejemplos de los tipos de KOSs :

· listados de los términos que comúnmente usan relaciones jerárquicas
· vocabularios y listas control de los diversos y preferidos términos basados en los diferentes conceptos
· vocabularios enciclopédicos que contengan relaciones jerárquicas
· listados de los diversos nombres
· glosario de los términos con sus definiciones
· diccionarios-gaceta de los nombres
· listado de los temas más relevantes, amplia categorización de las áreas temáticas.

Para empezar, necesitamos coger un inventario completo de los KOSs potenciales. En nuestro inventario, debemos determinar el grado de solapamiento de la terminología y las interrelaciones entre el KOS y el AGROVOC, la plataforma del AOS. Esto nos dará una idea de :

· el esfuerzo que se requiere para analizar y utilizar los sistemas
· los beneficios que podrán obtenerse por ambos, el KOS y el AOS, por ejemplo compartir términos e interrelaciones
· el procesado de los términos, las definiciones y las interrelaciones entre el AOS y el KOS.

Esto derivará en el desarrollo de las ontologías. Algunos KOSs, al igual que aquellos desarrollados por organizaciones como la CABI (la enciclopedia CAB) y el NAL (la enciclopedia AgNIC), tienen un alto grado de temas que se solapan con AGROVOC, y sin embargo se mantienen como entidades separadas. Estos sistemas añaden una mayor funcionalidad de los componentes del AOS al KOS, creando una nueva y separada ontología. Otros KOSs pueden elegir ser integrados completamente en el AOS y usarlo como punto de partida para la búsqueda de terminología agraria e interrelaciones. El siguiente gráfico nos muestra este desarrollo.

GRÁFICO


Este proyecto constituye el paso siguiente en el desarrollo de AGROVOC que es un tesauro agrarario multilingüe . Un tesauro es un sistema de términos y relaciones que presenta conocimientos en un determinado sector, Agrovoc contiene actualmente 16.607 descriptores (términos indizadores que consisten en una o dos palabras que representan siempre un único concepto, aparecen en letras mayúsculas y van seguidos de sus bloques de palabras, es decir, la estructura jerárquica del término) y numerosos no descriptores (son términos que ayudan al usuario a encontrar los descriptores apropiados. Aparecen en letras minúsculas y van seguidos de una referencia (operador USE) al descriptor, que es el término preferido, y el único que podrá utilizarse para la indización)

Cuadro de los símbolos utilizados en los bloques de palabras descriptores y no descriptores

SIMBOLO Significado Tipo de bloque de palabras Tipo de relación
BT término más amplio descriptor relación jerárquica
NT término más reducido descriptor relación jerárquica
rt término relacionado descriptor Relación asociativa
USE Uso no descriptor relación preferencial
USEAND usar esta combinación no descriptor relación preferencial
uf utilizado para descriptor relación preferencial
uf+ utilizado para en combinación descriptor relación preferencial

Podemos ampliar el uso de estas relaciones para detallar y dotar de mayor consistencia los índices, y para permitir una búsqueda más efectiva para los usuarios mediante relaciones ontológicas, necesitamos formalizar reglas para su desarrollo y procesos de implementación para usarlos en la indización y recopilación de datos. Estas relaciones deben ser comparadas entre los diferentes KOSs, con la obtención final de una colección común de todas las relaciones posibles. Estas relaciones comunes serán almacenadas en AOS para futuras reutilizaciones por otras ontologías. Como resultado de este proceso, del desarrollo y mantenimiento, obtenemos una colección refinada de las relaciones ontológicas más comúnmente usadas.


Relaciones Ontológicas
Ejemplos
Primary activity seasonal cropping
Type of plant cotton
Cultivar "U-name-it" cotton cultivar
Location Southern States (USA)
Production system agropastoral systems
Raw product cotton ballscottonseed oil
Derived product protective clothing
By-product mattressesoilseed cakes
Derived activity handicraftsmilling
Resources cotton gin machines
Environmental impact soil degradationfertilizersinsecticides
Infecting agent cotton boll weevil
Infection early blight (alternaria)
Limiting factor drought
Conflicting activity re-forestation



Un aspecto clave del AOS es que debe ser multilingüe. Para cualquier usuario en cualquier país que necesite acceso a los recursos, tiene que indizar y encontrar información en cualquier idioma que sea requerido. El AOS necesita recopilar y coordinar la terminología, las definiciones, sus relaciones en los 5 idiomas oficiales de la FAO, inglés, francés, español, árabe y chino, por lo menos. Otros idiomas deberán irse añadiendo si necesario por aquellos socios que desarrollen sus propias ontologías.
Existen dos cuestiones respecto al multilenguaje:

· La colección de términos en diferentes idiomas. Esto obvia la necesidad de usar diferentes KOSs cada uno de ellos abarcando las diferentes variantes en función del idioma. El AOS se beneficia de esta colección de términos en diferentes idiomas, y además los puede ofrecer para su reutilización en otras ontologías.
· La descripción de los términos y sus conceptos en los diferentes idiomas. Habitualmente, no existe una comparativa clara de los términos entre los diversos idiomas. Lo mismo pasa para las relaciones ontológicas. Es necesario ejecutar mapas de los conceptos básicos y las concordancias cruzadas (los grupos que recogen conceptos similares de diferentes grupos sociales se funden en un nuevo concepto) para describir términos equivalentes.

Para acceder al AOS y su colección de ontologías es necesario desarrollar una serie de herramientas que permitan el desarrollo, el almacenaje y la recuperación de datos. Estas herramientas pueden definirse como:

· hallazgo y descripción de los términos superpuestos y descripción de los términos comunes y sus definiciones
· creación de ontologías que usen las interrelaciones comunes del AOS y creación de ontologías interrelacionales específicas.
· indizar las ontologías para acceder a los recursos bien sea de manera manual o automática
· codificar el almacenaje de los términos, las definiciones y las relaciones bajo un mismo patrón, en un formato interoperativo
· asegurar la calidad y el mantenimiento de las ontologías por los directivos
· búsqueda de recursos y aunarlos mediante nuevas ontologías.

No tendría sentido desarrollar las antes mencionadas herramientas sin desarrollar interfaces que reúnan las necesidades de los usuarios. Para ello, debemos saber :

· ¿usarán las herramientas únicamente los usuarios, o existe un público más amplio?
· ¿desarrollaremos interfaces para todo tipo de herramienta , o sólo para parte de ellas?
· ¿los usuarios son expertos en el tema y en el uso de las diferentes herramientas?
· ¿qué nivel de detalle quieren los usuarios en la indización o en la recopilación de datos?
· ¿qué tipo de interrelaciones les interesará en mayor medida?

Regreso a pagina inicial