ÍNDICE


0.- PRESENTACIÓN

1.- INTRODUCCIÓN

2.- TESAUROS Y ONTOLOGÍAS

2.1.- DEFINICIONES

2.2.- IMPORTANCIA DE LOS TESAUROS Y LAS ONTOLOGÍAS

2.3.- SIMILITUDES ENTRE ONTOLOGÍAS Y TESAUROS

2.4.- DIFERENCIAS

3.- DE LOS TESAUROS A LAS ONTOLOGÍAS

3.1.- ¿POR QUÉ MIGRAR LOS TESAUROS A ONTOLOGÍAS?

3.2.- TRES PROPUESTAS DE MIGRACIÓN DE TESAUROS EXISTENTES A ONTOLOGÍAS

4.- PROYECTO: SOA, UN SERVICIO DE ONTOLOGÍA AGRARIA

4.1.- FAO: ANTECEDENTES DE SOA

4.2.- EL TESAURO AGROVOC Y SUS LIMITACIONES

4.3.- ADAPTACIÓN DEL TESAURO AGROVOC A ONTOLOGÍA

4.4- LOS PROTOTIPOS DEL SOA

4.5- CONCLUSIONES DEL PROYECTO

5.- CONCLUSIONES

6.- BIBLIOGRAFÍA

 


 

 

O. PRESENTACIÓN

En esta página se estudian las ontologías como un instrumento válido de representación del conocimiento. Siendo el objetivo fundamental de la misma ponerlas en relación con los tesauros, con vistas a determinar sus puntos en común, sus diferencias, las posibilidades de conversión y comentar algunos ejemplos de aplicaciones prácticas.

   

1. INTRODUCCIÓN

Internet ofrece una plataforma potencial para el acceso mundial a la información, pero hay una serie de cuestiones importantes que deben afrontarse para poder aprovechar plenamente ese potencial.

La propia arquitectura de la Web implica que la información sobre asuntos similares este dispersa entre muchos servidores diferentes de todo el mundo. Sin embargo, hay pocos instrumentos para integrar la información conexa de distintas fuentes. Como consecuencia de ello, frecuentemente es muy difícil encontrar las cosas en la Web.

Estos problemas solamente pueden resolverse si se adoptan medidas para establecer normas, vocabularios, orientaciones y reglas, adecuados para facilitar la integración de datos de distintas procedencias. Esta integración permitiría la descripción integrada de los diferentes recursos de información y su posterior recuperación, lo que también debiera mejorar la recuperación en la web, en términos de efectividad, rapidez y facilidad de acceso a la información.

Los profesionales, cada vez más, entienden que es urgente la construcción y aplicación de sistemas de organización y representación del conocimiento. Además parece que las tecnologías de la información hacen explícitas las ventajas de la incorporación de este tipo de instrumentos , sobre todo cuando se sufren los problemas de organizar la información en un contexto digital.

Todo ello, ha generado que en los últimos años, se haya producido un aumento de instrumentos como los tesauros, las clasificaciones y las ontologías.



Volver arriba

2. TESAUROS Y ONTOLOGÍAS

2.1. Definiciones

A) Tesauros

"Tesauro es un lenguaje documental dinámico que contiene términos relacionados semánticamente, de acuerdo con un dominio de conocimiento. Es un sistema de clasificación para organizar conocimientos" [CAMPOS, 2001].

Según la definición de la UNESCO, "un tesauro es un instrumento de control terminológico utilizado para traducir a un lenguaje más estricto el idioma natural empleado en los documentos y por los indizadores".

Por su estructura, es un vocabulario controlado y dinámico de términos relacionados semántica y genéricamente, los cuales cubren un dominio específico del conocimiento. La estructura de la terminología de un tesauro está basada en las interrelaciones entre los conceptos. Estas interrelaciones pueden ser: jerárquicas, de afinidad y preferenciales. Las relaciones jerárquicas indican términos más amplios o más específicos de cada concepto. Las relaciones de afinidad muestran términos relacionados conceptualmente, pero que no están ni jerárquica ni preferencialmente relacionados. Las relaciones preferenciales se utilizan para indicar cuál es el término preferido o descriptor entre un grupo de sinónimos; y la calificación de homónimos para diferenciar su significado, eligiendo un significado preferido para cada término.

B) Ontologias

La definición más consolidada es la que la describe como "una especificación explícita y formal sobre una conceptualización compartida".

Las ontologías proporcionan una vía para representar el conocimiento (en especial en la web) y son un enfoque importante para capturar semántica.

El concepto de ontología tiene su origen en la Filosofía. Posteriormente fue tomado por la Inteligencia Artificial, para definir el vocabulario de un dominio acotado mediante un conjunto de términos básicos y relaciones entre dichos términos. Con este alcance, una ontología estaría englobada dentro de la definición de lo que es un lenguaje controlado.

En el entorno de Inteligencia Artificial, las ontologías son teorías que especifican un vocabulario relativo a un cierto dominio. Este vocabulario define entidades, clases, propiedades, predicados y funciones y, las relaciones entre estos componentes.

Las ontologías constan de términos, sus definiciones y los axiomas que los relacionan con otros términos que están organizados en una taxonomía. Estos axiomas permiten realizar búsquedas con inferencias. Las ontologías definen conceptos y relaciones de algún dominio, de forma compartida y consensuada; y esta conceptualización debe ser representada de una manera formal, legible y utilizable por las computadoras.

Volver arriba

2.2. Importancia de los tesauros y las ontologías

La ontologías y los tesauros han adquirido una importancia capital debido a que “existe la necesidad de describir la semántica de un dominio de forma que el humano lo entienda y que pueda ser procesado por el ordenador” [MEERSMAN et al 2002].

 

2.3. Similitudes entre ontologías y tesauros

Algunas de las similitudes que podemos destacar entre las ontologías y los tesauros son las siguientes:

  • Ambos son sistemas basados en conceptos que representan conocimiento altamente complejo.

  • Ambos pueden englobarse dentro de los lenguajes controlados. Puesto que ambos definen el vocabulario de un dominio específico mediante un conjunto de términos básicos y las relaciones entre dichos términos.

  • Ambos están relacionados con la terminología empleada para representar los conceptos de un dominio particular.

  • Ambos utilizan jerarquías para agrupar términos en categorías y subcategorías.

  • Ambos pueden utilizarse para catalogar y organizar recursos de información.

  • Si definimos la ontología como un instrumento que define los términos básicos y sus relaciones a partir del vocabulario de un área, así como, las reglas de combinación de estos términos y relaciones, podemos observar que el paralelismo con los tesauros es evidente. Especialmente en lo que se refiere a la delimitación de los términos que deben formar parte de una construcción de representación del conocimiento, así como en lo que se refiere a las relaciones que se establecen.

Volver arriba

2.4. Diferencias

Son varios los autores que han profundizado en las diferencias existentes entre las ontologías y los tesauros. Por ejemplo, Qin y Paling entienden que las primeras son superiores a los segundos por varias razones:

  • Presentan un nivel más alto de concepción y descripción del vocabulario. Además, las ontologías se caracterizan por una descripción del vocabulario.

  • Se caracterizan por un desarrollo semántico más profundo para las relaciones del tipo clase/subclase y para las relaciones cruzadas, lo que supone la ampliación de éstas y un mayor cuidado en su descripción, por supuesto explícita.

  • Destacan el uso de la lógica de descripción empleada en la descripción de situaciones.

  • Son reusables.

  • Posibilidad de trabajo en sistemas heterogéneos, al describir formalmente objetos en el mundo, sus propiedades, y las relaciones entre estos objetos.

En esta misma línea de pensamiento, Ding y Foo creen que las diferencias fundamentales entre una ontología y un vocabulario de representación convencional se sitúan en el nivel de abstracción, en las relaciones entre conceptos, en la capacidad para que sea comprensible para las máquinas y, lo más importante, en la expresividad que pueden proporcionar. Así:

  • Una ontología puede estar elaborada de acuerdo con diferentes requerimientos y, al mismo tiempo, puede funcionar como un esquema de base de datos, como una auténtica base de conocimiento, para definir varias tareas o aplicaciones.

  • Una ontología potencia la comunicación entre humanos y ordenadores mientras que un vocabulario convencional, en el mundo de lo que ellos llaman Library Science, sólo permite la comunicación entre seres humanos.

  • Una ontología promueve la normalización y reutilización de la representación de la información mediante la identificación del conocimiento común y compartido.

  • Las ontologías añaden valor a los tesauros tradicionales a través de una semántica más profunda, así como desde un prisma conceptual, relacional e informático. De hecho una mayor profundidad semántica puede implicar niveles más profundos de jerarquía, unas enriquecidas relaciones entre clases y conceptos, así como la capacidad de formular reglas de inferencia, etc.



A continuación ofrecemos una síntesis de algunas de las diferencias que hemos creído conveniente resaltar.

  • Diferencias respecto a los usuarios:
  • - Los tesauros están destinados para ser usados por humanos.

    - Las ontologías pueden ser usadas por humanos, para compartir conocimiento, y por agentes de software, para procesar conocimiento.

  • Diferencias respecto a la semántica:
  • - En los tesauros los descriptores se enlazan mediante tres tipos principales de relaciones muy simples, formando un árbol taxonómico del sistema de información. Estas relaciones se utilizan para la recuperación y, también, para tener una idea general del contenido de la base o navegar a través de los mismos descriptores.

    - La construcción de ontologías lleva implícito que cada término y cada relación entre términos se defina formalmente. Los conceptos se describen explícitamente para entender su significado mediante acuerdos ontológicos. Con ello un usuario que desee reutilizar una ontología desarrollada por otros, puede conseguir la información de todos los conceptos que soporta, su taxonomía y los axiomas.

    - Las ontologías poseen una mayor variedad de relaciones entre conceptos. Estas relaciones se crean a propósito del modelo conceptual existente en el dominio que se está formalizando.

    - La descripción de los conceptos y sus relaciones pueden ser empleadas de forma más general que los actuales tesauros de manera que se pueden establecer un mayor número de relaciones distintas, y tener definidas cada una de ellas.

  • Representación del conocimiento:
  • - Tesauros: limitada y no formalizada.

    - Ontologías: explícita y formalizada.

Volver arriba

3. DE LOS TESAUROS A LAS ONTOLOGÍAS


3.1.- ¿Por qué migrar los tesauros a ontologías?

La migración de tesauros a ontologías, requiere del incremento de la precisión de la semántica en las relaciones existentes en los tesauros.

Migrar los tesauros a ontologías conlleva un determinado coste, pero a pesar de ello genera unos beneficios por los que se está consolidando una tendencia evidente en el intento de elaborar determinadas ontologías a partir de tesauros.

Las operaciones que pueden realizarse en un tesauro son comprobar la idoneidad de un término o ver las relaciones existentes con otros términos.

Algunas ontologías ofrecen la habilidad de comprobar la consistencia de la misma y deducir la existencia de los objetos de forma automática.

Los beneficios añadidos por la consistencia y el razonamiento completo de las ontologías, justifican el coste de la precisión en la semántica de sus relaciones.

3.2.- Tres propuestas de migración de tesauros existentes a ontologías

Wilson (2002) recoge tres propuestas de cambio para migrar información desde los tesauros a las ontologías:

  • Conversión de las relaciones o enlaces de los tesauros en relaciones DAML/OIL.
  • Conversión de los contenidos del tesauro en relaciones de RDF schema.
  • Conversión de las relaciones en enlaces del tesauro en relaciones RDF schema.

A continuación se ofrece una descripción de dichas propuestas:

1. Conversión de las relaciones o enlaces de los tesauros en relaciones DAML/OIL.

Propuesta realizada por Hall, quien se planteó construir tesauros con sus relaciones representadas como relaciones DAML+Oil, permitiendo la expresión de restricciones. Presentó un esquema alternativo a la compilación de tesauros monolingües en DAML, con tipos de enlaces adicionales para los acrónimos. La propuesta está limitada a tesauros monolingües.

2. Conversión de los contenidos del tesauro en relaciones de RDF schema.

Propuesta realizada por Wielinga [et al]. En este caso se construye una ontología sobre la base de un tesauro, a partir de las siguientes modificaciones:

a) representación de cada concepto en la base de conocimiento por un único identificador;

b) conversión de la jerarquía de términos existente en jerarquía de conceptos;

c) aumento del número de conceptos con slots adicionales, y

d) suma del conocimiento acerca de la relación entre posibles valores de los campos y nodos de la base de conocimiento.

Esta propuesta fue ejemplificada utilizando el AAT, pero su efectividad y su eficiencia no han sido evaluadas.

3. Conversión de las relaciones en enlaces del tesauro en relaciones RDF schema.

Propuesta realizada por Cross [et al] de la cual es interesante destacar la presentación de:

  • varias clases: ThesaurusObject, Concept, TopConcept, Term y ScopeNote)
  • determinadas propiedades: ClassificationCode, hasScopeNote, isIndicatedBy, PreferredTerm, UsedFor, ConceptRelation (Broader, Narrower, Top, Related concept relationship)
  • propiedades de términos (inLanguageOf ) y
  • propiedades de las notas de aplicación (inLanguageOf, ScopeNoteType).
Volver arriba


4. PROYECTO: SOA, UN SERVICIO DE ONTOLOGÍA AGRARIA

4.1. FAO: Antecedentes de SOA

El cometido de la FAO (Food and Agriculture Organization), perteneciente a las Naciones Unidas, es ayudar a combatir y erradicar el hambre del mundo. La divulgación de la información es una herramienta importante y necesaria para llevar a cabo esta causa. Para ello será necesario un medio que proporcione constancia, un acceso útil a la información y que asista a aquellas personas u organismos que construyan sistemas de divulgación de la información. El amplio reconocimiento de la FAO como un centro de excelencia neutral e internacional,provocó que la primera reunión de la COAIM (Consultation on Agricultural Information Management) recomendase que esta organización asumiese el mando en la creación de los estándares internacionales de administración de la información en el área de agricultura.

Además, recomendaron que la FAO coordinase y facilitase la promoción y adopción de dichos estándares en las naciones miembros y en colaboración con otros socios. Siguiendo estas recomendaciones, la FAO se comprometió a mejorar las metodologías existentes de administración de la información, desarrollar estrategias y líneas de guía para la administración de la información agraria y seguir de cerca nuevas líneas de desarrollo en esta área.

Para ello, se desarrolló un Servicio de Ontología Agraria (SOA) que funcionase como una herramienta de referencia y que estructurase y estandarizase la terminología agraria en múltiples lenguajes para ser usado por un número indeterminado de sistemas. Los propósitos del SOA son:

- Incrementar la eficacia y coherencia de la descripción y la relación de los recursos multilingües de agricultura.

- Disminuir la naturaleza aleatoria de la recuperación de información y aumentar la funcionalidad del acceso a los recursos de información.

- Permitir compartir descripciones, definiciones y relaciones comunes entre la comunidad agraria.

Estos objetivos se llevan a cabo ayudando a los socios en la construcción de ontologías.

El SOA se basa en asociaciones internacionales esparcidas por el mundo entero. La FAO ha creado los estándares para la construcción del SOA en colaboración con estos socios. Estos estándares abarcan los lenguajes de definición de datos de la ontología y un mecanismo para el intercambio de términos y relaciones entre los diferentes servidores distribuidos geográficamente.

Volver arriba


4.2. El tesauro AGROVOC y sus limitaciones

En el sector agropecuario existen muchos vocabularios controlados, acreditados y autorizados, como el Tesauro multilingüe de terminología agrícola (AGROVOC) de la FAO, el Tesauro CAB (en Inglaterra) y el AgNIC (tesauro de la National Agricultural Library de los Estados Unidos). Estos tesauros están jugando un rol sustancial ayudando a los administradores y a los usuarios de información en tareas de indización de documentos y recuperación de información.

Con los avances de la web, las tareas de administración de información requieren herramientas más versátiles y flexibles que faciliten las tareas de organización y búsqueda de información lógica y sistemática en la web, como la creación de ontologías.

Desde la perspectiva de la recuperación de información, es importante que las herramientas sean desarrolladas para permitir a los motores de búsqueda trabajar con conceptos en lugar de con palabras clave.

Las herramientas y sistemas de vocabularios actuales presentan algunas limitaciones. A continuación se reflejan las principales limitaciones de los tesauros, y más concretamente las del tesauro AGROVOC.

    - Área de alcance general: los tesauros, como el AGROVOC en el ámbito de la agricultura, tienen un dominio de ámbito general y carecen de conceptos específicos. El énfasis se encuentra en los conceptos generales de agricultura y no se especializa en disciplinas como las ciencias forestales, pesca, nutrición,…

    - Carencias de conceptos en áreas opuestas de alto nivel: existen vocabularios muy concentrados en conceptos temáticos y términos específicos que no incluyen conceptos opuestos entre áreas, como “desarrollo-sostenible”, “globalización”, etc. Hay una necesidad de incluir conceptos no científicos y conceptos cruzados entre áreas que son de interés para la agricultura.

    - Cobertura semántica limitada: los términos "general", "específico", "usado por" y "relacionado" no están definidos semánticamente de forma precisa. Las relaciones contenidas de esta forma no captan las relaciones semánticas requeridas en la búsqueda de información en la web.

    - Cobertura limitada del lenguaje: a menudo las herramientas son parciales o sólo cubren muy pocos idiomas (con excepción de AGROVOC).

    - Procesamiento automático limitado: muchos sistemas de vocabularios son desarrollados en un sistema de base de datos propio, dejando una posibilidad muy limitada para el procesamiento semántico automático. Estos sistemas tienen que convertirse en formatos automáticos procesables basados en tecnología XML.

    - AGROVOC carece de representaciones formales y precisas del significado que puedan ser utilizadas automáticamente, es decir, sus significados no están representados utilizando tecnologías de meta datos.

    - AGROVOC está almacenado y mantenido en un sistema de base de datos relacional que impide que se reutilice y se comparta.

Tras esta primera aproximación, vamos a centrarnos en los problemas que presenta la representación semántica en AGROVOC:

1) Las relaciones Genérico-Específicas (Broader Term – BT y Narrower Term - NT) en AGROVOC son las típicas relaciones jerárquicas de un tesauro y su semántica no está claramente definida. En ellas es común incluir como mínimo las siguientes relaciones:

  • Pertenece a (ej. Leche/ Leche de vaca; Agencias de desarrollo/CIDI)
  • Ingrediente de (Ej. Leche/ Grasa de la leche)

  •   La grasa de la leche es un ingrediente de la leche es un ingrediente de milk
  • Propiedad de (Ej. Maíz/ Maíz dulce)

  •   El dulzor es una propiedad del maíz dulce.

Por ejemplo:

MAÍZ
NT Maíz dentado
NT Maíz duro
NT Palomitas de maíz
NT Maíz amilaceo
NT Maíz dulce
NT Maíz ceroso
LECHE
NT Grasa de la leche
NT Colostro
NT Leche de Vaca
AGENCIAS DE DESARROLLO
NT Bancos de desarrollo
NT Agencias voluntarias
NT IDRC

2) Las relaciones usado por (UF) y USE representan las relaciones de equivalencia. Su semántica es imprecisa, como en los siguientes casos:

- Sinónimos o significados idénticos

- Sinónimos cercanos o de significados similares

En algunos tesauros la equivalencia puede incluir antónimos o significados opuestos. Por ejemplo:

AGENCIAS DE DESARROLLO

UF Instituciones de ayuda (similares, pero no necesariamente conceptos equivalentes)

NUEVOS ALIMENTOS

UF Alimentos Novedosos (conceptos completamente diferentes)


3) Los términos relacionados (Related Term, RT) representan las relaciones asociativas, las cuales involucran las relaciones semánticas más ambiguas:


- Causalidad
- Agente o instrumento
- Jerarquía, donde no se han permitido las polijerarquías, las relaciones jerárquicas ausentes están reemplazadas por relaciones asociativas.
- Secuencia de tiempo o espacio
- Circunscripción o distrito electoral
- Rasgos característico
- Objeto de una acción, proceso o disciplina
- Localización
- Similitud (en los casos donde dos sinónimos cercanos han sido incluidos como descriptores)
- Antónimos

Por ejemplo:

DEGRADACIÓN IRDC
RT Degradación química (causalidad) RT Canada (localizacion)
RT Decoloración
RT Hidrólisis
RT Merma


Volver arriba

4.3. Adaptación del tesauro AGROVOC a ontología

El SOA aspira a transformar completamente el tesauro AGROVOC en una ontología. Para ello, irá desarrollando varias ontologías específicas que se circunscribirán a un área más concreta dentro del dominio de la agricultura. Estas ontologías específicas serán desarrolladas por las diversas asociaciones internacionales con las qu trabaja el SOA.

Esta transformación en un modelo de ontología podría resolver los problemas vistos en el punto anterior. Algunos de ellos son:

  1. Revisar las relaciones existentes para presentar unas relaciones semánticas claras: por ejemplo,

  2. – La relación genérico-específica puede ser resuelta mediante una relación “Pertenece A”.

    – Los términos relacionados pueden ser perfeccionados con más relaciones específicas, tales como “producidas”, “usadas por”, “hechas para”.

  3. Los términos compuestos específicos, pueden ser transformados en conceptos básicos que no se representen ambiguamente: por ejemplo,

  4. – Productos perecederos puede ser representado como “producto” con el atributo “perecedero”

    – Espada de esgrima puede ser representado como “espada” usada para “esgrima”

Del mismo modo, esta transformación de AGROVOC en una ontología, consigue los siguientes resultados:

  • Una semántica más formal debida a la estandarización de los significados.
  • Consistencia interna debida a restricciones de integridad.
  • Capacidad de inferencia.
  • Fácil de reutilizar y compartir:

– Las ontologías son representadas en lenguajes estándar tales como RDF, DAML/OIL, OWL, etc.

– Posibilidad de usar un identificador conceptual único para estandarizar el significado de los conceptos globales.

Y... ¿cómo se está llevando a cabo la transformación del tesauro AGROVOC en ontología?

En primer lugar, se realiza un inventario con los sistemas de organización del conocimiento existentes en el área y que potencialmente serán útiles: listados, vocabularios, glosarios, diccionarios, tesauros, otras ontologías, ... En este inventario, se determina el grado de solapamiento de la terminología y las interrelaciones existentes entre dichos sistemas y el tesauro AGROVOC.

Algunos sistemas de organización del conocimiento, como los desarrollados por organizaciones como la CABI (la enciclopedia CAB) y el NAL (la enciclopedia AgNIC), tienen un alto grado de temas que se solapan con AGROVOC, y sin embargo se mantienen como entidades separadas. Estos sistemas añaden una mayor funcionalidad de los componentes, creando una nueva y separada ontología. Otros sistemas pueden elegir ser integrados completamente en el SOA y usarse como punto de partida para la búsqueda de terminología agraria y sus interrelaciones. El siguiente gráfico nos muestra este desarrollo.


Fuente: http://www.fao.org/agris/AOS/Documents/AOS_Draftproposal.htm

El proyecto SOA constituye el paso siguiente en el desarrollo de AGROVOC. En el siguiente cuadro se representan los símbolos utilizados por las relaciones en AGROVOC.


SIMBOLO SIGNIFICADO TIPO DE PALABRA TIPO DE RELACION
NT término más amplio descriptor relación jerárquica
NT término más reducido descriptor relación jerárquica
NT término relacionado descriptor relación asociativa
USE Uso no descriptor relación preferencial
USEAND usar esta combinación no descriptor relación preferencial
uf utilizado por descriptor relación preferencial
uf+ utilizado por en combinación descriptor relación preferencial

Fuente:http://www.fao.org/agris/Magazine/News_Items/Agrovoc_Es.htm


El uso de estas relaciones se puede ampliar para detallar y dotar de mayor consistencia los índices y para permitir una búsqueda más efectiva mediante relaciones ontológicas.

Estas relaciones deben ser comparadas entre los diferentes sistemas de representación del conocimiento, con la obtención final de una colección común de todas las relaciones posibles. Estas relaciones serán almacenadas en el SOA para futuras reutilizaciones por otras ontologías. Como resultado de este proceso obtenemos una colección refinada de las relaciones ontológicas.


Relaciones Ontológicas Ejemplos
Actividad primaria Cultivo de temporada
Tipo de planta Algodón
Cultivo Cultivos de algodón
Localización Estados del sur(USA)
Sistema de producción Sistemas agropascícolas
Materia prima Aceite de algodón
Producto derivado Indumentaria de protección
Subproducto Pasteles hechos con aceite vegetal
Actividad derivada Artesanía
Recursos Máquinas de desmoteado de algodón
Impacto medioambiental Degradación del suelo
Agente infectante Gorgojos de algodón
Infección Tizón temprano(alternaria)
Factor límite Sequía
Actividad conflictiva Reforestación

Fuente:http://www.fao.org/agris/AOS/Documents/AOS_Draftproposal.htm


Un aspecto clave del SOA es que debe ser multilingüe. El SOA necesita recopilar y coordinar la terminología, las definiciones y sus relaciones en los 5 idiomas oficiales de la FAO (inglés, francés, español, árabe y chino). Otros idiomas deberán irse añadiendo por aquellos socios que desarrollen sus propias ontologías. El SOA se beneficia de esta colección de términos en diferentes idiomas, y además los puede ofrecer para su reutilización en otras ontologías.

Para acceder al SOA y su colección de ontologías es necesario desarrollar una serie de herramientas que permitan el desarrollo, el almacenaje y la recuperación de datos.

Volver arriba

4.4. Los prototipos del SOA

El propósito de los prototipos del SOA es demostrar la utilidad de las ontologías en la mejora de la administración de los recursos de información agrícola. A continuación presentamos una descripción detallada de los mismos.

A. The Fishery Ontology (Ontología de Pesca)

La ontología de Pesca se centra en integrar los recursos de terminología acuática y de pesca existentes en esta área. Los sistemas integrados son: las tablas de referencia que sirven de base al portal FIGIS, el tesauro ASFA on-line, la parte de pesca del tesauro AGROVOC y el directorio comunitario OneFish. El Servicio Ontológico de Pesca está destinado a ser la figura clave del tesauro Enhanced Online Multilingual Ontology Thesaurus, el cual se encarga del problema de acceso y/o integrar la información de pesca que ya está en parte accesible en los portales especializados y otros servicios Web.

Socios implicados: La Ontología de Pesca se desarrolla en colaboración con el Departamento de Pesca de la FAO (FIGIS), el Secretariado de ASFA, el Servicio OneFish de SIFAR y el grupo Ontology and Conceptual Modelling de IP-CNR.

El objetivo básico del prototipo es trazar un mapa que armonice la terminología de pesca de diferentes recursos para hacer posible la integración de la información de diferentes portales web y sistemas de información sobre pesca.

Los resultados esperados son:

    • Integración de la información: por ejemplo, consultando los tesauros heterogéneos de manera unificada, realizando múltiples búsquedas de documentos sobre distintas bases de datos.
    • Navegación conceptual dentro de terminologías y recursos de terminología controlada (documentos, sitios web, etc.): por ejemplo, destacando los diferentes puntos de vista y contextos de uso.
    • Construcción automática de perfiles de usuarios, con la posibilidad de entrega automática de documentos nuevos o actualizados, o direcciones de sitios web.

Podemos encontrar un borrador de este proyecto en http://www.fao.org/agris/aos/Documents/FisheryConceptPaper.doc, donde se puede consultar de forma más detallada información sobre dicho proyecto: aspectos tales como la metodología aplicada, los recursos utilizados, las asociadas al desarrollo de la ontología, la construcción de los axiomas del dominio, ....

B. The Crop-Pest Ontology (Ontología de los Parásitos de los Cultivos)

Con este prototipo se esperan mejorar las búsquedas en los sistemas de información y bases de datos relacionadas con cítricos. La ontología cubrirá publicaciones e imágenes del área de los cítricos y sus parásitos. La ontología probará las aplicaciones existentes para ver lo bien que responden los usuarios con las búsquedas asistidas por la ontología. EDIS (Extension Digital Information Source Web-site) y DDIS (Distance Diagnostics and Identification System database) serán utilizadas para probar la ontología.

Socios involucrados: El prototipo de Ontología de Parásitos de los Cultivos se desarrolla en colaboración con el Instituto de Ciencias Agrícolas y de los Alimentos de la Universidad de Florida.

Los objetivos específicos del prototipo de Ontología de Parásitos de los Cultivos incluye lo siguiente:

    • Objetivo 1: Desarrollar una ontología para los cítricos que abarque las publicaciones sobre este tema en EDIS, y las imágenes de parásitos de los cítricos, además de otras relacionadas en DDIS.
    • Objetivo 2: Seguir probando metodologías para la construcción de la ontología.
    • Objetivo 3: Implementar la ontología utilizando las herramientas propias de desarrollo y los lenguajes de representación del conocimiento estándares.
    • Objetivo 4: Desarrollar un sistema experimental de extracción de información para analizar los subtítulos de las imágenes asociadas con las imágenes de DDIS.
    • Objetivo 5: Desarrollar una interfaz de búsqueda para los usuarios en EDDIS/DDIS que utilice esta ontología.
    • Objetivo 6: Explorar intercambios de información y fusionar las ontologías con otros proyectos del SOA (por ejemplo: el proyecto de pesca).
    • Objetivo 7: Evaluar y examinar esta interfaz a través del sitio web de EDIS y los usuarios de DDIS.

Los resultados esperados del prototipo incluyen:

    • Una ontología en el area de insectos y parásitos de los cultivos, la cual está basada en cítricos pero puede generalizarse a otros parásitos.
    • Una interfaz de usuarios para realizar búsquedas asistidas por la ontología.
    • Una evaluación de la metodología y los lenguajes de representación del conocimiento para la construcción de este prototipo del SOA.
    • Un sistema de procesamiento del lenguaje natural para la extracción de información
    • Una demostración del intercambio de información entre diferentes proyectos del SOA.
    • Una evaluación de la efectividad de las búsquedas asistidas en la ontología en un sistema de información agrícola electrónico.

C. The Anti-Microbial Ontology (Ontología Anti-Microbios)

La ontología Anti-Microbios será utilizada principalmente en el área microbiológica. El proyecto demuestra la utilidad y la unificación de la ontología implementando una ontología que combina dos áreas: por ejemplo, componentes anti-microbiales naturales del proyecto A/OL y las conductas de crecimiento de los micro-organismos como el modelo Combase. (Combase es un sistema para modelar y simular el crecimiento de los microbios).

Socios involucrados: El prototipo se desarrolla en colaboración con el Instituto de Búsquedas Agrotecnológicas (ATO), Wageningen, Holanda.

El objetivo de este proyecto es ofrecer acceso a búsquedas para asegurar el conocimiento sobre componentes naturales anti-microbiales, incluyendo referencias a documentos.

El motivo de este proyecto es demostrar la utilidad de las ontologías en las búsquedas de información, mostrar el proceso del cruce de áreas poniendo las ontologías en mapas, y demostrar la ventaja de integrar ontologías a través de las áreas adyacentes para las búsquedas de información.

Los resultados esperados son:

    • Una ontología común en el ámbito microbiológico, consistente en conceptos de los proyectos A/OL y Combase.
    • Demostración de la capacidad de búsqueda mejorada, utilizando al menos tres perfiles de búsqueda representativos: a) una búsqueda sin utilizar una ontología que la guíe, b) una búsqueda basada en la ontología A/OL, c) una búsqueda basada en la ontología del SOA, donde ha sido mejorada la ontología A/OL-Combase.


D. The Food Safety Ontology (Ontología de la Seguridad de los Alimentos)

La ontología será utilizada para comentar documentos con información semántica y para estructurar portales web sobre la seguridad de los alimentos. El núcleo de esta ontología se ha creado extrayendo términos de documentos relacionados con este tema. También algunos expertos en la materia se involucraron en el proyecto proponiendo conceptos y relaciones que deberían ser incluidas en la ontología.

Socios involucrados: El Joint Institute for Food Safety and Nutrition (JIFSAN), el Food and Drug Administration (FDA) y la Universidad de Maryland.

Su objetivo básico es proporcionar vocabularios de dominio multilingüe para facilitar la búsqueda y la recuperación de información en portales web relacionados con este tema.

Los resultados esperados son, principalmente, la implementación de una interfaz de usuario que permita echarle un vistazo a la ontología.

Volver arriba

4.5. Conclusiones del proyecto

  • AGROVOC no tiene el nivel semántico específico requerido.
  • La transformación de AGROVOC en una ontología permitirá incrementar la precisión de la semántica, particularmente en los propósitos de recuperación de información.
  • La experiencia de colaboración aborda el mantenimiento del tesauro AGROVOC basado en la actividad de los centros asociados, lo que le llevará a un nuevo nivel.
  • La meta del SOA es mantener y promover el desarrollo y la aplicación de los estándares semánticos (vocabularios, glosarios, definiciones, tesauros, meta datos, esquemas y ontologías) en todas las áreas de materia agrícola, que contribuyan al conocimiento para conseguir un desarrollo sostenible.
  • El SOA actuará como un servicio de compensación entre el suministro de datos (organizaciones internacionales, institutos de investigación, universidades, y el sector privado) y el suministro de servicios (organizaciones internacionales, gubernamentales, y servicios de información).


5. CONCLUSIONES

Tras la elaboración de este trabajo podemos extraer algunas de las siguientes conclusiones:

- Ante unas relaciones jerárquicas sobrecargadas semánticamente en los tesauros, es conveniente valorar el potencial de las representaciones ontológicas.

- Progresiva sustitución de los modelos convencionales del proceso de recuperación de la información por modelos cognitivos, lo que implica que las ontologías están adquiriendo una importancia capital para estructurar las bases del conocimiento.

- Mayor riqueza y dificultad estructural encarnada en elementos como los slots y las facetas, debido a que trabajan como auténticas bases de conocimiento y de datos.

De todas formas, aunque los tesauros y las ontologías son instrumentos que tienen vida separada, parece que en la actualidad se está produciendo un evidente proceso de retroalimentación. A esto hay que sumar, una diferencia clara, la que radica en la incorporación por parte de la ontología de los lenguajes lógicos formales, de lo que se deduce su disposición para la realización de inferencias.

Sin embargo, a pesar de la progresiva implantación de las ontologías, algunos autores consideran que estos nuevos instrumentos están en un momento inicial, que requieren de más reflexión y normalización, y demuestran una excesiva inclinación por lo taxonómico.

En el trabajo se han presentado tres propuestas, que reflejan el estado en el que se encuentra actualmente la migración de tesauros a ontologías. La principal diferencia entre las propuestas es que representan la información de los tesauros utilizando tres niveles diferentes de representación del lenguaje.

Sin un considerable esfuerzo humano no sería posible realizar los cambios de un tesauro a una ontología, es decir, cambiar una representación semánticamente ambigua y pobre a otra semánticamente expresiva y no ambigua.

En el trabajo también ha sido abordado el SOA, con la intención de ofrecer una visión de este tipo de servicios. Por lo que podemos concluir que los Servicios de Ontologías ofrecen un marco contextualmente rico y moderno para elaborar modelos, prestar servicios y gestionar la terminología en cualquier materia. Su integración con instrumentos de búsqueda basados en Internet, puede facilitar mucho la recuperación de recursos, no sólo proporcionando acceso a los documentos específicos que una determinada persona está buscando, sino también ofreciendo sugerencias relativas a otros recursos conexos que son potencialmente pertinentes para el tema de interés. Esta funcionalidad adicional no sólo aumenta espectacularmente el alcance de los motores de búsqueda basados en Internet, sino también revoluciona la forma en que los usuarios interactúan con la Web.

Volver arriba


6. BIBLIOGRAFÍA

Agricultural Ontology Service Project (AOS). Disponible en: http://www.fao.org/agris/AOS/ [Consultado: 17/05/04]

Cross, P.; Brickley, D.; Koch, T. Conceptual relationships for enconding thesauri, classification systems and organised metadata collections and a proposal for encoding a core set of thesaurus relationships using an RDF Schema, 2000. Disponible en: http://www.desire.org/results/discovery/rdfthesschema.html [Consultado: 18/05/04]

Ding, Y.; Foo, S. Ontology research and development. Part 1- a review of ontology generation. Journal of Information Science, 2002, vol. 28, nº 2, p. 123-136.

FAO. The Agricultural Ontology Service (AOS) Concept Note Draft 5.5: A Tool for Facilitating Access to Knowledge . Disponible en: http://www.fao.org/agris/AOS/Documents/AOS_Draftproposal.htm [Consultado: 18/04/04]

FAO. Anti-microbial Ontology. Disponible en: http://www.fao.org/agris/aos/News_Events/prototype.htm#micro [Consultado: 18/05/04]

FAO. Crop-pest Ontology. Disponible en: http://www.fao.org/agris/aos/News_Events/prototype.htm#crop [Consultado: 18/05/04]

FAO. Fishery Ontology. Disponible en: http://www.fao.org/agris/aos/News_Events/prototype.htm#fishery [Consultado: 18/04/04]

FAO. La utilización de Agrovoc. Disponible en: http://www.fao.org/agris/Magazine/News_Items/Agrovoc_Es.htm [Consultado: 17/05/04]

Fisseha, F.; Liang, A.; Keizer, J. Reengineering AGROVOC to Ontologies. Step towards better semantic structure. NKOS Workshop, Mayo 2003. Disponible en: http://www.fao.org/agris/aos/Presentations/Sixth_NKOS.ppt [Consultado: 17/05/04]

García Jiménez, A. Instrumentos de representación del Conocimiento: tesauros versus ontologías. Anales de ocumentación, 7, 2004, PÁGS. 79-95.

Hall, M. CALL Thesaurus Ontology in DAML. Dynamics Research Corporation, 2001.

Keizer, J., et al. The AGRICULTURAL ONTOLOGY SERVICE: A Comprehensive Framework for Building Multilingual Domain Ontologies. Beijing: AFITA, Octubre 2002. Disponible en: http://www.fao.org/agris/aos/Presentations/1 [Consultado: 18/05/04]

Keizer, J., et al. The AGRICULTURAL ONTOLOGY SERVICE: A Proposal to Create a Knowledge Organisation Framework in the area of Food and Agriculture. Workshop, Enero 2001. Disponible en: http://www.fao.org/agris/aos/Presentations/AOSUserGroupOxford.ppt [Consultado: 17/05/04]

Lauser, B., et al. A Comprehensive Framework for Building Multilingual Domain Ontologies. Florence, 2002. Disponible en: http://www.fao.org/agris/aos/Presentations/dc2002.ppt [Consultado: 14/05/04]

Qin, J.; Paling, S. Converting a controlled vocabulary into an ontology: the case of GEM. Information Research, 2000-01, vol. 6, nº 2. Disponible en: http://informationr.net/ir/6-2/paper94.html [Consultado: 17/05/04]

Wielinga, B.J.; Schreiber, A. Th.; Wielemaker, J. ; Sandberg, J. A. C. From Thesaurus to Ontology. En Proceedings of the International Conference on Knowledge Capture , 2001. ACM Press, p. 194-201.

Wilson, M. Migrating from Thesauri to Ontologies, 2002. Disponible en: http://www.w3c.rl.ac.uk/ukofficepasttalksindex.html [Consultado: 19/05/04]

Wilson, M. A Thesaurus Interchange format for migrating to the Semantic Web. http://www.w3c.rl.ac.uk/pasttalks/slidemaker/XML_UK_SW_Thes/Overview.html [Consultado: 19/05/04]

Volver arriba