3. LAS ONTOLOGÍAS Y LA RECUPERACIÓN DE INFORMACIÓN EN INTERNET

 

3.1 QUÉ ES UNA ONTOLOGÍA:

    Ontología es una antigua disciplina que va desde el estudio realizado por Aristóteles sobre las categorías a la metafísica, y la ciencia que estudia el ser y sus propiedades.

    En el entorno de Inteligencia Artificial, ontologías son teorías que especifican un vocabulario relativo a un cierto dominio. Este vocabulario define entidades, clases, propiedades, predicados y funciones y, las relaciones entre estos componentes. Las ontologías toman un papel clave en la resolución de interoperabilidad semántica entre sistemas de información y su uso dentro del contexto.

     Una ontología es un instrumento que define los términos básicos y relaciones a partir del vocabulario de un área así como las reglas de combinación de estos términos y relaciones para definir extensiones a un vocabulario. Como se puede observar, el paralelismo con los tesauros es evidente, especialmente en lo referente a la delimitación de los términos que deben formar parte de una construcción  de representación del conocimiento así como en lo que se refiere a las relaciones que se establecen.

 

 

OBJETIVOS:

 

1.  Compartir la comprensión común de la estructura de información  entre personas o agentes de software.

 

2.  Permite:
- La reutilización del conocimiento perteneciente a un dominio. Por ejemplo a la hora de iniciar la elaboración de una ontología.
- Hacer explícitos los supuestos de un dominio.

 

3.  Separa el conocimiento de un dominio del conocimiento que se puede denominar operacional.

 

4.  Hace posible analizar el conocimiento de un campo, por ejemplo en lo que se refiere al estudio de los términos y  relaciones que lo configuran ya sean formalmente o no.
 

    En términos generales, se puede decir que una ontología es una forma más de describir formalmente el conocimiento de un dominio.

 

 SE COMPONE DE LAS SIGUIENTES PARTES:

 

a) Una primera que son las clases o subclases (o conceptos).

 

b) En segundo lugar, se encuentra los slots (en ocasiones llamados roles o propiedades) que delimitan las propiedades y características de cada concepto describiendo varios rasgos y atributos. Éstos slots van a ayudar a definir las características de las clases. Así pueden ser intrínsecos, extrínsecos, partes o bien relaciones de miembros individuales de las clases y otros items.

 

c) En tercer lugar, encontramos las facetas (también llamadas restricciones de roles). Estas facetas describen cosas como los tipos de valores, los valores permitidos, el número de valores y cualquier otra característica que un slot puede tomar. Entre los tipos más comunes de facetas están la cardinalidad (permiten definir cuántos valores pueden tener un slot), el tipo de valor del slot (string, número, booleanos,etc.), domi-nio y rango de un slot, etc.

 

d) Finalmente destacan las instancias, que en realidad son objetos de una clase.

 

 

TIPOS DE ONTOLOGÍAS:

 

Según Steve (1998):

 

Ø      Ontologías de un dominio, en las que se representa el conocimiento especializado pertinente de un dominio o subdominio, como la medicina, las aplicaciones militares, la cardiología o, en nuestro caso particular, la oncología.

 

Ø      Ontologías genéricas, en las que se representan conceptos generales y fundacionales del conocimiento como las estructuras parte/todo, la cuantificación, los procesos o los tipos de objetos.

 

Ø      Ontologías representacionales, en las que se especifican las conceptualizaciones que subyacen a los formalismos de representación del conocimiento, por lo que también se denominan meta-ontologías (meta-level o top-level ontologies).

 

Según Guarino hay cuatro tipos de ontologías:

Ø      Ontologías de nivel más alto que describen todos los conceptos generales tales como el espacio, el tiempo, la materia, el objeto, el hecho, la acción, etc.

Ø      Ontologías de dominios, describen el vocabulario relacionado con un dominio genérico

Ø      Ontologías de tareas, describen actividades, lo que puede resultar útil en las organizaciones.

Ø      Ontologías de aplicaciones, describen los conceptos conforme a un campo determinado o unas tareas concretas, que resultan, en muchas ocasiones, especializaciones de diversas ontologías.

 

 

3.2  EL USO DE LAS ONTOLOGIAS EN INTERNET

 

    Las ontologías, que en el campo de la recuperación de información suponen un avance en la interrelación entre los humanos y los ordenadores, pueden ser:

 
  • Lingüísticas: estando vinculadas con aspectos gramáticos, semánticos y sintácticos. Son:

        -Una lista jerárquica de términos de un área específica

        -Vocabularios controlados que incluyen un análisis semántico de palabras para

         su posterior categorización y enlazado con otras, en términos similares a las    

         relaciones propias de los tesauros.

 
 

  • No Lingüísticas: empleadas para la creación de agentes inteligentes.

 

Es importante tener en cuenta que la combinación de las herramientas basadas en el conocimiento y los métodos lingüísticos aportan los mejores resultados globales para recuperar con precisión la información buscada.

En el contexto de uso actual de las ontologías, como son los portales web, las colecciones multimedia, diseño de documentos web, los agentes inteligentes, comercio electrónico, gestión de la imagen audiovisual, etc., existen varias utilidades de las ontologías, entre las que destaca en primer lugar, la mejora en la comunicación, habida cuenta de su dedicación a reducir la confusión terminológica y conceptual en un único marco de trabajo.

En segundo lugar, favorece la interoperatividad. En efecto, las ontologías, en principio, han de potenciar el intercambio de datos en contextos informáticos y digitales gracias a los fundamentos semánticos que se encuentran en ellas.

 

 

UTILIDADES
  • Mejora en la comunicación para reducir la confusión terminológica y conceptual en un único marco de trabajo.
  • Favorece la interoperatividad. Las ontologías han de potenciar el intercambio de datos en contextos informáticos y digitales gracias a los fundamentos semánticos que se encuentran en ellas.

 

 

VENTAJAS
 

   El uso de ontologías para la recuperación de la información tiene ciertas ventajas sobre los métodos de acceso simples basados en palabras clave.

 

  • Suministran un vocabulario compartido y común para expresar información sobre el contenido de los documentos.
  • Incluyen axiomas para especificar relaciones entre conceptos, es decir, podemos utilizarlas para formular consultas más complejas y recuperar exactamente la información en la que estamos interesados .
  • Amplían semánticamente los conceptos en el refinador semántico
  •  Son útiles en la clasificación de la información resultante de las páginas web obtenidas a través de un buscador, reconociendo conceptos similares
  • Integran la información obtenida a partir de las distintas fuentes para poder unificar conceptos expresados con distinta terminología y reconocer coincidencias de autores e instituciones que puedan estar expresadas de distinta manera.

 

 ¿Cómo se recupera Información a través del uso de ontologías?

 
  • Se navega por la ontología hasta encontrar la información que se necesita.
  • El usuario obtiene información adicional a medida que realiza la búsqueda para poder orientar sus sucesivos pasos y encontrar la solución que busca de forma coherente y precisa.
  • La consulta permite la realización de operaciones sobre conjuntos y se expande en busca de instancias por las subclases y las relaciones que hay entre los elementos de las ontologías.
  • Mediante esta técnica se puede concretar un resultado por medio de las propiedades de jerarquía y se puede asociar conceptos de dominios distintos debido a las relaciones.
 
    ¿Qué ventaja se obtiene empleando estos métodos?
 
        Mayor precisión en la recuperación de información.

  

 3.3  LENGUAJES ONTOLÓGICOS EN INTERNET

             Para aportar significado a las páginas web, estas se pueden anotar con información ontológica. La forma de añadir esta meta-información depende del lenguaje que estemos utilizando para ello. Existen muchos lenguajes de ontología basados en WEB. Tienen como una de sus principales características que están en continua evolución y que pueden estar construidos por ejemplo, en sintaxis XML o en RDF(S) como OIL (Ontology Inferenca Layer), DAML (DARPA Agent Mark-Up Language) + OIL y OWL (Web Ontology Language) . Los lenguajes de marcado de las ontologías están todavía en desarrollo.

Para estudiar con mayor profundidad los lenguajes ontológicos, a continuación se desarrollan los más destacados.

 

 Son numerosos los proyectos y experiencias que se han desarrollado en Internet, utilizando ontologías. Es necesaria una breve revisión recordando el servidor Ontolingua, fruto de KSE, que ofrece las herramientas necesarias para crear ontologías, integrarlas con otras existentes, e incorporarlas en nuevos productos de software.

 

Otro enfoque diferente es el aportado por Luke, Spector y Pager (1996), que han desarrollado SHOE (Simple HTML Ontology Extensions), un complemento semántico al HTML, el cual refleja el contenido de la página web, y que puede ser utilizado por agentes para el descubrimiento de información.. Posteriormente SHOE ha evolucionado hacia RDF y CG, siendo la más reciente la especificación OML (Ontology Markup Language), mantenida por Robert E. Kent, y que se apoya en la misma filosofía que SHOE.

 

Uno de los proyectos más conocidos es el llevado a cabo por Ferry M. Kiermann, con el nombre de CyberStacks. Se puede ofrecer al usuario un listado de recursos de información en Internet, organizados según una clasificación, subclases y descripciones Particulares. Sin embargo, por el momento no ha integrado completamente ontologías en su servidor, y tampoco dispone de agentes capaces de aprovechar esas ontologías.

 

LA utilización de ontologías también está presente en el proyecto FERMI (Formalisation and Experiemntation on the Retrieval of Multimedia Information), proyecto ESPRIT 8134, bajo la dirección K. van Rijsbergen, en el que se incluyen herramientas de planificación, descubrimiento y selección de recursos de información mutimedia.