Análisis de PROTÉGÉ –2000

 

 

 

 

 

 

 

 

 

 

 

 

Yolanda Martí Muñoz

 Enriqueta Planelles Riera

                                                               SRP-5º Documentación

                Universidad Politécnica de Valencia-2002

 

 

 

 

 

 

 

INDICE___________________________________

 

 

1. Introducción………………………………………………………………….3

2. Objetivos……………………………………………………………………….4

3. Metodología……………………………………………………………………5

4. Comparación Kappa/Protégé-2000………………………………6

5. Conclusiones…………………………………………………………………13

6. Bibliografía……………………………………………………………………14

 

 

 

 

 

 

 

 

 

 

 

 

1. Introducción.

 

 

Protégé-2000 es una herramienta integrada de software para desarrollar sistemas basados en el conocimiento. Los usos desarrollados con Protégé-2000 se utilizan para la solución de problemas y la toma de decisiones en un dominio particular. Esta herramienta facilita trabajar simultáneamente con las clases y los casos.

       

Protégé-2000 permite:

·        Modelar una ontología de las clases que describen un tema particular.

·        Creación de una herramienta de adquisición de conocimiento para recoger conocimiento.

·        Entrar en casos específicos de datos y de la creación de una base de conocimiento.

·        La ejecución de usos.

 

La ontología define el sistema de conceptos y sus relaciones. Esta herramienta de adquisición del conocimiento se diseña para ser específica del dominio, permitiendo a expertos del dominio incorporar fácil y naturalmente su conocimiento del área. La base de conocimiento que resulta se puede entonces utilizar con un método problem-solving para contestar a preguntas y para solucionar problemas con respecto al dominio.

 

Protégé-2000 se diseña para dirigir a los expertos del dominio en el proceso de desarrollo del sistema y para permitir que estos reutilicen las ontologías del dominio y los métodos problem-solving para el mantenimiento y desarrollo del programa.

 

 

Actualmente se está utilizando en medicina clínica, y ciencias biomédicas, aunque puede ser utilizado en cualquier campo donde los conceptos se pueden modelar como jerarquía de clases.

 

 

 

 

 

 

 


           

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 -Clases e Instancias-

 

 

 

2. Objetivos

 

            Los objetivos que se pretenden conseguir con el análisis de esta herramienta son los siguientes:

 

v     Analizar y probar el funcionamiento de la herramienta integrada de software Protégé-2000 para la generación de bases de conocimiento.

 

v   Estudiar las ventajas y desventajas de este entorno relacionándolo con KAPPA y utilizando la representación del conocimiento mediante frames, realizada en la práctica “ Discografía” de la asignatura Sistemas de Representación y Procesamiento Automático del Conocimiento.

 

3. Metodología

 

Tomando como base la práctica denominada “ Discografía” implementada en KAPPA, se ha llevado a cabo un análisis del funcionamiento de Protégé-2000, modelando una ontología de las clases que describen este tema.

 

Para el desarrollo de la práctica se ha seguido los siguientes pasos:

 

v     Construcción de una ontología inicial de clases, instancias y slots.

v     Introducción de datos.

v     Interrogación al sistema.

 

Nuestra base de conocimiento trata de organizar en una estructura jerárquica datos sobre música de jazz, incluyendo:

 

v     evolución de la música desde los años 20 a los 90, con sus correspondientes estilos.

v     relación de autores más relevantes en la historia del jazz, junto al instrumento musical que los caracteriza o ha caracterizado.

v     información sobre dos personas muy aficionadas a la música de jazz, y que cuentan con una amplia discografía en cassettes y compact disc.

 

Podemos utilizar la información de esta base de conocimiento para una gran variedad de usos:

 

v     recuperar información sobre intérpretes, estilos, épocas, títulos…

v     obtener la cantidad de CDs y CSs que sobre un determinado estilo, o intérprete poseen cada uno de los aficionados.

v     averiguar el estilo de música  preferido por cada uno de ellos.

v     conocer de qué época disponen más música. 

 

 Se pretende demostrar, con este ejemplo, como las bases de conocimiento, las ontologías y las herramientas de adquisición de conocimiento se pueden diseñar con Protégé-2000.

 

4. Comparación Kappa / Protégé-2000

 

Generalidades:

 

Interfaz de usuario más amigable, puesto que permite la creación de gráficos, tablas, diagramas, y diferentes componentes de animación para acceder a la base de conocimiento.

 

Permite importar, incluir y configurar un proyecto de texto, base de datos o RDF, y al mismo tiempo, generar el HTML de un proyecto. En cuánto a la importación, se puede importar un proyecto desde los formatos externos que Protégé soporta. Los siguientes formatos pueden ser importados:

 

v     Archivos de texto: se puede importar un proyecto a partir de dos archivos de texto que describen las clases/slots y la información de instancias. Importar un proyecto de texto se puede utilizar, por ejemplo para la actualización de Protégé/ Win a Protégé-2000.

 

v     Tabla de Base de datos: se puede importar un proyecto desde una tabla de base de datos de JDBC.

 

v     Archivos RDF: se puede importar un proyecto a partir de dos archivos de RDF que describan las clases/slots y la información de las instancias.

 

Protégé-2000 generará las formas por defecto para todas las clases en el proyecto importado.

 

Otra posibilidad que ofrece esta herramienta es la capacidad de incluir un proyecto existente en un proyecto actual, lo cual, permite construir un proyecto grande de unos o más proyectos más pequeños. Las clases, los slots, y las instancias incluidos no pueden ser corregidos; las formas incluidas se pueden corregir, sin embargo. Una vez que un proyecto se haya incluido en otro proyecto, no hay manera de quitarlo usando el interfaz Protégé-2000. Es posible quitar un proyecto incluido, editando la instancia “Project” en el archivo del pprj.

 

Protégé guarda los proyectos creados con la extesión pprj. Además, crea dos archivos (en formato de texto) que contienen la información adicional sobre la ontología y las instancias del proyecto. Así pues cuando se abre un archivo pprj. Protégé-2000 carga automáticamente estos archivos. Por defecto, los archivos adicionales son salvados en formato de texto:

 

v     un archivo de texto que contiene la clase y la información del slot a través de la extensión .pont (ontología de Protégé).

 

v     un archivo de texto que contiene la información de la instancia, mediante la extensión .pins (instancias de Protégé).

 

Mayor rapidez en la introducción de datos, puesto que permite capturar todos los datos previamente introducidos.

 

No utiliza un lenguaje específico de interrogación, lo cual incrementa su sencillez.

 

 

 

 

 

 

 

 

 

 

 


      -Guardar un proyecto en formato texto-

 

 

Especificaciones:

       

        El sistema de creación de clases, instancias, slots, así como sus respectivos sistemas de herencia, básicamente es el mismo en las dos herramientas.  Todas las clases se muestran como descendiendo, directamente o indirectamente, de la clase: THING del sistema. Los iconos muestran la información adicional sobre su clase.

 

Como excepción a lo anterior, es destacable el hecho de la diferenciación entre clases abstractas y concretas. Las clases concretas pueden tener instancias directas y las abstractas no incluyen instancias.

 

A la hora de definir los slots, se ha de tener en cuenta, que no pueden existir dos slots con un mismo nombre, puesto que el sistema no lo admite.

 

 

 

 

 

 

 

 

 

 

 


           -Creando una nueva clase-

                                                                                                                 

Protégé-2000 genera por defecto una forma para cada clase. Con las formas se pueden incorporar instancias a través del panel de instancias, utilizado típicamente por personas que no son expertos. Así pues, la lengüeta de las formas permite crear diferentes interfaces de usuario para la misma Ontología.

 

Cada forma contiene un número de “ widgets” que se corresponden a los slots  en la clase. Los “widgets” se traducen en los campos de entrada en el panel de las instancias, y controlan cómo los usuarios incorporarán la información como instancias.

 

Las formas que se diseñan y que se crean en el panel de las formas se pueden ver en su formato final a través del panel de las instancias. Los usuarios finales utilizan las formas acabadas para incorporar casos en la base de conocimiento.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-Panel de las formas-

 

Protégé-2000 incluye la posibilidad de visionar una gran cantidad de casos al mismo tiempo, junto con las relaciones seleccionadas entre los casos a través de diagramas. Un  diagrama, por tanto, es visualmente un sistema de nodos y los conectores que los ensamblan.

 

Los nodos representan los objetos del dominio, y los conectores representan a las instancias del Conector (clase que el “widget” del diagrama utiliza para representar relaciones importantes). El conector registra dos tipos distintos de información: qué  tipos de objetos se pueden conectar por este acoplamiento y qué slots en los objetos.

 

 Protégé-2000 incluye además, la posibilidad de realizar tablas, que se definen como widgets complejos diseñados para visualizar relaciones funcionales en una base de conocimiento.

 

Las tablas widgets reflejan una relación funcional subyacente en la base de conocimiento. La decisión de utilizar  tablas no debe tomarse ligeramente, ya que usar widgets de la tabla en proyectos y bases de conocimiento que explícitamente no fueron diseñadas para ser utilizadas con ellas, puede resultar problemático.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


        -El Panel de Preguntas-

 

 

Continuando con el análisis de Protégé-2000 otro aspecto importante a destacar es cómo interrogar al sistema y localizar, así, la información requerida según el criterio especificado. Esto se puede llevar a cabo a través del panel de las preguntas.

 

A la hora de interrogar al sistema, se pueden utilizar dos tipos de preguntas para la obtención de información: preguntas simples o complejas, con múltiples criterios, según se desee restringir o ampliar los resultados.

 

Existe la posibilidad de utilizar una cuestión como parte integrante de otra, con la finalidad de obtener una información más concreta. Ejemplo la pregunta: Muestra los títulos de los CD de Juan donde se toque la trompeta necesitaría de esta otra pregunta para obtener la información requerida: Interpretes cuyo instrumento sea la trompeta.

 

En relación con la interrogación al sistema  Protégé-2000, presenta las siguientes limitaciones:     

 

-   Imposiblidad de obtener una respuesta afirmativa o negativa (Sí/No).

-         carencia de funciones para realizar ciertas operaciones como sumar, restar, etc…

-         a través de la práctica implementada hemos advertido  que, independientemente de la pregunta formulada, la respuesta del sistema siempre es una referencia, que nos conducirá a la información completa.

 

 

Conclusiones

 

v     Los usos desarrollados con Protégé-2000 se utilizan en la solución de problemas y la toma de decisiones en un dominio particular.

 

v     Protégé-2000 facilita el trabajo con las clases y las instancias.

 

v     La base de conocimiento que resulta se puede utilizar como un método para contestar a preguntas y para solucionar problemas con respecto al dominio.

 

v     Desde nuestro punto de vista, esta herramienta presenta una mayor sencillez a la hora de interrogar el sistema, puesto que no es necesario la utilización de un lenguaje específico.

 

v     Protégé-2000 es una herramienta que permite al usuario

§         Construir un dominio ontológico.

§         Personalizar formas de adquisición del  conocimiento.

§         Penetrar en el dominio del conocimiento.

 

v     Es una plataforma que puede ampliarse con gráficos, tablas, diagramas, y componentes de animación para acceder a otras aplicaciones ensambladas en sistemas basados en el conocimiento.

 

v     Una librería con otras aplicaciones que pueden usarse para acceder y visualizar bases de conocimiento.

 

 

 

 

 

Bibliografía

 

v     Protégé-2000

<http://protege.standford.edu/index.html>[Consulta:abril-mayo 2002]

 

v     KAPPA-PC OnLine Manual.

 

v     GUERRERO BOTE, Vicente; LOZANO TELLO, Adolfo."Vínculos entre las Ontologías y la Biblioteconomía y Documentación" en La Representación y la Organización del Conocimiento en sus distintas perspectivas: su influencia en la Recuperación de la Información : Actas del IV Congreso ISKO-España EOCONSID’99 22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultad de Biblioteconomía y Documentación, 1999, p. 25-31.

 

v     Ontologías. http://www.ontology.org/ (consultado el 23-05-2002).

 

 

v     TRAMUYAS, Jesús. "Agentes y ontologías para el tratamiento de la información: clasificación y recuperación en Internet" en La Representación y la Organización del Conocimiento en sus distintas perspectivas: su influencia en la Recuperación de la Información : Actas del IV Congreso ISKO-España EOCONSID’99 22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultad de Biblioteconomía y Documentación, 1999, p.247-252.