WEB SEMÁNTICA: AGENTES INTELIGENTES

 

1. WEB SEMÁNTICA

1.1. DEFINICIÓN Y EVOLUCIÓN
1.2. LENGUAJES DE LA WEB SEMÁNTICA

1.2.1. XML
1.2.2. RDF
1.2.3. PICS
1.2.4. ONTOLOGÍAS
1.2.5. DAML-OIL

2. AGENTES

2.1. AGENTES INTELIGENTES SOFTWARE

2.1.1. CARACTERÍSTICAS
2.1.2. TIPOLOGÍAS

2.1.2.1. AGENTES REACTIVOS
2.1.2.2. AGENTES DELIBERATIVOS
2.1.2.3. AGENTES COLABORATIVOS O COOPERATIVOS
2.1.2.4. AGENTES DE INTERFAZ
2.1.2.5. AGENTES MÓVILES
2.1.2.6. AGENTES ESTÁTICOS
2.1.2.7. AGENTES DE INFORMACIÓN / INTERNET
2.1.2.8. AGENTES HÍBRIDO
2.1.3. SISTEMAS MULTIAGENTES
2.1.4. APLICACIONES

2.2. AGENTES INTELIGENTES DE BÚSQUEDA

2.2.1. CLASIFICACIÓN
2.2.2. FUNCIONES TÉCNICAS
2.2.3. EJEMPLOS DE AGENTES DE BÚSQUEDA EN INTERNET

2.2.3.1. QUERYN METASEARCH 2.2
2.2.3.2. HURRICANE WEBSEARCH 1.30
2.2.3.3. WEBFERRET 5.0
2.2.3.4. BULLSEYE 2.5.013
2.2.3.5. WEBSEEKER 5.0
2.2.3.6. COPERNIC 6.1
2.2.3.7. MATAHARI V.2.01
2.2.3.8. BOOKWHERE V 4.2.0
2.2.3.9. BLACKWINDOW 4.07

3. RELACION WEB SEMÁNTICA- AGENTES

3.1. EJEMPLOS

3.1.1 SHOE
3.1.2 ONTOBROKER
3.1.3 LEXIGUIDE
3.1.4 CYC KNOWLEDGE SERVER

4. CONCLUSIÓN
5. BIBLIOGRAFÍA

1. WEB SEMÁNTICA

1.1. DEFINICIÓN Y EVOLUCIÓN

Según Berners-Lee, Hendler y Lassila, la Web Semántica es entendida como una Internet en la que los ordenadores no sólo son capaces de presentar la información contenida en las páginas web, como hacen ahora, sino que además pueden "entender" dicha información.

La Web Semántica es una extensión de la actual Web que permitirá encontrar, compartir y combinar la información más fácilmente.

Actualmente la información presente en la Web se encuentra estructurada mediante lenguajes de etiquetado que únicamente describen la forma en que dicha información debe ser presentada al usuario por el navegador (colores, maquetación, interacción...), pero no expresan nada sobre su significado, es decir, su semántica. El objetivo del proyecto de la Web Semántica es que toda esta información sea comprensible no sólo por humanos, sino también por computadoras. Para conseguir esto se deberá codificar la semántica de los documentos web mediante lenguajes de metadatos y ontologías (representaciones compartidas de conocimiento en forma de taxonomías de conceptos relacionales y reglas de inferencia).

En la última década ha habido una preocupación constante para que las páginas sean comprendidas por los usuarios a través del diseño pero poco se han preocupado para que las computadoras lo entendieran.

La web semántica propone superar las limitaciones de la web actual mediante la introducción de descripciones explícitas del significado, la estructura interna y la estructura global de los contenidos y servicios disponibles en la WWW, promueve la separación de contenido y formato.

Esta semántica permitirá que agentes inteligentes puedan "entender" el significado de los documentos, con lo que podrían asistir a usuarios en tareas como, por ejemplo, la recuperación de información o la gestión de su agenda.

En la práctica esto significa que las máquinas —los ordenadores personales o cualquier otro dispositivo conectado a Internet— podrán realizar, casi sin necesidad de intervención humana, infinidad de tareas que simplificarán nuestra vida. "La web semántica", explican los autores, "no es una web aparte sino una extensión de la actual en la que la información tiene un significado bien definido, posibilitando que los ordenadores y las personas trabajen en cooperación". Así, lo que hasta ahora había sido básicamente "un medio de documentos para personas" pasará a ser un sistema de datos e información que se podrán procesar automáticamente.

El primer lenguaje para la construcción de la web semántica fue SHOE, creado por Jim Hendler en la Universidad de Maryland en 1997. Desde entonces se han definido otros lenguajes y estándares con finalidad similar, como XML, RDF, DAML+OIL, y más recientemente OWL, por citar los más importantes.


1.2. LENGUAJES DE LA WEB SEMÁNTICA

Los elementos necesarios que componen la web semántica son: XML, RDF, PICS, ONTOLOGÍAS y AGENTES

XML

XML (eXtensive Markup Language), permite la codificación para la distribución de documentos complejos por Internet, es decir, es uno de los resultados del empuje general hacia una estructura mas semántica en la Web. Permite que los creadores de páginas web, usen su propio conjunto de etiquetas de demarcación (markup-tags). Esas etiquetas pueden ser elegidas de manera tal que reflejen la semántica específica del dominio tratado, en lugar de ocuparse meramente de la posición y formato de la información que comprenden.

XML es un subconjunto de SGML, y define un formato de texto diseñado para la transmisión de datos estructurados. Al ser un subconjunto de SGML mantiene sus características de validación, estructurado y especialmente facilita la extensibilidad, porque es un metalenguaje que permite describir lenguajes de marcas, tanto la definición de etiquetas como la relación estructural que existen entre ellas.

Un ejemplo de como funciona XML sería algo así:


<agenda>

<persona>

<nombre>Kike</nombre>

<telefono>638002993</telefono>

<comentario>Es un bombon</comentario>

</persona>

<persona>

<nombre>Maria</nombre>

<telefono>956-78.90.12</telefono>

<telefono>652135792</telefono>

</persona>

</agenda>


RDF

RDF son las siglas que definen Resource Description Framework (algo así como marco de descripción de recursos). Como su nombre indica el área en la que está enmarcado, es la descripción de recursos de la red, entendiendo por recurso todo lo que nos de sí la imaginación en tanto que a definir cualquier cosa, páginas, personas, dispositivos... RDF permite que las condiciones que se quieren "preguntar" sobre un recurso sean definidas como un conjunto de propiedades que componen el esquema.

RDF ofrece una estructura semántica inambigua (por el uso de los URI, Uniform Resource Identifier) que permite codificación, intercambio y procesamiento automático de los metadatos normalizados.

RDF proporciona también reglas para facilitar técnicamente la manera de explicar conceptos de modo que los ordenadores puedan procesarlo rápidamente y proporciona un medio que posibilita la edición de vocabularios con propiedades definidas para la descripción de los recursos de una comunidad.

RDF usa la sintaxis del lenguaje XML para el intercambio y procesamiento de metadatos, las condiciones se recogen en los rdf: Descripcion de los elementos XML.

PICS

Los PICS (Platform for the Internet Content Selection), nos indican lo adecuado o conveniente de determinados ficheros de datos según la comunidad en la que se encuentre el usuario. Es una infraestructura para asociar las etiquetas con los contenidos de Internet. Aunque en un principio estaba destinado al control del acceso de los niños a Internet, su uso se puede extender a otras etiquetas que incluyan privacidad, licencias, etc. PICS es una plataforma sobre la cual se han construido otros servicios de clasificación que no sólo define una manera de construir etiquetas sino que es un mecanismo para realizar las valoraciones. Este mecanismo esta formado, al menos por lo siguiente:

· Las etiquetas, que son los metadatos que indican la valoración de un documento
· Los servicios de valoración, es decir, las organizaciones, grupos o personas que realizan una valoración
· Los perfiles, que son las reglas que da el usuario para definir el filtro y evitar recibir documentos no deseados.

Para que el filtrado de documentos no deseados se lleve a cabo, también es necesario un software cliente y otro servidor que tengan implementado el sistema de valoración. Estas funciones se pueden realizar por separado, lo cual permite que por un lado los desarrolladores de software puedan realizar una aplicación informática sin suministrar un sistema de valoración mientras que por otro una organización puede crear sistemas de valoración sin tener que desarrollar el software.


ONTOLOGÍAS

Según García Cataño, C., “las ontologías son colecciones de enunciados redactados en un lenguaje, como el RDF, que define las relaciones entre conceptos y especifica reglas lógicas para razonar con ellos. Los ordenadores "comprenderán" el significado de los datos semánticos de una página de la red siguiendo vínculos con ontologías especificadas”.

A partir de estos conceptos, aparece OIL (Ontology Inference Language), desarrollado en Europa, y DAML (DARPA Agent Markup Language), en EE.UU., dos lenguajes muy similares que de hecho se terminaron fundiendo en DAML+OIL. Son dos lenguajes RDF de nivel básico que permiten definir nuevas aplicaciones sobre el RDF de una manera estructurada e interoperable, permitiendo crear términos inversos, términos transitivos, equivalencias, tipos de datos, uniones, intersecciones, etc.

OIL Ontology Inference Layer es el primer lenguaje de representación de ontologías basado en estándares W3C: tiene sintaxis XML y está definido como una extensión de RDFS. El modelo utilizado por OIL para la representación del conocimiento lo ha heredado, por una partede la Lógica Descriptiva (declaración de
axiomas o reglas) y, por otra, de los sistemas basados en frames (taxonomía de clases y atributos).

OIL se encuentra estructurado en varias capas de sublenguajes. La capa base o núcleo de OIL coincide plenamente con RDFS, y cada una de las capas superiores añade funcionalidad y complejidad a su capa subyacente. Esto posibilita, teóricamente, la reutilización de agentes diseñados para RDFS, que podrían procesar ontologías OIL.

Entre las limitaciones de OIL podíamos destacar las siguientes: no ofrece la posibilidad de sobrescritura de valores heredados de una superclase; presenta falta de expresividad en la declaración de axiomas (reglas); y, no soporta dominios concretos (ej.: números enteros, cadenas de caracteres, etc.).

DAML+OIL es una propuesta de lenguaje de representación de ontologías más reciente, fruto de la cooperación entre los grupos de trabajo de OIL y DARPA (US Defense Advanced Research Projects Agency), quienes anteriormente habían desarrollado el lenguaje DAML (DARPA’s Agent Markup Language) con la finalidad de extender el nivel de expresividad de RDFS.

Por tanto DAML+OIL es un lenguaje que unifica estos dos lenguajes, aunando esfuerzos en el camino de la construcción de un lenguaje estándar para la definición de ontologías. Aunque DAML+OIL hereda muchas de las características de OIL, difiere en algunas. De hecho, se aleja del modelo basado en frames de OIL, potenciando Lógica Descriptiva. A nivel práctico, DAML+OIL demuestra ser más útil como soporte para ontologías, sin embargo aún tiene ciertas carencias como formato de intercambio y modelado otra legible por humanos (puede que basada en un DTD de XML).

Fue a partir de esta unión cuando se definió el lenguaje OWL (Web Ontology Language), con el propósito de reunir todas las ventajas de DAML+OIL y resolver los problemas de este lenguaje.

2. AGENTES

Desde hace algunos años, los agentes han adquirido una importancia creciente, este interés se ha originado gracias a la convergencia progresiva de la informática y las telecomunicaciones o lo que se conoce como Telemática.

Según Maes, P. “los agentes son sistemas computacionales que habitan en entornos dinámicos complejos, perciben y actúan de forma autónoma en ese entorno, realizando un conjunto de tareas y cumpliendo objetivos para los cuales fueron diseñados”.

En la web semántica serán los encargados de realizar la búsqueda de servicios, para ello, la semántica facultará a los agentes para describir unos a otros la función exacta que realizan, y qué datos han de recibir para ello.

Pretenden ser programas avanzados que pueden funcionar útilmente en entornos de importancia para los seres humanos.

Los agentes inteligentes se dividen en: agentes biológicos, agentes hardware y agentes software. Estos últimos serán los tratados en nuestro trabajo.


2.1 AGENTES INTELIGENTES SOFTWARE

Las ideas de agentes inteligentes y las tecnologías han sido influenciadas por una gran variedad de disciplinas y prácticas. No obstante, su origen está en el campo de la inteligencia artificial. Se empezó a usar a principios de los 80 para reflejar la idea de crear objetos que piensan, por ejemplo, entidades software autónomas de acuerdo con una inteligencia autocontenida.

Son software encargados de establecer interfaces y gerenciar la información para tratar de satisfacer las necesidades de los clientes o usuarios.

Según Benner, “un agente inteligente software es un programa que puede realizar tareas específicas para un usuario y posee un grado de inteligencia suficiente para ejecutar parte de sus tareas de forma autónoma y para interactuar con su entorno de forma útil”.


2.1.1 CARACTERÍSTICAS

Puesto que conceptualizar los agentes software no es fácil, se ha optado por definir un conjunto de propiedades o atributos que caracterizan este tipo de agentes (aunque esto no implica que todos las posean):

· Autonomía: Operan sin intervención de otros agentes para encontrar sus objetivos diseñados, además tienen alguna clase de control sobre sus acciones y estados internos.

· Sociabilidad (comunicación): Interaccionan con otros agentes utilizando para ello un lenguaje de comunicación entre agentes. Pueden comunicarse además con varios recursos del sistema o usuarios, de allí que los que interactúan directamente con el usuario se llamen agentes de interfaz. Desde el punto de vista del agente los recursos pueden ser locales o remotos.

· Cooperación: Permiten la cooperación entre entidades de agentes. La complejidad de la cooperación puede variar desde un estilo de interacción cliente/servidor a negociaciones y cooperación basada en métodos de inteligencia artificial, tales como redes de contrato y protocolos. Esta cooperación puede necesitar del intercambio de información y representaciones de prerequisitos para sistemas multiagentes.

· Reactividad: Perciben estímulos de su entorno y reaccionan ante ellos posiblemente para cambiar lo que allí ocurre.

· Proactividad/Iniciativa: Tienen carácter emprendedor y actúan guiados por sus objetivos. Esta propiedad también se llama “orientado a objetivos”.

· Movilidad: Se trasladan a través de una red telemática para desempeñar tareas específicas. Normalmente se identifican dos niveles:

· Ejecución remota: Un agente es transferido a un sistema remoto donde es activado y ejecutado en su totalidad. El mecanismo de transporte del agente utilizado varía desde TCP/IP a correo electrónico.

· Migración: Durante su ejecución un agente activo puede moverse de nodo a nodo para cumplir progresivamente su tarea.

· Veracidad: No comunican información falsa a propósito (se supone).

· Benevolencia: Ayuda a otros agentes y no entra en conflicto con sus propios objetivos.

· Racionalidad: Actúa en forma racional con miras a cumplir sus objetivos.

· Inteligencia: Se refiere al método utilizado para desarrollar la lógica del agente o la inteligencia y está estrechamente relacionada con los lenguajes de agentes donde predominan dos aspectos: la creación de contenido pragmático del agente y la representación del conocimiento que proporciona los medios para expresar objetivos, tareas, preferencias y vocabulario apropiado para varios dominios.

· Adaptativo (Aprendizaje): Cambia su comportamiento basado en las experiencias previas.

· Carácter: Se puede creer que tienen personalidad y estados emocionales.

· Operación Asíncrona: El agente puede ejecutar tareas totalmente desacoplado de sus usuarios o de otros agentes, lo que significa que puede ser disparado por la ocurrencia de un evento particular.

2.1.2 TIPOLOGÍAS

La tipología se refiere al estudio de tipos de entidades de agentes. Hay varias dimensiones para clasificar el software de agentes existentes:

A. Según su capacidad para resolver problemas:

- Agentes Reactivos
- Agentes Deliberativos

B. Según su autonomía, aprendizaje y cooperación (atributos):

- Agentes Colaborativos o Cooperativos
- Agentes de Interfaz

C. Según su movilidad:

- Agentes Móviles
- Agentes Estáticos

D. Otros tipos:

- Agentes de Información / Internet
- Agentes Híbridos

Agentes Reactivos

Los agentes reactivos no poseen modelos simbólicos internos de sus entornos. En su lugar reacciona en modo de estímulo respuesta para representar el estado de su entorno.

Características:
- robustos y tolerantes
- simples y fáciles de entender
- economía cognitiva baja
- flexibilidad y la adaptabilidad
- pueden direccionar problemas de estructura difícilmente abordables por medio de las técnicas tradicionales de inteligencia artificial.

Hay un número relativamente pequeño de aplicaciones software basadas en agentes reactivos, por esta razón no hay un modo estándar para su operación, tienden a depender de la arquitectura de un agente reactivo seleccionado.

Agentes Deliberativos

Los agentes deliberativos poseen un modelo de razonamiento simbólico interno comprometido en la planeación y negociación para realizar coordinación con otros agentes.
Son capaces de razonar acerca de sus intenciones y conocimientos, crear planes de acción, y ejecutar dichos planes.

Agentes Colaborativos o Cooperativos

Los agentes colaborativos enfatizan en la autonomía y la cooperación para ejecutar tareas por ellos mismos, pueden aprender pero este no es su aspecto más destacado.

Las características generales de estos agentes incluyen autonomía, sociabilidad, responsabilidad y proactividad. Sin embargo ellos deben ser capaces de actuar racional y autónomamente en entornos multi-agente de tiempo comprimido y en entornos abiertos.
Tienden a ser estáticos, pueden ser benevolentes, racionales, verdaderos, algunas combinaciones de ellos o ninguna.

Los sistemas de Agentes Colaborativos pueden:
- Resolver problemas que para un solo agente resultarían muy complejos
- Permitir la interconexión e interoperación de múltiples sistemas
- Proporcionar soluciones a partir de las fuentes de información distribuidas, por ejemplo en fuentes de información distribuidas on-line.
- Proporcionar soluciones donde la experiencia es distribuida por ejemplo en provisión de cuidados sanitarios.


Agentes de Interfaz

Los agentes de interfaz enfatizan en la autonomía y el aprendizaje para desempeñar tareas para sus propietarios.

Esencialmente los agentes de Interfaz soportan y proporcionan asistencia, para que el usuario aprenda a utilizar una aplicación. El agente usuario observa y supervisa las acciones efectuadas por el usuario en la interfaz, aprende nuevos atajos y sugiere mejores formas para realizar las tareas. Así el agente de usuario actúa como un asistente personal autónomo que coopera con el usuario en el cumplimiento de algunas tareas en la aplicación. Los agentes de interfaz aprender a asistir a su usuario de formas diferentes:

- Observando e imitando al usuario
- Por realimentación desde el usuario (aprendiendo del usuario)
- Recibiendo instrucciones explícitas por parte del usuario
- Solicitando consejo a agentes

La cooperación con otros agentes está limitada a solicitar consejo y no en prologar negociaciones o tratos con ellos, como en el caso de los agentes colaborativos

Beneficios:
- reducen el trabajo para el usuario final y para el desarrollador de la aplicación.
- pueden adaptarse sobre la marcha a las preferencias y hábitos de sus usuarios.
- pueden ser usados en el desarrollo de aplicaciones reales porque son simples, operan en dominios limitados y no requieren en general, cooperación con otros agentes.


Agentes Móviles

Los Agentes Móviles son procesos software capaces de recorrer o vagar por redes de WAN tales como WWW, interactuando con host extraños, recogiendo información en nombre de su propietario y realizando las obligaciones impuestas por sus usuarios.

Los agentes móviles son implementaciones de programas remotos es decir programas que se desarrollan en una máquina y se distribuyen en una segunda máquina para su subsecuente ejecución. Además son agentes porque son autónomos y cooperan, a diferencia de los agentes colaborativos, por ejemplo ellos pueden cooperar y comunicarse con otros agentes ubicando algunos de los objetos y métodos internos de otros agentes, de esta manera pueden intercambiar datos e información sin necesidad de dar toda la información.

Características:
- Reducción en el costo de la comunicación
- Coordinación sencilla: Puede ser sencillo coordinar un número de requisitos remotos e independientes y comparar todos los resultados localmente.
- Cálculo asíncrono: los agentes pueden operar cuando no este el usuario conectado a la red.
- Proporcionan entornos de desarrollo natural para implementar servicios de libre comercio.
- Una arquitectura de cómputo distribuida flexible.

Tipos:

- Monosalto: Se mueven a un único y específico lugar
- Multisalto: Transitan por la red de uno a otro lugar


Agentes estáticos

Los agentes estáticos son programas que tienen una función o funciones en específico que cumplir. Están instalados en un sistema o una red y no pueden realizar tareas fuera de las que el han sido asignadas. Sin embargo, pueden interactuar con otros agentes estáticos o bien con agentes móviles, de manera que puedan realizar en conjunto un objetivo específico.


Agentes de Información / Internet

Los agentes de información surgen de la necesidad de manejar el crecimiento de información que se encuentra en la Internet y poder sacar de ella los mayores beneficios. Los agentes de información se encargan de manejar, manipular y coleccionar información de muchas fuentes distribuidas.

Los agentes de información tienen varias características: pueden ser estáticos o móviles, no cooperativos o sociales y pueden o no aprender, de allí que no haya un modelo estándar que defina su modo de operación.

Los agentes Internet pueden ser móviles, pueden ser capaces de atravesar el WWW y recolectar información. El usuario del agente de información que requiere una información con ciertas características solicita varias búsquedas a una o varias máquinas de búsqueda de URLs para encontrar la petición. La información se localiza y se envía al usuario.

Los agentes de información son similares a los agentes de interfaz o a los agentes móviles. Si son estáticos, entonces se les aplica los cambios de los agentes de interfaz. Sin embargo, si son móviles se les aplican los cambios de los agentes móviles.

Agentes Híbridos

Una forma de maximizar las fortalezas y minimizar las deficiencias de los anteriores tipos de agentes es adoptar una aproximación híbrida. Los agentes híbridos se refieren a aquellos cuya constitución es una combinación de dos o más filosofías de agentes para formar un agente único.

2.1.3 SISTEMAS MULTIAGENTES

"Un sistema multiagente es aquel que contiene una colección de dos o mas agentes"

U n sistema multiagente requiere:

· Dos o mas agentes
· Al menos un agente autónomo: Dado que los agentes trabajan para cumplir objetivos pero son incapaces de generar sus propios objetivos, un sistema multiagente no tendría razón de ser sin un agente autónomo que genere estos objetivos
· Al menos una relación entre dos agentes donde uno satisface el objetivo del otro: que exista una interacción entre los agentes del sistema, ya que de lo contrario tendríamos un conjunto de agentes actuando independientemente de los demás, que los convertiría en una mera colección de componentes y no en un sistema.

2.1.4 APLICACIONES

En estos momentos el desarrollo se está llevando a cabo en distintos tipos de agentes. A continuación enumeramos algunas de las áreas identificadas como las más prometedoras para la aplicación de esta tecnología.

· Gestión de Redes y Sistemas. La gestión de sistemas y redes es una de las primeras áreas que están recibiendo el impacto de la tecnología de los agentes inteligentes. El creciente uso de la arquitectura cliente/servidor ha intensificado la complejidad de los sistemas utilizados. Los usuarios que hacen uso de estos sistemas (principalmente operadores y administradores de sistemas) necesitan una gestión más simplificada para afrontar la creciente complejidad. La tecnología de los agentes puede ser usada para mejorar el software de gestión de sistemas. Por ejemplo, pueden ayudar a filtrar y a realizar acciones automáticas a un alto nivel de abstracción. Además pueden ser usados para gestionar grandes configuraciones dinámicamente.

· Movilidad.
De la misma manera que la informática ha evolucionado de la máquina centralizada hacia las redes, los usuarios lo han hecho hacia una mayor movilidad. Ahora no sólo se precisa un acceso a los recursos de la red desde cualquier ubicación, sino que además este acceso debe ser satisfactorio a pesar de las limitaciones del ancho de banda que presenta la tecnología móvil tales como la comunicación sin cables. Los agentes inteligentes que en este caso residen en la red y no en los ordenadores de los usuarios pueden gestionar estas necesidades. Además los agentes pueden procesar datos y mandar únicamente respuestas comprimidas a los usuarios, más que sobrecargar la red con grandes cantidades de datos sin procesar.

· Correo y Mensajería.
El software de mensajería (como por ejemplo, las aplicaciones de correo electrónico) ha ido evolucionando para mejorar el servicio de los usuarios y es un área donde la introducción de la tecnología de los agentes inteligentes parece muy propicia ya que el futuro de estas aplicaciones pasa por la delegación de la toma de decisiones del usuario en el agente de correo. Los usuarios precisan de utilidades que automáticamente organicen el correo electrónico, y en el futuro, incluso debería gestionar todo el correo de una persona como si fuera ella misma. Los agentes inteligentes pueden hacer posible todo esto mediante reglas de gestión del correo, y permitiendo a los agentes inteligentes operar en nombre de los usuarios de acuerdo a dichas reglas. En el futuro será posible que los agentes deduzcan estas reglas observando el comportamiento del usuario e intentando encontrar los patrones del usuario.

· Gestión y Acceso a la Información. El acceso y gestión de la información es un área con gran actividad, dado el gran crecimiento que se esta produciendo en Internet y la consiguiente explosión de datos disponibles para los usuarios. Aquí los agentes inteligentes no solo ayudan en las tareas de búsqueda y filtrado, sino que también lo hacen en la clasificación, establecimiento de prioridad, descarte selectivo, anotación y compartición y colaboración de información y documentos.

· Workflow y Gestión Administrativa.
Estos sistemas ayudan a automatizar los procesos de negocio, asegurando que diferentes tareas son ejecutadas por las personas idóneas en el momento adecuado, además de asegurar que el flujo de documentos se gestiona correctamente dentro de la organización.

El sistema ADEPT es un ejemplo de sistema gestor de procesos de negocio basado en agentes. En este sistema cada departamento y cada persona perteneciente a un departamento se convierten en agentes. Para conseguir sus objetivos individuales necesitan interaccionar entre ellos.

· Comercio Electrónico. El comercio electrónico es un área de gran crecimiento debido a la creciente popularidad de Internet.

Los compradores necesitan encontrar vendedores de productos y servicios, necesitan información de los productos que solucionen sus problemas, y también precisarán de consejo experto tanto antes de la compra como después, durante el soporte.

Los vendedores necesitan encontrar compradores y tendrán que proporcionar consejo experto sobre sus productos o servicios al igual que soporte y servicio al cliente. Ambos, compradores y vendedores, necesitan automatizar el manejo de sus transacciones comerciales. Los agentes inteligentes pueden ayudar en el comercio electrónico de varias maneras. Pueden ir de compras para un usuario, coger las especificaciones de lo que se desea y devolverlas con recomendaciones de posibles compras, etc.. Pueden también servir de vendedores proporcionando productos o servicios, y ayudar con los posibles problemas que tengan los clientes.

· Interfaces de Usuario Adaptativos. Al tiempo que avanzan las capacidades y aplicaciones de los ordenadores, el interfaz de usuario necesita incorporar tal aumento de complejidad. Y además, los usuarios de ordenadores son un grupo cada vez más numeroso y disperso, de forma que los interfaces del ordenador deben aprender los hábitos y preferencias del usuario y adaptarse a las individualidades de cada persona. Los agentes inteligentes (llamados agentes de interfaz) pueden ayudar con estos problemas, ya que permite al sistema monitorizar las acciones de los usuarios, desarrollar modelos sobre ellos, y automatizar la ayuda cuando surgen los problemas. Cuando son combinados con la tecnología de procesamiento del lenguaje, los agentes inteligentes hacen que los interfaces de ordenador sean más humanos o sociables cuando se tiene interacción con ellos.

· Agentes para Gestión de Sistemas Industriales. Probablemente el mayor sistema multiagente, y también el mas conocido en Europa, en este campo sea ARCHON. Desarrollado por un consorcio de empresas y centros de investigación europeos y que se encuentra en funcionamiento para controlar la red de distribución de energía del País Vasco.

ARCHON tiene dos partes principales: Un domain component que realiza la función especifica del dominio del agente; y un wrapper component que proporciona al agente funcionalidad, permitiendo al sistema que planifique sus acciones y que sea capaz de comunicarse con otros agentes.

La tecnología empleada en ARCHON ha sido aplicada dentro de muchos otros campos como, por ejemplo, el control de la aceleración de partículas.

· Simulación Social

Una de las visiones detrás de los sistemas multiagente es la de utilizarlos como herramientas experimentales en las ciencias sociales. Es decir, se pueden utilizar agentes para simular el comportamiento de las sociedades humanas.

El proyecto EOS, llevado a cabo por la Universidad de Essex en el Reino Unido, es un buen ejemplo de simulador de la sociedad. El objetivo del proyecto era investigar las causas de la aparición de una compleja sociedad en Francia durante el Paleolítico Superior.

2.2 AGENTES INTELIGENTES DE BÚSQUEDA

Los agentes inteligentes de búsqueda son agentes software dedicados a la recuperación de información, están diseñados específicamente para las tareas de localización, acceso y procesamiento de información textual. Constituyen la tipología de agentes más conocida y útil en Internet, al menos en lo que respecta al usuario común.

No es necesario que un agente inteligente de búsqueda posea todas las propiedades que se han citado anteriormente en el apartado Características de los agentes inteligentes software, pero sí las que se describen a continuación:

- Autonomía: actuar sin ningún tipo de intervención humana directa y tener control sobre sus propios actos.
- Sociabilidad: comunicarse por medio de un lenguaje común con otros agentes, incluso con los humanos.
- Capacidad de reacción: percibir su entorno y reaccionar para adaptarse a él.
- Iniciativa: Emprender las acciones para resolver un problema.


2.2.1 CLASIFICACIÓN (según HIPOLA, P. y VARGAS-QUESADA, B.)

- Agentes de consulta: Un sistema de agentes orientados a consulta origina uno o más agentes en respuesta a la pregunta formulada por el usuario. Estos agentes trabajan en representación del individuo mientras dura la consulta, recogiendo información de todas las bases de datos disponibles.

Cuando una persona realiza una pregunta, esta se descompondrá en subconsultas para su resolución. Si los agentes existentes son incapaces de dar respuesta en toda su amplitud, se generan nuevos agentes que buscarán en otras bases de datos. Si aun así la respuesta no es suficientemente amplia se crean nuevos agentes hasta poder ofrecer la respuesta adecuada. Un ejemplo de agente de consulta sería Mata Hari.

- Agentes de bases de datos: En el caso anterior las bases de datos funcionan como depósitos pasivos de información. Sin embargo, en este sistema pasan a ser agentes interactivos que interactúan entre sí. Cada base de datos dispone de un agente que sabe como presentar de forma adecuada las subconsultas a su base de datos, conociendo a su vez el tipo de información que se almacena en ella. Un ejemplo de agente de bases de datos sería Clientelle, gestor de billetes de avión con cobertura mundial.

- Agente de consulta a bases de datos: Las bases de datos y las consultas pueden ambas tener sus propios agentes con el fin de proporcionar las repuestas más adecuadas al usuario. Forman una estructura jerárquica en donde los agentes de consulta poseen información de las materias almacenadas en cada base de datos. Un ejemplo de agente de consulta a bases de datos sería Seidam, un agente de consulta para sistemas que dan soporte a SQL.

- Agentes mediadores de consulta de bases de datos: Esta basado en el modelo descrito anteriormente pero, incluye la novedad de contar con un agente mediador entre el agente de consulta y el de la base de datos. Un ejemplo de este tipo de agente es Macron.

- Agentes de usuario: Los agentes orientados a usuario están asociados a una persona en concreto. A diferencia de los agentes de consulta siempre están activos , buscando información y suministrándosela a su creador. Un ejemplo de agente de usuario sería BullsEye.

- Agentes de recuperación de información en Internet, también conocidos en el ámbito anglosajón como searchbots, tienen la capacidad de hacer transparente la complejidad de la información almacenada en la Red, filtrando la información disponible sobre la materia requerida. Las consultas pueden ser textuales (productos en concreto, información sobre viajes, etc...) o por las distintas partes ( título, cuerpo,...) en que el world wide web se representa hoy día.


2.2.2 FUNCIONES TÉCNICAS

- Consulta autónoma a fuentes de información: El usuario establece qué fuentes de información van a ser consultadas para solucionar la cuestión planteada.

- Consulta simultánea: No se lanzan las conexiones secuencialmente sino que lo hacen de forma simultánea e informan del estado de la consulta y de las respuestas definidas consiguiendo optimizar la conexión y el tiempo.

- Filtrado de respuestas: Se eliminan referencias duplicadas o inexistentes.

- Criterios de ordenación y ponderación de respuestas: Incorporan algoritmos que analizan el contenido del documento y lo dotan con una escala de valoración de sus contenidos.

- Obtención del documento original: Permite el almacenamiento y navegación en el ordenador del usuario sin necesidad de estar conectado a Internet.

- Creación de recursos de información locales: Ofrece la posibilidad de crear recursos de información en su propio ordenador, adoptando la forma de bases de datos textuales, directorios, etc...

- Definición de perfiles de usuario: Se crea un archivo permanente donde se pueden almacenar las necesidades de información del usuario.

- Temporalización de actividades: Ofrece la posibilidad de establecer la ejecución de perfiles de usuarios a intervalos temporales.

- Tareas de vigilancia y mantenimiento: Supone la revisión de resultados de búsquedas ya realizadas.


2.2.3 EJEMPLOS DE AGENTES DE BÚSQUEDA EN INTERNET


QUERYN METASEARCH 2.2:

Es un producto de FreeFlow Software (http://www.queryn.com). Es un searchbot muy simple, ofrece al usuario una lista predefinida de motores de búsqueda a consultar (Altavista, AOL NetFind, Excite, Hotbot, InfoSeek, Lycos, Magellan, WebCrawler y Yahoo!), así como una ventana para formular la expresión de búsqueda. Lanza un conjunto de conexiones simultáneas a los diferentes motores, espera las respuestas, elimina los duplicados, permite la utilización de operadores, y procede a desarrollar un proceso de verificación de la existencia de los documentos obtenidos como respuesta. No se obtiene copia de los documentos originales, sólo una lista de resultados.


HURRICANE WEBSEARCH 1.30:

Es un desarrollo de Gate Comm Software y puede consultarse en http://www.gatecomm.com . Es un searchbot muy básico, solo ejecuta la búsqueda contra varios motores y no incluye prestaciones más avanzadas, como es la utilización directa de operadores o eliminación de duplicados. Obtiene resultados directamente.

WEBFERRET 5.0:

Es un producto de FerretSoft LLC.( http://www.ferretsoft.com) Es un searchbot del mismo estilo que QueryN MetaSearch. Tiene dos versiones: La freeware incorpora menos funcionalidad pero es más rápida y la versión Pro que incorpora más motores de búsqueda, operadores, criterios de relevancia y búsqueda avanzada.

Características:

o Requiere Windows 98, Me, NT, 2000, o XP
o Presenta un interfaz compacto, permitiendo que los usuarios visionen más resultados
o Sugiere palabras claves basadas en la pregunta original realizada por el usuario.
o Ofrece resúmenes de los resultados obtenidos
o Valida y gradua los resultados, lo cual permite que los usuarios verifiquen la página y se pregunten si desean visitarla.


BULLSEYE 2.5.013:

Es un producto de Intelliseek Inc (http://www.intelliseek.com) . Permite descargar el programa básico, complementos léxicos o tratamiento del lenguaje.

Características:

o Usa más de 800 motores de búsqueda y bases de datos
o Ofrece predefinidas categorías de información sobre las que buscar.
o Tiene la opción de búsqueda avanzada
o Resultados: puedes elegir entre que te recupere los documentos de cada motor y ofrezca una lista de los mismos (opción No Analysis), que ademas compruebe la existencia de los documentos o páginas web y elimine aquellos que no responden a su localización (Remove Dead Links), y permite obtener una copia de todos los documentos originales recuperados y procede a su análisis de contenido (Download and Analyze Results).


WEBSEEKER 5.0


Searchbot desarrollado por Blue Squirrel. Es posible obtener una copia en http://www.bluesquirrel.com .

o Tipos de búsqueda:
§ InstantFind: es la más rápida y sólo elimina los duplicados
§ CleanFind: elimina duplicados y enlaces no verificados
§ FilterFind: es la más lenta, además de todo lo anterior indiza los resultados para refinar la búsqueda.


COPERNIC 6.1

Es uno de los searchbots más utilizados, se obtiene de forma gratuita y las prestaciones que ofrece en esta versión son bastante superiores a los de otros freeware. Es un producto de Copernic Technologies Inc, y está disponible en http://www.copernic.com.

Este agente libre del software encuentra exactamente lo que el usuario busca, de forma simultánea, consultando los mejores motores de búsqueda de Internet. Con el agente de Copernic, las búsquedas son más fáciles, más rápidas y eficientes que nunca. Proporciona el acceso a unas 90 fuentes de información (agrupadas en 10 categorías) tales como AltaVista, Deja.com, Excite, HotBot, INFOSEEK, Lycos, Magellan, WebCrawler y Yahoo!.

Copernic Agent presenta tres modalidades Copernic Agent Basic, Personal y Professional. En su página web encontramos la posibilidad de descargar gratuitamente la primera versión “Copernic Agent Basic”. Los demás programas no son gratuitos, aunque en la página web nos ofrece toda la información necesario para su adquisición.

Cada modelo nos ofrece diferentes características:

 

CARACTERÍSTICAS COPERNIC AGENT BASIC COPERNIC AGENT PERSONAL COPERNIC AGENT PROFESSIONAL
Envía informes al usuario informándole sobre la últimas novedades relacionadas con sus necesidades de información.    

X

Informa al usuario sobre los cambios de contenido que se han producido en las sus Webs favoritas.    

X

Ofrece resúmenes de las páginas encontradas y sus palabras claves.    

X

Gestiona la búsqueda y los resultados. Agrupa, filtra y almacena los resultados. Automáticamente elimina los enlaces rotos.  

X

X

Posee 1000 fuentes de información agrupadas en 90 categorias.  

X

X

Permite personalizar la búsqueda.  

X

X

Busca en la Web información relevante, ofreciendo los resultados más relevantes. Busca directamente en Internet Explorer.

X

X

X

 

En concreto Copernic Agent Basic:
o Ofrece predefinidas categorías de información sobre las que buscar.
o Ofrece tres opciones de búsqueda simple con el uso de operadores, puesto que la avanzada solo es posible con Copernic Agent Professional:
o Search for all words: establece que todos los términos introducidos deben aparecer en el documento. Equivale al operador AND
o Search for any Keyword: equivale al operador booleano OR
o Search for exact phrase: indica que la expresión usada es una frase completa y debe considerarse como tal.
o Resultados:
o Eliminación de duplicados
o Opción Download: permite obtener una copia de los documentos originales creando una base de datos en el ordenador del usuario.
o Guarda un historial de búsquedas
o Tareas comunes:
o Sólo permite analizar los resultados, en cuanto a vínculos duplicados
o Permite la navegación entre resultados
o Permite usar filtros en cuanto a región, estado y dominio de los resultados
o Permite refinar las búsquedas (buscando en los resultados)
o Permite agregar o personalizar categorías. En este enlace el usuario podrá elegir también los motores de búsuqeda donde quiere realizar las búsquedas
o No permite verificar y eliminar vínculos rotos en esta versión.

El problema principal de esta versión son sus escasas prestaciones respecto a las otras dos versiones. Dado que solo oferta los elementos básicos para poder realizar búsquedas.

 

MATAHARI V.2.01

Cubre todo tipo de categorías, incluyendo motores de búsqueda de temática altamente especializados. Además permite desarrollar expresiones y ecuaciones muy complejas, lo que lo convierte en una herramienta de gran calidad. La única limitación que puede encontrarsele es su tiempo de uso, limitado a 30 dias si no se adquiere una licencia comercial.

Características:

o Permite usar operadores.

o Es muy potente para analizar los resultados obtenidos tras un proceso de búsqueda.

o Opciones:
o Rank: permite reordenar la presentación de los resultados obtenidos, de acuerdo con el interés del usuario, usando como criterrio el contenido de una página web recuperada
o MEBIR: es una combinación de búsqueda booleana, el modelo vectorial y el cálculo de la frecuencia de términos. Esta opción combina el tratamiento básico realizado por MataHari con el número de veces que aparecen los terminos en el documento.
o EBIR: es la combinación simple entre la búsqueda booleana y el modelo de espacio vectorial.
o Boolean: muestra la pertinencia según el algebra de Boole. EBIR y Boolean sólo son útiles cuando en la búsqueda se combinan dos expresiones
o VSM (Vectorial Space Model): utiliza un algoritmo matemático especial para determinar la similaridad estadística entre los documentos recuperados entre sí y respecto a la expresión de búsqueda.

BOOKWHERE v 4.2.0

No consulta motores de búsqueda en Internet, sinó que consulta bases de datos de catálogos de bibliotecas. Es utilizado actualmente por millares de bibliotecarios y de investigadores.

BookWhere permite que los usuarios busquen simultáneamente en centenares de bases de datos dispares de información vía protocolo Z39.50. Es capaz de realizar consultas simultáneas a numerosos catálogos, filtrando y presentando los registros bibliográficos al usuario.

Características:

o AutoSync – Construye una lista automatizada de bases de datos consultables

o MARC Notepad – Opción para corregir expedientes MARC

BLACKWINDOW 4.07

No se trata de un agente como los vistos hasta ahora, no es capaz de localizar y obtener documentos originales. Esta herramienta toma como punto de partida un URL cualquiera, analiza la estructura de directorios, contenidos y enlaces existentes y obtienen un mapa o una representación gráfica de la misma. De esta forma, se podrá desarrollar a posteriori una navegación offline.

3. RELACION WEB SEMÁNTICA- AGENTES


Según Lozano Tello, A., la Web Semántica se basa en la estandarización de todos sus datos, todo en la web (páginas, servicios, etc.) debe presentarse en el mismo formato, el cual puede ser comprendido por una nueva generación de agentes inteligentes que clasificarán la información de una manera más eficiente para devolver resultados más precisos ante una búsqueda o un pedido de información.

La idea es que los datos puedan ser utilizados y “comprendidos” por los ordenadores sin necesidad de supervisión humana, de forma que los agentes web puedan ser diseñados para tratar la información situada en las páginas web de manera semiautomática. Se trata de convertir la información en conocimiento, referenciando datos dentro de las páginas web a metadatos con un esquema común consensuado sobre algún dominio. Los metadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia, sino que además podrán tener información adicional de cómo hacer deducciones con ellos, es decir, axiomas que podrán aplicarse en los diferentes dominios que trate el conocimiento almacenado. Con ello, se mejorará la búsqueda de información y se potenciará el desarrollo de aplicaciones, como el comercio electrónico, ya que las anotaciones de información seguirán un esquema común, y los buscadores web compartirán con las anotaciones web los mismos esquemas. Empresas que traten con clientes y proveedores, podrán intercambiar sus datos de productos siguiendo estos esquemas comunes consensuados.

Los agentes web no sólo encontrarán la información de forma precisa, si no que podrán realizar inferencias automáticamente buscando información relacionada con la que se encuentra situada en las páginas, y con los requerimientos de la consulta indicada por el usuario.

Por tanto, la web semántica facilita que sean los agentes inteligentes quienes busquen, comparen y manejen la información de Internet para nosotros.

El papel del agente inteligente en el proceso de recuperación “semántica” de información no debe confundirse con la de un buscador inteligente. Un buscador inteligente se aprovechará del enriquecimiento semántico de los recursos web para mejorar (principalmente en la precisión) la recuperación de información, aunque su funcionamiento se basará, como los actuales buscadores, en la previa indización de todos aquellos recursos susceptibles de ser recuperados.

En cambio, un agente inteligente recorrerá la Web a través de los enlaces entre recursos (hiperdocumentos, ontologías,...) en busca de aquella información que le sea solicitada, pudiendo además interactuar con el entorno para el cumplimiento de tareas encomendadas. Por ejemplo, un agente inteligente, ante una consulta dada, podría consultar autónomamente un buscador, y a partir de sus resultados, explorar la Web hasta encontrar la información solicitada, pudiendo finalmente llevar a cabo una acción sobre dicho recurso, como podría ser la reserva de una habitación en un hotel.


3.1 EJEMPLOS

3.1.1 SHOE

Combina las características de los lenguajes de marcado, de la representación del conocimiento, de datalog y de las ontologías en un intento de abordar de forma única los problemas de la semántica en la Web. El lenguaje soporta adquisición del conocimiento aumentando la web con etiquetas que suministran semántica. La estructura básica de SHOE son las ontologías, que definen las reglas que nos dicen que tipo de aserciones pueden hacerse y que clase de conclusiones pueden derivarse de esas aserciones, y las instancias, que realizan las aserciones basándose en esas reglas.

SHOE permite a los creadores de páginas web dotar a sus documentos web de conocimiento comprensible para la máquina. En definitiva, SHOE hace que sea posible la existencia en la web de los agentes software inteligentes.

La actual web está compuesta en su mayoría por documentos HTML, cuya función es presentar datos en pantalla que sean leíbles para los humanos. El conocimiento en este tipo de páginas web está en un lenguaje comprensible para los humanos, normalmente inglés. De manera que para los computadores de hoy en día es difícil leer y entender los documentos web. Esto hace muy difícil crear un agente inteligente que pueda navegar por la web por él mismo, leyendo y comprendiendo las páginas web por las que pasa.

SHOE elimina este problema haciendo posible que las páginas web incluyan conocimiento que los agentes inteligentes puedan realmente comprender.

SHOE utiliza XML como etiquetas y avanzada tecnología artificial para conseguir que los motores de búsqueda basados en palabras clave sea una cosa del pasado.
Estas etiquetas más que proporcionar palabras clave y descripciones, los que hacen es describir el contenido y relaciones del documento. Actualmente, muchas páginas web están siendo creadas usando etiquetas orientadas al contenido. Sin embargo, XML solo no puede solucionar el problema de búsqueda, porque las máquinas no entienden el significado asociado con las etiquetas XML. SHOE quizá resuelve este problema asociando un contexto a la página web; este contexto puede ser usado para que no exista ambigüedad con los términos y además proporciona un conocimiento que ayuda interpretar el contenido. Este contexto del que hablamos no es más que una ontologia, es decir, un vocabulario y su significado.

A continuación podemos ver el funcionamiento de un sistema SHOE. Cómo se añaden las marcas SHOE a las páginas web, como encuentra y almacena información y como esta información puede consultarse mediante SHOE Search. (herramienta de búsqueda que permite al usuario consultar información SHOE sin necesidad de entender como esa información está estructurada. El funcionamiento es el siguiente:

En primer lugar, se añaden etiquetas SHOE a las páginas web. Este proceso se conoce como anotación, y aunque puede realizarse usando simplemente un editor de texto, se ha creado para facilitar esta tarea Knowledge Annotator, una herramienta que facilita el marcado de páginas web con etiquetas SHOE .

En segundo lugar, Exposé se encarga de buscar páginas web con marcas SHOE y integra el conocimiento y lo almacena en una base de datos Parka KB.

Finalmente el usuario puede consultar las páginas web almacenadas. Para ello puede utilizar una serie de herramientas que a continuación enumeramos:
- PIQ ( Parka Interface for Querys)
- TSE Path Analyzer: herramienta que permite al usuario realizar búsquedas mediante la selección de una serie de valores de una lista jerárquica para especificar la consulta. Los resultados son presentados en forma de grafo, de manera que “clickando” en alguno de los nodos del grafo puedes abrir las páginas web que proporcionan información relacionada con ese nodo.
- SHOE Search: herramienta de búsqueda que permite al usuario consultar información SHOE sin necesidad de entender como esa información está estructurada.

En la página www.cs.umd.edu/projects/plus/SHOE/downloads/www.cs.umd.edu/projects/plus/SHOE/downloads/ es posible descargar las herramientas mencionadas. Estas aplicaciones son de código abierto y están cubiertas por la GNU General Public License , en otras palabras se trata de software libre.

En general existen dos ficheros a descargar:
- Source Code downloads contiene archivos JAVA, documentación de uso, y algunos datos o ficheros de imagen necesarios para que la aplicación funcione.
- Application downloads contiene ficheros de Java compilados, documentación de uso y algunos datos o ficheros de imagen necesarios.

El grupo ha intentado descargar y probar este software, para detectar así sus ventajas e inconvenientes. Hemos encontrado inconvenientes en la descarga e instalación que no nos han permitido evaluar su funcionamiento con mayor profundidad. Los dos inconvenientes que nosotras hemos encontrado y que puede encontrarse cualquier usuario son:

- En primer lugar, es necesario que tu sistema tenga instalada la máquina virtual Java para su funcionamiento.
- En segundo lugar, estas aplicaciones requieren para su funcionamiento un componente software con licencia que no hemos podido conseguir, se trata de Parka DB.

3.1.2 ONTOBROKER:

Ontobroker es un servicio de consulta basado en ontologías. Proporciona una serie de lenguajes y herramientas que pretenden mejorar las consultas, accesos y servicios de inferencia en la WWW y solucionar el problema de cuello de botella en el acceso a la información, existente en Internet debido a la creciente cantidad de información y a la libertad en la representación de la información. Ontobroker se basa en una arquitectura con tres elementos centrales: una interfaz de consulta, un motor de inferencia que proporciona respuestas y un “webcrawler” usado para colectar el conocimiento requerido de la web. Cada uno de estos elementos va acompañado de un lenguaje de formalización: el lenguaje de consulta para formular consultas, el lenguaje de representación para formular ontologías, y el lenguaje de anotación para dotar a los documentos web de información ontológica.


Ontobroker y el sistema SHOE son dos sistemas anotadores de páginas web en base a una ontología. Ambos proponen recoger la meta-información de las páginas y almacenarla en algún tipo de base de conocimiento.

3.1.3 LEXIGUIDE

Lexiguide es pionero en una nueva clase de software que realza la interacción entre el hombre y la maquina, más específicamente las preguntas que lanzan a los sistemas para la búsqueda de información. Mediante unos lenguajes, lexiguide enseña al sistema de los ordenadores a entender el lenguaje de los humanos.

Esto ofrece una serie de beneficios:
- Permite a los usuarios hacer consultas en su propio lenguaje para la búsqueda de información.
- Realza la búsqueda de consultas de la maquina, acrecentando la posibilidad de producir resultados productivos.

Lexiguide usa técnicas tales como contextuales y gramáticas, desambiguación y semántica para guiar al usuario en la búsqueda de solo aquellos documentos que son relevantes. Permite al usuario realizar la búsqueda en lenguaje natural
Una capacidad de Lexiguide es la construcción de complejas búsquedas booleanas basadas en las necesidades de los usuarios.
En la página web de LexiQuest Guide no hemos encontrado ningún mecanismo que permita la descarga de una demo.

Permite probar las búsquedas mediante una ventana. Sin embargo, no nos ha dado ningún resultado cuando lo hemos intentado: página no encontrada.

LexiGuide es un mecanismo de búsqueda en lenguaje natural que traduce consultas en ‘lenguaje plano’ a una forma fácilmente comprensible por los buscadores tradicionales. Esta potente capacidad puede ser refinada por módulos de adición, incluyendo diccionarios de terminología especifica. LexiGuide esta disponible en inglés, francés y español.

LEXIQUEST ha desarrollado una serie de productos que trabajan con motores de busqueda para aumentar sus resultados. LexiGuide Expert usa tecnicas como el parsing contextual y gramatical, desambiguacion y redes semanticas para guiar al usuario unicamente hacia aquellos documentos que son relevantes. LexiGuide Surfer permite al usuario hacer consultas en lenguaje natural; y LexiGuide Web esta diseñado para intranets corporativas y trabaja con los mecanismos de busqueda existes para mejorar sus resultados. Una capacidad de la tecnologia de LexiQuest es la construccion de búsquedas booleanas complejas basadas en la consulta del usuario

Los productos de LexiQuest se usan con los motores de busqueda existentes y no requieren ninguna reestructuración de la información existente.

Las búsquedas online pueden ser extremadamente frustrantes, produciendo resultados irrelevantes. Lexiguide trabaja para hacer posible que los ordenadores puedan entender el lenguaje humano analizando la gramática y conceptos generales a partir de palabras específicas.


3.1.4 CYC KNOWLEDGE SERVER

Cyc Knowledge Server es una base de conocimiento multicontextual con una ingenieria desarrollado por Cycorp.

La meta de Cycorp's es construir un conocimiento basado en el sentido común, una semántica de términos, reglas, y relaciones.

Cyc está intentando provenir un estándar para que pueda ser usado por otros programas y que sea más flexible.

The Cyc Knowledge Base (KB) es una representación del conocimiento humano: hechos, reglas y razonamiento heurístico sobre objetos y eventos que ocurren en la vida cotidiana. El medio de representación es el lenguaje formal CycL

La KB está formada por términos que constituyen el lenguaje CycL y afirmaciones que relacionan estos términos. Estas afirmaciones nos aportan más información sobre dichos términos.

Ejemplo:
· Fred vio el avión volando sobre Zurich.
· Fred vio las montañas volando sobre Zurich.
Estas afirmaciones ya resultan algo difíciles de comprender para el razonamiento humano. Los sistemas tradicionales que procesan lenguaje natural no son capaces de distinguir, en la segunda afirmación, si el que vuela es Fred o las montañas. Cyc, sin embargo, está capacitado para entender esta afirmación ya que en su base de conocimiento almacena información de sentido común como ‘las montañas no vuelan’.
The CYC-NL system (Cyc Lenguaje Natural) tiene tres componentes: léxico, sintáctico y semántico. Estos son los que describen en detalle las páginas. Están desarrollando interfaces que permitan a la gente hacer afirmaciones y consultas usando ingles en vez de Cyc.

OpenCyc es la versión gratuita de esta aplicación. Para su instalación requiere Microsoft NT, Win2k o XP y 250 MB de memoria. No funciona con Windows 98 o versiones anteriores. Uno de sus componentes necesita Java 2.

En esta página web podemos encontrar más documentación (http://www.opencyc.org).
Una vez descargada la aplicación se tiene que descomprimir.

Cuando conseguimos poner la aplicación en marcha tenemos que indicarle unos comandos (que no acepta) y luego acceder al servidor (según el manual de instrucciones) para acceder a ella.

Hemos seguido todos los pasos repetidas veces pero no nos abre la página proporcionada para acceder.

En cuanto a las características de la base de conocimiento de OpenCyc podemos decir que consiste en una serie de códigos, escritos en el lenguaje CycL, que representa hechos y reglas pertenecientes a una realidad consensuada (consensus reality).
El servidor de conocimiento de OpenCyc consiste en una versión binaria del Cyc® Inference Engine y del Knowledge Base Index.

Sin embargo, en la licencia proporcionada para las versiones gratuitas se explicita que estas no tienen ninguna garantía.

 


4. CONCLUSIONES

La sociedad en la que vivimos es una sociedad dominada por la información, que se ha convertido en la materia prima más valiosa.

Internet está posibilitando cambios destacados en nuestros modos de vida. Sin embargo, no todo es positivo: la búsqueda de información en la web todavía es muy caótica y dista mucho de ser una verdadera infraestructura de información para los usuarios. La búsqueda mediante buscadores conlleva mucho tiempo y esfuerzo si se desean agotar todas las posibilidades.
La aparición de agentes inteligentes ha conllevado un avance significativo en este ámbito ya que permiten realizar la búsqueda simultáneamente en varios motores de búsqueda, comparar los resultados y ofrecer un listado preciso al usuario.
El desarrollo de agentes está ligado a lo que se conoce como web semántica en la que todo lo que circule por la web será entendible no solo por el usuario sino también por la máquina. En este sentido, la clave para el éxito de un agente es el grado en el cual entiende la información que está manipulando.

Por otra parte, se puede decir que estamos ante una primera generación de agentes inteligentes en la cual todavía no existen estándares fijos ni para su funcionamiento ni para su consulta.

Las posibilidades ofrecidas por los agentes generan una serie de problemas que cabe tener en cuenta. En primer lugar, los agentes existentes en la actualidad necesitan de una gran cantidad de recursos para funcionar, tanto a nivel de máquina del usuario como a nivel de red. Esta cuestión se puede resolver con el tiempo según avance la tecnología.

En segundo lugar, las habilidades que puedan tener estos agentes pueden resultar una amenaza para la privacidad e intimidad de los usuarios desde el momento que registran sus gustos, preferencias, maneras de actuar, etc. Esta cuestión es más delicada que la primera puesto que afecta a temas individuales y legales. Se han hecho algunas propuestas para solucionarlo pero son las posibles futuras normas al respecto las que realmente podrán solucionar estas cuestiones.

5. BIBLIOGRAFÍA

URL’s consultadas del 19.04.2004 al 17.05.2004:

http://www.informandote.com/jornadasIngWEB/articulos/jiw02.pdf
http://greta.cs.ioc.ee/~helemai/HaavLubiADBIS2001.pdf
http://www.estadistico.com/arts.html?20011105
http://www.ii.uam.es/~castells/docencia/semanticweb/apuntes/
http://www.rediris.es/rediris/boletin/66-67/ponencia18.pdf
http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_lydia.pdf
http://www.straddle3.net/context/02/020619_semantic.es.html
http://petra.euitio.uniovi.es/~labra/cursos/ext03/SemWeb.pdf
http://www.ii.uam.es/~castells/docencia/semanticweb/
http://antic.ibit.org/websemantica/quees_es.cfm
http://suburbia.sindominio.net/pdf.php3?id_article=107
http://www.baquia.com /com/20010523/art00008.html
http://zope.aditel.org/personal/esanchez/documentos/rtb/files/rtb-doc/x155.html/index.html/index.html/x155.html/index.html/x155.html/index.html
http://www.baquia.com /com/20010523/art00008.html
http://www.dcc.uchile.cl/~cgutierr/websemantica/
http://www.interacciones.i-p.com/doc24.xhtml
http://www.infovis.net/Revista/num_26.htm
http://www.dcc.uchile.cl/~jcvidal/Agentes/AgentesWeb.html
http://www.lexiquest.fr/news/releases/990809_ge.html
http://www.cyc.com/cyc/technology/whatiscyc_dir/whatsincyc
http://www-cia.mty.itesm.mx/~avazquez/knowledge/
http://www.it.uc3m.es/liliana/paginas/masinfo/agentes.doc
http://rayuela.uc3m.es/~bety/lydia/Age/AGENTES.html#Característica%20de%20los%20agentes

Monografías:

BERROCAL, J.L., et al. Agentes inteligentes: recuperación autónoma de información en la web. Revista Española de Documentación Científica, 2003, vol. 26, nº 1

INGLADA, V. J. y BOTTI, V. Agentes inteligentes: el siguiente paso en la Inteligencia Artificial. En: NOVATICA, may-jun, 2000. p. 95-99
HIPOLA, P. y VARGAS-QUESADA, B. Agentes inteligentes: definición y tipologías. Los agentes de información. El profesional de la información, 1999, vol. 8. nº 4, p. 13-21
PEIS, E., et al. Ontologías, taxonomías y agentes: recuperación "semántica" de la información. JOTRI 2003: II Jornadas de Tratamiento y Recuperación de Información, 8 y 9 de septiembre. 2003

Páginas web para la descarga de algunos programas:

WEBFERRET 5.0 http://news.swzone.it/swznews-10855.php
COPERNIC VERSION 6.1 http://www.copernic.com/en/products/agent/basic.html
SHOE http://www.cs.umd.edu/projects/plus/SHOE/search/