![]()
1.1 LA INFORMACIÓN EN LA WEB
A medida que Internet ha ido evolucionando y creciendo se ha complicado la forma de poder localizar y consultar la información disponible en la propia red. El crecimiento de la información en la WEB ha provocado un aumento en el uso de instrumentos como los Tesauros, las clasificaciones y las ontologías. Los profesionales cada vez más, entienden que es urgente la construcción y aplicación de sistemas de organización y representación del conocimiento. La mayoría de las herramientas utilizadas se centran más en la cantidad que en la calidad, es en este punto cuando el empleo de las técnicas inteligentes resulta adecuado para la mejora de los resultados obtenidos.
La Web nos ofrece una enorme cantidad de información tanto estructurada como semiestructurada. Los mecanismos de presentación de la información son simples y existe libertad a la hora de presentar la información, por lo que producen cuello de botella cuando accedemos a la información disponible en la web. Actualmente existen dos técnicas de búsqueda en la web: una navegación por parte de los usuarios a través de las representaciones textuales y gráficas siguiendo los enlaces y los motores de búsqueda basados en palabras clave.
Los motores de búsqueda son sitios, dentro del Web, especializados en servirnos como herramientas para la búsqueda de información y demás recursos que se pueden encontrar en Internet.
Por lo general, un Buscador, ejecuta periódicamente un programa que se va comunicando con los sitios “Web” cuya dirección previamente ha sido inscrita en su base de datos, y trae hacia sí las páginas que encuentra, siguiendo también consecutivamente los enlaces hacia otras páginas. Examinando el contenido de cada página recuperada, el programa construye una gran base de datos de manera de índice con palabras, frases o descriptores y la dirección de las páginas donde aparecen esos elementos.
Los Buscadores se pueden clasificar en dos tipos según manejen o no una clasificación temática cuando registran una nueva información en su base de datos:
- Buscadores que indexan el texto completo
- Buscadores que usan clasificaciones temáticas (llamadas taxonomías u ontologías) El principal ejemplo de este tipo de buscador es YAHOO.
Los actuales buscadores, basados en indización humana (en el caso de los índices de búsqueda), e indización automática (en el caso de los motores de búsqueda), son incapaces de ofrecer tasas de exahustividad y precisión realmente aceptables en sus resultados.
Todos los buscadores presentan una estructura similar constituida principalmente por la base de datos, el programa de indización, el robot de búsqueda y la interfaz.
Los buscadores no contemplan la posibilidad de recuperar sinónimos y es usual que un gran número de las URLs retornadas no sean de interés para el usuario. Un preprocesamiento que enriquezca la consulta semánticamente puede mejorar la precisión de los documentos retornados. El refinador semántico analiza y amplia semántica y multilingualmente cada uno de los conceptos de la búsqueda, por lo que se utilizan tesauros y ontologías predeterminados, disponibles on-line, y según el área del conocimiento de la búsqueda. La ampliación de los conceptos se representa en la estrategia de búsqueda utilizando la disyunción. Esta ampliación permite aumentar el indicador recall, al agregar sinónimos y palabras relacionadas con cada concepto a buscar. Ampliados todos los conceptos involucrados en la consulta del usuario, estos se combinan con el conector de conjunción para completar la estrategia de búsqueda.
Por lo tanto, para dar sentido a la información que contiene la Web será necesario basarse en la capacidad de asociar semánticamente datos independientes entre sí, pero relacionados en un determinado contexto.
En los últimos años se ha comenzado a experimentar el uso de técnicas de representación del conocimiento para extender la Web actual con meta-datos. De esta manera se crearía una nueva web, donde los ordenadores no sólo serían capaces de presentar toda la información contenida en ella, sino, además, podría entenderla y gestionarla de forma “inteligente”; esta Web mejorada es lo que actualmente se conoce como Web Semántica.
El objetivo de la Web semántica consiste en definir los datos contenidos en la red, de forma que puedan ser utilizados y comprendidos por las máquinas sin necesidad de la intervención humana.
Así la Web se convertirá en un espacio autonavegable y autocomprensible, es decir, sería posible la relación entre los términos independientes de una misma búsqueda ofreciendo como resultado sólo aquellas páginas Web que realmente se adapten a los requisitos especificados durante la misma.
De este modo toda la información se convierte en conocimiento, codificando los datos con metadatos. Esta codificación se realiza actualmente con ontologías. Cada una de estas ontologías se crean atendiendo a dos principios: serán reutilizables y se realizarán e forma consensuada.