Mª Isabel Espí Albert

Núria Jiménez Riera

Rosa Sáez Abad

Patricia Marín Montiel

2001/2002

EXCALIBUR

I. INTRODUCCIÓN

II. FAMILIA EXCALIBUR

2.1. EXCALIBUR RETRIEVALWARE

1. Características

2. El Proceso de Reconocimiento Adaptativo de Patrones (APRP)

3. Redes Semánticas

4. Componentes

5. Servidores de texto de RetrievalWare

6. RetrievalWare Server

7. Arquitectura RetrievalWare

8. Plataformas soportadas

9. Módulos disponibles

2.2. EXCALIBUR VISUAL RETRIEVALWARE

2.3. EXCALIBUR SCREENING ROOM

III COMERCIALIZACIÓN DE EXCALIBUR

3.1 PRODUCTOR DE EXCALIBUR

3.1.1 Aspectos generales

3.1.2. Evolución cronológica

3.1.3. Socios

3.1.4. Sedes físicas/virtuales

3.1. 5. Clientes de Convera

3.1.6. Aspectos económicos

3.2 DISTRIBUIDOR NACIONAL DE EXCALIBUR

3.2.1 Aspectos generales

3.2.2. Evolución cronológica

3.2.3 Socios tecnológicos

3.2.4 Clientes

3.2.5. Sedes físicas

IV. EXCALIBUR RETRIEVALWARE EN PRESIDENCIA DE LA GENERALITAT VALENCIANA

IV.1. La Unidad de Documentación General y las necesidades informativas de Presidencia

IV.2. Adquisición e implantación de Excalibur RetrievalWare

IV.3. Uso actual de Excalibur RetrievalWare en Presidencia

IV.3.1. Alimentación de Excalibur RetrievalWare

IV.3.2. Consultas a la base de datos

IV.4. Novedades en Excalibur RetrievalWare de Presidencia

V. CONCLUSIONES

VI. BIBLIOGRAFÍA

 

INDICE DE ILUSTRACIONES

 

Tabla 1. Evolución cronológica de Excalibur *

Tabla 2. Socios internacionales de Convera *

Gráfico 1. Miembros internacionales de Convera. *

Gráfico 2. Distribución porcentual de los socios internacionales de Convera *

Tabla 3. Socios americanos de Convera *

Gráfico 3. Tipos de socios de Convera *

Tabla 4. Contactos Convera *

Tabla 5. Clientes Convera *

Tabla 6. Evolución cronológica de OCS Technologies *

Tabla 7. Socios tecnológicos de OCS Technologies *

Tabla 8. Clientes de OCS Technologies. Comunicación *

Tabla 9. Clientes de OCS Technologies. Ccomunicaciones *

Tabla 10. Clientes de OCS Technologies. Administración pública *

Tabla 11. Sedes físicas de OCS Technologies *

 

I. INTRODUCCIÓN

El conocimiento es unos de los bienes más valiosos de una organización y la capacidad para acceder al mismo y recuperarlo es crucial. Sin embargo, como consecuencia del volumen bruto de los datos disponibles, su calidad cambiante y su amplia gama de formatos, puede ser todo un reto conseguir un acceso eficaz y una captura precisa de solo aquello que se está buscando.

El crecimiento sin precedentes de Internet y la tendencia constante hacia sistemas de información distribuidos, imágenes documentales, publicaciones electrónicas y multimedia interactivas, ha obligado a la industria de las tecnologías de recuperación de información a adaptarse a las nuevas demandas.

Un software de recuperación de información debería ser capaz de:

Los motores de recuperación del conocimiento intentan hacer posible ese reto: localizar, de forma inteligente, información de texto y multimedia sin clasificar ni estructurar. El objetivo de Excalibur es mejorar la forma en que los usuarios recuperan la información almacenada en los ordenadores. En lugar de pedir a los usuarios que se adapten a la tecnología, la tecnología se adapta a la forma de pensar y trabajar de las personas. De acuerdo con este objetivo se ha desarrollado una tecnología puntera mediante la cual los usuarios podrán recuperar la información necesaria utilizando su propio lenguaje natural y su sentido común. Proporciona potentes soluciones construidas sobre una arquitectura abierta, flexible, adaptable, y de fácil implantación.

Líder en el mercado desde los 80 en soluciones de búsqueda y recuperación de información, la tecnología Excalibur, proporciona con sus herramientas funcionalidades para la gestión de la información basadas en el Proceso de Reconocimiento Adaptativo de Patrones (APRPTM) y las Redes Semánticas. Así, de forma simultánea es posible acceder a los patrones de información digital y al significado real de las palabras.

 

II. FAMILIA EXCALIBUR

Los motores de recuperación del conocimiento Excalibur, lo que se denomina comúnmente "la familia Excalibur" son:

Los productos de Excalibur intentan adaptarse a tipos de datos múltiples y ofrecer soluciones para afrontar los retos provocados por la explosión informativa derivada de Internet y las Intranets.

 2.1. EXCALIBUR RETRIEVALWARE

 1. Características

Booleana: es el tipo de búsqueda más sencilla, pero puede ser combinada con una serie de operadores.

Patronal: el sistema de patrones APRP, incorporado al motor, descompone cada palabra en un mapa de bits y realiza las búsquedas por medio de una comparación porcentual entre dichos mapas, evitando así cualquier posible error en el reconocimiento de caracteres.

Semántica o conceptual: gracias a su red semántica e-lexis, RetrievalWare localiza cualquier texto que contenga una palabra dada, incluyendo sus sinónimos, derivados y palabras relacionadas. Utiliza diccionarios y libros de referencia como conocimiento de base desde el cual puede procesar sus consultas. Estas fuentes proporcionan información sobre los significados de palabras, sintaxis, variaciones de palabras y relaciones entre ellas. Esta relación de palabras hace posible la unión de las mismas en un campo semántico.

 

 

2. El Proceso de Reconocimiento Adaptativo de Patrones (APRP)

Esta diseñado a partir de modelos de sistemas biológicos y utiliza Redes Neuronales para procesar información. Actúa como un sistema auto-organizador que aprende y memoriza patrones binarios extraídos de los datos para indexarlos automáticamente en la información digital. Se crea entonces una memoria basada en patrones que se auto-optimiza a partir del contenido original de los datos.

La llamada "búsqueda difusa" es una función basada en la tolerancia a los errores tanto de los datos de entrada como de los términos de petición. Es muy útil y productiva, especialmente, cuando se digitaliza gran cantidad de documentos y se utilizan procesos de OCR sobre las imágenes digitalizadas.

Permite recuperar documentos que contienen palabras con deletreos similares. El número de palabras con parecida forma se determina en el campo Spell Words. Esto puede ser útil en situaciones en las que se tengan datos procedentes de OCR sin verificar o palabras con varios o complicados deletreos (P.e. GATO y GAMO - CASO Y COSA).

 

La capacidad de combinación de patrones binarios de APRP es independiente al idioma, soportando el desarrollo de soluciones de recuperación de texto multilenguaje. El pequeño tamaño de los índices facilita una alta velocidad de acceso en el proceso de recuperación.

En definitiva, la tecnología APRP, proporciona múltiples ventajas:

3. Redes Semánticas

La tecnología de la Red semántica de Excalibur incorpora sintaxis, morfología y el significado real de las palabras, según se definen en los diccionarios:

  4. Componentes

Incluye componentes cliente/servidor que soportan múltiples procesos de servidor independientes, incluyendo un servidor de seguridad completo.

 

5. Servidores de texto de RetrievalWare

Están construidos en módulos de procesamiento y presentación y ofrecen un gran número de opciones de componentes.

Servidor Semántico y de Patrones

Ofrece un rango completo de opciones de búsqueda de texto:

Servidor de Patrones

Incluye técnicas de búsqueda booleana y estadística, optimizándose así las búsquedas para aplicaciones con un alto nivel de tolerancia a errores (por ejemplo, aplicaciones que cargan grandes volúmenes de texto desde papel vía escáner y OCR).

Servidor Web

Hace de interfaz con cualquier servidor HTTP a través de un CGI (Interfaz de Salida Común). Se despliega sobre un servidor que proporciona facilidad de manejo de grandes volúmenes de peticiones de usuarios.

Servidor de Seguridad

El Servidor Web incluye un servidor de seguridad cuya funcionalidad se hace fácilmente extensible al resto de los componentes, incluyendo el servidor de perfiles o agentes para filtrar y localizar información en tiempo real.

Servidor de Perfiles (Agentes inteligentes)

Sistema que filtra noticias de prensa, mensajes de e-mail, Transferencias de ficheros u otros flujos dinámicos de información en tiempo real. Su arquitectura está optimizada para su ejecución en tiempo real mientras se preserva la simetría con el Servidor Web y los Servidores de texto.

Excalibur Internet Spider

Solución que explora la Internet o la Intranet buscando el conocimiento en documentos tipo texto y multimedia. Estas páginas web obtenidas pueden ser indexadas dentro de RetrievalWare.

Permite a los usuarios acceder a los almacenes de conocimiento corporativo de una empresa/organización, establecidos sobre múltiples servidores y ejecutados sobre múltiples plataformas. A su vez, puede controlar un número ilimitado de páginas Web, tanto internas como externas y recoger activamente documentos específicos de las mismas.

 

6. RetrievalWare Server

Su servidor Web ofrece todo el potencial del Proceso de Reconocimiento Adaptativo de Patrones (APRPTM) y la tecnología de Red Neuronal Semántica en servidores HTTP.

Ofrece un entorno único de ejecución; haciendo fácil la recuperación de la información en aplicaciones de Internet/Intranet. El crecimiento sin precedentes de Internet ha originado la extensión de las búsquedas de texto completo y de bases de datos más allá de los límites establecidos. El gran volumen y variedad de información disponible en Internet ha originado una necesidad urgente de facilitar el uso de soluciones de recuperación que proporcionen a los usuarios un medio intuitivo, flexible y rápido para localizar con precisión la documentación solicitada.

Adicionalmente y aunque RetrievalWare es aplicable únicamente a texto, la ingeniería de búsqueda del APRP ofrece la posibilidad de indexar y recuperar los contenidos de cualquier tipo de información digital incluyendo textos, imágenes y vídeo.

 

7. Arquitectura RetrievalWare

Está construido en una arquitectura flexible y modular que posibilita el procesamiento paralelo a través de servidores "multithreaded" distribuidos en LANs, WANs privadas e Internet. Está diseñado para soportar bases de datos de enorme magnitud y sistemas de información con miles de usuarios.

Proporciona procesos de servidor independientes que maximizan la eficiencia en la carga, indexación y manejo de peticiones de documentos, con una fuerte seguridad y protección. También soporta procesos de servidores dedicados que habilitan las búsquedas combinadas de texto completo y de bases de datos relacionales a través de una salida abierta RDBMs.

El Servidor Web:

 

8. Plataformas soportadas

RetrievalWare soporta las siguientes plataformas:

SERVIDOR:

Sun Solaris 2.5 y posteriores

IBM RS-6000 AIX 4.2

HP 10.20

Silicom Graphics IRIX 6.2

DEC Alpha OSF 4.0

Sequent PTX 4.2

Windows NT

DEC Alpha NT

CLIENTE:

Cliente Web basado en navegador Internet/Intranet (Multiplataforma)

Cliente basado en modo texto

Aplicaciones clientes sobre Windows 16-bit y 32-bit

 

9. Módulos disponibles

Configuración básica:

Módulos complementarios:

 

2.2. EXCALIBUR VISUAL RETRIEVALWARE

Es un entorno para el desarrollo de aplicaciones de alto rendimiento destinado a datos visuales, lo que incluye fotografías, gráficos, animación, vídeo, y otros formatos digitales especializados, es decir, información multimedia en general.

Los datos visuales representan un gran reto técnico y conceptual para los desarrolladores de sistemas de información. En contraste con la información textual, las imágenes digitales y el vídeo tienen unos niveles de densidad muy altos. El contenido de los datos visuales es difícil de describir objetivamente mediante palabras, lo que hace que las indexaciones y búsquedas sean tareas especialmente complejas y fustrantes. En el caso del vídeo estos problemas se agudizan por las grandes dimensiones de tiempo y movimiento que implican.

El acceso eficiente a los datos visuales almacenados en SI On-line es crítico para manejar todo el potencial de esta información.

Constituye un software potente y flexible para la recuperación de datos visuales basados en el contenido. Gracias al poder del Procesador de Reconocimiento Adaptativo de Patrones (APRPTM), proporciona la capacidad de indexar y recuperar automáticamente datos visuales sobre la única base de su propio contenido original.

El sistema analiza cada dato visual sobre la base de los patrones de figuras, colores y texturas contenidos en el dato y, a continuación, se reducen a un índice localizable inferior a un 10% del fichero original. Por lo tanto, los usuarios pueden hacer peticiones al sistema usando ejemplos de datos visuales o construyendo claves de búsqueda mediante índices gráficos de autoridades. El mismo proceso de análisis por el que se indexa se realizará en la clave de búsqueda, apareciendo una lista de imágenes iguales o parecidas.

La integración de Visual RetrievalWare con los servidores de texto de RetrievalWare da lugar a una potente solución de búsqueda:

Servidor de imágenes:

Utiliza el poder del procesamiento por patrones (APRP) para construir aplicaciones de recuperación de imágenes visuales. Incluye componentes para la indexación y recuperación de imágenes digitales basados en su contenido objetivo. Estos componentes permiten que las aplicaciones de recuperación de imágenes, basadas en el reconocimiento de patrones, reconozcan automáticamente ciertos tipos de información visual y proporcionen importantes posibilidades en la gestión de imágenes.

Plataformas soportadas:

Servidor:

Sun solaris 2.5 y posteriores

IBM RS-6000 AIX 4.1

HP 10.01

Silicom Graphics IRIX 6.2

DEC Alpha OSF 4.0

Sequent PTX 4.2

Windows NT

DEC Alpha NT 4.0

Linux 2.0

Cliente:

Cliente Web basado en navegador Internet/Intranet (Multiplataforma)

Aplicaciones clientes sobre Windows 16-bit y 32-bit

 

2.3. EXCALIBUR SCREENING ROOM

Constituye una tecnología avanzada para la captura, análisis, búsqueda, recuperación y visualización de cualquier tipo de vídeo, así como de los subtítulos, códigos de tiempo o metadatos relacionados con éste.

Es posible capturar, digitalizar vídeos analógicos y digitales, analizar sus características visuales y crear vídeos en alta resolución y/o un vídeo proxy de baja resolución que, inmediatamente, pueden ser accesibles desde una intranet, extranet o internet.

La recuperación de los contenidos ya catalogados se hace a través del navegador, bien buscando vídeos que contengan imágenes similares a una imagen modelo (color, forma, brillo etc.), bien buscando semántica y/o patronalmente en los contenidos de texto embebidos en el teletexto, en los convertidos desde voz, o en las diversas anotaciones previamente introducidas.

Esta especialmente dirigido a compañías que producen o utilizan el vídeo como fuente principal de información o como mercancía.

En resumen Screening room permite:

 

 

III COMERCIALIZACIÓN DE EXCALIBUR

En este apartado se estudiarán los aspectos relativos la comercialización del producto, englobando tanto su producción como su distribución.

3.1 PRODUCTOR DE EXCALIBUR

3.1.1 Aspectos generales

Excalibur Technologies Corporation (NASDAQ: EXCA) fue fundada en 1980 en USA. Se convirtió en el pionero de las soluciones innovadoras del software de búsqueda y recuperación de la información. Las tecnologías de la familia Excalibur fueron diseñadas para trabajar de forma intuitiva y utilizando el lenguaje natural y permitir a las organizaciones la recuperación de la información dentro del amplio espectro de la información digital, incluyendo texto, imágenes y datos multimedia en entornos de trabajo local o más amplio (Intranet/Internet).

Utiliza la tecnología APRP -proceso de reconocimiento adaptativo de patrones-, que ya se ha comentado anteriormente, de propiedad exclusiva de Excalibur. Fue desarrollada por el fundador de Excalibur, James Dowe III en 1980 y su primera versión en el mercado aparece en mayo de 1990; a partir de este momento y con una periodicidad mínima de un año aparecen versiones que modifican la anterior, con nuevas prestaciones o una versión totalmente nueva. En estos momentos, la versió actual es 4.0 aparecida en agosto de 2001.

Desde que el 21 de diciembre de 2000 Intel y Excalibur se fusionaron en una macroempresa Convera Corporation, Excalibur Technologies desaparece como tal nombre, aunque se siga utilizando, por tanto hay que tener en cuenta que aunque se hable de Excalibur como empresa en realidad se está haciendo referencia a la reciente empresa. El distribuidor español OCS Technologies, en sus últimas versiones de publicidad comercial hace mención a Convera Retrialware, como antiguo Excalibur.

En la actualidad el proyecto es dirigido por Alexander Nareyek y participan diversas instituciones como Technical University of Berlin y The Carnegie Mellon University (CMU). Alexander Nareyek es un informático que cursó sus estudios en la Technical University of Berlin, finalizando en 1996. Continuó con el doctorado en German National Research Center for Information Technology (GMD) y Research Institute for Computer Architecture and Software Technology (FIRST). , y en la actualidad trabaja como científico en la Universidad Carnegie Mellon becado por la fundación alemana DFG de la investigación.

Financiación del proyecto

La financiación es realizada por la German Research Foundation (DFG). Anteriormente también estuvo involucrada German National Research Center for Information Technology (GMD), que en la actualidad ya no existe como tal. Otros miembros comerciales que financian el proyecto son: Conitec Datensysteme GmbH, Cross Platform Research Alemania (CPR) y NICOSIO (by products, service and financing students).

 

3.1.2. Evolución cronológica

1.980

Se constituye Excalibur Tecnologies Corporation (NADCA: EXCA) por James Dowe III.

1.990

En mayo aparece la primera versión de Excalibur 1.0 lanzada al mercado.

1992

Versión 1.1

1993

Versión 1.3

1994

Versión 2.0

1995

Versión 2.

1996

Versión 2.3 de Excalibur

1.997

  • Versión 2.5.1 de Excalibur.
  • - Contrato de distribución exclusiva con Excalibur Technologies, para los productos Excalibur RetrievalWare® y Visual RetrievalWare® con el distribuidor ICS Technologies.

1998

Aparece en el mercado la versión 2.6 de Excalibur

1999

Aparece en el mercado la versión 3.0.1 de Excalibur

2000

Intel y Excalibur forman Interactive Media Services Company.

2000

diciembre

Intel y Excalibur se fusionan en Convera Corporation. (Desaparece Excalibur Technologies como corporación)

2.001

agosto

Última versión de Excalibur lanzada al mercado: 4.0

Tabla 1. Evolución cronológica de Excalibur

 

3.1.3. Socios

La presencia en el mercado tanto nacional como internacional, se puede ver reflejada en la siguientes tablas que se muestra a continuación, con una detallada relación de todos sus socios actuales, especificando el tipo de miembro así como la región en que actúan.

Convera Corporation distingue tres categorías de socios diferentes:

Se distingue entre socios internacionales, que son todos aquellos que no se encuentran físicamente en Norteamérica y los socios del continente americano.

 

    1. Socios Norteamericanos

Organización

Tipo de socio

Región

Acamaya

Integradores de sistema

Francia

ActiveNavigation

OEM

UK

Apellin Ltd

Distribuidor

Suecia

APR

OEM

UK

Arco

Distribuidor

Bélgica

Arco Information

Distribuidor

Bélgica

Asset House Technology Ltd

OEM

UK

Atos Origin

Distribuidor

UK

Bahadir Celep & Partners

Distribuidor

Turquía

BancTec BV

Distribuidor

Suecia y Finlandia

CAST Systems

Distribuidor

UK

Cedar Group Plc

OEM/Distribuidor

UK

Common Knowledge

Distribuidor

UK

Compaq Israel

Distribuidor

Israel

Cross Atlantic

Distribuidor

Alemania

DBEE

Distribuidor

Francia

EMD Group

Distribuidor

Bélgica

Esteem Computers Plc

Distribuidor

UK

Focal Point Systems Ltd

OEM

UK

Fujitsu Limited

OEM

Japón

GMD Italia

Distribuidor

Italia

Granite Rock

OEM

UK

I-documentsystems

OEM

UK

INCAD

Distribuidor

República Checa

InfoCap Technologies Ltd

OEM

UK

Insight Technologies Ltd

OEM

UK

IRIS

Distribuidor

Bélgica

Ixos Software Ltd

OEM

UK

Knowledge Concepts BV

OEM/Distribuidor

The Netherlands

Knowledge Focus

Distribuidor

Sudafrica

KnowledgeWare

Distribuidor

Arabia Saudi

Logica UK Ltd

Distribuidor

UK

MAULDE Technologies

OEM

Francia

Meridio

OEM

UK

MISC

Distribuidor

Egipto

NMR

Distribuidor

UK

OCS

Distribuidor

España, Portugal y Latino América

Odeon

Distribuidor

Rusia

Open System Integrators

Integradores de sistema

Gran Bretaña

Orbital Software

OEM

Gran Bretaña

PROCOM

Distribuidor

Austria

Reveda

OEM

Gran Bretaña

Silicon Valley Group

Integradores de sistema

Gran Bretaña

Synomics Ltd

OEM

Gran Bretaña

TC Systema

Distribuidor

Italia

Tecmath AG

Distribuidor

Alemania

Transcom Software Inc.

OEM

Gran Bretaña

Tyrell

Distribuidor

Gran Bretaña

Uptima

Distribuidor

Gran Bretaña

XL International Secure Solutions Ltd

Distribuidor

Gran Bretaña

Tabla 2. Socios internacionales de Convera

Si esta tabla se traduce en un gráfico en términos absolutos se puede apreciar claramente el liderazgo de Gran Bretaña frente al resto de países, lo que supone el 52% de representación con respecto al total (gráfico 2), seguido de un tímido 8% de Bélgica. En nuestro contexto se pude ver que el único distribuidor que tenemos es compartido también por Portugal y España y que su representación con respecto al total es mínima.

Gráfico 1. Miembros internacionales de Convera.

 

 

Gráfico 2. Distribución porcentual de los socios internacionales de Convera 

 

2. Socios Norteamericanos

Compañía

Tipo de socio

Región

Active Navigation, inc.

Distribuidor

Norteamérica

ADCS

Distribuidor

Norteamérica

Akamai

OEM

Norteamérica

Ancept

Integradores de sistema

Norteamérica

Aspen Systems

Integradores de sistema

Norteamérica

Auto-Trol Technology Corp.

OEM

Norteamérica

Booz Allen and Hamilton

Distribuidor

Norteamérica

Cedar

Distribuidor

Norteamérica

Compaq

Solutions Provider

Norteamérica

Compu-data

Integradores de sistema

Norteamérica

Context Media

Distribuidor

Norteamérica

CSC

Integradores de sistema

Norteamérica

DataChannel/Netegrity

OEM

Norteamérica

Digital Island

OEM

Norteamérica

Digital System Technology (DST)

Distribuidor

Norteamérica

Electronic Data Systems (EDS)

Distribuidor

Norteamérica

EMC

OEM

Norteamérica

eMotion

Cooperativa

Norteamérica

Empowerment Conversions, Inc.

Solutions Provider

Norteamérica

Enterprise III Systems

Integradores de sistema

Norteamérica

EOS International

OEM

Norteamérica

ExTRA BYTES

Integradores de sistema

Canada

Fast Talk

Solutions Provider

Norteamérica

FMC Consulting, Inc.

Integradores de sistema

Norteamérica

Front Porch Digital

OEM

Norteamérica

Fujitsu Australia Software Tech Pty Ltd

Distribuidor

Australia

Gray Hawk Systems

Distribuidor

Norteamérica

Hyper Technology Pty Ltd

Distribuidor

Canada

Hyperion Solutions Corp.

OEM

Norteamérica

Identitech, Inc.

OEM

Norteamérica

IHS Solutions

Distribuidor

Canada

ImageWork Technologies Corp.

Integradores de sistema

Norteamérica

Indus International

OEM

Norteamérica

Informix

OEM

Norteamérica

Intersect Software Corp.

OEM

Norteamérica

Island Data Corporation

OEM

Norteamérica

Japan Information Processing Corporation

Distribuidor

Japan

KDN

Distribuidor

Korea

Ktech Corporation

Distribuidor

Norteamérica

Lockheed Martin

Integradores de sistema

Norteamérica

Logicon

Integradores de sistema

Norteamérica

MacFadden & Associates, Inc.

Distribuidor

Norteamérica

Merrill Corporation

OEM

Norteamérica

MicroPact Engineering Inc.

Integradores de sistema

Norteamérica

Miklos Corporation

Integradores de sistema

Norteamérica

Mindwrap

OEM

Norteamérica

Morris

OEM

Norteamérica

Nikoyo (HK) Limited

Distribuidor

Japón

Northern Light

OEM

Norteamérica

Orbital Software

OEM

Norteamérica

Parametric Technology Corp. (PTC)

OEM

Norteamérica

Peregrine

OEM

Norteamérica

Presearch Incorporated

Integradores de sistema

Norteamérica

PROGRESSIVE TECHNOLOGIES

Distribuidor

Norteamérica

PTFS, Inc.

OEM

Norteamérica

Raytheon

Integradores de sistema

Norteamérica

Realm Consulting

Integradores de sistema

Norteamérica

SAIC

OEM

Norteamérica

SAIC New Media Systems

Integradores de sistema

Norteamérica

SAP Portals

OEM

Norteamérica

Saucedo Enterprises

Distribuidor

Norteamérica

Semantix Technologies

OEM/Distribuidor

Norteamérica

SRA Corporation

Distribuidor

Norteamérica

Strategic Technologies

Distribuidor

Norteamérica

Teradata, a division of NCR Corp.

OEM/Distribuidor

Norteamérica

The Brain Technologies

OEM

Norteamérica

The Bulldog Group

Distribuidor

Canada

TRW

Integradores de sistema

Norteamérica

Universal Systems Inc.

Distribuidor

Norteamérica

Veridian Engineering

Distribuidor

Norteamérica

Video Intelligence, Inc.

Integradores de sistema

Norteamérica

Vignette

Integradores de sistema

Norteamérica

Viper Media

Integradores de sistema

 

WebAdTv

Proveedor

Norteamérica

WhamTech Inc.

OEM

Norteamérica

WIZnet

OEM

Norteamérica

WordWave

Proveedor

Norteamérica

Tabla 3. Socios americanos de Convera

 

 

De los 150 socios ubicados físicamente en Norteamérica que se encuentran, solo cuatro pertenecen a Canadá el resto se encuentra repartido por los diferentes estados americanos. Lo que si resulta claramente significativo es la gran penetración de esta empresa en el mercado americano que rebasa ampliamente el número de miembros en este continente frente a los 50 socios repartidos por el resto de la geografía contando tanto oriente como occidente.

 

De un análisis conjunto de los tipos de miembros, si que se pueden sacar datos claros como muestra el gráfico que viene a continuación:

Claramente domina la tipología de socio de distribuidor, ya en la serie

Gráfico 3. Tipos de socios de Convera

 

internacional o norteamericana, mientras que los sistemas integrados se puede apreciar que están muy poco integrados en el viejo continente, donde sólo existen tres de este tipo de distribuidores,

 

3.1.4. Sedes físicas/virtuales

El contacto de todos los miembros que trabajan o colaboran se realizan a través de su departamento correspondiente: ayuda, venta, marketing, alianzas. En el último apartado está la dirección que puede utilizar cualquier persona física o jurídica para ponerse contacto con la empresa, distinguiendo entre la zona norteamericana y la internacional.

Contactos Convera

    • Ayuda

Productos de Texto :

- 800 787 1715

  • Ayuda

Productos Visuales

+ 44 (0) 1344 781 900

vsupport@convera.co.uk

    • Ventas

OEM

Dennis Tran - 800 755 7005

dtran@convera.com

    • Marketing

Tolerancia Karch (Costa Del este) - 800 755 7005 De Maria

mkarch@convera.com

Peggy Charboneau (Costa Del oeste) - 800 755 7005

pcharboneau@convera.com

Martin Bayton (Reino Unido) - +44 1344 781 800

mbayton@convera.co.uk

Iain Fletcher (Reino Unido) - +44 1344 781 800

ifletcher@convera.co.uk

    • Alianzas

Cheryl McLeod - 800 755 7005

cmcleod@convera.com

Cecilia Monti (Reino Unido) - +44 (0)1344 781 800

cmonti@convera.co.uk

    • Comercialización

Cheryl McLeod - 760 761 5281

cmcleod@convera.com

    • General

Norteamérica: 800 788 7758

info@convera.com

Internacional: +44 (0)1344 781 800

nfo@convera.co.uk

Tabla 4. Contactos Convera

Añadir también que existe actualmente una lista de distribución sobre Excalibur totalmente gratuita. Su participación se realiza a través de un moderador, que se encuentra en la siguiente dirección electrónica: http://www.eg.bucknell.edu/~excalibr/excalibur.html

 

3.1. 5. Clientes de Convera

Gobierno

Intranet

Atomic Energy Agency (UK)

ABC News

Caisse des Dépôts et Consignation

ABN Amro

Federal Bureau of Investigation

Air Francia Airbus Industrie

Food and Drug Administration

Anheuser Busch

Internal Revenue Service

Amgen

Justice Information Center

a_priori international

Labour Party (UK)

Asian Development Bank

NASA

Atlanta Journal Constitution

National Institutes of Health

AUDI

Nuclear Regulatory Commission

Augusta Chronicle

Sandia National Labs

Bell Atlantic

Securities and Exchange Commission

Beumer

Social Security Administration

British Gas (BG) Technology

U.S. Air Force Research Lab

The Boeing Company

U.S. Army Research Lab

British Library

U.S. Department of Agriculture - Farm Service Agency

British Nuclear Fuels Limited

U.S. Department of Energy

The Capital Group

U.S. Department of Justice

City of Oklahoma

U.S. Department of State

Clifford Chance

U.S. House of Representatives

Cooper Tire and Rubber Co.

U.S. Information Agency

Copley Press

U.S. Joint Chiefs of Staff

Criterion Catalysts

U.S. Naval Research Lab

Dassault

Internet and eCommerce

debis Systemhaus

Deutsche Post

bigchalk.com

Domnick Hunter

Bell & Howell

Dow Agro Sciences

Blackvoices.com

Ducati Energia S.p.a.

Bouygues Telecom

Eutelsat

Careerbuilder.com

Fastenal

ChicagoTribune.com

Fleishman Hillard

DeseretNews.com

Ford Motor Company

eRugGallery.com

Framatome

Europay International

Gazette Newspapers

Federal Filings - EDGAR Direct

gedas

found.com

General Electric

The Independent

Granada Media

Infonautics

Goldman Sachs

InfoPlease.com

Honeywell

Intel

Johns Hopkins University

Kommunale Gemeinschaftsstelle

Kirch New Media

KPMG

Korea Electric Power Data Network (KDN)

LATimes.com

Kreissparkasse Hannover

MacMillan Publishing Ltd.

LDCom

Morehouse College

Lockheed Advanced Development Company

Morris Communications

Märkische Oder Zeitung

Physicians Online

Nortel Networks

QXL.com

Northrop Grumman

TheWorksUSA.com

Pfizer, Inc.

Viacom

ProSieben-Sat.1-Gruppe

Wila Verlag

PSA Peugeot Citroën

 

Raytheon

Media and Entertainment

SAP Portals

ABC News

Scamark (Groupe Leclerc)

Augusta Chronicle

Shell Services Integration Group

Baltimore Sun

Stora Enso

Canal+ Belgique

Telefonica

Chicago Tribune

Tractebel

Copley Press

T-Systems

Discovery Communications

UCLA

The Financial Times

United Airlines

FOXSPORTS.com

Virginia Power

Gazette Newspaper

Visa International

Gruner & Jahr Publishing

Watson Wyatt

The Independent

The World Bank

it4TV

Xerox

KABC-TV

YMCA

KGO-TV

Yorkshire Water plc

liberation.fr

 

Los Angeles Times

 

Morris Communications

 

National Geographic Television

 

Orlando Sentinel

 

Pathé Archives

 

ProSieben

Tribune Interactive

Turner Entertainment

TV5

Viacom

VNU eMedia Inc.

Warner Brothers Online

WebEncyclo.com (Editions Atlas)

Tabla 5. Clientes Convera

Sus más de ciento treinta clientes se encuentran agrupados en cuatro grandes apartados: administración pública, Intranet, Internet y comercio electrónico, comunicación y ocio. Hay que señalar que esta es una lista sesgada que no engloba la totalidad de sus clientes y que ha sido extraída de la página web de dicha corporación.

 

3.1.6. Aspectos económicos

En cuanto al precio no se ha podido encontrar información exacta. A la conclusión que se ha llegado por la información facilitada por el propio distribuidor nacional es que este precio es relativo según las necesidades del cliente y que por tanto dependerá de variables tan distintas como la dimensión de la empresa, el tamaño del fondo documental, las especificaciones técnicas que se exigan y la plataforma escogida para ser soportada, entre otros.

De todas maneras lo que si se puede afirmar es que su coste es elevado y que consecuentemente solo podrá ser adquirido por aquellas organizaciones de cierto peso en el mercado tanto desde un punto de vista económico como desde un punto de vista profesional.

 

3.2 DISTRIBUIDOR NACIONAL DE EXCALIBUR

 

3.2.1 Aspectos generales

El distribuidor español junto a Portugal y a Latinoamérica es OCS Technologies Corporation. Se trata de un grupo empresas, de carácter tecnológico, especialistas en el tratamiento de la información, que comienza su andadura en Madrid en la década de los ochenta y en la actualidad ya tiene un reconocimiento internacional.

Se trata de una empresa de capital privado cuyo principal inversor recae en el entorno más directo de su presidente y director. Asimismo, desde 1999 está participado con un 29,76%, 3i Group, una empresa privada, primera sociedad de inversiones de capital del Reino Unido. Esta participación pretende reforzar el fuerte crecimiento del grupo en los últimos años así como el desarrollo y comercialización de nuevos productos tanto en España como en el extranjero.

Empresas del grupo

El grupo OCS Technologies está formado por diez grandes empresas estructuradas en dos grandes grupos de trabajo:

1. Productos, Proyectos y Servicios Documentales

La actividad de las compañías que conforman esta división se fundamenta en transformar la información en conocimiento, generar contenidos de valor añadido y crear nuevos canales indirectos de venta con una amplia oferta de proyectos, productos y servicios:

2. Soluciones para la Nueva Economía

El objetivo de estas compañías se centra en generar contenidos de valor para el e-business, portales o empresas punto.com y en crear nuevos canales digitales de venta:

Una vez conocido el contexto de la empresa, nos centraremos únicamente en aquella que se dedica a la comercialización de nuestro producto:

OCS Software

Fundada en 1981, OCS Software es la matriz del grupo OCS Technologies. En ella se diseña, desarrolla y comercializa todo tipo de soluciones informáticas para el Tratamiento de la Información.

Las herramientas que ofrecen van desde los tradicionales sistemas de Gestión Electrónica Documental, WorkFlow y Procesamiento Automático de Formularios hasta las más modernas Tecnologías de Recuperación y Gestión del Conocimiento Corporativo.

Todas ellas pensadas para sustituir los sistemas tradicionales de gestión, almacenamiento, mantenimiento y acceso a los archivos de documentación de las empresas por un tratamiento electrónico automatizado capaz de gestionar toda la información de las empresas independientemente del formato que soporten.

Avalados por un gran número de instalaciones y clientes, con OCS Software ocupa una posición relevante ya en el mercado nacional e internacional.

 

3.2.2. Evolución cronológica

1.981

Se constituye la sociedad OCS con sede en Madrid y clara vocación de consultor en temas informáticos de organización para Entidades de Seguros, sector al que se dedica con exclusividad hasta 1.988.

1.988

Comienza su expansión a otros sectores. Para dar cobertura a la creciente demanda de servicios de digitalización de documentos se crea Mediacom.

1.995

Incorporación de los últimos avances tecnológicos en sistemas de captura y almacenamiento de información (escáneres, jukebox, cámaras digitales...). Esto permite integrar toda la Gestión de Información Digital multiformato: papel, microfichas, microfilm, planos, radiografías, fotografías, etc.

1.996

Consolidación y expansión de OCS Optic® como solución puntera de Gestión Electrónica Documental. Extensión de la red de partners y búsqueda de nuevos canales de distribución.

1.997

Contrato de distribución exclusiva con Excalibur Technologies, para los productos Excalibur RetrievalWare® y Visual RetrievalWare®. Desarrollo de tecnologías de búsqueda Internet/Intranet basadas en redes neuronales.

1.998

Ampliación de las soluciones con productos para el Reconocimiento Automático de Formularios e introducción de sistemas WorkFlow. Se extienden las áreas de negocio hacia el mercado Latinoamericano con la apertura de OCS International Corporation con sede en Miami.

1.999

Buena parte de los recursos de I+D se dedican al desarrollo de la Semántica para reforzar las capacidades de las herramientas de búsqueda y recuperación de la información. Incorporación de Excalibur Screening Room® para la indexación y búsqueda de vídeo. Se funda OCS Medi@ para el seguimiento de prensa y se constituye OCS Net para dar soluciones globales para la Red.

2.000

Apertura de oficinas en Málaga, Albacete y Bogotá (Colombia). Lanzamiento al mercado del sistema de conocimiento OCS Glob@l®. Desarrollo del canal e implantación de soluciones en el mercado de las PYMES con la creación de la empresa eAko Soft. Se crea la plataforma de sistemas de información IDC (Internet Data Center).

2.001

Incorporación de Cartel Data, empresa líder en el análisis de precios promocionales de productos de consumo de la gran distribución. Apertura de oficinas en México.

Tabla 6. Evolución cronológica de OCS Technologies

 

3.2.3 Socios tecnológicos

OCS Technologies ha ido contando con el apoyo de socios tecnológicos que, como proveedores de tecnología, proporcionan una plataforma común para desarrollar el modelo de negocio OCS.

De reconocido prestigio también en el sector tecnológico, los socios que posee en la actualidad son:

CONVERA

http://www.convera.com

EMC2

http://www.emc.com

MICROSOFT

http://www.microsoft.com

OCE-CGK

http://www.oce.es

SAFELAYER

http://www.safelayer.com

SECUWARE

http://www.secuware.com

STAFFWARE ESPAÑA

http://www.staffware.com

STORAGETEK

http://www.storagetek.es

SUN MICROSYSTEMS

http://www.sun.es

Tabla 7. Socios tecnológicos de OCS Technologies

 

 Conviene señalar, que pese al contrato de distribución exclusiva en España, Portugal y Sudamérica con Convera, OCS Software también comercializa todos sus productos a través de cualquiera de sus socios tecnológicos junto con Fujitsu ICL España, según el acuerdo de colaboración firmado el 6 de junio de 2000, por el que se estipula la distribución y comercialización de los productos OCS Software a escala nacional.

 

3.2.4 Clientes

OCS cuenta con una amplísima cartera de clientes repartidos entre los siguientes sectores: alimentación, comunicación, distribución, e-business, finanzas, industria, público, sanidad, telecomunicaciones y otros.

Aunque se conoce la cartera de los clientes, así como el sector profesional al que pertenecen, no se ha podido determinar con exactitud el número de clientes que utilizan este software de recuperación. No obstante si que se puede aseguran que un gran porcentaje pertenece al sector de la comunicación: es el caso de Canal 9, La Unidad de Documentación de Presidencia, La Vanguardia, Ministerio de Fomento, el Diario El Comercio, Via Plus. Sin embargo existen otros casos como Maphre del sector de finanzas y ACERINOX de la industria que también se sabe que utilizan el producto par la gestión de la información entre las distintas empresas del grupo o como solución integrada.

Por tanto, podemos deducir que este producto va dirigido a cualquier organización ya sea pública o privada que necesite gestionar un gran volumen de información por y para su almacenamiento y recuperación, no centrándose en las instituciones documentales por excelencia.

 

Comunicación

ICM

141 COMUNICACIÓN ADESPORT/ QUUM AFFIDAVIT

ANTENA 3 TV

AREA COMUNICACION GLOBAL

ARS NETWORK

BASSAT COMUNICACIÓN
BEST RELATIONS

BOOK COMUNICATION

BRODEUR COMUNICACION EMPRESARIAL

BURSON MARSTELLER

CANAL 9

CARAT ESPAÑA

CONSULTORES QUANTUM LEAP

COOL LINES

COSMOPOLITAN T.V

CREA

DESPACHO DE MILA BENTABOL
DFI-DKAN
DIARIO 16
DIARIO EL MUNDO
DIARIO LA VANGUARDIA
DOMEUS

DOYMANET, S.A.

EDELMAN COMUNICACIÓN

EDICIONES DOYMA
EMPRESA EDITORA EL COMERCIO
EUROPA PRESS
EUROSPORT
EVENT & MEDIA
GRUPO ANAYA
GRUPO ASESORES
GRUPO COMUNICACIÓN
GRUPO MERCADOS TELEMATICOS
HERMES
HILL & KNOWLTON
INSTITUT D'EDICIONS
INTERPRESS 2000
IP COMUNICACIÓN
JESSEN-MAYO
LA LEY - ACTUALIDAD
LAST LAP
LLORENTE & CUENCA
LUCA COMUNICACIÓN
MAGENTA MEDIA
MARTA ROMERO & ASOCIADOS

MASTER EVENTS

MCB

MILLWARD BROWN

OCEANO GRUPO EDITORIAL
PLURAL COMUNICACIÓN
RADIO POPULAR CADENA COPE. CADENA 100
RECOLETOS COMPAÑÍA EDITORIAL
SAB COMUNICACIÓN EMPRESARIAL
SANCHIS COMUNICACIÓN
SEASONS
SERFUSION
SERVICE.COM
SHANDWICK
SOCIEDAD GENERAL DE LIBRERIAS
TELEVISION DE GALICIA
TEXT 100
TINKLE CONSULTANTS
TV3
ULLED & ASOCIADOS
UNIDAD EDITORIAL, S.A
URANO
VARENGA
WOLTERS KLUWER

MULTIPARK- MPM

MIRROR -

Tabla 8. Clientes de OCS Technologies. Comunicación

 

Comunicación

AIRTEL MOVIL, S.A.
BRITISH TELECOM
BT. TELECOMUNICACIONES
COLT TELECOM
CONVEX SUPERCOMPUTER S.A.E
ERICCSON BILBAO
ERICCSON INFOCOM

ERICCSON RADIO
HEWLETT-PACKARD ESPAÑOLA, S.A.
HISPASAT
JAZZTEL
JAZZTEL INTERNET FACTORY
ONO (CABLEEUROPA)
PANDA SOFTWARE

SATEC
SINTEL
TELEFONICA
TELEFONICA MOVILES
TERRA NETWORKS, S.A.
TISSAT

Tabla 9. Clientes de OCS Technologies. Ccomunicaciones

Para la visualización del resto de clientes seleccionar aquí.

 

 

Administración pública

AGUAS DE JEREZ

ALLEN & OVERY

APEX
AYUNTAMIENTO DE SABADELL
BOLETIN OFICIAL DE LA PROVINCIA DE BARCELONA
BOLETIN OFICIAL DE LA PROVINCIA DE MALAGA
BOLETIN OFICIAL DE LA REGION DE MURCIA
CAJA DE AHORROS INMACULADA
CEDRO
CENTRAL DE TERMINOLOGIA CATALANA

CIEMAT

CNMV

COMISION DE ACCIDENTES DE AVIACION CIVIL

COMUNIDAD DE MADRID

CONFEDERACIÓN HIDROGRAFICA DEL EBRO

CONSEJERIA DE EDUCACION VALENCIANA

GENERALITAT VALENCIANA REGISTRO CIVIL DE MURCIA SENADO/ GRUPO PARLAMENTARIO POPULAR SERVICIO JURIDICO DEL ESTADO TRIBUNAL SUPREMO

UNED RECTORADO Y SECRETARIA UNIVERSIDAD AUTONOMA DE CIUDAD

CONSEJERIA OBRAS PUBLICAS DE CANARIAS
DIPUTACION DE MURCIA
DIPUTACION DE TARRAGONA
DIPUTACION GENERAL DE ARAGON
DIPUTACION PROVINCIAL DE BARCELONA
DIPUTACION PROVINCIAL DE ZARAGOZA

ECEM

EJERCITO DEL AIRE EMPRESA MUNICIPAL DE AGUAS DE MURCIA

EMPRESA MUNICIPAL DE LA VIVIENDA ENTE PUBLICO PUERTOS DEL ESTADO

FUNDACION ENTORNO GENERALITAT DE CATALUNYA GOBERNACION DEL HUILA

GOBIERNO DE NAVARRA

IGAPE

JUAREZ UNIVERSIDAD CARLOS III UNIVERSIDAD DE BARCELONA UNIVERSIDAD POLITECNICA VALENCIA

Tabla 10. Clientes de OCS Technologies. Administración pública

 

3.2.5. Sedes físicas

Oficinas nacionales

Oficinas internacionales

MADRID

ESTÉBANEZ CALDERÓN, 3

28020 MADRID

TLF: 91 579 08 00

FAX: 91 579 11 35

MIAMI

1150 N.W. 72 AVE SUIT 740

FL 33126 MIAMI. USA.

TLF: 001 305 477 62 67

FAX: 001 305 477 68 67

ZARAGOZA

AVD MADRID Nº 121

50017 ZARAGOZA

TLF: 976 34 64 29

FAX: 976 34 61 17

BOGOTA

Transversal 70 B nº3-31 Sur

APDO 508 INT 2. BOGOTA. COLOMBIA. SUR AMERICA

TLF: +57 126 079 26

FAX: +57 344 160 50

BARCELONA

PLZ FRANCIASC MACIA Nº7

08029 BARCELONA

TLF: 93 419 15 15

FAX: 93 410 77 55

MÉXICO

Mariano Escobedo 510 Piso 12

Colonia Nueva Anzures

11590. MEXICO DF. MEXICO.

TLF: +52 52 63 25 30

FAX: +52 52 63 25 10

MALAGA

C/ PUERTO Nº 14

EDIFICIO KEROMNES LOCAL 7, PL 4

29016 MALAGA

TLF: 952 21 63 24

FAX: 952 21 63 24

 

ALBACETE

C/ MARTINEZ VILLENA Nº 13, 2ºB

02001 ALBACETE

TLF: 967 60 55 24

 

Tabla 11. Sedes físicas de OCS Technologies

 

 

IV. EXCALIBUR RETRIEVALWARE EN PRESIDENCIA DE LA GENERALITAT VALENCIANA

IV.1. La Unidad de Documentación General y las necesidades informativas de Presidencia

 
La UDG nace en 1992, adscrita por aquel entonces al Centro de Documentación y Análisis de Presidencia. Un año después, es integrada definitivamente en el Área de Documentación y Análisis de la Dirección General de Planificación y Estudios.
Su misión es cubrir las necesidades informativas que surgen en la toma de decisiones en el entorno del President, Vicepresidentes, Consellera Portaveu y demás usuarios de la propia conselleria. La documentación necesaria para llevar a cabo este propósito es de muy diverso origen. Por ello, la Unidad dispone de los servicios y fondo documental propios de una biblioteca especializada y de un centro de documentación; así como de las herramientas de análisis, almacenamiento, búsqueda y recuperación adecuadas, entre las que se encuentra Excalibur RetrievalWare.
En este sentido, la propuesta de compra Excalibur RetrievalWare surgió de la necesidad de dotar al Portal de la Generalitat Valenciana de una potente herramienta de indexación y búsqueda por contenidos, que almacenara toda la información de interés para la institución, ya fuera generada por ella o por cualquier fuente externa.
La gran variedad de información y documentación disponible en los servidores web de la Generalitat Valenciana y foráneos hacía muy difícil la búsqueda sobre un tema determinado. Era necesaria, por tanto, una solución que proporcionase a los usuarios un acceso intuitivo, preciso y rápido al contenido.
Frente a estas premisas, Excalibur RetrievalWare se ofrecía como la herramienta más adecuada, no únicamente por su flexibilidad y gran potencia de indexación, también por las múltiples posibilidades y capacidad de recuperar de documentos, gracias a las búsquedas por patrones y por redes semánticas -para las cuales se cargó el diccionario Espasa, de 12 volúmenes-.
 
 

IV.2. Adquisición e implantación de Excalibur RetrievalWare

Excalibur RetrievalWare fue adquirido por la Generalitat Valenciana en el año 2000.
Por lo que respecta a la implantación del programa, se decidió que iba a hacerse en dos fases:
1ª. Instalación de Excalibur RetrievalWare y creación de librerías:
Una librería Excalibur RetrievalWare es un conjunto de documentos del mismo tipo, que pueden estar almacenados en archivos, bases de datos, servidores web, etc.
2ª. Desarrollo del interfaz de búsqueda:
Análisis, desarrollo, pruebas e implantación de un interfaz de búsqueda común, integrado por 3 páginas HTML:
-Página de búsqueda: permite introducir la palabra o palabras a buscar y seleccionar los criterios de búsqueda y de presentación
-Página de búsqueda experta: permite seleccionar los significados que se desean incorporar a la búsqueda
-Página de resultados: muestra un listado con los documentos encontrados. Cada registro presenta el título del documento, la relevancia o peso y las primeras líneas del documento
 
 

IV.3. Uso actual de Excalibur RetrievalWare en Presidencia

 

IV.3.1. Alimentación de Excalibur RetrievalWare

 
Si tenemos en consideración las grandes posibilidades que ofrece el sistema, el uso que se realiza actualmente en Presidencia de la Generalitat Valenciana es bastante limitado. Pese a que se compró el módulo de Internet Spider- programa que rastrea las páginas web de Internet o de la propia intranet para recuperar documentos nuevos o modificaciones de los existentes en su base de datos-, hoy en día su funcionamiento es no está suficientemente explotado.
Así pues, el fondo documental de Excalibur RetrievalWare de Presidencia se compone únicamente de documentos bajados manualmente de Internet, escaneados o digitalizados con OCR -lo cual no obsta para que se trate de una colección de gran tamaño, gran calidad y muy adecuada a los objetivos de la Unidad-.
En líneas generales, el proceso de alimentación de la base de datos se compone de los siguientes pasos:
- Seleccionar el documento: gracias a que Excalibur admite texto en diversos formatos, los documentos pueden ir desde el sumario de una revista hasta un artículo de prensa en HTML, pasando por informes en PDF, documentos en PowerPoint, etc. El único requisito a cumplir por el documento, por tanto, es que se adapte a las necesidades de nuestros usuarios.
- Guardar el documento en la unidad de red y carpeta correspondiente: en la red local han sido creadas diversas unidades que se corresponden con las librerías establecidas en Excalibur. Una vez seleccionada la unidad, se guarda el documento en la carpeta y unidad adecuadas.
- Tratamiento del documento: si, por ejemplo, el documento ha sido digitalizado con OCR, se comprueba la ortografía -de una parte, si es muy largo-; si se trata de un artículo de prensa bajado de la edición digital del periódico y escaneada la página, se elabora una ficha en Word con el texo de la noticia y se introduce una cabecera con los datos de: título del artículo, fecha de edición, periódico al que pertenece, identificadores -listado de términos o frases significativos creado por la Unidad sobre temas de interés para facilitar la recuperación de documentos, sobre todo en consultas booleanas- y tipología -opinión, editorial, reportaje, etc.-.
- Asociar la imagen al texto: una vez guardado el documento, se le asocia la imagen .tif correspondiente.
 

IV.3.2. Consultas a la base de datos

Aunque la intención es que sean los propios usuarios los que accedan Excalibur RetrievalWare, guarden sus consultas y definan sus propios agentes, en la actualidad la consulta es realizada por los técnicos documentalistas de la Unidad.
Como ya se ha comentado, Excalibur RetrievalWare permite buscar documentos sobre múltiples librerías utilizando un lenguaje de búsqueda natural.
 

La secuencia normal de operación empieza seleccionando las Librerías sobre las que desea hacer la búsqueda y pulsado el botón Buscar. En este momento se introduce la expresión a buscar y se seleccionan los parámetros que controlan la realización de la búsqueda. Pulsando el botón Buscar!, Excalibur lanza la búsqueda.

Como alternativa a la búsqueda simple, el sistema permite hacer consultas a través de una pantalla de búsqueda Experta, para ejercer un control directo sobre cómo quiere que se realice la búsqueda. Esta opción permite escoger los significados o palabras alternativas y asignar pesos individualmente a cada palabra.

Terminada y lanzada la secuencia de búsqueda, el programa abre la ventana de Resultados. Una la lista muestra todos los documentos encontrados y, clicando sobre cualquiera de ellos, podemos ver el contenido -los términos que hemos introducido en nuestra sentencia aparecen marcados-.

Excalibur permite guardar la consulta y los resultados para utilizarlos en otro momento, o guardar la sentencia y sus parámetros como un Agente. Éste podrá ser lanzado de manera automática sobre los nuevos documentos añadidos a la librería.

Por último, comentar que la opción Preferencias es usada para cambiar los valores predeterminados del programa.

Después de una visión general de los componentes de Excalibur RetrievalWare, a continuación pasamos a detallar cada una de las pantallas, así como las librerías y parámetros definidos ex profeso para la aplicación instalada en Presidencia de la Generalitat Valenciana:

La ventana de la izquierda tiene las opciones de Consultas y de Librerías.

 
 
- Los Agentes de Consulta -Real Time Profile Queries- muestran todas las consultas que previamente se han guardado como tales. Los agentes están contínuamente activos y recibiendo las modificaciones de los nuevos documentos. Pulsando sobre el nombre de uno de ellos, se ve la consulta y los resultados en la subventana derecha.
- Las Consultas Guardadas -Stored queries- muestran la lista de las consultas no-agentes guardadas. Pulsando sobre el nombre de una de ellas, se ve la consulta y/o los resultados en la subventana derecha.
- Seguidamente está la opción de borrar una consulta. Para ello hay que seleccionar la consulta y pulsar el botón Papelera -Trash-. Las consultas sólo son movidas a la papelera. No son borradas mientras que no vacíe la papelera.
Para vaciar la papelera, hay que pulsar el botón Vaciar -Empty all-. Si se quiere sacar algo de la papelera, primero hay que pulsar sobre el + para ver el contenido, y a continuación pulsar el checkbox asociado al nombre de la consulta y el botón Restaurar -Restore-.
 
Para seleccionar una Librería, sólo hay que clicar en el checkbox asociado al nombre.
El número y características de las Librerías son determinados por el centro, de acuerdo con sus necesidades.
Los criterios seguidos en Presidencia para crear las colecciones han sido el idioma, tipología y formato del documento. En la actualidad, hay dadas de alta las siguientes librerías:

 

 

En el margen izquierdo superior vienen indicadas la librerías seleccionadas. Debajo, una caja de texto permite introducir el o los términos de búsqueda.

La opción Parámetros de búsqueda que aparece a continuación permite definir la búsqueda y la presentación de los resultados:

A su vez, la parte inferior de la pantalla permite buscar por los campos definidos para la librería o librerías seleccionadas: uno, varios o todos.

Si pulsamos Usar selección experta, el sistema tendrá en cuenta los significados/alternativas que hemos seleccionado. Si optamos por Usar todos los significados/alternativas, la búsqueda no será experta.

Finalmente, la opción Peso aparece para cada palabra, y deja especificar la importancia de la misma en relación con las del resto de la expresión a la hora de recuperar los documentos. El resultado es una búsqueda más afinada, más específica.

 

 

 Lanzada la consulta, aparece la pantalla de Resultados. Dividida por la mitad, en la parte superior está el número total y la lista de los documentos recuperados, con el siguiente formato: un icono para ver el documento original, el número de documento -en la lista-, el nivel de relevancia, el título del documento, la librería a la que pertenece y un sumario o resumen del mismo.

 

Basta con pulsar sobre el icono del documento para ver el documento en su formato nativo -imagen, procesador de texto, PDF, etc.-. El documento se muestra en la subventana inferior o en una nueva ventana del navegador. En el texto del documento aparecen marcadas las palabras relevantes o hits encontradas en su búsqueda.

 
Desde esta pantalla es posible guardar la consulta y/o los resultados en una base de datos relacional, pulsando Guardar Consulta o Guardar Agente. Estos botones abren una ventana de diálogo donde se podrá introducir un nombre y un comentario, y elegir si quiere o no guardar los resultados. En este caso -Guardar Consulta- se puede seleccionar qué librerías estarán asociadas a la consulta. En Guardar Agente, sin embargo, se debe seleccionar una librería para la monitorización, y especificar el nivel de relevancia -cualquier documento de relevancia igual o superior a la indicada será guardado por el agente-.
 
El siguiente botón es QBE, que permite hacer una Query by Example -"consulta basada en el ejemplo"-. Utiliza los términos más significativos del texto actual para hacer una nueva búsqueda. Es decir, busca otros documentos como el que se está visualizando.
 
 
A continuación, Refinar sirve para hacer una búsqueda Recurrente. El sistema nos devuelve a la ventana de Buscar. La consulta que hagamos ahora estará limitada al conjunto de documentos encontrados en la búsqueda inicial.
Por último, pulsando sobre el título del documento se abre la ventana visor del Documento. Esta opción abre una nueva ventana del navegador independiente de las demás para ver el documento íntegro.

Los parámetros son:

 

 

 
 

IV.4. Novedades en Excalibur RetrievalWare de Presidencia

Hemos querido finalizar el trabajo mencionando dos proyectos en los que se está trabajando con el objeto de rentabilizar más una herramienta tan valiosa como es Excalibur RetrievalWare.

Por un lado, se están haciendo pruebas sobre el funcionamiento del módulo Spider -rastreador de páginas web- para poder sacarle el máximo partido.

Por otro, comentar la inminente puesta en funcionamiento del interfaz GVA-Excalibur Prensa. Como principal característica cabe destacar la posibilidad de mostrar unas consultas guardadas u otras en función del usuario que acceda al sistema.

En estos momentos se están definiendo los distintos usuarios -su número es ilimitado-, así como las búsquedas predefinidas almacenadas para cada uno -es posible definir hasta un total de 40 por usuario-; y se está elaborando un manual de usuario.

 

 

La pantalla de acceso se muestra a continuación:

 

 

 

 

 

 

 

 

 

V. CONCLUSIONES

 

La necesidad de un acceso rápido y eficaz a la información distribuida y en múltiples formatos, requiere de potentes software de recuperación.

Los productos Excalibur aparecen en el mercado como una solución de alto nivel que cumple con las expectativas.

La tecnología de Proceso de Reconocimiento Adaptativo de Patrones (APRP) y las Redes Semánticas abren amplios horizontes a las posibilidades de recuperación, al incorporar a la ya conocida búsqueda booleana, la patronal y la conceptual, lo que proporciona múltiples ventajas al usuario, ya que no necesita aprender complejos lenguajes de interrogación, permitiéndole realizar la búsqueda de una forma más intuitiva.

La arquitectura abierta, flexible y adaptable a cualquier entorno, hace de Excalibur una herramienta útil que le posiciona en el mercado en un nivel muy competitivo.

En lo referente a la comercialización de los productos que conforman la familia Excalibur, podemos extraer las siguientes conclusiones:

Se trata de una gama de productos de gran tradición en el mercado, recordemos que la primera versión apareció en 1990 y que hay que situarlo en el contexto de la industria de la información, donde se experimenta un crecimiento mucho más rápido que otros sectores profesionales.

El elevado número de clientes así como las organizaciones que lo comercializan dentro de sus diferentes tipologías, son una muestra de la fuerte penetración de Convera RetrievalWare (o sea Excalibur), especialmente en el continente americano y europeo y más concretamente en Gran Bretaña, como indica el elevado número de colaboradores que allí existen, tal y como se señala en el gráfico 1.

A esta gran expansión del producto a través de sus socios más directos, hay que sumar otros que forman parte junto con ellos de otras estrategias empresariales o comerciales que les permite la distribución del producto, es el caso del distribuidor OCS Technologies, que además de comercializarlo directamente o indirectamente a través de sus socios tecnológicos, también tiene un acuerdo de colaboración con otras empresas, por tanto la red de distribución tiene un crecimiento exponencial que explica esa penetración en el mercado

En cuanto al perfil profesional al que va dirigida esta gama de productos no está claramente definido, porque como se ha podido ver anteriormente en los respectivos apartados de clientes abarca todo tipo de organizaciones tanto públicas como privadas y tanto pertenecientes al sector profesional de la información como a otros sectores que nada tienen que ver con este ámbito. Sin embargo, la característica común que se puede señalar de todas estas organizaciones es que se trata de instituciones con un gran volumen de información en diferentes formatos, que necesita ser organizada para su posterior recuperación y que tienen un cierto peso tanto profesional como económico para poder adquirir y gestionar el producto.

Pese a las indudables posibilidades de consulta, el hecho de ser muy intuitivo y tener un interfaz de uso bastante sencillo, no hay duda de que un manejo de la pantalla de búsqueda tal que dé resultados altamente precisos de forma sistemática, tiene que ser necesariamente consecuencia de un aprendizaje de días.

 

 

VI. BIBLIOGRAFÍA

Ai-center. Dirección electrónica: <http://www.ai-center.com>. [Fecha de consulta: 2-05-2002].

Algunas aplicaciones de redes neuronales artificiales en documentación. El caso Excalibur. Noverges, N…et al. Trabajo de la asignatura SRP 2001-2002. En http://ttt.upv.es/ccarrasc/

Convera/Excalibur RetrievalWare: Search Tools Report. http://www.searchtools.com/tools/retrievalware.html [Consultado el 06-05-02]

CONVERA - Digital Content Management for the Enterprise. Dirección electrónica: <http://www.convera.com> [Fecha de consulta: 12-04-2002].

Excalibur. Electronic Warfare Simulation and Training http://www.excalibur.com/ [Consultado el 29-04-02]

Excalibur: Recuperación inteligente de información. Madrid: OCS Software. http://www.ocstechnologies.com/downloads/productos/Ficha%20Excalibur.pdf [Consultado el 24-04-02]

Excalibur RetrievalWare. Madrid: OCS Software http://www.ocstechnologies.com/downloads/productos/Retrievalware.doc [Consultado el 25-04-02]

Excalibur Screening Room. Madrid: OCS Software http://www.ocstechnologies.com/downloads/productos/Screening%20Room.doc [Consultado el 06-05-02]

Excalibur: The LaText-Aware Spelling checker. http://www.eg.bucknell.edu/~excalibr/excalibur.html [Consultado el 08-05-02]

Excalibur Visual RetrievalWare. Madrid: OCS Software http://www.ocstechnologies.com/downloads/productos/Visual%20Retrievalware.doc [Consultado el 06-05-02]

Grupo OCS Technologies [en línea]. Dirección electrónica: <http://www.ocs.technologies.com> [Fecha de consulta: 12-04-2002].

Systems administrator's guide: RetrievalWare version 6.0. Columbia: Excalibur Technologies, 1997. http://www.ai-center.com/projects/excalibur/ [Consultado el 25-04-02]

Zaconne, Ricck. Excalibur. Dirección electrónica: < http://www.eg.bucknell.edu/~excalibr/excalibur.html> [Fecha de consulta: 29-03-2002].