Por Cristòfol Rovira
WAIS (Wide area information server) es un servicio de Internet, basado en el protocolo Z39.50, que funciona bajo la arquitectura cliente/servidor. Con él se pueden crear y gestionar bases de datos documentales en Internet a partir de ficheros ascii, páginas html, ficheros de gráficos, registros en formato MARC… Cualquier documento de texto puede ser convertido en base de datos indicando, mediante etiquetas, el inicio de cada campo y el cambio de registro.
Incorpora las opciones básicas de los programas de gestión documental, como búsqueda con operadores booleanos, limitación por campos, operadores de proximidad, truncamientos, fichero de palabras vacías…, características que han hecho que WAIS sea, hasta hace poco, la única opción para ofrecer bases de datos documentales en Internet. Ahora, en cambio, parece que se avecina una avalancha de este tipo de productos.
No obstante, el servicio WAIS ha tenido poca aceptación: casi nadie se instala un cliente WAIS para buscar información en Internet. Sorprende esta situación al constatar que este sistema tiene la misma base tecnológica (cliente/servidor) y las mismas condiciones de adquisición (gratuidad) que otros productos de Internet. Hay dos motivos básicos para esta infrautilización:
– la todavía deficiente integración del WAIS en la World Wide Web y
– la aparición de los buscadores (motores de búsqueda en la traducción literal del inglés search engines).
Orígenes de WAIS
Se debe a un proyecto conjunto, de finales de los años 80, de las empresas Apple, Thinking Machines y Dow Jones dirigido por Brewster Kahle (en la foto de Wikipedia), el fundador del Internet Archive y de Alexa. El objetivo era construir un programa para facilitar la búsqueda de información en Internet. El diseño original funcionaba mediante comandos en una interface no gráfica. Sin embargo, la gran aceptación de la World Wide Web provocó la creación de pasarelas para consultar bases de datos WAIS a partir de páginas html, siguiendo la tendencia general de incorporar todos los servicios de Internet en la Web y convirtiendo al html en la interface estándar de usuario.
La integración del WAIS en la web es posible gracias a los CGI (Common Gateway Interface), scripts que permiten ejecutar un programa externo a la web, suministrando desde una página html los parámetros y datos necesarios para que el programa funcione y mostrando los resultados también en formato html. Este modo de incorporar el WAIS a la Web tiene la ventaja de aprovechar el software existente, aunque el rendimiento obviamente se resiente. El uso de los servidores WAIS a partir de páginas html ha hecho innecesario instalar clientes WAIS. Tampoco se usan direcciones WAIS, ya que en la mayoría de ocasiones se accede directamente a un formulario albergado en una web, ejecutando una búsqueda sin saber siquiera que se está utilizando este programa.
El objetivo final de los WAIS se ha modificado con la aparición de la Web. El diseño original buscaba la indexación de la información de Internet de manera descentralizada, con la pretensión de abarcar toda la red. En la actualidad son los motores de búsqueda los que tienen este objetivo, pero de manera más centralizada. Los WAIS se utilizan ahora para ofrecer bases de datos o catálogos con la documentación interna de una organización. Por tanto, las búsquedas WAIS siempre serán muy parciales, aunque se ofrezca la opción de interrogar diversas bases de datos al mismo tiempo.
WAIS y motores de búsqueda
Aunque los WAIS y los buscadores realicen funciones paralelas, tienen diferencias importantes que determinan un uso diferenciado de ambos recursos. Los motores de búsqueda son productos comerciales con una infraestructura tecnológica y humana muy importante y con una administración centralizada. Los WAIS, en cambio, no tienen una orientación comercial, ni una administración centralizada porque indexan sólo la información interna de una organización, utilizando muchas veces un software de dominio público.
CARACTERÍSTICAS | MOTORES DE BÚSQUEDA | WAIS |
Arquitectura | Cliente Web y servidor Web | 1. Cliente WAIS y servidor WAIS 2. Cliente Web y servidor (Web + WAIS) |
Protocolo | HTTP | WAIS |
Administración | Centralizada | Descentralizada |
Indexación | 1. Automática o semiautomática 2. Sobre el texto completo o sobre partes del documento | 1. Manual 2. Sobre el texto completo |
Contenido de la bdd | La indexación del recurso y un enlace al recurso | La indexación del documento y el documento |
Recursos indexados | Web, Gopher, FTP, texto… | Web y texto |
Software | Propietario | Wais Inc. o FreeWais |
Orientación del servicio | Comercial | No comercial |
Alcance | Toda la Internet | La documentación de una organización |
Cuadro 1. Comparación entre los buscadores y el servicio WAIS
Otra diferencia importante es el tipo de indexación que ofrece cada producto. Por un lado, los motores de búsqueda disponen de un módulo de indexación automática que «viaja» autónomamente por Internet, recogiendo direcciones y indexando según las propiedades estadísticas de los recursos localizados. Posteriormente algunos buscadores realizan además una clasificación manual. El resultado de este proceso es una base de datos de referencias a recursos de Internet, con sus correspondientes enlaces. En los WAIS, en cambio, la indexación es sólo manual, y el resultado de la indexación incluye los ficheros de índices que permitirán diferentes tipos de búsquedas y el propio documento indexado.
En otras palabras, los motores de búsqueda son bases de datos referenciales y los WAIS normalmente son bases de datos a texto completo. Esta diferencia que en otros soportes (papel, cd-rom, bases de datos online) sería esencial, tiene poca importancia en Internet, ya que en este medio tener la referencia a un documento es prácticamente lo mismo que tener el propio documento (a no ser que la dirección no esté actualizada). En realidad son dos productos complementarios: los WAIS para realizar búsquedas muy concretas sobre la documentación de una organización y los motores de búsqueda para realizar búsquedas sobre toda la Internet.
WAIS público y WAIS privado
A partir de 1992 Brewster Kahle y Bruce Gilliat continuaron el proyecto iniciado por Apple, Thinking Machines y Dow Jones fundando la empresa WAIS Inc
http://www.wais.com
Paralelamente algunas organizaciones, sin ánimo de lucro, creaban versiones de dominio público de WAIS, responsabilizándose de su mantenimiento con nuevas versiones y moderando grupos de discusión sobre sus productos:
- freeWais creado por CNIDR (Clearinghouse for Networked Information Discovery and Retrieval)
http://ls6‑www.informatik.uni‑dortmund.de/freeWAIS‑sf/README‑sf
ftp://ftp.cnidr.org/pub/NIDR.tools
- freeWais-sf de la Universidad de Dortmund
ftp://ls6-www.informatik.uni-dortmund.de/pub/wais
Las características de las versiones públicas y privadas de WAIS son muy parecidas, aunque el WAIS de pago incluye algunas opciones más potentes en la definición de formatos de registro y en las búsquedas.
Existen otros programas en Internet que realizan las mismas funciones que WAIS: Los más conocidos son Swish
http://www.eit.com/software/swish/swish.html
e Isite
http://vinca.cnidr.org/software/Isite/Isite.html
Ambos son de dominio público y funcionan también bajo la norma Z39.50. Swish permite recuperar información sobre los índices generados por WAIS. Sus creadores dicen que ofrece una instalación más sencilla. Isite está formado por un recuperador (Isearch) y un indexador que genera los índices en su propio formato.
Instalación de freeWais-sf
El freeWais-sf apareció después del freeWais, funciona sobre la versión 2 de la norma Z39.50 y mejora sustancialmente el tratamiento por campos que ofrecía su predecesor. Por ahora es el WAIS de uso público el que ofrece más garantías y mejores prestaciones. Está formado por tres módulos:
- WaisIndex: es el módulo que indexa todos los términos del fichero de entrada, creando el fichero inverso.
- WaisServer: módulo que permite las búsquedas externas según la norma 50-88.
- WaisSearch: es la interface de usuario basada en las flechas del cursor y no gráfica.
Características | Isite | freeWais | freeWais-sf | Wais Inc. | Características constantes |
Fichero inverso | Sí | Sí | Sí | Sí | * |
Fichero palabras vacías | Sí | Sí | Sí | Sí | * |
Thesaurus | No | No | No | No | * |
Fichero sinónimos | Sí | Sí | Sí | Sí | * |
Búsquedas por campos | Sí | No | Sí | Sí | |
Operadores booleanos | Sí | Sí | Sí | Sí | * |
Operadores de proximidad | No | No | Sí | Sí | |
Búsquedas por rangos | ? | No | Sí | Sí | |
Búsquedas leng. natural | Sí | Sí | Sí | Sí | * |
Truncamiento | Sí | Sí | Sí | Sí | * |
Recuperar últimas búsquedas | No | No | No | No | * |
Formato de registro | Sí | Sí | Sí | Sí | * |
Cuadro 2. Comparación entre aplicaciones Z39.50.
La instalación de freeWais-sf, y en general cualquier producto de uso público, exige grandes dosis de paciencia por el mal acabado en los programas de instalación. Los ficheros que se obtienen vía FTP están en código fuente y se compilan en la máquina donde serán instalados según las características de su sistema operativo.
freeWais-sf dispone de un script de instalación que ayuda en este proceso, va pidiendo al usuario las características de la plataforma, para seguidamente compilar con los parámetros adecuados.
Para hacer accesible el freeWais-sf desde la Web hay que instalar también un CGI. Hay diferentes opciones, por ejemplo:
- pl
ftp://ftp.ncsa.edu/web/ncsa_httpd/cgi/wais.tar.Z
Uno de los primeros CGI para acceder a freeWais desde la web. Está realizado en perl con sólo dos páginas de código. - wwwwais
ftp://ftp.eit.com/pub/web.software/wwwwais/
CGI mucho más completo con veinte páginas de código, realizado en C y bien documentado (entre los ficheros de instalación hay una página html explicativa: html - SF-gate
http://ls6-www.informatik.uni-dortmund.de/SFgate/SFgate.html
Es el CGI de más reciente creación, muy sólido, bien documentado y con más opciones de búsqueda que los anteriores.
SF-gate es el CGI que ofrece más garantías para trabajar junto a freeWais-sf. También hay que compilarlo en la máquina del servidor y crear una página html que utilizará el usuario en sus consultas. Esta página está formada por una etiqueta <form> para recoger las opciones de búsqueda: términos a buscar, campos a utilizar, número máximo de ítems a encontrar… El form ejecuta el CGI que, a su vez, ejecuta el freeWais-sf según estos parámetros y procesa la respuesta para mostrarla en formato html.
En resumen, FreeWais-sf y SF-gate son dos aplicaciones de dominio público que permiten hacer accesibles bases de datos documentales y catálogos en Internet. A pesar de algunas lagunas en la indexación por frases y en el fichero de sinónimos, ofrecen las prestaciones básicas de una base de datos documental clásica. Con un poco de paciencia en el proceso de instalación, se obtendrá una herramienta para ofrecer búsquedas en bases de datos de todo tipo de documentos: catálogos en formato MARC, páginas web, documento de texto con estructura de campos…
Direcciones útiles
Grupo de discusión sobre WAIS:
comp.infosystems.wais
Lista de distribución sobre Isite:
listserv@vinca.cnidr.org
isite-l@vinca.cnidr.org
Lista de distribución sobre freeWais-sf:
fwsf@marcy.informatik.uni-dortmund.de
Home de Isite:
http://vinca.cnidr.org/software/Isite/Isite.html
Manual creado por la University of Leeds sobre cómo instalar un servidor web. Tiene un apartado sobre programas de indexación y búsqueda muy completo:
http://www.leeds.ac.uk/ucs/WWW/handbook/handbook.html
Cristòfol Rovira Fontanals
Secció Científica de Biblioteconomia i Documentació.
Departament de Ciències Polítiques i Socials.
Universitat Pompeu Fabra, Barcelona.
Tel.: +34-3-542 22 64; fax: 542 23 72
rovira_cristofol@fcsc.upf.es
—
Esta información se publicó en la revista Information World en Español (IWE), v. 6, n. 3, marzo de 1997, pp. 22-24.
- Volver al índice de este v. 6, n. 3:
https://staging.scimagoepi.com/information-world-en-espanol-iwe-v-6-n-3-marzo-de-1997
- Volver a la página principal de Information World en Español (IWE):
https://staging.scimagoepi.com/information-world-en-espanol-iwe

