Está en la página 1de 7

Historia del Internet

Los inicio de Internet nos remontan a los aos 60. En plena guerra fra, Estados Unidos crea una red exclusivamente militar, con el objetivo de que, en el hipottico caso de un ataque ruso, se pudiera tener acceso a la informacin militar desde cualquier punto del pas. Este red se cre en 1969 y se llam ARPANET. En principio, la red contaba con 4 ordenadores distribuidos entre distintas universidades del pas. Dos aos despus, ya contaba con unos 40 ordenadores conectados. Tanto fue el crecimiento de la red que su sistema de comunicacin se qued obsoleto. Entonces dos investigadores crearon el Protocolo TCP/IP, que se convirti en el estndar de comunicaciones dentro de las redes informticas (actualmente seguimos utilizando dicho protocolo). ARPANET sigui creciendo y abrindose al mundo, y cualquier persona con fines acadmicos o de investigacin poda tener acceso a la red. Las funciones militares se desligaron de ARPANET y fueron a parar a MILNET, una nueva red creada por los Estados Unidos. La NSF (National Science Fundation) crea su propia red informtica llamada NSFNET, que ms tarde absorbe a ARPANET, creando as una gran red con propsitos cientficos y acadmicos. El desarrollo de las redes fue abismal, y se crean nuevas redes de libre acceso que ms tarde se unen a NSFNET, formando el embrin de lo que hoy conocemos como INTERNET. En 1985 la Internet ya era una tecnologa establecida, aunque conocida por unos pocos. El autor William Gibson hizo una revelacin: el trmino "ciberespacio". En ese tiempo la red era basicamente textual, as que el autor se baso en los videojuegos. Con el tiempo la palabra "ciberespacio" termin por ser sinonimo de Internet. El desarrollo de NSFNET fue tal que hacia el ao 1990 ya contaba con alrededor de 100.000 servidores. En el Centro Europeo de Investigaciones Nucleares (CERN), Tim Berners Lee diriga la bsqueda de un sistema de almacenamiento y recuperacin de datos. Berners Lee retom la idea de Ted Nelson (un proyecto llamado "Xanad" ) de usar hipervnculos. Robert Caillau quien cooper con el proyecto, cuanta que en 1990 deciden ponerle un nombre al sistema y lo llamarn World Wide Web (WWW) o telaraa mundial. La nueva formula permita vincular informacin en forma lgica y atravs de las redes. El contenido se programaba en un lenguaje de hipertexto con "etquetas" que asignaban una funcin a cada parte del contenido. Luego, un programa de computacin, un intrprete, eran capaz de leer esas etiquetas para despeglar la informacin. Ese interprete sera conocido como "navegador" o

"browser". En 1993 Marc Andreesen produjo la primera versin del navegador "Mosaic", que permiti acceder con mayor naturalidad a la WWW. La interfaz grfica iba ms all de lo previsto y la facilidad con la que poda manejarse el programa abra la red a los legos. Poco despus Andreesen encabez la creacin del programa Netscape.

Apartir de entonces Internet comenz a crecer ms rpido que otro medio de comunicacin, convirtiendose en lo que hoy todos conocemos. Algunos de los servicios disponibles en Internet aparte de la WEB son el acceso remoto a otras mquinas (SSH y telnet), transferencia de archivos (FTP), correo electrnico (SMTP), conversaciones en lnea (IMSN MESSENGER, ICQ, YIM, AOL, jabber), transmisin de archivos (P2P, P2M, descarga directa), etc.

ARCHIE
En 1989 un estudiante, Peter Deutsch de la McGill University de Montreal, cre un sistema buscador de ficheros en servidores FTP ( 8.2) denominado Archie [1] basado en una idea muy simple: construir un ndice que contiene los nombres de los ficheros y la direccin del servidor donde se encuentran. Este ndice se instala en un servidor que pueda ser consultado por todos (Servidor Archie). Se trata pues de una suerte de directorio (como la gua de telfonos), pero no de personas sino de ficheros, con informacin muy escueta sobre cada fichero; junto con el nombre y direccin del servidor FTP que lo alberga, una sucinta descripcin del mismo. El funcionamiento se basa en que el usuario pregunta al servidor Archie por el nombre del fichero que desea, y el sistema responde con una lista de sitios donde puede encontrarlo.

En realidad, Archie es mas que un solo servidor, es un sistema de base de datos distribuida, en la que los ndices se guardan en distintos servidores de FTP que cuentan con informacin sobre millones de ficheros. Para mantener actualizados los ndices, los servidores de Archie se conectan mensualmente a los sitios FTP que tienen registrados y recogen los cambios observados [2]. Una vez efectuada la consulta, puede usarse un programa FTP para bajarse el fichero localizado [3]. El servicio Archie tuvo mucho xito y pronto se difundi por la red -El servidor de la propia McGill registraba unas 30 conexiones diarias en Noviembre de 1990, que haban pasado a ser 2.600 para Septiembre del 91-. El programa original fue posteriormente retocado y mantenido por el Archie Group de la dicha universidad, pero adoleca de la dificultad de que haba que conocer de antemano el nombre del fichero buscado. Para subsanar esta dificultad surgieron programas o servicios como CWIS, WAIS y Gopher, que permitan buscar por contenidos y no solo por nombres. En Otoo de 1991 se estimaba que los servidores Archie contenan informacin sobre unos 900 servidores FTP, distribuidos por los cinco continentes, con 1 milln de ficheros y un ritmo de crecimiento de 7 a 10 nuevos sitios cada semana (contando solo servidores Unix). En Agosto de

1994 existan unos 1.200 servidores FTP annimos, con cientos, a veces miles de ficheros en cada uno. Incluso sabiendo el servidor en que hay que buscar, la tarea no es fcil, por lo que es mejor preguntar a Archie en la esperanza que haya indizado todos los ficheros de cada uno de los servidores que tiene registrados. A la fecha (1998), los ficheros en servidores FTP clasificados por Archie se referan mayoritariamente a informacin tcnica relacionadas con la ingeniera, las ciencias de la computacin y catlogos de bibliotecas. Este ltimo campo de informacin (la catalogacin de fondos bibliogrficos), es uno de los que ha tenido ms rpido carecimiento en Internet, de forma que bibliotecas de la ms variada ndole, Colegios, Universidades, Instituciones, etc. se han apresurado a "Publicar" sus fondos en la Web (se supone que una vez estn los catlogos, el prximo paso ser contar con la obra misma). Tradicionalmente han existido tres maneras de acceder a servidores Archie para hacer consultas: y y Correo electrnico. Los servidores Archie disponen de una interfaz que permite a los clientes enviar preguntas y recibir las respuestas por e-mail ( 8.1). Sesin remota (Telnet 8.7). Evidentemente para usar este procedimiento es necesario tener una "Cuenta" en un Servidor Archie para que podamos conectarnos al mismo, con Telnet, y realizar la consulta, o bien que el servidor sea annimo. Cliente Archie, de los que existen infinidad. En esencia los clientes Archie son meras interfaces que permiten acceso remoto (Telnet) a los servidores (mediante el protocolo Prospero). Permiten realizar consultas y bsquedas; bajar listas de contenido por FTP, y enviar mensajes al servidor e-mail del sistema anfitrin, que se encarga de enviar automticamente listados del ndice o del resultado de la bsqueda. Todo ello sin necesidad de utilizar directamente los comandos Unix. Adems, estos programas suelen tener tambin capacidad FTP, de forma que es posible bajarse el fichero una vez localizado. Tambin puede darse la circunstancia complementaria, que los buenos clientes FTP cuenten con la capacidad aadida de buscar en los Servidores Archie.

Archie ha seguido perfeccionndose y extendiendo el servicio, a fin de ampliar el tipo de informacin proporcionado, incluyendo directorios de "Pginas Amarillas" y de direcciones de correo. Actualmente es mucho ms fcil utilizar las mltiples pasarelas Web [4] (la Web est fagocitando muchos de estos proto-servicios de Internet). Por otra parte, los modernos robots de bsqueda estn convirtiendo en obsoletos estos servicios que sern pronto reliquias histricas.

Gopher
Para superar algunos de los problemas de Archie, en 1991, un equipo dirigido por Mark McCahill de la universidad de Minnesota, crea Gopher (inicialmente solo estaba pensado para administrar informacin en el mbito del campus de la propia Universidad). Se trata de un sistema clienteservidor (precursor de la Web en ciertos aspectos), en el que los proveedores de informacin disponen de un sistema (servidor Gopher), que organiza un sistema de ndices jerarquizado con las descripciones de los datos que contiene el servidor. Una especie de gua de contenido, que los clientes por su parte vern como mens por los que navegar (con una estructura que remeda la organizacin de directorios y ficheros en cualquier ordenador), de forma que se puede ir horquillando la bsqueda hasta dar con la informacin buscada.

Como se ha dicho, debido a ciertas peculiaridades, Gopher es considerado el precursor de la Web. De hecho, un cliente Gopher permite una cierta clase de "Navegacin" por la informacin, ya que estos servidores almacenan informacin, creando lo que se dio en llamar Gopherespacio (un remedo de Ciberespacio actual). La simplicidad del modelo permiti que de inmediato se construyeran clientes Gopher para multitud de plataformas, y el sistema se extendi rpidamente (en Noviembre de 1993 ya haba censados unos 2.200 servidores Gopher). Adems utiliza un protocolo muy sencillo (a medio camino entre FTP y HTTP). Gopher presenta la informacin organizada en un smil de directorios y ficheros (como FTP), mientras que comparte con HTTP el poder referenciar informacin que est fsicamente situada en cualquier parte del sistema, incluso fuera de la propia red local (en otro continente). Esta similitud ha permitido dotar a los navegadores actuales de capacidades Gopher, de forma que el Gopherespacio puede ser navegado como parte de la propia Web [5]. Aunque este protocolo caera en desuso con la aparicin de HTTP ( 5.2) y la Word Wide Web, MS I. Explorer incluye un cliente gopher que permite acceder a este tipo de servicios a travs de URLs que comiencen con gopher://. Desde el navegador se puede usar un comando Gopher como se hace como con cualquier otro: gopher://nombre.de.servidor/pathname Nombre de servidor es el nombre del dominio que aloja al servidor Pathname es la direccin completa del fichero dentro del dominio. Ms informacin en Nota 19 ( N.19).

VERONICA
Para resolver algunos problemas que presentan las bsquedas en el Gopherespacio, por ejemplo, cuando no se saba en que servidor empezar la bsqueda, o la clasificacin exacta del recurso deseado, se inventa VERONICA ("Very Ease Rodent-Oriented Netwide Index To Computerized Archives") en la Universidad de Nevada [6]. Este servicio hace en el Gopherespacio lo que Archie en los servidores FTP, es decir, crear un motor que escana peridicamente los servidores Gopher, construyendo un ndice con el contenido de sus mens. Por esta razn Veronica ha sido denominado el "Archie del Gopherespacio". Recordemos que Gopher es un sistema de bsqueda mediante navegacin (sistema de ndices navegables ), pero gracias a Veronica el Gopherespacio se convierte tambin en un rea donde son posibles bsquedas del tipo pregunta-respuesta. Su eficacia y popularidad se deben a que los clientes Gopher pueden acceder al servidor Veronica, e inmediatamente (gracias al sistema de hiperenlaces de sus mens, y a la poltica de puertas abiertas de la mayora de los sitios), a los servidores Gopher que contienen los recursos encontrados. Veronica encuentra e indiza la prctica totalidad de los servidores Gopher de acceso pblico. En Febrero de 1994 contena ndices de mas de 3.200 de estos servidores en unos 2.500 equipos de Internet. En dicho mes las consultas a servidores Veronica se estimaron en 1.200.000 accesos,

siendo resultas la mayora en menos de 20 segundos. Ocho de estos servidores (de grandes instituciones) atendan las necesidades del pblico de Internet en general, mientras que algunos otros atendan las necesidades especficas de ciertas organizaciones. El servicio Veronica comprende dos tareas (que no tienen porqu ser realizadas necesariamente por el mismo ordenador): y y Recolectar datos de los servidores Gopher e indizarlos de forma que sean utilizables. Poner esta informacin a disposicin de los clientes.

Los servidores Veronica son fcilmente accesibles mediante los propios clientes Gopher (actualmente tambin se puede acceder a Veronica desde pasarelas Web), ofreciendo varios tipos de bsquedas. Desde las mas simples (de una sencilla palabra clave), a interrogaciones lgicas de tipo booleano (and, or, not, etc. Ap. K) de cualquier complejidad (incluyendo parntesis). Es posible as mismo establecer el nmero mximo de respuestas que se desean, as como restringir la bsqueda a ciertos tipos Gopher. Los resultados de las interrogaciones se obtienen en formato Gopher, es decir, como una serie de temes de tipo men, cuyos ttulos responden al criterio de bsqueda utilizado. Debido a que la interrogacin se realiza utilizando un cliente Gopher, el usuario puede ya seleccionar directamente cualquiera de estos temes que le conducir directamente al servidor Gopher que contiene la informacin correspondiente. En 1994 la recoleccin y preparacin de datos era realizada por la Universidad de Nevada que distribua los resultados a los diversos servidores Veronica. Desde el propio Veronica se pueden obtener mas instrucciones sobre su utilizacin.

WHAIS
El sistema WAIS ("Wide Area Information Servers system"), fue introducido en 1991 por Thinking Machines Corporation de Cambridge, Massachusetts en colaboracin con Apple Computer, Dow Jones & Company y KPMG Peat Marwick. Nota: Otras fuentes citan que WAIS fue creado en 1989 por Brewster Kahle, un desarrollador de Thinking Machines (que ms tarde fundara The Internet Archieve), que comienza a trabajar en un sistema para compartir datos de redes, incluyendo Internet; se traslada a San Francisco y funda WAIS Inc. Aqu es donde interviene WAIS. Brewster Kahle, fundador y presidente de WAIS Inc. declaraba en septiembre pasado (1998) a Internet World: "Nos gusta usar esta analoga: un libro tiene tres secciones: la tabla de contenidos; las pginas, y el ndice analtico. As que pensemos en la Internet como en un libro: est Gopher, que es la tabla de contenidos; est el World-Wide Web, que son las pginas de hipertexto, y est WAIS, que es una bsqueda directa cuando sabes lo que quieres". Cuando uno sabe lo que busca, y slo le falta encontrarlo, tiene WAIS, que sera algo as como un ndice analtico para el WWW. Pero WAIS no se ha conformado siempre con este papel secundario. En un principio aspiraba a ser mucho ms.

Ms adelante aade: Si tenemos xito, nadie sabr que est usando WAIS ... Slo estamos interesados en ser la parte de atrs, y la fontanera slo se nota cuando funciona mal. As que nuestro objetivo es estar fuera de vista y trabajar. El prrafo anterior es de Carles Bellver Torl, "ndices electrnicos en el World-Wide Web" http://nti.uji.es/docs/nti/net/indices.html. (este artculo se public originalmente en el nmero de febrero de 1996 en la revista Net Conexin).

Se trata de un sistema electrnico de indizado, publicacin y recuperacin de informacin multimedia, en un entorno de red, es decir: de bases de datos personales, corporativas o pblicas en cualquier punto del mundo. La informacin es accesible con independencia de su formato, ya sea texto corriente, documentos formateados, imgenes, hojas de clculo, grficos sonidos o video [7]. Nota: Algunos sistemas actuales son ya capaces de identificar y leer mas de 200 formatos de archivo diferentes y estas habilidades crecen sin parar.

Utiliza un modelo Cliente/Servidor y un sencillo protocolo (Z39.50-1988). Consta de tres paquetes software de los que existen versiones para la mayora de los Sistemas Operativos (mas detalles en: y www.iti.gov.sg). El sistema tiene varios componentes: Indizador: Permite clasificar automticamente cualquier cantidad de informacin por grande que sea. Se distingue de otros sistemas de ndice, como Archie o Veronica, en que no solo puede indizar los documentos contenidos en un servidor, tambin indizar una descripcin del contenido del mismo. Servidor: Permite hacer utilizable la informacin a travs de redes como Internet. Un servidor Wais permite al administrador establecer un ndice de los documentos (o recursos) que sern publicados. Dispone de un agente, encargado de recibir las interrogaciones de los clientes y devolver el resultado. Por su parte, el usuario del servicio puede utilizar un cliente Wais, encadenarlo a un servidor especfico, establecer un patrn de bsqueda y asociarlo a su vez al ndice del servidor, de forma que bsquedas que hayan sido probadas satisfactoriamente pueden ser repetidas automticamente, y que avisen de la nueva informacin que haya al respecto tan pronto como se encuentre disponible. Cliente Wais: Como clientes pueden usarse clientes Wais especficos; clientes Gopher (mediante una pasarela trasparente para el usuario), y clientes Web (Navegadores) como Mosaic, Netscape o MS I Explorer (tambin mediante pasarelas). Esta ltima facilidad es responsable de que, en la prctica, resulte excepcional la utilizacin de clientes Wais, siendo por lo comn interrogados los servidores con los navegadores mediante pasarelas Web. En la Universidad Complutense de Madrid existe una de estas pasarelas, aunque recientemente (1998) ha dejado de actualizar sus ndices: www.ucm.es.

El sistema permite ser interrogado en lenguaje natural, de forma que la bsqueda y recuperacin de informacin se realizan utilizando el lenguaje nativo (se han usado Ingles, Francs, Italiano y

Latn). Las palabras mas comunes ("stop" words) son eliminadas y se suponen "OR" lgicos implcitos entre las palabras que quedan. Tambin se permiten bsquedas lgicas (booleanas) e incluso de condiciones de proximidad de palabras, etc. El servidor Wais lee la consulta, busca a continuacin en la totalidad de los textos de su base de datos, intentando encontrar los documentos que considera concordantes al respecto. A continuacin, los documentos seleccionados, son ordenados mediante un proceso estadstico tras asignar un cierto peso a las palabras segn un esquema de su relevancia probable (que incluye no solo el nmero de encuentros en el texto sino la proximidad de unos a otros); de esta forma, el sistema contesta proporcionando la informacin de forma ponderada y ordenada segn su importancia probable. En realidad, el servidor no tiene que comprender totalmente la pregunta, el sistema de recuperacin de la informacin se base en un mtodo de bsqueda que contiene elementos de lgica difusa, denominado de realimentacin de relevancia ("Relevance feedback"). El usuario puede elegir ver determinados documentos o realizar un nuevo afinado. Una de las caractersticas ms interesantes de la utilizacin de esta lgica es que, con el fin de refinar bsquedas sucesivas, los documentos ms relevantes encontrados (cualquiera que sea su tamao), pueden ser reenviados al servidor dicindole: "Encuntrame algo ms, parecido a esto". Muchos de los servicios de bsquedas distribuidas que permiten consultas en lenguaje natural sobre ndices (muchos buscadores de la Web), utilizan sistemas Wais (algunos son claramente identificables, precisamente porque devuelven los resultados ordenados en orden de importancia decreciente).