Está en la página 1de 10

La búsqueda de información en Internet

Lic. Francisco Javier Albarello

Guía de lectura
1- Enumere y explique las distintas herramientas de búsqueda en internet
2- Revise y actualice la guía de motores de búsqueda, directorios y metabuscadores
que menciona el texto. Elabore un listado actual
3-¿Cúales son las limitaciones de los buscadores?
4-¿Qué es la Web invisible y cúal su tamaño?
5-¿Cómo buscar información en Internet?
6- ¿Cuáles son los distintos tipos de Web profunda?

Los motores de búsqueda son las herramientas privilegiadas para encontrar


información en Internet, y aprender su utilización puede mejorar el uso de la red
como fuente de documentación.
Sin embargo, los buscadores tienen sus sesgos y limitaciones, así como sus criterios
de agenda y de inclusión de determinados temas en sus índices.
Conocer sus posibilidades y defectos es una manera de hacer un uso inteligente de
las posibilidades que nos brinda la web.
Asimismo, los mentores de la red ya están pensando en desarrollar una red más
"inteligente": la web semántica, que proyecta ajustarse más a las necesidades
específicas de cada usuario.

LA BUSQUEDA DE INFORMACIÓN EN INTERNET

Antecedentes: la biblioteca y la enciclopedia

La documentación electrónica

La información en Internet

Los motores de búsqueda de Internet

Búsquedas básicas

Búsquedas avanzadas

Metabuscadores

Buscadores temáticos

Las limitaciones y los sesgos de los buscadores en Internet

El problema de la indexación
El mito de la neutralidad de la tecnología

Encontrar lo que no se quiere

Un estudio de caso

La web inteligente

BIBLIOGRAFÍA

Antecedentes: la biblioteca y la enciclopedia

Desde que el hombre es hombre necesitó comunicarse con sus semejantes, y esa capacidad de
simbolizar es el rasgo cualitativo que lo separó del animal. Las culturas orales recurrieron al
uso de la memoria como sistema de preservación de la información, la tradición y la identidad,
y la función de los mayores, los ancianos y los padres de la comunidad era la de recordación
de la historia de determinada agrupación humana: sus héroes, sus batallas, sus tiempos de
abundancia y sus crisis. Gracias a su memoria se podía recuperar información del pasado para
aplicarla en acciones futuras. Con el advenimiento de la escritura no sólo hubo un cambio en el
modo de comunicar, sino que con ella nació la documentación: la capacidad de almacenar
documentos de información que podían resistir el paso de los años y trascender la fragilidad de
la memoria de los padres de las culturas orales.

De esta forma, se puede establecer que la primera etapa destacable en los sistemas de
almacenamiento de información tiene que ver con la institucionalización de la biblioteca como
lugar donde se conservaban los volúmenes de autores diversos. La historia de la biblioteca
estuvo muy marcada por el condicionante de la alfabetización, a la cual accedían
principalmente las clases pudientes, y tuvo su bastión principal en los monasterios de clausura.
Los monjes, que accedían a la alfabetización y en muchos casos dedicaban su vida a copiar
volúmenes en los scriptoriums de los conventos, tenían al alcance de sus manos el acerbo
cultural de la época, y el bibliotecario hacía uso de un poder exclusivo: controlar el acceso a l a
información. Con la invención de la imprenta de Gutemberg todo eso cambió: los libros, ahora
reproducidos mecánicamente, ganando en economía y rapidez, se les fueron de las manos a
los monjes en los monasterios y a la Iglesia Católica, que en plena Edad Media monopolizaba
la producción del saber. Si no fuera por la Imprenta, no hubiera existido la Reforma Luterana,
que tuvo lugar gracias a la libre interpretación de los textos sagrados, los cuales ya no
permanecieron guardados en las bibliotecas bajo la celosa mirada del bibliotecario, sino que
salieron de los claustros y fueron ganando lugar en la vida cotidiana de las clases populares
paulatinamente alfabetizadas. De la mano de la libre interpretación de los textos y del
entronamiento, no ahora de la fe en Dios sino en la razón, surge en el siglo XVIII el proyecto
iluminista de la Enciclopedia. Diderot y D´Alambert inauguran la tendencia a comprimir el
conocimiento en volúmenes, esquemas que englobaban las distintas ramas del saber. Desde
ese momento surge la necesidad de clasificaciones pretendidamente universales y
omniabarcativas con el fin de facilitar el ordenamiento y la recuperación del conocimiento
disponible.

La documentación electrónica
De acuerdo al profesor López Yepes, "documentación puede entenderse como conjunto de las
disciplinas (Ciencias de la documentación) relacionadas con el estudio del documento como
fuente de información para obtener nueva información o una toma de decisiones, disciplinas...
o, si se prefiere, el estudio de los procedimientos netamente informativos subsiguientes al
tratamiento técnico de los documentos para la eficaz difusión de los mensajes en ellos
contenidos". (1) Esta definición amplia de documentación, según Juan Carlos Marcos Recio,
puede ser considerada una integración de la vieja disputa entre documentación y
biblioteconomía. Más allá de esta dicotomía, aquí es importante resaltar que la documentación
se fue desarrollando como ciencia principalmente durante el siglo pasado, y que esta ciencia
recibe sus aportes de otras, como lingüística, matemáticas, psicología, información, ingeniería
e informática. (2)

"El origen de la información electrónica lo tenemos que situar en la aparición del cable como
elemento transmisor a distancia, fundamentalmente el telégrafo y el teléfono". (3) Pero sin
dudas, el cambio fundamental para las ciencias de la documentación vino de la mano de las
computadoras, desarrolladas en la segunda mitad del siglo XX. Con los nuevos avances
técnicos se permitió no sólo mejorar la conservación de los datos (por ejemplo, la digitalización
de información en soporte papel evita la manipulación de éste), sino que también aportó
mayorper versatilidad en su manejo y redujo ostensiblemente los tiempos en su recuperación
de datos gracias a la interactividad de los sistemas. A esto hay que sumarle la reducción de los
espacios en los archivos, ya que los bits prácticamente no ocupan lugar (como ejemplo,
piénsese en una enciclopedia en CD-Rom) Tampoco hay que dejar de lado las mejoras que
incorporó la información electrónica en las bibliotecas: las tareas de análisis, indización,
resumen y catalogación se ven impulsadas por el nuevo soporte y facilitan la tarea para la
búsqueda de la información.

En los años setenta aparecen en Estados Unidos las primeras bases de datos de uso
periodístico, tales como el Information Bank, del New York Times, o el DowJones/Retrieval. A
partir de allí los periódicos comenzaron a desarrollar sus propias bases de datos electrónicas a
fin de satisfacer las necesidades de documentación de sus redactores, y también comenzaron a
tercerizar los servicios contratando a empresas dedicadas a dicha actividad. Estas bases de
datos encontraron en los diskettes y luego en los CD-Rom sus soportes ideales, pero con el
desarrollo de Internet, la documentación alcanza niveles inusitados. Mucha información ahora
se puede recibir gratuitamente, prescindiendo de los soportes y ganando tiempo, ya que los
datos se pueden solicitar on-line al instante. En otros casos, esa información se sigue
cobrando: un ejemplo de ello son las suscripciones a fuentes de documentación, las bases de
datos de revistas científicas o los anuarios de los diarios que se editan en CD-Rom.

Marcos recio señala un punto importante: "la información electrónica no entró a formar parte
dentro de la redacción y del centro de documentación hasta la llegada de los periódicos
electrónicos, que utilizando las primeras herramientas permitían una interconexión de la
información entre el redactor y el lector, o entre el redactor y el documentalista". (4) Es decir,
que la documentación electrónica prácticamente no tuvo vida en las redacciones antes de
Internet. Una de las virtudes de la red es, justamente, la que pone en un nuevo aprieto a las
ciencias de la documentación: nadie es propietario de la información, no hay una autoridad
jerárquica que la administre. Entonces se corre un riesgo importante: la disolución de la
profesionalidad en la producción y organización de la información, ya que ésta se encuentra
accesible, gratuitamente y sin intermediarios.

La información en Internet

Con el caudal de información producido en los siglos XIX y XX, las categorías de la enciclopedia
de los filósofos iluministas fueron superadas, e irrumpieron en el escenario del saber los
medios de comunicación, con su capacidad de recolectar información en tiempos cada vez más
cortos. En la denominada "sociedad de la información", los diarios se transformaron en
valiosos documentos de consulta. Lo mismo sucedió con los archivos fotográficos y
audiovisuales. Pero con Internet, de alguna forma, se impone la necesidad de un ordenamiento
de la información en constante cambio, y esa es la batalla de nunca acabar: ¿es posible
clasificar, sumar, ordenar y almacenar toda la información que hay en la WWW? Aún
concibiendo la posibilidad de que en la web esté almacenada toda o al menos gran parte de la
información necesaria para la sociedad, ¿es posible acceder a ella? ¿Se puede encontrar
específicamente lo que se busca? Provisionalmente podemos decir que en Internet
encontramos mucha información sobre determinados temas, poca de otros y nada de otros
tantos. Se estima que hay una web invisible (es decir, que no aparece indexada en los
buscadores) 500 veces mayor a la que podemos ver. Así como "un libro mal colocado en un
librero puede desaparecer para siempre", la acción de incluir o no en un listado lo que se
publica en la web es determinante: "clasificar, por consiguiente, es ejercer el poder" (5).

Los motores de búsqueda de Internet

Para buscar información en la WWW contamos con dos alternativas: los "buscadores", o
"motores de búsqueda (search engines)", ejemplos de ellos son Altavista, Goggle. About,
Excite, Hotbot; y los directorios o "árboles temáticos" (ejemplo: Yahoo!), que utilizan
categorías para ayudar en la búsqueda tanto de archivos de texto como de fotografías y
música en formato MP3. Esas categorías, que recuerdan a la clasificación de la enciclopedia de
Diderot, suelen ser el primer paso para la recogida de información.

A través del lenguaje hipertextual característico de Internet, es posible llegar a la información


buscada clickeando sobre las palabras o frases que aparecen resaltadas en la pantalla, y de
esa forma, sin necesidad de recurrir al soporte-papel (y sin moverse de la silla), se accede a la
información.

Para familiarizarse con el funcionamiento de los buscadores es recomendable visitar cada uno
de ellos, ya que además de tener en común la forma de buscar datos (en el caso de los
directorios clickeando una categoría, y en el de los motores de búsqueda, tipeando una palabra
o frase para iniciar la exploración), poseen herramientas diferentes para refinar la búsqueda o
personalizarla de acuerdo a las necesidades del usuario. De todas formas, el presente artículo
brinda algunas herramientas para iniciarse en la búsqueda de información (6).

Búsquedas básicas

Para iniciar un rastreo en un motor de búsqueda es importante escribir las palabras que
llevarán directo a la información deseada. Algunos consejos útiles:

-Usar sustantivos como palabras clave. Los verbos, adjetivos y adverbios no son muy
específicos. (Ejemplo: periodismo)

-Tipear las palabras con minúsculas, ya que si se comienza con mayúscula el resultado
arrojará sólo aquellas páginas en donde el término esté escrito de esa manera

-Es mejor tipear varias palabras que describan el tema, para que el buscador acote más los
resultados. Ejemplo: periodismo, diarios electrónicos, periodismo digital. También se puede
escribir una frase entre comillas, lo que discriminará aún más la búsqueda. Ejemplos:
"periodismo on line"

-Se pueden combinar varios conceptos y separarlos con paréntesis, para que el programa
los tome como una sola unidad. Ejemplo: (diarios electrónicos) (revistas electrónicas)

-Para indicarle al buscador que la palabra puede aparecer en singular o plural, se puede
escribir en singular seguido de asterisco, y el buscador devolverá todas las páginas que
contengan el término de las dos formas

-Los buscadores suelen darle más relevancia a los términos que aparecen primero, por eso
es fundamental encabezar la lista de palabras o frases clave con las más importantes para
el rastreo
Búsquedas avanzadas

En un segundo paso se pueden dejar de lado las búsquedas que, por muy generales, dificultan
el acceso a información específica, y animarse a métodos de búsqueda que acoten más la
información. En motores tales como Altavista, Yahoo!, Excite o Hotbot, las búsquedas
complejas se hacen a través de los conectores lógicos o booleanos: los términos and (y), near
(cerca), and not (y no) y or (o). Colocando estas palabras entre los términos de nuestra
búsqueda, el usuario se puede aproximar a los resultados esperados:

AND (y): al vincular los términos con este conector. Se le indica al buscador que todas las
palabras tipeadas en el casillero deben estar presentes en las páginas y sitios hallados.
Ejemplo: periodismo and internet and digital

AND NOT (y no): se le puede pedir al buscador que no incluya a los términos que
aparecen después del conector. Ejemplo: periodismo and not gráfico

OR (o): una u otra palabra clave debe aparecer en los resultados. Es útil cuando se
quieren dar sinónimos de los términos. Ejemplo: periodismo electrónico or periodismo
digital

NEAR (cerca): sólo aparecerán las páginas o sitios que tengan los términos unidos por
este conector a una distancia mínima de 10 palabras. Este comando le exige al buscador
que busque información donde las palabras pedidas estén cerca unas de otras

Estos conectores booleanos pueden emplearse también para relacionar frases, las cuales
deberán encerrase entre comillas. Ejemplo: "periodismo electrónico" and "sociedad de la
información". Asimismo, pueden utilizarse paréntesis. Ejemplo: periodismo near (digital or
electrónico).

Algunos buscadores utilizan conectores boléanos designados con signos: por ejemplo el signo
más (+) y el signo menos (-), que pueden ser utilizados para refinar la búsqueda, adicionando
o excluyendo ítems en la devolución de los resultados.

Metabuscadores

Para facilitar la búsqueda de información en Internet y no limitarse a hacerlo mediante un


motor de búsqueda determinado, existen metabuscadores (buscadores de buscadores) que
relevan la información en varios motores a la vez. El caso paradigmático es el de Copernic, que
se puede bajar gratis de Internet. Copernic es un programa que se baja al disco rígido y,
conectado a la web, realiza búsquedas en 80 fuentes de información. Posee herramientas de
búsqueda avanzada, muestra los resultados en orden jerárquico según su relevancia, y cada
búsqueda realizada queda registrada en una ventana, de modo que se puede volver a
chequear tantas veces como se quiera.

Buscadores temáticos

Otras de las opciones para buscar información de manera más específica es recurrir a
rastreadores especializados en ciertas áreas como salud, derecho, música, tecnología. Como
los buscadores generales tienen indexados un mínimo porcentaje de los sitios que hay en la
red, la tendencia a la especialización intentará solucionar ese problema.

Las limitaciones y los sesgos de los buscadores en Internet

Desde que existen las fuentes de documentación, administrar o disponer de ellas fue una
cuestión de poder. El bibliotecario de los monasterios medievales, el filósofo iluminista que
clasificaba el conocimiento en determinadas ramas, el diseñador de los buscadores de
información en Internet; todos ellos comparten una función: manejan información, gestionan
el conocimiento. Si antes ese poder estuvo en manos de la Iglesia Católica (en el caso de las
bibliotecas), luego en el racionalismo positivista (la enciclopedia de Diderot), ahora -de
acuerdo a Laura Siri y Aníbal Ford, ese poder es sustentado por un país: Estados Unidos. En el
libro: "Internet: búsquedas y Buscadores", Laura Siri elabora una crítica a los motores de
búsqueda y directorios de Internet. Establece que estos tienen sesgos bien marcados a la hora
de brindar la información que se publica en la web:

"la hiperinformación que caracteriza la época actual funciona en un solo sentido: cada vez es
más fácil encontrar en Internet documentación de toda clase referida a los países del Primer
Mundo (y muy especialmente, a Estados Unidos), mientras que hay grandes dificultades para
documentarse sobre temas vinculados a los otros países" (7)

Este fenómeno también se registra en las Enciclopedias en CD-ROM, tales como Encarta de
Microsoft. En "La marca de la bestia", Anibal Ford dice:

"los nuevos sistemas globales de información, como es el caso de Internet o las enciclopedias
globales en CD-ROM como Encarta de Microsoft, privilegian la información sobre ciertas
culturas, obviamente la de los países industrializados y marginan, disminuyen, simplifican e
incluso procesan de manera errada a muchas otras. Este es un proceso muy antiguo pero
sobre el que pesa la hegemonía "ideológica/clasificatoria" de Estados Unidos presente en toda
búsqueda de Internet y produce, como también sucede en las enciclopedias en CD-ROM, un
proceso de desinformación global importante con respecto a los países pobres cuando no una
intermediación o intrusión en la información sobre ellos errónea e hiper-simplificada" (8)

Esta visión crítica de los buscadores de Internet es también compartida por investigadores del
primer mundo:

"un "defecto" especialmente significativo de los buscadores es que, según el estudio de


Lawrence y Giles (financiado por la compañía norteamericana NEC en New Jersey, 1999),
tienden a indexar con mucha más frecuencia las páginas que están en Estados Unidos que las
que no lo están. Es decir que, no sólo la cantidad de sitios norteamericanos (72 por ciento
según Activmedia) con respecto a los del resto del mundo es mucho mayor, sino también que
los sitios no norteamericanos son más difíciles de encontrar con las herramientas disponibles"
(9)

Esta visión "hipersimplificada" de los países del tercer mundo recurre a estereotipos sobre esas
sociedades, y lejos de conocer profundamente su cultura, destacan su carácter de "exótico" y
"diferente", para marcar una diferencia insalvable entre los dos mundos. Desde esta lógica, las
distancias que parece neutralizar Internet, se vuelven más pronunciadas a la hora de analizar
quiénes son los que más hablen y qué dicen de quienes no pueden hablar en este nuevo
medio.

El problema de la indexación

Para entender como funciona un motor de búsqueda, es necesario comprender cual es su


lógica de indexación, es decir, cómo es el proceso de inclusión de las páginas o archivos sobre
determinados temas que se hallan publicadas en la red. Teniendo en cuenta que para el
usuario común es difícil acceder a las páginas en forma directa (a no ser que sepa de su
existencia por otras vías), el rol de los buscadores es determinante.

Laura Siri señala tres factores fundamentales acerca de cómo trabajan los motores de
búsqueda:

a) La base de datos. Los buscadores la construyen con la información proveniente de


los formularios de alta que los administradores de sitios les envían voluntariamente.
Además, muchos search engines (Altavista, Infoseek, Lycos, Excite, Hotbot, Open Text,
Web Index, Northern Light y Web Crawler) tienen programas llamados web crawlers,
spiders o robots, que vagan por la Internet y almacenan la información sobre cada
página que encuentran.En general, estos agentes comienzan con una lista histórica de
links "populares", y los siguen para encontrar más enlaces y agregarlos a la base. De
los 100 sitios más populares, la totalidad son norteamericanos.

b) La interfaz con el usuario. Este aspecto tiene que ver con lo que el navegante
tiene permitido hacer al ingresar la palabra clave (esto fue descrito en los puntos sobre
búsquedas básicas y avanzadas)

c) Presentación de resultados. Dado que el número de páginas halladas para una


determinada búsqueda puede ser alto, los buscadores deben tener criterios para su
ordenamiento y jerarquización. Para ello asignan a cada resultado un "puntaje de
relevancia". En general, este tiene que ver con: el número de veces que el término
aparece en el texto, si aparece en el título, si lo hace al principio o si las palabras
buscadas figuran o no próximas entre sí. (10)

A todo esto se debe sumar que por lo general -continua Siri- "los usuarios no van más allá de
los primeros quince o veinte sitios que aparecen en la lista de resultados"(11). Este factor se
vuelve determinante si pensamos -tal como se explicó- que no necesariamente los sitios más
importantes aparecen en primer término.

El documento "Herramientas de búsqueda para la WWW", de Adelaida Delgado Domínguez


(publicado en el CIVE2001) contiene información interesante sobre los buscadores, y con
respecto a sus sesgos dice que los creadores de páginas comerciales desarrollan una serie de
trucos para aparecer en la lista de los 10 primeros sitios indexados por el buscador, empleando
estratagemas tales como:

"repetir reiteradamente ciertas palabras en el texto (incluso escribiéndolas con el mismo color
que el fondo para que así sólo las lea el robot y no el usuario), asociar palabras clave al
documento que tengan mucha probabilidad de ser buscadas por los usuarios (por ejemplo
"gratis", "sexo", etc. o marcas comerciales importantes) incluso aunque no tengan que ver con
el contenido del documento, realizar alianzas con otros autores para referenciarse
mutuamente a través de enlaces, o en algunos casos, pagar al buscador (si éste lo permite)
por aparecer en los primeros lugares de la lista de resultados en la consulta de ciertos
términos."

El mito de la neutralidad de la tecnología

Internet, como otras tantos inventos, aún goza de cierto halo de neutralidad tecnológica.
Mucha gente aún piensa que la tecnología es neutral, y que depende de quién haga uso de
ella. Si tenemos en cuenta que la Red nació en Estados Unidos, no debe sorprendernos
comprobar que a mayor parte de la información que brinda es sobre ese país. Entonces, lo que
-según los gurúes de la comunicación como Nicholas Negroponte - algunos entienden por
"democracia perfecta" o "libre acceso a la información" desde cualquier lugar del planeta, se
transforma en una más de las utopías que el hombre fabricó alrededor de los inventos a los
que dio creación.

Con respecto a Internet, esa aura de neutralidad es acentuada en la medida e que quienes
organizan el conocimiento en los motores de búsqueda o directorios, son técnicos. Tal como
dice Siri:

"mientras que la obra de los enciclopedistas fue construida por filósofos, científicos y gente de
letras, hoy la Internet y otros medios interactivos son el fruto de knowledge managers, cuya
formación es más técnica que vinculada a las ciencias y las artes, y cuyas metodologías
imponen sobre sus productos el halo de neutralidad ideológica tradicionalmente atribuidos a
los algoritmos computacionales" (12)

Entonces, no sólo los criterios de clasificación de los "árboles del conocimiento" dependen de la
ideología de los países del primer mundo, sino que además esos criterios son elaborados por
agentes técnicos que carecen de la formación humanista que se requiere para elaborar esos
criterios.

Encontrar lo que no se quiere

En forma paralela al crecimiento de la información que ofrece Internet, también hay cada vez
más basura. Basta con introducir una palabra clave en un motor de búsqueda para que, entre
algunas direcciones útiles, aparezcan numerosos links que nada tienen que ver con la
búsqueda inicial. Asimismo, se puede comprobar que muchos de esos links aparecen repetidos,
porque el buscador indexa todos los sitios que utilizan ese término, sin discriminar si el sitio ya
fue citado o no.

Además, existe un truco muy común que es utilizado por los programadores de páginas web,
que es el de abrir automáticamente páginas que no tienen que ver con lo que busca el usuario,
pero que utilizan palabras clave para accionarlas. Al armar un sitio web, el programador
incluye etiquetas (denominadas metatags) con palabras claves que actúan como disparadores
de búsqueda y que llevan al usuario a esos sitios sin haberlo solicitado, y no teniendo -muchas
veces- que ver con la página que se encontraba visitando.

Por último, no es descabellado suponer que detrás de los motores de búsqueda se esconden
fuertes intereses económicos, teniendo en cuenta que los search engines perteneces a
compañías que se desarrollan y fusionan al igual que muchos medios de comunicación,
contribuyendo a la concentración monopólica de la información. Al respecto, Siri introduce la
duda:

"Existe, o se sospecha que existe, otro criterio más de jerarquización de los resultados: es
posible que el algoritmo esté programado para asignar mayor puntaje a los sitios de aquellas
empresas que hayan pagado para figurar en primer lugar (del mismo modo, también se
venden keywords a los anunciantes para que cuando un navegante las ingresa como término
de búsqueda, se despliegue un "banner" con publicidad de la compañía correspondiente)" (13)

La duda es despejada por una de las tantas denuncias sobre los intereses comerciales que
existen detrás de la información que brindan los buscadores. Por ejemplo, en julio del año
2001, la Organización norteamericana de Consumidores denuncio a 8 de los más importantes
motores de búsqueda (Microsoft, Altavista, AOL Time Warner, Terra, Lycos, Direct Hit, iWon y
LookSmart) por incluir en las primeras posiciones en los resultados de las búsquedas a
empresas que habían pagado por ello, sin que previamente se avisas a los usuarios de ese
hecho. (14)

Un estudio de caso

Durante la semana del 11 de septiembre del 2001, una fecha imborrable por los sucesos que
tuvieron lugar en EE.UU, se analizó el buscador Ubbi, del diario argentino Clarín, y soportado
por el buscador norteamericano Google. Durante esa semana se comprobó el sesgo de ese
buscador y, coincidiendo con esa fecha lamentable, se pudo corroborar los cambios que se
produjeron a la luz de dichos acontecimientos. Se puede acceder al análisis del caso haciendo
clic aquí.

La web inteligente

El los últimos años, investigadores de Estados Unidos y de Europa se han dedicado a trabajar
en lo que se puede denominar una nueva revolución en Internet: la web inteligente. Existen
dos proyectos paralelos: la web semántica y el cerebro global.
La web semántica: impulsada por el creador de la WWW, Tim Berners-Lee: "La Web
Semántica no es algo que tenga relación con la Inteligencia Artificial, es algo muy práctico,
cuyo objetivo es que los agentes entiendan el significado en base a marcas semánticas".(15)
Se trata de asignar etiquetas (marcas semánticas) a los datos a través de un nuevo lenguaje
(XML) para que la red comprenda el significado de ese dato. Cuando el usuario busca
información en Internet, en la devolución de resultados aparecen numerosos links de interés,
muchos de ellos repetidos, y junto a otros tantos denominados "información basura". El
proyecto de la web semántica intenta discriminar más la búsqueda de información a través de
un software inteligente ("agents") que comprende el sentido de los datos, los contextualiza y
recién después de esa instancia los devuelve al usuario que busca la información.(16) Berners-
Lee, director del World Wide Web Consortium con base en el MIT (Instituto Tecnológico de
Massachussets) se encuentra embarcado en este proyecto en los últimos años, y junto a Hans-
Georg Stork, y James Hendler lidera a un grupo de al menos cien investigadores. Para
Berners-Lee, "la web semántica es información realmente procesable por la máquina" (17). Por
su parte, Hans-Georg Stork, responsable de la investigación la Web Semántica de la Comisión
Europea, dice que “La Web Semántica tiene por objeto ordenar el caos de Internet”.(18)

El cerebro global: es el otro proyecto que llevan adelante investigadores como Francis
Heylighen, Johan Bollen y Cliff Joslyn. El objetivo que se persigue es que "los servidores sean
capaces de aprender el recorrido virtual que hacen los internautas en su navegación por la Red
para que ésta acaba funcionando como un cerebro global". (19). Se trata de una gran red de
redes de información precisa, que se crea con la inteligencia de los usuarios en la red, algo así
como una "inteligencia compartida", "una inteligencia que une cada uno de los ordenadores
conectados como si fueran las neuronas de un cerebro". (20). En esta línea están trabajando el
belga Francis Heylighen, codirector del Instituto de Investigación Transdiciplinar de la
Universidad Leo Apostel, y coeditor del Proyecto Principia Cibernética y su discípulo, Johan
Bollen, que trabaja en el Laboratorio Nacional de Los Alamos (EE.UU). Con algoritmos
matemáticos se están realizando experimentos que demuestran cómo se trabaja con las
máquinas que simulan el funcionamiento del cerebro humano. Para Karma Peiró, "El cerebro
humano es un órgano flexible y eficiente que contiene una enorme cantidad de datos. No es
perfecto pero, comparativamente, funciona muchísimo mejor que un buscador de Internet".
(21) El proyecto del cerebro global, entonces, pretende que la web funcione como un gran
cerebro colectivo inteligente, pero desarrollado por los recorridos de los navegantes, por
asociación de ideas y no por simples algoritmos matemáticos que no pueden distinguir un dato
de otro similar.

Por otra parte, desde España, el grupo de periodistas digitales liderado por Luis Angel
Fernández hermana está haciendo lo suyo desde hace algunos años en función de la web
inteligente. Desde su sitio, www.enredando.com, ofrece interesantes notas y entrevistas sobre
el tema. Concretamente, el 26 de octubre de 2001 tuvo lugar en Barcelona un congreso
organizado pro este grupo, donde se dieron a conocer los proyectos descriptos. Sin dudas, los
próximos avances en Internet tendrán que ver con estas ideas que hoy parecen inalcanzables.

Los proyectos de la web semántica y el cerebro global se plantean como alternativas a los
actuales motores de búsqueda de Internet. Conocidas sus limitaciones y sesgos en la recogida
de datos, estos dos proyectos pretenden ofrecer información específica, útil y verdadera.

BIBLIOGRAFÍA

1- Marcos Recio, Juan Carlos, La documentación electrónica en los medios de


comunicación, (Madrid), Fragua, 1999, pág. 30

2- Marcos Recio, Juan Carlos, La documentación electrónica en los medios de


comunicación, (Madrid), Fragua, 1999, pág. 25
3- Marcos Recio, Juan Carlos, La documentación electrónica en los medios de
comunicación, (Madrid), Fragua, 1999, pág. 56

4- Marcos Recio, Juan Carlos, La documentación electrónica en los medios de


comunicación, (Madrid), Fragua, 1999, pág. 61

5- Darnton, Robert. Los filósofos podan el árbol del conocimiento: la estrategia


epistemológica de la "Enciclopedia". En: La gran matanza de gatos y otros episodios en
la historia de la cultura francesa. (México), Fondo de Cultura Económica, 1987

6- Gentil, Andrea y Bellucci, Marcelo. El que sabe buscar bien, encuentra más y mejor.
En Suplemento de Informática de Clarín, miércoles 21 de junio de 2000

7- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 15

8- Ford, Anibal. La marca de la bestia. Identificación, desigualdades e


infoentretenimiento en la sociedad contemporánea, (Buenos Aires), Norma, 1999, pág.
119

9- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 23.

10- Siri, Laura. Internet: búsquedas y buscadores, (Buenos Aires), Norma, 200, pág. 59

11- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 63

12- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 18

13- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 66

14- La denuncia fue publicada en el Boletín electrónico Albanova.Año II - Número 70 - 23


de julio de 2001 (www.albanova.com)

15-Flotats,Sonia, La tercera revolución de la web, En:www.enredando.com (30/10/2001)


Nota completa

16- Port, Otis, The Next Web, Business Week, New York, March 4, 2002,
Industrial/Technology Edition, Issue: 3772, pp. 96-102

17- Frauenfelder, Mark, A smarter web, Technology Review, Cambridge, Nov 2001, Vol.
104 Issue: 9, pp. 52-59

18- Peiró, Karma, El compromiso entre los humanos y las máquina, En:
www.enredando.com (30/10/2001) Nota completa

19- Rexxac Pous, Eva, Inteligencias compartidas, En: www.enredando.com (23/10/2001)


Nota completa

20- Rexxac Pous, Eva, Inteligencias compartidas, En: www.enredando.com (23/10/2001)


Nota completa

21- Peiró, Karma, El compromiso entre los humanos y las máquina, En:
www.enredando.com (30/10/2001) Nota completa

También podría gustarte