Caminos Inteligencia Colectiva

MS ALL de Google Los caminos de la Inteligencia
Colectiva Entrevista con Pierre Lvy

http://colaboratorio1.wordpress.com/2010/01/07/mas-alla-de-google-los-caminos-de-la-inteligenciacolectiva-entrevista-con-pierre-levy/
By colaboratorio1
Visit Multitud
Traduccin: Diego L. Sanromn
El buscador Google no es ms que una pieza entre otras de la cuestin mucho ms vasta de la
navegacin y los modos de bsqueda en Internet. Histricamente ha desempeado un papel ms
importante por haber sido el primeo en integrar las elecciones de los propios internautas en los
resultados de sus peticiones por medio de los vnculos hipertextuales que dirigen de un sitio a otro. Ha
sido igualmente uno de los pioneros de lo que se llama cloud computing, distribuyendo por el tejido
de la Red los datos y dems capacidades tecnolgicas a los que cada internauta tiene acceso. El ms
famoso de los motores de bsqueda, sin embargo, alcanza hoy sus lmites, en primer lugar, como
consecuencia de su posicin dominante. Y en segundo lugar, y sobre todo, como consecuencia de las
preferencias que comparte con la instancia de gobernanza de la Web, el World Wide Web Consortium o
W3C (al que pertenece, al igual que Yahoo o Microsoft). Los estndares de la Web, en efecto,
evolucionan poco, como si estuvieran bloqueados por las constricciones comerciales de los ingresos
por clic. Qu queda, pues, de ese camino hacia cada vez ms inteligencia colectiva que ha sido uno
de los combustibles esenciales de Internet? Pierre Lvy es filsofo y, a la vez, director de investigacin,
en Canad, de un proyecto de metalenguaje que permitira a los internautas codificar el sentido y
no sencillamente los datos. O, en otras palabras, llevar a cabo bsquedas mil veces ms afinadas en el
ocano de la Red. Ms all de la (necesaria) crtica de Google, no resulta indispensable llevar a cabo
investigaciones en la confluencia entre la informtica y las ciencias sociales con el fin de aumentar ese
potencial de inteligencia que sigue siendo Internet? Libre intercambio
Multitudes: En su opinin, cules son o siguen siendo hoy en da las principales cualidades de un
motor de bsqueda como Google?
Pierre Lvy: La principal cualidad de Google est en reflejar, aunque sea de manera muy grosera, la
inteligencia colectiva de los usuarios de la Web. En efecto, el xito de Google se ha construido, desde
su origen en 1998, sobre el algoritmo de ordenancin de pginas web inventado por Larry Page y
Sergey Brin. Segn dicho algoritmo, cuyo nombre es PageRank, los sitios web correspondientes a
una peticin se ordenan en funcin de la cantidad de vnculos que apuntan hacia tales sitios,
concediendo un peso ms importante a los vnculos que proceden de sitios que, asimismo, disponen de
un mayor nmero de vnculos. Esto supone hacer partcipes a los internautas que lanzan hipervnculos a
la Web en la definicin del orden de respuestas del motor de bsqueda. Antes de la innovacin de Page
y Brin, se ordenaban las respuestas en funcin de la frecuencia de los trminos buscados en los sitios.
En suma, los motores de bsqueda pre-Google estaban nicamente orientados hacia los documentos.
Google fue, de hecho, el primer motor de bsqueda que hizo entrar la computacin social en su
ecuacin. La segunda razn del xito de Google fue (y sigue siendo) su extraordinaria ambicin
computacional. La loca idea inicial del proyecto era registrar automticamente la totalidad de la Web en
una sola base de datos, base sobre la cual se podran, a continuacin, llevar a cabo clculos estadsticos
a una escala muy grande. La infraestructura tcnica de Google descansa en decenas de inmensos
centros de clculo dispersos por todo el planeta, cada uno de los cuales concentra centenares de miles
de servidores de bajo precio interconectados mediante fibra ptica y funcionando con Linux. Dichos
centros estn directamente conectados a los backbones de Internet y consumen cantidades fenomenales
de electricidad. La disponibilidad de estos centros de clculo ha impulsado a Google a proponer una
multitud de servicios de cloud computing: vuestros datos, vuestros programas, vuestras infraestructuras
de clculo ya no estn en vuestros ordenadores, sino en algn lugar de la red, inmediatamente
disponibles para cualquier conexin a Internet. El cloud computing, del que Google y Amazon son los
principales pioneros, es, ciertamente, una de las principales tendencias de la cibercultura. La memoria y
el tratamiento de la informacin se convierten as en ubicuos.
Multitudes: A la inversa, cules son los fallos esenciales o al menos, los lmites ms importantes- de
Google hoy en da?
P. L.: Creo que el error resulta visible para todo el mundo. Es bastante inquietante que una sola
compaa gestione la mayor parte del acceso de los internautas a la memoria digital mundial, sobre
todo si uno repara en que sus algoritmos son secretos comerciales y, en consecuencia, opacos. An ms,
Google tiene un acceso directo a los datos y a las actividades de sus usuarios de cloud computing,
incluidas las cuentas de e-mail (gmail). El conjunto de tales datos se emplean hoy en da principalmente
con fines de marketing, pero todas las censuras, manipulaciones comerciales y colaboraciones con los
servicios secretos (estadounidenses, chinos u otros) son posibles. En cuanto a los lmites, es preciso
comprender que Google no es el nico en cuestin. Es el conjunto de la bsqueda y del filtrado de la
informacin en Internet el que se encuentra hoy en da en su prehistoria. Para empezar, las bsquedas
todava se llevan a cabo principalmente mediante cadenas de caracteres (las palabras), en lugar de
mediante conceptos (que pueden expresarse de muy diversas maneras). Adems, el carcter multilinge
de la memoria mundial se gestiona con no pocas dificultades y las traducciones automticas son de una
mala calidad notoria. Los algoritmos de bsqueda son generalmente los mismos para todo el mundo,
mientras que podran imaginarse modos de filtrado mucho ms personalizados. Finalmente, el valor
de la informacin depende de un gran nmero de parmetros contextuales o de puntos de vista y
debera poder calcularse segn juegos de inteligencia colectiva extremadamente variados. Este ltimo
problema apenas ha aflorado en las investigaciones contemporneas mediante buscadores como
Google.
Multitudes: Se oye hablar cada vez ms de lo que se llama la deep Web, esto es, la Web invisible,
oculta, la de los archivos, bases y bancos de datos, pero tambin la de cierto tipo de portales y
bibliotecas en lnea o de pago, a los que los buscadores de hoy no daran cobertura. Ciertamente,
Google indexa, por ejemplo, los ficheros .pdf o Excel, pero se dira que est muy lejos de cubrir, en
2009, la totalidad de la Web en su escaneado mensual y en la respuesta a las peticiones. Recuerdo, por
otra parte, un estudio de la sociedad Bright Planet, hace 8 aos, que afirmaba que los documentos
presentes en la Web eran, en realidad, 500 veces ms que los inventariados en los motores de bsqueda.
Cmo est la cuestin hoy en da?
P. L.: No soy un especialista en la deep Web, pero puesto que los motores de bsqueda recogen los
datos de la Web mediante el seguimiento de los vnculos por autmatas esta claro que: todo el
contenido que no est hipervinculado, y en particular el contenido de las bases de datos (incluso si tales
bases son accesibles a travs de la Web), no se encontrar en las respuestas de los motores de
bsqueda Pero su evaluacin es tal vez excesiva. Por definicin, la cosa es muy difcil de medir.
Pienso, siguiendo a especialistas actuales, que la relacin entre Web de superficie y Web profunda es
del orden de uno (en cuanto a la superficie) a cincuenta o cien (en cuanto a la profunda) que, en todo
caso, es enorme!
Multitudes: En el texto que public en Multitudes en la primavera de 2008, subrayaba usted el
problema que representa ese verdadero poder activo y centralizado (que) detentan las empresas del
World Wide Web Consortium (W3C), que rene a Google, Yahoo, Microsoft y algunas otras, y
explicaba que dicho consorcio bloquea la evolucin orientndola en su provecho. Podra precisar esta
crtica y decirnos si sigue tan de actualidad como hace un ao?
P. L.: Es preciso comprender que los grandes financiadores del W3C tienen como objetivo principal
rentabilizar sus inversiones y rendir el mximo de dividendos a sus accionistas, y no desarrollar la
inteligencia colectiva de la humanidad. Si sus objetivos pasan por un aumento de la inteligencia
colectiva, tanto mejor: a priori no estn en contra; si no, qu se le va a hacer! El resultado es una
orientacin de la investigacin muy centrada en lo que se llama el Click stream marketing y,
consecuencia, en los ingresos por clic. Son estas grandes empresas las que tienen el mayor poder sobre
la orientacin de la definicin de los estndares publicados por el W3C. Por otra parte, las directrices
de innovacin siguen basndose en: los formatos de datos estandarizados como HTML o XML; los
sistemas e inferencias lgicas inspirados en la inteligencia artificial, basados en ontologas
expresadas en esos mismos formatos estndar (en el dominio de la informtica, las ontologas son
esencialmente jerarquas de clases y de sub-clases de conceptos, as como redes formales de relaciones
entre clases, en tanto que los conceptos siguen expresados en lenguajes naturales); los mtodos de
anlisis estadstico a gran escala, que se han convertido en una especialidad de Google. A mi parecer, el
problema est en que las directrices de investigacin alternativas o complementarias a estos modos de
innovacin estndar son excluidas implcitamente, incluso en los departamentos de informtica de las
universidades.
Multitudes: Acaso es posible hacerlo de otro modo?
P. L.: En el mbito matemtico, sera sin duda necesario explorar formalismos distintos de los de la
lgica y la estadstica. Aunque la teora de grafos se utiliza cada vez ms, queda todava mucho trabajo
que hacer por este lado, por no hablar de lo que sera una topologa o una geometra sociales del
sentido. Yo mismo trabajo con un matemtico (Andrew Roczniak) sobre un grupo de transformacin
complejo, capaz de representar los fenmenos de inteligencia colectiva.
Multitudes: Existen orientaciones de investigacin ms o menos bloqueadas por quienes hoy en da
encarnan la gobernanza de la Red? Existiran tabes sobre el tema de la evolucin de los motores de
bsqueda?
P. L.: El mayor tab pesa probablemente sobre la invencin de nuevos sistemas simblicos que saquen
partido de la potencia de clculo y de la memoria prcticamente infinita abiertas hoy a los internautas.
Funcionamos como si la caja de herramientas simblicas que necesitamos para los siglos que vienen no
debiera contener ms que los lenguajes naturales y los sistemas de signos desarrollados por la cultura
antes de la existencia de una memoria mundial digital y ubicua. Finalmente, nuevos modos de
computacin social y de organizacin de la inteligencia colectiva emergen de la actividad espontnea
de los internautas. Las start-up y las grandes compaas cabalgan la ola, mientras la investigacin en
ciencias humanas y sociales se contentan con ir detrs y observar, siempre con un poco de retraso, en
lugar de innovar trabajando codo con codo con la investigacin en informtica. Y ni siquiera evoco
ahora ese oscurantismo anti-tcnico tan potente en Francia, que incluye a los medios de investigacin
en ciencias humanas. Tales directrices de investigacin, complementarias a las que hoy en da estn en
primer plano, deberan ponerse al servicio de una gestin participativa y transcultural de los
conocimientos orientados hacia el desarrollo humano, antes que servir a estrechas finalidades de
marketing. Pero no quisiera simplemente dedicarme a ese deporte nacional francs que consiste en
criticar a los americanos y a las empresas capitalistas. Me han llamado de todo en Francia (en
particular, en los medios de izquierdas) porque, en mi libro de 1994 [1], hablaba de inteligencia
colectiva en el ciberespacio, cuando la cosa se ha convertido hoy en da en una evidencia ampliamente
compartida. De igual manera, mi libro de 2002 [2] sobre la ciberdemocracia y la explosin de la
libertad de expresin en la Web ha sido arrastrado por el fango por los periodistas franceses. Sin duda,
algunos de ellos eran lectores de Virilio, de Finkielkraut y de Wolton, mientras hoy todo el mundo se
extasa con la Web 2.0 y el papel de los medios sociales en la eleccin de Obama Con raras
excepciones (Serres, De Rosnay, Moulier-Boutang, Stiegler), la institucin intelectual francesa, presa
de su pasin crtica exclusiva, me parece profundamente ciega ante el futuro.
Multitudes: Se dira que la W3C y Google, en particular, trabajaban en la Web semntica y en
herramientas adaptadas a dicho tipo de Web Podra recordarnos qu es la Web semntica y decirnos
qu pasa con la evolucin hacia la Web semntica y las herramientas adaptadas?
P. L.: Uno de los sntomas ms reveladores de los lmites de la supuesta Web semntica es su
reciente cambio de nombre. Tim Berners-Lee y su equipo hablan hoy de Web de datos. La idea
principal es que la Web actual es principalmente una Web de documentos, de documentos que estn
conectados mediante hipervnculos. La finalidad de la Web de datos es realizar una integracin de la
memoria mundial a un nivel ms abstracto que la Web de documentos: el nivel de los datos a partir de
los cuales los documentos se producen, cada vez ms, de forma automtica. El formato RDF
(Ressource Description Framework), que se corresponde con esta visin, permite descomponer la
descripcin de las informaciones en la Web en conjuntos de tripletes:
1) el tema, o sea, el recurso que hay que describir; por ejemplo, un texto y su direccin URL (Uniform
Ressource Locutor);
2) la propiedad; por ejemplo, el autor del texto, representado tambin por una direccin URL;
3) el objeto; por ejemplo, Madame Dupont o El estudio de los nuevos tipos de cultivo del
calabacn, tambin eventualmente representado por una URL. A continuacin, los conjuntos de
tripletes RDF pueden ensamblarse en grafos complejos y ser objeto de clculos lgicos automticos.
La finalidad ms o menos explcita de la Web de datos es transformar Internet en una sola base de datos
virtual por medio de la codificacin en formato RDF de todos los documentos, o ms bien de todos los
datos, incluso si sabemos que siempre existir una multitud de bases de datos reales diferentes. Las
ontologas expresadas en el lenguaje OWL (Ontology Web Language), es decir, para simplificar de
forma algo excesiva, las relaciones entre ideas y conceptos que se encuentran en Internet, permiten por
otra parte realizar razonamientos automticos sobre conjuntos de datos codificados en RDF, datos
que se corresponden con el dominio de conocimiento o de prctica particulares que es descrito por una
ontologa.
Multitudes: Qu ms aporta esta Web de datos, en comparacin con la Web tal como la conocemos
hoy?
P. L.: Se supone que hace la navegacin (dicho de otro modo, el surf y, en consecuencia, el trabajo de
investigacin) a la vez ms fcil, ms pertinente y ms completo, sin permitir, con todo, husmear en la
integridad de la deep Web de la que hablbamos antes.
Multitudes: En concreto, y en particular para Google, es ya una realidad? Navegamos, sin saberlo,
por esta Web de datos?
P. L.: Las tecnologas de la Web de datos, puesto que se habla cada vez menos de Web semntica, son
adoptadas cada vez ms por los organismos de investigacin para la codificacin de datos cientficos,
pero tambin por las empresas para la gestin liberada de la informacin. Igualmente, empezamos a ver
aparecer en la Web aplicaciones comerciales para el gran pblico (por ejemplo, el sitio Twine.com). El
acercamiento de Google es muy pragmtico: mientras los clculos estadsticos sobre el contenido de las
pginas web satisfaga a los usuarios, no se lanzan a la Web de datos, pero desde el momento en que las
tcnicas de la Web de datos ofrecen resultados comerciales interesantes, se sirven de ellas.
Multitudes: Afirma usted que el lmite de la Web semntica, o ms bien habra que decir ahora de la
Web de datos, est en que no permite codificar el sentido. Podra aclararnos esta idea?
P. L.: Se trata evidentemente de un problema muy complejo que es difcil de tratar de manera
exhaustiva y precisa en una entrevista de esta naturaleza. Digamos que la informtica hizo un gran
progreso cuando logr codificar las imgenes en binario (los pxeles), lo que ha permitido tratar
automticamente las imgenes y ha abierto el camino a la fotografa y al vdeo digitales, a los
programas de produccin de dibujos animados o a los videojuegos, as como a todos los Photoshops
posibles e imaginables. Del mismo modo, hoy existen distintos formatos de codificacin digital de la
msica que han abierto el camino a mtodos informatizados de composicin, de sampleo, de remezcla,
de sntesis, de grabacin y de intercambio (en perjuicio, claro, de los editores). Insisto en el hecho de
que la codificacin digital universal de la imagen y del sonido puede acomodarse a cualquier tradicin
visual o musical, y en que tal codificacin ha abierto el camino a mltiples mestizajes, incluso a nuevas
tradiciones. No se trata en absoluto de una uniformizacin esterilizante, bien al contrario. Pues bien, yo
busco, en la misma lnea, una codificacin digital del sentido, cuyo efecto podra ser un aumento
extraordinario de la potencia de expresin y de interpretacin en manos de los internautas y de sus
inteligencias colectivas.
Multitudes: Dicho de otra manera, cul son las limitaciones de la Web de hoy en da y, ms all, de la
Web de datos a la que usted se enfrenta?
P. L.: Simplificando, todo lo que tenemos hoy es una codificacin digital de caracteres (alfabticos o de
otro tipo), gracias al estndar unicode llamado utf8, as como una codificacin digital de ciertas
relaciones lgicas entre ciertas cadenas de caracteres (las ontologas de la Web de datos). Lo que yo
propongo es un sistema universal de codificacin de ideas y conceptos independiente de los lenguajes
naturales, como los pxeles son independientes de los estilos visuales y la norma mp3 es independiente
del lenguaje musical utilizado.
Multitudes: Pero, qu es lo que esto nos aportara?
P. L.: Un sistema universal de codificacin de ideas y conceptos como ste otorgara un fundamento
semntico a las ontologas y les permitira comunicarse mucho ms fcilmente de lo que lo hacen hoy.
Contendra de manera intrnseca una representacin formal (calculable automticamente) de las
relaciones entre los conceptos en diferentes niveles de complejidad. Adems, se tratara de un
metalenguaje abierto, que permitira la aadidura hasta el infinito de nuevos conceptos y de nuevas
relaciones entre conceptos. Se tratara, en suma, de construir una Web de conceptos (o una Web de
metadatos), por encima de la Web de datos, pero en absoluto contra ella, desde luego. No hay que
olvidar tampoco que una inmensa cantidad de metadatos no est organizada mediante ontologas.
Pienso en particular en los tags producidos espontneamente por los internautas en sus blogs, en
aplicaciones como Flickr, Delicious o YouTube, o incluso en los hashtags utilizados en Twitter. Si
esos tags espontneos, es decir, esa especie de etiquetas de definicin de contenidos, estuvieran
codificados como yo propongo, se volveran automticamente traducibles a todas las lenguas (por
medio de un diccionario colaborativo) y permitiran modos de bsqueda, de navegacin, de filtrado, de
sntesis informativa y de coordinacin de inteligencias colectivas inimaginables hoy en da.
Multitudes: Usted mismo trabaja, como investigador en Canad, en un lenguaje, el IEML
(Information Economy Meta Language), que podra paliar ciertas limitaciones de motores de
bsqueda como Googgle, y tambin de dicha Web de datos. Podra decirnos algunas palabras al
respecto?
P. L.: El IEML es, precisamente, una primera tentativa en la direccin que acabo de indicar. En primer
lugar, pens en este metalenguaje como en una suerte de sistema de coordenadas de un espacio
abstracto, al que llamo espacio semntico, en el que se despliegan los fenmenos de la inteligencia
colectiva humana.
Multitudes: Podra precisar su idea, en particular, a travs de eso que usted llama la inteligencia
colectiva humana?
P. L.: Mi intuicin fundamental es que existe una naturaleza (fractal, hipercompleja) de la
inteligencia colectiva que ahora podemos explorar y cartografiar de forma dinmica, puesto que
tenemos una memoria mundial tcnicamente unificada (alimentada por los flujos de datos y de
metadatos de cada cual) y una inmensa potencia de clculo descentralizada a nuestra disposicin. Todo
lo que nos falta es el sistema simblico unificador (sin ser uniformizante) adecuado a dicho objetivo.
La inteligencia colectiva humana es una naturaleza (nica, universal), pero es una naturaleza infinita en
sus virtualidades de diversidad cualitativa, de diferenciacin evolutiva y de complejizacin. Adems,
cada zona del espacio semntico infinito, que contiene la inteligencia colectiva, es, en potencia, un
punto de vista interpretativo original del conjunto: todos los puntos son centros virtuales. El IEML trata
de traducir esta visin a un dispositivo prctico.
Multitud: En qu lugar se encuentran ahora?

P. L.: El objetivo es que este metalenguaje pueda ser utilizable dentro de algunos aos. No tengo prisa;
sobre todo, me interesa que los fundamentos sean slidos. La finalidad ltima del espacio semntico
abierto por el IEML es permitir que los procesos de inteligencia colectiva se representen a s mismos y
favorecer as una conciencia reflexiva de la inteligencia colectiva humana tal como se desenvuelve y se
complejiza espontneamente en el ciberespacio. Es fcil representarse las repercusiones en el desarrollo
humano El IEML permitir distinguir las informaciones en funcin de su contenido y de su situacin
en el documento: atajo de comienzo, atajo de fin, etc. La base de la teora matemtica ya est planteada,
pero todava no ha sido publicada. Se ha construido un ncleo lxico a partir del cual generar, mediante
colaboracin, el diccionario multilinge. Un parser (es decir, una herramienta de anlisis sintctico), en
vas de construccin, permitir pasar automticamente de una representacin corriente a una
representacin binaria y a una forma XML compatible con Internet y con sus evoluciones ms
recientes. Una base de datos orientada hacia IEML est siendo probada, y ciertas herramientas de
traduccin semi-automtica de tags y de ontologas dirigidas a IEML estn en vas de desarrollo [3]
Multitudes: Puede darnos una idea de la amplitud del proyecto?
P. L.: El grupo de investigacin sobre el IEML es restringido, aunque internacional. Hoy en da trabajo
con equipos franceses (Labo paragraphe de Paris-8), coreanos (Universidad INHA), brasileos (PUC
Sao Paulo) y americanos (Michel Biezunski y Steve Newcomb, que son investigadores y asesores
independientes). Est previsto un libro que aparecer en Hermes-Sciences, primero en francs y
despus traducido al ingls. S perfectamente que todo esto (estas investigaciones sobre nuevas
dimensiones de la inteligencia colectiva, bastante ms all de un buscador como Google) parecer a
muchos una utopa nebulosa, incluso algo de ciencia ficcin. Pero he aprendido desde hace tiempo a no
fiarme de la opinin
Entrevista realizada por Ariel Kyrou. VERSIN EN FRANCS.
[1] Pierre Lvy, Lintelligence collective, Paris, La Dcouverte, 1994. Texto en lnea (Espaol).
[2] Pierre Lvy, Cyberdmocratie, Paris, Odile Jacob, 2002. Traduccin castellana en GOOGLE
LIBROS.
[3] Para saber ms sobre el IEML: http://www.ieml.org/

Caminos Inteligencia Colectiva

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Caminos Inteligencia Colectiva

Cargado por

Copyright:

Formatos disponibles

MS ALL de Google Los caminos de la Inteligencia

Colectiva Entrevista con Pierre Lvy

Multitud: En qu lugar se encuentran ahora?

También podría gustarte