Está en la página 1de 34

Big Data y Ciencias Sociales.

Usando
lentes cuantitativos para entender la
cultura
Alejandro Piscitelli*
Ayudante: Valeria Larrart**

Objetivos de la materia:

Familiarizar a los estudiantes con la problemtica bsica de las Humanidades Digitales


ligada a la analtica cultural y la lectura distante.

Inscribir estas nuevas formas de investigar, analizar, conocer y trabajar en el mundo del
Big Data Cultural.

Pasar revista a la evolucin, colapso y eventual desaparicin de los medios


tradicionales a partir de la emergencia de una metamedio y del cdigo/software como
infraestructura cultural

Analizar obras cannicas de las Humanidades Digitales como precursores del


movimiento en la actualidad

Proponer lneas de trabajo para el desarrollo de proyectos en Humanidades Digitales

Manejo de herramientas bsicas de visualizacin que permitirn adentrarse en la


problemtica de las humanidades digitales
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Fundamentacin terica:

Hablando de las Humanidades Digitales


Por ms que ltimamente se han publicado ms de una decena de libros seminales y
compilaciones sobre las Humanidades Digitales (ver bibliografa recomendada), es difcil llegar
a un consenso sobre en qu consisten las Humanidades Digitales. Como bien dice R
afael
Alvarado en este post en vez de una definicin, tenemos una genealoga, una red de
parentesco de familias entre escuelas de pensamiento, intereses metodolgicos, y
herramientas preferidas. Es decir una historia de gente que ha decidido autodenominarse
humanistas digitales y que en el proceso de definir el trmino lo estn recreando, como
e trata de una categora social, no de una
corresponde a toda definicin generativa. S
ontolgica.

Como afirma Matthew Kirschenbaum, uno de los padres fundadores de la disciplina, las Digital
Humanities giran alrededor de una revista con referato, una oficina nacional en USA, una
conferencia anual, y una red internacional de centros acadmicos bajo el auspicio de la Alliance
of Digital Humanities Organizations (ADHO).

El desplazamiento de las actividades inscriptas bajo el paraguas desde la computacin


humanstica hacia las humanidades digitales muestra un notable crecimiento en cantidad de
personas, instituciones y publicaciones. Mientras que durante muchos aos sus cultores se
conformaban con asistir a microscpicos THATCamp, en otras latitudes son multitudes las que
las coronan.

Una variedad inagotable de enfoques y procedimientos


Entre las novedades del enfoque humanista digital hay varias aproximaciones como revelan los
siguientes grupos de trabajo:

Los que descartan los remanentes textuales, que son lo propio de las humanidades
analgicas donde el conocimiento es una aplicacin basada en los textos, cuyos
curadores son crticos literarios, historiadores o bibliotecarios y van ms all del texto.

2
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Los que han abrazado las humanidades espaciales a travs del uso de software que
mapea el texto sobre la visualizacin de la geografa humana.
adre Roberto Busa y su alianza con IBM, hasta
Crticos estadsticos que van desde el P
Franco Moretti y su alianza con NGram de Google, quienes insisten en que aplicando
mtodos de lingstica computacional y observando grandes corpuses se podrn
generar hiptesis inaccesibles a la mera lectura (distant reading),
Proyectos como el Critical Code Studies que interpreta al cdigo fuente como un
conjunto de smbolos y procesos a explorar.

Todos estos y muchos otros ejemplos remiten a las humanidades digitales pero no las definen,
y eso que estn entre los mejor dotados financieramente, llenos de ideas y con cultores de
monta. Pero como insiste Alvarado, ninguno de ellos ha hecho una diferencia epistemolgica
abismal, aunque quizs el problema est en otro lado, en nuestra incapacidad de definir las
disciplinas de un modo que recoja la nueva forma de hacer las cosas postuladas por la
humanidades digitales.

Porque convengamos que para un outsider, pero tambin muchas ms veces para insiders
crticos, es muy difcil saber qu diferencia hay entre historia, sociologa, economa,
antropologa y arqueologa. Porque entre todas estas disciplinas hay ms coincidencias que
diferencias, y esta diferencia est ms que en cualquier otra en el modo en que se da cuenta
de un dominio particular de datos, su adquisicin, organizacin, anlisis e
interpretacin.

Indefiniendo una disciplina, haciendo cosas al programar


Para los humanistas digitales las tecnologas computacionales pueden ser cosas muy
diferentes y el grado de radicalidad de su tarea diferir acorde. No es lo mismo imaginarlas
como herramientas, como texto o como metforas. Despus de dar tantas vueltas podemos
convenir en que las humanidades digitales son ms que nada un curriculum, un conjunto
interrelacionado de dominios y recursos que contribuyen a la construccin de conocimiento.

3
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Quizs lo que mejor defina a las humanidades digitales no sean tanto las tecnologas a las que
recurre (innumerables y voltiles), ni los mtodos (que provienen de los campos consagrados
ms diversos), sino cierto encuentro alegre y juguetn con la representacin digital en
s misma.

Con dos detalles peculiares y muy interesantes. Por un lado que esa representacin digital est
cambiando de resultas de cmo est evolucionando el software, y de que en vez de
consignarnos a los rboles, los arrays, los lattices y otras combinaciones bidimensionales de
datos, podamos imaginar otras posibilidades tridimensionales cada vez ms complejas y ricas.

No menos interesante es que los humanistas digitales son cada vez ms son ellos mismos
programadores y constructores de dispositivos y de herramientas y plataformas, y por lo tanto
pueden participar de un tipos de conversaciones para la accin que se da muy pocas veces en
la historia.

Los humanistas digitales de ltima generacin f orman parte del movimiento maker, trabajan
en labs, son bilinges terico/prcticos, en algunos casos son polmatas que ejercen tanto
saberes conceptuales como prcticos, y por lo mismo estn en capacidad de combinar el
conocimiento y la accin de un modo similar al de los artesanos y filsofos renacentistas.
Aunque tamaa ambicin sea una exageracin al mismo tiempo es una interesante posibilidad.
Aprovechmosla.

Deviniendo posthumanos y ms an
Conocimos a Katherine Hayles en un evento organizado por la Media Ecology Association en
Mxico en el 2007. En ese entonces habamos ledo un par de sus libros como Chaos and
Order: Complex Dynamics in Literature and Science. (ed.) (1991) y How We Became
Posthuman: Virtual Bodies in Cybernetics, Literature and Informatics, (1999).

Como la mujer, que hoy ya pisa los 70 aos, no descansa nunca, ao a ao fue profundizando
en estas intersecciones desde la veta autobiogrfica como en My Mother Was a Computer:
Digital Subjects and Literary Texts (2005), metindose de lleno en la literatura digital como en
Electronic Literature: New Horizons for the Literary, (2008), para finalmente publicar en 2012 un

4
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

impresionante conjunto de ensayos y reflexiones concentradas en la pregunta que se hiciera


Vannevar Bush (1975) hace cerca de 80 aos en How we may think , con la diferencia de que
ella no especula tanto acerca de cmo ser el futuro sino que en How We Think: Digital Media
and Contemporary Technogenesis trabaja con un detalle y una profundidad pocas veces vista
antes, cmo escribimos, pensamos, investigamos, comunicamos, conectamos, etc. en el
universo digital.

Hayles, trabaja en las huellas de Marshall McLuhan y de Lev Manovich (2008), pero tambin
en el terreno balizado por Friedrich Kittler (1999) y Liza Gitelman (2006) y parte del movimiento
de las humanidades digitales que toma a la era de la imprenta como un artefacto cultural que
ya lleg a su pice y est en reflujo.

Para ella las tecnologas digitales se aprecian y valoran en un nivel estratificado de usos
acadmicos. En el ms bsico e-mail, los sitios web de los departamentos universitarios, las
bsquedas, los mensajes de texto, los archivos digitales, su diseminacin, etc. Casi todos en la
academia participan de este uso bsico.

Quienes llegamos ms all de esos usos primarios e instrumentales lo hemos hecho no slo
de la mano de programas y plataformas sino de una epistemologa subyacente que est en las
antpodas de la cultura letrada con su privilegio de las ideas y las discusiones abstractas, los
argumentos hipotticos y los juegos del lenguaje centrados bsicamente en el como si .
Aunque hay muchas vertientes y variantes la cultura letrada -a excepcin de sus herejes- en su
mayora est comprometida con una visin mentalista e individualista del conocimiento.

Cuando ampliamos esa visin y postulamos una cognicin extendida (Lakoff (1999), Varela et
al (1992) en la cual el pensamiento y la accin humanas se ven enredadas mas all de la
computadora aislada y dentro de una ecologa de acciones e intervenciones colectivas, hasta
la propia actividad acadmica se ve profundamente subvertida. Ello ocurri cuando los
acadmicos empezaron a utilizar las tecnologas como punto de partida para los procesos de
reinvencin de la investigacin.

5
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Las Humanidades digitales estn pasando de su etapa Lumire y Melies a


su etapa Griffith y Eisenstein.
Las humanidades digitales muestran como las formas de hacer humanidades y ciencias
sociales se han visto afectadas en todas sus fases: investigacin, comunicacin, enseanza,
mentorazgo, acreditacin, evaluacin de pares y, sobre todo, la (re)-articulacin de la
academia con la sociedad, al punto de que resulta llamativo e incomprensible el intento de
muchsimas instituciones por seguir operando como si viviramos a principios, mediados o
fines del siglo XX. Tanto en trminos de docencia como en trminos de investigacin.

Se trata pues de un nuevo nivel de involucramiento con el paradigma digital ligado al diseo e
implementacin de programas de investigacin en medios digitales. En este plano intervienen
en la puesta a punto cuestiones ligadas al diseo, la navegacin, la grfica, la animacin y su
integracin conceptual. Lo significativo aqu es la fuerza argumentativa que tiene cada una de
estas dimensiones con su apuesta crecientemente intensificadas hacia el trabajo colaborativo
en las antpodas del autismo epistemolgico propia de la investigacin centrada en un tema, en
una cabeza, en una tradicin de pensamiento y en una carrera profesional individual.

Al trabajar colaborativamente el acadmico digital puede incluir fcilmente a estudiantes en los


proyectos, y la apropiacin de la web forma parte constitutiva de cualquier emprendimiento. La
clase ya no alcanza como espacio para contener el trabajo y se abre el camino a los labs como
espacio de trabajo colaborativo y a los estudios en donde se produce e implementa. He aqu el
trpode inexistente e invisible para la academia tradicional de que es pensar/hacer en poca de
web masiva. Las tecnologa no solo estn cambiando el modo de hacer humanidades y
ciencias sociales sino tambin al sistema educativo (especialmente al universitario) en su
conjunto.

Actualmente estamos asistiendo a una segunda o tercera generacin de Digital Humanities


(Berry, 2011) a la que Hayles bautiz como Comparative Media Studies aparecida a mediados
y fines del 2000 y que se traducen en obras muy poco conocidas pero de un enorme poder de
evocacin, metaforizador y multiplicador de intersecciones .

6
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Esta variedad llamativa de obras critican ideolgicamente la retrica, los formatos y los
procedimientos propios del software, aluden a la retrica de los procedimientos (Ian Bogost),
se centran en la analtica cultural (Lev Manovich & Jeremy Douglas), que usan el anlisis
estadstico y las estructuras de base de datos para analizar enormes conjuntos de materiales
visuales impresos, como las tapas de la revista Time entre 1923 y 1989, o un milln de pginas
de novelas grficas de manga, mostrando cmo es posible analizar, criticar, comentar y
remixar formatos que van mas all del texto con la misma profundidad, valor y sofisticacin que
en el caso de los textos (Manovich, 2012).

Ensear lo que no se sabe todava


Contrariamente a la seguridad acadmica textual estos antidisciplinarios disean cursos que
ponen en cuestin la transparencia del texto y lo desnaturalizan hacindolo resonar con otros
medios. Es el caso de cursos como Literature+ de Alan Liu en UCSB, en los cuales los
estudiantes pueden elegir una historia o poema y lo modelizan, simulan, mapean, visualizan,
codifican, lo someten a anlisis de textos, lo samplean, mashupean, generan un storyboard o
blog, lo redisean como un juego, generan una versin en machinima, o lo convierten en una
base de datos, un hipertexto, o un mundo virtual.

En la misma direccin va el curso que ofrecen Jessica Brantley, una medievalista, y Jessica
Pressman, una especialista en literatura contempornea, ambas de Yale University,
comparando la transicin del manuscrito a la imprenta con el pasaje de la imprenta a lo digital,
y donde uno de los pilares del trabajo es el espacio del laboratorio y del diseo de experiencias
de lectoescritura.

Tecnognesis y coevolucin
La propuesta de Katherine Hayles no se agota con la presuncin de que hoy empezamos a
pensar distinto porque los medios con los que interactuamos son muy diferentes a los que
predominaron durante los 500 aos de hegemona de la imprenta.

7
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Ms all de este semitruismo Hayles plantea mcluhaniamente que estas diferencias son
atribuibles a una tecnognesis, dado que los humanos y la tcnica hemos coevolucionado
desde el fondo de la historia tal como se comprueba con la emergencia del bipedalismo junto
con la manufactura de herramientas y el transporte en una causalidad recproca continua.

A ello debemos sumarle el efecto Baldwin segn el cual cada vez que ocurre una mutacin
gentica su dispersin se acelera a travs de la poblacin cuando la especie reingenieriza su
entorno de modo tal que la mutacin sea ms adaptativa. Los cambios epigenticos iniciados y
trasmitidos a travs del entorno en vez de a travs del cdigo gentico tienen una fuerza
notable y a su vez pueden ser acelerados por cambios en el entorno que los hacen mas
adaptativos, lo que lleva recursivamente a producir ms cambios epigenticos que al
producirse en forma mucho ms acelerada que los biolgicos, amplifican a su vez los procesos
de transformacin en curso.

Entre esos cambios epigenticos uno que sobresale en trminos de tecnologas cognitivas son
las mutaciones en la capacidad de lectura (algo que como bien explicit Antonio Dehanae
(2010) en Reading in the brain) al no tener inscripcin gentica permite cambios significativos
ms all de cualquier mutacin), que despus de haber estado centradas durante centenares
de aos (y muy particularmente a nivel crecientemente masivo desde el advenimiento de la
imprenta) en la lectura exegtica, interpretativa y/o hermenutica, comenz en las ltimas
dcadas (otros dirn que el fenmeno viene desde ms atrs a partir del advenimiento de la
cultura de masas de los aos 1920 en adelante) a convertirse en nuevas modalidades y
formatos y muy particularmente en algo que desde los aos 1990 (con el advenimiento de la
web) denominamos hiperlectura (ver ms abajo)

Proyectos de trabajo automatizado


Cuando nos centramos en la obra de diseadores textuales como Kenneth J. Knoespel
McEver Professor of Engineering & Liberal Arts at Georgia Tech nos encontramos con
ejemplos vivos de la Tercera Cultura (que nos viene prometiendo John Brockman (1996) hace
dcadas), a partir de una combinacin de anlisis textual y una enorme variedad de otras
modalidades de trabajo automatizado que llaman poderosamente la atencin y nos inspiran a
revisarlos atentamente.

8
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Lo mismo vale cuando analizamos un proyecto como la iniciativa Transcriptions de Alan Liu,
director del English Departamento de la Universidad de California en Santa Brbara, (que por
otra parte se inici en el prehistrico 1998).

Tambin ocurre cuando revisamos los nmeros de la revista Vectors codirigida por Tara
McPherson. En todos los casos y en la mejor tradicin edupunk no solo cambia la naturaleza
de la investigacin sino tambin el formato pedaggico y, muy especialmente, el lugar de los
no-alumnos que rompen con todas las divisorias y estructuras momificadas propias de la
academia tradicional.

Pero no se trata solo de tecnologa o de anlisis sino tambin de implicancias ideolgicas de


largo aliento. En esta orientacin la funcin del crtico es hacer aflorar la ideologa del texto a
plena luz para as develarla y resistirla del mejor modo posible. Iniciada en reas del
psicoanlisis y del marxismo ya han pasado dcadas de lectura sintomtica.

Por eso vemos emerger junto a esa lectura profunda o de cerca (que ms que nada proyecta
sobre el material analizado sus propios juicios y reflejos) una lectura superficial para la cual el
texto no vale por sus claves ocultas sino por su mensaje explcito, una recuperacin de su
valor esttico y una variedad de estrategias de lectura centradas en el afecto, el placer y el
valor cultural.

Retomando la idea-fuerza de L. S. Vygotsky de zona de desarrollo prximo con su nfasis en


la capacidad real del lector (punto de partida para su amplificacin a futuro) los trabajos de
Robertson, Fluck & Webb acerca del encofrado, igual que la nocin de zona de capacidad
reflexiva de Tinsley and Lebak, muestran que el aprendizaje (aqu la lectura en nuevos
soportes medios y formatos) puede ocurrir por instruccin directa pero tambin trabajando con
pares ms avezados.

9
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

La lucha potica/poltica a favor y en contra del digitalismo


Es tiempo de que empecemos a criticar al mantra de la crtica. Pero mucho ms interesante
an es que los humanistas digitales empecemos a disear nuevas herramientas que estn a la
altura de nuestra profesin como propone Anne Balsamo (2011) en Designing Culture: The
Technological Imagination at Work. Debemos prestar cada vez ms y mejor atencin a las
bsquedas automatizadas de informacin, debemos enfrascarnos en el diseo y anlisis de las
bases de datos, y debemos mejorar y potenciar el diseo de interfaces ya que todo ello forma
parte del core de nuestra pertenencia el mundo de las digital humanities.

Nadie debera sorprenderse de esta mutacin en curso (y eventos como la convencin de la


Modern Language Association en 2009 #mla09 as lo sealan) cuando se relevan los cambios
epocales que supusieron el pasaje de la escritura manuscrita a la dactilografiada como lo
revel Friedrich Kittler (1992).

El humanista digital debe estar atento a la informacin que se despliega en los monitores o
pantallas, y al mismo tiempo al cdigo que genera esos productos. La escritura del cdigo se
ve as afectada por su poder generativo (circularidad bien teorizada por Francisco Varela,
en1999, varias dcadas atrs). En la literatura en/de la web parece haber una primaca de
bloques cortos de prosa que no exigen deslizar la pantalla (scroll), y tambin de bloques
conceptuales que puede ser rearmados a voluntad.

Reading on the brain


Empezamos a escribir hace casi 10.000 aos atrs en el contexto de nuestra habilidad para
reconocer formas naturales. Los escribas utilizaron estas correspondencias para disear
sistemas de escritura que pudieran reorganizar circuitos neuronales preexistentes. A lo largo de
milenios tuvo lugar un poderoso proceso de seleccin que permiti la aparicin de sistemas de
notacin cada vez ms eficientes adecuados al funcionamiento cerebral. El neocortex no
evolucion por lo tanto, para escribir sino que la escritura evolucion para adecuarla a las
demandas y posibilidades del neocortex.

10
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

As las cosas no debera sorprendernos ver emerger nuevas evoluciones notacionales y de


formatos, navegaciones, escorzos y propuestas enderezadas a una coevolucin cada vez ms
intensa entre weblectoescritura y evolucin cerebral. Pero esta eventualidad no tiene nada que
ver con las conclusiones facilistas de que Internet sera el medio adecuado para matar el
recableado cerebral propuesto por la Imprenta, y correlativamente de nuestra capacidad crtica
de resistir a los cantos de sirena propuestos por los usos ms ingenuos, superficiales y
filoespectaculares que seran la estopa profunda de la que estara hecha la web.

Hiperlecturas
La hiperlectura que incluye el escaneado, el picoteo, la fragmentacin y la yuxtaposicin de
textos, es una respuesta adaptativa a la proliferacin de un entorno intensivo en informacin,
que busca dirigir la atencin en informacin a lo ipso facto relevante, de modo tal que lo ledo
es tan solo una parte minscula de los disponible en la pantalla.

La hiperlectura viene acompaada con la hiperatencin, una modalidad cognitiva con baja
tolerancia hacia el aburrimiento, que presta atencin en paralelo a distintos flujos
informacionales y prefiere un alto nivel de estimulacin. La lectura profunda (o cercana) va de
consumo con una atencin profunda, con el modo de conocimiento tpico de las humanidades
con su nfasis en una fuente de informacin nica, que focaliza la atencin en un solo objeto
cultural durante largo tiempo, y que tiene una tolerancia infinita para con el aburrimiento.

Es hora pues de que admitamos la coexistencia de fortalezas y limitantes en cada modo


cognitivo, la existencia de pedagogas diferenciales (algo que ni la escuela ni mucho menos la
universidad tienden a aceptar por ahora) y la obligatoriedad de tender puentes entre estas
estrategias dismiles y muchas veces contradictorias.

Dado que la investigacin y la enseanza en las humanidades suponen un problema (o


desafo) de diseo (una vez que nos liberamos de una epistemologa de los contenidos y
pasamos a una epistemologa de los problemas y los proyectos), habr que prestar especial
cuidado a las dinmicas de la atencin como un factor limitador para todo proyecto imaginable
en un mundo hipercargado de datos e informacin .

11
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Mquinas inteligentes de lectoescritura


Si a la hiperlectura le sumamos la capacidad diseada de algunas mquinas que pueden leer
por s mismas, habr que reconceptualizar nuestra idea de que son objetos de anlisis, los que
dejaremos de entrever como entidades estticas y empezaremos a tratar como ensamblajes
mutantes. Los objetos devienen as en individuos tcnicos embebidos en redes de relaciones
sociales, econmicas, y tecnolgicas, algunas de las cuales son humanas y otras no.

Tanto la materialidad como los propios objetos no son datos a priori sino procesos dinmicos
que cambian a medida que se altera el punto de vista: las prcticas sociales producen espacios
sociales.

Si hay algo ajeno a la investigacin humanstica es el trabajo basado en la prctica prototpica


de la ciencia. Hacer algo (gestar un producto que conlleva muchsimas horas de trabajo
manual) tiene numerosas implicancias que van mas all de hacer cosas con palabras. La
prctica como habilidad encarnada est sumamente vinculada con la conceptualizacin.

La forma como est cambiando la investigacin, la inclusin de la programacin como una


prctica lingstica necesaria y los proyectos web de alto alcance de las humanidades, estn
mostrando como el comercio masivo con las tecnologas digitales est afectando de cabo a
rabo los presupuestos y prejuicios de los acadmicos, incluyendo su definicin profesional y su
visin del futuro de su profesin.

Trabajos de campo y las manos en la masa


Ms all de las generalidades y de los lugares comunes, cuando nos ensimismamos en las
intrincadas relaciones entre anlisis maquinal y lectura humana emergen prcticas de lectura
inditas y de enorme inters para la refundacin de los estudios humanistas, pero sobre todo,
para la arquitectura institucional asociada a la universidad tal como ha vivido indisolublemente
a la imprenta durante 5 siglos (Ver The futures of digital humanities is a matter of words).

Sin embargo no todo es oro lo que reluce en este terreno. Tambin hay una inflacin de
promesas y de reiteraciones poco felices al tratar a las digital humanities como una panacea.

12
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Porque una cosa es plantear a las humanidades digitales como horizonte epistemolgico
(Willard McCarty en Humanities Computing) y otra muy distinta es creer en el poder mgico de
los algoritmos.

Artculos recientes como los de Stephen Marche Literature is not Data: Against Digital
Humanities y las siempre insistentes pullas de Nicholas Carr como en Will Gutenberg laugh last
llevan a que nos tomemos las cosas con ms calma, a que los anlisis sean ms mesurados, a
que no creamos que las digital humanities son un genio salido de la botella dispuesto a ir por
todo y conseguirlo sin ms.

Disputas intensas como las que han tenido lugar a principios de 2013 entre Steven Johnson y
Evgeny Morozov (Sasaki, 2013) acerca de los nuevos poderes (si es que los hay) de la web en
cuanto a fuente de conocimiento y de sentido y muy particularmente las endechas de Brooks
(2013) en contra de la sustitucin de la narrativa a manos de los datos con sagaces crticas

Y an as se trata de un territorio lleno de desafos y propuestas.

Definiciones

Qu es la BIG DATA?
El primer cuestionamiento que posiblemente llegue a su mente en este momento es Qu es
Big Data y porqu se ha vuelto tan importante? pues bien, en trminos generales podramos
referirnos como a la tendencia en el avance de la tecnologa que ha abierto las puertas hacia
un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir
enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que
tomara demasiado tiempo y sera muy costoso cargarlos a un base de datos relacional para su
anlisis. De tal manera que, el concepto de Big Data aplica para toda aquella informacin que
no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.

13
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Sin embargo, Big Data no se refiere a alguna cantidad en especfico, ya que es usualmente
utilizado cuando se habla en trminos de petabytes y exabytes de datos. Entonces Cunto es
demasiada informacin de manera que sea elegible para ser procesada y analizada utilizando
Big Data? Analicemos primeramente en trminos de bytes:

Gigabyte = 109 = 1,000,000,000


Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000

Adems del gran volumen de informacin, esta existe en una gran v ariedad de datos que
pueden ser representados de diversas maneras en todo el mundo, por ejemplo de dispositivos
mviles, audio, video, sistemas GPS, incontables sensores digitales en equipos industriales,
automviles, medidores elctricos, veletas, anemmetros, etc., los cuales pueden medir y
comunicar el posicionamiento, movimiento, vibracin, temperatura, humedad y hasta los
cambios qumicos que sufre el aire, de tal forma que las aplicaciones que analizan estos datos
requieren que la velocidad de respuesta sea lo demasiado rpida para lograr obtener la
informacin correcta en el momento preciso. Estas son las caractersticas principales de una
oportunidad para Big Data.

Es importante entender que las bases de datos convencionales son una parte importante y
relevante para una solucin analtica. De hecho, se vuelve mucho ms vital cuando se usa en
conjunto con la plataforma de Big Data. Pensemos en nuestras manos izquierda y derecha,
cada una ofrece fortalezas individuales para cada tarea en especfico. Por ejemplo, un
beisbolista sabe que una de sus manos es mejor para lanzar la pelota y la otra para atraparla;
puede ser que cada mano intente hacer la actividad de la otra, mas sin embargo, el resultado
no ser el ms ptimo.

14
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

De dnde proviene toda esa informacin?


Los seres humanos estamos creando y almacenando informacin constantemente y cada vez
ms en cantidades astronmicas. Se podra decir que si todos los bits y bytes de datos del
ltimo ao fueran guardados en CD's, se generara una gran torre desde la Tierra hasta la Luna
y de regreso.

Esta contribucin a la acumulacin masiva de datos la podemos encontrar en diversas


industrias, las compaas mantienen grandes cantidades de datos transaccionales, reuniendo
informacin acerca de sus clientes, proveedores, operaciones, etc., de la misma manera
sucede con el sector pblico. En muchos pases se administran enormes bases de datos que
contienen datos de censo de poblacin, registros mdicos, impuestos, etc., y si a todo esto le
aadimos transacciones financieras realizadas en lnea o por dispositivos mviles, anlisis de
redes sociales (en Twitter son cerca de 12 Terabytes de tweets creados diariamente y
Facebook almacena alrededor de 100 Petabytes de fotos y videos), ubicacin geogrfica
mediante coordenadas GPS, en otras palabras, todas aquellas actividades que la mayora de
nosotros realizamos varias veces al da con nuestros "smartphones", estamos hablando de que
se generan alrededor de 2.5 quintillones de bytes diariamente en el mundo.
1 quintilln = 10 30 = 1,000,000,000,000,000,000,000,000,000,000

De acuerdo con un estudio realizado por Cisco, entre el 2011 y el 2016 la cantidad de trfico de
datos mviles crecer a una tasa anual de 78%, as como el nmero de dispositivos mviles
conectados a Internet exceder el nmero de habitantes en el planeta. Las naciones unidas
proyectan que la poblacin mundial alcanzar los 7.5 billones para el 2016 de tal modo que
habr cerca de 18.9 billones de dispositivos conectados a la red a escala mundial, esto
conllevara a que el trfico global de datos mviles alcance 10.8 Exabytes mensuales o 130
Exabytes anuales. Este volumen de trfico previsto para 2016 equivale a 33 billones de DVDs
anuales o 813 cuatrillones de mensajes de texto.

Pero no solamente somos los seres humanos quienes contribuimos a este crecimiento enorme
de informacin, existe tambin la comunicacin denominada mquina a mquina (M2M
machine-to-machine) cuyo valor en la creacin de grandes cantidades de datos tambin es
muy importante.

15
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Sensores digitales instalados en contenedores para determinar la ruta generada durante una
entrega de algn paquete y que esta informacin sea enviada a las compaas de
transportacin, sensores en medidores elctricos para determinar el consumo de energa a
intervalos regulares para que sea enviada esta informacin a las compaas del sector
energtico. Se estima que hay ms de 30 millones de sensores interconectados en distintos
sectores como automotriz, transportacin, industrial, servicios, comercial, etc. y se espera que
este nmero crezca en un 30% anualmente.

Big Data y el campo de investigacin


Los cientficos e investigadores han analizado datos desde ya hace mucho tiempo, lo que
ahora representa el gran reto es la escala en la que estos son generados.

Esta explosin de "grandes datos" est transformando la manera en que se conduce una
investigacin adquiriendo habilidades en el uso de Big Data para resolver problemas complejos
relacionados con el descubrimiento cientfico, investigacin ambiental y biomdica, educacin,
salud, seguridad nacional, entre otros.

Con la capacidad de generar toda esta informacin valiosa de diferentes sistemas, las
empresas y los gobiernos estn lidiando con el problema de analizar los datos para dos
propsitos importantes: ser capaces de detectar y responder a los acontecimientos actuales de
una manera oportuna, y para poder utilizar las predicciones del aprendizaje histrico.
Esta situacin requiere del anlisis tanto de datos en movimiento (datos actuales) como de
datos en reposo (datos histricos), que son representados a diferentes y enormes volmenes,
variedades y velocidades.

La naturaleza de la informacin hoy es diferente a la informacin en el pasado. Debido a la


abundancia de sensores, micrfonos, cmaras, escneres mdicos, imgenes, etc. en nuestras
vidas, los datos generados a partir de estos elementos sern dentro de poco el segmento ms
grande de toda la informacin disponible.

16
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

El uso de Big Data ha ayudado a los investigadores a descubrir cosas que les podran haber
tomado aos en descubrir por s mismos sin el uso de estas herramientas, debido a la
velocidad del anlisis, es posible que el analista de datos pueda cambiar sus ideas basndose
en el resultado obtenido y retrabajar el procedimiento una y otra vez hasta encontrar el
verdadero valor al que se est tratando de llegar.
Extrado de: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/

Actividades de Taller:
El investigador en humanidades digitales procura incorporar las herramientas digitales no como
un bonus, un extra, sino como parte fundamental de sus recursos. Estas herramientas se
trabajan a partir de una metodologa gil, que encuentra referencia en el pensamiento de
diseo, centrado en dar soluciones a necesidades. Esas soluciones pueden ser muy variadas,
y se evaluarn en trminos de eficacia, performance y resultados. Ante la necesidad de trabajar
con las grandes cantidades de informacin que nos ofrece por ejemplo YouTube, hemos
encontrado varias soluciones para resolver este problema.
Aqu les ofrecemos un paso a paso para que puedan evaluarlas por ustedes mismos.

Hacerle preguntas a los datos: Interactive YouTube API Demo Beta


Cmo hacerle preguntas a los datos de YouTube? Mediante una herramienta llamada
Interactive YouTube API Demo Beta:
https://developers.google.com/youtube/v3/ - Entrar en Documentation

Vamos a diseccionar un poco el nombre para entender ms esta herramienta. La primera


palabra es Interactive (interactivo) es decir que vamos a poder performar operaciones con la
herramienta, vamos a poder usarla. YouTube: Nuestro objeto de estudio, ahora ya sabemos
que vamos a poder hacer operaciones en YouTube mediante esta herramienta. API: Este es el
trmino ms crptico pero el ms rico. Qu es una API? API significa: Application
Programming Interface (Interfaz de Programacin de Aplicaciones en espaol).

17
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Una API es el conjunto de herramientas que tiene un software para conectarse con otro
software, es decir, es un protocolo de comunicacin entre diferentes programas, o en el caso
de YouTube, entre diferentes servicios web. Una API tiene ciertas caractersticas y hay cosas
que permite y otras que no, si queremos obtener datos de una API tenemos que saber cmo
preguntarle por esos datos. Si queremos obtener un resultado, tenemos que cumplir ciertos
procesos, llenar ciertos formularios y esperar la respuesta. Hay cosas sobre las que no
tenemos capacidad de operar y tenemos que esperar que la otra parte decida y nos comunique
la decisin.

Hasta ahora entonces tenemos que esta herramienta nos permite operar en YouTube,
utilizando la API como protocolo de comunicacin. Las dos ltimas palabras las podemos
unificar: Demo y Beta. Lo que sabemos ac es que: No tiene todas las funciones que tiene la
API de YouTube ya que es una versin de demostracin y que al ser una beta (Una versin no
final) puede fallar. Entonces nos queda as:

Interactive YouTube API Demo Beta es una herramienta que nos permite operar en YouTube,
utilizando la API como protocolo de comunicacin. Al ser una versin no final algunas veces
puede fallar y como es una versin de demostracin no tiene todas las caractersticas
disponibles.

Ahora bien, qu es lo que podemos hacer con esta herramienta? Primero que nada,
explorarla por nuestra cuenta y tratar de entender cmo funciona. Si esto no resulta, ac les
dejo unos tips de lo que puede ser til:

Primero que nada es importante destacar que la funcin que nos interesa es la de Query
(Bsqueda en ingls). Create y delete son operaciones de escritura en un canal propio por lo
que no nos son tiles. Siempre que hagamos el seteo de la query vamos a utilizar la V2 de la
API y la proyeccin ser siempre programtica.

18
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Video Feeds
Videos
Trae los videos segn categoras o keywords, se puede usar operadores lgicos and/or y se
pueden traer hasta 50 videos por vez (Pero usando la opcin Results starting with podemos
pedir que nos traiga a partir del video 51, con lo cual podemos saltar el paginado). Se puede
ordenar por relevancia, fecha de publicacin o cantidad de views y se puede filtrar el formato de
video y el safesearch.

Related
Trae los videos relacionados de un video, hay que insertar el id del video del que queremos
obtener los datos (Es el cdigo alfanumrico que viene despus del = en la URL del mismo)
Tambin se puede usar el Results starting with para traer ms de 50 videos y saltearse el
paginado.

Uploads
Trae los videos subidos por un determinado usuario, hay que insertar el id del usuario (nick o
cdigo alfanumrico si el usuario no lo seteo). Se puede ordenar por relevancia, fecha de
publicacin o cantidad de views y se puede filtrar el formato de video y el safesearch.

Community Features
Comments
Trae los comentarios a un determinado video, se inserta el id del video y se pueden traer 50
comentarios mximo por vez, otra vez, usando el Results begin with salteamos esa limitacin.

Responses
Trae las videorespuestas a un determinado video, se inserta el id del video y se pueden traer
50 comentarios mximo por vez, otra vez, usando el Results begin with salteamos esa
limitacin.

19
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Saving and Collecting


Favorites
Trae los videos faveados por determinado usuario, ingresamos el id del usuario y se puede
ordenar por relevancia, fecha de publicacin o cantidad de views y se puede filtrar el formato de
video y el safesearch.

Playlists
Trae las playlists creadas por determinado usuario solo tenemos que ingresar el id del usuario.

Subscriptions
Trae los canales a los que est suscrito determinado usuario.

Standard Feeds
Most recent
Most viewed
Top rated
Most discussed
Top favorites
Most linked
Recently featured
Most responded

Estas querys no hay que configurarlas ya que lo que hacen es traer los videos que cumplen
esos criterios. Si especificamos estas bsquedas y no hay ningn video que cumpla con el
criterio que est en esos listados nos va a tirar un error. Cmo decamos anteriormente, las
APIs estn pensadas para funcionar como protocolo de comunicacin entre un software y otro,
por lo que el resultado se entrega en un formato llamado XML que al principio parece un
pedazo de cdigo que si se nos apareciera entre sueos calificaramos como pesadilla pero
que si nos sentamos a leerlo durante algunos minutos vamos a ver que es muy sencillo de
entender.

20
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Algo til puede ser hacer copy&paste de todo ese texto y pegarlo en un programa de bloc de
notas avanzado como Notepad++, SublimeText o TextMate, guardarlo como archivo XML y ver
como el programa nos lo formatea para que sea ms claro.

Convertir datos en informacin: del xml al Excel


XML?
Ahora bien. Ahora nos toca hacer ese archivo en formato XML que nos dio la API un poco ms
amigable. Al principio no parece muy fcil, pero si miramos con atencin y detenimiento, vamos
a comprender cmo est organizada la informacin que necesitamos extraer.

Pero, qu es XML? Es un lenguaje utilizado para almacenar datos de forma estructurada en


un archivo de texto (como la informacin de una hoja de clculo) que sigue cierto estndar,
hacindolo til para intercambiar informacin entre aplicaciones. Otra vez? Decimos que es
un lenguaje para la entrada de datos estructurada porque cualquiera que quiera escribir un
archivo con este formato deber seguir un mtodo particular para escribir la informacin (data),
pudiendo determinar cierta estructura y jerarqua; de esta manera generamos un archivo de
texto que al estar estructurado de forma estndar, puede ser seguida por quien lo lee.

Cualquiera de nosotros puede crear y customizar los tags de un XML. En XML se pueden
definir un nmero ilimitado de tags. Este tipo de archivos puede ser ledo por cualquier
programa similar a un bloc de notas avanzado como Notepad++, SublimeText o TextMate.

Nos creen si les decimos que con algunos pasos podemos abrir este tipo de archivos con el
tan conocido amigo Excel, del paquete Office? S, es posible, siempre y cuando que el archivo
en XML est bien formado o escrito con una correcta sintaxis. Es muy fcil, tens que tener
guardado el archivo en tu computadora, abrir Microsoft Excel y desde ese programa abrir el
archivo. Ten en cuenta que debers seleccionar all files o todos los archivos en la ventana
que te habilita a abrir (para que no slo te muestre los archivos en formato XML Spreadsheet
(XMLSS), el formato tradicional de Excel).

21
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Luego, te aparecer una mini ventanita como esta:

22
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Para poder operar con los datos, elegir como un documento de slo lectura. Al dar ok, el
archivo xml es aplanado o transformado en una hoja de clculo de doble entrada compuesta
por filas y columnas, ms parecido a lo que todos conocemos. Los tags del XML (del tipo ttulo
del video, url, cantidad de vistas, cantidad de comentarios, etc.) aparecen en la primera
fila como cabezales de cada columna y los datos se organizan a partir de esos cabezales y en
cada fila. Como el archivo se abri solo-lectura, para poder modificarlo y jugar con l debers
guardar tu archivo como un Excel tradicional, en un formato XML Spreadsheet (XMLSS). Bien,
hasta ac todo marcha perfecto. Qu puede pasar? Algo muy comn con los demos (los
programas de demostracin como la API que les mostramos) pueden ocasionar algunos
errores. En este caso, es muy posible que por algn error de sintaxis del archivo XML que les
devuelve la API, Excel no les permita abrir el archivo. En ese caso, habr que volver al XML y
revisar la informacin que marca como errnea. Para realizar esto hace falta conocer un poco
ms sobre cmo se escribe en este formato. Adems, esta informacin no est filtrada, lo que
quiere decir que muchas de las columnas que les aparecern no les servirn para analizar ya
que contendrn informacin redundante e intiles para sus fines, por lo que debern eliminar
gran parte de ellas (si es que no tienen la posibilidad de hacerlo con un programa de forma
automtica).

Otra herramienta para extraer informacin de YouTube es TubeKit. TubeKit lo que hace es
llamar de forma automatizada a YouTube, pidiendo informacin de acuerdo a nuestra
bsqueda. YouTube devuelve la informacin en formato XML y TubeKit la procesa, cargndola
en una base de datos. Estos datos luego pueden exportarse para usar en Excel.

Excel
Como ya deben saber, Excel es un programa distribuido por Microsoft Office para hojas de
clculo. Normalmente se utiliza para tareas financieras o contables pero nosotros les
proponemos un uso ms relacionado con el procesamiento de los datos recolectados para
poder realizar el anlisis.

Entendemos que no todos han utilizado Excel en profundidad y por tal motivo no conocen todas
las herramientas y utilidades que pueden darle a este poderoso programa. Al mismo tiempo,
deben entender que no podemos transcribir un tutorial total e integral para su uso.

23
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Por ese motivo, les acercamos tutoriales que han realizado otros. Hemos filtrado aquellas
herramientas que pueden ser tiles para los proyectos que ustedes realizarn.

Bases de datos
Formatos de celdas
Funciones / Video tutorial
Frmulas
Filtros: Ordenar y filtrar
Eliminar datos duplicados
Atajos del teclado
Buscar datos
Formato condicional: (para aplicar de manera selectiva y automtica un formato
a las celdas de acuerdo a su contenido).
Funcin si
Grficos:
de torta
de lneas
de barras

Este programa no tiene porqu convertirse en el mero depositario de sus bases de datos, sino
que les puede ayudar a interpretarlos y aislar variables, y en muchos casos automatizar
bsquedas que, de hacerlas manualmente o artesanalmente, podran salvarles tiempo. Por
este motivo, decidimos compartir un ejemplo de cmo trabajar con tablas dinmicas.

24
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Tablas dinmicas
Las tablas dinmicas permiten resumir y analizar fcilmente grandes cantidades de informacin
con tan slo arrastrar y soltar las diferentes columnas en un cuadrado diseado para tal fin (que
contempla diferentes reas). De esta manera, se pueden aislar las variables que se desean
analizar y esto permitir ver la informacin ms claramente para luego visualizar.

He aqu un ejemplo [hacer click aqu para descargar el ejemplo] en el que utilizamos una base
de datos provista por TubeKit, con determinada informacin sobre videos relacionados con
Cromagnon, con un sinttico paso a paso para su confeccin. A partir de que formulamos la
siguiente hiptesis: La cantidad de comentarios de estos videos es proporcional a las vistas,
decidimos aislar las variables de identificacin de video, comentarios y vistas. Asimismo
decidimos ver esta informacin agrupada por ao y mes, por lo que tuvimos que crear nuevas
variables (Ao y Mes), a partir de usar funciones que nos suministra Excel. Recuerden que
cada fila representa la informacin de un video.

25
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Paso 1: Dirigirse a Insertar/Tabla Dinmica. Excel nos preguntar qu rango de celdas


utilizaremos podemos seleccionar toda la tabla y hacer clic en Aceptar. Este paso puede ser
obviado si estamos parados en alguna celda que sea parte de los datos. Excel calcular
automticamente que celdas usar.

Paso 2: En una hoja nueva en blanco, aparecer un cuadro a la derecha que nos ayudar a
determinar los campos de informacin para insertar en esta nueva hoja. Cada uno de estos
campos se corresponde con una columna de nuestra base principal.

Paso 3: Para completar la tabla dinmica debemos arrastrar los campos al rea
correspondiente (filtro de informe, etiquetas de columnas, etiquetas de filas y valores).

Paso 4: Como sealamos al principio trasladamos al sector de Filas de la TD las variables de


Ao y Mes creadas por nosotros. Y agregamos al sector de Valores las variables con las
cantidades de visitas y comentarios.

Paso 5: Ahora podemos generar el grfico usando el botn derecho e insertando el grafico XY
Aqu encontrarn un tutorial muy detallado sobre tablas dinmicas
http://exceltotal.com/tablas-dinamicas-en-excel/ para que puedan consultar.

La visualizacin de la informacin, Manyeyes, Wordle, Infogram y Voyant


Tools.
El tercer, aunque quizs no el ltimo paso para el anlisis de los datos extrados, es el de la
visualizacin grfica de la informacin. Les presentamos cuatro herramientas: ManyEyes,
Wordle, Infogram y Voyant Tools. Son muy tiles y permiten una buena aproximacin a los
datos/textos, los van separando de su aparente naturaleza inconexa.

26
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

ManyEyes
Algunas de las caractersticas de Many Eyes son:
Es interactivo. Los usuarios pueden: crear sus propias bases de datos y sus propias
visualizaciones, interactuar y modificar visualizaciones realizadas por otros, y usar los
set de datos que otras usuarios suben para realizar sus propias visualizaciones.
Es pblico y colaborativo: todo contenido que se sube a Many Eyes es completamente
visible en Internet y puede ser reutilizado por otros.
Antes de comenzar con los esenciales de Many Eyes, les paso unas recomendaciones:
Actualicen su navegador (funciona muy bien con Chrome).
Actualicen la aplicacin Java .
Ingresen en el sitio http://www-958.ibm.com/
Regstrense
Si queremos crear nuestras propias visualizaciones, el proceso consta de dos pasos:
Subir el set de datos: la aplicacin acepta formatos xls y txt.
Crear nuestras propias visualizaciones de datos, eligiendo las ms convenientes para el
tema a tratar.

El men de visualizaciones de Many Eyes es muy amplio, y la habilidad consiste en elegir los
formatos ms apropiados para el tema que queremos tratar. En esta oportunidad elegimos
trabajar con los videos etiquetados como #FSOC en su ttulo, descripcin o etiqueta. Nuestra
base consta de 480 videos.

Desde esta pgina, accedemos a los tres pasos necesarios para crear las visualizaciones: subir
la base/crear las visualizaciones/publicar las visualizaciones.

Recomendaciones:
Trabajar con bases de datos de pocas columnas. Las que nosotros creamos tienen no
ms de tres. Pueden utilizar las que resulten de su anlisis con las tablas dinmicas de
Excel. Es por eso que creamos diferentes bases de datos, cada una adecuada al tipo de
visualizacin que quisimos lograr.

27
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

No olvidar de publicar la visualizacin. El programa primera mostrar una vista previa de


la visualizacin, pero para que la misma quede grabada hay que publicarla.
Ordenar las bases de datos y las visualizaciones en un topic center, a efectos de
encontrarlas ms rpidamente.
Una vez creado el topic center, las visualizaciones y las bases de datos se pueden
agregar a l con un botn que figura debajo de la visualizacin o de la base de datos.

A partir de la misma , mostramos ejemplos de distintos formatos: rbol de palabras, mapa de


redes, grficos de barra y otros.

28
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Wordle
Wordle es muy fcil de usar http://www.wordl.net/. Ponerla en prctica es un ejercicio casi
intuitivo, la pagina te va llevando. Hay algunas salvedades que pueden servir a la hora de
generar una visualizacin coherente, que responda a los fines de la investigacin y que nos
permita ver los datos.

Por ejemplo; fuente y color simples, no ornamentados, homogenizan el resultado dejando al


tamao que adquieran las palabras en la nube la tarea de sealar su importancia y recurrencia
dentro del texto. El color llamativo en una palabra podra sugerir que es ms importante que
otra y que esto no sea as a los hechos (a los datos). Es recomendable tambin que
predomine el orden horizontal por los mismos motivos. Dentro de las opciones se pueden
eliminar de la nube las palabras comunes del espaol, para personalizar le dan botn derecho
sobre la palabra que quieran eliminar, y remove. Estas salvedades se hacen teniendo en
cuenta que la nube va a ser utilizada en una investigacin y no con fines decorativos. Peguen
el texto en la ventana, pongan Go y jueguen un poco.

29
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Detalle: la manera de hacerse con esta nube de palabras es a travs de una captura de
pantalla.

Voyant Tools
Voyant Tools http://voyant-tools.org/, tambin tiene una ventana para pegar texto y generar
una nube de palabras. A la vez nos muestra otras cosas.

30
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Hay cuatro pantallas principales que rodean al texto. La del extremo superior izquierdo muestra
la nube de palabras, la del extremo inferior nos ensea la cantidad de veces que las palabras
aparecen en el texto, de aqu podemos hacer copiar-pegar y pasarlo directamente a un Excel.
Es esta ventana se seleccionan tambin las palabras que aparecen retratadas en el grfico de
la pantalla superior derecha, estas lneas nos muestran la recurrencia de los trminos a travs
del texto, podemos poner en relacin dos o ms como as tambin seleccionar una sola. La
ltima pantalla (abajo a la derecha) muestra el trmino seleccionado en su contexto. Las
marcas azules que aparecen al costado izquierdo del texto muestran la densidad; cada
pequea lnea corresponde a una porcin de texto y la intensidad del color habla de la
recurrencia del trmino seleccionado en ese fragmento de texto, al azul ms oscuro le
corresponde mayor aparicin de la palabra y viceversa. Clickeando sobre el icono de arriba a la
derecha (al lado del signo de pregunta) se nos da la opcin de generar una URL para acceder
directamente a nuestra visualizacin, tambin podemos descargar la nube a nuestra
computadora, la opcin est en la ventana que la contiene. En esta herramienta, al igual que en
la anterior, se pueden filtrar las palabras ms comunes de cada idioma a travs de una lista
predeterminada susceptible de ser modificada por el usuario.

Infogram
https://infogr.am/ Para utilizar esta herramienta tienen que loguearse. Una vez logueados les da
la opcin de crear infografas y tablas.

Amigarse con esta herramienta lleva un rato ya que requiere mayor interaccin y aporte por
parte del usuario, los resultados tambin son diferentes. El universo de posibilidades se
expande en relacin a las primeras dos opciones. Los datos ya no se cargan en una ventana
para texto sino en una planilla a la que se le puede pegar una de Excel, ah deben generarse
las variables y cargarse los datos que luego aparecern retratadas en los grficos.

31
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

En este caso, si bien ms complejo, la pgina tambin va guiando, cada opcin de infografa
viene con un ejemplo que hace de molde para trabajar sobre eso, sirve por lo menos hasta que
se agiliza el uso.

32
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Bibliografa de referencia:
Berry, David M. (Editor) Understanding Digital Humanities
Burdick, Anne; Lunenfeld, Peter et al Digital HUmanities
Gold, Matthew K. (Editor) Debates in the Digital Humanities 2012
McCarty, Willard Humanities Computing
Ramsay, Stephen Reading Machines: Toward an Algorithmic Criticism
Schreibman, Susan; Siemens, Ray & Unsworth, John (Editor) A Companion to Digital
Humanities 2008
Manovich, Lev Big Data, Visualization, and Digital Humanities course at CUNY
Graduate Center, Spring 2013
Balsamo, Anne Designing Culture: The Technological Imagination at Work (2011).
Bartsherer, Thomas & Roderick Coover (eds) Switching Codes. Thinking through digital
technology in the humanities and the arts (2011).
Berry, David Digital Humanities: First, Second and Third Wave
Brockman, John (1996)
Brooks, David What Data Cant Do T he New York Times 18/3/2013
Bush, Vannevar "Como podemos pensar". En Pylyshyn, Zenon W. Perspectivas de la
revolucin de las computadores. Madrid Alianza, 1975.
Clark, Andy Supersizing the mind. Embodiment, action and cognitive extension (2011)
Dehanae 2012
Epstein, Mikhail The trasformative humanities. A Manifesto (2012)
Fuller, Matthew Media Ecologies Materialist energies in art and technoculture (2005)
Gitelman, Liza (2006)
Gold, Matthew K. (Editor) Debates in the Digital Humanities Indice (2012)
Hamilton, David Publishing by and for? the Numbers Higher Education. December
31, 2009.
Interchange: The Promise of Digital History
Pennenberg, Adam The book as we know it is dead Interface 2011, 27th July 2011,
UCL London.
Kirschanbaum, Matthew G. Mechanisms. New media and the forensic imagination
(2008)
Kittler, Friedrich (1999) especialmente en Gramophone, Film, Typewrite
Lakoff, y Johnson, Mark Philosophy in the flesh: the embodied mind and its challenge to
western thought (1999)
Liu, Alan The laws of cool Knowledge work and the culture of information (2004)
Liu, Alan. 2004. The Laws of Cool: Knowledge Work and the Culture of Information.
Chicago: University of Chicago Press.
Mangen, Anne. 2009. The Impact of Digital Technology on Immersive Fiction Reading:
A Cognitive-Phenomenological Study. Saarbrcker, Germany: VDM Verlag.
Manovich, Lev (2008),
Naughton, John How algorithms secretly shape the way we behave

33
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.

Ramsay, Stephen Reading Machines: Toward an Algorithmic Criticism


Sasaki, David Future Imperfect: Evgeny Morozov vs. Steven Johnson 27/2/2013
Taleb, Nassim The Surprising Truth: Technology Is Aging in Reverse
The Digital Humanities Manifesto 2.0
Unsworth, John (2002) What Is Humanities Ccomputing and what is not?
Varela, F. et al. De Cuerpo Presente. Las ciencias cognitivas y la experiencia humana.
Barcelona Gedisa,1992.

______________________________________________________________________
*Lic. en Filosofa (UBA), Mster en Ciencias de Sistemas (Universidad de Louisville - EEUU) y
Master en Ciencias Sociales (FLACSO - Argentina). Especialista en nuevos medios. Se
desempea como Profesor Titular del Taller de Procesamiento de Datos, Telemtica e
Informtica, en la carrera de Ciencias de la Comunicacin, UBA. Docente en FLACSO y en la
Universidad de San Andrs. Es coeditor del diario online Interlink Headline News (ILHN). Entre
2003 y 2008 fue gerente general del portal educativo Educ.ar.

**Profesora especializada en la inclusin de las tecnologas a la educacin. Co-fundadora de


ILAB, un Laboratorio de ideas para renovar el aprendizaje mediado por las tecnologas.
Facilitadora pedaggica digital, miembro del consejo consultivo y ambiente de pruebas en el
Ministerio de Educacin de la CABA. Integrante de proyectos de insercin de robtica
educativa en la CABA, Pcia. de San Luis, Pcia. de La Rioja, entre otros. Capacitadora del portal
Educ.ar del Ministerio de Educacin de Nacin. Particip del proyecto "ConectarLab" dentro del
programa "Conectar Igualdad".

34
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura

También podría gustarte