Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Usando
lentes cuantitativos para entender la
cultura
Alejandro Piscitelli*
Ayudante: Valeria Larrart**
Objetivos de la materia:
Inscribir estas nuevas formas de investigar, analizar, conocer y trabajar en el mundo del
Big Data Cultural.
Fundamentacin terica:
Como afirma Matthew Kirschenbaum, uno de los padres fundadores de la disciplina, las Digital
Humanities giran alrededor de una revista con referato, una oficina nacional en USA, una
conferencia anual, y una red internacional de centros acadmicos bajo el auspicio de la Alliance
of Digital Humanities Organizations (ADHO).
Los que descartan los remanentes textuales, que son lo propio de las humanidades
analgicas donde el conocimiento es una aplicacin basada en los textos, cuyos
curadores son crticos literarios, historiadores o bibliotecarios y van ms all del texto.
2
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Los que han abrazado las humanidades espaciales a travs del uso de software que
mapea el texto sobre la visualizacin de la geografa humana.
adre Roberto Busa y su alianza con IBM, hasta
Crticos estadsticos que van desde el P
Franco Moretti y su alianza con NGram de Google, quienes insisten en que aplicando
mtodos de lingstica computacional y observando grandes corpuses se podrn
generar hiptesis inaccesibles a la mera lectura (distant reading),
Proyectos como el Critical Code Studies que interpreta al cdigo fuente como un
conjunto de smbolos y procesos a explorar.
Todos estos y muchos otros ejemplos remiten a las humanidades digitales pero no las definen,
y eso que estn entre los mejor dotados financieramente, llenos de ideas y con cultores de
monta. Pero como insiste Alvarado, ninguno de ellos ha hecho una diferencia epistemolgica
abismal, aunque quizs el problema est en otro lado, en nuestra incapacidad de definir las
disciplinas de un modo que recoja la nueva forma de hacer las cosas postuladas por la
humanidades digitales.
Porque convengamos que para un outsider, pero tambin muchas ms veces para insiders
crticos, es muy difcil saber qu diferencia hay entre historia, sociologa, economa,
antropologa y arqueologa. Porque entre todas estas disciplinas hay ms coincidencias que
diferencias, y esta diferencia est ms que en cualquier otra en el modo en que se da cuenta
de un dominio particular de datos, su adquisicin, organizacin, anlisis e
interpretacin.
3
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Quizs lo que mejor defina a las humanidades digitales no sean tanto las tecnologas a las que
recurre (innumerables y voltiles), ni los mtodos (que provienen de los campos consagrados
ms diversos), sino cierto encuentro alegre y juguetn con la representacin digital en
s misma.
Con dos detalles peculiares y muy interesantes. Por un lado que esa representacin digital est
cambiando de resultas de cmo est evolucionando el software, y de que en vez de
consignarnos a los rboles, los arrays, los lattices y otras combinaciones bidimensionales de
datos, podamos imaginar otras posibilidades tridimensionales cada vez ms complejas y ricas.
No menos interesante es que los humanistas digitales son cada vez ms son ellos mismos
programadores y constructores de dispositivos y de herramientas y plataformas, y por lo tanto
pueden participar de un tipos de conversaciones para la accin que se da muy pocas veces en
la historia.
Los humanistas digitales de ltima generacin f orman parte del movimiento maker, trabajan
en labs, son bilinges terico/prcticos, en algunos casos son polmatas que ejercen tanto
saberes conceptuales como prcticos, y por lo mismo estn en capacidad de combinar el
conocimiento y la accin de un modo similar al de los artesanos y filsofos renacentistas.
Aunque tamaa ambicin sea una exageracin al mismo tiempo es una interesante posibilidad.
Aprovechmosla.
Deviniendo posthumanos y ms an
Conocimos a Katherine Hayles en un evento organizado por la Media Ecology Association en
Mxico en el 2007. En ese entonces habamos ledo un par de sus libros como Chaos and
Order: Complex Dynamics in Literature and Science. (ed.) (1991) y How We Became
Posthuman: Virtual Bodies in Cybernetics, Literature and Informatics, (1999).
Como la mujer, que hoy ya pisa los 70 aos, no descansa nunca, ao a ao fue profundizando
en estas intersecciones desde la veta autobiogrfica como en My Mother Was a Computer:
Digital Subjects and Literary Texts (2005), metindose de lleno en la literatura digital como en
Electronic Literature: New Horizons for the Literary, (2008), para finalmente publicar en 2012 un
4
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Hayles, trabaja en las huellas de Marshall McLuhan y de Lev Manovich (2008), pero tambin
en el terreno balizado por Friedrich Kittler (1999) y Liza Gitelman (2006) y parte del movimiento
de las humanidades digitales que toma a la era de la imprenta como un artefacto cultural que
ya lleg a su pice y est en reflujo.
Para ella las tecnologas digitales se aprecian y valoran en un nivel estratificado de usos
acadmicos. En el ms bsico e-mail, los sitios web de los departamentos universitarios, las
bsquedas, los mensajes de texto, los archivos digitales, su diseminacin, etc. Casi todos en la
academia participan de este uso bsico.
Quienes llegamos ms all de esos usos primarios e instrumentales lo hemos hecho no slo
de la mano de programas y plataformas sino de una epistemologa subyacente que est en las
antpodas de la cultura letrada con su privilegio de las ideas y las discusiones abstractas, los
argumentos hipotticos y los juegos del lenguaje centrados bsicamente en el como si .
Aunque hay muchas vertientes y variantes la cultura letrada -a excepcin de sus herejes- en su
mayora est comprometida con una visin mentalista e individualista del conocimiento.
Cuando ampliamos esa visin y postulamos una cognicin extendida (Lakoff (1999), Varela et
al (1992) en la cual el pensamiento y la accin humanas se ven enredadas mas all de la
computadora aislada y dentro de una ecologa de acciones e intervenciones colectivas, hasta
la propia actividad acadmica se ve profundamente subvertida. Ello ocurri cuando los
acadmicos empezaron a utilizar las tecnologas como punto de partida para los procesos de
reinvencin de la investigacin.
5
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Se trata pues de un nuevo nivel de involucramiento con el paradigma digital ligado al diseo e
implementacin de programas de investigacin en medios digitales. En este plano intervienen
en la puesta a punto cuestiones ligadas al diseo, la navegacin, la grfica, la animacin y su
integracin conceptual. Lo significativo aqu es la fuerza argumentativa que tiene cada una de
estas dimensiones con su apuesta crecientemente intensificadas hacia el trabajo colaborativo
en las antpodas del autismo epistemolgico propia de la investigacin centrada en un tema, en
una cabeza, en una tradicin de pensamiento y en una carrera profesional individual.
6
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Esta variedad llamativa de obras critican ideolgicamente la retrica, los formatos y los
procedimientos propios del software, aluden a la retrica de los procedimientos (Ian Bogost),
se centran en la analtica cultural (Lev Manovich & Jeremy Douglas), que usan el anlisis
estadstico y las estructuras de base de datos para analizar enormes conjuntos de materiales
visuales impresos, como las tapas de la revista Time entre 1923 y 1989, o un milln de pginas
de novelas grficas de manga, mostrando cmo es posible analizar, criticar, comentar y
remixar formatos que van mas all del texto con la misma profundidad, valor y sofisticacin que
en el caso de los textos (Manovich, 2012).
En la misma direccin va el curso que ofrecen Jessica Brantley, una medievalista, y Jessica
Pressman, una especialista en literatura contempornea, ambas de Yale University,
comparando la transicin del manuscrito a la imprenta con el pasaje de la imprenta a lo digital,
y donde uno de los pilares del trabajo es el espacio del laboratorio y del diseo de experiencias
de lectoescritura.
Tecnognesis y coevolucin
La propuesta de Katherine Hayles no se agota con la presuncin de que hoy empezamos a
pensar distinto porque los medios con los que interactuamos son muy diferentes a los que
predominaron durante los 500 aos de hegemona de la imprenta.
7
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Ms all de este semitruismo Hayles plantea mcluhaniamente que estas diferencias son
atribuibles a una tecnognesis, dado que los humanos y la tcnica hemos coevolucionado
desde el fondo de la historia tal como se comprueba con la emergencia del bipedalismo junto
con la manufactura de herramientas y el transporte en una causalidad recproca continua.
A ello debemos sumarle el efecto Baldwin segn el cual cada vez que ocurre una mutacin
gentica su dispersin se acelera a travs de la poblacin cuando la especie reingenieriza su
entorno de modo tal que la mutacin sea ms adaptativa. Los cambios epigenticos iniciados y
trasmitidos a travs del entorno en vez de a travs del cdigo gentico tienen una fuerza
notable y a su vez pueden ser acelerados por cambios en el entorno que los hacen mas
adaptativos, lo que lleva recursivamente a producir ms cambios epigenticos que al
producirse en forma mucho ms acelerada que los biolgicos, amplifican a su vez los procesos
de transformacin en curso.
Entre esos cambios epigenticos uno que sobresale en trminos de tecnologas cognitivas son
las mutaciones en la capacidad de lectura (algo que como bien explicit Antonio Dehanae
(2010) en Reading in the brain) al no tener inscripcin gentica permite cambios significativos
ms all de cualquier mutacin), que despus de haber estado centradas durante centenares
de aos (y muy particularmente a nivel crecientemente masivo desde el advenimiento de la
imprenta) en la lectura exegtica, interpretativa y/o hermenutica, comenz en las ltimas
dcadas (otros dirn que el fenmeno viene desde ms atrs a partir del advenimiento de la
cultura de masas de los aos 1920 en adelante) a convertirse en nuevas modalidades y
formatos y muy particularmente en algo que desde los aos 1990 (con el advenimiento de la
web) denominamos hiperlectura (ver ms abajo)
8
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Lo mismo vale cuando analizamos un proyecto como la iniciativa Transcriptions de Alan Liu,
director del English Departamento de la Universidad de California en Santa Brbara, (que por
otra parte se inici en el prehistrico 1998).
Tambin ocurre cuando revisamos los nmeros de la revista Vectors codirigida por Tara
McPherson. En todos los casos y en la mejor tradicin edupunk no solo cambia la naturaleza
de la investigacin sino tambin el formato pedaggico y, muy especialmente, el lugar de los
no-alumnos que rompen con todas las divisorias y estructuras momificadas propias de la
academia tradicional.
Por eso vemos emerger junto a esa lectura profunda o de cerca (que ms que nada proyecta
sobre el material analizado sus propios juicios y reflejos) una lectura superficial para la cual el
texto no vale por sus claves ocultas sino por su mensaje explcito, una recuperacin de su
valor esttico y una variedad de estrategias de lectura centradas en el afecto, el placer y el
valor cultural.
9
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
El humanista digital debe estar atento a la informacin que se despliega en los monitores o
pantallas, y al mismo tiempo al cdigo que genera esos productos. La escritura del cdigo se
ve as afectada por su poder generativo (circularidad bien teorizada por Francisco Varela,
en1999, varias dcadas atrs). En la literatura en/de la web parece haber una primaca de
bloques cortos de prosa que no exigen deslizar la pantalla (scroll), y tambin de bloques
conceptuales que puede ser rearmados a voluntad.
10
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Hiperlecturas
La hiperlectura que incluye el escaneado, el picoteo, la fragmentacin y la yuxtaposicin de
textos, es una respuesta adaptativa a la proliferacin de un entorno intensivo en informacin,
que busca dirigir la atencin en informacin a lo ipso facto relevante, de modo tal que lo ledo
es tan solo una parte minscula de los disponible en la pantalla.
La hiperlectura viene acompaada con la hiperatencin, una modalidad cognitiva con baja
tolerancia hacia el aburrimiento, que presta atencin en paralelo a distintos flujos
informacionales y prefiere un alto nivel de estimulacin. La lectura profunda (o cercana) va de
consumo con una atencin profunda, con el modo de conocimiento tpico de las humanidades
con su nfasis en una fuente de informacin nica, que focaliza la atencin en un solo objeto
cultural durante largo tiempo, y que tiene una tolerancia infinita para con el aburrimiento.
11
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Tanto la materialidad como los propios objetos no son datos a priori sino procesos dinmicos
que cambian a medida que se altera el punto de vista: las prcticas sociales producen espacios
sociales.
Sin embargo no todo es oro lo que reluce en este terreno. Tambin hay una inflacin de
promesas y de reiteraciones poco felices al tratar a las digital humanities como una panacea.
12
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Porque una cosa es plantear a las humanidades digitales como horizonte epistemolgico
(Willard McCarty en Humanities Computing) y otra muy distinta es creer en el poder mgico de
los algoritmos.
Artculos recientes como los de Stephen Marche Literature is not Data: Against Digital
Humanities y las siempre insistentes pullas de Nicholas Carr como en Will Gutenberg laugh last
llevan a que nos tomemos las cosas con ms calma, a que los anlisis sean ms mesurados, a
que no creamos que las digital humanities son un genio salido de la botella dispuesto a ir por
todo y conseguirlo sin ms.
Disputas intensas como las que han tenido lugar a principios de 2013 entre Steven Johnson y
Evgeny Morozov (Sasaki, 2013) acerca de los nuevos poderes (si es que los hay) de la web en
cuanto a fuente de conocimiento y de sentido y muy particularmente las endechas de Brooks
(2013) en contra de la sustitucin de la narrativa a manos de los datos con sagaces crticas
Definiciones
Qu es la BIG DATA?
El primer cuestionamiento que posiblemente llegue a su mente en este momento es Qu es
Big Data y porqu se ha vuelto tan importante? pues bien, en trminos generales podramos
referirnos como a la tendencia en el avance de la tecnologa que ha abierto las puertas hacia
un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir
enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que
tomara demasiado tiempo y sera muy costoso cargarlos a un base de datos relacional para su
anlisis. De tal manera que, el concepto de Big Data aplica para toda aquella informacin que
no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.
13
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Sin embargo, Big Data no se refiere a alguna cantidad en especfico, ya que es usualmente
utilizado cuando se habla en trminos de petabytes y exabytes de datos. Entonces Cunto es
demasiada informacin de manera que sea elegible para ser procesada y analizada utilizando
Big Data? Analicemos primeramente en trminos de bytes:
Adems del gran volumen de informacin, esta existe en una gran v ariedad de datos que
pueden ser representados de diversas maneras en todo el mundo, por ejemplo de dispositivos
mviles, audio, video, sistemas GPS, incontables sensores digitales en equipos industriales,
automviles, medidores elctricos, veletas, anemmetros, etc., los cuales pueden medir y
comunicar el posicionamiento, movimiento, vibracin, temperatura, humedad y hasta los
cambios qumicos que sufre el aire, de tal forma que las aplicaciones que analizan estos datos
requieren que la velocidad de respuesta sea lo demasiado rpida para lograr obtener la
informacin correcta en el momento preciso. Estas son las caractersticas principales de una
oportunidad para Big Data.
Es importante entender que las bases de datos convencionales son una parte importante y
relevante para una solucin analtica. De hecho, se vuelve mucho ms vital cuando se usa en
conjunto con la plataforma de Big Data. Pensemos en nuestras manos izquierda y derecha,
cada una ofrece fortalezas individuales para cada tarea en especfico. Por ejemplo, un
beisbolista sabe que una de sus manos es mejor para lanzar la pelota y la otra para atraparla;
puede ser que cada mano intente hacer la actividad de la otra, mas sin embargo, el resultado
no ser el ms ptimo.
14
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
De acuerdo con un estudio realizado por Cisco, entre el 2011 y el 2016 la cantidad de trfico de
datos mviles crecer a una tasa anual de 78%, as como el nmero de dispositivos mviles
conectados a Internet exceder el nmero de habitantes en el planeta. Las naciones unidas
proyectan que la poblacin mundial alcanzar los 7.5 billones para el 2016 de tal modo que
habr cerca de 18.9 billones de dispositivos conectados a la red a escala mundial, esto
conllevara a que el trfico global de datos mviles alcance 10.8 Exabytes mensuales o 130
Exabytes anuales. Este volumen de trfico previsto para 2016 equivale a 33 billones de DVDs
anuales o 813 cuatrillones de mensajes de texto.
Pero no solamente somos los seres humanos quienes contribuimos a este crecimiento enorme
de informacin, existe tambin la comunicacin denominada mquina a mquina (M2M
machine-to-machine) cuyo valor en la creacin de grandes cantidades de datos tambin es
muy importante.
15
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Sensores digitales instalados en contenedores para determinar la ruta generada durante una
entrega de algn paquete y que esta informacin sea enviada a las compaas de
transportacin, sensores en medidores elctricos para determinar el consumo de energa a
intervalos regulares para que sea enviada esta informacin a las compaas del sector
energtico. Se estima que hay ms de 30 millones de sensores interconectados en distintos
sectores como automotriz, transportacin, industrial, servicios, comercial, etc. y se espera que
este nmero crezca en un 30% anualmente.
Esta explosin de "grandes datos" est transformando la manera en que se conduce una
investigacin adquiriendo habilidades en el uso de Big Data para resolver problemas complejos
relacionados con el descubrimiento cientfico, investigacin ambiental y biomdica, educacin,
salud, seguridad nacional, entre otros.
Con la capacidad de generar toda esta informacin valiosa de diferentes sistemas, las
empresas y los gobiernos estn lidiando con el problema de analizar los datos para dos
propsitos importantes: ser capaces de detectar y responder a los acontecimientos actuales de
una manera oportuna, y para poder utilizar las predicciones del aprendizaje histrico.
Esta situacin requiere del anlisis tanto de datos en movimiento (datos actuales) como de
datos en reposo (datos histricos), que son representados a diferentes y enormes volmenes,
variedades y velocidades.
16
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
El uso de Big Data ha ayudado a los investigadores a descubrir cosas que les podran haber
tomado aos en descubrir por s mismos sin el uso de estas herramientas, debido a la
velocidad del anlisis, es posible que el analista de datos pueda cambiar sus ideas basndose
en el resultado obtenido y retrabajar el procedimiento una y otra vez hasta encontrar el
verdadero valor al que se est tratando de llegar.
Extrado de: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/
Actividades de Taller:
El investigador en humanidades digitales procura incorporar las herramientas digitales no como
un bonus, un extra, sino como parte fundamental de sus recursos. Estas herramientas se
trabajan a partir de una metodologa gil, que encuentra referencia en el pensamiento de
diseo, centrado en dar soluciones a necesidades. Esas soluciones pueden ser muy variadas,
y se evaluarn en trminos de eficacia, performance y resultados. Ante la necesidad de trabajar
con las grandes cantidades de informacin que nos ofrece por ejemplo YouTube, hemos
encontrado varias soluciones para resolver este problema.
Aqu les ofrecemos un paso a paso para que puedan evaluarlas por ustedes mismos.
17
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Una API es el conjunto de herramientas que tiene un software para conectarse con otro
software, es decir, es un protocolo de comunicacin entre diferentes programas, o en el caso
de YouTube, entre diferentes servicios web. Una API tiene ciertas caractersticas y hay cosas
que permite y otras que no, si queremos obtener datos de una API tenemos que saber cmo
preguntarle por esos datos. Si queremos obtener un resultado, tenemos que cumplir ciertos
procesos, llenar ciertos formularios y esperar la respuesta. Hay cosas sobre las que no
tenemos capacidad de operar y tenemos que esperar que la otra parte decida y nos comunique
la decisin.
Hasta ahora entonces tenemos que esta herramienta nos permite operar en YouTube,
utilizando la API como protocolo de comunicacin. Las dos ltimas palabras las podemos
unificar: Demo y Beta. Lo que sabemos ac es que: No tiene todas las funciones que tiene la
API de YouTube ya que es una versin de demostracin y que al ser una beta (Una versin no
final) puede fallar. Entonces nos queda as:
Interactive YouTube API Demo Beta es una herramienta que nos permite operar en YouTube,
utilizando la API como protocolo de comunicacin. Al ser una versin no final algunas veces
puede fallar y como es una versin de demostracin no tiene todas las caractersticas
disponibles.
Ahora bien, qu es lo que podemos hacer con esta herramienta? Primero que nada,
explorarla por nuestra cuenta y tratar de entender cmo funciona. Si esto no resulta, ac les
dejo unos tips de lo que puede ser til:
Primero que nada es importante destacar que la funcin que nos interesa es la de Query
(Bsqueda en ingls). Create y delete son operaciones de escritura en un canal propio por lo
que no nos son tiles. Siempre que hagamos el seteo de la query vamos a utilizar la V2 de la
API y la proyeccin ser siempre programtica.
18
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Video Feeds
Videos
Trae los videos segn categoras o keywords, se puede usar operadores lgicos and/or y se
pueden traer hasta 50 videos por vez (Pero usando la opcin Results starting with podemos
pedir que nos traiga a partir del video 51, con lo cual podemos saltar el paginado). Se puede
ordenar por relevancia, fecha de publicacin o cantidad de views y se puede filtrar el formato de
video y el safesearch.
Related
Trae los videos relacionados de un video, hay que insertar el id del video del que queremos
obtener los datos (Es el cdigo alfanumrico que viene despus del = en la URL del mismo)
Tambin se puede usar el Results starting with para traer ms de 50 videos y saltearse el
paginado.
Uploads
Trae los videos subidos por un determinado usuario, hay que insertar el id del usuario (nick o
cdigo alfanumrico si el usuario no lo seteo). Se puede ordenar por relevancia, fecha de
publicacin o cantidad de views y se puede filtrar el formato de video y el safesearch.
Community Features
Comments
Trae los comentarios a un determinado video, se inserta el id del video y se pueden traer 50
comentarios mximo por vez, otra vez, usando el Results begin with salteamos esa limitacin.
Responses
Trae las videorespuestas a un determinado video, se inserta el id del video y se pueden traer
50 comentarios mximo por vez, otra vez, usando el Results begin with salteamos esa
limitacin.
19
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Playlists
Trae las playlists creadas por determinado usuario solo tenemos que ingresar el id del usuario.
Subscriptions
Trae los canales a los que est suscrito determinado usuario.
Standard Feeds
Most recent
Most viewed
Top rated
Most discussed
Top favorites
Most linked
Recently featured
Most responded
Estas querys no hay que configurarlas ya que lo que hacen es traer los videos que cumplen
esos criterios. Si especificamos estas bsquedas y no hay ningn video que cumpla con el
criterio que est en esos listados nos va a tirar un error. Cmo decamos anteriormente, las
APIs estn pensadas para funcionar como protocolo de comunicacin entre un software y otro,
por lo que el resultado se entrega en un formato llamado XML que al principio parece un
pedazo de cdigo que si se nos apareciera entre sueos calificaramos como pesadilla pero
que si nos sentamos a leerlo durante algunos minutos vamos a ver que es muy sencillo de
entender.
20
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Algo til puede ser hacer copy&paste de todo ese texto y pegarlo en un programa de bloc de
notas avanzado como Notepad++, SublimeText o TextMate, guardarlo como archivo XML y ver
como el programa nos lo formatea para que sea ms claro.
Cualquiera de nosotros puede crear y customizar los tags de un XML. En XML se pueden
definir un nmero ilimitado de tags. Este tipo de archivos puede ser ledo por cualquier
programa similar a un bloc de notas avanzado como Notepad++, SublimeText o TextMate.
Nos creen si les decimos que con algunos pasos podemos abrir este tipo de archivos con el
tan conocido amigo Excel, del paquete Office? S, es posible, siempre y cuando que el archivo
en XML est bien formado o escrito con una correcta sintaxis. Es muy fcil, tens que tener
guardado el archivo en tu computadora, abrir Microsoft Excel y desde ese programa abrir el
archivo. Ten en cuenta que debers seleccionar all files o todos los archivos en la ventana
que te habilita a abrir (para que no slo te muestre los archivos en formato XML Spreadsheet
(XMLSS), el formato tradicional de Excel).
21
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
22
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Para poder operar con los datos, elegir como un documento de slo lectura. Al dar ok, el
archivo xml es aplanado o transformado en una hoja de clculo de doble entrada compuesta
por filas y columnas, ms parecido a lo que todos conocemos. Los tags del XML (del tipo ttulo
del video, url, cantidad de vistas, cantidad de comentarios, etc.) aparecen en la primera
fila como cabezales de cada columna y los datos se organizan a partir de esos cabezales y en
cada fila. Como el archivo se abri solo-lectura, para poder modificarlo y jugar con l debers
guardar tu archivo como un Excel tradicional, en un formato XML Spreadsheet (XMLSS). Bien,
hasta ac todo marcha perfecto. Qu puede pasar? Algo muy comn con los demos (los
programas de demostracin como la API que les mostramos) pueden ocasionar algunos
errores. En este caso, es muy posible que por algn error de sintaxis del archivo XML que les
devuelve la API, Excel no les permita abrir el archivo. En ese caso, habr que volver al XML y
revisar la informacin que marca como errnea. Para realizar esto hace falta conocer un poco
ms sobre cmo se escribe en este formato. Adems, esta informacin no est filtrada, lo que
quiere decir que muchas de las columnas que les aparecern no les servirn para analizar ya
que contendrn informacin redundante e intiles para sus fines, por lo que debern eliminar
gran parte de ellas (si es que no tienen la posibilidad de hacerlo con un programa de forma
automtica).
Otra herramienta para extraer informacin de YouTube es TubeKit. TubeKit lo que hace es
llamar de forma automatizada a YouTube, pidiendo informacin de acuerdo a nuestra
bsqueda. YouTube devuelve la informacin en formato XML y TubeKit la procesa, cargndola
en una base de datos. Estos datos luego pueden exportarse para usar en Excel.
Excel
Como ya deben saber, Excel es un programa distribuido por Microsoft Office para hojas de
clculo. Normalmente se utiliza para tareas financieras o contables pero nosotros les
proponemos un uso ms relacionado con el procesamiento de los datos recolectados para
poder realizar el anlisis.
Entendemos que no todos han utilizado Excel en profundidad y por tal motivo no conocen todas
las herramientas y utilidades que pueden darle a este poderoso programa. Al mismo tiempo,
deben entender que no podemos transcribir un tutorial total e integral para su uso.
23
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Por ese motivo, les acercamos tutoriales que han realizado otros. Hemos filtrado aquellas
herramientas que pueden ser tiles para los proyectos que ustedes realizarn.
Bases de datos
Formatos de celdas
Funciones / Video tutorial
Frmulas
Filtros: Ordenar y filtrar
Eliminar datos duplicados
Atajos del teclado
Buscar datos
Formato condicional: (para aplicar de manera selectiva y automtica un formato
a las celdas de acuerdo a su contenido).
Funcin si
Grficos:
de torta
de lneas
de barras
Este programa no tiene porqu convertirse en el mero depositario de sus bases de datos, sino
que les puede ayudar a interpretarlos y aislar variables, y en muchos casos automatizar
bsquedas que, de hacerlas manualmente o artesanalmente, podran salvarles tiempo. Por
este motivo, decidimos compartir un ejemplo de cmo trabajar con tablas dinmicas.
24
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Tablas dinmicas
Las tablas dinmicas permiten resumir y analizar fcilmente grandes cantidades de informacin
con tan slo arrastrar y soltar las diferentes columnas en un cuadrado diseado para tal fin (que
contempla diferentes reas). De esta manera, se pueden aislar las variables que se desean
analizar y esto permitir ver la informacin ms claramente para luego visualizar.
He aqu un ejemplo [hacer click aqu para descargar el ejemplo] en el que utilizamos una base
de datos provista por TubeKit, con determinada informacin sobre videos relacionados con
Cromagnon, con un sinttico paso a paso para su confeccin. A partir de que formulamos la
siguiente hiptesis: La cantidad de comentarios de estos videos es proporcional a las vistas,
decidimos aislar las variables de identificacin de video, comentarios y vistas. Asimismo
decidimos ver esta informacin agrupada por ao y mes, por lo que tuvimos que crear nuevas
variables (Ao y Mes), a partir de usar funciones que nos suministra Excel. Recuerden que
cada fila representa la informacin de un video.
25
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Paso 2: En una hoja nueva en blanco, aparecer un cuadro a la derecha que nos ayudar a
determinar los campos de informacin para insertar en esta nueva hoja. Cada uno de estos
campos se corresponde con una columna de nuestra base principal.
Paso 3: Para completar la tabla dinmica debemos arrastrar los campos al rea
correspondiente (filtro de informe, etiquetas de columnas, etiquetas de filas y valores).
Paso 5: Ahora podemos generar el grfico usando el botn derecho e insertando el grafico XY
Aqu encontrarn un tutorial muy detallado sobre tablas dinmicas
http://exceltotal.com/tablas-dinamicas-en-excel/ para que puedan consultar.
26
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
ManyEyes
Algunas de las caractersticas de Many Eyes son:
Es interactivo. Los usuarios pueden: crear sus propias bases de datos y sus propias
visualizaciones, interactuar y modificar visualizaciones realizadas por otros, y usar los
set de datos que otras usuarios suben para realizar sus propias visualizaciones.
Es pblico y colaborativo: todo contenido que se sube a Many Eyes es completamente
visible en Internet y puede ser reutilizado por otros.
Antes de comenzar con los esenciales de Many Eyes, les paso unas recomendaciones:
Actualicen su navegador (funciona muy bien con Chrome).
Actualicen la aplicacin Java .
Ingresen en el sitio http://www-958.ibm.com/
Regstrense
Si queremos crear nuestras propias visualizaciones, el proceso consta de dos pasos:
Subir el set de datos: la aplicacin acepta formatos xls y txt.
Crear nuestras propias visualizaciones de datos, eligiendo las ms convenientes para el
tema a tratar.
El men de visualizaciones de Many Eyes es muy amplio, y la habilidad consiste en elegir los
formatos ms apropiados para el tema que queremos tratar. En esta oportunidad elegimos
trabajar con los videos etiquetados como #FSOC en su ttulo, descripcin o etiqueta. Nuestra
base consta de 480 videos.
Desde esta pgina, accedemos a los tres pasos necesarios para crear las visualizaciones: subir
la base/crear las visualizaciones/publicar las visualizaciones.
Recomendaciones:
Trabajar con bases de datos de pocas columnas. Las que nosotros creamos tienen no
ms de tres. Pueden utilizar las que resulten de su anlisis con las tablas dinmicas de
Excel. Es por eso que creamos diferentes bases de datos, cada una adecuada al tipo de
visualizacin que quisimos lograr.
27
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
28
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Wordle
Wordle es muy fcil de usar http://www.wordl.net/. Ponerla en prctica es un ejercicio casi
intuitivo, la pagina te va llevando. Hay algunas salvedades que pueden servir a la hora de
generar una visualizacin coherente, que responda a los fines de la investigacin y que nos
permita ver los datos.
29
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Detalle: la manera de hacerse con esta nube de palabras es a travs de una captura de
pantalla.
Voyant Tools
Voyant Tools http://voyant-tools.org/, tambin tiene una ventana para pegar texto y generar
una nube de palabras. A la vez nos muestra otras cosas.
30
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Hay cuatro pantallas principales que rodean al texto. La del extremo superior izquierdo muestra
la nube de palabras, la del extremo inferior nos ensea la cantidad de veces que las palabras
aparecen en el texto, de aqu podemos hacer copiar-pegar y pasarlo directamente a un Excel.
Es esta ventana se seleccionan tambin las palabras que aparecen retratadas en el grfico de
la pantalla superior derecha, estas lneas nos muestran la recurrencia de los trminos a travs
del texto, podemos poner en relacin dos o ms como as tambin seleccionar una sola. La
ltima pantalla (abajo a la derecha) muestra el trmino seleccionado en su contexto. Las
marcas azules que aparecen al costado izquierdo del texto muestran la densidad; cada
pequea lnea corresponde a una porcin de texto y la intensidad del color habla de la
recurrencia del trmino seleccionado en ese fragmento de texto, al azul ms oscuro le
corresponde mayor aparicin de la palabra y viceversa. Clickeando sobre el icono de arriba a la
derecha (al lado del signo de pregunta) se nos da la opcin de generar una URL para acceder
directamente a nuestra visualizacin, tambin podemos descargar la nube a nuestra
computadora, la opcin est en la ventana que la contiene. En esta herramienta, al igual que en
la anterior, se pueden filtrar las palabras ms comunes de cada idioma a travs de una lista
predeterminada susceptible de ser modificada por el usuario.
Infogram
https://infogr.am/ Para utilizar esta herramienta tienen que loguearse. Una vez logueados les da
la opcin de crear infografas y tablas.
Amigarse con esta herramienta lleva un rato ya que requiere mayor interaccin y aporte por
parte del usuario, los resultados tambin son diferentes. El universo de posibilidades se
expande en relacin a las primeras dos opciones. Los datos ya no se cargan en una ventana
para texto sino en una planilla a la que se le puede pegar una de Excel, ah deben generarse
las variables y cargarse los datos que luego aparecern retratadas en los grficos.
31
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
En este caso, si bien ms complejo, la pgina tambin va guiando, cada opcin de infografa
viene con un ejemplo que hace de molde para trabajar sobre eso, sirve por lo menos hasta que
se agiliza el uso.
32
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
Bibliografa de referencia:
Berry, David M. (Editor) Understanding Digital Humanities
Burdick, Anne; Lunenfeld, Peter et al Digital HUmanities
Gold, Matthew K. (Editor) Debates in the Digital Humanities 2012
McCarty, Willard Humanities Computing
Ramsay, Stephen Reading Machines: Toward an Algorithmic Criticism
Schreibman, Susan; Siemens, Ray & Unsworth, John (Editor) A Companion to Digital
Humanities 2008
Manovich, Lev Big Data, Visualization, and Digital Humanities course at CUNY
Graduate Center, Spring 2013
Balsamo, Anne Designing Culture: The Technological Imagination at Work (2011).
Bartsherer, Thomas & Roderick Coover (eds) Switching Codes. Thinking through digital
technology in the humanities and the arts (2011).
Berry, David Digital Humanities: First, Second and Third Wave
Brockman, John (1996)
Brooks, David What Data Cant Do T he New York Times 18/3/2013
Bush, Vannevar "Como podemos pensar". En Pylyshyn, Zenon W. Perspectivas de la
revolucin de las computadores. Madrid Alianza, 1975.
Clark, Andy Supersizing the mind. Embodiment, action and cognitive extension (2011)
Dehanae 2012
Epstein, Mikhail The trasformative humanities. A Manifesto (2012)
Fuller, Matthew Media Ecologies Materialist energies in art and technoculture (2005)
Gitelman, Liza (2006)
Gold, Matthew K. (Editor) Debates in the Digital Humanities Indice (2012)
Hamilton, David Publishing by and for? the Numbers Higher Education. December
31, 2009.
Interchange: The Promise of Digital History
Pennenberg, Adam The book as we know it is dead Interface 2011, 27th July 2011,
UCL London.
Kirschanbaum, Matthew G. Mechanisms. New media and the forensic imagination
(2008)
Kittler, Friedrich (1999) especialmente en Gramophone, Film, Typewrite
Lakoff, y Johnson, Mark Philosophy in the flesh: the embodied mind and its challenge to
western thought (1999)
Liu, Alan The laws of cool Knowledge work and the culture of information (2004)
Liu, Alan. 2004. The Laws of Cool: Knowledge Work and the Culture of Information.
Chicago: University of Chicago Press.
Mangen, Anne. 2009. The Impact of Digital Technology on Immersive Fiction Reading:
A Cognitive-Phenomenological Study. Saarbrcker, Germany: VDM Verlag.
Manovich, Lev (2008),
Naughton, John How algorithms secretly shape the way we behave
33
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura
rea de Gestin Cultural FCE Universidad Nacional de Crdoba, Argentina.
______________________________________________________________________
*Lic. en Filosofa (UBA), Mster en Ciencias de Sistemas (Universidad de Louisville - EEUU) y
Master en Ciencias Sociales (FLACSO - Argentina). Especialista en nuevos medios. Se
desempea como Profesor Titular del Taller de Procesamiento de Datos, Telemtica e
Informtica, en la carrera de Ciencias de la Comunicacin, UBA. Docente en FLACSO y en la
Universidad de San Andrs. Es coeditor del diario online Interlink Headline News (ILHN). Entre
2003 y 2008 fue gerente general del portal educativo Educ.ar.
34
Big Data y Ciencias Sociales. Usando lentes cuantitativos para entender la cultura