Está en la página 1de 30

Introduccin al

Periodismo de Datos

Por Sandra Crucianelli


scrucianelli@icfj.org
www.facebook.com/sandracrucianelli
www.facebook.com/periodismodedatos
@spcrucianelli

Qu hay de nuevo?

Muckrakers

Jacob Riis: La estadstica asociada a


la imagen como elementos de denuncia

Cmo vive la otra mitad?

Un libro clave

Philip Meyer
Explor las causas de los disturbios raciales en la dcada de 1960
http://www.sampler.isr.umich.edu/2011/featured/revealing-theroots-of-a-riot/

Investigacin Social aplicada a la


Investigacin Periodstica

Investigacin Cualitativa:
I. Estudio de Casos
II. Grupos Focales
III. Anlisis del Discurso

Investigacin Cuantitativa
I. Investigacin Descriptiva (censo)
II. Investigacin Inferencial (encuestas)

Encuentre la diferencia

Periodismo de Investigacin: Sobre la base


de la iniciativa del reportero, se descubre una
verdad social importante que alguien intenta
mantener en secreto

Periodismo de Precisin: Indagar por


iniciativa propia, un conjunto de datos
difciles de obtener y ms complejos de
verificar o interpretar, con los que se pone en
evidencia una realidad oculta que no se quera
revelar.

Periodismo Asistido por Computadora

I.
II.
III.

IV.

PAC: introduce el uso de hojas de


clculo, como herramienta para procesar
datos
Clarence Jones (Miami Herald) , 1969, busc patrones en el
sistema de justicia penal.
David Burnham (The New York Times), 1972, expuso
discrepancias en las tasas de delitos denunciados por la polica
Elliot Jaspin (The Providence Journal), 1986, us bases de datos
para denunciar malos historiales de conduccin y antecedentes
penales de choferes de transporte escolar
Bill Dedman (The Atlanta Journal-Constitution), Pulitzer 1988,
El color del dinero: abord el tema de la discriminacin racial
en la otorgacin de prstamos hipotecarios

Amrica Latina

Periodismo de Datos?
Todo el periodismo se hace a partir de datos: Cierto
Cualquier cosa que se diga del Periodismo de Datos
hoy, no es definitiva
Qu hay de nuevo?
Casi todo se expresa con nmeros
En el mundo digital, tenemos capacidad para acceder
a grandes cantidades de datos
En el proceso, los datos no se transforman; la nica
transformacin que hay es desde lo abstracto hacia lo
tangible
Visin Cientfica: el periodista de datos reporta sus
mtodos, de modo que otros podran replicar el
proceso y llegar a la misma conclusin

Del PAC al PAH


Periodismo asistido por Hackers

Grandes conjuntos de datos: Big Data

Bsqueda de Datos
Extraccin de Datos
Procesamiento de Datos
Visualizacin de Datos
El programador se incorpora al equipo
periodstico

Periodismo de Datos

Manual Colaborativo (traduccin al


espaol)

http://interactivos.lanacion.com.ar/man
ual-data/

1) Salarios de 667.000 empleados pblicos


2) Crearon una aplicacin incorporando un buscador de sueldos por
nombre, oficina gubernamental, ao, categora.
3) Socializaron la informacin
http://www.texastribune.org/library/data/government-employee-salaries/

No tenemos ningn dato?

Realiz el diagnstico?
Bsqueda avanzada
Bsquedas reversas
Por defecto, restringiendo dominio, formatos
y/o fechas
Bsquedas geolocalizadas
Lectura de URLs y recorte de dominio
Bases de Datos interactivas
Monitoreo de redes sociales

http://www.google.com.ar/advanced_search
Explorar la Web Profunda
Usar el Acadmico
Buscar en Grupos, Libros e Imgenes

http://datos.bancomundial.org/
Herramientas Analticas (software de descarga gratuita)
1.Anlisis econmico
2.Medidas de Pobreza
3.Cruce de variables para Pobreza
4.Mapeo de pobreza

Monitoreo en redes sociales: de qu


habla la gente?
www.socialmention.com
www.48ers.com
www.twitterfall.com

Pro Pblica: Datos cualitativos se cuantifican


-Vecinos expresaron curiosidad, va Twitter, por recibir mails de campaa

de Obama, pidiendo distintos montos en donacin y los hicieron pblicos


-En 190 mensajes, encontraron 6 variaciones del contenido
-http://www.propublica.org/article/reverse-engineering-obamas-message-machine

Ver no es lo mismo que acceder


Formatos deberan ser reutilizables
Cmo extraer datos cuando no estn accesibles?

Un PDF de un JPEG
Datos de campaas publicidad oficial
En el sitio de la Jefatura de Gabinete de Ministros
http://www.jgm.gov.ar/paginas.dhtml?pagina=196

Scraping de Datos
Programas informticos o tcnicas de programacin
cuya finalidad es la de extraer datos (raspar) para:
1. Obtener datos estructurados (De PDF a Excel)
2. Leer datos de imgenes fotogrficas para convertirlos
en textos o tablas (OCR: Reconocimiento ptico de
Caracteres)
Secuencia:
I. Recoger (Ruby: lenguaje de programacin)
II. Procesar (Google Refine: para limpiar y organizar los
datos)
III. Almacenar (Panda Project: repositorio para compartir
bases de datos)

Minera de Datos: detecta patrones


sobre un gran conjunto de datos

Proceso

Bsqueda de relaciones entre variables


cualitativas
Bsqueda de relaciones entre valores, dentro
de una base de datos
Establece relaciones de jerarqua entre los
datos
Calcula proporciones (3 de cada 10)
Calcula frecuencias (veces que un mismo dato
se repite o combinaciones de datos que se
repiten)
Datos abstractos Datos inteligentes

Caso Diario La Nacin (Argentina)


http://www.transporte.gov.ar/content/subsidios-sistau/
13 meses de trabajo, 285.000 documentos: estudio de la progresin en los pagos
Finalista Data Journalism Award 2012
http://blogs.lanacion.com.ar/projects/data/subsidies-for-the-bus-transportation-system-datajournalism-project-in-argentina-lanacion/

Aplicaciones Sociales
Where does my money go?

A dnde van mis impuestos?

Iniciativas en Argentina

www.gastopublicobahiense.org

www.mapa76.info

www.quepasariachuelo.org.ar

http://www.malvinastreinta.com.ar/

Muchas Gracias

scrucianelli@icfj.org
www.facebook.com/sandracrucianelli
www.facebook.com/periodismodedatos
@spcrucianelli

También podría gustarte