La Relación Del Periodismo de Datos Con Big Data y Open Data

UNIVERSIDAD CARLOS III DE MADRID FACULTAD DE HUMANIDADES COMUNICACIN Y DOCUMENTACIN DEPARTAMENTO DE BIBLIOTECONOMA Y DOCUMENTACIN Mster en Investigacin en Documentacin 2011/2012
Trabajo de Fin de Mster
LA RELACIN DEL PERIODISMO DE DATOS CON BIG DATA Y OPEN DATA
Autora: ngeles Mario Tutor: Dr. Luis Joyanes Aguilar
TRABAJO DE FIN DE MSTER HA SIDO POSIBLE GRACIAS A LA BECA MAEC-AECID PARA EXTRANJEROS, CONVOCADA POR LA AGENCIA ESPAOLA DE COOPERACIN INTERNACIONAL PARA EL DESARROLLO Y QUE ME FUE CONCEDIDA EN EL PERODO ACADMICO 2011-2012.
CONTENIDO 1.INTRODUCCIN A LA INVESTIGACIN ....................................................................... 5

1.1 ANTECEDENTES Y MOTIVACIN ............................................................................................................................... 5 1.2 OBJETIVOS ............................................................................................................................................................... 5 1.3 OBJETO Y ESTADO DE LA CUESTIN ......................................................................................................................... 6 1.4 HIPTESIS ................................................................................................................................................................ 9 1.5 JUSTIFICACIN ......................................................................................................................................................... 9 1.6 METODOLOGA ......................................................................................................................................................... 9
1.6.1 LA WEB 2.0 EN MI TRABAJO DE INVESTIGACIN ................................................................ 12 2.PERIODISMO DE DATOS .................................................................................................. 13

2.1 INTRODUCCIN ...................................................................................................................................................... 13 2.2 LOS ANTECEDENTES DEL PERIODISMO DE DATOS: PERIODISMO DE PRECISIN Y CAR ......................................... 15 2.3 DEFINICIONES DE PERIODISMO DE PRECISIN ...................................................................................................... 16 2.4 LA EVOLUCIN DEL PERIODISMO DE PRECISIN Y DEL PERIODISMO DE DATOS ................................................... 17 2.5 CARACTERSTICAS DEL PERIODISMO DE DATOS .................................................................................................... 25 2.5.1 OBJETIVIDAD Y TRANSPARENCIA ....................................................................................... 25
2.5.2 NECESIDAD DE ORDENAR ................................................................................................... 26 2.5.3 TRABAJO EN GRUPO ........................................................................................................... 27

2.6 CMO SE HACE PERIODISMO DE DATOS? ............................................................................................................ 27 2.6.1 COMPILAR LOS DATOS ........................................................................................................ 28
2.6.2 FILTRADO Y LIMPIEZA DE DATOS ....................................................................................... 29 2.6.3 CONTEXTUALIZAR LA INFORMACIN ................................................................................. 30 2.6.4 COMBINAR LOS DATOS ....................................................................................................... 31 2.6.5 COMUNICACIN DE LOS DATOS .......................................................................................... 32
2.7 DOS EJEMPLOS DE PERIODISMO DE DATOS ............................................................................................................ 38 2.7.1 DNDE VAN MIS IMPUESTOS? ....................................................................................... 38
2.7.2 METADONA Y LA POLTICA DEL DOLOR ......................................................................... 39 3.HERRAMIENTAS PARA EL PERIODISMO DE DATOS .............................................. 40
3.1 MAPAS .................................................................................................................................................................... 40 3.2 SCREEN SCRAPING (RASPADO)................................................................................................................................ 41 3.3 LENGUAJE DE SCRIPTS ........................................................................................................................................... 41 3.4 MANEJO DE BASES DE DATOS ................................................................................................................................. 41 3.5 VISUALIZACIN DE DATOS ..................................................................................................................................... 42 3.6 LIMPIEZA DE DATOS ............................................................................................................................................... 42 3.7 ANLISIS ESTADSTICO ........................................................................................................................................... 43 3.8 OTRAS HERRAMIENTAS .......................................................................................................................................... 43
4.BIG DATA .............................................................................................................................. 44

4.1 BIG DATA Y SU INFLUENCIA EN EL PERIODISMO .................................................................................................... 49 4.2 EJEMPLO DE TRABAJO PERIODSTICO CON GRANDES BASES DE DATOS .................................................................. 50
5.OPEN DATA (DATOS ABIERTOS) ................................................................................... 52

5.1 OPEN DATA Y EL PERIODISMO ............................................................................................................................... 53 5.2 ESPAA................................................................................................................................................................... 54 5.3 FORMATO ............................................................................................................................................................... 56
6.CONCLUSIN ....................................................................................................................... 56 7. ANEXO .................................................................................................................................. 58

7.1 FRASES ................................................................................................................................................................... 58 7.2 BIBLIOGRAFA ........................................................................................................................................................ 59
7.2.1 BIBLIOGRAFA INTRODUCCIN A LA INVESTIGACIN ........................................................ 59 7.2.2 BIBLIOGRAFA PERIODISMO DE DATOS .............................................................................. 60 7.2.3 BIBLIOGRAFA BIG DATA Y OPEN DATA ............................................................................ 62
ILUSTRACIONES
ILUSTRACIN 1. "THE COLOUR OF MONEY". .............................................................................................................. 18 ILUSTRACIN 2. "LESS WIND, LOTS OF DAMAGE". ................................................... ERROR! MARCADOR NO DEFINIDO. ILUSTRACIN 3. "THE HOMICIDE REPORT". ............................................................................................................... 21 ILUSTRACIN 4. "AFGHANISTAN IEDS MAPPED"........................................................................................................ 22 ILUSTRACIN 5. THE INVERTED PYRAMID OF DATA JOURNALISM. ....................... ERROR! MARCADOR NO DEFINIDO. ILUSTRACIN 6. EXPORTS AND IMPORTS TO AND FROM DENMARK & NORWAY FROM 1700 TO 1780. ................... 33 ILUSTRACIN 7. MAPA GEOLGICO DE WILLIAM SMITH (1815). ........................................................................... 33 ILUSTRACIN 8. DISTRIBUCIN DE LA AYUDA INTERNACIONAL DE ESTADOS UNIDOS EN ELTIEMPO: 1946-2005.. 34 ILUSTRACIN 9. SIETE GNEROS.. ........................................................................................................................... 35 ILUSTRACIN 10. WHERE THE HEAT AND THE THUNDER HIT THEIR SHOTS............................................................. 37 ILUSTRACIN 11. "DNDE VAN MIS IMPUESTOS?". ................................................................................................... 38 ILUSTRACIN 12. METHADONE AND THE POLITICS OF PAIN. ................................................................................... 40 ILUSTRACIN 13. A DECADE OF DIGITAL UNIVERSE GROWTH.. ............................................................................. 45 ILUSTRACIN 14. "DATA INFLATION".. ....................................................................................................................... 46 ILUSTRACIN 15. "DOLLARS FOR DOCS". ................................................................................................................... 50
1. INTRODUCCIN A LA INVESTIGACIN A medida que la informacin disponible en Internet se ha ido multiplicando, el Periodismo tambin fue ampliando sus fuentes de informacin de manera tan relevante que naci una nueva forma de contar historias: el Periodismo de Datos (Data Journalism en ingls), aquel que se basa principal o exclusivamente en bases de datos y documentacin en lnea para crear una historia. Dos de los fenmenos que ms han ido acelerando el desarrollo de esta nueva especialidad han sido Big Data y Open Data, los cuales han ido impulsando el desarrollo de nuevas herramientas para su anlisis y comunicacin. De ah que los periodistas fueron y continan- adquiriendo nuevas habilidades en orden a analizar, filtrar y hacer visibles grandes masas de datos. Lo que pretende este Trabajo de Fin de Mster es estudiar esta nueva disciplina en el marco de la Documentacin y ser tanto material de consulta para periodistas que quieren adentrarse en la actividad como para documentalistas que quieren hacer llegar el material de su trabajo a la poblacin a travs de los medios de comunicacin. 1.1 ANTECEDENTES Y MOTIVACIN Mi formacin de grado y mi experiencia profesional se han dado ms que nada en el periodismo grfico. Por ello, cuando comenc el Mster de Investigacin en Documentacin en la Universidad Carlos III cre que mis estudios apuntaran a perfeccionar la tarea documentalista del periodista. Sin embargo, diferentes factores se conjugaron para que encontrara en el Periodismo de Datos un inters an mayor. Pues en este caso no se trata slo de la tarea de documentarse para contextualizar una noticia, sino de que los datos se vuelven la noticia misma. Y entre los factores que me llevaron a tomar esta decisin se encuentra el rpido desarrollo del Periodismo de Datos a nivel internacional, aunque con todava poco anclaje en el mundo acadmico en espaol. Y, aunque el Periodismo de Datos tiene sus antecedentes en tiempos previos a la llegada de Internet, ste sumado a Big Data, Open Data y otros fenmenos han cambiado el panorama hasta llegar al actual contexto que es de sobreabundancia de informacin. Profesionalmente entonces, es de mi inters que tanto los periodistas conozcan el potencial de las enormes cantidades de datos disponibles para la creacin de noticias como que los mismos responsables de la creacin y puesta a disposicin de datos, los documentalistas, conozcan dicho potencial. 1.2 OBJETIVOS
Por lo tanto, el objetivo general planteado para esta investigacin, es realizar una introduccin actualizada al Periodismo de Datos (tanto su contextualizacin y definicin como las herramientas y habilidades que involucra) y relacionarla con los fenmenos de Big Data y Open Data. Por ende, los objetivos especficos que se han determinado son los siguientes: 1. El Periodismo de Datos. Dar a conocer las caractersticas de esta especializacin del periodismo, analizando tanto sus antecedentes como su presente. 2. Big Data y Open Data y su influencia en el Periodismo de Datos. Describir cmo ambos fenmenos potencian nuevos contenidos informativos. 3. Herramientas del Periodismo de Datos. Repasar las principales herramientas que facilitan el trabajo de elaboracin y lectura de los datos aplicables a los medios de comunicacin. 1.3 OBJETO Y ESTADO DE LA CUESTIN Wikileaks didn't invent data journalism. But it did give newsrooms a reason to adopt it. There was just too much data for it to happen any other way. Simon Rogers, enero 2011 Es de destacar que el trabajo presente se centrar en el tratamiento con fines periodsticos del enorme volumen de datos disponibles en el entorno digital. Esto es, el Periodismo de Datos o Data Journalism como se le llama ms comnmente en su terminologa anglosajona. El trmino Periodismo de Datos comienza a divulgarse en los aos noventa como respuesta a cantidades de informacin antes desconocidas y a nuevas herramientas para su tratamiento en las noticias. Sin embargo, cobr ms fuerza en los ltimos aos, con las iniciativas aisladas sobre todo de diarios de Estados Unidos y de Gran Bretaa, hasta la actualidad cuando ya se han sumado al movimiento medios de otros pases y no slo diarios sino tambin programas de televisin. Para entender mejor el agitado momento en que se encuentra el Periodismo de Datos alcanza con destacar acontecimientos relevantes recientes: En 2011, de 16 ganadores del concurso Knight News Challenge de la Knight Foundation para subvencionar innovaciones en los medios de difusin, 14 eran de proyectos relacionados con el Periodismo de Datos. Asimismo, la convocatoria 2012 tambin repartir ms de 1 milln de dlares en iniciativas centradas especficamente en este tema. En enero de 2012 se lanza el primer concurso internacional de Periodismo de Datos. La iniciativa es de la Global Editors Network (GEN) en asociacin con Google y el European
Journalism Centre. Durante los tres meses que se mantiene abierta la convocatoria, se postulan ms de 300 trabajos procedentes de 60 pases. Recientemente, en abril de 2012, en el marco de The School of Data, durante el Festival Internacional de Periodismo en Italia se lanz The Data Journalism Handbook, un manual para Periodismo de Datos de cdigo abierto y escrito de manera colaborativa entre especialistas de todo el mundo.
Y, a pesar de que hechos como este hacen parecer que el Periodismo de Datos es un fenmeno nuevo, este tiene importantes antecedentes. Pero el caudal informativo actual y las herramientas a disposicin de los periodistas son los que marcan la gran diferencia. De estos antecedentes, cabe destacar que el Periodismo de Datos tiene sus races en el Computer Assisted Reporting (CAR), que en espaol se traduce como Periodismo Asistido por Computadora y en el Periodismo de Precisin, el cual cobr impulso en los aos sesenta sobre todo gracias al profesional y acadmico Philip Meyer1. Por parte de CAR, este naci en la dcada del 50 transformndose en el primer acercamiento organizado y sistemtico del uso de los ordenadores para recolectar y analizar datos en orden a mejorar las noticias. Su primer uso fue por parte de la CBC (Canadian Broadcasting Corporation) que en 1952 que lo implement para predecir los resultados de las elecciones presidenciales (BOUNEGRU, 2012). Y, en tanto que CAR es una tcnica, basndose en ella es que Meyer comienza a vislumbrar un cambio de concepcin de la actividad periodstica, en la que la vieja tradicin de los periodistas transportadores de informacin est siendo sustituida por periodistas procesadores de informacin
Actualmente, Philip Meyer es profesor emrito de la Universidad de North Carolina en Chapel Hill.
(MEYER, 1993). Y fue el mismo Philip Meyer quien, inspirado en la propuesta de un colega, llam as entonces al Periodismo que era el objeto de sus estudios y aficin y asent el nombre en su libro del ao 1973, Precision Journalism. A Reporters Introduction to Social Science Methods. Este libro fue fundamental para un acercamiento acadmico a esta prctica del Periodismo, rol que cumple hasta la actualidad ya que sigue siendo un manual de consulta. Este ltimo tipo de Periodismo, segn la definicin de Meyer (1993) es la aplicacin de mtodos cientficos de investigacin social y comportamental a la prctica del Periodismo. Tales mtodos pueden incluir sondeos, encuestas, anlisis de contenidoconsiguiendo que su eje sean los nmeros y las estadsticas. Sin embargo, aunque hay una relacin directa entre el Periodismo de Precisin y el Periodismo de Datos, este ltimo trmino es ms amplio ya que abarca toda informacin procesable por ordenadores. Su prctica se ha fortalecido desde 2010 a partir de la forma en que medios como The Guardian y The New York Times trataron las grandes cantidades de informacin que se derivaron de los cables de WikiLeaks. Pero hasta llegar all, segn Liliana Bounegru (2012), del European Journalism Centre una de las primeras alusiones a lo que hoy se conoce como Periodismo de Datos es la que hizo en 2006 el periodista Adrian Holovaty en su ensayo A fundamental way newspaper sites need to change. El texto de Holovaty discurre sobre que hay contenidos que si se los tratase a partir de una base de datos podran complementar los big blob of text, es decir los grandes bloques de texto. A la actualidad todava existe una discusin sobre si Periodismo de Datos no es lo mismo que CAR o el Periodismo de Precisin pero actualizado. Sin embargo, quienes lo defienden como una nueva especializacin apuntan a que los datos son la noticia en s. 1.3.1 TCNICAS Y HERRAMIENTAS QUE LO HACEN POSIBLE Asimismo, el Periodismo de Datos no puede comprenderse en su totalidad sin mencionar las herramientas tecnolgicas que involucra y que constantemente estn evolucionando. Por lo tanto, este existe no slo porque hay ms informacin a disposicin sino tambin porque surgen nuevas tcnicas para el proceso de esta. Hablar de Periodismo de Datos es referirnos a tcnicas nuevas en la creacin de informacin periodstica que requiere de conocimientos especficos y destrezas en el uso de bases de datos y presentacin (visualizacin) de la informacin en nuevas interfaces. (FLORES Y CEBRIN, 2012)
Tal es la conclusin de Jess Flores Vivar Doctor en Ciencias de la Informacin de la Universidad Complutense de Madrid- y de Cebrin Herreros, quienes en la actualidad trabajan en un proyecto de investigacin de tcnicas del Periodismo de Datos2. 1.4 HIPTESIS El caudal de informacin disponible que se ha visto potenciado en los ltimos aos gracias a Internet ha derivado en una nueva manera de informacin periodstica: el Periodismo de Datos. Especialmente la extensin de fenmenos como Big Data y Open Data ha llevado a que los periodistas aprendan tanto el uso de las nuevas herramientas que exige la lectura de grandes cantidades de datos, como la limpieza (o normalizacin y unificacin) de estos para luego comunicar la informacin al pblico. 1.5 JUSTIFICACIN Por una parte, la intencin de este trabajo es dar a conocer el nuevo uso que se est haciendo en el Periodismo de la cantidad de informacin disponible en el mundo digital, especialmente de bases de datos tanto pblicas como privadas. Por otra parte, entendemos que hay una necesidad de dar un anclaje acadmico en espaol a un tema que prolifera a gran velocidad pero que lo hace ms que nada en ingls y ms en circuitos profesionales de la informacin que en mundo universitario. Adems, aquello que se desarrolla en el presente trabajo es de utilidad tanto para periodistas e informadores como para documentalistas, quienes son los responsables de crear y hacer accesibles bases de datos y documentos. 1.6 METODOLOGA El presente trabajo requiri una documentacin incesante debido a que el Periodismo de Datos es un tema que est floreciendo tanto desde el mbito de la investigacin como del profesional y relacionado al cual surgen constantemente nuevos conocimientos y, ms que nada, herramientas. As pues, entre las fuentes de informacin utilizadas para realizar esta investigacin es de mencionar que primero se hizo una lectura de los contenidos ms recientes, para luego ir a los antecedentes y a las fuentes acadmicas. De los primeros destacamos el Data Journalism Handbook, el cual fue publicado muy recientemente, ya iniciado este trabajo, y es un manual completo y actualizado sobre el tema.
En el marco del Proyecto Cybermedia II: Desarrollos e innovaciones del periodismo en las redes sociales en Internet y telefona mvil. Convergencias, modelos de negocios, servicio y formacin.
Este naci como una iniciativa colectiva en el Festival Mozilla 2011 en Londres y culmin en abril de 2012 cuando fue presentado en el International Journalism Festival, en Perugia (Italia). Sus principales propulsores fueron la Open Knowledge Foundation y el European Journalism Centre que convocaron a algunos de los profesionales ms expertos en el tema para colaborar de manera conjunta en su redaccin. La intencin era escribir un manual que sirviese de introduccin al Periodismo de Datos y que respondiese a las siguientes preguntas: Dnde puedo encontrar datos? Cmo puedo pedir datos? Qu herramientas puedo utilizar? Cmo puedo encontrar historias en los datos?
Por otra parte, entre las fuentes de constante actualizacin caben mencionar los artculos que brindan fundaciones e instituciones con autorizada voz en lo que respecta al estudio constante del Periodismo y de las Ciencias de la Informacin como el Nieman Journalism Lab -un proyecto conjunto de la Nieman Foundation y la Universidad de Harvard-, el Poynter Institute y el Freedom Forum for Media Studies (www.freedomforum.org). Tambin estn aquellos contenidos de consultoras privadas especialistas en temas de tecnologa como OReilly Media que posee un sello editorial propio y la asociacin Investigative Reporters and Editors (IRE) que en su sitio web cuenta con revistas, publicaciones y enlaces a su centro asociado, el National Institute for Computer-Assisted Reporting (NICAR). Tambin son importantes los estudios de la consultora internacional McKinsey Global Institute, al igual que los de Cisco Systems o IBM. En cuanto a publicaciones, algunas de las ms prestigiosas que han tratado de manera especial los temas que se citan en este trabajo son The Economist, Wired y Nature. Luego estn los aportes de blogs de profesionales en el marco o no de sus medios de trabajo- y que se han convertido en unos de los principales promotores del tema en cuestin, como el de Paul Bradshaw, tambin consultor y profesor de Periodismo on-line de la Universidad de Birmingham o las columnas de Simon Rogers en The Data Blog, del diario ingls The Guardian. Este ltimo tambin es autor del libro que se cuenta entre los de ms reciente publicacin relacionados al Periodismo de Datos, llamado Facts are sacred (ROGERS, 2011) que, basado en la experiencia propia, propone que una nueva misin del periodista es la de mediar entre la informacin disponible de organizaciones pblicas o privadas y el procesamiento de esta para la audiencia.
10
Otra voz especializada que cabe mencionar es la del profesor y periodista espaol Alberto Cairo, con quien tom el curso en lnea "Introduccin a la Infografa y Visualizacin para Periodistas, ofrecido por el Centro Knight para el Periodismo en las Amricas. El espaol es autor de dos libros recomendables para la puesta en prctica de este periodismo, especialmente en lo que refiere a la visualizacin de los datos: El arte funcional: infografa y visualizacin de la informacin e Infografa 2.0: visualizacin interactiva de informacin en prensa. En cuanto a los antecedentes acadmicos, bas gran parte de la bibliografa en el creador del concepto de Periodismo de Precisin Philip Meyer y en quienes siguieron y ampliaron sus enseanzas. De Meyer revis aquella bibliografa suya a mi alcance incluyendo el discurso de su ltima comparecencia pblica de relevancia, la cual la hizo en 2011 con ochenta aos de edad. Su gran aporte ha estado en reforzar el costado cientfico del Periodismo con sus mtodos de investigacin tomados de las ciencias sociales (encuestas, estadsticas, matemticas). En Espaa, su traductor y principal divulgador es Jos Luis Dader, profesor de la Universidad Complutense de Madrid y quien ampli tambin su teorizacin con libros como Periodismo de Precisin: va socioinformtica de descubrir noticias. En l procura dar importancia y contenido terico a una rama del periodismo descuidada en su criterio ya que afirma que mientras disponemos de ros de tinta sobre el deber ser o los valores del periodismo, la cuestin de los mtodos ingenuamente se soslaya y resulta casi inexistente en la discusin de la profesin (DADER, 1997). Dader sugiere tambin el aprovechamiento de las bases de datos, de las nuevas tecnologas informativas y de Internet para descubrir y tratar nuevas noticias mediante tcnicas estadsticas y cientficas que lleven a un periodismo preciso. As pues, estos dos autores han sido la base bibliogrfica de este trabajo, a partir de quienes enlac para conocer otros acadmicos y otros estudiosos del Periodismo de Precisin. En la actualidad se habla ms del Periodismo de Datos y su bibliografa ha ido actualizndose de manera permanente y por vas no slo acadmicas: publicaciones, libros, ponencias y congresos, medios de comunicacin e Internet, sobre todo. Para este trabajo he procurado concentrarme sobre todo en estas ltimas publicaciones, de las cuales por lo menos el setenta por ciento se encuentran en ingls. Cabe mencionar tambin que en el mes de julio de 2012 (del 23 al 27) asist al Curso de Verano Periodismo de Datos organizado por la Universidad Complutense. All tambin ampli mis conocimientos y fuentes de informacin.
11
1.6.1 LA WEB 2.0 EN MI TRABAJO DE INVESTIGACIN El desarrollo de Internet y de las tecnologas de la informacin ha alterado el panorama de las fuentes y de los sistemas de recuperacin inherentes a ellas, debido a la aparicin de tipos documentales completamente nuevos y de aplicaciones de navegabilidad e intercambio de informacin que han potenciado la interconexin entre usuarios y la transferencia de informacin entre ellos. (CORDN et alter, 2012) Con esta frase de las primeras pginas del libro Las Nuevas fuentes de informacin: informacin y bsqueda documental en el contexto de la web 2.0 quiero destacar cunto me ha servido el intercambio de informacin al que se refieren los autores, para llegar a contenido valioso y de importancia para este trabajo. Pues tanto Internet como la web 2.0 han venido a complementar los medios convencionales de informacin. Entre las herramientas utilizadas y ms consultadas para este trabajo destaco: Herramientas RSS o de Sindicacin de Contenidos: imprescindibles para el manejo de la informacin y la actualizacin permanente. Twitter: las cuentas de especialistas en Periodismo de Datos como Alberto Cairo @albertocairo, Guardian Data Store @datastore, Paul Bradshaw @paulbradshaw, Sandra Crucianelli @spcrucianelli, Mar Cabra @cabralens, La Nacin Data @LNdata, Marcelo Soares @msoares, entre otros Wikis: destaco sobre todo el del grupo de Periodismo de Datos del MediaLab Prado de Madrid donde los profesionales aportan todo aquello que consideran de relevancia para el desarrollo de esta prctica. Blogs de actualizacin permanente y novedades constantes. Cabe mencionar: o Data Driven Journalism (datadrivenjournalism.net), una iniciativa del European Journalism Centre (http://ejc.net/) para acercar a los periodistas al uso de bases de datos y fuentes de informacin con distintas tcnicas, herramientas y habilidades. o o Open Knwoledge Foundation Blog (http://okfn.org/) El Online Journalism Blog (http://onlinejournalismblog.com/), el cual comenta y debate acerca de entre otros temas, el Periodismo de Datos. Su editor es Paul Bradshaw o NacinData (http://blogs.lanacion.com.ar/data/), blog del diario La Nacin de Argentina especializado en periodismo y datos. Naci en 2012, durante el proceso de este trabajo.
12
DataBlog (http://datablog.ahref.eu/), el cual forma parte del proyecto iData, patrocinado por la fundacin Ahref y que pretende desarrollar la primera plataforma italiana para el Periodismo de Datos.
A final de contas (http://afinaldecontas.blogfolha.uol.com.br/), blog del diario Folha de So Paulo con iniciativa similar a la de otros medios. Escrito por el periodista Marcelo Soares, tambin naci en abril de 2012.
DataBlog de The Guardian(http://www.guardian.co.uk/news/datablog), blog pionero especializado en este tema e inspirador de otros. Naci en 2009 como parte del proyecto DataStore que dirige Simon Rogers.
ProPublica (http://www.propublica.org/), fundacin periodstica sin fines de lucro de Estados Unidos que ya ha ganado dos premios Pulitzer por sus trabajos de investigacin. Destaca por la importancia que da al Periodismo de Datos.
Revistas y libros electrnicos, a algunos de los cuales tuve acceso mediante la biblioteca y los recursos electrnicos de la Universidad Carlos III de Madrid.
Sistema de citas y fuentes bibliogrficas En el texto del trabajo he utilizado el sistema de citas autor-fecha y para crear las referencias bibliogrficas de las fuentes de informacin consultadas he utilizado las normas ISO 690 e ISO 690-2. En cuanto a la bibliografa, esta se ha reunido y figuran tras lo grandes bloques que conforman el trabajo. En primer lugar, figura la dedicada a la introduccin; le sigue el apartado relacionado con el Periodismo de Datos y, por ltimo, la destinada a fuentes sobre Big Data y Open Data. Para la gestin de toda la informacin bibliogrfica y documental me he auxiliado con los gestores de informacin Refworks y Zotero. Este ltimo ha sido usado particularmente para las pginas web. 1.PERIODISMO DE DATOS 2.1 INTRODUCCIN Un campo que se est perfeccionando y est desarrollando una nueva especializacin a raz de la multiplicacin de los datos en el mundo digital es el Periodismo. Y, si bien para esta disciplina no es algo nuevo la lectura, el anlisis y la publicacin de bases de datos, s lo son la importancia que estas han adquirido y las nuevas herramientas y habilidades necesarias para mejor aprovechamiento de los datos en orden a su comunicacin. De ello trata el Periodismo de Datos, una especializacin que suena cada vez ms entre los profesionales de los medios a partir sobre todo de la avalancha de informacin que ha significado la
13
aparicin de Internet y de fenmenos como Big Data, Open Data y la lectura y comunicacin de las historias que hay detrs de los datos. Pues en este tipo de periodismo el eje no es retransmitir los datos de las bases de datos tal cual se consiguen o estn disponibles si bien puede hacerse-, sino que su funcin es la de informar a partir de ellas. Entonces, se pueden establecer relaciones entre los datos, practicar minera de datos, aplicar estadsticas, armar una secuencia Es decir, extraer una historia de los datos. Y los datos pueden ser tanto el origen de una investigacin para una noticia como pueden acompaar una noticia o pueden ser la noticia misma. Periodismo de Datos hace entonces referencia al conjunto de herramientas y prcticas que utilizan datos para la construccin de una historia (o noticia). Y estos datos pueden tanto acompaar una historia como ser fuentes de una investigacin. Segn la definicin del profesor Jess Flores Vivar (2012): El Periodismo de Datos es una forma de periodismo de investigacin que utiliza la informtica (ordenadores y sistemas algortmicos) para buscar, contrastar, visualizar, combinar datos y proporcionar informacin de diferentes fuentes, pblicas o privadas. El video documental Journalism in the age of data (2010) que llev a cabo el periodista especializado en multimedia Geoff McGhee (2009) para la universidad de Standford, fue un disparador para dejar asentado tanto la necesidad de desarrollar ms este Periodismo como las iniciativas que ya apuntaban en esa direccin. En el vdeo, McGhee procura mostrar la importancia de fusionar las narrativas tradicionales del periodismo con los avances tecnolgicos en torno a la explotacin de los datos. Para ello entrevist a profesionales de medios de comunicacin e investigadores de distintos centros que trabajaban tanto en el desentraar y comunicar los datos como en las herramientas idneas para ello, sobre todo en lo que refiere a su visualizacin. Y como ya demostraba McGhee en dicho material, en la actualidad, cada vez ms los medios son conscientes de la cantidad de historias que hay detrs de los datos y que no se las conoce porque no se las busca. Pero estn ah, estn en los archivos, en las bases de datos, en los Boletines Oficiales de Estados, en los informes oficiales, en las bibliotecas, en las empresas, en Internet. Desentraarlas, darles contexto y hacerlas visibles y notorias al resto de la poblacin es la misin del Periodismo de Datos (en ingls, Data Journalism), ms que nunca ahora que existe tanta informacin al alcance de la mano gracias a Internet y a las nuevas tecnologas de la informacin.
14
Claro que hay algunos medios que han sido pioneros o que llevan la delantera respecto de otros. As por ejemplo, el peridico estadounidense The New York Times tiene un equipo de 25 personas slo para proyectos de visualizacin de datos. Algunas de ellas son expertas en estadsticas, otras en Periodismo, otras en diseo grfico, programacin Tambin hay medios que destacan por haber hecho una verdadera apuesta al Periodismo de Datos, tanto desde la incorporacin de herramientas especficas como desde su promocin. Entre los que cabe mencionar se encuentran el diario britnico The Guardian con su Datablog, el estadounidense Los Angeles Times, el diario La Informacin de Espaa, el proyecto NacinData del diario La Nacin de Argentina y el blog Ao final de Contas del diario Folha de So Paulo. 2.2 LOS ANTECEDENTES DEL PERIODISMO DE DATOS: PERIODISMO DE PRECISIN Y CAR Pero, qu es exactamente y en qu consiste el Periodismo de Datos? Para entenderlo conviene revisar sus antecedentes pues esta no es una forma nueva y desconocida de comunicar. La diferencia est en cmo se la practica en la actualidad, en un contexto de una cantidad de informacin difcil de prever hace un tiempo. El movimiento principal que antecede al Periodismo de Datos es el ya mencionado Periodismo de Precisin, una rama del Periodismo de Investigacin que surgi como una respuesta al Nuevo Periodismo de la dcada del 60 y que se entiende como la utilizacin de programas informticos y tcnicas de las ciencias sociales como las estadsticas para aportar pruebas y no slo ancdotas en reportajes periodsticos. Como trmino, Periodismo de Precisin toma fuerza a partir del libro de 1973 del acadmico Philip Meyer Precision Journalism. A Reporters Introduction to Social Science Methods. Y, a pesar de que Meyer ha sido el principal promotor de esta disciplina, acadmicos sugieren que su historia podra remontarse a los aos treinta cuando la revista Fortune public la que se cree fue la primera encuesta cientfica llevada a cabo por un medio de comunicacin (DEMERS Y NICHOLS, 1987),. A ello le seguirn otros ejemplos periodsticos espordicos hasta que en la dcada del 60 los ordenadores hicieron ms fcil el trabajo de la recoleccin de datos y su anlisis (DEMERS Y NICHOLS, 1987). Es para estos aos que Philip Meyer se interesa en el estudio de los mtodos empricos de investigacin social para su aplicacin en el periodismo y lo lleva a cabo con una beca Nieman en la Universidad de Harvard. A partir de all combinar una carrera tanto acadmica y de investigacin como una profesional en medios periodsticos. As es que en 1968 gana un premio Pulitzer por su publicacin en el Detroit
15
Free Press acerca de las causas de una protesta racial en Detroit. Esta investigacin se realiz con los mtodos del Periodismo de Precisin y se volvi una referencia en la historia de este hasta la actualidad. Lo que all haba hecho el estudio del equipo de Meyer fue un cruce de datos que llevaron a contradecir la idea errnea de que los disturbios haban sido causados por negros procedentes del sur de Estados Unidos o por personas de bajo nivel educativo. Despus de ello, Meyer se dedicar a divulgar sus conocimientos y mtodos de investigacin periodstica en el mbito acadmico - actualmente es profesor emrito de la School of Journalism and Mass Communication en la Universidad de North Carolina at Chapel Hill- y con publicaciones y libros. De manera paralela, una variante del Periodismo de Precisin que se desarrolla junto con este, es el Periodismo de Investigacin Asistido por Ordenador (Computer-Assisted Investigative Reporting, CAR por sus siglas en ingls). Este periodismo es todava promovido bajo este nombre si bien podra enmarcarse dentro de la disciplina ms general que tratamos en este trabajo, el Periodismo de Datos. Su principal divulgador es el National Institute for Computer-Assisted Reporting (NICAR) un programa del Investigative Reporters and Editors, Inc. Bajo su patrocinio es que anualmente desde 1989 se lleva a cabo la conferencia CAR, donde se difunden los avances en herramientas para encontrar y analizar
informacin en formato electrnico. 2.3 DEFINICIONES DE PERIODISMO DE PRECISIN Para Meyer, el Periodismo de Precisin es la aplicacin de mtodos cientficos de investigacin social y comportamental a la prctica del Periodismo (MEYER, 1993). Para el autor, en 1973 algunos de esos mtodos incluan el sondeo o encuesta de opinin, el experimento psicosocial y el anlisis de contenido. Es decir, propona tomar herramientas de las ciencias sociales para el anlisis cuantitativo para que fueran aplicadas en el periodismo, sin por ello alterar la misin de localizar hechos, comprenderlos y explicarlos sin prdida de tiempo. Demers y Nichols (1987) tambin sugieren que el Periodismo de Precisin es un mtodo de investigacin, un modo de aprender sobre el mundo. Y su diferencial, segn afirman, radica en que esos mtodos cuantitativos de investigacin social sirven para conseguir la noticia.
16
Por su parte, la definicin que brinda el acadmico espaol Jos Luis Dader es: se entiende por Periodismo de Precisin la informacin periodstica que, sobre cualquier asunto de trascendencia social, aplica o analiza sistemticamente mtodos empricos de investigacin cientfica, de carcter numrico o no numrico, con especial inclinacin al campo de las ciencias sociales. En dicha actividad el nfasis corresponder a la validez y fiabilidad del mtodo de anlisis, por encima de la mayor o menor espectacularidad de los resultados (DADER, 1997). Respecto a su comparacin con el Periodismo de Investigacin, Dader ha escrito que estos guardan relacin pero no se tratan de lo mismo pues ni todo el Periodismo de Investigacin aplica las estrategias metodolgicas y conocimientos instrumentales del Periodismo de Precisin, ni este ltimo se aplica tan slo en proyectos de investigacin periodstica (DADER, 1997). La diferencia est en la metodologa de investigacin pues el periodista de precisin es el que aplica mtodos como el anlisis estadstico, la encuesta sociolgica y el rastreo en bases de datos. 2.4 LA EVOLUCIN DEL PERIODISMO DE PRECISIN Y DEL PERIODISMO DE DATOS Al momento en que Philip Meyer comienza a hacer difusin y practica el Periodismo de Precisin, todava no era posible pensar en computadores personales para cada periodista, lo que dificultaba su puesta en marcha. Es durante la dcada del setenta que esto empieza a ser posible y es finalmente en los ochenta que los ordenadores se vuelven ms accesibles y permiten a los periodistas tener acceso a un conjunto de datos que antes no era posible. Por ese entonces proliferan tambin las encuestas y los sondeos de opinin. Incluso para finales de los ochenta los principales peridicos anglosajones tenan ya departamentos exclusivamente de informacin socio-estadstica. Estos eran llevados por profesionales de las ramas de estadsticas y gestin de bases de datos que, entre otras misiones, daban soporte a casos de investigacin periodstica. De a poco entonces, esta rama del periodismo fue generando visibilidad, sobre todo en los Estados Unidos. Algunos de los hechos que lo ilustran y marcan antecedentes en la historia reciente del Periodismo de Datos son: 1986. Reconocimiento con un premio Pulitzer al reportaje del Dallas Morning News que, basndose en cruce de bases de datos por ordenador, denunciaron la existencia de discriminacin racial en la adjudicacin de viviendas pblicas en Texas.
17
1989. Premio Pulitzer de Periodismo Investigativo al periodista Bill Dedman por el reportaje The
colour of money. Este se trataba de una serie de artculos publicados en el diario estadounidense The
Atlanta Constitution en los que, a partir de un anlisis informtico de los formularios que deban rellenar prestamistas hipotecarios, quedaba en evidencia que haba discriminacin por parte de estos. Como consecuencia de dicha investigacin se introdujeron reformas en las condiciones crediticias de bancos de todo el pas. A continuacin, una imagen que formaba parte del reportaje:
ILUSTRACIN 1. "THE COLOUR OF MONEY". FUENTE: HTTP://POWERREPORTING.COM/COLOR/
1991. Philip Meyer publica The new precision journalism: a reporters introduction to social science methods, tercera edicin de su libro donde explica y actualiza cmo hacer anlisis de datos y estadstica con los ordenadores del momento.
18
1993. The Miami Herald gana un premio Pulitzer por su especial sobre la devastacin producida por el huracn Andrew titulado What went wrong?. En este nmero, un equipo de periodistas entre los que se encontraba Steve Doigt -hoy un frreo impulsor del Periodismo de Datos-, decidi comprobar cunto del nivel de destruccin del huracn haba sido responsabilidad de autoridades municipales y constructores. Para ello recopil cuatro bases de datos oficiales que, segn el acadmico Jos Luis Dader (2006) fueron las siguientes: 1) Los informes de las 50.000 inspecciones de daos realizadas en el condado tras el paso del huracn 2) El registro de datos de la propiedad de 1992, que inclua informacin detallada del tipo de vivienda, valor y ao de construccin de todas las edificaciones del rea 3) El fichero de Memorias de Edificacin de todas esas construcciones, que recoga informacin minuciosa sobre los tipos y calidades de los materiales utilizados 4) El Censo de Edificacin y Planificacin del condado, con ms de 7 millones de expedientes de permisos de construccin e inspecciones realizadas en los ltimos aos. Tras un cruce de toda esta informacin, el Miami Herald realiz un especial de 16 pginas en las que poda verse un mapa de las zonas afectadas por el huracn y cuadros estadsticos. Lo que terminaron por demostrar fue que el nmero de casas construidas despus de 1979 y que declaraban haber sido destruidas totalmente doblaba a las de construccin previa. Adems, dejaban evidencia de que los vientos ms fuertes no haban sido causantes de ms destruccin sino que tambin, esto se correlacionaba con los hogares de construccin posterior a 1979. En conclusin, haba sido causante de ms dao la reduccin de los controles de calidad de construccin que la fuerza el huracn.
19
ILUSTRACIN 2 "LESS WIND, LOTS OF DAMAGE". FUENTE: CUENTA DE FLICKR HTTP://WWW.FLICKR.COM/PHOTOS/JUGGERNAUTCO/SETS/72157607210036175/DETAIL/
DE
DANIEL
X.
O'NEIL,
2006. El periodista Adrian Holovaty (2006) publica su ensayo A fundamental way newspaper sites need to change a partir del cual se extiende la necesidad de profundizar en el Periodismo de Datos. Segn especialistas en el tema como el periodista Simon Rogers, Holovaty pudo haber sido el primero en hablar de Data Journalism, trmino anglosajn de Periodismo de Datos, para anclarlo como una tendencia.
20
2007. Entre ejemplos de Periodismo de Datos que empiezan a multiplicarse destaca el de Los Angeles Times llamado The homicide report y consiste en un mapa interactivo
(http://projects.latimes.com/homicide/map/) con una base de datos para conocer todos los casos de homicidio en el distrito de Los ngeles desde 2007 hasta la actualidad, presentando detalles de cada uno de los asesinatos que de la regin. En este mapa se pueden filtrar los datos de las vctimas segn raza, edad, gnero, causa de muerte, ubicacin y otros parmetros. Tambin pueden verse fotos de estos. Para Rich Gordon (2007), profesor asociado de la escuela Medill de Periodismo en la Northwetern University de Estados Unidos), esta iniciativa representa que cuando se unen el reportaje tradicional con las nuevas capacidades de uso de las bases de datos, surgen nuevas formas de periodismo.
ILUSTRACIN 3. "THE HOMICIDE REPORT". FUENTE: LOS ANGELES TIMES
21
2009. Premio Pulitzer para el diario estadounidense St. Petersburg Times por el proyecto Politi Fact en el que se comparaban las declaraciones juradas de polticos con hechos reales y concretos para evaluar el grado de veracidad. Trabajo basado en el uso de estadsticas y bases de datos. 2010. Las filtraciones ms importantes de Wikileaks cambian el panorama del Periodismo de Datos y sitios de noticias como The Guardian, a travs de su Datablog, y The New York Times llevan esta modalidad a su auge.
ILUSTRACIN 4. "AFGHANISTAN IEDS MAPPED". FUENTE: GUARDIAN.COM.UK
2011. Los 16 proyectos ganadores del Knight News Challenge, un concurso anual de la Knight Foundation destinado a promover las mejores ideas relacionadas con la innovacin en el mbito del periodismo, tienen al Periodismo de Datos como principal objetivo. El total de dinero que se les destina testimonia su importancia, 4,7 millones de dlares. En 2011 nace tambin el proyecto Overview, una herramienta de visualizacin de documentos. Ofrece organizarlos y conectarlos para ayudar a los periodistas a encontrar historias en medio de tanta informacin. Es una iniciativa del periodista Jonathan Stray con la financiacin de la agencia de noticias Associated Press.
22
2012. Algo que marc la transicin que est viviendo el Periodismo de Datos fue el lanzamiento en enero de 2012 del primer concurso internacional de esta especialidad, una iniciativa del Global Editors Network en alianza con Google. Adems, este mismo ao se publica el manual de Periodismo de Datos, ya citado anteriormente, The Data Journalism Handbook, una iniciativa colaborativa en la que participaron periodistas de todo el mundo.
Como puede deducirse, el Periodismo de Precisin tuvo al comienzo una mayor incidencia en Estados Unidos mientras que en Europa la evolucin fue ms lenta (Dader, 1993). En Espaa incluso, como tambin documenta el acadmico Jos Luis Dader, haban aplicaciones de un Periodismo de Precisin pero sin que sus profesionales supieran del movimiento: la relativa presencia de actuaciones periodsticas intuitivas, catalogables entre nosotros bajo el rtulo que nos ocupa, choca con la perplejidad generalizada que su sola mencin contina produciendo entre la mayora de los periodistas y profesores espaoles de Ciencias de la Informacin. Aos despus, ya para cuando comienza a hablarse de Periodismo de Datos a raz de la multiplicacin de bases de datos y herramientas para su tratamiento, la evolucin se da paralelamente en distintos mbitos geogrficos. Estados Unidos no pierde su vanguardia con medios de comunicacin cabeceras como The New York Times mientras que en Europa sus primeros promotores estn en Inglaterra con The Guardian y en Alemania con Der Spiegel. Y la gran bisagra en la evolucin del Periodismo de Datos no est slo en fenmenos de desarrollo continuo como puede ser Big Data. Tambin, hubo hechos puntuales y entre ellos es de mencionar el Cablegate, la filtracin de documentos diplomticos -especialmente de Estados Unidos- y que difundi el sitio Wikileaks. Al respecto, en diciembre de 2010, Paul Bradshaw escribi en su blog onlinejournalismblog.com un artculo que titul Un embajador avergonzado es una tragedia, 15 mil civiles muertos es una estadstica. All deduca, a partir del efecto Wikileaks en la prensa, que el Big Data traa nuevos desafos: hay que humanizar y personalizar grandes conjuntos de datos de una manera tal que ello no vaya en contra de la complejidad del tema que se est tratando.
23
Es decir, en medio de enormes cantidades de datos, el periodista debe intentar lograr un inters con ellos a pesar de que a los lectores les interesen ms las historias individualizadas, como la del embajador avergonzado con el que ejemplifica este punto. Al respecto, es vlido tambin comentar que los mismos datos necesitan de los medios de comunicacin pues de otra manera es posible que el pblico no se acerque a ellos, por la complejidad que esto representa. Como escribi el periodista John Keenan (agosto 2010) en The Guardian: Sin el anlisis, el comentario y la explicacin de periodistas especializados, los documentos habran quedado en el sitio de Wikileaks llamando la atencin slo de aquellos con un ferviente inters en el conflicto. La Casa Blanca y el Pentgono, apenas se habran inmutado. Eso es precisamente lo que entendi Julian Assange, el fundador de Wikileaks, cuando decidi hacer la distribucin de sus documentos a travs de grandes diarios occidentales, los cuales fueron El Pas de Espaa; The New York Times de Estados Unidos; The Guardian de Reino Unido, Le Monde de Francia y Der Spiegel de Alemania. Al mismo tiempo, en una visin actualizada del Periodismo de Precisin y ya con el Periodismo de Datos como una tendencia, Philip Meyer dio un discurso el 3 de octubre de 2011, como invitado a la Hedy Lamarr Lecture sobre Changing Needs in Journalism en la Academia Austraca de las Ciencias. En su exposicin, que luego fue difundida por los reportes Nieman, dijo: Necesitamos una estructura para ver la verdad de los hechos. (). Es posible que encontremos la manera de unir estas dos estrategias (Periodismo Narrativo y Periodismo de Precisin) y contar historias sobre los datos que se basan en teoras verificables? Para dar una respuesta a este interrogante, se remont a la historia del trmino Periodismo de Precisin, el cual fue acuado por el profesor Everette E. Dennis en la Universidad de Obregn en 1971. Lo que intentaba este, era explicar el nuevo Periodismo, basado en mtodos cientficos. Pero como desde haca unos aos se hablaba de nuevo periodismo para referirse a la corriente literaria del oficio, lo diferenciaron. Y continu entonces con su discurso, acercndose a la definicin de lo que se conoce como Periodismo de Datos: Ambos gneros, el Periodismo Narrativo y el Periodismo de Precisin, son especialidades que requieren determinadas habilidades. Si tuviramos que mezclar ambos, cmo lo llamaramos? El trmino que me gusta es narrativa basada en evidencia. Ello implica una buena historia basada en
24
evidencia verificable. S, esa sera una especialidad esotrica. Pero creo que hay un mercado que se est desarrollando para ella. El mercado de la informacin nos est llevando cada vez hacia una mayor especializacin. Y tanto el Periodismo de precisin como el Periodismo narrativo atraen a una audiencia sofisticada, una que aprecia la necesidad de estructurar la informacin de una manera que centre la atencin en la verdad. Y casi cuarenta aos despus de que el profesor Meyer remarcara por primera vez la necesidad de aplicar mtodos sociales en la investigacin periodstica hoy no slo se aplican en los ms importantes medios de comunicacin, sino que tambin las nuevas tecnologas permiten toda una variante de actividades a partir de ello. El ejemplo principal es la exploracin personal que puede hacer la audiencia de tantas bases de datos ahora a su disposicin. 2.5 CARACTERSTICAS DEL PERIODISMO DE DATOS En la actualidad, el Periodismo de Datos exige una especializacin, tal como remarc Philip Meyer. De ah que sobrevenga la necesidad de aprender las nuevas herramientas, de sortear las dificultades que representa la lectura de cierto formato de datos y de facilitar la tarea de lectura de la audiencia. Es decir que, como cualquier nueva tendencia tambin tiene sus puntos fuertes y dbiles. En cuanto a una de sus principales consecuencias positivas se encuentra la objetividad y transparencia que pueden brindar los datos, ya que el lector tambin tiene la posibilidad de interpretarlos y sacar sus propias conclusiones. Por otra parte, tanta informacin a disposicin puede complicar la tarea de su lectura. De ah la necesidad de ordenar. A continuacin, un listado de caractersticas del Periodismo de Datos. 2.5.1 OBJETIVIDAD Y TRANSPARENCIA "Aquel periodista que adapte los instrumentos del mtodo cientfico a su propia tarea, gozar de la posibilidad de realizar tiles evaluaciones con la mucha ms potente objetividad de la ciencia Philip Meyer, 1993 El profesor de grficos en la Universidad de Miami, Alberto Cairo (25 de abril 2011) coincide indirectamente con Philip Meyer cuando en un texto sobre infogrficos peligrosos se refiere al mtodo cientfico como el mayor avance de la Humanidad en su lucha por superar limitaciones perceptivas, ilusiones inconscientes e impulsos emocionales: un sistema que antepone la evidencia emprica a la opinin subjetiva, aunque esta ltima se rebele contra sus conclusiones, a veces contrarias a la intuicin, al statu quo... y al sentido comn.
25
Como es comn aprender en las carreras de Periodismo, la objetividad es un principio de este, si bien hay quienes la defienden y quienes no pues la neutralidad absoluta no es algo que pueda asegurarse en el discurso comunicativo En relacin con el Periodismo de Datos, la lectura de los datos y su puesta a disposicin contribuye a una mayor transparencia y objetividad en la tarea comunicativa. Es ms, hay quienes defienden que la transparencia es la nueva objetividad (THE ECONOMIST, julio 2011). 2.5.2 NECESIDAD DE ORDENAR Philip Meyer tambin reflexion en 2011 en su discurso en la Academia Austraca de las Ciencias acerca de la gran cantidad de informacin actual y la necesidad de organizar: Creera que todos estamos de acuerdo en que las tecnologas de la era de la informacin producen datos ms rpido de lo que producen conocimiento. En lugar de remplazar el periodismo, Internet est creando una nueva necesidad de mercado: para la sntesis y la interpretacin del flujo constante de hechos. Para el acadmico, los datos sin procesar son lo mismo que el ruido, de ah que a medida que se multiplica la informacin disponible en el mundo, tambin se multiplican las necesidades para procesarlo. Asimismo, Guy Laurence, CEO de Vodafone Reino Unido argumentaba en una entrevista de Simon Rogers editor del Datablog del peridico britnico The Guardian- que antes el acceso a la informacin era un gran problema mientras que ahora, la prioridad es saber manejarla: Nos hicieron creer que cuanto ms datos, mejor, pero eso ya no es verdad. Regresando a Meyer, en su discurso ya mencionado (2011) tambin dijo que ahora que la informacin es abundante lo importante es su procesamiento: Necesitamos una estructura para ver la verdad de los hechos. Para ello, Meyer (1993) reconoce que en la actualidad no slo alcanza con aplicar el mtodo cientfico a los datos. Ahora tambin es necesario saber nadar entre un mundo de datos: El periodista debe ahora ser un administrador de datos acumulados, un procesador de datos y un analista de esos datos. Los pasos que Meyer enumera para trabajar con los datos en periodismo son: 1. Recopilarlos 2. Almacenarlos 3. Recuperarlos 4. Analizarlos
26
5. Resumirlos 6. Comunicarlos 2.5.3 TRABAJO EN GRUPO Una caracterstica que todos los expertos en Periodismo de Datos coinciden es que cuanto ms un trabajo en equipo sea, mejores resultados se pueden obtener. Sobre todo a la actualidad, cuando las herramientas se multiplican y se valoran cada vez ms las especializaciones. Cierto es que as como se multiplican las herramientas estas se simplifican. Sin embargo, en un trabajo completo de Periodismo de Datos intervienen diferentes capacidades como las que dan la Estadstica, la Sociologa, la Programacin, el Diseo Grfico y el Periodismo. Puede haber reporteros que renan conocimientos de estadstica por ejemplo, pero no es lo ms comn. Por tanto, segn mencionaba Meyer (2011) ello exige una inversin por parte de los medios: Necesitaremos ms reportaje en equipo y editores capaces de reclutar y manejar los talentos que hacen falta. Jos Luis Dader (1993) asegura tambin en el prlogo de la versin espaola de Periodismo de Precisin. Nuevas Fronteras para la investigacin periodstica que este tipo de aventura profesional es una tarea de equipo. Pues el periodista puede encontrarse en su tarea con dificultades tcnicas y de mtodos, para lo que es una solucin buscar la ayuda de especialistas. 2.6 CMO SE HACE PERIODISMO DE DATOS? En un post de julio de 2011 Paul Bradshaw propuso en su blog cuatro fases de trabajo en el Periodismo de Datos: compilar los datos, filtrarlos, contextualizarlos y combinarlos para luego transmitirlos.
27
Ilustracin 5 THE INVERTED PYRAMID OF DATA JOURNALISM. FUENTE: ONLINEJOURNALISMBLOG.COM
2.6.1 COMPILAR LOS DATOS Para Paul Bradshaw, la bsqueda de datos puede iniciarse por dos razones: o porque hay una pregunta que necesita datos para su respuesta o porque hay datos que plantean un interrogante. Como sea, hay que encontrarlos o incluso crearlos, por ejemplo, a travs de encuestas. Para ello estn las bases de datos, pblicas o privadas. Las privadas no necesariamente son secretas, pero no est pensadas para el uso de los periodistas por lo que se puede pedir consultarlas o pagar por ellas, dado el caso. Algunas de las fuentes ms consultadas a partir de las cuales surgen historias son (BRADSHAW, abril 2010): Fuentes gubernamentales, locales, nacionales e internacionales Organismos que monitorean a diferentes organizaciones Instituciones acadmicas y cientficas Organismos de la salud
28
Grupos de presin y organizaciones sociales Empresas Los medios comunicacin
Los modos de recuperacin que Philip Meyer enumeraba en la versin actualizada de Periodismo de Precisin eran los siguientes: CdRom, para ser ledas en el ordenador personal. Conexin Fuentes de acceso pblico Recepcin mediante conexin a Internet De texto completo y bibliogrficas
Con las nuevas tecnologas y facilidades de la informtica, las maneras de recuperacin se han ampliado considerablemente. De ah que las enumeradas por Paul Bradshaw en su artculo de 2011 sean diferentes y actualizadas. A continuacin, citamos algunas de las que el periodista ingls propone, ms otras a considerar: Informacin provista al periodista directamente por una organizacin (todava no es comn que los datos estn adjuntos a los comunicados de prensa) Recuperada luego de bsquedas avanzadas dentro de sitios gubernamentales Haciendo scraping en bases de datos ocultas con herramientas como Scraperwiki, Yahoo!Pipes y el complemento de Firefox Outwit Hub. A travs de la conversin de documentos para su anlisis. Tomando informacin de las APIs Recolectando informacin por uno mismo a travs de observaciones, encuestas o formularios, entre otras formas. 2.6.2 FILTRADO Y LIMPIEZA DE DATOS Un problema que presenta el trabajar con bases de datos pblicas o ajenas incluso propias- es que pueden contener errores de tipeo o de otro tipo- que podran alterar la verdad de los contenidos que se pretenden comunicar. Para evaluar la informacin de una base de datos hay que preguntarse siempre quin suministr los datos originales y cundo y cmo se recolectaron. Muchas bases de datos gubernamentales son compilaciones de material procedente de muy diversas fuentes, cuya fiabilidad y meticulosidad no es uniforme. (MEYER, 1993)
29
Para ello es que un paso fundamental al trabajar con estas bases de datos es proceder a su revisin y limpieza. Numerosas herramientas permiten descubrir tpicos errores humanos sin necesidad de ir registro por registro. Una de ellas es Google Refine que descubre palabras aproximadas, entradas vacas y duplicados. Philip Meyer tambin repeta en su libro Periodismo de Precisin. Nuevas Fronteras para la investigacin periodstica. (1993): Nunca consideres como palabra de Dios lo que el ordenador te indica. Habr siempre que rastrear el paso anterior a la creacin de la base de datos, comprobando los documentos impresos o lo realizado por las personas que reunieron los datos. Asimismo, este tem tambin incluye la conversin de datos al formato con el que se pretende trabajar. Lo ms comn en este caso es el paso de informacin presente en archivos PDF a planillas de clculo como Microsof Excel. No siempre es una tarea sencilla y, a pesar de que existen herramientas gratuitas (PDFtotext, Cometdocs.com, PDFtoexcelonline.com, Zamzar.com) y de pago (PDFconverter, Adobe Acrobat X Pro, Nitro PDF), es necesaria una revisin meticulosa. Relacionado a este punto, otra tarea frecuente en el Periodismo de Datos es la extraccin de informacin de una pgina web a un documento de texto. Y, para cuando el copiar y pegar no funciona correctamente, sobre todo con listas y tablas, existen herramientas para convertir informacin en lenguaje HTML para su uso en un documento de texto o planilla de clculo. Un ejemplo de ellas es la que facilita Google: ImportHTML. 2.6.3 CONTEXTUALIZAR LA INFORMACIN Es necesario preguntarse de dnde viene la informacin, cul es su historia, qu instituciones intervinieron, porqu se recolect, cmo, dnde Entonces, si llega a manos de un periodista la base de datos de crmenes de una ciudad esta slo tendr sentido si se conoce la cantidad de poblacin, el historial, la calidad de vida, el desempleo, la inflacin, etctera. Es decir, una base de datos puede no ser interesante en s misma hasta que se cruzan dos variables. As por ejemplo, un registro de accidentes de una ciudad que se combina con el nivel educativo de los conductores protagonistas de estos puede tal vez dar lugar a una conclusin relevante. Es entonces cuando entra en juego la capacidad del periodista para hacerse las preguntas que deriven en material de noticia. Es en este paso tambin que entran en juego los conocimientos estadsticos y la importancia de esta ciencia dentro del periodismo y del mundo de la informacin.
30
Respecto a las estadsticas, en una entrevista de 2008 a Hal Varian, economista jefe de Google y profesor de Tecnologas de la Informacin en la Universidad de Berkeley, este ya predeca que en la prxima dcada se iba a tender inevitablemente al campo estadstico: "La capacidad de trabajar los datos - ser capaz de entenderlos, procesarlos, extraer valor de ellos, visualizarlos, comunicarlos- va a ser una habilidad de enorme importancia en las prximas dcadas (..). Porque es ahora que realmente se dispone de datos, esencialmente libres y en todas partes. As que el factor que falta es la capacidad de entenderlos y extraer valor de ellos (MCKINSEY QUARTERLY, enero 2009) Y Philip Meyer (1993) tambin ya lo deca en cuanto a su aplicacin en el oficio del periodista: Hubo un tiempo en que todo lo que haca falta era amor a la verdad, vigor fsico y cierta gracia literaria. Todava el periodista necesita esos recursos, pero ya han dejado de ser suficientes. Un nmero por s solo no significa mucho. Debe tener un contexto, debe ser comparado con otros nmeros. Para Jos Luis Dader (1997), la estadstica consiste en una aplicacin prctica de la matemtica, destinada a hacer visible, mediante una explicacin condensada y por tanto asequible al conocimiento humano-, la variabilidad de relaciones ciertas, pero a primera vista invisibles, que existen en grandes masas de datos o poblaciones. Es de mencionar que, en la actualidad, uno de los ms grandes precursores de las estadsticas es el mdico sueco Hans Rosling. l no slo insiste en la necesidad de aplicar las estadsticas en la tarea de la comunicacin sino tambin en todas las reas de la vida para entender el mundo actual. Conocido tambin por sus presentaciones en las charlas TED (organizacin internacional de divulgacin de ideas) para promover el entendimiento del mundo a travs de las estadsticas, en una entrevista de Ulrike Reinhard (marzo 2011), Rosling pone en palabras su percepcin respecto al universo de datos actual: Mi idea fundamental es que el mundo ha cambiado tanto que lo que la gente necesita no es ms datos sino una nueva mentalidad. Necesita un nuevo sistema de almacenamiento con el que poder manejar esta informacin. 2.6.4 COMBINAR LOS DATOS Este paso se refiere a la fusin de datos de diferentes fuentes en una sola. Un modo tpico en periodismo que incluye esta tarea est representado por los mashups, aplicaciones que toman y mezclan datos existentes en la web para crear algo nuevo. El de mapas es de los ms utilizados en el periodismo y sirve para ver cmo se distribuye algo en el espacio. Un ejemplo sera un mapa qu muestre cules son los pases que acumulan ms de cien
31
medallas de oro en la historia de los Juegos Olmpicos basndose en los datos de una tabla de informacin extrada de, por mencionar una fuente probable, Wikipedia. 2.6.5 COMUNICACIN DE LOS DATOS La forma de transmitir los datos a la audiencia es lo que ms ha variado en los ltimos aos gracias a las nuevas tecnologas de la informacin y herramientas que permiten que estos se vuelvan ms fciles de manipular y de acceder. De all que una caracterstica fundamental del Periodismo de Datos actual es la visualizacin de estos en tablas y grficos. 2.6.5.1 INFOGRAFA Y VISUALIZACIN DE DATOS En el mundo acadmico suele diferenciarse entre la infografa y la visualizacin de datos alegando que la infografa se preocupa en presentar la informacin de una manera que pueda ser asimilada por la audiencia, mientras que la visualizacin permite la exploracin al usuario a travs de esos datos. Sin embargo, Alberto Cairo, autor del libro El arte funcional: infografa y visualizacin de informacin habla de una frontera difusa entre ambos conceptos (16 de abril, 2011). Pues este periodista espaol considera que la relacin entre infografa y visualizacin es un continuo ya que todo grfico (de datos, cartogrfico, etc.) presenta, pero tambin puede convertirse en una herramienta que una audiencia manipule mentalmente para explicarse unos datos, para extraer de ellos significados, tendencias, para vincularlos con su propia vida, para buscar en ellos su propio barrio, su ciudad, su vivienda. He ah parte del potencial de la visualizacin de datos en los medios de comunicacin ya que permite esa interaccin del lector sobre todo con las nuevas herramientas. Y, aunque las formas visuales de presentar datos parecen novedosas, lo cierto es que, al menos las ms tpicas, existen desde hace dos siglos gracias a los estudios de mapas en historia y geografa y en otras disciplinas como las matemticas. As, al que se considera como el inventor de la tabla moderna es al ingeniero escocs William Playfair quien en The Commercial and Political Atlas de 1786 y en el Statistical Breviary de 1801 invent y utiliz un grfico de barras, uno de fiebre y otro de tarta, los grficos estadsticos que son ms utilizados en la actualidad. Uno de ellos es el que presentamos a continuacin y que plasma en un diseo grfico la evolucin del comercio de Inglaterra en relacin a Dinamarca y Noruega entre 1700 y 1780.
32
ILUSTRACIN 6. EXPORTS AND IMPORTS TO AND FROM DENMARK & NORWAY FROM 1700 HTTP://UPLOAD.WIKIMEDIA.ORG/WIKIPEDIA/COMMONS/D/D8/PLAYFAIR_TIMESERIES.PNG
TO
1780. FUENTE:
Adems de las mencionadas, otras formas de comunicacin visual de datos se inventaron durante el siglo XIX como el mapa geolgico de William Smith de 1815 que los cartografistas llaman el mapa que cambi el mundo:
ILUSTRACIN 7. MAPA GEOLGICO DE WILLIAM SMITH HTTP://EN.WIKIPEDIA.ORG/WIKI/FILE:GEOLOGICAL_MAP_BRITAIN_WILLIAM_SMITH_1815.JPG (1815). FUENTE:
33
Pero cuando comienzan a asomar las cantidades masivas de datos, se tornan necesarias nuevas herramientas para su lectura y comprensin. De ah que se comenzaran a utilizar aquellas especficas para la visualizacin de datos que poco a poco fueron mejorando y convirtindose de uso comn, sobre todo desde el momento en que se las comprendi como una forma alternativa de comunicacin. As, cada vez ms herramientas facilitan a cualquier usuario la visualizacin de datos. Una que tuvo especial repercusin fue ManyEyes, de IBM, la cual funciona en Internet y es de acceso gratuito. Con esta herramienta, a partir de bases de datos se pueden disear visualizaciones para cruzar los datos y encontrar nuevas relaciones.
ILUSTRACIN 8. DISTRIBUCIN DE LA AYUDA INTERNACIONAL DE ESTADOS UNIDOS EN ELTIEMPO: 1946-2005. FUENTE: MANYEYES.
La visualizacin entre otras cosas, sirve para poner datos en contexto, segn explica Jeffrey Heer, de la Universidad de Stanford en el video de Geoff McGhee (2010) Journalism in the age of data (2010). A su vez, Cole Nussbaumer (2011), experta en visualizacin de datos en Silicon Valley- prefiere hablar de humanizacin de datos, pues al presentarlos de manera creativa es posible hacer de ellos una historia ms transparente. Uno de los medios precursores y que constantemente est innovando en visualizacin de datos es The New York Times. 2.6.5.1.1 LA NARRATIVA DE LA VISUALIZACIN Para Edwar Segel y Jeffrey Heer (2010), de la Universidad de Stanford, la visualizacin de datos no slo revela historias sino que tambin puede contarlas, igual que si fuese una historia escrita.
34
Para ambos acadmicos las visualizaciones estticas a lo largo del tiempo han sido utilizadas para apoyar la narracin, generalmente en forma de diagramas insertos en un cuerpo mayor de texto. Y es en este formato que el texto transmite la historia, y la imagen por lo general proporciona evidencia de apoyo o detalles relacionados. Ahora, para ellos, una nueva clase de visualizaciones cada vez ms complejas tratan de combinar narraciones con grficos interactivos y narradores y periodistas, especialmente en lnea. A su vez, describieron siete gneros de narrativas de visualizacin: el estilo revista, el grfico anotado, el diagrama de flujo, la tira cmica, las diapositivas, el vdeo y el cartel dividido.
ILUSTRACIN 9. SIETE GNEROS. FUENTE: (SEGEL Y HEER, 2010).
El gur del Periodismo de Precisin, Philip Meyer (2011) tambin considera que la narrativa va a la par de los datos, pues en el siglo XXI es necesario tanto el Periodismo de precisin el cual toma sus herramientas de la ciencia- como el Periodismo narrativo, basado en el arte: La ciencia crea estructura con lo que Lippmann denomina modelos esquemticos, que provienen de la teora. El arte crea la estructura a travs del diseo de la narrativa en la narracin. Por ello no es cuestin de poner los datos como son y abrumar al lector. Hay que preguntarse qu es lo que este quiere saber a partir del grfico, qu es lo que puede llegar a preguntarse. Igualmente, Alberto Cairo insiste en la necesidad de no caer en la simplificacin excesiva. Y habla de dos corrientes en el campo de la visualizacin de la informacin: la de los minimalistas (racionales, cientficos) y la de los de una perspectiva ms emocional y esttica.
35
En cuanto a la teora, Cairo (2011) recuerda a Edward Tufte, un influyente profesor de estadstica que es defensor de la corriente minimalista y un aberrador de la ideologa de la decoracin. Incluso este habla de la basura de grficos (chart junk) que hay que evitar, como estilos que dificultan la lectura de los datos, grillas sobrecargadas, texturas incomprensibles Algunas de las reglas que enumera en su libro bsico The visual display of quantitative information son: Mostrar los datos Maximizar el uso de data-ink (tinta destinada a los datos).3 Evitar el chart-junk, o todo lo que dificulte la lectura de los datos Utilizar elementos multifuncionales, que facilitan la lectura. Mltiplos pequeos Textos y leyendas con la orientacin tradicional Hacer un uso cuidadoso del color
Su postura es en ocasiones extrema. Sin embargo, sus principios tuvieron y tienen hasta la actualidad gran percusin entre diseadores y comunicadores. Sin embargo, en las dos ltimas dcadas tambin se le ha rebatido su postura minimalista, basada ms en apreciaciones personales que en hechos empricos. Por su parte, estn aquellos defensores de un uso ms esttico y emocional de los grficos. Entre ellos se incluye el influyente Nigel Holmes, referente de la infografa moderna y defensor de la inclusin de ilustraciones junto a los datos. Para Cairo (2011), la esttica no est de ms siempre y cuando el grfico no est por encima del rigor informativo: rendirse en ocasiones a lo ldico y crear un grfico que tenga ms artificio que sustancia puede ser positivo, dependiendo del asunto y del contexto. Por su parte, las nuevas herramientas tecnolgicas permiten que sin llegar a la simplificacin absoluta se creen grficos interactivos que permiten a la audiencia buscar aquello que les sea de ms inters. El siguiente es un ejemplo de grfico interactivo que realiz el The New York Times el pasado junio llamado Where the Heat and the Thunder hit their shots. Aqu se pueden comparar las fortalezas de los jugadores de baloncesto del Miami Heat y del Oklahoma City Thunder basndose en sus patrones de disparo.
La regla central de Tufte es la ratio data-ink, la cual representa la cantidad de tinta que debe llevar la ilustracin en orden a representar los datos de manera aceptable. 36
ILUSTRACIN 10. WHERE THE HEAT AND THE THUNDER HIT THEIR SHOTS. FUENTE: THE NEW YORK TIMES.
2.6.5.2 OTRAS FORMAS DE COMUNICAR LOS DATOS La visualizacin de los datos se presenta como una de las formas que se estn volviendo cada vez ms populares para presentar la informacin a los lectores. Sin embargo, segn Paul Bradshaw (abril 2010) en su teora de la Pirmide Invertida del Periodismo de Datos, hay otras maneras de comunicar los datos:
37
La narracin: un artculo escrito de manera tradicional en el que se incluyen los datos recolectados. Comunicacin social: los datos pueden conseguirse a travs de las redes sociales o a travs de convocatorias y concursos. Humanizacin: presentar los nmeros con ejemplos reales para ilustrar una historia. No solo datos abstractos. Personalizar: la interaccin con los datos permite a los usuarios buscar aquello que les es de su inters personal. Por ejemplo: cmo le afectan los recortes de este trimestre segn regin?. Utilizar: semejante a personalizar, la comunicacin de los datos puede permitir al usuario buscar aquella informacin que le interese, sea o no que lo afecte a nivel personal.
2.7 DOS EJEMPLOS DE PERIODISMO DE DATOS 2.7.1 DNDE VAN MIS IMPUESTOS? En Internet, el sitio espaol www.dondevanmisimpuestos.es es una iniciativa de la Fundacin Ciudadana Civio la cual cuenta con el apoyo de la Open Knowdlege Foundation. Se trata de un proyecto de Periodismo de Datos para dar conocer los destinos del dinero segn los Presupuestos Generales del Estado desde 2008 hasta 2011. Inspirada en el proyecto ingls Where Does My Money Go?, bsicamente es una visualizacin interactiva en la que el usuario o lector puede ir desplegando los grficos segn cules sean sus intereses. Por ejemplo, puede ver los presupuestos que se destinan a Cultura, Artes Recreativas y Religin y a su vez cunto de esto va, por ejemplo, a Bibliotecas y Archivos. Tambin est la posibilidad de ver los presupuestos por comunidades autnomas ao a ao. Esta informacin es posible porque est disponible en los Boletines Oficiales del Estado. Sin embargo, lo que ya no puede saberse en Espaa es si efectivamente ese dinero fue destinado tal como estaba planeado por las trabas que presenta el no contar con una Ley de Acceso a la Informacin4. En este caso se trata de un diseo realizado a travs de las tablas en las que se recolect la informacin de los Presupuestos Generales de los gastos anuales de la Administracin Central del Estado (ministerios, agencias dependientes y otros organismos pblicos, como el Congreso) y la Seguridad Social.
ILUSTRACIN 11. "DNDE VAN MIS IMPUESTOS?". FUENTE: WWW.DONDEVANMISIMPUESTOS.ES
Ver apartado sobre Open Data. 38
2.7.2 METADONA Y LA POLTICA DEL DOLOR Es un reportaje de The Seattle Times de Estados Unidos cuyo ttulo original es Methadone and the politics of pain y fue publicado en tres partes en diciembre de 2011. Galardonado con el premio Data Journalism Award en la categora Data-Driven Investigation, consisti en la denuncia de todo lo que hay detrs del consumo del analgsico metadona. Su elaboracin llev diez meses y en el equipo participaron cinco personas. Entre otras cosas revelaban que desde 2003 haban muerto 2173 personas en el estado de Washington por sobredosis de metadona, la mayora de ellas de clases bajas. Denunciaban tambin que el frmaco tiene un inters financiero para el Estado, adems de que deja a los pacientes con un dolor crnico. El reportaje incluy representaciones grficas de los datos demogrficos de las muertes relacionadas con la metadona. El ms ambicioso de ellos traza las direcciones de aquellas personas que haban muerto por una sobredosis accidental vinculada a la metadona. Utilizando un cdigo de colores, el grfico del Estado fue dividido en cinco partes segn ingresos lo que permita ver que haba ms muertes en las comunidades ms pobres. A su vez, la investigacin estuvo sustentada en tres bases de datos: la de los certificados de muerte del Estado con detalles de la causa de muerte, entre otros; las notas de texto acerca de las muertes, por ejemplo las escritas por los mdicos y la del Comprehensive Hospital Abstract Reporting System (CHARSEl) con datos sobre cientos de miles de hospitalizaciones, diagnsticos, procedimientos realizados, costo de la estancia y la situacin econmica de cada paciente.
39
ILUSTRACIN 12. METHADONE AND THE POLITICS OF PAIN.FUENTE: THE SEATTLE TIMES
3.HERRAMIENTAS PARA EL PERIODISMO DE DATOS Como se ha mencionado a lo largo del trabajo, numerosas herramientas estn a disposicin de los periodistas, diseadores o quien lo quiera para hacer Periodismo de Datos. A continuacin, algunas de ellas clasificadas segn el uso que se le puede dar en la elaboracin de un contenido. 3.1 MAPAS
QUANTUM GIS (QGIS): sistema de informacin geogrfica de cdigo libre. Herramienta para crear
mapas a partir del anlisis de bases de datos.
40
OPENHEATMAP : una herramienta fcil de usar mientras los datos estn clasificados por pas, regin
o provincial.
ARC GIS: Sistema de informacin que permite crear, analizar, almacenar y difundir datos, modelos,
mapas y globos en 3D.

POSTGIS: mdulo que aade soporte espacial a la base de datos objeto-relacional PostgreSQL, para
su utilizacin en Sistema de Informacin Geogrfica (SIG).

GRASS: tambin un software SIG libre.
3.2 SCREEN SCRAPING (RASPADO) Esta actividad se refiere a una tcnica de programacin para extraer mediante ingeniera inversa la informacin de un PDF, plantilla de Excel, pgina web, grfico
SCRAPERWIKI: una herramienta en lnea que permite a cualquiera recoger, guardar y publicar la
informacin de una pgina web y convertirla en una base de datos.

READABILITY: aplicacin para facilitar la lectura de contenido en la web y que permite extraer el
texto.
SCRAPER (extensin para Chrome): sirve para extraer tablas de pginas webs.
3.3 LENGUAJE DE SCRIPTS

RUBY: lenguaje de programacin de cdigo abierto y dinmico. PYTHON: lenguaje de programacin tambin de cdigo abierto fcil de leer y escribir. ACTIONSCRIPT: lenguaje de la plataforma Adobe Flash PERL: lenguaje de programacin. PHP: lenguaje de programacin.
3.4 MANEJO DE BASES DE DATOS

MICROSOFT EXCEL: no es un gestor de bases de datos sino una hoja de clculo, pero cuando se trata
de conjuntos de datos hasta de tamao medio es la herramienta ms utilizada por los periodistas. Su funcionalidad primera es el trabajo con planillas de clculo y la aplicacin de diversas funciones en estas, en orden al anlisis y administracin de datos.
41
OPENOFFICECALC: tiene la misma finalidad que MicrosoftExcel aunque es de cdigo abierto y
presenta menos funciones que este. Cuando las hojas de clculo no son suficientes para el trabajo del periodista este necesita un gestor de bases de datos relacional, sobre todo cuando se trata de unir varias hojas de clculo o si se trabaja con grandes conjuntos de datos. Algunos de estos gestores pueden ser: SQLITE,
POSTGRESQL, MICROSOFTACCESS Y SQL SERVER . MYSQL,
3.5 VISUALIZACIN DE DATOS

MANYEYES : aplicacin que mezcla los datos y convierte nmeros complejos y datos de bases de
datos en visualizaciones que pueden ser tanto para la web como para la prensa escrita. Es una creacin del grupo de investigacin de IBM, el cual procuraba con esta herramienta la democratizacin de la visualizacin ya que es fcil de utilizar y de compartir.
YAHOO PIPES: es una herramienta informtica semejante a ManyEyes. TABLEAU PUBLIC: versin gratuita del software Tableau. Es integrable y puede insertarse con facilidad en la pgina web, blog o medio del usuario. No es confidencial pues queda abierto al pblico y tiene un lmite de cien mil registros y 50 MB por usuario. Su herramienta Show me indica qu tipo de grficos se adapta a la informacin que se est analizando. GOOGLE FUSION TABLES: es una herramienta ideal para principiantes. Permite visualizar los datos y publicarlos y compartirlos como mapas, lneas de tiempo y grficos. Se pueden combinar las tablas de datos, filtrarlos y ordenarlos. Adems, permite a otros dejar comentarios sobre cada uno de estos. Una desventaja es que los datos quedan en los servidores de Google, aun cuando se elija configurarlos en privado.
3.6 LIMPIEZA DE DATOS Esto es para unificar criterios antes de cruzar datos. Es decir, formateo de datos. Por ejemplo, si a la ciudad de Buenos Aires se la nombra como BA, Capital Federal o Ciudad Autnoma de Buenos Aires en la misma base de datos; entonces ser necesario unificarlas. En este caso se trata de establecer consistencia en los datos estableciendo un control de autoridades dirigido a denominar a cada entidad, sea nombre de persona, corporacin o concepto, de una nica manera.
DATA WRANGLER: herramienta del Grupo de Visualizacin de la Universidad de Standford.
Funciona en el mismo explorador y todava est en fase demo. Su ventaja es que permite, entre otras cosas, borrar de manera sistemticas filas en blanco, reacomodar los datos para que haya slo uno por fila, formatear datos mediante la deduccin automtica Su desventaja es la relacionada con la
42
seguridad de los datos pues estos son enviados a un sitio externo, por lo que para informacin confidencial no es tan recomendable (KANDEL et al., 2011)
GOOGLE REFINE : se trata de una poderosa herramienta gratuita para explorar datos y limpiarlos de
fcil manera. Funciona a travs del navegador, pero es una aplicacin de escritorio por lo que los datos con los que se trabaja no se hacen pblicos. Su principal funcin es el clustering o limpieza de datos basada en similitudes y correccin de erratas tanto en textos como en nmeros-, que agrupa por aproximacin distintos valores de celda que pueden referirse a lo mismo. Para ello utiliza diferentes algoritmos y el usuario puede elegir el que desea utilizar, pues van desde los ms simples hasta los ms estrictos. Su desventaja es que no tiene todas las funciones de una hoja de clculo aunque se parezca a una. Sin embargo, los datos se pueden importar y exportar desde formatos varios como CVS, Excel, XML y JSON. 3.7 ANLISIS ESTADSTICO
EL PROYECTO R: R es un sistema estadstico que sus autores prefieren llamar de entorno y es la
evolucin o nueva implementacin del lenguaje S que haba sido desarrollado en AT&T por Rick Becker, John Chambers y Allan Wilks. Es OpenSource, multiplataforma y su uso se est extendiendo cada vez ms. Algunas de las operaciones que pueden realizarse son: almacenamiento y manipulacin
efectiva de datos; operadores para clculo sobre variables indexadas (Arrays), en particular matrices; una coleccin de herramientas para anlisis de datos; posibilidades de visualizacin de datos y un lenguaje de programacin. Su gran potencial es que es extensible. SPSS (STADISTICAL PRODUCT AND SERVICE SOLUTIONS): software estadstico muy poderoso, de pago.
3.8 OTRAS HERRAMIENTAS

DOCUMENT CLOUD: proyecto ganador de uno de los desafos de la Knight Foundation que est
pensado para que los periodistas de diferentes medios de comunicacin publiquen sus documentos en una misma plataforma, con marcaciones propias si se quiere. Un caso de su uso que merece mencin tambin por relacionarse con informacin abierta es el del diario The New York Times que public 25.000 hojas de correos electrnicos de la candidata a vicepresidenta de Estados Unidos, Sarah Palin. As, al estar a disposicin del pblico, los lectores tambin podan marcar aquello que les pareca relevante y ayudar a los periodistas.
TEXTMATE: editor de texto plano con soporte para mltiples lenguajes de programacin. 43
4.BIG DATA Big Data o lo que es lo mismo en espaol, los grandes volmenes de datos, es el fenmeno que en tecnologa de la informacin hace referencia precisamente a aquellas cantidades de datos tan altas que es difcil imaginarlas. Y as como es difcil imaginarlas, es de comprender el problema que representan en distintos mbitos de la vida, tanto a nivel individual como general. Pues as como Big Data trajo beneficios tambin surgen constantemente nuevas necesidades en orden a poder almacenar tanta informacin, compartirla, organizarla y visualizarla. Para intentar imaginar a qu se refiere Big Data conviene destacar el ltimo informe sobre el Universo Digital de la consultora internacional IDC de junio de 2011 (GANTZ, Jhon; REINSEL, David, 2011) segn el cual toda la informacin digital del mundo se duplica cada dos aos. Y lo que calculaban para fines de dicho ao es que se llegara a los 1,8 zettabytes de datos cifra todava por confirmar si se alcanz-. Para tener una idea aproximada, un zettabyte son 1.000.000.000 billones de bytes. Dicho estudio -patrocinado por la empresa lder en almacenamiento EMC- se realiza anualmente desde 2007 y cada ao ha arrojado conclusiones sorprendentes, como la que deduce que el 75 por ciento de la actual informacin en la web es creada por los individuos y que los datos a la actualidad siguen superando la capacidad de almacenamiento disponible. Las principales conclusiones del ao a ao de este estudio podran resumirse de la siguiente manera: En 2006, la cantidad de informacin digital creada, capturada y replicada fue de 161 mil millones de gigabytes, lo mismo que tres millones de veces la informacin contenida en todos los libros de la historia. La conversin de lo analgico en digital es gran responsable del crecimiento. En 2007, la cantidad de informacin digital era de 281 mil millones de gigabytes. Este mismo ao, por primera vez toda la informacin creada, capturada y replicada haba excedido el almacenamiento disponible. En 2008 se crearon 487 mil millones de gigabytes y alrededor del 70 por ciento fue responsabilidad de los individuos. En 2009, segn revelaba el informe 2010 de IDC, la informacin haba crecido en el mundo un 62 por ciento hasta casi alcanzar 800.000 petabytes. Para imaginarlo, el informe compara esta cantidad con una torre de DVDs que va y vuelve de la Tierra a la Luna. Por ltimo, en 2010 la informacin ya alcanzaba y superaba la barrera del zettabyte llegando a 1,2 de esta ltima medida. Adems, los usuarios se vuelven responsables del 75 por ciento del
44
contenido disponible y no slo por la creacin de informacin sino por la informacin que generan alrededor de ello.
ILUSTRACIN 13. A DECADE OF DIGITAL UNIVERSE GROWTH. FUENTE: IDCS DIGITAL UNIVERSE STUDY.
Los efectos de tanta informacin disponible se manifiestan constantemente y hasta han transformado el panorama social. As es que el trfico de datos tambin ha crecido exponencialmente y segn el Informe Global de la Nube (2010-2015) de Cisco se calcula que este se cuadriplicar para 2015 hasta llegar a los 4,8 zettabytes. Por aclarar aqu a qu es lo que se refiere el trmino la nube o computacin en la nube (Cloud Computing), esta no tiene una definicin estndar aceptada. Por lo que una que encuentra acepcin y que puede considerarse en este trabajo es la de 2008 del IEEE Computer Society (MCFEDRIES, 2008): Estamos al borde de la computacin en la nube, en la que no slo los datos sino incluso nuestro software reside dentro de la nube, y podemos acceder a todo, no slo a travs de nuestros equipos, sino tambin a travs de dispositivos como telfonos inteligentes, PDAs, electrodomsticos, consolas de juegos e incluso coches " A su vez, para el profesor y experto Luis Joyanes Aguilar los datos y las aplicaciones se reparten en nubes de mquinas, cientos de miles de servidores de ordenadores pertenecientes a los gigantes de Internet, Google, Microsoft, IBM, Sun Microsystems, Oracle, Amazon, y poco a poco a cientos de grandes empresas, universidades, administraciones, que desean tener sus propios centros de datos a disposicin de sus empleados, investigadores, doctorandos, etc. (JOYANES, 2009).
45
De parte de todo esto se trata el fenmeno al que se llama Big Data, que no es una cosa o algo esttico, sino que alude a un concepto dinmico. Segn la definicin de IDC, las tecnologas de Big Data, describen una nueva generacin de tecnologas y arquitecturas, diseadas para extraer valor de grandes volmenes de datos, permitiendo la captura a alta velocidad, su descubrimiento y/o anlisis (GANTZ, Jhon; REINSEL, David, 2011). Las medidas Para conocer con exactitud las medidas y tamaos de datos a los que se hace mencin en este trabajo, es pertinente prestar atencin al grfico siguiente.
ILUSTRACIN 14. "DATA INFLATION". FUENTE: THE ECONOMIST.
Este cuadro corresponde al artculo All too much de la revista The Economist (febrero 2010) e ilustra de manera clara las unidades que miden la informacin digital. Como all se especifica, estas estn tomadas de la Oficina Internacional de Pesos y Medidas que en 1991 agreg los trminos zetta y yotta, siendo estos los dos ltimos. As, para tener una estimacin de cuanta informacin representa cada medida, The Economist hace comparaciones. Un B (byte) podra ser un nmero en cdigo informtico. Dos KB (kilobytes) son una pgina de slo texto. Cinco MB (megabytes) podran ser todas las obras de Shakespeare. Entre uno y dos GB (gigabytes) alcanzan para una pelcula comprimida de dos horas. Todos los libros catalogados de la Biblioteca del Congreso de Estados Unidos son 15 TB (terabytes). Luego, un PB (petabyte)
46
equivala en 2010 a toda la informacin que Google procesaba en una hora. Un EB (exabyte) podran ser mil millones de copias de la revista The Economist. Por su parte, 1,2 ZB (zettabyte) es la cantidad de informacin que haba en total en 2010. Mientas que un YB (yottabyte) es todava muy grande como para imaginar. Un desafo en todos los mbitos Con el correr de los ltimos aos es as como Big Data se ha ido convirtiendo en un elemento central del mundo actual. Y, sobre todo se ha vuelto un desafo. Por ejemplo para aquellas empresas que manejan inmensurables cantidades de informacin a cada hora. Pensar sino solamente en Facebook, Google o Twitter. Slo en la plataforma de videos de YouTube se suben 72 horas de contenido por minuto5, para tener una idea aproximada de los volmenes de informacin a los que hacemos mencin. Precisamente, por el lado empresarial es que el tema Big Data fue objeto de una cobertura especial de la revista The Economist de febrero de 2010 que se titul Data, data, everywhere. All se dio cuenta de la astronmica cantidad de informacin que es procesada cada segundo -en el mundo hay una cantidad de informacin digital inimaginable que se multiplica cada vez ms rpido- y del negocio que representa la economa centrada en los datos, si bien todava faltaban las herramientas. En ese mismo reportaje as lo admita el ejecutivo de Microsoft Craig Mundie: Usted puede ver las lneas generales de esta economa pero las implicaciones tcnicas de esta, la infraestructura e incluso el modelo de negocio, en este momento todava no se comprenden bien. La empresa del buscador Google bien sabe tambin la importancia que tiene la informacin y su potencial de negocio. Esto lo pone constantemente de manifiesto y puede evidenciarse en que el primer nmero de la primera revista de su autora, Think Quarterly estuvo destinada a los datos y se llam The Data Issue. En su introduccin, Matt Brittin (2011), el Managing director de Google Reino Unido e Irlanda, invita a los lectores a inspirarse con la revista para encontrar, entre un mar de informacin, los indicadores mgicos que le ayudarn a transformar su negocio. Big Data es un desafo empresarial tanto por los problemas que puede acarrear, como por las oportunidades que representa. Un importante ejemplo es el tema del almacenamiento disponible que todava es inferior a la cantidad de datos existente. Tener en cuenta al respecto que un gigabyte de contenido almacenado puede generar un trfico de hasta un petabyte sin que este sea almacenado, como es el caso del streaming de televisin o de las llamadas de voz.
Cfr. It's YouTube's 7th birthday... and youve outdone yourselves, again. YouTube Blog (Mayo 2012)
47
Pero, segn el informe de IBM, What is big data? Bringing big data to the Enterprise(2012), este fenmeno de Big Data, es ms que una simple cuestin de tamao, es una oportunidad para encontrar ideas en nuevos y emergentes tipos de datos y contenidos, para hacer un negocio ms gil y dar respuestas a preguntas que antes podan parecer fuera de alcance. Lo mismo deca la consultora Gartner Inc.-especializada en tecnologas de la informacin- en Pattern-Based Strategy IT Research Report, una publicacin de 2011 en la que adverta que las empresas no deban tomar el almacenamiento como el nico problema que acarrean los grandes volmenes de datos. Tambin estn la variedad y la velocidad. La variedad en el sentido de que cada vez hay ms tipos de informacin con los que lidiar y la velocidad tanto por la rapidez con la que se producen los datos como por lo rpido que la informacin deber ser procesada para satisfacer la demanda. De todas maneras, para los analistas de Gartner, BigData es un tema complejo pero el verdadero problema est en encontrarle sentido a tanta informacin y en buscar patrones que ayuden a las organizaciones a tomar mejores decisiones. Y, as como The Economist o Google con Think Quarterly no fueron ni los primeros medios relevantes ni los nicos en centrarse en Big Data como un tema actual y preponderante, previamente ya haba habido otros indicios como el de la revista Wired. Esta, en su nmero de julio de 2008 habl de la Era del Petabyte, enfocada a destacar el potencial de la lectura matemtica y estadstica de los datos, sin importar el mbito de su aplicacin pues es la cantidad de informacin lo que hace la diferencia. Es en ese sentido que BigData permite una nueva forma de investigacin en la que los nmeros hablan por s mismos: La nueva disponibilidad de grandes volmenes de datos junto con las herramientas estadsticas de hacer clculos de estas cifras ofrece una nueva forma de entender el mundo. Se refiere a la aplicacin de algoritmos tan solo sea para descifrar tendencias y costumbres de los usuarios, por ejemplo. Asimismo, el desafo no slo alcanza a las empresas en lo que refiere a almacenamiento y buen uso. Tambin alcanza a los individuos y a la sociedad en general que deben aprender a manejarse en un mundo con sobreabundancia de informacin y aprovechar su potencial. O puede tambin alcanzar mbitos especficos, como el cientfico por mencionar uno. Es as como la prestigiosa revista Nature en septiembre de 2008, hizo tambin su especial sobre el tema Big Data para resaltar los cambios que este fenmeno exige en el mbito de la investigacin: Los investigadores deben obligarse a documentarse y manejar la informacin con el mismo profesionalismo que invierten en sus experimentos. Incluso, en su editorial llega a afirmar que el
48
futuro de la ciencia puede depender en parte de la inteligencia que se aplique en navegar por la gran abundancia de datos para su propio beneficio. Tambin a nivel social y econmico estn las consecuencias. El Foro Econmico Mundial en su informe de 2012 Big Data, Big Impact: New Possibilities for International Development la ha considerado como una herramienta de desarrollo econmico, al referirse como ejemplo a los datos generados por los mviles y su utilidad en situaciones de emergencia como un terremoto: Los investigadores y los responsables polticos estn empezando a darse cuenta del potencial que tiene la canalizacin de flujos de datos en informacin que puede ser utilizada para identificar necesidades, proveer servicios, y predecir y prevenir crisis en beneficio de las poblaciones de bajos ingresos. 4.1 BIG DATA Y SU INFLUENCIA EN EL PERIODISMO Today, making sense of Big Data, particularly unstructured data, will be a central goal for data scientists around the world, whether they work in newsrooms, Wall Street or Silicon Valley. Alex Howard (O'Reilly Media) Pero Big Data no slo ha supuesto desafos para los mundos corporativos, gubernamentales y a nivel individual. Tambin ha supuesto cambios para el periodismo y la manera de contar historias. El anlisis de grandes bases de datos -ajenas o propias- supone el acceso a nuevas historias gracias a los vnculos que se pueden establecer. En esta lnea es que el periodista alemn Mirko Lorenz (2012), especializado en datos, define data como pequeos puntos de informacin que frecuentemente no son relevantes de manera aislada pero que a nivel masivo s lo son cuando se los analiza desde el ngulo correcto. Sin embargo, no es tan simple como suena pues exige a los comunicadores nuevas habilidades para dar contexto a enormes cantidades de informacin. O, en el caso que los comunicadores no incorporen estos nuevos conocimientos, lo idneo es que tengan compaeros de equipo que s lo hagan. Lo mismo en lo que refiere a la visualizacin de los datos. Al mismo tiempo es de destacar que las herramientas para el manejo de mucha informacin se vuelven ms accesibles y permiten ms fcilmente volver legibles y visibles grandes masas de datos que pueden provenir de diferentes sitios y que son demasiado grandes como para ser ledas o analizadas con los mtodos tradicionales. En general, cada vez hay una mayor toma de conciencia en el valor que tiene encontrar patrones de informacin para la elaboracin de noticias. Por ejemplo, una gran fuente de informacin actual es la
49
que est disponible en las redes sociales, como Facebook o Twitter. Aplicando all los algoritmos adecuados y extrayendo patrones es posible reunir informacin noticiable de todo el fluir constante de datos. O si los recursos son pocos y la informacin a analizar y cruzar es mucha, un trabajo en conjunto con la audiencia es tambin una nueva posibilidad. Lo mismo si se analiza una base de datos y se pone a disposicin del pblico para que haga sus propios cruces de informacin y, si la plataforma lo permite, la comparta. Pues los intereses varan de persona a persona y de comunidad a comunidad, de ah parte la ventaja de alojarlas en algn sitio del Internet. Asimismo, las herramientas para el manejo de Big Data en una redaccin no sirven slo para encontrar informacin, tambin es posible utilizarlas para conocer en tiempo real o no las reacciones de la audiencia digital y predecir aquello que ser ms de su inters, o que - tratndose de una empresavender ms. 4.2 EJEMPLO DE TRABAJO PERIODSTICO CON GRANDES BASES DE DATOS El proyecto Dollars for Docs de la organizacin periodstica sin fines de lucro ProPublica constituye un vlido ejemplo de trabajo con varias y grandes fuentes de datos. Lo que permite es que el lector pueda averiguar cul es la relacin de su mdico de inters de Estados Unidos- con las industrias farmacuticas. Ello fue posible gracias a la apertura de datos que las mencionadas industrias farmacuticas comenzaron a hacer en 2010 por un tema legal 6 . La intencin no es desenmascarar relaciones fraudulentas sino reconocer que estas pueden plantear cuestiones ticas. Adems, su foco est puesto en poner a disposicin dicha informacin de manera sencilla y desde all es posible sacar conclusiones. As es como medios de diferentes estados del pas norteamericano basaron investigaciones periodsticas en la fuente facilitada por ProPublica. O la misma organizacin bas notas periodsticas en su base de datos durante estos ltimos aos.
ILUSTRACIN 15. "DOLLARS FOR DOCS". FUENTE: PROPUBLICA.
A raz de la reforma sanitaria de Estados Unidos. La ley que as lo dispone es la llamada Physician Payments Sunshine que exige un informe anual para declarar cualquier pago o regalo por un monto mayor a los 10 dlares, lo que incluye viajes, subvenciones para investigacin, invitaciones a congresos, etctera.
50
51
5.OPEN DATA (DATOS ABIERTOS) La teora democrtica sostiene que la informacin sobre lo pblico ha de ser accesible de modo igualitario para todos los miembros del pblico. Philip Meyer, 1993 El acceso a la informacin pblica se ha ido multiplicando en los ltimos aos en distintos pases y, aunque todava se est lejos del nivel deseado, esto ya ha ido revolucionando la manera de hacer periodismo. El concepto de Open Data (cuya traduccin sera datos abiertos) hace referencia a la informacin de carcter pblico que se pone a disposicin del ciudadano o usuario, en orden a una mayor transparencia de accin. Se trata simplemente de abrir al pblico informacin que se aloja en los servidores propios o en la Nube y que son de autora de la institucin local, nacional o internacional. Puede tratarse de informes, de bases de datos, de encuestas, de estadsticas y dems, en formatos compatibles con los potenciales usuarios y terceros. Segn la definicin de la Unesco, el libre acceso consiste en permitir a todos acceder libremente a la informacin relativa a la investigacin cientfica evaluada por expertos (artculos cientficos y datos de investigacin). Ello supone que los titulares de los derechos conceden un derecho de acceso universal e irrevocable para copiar, utilizar, distribuir, transmitir y crear obras derivadas en cualquier formato en el marco de actividades legales, siempre y cuando se mencione como corresponde el autor original (UNESCO, 2011). Su nfasis en el libre acceso a la informacin de carcter cientfico hace referencia a que la institucin internacional fomenta el crecimiento del conocimiento en los mbitos de la educacin, la ciencia, la cultura y la comunicacin e informacin. Por ello es que participa activamente en su promocin. Asimismo, en la declaracin de la Sociedad de Gobierno Abierto sus miembros firmantes defienden el valor de la apertura en nuestro compromiso con los ciudadanos para mejorar los servicios, gestionar los recursos pblicos, promover la innovacin y crear comunidades ms seguras. Adoptamos los principios de transparencia y gobierno abierto para que haya ms prosperidad, bienestar y dignidad humana en nuestros propios pases y en un mundo cada vez ms interconectado. Esta Sociedad (Open Government Partnership, por sus siglas en ingls) fue lanzada en septiembre de 2011 entre los presidentes de Estados Unidos y Brasil, Barack Obama y Dilma Rousseff para
52
promover la transparencia como medio para mejorar la gestin de los recursos pblicos y aumentar la participacin cvica. La conforman gobiernos de diferentes pases y organizaciones civiles, pblicas y privadas. Una administracin pionera y ejemplo en lo que refiere a Open Data es la de Estados Unidos con su portal data.gov que fue luego replicado en otros gobiernos, entre ellos el de la Comisin de la Unin Europea o el de Gran Bretaa. Este ltimo, para su lanzamiento en enero de 2010 cont incluso con el apoyo del inventor de la World Wide Web, Tim Berners-Lee. Este sitio, http://data.gov.uk/, funciona como buscador y tiene indexadas miles de bases de datos ordenadas por distritos y estadsticas. Adems, cuenta con foros en los que los usuarios pueden discutir temas relacionados con el manejo de datos. Incluso tiene tutoriales sobre cmo utilizar la informacin y aprovechar las diferentes herramientas para su uso. En ellos puede encontrarse desde la cantidad de homicidios de un municipio o ciudad hasta las planillas con informacin detallada de los gastos pblicos. No es el caso de Espaa a nivel de estado aunque s en algunos casos a nivel autonmico, como es el Pas Vasco o el Principado de Asturias, que son los pioneros en el pas. El Pas Vasco tiene la plataforma Open Data Euskadi donde puede encontrarse la informacin reutilizable, es decir aquella que ya se ha hecho pblica y est librada a su reutilizacin. Adems, estn las iniciativas ciudadanas de datos abiertos, sobre todo a nivel de organizacin civil y que procuran facilitar al ciudadano el acceso a la informacin. Dos de ellas mencionables y que sirven a modo de ejemplo son TheyWorkForYOU y FixMyStreet. La primera se traduce como EllosTrabajanParaT y es un portal que, aprovechando la ley de acceso a la informacin britnica crea una plataforma para que fcilmente un ciudadano sepa todo aquello que hay disponible sobre sus representantes polticos en el Parlamento. Desde qu leyes votaron a favor o en contra, hasta qu preguntas hicieron en las intervenciones parlamentarias y dems. La segunda se traducira como ArreglaMiCalle y es una aplicacin de la misma organizacin civil britnica que cre la anterior y se llama MySociety. Esta permite notificar sobre problemas en un radio determinado para solicitar la intervencin del ayuntamiento y no slo eso, sino que es posible ver cules de todos los problemas denunciados fueron resueltos y tambin pueden recibirse notificaciones de cuando se denuncian problemas en el cdigo postal de inters. Dicha aplicacin es de cdigo abierto y se ha aplicado en otros pases. 5.1 OPEN DATA Y EL PERIODISMO
53
Si tanta informacin abierta al pblico tiene un valor agregado a nivel ciudadano tambin lo tiene a nivel periodstico. Y ah es donde entra la funcin del periodismo y, especialmente, del Periodismo de Datos que se vio potenciado con el movimiento de datos abiertos. No porque necesitara de este para afirmarse como tendencia, sino porque hizo crecer la cantidad de fuentes de informacin oficiales. Wikileaks tambin ha sentado un precedente en lo que refiere a informacin disponible al pblico. Sus documentos no se consiguieron de manera legal pero dieron relevancia a la necesidad de una apertura de datos y de normas que avalen esta. Pero es sobre todo la informacin pblica abierta la que ya continuar dando lugar a la elaboracin de noticias. Claro que no toda ni siempre, pues puede simplemente haber informacin de carcter pblico que no interesa. He ah tambin parte del trabajo adicional del periodista o documentalista ms all de lo que podra mirar un ciudadano comn y buscar entre el montn de informacin aquella historia que ser de inters en los medios. Luego quedar buscar la manera de comunicarla, conectndola e interpretndola procurando siempre dejar libre el acceso a la fuente de informacin original. 5.2 ESPAA En Europa, Espaa es de los pocos pases que no cuenta con una Ley de Acceso a la Informacin. Los otros son Chipre, Luxemburgo y Malta. Es decir, es el nico pas de la regin con ms de un milln de habitantes que no tiene esta legislacin. La Ley de Transparencia, Acceso a la Informacin Pblica y Buen Gobierno es todava un proyecto si bien su texto ha sido aprobado por el Consejo de Ministros el pasado 27 de julio. Antes de ello hubo una consulta abierta para los ciudadanos que quisieran aportar algo, aunque esta consulta irnicamente no fue transparentada y se desconoce si se tuvo en cuenta o no. Sobre su texto ha dicho la experta Helen Darbishire, directora ejecutiva de Access Info Europe que es insuficiente, poco progresista y est por debajo de los estndares internacionales, a raz de que no se considere el derecho a saber como un derecho fundamental, asociado a la libertad de expresin y a la calidad democrtica (GARCA GMEZ, 2012) Constitucionalmente lo que est contemplado es el derecho a la informacin (artculo 20) y el acceso a los archivos y registros administrativos (artculo 105). Sin embargo, una ley que desarrolle el libre acceso no ha sido formulada e incluso el derecho a la informacin se encuentra con numerosos
54
obstculos, sobre todo de los que devienen de la Ley Orgnica de Proteccin de Datos (LOPD) pues suele anteponerse el derecho a la privacidad. Entonces, si bien a nivel de las comunidades autnomas s hay iniciativas en orden a un gobierno abierto a nivel Estado hasta ahora slo hubo aproximaciones a una ley de acceso a la informacin A nivel autonmico las iniciativas ya sancionadas son las siguientes: Ley Foral de la Transparencia y del Gobierno Abierto de la Comunidad de Navarra: aprobada en 2012, y con una propuesta muy ambiciosa para la participacin ciudadana. A su respecto dijo Helen Darbishire (2012), directora de Access Info Europe: "Esta es una ley muy fuerte, a la altura de las mejores leyes de acceso a la informacin del mundo. De hecho esta ley va ms lejos incorporando principios datos abiertos y participacin ciudadana al concepto de Gobierno Abierto". Open Data Euskadi: sitio web a cargo del Gobierno Vasco donde se alojan los documentos abiertos, con informacin reutilizable a disposicin de cualquier ciudadano. Principado de Asturias: Catlogo de Datos Asturias, pionero en las iniciativas de gobierno abierto de Espaa. Catalua: Datos Abietos GenCat, de la Generalitat de Catalunya. Xunta de Galicia: portal Open Data, para la reutilizacin de informacin pblica
Lo que es posible en Espaa es la reutilizacin de contenidos ya pblicos siendo una gran fuente de informacin los Boletines Oficiales del Estado. La dificultad de estos reside en su lectura ya que en los sitios estatales donde se alojan se encuentran en formato PDF que exige herramientas especficas y tiempo para extraer los datos. Adems, sobre Espaa es posible encontrar informacin a nivel de la Unin Europea que tiene ms polticas de datos abiertos. La Unin Europea lanz en diciembre de 2011 una estrategia Open Data para Europa que establece normas para un mejor uso de la informacin en manos de los gobiernos. Se trata de un borrador de ley que pretende abrir una importante fuente de informacin pblica en sectores varios como el cientfico, el gubernamental, geogrfico, de diferentes administraciones, etctera. Asimismo existen en Espaa iniciativas para promover la apertura de datos que parten del mbito civil. Entre ellas: Access Info Europe. Organizacin dedicada a promover el derecho a la informacin en Espaa y el resto del mundo.
55
Tuderechoasaber.es Plataforma para hacer solicitud de informacin a instituciones pblicas.
5.3 FORMATO El hecho de que los documentos de carcter pblico estn a disposicin de quien as lo quiera no es suficiente. De all que el concepto de Open Data tambin hace alusin al formato en que esta informacin es presentada. Pues, es conocido el problema que significa recolectar datos relevantes de archivos PDF, uno de los ms comunes. Es de destacar la iniciativa de Sun Microsystems que desarroll el formato de documento abierto ODF (OpenDocumentFormat) en 2006 con la intencin de crear un formato libre que funcionara con distintos sistemas operativos, es decir, que fuera interoperable. As es que numerosas iniciativas de datos abiertos lo han adoptado para facilitar la lectura de la informacin a publicar. 6.CONCLUSIN El Periodismo de Datos no es algo estrictamente nuevo pero el contexto de abundancia de informacin actual ha hecho que en los ltimos aos su prctica se disparara, se diversificara y se facilitara. Pero no es solamente la cantidad lo que ha intervenido en su potenciamiento, tambin ha sido responsable la concientizacin sobre librar la informacin para uso y desuso de los usuarios, sean estos periodistas o no. Adems, la aparicin constante de herramientas que facilitan el acceso y la comunicacin de datos que de otra manera resultaran complejos de interpretar, ha contribuido tambin a perfeccionar y extender esta forma de comunicacin. Desde aplicaciones masivas como las de Google Fusion Tables para la gestin y visualizacin de datos hasta otras ms especficas como Scraperwiki para la extraccin de datos. El especialista en Documentacin debe conocer tambin esta faceta periodstica de las diferentes bases de datos y fuentes de informacin con las que trabaja constantemente para poder ayudar en el proceso de su comunicacin a travs de medios de difusin, en caso de que sea de inters. Y el Periodismo de Datos, sobre todo para temas de gran envergadura o que exigen la revisin de pesadas fuentes de informacin, tiene la particularidad de combinar diferentes talentos en orden a un mejor resultado. Consideramos que, puesto que no es comn que se d el caso de un periodista con habilidades para programar, para realizar estadsticas, para investigar temas que no sean de su especialidad, para manejar bases de datos, para realizar infografas, etctera el Periodismo de Datos se trata de una forma
56
de periodismo idnea para el trabajo en equipo donde confluyen distintas especialidades entre las que no debe quedar fuera la del documentalista. En cuanto a su divulgacin acadmica, el Periodismo de Datos todava no es una materia muy presente en programas de formacin, siquiera de Periodismo, por lo que tampoco ocupa un lugar fundamental en el rea de Documentacin. Sin embargo, el fenmeno se va imponiendo por su fuerza e influencia por lo que se espera que en los prximos aos su aproximacin acadmica se potencie y precisamente este trabajo de fin de Mster es un intento de agilizar este proceso. Y as como hay cada vez ms acceso a bases de datos que antes era impensable que estuviesen disponibles para cualquiera, es cierto que el Periodismo de Datos alcanzara una mayor expresin con una ley de acceso a la informacin pblica o de transparencia que no ponga trabas cuando se necesita tal o cual dato. Y este escollo est presente todava en muchsimos pases, incluido entre ellos Espaa con una ley encaminada, pero una ley que no reconoce el acceso a la informacin pblica como un derecho inherente a la libertad de expresin, sino como una norma. Este mismo anteproyecto de ley de transparencia encuentra contradicciones con la anterior ley orgnica de proteccin de datos. Entonces, por ejemplo, sera posible acceder a cierta informacin de carcter pblico pero no sera legal difundirla a travs un medio de difusin por si posible violacin al derecho a la privacidad. As pues, lo ms comn es que un trabajo de Periodismo de Datos se base en fuentes pblicas y accesibles. Pues puede darse el caso de que haya pases que cuenten con normas para el acceso a la informacin pero cuando esta se solicita ponen trabas o no las presentan en formatos legibles e interoperables, lo que puede complejizar el trabajo de su lectura. Eso s, segn recomienda Jos Luis Dader (2012), los datos incrustados sin ms en una informacin, a partir de la iniciativa de fuentes externas no constituyen una transformacin sustancial del Periodismo convencional. Bajo su perspectiva ello tendr valor en la medida en que aporte una diferencia apreciable frente al periodismo de narracin episdica y enfoque dramatstico (infoentretenimiento). Es decir, ir por aquella informacin por la que el ciudadano no ira por motu proprio o encontrar en ella lo que no podra verse a primera vista en una larga lista de datos. En cuanto a la sobreabundancia de informacin, esta no es nueva. Ya en 1970 Alvin Toffler hablaba de information overload (sobrecarga de informacin) en su libro Future Shock.
57
Incluso hasta podramos remontarnos a los aos que siguieron a la invencin de la imprenta y la anecdtica queja del tologo Juan Calvino que en 1550 hablaba de que haba tantos libros que ni tiempo tena de leer los ttulos. As es que, si tanto el Periodismo de Datos en s no es nuevo o si la gran cantidad de datos (Big Data) tampoco lo es, no se trata de una revolucin en la forma de comunicar. Sin embargo, las circunstancias actuales de las tecnologas de la informacin y la necesidad de informarse reclaman un reconocimiento a las nuevas caractersticas del tipo de periodismo que trabaja con datos. Por ello, este trabajo pretende ser un llamado de atencin para documentalistas, especialmente para aquellos que trabajan directamente en medios de comunicacin y tambin para otros profesionales de los medios. Pues el Periodismo de Datos brinda la oportunidad de una lectura ms objetiva y diferente de la actualidad, basndose en las mltiples herramientas disponibles, tanto para su produccin como para su lectura. Puede incluso ser la oportunidad para que el periodismo tradicional se reinvente a s mismo y encuentre el potencial de la comunicacin y visualizacin de los datos, derivados de fuentes abiertas o recopilados por otros medios. 7. ANEXO 7.1 FRASES
I THINK DATA-DRIVEN JOURNALISM IS ONE OF THE BIG POTENTIAL GROWTH AREAS IN THE FUTURE OF JOURNALISM (). IN FACT, I BELIEVE IT IS JOURNALISM IN ITS TRUEST ESSENCE: UNCOVERING AND MINING THROUGH INFORMATION THE PUBLIC DO NOT HAVE ENOUGH TIME TO DO THEMSELVES, INTERROGATING IT, AND MAKING SENSE OF IT BEFORE SHARING IT WITH THE AUDIENCE.
Adam Westbrook, autor de Next Generation Journalist. Fuente:European Journalism Centre
ONLY TIME WILL TELL, BUT INFORMATION OUGHT TO HELP DEMOCRACY, NOT HURT IT. WE NEED NEW INSTITUTIONS TO BUILD NEW MEDIA FORMS THAT WILL LET TRUTH STAND OUT FROM THE NOISY BABBLE AND COMMAND ATTENTION BECAUSE THEY are TRUSTED AND COMPREHENDED. NARRATIVE
58
JOURNALISM COMBINED WITH PRECISION JOURNALISM COULD DO THAT JOB. LETS GET STARTED.
Philip Meyer, autor de Precision Journalism. Fuente: Nieman Lab.

ONE OF OUR BIG GOALS IN THE STORYTELLING PROCESS IS TO HUMANIZE THE STATISTICS. ITS HARD FOR PEOPLE TO CARE ABOUT NUMBERS, ESPECIALLY LARGE NUMBERS.
Brian Storm, fundador de Mediastorm. Fuente: European Journalism Centre.
"DATA JOURNALISM" IS NOT ALWAYS PRESENTING THE DATA *AS* JOURNALISM. IT'S ALSO FINDING THE JOURNALISM WITHIN THE DATA.
Jay Rosen, profesor de Periodismo en la Universidad de Nueva York. Fuente: Twitter. 7.2 BIBLIOGRAFA 7.2.1 BIBLIOGRAFA INTRODUCCIN A LA INVESTIGACIN BOUNEGRU, Liliana. Data Journalism in Perspective. En GRAY, Jonathan; CHAMBERS, Lucy; BOUNEGRU, Liliana (ed) The Data Journalism Handbook. Estados Unidos. O'Reilly Media. 2012. Disponible en: http://datajournalismhandbook.org/1.0/en/introduction_4.html. [Consulta: 2 febrero 2012].
CORDN GARCA, J.A; ALONSO ARVALO, J.; GMEZ DAZ, R. Y LPEZ LUCAS, J. Las
Nuevas fuentes de informacin: informacin y bsqueda documental en el contexto de la web 2.0. Madrid. Pirmide. 2012. DADER, Jos Luis. Periodismo de precisin. Va socioinformtica de descubrir noticias. Espaa: Editorial Sntesis. 1997. EGIDO, Moiss. Se desarrolla el Periodismo de precisin. Telos N 45. Madrid. 1996. P.136- 143. FLORES VIVAR, Jess Miguel y CEBRIN HERREROS, Mariano. El data journalism en la construccin de mashups para Medios digitales. En: SABS TURMO, Fernando y VERN LASSA, Jos Juan (Eds.). El Periodismo digital analizado desde la investigacin procedente del mbito acadmico. XIII Congreso de Periodismo Digital de Huesca 15/16 de marzo 2012. Huesca: Asociacin de la Prensa de Aragn. 2012. P. 215-229.
59
MEYER, Philip. Periodismo de precisin: Nuevas fronteras para la investigacin periodstica. Espaa: Editorial Bosch. 1993. ROGERS, Simon. Facts are Sacred: The power of data. Guardian Shorts. Edicin para Kindle. 2011. ROGERS, Simon. Wikileaks data journalism: how we handled the data [en lnea]. Guardian.go.uk. Enero 2011. Disponible en: http://www.guardian.co.uk/news/datablog/2011/jan/31/wikileaks-datajournalism. [Consulta: 2 febrero 2012]. ROGERS, Simon. Executive Insight [en lnea]. Think Quarterly by Google. Marzo 2011.
Disponible en: http://www.thinkwithgoogle.co.uk/quarterly/data/executive-insight-guy-laurence-ceovodafone.html [Consulta: 14 junio 2012]. 7.2.2 BIBLIOGRAFA PERIODISMO DE DATOS BRADSHAW, Paul. Data journalism pt1: Finding data (draft comments invited) [en lnea]. Online Journalism Blog. Abril 2010. Disponible en: http://onlinejournalismblog.com/2010/04/21/datajournalism-pt1-finding-data-draft-comments-invited. [Consulta: 2 febrero 2012]. BRADSHAW, Paul. One ambassadors embarrassment is a tragedy, 15,000 civilian deaths is a statistic [en lnea]. Online Journalism Blog. Diciembre 2010. Disponible en:
http://onlinejournalismblog.com/2010/12/07/wikileaks-cablegate/ [Consulta: 14 junio 2012]. CAIRO, Alberto. El arte funcional. Infografa y visualizacin de la informacin. Espaa. Alamut. 2011. CAIRO, Alberto. Periodismo de precisin y visualizacin de datos (parte 2) [en lnea]. Periodismo con futuro. Blogs EL PAS. 16 de abril de 2011. Disponible en: http://blogs.elpais.com/Periodismocon-futuro/2011/04/Periodismo-de-precision-y-visualizacion-de-datos-parte-2.html febrero 2012]. CAIRO, Alberto. Los abusos de Guantnamo y una apologa de los infogrficos peligrosos [en lnea]. Periodismo con futuro. Blogs EL PAS. 25 de abril de 2011. Disponible en: http://blogs.elpais.com/Periodismo-con-futuro/2011/04/infograficos-peligrosos.html febrero 2012]. DADER, Jos Luis. "Introduccin. En: MEYER, Philip. Periodismo de Precisin: Nuevas Fronteras para la investigacin periodstica. Barcelona. Bosch. 1993. [Consulta: 15 [Consulta: 2
60
DADER, Jos Luis. Periodismo de precisin. Va socioinformtica de descubrir noticias. Espaa: Editorial Sntesis. 1997. DADER, Jos Luis. Periodismo De Precisin: El Anlisis Matemtico e Informtico Como Vigilancia De Las Estadsticas Sociales y Su Manipulacin Por El Poder. Espaa. 2006. Disponible en: http://www.juntadeandalucia.es:9002/jornadas/jornadas-informacion/ponencias-jornadas-
periodistas/Periodismo-de-Precision.Sevilla06.pdf [Consulta: 5 julio 2012]. DEMERS, David Pearce y NICHOLS, Suzanne. Precision journalism: A practical guide. Estados Unidos: Sage Publications. 1987. DJA nominee of the day: Methadone and the Politics of Pain [en lnea]. Data Driven Journalism. Mayo 2012. Disponible en:
http://datadrivenjournalism.net/featured_projects/DJA_nominee_of_the_day_Methadone_and_the_Pol itics_of_Pain#When:15:37:36Z [Consulta: 20 julio 2012]. FLORES VIVAR, Jess Miguel. Reflexiones, tendencias y perfiles del Periodismo de Datos. Durante: Curso de verano Periodismo de Datos. San Lorenzo del Escorial, Madrid. 2012. GORDON, Richard. Data as journalism, journalism as data. Readership Institute. Noviembre 2007. Disponible en: http://getsmart.readership.org/2007/11/data-as-journalism-journalism-as-data.html
[Consulta: 14 julio 2012]. Hal Varian on how the Web challenges managers [en lnea]. McKinsey Quarterly. Enero 2009. Disponible en:
http://www.mckinseyquarterly.com/Energy_Resources_Materials/Oil_Gas/Hal_Varian_on_how_the_ Web_challenges_managers_2286 [Consulta: 14 junio 2012]. HOLOVATY, Adrian. A Fundamental way newspaper sites need to change [en lnea]. Holovaty.com. Septiembre 2006. Disponible en: http://www.holovaty.com/writing/fundamentalchange/ [Consulta: 14 julio 2012]. How to Shape Your Data [en lnea]. Tableau Public. 7 de abril 2011. Disponible en: http://www.tableausoftware.com/public/blog/2011/04/data-shaping [Consulta: 25 de mayo 2012]. Impartiality: The Foxification of news. The Economist. Julio 2011. Disponible en:
http://www.economist.com/node/18904112?fsrc=scn/tw_ec/the_foxification_of_news [Consulta: 25 de mayo 2012].
61
KANDEL, Sean; PAEPCKE, Andreas; HELLERSTERIN, Joseph y HEER, Jeffrey. Interactive Visual Specification of Data Transformation Scripts. ACM Human Factors in Computing Systems (CHI). 2011. KEENAN, John. Why raw data sites need journalism [en lnea]. Guardian.co.uk. Agosto 2010. Disponible en: http://www.guardian.co.uk/commentisfree/libertycentral/2010/aug/11/raw-data-
journalism-wikileaks [Consulta: 25 de junio 2012]. MCGHEE, Geoff. Journalism in the Age of Data: A Video Report on Data Visualization. [Videoreportaje] Estados Unidos. 2010. Disponible en: http://datajournalism.stanford.edu/ [Consulta: 2 1 junio 2012]. MEYER, Philip. Periodismo de precisin: Nuevas fronteras para la investigacin periodstica. Espaa. Bosch. 1993. MEYER, Philip. Precision Journalism and Narrative Journalism: Toward a Unified Field Theory. Nieman Reports. 2011. Disponible en http://www.nieman.harvard.edu/reports/article-online-
exclusive/100044/Precision-Journalism-and-Narrative-Journalism-Toward-a-Unified-FieldTheory.aspx [Consulta: 14 junio 2012]. NUSSBAUMER, Cole. Data Stories [en lnea]. Think Quarterly by Google. Marzo 2011. Disponible en: http://www.thinkwithgoogle.co.uk/quarterly/creativity/data-stories.html [Consulta: 10 febrero 2012]. REINHARD, Ulrike. A Data State of Mind [en lnea]. Think Quarterly by Google. Marzo 2011. Disponible en: http://www.thinkwithgoogle.co.uk/quarterly/data/hans-rosling-a-data-state-of-
mind.html [Consulta: 25 de junio 2012]. SEGEL, Edward y HEER, Jeffrey. Narrative Visualization: Telling Stories with Data. The IEEE Transactions on Visualization and Computer Graphics.2010. Vol. 16, no. 6, pp. 1139-1148. 7.2.3 BIBLIOGRAFA BIG DATA Y OPEN DATA "All Too Much". The Economist. Vol. 394. Nmero 8671. Seccin especial, pg 5. Febrero 2010. Disponible en: http://www.economist.com/node/15557421 [Consulta: 5 Junio 2012]. Big Data, Big Impact: New Possibilities for International Development. World Economic Forum. Enero 2012. Vital Wave Consulting. Disponible en: http://www.weforum.org/reports/big-data-bigimpact-new-possibilities-international-development [Consulta: 15 de junio 2012].
62
BRITTIN, Matt. Data [en lnea]. Think Quarterly by Google. Marzo 2011. Disponible en: http://www.thinkwithgoogle.co.uk/quarterly/data/note.html [Consulta: 9 Junio 2012]. "Data, Data Everywhere." The Economist. Vol. 394. Nmero 8671. Seccin especial. Febrero 2010. Disponible en: http://www.economist.com/node/15557443 [Consulta: 5 Junio 2012]. It's YouTube's 7th birthday... and youve outdone yourselves, again [en lnea]. YouTube Blog. Mayo 2012. Disponible en: http://youtube-global.blogspot.com.es/2012/05/its-youtubes-7th-birthdayand-youve.html [Consulta: 25 de mayo 2012]. GANTZ, Jhon; REINSEL, David. "The 2011 Universal Digital Study: Extracting value from chaos". IDC research report, sponsored by EMC. Vol. 19. Junio 2011. Disponible en:
http://www.emc.com/collateral/demos/microsites/emc-digital-universe-2011/index.htm [Consulta: 25 de junio 2012]. GARCA GMEZ, Rosario. Donde no hay luz pasan cosas. El Pas. 15 de agosto 2012. Disponible en: http://sociedad.elpais.com/sociedad/2012/08/15/actualidad/1345050724_942894.html [Consulta: 23 de agosto 2012]. JOYANES AGUILAR, Luis. Computacin en la nube. Estrategias de Cloud Computing en las empresas. Edicin Latinoamericana: Mxico. Alfaomega. Edicin Espaola: Barcelona.
Marcombo/Alfaomega. 2012. LORENZ, Mirko. Why Journalists Should Use Data. En GRAY, Jonathan; CHAMBERS, Lucy; BOUNEGRU, Liliana (ed). The Data Journalism Handbook. Estados Unidos. O'Reilly Media. 2012. Disponible en: http://datajournalismhandbook.org/1.0/en/introduction_4.html [Consulta: 25 de mayo 2012]. MCFEDRIES, Paul. The Cloud Is The Computer. IEEE Spectrum. Agosto 2008. Disponible en: http://spectrum.ieee.org/computing/hardware/the-cloud-is-the-computer [Consulta: 23 de julio 2012]. Navarra open government law [en lnea]. Access Info Europe. Madrid, 20 de enero de 2012. Disponible en: http://www.access-info.org/es/coalicion-pro-acceso/215-navarra-open-government-law [Consulta: 23 de agosto 2012]. OPEN GOVERNMENT PARTNERSHIP. Declaracin sobre Gobierno Abierto. Septiembre 2011. Disponible en: http://www.opengovpartnership.org/declaraci%C3%B3n-sobre-gobierno-abierto
[Consulta: 20 de agosto 2012].
63
Pattern-Based
Strategy
IT
Research
Report.
Gartner
Inc.
Disponible
en:
http://www.gartner.com/technology/research/pattern-based-strategy/ [Consulta: 25 de junio 2012]. Special: Big Data. Nature. Vol. 455. Nro. 7209. 4 septiembre 2008. Disponible en: http://www.nature.com/news/specials/bigdata/index.html [Consulta: 27 de junio 2012]. The Petabyte Age : Because More Data Isn't just More - More is Different. Wired. 16 julio 2008. San Francisco, Estados Unidos. Disponible en:
http://www.wired.com/science/discoveries/magazine/16-07/pb_intro [Consulta: 25 de julio 2012]. UNESCO. Proyecto revisado de estrategia sobre la contribucin de la UNESCO a la promocin del libre acceso a la informacin y la investigacin cientficas. Pars. Agosto 2011. Disponible en: unesdoc.unesco.org/images/0021/002133/213342s.pdf [Consulta: 20 de agosto 2012]. What is Big Data? Bringing Big Data to the Enterprise. IBM. 2012. Disponible en: 01.ibm.com/software/data/bigdata/ [Consulta: 25 de mayo 2012]. http://www-
64

La Relación Del Periodismo de Datos Con Big Data y Open Data

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Relación Del Periodismo de Datos Con Big Data y Open Data

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD CARLOS III DE MADRID FACULTAD DE HUMANIDADES COMUNICACIN Y DOCUMENTACIN DEPARTAMENTO DE BIBLIOTECONOMA Y DOCUMENTACIN Mster en Investigacin en Documentacin 2011/2012

Trabajo de Fin de Mster

LA RELACIN DEL PERIODISMO DE DATOS CON BIG DATA Y OPEN DATA

Autora: ngeles Mario Tutor: Dr. Luis Joyanes Aguilar

CONTENIDO 1.INTRODUCCIN A LA INVESTIGACIN ....................................................................... 5

1.6.1 LA WEB 2.0 EN MI TRABAJO DE INVESTIGACIN ................................................................ 12 2.PERIODISMO DE DATOS .................................................................................................. 13

2.5.2 NECESIDAD DE ORDENAR ................................................................................................... 26 2.5.3 TRABAJO EN GRUPO ........................................................................................................... 27

4.BIG DATA .............................................................................................................................. 44

5.OPEN DATA (DATOS ABIERTOS) ................................................................................... 52

6.CONCLUSIN ....................................................................................................................... 56 7. ANEXO .................................................................................................................................. 58

ILUSTRACIN 2 "LESS WIND, LOTS OF DAMAGE". FUENTE: CUENTA DE FLICKR HTTP://WWW.FLICKR.COM/PHOTOS/JUGGERNAUTCO/SETS/72157607210036175/DETAIL/

Ilustracin 5 THE INVERTED PYRAMID OF DATA JOURNALISM. FUENTE: ONLINEJOURNALISMBLOG.COM

Grupos de presin y organizaciones sociales Empresas Los medios comunicacin

Ver apartado sobre Open Data. 38

mapas a partir del anlisis de bases de datos.

mapas y globos en 3D.

su utilizacin en Sistema de Informacin Geogrfica (SIG).

informacin de una pgina web y convertirla en una base de datos.

3.3 LENGUAJE DE SCRIPTS

3.4 MANEJO DE BASES DE DATOS

OPENOFFICECALC: tiene la misma finalidad que MicrosoftExcel aunque es de cdigo abierto y

3.5 VISUALIZACIN DE DATOS

3.8 OTRAS HERRAMIENTAS

Tuderechoasaber.es Plataforma para hacer solicitud de informacin a instituciones pblicas.

Adam Westbrook, autor de Next Generation Journalist. Fuente:European Journalism Centre

Philip Meyer, autor de Precision Journalism. Fuente: Nieman Lab.

Brian Storm, fundador de Mediastorm. Fuente: European Journalism Centre.

http://www.economist.com/node/18904112?fsrc=scn/tw_ec/the_foxification_of_news [Consulta: 25 de mayo 2012].

[Consulta: 20 de agosto 2012].

También podría gustarte