Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Un nuevo paradigma
de análisis de datos
There was five exabytes of Palabras clave: cálculo distribuido, Key words: data mining, distributed
information created between the conjuntos de datos masivos, estadísti- computing, massive datasets, statistics.
dawn of civilization through ca, minería de datos.
2003, but that much information Abstract:
is now created every two days, Resumen: An unquestionable fact is the vast
and the pace is increasing.
En nuestros días, es un hecho in- amount of information that each second
Eric Schmidt, former CEO cuestionable la ingente cantidad de is now generated on our planet. This in-
of Google, 2010 información que se genera cada se- formation can be structured, semi-struc-
gundo en nuestro planeta. Dicha in- tured or unstructured. It can also bring
formación puede ser estructurada, tremendous value to any entity or may
semiestructurada o no estructurada. lead to undue consumption of human or
También puede aportar enorme valor computing resources. Intelligent analysis
a cualquier entidad o puede suponer (generally in real time) of this informa-
un consumo excesivo de recursos hu- tion is becoming absolutely undeniable
manos, informáticos, etc. for the survival of many companies and
El análisis inteligente (y la mayoría organizations. As a result demand for
de las veces en tiempo real) de este the so-called “data scientist” is growing
Carlos Maté Jiménez tipo de información está empezando exponentially and new concepts like big
Profesor Propio de la ETSI (ICAI) de la Universidad a ser un requisito innegable para la su- data, Mapreduce, Hadoop or cloud com-
Pontificia Comillas de Madrid, adscrito al Departa- pervivencia de muchas empresas y or- puting have emerged.
mento de Organización Industrial y al Instituto de ganizaciones. Como consecuencia de This article presents an informative in-
Investigación Tecnológica (IIT). Doctor en Ciencias ello han surgido en los últimos años troduction to all these terms and analy-
Matemáticas y diplomado en Ciencias Económicas términos de nuevo cuño como big zes the best known structures for the
y Empresariales por la Universidad Complutense. data, Mapreduce, Hadoop o compu- treatment of big data, as well as legal
Actualmente imparte las asignaturas de Análisis de tación en la nube. Así, la demanda de and ethical issues.
Datos, Economía y Gestión de Empresas y Estadísti- los llamados “científicos de datos” está
ca. Reconocido experto en predicción y en análisis creciendo exponencialmente.
de datos simbólicos, ha escrito varios libros sobre Este artículo plantea una introduc-
Estadística y publicado diversos artículos sobre ción divulgativa a todos estos térmi-
aplicaciones de los métodos estadísticos en pres- nos y analiza las estructuras más co-
tigiosas revistas internacionales y nacionales, tanto nocidas para el tratamiento de los big
del ámbito industrial, informático y de organización data, así como las cuestiones legales
como del económico. y éticas.
Sistema
Nombre Símbolo Ejemplo 2014 estático Ejemplo 2014 dinámico
internacional
Byte B 100 bytes 1 B es un número de 0 a 255
Fuente: http://www.infosun.fim.unipassau.de/cl/MapReduceFoundation/