Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Iit 14 153a
Iit 14 153a
Iit 14 153a
Un nuevo paradigma
de análisis de datos
There was five exabytes of Palabras clave: cálculo distribuido, Key words: data mining, distributed
information created between the conjuntos de datos masivos, estadísti- computing, massive datasets, statistics.
dawn of civilization through ca, minería de datos.
2003, but that much information Abstract:
is now created every two days, Resumen: An unquestionable fact is the vast
and the pace is increasing.
En nuestros días, es un hecho in- amount of information that each second
Eric Schmidt, former CEO cuestionable la ingente cantidad de is now generated on our planet. This in-
of Google, 2010 información que se genera cada se- formation can be structured, semi-struc-
gundo en nuestro planeta. Dicha in- tured or unstructured. It can also bring
formación puede ser estructurada, tremendous value to any entity or may
semiestructurada o no estructurada. lead to undue consumption of human or
También puede aportar enorme valor computing resources. Intelligent analysis
a cualquier entidad o puede suponer (generally in real time) of this informa-
un consumo excesivo de recursos hu- tion is becoming absolutely undeniable
manos, informáticos, etc. for the survival of many companies and
El análisis inteligente (y la mayoría organizations. As a result demand for
de las veces en tiempo real) de este the so-called “data scientist” is growing
Carlos Maté Jiménez tipo de información está empezando exponentially and new concepts like big
Profesor Propio de la ETSI (ICAI) de la Universidad a ser un requisito innegable para la su- data, Mapreduce, Hadoop or cloud com-
Pontificia Comillas de Madrid, adscrito al Departa- pervivencia de muchas empresas y or- puting have emerged.
mento de Organización Industrial y al Instituto de ganizaciones. Como consecuencia de This article presents an informative in-
Investigación Tecnológica (IIT). Doctor en Ciencias ello han surgido en los últimos años troduction to all these terms and analy-
Matemáticas y diplomado en Ciencias Económicas términos de nuevo cuño como big zes the best known structures for the
y Empresariales por la Universidad Complutense. data, Mapreduce, Hadoop o compu- treatment of big data, as well as legal
Actualmente imparte las asignaturas de Análisis de tación en la nube. Así, la demanda de and ethical issues.
Datos, Economía y Gestión de Empresas y Estadísti- los llamados “científicos de datos” está
ca. Reconocido experto en predicción y en análisis creciendo exponencialmente.
de datos simbólicos, ha escrito varios libros sobre Este artículo plantea una introduc-
Estadística y publicado diversos artículos sobre ción divulgativa a todos estos térmi-
aplicaciones de los métodos estadísticos en pres- nos y analiza las estructuras más co-
tigiosas revistas internacionales y nacionales, tanto nocidas para el tratamiento de los big
del ámbito industrial, informático y de organización data, así como las cuestiones legales
como del económico. y éticas.
Sistema
Nombre Símbolo Ejemplo 2014 estático Ejemplo 2014 dinámico
internacional
Byte B 100 bytes 1 B es un número de 0 a 255
Fuente: http://www.infosun.fim.unipassau.de/cl/MapReduceFoundation/