Documentos de Académico
Documentos de Profesional
Documentos de Cultura
“La ciencia de datos es la disciplina de hacer que los datos sean útiles”
Minería de datos
Si aún no sabes qué decisiones quieres tomar, lo mejor que puedes hacer es salir en busca de
inspiración para poderlas descubrir. Esto se conoce como análisis de datos o analítica o
analítica descriptiva o análisis de datos exploratorio (EDA en inglés) o descubrimiento del
conocimientos (KD en inglés), dependiendo de gustos y colores. Y contrario a lo que dice el
refrán, de esto si han escrito mucho los autores.
Regla de oro de la analítica: solo saca conclusiones de lo que puedes ver.
Comienza aquí, a menos que ya sepas cómo estructurar tu toma de decisiones. La buena
noticia es que esto es fácil. Piensa en tu conjunto de datos como un grupo de fotos en negativo
que las encontraste en un cuarto oscuro de revelado. La extracción de datos consiste en utilizar
los equipos para revelar las fotos lo más rápido posible, para que puedas ver si hay algo
inspirador o interesante en ellas. Al igual que con las fotos, recuerda no tomarte en serio lo que
ves. Tú no tomaste las fotos, así que no sabes mucho sobre las historias que hay detrás de
ellas. La regla de oro de la minería de datos es: enfocarse en lo que está aquí. Solo saca
conclusiones acerca de lo que puedes ver, nunca a cerca de lo que no puedes ver (para eso
necesitas estadísticas y mucha más experiencia).
La experiencia en minería de datos es juzgada por la velocidad con la que puedes examinar
los datos.
El cuarto oscuro de revelado es intimidante al principio, pero no se puede hacer mucho al
respecto. Solo aprender a utilizar bien el equipo de revelado. Aquí hay un tutorial en R y aquí
en Python para comenzar. Puedes llamarte a ti mismo un “analista de datos” tan pronto como
empieces el trabajo, y puedes llamarte un “analista experto” cuando puedas revelar las fotos (y
todos los demás tipos de conjuntos de datos) a la velocidad de un rayo.
Inferencia estadística
La inspiración es barata, pero el rigor es caro. Si quieres llegar más lejos con los datos,
necesitarás capacitación especializada. Teniendo yo un bachillerato y posgrado en estadística,
pueda que mi opinión esté un poco parcializada, pero creo que la inferencia estadística (las
estadísticas para abreviar) es de las tres áreas, la más difícil y cargada de filosofía. Llegar a ser
bueno en esto, lleva más tiempo.
La inspiración es barata, pero el rigor es caro.
Si quieres tomar decisiones importantes, de alta calidad, y con riesgo controlado, que se basen
en conclusiones sobre el mundo más allá de los datos disponibles, tendrás que agregar
habilidades estadísticas a tu equipo. Un buen ejemplo es el momento en el que tu dedo está
dando vueltas alrededor del botón de inicio de un sistema de Inteligencia Artificial (AI) y te
viene a mente que debes verificar que funcione correctamente antes de apretarlo (siempre es
una buena idea, en serio). Aléjate del botón y llama al estadístico.
La estadística es la ciencia de cambiar tu mente (cuando hay incertidumbre).
Ingeniería de datos
¿Qué hay de la ingeniería de datos, que es el primero en entregar datos al equipo de ciencia de
datos? Como es un campo sofisticado, prefiero protegerlo de las aspiraciones hegemónicas de
la ciencia de datos y además, está mucho más cerca de la ingeniería de software que de las
estadísticas.
La diferencia entre la ingeniería de datos y la ciencia de datos es la diferencia del antes y
el después.
Siéntete libre de ver la diferencia entre la ingeniería de datos y la ciencia de datos como
un antes y después. La mayor parte del trabajo técnico que conduce al nacimiento de los datos
(antes) puede llamarse “ingeniería de datos” y todo lo que hacemos cuando llegan algo de
datos (después) es “ciencia de datos”.
Las políticas públicas constituyen una de las herramientas que le permite al Estado visibilizar
las acciones encaminadas a desarrollar programas y proyectos que tienen como finalidad
focalizar las demandas poblacionales con el objetivo de mitigar unas determinadas
necesidades. Estas acciones están enmarcadas bajo un concepto de sinergia participativa a
través de la gobernanza definida por Nohlen (2004) como la interacción entre gobernantes y
gobernados, entre capacidades de Gobierno y demandas políticas del Gobierno. (Sánchez)