Está en la página 1de 7

Analisis de datos

Presentación del análisis computacional de datos

Los datos nos ayudan a tomar decisiones en la vida cotidiana y en los negocios.
Aprenderemos como un analista de datos utiliza el analisis de datos y las herramientas
de su comercio para informar esas decisiones.

Learning objectives

Definir conceptos claves, analizar el uso de datos en decisiones de la vida cotidiana,


identificar caracteristicas clave del entorno de aprendizaje, describir principios y
practicas q ayuden a aumentar las probabilidades de éxito en este certificado, explicar
el uso de datos en la toma de decisiones organizativas, describir conceptos claves q se
analizaran en el programa.

MODULO 1

Iniciación, descripción del programa y plan de estudios

Q tienen en común las empresas de comercio electrónico, entretenimiento, atención


medica, finanzas y cientos de otras industrias? TODAS utilizan datos. Las
organizaciones de todo tipo necesitan analistas de datos para mejorar sus procesos,
identificar oportunidades y tendencias, lanzar nuevos productos, proporcionar un buen
servicio y tomar decisiones bien pensadas.
Q son exactamente los datos?
Los datos son una colección de hechos. Esta colección puede incluir números,
imágenes, videos, palabras, mediciones, observaciones y mas. Una vez q se tienen los
datos, se analizan. El análisis de datos es la recopilación, transformación y organización
de los datos para sacar conclusiones, hacer predicciones e impulsar una toma de
decisiones fundamentada. Además, los datos evolucionan con el tiempo, lo q significa q
este análisis o analítica, puede darnos una nueva info a lo largo de todo el ciclo de vida
de los datos.
Los datos están en todos lados, por ejemplo, monitorear el total de pasos del día, una
reseña de un producto antes de comprarlo. También se crean enormes cantidades todos
los días. Cada vez q uno usa el teléfono, busca algo en linea, compra con una tarjeta de
crédito, usa el GPS para mapear una ruta o publicar algo en redes sociales, se están
creando datos.
Q hace exactamente un analista de datos?
Básicamente, un analista de datos, es alguien q colecciona, transforma y organiza datos
con el fin de ayudar a tomar decisiones fundamentadas. Además de su rol en si, una de
las partes mas emocionantes es la cantidad de oportunidades disponibles. Hay tanta
demanda q es mayor q la cantidad de persona calificadas para ocupar las vacantes.
Preparación para el trabajo
A diario, la cantidad de datos aumenta cada vez mas. Por lo tanto es importante tener la
capacidad de interpretarlos eficazmente. El análisis computacional de datos se esta
convirtiendo en una de las opciones mas gratificantes y de crecimiento mas rápido del
mundo.
A nivel mundial, empresas de todo tipo necesitan analistas de datos calificados para
resolver problemas y le ayuden a tomar mejores decisiones comerciales posibles.
Registro de aprendizaje: Piensa en los datos de la vida cotidiana

*A lo largo del curso, se va a pedir que se hagan entradas en un registro de aprendizaje,


un espacio personal para hacer un seguimiento de ideas y reflexiones sobre nuestra exp.
Pueden incluir lo q nos gusto, lo q cambiaríamos y las preguntas q se plantearon.
Datos cotidianos
Antes de escribir una entrada en el registro, pensar donde y como usamos los datos para
tomar decisiones. Crearemos una lista de al menos 5 preguntas con datos para
responder:
Cuantas horas duermo por día?
Cuanto tiempo dedico entrenando?
Obtencion certificado

 Aprobar todas las tareas obligatorias o alcanzar el umbral de aprobación del


curso. Cada tarea con calificación cuenta para el puntaje acumulado, y cada
certificado de Google Data Analytics se aprueba con un 80%.

Caso practico: Nuevas perspectivas de datos

El análisis de personas es la práctica de recopilar y analizar datos sobre las personas que
conforman la fuerza laboral de una empresa con el fin de obtener información para
mejorar su funcionamiento. Ser analista de personas implica utilizar el análisis de datos
para obtener información sobre los empleados y cómo viven su vida laboral. El
conocimiento se utiliza para definir y crear un lugar de trabajo más productivo y
empoderador. Esto puede liberar el potencial de los empleados, motivar a las personas a
rendir al máximo y garantizar una cultura empresarial justa e inclusiva.
Los 6 pasos del proceso de análisis de datos son: preguntar, preparar, procesar, analizar,
compartir y actuar.
En este caso practico, una organización estaba teniendo una alta tasa de rotación entre
los nuevos empleados. Muchos empleados abandonaron la empresa antes del final de su
primer año de trabajo. Los analistas utilizaron el proceso de análisis de datos para
responder la siguiente pregunta: ¿Cómo puede la organización mejorar la tasa de
retención de los nuevos empleados?
PREGUNTAR
En primer lugar, los analistas necesitaban definir como seria el proyecto y q calificaría
como resultado exitoso. Por lo tanto, para determinar estos elementos, hicieron
preguntar efectivas y colaboraron con lideres y gerentes interesados en el resultado del
análisis de personas. Estas fueron algunas preguntas q hicieron:

 ¿Qué crees que necesitan aprender los nuevos empleados para tener éxito en su
primer año de trabajo?
 ¿Has recopilado datos de nuevos empleados antes? Si es así, ¿podemos tener
acceso a los datos históricos?
 ¿Crees que los gerentes con tasas de retención más altas ofrecen a los nuevos
empleados algo adicional o único?
 ¿Cuál sospechas que es una de las principales causas de insatisfacción entre los
nuevos empleados?
 ¿En qué porcentaje te gustaría que aumente la retención de empleados en el
próximo ejercicio económico?
PREPARAR
Todo comienza con una preparación solida. El grupo creo un cronograma de 3 meses y
decidió como quería transmitir el avance a las partes interesadas. También, los analistas
identificaron q datos necesitaban para lograr el resultado exitoso q identificaron en el
paso anterior, los analistas optaron por recopilar los datos de una encuesta en linea de
nuevos empleados. Desarrollaron preguntas especificar acerca de la satisfacción de los
empleados y su compensación general. Se establecieron reglas respecto de quien tendría
acceso a los datos recopilados (personas ajenas al grupo no tenían acceso a los brutos,
sino a datos resumidos o combinados) Y para finalizar, determinaron q info especifica
se recopilaría y la mejor manera de presentar los datos visualmente. También se
evaluaron posibles problemas y como evitarlos.
PROCESAR
El grupo envió la encuesta. Dado q los empleados proporcionaron los datos, es
importante asegurarse de todos dieran su consentimiento. Los analistas también se
aseguraron de q los empleados entendieran como se recopilarían, almacenarían,
gestionarían y protegerían sus datos. Con el fin de mantener confidencialidad y proteger
y almacenar los datos de manera efectiva, el acceso se otorgo a numero limitado de
analistas. El uso ético de los datos es una de las responsabilidad q tiene un analista.
Luego, se limpiaron los datos para garantizar q estuvieran completos, fueran correctos y
pertinentes. Algunos datos se agregaron y resumieron sin revelar respuestas
individuales. Los datos sin procesar se cargaron en un almacén de datos interno para
obtener una seguridad adicional.
ANALIZAR
Luego se hizo lo q mejor saben hacer... analizar. A partir de las encuestas, los analistas
descubrieron q los empleados q experimentaron un largo y complicado proceso de
contratación tenían mas probabilidades de abandonar la empresa. Y es mas probable q
los hayan experimentado un proceso de evaluación con comentarios eficientes y
transparentes permanezcan en la empresa. El grupo sabia q era importante documentar
exactamente lo q se había encontrado, sin importar los resultados. Hacer lo contrario
disminuiría la confianza en el proceso de encuesta y reduciría la capacidad de recopilar
datos veraces.
COMPARTIR
Así como aseguraron los datos correctamente, también compartieron cuidadosamente el
informe. Solo los gerentes q cumplieron o superaron el numero mínimo de
colaboradores directos con respuestas a la encuesta eran elegibles para recibir el
informe. El grupo presento los resultados a los gerentes elegibles para asegurarse de q
tuvieran el panorama completo. Luego, pidieron q entregaran los resultados a los
equipos. Dando la oportunidad de comunicar los resultados con el contexto correcto, y
así tener conversaciones de equipo productivas sobre los próximos pasos a mejorar.
ACTUAR
La ultima etapa fue trabajar con los lideres de la empresa y decidir cual era la mejor
manera de implementar los cambios y tomar medidas basadas en los hallazgos. Los
analistas recomendaron estandarizar el proceso de contratación y evaluación de todos
los nuevos empleados y basarse en practicas mas eficientes y transparentes. Un año
después, se distribuyo la misma encuesta, los analistas anticiparon q una comparación
indicaría q el plan de acción funciono. Resultando en una mejora de la tasa de retención
de nuevos empleados y las acciones tomadas fueron exitosas.
Dimensiones de la analítica de datos
La ciencia de datos, la disciplina de hacer útiles los datos, es un termino general q
abarca 3 disciplinas: aprendizaje automático, estadísticas y análisis. (machine learning,
statistics, analitycs)
Están separadas por cuantas decisiones sabes q queres tomar antes de empezar con ellas.
Si uno quiere tomar decisiones importantes con incertidumbre, es estadística. Si uno
quiere automatizar, ósea, tomar muuuchas decisiones con incertidumbre, es aprendizaje
automático e IA. Pero, si uno no sabe cuantas decisiones quiere tomar antes de empezar,
y busca inspiración, entender el mundo, es análisis.

Que es el ecosistema de datos?

En pocas palabras, un ecosistema es un grupo de elementos q interactúan uno con el


otro. Pueden ser grandes, o diminutos. Los datos, viven en su propio ecosistema. Los
ecosistemas de datos se componen de varios elementos q interactúan entre si para
producir, gestionar, almacenar, organizar, analizar y compartir datos. Estos elementos
incluyen hardware y herramientas de software y las personas q los usan. Los datos
también se pueden encontrar en la nube. Es un lugar para mantener los datos en linea,
en lugar de en el disco duro de una computadora. Accediendo a los datos a través de
Internet. Básicamente es un termino para describir la ubicación virtual. Esta, desempeña
un papel importante en el ecosistema de datos, y como analista, es importante
aprovechar el poder del ecosistema, buscar la info correcta y proporcionar análisis al
equipo q los ayude a tomar decisiones inteligentes. Por ejemplo, se puede aprovechar la
base de datos de una tienda minorista q es un ecosistema de nombres de clientes,
direcciones, compras anteriores y opiniones de clientes. Se puede usar esta info para
predecir lo q estos clientes comprarían a futuro y asegurarse q la tienda los tenga cuando
se necesiten.
Claramente un ecosistema no solo sirve para tiendas u oficinas, pueden funcionar en
granjas también como las empresas agrícolas q los usan para incluir info como patrones
geológicos en los movimientos climáticos, ayudando a los agricultores a predecir el
rendimiento de los cultivos. Algunos incluso los usan para proteger ecosistemas
ambientales reales. realizando seguimiento de crecimiento de arrecifes y medir
aumentos o disminuciones de colonias, hay posibilidades infinitas.
Vamos a diferenciar ciertas confusiones en esta área. Diferenciemos un analista de datos
y un científico de datos: La ciencia de datos se define como crear nuevas formas de
modelar y entender lo desconocido mediante el uso de datos sin procesar. Crean nuevas
preguntas con los datos, mientas un analista encuentra respuestas a preguntas existentes
y crean info a partir de las fuentes de datos.
Entonces, hay muchas formas diferentes de usar los datos, desde nuestra vida cotidiana
a negocios. Aunque esto es solo una pequeña parte
Una de las formas mas poderosas de usar los datos es al momento de tomar decisiones
basadas en hechos. Este proceso se define como el uso de datos para guiar la estrategia
empresarial. Las organizaciones de distintas industrias tienen el poder de tomar mejores
decisiones basadas en datos gracias a los analistas. El primer paso es descubrir la
necesidad del negocio, generalmente suele ser un problema a resolver. Por ejemplo, una
nueva empresa necesita establecer mejor reconocimiento de marca para competir, o una
organización quiere mejorar un producto y necesita averiguar como obtener piezas u
otro proveedor. Cualquiera sea el problema, una vez definido, el analista encuentra
datos, los analiza y los usa para descubrir tendencias, patrones y relaciones.
Datos e instinto
Los analistas utilizan la toma de decisiones basada en datos y siguen un proceso paso a
paso. (los 6 antes mencionados) Pero hay otros factores q influyen en el proceso de
toma de decisiones.
El instinto es una comprensión intuitiva de algo con poca o ninguna explicación. No
siempre es algo consciente, a menudo captamos señales sin siquiera darnos cuenta.
El centro de la toma de decisiones basada en datos son los datos. Por lo tanto, es
esencial q los analistas de datos se centren en ellos para garantizar q toman decisiones
informadas. Si uno ignora los datos y prefiere tomar decisiones basadas en experiencia,
pueden ser sesgadas, y generar errores.
Datos + conocimiento empresarial= misterio resuelto
Combinar datos con conocimiento empresarial, además de un toque de instinto, será una
parte habitual del proceso como analista de datos junior. La clave es averiguar la
combinación exacta de cada proyecto en particular. Muchas veces, dependerá de los
objetivos del análisis. Por eso los analistas a menudo se preguntan como definir el éxito
del proyecto.
Además, hay q hacerse preguntas sobre un proyecto para encontrar el equilibrio.

 ¿Qué tipo de resultados se necesitan?


 ¿A quién se informará?
 ¿Estoy respondiendo la pregunta que se está haciendo?
 ¿Con qué rapidez hay que tomar una decisión?

Por ejemplo, si estás trabajando en un proyecto urgente, es posible que tengas que
confiar en tus propios conocimientos y experiencia más de lo habitual. No hay tiempo
suficiente para analizar a fondo todos los datos disponibles. Pero si tienes un proyecto
que implica mucho tiempo y recursos, entonces la mejor estrategia es centrarse más en
los datos.
Orígenes del proceso de análisis de datos
Los análisis de datos se basan en la estadística, q de por si ya tiene una historia bastante
larga.
Entrando en el ciclo de vida del análisis de datos, es el proceso de pasar de los datos a la
decisión. Los datos pasan por varias fases a medida q se crean, consumen, prueban,
procesan y reutilizan. Con un modelo de ciclo de vida, todos los miembros clave del
equipo pueden impulsar el éxito al planificar el trabajo tanto por adelantado como al
final del proceso de análisis. A pesar de q el ciclo de vida es bien conocido entre
expertos, no existe una sola estructura definida de esas fases. Pero si existen algunos
fundamentos compartidos en cada proceso de análisis.
El proceso que se presenta como parte del certificado de Google Data Analytics es uno
que te resultará valioso a medida que avances en tu carrera profesional:

1. Preguntar: Desafío empresarial/objetivo/pregunta


2. Preparar: Generación, recopilación, almacenamiento y administración de datos
3. Procesar: Limpieza de datos/integridad de datos
4. Analizar: Exploración, visualización y análisis de datos
5. Compartir: Comunicación e interpretación de los resultados
6. Actuar: Uso de tus conocimientos para resolver el problema.

Comprender este proceso, y todas las iteraciones q ayudaron a hacerlo popular, será una
parte importante a la hora de guiar tu propio análisis y trabajo en este programa.
Repasemos otras variaciones:
Ciclo de vida del análisis de datos de EMC:
Es cíclico con 6 pasos:

1. Descubrimiento
2. Preprocesamiento de datos
3. Planificación de modelos
4. Construcción de modelos
5. Comunicación de los resultados
6. Puesta en funcionamiento

Este modelo refleja la naturaleza cíclica de los proyectos del mundo real. Las fases no
son hitos estáticos; cada paso se conecta y conduce al siguiente, y eventualmente se
repite. Las preguntas clave ayudan a los analistas a probar si han logrado lo suficiente
como para avanzar y garantizar que los equipos hayan dedicado tiempo necesario en
cada una de las fases y no empiecen a modelar antes de que los datos estén listos. Es un
poco diferente del ciclo de vida del análisis de datos en el que se basa este programa,
pero tiene algunas ideas básicas en común: la primera fase está interesada en descubrir y
formular preguntas; los datos deben prepararse antes de poder analizarse y utilizarse; y
luego se deben compartir los hallazgos y actuar en consecuencia.
Ciclo de vida iterativo de SAS
Es una proveedora líder de soluciones de análisis computacional de datos. Se puede
utilizar para producir resultados repetibles, fiables y predictivos_

1. Preguntar
2. Preparar
3. Explorar
4. Modelar
5. Implementar
6. Actuar
7. Evaluar

Este modelo enfatiza la naturaleza cíclica de su modelo al visualizarlo como símbolo


infinito. Incluye un paso posterior a la fase Actuar, diseñado para q los analistas evalúen
sus soluciones y potencialmente, vuelvan a la fase Preguntar.
Ciclo de vida del análisis computacional de datos basado en proyectos

1. Identificación del problema


2. Diseño de requisitos de datos
3. Preprocesamiento de datos
4. Realización de análisis de datos
5. Visualización de datos

No incluye la sexta fase ni lo q denominamos la fase Actuar. Aunque, abarca


igualmente muchos de los mismos pasos ya vistos. Comienza por identificar el
problema, preparar y procesar datos antes del análisis y termina con la visualización de
datos.
Ciclo de vida del análisis de big data

1. Evaluación de casos de negocio


2. Identificación de datos
3. Adquisición y filtrado de datos
4. Extracción de datos
5. Validación y limpieza de datos
6. Agregación y representación de datos
7. Análisis de datos
8. Visualización de datos
9. Utilización de los resultados del análisis

Este ciclo parece tener mas pasos que otros modelos, pero en realidad lo q hacen es
dividir aquello a lo q nos hemos referido como Preparar y Procesar en pasos mas
pequeños. Hace hincapié en tareas individuales necesarias para recopilar, preparar y
limpiar datos antes de la fase de análisis.
Conclusión clave
El proceso de análisis de datos es como la arquitectura de la vida real: hay diferentes
formas de hacer las cosas, pero las ideas fundamentales aparecen en cada modelo del
proceso.

También podría gustarte