Documentos de Académico
Documentos de Profesional
Documentos de Cultura
pe
WhatsApp: (+51) 977342458
Skype: mpatino23
Ing. Miguel Ángel Patiño Antonioli
▪ MBA in General and Strategic Management, Maastricht School of Management (Holanda)
▪ Magíster en Administración Estratégica de Empresas por la PUCP - CENTRUM Católica.
▪ Ingeniero Industrial titulado con honores de la PUCP.
▪ Trilingüe (italiano, inglés, español).
▪ Scrum Fundamentals, Scrum Developer, Scrum Master, Agile Master Certified y Design Thinking.
▪ Autor del paper “Aplicación de las cadenas ocultas de Markov para la preferencia de los
consumidores en el mercado cervecero” (Pontificia Universidad Católica del Perú. Facultad de
Ciencias e Ingeniería - Tesis de Licenciaturas, 2011): mejora en la precisión del modelo clásico
del 15%.
▪ Amplia experiencia en Mejora de Procesos en empresas como BCP y Ripley.
▪ Amplia experiencia en Marketing e Investigación de Mercados, como líder de proyectos de
investigación y Category Manager por más de 4 años, responsable de administrar presupuestos de
más de S/. 4MM y logrando un crecimiento de más de 160% en los indicadores clave del negocio a
su cargo y más de 200% en crecimiento del portafolio asignado.
▪ Fundador, Gerente General y principal Coach de “6S Consultores”, una empresa de consultoría
dedicada a la gestión y mejora de procesos, planeamiento estratégico, capacitación e
implementación de metodologías variadas, clínica empresarial y consultoría integral de negocios.
▪ Profesor en el Área Académica de Estadística, Tecnología y Operaciones de CENTRUM Católica
Graduate Business School.
▪ Experiencia de más de 10 años como Consultor Senior en: Lean, Six Sigma, Mejora de Procesos,
Estadística, Calidad, Simulación de Sistemas e Inv. Op., Agile, entre otros.
Fundador y Gerente General:
▪ Evaluaciones individuales
✓ Exámenes (6) 50%
▪ Evaluaciones grupales
✓ Proyecto Aplicativo Final 50%
Total 100%
Kick off !
Algunas Estadísticas curiosas …
1 Se imprimen más billetes de Monopolio que reales cada año.
Debate en parejas:
1. ¿Por qué es importante la
Estadística en el mundo de
los procesos?
2. ¿Cuáles serían sus límites?
Hoy vamos a
empezar una
Transformación
Planteamiento Monty-Hall
https://www.youtube.com/watch?v=uz58hg0EJAY
Sesión 1:
Estadística Descriptiva: KPIs clave
Objetivos
Al finalizar esta sesión, el alumno:
1. Comprende la importancia de la Estadística y su
aplicabilidad.
2. Reconoce los conceptos básicos de la Estadística
Descriptiva así sus aplicaciones a los procesos
3. Comprende el uso del análisis gráfico y arreglo de
datos para la toma de decisiones.
4. Domina las herramientas gráficas y reconoce cuándo
emplear cada una en un contexto real.
5. Comprende los KPI clave y su correcta interpretación
6. Comprender los conceptos de Regresión.
Agenda
▪ La Estadística: Ciencia de la variabilidad
▪ Análisis exploratorio de los datos.
▪ Representación gráfica
▪ Estadística Sumaria:
➢ Medidas de Tendencia Central
➢ Medidas de Dispersión
➢ Medidas de Posición
➢ Medidas de Deformación
✓ Asimetría
✓ Curtosis
▪ Regresión y KPIs de calidad de ajuste
Descripción de Datos
Conceptos introductorios
Estimadores y Parámetros
Parámetro:
Valor o indicador representativo de una población. Se
simboliza por letras griegas.
Sólo hay un parámetro en cada población para cada
indicador.
Media poblacional
2 Varianza poblacional
Desviación estándar poblacional
Proporción poblacional
Descripción de Datos
Conceptos introductorios
Estimadores y Parámetros
Estimador
Valor o indicador representativo de una muestra. Se
simboliza por letras latinas.
Existen tantos estimadores como muestras se
extraigan de una población.
x Media muestral.
s 2 Varianza muestral.
s Desviación estándar muestral.
p Proporción muestral.
1-7
Descripción de Datos
Conceptos introductorios
Tipos de Variables
VARIABLES
Cualitativas Cuantitativas
Discretas Continuas
1-7
Descripción de Datos
Conceptos introductorios
Tipos de Variables Cuantitativas
Cuantitativas Discretas
▪ Sólo pueden adquirir ciertos valores puntuales y casi siempre
hay “brechas” entre esos valores.
▪ Ej.: el número de habitaciones en una casa (1,2,3,..., etc.).
Cuantitativas Continuas
▪ Pueden tomar cualquier
valor dentro de un
intervalo específico.
▪ Ej.: el tiempo que toma
volar de Lima a Tacna.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
1) Las Tablas de Distribución
1.1) Tablas simples
Ej.: Cuadro 1: Calidad de Servicio Postventa
Número de Tasa
Categoria Clientes Porcentual (%)
Muy Bueno 5 11,11
Bueno 16 35,55
Aceptable 12 26,67
Malo 8 17,78
Muy Malo 4 8,89
Total 45 100,00
Fuente: Encuesta a los clientes, enero 1998
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
1) Las Tablas de Distribución
1.1) Tablas simples
Para datos cuantitativos se construyen las denominadas Distribuciones de
Frecuencias.
Ej.: Cuadro 2: Ventas diarias durante el mes de enero (en soles).
Ventas Tasa
(en soles) Días porcentual (%)
1000 - 4999 3 10,00
5000 - 8999 7 23,33
9000 - 12999 10 33,33
13000 - 16999 8 26,67
17000 - 20999 2 6,67
Total 30 100,00
S/ 30,000
S/ 25,000
Suma de Saldos
S/ 20,502
S/ 20,000 S/ 19,031 S/ 18,505
S/ 15,000
S/ 10,000
S/ 5,000
S/ 0
Piura Trujillo Arequipa Cusco
Sucursal
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
2) Gráficos de Barras
16 16
15
12
Porcentaje
10
8 8
5 4 4 4 4 4
0
5 6 7 8 9 10 11 12 15 16 20
Cantidad de defectos
Porcentaje en todos los datos.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
2) Los Gráficos
2.4) Histograma
▪ Son barras verticales
presentadas una a
continuación de otra (en
variables continuas).
▪ El ancho es homogéneo
(amplitud de clase).
▪ La altura está en
función a la frecuencia.
▪ La organización de
datos en un histograma
permite una mejor
compresión de los
datos.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
2) Los Gráficos
2.4) Histograma
a) Normales:
El valor medio está al centro, que tiene la
mayor frecuencia. Es el más frecuente y tiene
forma simétrica.
c) Sesgo positivo:
Forma asimétrica la media está localizada
a la izquierda.
d) Cliff:
Forma asimétrica la frecuencia
disminuye bruscamente a la izquierda.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
2) Los Gráficos
2.4) Histograma
e) Planicie:
Las clases tienen más o menos la misma frecuencia.
g) Isla:
Presenta un pico aislado, además de un
histograma general.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
2) Gráfico de Torta o Circular
▪ El circulo se divide en segmentos circulares, de tamaño proporcional a
la frecuencia de la categoría.
Arequipa
14; 23.3%
Trujillo
17; 28.3%
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
Tablas y Gráficos
2) Los Gráficos
2.9) Diagrama de Cajas
▪ Utilizado para visualizar la variabilidad o la dispersión de los datos.
▪ Normalmente se utiliza para comparar 2 o más grupos de datos.
▪ La medida del ancho de la caja marca la variabilidad y se conoce como el RI
(Rango Intercuartil). RI = Q3-Q1.
Descripción de Datos
Uso del análisis gráfico y arreglo de datos para la toma de decisiones
2) Los Gráficos
2.10) Diagrama de Pareto
Caso 1
Metalmecánica
Descripción de Datos
Caso 1 - Metalmecánica
¿Estamos contentos
con este análisis?
“La Estadística
es una ciencia
que demuestra
que si mi vecino
tiene dos coches
y yo ninguno,
entonces…
los dos
George Bernard Shaw
(1856-1950) tenemos uno.”
“Un estadístico
podría meter su
cabeza en un
horno y sus
pies en hielo, y
decir que en
promedio …
Peter Drucker se encuentra
bien.”
Resumen numérico de los datos
Características clave de los Datos
Tendencia Central
(Posición)
Dispersión
(Variación)
Asimetría
Medidas de
Tendencia Central
Debate en equipos:
¿Por qué no existe una única
medida de tendencia central?
“The only certainty is
that nothing is certain”
Resumen numérico de los datos
Medidas de Tendencia Central
▪ Aquellas que nos indican cual podría ser el punto medio
o representativo de un conjunto de datos analizados.
▪ Llamados “Promedios”, buscan dar su “opinión” respecto
al valor central. Los principales son:
w x i i
x p
= i =1
k
w
i =1
i
Resumen numérico de los datos
Medidas de Tendencia Central
Media Geométrica
0.5 − H i −1
▪ Punto medio de los Med = Li + A *
valores después de
ordenarlos.
hi
▪ No es afectada por Intervalos
valores extremos.
d1
▪ Valor que más se repite en Mo = Li + i
un conjunto de datos. d 1 + d 2
▪ No es afectada por valores DatosAgrupados
extremos.
▪ Para datos discretos es
fácil de calcular.
▪ No puede ser calculada
exactamente en una
distribución de frecuencias.
¿Cómo nos impactan los
Outliers
(datos atípicos/extremos)?
VOLATILIDAD
VARIABLIDAD
HETEROGENEIDAD
¿Cuántos zapatos tienes?
(incluye sandalias, etc.)
Récord a la fecha:
83 zapatos!!!
Medidas de
Dispersión
Resumen numérico de los datos
Medidas de Dispersión www.leansolutions.co
Resumen numérico de los datos
Medidas de Dispersión
Coeficiente de Variación (CV)
CV Grado de Variabilidad
0% < CV < 10% Datos muy homogéneos
10% ≤ CV < 15% Datos regularmente homogéneos
15% ≤ CV < 20% Datos regularmente variables
20% ≤ CV < 25% Datos variables
CV ≥ 25% Datos muy variables
Resumen numérico de los datos
Medidas de Posición
Fractiles
F j = X ( jn F + 0.5)
▪ Medidas de posición.
DatosNoAgrupados
▪ Dividen en:
✓ Cuartiles (Qj) jn − faA
✓ Deciles (Dj)
= + F i
✓ Centiles (Pj) F j Lij f
▪ Formulación semejante ij
a la mediana. DatosAgrupados
Me = Q2 = D5 = P50
Resumen numérico de los datos
Medidas de Posición
Resumen numérico de los datos
Medidas de Posición
Cuartiles en el Diagrama de Cajas
Resumen numérico de los datos
Medidas de Posición
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Coeficiente de Asimetría de Pearson
3(𝜇 − 𝑀𝑒𝑑)
𝑆𝑘𝑝 =
𝜎
3(𝑥 − 𝑚𝑒𝑑)
𝑆𝑘𝑝 =
𝑠
𝑆𝑘𝑝 = 0
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Sesgo de una distribución
Negativamente Positivamente
Simétrica Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Coeficiente de Curtosis
Recta de Recta de
Lineal Regresión con Regresión con 2 o
1 Regresor más Regresores
Curva de Curva de
No Lineal Regresión con Regresión con 2 o
1 Regresor más Regresores
Modelos de Regresión lineal
Análisis de Regresión
Variaciones
14
Y
* Variación no Y’
12
Explicada
10 Variación
8 Total *
Variación
6 Explicada
4
2
Y
0
0 1 2 3 4 5
Modelos de Regresión lineal
KPI de calidad de ajuste en la Regresión
0.7
FUERTE
1
R2
0
Medidas de Correlación
Análisis de Regresión Simple
Ejemplos de posibles correlaciones
Medidas de Correlación
Análisis de Regresión Simple
Coeficiente de Determinación (R2)
Y Y’ 𝑌 (Y- 𝑌 )2 (Y’- 𝑌 )2 (Y-Y’)2
9 9.0 9 0 0.0 0.0
5 4.8 9 16 0.2 0.04
7 6.9 9 4 0.1 0.01
14 13.2 9 25 0.8 0.64
10 11.1 9 1 -1.1 1.21
∑= 46 ∑= 44.10 ∑= 1.90
Variación Total = Variación Explicada + Variación No Explicada
46 = 44.10 + 1.90
96% de la variación del
Var.Explicada (Y '−Y ) 2
r =
2
= = 0.96 Tiempo de entrega (Y) está
Var.Total (Y − Y )
2
explicada por la variación del
tiempo de setup (X).
Regresión Lineal Simple
Análisis de resultados en Minitab
Regresión
Lineal Múltiple
Regresión Lineal Múltiple
Matemáticamente, el Modelo de Regresión Lineal Múltiple (MRLM) se expresa:
𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏 + 𝜷𝟐 𝑿𝟐 + … + 𝜷𝒊 𝑿𝒊 + 𝜺𝒊
Donde, 𝜀𝑖 ~𝑁(0, 𝜎
2)
Supuestos:
▪ 𝜺𝒊 representa la perturbación o error aleatorio, independiente, con
esperanza nula y distribución de probabilidad normal.
▪ Varios Regresores o variables independientes aportan una contribución
explicativa para el modelo que trata de estimar a la variable dependiente.
▪ Multi-Colinealidad entra las variables independientes y la dependiente.
▪ Homocedasticidad
ANOVA
▪ Análisis de Varianza
▪ Procedimiento para comparar varias medias poblacionales de forma simultánea.
▪ Se asume normalidad y es para variables en escala de Intervalos o Razón
▪ Se asume independencia.
▪ Se asume homocedasticidad
Estadístico de Prueba:
𝑺𝑪𝑹
𝑴𝑪𝑹 𝒌
𝐅𝟎 = = ~ 𝒇(𝒌, 𝒏 − 𝒌 − 𝟏)
𝑴𝑪𝑬 𝑺𝑪𝑬
𝒏−𝒌−𝟏
Regresión Lineal Múltiple
Pruebas de significancia
Estadístico de Prueba:
𝒃𝒊
𝐓𝟎 = ~ 𝒕(𝒏 − 𝒌 − 𝟏)
𝑺𝒃
Regresión Lineal Múltiple
Pruebas de significancia
3) Prueba de la Correlación
Estadístico de Prueba:
𝐫 𝒏−𝟐
𝐓𝟎 = ~ 𝒕(𝒏 − 𝒌 − 𝟏)
𝟏 − 𝒓𝟐
Regresión Lineal Múltiple
Análisis de resultados en Minitab
Regresión Lineal Múltiple
Análisis de resultados en Minitab
Conclusiones finales:
1. Un buen análisis de datos
utiliza como mínimo Tendencia
central y Dispersión.