Documentos de Académico
Documentos de Profesional
Documentos de Cultura
it happen
eae.es
Índice
01. ¿Qué es la estadística? La estadística descriptiva
eae.es
3
Estadística
Impresiones
Opiniones
Suposiciones
Prejuicios
? DATOS !
…
4
Para modificar título del PPT, cambiar pie de página
¿Qué es la
estadística?
ESTADÍSTICA
Disciplina que estudia cómo recoger datos y como
analizarlos para obtener la información deseada.
5
Las 2 salidas de un
proceso
Productos
o servicios
Entradas PROCESO
ESTADÍSTICA DATOS
Mejora del
producto y
del proceso
INFORMACIÓN ESTADÍSTICA
6
Estadística
descriptiva
30
20
10
40 43 46 49 52 55 58
378498947362394940
Pareto Chart for C1
274948599876537383
200
932849276732904854 100
80
283928985940903850
Percent
Count
60
239832795059049044 100
40
094385040049850385 20
987897899893222341 0
n
0
s ras a c ió rs
du ina
283928985940903850 Ra
ya
So
pla Fo
rm
T erm Ot
he
239832795059049044
094385040049850385 y = 133,5
987897899893222341 s = 7,41
40
Respuesta
Datos a preguntas
C4
30
20
20 30 40 50
C1
7
02. Síntesis numérica de datos
eae.es
8
Probabilidad e
Inferencia
POBLACIÓN POBLACIÓN
?
Probabilidad Estadística / Inferencia
?
MUESTRA MUESTRA
9
94,95
59,91
63,65
104,21
68,72
Síntesis numérica 71,26
85,39
de datos 77,30
121,43
94,95 94,95 91,52
59,91 59,91 95,52
63,65 63,65 126,74
104,21 104,21 79,08 Medidas de tendencia central
68,72 68,72 130,79
71,26 71,26 109,62 Media, Mediana y Moda
85,39 85,39 65,19
77,30 77,30 126,02
121,43 121,43 137,61
91,52 91,52 63,90
95,52 95,52 94,95
?
126,74
79,08
126,74
79,08
59,91
63,65
Medidas de dispersión
104,21
Rango, Varianza, Desviación
130,79 94,95
130,79
109,62 59,91
109,62 68,72
65,19 63,65
65,19 71,26
126,02 104,21
126,02 85,39 tipo
137,61 68,72
137,61 77,30
63,90 71,26
63,90 121,43
85,39
77,30
91,52
95,52
Medidas de posición
126,74
Cuartilas, percentiles
121,43
91,52 79,08
95,52 130,79
126,74 109,62
79,08 65,19
130,79
109,62
126,02
137,61
Medidas de relación entre dos variables
63,90
65,19
126,02 Covarianza, correlación
137,61
63,90 10
Tendencia central:
media
Frecuencia Valor de la
absoluta ni: variable: Xi
Mediana
0 1 2 3 4 5 6 7 8 9 10 12
Tendencia central:
moda
Valor que más se repite
Apenas se usa con valores numéricos
Puede no haber moda
Distribución bimodal
150
100
50
40 50 60 70
13
Posición: cuartiles
Menor 50
52
57
58
59
60 25 %
61
61 Q1 = 61: Primer Cuartil
61
64
68 75 %
Datos ordenados
69 50 %
de menor a mayor 71
72
73
78
75,5 Mediana
78
80
81 50 %
82 75 %
82
84
86 Q3 = 86: Tercer Cuartil
90
92
93
25 %
94
95
98
Mayor 100 14
Dispersión: rango
0 1 2 3 4 5 6 7 8 9 10
15
Dispersión:
varianza (1)
“Promedio” del cuadrado de las distancias de cada valor a la media
MUESTRA POBLACIÓN
n n
xi x xi
2 2
s2 = i=1 2 = i=1
n- 1 N
2,6 2,4
3,6 4,4
0 1 2 3 4 5 6 7 8 9 10
17
4,6
Dispersión:
desviación tipo
Medida de dispersión de uso cotidiano
MUESTRA POBLACIÓN
s = s2 = 2
(x x)(yi i y) 10
Cov(X, Y) i1 Negativa I II Positiva
n1 9 (+ · -) (+ · +)
8
- +
7
Cov (X,Y) > 0: + +
6
Relación positiva
Y 5 Media de Y
- -
4
Cov (X,Y) < 0:
Relación negativa 3
- +
2
1 Positiva Negativa
Cov (X,Y) 0: (- · -) Media de X (- · +)
No hay relación 0 IV III
0 1 2 3 4 5 6 7 8 9 10
X
19
INCONVENIENTE: Depende de las unidades de las variables
Medidas de relación
lineal entre 2
variables
El coeficiente de correlación resuelve los problemas de la covarianza
Cov(X,Y)
rXY
sX sY
Unidades: Es adimensional
110
r = 0,779
1500
100
Y=N(1000, 200)
90
80
Peso
1000
70
60
50
r = - 0,160
500
40
150 160 170 180 190 200 500 1000 1500 20
Altura X=N(1000, 200)
Medidas de relación
lineal entre 2
variables
No siempre un coeficiente de correlación bajo significa una falta de
dependencia entre las variables:
Coeficiente de correlación
21
03. Representaciones gráficas
eae.es
22
El caso de la
panadería
Día Ope. Máquina 1 Máquina 2
23
Histogramas:
Visión general
35 30
30
25
25
20
20
15
15
10
10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
24
Histogramas:
Comparación
Operario A Operario B
Porcentaje Porcentaje
35 35
30 30
25 25
20 20
15 15
10 10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
25
Histogramas:
Comparación (2)
Máquina 1 Máquina 2
Porcentaje Porcentaje
35 35
30 30
25 25
20 20
15 15
10 10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
26
Histogramas:
Ejercicio
Máquina 1 Máquina 3
Porcentaje Porcentaje
35 25
30
20
25
20 15
15
10
10
5
5
0 0
205 210 215 220 225 230 235 212 214 216 218 220 222 224 226 228
Pesos Pesos
27
Histogramas: Tipos
150 150
80
100 100
40
50
50
0 0 0
30 35 40 45 50 55 60 65 70 25 30 35 40 45 50 55 60 65 70 75 0 5 10 15 20 25
50 50 50
0 0 0
35 40 45 50 55 60 65 70 75 80 85 90
30 35 40 45 50 55 60 65 70 35 40 45 50 55 60 65 70 75 80 85 90
Ventajas
• Revela la media, la variabilidad de los datos y la
forma de la distribución
Limitaciones
No refleja la información temporal de los datos
29
Boxplot
Fija la atención en las medidas de posición y los valores extremos
Orden: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Q1 Mediana Q3
* * * o
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
30
Boxplot: Ejemplos
10
200
Humedad
Weight
9
150
100
8
Sex
31
Diagramas
bivarantes
RELACION TEMPERATURA-RENDIMIENTO
Reactor B Periodo Enero-Febrero 1999 (N=50)
Rendimiento
95.0
94.5
94.0
93.5
93.0
92.5
92.0
91.5
91.0
90.5
32
Diagramas
bivariantes:
correlación causa y
efecto
Ejemplos:
33
Diagramas
bivariantes:
correlación causa y
efecto
Utilidad
Identifica correlación entre variables. También indica
la intensidad de la correlación.
Ventajas
• Ayuda a identificar que entrada o variable del
proceso puede estar relacionada con una salida del
proceso.
30
25
Datos globales 20
Porcentaje 15
35
10
30 5
0
25
205 210 215 220 225 230 235
Pesos
20
15
Máquina 2
Porcentaje
10
35
5 30
25
0
20
205 210 215 220 225 230 235
Pesos 15
10
0
205 210 215 220 225 230 235
Pesos
35
Estratificación:
diagramas
bivariantes
Máquina
1
10 10
2
9 9
Densidad
Densidad
8 8
7 7
6 6
25 30 35 40 25 30 35 40
36
Estratificación
Utilidad
Ventajas
• Podemos tratar tablas de datos que tienen “peras y
manzanas” separándolas
37
04. Caso práctico
eae.es
38