Documentos de Académico
Documentos de Profesional
Documentos de Cultura
buenos negocios
centrum.pucp.edu.pe
ESTADISTICA
Sesiones 3 -4
1
Objetivos
● Reconozcamos las medidas de Tendencia Central
2
Medidas de
Tendencia Central
3
Características de los Datos
Tendencia Central
(Posición)
Dispersión
(Variación)
Sesgo
4
Tendencia
Central
5
Media de la Población
6
Media de una Muestra
x = x / n
donde denota la media muestral
7
Propiedades de la Media Aritmética
8
Media Aritmética
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
9
Media Ponderada
10
Media Geométrica
11
Mediana
12
Mediana
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
n +1
Mediana =
2
13
Propiedades de la mediana
14
Moda
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Sin Moda
15 Moda = 9
Datos NO Agrupados
Registro cantidad de artículos vendidos
durante 22 días
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
17
Media de Datos Agrupados
( f * x ) ( f * x )
x= =
f n
f = frecuencia de cada clase
x = punto medio o marca de la clase
n = número de observaciones
18
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.
1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224
224
Media = 10.18
19
22
Mediana de datos agrupados
La mediana de una muestra de datos agrupados se calcula mediante la siguiente
fórmula:
( n + 1) / 2 − ( F + 1)
m=
* w + Lm
fm
F= suma de todas las frecuencias de clase hasta pero sin incluir la clase mediana.
22 + 1
Ubicación de la mediana = = 11.5
2
( 22 + 1) / 2 − (9 + 1)
m= * 3 + 10 = 10.64
7
21
Moda de datos agrupados
22
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
(7 − 5)
Mo = 10 +
(7 − 5) + (7 − 4)
* 3 = 11.2
23
Medidas de Medidas
de dispersión
24
Dispersión
25
Alcance o Rango
26
Alcance
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
27
Cuartiles
( Q1 ) ( Q2 ) ( Q3 )
Observación Observación
Menor Mayor
28
Desviación de la Media
29
Promedio de desviación de cada dato
-2
1
-1
0 1 2 3 4 5
( x − ) = 0
30
x1 xn
X
x2
31
Varianza de la Población
Desviación cuadrática promedio con relación a la media de
la Población
( x − ) 2
2
=
N
x 2
2
= − 2
N
32
Desviación Estándar de la Población
Raíz Cuadrada de la Varianza de la Población
( x − ) 2
= 2
=
N
x 2
= 2
= − 2
N
33
Varianza de la Muestra
n −1
x 2 2
nx
s =
2
−
n −1 n −1
34
Varianza de la Muestra
Desviación cuadrática promedio (n-1) con relación a la
media de la Muestra
( x − x ) 2
s = 2
n −1
x 2 2
nx
s =
2
−
n −1 n −1
35
Desviación Estándar de la Muestra
( x − x ) 2
s= s 2
=
n −1
x2 2
nx
s= s 2
= −
n −1 n −1
36
Varianza de la Población
Datos Agrupados
f ( x − ) 2
2
=
N
fx 2
2
= − 2
N
x = marca de clase
37
Desviación Estándar de la Población
Datos Agrupados
f ( x − ) 2
= 2
=
N
fx 2
= 2
= − 2
N
x = marca de clase
38
Varianza de la Muestra
Datos agrupados
f ( x − x) 2
s =
2
n −1
fx 2 2
nx
s =
2
−
n −1 n −1
x = marca de clase
39
Desviación Estándar de la Muestra
Datos Agrupados
f ( x − x) 2
s= s 2
=
n −1
fx 2 2
nx
s= s 2
= −
n −1 n −1
x = marca de clase
40
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27
41
Comparación de Desviaciones Estándar
Datos A
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
42
Interpretación y usos de la Desviación Estándar
43
Interpretación y usos de la Desviación Estándar
44
Curva de Distribución Normal
13.60%
13.60%
2.135% 2.135%
0.135% 0.135%
68.26%
95.46%
99.73%
46
Resultado Estándar
x−
Re =
47
= 100 = 100
= 20 = 20
x = 80 x = 160
¿ Re? ¿ Re?
80 100 160
s
CV = (100%)
x
49
Ejemplo de Dispersión Relativa
Distribuci ón A Distribuci ón B
x = 10 x = 100
s=2 s=5
50
Ejemplo de Dispersión Relativa
Distribución A Distribución B
2 5
CV = 100 = 20% CV = 100 = 5%
10 100
51
Coeficiente de Variación
NOTA: Las tablas que se presentan son
algunas propuestas que ayudan a la
interpretación del Coeficiente de
Variación, sin embargo es importante
resaltar que esta información es solo
referencial, y la interpretación en cada
caso debe ser hecha por el analista de la
información, teniendo en cuenta el
proceso que se esta analizando.
52
Simetría y Medida
de Curtosis
53
Sesgo de una distribución
Positivamente
Negativamente Simétrica Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
54
Coeficiente de asimetría
El coeficiente de asimetría de una distribución se define como:
55
56
CASO APLICADO
Usted trabaja en una planta ensambladora de motores de automóviles. Una de las piezas, un árbol de levas, debe
tener 600 mm +2 mm de largo para cumplir con las especificaciones de ingeniería. Ha habido un problema crónico
con la longitud del árbol de levas que no ha cumplido con la especificación , lo cual causa que los ensamblajes no
queden ajustados adecuadamente y originando altas tasas de descarte y reparación.
El supervisor desea analizar el proceso, de manera que en un mes recolectamos un total de 100 observaciones (20
muestras de 5 árboles de levas cada una) de todos los árboles de leva utilizados en la planta y 100 observaciones
de cada uno de sus proveedores.
57
Summary Report for Supp2
Anderson-Darling Normality Test
A-Squared 0.29
P-Value 0.61 5
Mean 600.23
StDev 1 .87
Variance 3.51
Skewness 0.051 853
Kurtosis -0.51 8286
N 1 00
Minimum 596.20
1 st Quartile 599.00
Median 600.20
3rd Quartile 601 .60
Maximum 604.20
95% Confidence Interval for Mean
597.0 598.5 600.0 601 .5 603.0 599.86 600.60
95% Confidence Interval for Median
599.80 600.60
95% Confidence Interval for StDev
1 .65 2.1 8
Mean
Median
Mean
Median
59
Medidas estadísticas
de asociación
60
Coeficiente de
correlación de
Pearson
61
Coeficiente de Correlación
La correlación es el método de análisis que
se usa para medir la intensidad de
asociación observada entre cualquier par
de variables cuantitativas y para probar si
es mayor de lo que podría esperarse por
azar.
63
Coeficiente de Correlación muestral de Pearson (r)
64
65
66
Supuestos del Análisis de Correlación
67
Análisis de Correlación
EJEMPLO
12 55
A
14 63
B
17 67
C
16 70
D
11 51
E
68
Análisis de Correlación
EJEMPLO
80
70
60
50
40
Y
30
20
10
0
10 12 14 16 18 20
r = 0.9546
X
En otras palabras, las personas con una calificación mas alta en la prueba de destreza tienden
a registrar niveles de productividad mas altos.
69
70
Análisis de
Regresión.
71
Análisis de Regresión
Modelo que permite utilizar la información proporcionada por las variables
explicativas (X) para describir adecuadamente el comportamiento de la
variable dependiente Y.
Regresión
Regresión simple
no lineal
Regresión
72 múltiple
Análisis de Regresión Lineal Simple
MODELO MATEMÁTICO
Consumo
Línea de regresión
Y
Y.X=0+ 1X
Y X
•
Y X Y X
Y X
• •
•
Y X
Y X
•
f(X,Y) X1
X2
Xk X
Ingreso
mensual
73
Análisis De Regresión Lineal Simple
MODELO DE REGRESION
Modelo de regresión poblacional= modelo matemático
Y.X=0+ 1X
Parámetros:
0 Coeficiente coeficiente de intersección poblacional.
Expresa el valor de la media Y.X cuando X=0
1 Coeficiente de regresión poblacional o pendiente
de la línea de regresión. Expresa el valor del
cambio promedio que ocurre en la variable Y como
consecuencia de un cambio unitario en la variable
X.
74
Análisis De Regresión Lineal Simple
MODELO ESTADISTICO
Consumo
Modelo matemático
Y
Y.X=0+ 1X
(xi, yi)
yi •
i
Modelo estadístico
yi yi = Y.Xi + i
Y.Xi
= 0+ 1Xi + i
xi
X
Ingreso mensual
75
Análisis De Regresión Lineal Simple
MODELO ESTADISTICO
i Término aleatorio residual o del error. Expresa el efecto propio del muestreo
aleatorio y el efecto de otras variables no incluidas en el modelo.
76
Análisis de Regresión Lineal Simple
SUPUESTOS SOBRE EL MODELO ESTADÍSTICO
Yi =0+ 1Xi + i
2. Los términos aleatorios del error residual i son independientes y tienen una
distribución con media cero y variancia 2 ; es decir:
E i = 0 ,
E i2 = 2 y
E i j = 0 i j
4. Para cada valor de x, los valores de Y tienen una distribución normal con media
y.x = 0 + 1 x , y con variancia y.x ; es decir:
2
Y N( y.x , y2.x )
6 Los valores de Y, para cada valor de X, son obtenidos mediante una muestra es
aleatoria.
78
Análisis de Regresión Lineal Simple
ESTIMACIÓN DE LOS PARÁMETROS 0 y 1
Yi = b0 + b1 xi + ei
Despejando para ei se obtiene:
ei = Yi − Yˆi = Yi − b0 − b1 xi
De donde, para minimizar los errores ei se hace uso de la
siguiente suma de cuadrados de los errores.
n n
Q(b 0 , b1 ) = ei2 = ( y i − b 0 − b 1 xi ) 2
i =1 i =1
80
Análisis de Regresión Lineal Simple
EJEMPLO
12 55
A
14 63
B
17 67
C
16 70
D
11 51
E
81
82
Diagrama de
dispersión y la
línea de
regresión de
mínimos
cuadrados
83
Análisis de Regresión Lineal Simple
Obtención de la línea de regresión estimada
b0=19.2 Este valor indica que las unidades producidas en una hora ( con 0 en
la calificación de la prueba de destreza) es de 19.2 unidades.
b1=3.0 Este valor indica que por cada punto adicional en la calificación de la
prueba de destreza, las unidades producidas en una hora se incrementan en
3.0 unidades
84
Estimación puntual usando la línea de regresión
85
El coeficiente de Determinación
86
El coeficiente de Determinación
EJEMPLO
Regression Statistics
Multiple R 0.954575798
R Square 0.911214953
Adjusted R Square 0.881619938
Standard Error 2.75680975
Observations 5
r2= 0.911
Lo que refleja que las calificaciones en la prueba de destreza (x) explican el 91.1% de la
variación en la productividad (y).
87