Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Internacional Empresarial
en Gestión de Operaciones
Estadística
1
Sesiones 3 y 4:
Resumen numérico de los
datos. Medidas de
Correlación.
2
“La estadística es una ciencia
que demuestra lo siguiente:
- Si mi vecino tiene 1 millón de
dólares y yo no tengo ninguno,
en promedio LOS DOS
TENEMOS UN MILLÓN DE
DOLARES CADA UNO”
3
AGENDA
Medidas de Tendencia
Central
Medidas de Dispersión
Simetría y Medida de
Curtosis
Coeficiente de Correlación y
Determinación
4
Descripción Numérica de
Datos
Mediana
Rango Intercuartil
Moda Varianza
Desviación Estándar
Coeficiente de Variación
5
Medidas de Tendencia
Central
Tendencia Central
6
Medidas de Tendencia Central
Aquellas que nos indican cual podría ser el punto medio o típico de un
conjunto de datos analizados. Se llaman también “Promedios”.
Ejemplos:
Media ponderada
Media Geométrica
Media Armónica
Mediana
Moda
7
Media aritmética
VENTAJAS DESVENTAJAS
Es conocida y fácil de calcular En caso de existir valores extremos
e interpretar. o atípicos, la media se ve afectada
Para su cálculo se utilizan por estos.
todas las observaciones del No es recomendable para variables
conjunto de datos. con distribuciones asimétricas.
Es única para cada conjunto
de datos
9
Media Ponderada
k
Media aritmética en la cual se
considera a cada uno de los valores w X i i
12
VER: Excel
Media geométrica
13
Ejemplo: Media geométrica
14
VER: Excel
Ejemplo: Media geométrica
xg n x1, x 2, x 3,......x
15
VER: Excel
Ejercicio 1:
16
VER: Excel
Ejercicio 2:
17
VER: Excel
Ejercicio 3:
18
VER: Excel
Ejercicio 4:
19
VER: Excel
Mediana
Es un promedio de posición.
N
2 faA
No es afectada por valores Med Li i
f i
extremos a DIFERENCIA de DatosAgrupados
la media aritmética
20
Mediana
Reglas
2º Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la ser
previamente ordenada.
Ejemplo:
12, 14, 16,18, 22, 25, 30, 36
21
Mediana
VENTAJAS DESVENTAJAS
Los valores extremos no Como valor central, se debe
afectan a la mediana como en ordenar primero la serie de datos.
el caso de la media aritmética.
Es fácil de calcular, interpretar
y entender.
Se puede determinar para
datos cualitativos.
22
Ejemplo:
En el siguiente cuadro se muestra el número de vacunas para el COVID 19
que se aplicaron diariamente en un periodo de 50 días.
24
Moda
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
25
Moda
VENTAJAS DESVENTAJAS
Se puede utilizar tanto para No tiene un uso tan frecuente como
datos cualitativos como la media.
cuantitativos. Muchas veces no existe moda
No se ve afectada por los (distribución amodal).
valores externos En otros casos la distribución tiene
varias modas, lo que dificulta su
interpretación.
26
¿Qué promedio elijo?
OBSERVACIÓN DATOS
22, 24, 25, 26, 27,
Número de cursos
28, 28, 29, 30, 31,
aprobados
33, 34
8, 8.2, 9,10,11,12,
Ingresos
12.3,12.5,13,13.5,
(miles de soles)
86,97
39, 40, 41, 41, 41,
Talla de zapatillas 41, 42, 42, 43, 43,
44, 45
31
Equivalencias entre Cuartiles, deciles
y percentiles
Percentil Decil Cuartil
P10 D1
P20 D2
P25 Q1
P30 D3
P40 D4
P50 D5 Q2
P60 D6
P70 D7
P75 Q3
32
P80 D8
P D
Medidas de dispersión
A B
1800 700
1800 700
2000 1600
2000 1600
2100 5100
=1940 =1940
En ambas la media es la misma. Pero
¿En cuál de las 2 empresas, el ingreso promedio es más representativo?
DISPERSION
36
Rango o recorrido
VENTAJAS DESVENTAJAS
Es fácil de calcular Sólo considera los valores extremos
Es fácil de entender e No toma en cuenta ni el número de
interpretar datos ni el valor de estos
37
Rango Intercuartílico
𝑹𝑰 𝑪=𝑸 𝟑 −𝑸 𝟏
El rango intercuartílico es el
resultado de la diferencia entre
los cuartiles tres (𝑸𝟑) y uno (𝑸𝟏).
Es el rango en el que se
encuentra el 50% central de los
LS atípico
datos.
39
Varianza
Media aritmética de las desviaciones N
X
2
cuadráticas respecto a la media.
2
Expresada en unidades al cuadrado. i 1
N
Mide la variabilidad del conjunto de Poblacion
datos con respecto a la media, si los n
x i x
2
datos están cerca a la media,
S i 1
2
entonces la varianza será pequeña, en n1
caso contrario, será grande. Muestra
40
Ejemplo:
El gerente del Banco RENTABLE seleccionó una muestra de 8 clientes y registró los
montos de retiros (en miles de soles) realizados en un cajero automático, a saber: 34, 37,
23, 34, 45, 56, 34 y 22. Calcule la varianza.
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21
s = 4.57
¿Podemos usar Desviación Estándar?
43
¿Cómo es la variabilidad de los datos?
Ejemplo:
Empleando los mismos datos del ejemplo anterior, complementemos
la información sobre la variabilidad de los retiros en el cajero de
banco RENTABLE.
Entonces
nuevos soles
46
Ejemplo:
x
Z
Z
-3 -2 -1
0 +1 +2 +3
68%
μ
μ 1σ
49
Interpretación y usos de la Desviación Estándar
95% 99.7%
μ 2σ μ 3σ
50
Regla Empírica
34.13% 34.13%
13.60%
13.60%
2.135% 2.135%
0.135% 0.135%
68.26%
95.46%
99.73%
51
Esto es calculado de manera empírica, no es exacto!!!
Ejemplo: Metamelcan
Al final del experimento los pesos de las truchas fueron (en gramos):
124, 125, 125, 123, 120, 124, 127, 125, 126 y 121
Simetría y Curtosis
Coeficiente de
Coeficiente de Curtosis
Asimetría
54
Coeficiente de Simetría
Brinda información sobre la dirección horizontal
que toma la distribución de los datos con
respecto a su centro.
Simétrica = 0
56
Coeficiente de Curtosis
Grado de concentración con relación a la media
aritmética.
Sin unidades.
σ 𝑛𝑖=1ሺ𝑥 𝑖 −𝑥ҧ
ሻ4
Interpretación: 𝑘= ሺ𝑛−1ሻ𝑠 4
-3
Mesocurtica = 0
Leptocurtica > 0
Platicurtica < 0
58
Regresión Simple
Ecuaciones Simples expresan una relación entre dos variables.
Variables: X , Y
Variables: X , Y, Z
59
Análisis de Regresión Simple
La finalidad es establecer una relación cuantitativa (ecuación de
regresión) entre dos variables, y estimar el valor de Y (dependiente)
con base en un valor de X (independiente).
Y ' a bX
Y' 0 1 X
60
Análisis de Regresión Simple
Métodos: gráfico y matemático (mínimos cuadrados).
Gráfico
Diagrama de dispersión.
X 3 1 2 5 4 6
4
Y 9 5 7 14 10 2
0
0 1 2 3 4 5 6
61
Coeficiente de correlación (r)
Mide el grado de asociación o
relación lineal entre las
variables X e Y.
r
XY nXY
Sus valores van de -1 a +1
( X 2 nX 2 )( Y 2 nY 2 )
Los valores X y Y son
obtenidos de una muestra de
tamaño n.
Correlación Correlación
Negativa Ninguna Positiva
Perfecta Correlación Perfecta
Correlación Correlación
Negativa Positiva
Moderada Moderada
-1 0.5 0 0.5 1
68
Coeficiente de correlación (r)
Y Y Y
X X X
r = -1 r = -0.6 r=0
Y
Y Y
X X X
69 r = +1 r = +0.3 r=0
Coeficiente de determinación ()
Proporción de la variación total en la variable
dependiente (Y) que se explica o se debe a
la variación de la variable independiente.
2
r
Var. Explicada
(Y ' Y ) 2
70
Coeficiente de determinación ()
0 r2 1
71
Coeficiente de determinación ()
Y Y’ (Y- )2 (Y’- )2 (Y-Y’)2
9 9.0 9 0 0.0 0.0
5 4.8 9 16 0.2 0.04
7 6.9 9 4 0.1 0.01
14 13.2 9 25 0.8 0.64
10 11.1 9 1 -1.1 1.21
∑= 46 ∑= 44.10 ∑= 1.90
14 Y
* Variación no Y’
12 Explicada
10 Variación
Total *
8 Variación
Explicada
6
4
2
Y
0
0 1 2 3 4 5
73
IMPORTANTE: RECETA PARA USAR
REGRESIÓN (PRONÓSTICO)
1. Se calcula los coeficientes de Determinación y de correlación
2. Realizar Prueba Global: Indicará si la ecuación tendrá o no
carácter predictivo.
Prueba de Hipótesis: Ho : Bj = 0 / Ho : Bj ≠ 0
Alfa: 0.05
Estadístico de Prueba: F
Rechazo si valor crítico F<0.05 ECUACION TIENE
CARÁCTER PREDICTIVO.
No Rechazo si valor crítico F>0.05 ECUACION NO TIENE
CARÁCTER PREDICTIVO.
74
Ejemplo: CARGA
Una empresa dedicada a la producción de cierto artículo perecible XX desea
evaluar la relación existente entre la distancia recorrida para transportar su
producto a los diferentes puntos de comercialización y las mermas producidas por
dicho transporte. Con este fin, se lleva a cabo un estudio en el que se observan,
entre otras variables:
Y= porcentaje de carga útil final (luego del transporte)
X= Distancia recorrida (decenas de kilómetros)
Y se encuentra en una muestra aleatoria de 12 viajes o recorridos los siguientes
resultados:
75
VER: Excel
Diplomatura de Estudio
Internacional Empresarial
en Gestión de Operaciones
Estadística
76