Está en la página 1de 19

Sesión 4

Medidas de Tendencia
Central y de Dispersión
Junio, 2022
Objetivos de la
sesión
Comprender los conceptos relacionados
Part 1 con dispersión muestral.

Calcular medidas de asociación y


Part 2 correlación de un conjunto de datos.

Resultados del aprendizaje: Que los estudiantes puedan


utilizar medidas de dispersión y asociación
Coeficiente de variación
CHOL: colesterol, WT: Peso (Kg), HT: Altura (cm), DBP: Presión diastólica, SBP: Presión sistólica CHOL
Var= 3082,92
Sd= 55,52
Media= 258,10
CV= 21,51

WT SPB
Var= 709,67 Var= 328.14
Sd= 26,64 Sd= 18.11
Media= 168,07 Media= 124,7
CV= 15,85 CV= 14,52
HT
Var= 7,66
Sd= 2,77
Media= 68,16
CV= 4,06
Varianza, desviación estándar, rango de la muestra
Variación

Rango Rango Varianza Desviación Coeficiente de


Intercuartílico Estándar Variación
R = X (n ) − X (1) Varianza
Poblacional Desviación 𝑠𝑠
RI = Q(3 ) − Q(1) Estándar
𝑉𝑉 = 100
𝑥𝑥̅
N
Poblacional
∑ i
(x − μ) 2

σ2 = i=1
2
N σ= σ
Varianza Desviación
Muestral Estándar
n
Muestral
∑ i
(x − x ) 2
2
2
s = i =1 s= s
n -1

57

Estadística para Ingenierías


Sesgo y kurtosis
El sesgo de una distribución es su grado de “asimetría” o el grado en el que se aleja de la
“simetría”. Podemos tener 2 tipos de sesgo:
Asimetría positiva (sesgo positivo): indica que las frecuencias se agrupan en el extremo
inferior de la escala y la cola se extiende a la derecha.
Asimetría negativa (sesgo negativo): indica que la cola de la distribución se extiende a la
izquierda, con la mayoría de frecuencias agrupadas en el extremo superior de la escala.

𝟑𝟑
𝟏𝟏 �
𝑿𝑿𝒊𝒊 − 𝑿𝑿
𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺 = 𝑨𝑨𝒌𝒌 = � 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
𝒏𝒏 𝒔𝒔 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 S𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
𝑋𝑋� > 𝑀𝑀𝑀𝑀𝑀𝑀 > 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑋𝑋� = 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑋𝑋� < 𝑀𝑀𝑀𝑀𝑀𝑀 < 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀

𝐴𝐴𝑘𝑘 > 0 𝐴𝐴𝑘𝑘 = 0 𝐴𝐴𝑘𝑘 < 0


Sesgo y kurtosis

Evalúa el grado apuntamiento/planitud de la distribución. Se pueden dar tres tipos de


apuntamiento:
Mesocúrtica: Una distribución normal tiene kurtosis exactamente igual a 0. Si alguna
distribución tiene kurtosis ≈ 0, se denomina mesocúrtica
Leptocúrtica: Comparada a la distribución normal, su pico central es más alto y agudo;
mientras las colas son más largas.
Platicúrtica: En comparación a la distribución normal, su pico central es más bajo y más
ancho, y sus colas son más delgadas.

𝟒𝟒
𝟏𝟏 �
𝑿𝑿𝒊𝒊 − 𝑿𝑿
𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊𝐊 = 𝑲𝑲𝒖𝒖 = � − 𝟑𝟑
𝒏𝒏 𝒔𝒔
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃
𝐾𝐾𝑢𝑢 = 0 𝐾𝐾𝑢𝑢 > 0 𝐾𝐾𝑢𝑢 < 0
•,-- -■
lnsesgada I .

, .•
■ •
I ' 1111

/ \

---- --· Distribución

/
1
.--- -- '• S e s g o P ositi vo (a la d e r e c h a )
Leptocúrl.ic

I

I Distribución
I
M§dia
/
l!I Mod

Distribución
Platicúrtic ,
Sesgo y kurtosis
Se desea realizar un estudio sobre la utilización del agua en tres zonas rurales (A, B y C).
Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6 de la zona B y 10
de la zona C. Luego se registró el número de litros de agua consumidos por un día, los
cuales se presenta en el siguiente cuadro. Se solicita calcular el sesgo y kurtosis.
Graficar.
Se desea realizar un estudio sobre la utilización del agua en tres zonas rurales (A, B y C).
Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6 de la zona B y 10
de la zona C. Luego se registró el número de litros de agua consumidos por un día, los
cuales se presenta en el siguiente cuadro. Se solicita calcular el sesgo y kurtosis.
Graficar.
Datos bivariados: Matriz de varianzas y covarianzas, Matriz de
correlación

Las técnicas estadísticas bivariantes


permiten el análisis conjunto de dos SUELDO
características de los individuos de una
población con el propósito de detectar CARGAS
posibles relaciones entre ellas. FAMILIARES
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (2)

Si dos variables están asociadas positivamente o se comportan igual, es decir


mientras X aumenta, Y también aumenta; o lo contrario mientras X disminuye, Y
también disminuye.
Esta medida de asociación se llama covarianza entre X y Y

� )(𝒀𝒀𝒊𝒊 − 𝒀𝒀
∑𝒏𝒏𝒊𝒊=𝟏𝟏(𝑿𝑿𝒊𝒊 − 𝑿𝑿 �)
𝒄𝒄𝒄𝒄𝒄𝒄 𝒙𝒙, 𝒚𝒚 = 𝑺𝑺𝒙𝒙𝒙𝒙 =
𝒏𝒏 − 𝟏𝟏
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (3)
La matriz de varianzas y covarianzas resume la variabilidad de los datos y la información respecto a la
relación lineal entre las variables. La matriz es cuadrada y simétrica de orden “K” (k variables). En la diagonal
se ubican las varianzas, mientras que en las no diagonales se ubican las covarianzas entre las variables…
Por definición:
𝑆𝑆12 𝑆𝑆12 ⋯ 𝑆𝑆1𝑘𝑘
𝑆𝑆21 𝑆𝑆22
𝑆𝑆 = ⋮ ⋱ ⋮ Para el caso de dos variables tendríamos una matriz 2x2

𝑆𝑆𝑘𝑘1 𝑆𝑆𝑘𝑘2 ⋯ 𝑆𝑆𝑘𝑘2

𝑆𝑆12 𝑆𝑆12
𝑆𝑆 =
𝑆𝑆21 𝑆𝑆22
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (4)
Ejemplo:

Y= Cargas
No X= Sueldo Necesitamos calcular la media y varianza de cada variable…
familiares
1 10 1
2 8 1 𝑋𝑋� = 24 𝑌𝑌� = 2,4
3 22 3 𝑆𝑆𝑥𝑥2 = 292 𝑆𝑆𝑦𝑦2 =1,8
4 30 3
5 50 4

10 − 24 1 − 2,4 + 8 − 24 1 − 2,4 + 22 − 24 3 − 2,4 + 30 − 24 3 − 2,4 + (50 − 24)(4 − 2,4)


𝑆𝑆𝑥𝑥𝑥𝑥 =
4
𝑆𝑆𝑥𝑥𝑥𝑥 = 21,5 La matriz de varianzas y covarianzas quedaría así: 𝑺𝑺 = 292 21,5
21,5 1,8
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (5)

Indicador de relaciones lineales entre dos variables X y Y de una misma muestra


Mide la “Fortaleza” de la relación lineal.

� )(𝒀𝒀𝒊𝒊 − 𝒀𝒀
∑𝒏𝒏𝒊𝒊=𝟏𝟏(𝑿𝑿𝒊𝒊 − 𝑿𝑿 �) 𝑺𝑺𝒙𝒙𝒙𝒙
𝒓𝒓𝒙𝒙𝒙𝒙 = 𝒓𝒓𝒙𝒙𝒙𝒙 =
∑(𝑿𝑿𝒊𝒊 − 𝑿𝑿 � )𝟐𝟐 ∑(𝒀𝒀𝒊𝒊 − 𝒀𝒀� )𝟐𝟐 𝑺𝑺𝒙𝒙 𝑺𝑺𝒚𝒚
Calcular el coeficiente de correlación del ejercicio anterior…
1 0,93
La matriz de correlación quedaría así: 𝐑𝐑 =
0,93 1
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (6)
Características del Coeficiente de Correlación

 No tiene unidad de medida.


 Varía entre -1 y 1.
 La cercanía a -1 indica fuerte relación lineal negativa.
 La cercanía a 1 indica fuerte relación lineal positiva.
 La cercanía a 0 indica débil relación lineal.
 +1 ó -1 son correlaciones perfectas.
Coeficiente de correlación de muestras
• El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo el sentido de
la relación:
• Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre
las dos variables denominada relación directa: cuando una de ellas aumenta, la otra
también lo hace en proporción constante.
• Si 0 < r < 1, existe una correlación positiva.
• Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos
variables.
• Si -1 < r < 0, existe una correlación negativa.
• Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la
otra disminuye en proporción constante.
3.5 Datos bivariados: Matriz de varianzas y covarianzas, Matriz
de correlación (7)
No hay relación Relación fuerte

y y

x x
y y

x x
Frecuencia Frecuencia
Marca De Frecuenci Frecuencia
Clase Absoluta Relativa
Clase a Absoluta Relativa
Acumulada Acumulada
[0, 5) 4
9
0,16
0,62
9 0,82
0,11
32,5

Taller grupo par: Se tiene la siguiente tabla de frecuencias, en la cual faltan algunos valores.
•Completar la Tabla de frecuencias (40 puntos)
•Calcule media y la varianza (20 puntos)
•Grafique la ojiva (20 puntos)
•Graficar el diagrama de cajas e indicar si existen datos atípicos (20 puntos)
Datos agrupados: Medidas de Tendencia Central, dispersión y posición
La tabla de frecuencias contiene los datos del número de artículos vendidos por
un almacén en 50 días, agrupados en 6 clases. Se conoce que la media es 40,4
Clase I. Clase Marca 𝒇𝒇𝒊𝒊 𝑭𝑭𝒊𝒊 𝒇𝒇𝒊𝒊 /𝒏𝒏 𝑭𝑭𝒊𝒊 /𝒏𝒏
1 2
2 0,24
3 [30 , 40) 12 0,48
4
5 47 0,94
6

Taller grupo impar: Completar la Tabla de frecuencias (40 puntos)


•Calcule media y la varianza (20 puntos)
•Grafique la ojiva (20 puntos)
•Graficar el diagrama de cajas e indicar si existen datos atípicos (20 puntos)

También podría gustarte