Está en la página 1de 24

U1 ESTADÍSTICA

DESCRIPTIVA

1
¿Por qué son importantes las
medidas de dispersión?
Porque muestran los indicadores de qué tan dispersos se encuentran los datos entre sí, en un
rango determinado respecto a las medidas de tendencia central, asimismo se observa la
distribución, su vinculación y lo simétrico o asimétricos que resultan respecto al valor medio.

Más importante aún, al aplicarlos en tu campo profesional te permite entender el


comportamiento de una variable de manera confiable para desarrollar las estrategias necesarias
y lograr los objetivos propuestos.
Menor dispersión = datos más homogéneos (datos muy parecidos).
Mayor dispersión = datos menos homogéneos.
Menor dispersión = datos menos heterogéneos (datos no tan distintos).
Mayor dispersión = datos más heterogéneos.

2
Rango

Varianza

Medidas de dispersión
Desviación típica

Coeficiente de Variación

También suelen considerarse de dispersión:


Percentiles y Cuartiles, aunque en ciertas referencias
bibliográficas se manejan como medidas de localización.

3
Medidas de Localización
Percentiles

El percentil 𝑝 es un valor tal que por lo menos 𝑝 por ciento de


las observaciones son menores o iguales que este valor y por
lo menos (100 − 𝑝) por ciento de las observaciones son
mayores o iguales que este valor.

4
CÁLCULO DEL PERCENTIL 𝑝
Paso 1. Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
Paso 2. Calcular el índice (posición) 𝑖
𝒑
𝒊= 𝒏
𝟏𝟎𝟎
donde 𝑝 es el percentil deseado y 𝑛 es el número de observaciones.
Paso 3.
(a) Si 𝑖 no es un numero entero, debe redondearlo. El primer entero mayor que 𝑖 denota la posición
del percentil 𝑝.
(b) Si 𝑖 es un numero entero, el percentil 𝑝 es el promedio de los valores en las posiciones 𝑖 e 𝑖 + 1.

5
Suponga que la bolsa de trabajo de una universidad envía cuestionarios a los recién
egresados de la carrera de administración solicitándoles información sobre sus sueldos
mensuales iniciales. En la tabla se muestran los datos de 12 egresados.
a) En promedio ¿Cuál es el sueldo mensual inicial?
b) Determina el percentil 85 de estos sueldos iniciales.
c) Calcula el percentil 50.

6
Solución
a) Promedio (Media):
σ 𝑥𝑖
𝑥ҧ = = 3540
𝑛
b) Percentil 85
Datos ordenados

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730
3730 3925

𝑝 85
𝑖= ∗𝑛 = ∗12=10.2
100 100

El percentil 85 es el dato que se encuentra en la posición 11, es decir 3730. Entonces el 85% de los
sueldos iniciales es menor a 3730 y el 15% de los sueldos iniciales es mayor a 3730.

7
c) Percentil 50.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
3490 3520

50
Posición del percentil 50 𝑖 = ∗ 12 = 6 como el valor es entero, se debe calcular el promedio de
100
los valores en la posición 6 y 7,

3490 + 3520
= 3505,
2

Que coincide con la mediana.

8
Cuartiles
Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada
parte contiene una cuarta parte o 25% de las observaciones. En la figura se
muestra una distribución de datos dividida en cuatro partes. A los puntos de
división se les conoce como cuartiles y están definidos como sigue:
𝑸𝟏 primer cuartil, o percentil 25
𝑸𝟐 segundo cuartil, o percentil 50
𝑸𝟑 tercer cuartil, o percentil 75

9
Los cuartiles sólo son percentiles determinados; así que los pasos para
calcular los percentiles también se emplean para calcular los cuartiles.
Ejercicio. De la tabla de los sueldos iniciales, calcula los cuartiles 𝑄1 , 𝑄2 y 𝑄3 .

10
Ejercicio 1
El Dow Jones Travel Index informa sobre lo que pagan por noche en un hotel en las principales
ciudades de Estados Unidos los viajeros de negocios (The Wall Street Journal, 16 de enero de 2004).
Los precios promedio por noche en 20 ciudades son los siguientes:

11
a. ¿Cuál es la media en el precio de estas habitaciones?

b. ¿Cuál es la mediana en el precio de estas habitaciones?

c. ¿Cuál es la moda?

d. ¿Cuál es el primer cuartil?

e. ¿Cuál es el tercer cuartil?

12
Ejercicio 2
La empresa Walt Disney compró en 7.4 mil millones de dólares Pixar Animation
Studios Inc. (CNNMoney.com 24 de enero de 2006). A continuación se presentan
las películas animadas producidas por cada una de estas empresas (Disney y
Pixar). Las ganancias están en millones de dólares. Calcule las ganancias totales,
la media, la mediana y los cuartiles para comparar el éxito de las películas
producidas por ambas empresas. ¿Sugieren dichos estadísticos por lo menos una
razón por la que Disney haya podido estar interesada en comprar Pixar?

Analiza la media para las películas de Disney y las de Pixar por separado y de cada
una calcula el cuartil 3.

13
14
3.1. Medidas de dispersión (o variabilidad) en muestras pequeñas y grandes
Rango 𝑹 Varianza muestral 𝝈𝟐 Desviación Típica Coeficiente de variación
(o estándar)
La medida de Está basada en la Se define como la raíz Esta medida indica cuán grande es la
variabilidad más diferencia entre el cuadrada positiva de la desviación estándar en relación con la
sencilla es el rango, valor de cada varianza. Se suele media y se representa como porcentaje:
pues sólo considera observación 𝑥𝑖 y la denotar como 𝒔 para la
dos datos de la media 𝑥ҧ por medio de desviación estándar
muestra, el valor la fórmula: muestral y 𝝈 para la
mayor menos el valor desviación estándar 𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒕í𝒑𝒊𝒄𝒂
menor: σ 𝒙𝒊 − 𝒙
ഥ 𝟐 poblacional. 𝑪𝑽 = × 𝟏𝟎𝟎 %
𝑴𝒆𝒅𝒊𝒂
𝒔𝟐 =
𝒏−𝟏
Desviación muestral:
Donde 𝑛 es el número
𝑹 = 𝑴𝒂𝒚𝒐𝒓 − 𝑴𝒆𝒏𝒐𝒓 de observaciones 𝒔= 𝒔𝟐
(datos),
Desviación poblacional:

𝝈= 𝝈𝟐

15
Ejercicio 3.
Calcula el rango, varianza, desviación típica y coeficiente de variación
con los datos de los sueldos iniciales:

16
EJERCICIO 4
Las calificaciones del primer parcial de 26 estudiantes de Licenciatura en Administración una
Universidad privada se muestran a continuación:

8 8 8 3
9 10 0 4
6 3 10
10 3 7
0 7 0
8 8 9
5 5 10
8 2 8

Calcula la media, el rango, varianza, desviación estándar y coeficiente de variación.


¿Qué se puede concluir sobre el desempeño, en general, de los estudiantes?

17
Rango intercuartílico
Una medida que no es afectada por los valores extremos es el rango intercuartílico
(RIC). Esta medida de variabilidad es la diferencia entre el tercer cuartil Q3 y el
primer cuartil Q1. En otras palabras, el rango intercuartílico es el rango en que se
encuentra el 50% central de los datos.

𝐼𝑄𝑅 = 𝑄3 − 𝑄1

18
Ejemplo
En los datos de los sueldos mensuales iniciales, los cuartiles 1 y 3 son:

Por lo que el rango intercuartílico es: 3600 − 3465 = 135.

19
Medidas de la forma de la distribución, de la
posición relativa y de la detección de las
observaciones atípicas.
Se han descrito ya varias medidas de localización y de variabilidad de los datos. Además de estas
medidas se necesita una medida de la forma de la distribución. En la unidad 1 se vio que un
histograma es una representación gráfica que muestra la forma de una distribución.

Una medida numérica importante de la forma de una distribución es el sesgo.

20
Forma de la distribución
En la figura se muestran cuatro
histogramas elaborados a partir de
distribuciones de frecuencias relativas.
Los histogramas A y B son
moderadamente sesgados.
El histograma A es sesgado a la izquierda,
su sesgo es -0.85. El histograma B es
sesgado a la derecha, su sesgo es +0.85. El
histograma C es simétrico; su sesgo es 0.
El histograma D es muy sesgado a la
derecha; su sesgo es 1.62.

21
Fórmula para calcular el sesgo de datos
muestrales:
3
𝑛 𝑥𝑖 − 𝑥ҧ
𝑆𝑒𝑠𝑔𝑜 = ෍
(𝑛 − 1)(𝒏 − 𝟐) 𝑠

Si los datos están sesgados a la izquierda, el sesgo es negativo; en datos sesgados a la


derecha, el sesgo es positivo. Si los datos son simétricos, el sesgo es cero.
En una distribución simétrica, la media y la mediana son iguales. Si los datos están
sesgados a la derecha, la media será mayor que la mediana; si los datos están
sesgados a la izquierda, la media será menor que la mediana.

22
EJERCICIO 5
1.Del ejercicio 4 que muestra las calificaciones del primer parcial de la materia de estadística de 26
estudiantes de Licenciatura en Administración de una Universidad Privada. Realiza una histograma,
calcula la media, la mediana y su sesgo.
8 8 8 3
9 10 0 4
6 3 10
10 3 7
0 7 0
8 8 9
5 5 10
8 2 8

23
Algunas Referencias Bibliográficas:
Walpole y Ronald E. (1999). Probabilidad y Estadística para Ingenieros. México,
Prentice Hall Hispanoamericana, S.A.
Anderson, D. Sweeney, D. y Williams, T. (2008). Estadística para Administración y
Economia. México, Cengage Learning Editores, S.A.
Mendenhall, Beaver, Beaver, (2010). Introducción a la Probabilidad y Estadística.
Cengage learning inc, S.A. de C.V.

24

También podría gustarte