Está en la página 1de 29

Objetivo:

Para esta semana:

*Distinguir las principales medidas de


dispersión para datos no agrupados y
agrupados en el área de las ciencias
sociales.
Con la finalidad de responder la pregunta planteada,
estudiemos que son, como se calculan y como se
interpretan las:

Medidas dispersión y de
forma de las
distribuciones o medidas
de distribución.
Vamos a tratar de responder la pregunta:

¿De qué manera las medidas de


dispersión te dan los elementos
suficientes para afirmar o rechazar una
suposición?
Medidas que, con la ayuda de las tablas y gráficos de datos
numéricos, nos permiten describir la distribución de frecuencia de
esos datos y a través de ellas poder interpretar, analizar y
comparar las variables. Se les conoce con el nombre de medidas
descriptivas y dentro de ellas se encuentran:

*Medidas de dispersión: desviación


estándar, varianza, coeficiente de
variación, rango.
*Medidas de distribución: simetría y
kurtosis o curtosis (atributos de las
distribuciones muéstrales debido a la
dispersión), y teorema de Chebyschev.
¿Qué son medidas de dispersión?
Son valores que miden cómo se
encuentran dispersos los datos, de la
población o de la muestra, con respecto
a los valores centrales.
VEAMOS:

Rango es la diferencia entre el valor mayor y el valor menor


del set de datos.
Varianza: Es el promedio de los cuadrados de las diferencias
entre cada dato de la muestra y la media del set de datos.
Desviación Estándar: es la raíz cuadrada de la varianza.
Coeficiente de variación: representa cuanta cantidad de
desviación estándar, respecto a la media, existe para el
conjunto de datos.
Curtosis: Su valor señala la dispersión de los datos respecto
a la media y señala el grado de apuntalamiento de la curva de
distribución del set de datos de la muestra.
Fue seleccionada una muestra aleatoria de seis estudiantes a quienes se
les aplicó un examen de memoria. Las calificaciones fueron:
6, 9, 5, 4, 7 y 5.

a) Determina el rango.
b) Determina la varianza y la desviación estándar.
c) Determina el coeficiente de variación.
Rango: Valor mayor menos valor menor (9 – 4) = 5 rango=5

Para determinar la Varianza muestral primero es necesario determinar la


media muestral:
=∑x/n
Determinemos primero la media ∑= 6+9+5+4+7+5 = 36 hay 6 valores o
sea n = 6 entonces la media
Siguiendo la secuencia de las operaciones anteriores
podemos definir :

VARIANZA MUESTRAL: el promedio ajustado del cuadrado de las


diferencias entre la media muestral y cada valor de la muestra, utilizando
como denominador n-1.
En consecuencia,

VARIANZA POBLACIONAL: es el promedio del cuadrado de las


diferencias entre la media poblacional y cada valor de la población,
utilizando como denominador N.

Sigamos las siguientes ecuaciones:


MEDIDAS DE DISPERSIÓN:
OTRO UN EJEMPLO: En una tienda de celulares fue seleccionada una
muestra aleatoria durante 11 días de atención, para conocer cuantos iPhone 11
Pro-Max Gold son vendidos por día.
a) Determina el rango. b) Determina la varianza y la desviación estándar. C)
Determina el coeficiente de variación.
Formula para calcular la media de datos libres

Formula para calcular la media de datos agrupados


Para determinar la Varianza muestral primero
es necesario, fundamental, determinar la media
muestral: Determinemos la media:
Clientes
Día atendidos por
hora
1 14
2 9
3 7
4 11
5 10
6 7
 = 110/11 = 10  = 10 7 9
8 11
9 15

a) RANGO= 15 – 7 = 8 10
11
9
8
110
LUEGO DE CALCULAR LA MEDIA, PROCEDEMOS
A CALCULAR LA VARIANZA (2 ) PARA LA
MUESTRA:

Y LUEGO LA DESVIACIÓN ESTÁNDAR

Para la población habría sido:  = 2


B) Determina la varianza y la desviación estándar.
Clientes
Día atendidos X- Diferencia (X - )2
por hora  = 110/11 = 10

1 14
14-10=4 -4 16
2 9 9-10=-1 -1 1
3 7 7-10=-3 -3 9
4 11 11-10=1 1 1
5 10 10-10=0 0 0
6 7 7-10=-3 -3 9
7 9 9-10=-1 -1 1
8 11 11-10=1 1 1
9 15 15-10=5 5 25
10 9 9-10=-1 -1 1
11 8 8-10=-2 -2 4
n = 11 110 68
 =10 n-1 = 11 – 1 = 10
Varianza: S2 = 68/10 = 6,8 S2 = 6,8

Desviación Estándar: S = √ 6,8= 2,61 S =2,61


No clase clases xi fi x i * fi   - xi ( - xi)2 (-xi)2 fi
1 0-6 3 140 420 23.266 20.266 410.710756 57499.506
2 7 - 13 10 100 1000 23.266 13.266 175.986756 17598.676
3 14 - 20 17 44 748 23.266 6.266 39.262756 1727.561
4 21 - 27 24 60 1440 23.266 -0.734 0.538756 32.325
5 28 -34 31 76 2356 23.266 -7.734 59.814756 4545.921
6 35 -41 38 90 3420 23.266 -14.734 217.090756 19538.168
7 42 - 48 45 56 2520 23.266 -21.734 472.366756 26452.538
8 49 - 55 52 44 2288 23.266 -28.734 825.642756 36328.281
610 14192 163722.9772

∑ (-xi)2 fi
163.722,98
S2 = S2 = = 268.40 S = √ S2 = 16.38
∑ fi 610

14192
Nota: xi = mi = mj
 = = 23.27
dependiendo del
610
autor.
Datos agrupados de una muestra o población ( o también
distribución de frecuencias agrupadas):

Cuando los datos son muchos es aconsejable ordenarlos en una tabla


de frecuencias agrupadas.

Veamos el siguiente ejemplo y utilicemos la siguiente ecuación:

∑ (-xi)2 fi
S2 =
∑ fi
Dónde:
 es la media de la muestra
xi es el centro de clase o marca de clase
fi es la frecuencia de clase
S2 es la varianza
∑ es la sumatoria de los elementos (i) o número de clase desde 1 hasta la última.
Hasta ahora en el ejercicio B =10
tenemos: s =2.61

Coeficiente de variación (Cv) representa la proporción


porcentual de la desviación estándar respecto al valor absoluto
de la media. No tiene unidad de medida.

En nuestro ejemplo:

Coeficiente de variación (Cv) = (2.61/10) x 100= 26.10%


Asimetría:

La asimetría es positiva cuando se cumple:

La asimetría es negativa cuando se cumple:

Se calcula mediante la ecuación:

Se supone que en una distribución normal perfecta la mediana y la media


deben coincidir, o sea simétrica, en este caso debe emplearse la media.

Cuando la distribución es asimétrica, la media proporciona una


información falsa de la tendencia central.
Curtosis:
Este coeficiente (g2) determina el grado de concentración
alrededor de la media que presentan los valores en la región
central de la distribución.
Se calcula mediante la
ecuación :
Pueden considerarse 3 tipos de respuestas dependiendo de los
valores resultantes como mayor de 0 (leptocúrtica), igual a 0
(mesocúrtica) o menor de 0 (platicúrtica), aceptable hasta ±
0.5 en ambos coeficientes
Distribución normal o curva normal tipificada:
Dónde: µ =0
σ=1
q= 68.20 %

q = 95.40 %
UTILES PARA DETERMINAR LA TENDENCIA DEL
TIPO DE DISTRIBUCIÓN DEL CONJUNTO DE DATOS
EN LA MUESTRA.

SIMETRIA
CURTOSIS:
Su valor muestra el grado de apuntalamiento
de la curva de dispersión del set de datos.
HASTA LUEGO
ESTIMADOS
ESTUDIANTES,
ESTAMOS
AL
PENDIENTE.

También podría gustarte