Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instrumentos y matriz
Medidas de de datos
Dispersión
Estadística Descriptiva
Profesor: Gonzalo Fernández
Fecha: 26/09/2017
LOGRO DE LA SESIÓN
Al finalizar la sesión, el
estudiante estará en la
capacidad de calcular e
interpretar medidas de
dispersión de datos
numéricos sin agrupar y
agrupados en tablas de
frecuencias.
Sesión 6: Medidas de dispersión
•Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
Moda Varianza
Desviación Estándar
Cuartiles
Coeficiente de Variación
Percentiles
¿Qué son las Medidas de Dispersión?
¿Cómo sabré si un
•Son las que miden el grado de promedio es confiable?,
concentración o dispersión de los o si los datos están
concentrados.
valores de una variable en torno
de un promedio.
Los más utilizados son:
•Rango o Recorrido
•Recorrido Intercuartílico (RIC)
•Varianza y Desviación estándar
•Coeficiente de Variación
Variabilidad o Dispersión
Baja dispersión = Alta concentración=Datos
homogéneos.
Alta dispersión = Baja concentración=Datos
heterogéneos.
Imagen visual de la Distribución de la variable
• Medidas de dispersión
dan información sobre
la dispersión o
variabilidad de los
datos. Mismo centro,
Variación diferente
Variabilidad o Dispersión
Miden el grado de dispersión de los datos.
Rango 8 1 7
– Es muy sensible a los valores extremos.
Rango Intercuartílico Q3 Q1
– No es tan sensible a valores extremos.
Ejemplo: DVD - Satisfacción
Niveles de satisfacción de 20 clientes:
1 3 5 5 7 8 8 8 8 8 8 9 9 9 9 9 10 10 10 10
n=20
Me = (8+8)/2 = 8
Q1 Q2 Q3
25% 25% 25% 25%
Ejemplo: Rango Intercuartílico (RIC)
Las puntuaciones de un exámen de15 estudiantes se listan abajo.
Halle el primer, segundo y tercer cuartíl de las puntuaciones, y el RIC.
28 43 48 51 43 30 55 44 48 33 45 37 37 42 38
Datos Ordenados: n=15
Mitad inferior Mitad Superior
28 30 33 37 37 38 42 43 43 44 45 48 48 51 55
Q1 Q2 Q3
n
2
S
2 1
(n1) i 1
( xi ) n( X )
2
Desviación estándar muestral:
Es la raíz cuadrada de la varianza.
S Var ( x)
Fórmula alternativa para s2
Ejemplo: Los pesos (en libras) de una muestra de cinco
cajas que se envían por UPS (empresa de mensajería)
son los siguientes: 12, 6, 7, 3 y 10. Calcule la varianza y
la desviación estándar.
Varianza muestral S2 :
• Solución:
1,4035
• Media = 2.1667 CV ( x ) 100 64,7759%
• Desv. Estándar = 1.4035 2,1667
• Máquina B:
10.22
• Media = 40.8 CV ( y ) 100 25.05%
40.8
• Desv. Estándar = 10.22
Asimétrica Asimétrica
Simétrica
Izquierda Derecha
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Boxplots: Aplicación
El índice fog se utiliza para medir la dificultad para leer un texto escrito:
cuanto más alto es el valor del índice, más difícil es el nivel de lectura.
Se toman muestras aleatorias independientes de 6 anuncios de
Scientific American, Fortune y New Yorker. Se miden los índices fog de
los 18 anuncios y se anotan en la Tabla siguiente.
Scientific
Fortune New Yorker
American
Grupos de comparación:
Varianza 7,005
Scientific Coeficiente
0,241229
American Variación
Rango 7,55
Amplitud 3,63
intercuartil
Varianza 1,445
Coeficiente
New Yorker 0,192103
Variación
Rango 3,61
Amplitud 2,34
33 intercuartil
Boxplots: Problema
Se llevó a cabo una encuesta entre los miembros del Club del libro del mes,
para verificar si pasan más tiempo viendo televisión que leyendo. Suponga
que en una muestra de 15 encuestados se obtuvieron las horas semanales
que se dedican a ver televisión y las que se dedican a la lectura.