Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
1
Estadísticas de resumen importantes
Medidas de resumen
CA Caja y Valores
Bigotes Atípicos
VARIACIÓN
Rango Varianza
Desviación
Estandar
CV
Media aritmética Mediana Moda
M E x( k ) M o xi
n
x i Si n es impar
x i 1
n x( k ) x ( k 1 )
ME Si n es par
2
3
Rango Coeficiente de Asimetría
R max( xi ) min( xi )
3.( x Me )
CA
s
xi x i
2 2 Si CA>0 si la distribución es asimétrica a la derecha
x
s2 i 1
i 1
x2
n n Coeficiente de variabilidad
s
Desviación estandar CV 100%
x
4
PERCENTILES, DECILES O CUARTILES
El Percentil va de 1 a 100
P25: es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
D4: es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
Q3 es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
5
Diagrama de CAJA Y BIGOTES o BOXPLOT
xi < LI
1,5RIC
Q3
Q2 = Me RIC
Q1
1,5RIC
xi > LS
6
EJEMPLO: El consejo académico de un colegio aplicó una prueba de
conocimientos, entre 70 estudiantes elegidos al azar. El puntaje de dicha
prueba variaba de 1 a 200 para determinar su capacidad intelectual.
Los datos ordenados son:
Puntuaciones ORDENADAS
85 98 104 110 118 125 133
85 98 104 112 119 125 133
87 98 104 112 119 126 133
89 100 105 113 119 127 135
90 100 105 114 120 127 139
91 100 107 115 121 128 147
93 100 108 116 122 128 150
93 103 108 116 122 128 154
93 103 108 117 122 131 154
95 103 110 118 125 133 154
Se pide:
A) Hallar las medidas de tendencia central y las relativas.
B) Hallar las medidas de variabilidad.
C) Analizar la variabilidad y sesgo del conjunto de datos
D) Analizar la existencia de valores atípicos 7
Cuenta 70 Media 114,671429 CV 14,9162924 Q1 103
Suma 8027 Mediana 114,5 CA 0,03006688 Q3 125,75
Mínimo 85 Moda 100 y 133 RIC 22,75
Máximo 154 Varianza de la Li 68,875
Rango 69 muestra 292,571636 Ls 159,875
Desviación
estándar 17,1047255
Los datos muestrales presentan poca variabilidad (15%) y una asimetría despreciable
(0,03) por lo que se puede decir que no presenta sesgo.
Por lo tanto, la medida de tendencia central que mejor representara a este conjunto
de datos es la media.
El conjunto de datos no presenta valores atípicos.