Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MEDIDAS RESUMEN
Medidas de la tendencia central (Media, Mediana y Modo)
Media aritmética (promedio) : suma de todos los valores de la variable
dividido el total de observaciones.
̅
Propiedades de la media aritmética:
1) En su cálculo intervienen todas y cada una de las observaciones.
2) La suma de los desvíos, formados entre cada valor de la variable
menos su media aritmética, estén estos multiplicados o no por las
frecuencias absolutas, es siempre igual a cero, es decir:
̅ 0
Desventajas:
1)En las distribuciones con datos agrupados, donde existen intervalos
de clase abiertos, es decir límite inferior del primero y/o límite superior
del último sin definir, no puede calcularse la media aritmética.
2)El valor de la media aritmética se ve afectado por los valores
extremos de la distribución.
Ejemplo: en una habitación se encuentra dos niños de 5 años, tres de
!" !# $ %"&
10 años y un anciano de 90 años.
5 2
5.2 10.3 90
̅ 22 ñ
6
10 3
90 1
Como vemos este valor no es representativo del grupo.
Mediana:
Dada una sucesión de n valores ordenados en forma creciente, se
define como Mediana de dicha sucesión, al valor de la misma que la
divide en dos partes iguales, o bien que deja por debajo o por encima
de él al 50% de las observaciones.
En el ejemplo de arriba, tendríamos :
5 5 10 10 10 90 como n=6 es par , se toma el promedio
de los valores centrales,
10 10
10
2
Este valor obtenido como medida resumen del grupo, es más
representativo.
Ventajas e inconvenientes.
- Es la medida más representativa en el caso de variables que solo
admitan la escala ordinal.
-Es fácil de calcular.
-En la mediana solo influyen los valores centrales y es insensible a los
valores extremos u outliers.
- En su determinación no intervienen todos los valores de la variable.
- Cuando la sucesión de valores está compuesta por un número de
elementos que resulte difícil en detallar en forma ordenada a la
sucesión para determinar la mediana, se hace uso de las frecuencias
acumuladas (Fa). Para ello se calcula previamente el orden de la
mediana. ( ' )
2
Ejemplo : Edad fi Fa
5 2 2
10 3 5
90 1 6
6
ºMe = 6 / 2 = 3 que lo acumula la Fa=5, luego la Me=10 años
Modo :
Se define como Modo (o Moda) de una distribución, a aquél valor de
la variable para el cual se presenta la máxima frecuencia absoluta.
En el ejemplo propuesto, el Mo= 10.
∑ log x i
log xg = i
n
Mg = antilog. ∑ log. Xi
n
Ventajas
Considera todos los valores de la distribución.
Es menos sensible que la media aritmética a los valores extremos.
Desventajas
- Es de significado estadístico menos intuitivo que la media
aritmética.
- Su cálculo es más difícil.
- Solo para valores positivos.
Calculo de la Media aritmética, Mediana y Modo para datos
agrupados.
Ejemplo: alturas mínimas de mareas en el Puerto Rawson
LI LS xi fi Ri Fa Ra
Media aritmética ( ̅ )
̅ ( , donde = punto medio del intervalo de clase
y = frecuencia absoluta en cada intervalo.
̅ 0,87 m
Mediana (Me)
80
'
40
2 2
Primero se calcula el orden de la mediana
Que estaría contenido en la Fa= 48. Pero esto nos lleva a un intervalo
de clase, luego debemos calcular la penetración al intervalo (P).
'
,-. / donde ,-. = frecuencia acumulada anterior a
+
a la que contiene el orden.
h= amplitud del intervalo
= frecuencia absoluta del intervalo donde cae
la mediana.
40 20 . 0,225
+ 0,16
28
01 + =0,675+0,16=0,835 (el 50% de los datos son menores o
Iguales a 0,835m)
Modo (Mo)
Observamos que la máxima frecuencia absoluta es 28 , esto nos lleva
a un intervalo de clase dentro del cual se encontrará el valor del modo.
3 28 13 . 0,225
+ / 0,12
3 34 28 13 28 15
Luego
01 + 0,675 0,12 0,795
Medidas de Variabilidad
Ya hemos visto que con las medidas de la Tendencia Central (en
especial con la media aritmética) de una distribución empírica,
establecíamos la “posición” de la misma respecto al campo de
variación de la variable bajo estudio.
Lo que queremos ahora, es conocer el mayor o menor grado de
concentración de los valores observados alrededor de la media
aritmética ( ̅ ).
Varianza o variancia :
En la Población En la muestra
N n
1 1
σ =
2
∑ i
( x − µ ) 2
σˆ 2 = ∑ ( x − x ) 2
n − 1 i =1
i
N i =1
Desvío Estándar o desvío típico : es un promedio de las desviaciones
individuales de cada observación con respecto a la media de una
distribución.
Mide el grado de dispersión o variabilidad
sˆ = sˆ 2
Coeficiente de Variación (CV):
Este coeficiente es el que definitivamente mide la homogeneidad o
heterogeneidad de una distribución.
Es igual al cociente entre el desvío estándar y la media aritmética,
multiplicada por 100 para expresarlo en porcentaje.
=
;< ⋅ 100 0 25% HOMOGENEA
>
En la población
25% 50% CUASIHOMOGENEA
50% 75% CUASIHETEROGENEA
=@ 75% HETEROGENEA
;< ⋅ 100
̅
En la muestra
As = 3
orden 3)
Ŝ
Asimetría positiva (o a la derecha): si la “cola” a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más
separados de la media a la derecha.
Asimetría negativa (o a la izquierda): si la “cola” a la izquierda de la
media es más larga que la de la derecha, es decir, si hay valores más
separados de la media a la izquierda.
Curtosis (K): esta medida determina el grado de concentración que
presentan los valores en la región central de la distribución.
QR
P - -3
Ŝ R
Clasificacion :
K>0 leptocurtica
K=o mesocurtica
K<0 platicurtica
Cuartiles : los cuartiles son los tres valores que dividen una serie de
datos ordenados en cuatro porciones iguales.
Para el Q3:
3 '
V ,-. /
P
YYY
Z
V YYY VYYY 01 +
4
Grafico de caja y bigotes:
La caja central cubre la mitad de los datos, extendiéndose desde el cuartil inferior hasta
el cuartil superior. Las líneas extendidas a izquierda y derecha de la caja (los bigotes)
muestran la localización del mayor y menor de los datos. La mediana (0,835) de los datos
está indicada por la línea vertical en el interior de la caja, mientras que el signo (+)
muestra la localización de la media aritmética (0,87725). El hecho de que el bigote
superior es algo más largo que el inferior, a la vez que la media es algo mayor que la
mediana, es indicativo de asimetría o sesgo (0,266056) positiva en los datos.