Está en la página 1de 28

MEDIDAS ESTADISTICAS

MEDIDAS RESUMEN
Medidas de la tendencia central (Media, Mediana y Modo)
Media aritmética (promedio) : suma de todos los valores de la variable
dividido el total de observaciones.
̅
Propiedades de la media aritmética:
1) En su cálculo intervienen todas y cada una de las observaciones.
2) La suma de los desvíos, formados entre cada valor de la variable
menos su media aritmética, estén estos multiplicados o no por las
frecuencias absolutas, es siempre igual a cero, es decir:

̅ 0

Desventajas:
1)En las distribuciones con datos agrupados, donde existen intervalos
de clase abiertos, es decir límite inferior del primero y/o límite superior
del último sin definir, no puede calcularse la media aritmética.
2)El valor de la media aritmética se ve afectado por los valores
extremos de la distribución.
Ejemplo: en una habitación se encuentra dos niños de 5 años, tres de
!" !# $ %"&
10 años y un anciano de 90 años.
5 2
5.2 10.3 90
̅ 22 ñ
6
10 3
90 1
Como vemos este valor no es representativo del grupo.
Mediana:
Dada una sucesión de n valores ordenados en forma creciente, se
define como Mediana de dicha sucesión, al valor de la misma que la
divide en dos partes iguales, o bien que deja por debajo o por encima
de él al 50% de las observaciones.
En el ejemplo de arriba, tendríamos :
5 5 10 10 10 90 como n=6 es par , se toma el promedio
de los valores centrales,
10 10
10
2
Este valor obtenido como medida resumen del grupo, es más
representativo.
Ventajas e inconvenientes.
- Es la medida más representativa en el caso de variables que solo
admitan la escala ordinal.
-Es fácil de calcular.
-En la mediana solo influyen los valores centrales y es insensible a los
valores extremos u outliers.
- En su determinación no intervienen todos los valores de la variable.
- Cuando la sucesión de valores está compuesta por un número de
elementos que resulte difícil en detallar en forma ordenada a la
sucesión para determinar la mediana, se hace uso de las frecuencias
acumuladas (Fa). Para ello se calcula previamente el orden de la
mediana. ( ' )
2
Ejemplo : Edad fi Fa
5 2 2
10 3 5
90 1 6
6
ºMe = 6 / 2 = 3 que lo acumula la Fa=5, luego la Me=10 años
Modo :
Se define como Modo (o Moda) de una distribución, a aquél valor de
la variable para el cual se presenta la máxima frecuencia absoluta.
En el ejemplo propuesto, el Mo= 10.

Ventajas y desventajas del modo.


- Puede determinarse para todos los niveles de datos: nominal,
ordinal y de intervalo . No se ve afectada por los valores muy altos
o muy bajos.
- Puede utilizarse como medida de tendencia central para
distribuciones con clases de extremos abierto.
- Para muchos conjuntos de datos no hay valor modal porque
ningún valor aparece más de una vez.
- Para algunos conjuntos de datos hay más de un modo
(bimodal=que tiene dos modas)
Media geométrica

∑ log x i
log xg = i
n
Mg = antilog. ∑ log. Xi
n
Ventajas
Considera todos los valores de la distribución.
Es menos sensible que la media aritmética a los valores extremos.
Desventajas
- Es de significado estadístico menos intuitivo que la media
aritmética.
- Su cálculo es más difícil.
- Solo para valores positivos.
Calculo de la Media aritmética, Mediana y Modo para datos
agrupados.
Ejemplo: alturas mínimas de mareas en el Puerto Rawson
LI LS xi fi Ri Fa Ra

0,0 0,225 0,1125 3 0,0375 3 0,0375


0,225 0,45 0,3375 4 0,0500 7 0,0875
0,45 0,675 0,5625 13 0,1625 20 0,2500
0,675 0,9 0,7875 28 0,3500 48 0,6000
0,9 1,125 1,0125 15 0,1875 63 0,7875
1,125 1,35 1,2375 8 0,1000 71 0,8875
1,35 1,575 1,4625 6 0,0750 77 0,9625
1,575 1,8 1,6875 3 0,0375 80 1,0000
TOTAL 80 1,0000 ------ ------

Media aritmética ( ̅ )
̅ ( , donde = punto medio del intervalo de clase
y = frecuencia absoluta en cada intervalo.
̅ 0,87 m
Mediana (Me)
80
'
40
2 2
Primero se calcula el orden de la mediana
Que estaría contenido en la Fa= 48. Pero esto nos lleva a un intervalo
de clase, luego debemos calcular la penetración al intervalo (P).

'
,-. / donde ,-. = frecuencia acumulada anterior a
+
a la que contiene el orden.
h= amplitud del intervalo
= frecuencia absoluta del intervalo donde cae
la mediana.
40 20 . 0,225
+ 0,16
28
01 + =0,675+0,16=0,835 (el 50% de los datos son menores o
Iguales a 0,835m)
Modo (Mo)
Observamos que la máxima frecuencia absoluta es 28 , esto nos lleva
a un intervalo de clase dentro del cual se encontrará el valor del modo.

3 28 13 . 0,225
+ / 0,12
3 34 28 13 28 15

3 = diferencia entre la máxima frecuencia absoluta y la inmediata


anterior.
34 diferencia entre la máxima frecuencia absoluta y la inmediata
posterior .

Luego
01 + 0,675 0,12 0,795
Medidas de Variabilidad
Ya hemos visto que con las medidas de la Tendencia Central (en
especial con la media aritmética) de una distribución empírica,
establecíamos la “posición” de la misma respecto al campo de
variación de la variable bajo estudio.
Lo que queremos ahora, es conocer el mayor o menor grado de
concentración de los valores observados alrededor de la media
aritmética ( ̅ ).
Varianza o variancia :

En la Población En la muestra
N n
1 1
σ =
2
∑ i
( x − µ ) 2
σˆ 2 = ∑ ( x − x ) 2

n − 1 i =1
i
N i =1
Desvío Estándar o desvío típico : es un promedio de las desviaciones
individuales de cada observación con respecto a la media de una
distribución.
Mide el grado de dispersión o variabilidad

sˆ = sˆ 2
Coeficiente de Variación (CV):
Este coeficiente es el que definitivamente mide la homogeneidad o
heterogeneidad de una distribución.
Es igual al cociente entre el desvío estándar y la media aritmética,
multiplicada por 100 para expresarlo en porcentaje.

=
;< ⋅ 100 0 25% HOMOGENEA
>
En la población
25% 50% CUASIHOMOGENEA
50% 75% CUASIHETEROGENEA
=@ 75% HETEROGENEA
;< ⋅ 100
̅
En la muestra

Dada la hibrides de su resultado (exento de unidad de medida), su


uso más importante se encuentra en la comparación de dos o más
series estadísticas que se refieran al comportamiento de variables
medidas en distinta unidad de medida.
Medidas de Sesgo:
Dada la importancia que ciertas y determinadas Distribuciones
teóricas de Probabilidad (fundamentalmente la ley Normal de
Laplace-Gauss) tienen en el estudio de las distribuciones empíricas, es
que se introduce el concepto y medición de la asimetría y curtosis que
ellas presentan respecto de la distribución Normal.
Asimetría:
Si una distribución es simétrica existe el mismo número de valores a la
derecha que a la izquierda de la media, por tanto, el mismo número
de desviaciones con signo positivo que con signo negativo.
Fórmula de la asimetría :
̅ O
>O (
µ 3 (momento centrado de

As = 3
orden 3)


Asimetría positiva (o a la derecha): si la “cola” a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más
separados de la media a la derecha.
Asimetría negativa (o a la izquierda): si la “cola” a la izquierda de la
media es más larga que la de la derecha, es decir, si hay valores más
separados de la media a la izquierda.
Curtosis (K): esta medida determina el grado de concentración que
presentan los valores en la región central de la distribución.

QR
P - -3
Ŝ R
Clasificacion :

K>0 leptocurtica
K=o mesocurtica
K<0 platicurtica

Con este coeficiente se determina en que medida la distribución


empírica excede o no al valor modal del modelo Normal, es decir que
quizás la distribución bajo estudio puede ser simétrica pero ser más
“achatada” o más “empinada” que la Normal.
Porcentaje de observaciones en ( ̅ U & )
Medidas de Posición:
Las medidas de posición dividen un conjunto de datos en grupos con
el mismo número de individuos.
Para datos no agrupados es necesario previamente que los datos
estén ordenados de menor a mayor.

Cuartiles : los cuartiles son los tres valores que dividen una serie de
datos ordenados en cuatro porciones iguales.

El primer cuartil (Q1) deja a la izquierda el 25% de los datos.


El segundo cuartil (Q2) deja a la izquierda y derecha el 50% de los
datos y coincide con la Me.
El tercer cuartil (Q3) deja a la izquierda el 75% de los valores.
Para datos agrupados:
Para el Q1:
'
V ,-. /
P
W
'
V W VY 01 +
4

Para el Q3:

3 '
V ,-. /
P
YYY
Z
V YYY VYYY 01 +
4
Grafico de caja y bigotes:

Resumen Estadístico para ALTURA MINIMA


Recuento 80 Gráfico de Caja y Bigotes
Promedio 0,87725
Mediana 0,835
Moda 0,67
Desviación Estándar 0,335929
Coeficiente de Variación 38,2934%
Cuartil Inferior 0,685
Cuartil Superior 1,06
Sesgo 0,266056
Curtosis 0,0908818

0 0,3 0,6 0,9 1,2 1,5 1,8


ALTURA MINIMA
El gráfico de caja y bigotes, aporta 5-números resumen de la muestra de datos.

La caja central cubre la mitad de los datos, extendiéndose desde el cuartil inferior hasta

el cuartil superior. Las líneas extendidas a izquierda y derecha de la caja (los bigotes)
muestran la localización del mayor y menor de los datos. La mediana (0,835) de los datos
está indicada por la línea vertical en el interior de la caja, mientras que el signo (+)
muestra la localización de la media aritmética (0,87725). El hecho de que el bigote
superior es algo más largo que el inferior, a la vez que la media es algo mayor que la
mediana, es indicativo de asimetría o sesgo (0,266056) positiva en los datos.

También podría gustarte