Está en la página 1de 3

Guion del Modulo 2 de Estadstica

1. E MPEZAMOS CON LOS PAR AMETROS ESTAD ISTICOS . M EDIDAS DE CENTRALIZACI ON

Los parametros estadsticos son valores numericos que permiten obtener una informacion resumida de una variable
estadstica. Podemos destacar dos tipos:

1. Parametros de centralizacion. Son valores representativos de todos los datos, respecto de distintos puntos vista.
Estudiaremos la moda (Mo), la mediana (Me), y la media (x).
2. Parametros de dispersion. Son valores que miden como de separados que estan los datos.

Las calculadoras que incorporan funciones estadsticas permiten obtener de forma automatica todos estos valores. Sin
embargo, para familiarizarnos con ellos, no viene mal empezar calculandolos de forma manual.
En primer lugar nos restrigiremos a variables estadsticas para datos simples, aunque para datos agrupados en interva-
los razonaremos de forma analoga representando a veces al intervalo por su marca de clase.
La moda (Mo) es aquel o aquellos datos con mayor frecuencia absoluta, y por ello, corresponde con el dato o datos mas
frecuentes de la muestra.
En cuanto a la mediana (Me), si ordenamos todos los datos de menor a mayor, incluyendo todas las repeticiones, esta
correspondera al dato que ocupa la posicion central o en el caso de que existan dos en el centro, el valor medio o semisuma
de estos.
Esta forma de calcular la mediana es viable cuando tenemos un numero pequeno de datos. En general, podremos
calcular esta a partir de la tabla que incluye la columna de las frecuencias absolutas acumuladas Fi . Para ello, siendo como
N
siempre N el numero de datos, buscamos entre los valores de las frecuencias absolutas acumuladas. Tenemos dos casos:
2

1. Si dicho valor no se corresponde con ninguna frecuencia absoluta acumulada, la mediana Me coincide con el dato
N
xi cuya frecuencia absoluta acumulada supera por primera vez a .
2
2. Si dicho valor corresponde con la frecuencia absoluta acumulada Fi de un dato xi , la mediana Me sera el punto
medio o semisuma de este dato xi y el siguiente dato xi+1 , esto es,

xi + xi+1
Me = .
2

Volveremos a hablar de la mediana cuando presentemos los cuartiles, deciles y percentiles.


La ultima de las medidas de centralizacion que presentaremos es la media x, que correspondera a lo que en fsica se
conoce como el centro de masas, y no es mas que:

P
x1 f1 + x2 f2 + . . . + xn fn xi f i
x = = .
N N

Para su calculo resulta muy util la disposicion de los datos en una tabla que incluira una columna para los distintos
datos xi , otra para las frecuencias absolutas fi y una nueva columna para xi fi , que seran los productos de los valores
correspondientes a la misma fila de las columnas anteriores. La media corresponde a la suma de los valores de esta ultima
P
columna xi fi , partido de N .
2. PAR AMETROS ESTAD ISTICOS . M EDIDAS DE DISPERSI ON

Existen variables estadsticas con comportamientos distintos que tienen la misma media, y lo mismo ocurre con las otras
medidas de centralizacion. Por ello, resulta necesario calcular parametros que muestren como se distribuyen los datos. As,
introduciremos algunos parametros de dispersion, que nos informan sobre como de dispersos se encuentran los datos
con respecto de la media. Esos seran la desviacion media, varianza, desviacion tpica y el coeficiente de variacion.
Supongamos que nuestra variable estadstica X toma los distintos valores x1 , x2 , . . . , xn con frecuencias absolutas
f1 , f2 , . . . , fn respectivamente, y x es la media. Entonces se define:

1. La desviacion media es:


P
|xi x|fi
DM(X) =
N

.
Dado que |xi x| es la distancia del dato xi a x, la desviacion media es un promedio de las distancias de los
datos a la media, y por lo tanto, en cierto sentido, mide lo separados en promedio que estan los datos con respecto
de la media.
2. La varianza se define como

|xi x|2 fi x2i fi


P P
2
Var(X) = = = x2 .
N N

La primera de las expresiones indica que la varianza tambien mide como de separados estan con respecto de la
media, la segunda es la que utilizaremos para calcular la varianza a partir de una tabla.
p
3. La desviacion tpica es dt(X) = = V ar(X).

4. El coeficiente de variacion se define como CV(X) = .
x
Para calcular todos estos parametros, completaremos con nuevas columnas la tabla que hemos utilizado para calcular
la media. Para ello, incluiremos una nueva columna donde calcularemos para cada dato el valor de |xi x|, una columna
P
para |xi x|fi . La suma de los elementos de esta columna |xi x|fi partido de N sera el valor de la desviacion media.
Ahora incluiremos una nueva columna con los valores de x2i fi , y utilizaremos la suma de estos para incluirlos en la
expresion de la varianza. De esta, calcularemos la desviacion tpica y despues la variacion media.
3. C UARTILES , DECILES Y PERCENTILES

La mediana de una variable estadstica corresponde a un datoque deja la mitad de los datos por debajo de el.
Vamos a generalizar este concepto para definir los cuartiles, deciles y percentiles, para ello ahora dividiremos los datos
en 4 para los cuartiles, 10 para los deciles, y 100 para los percentiles.
Para los cuartiles, al dividir por 4, tendremos un datoque deja por debajo de el la primera cuarta parte de los datos,
un valor que deja la 2/4 parte de los datos, y otro para la 3/4 parte de los datos. Estos valores se denotan por Q1 , Q2 y Q3 .
Esta sera la idea intuitiva, pero al igual que para la media, no siempre existe tal dato, y entonces definimos el cuartil, como
tambien el decil o el percentil, como un promedio.
Con la idea de que Q1 es aquel valor que deja la cuarta parte de los datos por debajo de el, y razonando como para la
N
media (de hecho, estoy haciendo un copia y pega), dividiremos el numero de datos entre 4, , y utilizando la tabla con
4
las frecuencias absolutas acumuladas se tiene dos posiblidades:
1. Si dicho valor no corresponde a ninguna frecuencia absoluta acumulada, el primer cuartil Q1 coincide con el dato
N
xi cuya frecuencia absoluta acumulada supera por primera vez a .
4
2. Si el valor es igual a la frecuencia absoluta acumulada Fi de un dato xi , el primer cuartil Q1 sera el punto medio o
xi + xi+1
semisuma de este dato xi y el siguiente dato xi+1 , esto es, Q1 = .
2
2N N
De la misma forma calcularamos el segundo cuartil Q2 con = , observa que este coincide con la mediana, y el
4 2
3N
tercer cuartil Q3 con .
4
Con la misma idea calcularamos los deciles, al dividir los datos entre 10 obtendramos D1 , D2 , . . . , D9 , donde Dk se
kN
calcula a partir del valor y la columna de las frecuencias absolutas acumuladas, y los percentiles P1 , P2 , . . . , P99 , con
10
kN
la misma idea y procedimiento usando el valor .
100