Está en la página 1de 3

Guión del Módulo 2 de Estadı́stica

1. E MPEZAMOS CON LOS PAR ÁMETROS ESTAD ÍSTICOS . M EDIDAS DE CENTRALIZACI ÓN

Los parámetros estadı́sticos son valores numéricos que permiten obtener una información resumida de una variable
estadı́stica. Podemos destacar dos tipos:

1. Parámetros de centralización. Son valores representativos de todos los datos, respecto de distintos puntos vista.
Estudiaremos la moda (Mo), la mediana (Me), y la media (x̄).
2. Parámetros de dispersión. Son valores que miden cómo de separados que están los datos.

Las calculadoras que incorporan funciones estadı́sticas permiten obtener de forma automática todos estos valores. Sin
embargo, para familiarizarnos con ellos, no viene mal empezar calculándolos de forma manual.
En primer lugar nos restrigiremos a variables estadı́sticas para datos simples, aunque para datos agrupados en interva-
los razonaremos de forma análoga representando a veces al intervalo por su marca de clase.
La moda (Mo) es aquel o aquellos datos con mayor frecuencia absoluta, y por ello, corresponde con el dato o datos más
frecuentes de la muestra.
En cuanto a la mediana (Me), si ordenamos todos los datos de menor a mayor, incluyendo todas las repeticiones, esta
correspondera al dato que ocupa la posición central o en el caso de que existan dos en el centro, el valor medio o semisuma
de estos.
Esta forma de calcular la mediana es viable cuando tenemos un número pequeño de datos. En general, podremos
calcular esta a partir de la tabla que incluye la columna de las frecuencias absolutas acumuladas Fi . Para ello, siendo como
N
siempre N el número de datos, buscamos entre los valores de las frecuencias absolutas acumuladas. Tenemos dos casos:
2

1. Si dicho valor no se corresponde con ninguna frecuencia absoluta acumulada, la mediana Me coincide con el dato
N
xi cuya frecuencia absoluta acumulada supera por primera vez a .
2
2. Si dicho valor corresponde con la frecuencia absoluta acumulada Fi de un dato xi , la mediana Me será el punto
medio o semisuma de este dato xi y el siguiente dato xi+1 , esto es,

xi + xi+1
Me = .
2

Volveremos a hablar de la mediana cuando presentemos los cuartiles, deciles y percentiles.


La última de las medidas de centralización que presentaremos es la media x̄, que corresponderı́a a lo que en fı́sica se
conoce como el centro de masas, y no es más que:

P
x1 · f1 + x2 · f2 + . . . + xn · fn xi · f i
x̄ = = .
N N

Para su cálculo resulta muy útil la disposición de los datos en una tabla que incluirı́a una columna para los distintos
datos xi , otra para las frecuencias absolutas fi y una nueva columna para xi · fi , que serı́an los productos de los valores
correspondientes a la misma fila de las columnas anteriores. La media corresponde a la suma de los valores de esta última
P
columna xi · fi , partido de N .
2. PAR ÁMETROS ESTAD ÍSTICOS . M EDIDAS DE DISPERSI ÓN

Existen variables estadı́sticas con comportamientos distintos que tienen la misma media, y lo mismo ocurre con las otras
medidas de centralización. Por ello, resulta necesario calcular parámetros que muestren como se distribuyen los datos. Ası́,
introduciremos algunos parámetros de dispersión, que nos informan sobre como de “dispersos” se encuentran los datos
con respecto de la media. Esos serán la desviación media, varianza, desviación tı́pica y el coeficiente de variación.
Supongamos que nuestra variable estadı́stica X toma los distintos valores x1 , x2 , . . . , xn con frecuencias absolutas
f1 , f2 , . . . , fn respectivamente, y x̄ es la media. Entonces se define:

1. La desviación media es:


P
|xi − x̄|fi
DM(X) =
N

.
Dado que |xi − x̄| es la distancia del dato xi a x̄, la desviación media es un promedio de las distancias de los
datos a la media, y por lo tanto, en cierto sentido, mide lo separados en promedio que están los datos con respecto
de la media.
2. La varianza se define como

|xi − x̄|2 fi x2i fi


P P
2
Var(X) = σ = = − x̄2 .
N N

La primera de las expresiones indica que la varianza también mide cómo de separados están con respecto de la
media, la segunda es la que utilizaremos para calcular la varianza a partir de una tabla.
p
3. La desviación tı́pica es dt(X) = σ = V ar(X).
σ
4. El coeficiente de variación se define como CV(X) = .

Para calcular todos estos parámetros, completaremos con nuevas columnas la tabla que hemos utilizado para calcular
la media. Para ello, incluiremos una nueva columna donde calcularemos para cada dato el valor de |xi − x̄|, una columna
P
para |xi − x̄|fi . La suma de los elementos de esta columna |xi − x̄|fi partido de N será el valor de la desviación media.
Ahora incluiremos una nueva columna con los valores de x2i fi , y utilizaremos la suma de estos para incluirlos en la
expresión de la varianza. De esta, calcularemos la desviación tı́pica y después la variación media.
3. C UARTILES , DECILES Y PERCENTILES

La mediana de una variable estadı́stica corresponde a un “dato”que deja la mitad de los datos por debajo de el.
Vamos a generalizar este concepto para definir los cuartiles, deciles y percentiles, para ello ahora dividiremos los datos
en 4 para los cuartiles, 10 para los deciles, y 100 para los percentiles.
Para los cuartiles, al dividir por 4, tendremos un “dato”que deja por debajo de el la primera cuarta parte de los datos,
un valor que deja la 2/4 parte de los datos, y otro para la 3/4 parte de los datos. Estos valores se denotan por Q1 , Q2 y Q3 .
Esta serı́a la idea intuitiva, pero al igual que para la media, no siempre existe tal dato, y entonces definimos el cuartil, como
también el decil o el percentil, como un promedio.
Con la idea de que Q1 es aquel valor que deja la cuarta parte de los datos por debajo de el, y razonando como para la
N
media (de hecho, estoy haciendo un “copia y pega”), dividiremos el número de datos entre 4, , y utilizando la tabla con
4
las frecuencias absolutas acumuladas se tiene dos posiblidades:
1. Si dicho valor no corresponde a ninguna frecuencia absoluta acumulada, el primer cuartil Q1 coincide con el dato
N
xi cuya frecuencia absoluta acumulada supera por primera vez a .
4
2. Si el valor es igual a la frecuencia absoluta acumulada Fi de un dato xi , el primer cuartil Q1 será el punto medio o
xi + xi+1
semisuma de este dato xi y el siguiente dato xi+1 , esto es, Q1 = .
2
2·N N
De la misma forma calcuları́amos el segundo cuartil Q2 con = , observa que este coincide con la mediana, y el
4 2
3·N
tercer cuartil Q3 con .
4
Con la misma idea calcuları́amos los deciles, al dividir los datos entre 10 obtendrı́amos D1 , D2 , . . . , D9 , donde Dk se
k·N
calcula a partir del valor y la columna de las frecuencias absolutas acumuladas, y los percentiles P1 , P2 , . . . , P99 , con
10
k·N
la misma idea y procedimiento usando el valor .
100

También podría gustarte