Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Caso:
La mediana
Moda
La moda, es aquel dato, aquel valor de la
variable que ms se repite; es decir, aquel
valor de la variable (que puede no ser un
nico valor) con una frecuencia mayor.
La moda de un conjunto de datos es el dato que ms se repite.
Una zapatera ha vendido en una semana los zapatos
que se reflejan en la tabla:
Ejemplo.
La moda es 41.
N de calzado 38 39 40 41 42 43 44 45
N de personas 16 21 30 35 29 18 10 7
El nmero de zapato ms
vendido, el dato con mayor
frecuencia absoluta, es el 41.
Lo compran 35 personas
La moda
Cuartil, Quintiles, Deciles, Percentiles
La mediana, como vimos, separa en dos mitades el conjunto ordenado
de observaciones. Podemos a su vez subdividir cada mitad en dos,
de tal manera que resulten cuatro partes iguales. Cada una de esas
divisiones se conoce como Cuartil y lo simbolizaremos mediante la
letra Q agregando un subndice segn a cual de los cuatro cuartiles
nos estemos refiriendo. Se llama primer cuartil (Q1) a la mediana de
la mitad que contiene los datos ms pequeos. Este cuartil,
corresponde al menor valor que supera o que deja por debajo de
l a la cuarta parte de los datos. Se llama tercer cuartil (Q3) a la
mediana de la mitad formada por las observaciones ms grandes.
El tercer cuartil es el menor valor que supera o que deja por
debajo de l a las tres cuartas partes de las observaciones. Con
esta terminologa, la mediana es el segundo cuartil (Q2) y el cuarto
cuartil (Q4) coincide con el valor que toma el ltimo dato, luego de
ordenados.
Medidas de Dispersin
El desvo estndar
Es posible identificar conjuntos de datos que a pesar de ser muy
distintos en trminos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es
la concentracin o dispersin alrededor de la media.
Una manera de evitar que los distintos signos se compensen es
elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raz cuadrada del promedio de estas cantidades recibe
el nombre de desvo estndar, o desviacin tpica y es representada
por la siguiente frmula:
A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con respecto a
su media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se entiende
entonces que cuando este valor es ms pequeo, las diferencias de los valores respecto a la
media, es decir, los desvos, son menores y, por lo tanto, el grupo de observaciones es ms
homogneo que si el valor de la desviacin estndar fuera ms grande. O sea que a menor
dispersin mayor homogeneidad y a mayor dispersin, menor homogeneidad.
La Varianza
El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La
suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media
aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de
cualquier otro valor que no sea la media aritmtica.
Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado.
Precisamente la manera de simbolizarla es.
Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza
8 cms.
Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos
tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9
=
72
9
= 8
El quinto rectngulo y el octavo rectngulo en un acto de rebelda
cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10
centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
9
= 8
... el mismo promedio! Pero... ha habido variacin?
8 cms.
10 cms
6 cms
El rectngulo rojo tiene +2 centmetros sobre el promedio, y el
rectngulo azul tiene 2 centmetros bajo el promedio. Los otros
rectngulos tienen cero diferencia respecto del promedio.
8 cms.
10 cms
6 cms
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 2 + 0 = 0
Este valor nos parece indicar que no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variacin.
8 cms.
10 cms
6 cms
Una forma de eliminar los signos menos de aquellas diferencias que
sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
= 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
=
9 9
8
= 0,89
8 cms.
10 cms
6 cms
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
De manera que se define
0, 89 0, 943
La raz cuadrada de la varianza se llama desviacin estndar
8 cms.
10 cms
6 cms
Que la desviacin estndar haya sido de 0,943 significa que en promedio la
altura de los rectngulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que
los causantes de la variacin fueron los rectngulos quinto y octavo.
Esta variacin hace repartir la culpa a todos los dems rectngulos
que se portaron bien.
La desviacin estndar mide la dispersin de los datos respecto del
promedio
8 cms.
10 cms
6 cms
4 cms
8 cms. 8 cms. 8 cms.
7 cms.
8 cms.
Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
9
= 7,44
Luego debemos calcular la varianza
8 cms.
10 cms
6 cms
4 cms
8 cms. 8 cms. 8 cms.
7 cms.
8 cms.
Promedio
7,44
0,56
-3,44
0,56
0,56 2,56
0,56 -0,44
-1,44
0,56
0,56
2
+ (-3,44)
2
+ 0,56
2
+ 0,56
2
+ 2,56
2
+ 0,56
2
+ (-0,44)
2
+ (-1,44)
2
+
0,56
2
9
22,2224
9
=
= 2,469
Este es el valor de la varianza
10 cms
8 cms.
6 cms
4 cms
8 cms. 8 cms. 8 cms.
7 cms.
8 cms.
Promedio
7,44
Si la varianza fue de 2,469, entonces la desviacin estndar es de...
2, 469 1, 57
Lo que significa que, en promedio, los rectngulos se desviaron ms o
menos (ms arriba o ms abajo) en 1,57 centmetros.
Para entender la varianza necesariamente debe saber:
Sumar
Restar
Multiplicar
Dividir
Potencia de orden 2
Raz cuadrada
Y es claro que esto no es suficiente (salvo que queramos que aprenda de
memoria los clculos). Necesitamos estimular su imaginacin para que
vea la variabilidad existente en la naturaleza.
Entregue una lista de fenmenos en que un mismo atributo tenga
variabilidad si se mide este atributo a un nmero de individuos u objetos.