Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Lectura 1
Estadistica Lectura 1
=
1
Mientras que en la muestra el estadstico x corresponde a la media de la muestra.
x
1
+ x
2
+ . . . . . . . + x
n
x = -------------------------------- n es el nmero de observaciones.
n
Se denota como:
n
x
x
n
i
=
1
El siguiente diagrama representa la analoga entre la media poblacional para una
poblacin y la media muestral para una muestra:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 8 -
Poblacin
Tamao: N
Muestra
Tamao: n
x
Poblacin
Tamao: N
Muestra
Tamao: n
x
En nuestro caso:
-3+(-2)+(-2)+(-2)+(-2)+(-1)+(-1)+0+0+1+1
x = ------------------------------------------------------ = -1
11
Dentro de los valores estadsticos de posicin central la media es el de mayor
representatividad, pero debemos tener presente que a su ves es el ms sensible a
los valores extremos de la distribucin
Los valores extremos de la distribucin pueden influir en el valor de la media y de esa
manera hacerle perder su condicin de referente, tenga Ud. en cuenta el siguiente
ejemplo: En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de
$1000 mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo
promedio para esa distribucin ser:
1000 + 1000 + 1000 + . . . . + 10000 19.000
= ---------------------------------------------- = -------------
10 10
= $ 1900
Esto estara indicando que el sueldo promedio de los empleados de la empresa es de
$1900, cifra esta que de ninguna manera representa la realidad.
Recordar
MEDIA Cantidad de elementos
Poblacin N
Muestra x n
2.4. MEDIANA
Se define como Mediana de una distribucin, al valor que ocupa el punto medio de la
distribucin
Ocupar el punto medio de la distribucin implica que la mediana deja a la izquierda la
misma cantidad de valores que a la derecha. Todos los valores que se encuentran a la
izquierda son menores o eventualmente iguales a l, mientras que los valores que se
ubican a la derecha sern mayores o eventualmente iguales a l.
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 9 -
Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:
-3 -2 -2 -2 -2 -1 -1 0 0 1 1
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
x
11
Me = x
6
= -1
Teniendo presente que el nmero de observaciones n = 11 el valor que ocupa el
lugar central de la distribucin corresponder a x
6
y por lo tanto la mediana toma el
valor de -1.
Cuando el nmero de componentes de la distribucin es impar, la mediana est
perfectamente definida, pero para el caso de que n sea par, no se tiene un nico valor
central, en este caso la mediana estar dada por el promedio de los dos valores
centrales. Suponiendo que se le quitara el ltimo valor a la distribucin de
temperaturas que estamos analizando, el nmero de observaciones n = 10 y los dos
valores centrales seran x
5
y x
6.
-3 -2 -2 -2 -2 -1 -1 0 0 1
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
x
5
+ x
6
Se tendra en este caso que Me = -------------
2
Podemos generalizar el valor de la mediana para una distribucin de n valores
teniendo en cuenta que el nmero de observaciones sea par o impar:
Si n es impar Me = x
i
donde i = (n+1)/2
Mediana x
(n/2)
+ x
(n/2 +1)
Si n es par Me = ------------------
2
Para determinar el valor de la mediana de una serie simple o distribucin de
frecuencia es necesario tener en cuenta el nmero de observaciones, si n es impar, la
mediana pertenece a la distribucin y esta dada por el valor que ocupa el punto
central de la misma. En el caso de que n sea impar, el valor de la mediana esta dado
por el promedio de los dos valores centrales, esto implica que puede pertenecer a la
distribucin solo en el caso de que los valores centrales sean iguales:
a) 4 6 6 8 Me = 6
b) 2 10 18 20 Me = 14
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 10 -
c) 4,3 5,8 6,2 7,2 8,5 9,6 Me = 6,7
d) 2 3 3 6 9 Me = 3
e) 3,5 4,7 6,8 7,3 9,6 10 12,5 Me = 7,3
Observe el lector que a diferencia de la media o promedio la cul se ve influenciada
por los valores extremos, segn ya vimos, no ocurre lo mismo con la mediana la cul
se presenta como insensible a los valores extremos y por lo tanto describe con mayor
exactitud las distribuciones en donde los valores extremos son sensibles .Son ejemplo
de este tipo de distribuciones:
a) los ingresos personales
b) Las retribuciones generales en una empresa
c) Gastos domsticos
d) Ingresos netos por hogar, etc.
No obstante todo esto las propiedades que presenta la media y que veremos
ms adelante la hace ms atractiva para su utilizacin.
2.5. MODA
Se define como Moda de una distribucin al valor que ms veces se repite.
En nuestro caso -2 se repite en cuatro oportunidades y por lo tanto ste valor se
constituye en moda de la distribucin.
Mo = -2
Con respecto a este valor es necesario aclarar que si en una distribucin se tiene ms
de un valor con el mismo mximo de repeticiones, cada uno de ellos se constituir en
una nueva moda, es decir que una distribucin puede tener ms de una moda. En
caso de tener dos modas se la denomina bimodal y en caso de tres trimodal, etc.
As mismo si se presentare el caso en que todos los valores de la distribucin tienen
el mismo nmero de repeticiones, diremos que dicha distribucin no tiene moda.
FRECUENCIA
Dada una distribucin se define como Frecuencia de un valor, al nmero de veces que
el mismo se repite.
Ejemplo:
En la distribucin correspondiente a las temperaturas mnimos tomadas en una
localidad del Sur del Pas durante los ltimos 10 das, defina para cada valor su
frecuencia:
-2 -2 -4 -1 -1 -1 0 -3 -2 -1
para -4 su f = 1
-3 su f = 1
-2 su f = 3
-1 su f = 4
0 su f = 1
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 11 -
f = 10
Tenga en cuenta que la suma de todas las frecuencias es igual al nmero total de
observaciones.
2.6. DISTRIBUCIN DE FRECUENCIA
En la mayora de los casos nos encontraremos con una cantidad de observaciones n
que superan los 20, por lo tanto pretender operar con una serie simple se tornara
engorroso, en estos casos ser conveniente seleccionar los valores de acuerdo a una
determinada clase y determinar de cada una de ellas su frecuencia, de all que es
comn encontrar a este tipo de distribucin como Distribucin de intervalos, a los
efectos de facilitar el aprendizaje del alumno subdividiremos este tipo de distribucin
en dos grupos:
1) cuando la amplitud de intervalo es igual a 1
2) cuando la amplitud del intervalo de clase toma un valor mayor a 1
Caso a analizar
Supongamos tener que estudiar el nmero de accidentes que se producen en una
playa de estacionamiento durante los ltimos 50 das. Los datos relevados son los
siguientes
5 6 4 4 4 3 2 7 5 4 4 1
0 4 2 1 3 2 2 0 1 4 4 7
4 3 2 1 4 2 5 4 3 5 6 7
4 4 5 2 3 6 4 3 1 3 4 4
5 6
Es observable que trabajar con todos los valores como lo presenta la serie simple
sera por dems engorroso si no se dispusiera de una computadora, pero si
clasificamos los valores, en este caso de acuerdo a su valor numrico y para cada
uno de ellos determinamos su frecuencia, podramos confeccionar una tabla de las
siguientes caractersticas:
Tabla 1.1
Clase xi fi
1 0 2
2 1 5
3 2 7
4 3 8
5 4 16
6 5 5
7 6 4
8 7 3
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 12 -
=
i i
f
50
Si ahora analizamos la tabla de esta manera, se simplifica enormemente la
determinacin de la media ya que en lugar de efectuar la suma de todas las
observaciones, efectuaremos el producto de cada valor por su frecuencia y la suma de
estos productos lo dividiremos por el nmero total de observaciones.
x =
8
1
8
1
) . (
fi
fi Xi
Nota: Debemos tener presente que estamos frente a una muestra
A los efectos de facilitar los clculos, generemos en la tabla una nueva columna
conteniendo los productos de x
i
* f
i.
Tabla 1.2
Clase x
i
f
i
x
i
* f
i
1 0 2 0
2 1 5 5
3 2 7 14
4 3 8 24
5 4 16 64
6 5 5 25
7 6 4 24
8 7 3 21
50 177
De esta manera podemos calcular la media como:
= x
n
fi xi
n
i
=1
) . (
= 177 / 50 = 3,54
El valor de la media o promedio de la distribucin es de
= x 3, 54
2.7. FRECUENCIA RELATIVA
Definicin: Se define como frecuencia relativa de un valor y se expresa como fr
i
, al
cociente entre su frecuencia y la suma de todas las frecuencias (la suma de todas las
frecuencias es igual al nmero de elementos de la distribucin).
fr
i =
i
i
f
f
=
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 13 -
fi = n por lo tanto tambin se puede expresar
fi
f
r
i
= ---------
n
Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la fr de
cada clase:
Tabla 1-3
Propiedad:
La sumas de todas las frecuencias relativas correspondientes a los valores
clases de una distribucin es igual a 1
2
:
fri = f
r1
+ f
r2
+ f
r3
. . . . . . . . + f
r n
Tener en cuenta:
El concepto de frecuencia relativa, la media de una distribucin poblacional tambin se
puede expresar como:
(xi . fi)
= -------------- = (xi . fi/fi ) es decir
fi
2
Demostracin
fri = f
r1
+ f
r2
+ f
r3
. . . . . . . . + f
r n
f
1
f
2
f
3
f
n
fi
= --- + --- + ---- + + --- = ------- = 1
fi fi fi fi fi
Clase x
i
f
i
x
i
* f
i
fr
i
1 0 2 0 0,04
2 1 5 5 0,1
3 2 7 14 0,14
4 3 8 24 0,16
5 4 16 64 0,32
6 5 5 25 0,1
7 6 4 24 0,08
8 7 3 21 0,06
50 177 1
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 14 -
= (xi. fri)
2.8 FRECUENCIA ACUMULADA
Se define como frecuencia acumulada de una clase (por ejemplo i) y se la denota
como fa
i
, a la suma de su frecuencia y la suma de las frecuencias de los valores que
le anteceden.
Analicemos la tabla 1.3 de la pgina anterior,(corresponda al nmero de accidentes
que se produjeron durante los ltimos 50 das en una playa de estacionamiento),
teniendo en cuenta la definicin de frecuencia acumulada tendremos:
Tabla 1.4
Clase x
i
f
i
x
i
* f
i
fr
i
fai
1 0 2 0 0,04 2
2 1 5 5 0,1 7
3 2 7 14 0,14 14
4 3 8 24 0,16 22
5 4 16 64 0,32 38
6 5 5 25 0,1 43
7 6 4 24 0,08 47
8 7 3 21 0,06 50
50 177 1
Cules son las bondades que nos brinda la frecuencia acumulada:
a) Nos indica con su lectura el nmero de valores pertenecientes a la distribucin
que se ubican a la izquierda de cada uno de ellos. Si se quiere saber cuantos
das se registraron menos de 2 accidentes, se tendr la frecuencia acumulada
del 1, es decir 7, lo que implica que de los 50 das analizados solo en 7 de ellos
se tuvieron menos de dos accidentes diarios, pero con valores menores o iguales
a 2 se tuvieron 14, quiere decir que, de los 50 das, en 14 de ellos se tuvieron 2 o
menos de 2 accidentes diarios, este anlisis indica tambin que, del total de das
analizados, 7 de ellos tuvieron exactamente 2 accidentes diarios.
b) Ms adelante cuando efectuemos su graficacin Ud. podr visualizar con mayor
claridad esta propiedad.
c) Tambin nos permite determinar rpidamente el valor de la mediana. Analizando
nuestro caso, el nmero de observaciones es par, por lo que la mediana ser el
promedio de los dos valores centrales, el x
n/2
y el x
(n/2 + 1).
. Para determinar el
valor que ocupa la posicin n/2 ( en este caso 50/2 =25, el x
25
, nos ubicamos en
la columna correspondiente a frecuencia acumuladas y determinamos a cual de
las clases le corresponde la menor frecuencia acumulada que contiene a n/2,
en este caso le corresponde a la quinta clase, cuyo valor es el 4, desde la x
23
,
hasta la x
38
le corresponden 4, por lo tanto la Me = 4
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 15 -
2.9 FRECUENCIA DESACUMULADA
Se define como frecuencia desacumulada de un valor, fds de una distribucin, a la
diferencia entre el nmero total de observaciones y su frecuencia acumulada.
Es decir que para un valor cualquiera se verifica que:
fds
i
= n - fa
i
Analicemos la Tabla 1.5 a la cual se le creo una nueva columna conteniendo la
frecuencia desacumulada, aplicando su definicin
Tabla 1.5
Clase x
i
f
i
x
i
* f
i
fr
i
fai fds
1 0 2 0 0,04 2 48
2 1 5 5 0,1 7 43
3 2 7 14 0,14 14 36
4 3 8 24 0,16 22 28
5 4 16 64 0,32 38 12
6 5 5 25 0,1 43 7
7 6 4 24 0,08 47 3
8 7 3 21 0,06 50 0
50 177 1
De la definicin se desprende que:
fa
i
+ fds
i
= n
Bien podemos decir que la frecuencia desacumulada es el complemento a n de la
acumulada, es decir que para cada uno de los valores nos indica cuantos tenemos a la
derecha de l. La frecuencia desacumulada del valor de x=2, nos indica que la
distribucin posee 36 observaciones mayores que ese valor. Tambin podramos
valernos de este parmetro para la determinacin de la mediana, dejamos para que
Ud. efecte el anlisis correspondiente a esa situacin Analizaremos ms adelante el
diagrama representativo de ambas frecuencias correspondientes a una distribucin
DISTRIBUCIN DE FRECUENCIAS PARA DATOS NOMINALES
Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el
Bar de una Universidad durante un da de concurrencia normal del alumnado.
Colas 55
Naranja 63
Limn 72
Tnicas 44
Agua c/gas 15
Agua s/gas 18
Jugos 33
En este caso no tiene sentido determinar el valor de la media de la distribucin,
tngase en cuenta que las clases estn dadas por los distintos tipos de bebidas, luego
tiene sentido decir que la ms vendidas son las bebidas de limn, siguindole en
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 16 -
importancia las de naranja, es decir el valor de tendencia central que utilizaremos en
casos como estos le corresponde a la Moda. S sera conveniente generar una tabla
de frecuencias y determinar los porcentajes de cada uno de los sabores.
Tabla 1.6
x
i
f
i
fr
i
f
i
%
Agua c/gas 15 0,05 5
Agua s/gas 18 0,06 6
Jugos 33 0,11 11
Tnicas 44 0,1467 14,67
Colas 55 0,1833 18,33
Naranjas 63 0,21 21
Limn 72 0,24 24
f
i
= 300 f
i
% = 100
3-0 DIAGRAMAS
El poder graficar los valores estadsticos nos permite realizar una lectura rpida de la
distribucin y sacar conclusiones inmediatas de la misma.
Sera suficiente abrir una hoja de clculo para observar la cantidad variada de grficos
con que puede ser representada una distribucin: Diagramas de: Lneas, Barras,
Barras acumuladas, de Sectores o circular, Diagramas x-y, de Bastones etc. En este
texto haremos referencia a los diagramas: Circular, de Bastones e Histogramas y a
una combinacin de los grficos de Bastones, Barras y x-y Dispersin.
Ejercicio
Supongamos tener para analizar las notas obtenidas por 20 alumnos de una divisin
en la asignatura de Estadstica:
9 7 6 6 6 5 3 4 5 5 8
7 8 7 7 6 5 6 4 10
Generaremos una distribucin de frecuencias complementndola con: Frecuencias
relativas, Frecuencia acumulada y por ltimo Frecuencia desacumulada.
Tabla 1.7
X
i
f
i
fr
i
fa fds
3 1 0,05 1 19
4 2 0,1 3 17
5 4 0,2 7 13
6 5 0,25 12 8
7 4 0,2 16 4
8 2 0,1 18 2
9 1 0,05 19 1
10 1 0,05 20 0
20
1
Toda vez que se presenta una tabla tal como la 3.1, la primera pregunta que surge es,
que se debe graficar debe de tenerse siempre en cuenta que cada vez que se
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 17 -
habla de graficar estamos deseando volcar en forma grfica una cierta relacin. En la
presente situacin, la variable en estudio es la calificacin, por lo cual se podra
graficar la relacin:
Calificacin y frecuencia
Calificacin y frecuencia relativa
Calificacin y frecuencia acumulada
Calificacin y frecuencia desacumulada
3.1 Diagrama de bastones:
Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las
frecuencias y representamos mediante un segmento centrado en cada una de las
calificaciones su correspondiente frecuencia; tendremos nuestro primer diagrama.
Cada uno de los bastones corresponde a la frecuencia de cada calificacin y toma el
nombre de densidad de frecuencia entendindose como tal al cociente:
f
i
df
i
= ---- es decir frecuencia por unidad de intervalo de clase
Ax
Grfico 1.1
Diagrama de Bastones
0
1
2
3
4
5
6
3 4 5 6 7 8 9 10
calificaciones
f
r
e
c
u
e
n
c
i
a
3.2 DIAGRAMA DE SECTORES
Para este grfico debemos tener presente que el ngulo central del crculo es de 360
y que cada una de las clases estar dada por un sector cuyo ngulo ser proporcional
a su frecuencia:
Supongamos la calificacin de 3 cuya frecuencia es 1 tendremos que:
20 (suma de todas las frecuencias) ------------------------ 360
a 1 (frecuencia del 3) ----------------------- o
1 =
360. 1 / 20 = 18
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 18 -
Analicemos la calificacin del 4 cuya frecuencia es 2:
Si a 20 (frecuencia total) ---------------------------- 360
A 2 (frecuencia del 4) ---------------------------- o
2 =
360. 2 /20 = 36
Repitamos el procedimiento para el 5 el cul tiene frecuencia 4
Si a 20 le corresponde ----------------------------360
A 4 ---------------------------- o
4 =
360. 4/20 = 72
Debe tenerse en cuenta que en todos los casos la operacin que nos permite
determinar el ngulo de cada sector est dado por el producto entre 360 y el cociente
de la frecuencia de la calificacin en estudio y la suma de todas las frecuencias (N),
cociente ste que segn ya vimos corresponde a la frecuencia relativa (fr
i
= f / N), es
decir que el ngulo correspondiente a un determinado sector est dado por el producto
entre 360 y su frecuencia relativa:
o
i
= 360. fr
i
Grfico 1.2
Diagrama de Sectores
3
4
5
6
7
8
9
10
En realidad es ms interesante plantear este mismo diagrama pero expresado en
porcentajes, para lo cul el anlisis es muy similar al anterior. Al total de
observaciones, 20 en este caso, le corresponder el 100% y por lo tanto para
cualquiera de las observaciones con frecuencia fi le corresponde ser:
Si a 20 --------------------------- 100%
f
i
--------------------------- %
i
= 100. f
i
/ 20
Nuevamente nos encontramos con que el porcentaje correspondiente a cada una de
las calificaciones estar dado por el producto entre 100 y la frecuencia relativa
correspondiente a cada una de ellas. El grfico tiene la misma estructura anterior.
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 19 -
Grfico 1.3
Diagrama de Sectores Calificaciones
en porcentajes
3
5%
4
10%
5
20%
6
25%
7
20%
8
10%
9
5%
10
5%
3.2-HISTOGRAMA DE FRECUENCIAS:
ste es otro de los diagramas de gran utilizacin para el cul es necesario considerar
un sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las
abscisas las calificaciones y en el de las ordenadas la frecuencia, las clases estn
dadas por las calificaciones. El intervalo entre dos clases sucesivas se denomina
amplitud de intervalo, en este caso es la unidad y se la expresa como Ax = 1. Si
consideramos el diagrama de bastones y a partir del extremo inferior de cada uno de
ellos llevamos tanto a izquierda como a derecha la mitad del intervalo, en nuestro
caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos encontramos con
un diagrama de barras sin discontinuidades al que denominaremos Histograma, en
este caso de Histograma de Frecuencias.
Grfico 1.4
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 20 -
Histograma de Frecuencias
0
1
2
3
4
5
6
0 1 2 3 4 5 6 7 8 9 10 11
Calificaciones
F
r
e
c
u
e
n
c
i
a
La superficie encerrada por cada una de las barras est dada por el producto entre la
base Ax por la altura que segn ya vimos estaba dada por la densidad de frecuencia.
df
i =
f
i
/Ax por lo tanto:
S
i
= Ax. df
i
= Ax. f
i
/ Ax = f
i
Cada una de ellas tendr un valor igual a su frecuencia y el rea total del diagrama
ser entonces la suma de todas las frecuencias e igual a N.
S
i
= f
i
= N
3.4 - POLGONO DE FRECUENCIAS
Si se unen los puntos medios superiores de cada una de las barras del histograma y
se considera cero las frecuencias de las clases adyacentes a los extremos de la
distribucin, se formar con el eje de las abscisas un polgono denominado, en este
caso, como Polgono de Frecuencias:
Grfico 1.5. Polgono de frecuencias
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 21 -
0
1
2
3
4
5
6
2 3 4 5 6 7 8 9 10 11
xi
f
i
El rea encerrada por el polgono de frecuencias es igual al rea encerrada por el
histograma de frecuencias.
Consideremos la barra del histograma correspondiente al valor de la variable x = 6.
Observamos que mientras que la superficie del tringulo superior de la barra que
pertenece al histograma no pertenece al polgono, la superficie del tringulo inferior no
perteneciente al histograma si pertenece ahora al polgono, como las superficies de
ambos tringulos son iguales
3
, lo son tambin las superficies del polgono y del
histograma de frecuencias.
3.5 - HISTOGRAMA DE FRECUENCIAS RELATIVAS
Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las
frecuencias, se obtiene el Histograma de Frecuencias Relativas que tendr las
mismas caractersticas que el diagrama de frecuencias ya que fr
i
= f
i
/ N, es decir que
se divide a los valores de la ordenada por un valor constante N y por lo tanto
grficamente representa un cambio de escalas.
En este caso la altura de cada barra esta dada por la densidad de frecuencia relativa
dfr
i
= fr
i
/ Ax
y por lo tanto al igual que en el diagrama anterior, la superficie encerrada por cada
una de las barras del Histograma ser igual a su frecuencia relativa:
S
i =
Ax. fr
i
/ Ax = fr
i
De tal manera que el rea encerrada por el Histograma de frecuencias relativas ser
ahora igual a la suma de todas las frecuencias relativas y por tal razn igual a 1:
S
i
= fr
i
= 1
Grfico 1.6
3
Dos tringulos rectngulos en A y A con los ngulos o y o iguales por opuestos por el vrtice, | y |
alternos internos entre paralelas y el lado 11 = 22= Ax / 2 por lo tanto son iguales.
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 22 -
Histograma de Frecuencia Relativas
0
0,05
0,1
0,15
0,2
0,25
0,3
2 3 4 5 6 7 8 9 10 11
x
f
r
3.6 POLGONO DE FRECUENCIAS RELATIVAS
De la misma manera en que definimos al polgono de frecuencias, se define tambin al
polgono de frecuencias relativas. Tanto la superficie encerrada por el polgono de
frecuencias relativas como el del Histograma de esas mismas frecuencias son iguales
a 1.
Grfico 1.7
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 23 -
Histograma y Polgono de Frecuencias Relativas
0
0,05
0,1
0,15
0,2
0,25
0,3
2 3 4 5 6 7 8 9 10 11
3.7 FRECUENCIA ACUMULADA
Supongamos analizar el nmero de accidentes de trabajo que se producen
diariamente en una empresa metalrgica local, para lo cul se han considerado los
detectados durante los ltimos veinte das.
5 4 6 3 4 5 3 7 3 4 2 0
2 1 3 4 2 5 6 1
Confeccionaremos una tabla de frecuencias:
Tabla 1.8
x
i
f
i
fa
i
0 1 1
1 2 3
2 3 6
3 4 10
4 4 14
5 3 17
6 2 19
7 1 20
f
i
= 20
Para confeccionar el grfico de frecuencias acumuladas llevaremos sobre el eje de las
abscisas los valores observados y en el eje de las ordenadas las frecuencias
acumuladas.
Para el primer valor de la distribucin cero, la frecuencia acumulada vale 1, este valor
se mantendr constante hasta 1 en donde la frecuencia acumulada toma el valor de 3,
se mantiene constante hasta el valor observado de 2 en donde la fa adopta el valor de
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 24 -
6 y as sucesivamente hasta el valor de 7 en donde fa toma el valor de 20 y se
mantiene constante con este valor. Siga esto en el grfico 1.8.
Grfico 1.8
FRECUENCIA ACUMULADA
0
2
4
6
8
10
12
14
16
18
20
22
0 1 2 3 4 5 6 7 8 9
OBSERVACIONES
f
r
e
c
u
e
n
c
i
a
a
c
u
m
u
l
a
d
a
Observe el lector con que claridad este diagrama le entrega informacin. Por ejemplo
analizando la observacin 4, el punto inferior de la barra indica que menores a 4
accidentes diarios se han producido en 10 oportunidades mientras que el punto
superior indica que en 14 oportunidades se han producido 4 o menos accidentes
diarios. De igual manera en 17 oportunidades se produjeron menos de 6 accidentes en
un da y que en solo 2 oportunidades se produjeron 6 accidentes.
De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la
acumulada tal como lo muestra el Grfico 1.8 denominado comnmente como grfico
de escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de
la frecuencia acumulada y la desacumulada es igual al nmero total de observaciones.
fa + fds = n
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 25 -
Grfico 1.9
0
2
4
6
8
10
12
14
16
18
20
22
0 1 2 3 4 5 6 7 8 9
observaciones
f
r
e
c
u
e
n
c
i
a
Frecuencia acumulada
Frecuencia
desacumulada
La interseccin de ambas grficas debe de verificarse para fa = fds = n/2.
En el punto de interseccin ambas frecuencias son iguales por lo que podemos decir
que:
fa + fds = fa + fa = n
por lo que
2 fa = n
y
fa = n / 2
RELACIN ENTRE MEDIA, MEDIANA Y MODA
Cuando nos referimos al histograma de frecuencias relativas decamos que el rea
encerrada por cada una de las barras nos entregaba el valor de la frecuencia relativa
del valor correspondiente a dicha barra... Si este concepto lo extendemos a toda la
distribucin podemos asegurar que considerando un determinado intervalo de las
observaciones el rea encerrada por el histograma en dicho intervalo ser igual a su
frecuencia relativa, valor que segn ya vimos multiplicada por 100 nos entrega el
porcentaje de observaciones comprendidas en ese intervalo. Adems demostramos
que la superficie encerrada por el histograma de frecuencias relativas era igual a la
superficie del polgono de fr. Simplificando, el rea encerrada por el polgono de
frecuencias relativa es igual a 1 y esto implica tambin que encierra el 100% de las
observaciones.
Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres
divisiones que denominaremos como A, B y C en la asignatura de Estadstica:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 26 -
Tabla 1.9
A B C
xi fi fi fi
1 6 0 0
2 8 1 0
3 5 2 1
4 4 4 1
5 3 5 2
6 2 6 4
7 1 5 5
8 1 4 7
9 0 2 5
10 0 1 2
30 30 27
Las tres distribuciones tienen caractersticas distintas, veamos:
A) =. (xi.fi) / N = 3,1667
Me = (x
15
+ x
16
) / 2 = 3
Mo = 2
B) =. (xi.fi) / N = 6
Me = x
16 =
6
Mo = 6
C) = (xi.fi) / N = 7,296
Me = x
14 =
8
Mo = 8
Si graficamos los histogramas y polgonos de las frecuencias relativas de cada una de
las distribuciones relativas suavizando convenientemente los lados del polgono, nos
encontraremos con los siguientes grficos:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 27 -
Grfico 1.10 (Divisin A)
Histograma y polgono de frecuencias
relativas
0
0,05
0,1
0,15
0,2
0,25
0,3
1 2 3 4 5 6 7 8 9 10
observaciones
f
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
Grafico 1.11 (Divisin B)
Histograma y polgono de frecuencias
relativas
0
0,05
0,1
0,15
0,2
0,25
1 2 3 4 5 6 7 8 9 10 11
observaciones
Grafico 1.12 (Divisin C)
Histograma y polgono de frecuencias
relativas
0
0,05
0,1
0,15
0,2
0,25
0,3
1 2 3 4 5 6 7 8 9 10 11
observaciones
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 28 -
En el caso de la divisin B se observa una cierta simetra respecto a un eje vertical
coincidente con la mediana la moda y la media, decimos entonces que la distribucin
es del tipo Normal, y que en ese caso coinciden los tres valores ; Me y Mo.
En el A la distribucin se presenta en forma asimtrica y en este caso decimos que
corresponde a una asimtrica derecha asignndosele un signo positivo. A su vez, la
observacin de mayor ordenada le corresponder a la moda y la media tendr que
dividir al rea total en dos reas iguales, de acuerdo a su grfica y a sus valores se
observa que la media tiene un valor mayor a la mediana y que a su vez sta se ubica
entre la media y la moda.
Al analizar la ltima distribucin, C) se observa nuevamente que la misma es
asimtrica pero en este caso decimos que es asimtrica izquierda y se le asigna signo
negativo. Nuevamente la moda queda perfectamente definida (la observacin de
mayor ordenada), la Me est coincidiendo con ese valor y la media se coloca a la
derecha de ambas.
En toda distribucin sesgada ya sea a la derecha o a la izquierda, el segmento
comprendido por la media y la mediana es aproximadamente un tercio del segmento
comprendido por la media y la moda.
Una distribucin puede ser:
Simtrica = Me = Mo
Distribucin Derecha (+) < Me < = Mo
Asimtrica
Izquierda (-) > Me > = Mo
3.2 DISTRIBUCIN DE INTERVALOS DE CLASE
En una unidad militar de entrenamiento para futuros oficiales, se han determinado los
tiempos que tardan los integrantes de un pelotn en cruzar la pista de combate. Estos
valores expresados en minutos son los siguientes:
3,1 3,4 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9 3,9
4 4 4,1 4,2 4,2 4,3 4,3 4, 4,5 4,6
El jefe de pelotn necesita realizar un estudio estadstico sobre estos tiempos a los
efectos de determinar:
a- Qu proporcin de hombres tardan menos de 3,5 en cruzar la pista de
combate
b- Qu proporcin de los hombres del pelotn tardan menos de 4 en cruzar la
pista
En casos como el presentado, donde el nmero de observaciones es mayor a 20 y la
variable en estudio es del tipo continua, se hace necesario definir como clases a
intervalos y determinar como frecuencia de cada uno de ellos al nmero de
observaciones que contienen. En este caso la distribucin toma el nombre de
distribucin de intervalos de clase.
Para generar una distribucin de intervalos de clase debe tener en cuenta:
a) La cantidad de intervalos: La determinacin del nmero de intervalos, a los que
llamaremos como k est relacionada con el nmero de observaciones n.
Mientras que algunos operadores definen:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 29 -
k = n
Otros deciden optar por la expresin:
k = 1+ log
2
(n)
Pero en general se puede definir el valor de k teniendo en cuenta que:
5 <= k <= 15
Es decir que el nmero de intervalos debe estar comprendido entre 5 y 15. Una
cantidad menor de intervalos da lugar a una distribucin con informacin insuficiente.
Por otro lado una cantidad mayor a 15 intervalos genera una distribucin que resulta
engorroso operar.
Para el caso que tenemos en estudio y teniendo en cuenta que n = 21, la raz
cuadrada de 21 es de 4,58 y considerando la ltima condicin, adoptaremos para k el
valor de 5, k = 5.
b) La amplitud de intervalo Ax para la cul adoptaremos la expresin:
Ax =
k
x x
N 1
Para nuestro caso:
Ax = =
5
1 , 3 6 , 4
0,3
c) No puede haber un intervalo con frecuencia cero, si esa situacin se
presentare, ser necesario modificar la cantidad de intervalos o la amplitud de
intervalo.
d) Al definir los lmites de los intervalos debe tenerse en cuenta la posibilidad
que uno de ellos puede ser cerrado y el otro abierto:
e) Es conveniente que todos los intervalos tengan el mismo tamao y cuando
esto no sea posible, los intervalos de diferente amplitud deben ubicarse en los
extremos
f) No es conveniente que las observaciones coincidan con los lmites de los
intervalos, de esta manera desaparece la duda en cuanto a la pertenencia de una
observacin a un intervalo o a su adyacente.
En este caso particular, teniendo en cuenta que todas las observaciones tienen un
solo decimal, y que el menor es 3,1, adoptaremos como inicio de la distribucin el
valor de 3,09, de esta manera nos aseguramos que la primera observacin quede
contenida en el primer intervalo, y adems como la amplitud de intervalo es de 0,3, en
ningn caso una observacin coincidir con los lmites.
3,09 3,39 3,69 3,99 4,29 4,6
[`---------------)[--------------)[-----------------)[-----------------)[--------------------]
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 30 -
Podemos ahora confeccionar la tabla de distribucin de intervalos de clase, teniendo
en cuenta que, a los efectos de referenciar a cada intervalo, definiremos al punto
medio de cada uno de ellos como el valor representativo e igual a la semisuma de sus
lmites, toma el nombre de marca de clase y se lo denota como x
mi
.
3,09 3,39 3,69 3,99 4,29 4,6
[`---------------)[--------------)[-----------------)[-----------------)[-------------------]
3,24 3,54 3,84 3,14 3,44
3.2 DETERMINACIN DE LA MEDIA
Para determinar la media de la distribucin consideramos que todos los valores
pertenecientes a cada intervalo estn uniformemente distribuidos en dicho intervalo,
de esta manera la suma de todos ellos estar dada por el producto entre la marca de
clase por la frecuencia de ese intervalo.
N
fi x
mi
=
) * (
Para su determinacin creamos una nueva columna conteniendo los productos de
x
mi
*f
i
:
Tabla 1.10
Li ls f
i
xm
i
xm
i
* f
i
3,09 3,39 1 3,24 3,24
3,39 3,69 4 3,54 14,16
3,69 3,99 6 3,84 23,04
3,99 4,29 5 4,14 20,7
4,29 4,6 5 4,445 22,225
21 83,365
= =
21
365 , 83
3,9697
Esto nos indica que el tiempo promedio empleado por los integrantes del pelotn para
cruzar la pista de combate es de 3,9697
HISTOGRAMA DE FRECUENCIA
Para confeccionar el Histograma y Polgono de frecuencias debemos tener presente
que las frecuencias de los intervalos adyacentes a los extremos de nuestra distribucin
son nulas, adems se representa en el eje horizontal las marcas de clase.
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 31 -
Grfico 1.13
0
1
2
3
4
5
6
7
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x
f
3.3 DETERMINACIN DE LA MEDIANA
La mediana tendr que estar ubicada en el intervalo cuya menor frecuencia
acumulada contiene a la observacin X
(n/2),
es por lo tanto conveniente determinar las
columnas que contengan a las frecuencias acumuladas y desacumuladas.
Tabla 1. 11
Li ls f
i
xm
i
Xm
i
* f
i
fa
i
fds
i
2,79 3,09 0 2,94 0 0 21
3,09 3,39 1 3,24 3,24 1 20
3,39 3,69 4 3,54 14,16 5 16
3,69 3,99 6 3,84 23,04 11 10
3,99 4,29 5 4,14 20,7 16 5
4,29 4,6 5 4,445 22,225 21 0
4,6 4,39 0 4,74 0 21 0
De acuerdo a la tabla, la mediana se ubica en el intervalo [3,69 ; 3,99) al que
denominaremos intervalo medial, y para el cul la frecuencia acumulada es de 11 y
por lo tanto contiene a los valores correspondientes a x
10
y x
11
, pero faltara
determinar el valor que ms se aproxime al real.
Para la determinacin de la mediana en una distribucin de intervalos de clase
tendremos dos mtodos:
a) Mtodo grfico
Tracemos los diagramas correspondientes a la frecuencia acumulada:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 32 -
Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotn
solo 5 de ellos cruzan la pista en menos de 3,54, es decir que, mediante anlisis del
diagrama podemos reconstruir la tabla.
Grfico 1.14
0
5
10
15
20
25
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x
f
a
Combinemos en un mismo diagrama, las representaciones de frecuencia acumulada y
desacumulada. Este grfico toma el nombre de Ojiva.
Grfico 1.15
-5
0
5
10
15
20
25
2 2,5 3 3,5 4 4,5 5
x
f
a
-
f
d
s
Como ambas frecuencias se representan en el eje vertical, en el punto interseccin
ambas son iguales y como su suma
Fa + frds = N
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 33 -
Debe verificarse que el valor de esas frecuencias, en ese punto es igual a N/2.
Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente al
punto interseccin tendr su valor. Por lo tanto las coordenadas del punto interseccin
sern (Me; n/2).
b) Mtodo Analtico
Analizaremos el intervalo medial:
Grfico 1.16
0
2
4
6
8
10
12
3,69 3,99
Li Ls Ax
Me
0
2
4
6
8
10
12
3,69 3,99
Li Ls Ax
0
2
4
6
8
10
12
3,69 3,99
Li Ls Ax
Me
Al iniciar el intervalo 3,69 su frecuencia acumulada tiene el valor de 5 (que
denominaremos frecuencia acumulada inferior y la denotaremos como fai). De la
misma manera al finalizar ese intervalo (x = 3,69) su frecuencia acumulada es de 11 (a
la denominaremos frecuencia acumulada superior y la denotaremos como fas). Esa
variacin de frecuencia acumulada de 5 a 11 es justamente la frecuencia
correspondiente al intervalo medial (f
m
= 6). Adems como el total de observaciones
es de 21, N/2 = 10,5.
Consideremos los tringulos 123 y 123 ambos rectngulos en 2 y 2 respectivamente.
Esos tringulos son semejantes y por lo tanto sus lados homlogos son
proporcionales.
2 3 1 - 2
---------- = -------------
2 3 1 2
Si reemplazamos tendremos:
fm x A
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 34 -
------ ------- = ---------
(N/2 fai) Me Li
Despejando Me tendremos:
x A (N/2 fai)
Me = Li + -----------------
fm
En este caso particular, la Me = 3,69 + 0,3 *((10,5 - 5) / 6
Me = 3,965
3.4- DETERMINACIN DE LA MODA
Se define como intervalo modal al intervalo de mayor frecuencia, en este caso
corresponder a [3,69; 3,99) con frecuencia 6, coincide con el medial, pero bien podra
no coincidir, para la determinacin de la moda, consideremos en el histograma de
frecuencia, el intervalo modal y los intervalos adyacentes.
Grfico 1.17
0
1
2
3
4
5
6
7
3,54 3,84 4,14
x
f
Li Ls
Si definimos a d1 = (frecuencia del intervalo modal) (frecuencia del intervalo que le
antecede):
di = 6-4 = 2
y como d2 = (frecuencia del intervalo modal) (menos la frecuencia del intervalo que
le sucede):
d2 = 6-5 = 1
Como li se define al inicio del intervalo modal (3,69), el valor de la moda de una
distribucin de intervalos de clase esta dada por la expresin:
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 35 -
Mo = Li + . x A ( d1/(d1+d2) )
En este caso tendremos:
Mo = 3,69 + 0,3 (2 / ( 2+1) ) = 3,89
Conclusiones:
En una distribucin de intervalos de clase, la moda se encuentra siempre ubicada en
el intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia.
Los valores determinados para la media, mediana y moda, indican que la distribucin
tiene un leve sesgo derecho:
Media = 3,9697
Mediana Me = 3,965
Moda Mo = 3,89
> Me > Mo
4- VALORES DE DISPERSIN
Son suficientes los valores de posicin central para determinar las caractersticas de
una distribucin? Para responder a esta pregunta observemos la siguiente situacin:
Tenemos tres distribuciones que presenten la misma media, la misma moda y la
misma mediana pero no obstante ello las tres son distintas.
Pueden tenerse dos distribuciones mismo nmero de elementos o tambin
conformadas por los mismos elementos y no obstante ello ambas son distintas.
Tabla 1. 12
X1 F1 X2 F2
0 0 0 0
1 3 1 6
2 4 2 8
3 7 3 4
4 5 4 3
5 4 5 2
6 2 6 2
7 1 7 1
8 0 8 0
26 26
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 36 -
Grfico 1.19
0
1
2
3
4
5
6
7
8
0 2 4 6 8 10
Grfico 1.20
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 9
Es necesario entonces considerar valores que nos determinen que tn cuan dispersos
estn. Estos valores se denominan valores de dispersin:
4.1 RANGO O AMPLITUD
Definicin
La diferencia entre los valores extremos de una distribucin se denomina Alcance o
Rango y se lo denota como R
Si definimos a x
n
como el mayor valor observado y a x
1
como el ms pequeo,
entonces:
R = x
n
x
1
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 37 -
Si bien, una vez ordenados todos los valores, el clculo de la amplitud o recorrido es
simple e inmediata, no nos brinda ninguna informacin sobre las caractersticas de los
valores intermedios. Veamos las siguientes distribuciones:
A) 0 1 1 2 4 6 8 10 12 14
B) 50 50,1 50,2 50,3 50,5 50,6 50,7 50,8 60 64
En la distribucin A
R = 14 0 = 14
En la distribucin B
R = 64 50 = 14
Ambas tienen el mismo nmero de elementos, el mismo alcance, no obstante ello son
distintas, es decir que el Rango o Amplitud de una distribucin nos entrega una
informacin limitada.
4.2 DESVO MEDIO
Para determinar el grado de dispersin de los valores de la distribucin, debemos
definir con respecto a que punto de referencia se toman las distancias, el punto de
referencia ms utilizado es la media de la de la distribucin
Considerando el ejercicio de pag. 39 (Los tiempos que los integrantes de un pelotn
tardan en cruzar la pista de combate), la distribucin de intervalos la representbamos
como:
3,09 3,39 3,69 3,99 4,29 4,6
[`---------------)[--------------)[-----------------)[-----------------)[-------------------]
3,24 3,54 3,84 3,14 3,44
d1
9697 , 3 =
d2
En el primer intervalo se encuentra una sola observacin, la cul consideramos es
coincidente con la marca de clase, luego su distancia respecto a la media ser:
d1 = x
m1
-
La dispersin de los valores ubicados en el segundo intervalo, en este caso son 4 y
habiendo considerado que los mismos se encuentran uniformemente distribuidos en
dicho intervalo, la dispersin respecto a la media estar dada por el producto de la
distancia de la marca de clase por el nmero de observaciones
d2 = x
m2
-
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 38 -
Podramos intentar considerar como un valor representativo de la dispersin de los
valores respecto a la media, al promedio de los desvos medios:
N
fi x
pdm
mi
=
). (
Pero nos encontramos con que la suma de todos los desvos es nula y siempre lo
sern por considerar como punto de referencia a la media. Todas las distancias de las
marcas de clase que se ubiquen a la izquierda de la media sern negativas, mientras
que las distancias de los que se ubiquen a la derecha sern positivas. El problema
radica en anular los signos negativos, para ello podemos:
a) considerar los desvos absolutos medios, de esta manera no se tendra ningn
desvo negativo y la suma de los desvos absolutos medios sera distinta de cero,
salvo el caso en que todas las observaciones sean iguales. La expresin matemtica
quedara como:
N
fi x
DM
mi
=
.
Esta expresin se define como Desvo medio (Promedio de los desvos absolutos
medios).
En nuestro caso en estudio conformaremos la tabla correspondiente a la distribucin
de intervalos pero incluiremos una nueva columna conteniendo los desvos absolutos
medias.
Tabla 1. 13
Li ls fi xmi Xmi * fi fai fdsi !xi - media!.fi
2,79 0 0 2,94 0 0 21 0,000
3,09 3,39 1 3,24 3,24 1 20 0,730
3,39 3,69 4 3,54 14,16 5 16 1,719
3,69 3,99 6 3,84 23,04 11 10 0,779
3,99 4,29 5 4,14 20,7 16 5 0,851
4,29 4,6 5 4,445 22,225 21 0 2,376
4,6 4,99 0 4,74 0 21 0 0,000
21 83,365 6,455
Aplicando la frmula correspondiente, el desvo medio ser:
6,455
DM = ------------------
21
DM = 0,3074
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 39 -
4.3 VARIANZA
Otra forma de obtener todos los desvos positivos, sera elevndolos al cuadrado es
decir:
N
f x
pdmc
i mi
=
. ) (
2
Esta expresin que definimos como: el promedio de los desvos cuadrticos medios y
se denomina Varianza.
Es conveniente entonces considerar una nueva columna conteniendo la suma de los
desvos cuadrticos medios tal como la tabla:
Tabla 1. 14
Li ls fi xmi Xmi * fi fai fdsi !xi -media!.fi (xi-media)
2
.fi
2,79 0 0 2,94 0 0 21 0,000 0
3,09 3,39 1 3,24 3,24 1 20 0,730 0,53255244
3,39 3,69 4 3,54 14,16 5 16 1,719 0,73878118
3,69 3,99 6 3,84 23,04 11 10 0,779 0,10102891
3,99 4,29 5 4,14 20,7 16 5 0,851 0,14490505
4,29 4,6 5 4,445 22,225 21 0 2,376 1,12925624
4,6 4,99 0 4,74 0 21 0 0,000 0
21 83,365 6,455 2,647
Var(x) =2,647 / 21 = 0,126 minutos al cuadrado
Tambin se la denota como:
dos utoscuadra min 126 , 0
2
= o
4.4 DESVIACIN ESTANDAR
La Varianza es un valor que determina un cierto grado de dispersin, pero en relacin
a lo que nosotros buscbamos, nos encontramos con que no tenemos el promedio de
los desvos medios, si no que contamos con el promedio de los desvos cuadrticos
medios. Una aproximacin estara obteniendo la raz cuadrada de la varianza:
N
fi xi
=
2
) (
o
O abreviando
) (x Var = o =
= = 126 , 0 o 0,3549
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 40 -
Definimos a la desviacin estndar como la raz cuadrada de la varianza y
prcticamente entrega el grado de dispersin de los valores de una distribucin con
respecto a la media.
Para dos distribuciones con la misma media, tendr ms dispersin aquella que tiene
una mayor desviacin estndar, tal como lo indica la grfica
Grfico 1.21
4.4 COEFICIENTE DE VARIACIN
En muchas oportunidades es conveniente comparar distribuciones de distinta media o
de distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso
de una Universidad, los valores de posicin central y de dispersin de una de ellas
estarn dados en metros o centmetros, pero los de la otra sern en Kg. , luego en
principio sera incorrecto pretender comparar las dispersiones de esas distribuciones,
a fin de poder comparar se opera con el Coeficiente de Variacin, que esta dado por el
cociente entre el desviacin estndar de la distribucin y su media, expresada de
manera porcentual:
o
= CV . 100%
Como tanto la desviacin estndar y la media tienen las mismas unidades, al dividirlas
se simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV
entrega la proporcin de la desviacin estndar respecto de la media. En el caso que
nos ocupa el:
94 , 8 100 .
' 9697 , 3
3549 , 0
= = CV
CV = 8,94%
Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y
que los resultados arrojados son:
x
f
r
e
c
u
e
n
c
i
a
Desvo estndar = 2
Desvo estndar =0,5
Desvo estndar =1
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 41 -
Desviacin estndar Media CV
Del Peso Kg 10 = o 71 k.o. 14,08%
Altura cm 6 = o 168 cm 3,57%
Estos ltimos valores del CV indican que, la distribucin correspondiente a la altura
tiene menos dispersin que la correspondiente a los pesos.
4.5 CUARTILES Y PERCENTILES
En muchas ocasiones es necesario contar con una subdivisin de los datos en
determinadas fracciones, llamados en de manera general como fractiles. De esta
manera una fraccin o proporcin de datos caen en un fractil o por debajo de ste. De
acuerdo al nmero de subdivisiones los fractiles toman un nombre determinado, as
estas pueden ser:
a) en 10 partes. En este caso cada una de esas partes toman el nombre de
decil
b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil
c) en cambio si la subdivisin es en 100 partes, se la denomina a cada una de
ella como centil.
El alcance interfractil, dada por la diferencia entre dos fractiles constituye una medida
de dispersin entre ellos.
En general los fractiles ms utilizados lo constituyen los cuartiles y percentiles.
Subdividir a los datos en cuatro fractiles implica que el 50% de los datos estn por
debajo del segundo cuartil y el 75% de las observaciones estn por debajo del tercer
cuartil, representados grficamente implica:
X
1
Q1 Q2 Q3 Xn
Una cuarta parte de las observaciones se encuentran por debajo de Q1, como que
tambin estn por debajo de Q2. Entre Q3 y Q1 se concentra el 50% de las
observaciones. Es necesario aclarar que Q1 como Q2 y Q3 son los puntos fractiles,
por debajo de cada uno de ellos se encuentran los porcentajes los correspondientes
porcentajes de datos.
Cuando el nmero de valores no es lo suficientemente grande la determinacin exacta
de los cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede
entre observaciones, de cualquier manera en general podemos decir que la
determinacin de cada cuartil quede satisfecha con las expresiones:
La determinacin de los cuartiles para datos no agrupados estn dadas por las
expresiones:
Q1 =
) 4 / 1 4 / 1 ( + N
X
Q2 =
) 2 / 1 2 / 1 ( + N
X
Q3 =
) 4 / 1 4 / 3 ( + N
X
Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si
recordamos que, el rea encerrada por el polgono de frecuencias era igual al nmero
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 42 -
de observaciones, sera lgico suponer entonces que en un diagrama correspondiente
al polgono de frecuencias suavizado, las superficies encerradas por dicho diagrama
sern proporcionales al nmero de observaciones correspondientes a la misma. Con
este concepto definimos los cuartiles grficamente segn grfico 1.22.
Grfico 1.22
Q1 Q2 Q3
Se define como Rango Intercuartil o propagacin media a la diferencia:
R I = Q3 Q1
Percentiles: De la misma manera en que la distribucin en estudio la podemos dividir
en cuatro partes, en el caso de hacerlo en 100 cada una de ellos tomar el nombre de
percentil, un percentil z cualquiera es un valor tal que z por ciento de las
observaciones quedan a su izquierda mientras que (100 - z) porcientos de los
valores quedan a su derecha. El percentil 80 est dejando a su izquierda el 80% de los
valores de la distribucin, es decir todos aquellos menores a el, y por lo tanto el 20%
de la distribucin lo superan, es decir quedan a su derecha.
Grfico 1.23
fdp
xi
80
Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I)
Profesor: MARIO MARN
- 43 -
4.6 REGLA EMPRICA
Segn vimos en el punto anterior, dada una distribucin, el valor de su desviacin
estndar nos indica el grado de dispersin de sus valores con respecto a la media,
pero es en realidad la Regla Emprica, quien relaciona a los dos parmetros : y o con
el siguiente enunciado:
En el intervalo centrado en la media y tal que su origen izquierdo est dado por la
media menos un desviacin estndar y el derecho por la media ms un desviacin
estndar, se agrupa el 68 % de los valores de la distribucin; En el intervalo
comprendido por la media menos dos desviaciones estndar y ms dos desviacioness
se ubica el 95% de los valores de la distribucin, por ltimo en el intervalo
comprendido por la media menos tres desviaciones estndar y la media ms tres
desvos estndar se tendr el 99,7% de N (suele considerarse en muchas
oportunidades en este intervalo el 100% de N).
Debe de tener en cuenta que, entre el inicio de la grfica y su fin, se encuentran
ubicados todos los valores de la distribucin N.
Grfico 1.24
fdp
- 3o - 2o -1o +1o +2o +3o xi
68% N
95%N
99,72% N
Resumen Regla Emprica
( 1o ) se tiene el 68% de N
( 2o ) se tiene el 95% de N
( 3o ) se concentra el 100% de N