Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Frecuencias
Frecuencias
INTRODUCCIN
DEFINICIN DE ESTADSTICA
ESTADSTICA DESCRIPTIVA
CONCEPTOS BSICOS
POBLACIN
VARIABLE: Cualitativas o Categricas y Cuantitativas (Discretas y
Continuas)
MUESTRA
TAMAO MUESTRAL
DATO
DISTRIBUCIONES DE FRECUENCIAS
FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA
FRECUENCIA ACUMULADA
FRECUENCIA RELATIVA ACUMULADA
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS
MTODOS GRFICOS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTORES O DE PASTEL
HISTOGRAMA
MEDIDAS DESCRIPTIVAS DE POSICIN Y DISPERSIN
MEDIDAS DE POSICIN
MEDIDAS DE POSICIN CENTRAL
MEDIA ARITMTICA
MEDIANA
MODA
MEDIDAS DE POSICIN NO CENTRALES
PERCENTILES
CUARTILES
MEDIDAS DE DISPERSIN
MEDIDAS DE DISPERSIN ABSOLUTAS
VARIANZA
DESVIACIN TPICA
RECORRIDO INTERCUARTLICO
MEDIDAS DE DISPERSIN RELATIVAS
COEFICIENTE DE VARIACIN DE PEARSON
ESTADISTICA DESCRIPTIVA
INTRODUCCION
1.1 DEFINICIN DE ESTADSTICA: es un conjunto de teoras y mtodos
desarrollados para la recopilacin, representacin y el uso de datos sobre una
o varias caractersticas de inters con el objeto de tomar decisiones, extraer
conclusiones o emprender acciones.
1.2 ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga
de organizar, resumir y describir las caractersticas principales de los datos.
Generalmente se resumen en forma tabular, grafica o numrica. El anlisis se
limita en si mismo a los datos coleccionados y no se realiza inferencia alguna o
generalizaciones acerca de la totalidad de donde provienen esas
observaciones.
1.3 ESTADSTICA INFERENCIAL: Es la que trata de estimar
caractersticas de una poblacin a travs del estudio de una muestra.
las
pgina 2 de 32
ESTADISTICA DESCRIPTIVA
pgina 3 de 32
ESTADISTICA DESCRIPTIVA
N de calificaciones
3
6
10
38
25
50
0
pgina 4 de 32
ESTADISTICA DESCRIPTIVA
pgina 5 de 32
ESTADISTICA DESCRIPTIVA
Ejemplos:
Calificacin de una prueba de Estadstica realizada en la UCV
Puntuacin
90-99
80-89
70-79
60-69
Menos de 60
N de Estudiantes
2
6
15
30
60
Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir
temperatura, bien sea en grados Centgrados o Fahrenheit. En estas escalas la
diferencia entre 80 y 85 es igual a la que existe entre 90 y 95 o entre dos
puntos cualesquiera de la escala.
Las estadsticas apropiadas para esta escala son: media, desviacin estndar,
rango, varianza, coeficiente de variacin, asimetra y kurtosis. Tipos de
grficos: histograma, polgono de frecuencias y grfico de tallos y hojas.
Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto
de medicin, posee todas las caractersticas de las escalas nominales,
ordinales y de intervalos; adems tiene un cero absoluto o natural que tiene
significado fsico. Si en ella la medicin es cero, significa ausencia o
inexistencia total de la propiedad considerada. Son posibles todas las
operaciones aritmticas. Los nmeros indican los valores concretos de la
propiedad que s esta midiendo; peso, estatura, ingresos monetarios y gastos
directos, son ejemplos de medidas con una escala de razn.
Cuando se emplea este tipo de escala, los nmeros indican razones o
cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con
tales escalas pueden ser sometidos a los tratamientos ms elaborados.
Propiedades de la escala a razn:
1. La distancia entre los nmeros es un tamao conocido y constante.
2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el
coeficiente de variacin.
4. Permite hacer comparaciones entre los nmeros verdaderos con un cero
aritmtico siendo arbitrario nicamente la unidad de medida.
Ejemplo de escala a razn:
Computadores vendidos en el ltimo trimestres del ao 2006
Meses
Octubre
Noviembre
Diciembre
Prof. Simn Cabrera
N de computadores
4.000
6.000
15.000
pgina 6 de 32
ESTADISTICA DESCRIPTIVA
Otros ejemplos de esta escala son: la medicin del peso o altura de un grupo
de personas, el ingreso familiar, la intensidad de corriente elctrica de un cable,
la edad de un grupo de personas, etc.
Generalmente, se supone que los datos que se obtienen para una variable
cuantitativa se miden en escalas de intervalo o de razn. Estas escalas
constituyen los niveles ms elevados de medicin. Son formas ms fuertes de
medicin que la escala nominal y ordinal, porque permiten comprender no slo
cul de los valores de un estudio es mayor o menor, sino por cuntas
unidades de medida. Las escalas de razn son medidas de Longitud, peso,
capacidad, etc., los nmeros reflejan razones entre particularidades y los datos
obtenidos segn tales escalas pueden ser sometidas a cualquier tratamiento
estadstico
pgina 7 de 32
ESTADISTICA DESCRIPTIVA
Fi = f j = Fi 1 + f i
j =1
pgina 8 de 32
ESTADISTICA DESCRIPTIVA
fi
f1
f2
...
fn
fi=n
Fi
F1
f1+f2
...
f1+f2+ + fn
hi
h1= f1/n
h2= f2/n
...
hn= fn/n
hi=1
Hi
h1
h1+h2
...
h1+h2+ + hn
Ejemplo 1:
El gobierno desea averiguar si el nmero medio de hijos por familia ha
descendido respecto de la dcada anterior. Para ello ha encuestado a 50
familias respecto al nmero de hijos, y ha obtenido los siguientes datos:
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a. Construir la tabla de frecuencias absolutas
b. Cul es el nmero de familias que tiene como mximo dos hijos?
c. Cuntas familias tienen ms de 1 hijo pero como mximo 3?
d. Qu porcentaje de familias tiene ms de 3 hijos?
Solucin:
a. Para construir la tabla de frecuencias hay que tener en cuenta que la
variable en estudio es el nmero de hijos (discreta), que toma los valores
existentes entre 0 y 6 hijos y las frecuencias son el conjunto de familias, de
esta forma tenemos:
fi
Fi
hi
Hi
xi
0
2
2
0.04
0.04
1
4
6
0.08
0.12
2
21
27
0.42
0.54
3
15
42
0.3
0.84
4
6
48
0.12
0.96
5
1
49
0.02
0.98
6
1
50
0.02
1
n=50
b. En la columna de las fi: 2+4+21=27 en la columna de las Fi: F2= 27
c. En la columna de las fi: 21+15=36 en la columna de las Fi: 42-6=36
d. En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% en
la columna de las Hi: 1-0.84=0.16, 16%
Prof. Simn Cabrera
pgina 9 de 32
ESTADISTICA DESCRIPTIVA
pgina 10 de 32
ESTADISTICA DESCRIPTIVA
2.- Punto medio o Marca de clase ( X& ).- Es la semisuma del lmite inferior y
L +L
superior de una clase, tal como lo indica la siguiente formula: X i = i i 1 .
2
3.- Amplitud , Longitud o Tamao del Intervalo.- Los intervalos de clases
pueden ser de tres tipos: Clases de igual tamao, clases de tamaos
desiguales y clases abiertas. En trminos generales, las clases de igual tamao
son los mas utilizados y recomendados para los clculos estadsticos. Se
designa por las letras Ic.
Nota: Al nmero de observaciones de una clase se le llama frecuencia de
clase, si dividimos esta frecuencia por el nmero total de observaciones, se
llama frecuencia relativa de clase, y del mismo modo que lo hacamos para
datos sin agrupar definiramos Hi, y Fi.
DISTRIBUCIN
DE
Numero de Intervalos
De 4 a 8
De 8 a 11
De 11 a 14
pgina 11 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo 2
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el
precio de sus habitaciones, el gerente investiga los precios por habitacin de
40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles
de pesetas) fueron:
3.3
4.2
4.5
5.1
3.3
4.3
4.7
5.3
3.7
4.3
4.7
5.3
3.8
4.3
4.7
5.4
3.9
4.3
4.7
5.6
3.9
4.4
4.8
5.8
3.9
4.4
4.9
5.8
4.0
4.5
5.0
6.0
4.1
4.5
5.0
6.1
4.2
4.5
5.1
6.1
Procedimiento:
1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2.- K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos
3.- Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos
As pues la tabla sera:
CLASES
[3.3, 3.8)
[3.8, 4.3)
[4.3, 4.8)
[4.8, 5.3)
[5.3, 5.8)
[5.8, 6.3)
fi
3
8
14
6
4
5
Fi
3
11
25
31
35
40
Ci
3.5
4
4.5
5
5.5
6
hi
0.075
0.2
0.35
0.15
0.1
0.125
pgina 12 de 32
Hi
0.075
0.275
0.625
0.775
0.875
1
ESTADISTICA DESCRIPTIVA
MTODOS GRFICOS
La forma de la distribucin de frecuencias se percibe ms rpidamente si la
representamos grficamente. Se resume la informacin de la muestra de forma
grafica con fines clarificadores o para enfatizar y descubrir determinadas
caractersticas que de otra manera seria muy difcil de apreciar. Un grafico
siempre es mas inmediato de comprender que un conjunto de datos
estadsticos. Las representaciones graficas varan segn el tipo de variable:
a. Grficos para variables Discretas y Categricas
DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables
cuantitativas discretas o para variables cualitativas. En el eje de ordenadas
representamos los diferentes valores de la variable (xi). Sobre cada valor
levantamos una barra de altura igual a la frecuencia (absoluta o relativa).
Ejemplo:
180
160
140
120
100
80
60
40
20
0
1er
trim.
2do
trim.
3er
trim.
4to
trim.
fi
50%
40%
10%
a favor
en contra
abstencin
50 * 360
= 180
100
pgina 13 de 32
ESTADISTICA DESCRIPTIVA
a favor
en contra
abstencion
25
21
Frecuencias
20
15
16
16
15
11
10
8
6
4
0
15 20 25
30 35
40 45 50
Clases
pgina 14 de 32
55 60 65
ESTADISTICA DESCRIPTIVA
EJERCICIOS
1.- Los siguientes datos representan los ingresos diarios (en miles) de 20
obreros de cierta compaa.
16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24.
a. Construya una tabla de frecuencias agrupadas utilizando la formula
de Sturges.
b. Construya un histograma de frecuencias. Comente.
c. Cuntos obreros tienen un ingreso diario menor de 22?
d. Qu porcentaje de obreros tienen un ingreso diario entre 16 y 19?
2.- Los siguientes datos corresponden al tiempo que han necesitado 30 clientes
de un banco para llevar a cabo una transaccin bancaria:
0.1
4.1
0.4
4.1
1.1
4.3
1.2
4.6
1.3
5.0
1.4
5.5
1.5
6.4
1.6
6.5
2.0
7.7
2.5
7.3
2.8
7.4
2.8
8.0
3.1
9.5
3.3
9.5
3.6
10.0
11
16
12
16
12
16
13
16
13
16
pgina 15 de 32
13
16
14
16
14
17
15
19
ESTADISTICA DESCRIPTIVA
MEDIDAS DE POSICIN
INTRODUCCIN
Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Las medidas de
posicin forman parte del conjunto de medidas descriptivas numricas, las cuales se
clasifican en parmetros cuando se calculan a partir de la poblacin total- y los
estadgrafos - cuando se calculan a partir de los datos de una muestra. Una medida
de posicin es un nmero que se toma como orientacin para referirnos a un conjunto
de datos.
Uno de los problemas fundamentales que presenta un anlisis estadstico, es el de
buscar el valor ms representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es el de
resumir los datos en una distribucin de frecuencia; esto no es suficiente para fines
practico, puesto que a menudo es necesario una sola medida descriptiva, y en
especial cuando se requiere comparar dos o ms serie estadsticas. Es necesario
continuar el proceso de reduccin hasta sustituir todos los valores observados por uno
solo que sea representativo, de tal forma que permita una interpretacin global del
fenmeno en estudio; para que ese valor sea representativo debe reflejar la tendencia
de los datos individuales de la serie de valores. Un valor o dato de la serie con estas
caractersticas recibe el nombre de promedio, media o medida de posicin, esto es
debido a su ubicacin en la zona central de la distribucin. Las medidas de posicin
son de gran importancia en el resumen estadstico, ya que representan un gran
nmero de valores individuales por uno solo.
El valor ms representativo de un conjunto de datos por lo general no es el valor ms
pequeo ni el ms grande, es un nmero cuyo valor se encuentra en un punto
intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor
referido que representar la medida de posicin de la serie de valores. Las medidas de
posicin se emplean con frecuencia como mecanismo para resumir un gran nmero de
datos o cantidades con la finalidad de obtener un valor que sea representativo de la
serie.
Las Principales Medidas de Posicin son:
La Media Aritmtica, Mediana, Moda, los cuartiles, Deciles y Percentiles.
Todas ellas a su manera tratan de dar una idea del numero alrededor del cual se
centra a todo el conjunto de datos.
CARACTERSTICAS DE LAS MEDIDAS DE POSICIN
pgina 16 de 32
ESTADISTICA DESCRIPTIVA
MEDIA ARITMTICA
La media aritmtica ( X ) o simplemente la media es la medida de posicin de ms
importancia y utilizacin en las aplicaciones estadsticas por su fcil calculo e
interpretacin. Se trata del valor medio de todos los valores que toma la variable
estadstica de una serie de datos. La media es el valor ms representativo de la serie
de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos. Por lo
general se le designa con X .
La media aritmtica de una serie de n valores de una variable X1, X2, X3; X4,.........Xn,
es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre
n
X
i =1
= 0.
(X
X) <
2
(X
K) .
2
Xt =
n1 X 1 + n 2 X 2 + n3 X 3 + ........ + n k X k
=
N
X
n1
X
n2
X
n3
+ .......
X
nk
Donde:
pgina 17 de 32
ESTADISTICA DESCRIPTIVA
4. La media del producto de una constante por una variable, es igual al producto de la
constante por la media de la variable.
X =
KX
n
K Xi
n
= KX .
X (Xi +K ) =
(X
+ K)
X
n
K
n
= X + K . ., de
El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la
serie de datos.
La media es una medida de posicin que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.
X =
variable.
Ejemplo:
Calcule la media aritmtica de los siguientes valores: X i = {5, 7, 8, 9, 11, 14}
X =
X
n
5 + 7 + 8 + 9 + 11 + 14 54
=
= 9.
6
6
pgina 18 de 32
ESTADISTICA DESCRIPTIVA
MTODO DIRECTO
Este mtodo se le conoce tambin como mtodo largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase
son muy grandes, debido a que los clculos son demasiados extensos. Los pasos a
seguir para calcular la media con este mtodo son los siguientes:
1. Se agrupan los datos en clases y se llevan a una columna, se calculan los
puntos medios de cada clase y se colocan en sus respectivas columnas, se
determinan las frecuencias de cada clase y se ubican en sus respectivas
columnas.
2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto
f i X& i .
medio ( X& ) as:
f X&
f X&
X =
=
n
f =n
i
Ejemplo:
Calcule la media de la siguiente distribucin de frecuencia correspondiente al peso en
Kg. de un grupo de obreros. Realice los clculos respectivos para completar el
siguiente cuadro.
CLASES
75-------79
80-------84
85-------89
90-------94
95 ------99
fi
20
40
60
100
140
f i = n =360
Solucin:
PESOS
X&
N DE OBREROS
f i X&
75-------79
80-------84
85-------89
90-------94
95 ------99
77
82
87
92
97
20
40
60
100
140
n =360
1540
3280
5220
9200
13580
f X&
i
= 32820
Interpretacin:
El peso promedio del grupo de
360 obreros es de 91.17 Kg.
pgina 19 de 32
ESTADISTICA DESCRIPTIVA
LA MEDIANA
La mediana es el valor que divide en dos partes iguales, al conjunto de observaciones
ordenadas respecto de sus magnitudes, de tal manera que el numero de datos por
encima de la mediana sea igual al numero de datos por debajo de la misma. Se
designa por las letras Me. Tal como sucede con la media, el mtodo de determinacin
depende de si los datos son agrupados o no.
CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS (Discretos)
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posicin que esta ocupa en esa serie de datos; para ello hay que determinar si la serie
de datos es par o impar.
Si el nmero n es impar, entonces la posicin de la mediana se determina por la
formula: Me = X n +1 , luego el nmero que se obtiene indica el lugar o posicin que
(
ocupa la mediana en la serie de valores, luego la mediana ser el nmero que ocupe
el lugar de lo posicin encontrada.
Si n es par, se aplica la formula Me =
X ( n / 2) + X ( n+ 2 / 2)
2
El resultado obtenido, es la
Me =
X ( n / 2) + X ( n + 2 / 2)
X ( 4 ) + X ( 5)
2
9 + 11 20
=
= 10
2
2
pgina 20 de 32
ESTADISTICA DESCRIPTIVA
n
. El
2
resultado obtenido
2 F(i 1)
este resultado. Luego se aplica la formula: Me = Li +
Ic
fi
Donde,
n
2
= posicin de la mediana
Li
F(i-1)
fi
Ic
n
Ejemplo:
Dada la siguiente distribucin de frecuencia referida a las horas extras laboradas por
un grupo de obreros. Calcule la mediana. Realice los clculos respectivos para
completar el siguiente cuadro.
N de horas Extras
55------59
60------64
65------69
70------74
75------79
80------84
85------89
pgina 21 de 32
Obreros
6
20
18
50
17
16
5
n = 132
ESTADISTICA DESCRIPTIVA
Solucin:
Cuadro con las frecuencias acumuladas:
N de horas Extras
55------59
60------64
65------69
70------74
75------79
80------84
85------89
Obreros
6
20
18
50
17
16
5
N = 132
Fi
6
26
44
94
111
127
132
Clase Mediana
n 132
=
= 66, luego se busca en la frecuencia acumulada Fi, un valor que sea igual o
2
2
superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos clase
mediana. Por lo tanto el limite inferior de esa clase es 70 = Li. La frecuencia absoluta
de esa clase es 50 = fi , F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene:
66 44
22
Me = 70 +
5 = 70 + .5 = 70 + 2.2 = 72.2.
50
50
Luego la mediana de esa distribucin es 72.2. Esto quiere decir que un 50 % de los
obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron
horas extras por encima de 72.2 horas.
CARACTERSTICAS DE LA MEDIANA
pgina 22 de 32
no
ESTADISTICA DESCRIPTIVA
LA MODA
La moda es la medida de posicin que indica la magnitud del valor que se presenta
con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se
repite en un conjunto de datos. De las medidas de posicin la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observacin
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia.
Se designa con las letras Mo.
En las representaciones grficas la moda es el punto ms alto de la grfica. La
obtencin de la moda para datos agrupados no es un valor exacto, ya que vara con
las diferentes formas de agrupar una distribucin de frecuencia.
En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados
se pueden presentar dos o ms modas, en estos casos se habla de serie de datos
bimodales o multimodales respectivamente. Estos tipos de distribuciones o series de
valores se deben a la falta de homogeneidad de los datos.
Cuando una serie de valores es simtrica, la media, la mediana y el modo coinciden, y
si el grado de asimetra de la serie es moderada, la mediana estar situada entre la
media y el modo con una separacin de un tercio entre ambas. Tomando en cuenta
esta relacin, cuando se tengan dos de esta medidas se puede determinar la tercera;
sin embargo es conveniente utilizar esta relacin para calcular solamente la moda ya
que para calcular la media y la mediana existen formulas matemticas que dan
resultados ms exactos; la formula matemtica para calcular la moda por medio de la
relacin antes mencionada es: Mo = X 3 X Me .
1
.Ic
Mo = Li +
2
1
Donde,
Li = es el limite inferior de la clase modal.
1 = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase anterior a la modal.
2 = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase siguiente a la modal.
Ic = es el tamao del intervalo de clase.
pgina 23 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo:
Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg. de un
grupo de trabajadores de una empresa, calcule la moda.
Peso (Kg)
30-----39
40-----49
50-----59
60-----69
70-----79
80-----89
90-----99
TOTAL
Trabajadores
2
2
7
11
12
16
2
Clase modal
La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la
clase modal, donde Li = 80 1 = 16 12 = 4; 2 = 16 2 = 14; Ic = 10
Aplicando la formula se tiene:
1
40
4
Mo = 80 +
Mo = Li +
= 80 + 2.22 = 82.22.
.10 = 80 +
18
4 + 14
1 + 2
Este resultado de la moda se interpreta as: La mayora de los trabajadores tiene un
peso aproximadamente de 82.22 Kg .
CARACTERSTICAS DE LA MODA
pgina 24 de 32
ESTADISTICA DESCRIPTIVA
Qc =
cn
, en donde c viene a ser el nmero del cuartil solicitado, n corresponde al
4
cn
, el
4
cn
4 F(i 1)
Qc = Li +
Ic.
fi
Donde,
cn
4
c
Li
F( i-1)
fi
pgina 25 de 32
ESTADISTICA DESCRIPTIVA
pn
100 F( i 1)
pn
. Con esta posicin se aplica la formula: Pp = Li +
PP =
Ic .
fi
100
Ejemplo:
Dada la siguiente distribucin correspondiente al salario semanal en dlares de un
grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q1, b) Q2, c)
Compare los resultados con la mediana, d) P25, f) P50, g) P70
SALARIO EN $
200-----299
300-----399
400-----499
500-----599
600-----699
700-----799
Obreros
85
90
120
70
62
36
463
Fi
85
175
295
365
427
463
Clase cuartil
Clase mediana
Clase percentil
1x 463 463
=
= 115.75.
4
4
3075
115.75 85
Q1 = 300 +
.
100
=
300
+
= 300 + 34.17 = 334.17
90
90
pgina 26 de 32
ESTADISTICA DESCRIPTIVA
Q2 =
2 x 463
= 231.5 , ahora se ubica esta posicin en las frecuencias acumuladas
4
5650
231.5 175
Q2 = 400 +
.100 = 400 +
400 + 47.08 = 447.08.
120
120
P70 =
70 x 463
= 324.10 . Ahora se ubica este resultado en la columna de frecuencias
100
2910
324.10 295
P70 = 500 +
.100 = 500 +
= 500 + 41.57 = 541.57.
70
70
Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por
debajo de 541.57 $ y que el 30% de los restantes obreros, ganan un salario por
encima de 541.57 $.
pgina 27 de 32
ESTADISTICA DESCRIPTIVA
MEDIDAS DE DISPERSION
INTRODUCCIN
La utilizacin de una medida de posicin escogida para representar a los datos no
indica otras caractersticas que el conjunto de observaciones que posee. No todas las
observaciones son iguales a la medida de posicin tomada o seleccionada; en general
los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos
ndices o medidas que indiquen la variabilidad o dispersin del conjunto de
observaciones que se estudian.
Una medida de variabilidad es un numero que nos indica el grado de dispersin en un
conjunto de datos. Si el valor es pequeo (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos (homognea). Por el contrario, un gran valor
nos indica poca uniformidad (heterognea). Cuando es cero quiere decir que todos los
datos son iguales.
Las medidas de dispersin se clasifican en dos grupos:
RANGO O RECORRIDO.
Es la medida de dispersin mas sencilla y se define como la diferencia entre el valor
mas alto menos el valor mas pequeo y se designa por R. Es decir, R = Xmax-Xmin para
datos no agrupados. Si los datos estn agrupados en K clases el rango ser la
diferencia entre el limite superior de la K-esima clase menos el limite inferior de la
primera clase.
El rango nos dar una primera idea sobre las dispersin de los datos ya que si su valor
es pequeo nos indicar una gran concentracin de los datos, y si por el contrario su
valor es grande nos puede indicar una gran variabilidad o dispersin de los datos.
pgina 28 de 32
ESTADISTICA DESCRIPTIVA
RANGOS ESPECIALES
El rango nos da una idea de la dispersin total de las observaciones, por lo tanto
puede estar afectada por valores extremos dando en consecuencia una idea de alta
dispersin. Por tal motivo, se han definido otros rangos que tratan de subsanar este
problema.
RANGO NTERCUARTILICO. Se define como la diferencia entre el cuartil tres(Q3) y
el cuartil uno(Q1) de una distribucin de frecuencia y se expresa as: RI = Q3 Q1.
RANGO SEMI-NTERCUARTILICA. Es la diferencia entre el Q3 y el Q1 dividido
entre dos:
RSI =
Q3 Q1
.
2
Si los valores de la RI o RSI son pequeos indica una alta concentracin de los datos
de la distribucin en los valores centrales de la serie de datos. Estas medidas se
utilizan para comparar los grados de variacin de los valores centrales en diferentes
distribuciones de frecuencias. Los mismos no son afectados por los valores extremos,
no se adaptan a la manipulacin algebraica, por tal motivo son de poco utilidad.
DESVIACIN MEDIA. La desviacin media de un conjunto de n observaciones x1, x2,
x3,. . .xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto
a la media aritmtica o la mediana. Si se denomina como DM a la desviacin media,
entonces su formula matemtica ser la siguiente:
N
DM =
i =1
Xi X
N
i =1
di
DM =
i =1
X& i X
n
fi
i =1
fi d i
n
pgina 29 de 32
ESTADISTICA DESCRIPTIVA
VARIANZA
Una manera de resolver el problema de los signos de las desviaciones respecto de la
media aritmtica es elevndolos al cuadrado y luego sumar todos los resultados
obtenidos. Esta suma se puede considerar como una medida de la dispersin total de
los valores. Aquellos que estn mas alejados de la media aritmtica tendrn un aporte
mayor a esta suma de cuadrados.
Su mayor utilidad se presenta en la estadstica inductiva y se puede interpretar como
una medida de variacin promedio (o el promedio de la suma de los cuadrados). Se
obtiene dividiendo la variacin total entre el numero de unidades o medidas. Se
designa por la letra S2 su formula de calculo es al siguiente:
(X
=
X )2
fi (X i X )2
n
fi X
n
2
i
DESVIACIN TIPICA
Como la varianza es el promedio de los desvos respecto de la media elevados al
cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una
medida de dispersin en las unidades originales se le extrae la raz cuadrada (positiva)
a la varianza, obteniendo as otra medida de dispersin denominada desviacin tpica
o estndar, la cual se designara por S y ser igual a :
S=
S=
( X&
X )2
( X&
X )2 fi
n
X
n
2
i
fi
X 2
pgina 30 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo:
Los siguientes datos corresponden al nmero de panes consumidos por un grupo de
familias de una urbanizacin de la ciudad, durante una semana determinada.
Clases
3032
3335
3638
3941
4244
4547
4850
fi
10
18
60
100
80
14
6
288
Solucin:
Clases
fi
3032
3335
3638
3941
4244
4547
4850
10
18
60
100
80
14
6
288
X =
S=
f X&
i
f i X i2
X& 12
f i X& i
310
612
2220
4000
3440
644
294
11520
f i X& i2
9610
20808
82140
160000
147920
29624
14404
464508
11520
= 40.0.
288
X& i
31
34
37
40
43
46
49
464508
11520
=
= 12 . 88
288
288
2
X& i
=
464508 11520
=
288
288
pgina 31 de 32
ESTADISTICA DESCRIPTIVA
DISPERSIN RELATIVA
Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra;
pero, cuando hay que establecer comparaciones entre distintas muestras, ser
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Las medidas de dispersin relativas permiten comparar grupos de series distintas en
cuanto a su variacin, independientemente de las unidades en que se midan las
diferentes caractersticas en consideracin. Generalmente las medidas de dispersin
relativas se expresan en porcentajes, facilitando as el estudio con medidas
procedentes de otras series de valores La dispersin relativa viene a ser igual a la
dispersin absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de
variacin de Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite
la comparacin entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variacin de Pearson se designa con las letras CV. La
formula matemtica es:
CV =
S
x100
X
Una serie de valores ser ms dispersa que otra mientras su CV sea mayor.
Ejemplo:
La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro.
Determine el CV de cada uno y diga cul de ellos presenta mayor variacin y cul la
menor.
Producto
1
2
3
45
450
4500
S
5
40
350
Unidades
Bs.
Bs.
Bs.
CV
11.11 %
8.87 %
7.78 %
pgina 32 de 32