Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Descriptiva
Estadistica Descriptiva
ESTADISTICA DESCRIPTIVA
1.1. LA ESTADISTICA Y LA VARIABILIDAD .
La Estadstica se ocupa de la recoleccin y anlisis de datos que corresponden a
fenmenos o situaciones en donde est presente la variabilidad.
La finalidad del anlisis es explicar tal variabilidad.
Si con suficiente resolucin, se realizan mediciones del peso de un artculo, se
encontrar que stas varan. Esta variabilidad puede deberse a diversas razones: al
instrumento de medicin, a la persona que realiza las mediciones, a las condiciones en
que se realiza la medicin, etc. Si se eligen 10 personas al azar y se mide su estatura se
podr observar nuevamente el fenmeno de la variabilidad y ella puede deberse: al
instrumento de medida, a factores de herencia, al tipo de alimentacin, etc. Para cruzar
un ro no es suficiente saber que en promedio la profundidad del agua es 0.50 m; Es
necesario conocer como vara la profundidad.
La variabilidad aparece en muchos procesos. La finalidad de la
Estadstica es explicarla.
A partir del conocimiento de la variabilidad se podr realizar inferencias, predecir, y
muchas veces, controlar resultados.
El estudio de la variabilidad se realiza a partir de la Probabilidad. En el segundo y tercer
captulos se introducen los conceptos bsicos de esta teora. Se indica en estos captulos
los modelos probabilsticos principales que servirn para representar situaciones en
donde est presente la variabilidad.
En este primer captulo se desarrollan mtodos esenciales de la Estadstica Descriptiva,
mtodos que tienen que ver con la codificacin, tabulacin, representacin grfica y la
sntesis numrica de datos que presentan variabilidad. Se estudian las tcnicas bsicas
para organizar y presentar los datos antes de pretender cualquier interpretacin. A partir
de la Estadstica Descriptiva, mediante grficos y diagramas, se identifican los modelos
probabilsticos que servirn para llevar a cabo la inferencia de las caractersticas de toda
una poblacin sobre la base de los datos recolectados
2. Estadstica Descriptiva.
Poblacin.
Cualquier conjunto A es una poblacin y cada uno de sus elementos es
una unidad de anlisis.
A cada unidad de anlisis tambin se le llama unidad estadstica o unidad experimental.
1.1. Ejemplo.
El conjunto formado por todos los trabajadores que laboran actualmente en la industria
textil de un pas es una poblacin. Cada trabajador es una unidad estadstica o de
anlisis.
El conjunto formado por todos los artculos producidos por una fbrica es una
poblacin. Cada uno de los artculos es una unidad estadstica o unidad experimental.
Cualquier subconjunto de una poblacin se llama muestra.
1.2. Ejemplo.
Interesaba conocer si el programa de TV 0007, que se propaga entre las 8 p.m. y las 9
p.m., tiene o no aceptacin entre los televidentes del pas. Para ello se propuso estimar la
proporcin de las personas que ven el programa entre todos los televidentes que tienen
encendido su televisor en dicho horario. La estimacin se realiz escogiendo slo 165
familias entre todas las que acostumbran encender su televisor en el horario indicado. La
poblacin la constituyen todas las familias del pas que encienden su televisor entre las 8
p.m. y las 9 p.m. Las 165 familias escogidas forman una muestra.
Variable o carcter.
Para referirnos a una caracterstica de los elementos de una poblacin, por ejemplo la
edad, el lugar de procedencia, el coeficiente de inteligencia de un grupo de personas, o
el peso de los artculos que produce una fbrica, se usa el concepto de variable o
carcter. Una variable es susceptible de adoptar distintos valores. As, la variable edad
definida en la poblacin Regin Sur puede tomar los valores: 10, 50, 65, etc., aos; la
variable opinin, establecida para estudiar si los ciudadanos de una pas estn de
acuerdo o no con una determinada ley, puede tomar el valor 1, si el poblador est de
acuerdo, el valor 2, si no est de acuerdo y el valor 3, si su posicin es indiferente.
El establecimiento de una variable es una de las etapas ms importante de
toda tarea estadstica. Mediante una variable el investigador cuantifica,
transforma en cifras las caractersticas de una cualidad de los elementos de la
poblacin.
Para estudiar una caracterstica de una poblacin, se hace corresponder a cada unidad de
anlisis un nmero real. De ah que
se define una variable, como una funcin X que a cada elemento de una
poblacin le hace corresponder un nmero real.
A una variable, tambin se le llama carcter.
1.3. Ejemplo.
En la poblacin formada por los artculos producidos en una fabrica, se puede definir la
variable que a cada artculo le hace corresponder el nmero de defectos que tiene.
4. Estadstica Descriptiva.
Variables y encuestas
A menudo se realizan encuestas, a travs de cuestionarios, para recoger informacin de
una poblacin.
Cada pregunta puede relacionarse con una variable, como en el caso siguiente:
Est usted de acuerdo con la ley antitabaco?.
Las respuestas pueden ser: si, no, no sabe / no contesta.
El entrevistado debe dar slo una respuesta. Esta respuesta puede ser codificada,
respectivamente, con los valores 1, 2 y 3, correspondiendo estos valores a una variable
que puede llamarse ley antitabaco.
Otras veces, a una pregunta de un cuestionario estn ligadas varias variables como en el
siguiente ejemplo.
Cules de estos medios de transporte pblico usa para trasladarse a su centro de labores
y con qu frecuencia?.
Esta pregunta puede ser relacionada con dos variables: una de stas puede llamarse bus,
la cual puede tomar los valores: 1, si viaja en bus y con gran frecuencia; 2, si viaja en
bus y con poca frecuencia y 3, si no viaja en bus y la otra, que puede nombrarse con taxi
y que se define de manera anloga a la anterior.
Bus
Taxi
Si con gran
frecuencia
1
1
Si con poca
frecuencia
2
2
No
3
3
Matrices de datos.
Los datos que se recogen de una poblacin pueden escribirse en tablas formndose
cuadros llamados matrices de datos.
1.5. Ejemplo.
Se han indicado algunos elementos que son esenciales para su interpretacin. Estos
elementos son:
- el ttulo de la tabla: INDICADORES BASICOS
- la fuente de la cual se ha extrado la informacin: Banco Mundial.
- signos empleados: el smbolo < indica "menor que".
- las unidades que se usan para representar las cifras: dlares, porcentajes, etc.
INDICADORES BASICOS
N.Habit.
Pas
Superficie.
2
PNB
Tasa inf.
Esper. vida
(milln)
(en miles de km )
(en $)
(en %)
(en aos)
V1
V2
22
1285
V4
233.9
V5
Per
V3
1160
Colombia
32
1139
1260
24.8
69
Chile
13
757
1940
20.5
72
Bolivia
1099
630
317.9
60
Argentina
32
2767
2370
395.2
71
Venezuela
20
912
2560
19.3
70
Brasil
150
8512
2680
284.3
66
Japn
124
378
25430
<5
79
Poblacin
5284
133342
4200
14.7
66
63
mundial
Fuente: Banco Mundial. Informe sobre el desarrollo mundial 1992.
< 5 indica "menor que 5, "
En lo que sigue y cuando sea necesario, se tratar de que aparezcan los principales
elementos que describen la tabla.
1.6. Ejemplo.
En la siguiente tabla se presentan los valores de la variable X que a cada uno de los
nueve pases indicados le hace corresponder la "inflacin" en el mes de Octubre de
1993; esto es, la variacin del promedio de los precios de los principales bienes con
respecto al mes anterior.
Tambin se presentan los valores de la variable Y que a cada uno de los pases que
aparecen en la tabla les hace corresponder la "inflacin anual acumulada" durante el ao
1993. (Los conceptos sobre inflacin se explican ms adelante).
6. Estadstica Descriptiva.
INFLACION
(Variacin porcentual)
PAISES
Brasil
Venezuela
Ecuador
Chile
Uruguay
Per
Colombia
Argentina
Bolivia
X: Inflacin
Octubre 1993
34.12
5.00
5.13
2.60
2.18
1.50
1.06
0.60
0.51
Fuente: INEI
Y: Inflacin
anual 1993
2567.46
44.1
32.3
12.1
52.3
39.5
22.4
7.7
8.8
Escala nominal.
Se tiene una escala nominal si a todos las unidades estadsticas equivalentes respecto de
la propiedad o atributo en estudio se les hace corresponder un mismo nmero real, que
funciona slo como "etiqueta". Las operaciones que se puedan realizar con los nmeros
asignados a las unidades estadsticas, as como el orden que entre ellos se puedan
establecer, no tienen significado en relacin con el atributo que se mide. Con una escala
de este tipo se consigue la agrupacin de las unidades estadsticas en clases equivalentes
llamadas modalidades o categoras. La escala nominal es el tipo de escala ms sencillo.
Con ella se logra una notacin abreviada, por lo que su uso se ha incrementado con la
aparicin de la computadora.
1.7. Ejemplo.
Escala ordinal.
Se tiene una escala ordinal, cuando el orden de los nmeros asignados a las unidades
estadsticas refleja diferentes grados de la propiedad o atributo en estudio. De modo que
si la cifra asignada al elemento w es mayor que la asignada al elemento u, se puede
inferir que w posee un mayor grado que u en la propiedad que se estudia. Los nmeros
asignados, segn la escala ordinal, slo tienen sentido en cuanto a orden se refiere. La
diferencia entre los nmeros asignados no necesariamente tiene significado. As, el
ordenamiento en categoras de los vendedores de una tienda, asignndoles el 1, al que
logr las ventas ms altas, el 2 al que logr ventas intermedias y el 3 al que logr las
ventas ms bajas, no indica que la diferencia en ventas entre los vendedores de ventas
bajas y los de ventas intermedias es igual a la diferencia en ventas entre los vendedores
de ventas intermedias y los de vendedores de ventas altas, an cuando 3 - 2 = 2 - 1.
1.8. Ejemplo.
Si al considerar la poblacin formada por los alumnos del curso de Geografa se asigna a
cada uno el orden de mrito, segn las calificaciones que obtuvieron, se tendr una
escala ordinal. Si a un alumno se le asign el nmero 5 y a otro se le asign el nmero 8,
se puede decir que el primer alumno est en mejor posicin que el segundo pero no
podemos decir nada respecto a la diferencia 8 - 5 = 3.
8. Estadstica Descriptiva.
1.9. Ejemplo.
Si se considera la poblacin formada por todos los minerales que se producen en cierta
regin y a cada uno de stos le asignamos un nmero, de acuerdo al "grado de dureza"
que poseen, la escala asignada es ordinal.
Si al mineral a le asignamos el valor 2; al mineral b, el valor 4; al mineral c, el valor 10
y al mineral d, el valor 12; se puede decir que el mineral a es menos "duro" que el
mineral b; que el mineral d es ms "duro" que el mineral c; sin embargo, si al asignar las
medidas slo se tuvo en cuenta el orden de los valores, no se puede decir que la
diferencia del grado de dureza que existe entre a y b es igual, a la diferencia del grado
de dureza que hay entre c y d. La diferencia que existe entre los nmeros asignados no
necesariamente tiene significacin en esta escala.
Escala intervalar.
Se tiene una escala intervalar, cuando los valores asignados a las unidades estadsticas
no slo permiten que stas puedan ser ordenadas, sino que adems, las diferencias
iguales entre stos indican diferencias iguales en las cuantas de las propiedades a medir.
Como ejemplo de escalas intervalares, tenemos las escalas de Fahrenheit y de Celsius
(centgrada) para medir la temperatura.
Para cada una de estas escalas, por ejemplo la de Celsius, los nmeros ms grandes
significan mayor temperatura; el orden de los nmeros asignados tiene significado, pero
tambin tienen significado expresiones como la temperatura de hoy es 50 C ms alta
que la de ayer. La diferencia entre las temperaturas tiene sentido.
PROPIEDAD.
Una propiedad importante de este tipo de escalas indica que si para medir el mismo
atributo en tres elementos w1 , w2 , w3 se usan, respectivamente, los nmeros x1 , x 2 , x 3
y1 y2
Grados centgrados
0
100
Grados Fahrenheit
32
212
41
Estadstica Descriptiva. 9
y = a + bx
S e o b serv a q ue
y y2
x x2
=
y 2 y1
x 2 x1
y2
y1
E sca la I
x1 x2
x
Figura 1.1
As por ejemplo, entre los valores x, en grados centgrados, y los valores y, en grados
Fahrenheit, se cumple:
y = 32 + (9 / 5) x .
Escala de razn.
La escala de razn o cociente, es una escala intervalar en donde los cocientes o razones
de los nmeros asignados reflejan los cocientes o razones en las cuantas de las
propiedades que se miden. Para este tipo de escalas, adems del cociente entre los
nmeros asignados, tienen sentido el orden y las diferencias que entre ellos se puedan
establecer. Es decir toda escala de razn es intervalar y ordinal.
As, una persona que gana $1200 tiene mayor poder adquisitivo que otra que gana
$400. El orden en esta escala tiene sentido. Tambin se puede indicar la cantidad que
gana ms el primero que el segundo. La diferencia entre los nmeros asignados tiene
sentido. Adems los cocientes de los valores indicados tienen significacin; tiene
sentido, por ejemplo, la expresin el primero gana tres veces ms que el segundo.
PROPIEDAD.
Si x e y son dos valores asignados a un mismo elemento para medir la misma cualidad,
segn dos escalas de razn diferentes, entonces entre estos valores se cumple la
relacin y = bx.
E scala II
y1
y = bx .
y
E scala I
x1
Figura 1.2
Se ob serv a qu e
y1
y
=
x1
x
Estadstica Descriptiva. 11
Segn esta relacin, el 0 tiene el mismo significado para cualquier escala de razn.
Indica ausencia de la propiedad en estudio.
Si el salario de una persona se expresa en dlares (x) o en soles (y), entonces se cumple
la relacin y = 2.5x, si se supone que un dlar equivale a 2.5 soles. La constante 2.5
corresponde a lo que se denomina tipo de cambio.
El cociente entre los salarios de dos personas expresados en dlares es igual al cociente
de los mismos expresados en soles. Si dos personas ganan 200 y 300 dlares,
respectivamente, entonces la razn entre los salarios, 300/200, es igual a la razn entre
los salarios expresados en soles, 750/500.
Si para un variable, la asignacin de valores slo tiene sentido cuando se usa una escala
nominal u ordinal, sta se llama variable cualitativa o categrica; as por ejemplo, el
lugar de procedencia de un conjunto de personas, "el color" de los autos producidos
por una fbrica, corresponden a variables cualitativas.
Variables cuantitativas.
Una variable se llama cuantitativa o tambin estadstica si tiene sentido para las escalas
intervalar o de razn. Por ejemplo, la variable que a cada persona le hace corresponder
su salario es una variable cuantitativa.
La variable que a cada uno de los aparatos electrnicos producidos por una fbrica le
asigna su tiempo de vida es una variable cuantitativa.
De acuerdo al conjunto de valores de la variable, stas se clasifican en: discretas y
continuas.
Variables discretas
Una variable es discreta, si el conjunto de valores que puede tomar es finito o infinito
enumerable. (Un conjunto es "infinito enumerable" si sus elementos se pueden contar).
1.12. Ejemplo.
Una variable discreta cuyo conjunto de valores est formado por dos elementos, se llama
binaria o dicotmica.
Variables continuas.
Una variable es continua, si sus valores pueden ser cualesquiera de los elementos de un
intervalo o de la reunin de intervalos.
1.13. Ejemplo.
La variable que indica el tiempo de vida de los aparatos electrnicos es una variable
continua, la variable que indica la estatura de cada habitante de un pas es una variable
continua. Los valores que pueden tomar estas variables son no negativos. Para efectos de
mejor estudio de estas variables, se considera que el intervalo en donde pueden variar
los valores es [ 0,+[ .
Una variable es independiente, (con relacin a otra u otras) si sus valores influyen en
otra u otras variables.
Variables dependientes.
Una variable es dependiente si sus valores dependen de los valores que tiene una
variable independiente.
Las variables independientes y dependientes tambin se llaman explicativas y
explicadas, respectivamente.
As, para ver como influye una droga A en el tratamiento de una enfermedad, el
investigador aplica diferentes dosis al enfermo para observar si ste mejora o no. La
variable cuyos valores son las distintas dosis de droga suministrada es una variable
Estadstica Descriptiva. 13
independiente, mientras que la variable que indica el grado de mejora del enfermo es
una variable dependiente. En este caso, los valores de la variable independiente pueden
ser manejados por el experimentador; otras veces esto no es posible, pues los valores de
la variable independiente son intrnsecas al individuo al cual se aplica. As sucede
cuando se considera la variable independiente aos de estudio y la variable
dependiente sueldo.
Variables de control.
- No inversin de capitales.
- Retraso de la cultura.
- Emigracin de la poblacin.
- No s.
Estadstica Descriptiva. 15
que la consecuencia de la guerra tienen que ver con la economa, bastar con formar
slo las tres categoras siguientes:
1. Deterioro econmico. 2. Otras consecuencias y 3. No sabe, no contesta.
Estudios previos de la muestra de algunos cuestionarios. Estos nos darn las pautas
de las posibles respuestas y por lo tanto de las categoras que debemos formar.
Algunas veces se realizan investigaciones pilotos antes de realizar toda
investigacin.
Que las categoras contemplen todas las respuestas posibles. Existirn categoras
principales, para las respuestas relevantes y categoras de tipo general que
comprendan a las respuestas que no caen en las categoras principales.
Que las categoras no se traslapen. Cada respuesta debe pertenecer a una nica
categora.
Que las categoras sean descritas de manera clara, tratando que sean lo ms
detalladas posibles y tiles en la investigacin que se realiza.
Cuando las preguntas son cerradas; esto es, cuando las respuestas posibles son
especificadas de antemano, cada categora se identifica con cada una de las respuestas
posibles.
As por ejemplo, si la pregunta es cul es su regin de procedencia? y las posibles
respuestas son: 1. Costa, 2. Sierra y 3. Selva, se tendrn los siguientes cdigos y
categoras:
Cdigo
Categora
Costa
Sierra
Selva
Cdigo
Categora
de 0 a 13 aos
de 14 a 18 aos
de 19 a ms aos
Esta codificacin no ser til si, por ejemplo, el objetivo es determinar la edad promedio
de los habitantes; sin embargo, sta si ser de utilidad si el deseo es, por ejemplo,
analizar la relacin que exista entre la edad y otra variable cualitativa.
Caso cualitativo.
1.14. Ejemplo.
Estadstica Descriptiva. 17
Modalidad
Frecuencia
Frec. relativa
Frec. relativa
en porcentaje
Varn
30
30/50 = 0.60
60
Mujer
20
20/50 = 0.40
40
Total
50
1.00
100
ni
fi = ni/T
(ni/T)100%
C1
n1
n1/T
(n1/T)100
...
...
...
...
Ci
ni
ni/T
(ni/T)100
...
...
...
...
Ck
nk
nk/T
(nk/T)100
Total
100
Las frecuencias relativas pueden expresarse en porcentajes y el orden elegido para las
modalidades es arbitrario.
1.15. Ejemplo.
Las frecuencias que se indican en las columnas de la tabla pueden representarse con
barras rectangulares o mediante sectores circulares.
Ocupacin.
ni
ni/T
(ni/T)100
(1): Abogados
(2): Ingenieros
(3): Topgrafos
(4): Obreros
(5): Secretarias
18
32
45
20
15
0.1385
0.2461
0.3462
0.1538
0.1154
13.85
24.61
34.62
15.38
11.54
1.0000
100.00
TOTAL
T = 130
Se representa por ejemplo, las frecuencias ni utilizando barras rectangulares (figura 1.3.
a) y luego mediante sectores circulares (figura 1.3. b).
En el grfico de barras, cada barra rectangular corresponde a una modalidad, tiene base
constante y su altura puede ser medida en unidades de frecuencia o de frecuencia
relativa. En la grfica, para la modalidad "abogado" se tiene una barra vertical de altura
igual a 18.
En los "sectores circulares", cada sector corresponde a una modalidad y su
correspondiente ngulo en el centro es i = 360oni/T, en donde ni es la frecuencia en la
modalidad. A la modalidad "abogado", por ejemplo, le corresponde un sector circular
cuyo ngulo en el centro es igual a (360)(18)/130 = 49.84o.
50
40
OBRE
SECR
30
ABOG
20
TOPO
INGE
10
0
ABOG
INGE
TOPO
OBRE
SECR
(a)
(b)
Figura 1.3
1.16. Ejemplo.
Estadstica Descriptiva. 19
Causas de fallas
Herramienta gastada
Errores de operacin
Mal diseo
Mala calidad del material
Frecuencias
12
7
3
5.
1: Herram. gastada
2: Errores operacio.
3: Mal diseo
4: Mala calidad
En una poblacin formada por 100 lotes de 50 artculos cada uno, se consider la
variable cuantitativa discreta X = "nmero de artculos defectuosos en cada lote". Los
resultados fueron:
15423453542456452532463451632543635725427465283
36424348153737241353846545454526343523431454474
6 2 6 2 4 5.
La informacin puede organizarse como en la siguiente tabla
DISTRIBUCION DE 100 LOTES DE ACUERDO
AL NUMERO DE ARTICULOS DEFECTUOSOS.
xi
1
2
3
4
5
6
7
8
Total
Computo
|||||
|||||
|||||
|||||
|||||
|||||
|||||
|||
|||||
|||||
|||||
|||||
|||||
||||
||||| |||
||||| ||||| |||||
||||| |||||
ni
fi=ni/T
Ni
Fi
5
14
18
25
20
10
5
3
0.05
0.14
0.18
0.25
0.20
0.10
0.05
0.03
5
19
37
62
82
92
97
100
0.05
0.19
0.37
0.62
0.82
0.92
0.97
1.00
T = 100
en donde,
xi , corresponde a los distintos valores que puede tomar la variable,
ni , indica la frecuencia con que se repite xi (ej. la frecuencia para 3 es 18),
fi = ni/T , es la frecuencia relativa respecto del nmero total, T, de los datos. (ej. la
frecuencia relativa para 3 es 0.18). Se presenta tambin en porcentajes (multiplicando
cada valor por 100),
Ni , es la frecuencia acumulada. Es igual a la suma de las frecuencias de los valores
que son menores o iguales a xi, (ej. la frecuencia acumulada para 3 es 5 + 14 + 18 =
37),
Fi , es la frecuencia acumulada relativa. Es igual a la suma de las frecuencias
relativas de los valores que son menores o iguales a xi (ej. la frecuencia acumulada
relativa para 3 es 0.05 + 0.14 + 0.18 = 0.37).
- 0.25
1 2 3
4 5 6
7 8
Cada una de las siguientes figuras puede usarse para representar a la frecuencia
acumulada relativa, Fi .
Estadstica Descriptiva. 21
Fi
Fi
0.92
0.92
0.62
0.62
0.05
0.05
1
Los subintervalos pueden ser de longitudes diferentes, para mayor facilidad se usan de
longitudes iguales.
Los subintervalos obtenidos se toman, por convencin, cerrados por la izquierda y
abiertos por la derecha, a excepcin del ltimo, que es cerrado en ambos extremos. Los
intervalos que as se forman se llaman intervalos de clase.
I1 = [30.00, 31.25[
I3 = [32.50, 33.75[
I5 = [35.00, 36.25[
I7 = [37.50, 38.75[
30
31.25
32.50
33.75
I2 = [31.25, 32.50[
I4 = [33.75, 35.00[
I6 = [36.25, 37.50[
I8 = [38.75, 40.00]
35.00
36.25
37.50
38.75
40
Figura 1.7
NOTA.
xi
ni
fi
Ni
Fi
I1
I2
30.6250
0.0555
0.0555
31.8750
0.0833
0.1388
I3
I4
33.1250
0.1388
10
0.2776
34.3750
0.2222
18
0.4998
I5
I6
35.6250
0.1944
25
0.6942
36.8750
0.1666
31
0.8608
I7
I8
38.1250
0.1111
35
0.9719
39.3750
0.0277
36
Estadstica Descriptiva. 23
Menor que 25
Entre 25 y 50
Mayor que 50
5 o 6.
de 7 a 14.
de 15 a 20.
n' =
ca
n
ba
datos
n
n
a
c
Figura 1.8.
n
n
=
, de donde resulta
ba ca
lo antes indicado.
En particular, si c es la marca de clase del intervalo, en [a, c[ hay n' = (1 / 2 ) n .
El resultado anterior se extiende para el caso de las frecuencias relativas De este modo si
la frecuencia relativa en [a, b[ es f, entonces la frecuencia relativa en [a, c[ es f' = [(c a)/(b - a)]f.
1.19. Ejemplo.
[10, 12[
[12, 14[
[14, 16[
[16, 18]
ni
fi
Ni
12
30
28
10
0.150
0.375
0.350
0.125
12
42
70
80
Fi
0.150
0.525
0.875
1.000
El 5% de los estudiantes debe tener notas comprendidas entre los valores A y 18.
Luego,
18 16 18 A
=
0.125
0.05
Despejando, resulta que la nota a considerar, por encima de la cual existe el 5%, es A =
17.2
1.20. Ejemplo.
Las notas de N estudiantes estn distribuidas tal como se indica en la siguiente tabla.
Estadstica Descriptiva. 25
Notas
[8, 11[
fi
f1
[11, 14[
f2
[14, 17[
f3
[17, 20]
f4
Calcular las frecuencias relativas si el 40% de los estudiantes tienen notas menores que
12.5, el 80% tienen notas menores que 15.5 y el 85% tienen notas menores o iguales a
16.
Solucin.
Se tiene que
f1 + f 2 + f 3 + f 4 = 1
HISTOGRAMAS
Como en el caso discreto, las frecuencias de los conjuntos de datos que corresponden a
variables continuas se representan grficamente con la finalidad de obtener patrones que
indiquen la variabilidad o distribucin de los mismos. A menudo se usan curvas cuyas
formas se obtienen a partir de los grficos llamados histogramas.
Los histogramas se obtienen al yuxtaponer bandas rectangulares. Cada banda
corresponde a cada intervalo de clase Ii. La base es el intervalo y la altura puede tomarse
proporcional a la frecuencia que se desea representar. As, para representar la frecuencia
relativa, f i , cada altura puede tomarse igual a fi/li, en donde li es la longitud del
intervalo de clase correspondiente. De este modo se tiene que la suma de las reas de las
bandas es igual a 1 y el histograma es un histograma de frecuencias relativas.
p olgon o de
d e frecuencias
f i / li
l
30
40
i
i
I
OBSERVACION.
A menudo se usa como altura de cada banda rectangular al lado de longitud fi, sobre todo
si todos los intervalos de clase tienen la misma longitud. Cuando los intervalos de clase
son de longitudes diferentes, la altura de cada banda rectangular se toma igual a fi/li.
POLIGONOS DE FRECUENCIA.
Uniendo los puntos medios de los lados superiores de cada banda rectangular del
histograma se obtiene un polgono llamado polgono de frecuencias. (Figura 1.9)
El polgono de frecuencias, como en el caso discreto, ayuda en la bsqueda de la curva o
modelo terico que mejor describe la variabilidad o distribucin de los elementos de la
poblacin de acuerdo a la variable en estudio. A continuacin se presentan de manera
"suavizada" diversas formas de polgonos de frecuencias.
El grfico que aparece en (a) indica que el grupo de datos se acumula a la izquierda; que
hay pocos datos con valores altos. Se dice que este tipo de polgono es sesgado con cola
a la derecha. De manera anloga, se puede decir que el grfico que aparece en (b) es
sesgado con cola a la izquierda.
El grfico que aparece en (c) corresponde a un histograma simtrico, indica que los
datos estn distribuidos de manera simtrica, que stos estn acumulados en su mayora
en la parte central mientras que a la izquierda y a la derecha del centro hay pocos. Las
distribuciones con este tipo de grficos son muy comunes y a menudo se llaman
distribuciones normales; sin embargo, para que las distribuciones tengan este
calificativo necesitan ciertas condiciones adicionales, que estudiaremos posteriormente.
La grfica (d) corresponde a una distribucin bimodal; los datos estn agrupados en dos
sectores de la recta.
(a)
(b)
(c)
(d)
1.21. Ejemplo.
Estadstica Descriptiva. 27
Puntuaciones
[30, 40[
[40, 50[
[50, 60[
[60, 70[
[70, 80[
[80, 90[
[90, 100[
[100, 110[
[110, 120]
Frec. absoluta
20 -
4
11
7
14
5
5
3
0
1
15 -
Polgono de frecuencias
10 5
xi
ni
fi
Fi
[250,500[
375
0.08
0.08
[500,750[
625
0.16
0.24
[750,1000[
875
0.24
0.48
[1000,1250[
1125
0.28
0.76
[1250,1500[
1375
0.12
0.88
[1500,1750]
1625
0.12
1.00
Los histogramas para la frecuencia relativa y acumulada relativa son los siguientes:
-f
-F
0.76 -
0.28 0.24 -
0.48 -
0.16 0.08
0.24 0.08
250
750
500
1250
1000
1750
250
1500
750
500
1250
1000
1750
1500
-F
0.76 -
F (x)
Ojiva
B
0.48 -
0.24 0.08
F ( x )
250
750
500
1250
1000
1750
1500
(a)
(b )
1.23. Ejemplo.
n1
[b, c[
n1 +5
[c, d[
30
[d, e[
[e, f[
[60, h]
150
Solucin.
Como la distribucin es simtrica, se tiene que las frecuencias en los intervalos [d, e[, [e,
f[ y [60, h] son: 30, n +5 y n , respectivamente.
1
Estadstica Descriptiva. 29
17.5
n2 = 25
n1 = 20
60-4A 43.5
60-5A
60-3A
Figura. 1.14
Hasta b se han acumulado 20 datos (menos del 25%). Hasta c se han acumulado 45 datos
(ms del 25%). Luego, el valor 43.5, hasta donde existe el 25% de los datos, estar en el
segundo intervalo.
Por semejanza de tringulos:
43.5 ( 60 4 A)
17.5
A
25
Los extremos del primer intervalo son 35 y 40, del segundo, 40 y 45, etc.
1.24. Ejemplo.
N iv e l d e in g
[0 , 1 0 0 0 [
[1 0 0 0 , 2 0 0 0 [
[2 0 0 0 , 3 0 0 0 [
[3 0 0 0 , 4 0 0 0 [
[ 4 0 0 0 ,5 0 0 0 [
[ 5 0 0 0 ,6 0 0 0 [
[6 0 0 0 , 7 0 0 0 [
[7 0 0 0 , 1 0 0 0 0 [
[1 0 0 0 0 , 1 5 0 0 0 [
[1 5 0 0 0 , 2 5 0 0 0 [
[2 5 0 0 0 , 5 0 0 0 0 ]
% p o r m il d la re s
%
1
2
3
4
5
5
5
15
26
26
9
6
5
4
3
2
1
0
25
15
10
R e n ta ( m ile s d e d la r e s)
50
Figura. 1.15
Con 2 hijos
Con 4 hijos
90 mm
160 mm
Figura. 1.16
Estadstica Descriptiva. 31
En muchas ocasiones un factor que cause confusin puede ser controlado, como se
indicar ms adelante mediante el empleo de las tablas de frecuencias.
Hojas
8
1.25. Ejemplo.
12
268
2446668
12465
45
0
2
En el siguiente diagrama la indicacin "Unidad = 0.01" significa que, por ejemplo, 41|2
representa al dato 4.12.
Unidad = 0.01
Ejemplo. 41|2 representa 4.12.
41
42
43
44
45
46
22
668
103251
23
1
2
Si se indicara: "Unidad = 0.1", se tendra, por ejemplo, que 41|2 representa al dato 41.2.
1.7. EJERCICIOS.
1. Se ha indicado que el porcentaje de varones mayores de 20 aos que no tienen empleo en una ciudad de 5
millones de habitantes es 6 %. Los resultados fueron obtenidos a partir de un cuestionario aplicado a 2000
personas de la ciudad, elegidas de entre las personas mayores de 20 aos.
a) Sobre qu poblacin se ha realizado la encuesta?. Cules son las unidades estadsticas?.
b) Cul ha sido la muestra utilizada?.
Rpta. Poblacin: conjunto formado por las personas mayores de 20 aos. Unidad estadstica: cada
varn mayor de 20 aos. Muestra: conjunto formado por los 2000 personas mayores de 20 aos.
2. El gerente de ventas de una tienda de prendas de vestir desea saber cul ser la demanda de pantalones en el
prximo mes, as como las tallas que ms demanda tendrn. Si el gerente dispone de un registro del total de
las ventas realizadas por la tienda durante los 10 meses anteriores y usa esta informacin como una muestra
para predecir las ventas del prximo mes, cul es la poblacin?.
3. En los siguientes casos, indicar la poblacin, las unidades estadsticas y el tipo de escala a usar si se trata
de:
a) Asignar a los distritos de la capital su cdigo postal.
b) Asignar a las personas de una ciudad, el nmero de telfono que poseen.
c) Asignar a cada profesor de una universidad su categora (profesor auxiliar, profesor asociado o profesor
principal).
d) Asignar a cada par de ciudades de un pas la distancia, en kilmetros, que existe entre ellas.
Rpta. a) Nominal b) nominal, c) ordinal, d) intervalar y de razn.
4. El censo de alumnos de una universidad considera las siguientes variables: Facultad, ao de ingreso,
nacionalidad, tiempo de residencia en el pas, nmero de semestres que lleva en la universidad, grado en la
escala de pensiones, grado de instruccin del padre, nmero de hermanos, ingreso mensual familiar
promedio. Clasifique las variables e indique el tipo de escala en que estn medidas.
5. Un profesor propone a sus alumnos del curso de Aritmtica, una prueba de 10 ejercicios de clculo de
sumas. Si alguno de los ejercicios presenta, al resolverlo, algn error de clculo, el profesor califica la
prueba con 0, de otro modo la califica con 1. Qu tipo de escala emple?.
Rpta. Ordinal.
6. Si el profesor del ejercicio anterior cuenta los ejercicios correctos y considera que tal nmero corresponde a
la habilidad de clculo, qu tipo de escala ha empleado?.
7. A los elementos w, y y z de una poblacin se les asign los nmeros 8, 16 y 30 respectivamente, para medir
cierto atributo. Si en lugar del nmero asignado a w se le asignara el 20 y el nmero 40 a y, qu nmero se
le puede asignar a z si las escalas usadas son:
Estadstica Descriptiva. 33
45%
20%
12%
8%
Finanzas
Comercio
Otros
6%
5%
4%
Alumnos de
Ciencias
150
50
140
Total de
alumnos
2000
5000
3000
13. Los siguientes datos proporcionan los ingresos anuales en miles de dlares de 50 personas:
7.9 10.3 45.7 95 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0 30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0
41.5 13.5 12.0 9.2 42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5 18.0 24.9 20.0
28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0 12.0 8.3.
a) Construir un histograma de frecuencias relativas con 6 intervalos de clase para los ingresos anuales.
b) Interpretar el histograma.
c) Usar las marcas de clase construido para estimar la proporcin de ingresos que estn entre 12500 dlares
y 52500 dlares.
d) Estimar la proporcin de sueldos que estn debajo de 50000.
e) Estimar la proporcin de sueldos que estn por encima de 40000.
14. Un censo realizado a 10 jefes de familia proporcion los datos que aparecen en la siguiente tabla, en
donde
V1
V2
V3
V4
V5
V6
1
2
3
4
5
6
7
8
9
10
P
P
L
P
L
L
L
P
P
P
32
28
45
38
49
50
30
32
52
49
S
C
C
C
S
V
S
C
C
V
600
700
650
850
900
1000
860
550
890
900
1
1
2
2
3
2
3
2
0
3
300
400
350
380
400
380
560
300
350
400
Estadstica Descriptiva. 35
Intervalos de
clase.
A
B
C
D
E
Marca de clase
Frecuencia.
relativa
0.10
...
0.55
...
0.10
..
6
...
14
...
Frecuencia
acumulada. relativa
...
0.25
...
0.9
...
19. En la siguiente tabla de distribucin, un agente de seguros ha ordenado los datos mensuales
correspondiente a la cantidad de dlares de las plizas de seguros que ha vendido durante los tres aos
anteriores:
Venta mensual
[10000, 12000[
[12000, 14000[
[14000, 16000[
[16000, 18000[
Frecuencia
2
4
7
5
Venta mensual
[18000, 20000[
[20000, 22000[
[22000, 24000[
[24000, 26000]
Frecuencia
6
8
2
1
3
2
1
0
90
100
110
120
130
140
150
P re s i n s a n g u n e a .
Figura. 1.17.
160
Estadstica Descriptiva. 37
Grado de Instruc.
Frecuencia
Analfabetos: 1
Primaria:
2
Secundaria: 3
Tcnica:
4
Universit: 5
3
11
25
0
1
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la distribucin
se llama, respectivamente, unimodal, bimodal, etc.
La moda se puede usar para cualquier tipo de escala.
Si los datos estn agrupados en una tabla de intervalos de clase y corresponden a una
variable continua, no ser posible determinar exactamente la moda; pero s el intervalo
de mayor frecuencia; a ste se le llama intervalo modal (Figura 1.18 b).
(a) Moda
Figura 1.18.
La media aritmtica .
La media aritmtica o simplemente media de un grupo de datos, caracteriza a los grupos
de datos cuyo polgono de frecuencias presenta simetra y poca dispersin. Se define de
la siguiente manera:
Si x1, ... , xn es un grupo de valores, la media aritmtica o simplemente
media de estos datos es el nmero
x=
x1 + ...+ x n
n
1 n
x
n i =1 i
1.29. Ejemplo.
La media es x =
4.1+...+3.7
= 4.5733.
30
OBSERVACIONES.
x1n1 + ...+ x k n k
n1 + ...+ n k
= f i xi
i =1
x = wi xi con wi = 1 ,
i =1
1.30. Ejemplo.
Para la confeccin de un artculo una compaa utiliza: 1 hora para armado y 5 horas
para acabado. El salario por hora que paga la compaa es de $5 por hora para el armado
y de $9 por el acabado. La compaa desea saber el promedio del costo de trabajo por
hora para confeccionar dicho producto.
El simple promedio aritmtico de los salarios pagados por trabajo es
x=
5+ 9
=7
2
Estadstica Descriptiva. 39
Utilizando este promedio, se tendra que el costo del trabajo realizado para confeccionar
una unidad del producto es 7(1 + 5) = 42. Lo que es incorrecto.
Como se realizan diferentes actividades para confeccionar el producto, es obvio que ello
debe tomarse en cuenta. El promedio correcto se puede determinar considerando que el
costo total por el trabajo realizado es (5x1) + (9x5) = 49 y como se invierten 6 horas de
trabajo, el costo promedio de trabajo por hora es 49/6 = 8.17 aprox.
Se obtiene el mismo resultado si se considera que para confeccionar una unidad del
producto es necesario 6 horas. Un 1/6 de ese tiempo es para el armado y 5/6 para el
acabado. Utilizando estas fracciones como ponderaciones se tendr que una hora de
trabajo realizado cuesta en promedio
(1/6)5 + (5/6)9 = 8.17 aprox.
Se tiene que el costo promedio por hora para confeccionar un producto es la media
ponderada de los valores 5 y 9.
El aumento del precio de un bien puede ser insignificante para algunos pero muy
importante para otros. Si el aumento del precio del consumo de electricidad es 20%, el
de la vivienda el 10% y el de la alimentacin, el 3%, se tendr que la media del aumento
de los precios es 11%; sin embargo, para una persona que dedica el 1% de su sueldo a
consumo de electricidad, el 9% a vivienda y el 90% para alimentacin, el promedio del
aumento de los precios es 3.80%; para otra persona que dedica el 10% de su sueldo a
electricidad, el 40% a vivienda y el 50% a alimentacin, el promedio es 7.5%.
Si los datos estn agrupados en intervalos de clase, la media se aproxima usando las
marcas de clase, x' :
x
1 k
x n
n i =1 i i
1.31. Ejemplo.
En la siguiente tabla de frecuencias aparecen los intervalos de clase, las marcas de clase
y la frecuencia de un conjunto de 17 datos.
Intervalos
xi
ni
[5 9[
[9 13[
11
[13 17[
15
[17 21[
19
[21 25]
23
La media no tiene significacin si los datos, para los cuales se calcula, han resultado de
aplicar una escala nominal u ordinal.
Propiedades de la media aritmtica .
xi = nx
i =1
( xi x )
i =1
=0
( xi x ) = 0
i =1
d) Si a cada uno de los datos se les multiplica (divide) por una constante
k, la media de los datos transformados es igual a la media de los datos
originales multiplicada (dividida) entre la constante.
e) Si el conjunto de m datos, x1, ..., xm tiene media x y el conjunto de n
datos, y1, ..., yn tiene media y , entonces el conjunto x1, ..., xm, y1, ..., yn,
tiene media
mx + ny
.
m+ n
f) La media x de los valores x1, ... , xn corresponde al valor de a que
hace mnima a la expresin
Estadstica Descriptiva. 41
( x i a ) 2 , a .
i =1
n
i =1
i =1
( x i x ) 2 ( x i a ) 2 , a.
Esto es,
Nota.
Obviamente,
i =1
i =1
constante k.
1.32. Ejemplo.
El promedio de los precios de los artculos que conforman la canasta familiar en cierta
ciudad es 400 unidades monetarias. Si cada artculo de la canasta aumenta el 10% de su
precio entonces el nuevo promedio de los precios de la canasta es igual a (1.10)(400) =
440.
1.33. Ejemplo.
32 =
Escribiendo A =
a
a +b
y B=
b
a +b
25a + 35b
a+b
1.35. Ejemplo
En la siguiente tabla se indica el Producto Nacional Bruto (PNB) promedio por persona
y la poblacin en tres pases.
Pas
Per
Colombia
Bolivia
PNB ($)
Poblacin
1160
1260
630
22 mill.
32 mill.
7 mill.
1.36. Ejemplo.
El costo por unidad para producir 3000 pantalones es 12 unidades monetarias, el costo
por unidad para producir 5000 camisas es 10 unidades monetarias y el costo por unidad
para producir 2000 sacos es 50 unidades monetarias. Hallar el costo promedio por
unidad de produccin.
Solucin.
El costo promedio de produccin es
x=
1.37. Ejemplo.
El costo de produccin de un artculo en cada una de las tres fbricas que una compaa
tiene en la costa (C), en la sierra (S) y en la selva (U) es, respectivamente, 2, 2.3 y 2.5.
En C se produce el 90% de los artculos que se producen en S, mientras que en U se
produce 30% ms artculos que en S.
a) Hallar el costo promedio por artculo en las tres fbricas.
b) Hallar el precio promedio de venta por artculo si el estado establece que se debe
ganar el 10% por artculo.
Solucin.
Si x es la produccin en S, entonces en C la produccin es 0.9x y en U, 1.3x. La
produccin total es 0.9x + x + 1.3x = 3.2x.
Estadstica Descriptiva. 43
b) Como el precio de venta es 1.10 (precio de costo), el promedio del precio de venta
es 1.10(costo promedio) = 1.10(2.2968) = 2.5265.
1.38. Ejemplo.
Tres poblados A, B y C (en ese orden), se encuentran situados a lo largo de una carretera
recta. La distancia entre A y B es 15 km, entre B y C, 22 km. Se desea construir en un
punto M de la carretera un centro de recreo de tal manera que al transportar a este centro
30 personas de A, 20 de B y 40 de C, el costo total por transporte sea mnimo. Hallar el
punto M si el costo por transportar a cada persona de cada poblado es proporcional al
cuadrado de la distancia recorrida.
Solucin.
20 veces
40 veces
x =
ni xi
i =1
k
ni
i=1
La media de un conjunto de datos se calcula a partir de todos ellos, por ello es necesario
tener cuidado en el momento de hacer la interpretacin correspondiente, pues los datos
extremos pueden influenciar fuertemente en el resultado, desvirtuando de este modo la
imagen real de la media aritmtica.
En la siguiente tabla se indica la distribucin de 11 personas de acuerdo a su sueldo.
Sueldos (xi)
Frecuencia (ni)
100
120
2000
3000
4
5
1
1
de las 11 personas tiene una remuneracin menor o igual a 121. Los valores extremos
2000 y 3000 han influido grandemente en el resultado. (Si se construye el polgono de
frecuencias de la tabla anterior, podr notarse que ste tiene un sesgo con cola a la
derecha).
La observacin anterior indica que si una distribucin de datos tiene un sesgo (con cola a
la derecha o con cola a la izquierda) es mejor utilizar otra medida de tendencia central
que sea resistente a los valores extremos, tal como la mediana, que a continuacin se
estudia.
La mediana.
Para un grupo de n datos ordenados, la mediana Me es el valor central,
si n es impar y es igual al promedio de los dos datos centrales, si n es
par.
Para establecer el concepto de mediana se ha hecho uso del orden de los nmeros que
representan a los datos, luego esta medida no tiene significacin si los datos se obtienen
al usar una escala nominal.
Propiedades de la mediana.
Estadstica Descriptiva. 45
Debajo de la mediana existe aproximadamente el 50% de los datos (Figura 1.19 (a))
Suavizando la ojiva de la frecuencia acumulada relativa se ubica la mediana de un
conjunto de datos correspondientes a una variable continua. (Figura 1.19 (b)).
F
0.5
50%
50%
e
M
(a)
(b)
Figura 1.19
En el caso discreto siempre ser posible determinar exactamente la mediana, ya sea que
los datos se presenten de manera enumerativa o en una tabla de frecuencias. En el caso
continuo y cuando los datos se presentan en una tabla de intervalos de clase no ser
posible determinar exactamente el valor de la mediana por cuanto no se tiene la
informacin completa. Sin embargo, puede aproximarse como se indica a continuacin.
Aproximacin de la mediana para datos agrupados en una tabla de
intervalos de clase.
ba
Fb Fa
M e a + (b a )
0.5 Fa
Fb Fa
F
b
0.5
F
a
a
a
Ojiva en [a, b]
(b)
Ojiva de fr.ac.relativa
(a)
Figura 1.20.
en donde
a es el extremo izquierdo del intervalo que contiene la mediana,
b es el extremo derecho del intervalo que contiene a la mediana,
Fa es el valor de la frecuencia acumulada relativa "hasta el extremo" a y
Fb es el valor de la frecuencia acumulada relativa "hasta el extremo" b.
1.40. Ejemplo.
ni
[5, 8[
fi
0.125
Fi
0.125
[8, 11[
9.5
0.250
0.375
[11, 14[
12.5
0.083
0.458
[14, 17[
15.5
0.375
0.833
[17, 20[
18.5
0.125
0.958
[20, 23]
21.5
0.041
1.000
Interv. Clase
Se tiene que
M e 14 + (17 - 14)
0.50 0.458
= 14.336.
0.833 0.458
c). Se puede demostrar que para un grupo de datos x1, ... , xn, la mediana
Me de stos corresponde al valor que hace mnima la expresin
n
i =1
Estadstica Descriptiva. 47
Esto es,
n
i =1
i =1
| xi M e | | x i a | a real .
M o
Figura 1.21.
i =1 x i
OBSERVACIONES
H= k
1
i =1 xi
fi
xi 0
H=
6
= 8.6346 .
1 / 7 + 1 / 8 + 1 / 8 + 1 / 9 + 1 / 10 + 1 / 11
1.42. Ejemplo.
Por otro lado, si llamamos con a a la razn anual promedio, se tendr que despus del
primer ao, la produccin es (a + 1)A, despus del segundo ao, (1 + a)(1 + a)A, y
3
Los precios de una accin de la bolsa de valores en tres das consecutivos fueron: A,
0.5A y A, respectivamente. Luego la variacin de los precios con respecto al da anterior
fue como sigue: -50% y 100%, respectivamente.
Estadstica Descriptiva. 49
Una persona recorre la distancia de A a B con una velocidad de 30 km./h; otra persona
recorre la misma distancia con una velocidad de 60 km./h. Cul es el "promedio"
adecuado de las velocidades de las dos personas?.
Solucin.
Si la distancia de A a B es e km, entonces la primera persona utiliza e/30 horas para
recorrer la distancia de A a B y la segunda persona, e/60.
MEDIDAS DE DISPERSION
Dos grupos diferentes de datos pueden tener iguales medidas de tendencia central; sin
embargo, las caractersticas de su distribucin pueden ser diferentes. Un grupo de datos
puede tener mayor o menor dispersin que el otro con respecto de la medida central.
Precisamente, para interpretar mejor los datos se construyen medidas de dispersin o
estadgrafos de dispersin.
Las medidas de dispersin ilustran sobre la manera como varan los datos observados
alrededor de una medida de tendencia central, indican como estn concentrados los datos
alrededor del parmetro de centralizacin, permiten comparar una informacin con otra
y ayudan a verificar si determinadas medidas de tendencia central son o no significativas.
Por ejemplo, cuando la dispersin es muy grande la media aritmtica no tiene mucha
significacin; sin embargo si la dispersin es baja, la media adquiere significacin. Entre
las medidas de dispersin estn: el recorrido o rango, la varianza, la desviacin
estndar, el coeficiente de variacin, los intercuartiles, etc.
El recorrido o rango.
Aunque de uso muy limitado, el recorrido o rango de un conjunto de datos es la
diferencia entre el dato mayor y el dato menor.
Por ejemplo, si los datos de cierta variable son: 23, 24, 24.5, 24.6, 24.7, 24.9, 25, 26,9, 27, 28, 100, el
rango es, como en el caso anterior, 100 - 23 = 77.
Sin embargo, puede observarse que la forma como estn distribuidos los datos no es la
misma en ambos casos. En el segundo caso, los datos estn ms agrupados hacia el dato
menor. Esto muestra que el rango no indica la manera como estn distribuidos los datos.
s' =
1 n
(x x)2.
n i =1 i
(1 4) 2 + (3 4) 2 + (5 4) 2 + (7 4) 2
= 5.
4
s' 2 =
1 n 2
x x2
n i =1 i
n
n
1 n
1 n
1 n
( xi x ) 2 = xi2 2 xi x + x 2 = xi2 x 2 .
n i =1
n i =1
n i =1
i =1
i =1
Estadstica Descriptiva. 51
( x i x ) 2 ni
s 2 = i =1
xi2 ni
= i =1
nj
(x)2 ,
nj
j =1
j =1
1.45. Ejemplo.
ni
10
15
s' 2 =
( xi x ) 2 ni
i =1
1.46. Ejemplo.
Para los datos, cuya distribucin se muestra en la siguiente tabla, hallar la media y la
desviacin estndar de manera aproximada.
Inter. de clase
[2, 4[
[4, 6[
[6, 8[
[8, 10[
[10, 12]
marca de
clase
x'i
frecuenc.
ni
3
5
7
9
11
5
7
10
4
2
Solucin.
Usando las marcas de clase se tiene que
k
x 'i ni
x i =1
s' 2
( x ' i x ) 2 ni
i =1
s' 2.2711.
NOTA.
Otra forma de medir la dispersin de los datos, es mediante la varianza muestral que se define con
( xi x )2
i =1
n 1
PROPIEDADES DE LA VARIANZA.
A partir de la definicin de la varianza se pueden deducir las siguientes propiedades:
a) La varianza es un nmero no negativo.
b) Si todos los datos son iguales a una constante c, su varianza es igual a
0. (En este caso la media es igual a c). No hay dispersin.
c) Si a cada uno de los datos x1, ..., xn se les suma una constante b,
entonces la varianza de los datos transformados: x1 + b, ... , xn + b es
igual a la varianza de los datos originales.
d) Si a cada uno de los datos x1, ... , xn se les multiplica por una constante
k, entonces la varianza de los datos transformados: kx1, ... , kxn es igual a
la varianza de los datos originales multiplicada por el cuadrado de la
constante. Esto es, si la varianza de los datos originales es s'2 entonces la
varianza de los datos transformados es k 2 s '2 .
e) Si el conjunto de m datos: x1 , ... x m tiene media x y varianza s x'2 ,
mientras que el conjunto de n datos: y1 ,... y n tiene media y y varianza
s '2
, entonces el conjunto de datos x1 ,... x m , y1 ,... , y n tiene varianza
y
s' 2 =
ms' 2x + ns' 2y
m+n
m
n
(x M )2 +
(y M )2 ,
m+n
m+ n
s' =
ms' 2x + ns ' 2y
m+ n
1 (1 / k ) .
As, en el intervalo [ x - 2 s', x + 2 s'] por lo menos hay el 75% de los datos,
en el intervalo [ x - 3s', x + 3s'] por lo menos hay el 89% de los datos.
1.47. Ejemplo.
Aplicando las propiedades de la varianza, el lector puede observar que, si x1, ... , xm , es
un conjunto de datos cuya varianza es V X , entonces, el conjunto de datos y1, ..., ym ,
obtenidos al realizar la transformacin yi = axi + b , en donde a y b son constantes,
tienen media, varianza y desviacin estndar
(60)2(1.84) = 6624.
1.49. Ejemplo.
Solucin.
Denotemos con M al grupo de las mujeres, con H al grupo de los hombres, con m al
nmero de mujeres, con h al nmero de hombres y con t al total de personas (t = m + h).
De los datos se tiene:
xG = media general = 25, G = desv. est . general = 5
x H = media hmbr. = 27, H = desv. est . hmbr . = 4
x M = media muje. = 22,
(1)
25 =
25 =
27 h + 22 m
t
x i2
G
( 25)
(2)
2
x i2 + xi2
H
M
t
( 25)
(3)
xi2
16 =
( 27 )
(4)
2
(5)
M =
650 t 745h
m
( 22 )
(6)
M =
650 t 745h
m
23.5 = 4.8476.
1.50. Ejemplo.
Se han registrado durante 30 das, el nmero de viajeros que hacen reservaciones a una
agencia de viajes pero que no las hacen efectivas:
Estadstica Descriptiva. 55
12 18 14 12 10 10 20 9 19 15 18 16 16 16 14 18 16 18 14 19 19 15 13 15
13 18 12 17 14 14.
La media del nmero de pasajeros que hacen reservaciones y no las hacen efectivas es
igual a 15.1333 y la desviacin estndar es 2.8952.
En el intervalo [9.3429, 20.9237], que tiene la media como centro y dos desviaciones
estndar muestrales como radio, existe, segn Chebyshev, el 75% de los datos, por lo
menos.
Se desea demostrar que para un conjunto de datos, x1 , ..., x n , la proporcin de datos que
existen en el intervalo [ x ks , x + ks ] es por lo menos 1 - (1/k2).
Al conjunto de datos que estn dentro del intervalo lo llamaremos con D y al conjunto de
los datos que estn fuera con F.
Llamando con a al nmero de datos en F, se tiene:
( x i x ) 2 + ( xi x ) 2
2
s =
xi D
xi F
( xi x ) 2
xi F
k 2 s2
>
xi F
ak 2 s 2
,
n
ak 2 s 2
1
a
o 2 > .
n
n
k
La ltima relacin indica que la proporcin de datos que estn fuera del intervalo es
menor que 1/k2. Por tanto la proporcin de datos que estn dentro del intervalo es mayor
o igual a 1 - 1/k2.
1.51. Ejemplo.
Solucin.
x1 x
s'
x x
, ... , m
s'
Estadstica Descriptiva. 57
Coeficiente de variacin .
El coeficiente de variacin se define como
CV =
s'
x
Solucin.
El termmetro ms consistente es el que tiene menor coeficiente de variacin. El
coeficiente de variacin del termmetro A es 0.0022 (0.22%), mientras que para el
termmetro B este coeficiente es 0.0012 (0.12%). El termmetro B es ms consistente.
1.53. Ejemplo.
En una entidad estatal los sueldos de los directivos, de los empleados y de los obreros
son como aparece en la siguiente tabla.
Media
Desv. Estnd.
Directivos
2000
100
Empleados
1200
100
Obreros
1100
100
En este caso no podemos decir que la dispersin de los sueldos de los directivos, de los
empleados y de los obreros son iguales, an cuando las desviaciones estndar lo son. Los
coeficientes de variacin son: para los directivos, 0.0500 (5%), para los empleados,
0.0833 (8.3%) y para los obreros, 0.0909 (9.09%). Ahora podemos indicar que, con
respecto a la media, la dispersin es mayor en los obreros y que la de los empleados es
mayor que la de los directivos.
1.54. Ejemplo.
En una empresa los salarios para los hombres tiene media $500 y desviacin estndar
$50. Para las mujeres, que constituyen el 30% del total de trabajadores, la media de los
salarios es $490 y la desviacin estndar 30. Para el prximo mes, la empresa proyecta
realizar un aumento general del 15% a hombres y mujeres. Use el coeficiente de
variacin para indicar si cambia o no la dispersin de los salarios. Cmo cambia la
variacin de los salarios si en lugar de aumentar el 15%, se aumenta $50 a cada hombre
y a cada mujer?.
Estadstica Descriptiva. 59
Solucin.
La media de todos los trabajadores es x T = 0.7 (500) + 0.3( 490) = 497 .
sT2 = 0.7 (50) 2 + 0.3( 30) 2 + 0.7 (500 497 ) 2 + 0.3( 490 497 ) 2 = 2041 .
La desviacin estndar de todos los salarios es 45.1774. El coeficiente de variacin es
45.1774/497 = 0.0900 (= 9%)
Despus de aumentar el 15%, la media es igual a (1.5)(497) = 571.55, la desviacin
estndar es (1.5)(45.1774) = 51.9540 y el coeficiente de variacin es 0.0909 (= 9.09%).
La dispersin de los salarios aument.
Despus de aumentar $50, la media aumenta a 547, la desviacin estndar sigue
siendo igual a 45.1774 y el coeficiente de variacin es 45.1774/547 = 0.0826,
esto es 8.26%. La dispersin de los salarios disminuy.
15 15 16 17 18 19 21 23 25 25 .
El valor x ( 3) = 16 es el percentil 100(3 - 0.5)/10 = 25. Ntese que debajo de 16 existe
aproximadamente el 25% de los datos.
rea rea
25%
rea
25% 25%
25
50
rea
25%
0.25
C C C
25 50 75
75
(a)
(b)
Figura 1.22. Centiles.
Estadstica Descriptiva. 61
A los percentiles 25, 50 y 75 se les llama primer cuartil, segundo cuartil y tercer
cuartil, respectivamente.
1.57. Ejemplo.
Si los sueldos de 15 personas son, respectivamente, 100, 300, 400, 1300, 1370, 1450,
1500, 1650, 1670, 1710, 1800, 1900, 1950, 2000, 2050, se tiene que:
El percentil 25 (primer cuartil) corresponde al rango (25)(15)/100 + 0.5 = 4.25.
Como el rango no es entero, el percentil 25 es el valor
[ x (4 ) + x (5) ] / 2 = [1300 + 1370] / 2 = 1335.
el percentil 75 corresponde al rango (75)(15)/100 + 0.5 = 11.75. Luego, el percentil 75
es el valor
[ x (11) + x (12) ] / 2 = [1800 + 1900] / 2 = 1850.
1.58. Ejemplo.
Ck a + (b a )
( k / 100) Fa
,
Fb Fa
Ni
[50, 55[
[55, 60[
[60, 65[
[65, 70[
[70, 75[
[75, 80[
[80, 85[
[85, 90[
[90, 95[
[95, 100]
1
2
3
2
8
9
7
16
11
6
fi
0.0154
0.0307
0.0461
0.0307
0.1231
0.1385
0.1077
0.2461
0.1693
0.0923
Fi
0.0154
0.0461
0.0922
0.1229
0.2460
0.3845
0.4922
0.7383
0.9076
1.0000
Solucin.
Aproximando el primer cuartil C25 y luego el tercer cuartil C75.
El primer cuartil est en el intervalo [75, 80[. Aplicando la expresin general para
aproximar un percentil, se tiene
C25 75 + (5)
0.2500 0.2460
= 751444
.
.
0.3845 0.2460
Estadstica Descriptiva. 63
C75 90 + (5)
0.7500 0.7383
= 90.3455.
0.9076 0.7383
Media Moda
Desv. est .
M 0
M x0
M 0 x
Figura 1.23.
Sesgo de Pearson
3( Media Mediana )
.
Desv. estd .
A=
|
C
25
|
C
|
C
50
75
Figura 1.24.
Como C75 + C25 2 C50 = ( C 75 C50 ) ( C50 C25 ) , se puede indicar que el polgono
de frecuencias es
* simtrico, si C75 + C 25 2 C50 = 0, (las longitudes de los intervalos [ C 25 , C50 ] y
[ C50 , C 75 ] deben ser iguales). Esto es, si A = 0.
* asimtrico, con cola a la derecha, si C75 + C25 2 C50 > 0. Esto es, si A > 0.
* asimtrico, con cola a la izquierda, si C 75 + C 25 2 C50 < 0. Esto es, si A < 0.
NOTAS.
en donde =
3
3
s3
1 n
( x x ) 3 y s es la desviacin estndar de x1 , ..., x n .
n i =1 i
Estadstica Descriptiva. 65
( 0.5)( C75 C 25 )
,
C90 C10
M e s o c rtic a
P la tic rtic a
Figura 1.25.
NOTA.
4
s4
1 n
en donde = ( x x ) 4 y s es la desviacin estndar de x1 ,... , x n .
4
n i =1 i
Este es un coeficiente sin dimensin. La constante 3 se elige de tal manera que el
coeficiente sea nulo cuando la distribucin sea mesocrtica.
|
|
25
75
Figura 1.26.
en donde los lados "laterales" indican los percentiles C25 y C75, respectivamente. En el
rectngulo se indica la mediana, con un segmento. De los lados que representan a los
. d,
percentiles 25 y 75 parten, respectivamente, un segmento hasta el valor L = C25 15
en donde d es el rango intercuartil y un segmento hasta el valor U = C75 + 15
. d.
De un grfico de cajas se obtiene informacin acerca de:
La longitud de las "colas" (con los segmentos que parten de los lados laterales).
Estadstica Descriptiva. 67
12
18
*
19
20
Notas
Figura 1.27.
|
20
|
40
|
60
|
80
|
100
|
120
|
140
Figura 1. 28.
Si
qi =
j =1
Ni
2413
4342
8642
13300
14500
10200
4093
443
125
Total
58058
Fi
0.0416
0.1164
0.2652
0.4942
0.7440
0.9196
0.9901
0.9978
1.0000
Si
253365
525382
1192596
1888600
2276500
1652400
732647
81955
24875
qi
0.0293
0.0903
0.2284
0.4473
0.7112
0.9027
0.9876
0.9971
1.0000
8628320
Estadstica Descriptiva. 69
F
i
1
i
A
Curva de Lorenz
F
i-1
q
i -1
1
Figura 1.29.
[ 0.5(q i + qi 1 )( Fi Fi 1 )] .
Luego,
1.10. EJERCICIOS .
1.- Calcular la media, la mediana y la moda de los datos 2 5 5 6 6 6 7 7 60. Comentar los resultados .
Cul de las medidas calculadas describe mejor el centro de la distribucin de los datos?.
Rpta. x = 115555
.
, M 0 = 6, M e = 6.
2. El siguiente conjunto de datos, corresponde a los porcentajes de humedad en diferentes lugares en una
determinada regin: 90 63 20 18 12 60 24 28 14 11 85 29 25 8 10 86 16 25 6 11
80 16 20 16 6.
a) Calcular la media y la desviacin estndar s
b) Qu porcentaje de datos est en el intervalo [ x 2 s , x + 2 s ] ?.
Rpta. a) x = 311600
.
s' = 27.2597 .
3. A continuacin se presenta la distribucin de 53 tiendas de abarrotes de acuerdo al nmero de empleados
que tienen.
Nm. de
emplead.
Nm. de
tiendas
2
3
11
16
17
Usar la informacin de la tabla para calcular la media, la mediana y la desviacin estndar del nmero de
empleados.
4. Los siguientes resultados indican el rendimiento de dos marcas de llantas:
Llanta
A
B
Mediana, en Km..
25000
27000
Media en Km.
27000
25000
Si las llantas de cualquier marca se venden al mismo precio, qu marca de llanta se recomienda?.
5. Los datos siguientes corresponden al tiempo, en minutos, que demora una oficina "en darle trmite" a 50
documentos que ha recibido.
400 392 358 304 108 156 438 60 360 168 448 224 576 384 194 216 120 208 232 72 264 168
128 256 72 136 168 308 340 64 480 114 80 246 224 184 104 112 184 152 152 536 224 464
72 152 168 288 264 208.
a) A partir de la tabla de frecuencias, construir el histograma de frecuencias relativas. Graficar el polgono
de frecuencias relativas. Indicar las caractersticas de la distribucin.
b) Calcular la media, varianza, desviacin estndar y el coeficiente de variacin de los datos.
c) Calcular la mediana, utilizando directamente los datos y utilizando la ojiva de la frecuencia acumulada
relativa.
d) Calcular los percentiles C10, C20, C75, y C90.
6. Se informa que en el saln B las notas de Historia de los alumnos que lo forman se distribuyen tal como lo
indica la siguiente tabla y en donde fi son las frecuencias relativas
Estadstica Descriptiva. 71
Notas
fi
[8, 12[
f1
[12, 16[
f2
[16, 20]
f3
Calcular aproximadamente la media de las notas en B si el 45% tiene una nota inferior a 11 y el 70% tienen
una nota inferior a 17.
Rpta. Los valores respectivos de las frecuencias relativas son 0.60, 0 y 0.4. La media es 13.2
7. Indicar una lista de 10 nmeros de forma que la desviacin estndar sea lo ms grande posible con la
condicin de que:
a) cada nmero sea un 1 o un 5.
b) cada nmero sea un 1 o un 5 o un 9 y, a lo ms, dos de ellos sean 5.
8. Un investigador toma una muestra de 100 hombres cuyas edades estn comprendidas entre 18 y 24 aos de
edad en una ciudad determinada. Otro investigador toma una muestra de 1000 hombres cuyas edades
tambin estn entre 18 y 24 aos.
a) Habr una muestra con una media mayor que la media de la otra muestra o sern ambas parecidas?.
b) Habr una muestra con una desviacin estndar mayor o sern ambas parecidas?.
9. Tres profesores estn comparando las notas de los exmenes finales que han realizado. Cada profesor tiene
99 alumnos. En la clase A, un estudiante obtuvo 1 punto, otro obtuvo 99 puntos, y el resto obtuvieron 50
puntos. En la clase B, 49 estudiantes lograron una puntuacin de 1, un estudiante logr 50 puntos y 49
alumnos llegaron a los 99 puntos. En la clase C, un estudiante logr 1 punto, otro estudiante 2 puntos, otro
estudiante 3 puntos y as sucesivamente hasta llegar el estudiante nmero 99 que logr los 99 puntos.
a) Existe alguna clase que tenga una media de notas superior a las dems o todas las medias son iguales?.
b) Existe alguna clase que tenga una desviacin estndar de notas superior a las dems o todas las
desviaciones estndar son iguales?.
10. En un conjunto de nmeros positivos, puede ser mayor la desviacin estndar que la media en alguna
ocasin?.
11. Un conjunto est formado por 10 nmeros. Cada nmero es: o el 1, o el 2 o el 3.
a) La media es 2 y la desviacin estndar es 0. Cmo es el conjunto de datos exactamente?.
b) La desviacin estndar es 1. Cmo es el conjunto exactamente?.
c) Puede ser la desviacin estndar superior a 1?.
12. Un profesor est haciendo a sus alumnos un examen que tiene una calificacin mxima de 20 puntos. Su
sistema es tal, que las notas deben ser necesariamente mltiplos de 5. Al final, una vez corregidos los
exmenes obtiene la siguiente distribucin de notas.
40% obtuvieron la nota 20, 30% obtuvieron 15, 20% obtuvieron 10 y 10% obtuvieron 5.
a) Si se supone que hay 20 alumnos, se puede hallar la media y la desviacin estndar?.
b) Si no se sabe el nmero de alumnos, se puede calcular la media y la desviacin estndar?.
13. La reparticin de un grupo de 75 alumnos de un colegio de acuerdo a su talla en cm, es como se indica en
la siguiente tabla.
a) Graficar la frecuencia relativa y la frecuencia acumulada relativa.
b) Usar las marcas de clase para aproximar la media, la mediana y la desviacin estndar.
Talla
Frecuencia
[80, 85[
[85, 90[
14
[90, 95[
23
[95, 100[
17
[100, 105[
11
[105, 110]
14. A continuacin se presenta la distribucin de los tiempos totales, en minutos, que diferentes estaciones de
radio dedican a los avisos comerciales entre las 8:00 a. m. y las 12:00 m.
Tiempo
# radios
[0.5, 6.5[
[6.5, 12.5[
[12.5, 18.5[
[18.5, 24.5[
[24.5, 30.5[
[30.5, 36.5[
[36.5, 42.5[
[42.5, 48.5[
[48.5, 54.5[
[54.5, 60.5]
1
3
18
2
1
10
0
0
2
14
a) Usar las marcas de clase para aproximar la media y la desviacin estndar del tiempo que las estaciones
de radio dedican a los avisos comerciales entre las 8:00 a.m. y las 12:00 m.
b) Calcular el porcentaje de tiempos de avisos comerciales que estn en el intervalo [ x 3s , x + 3s ] .
c) Calcular la mediana, utilizando la ojiva de la frecuencia acumulada relativa.
15. Los 100 alumnos de una seccin A se distribuyen de acuerdo a sus notas de Historia tal como indica la
siguiente tabla (ni indica la frecuencia).
[8, 10[
ni
28
[10, 12[
50
[12, 14]
22
Notas
De manera aproximada, calcular la nota debajo de la cual est el 40% de las notas. Tambin calcular,
aproximadamente, la mediana.
Rpta. El percentil 40 es 10.48.
16. Se encontr que en 800 datos la media aritmtica y la desviacin estndar eran 9.496 y 0.345,
respectivamente. Una revisin de los resultados mostr que en lugar del valor 9.56 se introdujo 1.56.
Recalcular la media aritmtica y la desviacin estndar.
Rpta. 9.506, 0.200.
17. Calcular la media de un grupo de 80 datos que ha sido dividido en tres subgrupos: A, B y C, para los
cuales se tienen las medias y el nmero de datos correspondiente:
Estadstica Descriptiva. 73
c) Un operario cualquiera nunca demor un tiempo que excedi al tiempo medio en ms de dos
desviaciones estndar.
Si se eligiera al azar a uno de los operarios y se deseara predecir el tiempo en que ste ejecut la tarea, de tal
manera que el promedio de los cuadrados de los errores fuera mnimo, cul sera el valor de prediccin?.
Si se eligiera al azar a uno de los operarios y se deseara predecir el tiempo en que ste ejecut la tarea, de tal
manera que el promedio de los de los errores en valor absoluto fuera mnimo, cul sera el valor de
prediccin?.
27. La distribucin de mujeres cuyas edades fluctan entre 40 y 50 aos, de acuerdo al nmero de hijos en las
comunidades A y B es como se indica en la siguiente tabla.
Nmero de mujeres
Nmero hijos
0
1
2
3
4
6
9
23
28
22
8
15
20
15
10
Rpta. 1.75
29. Las ciudades A, B, y C (en ese orden) estn unidas en lnea recta por una carretera. La distancia entre las
ciudades A y B es 4 km, mientras que entre B y C la distancia es 5 km. Se desea construir un centro de
recreo en un punto de la carretera para un total de 200 nios distribuidos de la siguiente manera: 25% de los
nios viven en A, 35% de los nios viven en B y el resto vive en C. Cul debe ser la ubicacin del centro
de recreo si se considera que el costo de transporte por cada nio es proporcional a la distancia recorrida y
el costo total al transportar a todos los nios debe ser mnima?.
Rpta. La respuesta corresponde a la mediana de los valores: 0, repetido 50 veces, 4 repetido 70 veces y 9
repetido 50 veces.
30. Usando los datos del ejercicio 5, calcular los percentiles 10, 20, 50 y 75.
31. Usando los datos de la tabla del ejercicio 8, calcular aproximadamente el intercuartil.
32. Durante cuatro aos consecutivos un banco aument su capital en 100%, 150%, 300% y 400%. Indicar la
tasa de aumento promedio del capital si al inicio fue 50 millones de dlares.
33. El aumento de la tasa de cambio en el pas durante las cuatro semanas del mes de Junio y con respecto a la
semana anterior fue como sigue: 1%, 2%, 3%, y 2%. Calcular, usando la media geomtrica, el aumento
promedio de la tasa de cambio.
Rpta. El aumento promedio de la tasa de cambio es 1.9975%.
Estadstica Descriptiva. 75
34. Determinar la tasa de crecimiento promedio de la poblacin en los ltimos tres aos si en 1992 la
poblacin fue 18000000, en 1993 fue 2000000 y en 1994 fue 25500000. Indicar por qu la media
aritmtica no es adecuada para indicar el cambio promedio de crecimiento.
35. La velocidad con que escriben tres personas el mismo texto es 60, 70 y 65 palabras por minuto,
respectivamente. Calcular la velocidad promedio.
Rpta. 64.74 palabras por minuto.
36. En la siguiente tabla se registran: el tiempo que emplean 5 obreros en fabricar un artculo as como el
tiempo total trabajado por cada uno de ellos. Calcular el tiempo promedio que se utiliza en fabricar un
artculo.
Obreros
480
1.00
480
1.20
480
1.20
240
1.50
0.80
37. Dos alumnos desarrollaron, cada uno, una prueba que tena 40 "tems". El primero hizo una pregunta cada
2 minutos y el segundo una pregunta cada 2.5 minutos. Calcular el promedio de preguntas desarrolladas
cada 5 minutos.
Rpta. 2.22 preguntas cada 5 minutos.
38. Una propiedad importante de la media dice que si x1,..., xn tienen media x y si y = f ( x ) es una
1 n
funcin cncava hacia abajo entonces f ( x ) f ( xi ) (Desigualdad de Jensen).
n
i =1
Usando la desigualdad de Jensen, probar que G x , en donde G es la media geomtrica de los datos.
39. Para los datos del ejercicio 5, hallar el sesgo y el coeficiente de curtosis. A qu tipo de curva
corresponde?.
40. El ndice de Gini puede usarse tambin para analizar la concentracin de la poblacin de una determinada
regin. A partir de la siguiente informacin, analizar la concentracin de la poblacin.
Habitantes
[500, 1000[
[1000, 1500[
[1500, 2000[
[2000, 2500[
[2500, 3000[
[3000, 3500[
Nmero de
distritos
Poblacin
total
320
130
110
80
30
10
192000
143000
187000
192000
79500
34500