Está en la página 1de 18

CAPÍTULO 2

Análisis de medidas de posición y de tendencia central


2.1 Medidas de posición y de tendencia central
2.2 Cuartiles y percentiles
2.3 Análisis exploratorio
2.4 Ejercicios propuestos

POSICIÓN Y DE TENDENCIA CENTRAL


2.1 MEDIDAS DE
información
caracterizanal conjunto de datos y proporcionan
Son medidas que
son posicionales, en el
sobre su distribución. Algunas, como los percentiles,
importante los que son
de valores en dos grupos:
sentido de que dividen a la serie ordenada
como la media aritmética,
se
valor los que son m e n o r e s . Otras,
mayores que ese y con tendencia a ocupar
interpretan como lugaresde acumulación de las medidas,
valores centrales.

de medidas {x1, X2, X3,..Xn}


La media aritmética de un conjunto
se define como la suma de
todas las medidas dividida entre el
simboliza por X y se lee" x
MEDIA número total de medidas. Se
ARITMÉTICA barra".
f 2.1)
n

Ejemplo 2.1
n muestra de pasajeros en un vuelo San
Las edades de una

Salvador-Miami son: 32, 21, 60, 47, 64, 17, 72, 55, 33, 41.
Ventajas de la
Calcular la media aritmética de las edades.
media:
1 Es única, y se Solución
empleantodos
los datos para su
32+21+60+..+41 442
10 10
44244.2
cálculo. La edad 44.2 años es la media aritmética o valor promedio del
2 Es el centro de conjunto de edades.
masas de la dis-
tribución de meComo medida de tendencia central, la media, se explica con
didas. más claridad en el campo de la física, ya que representa "el
3 Su expresión de centro de masa de los valores". Si tomamos las edades como
cálculo permite pesostel peso de los años) distribuidos a lo largo de una barra
un fácil manipu- uniforme, el lugar que ocupa la media es el punto donde se
leo algebraico en esos pesos.
comprobaciónequiidran
la
de propiedades.
4 Sirve para repro-
ducir un total po 20 30 40 A 50 60 70
blacional. 44.2
Si en un
s00
poblado
hay HAY MEDIDAS
QUE SE REPITEN
CALcULO CUANDO
media degares lal
y
pequena empresa hay
personasSupongamos 8 dólares la hora, tres que ganannco5
en una
(queganan
por hogar es X= 4.7, trabajadores que
entonces el total dedólares y cuatro que ganan solo 2 dólares la hora.
de los trabajadores es.
personas
do es:
en el pobla- nedia de los salarios horarios
XN= 4.7 x800 y ( 8 + 8 +8+8 +8) +(5 +
5+ 5) + (2+ 2+2+2) - 5.25
3760 5+3+4
si hacemos:
Obviamente el cálculo se simplitica
Desventajas de la I(8x5)+(5x3)+(2x4)|/12
media: organizar la siguions
Este recurso aritmético permite uiente
1. No es un
valor| expresion:
observado de a
variable, en el ma- Ld media aritmética de un conjunto de medidas x1, Y
yor de los casos. con frecuencias t, fz. f.f
X,..Xk, que se
repiten
calcula mediante:
respectivamente, se
En
municipio del
un
f 2.2)
pais se conoce que la =

media del número de +St..+ Ji


hijos En notación de sumatorias:
por hogar es 3.6|
hijos, sin embargo k
ningún hogar reportó
esa cantidad de
hijos. o más usual:
=
n
2. La media se
ve
muy afectada por
valores extremos.
CÁLCULO DE LA MEDIA EN UNA SERIE AGRUPADA
Las edades de los inte- Esta última fórmula es la que se emplea tambien para
grantes de dos peque- calcular la media aproximada de un conjunto de valores
ñas familias A y B son: que han sido distribuidos en clases y frecuencias, y para los
A: 30 28 10 8 cuales se desconoce la serie original.
B: 30 28 10 64
La media de las eda-
Ejemplo 2.2
des en la familia A es| Las cifras de
sobrepeso, en kilogramos, de 42 ejecutivos
19 años, en tanto que que han
ingresado a un programa de dieta, se dan en el
en la familia B es 33 cuadro a continuación.
Determinar la media de sobrepeso.
años.
La familia A está com-
puesta por: el padre,
| Indice i Clases(kg) f. absoluta fi
la madre y dos hijos. 0< 6 4
2
La familia B la com- 6<12 10
ponen: el padre, la 12<18 18
4 18< 24
madre, un hijo y..el
abuelo. 24< 30 3
42
Es claro que la Solucion:
edad del abuelo Sr toman como valores x a los representantes de la clase, es
afecta mucho a la de i a las maras ede ase, y sorn estas mart as las
media de la familia tantas Vees omo la freruene atsoluta (que
de sela repiten
clase
orespondiente Recuerde que x. es el valof (que se eneuentra
enel centro de la lase i It aplic ar ion ee la tormula se realiza
ejor en un uadro como el siguente
Propiedades linea-
les de la media.
Indicei Clases (kg) xi
Consideremos que
X1, Na,Xn es una 612 10
muestra de medi- 1218 15 18 270
das con media x.
18< 24 21 147

1. Si se multipli 24 3027 81
42 600
can cada una
de las medidas 600
= 14.29
por una canti
dad b, la nue-
va media es: Debe advertirse que la cifra 14.29 kg es un valor aproximado de
bx. la media aritmética. La verdadera media se consigue al
calcularla con los 42 datos de la serie simple, sin agrupar.
2. Si se suma (o se
resta) a cada
una de las CALCULO DE UNA MEDIA DE MEDIAS
didas una mis- | Ejemplo2.3
ma cantidad b, Las notas promedio, en el primer examen parcial de un curso de
la nueva media Estadística ,fueron: para la sección Ei, que tiene n1 = 11
es: Xb estudiantes, X1=6.7; para la sección E2, con n2 = 15 estudiantes,
X2=7.2 y para la E3 con ns = 27 estudiantes, X3=8.6
3. Si se resta a ca- Calcular la media de los tres cursos.
da observación
la media x, la | Solución:
nueva media es Es incorrecto en este caso calcular la media haciendo:
igual a cero. (6.7 + 7.2 + 8.6) /3 = 7.5 ya que las secciones no tienen igual
número de estudiantes.
X- X)= 0 Lo correcto es: reproducir la suma de las notas en cada sección,
adicionar esas sumas y luego dividir este resultado entre el total
de estudiantes de las tres secciones.
4. Si se transtor
man los datos = [ (11x 6.7) + (15 x 7.2) + (27 x 8.6)]/(11 15 + 27)
iniciales me =413.9/53 7.81
diante:
Note que 7.81 es muy diferente de 7.5.
y a+bx
la nueva media es: La fórmula para tres grupos queda asi:

y a+ br
n+n,+n
e n un

general para
la media
de medias,
numero k
expresión
La escrihe:
Las ponderaciones e grupos, se
En el proceso de
n, 2.3)
ingreso a una uni
versidad, las unida
des de administra
ción académica
ponderan con dife
rentes pesos los
MEDIA PONDERADDA
exámenes: de
selección de persn-
sea
ya
psicológicos, de Al evaluar un proceso,
contrato,
o simplemente calcular la
conocimientos djudicac ión de
un
es usual que las etapas
ciclo,
otros aspectos de al fin del
final de un curso c o n diterentes pesos.
o ponderen
medición, que en proceso se califiquen

su conjunto deter-
conjunto de medidas y.
medidas xi
ponderada de
un
minan o no el aritmética
respectivas (pesos): w W2
a media
ingreso del estu- X, X..Xk, Con ponderaciones
diante. WWk, se calcula
mediante:

x, W
+X, W, +...+X JW1 (f 2.4)
W+W t..t.W

Ejemplo 2.4
En un proceso de selección de personal se ponderaron tres
en el área: 28 puntos; examen
aspectos: experiencia
psicológico: 12 puntos y conocimient0 de idiomas: 10puntos.|

Las notas de dos candidatos, en el orden señalado, fueron:


Candidato A: 7.2, 8.2, 8.8.
Candidato B: 8.3, 6.8, 7.0.
Cuál de los dos obtuvo mejor promedio?

Solución
Fl candidato A obtuvo elmejor promedio
A-I(7.2x28)+(8.2x12)+(8.8x10)]/ 50 =7.76
B-I(8.3x28)+(6.8x 12)+(7.0x10)|/50 = 7.68

Traducicloa puntaje, el candidato A obtuvo: 0.776x50 38.8


y el candidato B: 0.768x50 = 38.4. La diferencia minima
obligará sin duda a valorar aspectos individuales como po
ejemplo: la menor experiencia de A en el área, contra la no
muy bajal6.8), del candicdato B en
su examen psicologico.
La media geométrica de un conjunto de medidas Xi, X2,
X3,... Xn
se define como la raíz ene-ésima del producto de las medidas.

f 2.5)

Cuando los datos están asociados a una progresión y no


pueden considerarse exactamente Como observaciones
independientes, la media geométrica tiene un sentido más
MEDIA realista que la media aritmética.
GEOMÉTRICA
Ejemplo 2.5
Las remesas familiares a nuestro país, en millones de dólares,
fueron: en 2007 de 3,695 y en 2016 de 4,576. Estimar un
valor promedio de las remesas en los 10 años.

Ventajas y desven- Solución


tajas de la media No parece razonable calcular la media aritmética de las dos
geométrica: cantidades ya que son valores extremos y además se estaría
1. Es una medida suponiendo una tendencia lineal de la serie. La media
geométrica, en cambio, se asocia a un comportamiento más
de tendencia
suavizado de los valores.
central más
g= V3695x4576 = 4112
realista, cuando
se trata de El valor de la media aritmética es x = 4135.5, superior en más
datos que están de 23 millones de dólares.
relacionados
con progresio- Ejemplo 2.6
nes, tasas de Los precios de referencia al público de la gasolina especial (en
dólares/galón), de enero a mayo 2017 en El salvador, registrados
crecimiento o al inicio de cada mes fueron: 3.03, 3.15, 3.08, 3.07 y 3.222
tasas de cambio respectivamente para esos meses. Hallar la tasa promedio de
variación de los precios para el período señalado.
promedio.
2. No se puede Solución
aplicar cuando Las variaciones porcentuales mensuales son:
3.15/3.03) = 1.0396 (4.0%)
alguna observa- (3.08/3.15) = 0.9778(-2.2%)
ción es cero o
(3.07/3.08) =0.9968 (-0.03%)
cuando resulta (3.22/3.07) = 1.04894.9%)
una raíz par de
un número ne-
La media geométrica es.
8 1.0396x0.9778x0.9968x1.0489 = 1.0153
gativo.
Lo que significa una variación porcentual mensual (tasa de
variación) de 1.53%. Nótese que este resultado también se obtiene
22
haciendo: -1= 0.0153, (1.53%). Cuál es la tasa de variación
de las remesas familiares en el ejemplo 2.5?

Tasa de variación a=
observación inicial
observación final
nedida das xi, x
conjunto
de
entre3 X3,...Xn Se
mónica
de un
valores,
dividido e la suma
La media total de
número

define como: el
valores.
de los inversos
de os
(f 2.6)

h-1 +..+

medida
de uso muy frecuente en
una e l o c u e n t e su :
Esta media no cs

sin embargo,
es muy
de ilidad
analisis estadístico,

Cuando queremos
estimar un
valor medio

ejemplo clásico:
idades
Consideremos el siguiente
promedio.

Ejemplo 2.7 en viaje de ida.


una
distancia d, a

una
MEDIA Un ciclista recorre
la misma distancia
de 30 km/h y
ARMÓNICA velocidad promedio velocidad promedio de 20 km/h un
una
viaje de regreso, a hizo todo
velocidad media
/ A qué el
h= poco cansado?).
recorrido?

Solución
La media aritmética: (30 + 20)/2 = 25 es una respuesta

tentadora, pero no es la
correcta. Veamos por qué:
El tiempo que tardó en el viaje de ida es ti = d/30 y el tiemno
que gastó en el viaje de regreso es t2 = d/20. Por lo tanto, a
velocidad media a la que recorrióla distancia 2d fue:
2d 2d 2
V=
= 24
, +t, d d 1 1
30 20 30 20

|La velocidad media correcta es 24 kilómetros por hora, no 25.


Nótese que la expresión de cálculo resultante
corresponde
exactamente a la definición de media armónica.
En un conjunto de medidas
ordenadas de menor a
mayor
MEDIANA XI<X2<X3<...<Xn, la mediana es un valor que se ubica en
e
centro de la serie: no más de la
mitad de las observaciones son
Ventajas y desven- mayores que ese valor y no más de la mitad son menores.
tajas de la mediana La mediana es una
medida de posición que en ocasiones
1. Es única, y no prefiere a la media aritmética, ya que tiene la ventaja de eno
se ve afectada verse intluenciada por los valores
por valores extremo0s.
muy grandes o Ejemplo 2.8
muy pequeños.
pequenos.L0S salarios mensuales
Se puede calcu- empresa son: 1420, 1400,dólares de cinco empleados de u
en
2.
lar e interpretar de la mediana. 1500, 1350, 5000. Hallar el vai
en variables Solución
cualitativas que La serie ordenada
admiten orden. Indicador de ordenqueda
i: 1
de la
siguiente manera:
Serie ordenada: 2 3 4 5
1320 1400
1420 1500 5000
3. No se puede De acuerdo con la definición, la observación que ocupa la
calcular en posit ión tres es la mediana: Md= 1420. No más del 50% de
aquellos los salarios son nayores (que 1420 y no más del 50% son
cuadros de fre menores (que 1420.
cuencias que
tienen clases SI comparamos con el valor de la media aritmética f =
abiertas y la 10640/5 2128, debemos admitir que esta medida,
mediana cae en Considerada central, no caracteriza ficlmente al conjunto de
una de esas datos, ya que 80%% de los salarios son menores que 2128. Para
clases. (que la media aritmética pucda, en este caso, ser un buen
representante de la tendencia central de los datos debe
calcularse omitiendo el valor extremo 5000. Se tendría: X =
1410, un valor muy comparable con la mediana.

Ejercicio de Si la serie en cuestión fuera la de seis salarios de seis


prueba: empleados, la mediana se debe calcular haciendo "la semi
En el siguiente dia- suma de los dos valores centrales".
grama ordenado de
tallos y hojas, cal- Indicador de orden i: 1 2 3 4 5 6
cular la mediana Serie ordenada: 1320 1400 1420 1500 2100 5000
de la serie.
Tallos hojas Mediana Md = (1420 + 1500)/2 =1460
13 2 3
14 0 2 6 7 PASOS PARA DETERMINAR LA MEDIANA EN LA SERIE
15 2 4 6 6 8 SIMPLE
16 0 1 9 1. Ordenar la serie de menor a mayor: X1 < X2 < X3 <...< Xn.
17 2 3 4 6 2. Calcular n/2
18 015 3. Si n/2 es un número decimal, (por ejemplo 7.5), seleccione
como indicador de orden i al entero próximo superioren
respuesta: ,

este caso i =8): la mediana es la observación xi (xs).


4. Si n/2 es un número entero, seleccione como indicadores
de orden al entero obtenido i y al siguiente: i +1 . La
mediana se obtiene haciendo: Md (xi Xi+1)/2. =
+

Fórmula para cal- PASOS PARA DETERMINAR LA MEDIANA EN LA SERIE


cular la mediana AGRUPADA
en la serie agrupa- 1. Calcular n/2
2. ldentificar la clase donde se encuentra la observación n/2.
da en clases y fre.
Cuencias Esta es llamada clase mediana y se localiza fácilmente al
observar la columna de las frecuencias acumuladas F
- F 3. Calcular la mediana con la expresión: Md = Li + d donde:
Md L +2 Li es el límite inferior de la clase mediana y d es la distancia
quefalta para llegar a la mediana. El valor d se consigue
(f 2.7) mediante la proporción:
n

2 ,donde ces el ancho de la clase.


de obierno cuál era la
g o b i e r n o

casara
Ejemplo 2.9 empleados

a
124 habia
desde su asa
hacia su
Se
Se preguntó

distancia,
en
kilómetros,
que
resumen
de sus
respuestas

mediana.
está.
dado enen el
Un distancia

trabajo. la
ugar de cuadro.
Determinar

siguiente

Solucion IndiceiClases (km) F


3 4 4
3 5 8
| 12
20
30 20
7<9 50
32
82
9< 11 23 105
11<13 15 120
d
13<15 4 124
-C#2

La observación n/2 = 62 se encuentra en la


cuarta clase (i =
frecuencia absoluta f4 50, limit
=

Es la clase mediana y tiene:


inferior L4- 7 y ancho de clase C= 2, como puede observarse
en la figura.
La frecuencia acumulada hasta la clase anterior a la clase
mediana es Fs = 32, de manera que la diferencia: n/2 Fi=
30, es el número de observaciones que restan para llegar ala
posición mediana.

Md =7+ d
Al igualar las razones: d/2 =
30/50, obtenemos d 1.20. =

Luego:
Md 7+ 1.20
8.20 kilómetros.
Es el valor o la modalidad
más frecuente
LA MODA Es aplicable tanto serie de datos. en una
para caracteres cualitativos
caracteres cuantitativos. Se como para
Ventajas y desven- denota Mo.
tajas de la moda: La moda se
1. No ve reconoce
fácilmente en el caso de
se
afec- CualitativOs, ya que muchas de las caracteres
tada por valores de
opinión preguntas en las
extremoS identificar
o estudios
de
mercado, encuesta
buscan
puede inter asociada la mayor más frecuente. Así,fundamentalmen
2. Se
el suceso
pretar tanto pa- los entrevistados proporción en una la moda, ene

ra variables noticieros por


variables tienern como investigación: "6570 de
cualitativas co- en la confeccióntelevisión", "53%fuente principal de noticla los
de los
mo para cuan-
etC...La
de
camisas defectos encontra encontrados

la moda.primera clase en un
se deben a talla incorrecta"
titativas talla
incde
diagrama de Pareto correspo correspondk a
3. Tiene la des Cuardo el carácter es cuantitativn ehise rets basta con contar et
ventaja de que u e qe más e repite P ejomple si en una pequeña
diferentes stce muestra tde farmilias se ternen les sigaientes faterR de "mumere
sS pueden te d hijos pw familia" 0 4 , n , . 0 2 e
ner la nsisrma y H e ue apareee más frrY tnte es hijes Fn censeruene ia
mayor frecuen a rmwia e Me-
cia. Por lo tanto
pueden haber En ciert% casos la moda es la meedicda ele tenelen ia rentral epie
distribu Ones ejor reprsenta al onjunto te valores
bimodales, tri
modales etc tjemplo 2.10
4. Visto desde Determine la media aritmética, la mediana y la moda en la
otro angulo, la iguiente serie de salarios mensuales en dólares. ee toreos les
presencia de empleados de una fábrica incluyendo sus dirigentes
varias modas
constituye una 500 500 400 400 400 400
intomación 400 200 200 200 200 200
adicional, pues 4800 2000 500 500 500 500
indicaria que 200 200 200 200 200
en la población
existen grupos Solución
o estratos bien El salario $200 aparece 10 veces y es el de mayor trecuencia:
definidos. 400 aparece 5 veces; el salario $500, seis veces y tinalmente
$2000 y $4800 solo una vez. De acuerdo a esta distribucion y
los cálculos del caso tenemos:

Media aritmética: X = 600


Mediana: Md = 400
Moda: MO = 200

Es evidente que la media aritmética engaña pues, en principio


nadie gana $600 y luego, solo 2 personas de un total de 23
gana más de $600. La mediana por su parte expresa que, à lo
mucho el 50% gana $400 o menos; pero en realidad, más del
43% gana $200, (10/23x100). Debemos aceptar que en este
caso la moda caracteriza mejor al conjunto de salarios.

Cuando la variable es continua y está distribuida en un cuadro


de clases y frecuencias se debe identiticar la clase modal, es
decir la clase con mayor trecuencia absoluta. No hay manera
en este caso de calcular con precisión el valor de la moda.

Algunos estadigratos sugieren tomar la de clase de la


marca
clase modal como el valor modal; otros, emplean una
expresion que involucra las trecuencias absolutas de las clases
adyacentes. El diagrama de la izquierda explica la siguiente
1órmula
( 2.8)

Mo-,ab de la
clase modal
claso
C=anchode
inferior
onde: 1: limite
b = i -i
i

Ejemplo 2.11
Calcular el valor de
la moda
en el cuadro de
bución del
distribuci.

ejemplo 2.9.

do
Solución: trecuencia absoluta fa = 50
50.
Laclasemodal es la clase4 c o n

20 ;b =fs- ts =
50-23; c = 2
L4=7; a =f- fi= 50
tenemos:
Sustituyendo en la fórmula
30
Mo = 7+ 28.05
30+27
RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Las representaciones gráficas de las tres medidas de tendencia
central pueden facilitar la interpretacion de casos Concretos v
relacionar el orden de las medidas con la asimetria que pueda
presentar la distribución de valores.

Gráfico simétrico:
La media, la mediana y la

al
moda coinciden.
La mediana divide el área
en dos
partes iguales
La moda es la marca de
clase de la clase de mayor
RELACIÓN ENTRE recuencia media=mediana=moda
LAS MEDIDAS

Gráfico con asimetría a la


izquierda (negativa):

X está influenciada
Note que en este por los valores extremos de
X< Md< Mo
caso: la izquierda
34
Gráfico con asimetría a la derecha (positiva):

Mo Md

X está influenciada por los valores extremos de la derecha.


Note que:
Mo< Md< X

2.2 CUARTILES Y PERCENTILES

CUARTILES Y Los percentiles son medidas de posición que dividen la serie


PERCENTILES ordenada de valores en dos subconjuntos: los que son menores
que ese valor y los que son mayores que ese valor.

Uso discutible_deE nombre hace referencia a porcentajes de


percentil
lospercentiles observaciones que van desde 1% hasta 99% y que identifican a
Los resultados de
algunas pruebas ded medida posicional. Simbólicamente lo denotamos:
aptitud, tal com0 Pk, el k-ésimo percentil, con k = 1, 2,..,99.
nuestra conocida
PAES, se dan a los Asi, Pio es el décimo percentil, y significa que no más del 10%
estudiantes en per de las medidas son menores que Pro y no más del 90% son
centiles y no en mayores que P10.
cifras absolutas.
Esto puede condu-| Los Cuartiles, incluyendo la mediana; de los cuales hicimos
cir a que el estu- referencia gráfica en el capítulo1, resultan ser los percentiles del
diante se haga una 25%, 50% y 75%.
falsa apreciacion O1= P2s Q2 = Pso = Md Q3 = Prs
de su rendimiento,
ya que puede en
Con igual interpretación.
contrarse en el per DETERMINACIÓN DE PERCENTILES
centil 85 de la La metodología de cálculo es básicamente la misma que se
distribución de no0 utilizó para obtener la mediana, tanto para la serie simple
tas y tener una n0- ordenada como para los datos organizados en clases y
ta real de apenas frecuencias. Veamos de manera práctica los cambios que se dan
5.4 en los pasos a través de un ejemplo.

Ejemplo 2.12
Los 59 datos de precipitación, en mm, que se encuentran en la

primera columna de la página 36 están ordenados de menor a


Determine el percentil 35 y los
mayor, siguiendo las columnas.
tres cuartiles de la serie.

35
35 e encuent
so

el p e r c e n t i l
Datos de precipita Solucion:
que
ocupa
en la
serie

ción en mm. Ld
posiciOon
59
20.65.
doto.
ermin, lal
=

(35/100)x utiliza para


se
Estación Santa Te- haciendo:
3 que
con el paso
es i = 21 y lla observa a
cla, agosto C o n s e c u e n t e

del percentil
la posición
(1942-2000). mediana, 295.
Luego Ps
=

localizar es X21.
174 279 337 368
14.75;(i
=
15)> Qi=27.6
174 280 340 371
Qi >
(25/100)x59 =29.50 ;(i
178 283 340 376
376
Posición de
(50/100)x59
=
= 30)> Q2=333
181 292 348 381
sición
Posic de Q:
(75/100)x59
= 44.25;(i =
5)
45)- Q=367
sición de Qi
Posic
182 293 348 389
183 295 350 392 del percentil
ásimo se encuentra
k-ésimo se ene

En resumen, la posición
211 300 351 398
calculando: (k/100)n. se seleccionan co
216 301 352 415 un número enter0,
Si el resultado es
217 304 355 423 entero obtenido
I Y al siguientei+ .El
indicadores de orden al
226 304 362 437
percentil se obtiene haciendo: Pk
=
(Xi+Ki+1)/2.
233 310 363 451
235 310 365 528 En las series agrupadas, el procedimiento de cálculo na
do
257 328 366 567 percentiles es el mismo que el que sigue para
la mediana,. Una
270 328 367 699vez determinada la posición debemos iIdentificar la clase que
276 333 367 contiene al percentil y calcular d mediante la proporción:

kn
d 100 Fia luego, P Li +d
-

El siguiente es un
diagrama llamado
Para el cálculo de los cuartiles
de tallos dobles. se puede emplear la
siguiente|
expresión:
El dígito de las
ho
jas es menor que 5
para el primer ta- n-F - c j = 1, 2, 3. (f 2.9)
llo, y mayor o igua
que 5 para
que para el se
se-
el Donde Lies el límite inferior de la clase
gundo repetido. que contiene al cuartil.
Ordene los datos y
encuentre los Ejemplo 2.13
cuartiles.
tres En el siguiente cuadro de
distancia en kilómetros que distribución, que se refiere a
la
su
lugar de trabajo; calcule los hay desde
del empleado a la casa
Tallo hojas valores de los cuartiles
1 0 4 3 3 2 2 33 empleando la fórmula.
1 86 76 9
2 0 1 4 3
57
Indice i Clases (km) Fi
3 12 24 3
3 76 4
3< 5 8
<7 12
20 32
7< 9
50 82
9<11 23
11 < 13 105
15 120
13<15
4 124
Solucion
Posic on de Q: (1/4)124 1, se eneuentra en la tercera lase
-5 1-1 2)7
20

Posicion ede (): (2/4)12462, se encuentra en la (Uarta case


7 + 02-32
50
(2)8.20

Posición de Q: (3/4)124 93, se encuentra en la quinta clase

-9+
93-82,
(2) 9,96
23

2.3 ANÁLISIS EXPLORATORIOo

Rango La organización de los datos en diagramas de tallos y hojas es


intercuartílico lo que comúnmente se conoce como análisis exploratorio de
La distancia entre datos. Es muy empleado por su facilidad de elaboración y
el primer cuartil y porque es un medio muy eficaz para descubrir información.
el tercer cuartil se Una lista de números se trasforma rápidamente en una
lama rango inter- estructura organizada con gráfico incorporado que abre
cuartilico0. muchas posibilidades de análisis.
RI =Q-Q1
Esta medida es em- El diagrama ordenado de los datos, de menor a mayor, permite
pleada en el análi- calcularestadísticas de orden muy importantes, tales como los
sis descriptivo para percentiles y los cuartiles.
identificar valores
extremos(outliers). El análisis exploratorio se complementa de manera muy útil
Se calculan dos lí- con un diagrama de 5 puntos, más conocido como diagrama
mites: de caja.
fi-Q1-1.5 RI y
f2-Q3+ 1.5 RI Los cinco puntos que se emplean de la variable son los
los valores que se estadísticos de orden:
encuentran fuera (Mínimo valor, Qi, Q2.Q3, máximo valor).
del intervalo (f1, f2)
se consideran out- Se le llama caja a una figura rectangular con altura arbitraria
liers cuya base abarca desde el primer cuartil hasta el tercer cuartil.
Son valores que La caja se divide en dos partes trazando una linea a la altura
deben revisarse de la mediana. A derecha e izquiercda de la caja, a partir del
pues pueden dis- punto medio de su altura, se trazan líneas continuas hasta
torsionar los resul-alcanzar los puntos máximo y mínimo de la
tados de algunas muestra de valores.
medidas centrales
o de dispersión.
Ejemplo 2.14 el siguiente co
laborar un diagrama
de caja para
a los pesos
ramos
en kilogra de l junto
o
un grup
correspondiente
datos
de 60 estudiantes.

50 52 52 52 52 53
47 48 49 50 50
44 45 46 46
55 55 55 55 56 56 56 57 60 60
53 53 54 54 54
64 64 64 65 65 65 66
60 60 60 61 61
62 62 63
70 70 71 72
72 74 75 8093
67 68 68 68 70 70

Solución 66.5, 93). El rango Intercua


Los 5 puntos son: (44, 53, 60,
13.5.
Intercuartílica
Q-Qi=66.5-53
=
es RI =

S0%
25%
25%

40 50 60 70 80 90 100

RI = 13.5 que en un intervalo de longitud 13.5 kg s


significa
encuentra el 50% de las observaciones centrales . El
diagrama
estaría expresando que los pesos están concentrados en
los
valores menores y que existe una cierta asimetría
positiva en la
distribución.

Los límites para determinar valores extremos son:

fi-Qi-1.5 RI 53 -1.5(13.5) 32.75


=
=

f2-Q3 +1.5 RI =66.5+1.5(13.5) 86.75 =

De acuerdo con los


resultados, solo el peso de 93 K8
considera outlier. Podría
el cálculo de
ser
conveniente no considerarlo pala
otras medidas.
2.4 EJERCICIOS PROPUESTOS

1. Calcule la
media aritmética, la mediana la
y moda para las siguientes muestras de
observaciones ;Qué medida central
a) Edad del padre en un representa mejor al conjunto?
grupo de 10 familias: 28, 32, 24,
35 26, 41, 38, 58, 27, 32,
b) Notas de un examen de
estadística: 5.4, 9.2, 7.3, 6.9, 8.2, 6.1, 7.6
c) Número de defectos
encontrados en una muestra de cinco artículos:
10, 9, 12, 16, 2, 3, 10. 6, 4, 8,
d) Tiempo en minutos
que tarda una operadora en realizar una tarea:
7.9, 3.8, 5.3, 4.6, 5.1, 10.4, 4.1 4.2, 5.1,
e) Peso en libras de hombres entre 20
y 25 años: 128, 133, 140, 155, 145, 180,
125, 178, 160, 181, 128, 130, 135.

2. Los siguientes
datos se refieren a los
pesos (en libras) de 35 paquetes transportes por
una compañia de encomiendas.
8 13 22 16 26 23 41
35 24 23 27 16 20 56
31 17 20 33 18 23 26
46 30 19 22 13 22 28
43 37 15 20 11 25 22

a) Calcule la media aritmética, la mediana y la moda del conjunto de valores


b) Elabore un cuadro de distribución de frecuencias con 6 clases de
calcule nuevamente las medidas anteriores en la serie
igual ancho y
diferencias entre los valores?
agrupada /Existen
c) Empleando la serie simple determine los valores necesarios y elabore un
diagrama de cajas /Existe algún outlier?

3. Los siguientes datos corresponden al peso en libras y al género, masculino (m) y


femenino (t) de un grupo de 59 estudiantes.

143 f 101 m 140 f 105 m 129 m 168


104 m 179 140 115 m 120 f 160
140 f 115 m 164 m 150 m 137 m 118
110 m 132 m 170 m 176 120 m 180
117 f 142 f 120 f 106 f 136 m 175
m 160 m 155 f 130 f 116 f 105 f 124
131 m 172 130 m 118 m 135 f 180
m 120 100 t 110
110 f 150 m 153 m 142
f 105 125 f 105 f 110
f 135 m 210 m

f 138 125 m 155 105


f112 m

a) medidas de tendencia central: media aritmética, mediana y moda


Compare las
para la variable peso y para cada género.
b) Utilice una misma escala vertical para la variable peso y grafique los diagramas
de caja para cada género. Exprese sus conclusiones.
dólares) por
un grupo de asat

4. La distribución del impuesto a distribución


ilustra en el guiente cuadro de
P
(en
en
Clases y trecuencias,
ariados
siguie
A pagar ($) Frecuencia

10 30
30 50
50 70 12
70 90 50
90 1 10 35
110< 130 15
130< 1 50 5
a pagar
dCalcule la media, la mediana y la moda del impuesto
todo el grupo
là cantidad aproximada a pagar por
c l e
Q u e porcentaje de asalariados paga más de $80
los contribuyentes
d)Cuál es el valor mínimo, aproximado, que pagan tes que estan
en el 25%o superior de la distribución?

5. Un almacén tiene cinco trabajadores 3 el


en el departamento A, en
By
3y 2 en
en elc
elc
LOS Salarios promedios diarios por departamento son respectivamente: 14, 12 vt
dolares. Determínese la media de los salarios de todos los trabajadores del
almaci
6. El detalle de cinco compras de una materia prima en loS ultimos meses se
proporciona en el siguiente cuadro:

Compra Costo por libras ($) Cantidad de libras


3.00 1,200
2 3.4 500
3 2.80 2,500
4 .90 1,000
5 3.25 800

Cuál es el costo promedio por libra?

7. Los siguientes datos muestran la


clínica,
pérdida de peso (en libras) para cada paciente de
una después de un año de haber sido
sometidos a un
ejercicios. régimen de dieta
8 13 22 16 26 23 41 21
35 24 23 27 16 15 19 26
20 56
31 17 20 33 25 12 34 10
18 23 26
46 30 19 22 14 29 18 28
13 22
45 37 15 28 23 17
20 11 25 23 35
15 18 11 21 12
23 18 17 27 26
26 31 20 12 41 34
Aplique la técnica del análisis
relevante del conjunto de valores,exploratorio de datos para obtener ación

que le permitan
Exprese sus conclusiones con claridad intormia
caracterizar su comportarn miento.

y precisión
8. Considere que X1, X2,...XN Jes una muestra de medidas media
las siguientes propiedades lineales de la media.
con
X.Compruebe
Si
a)
Y Xi +b,entonces Y X+b
=
=

b)Si Ya+ bX,, entonces Y-a +bX


c ) S i Y = Xi - X', entonces Y= 0

9. Utilizando la serie de datos del ejercicio 1 c) de la


variación de las
página 21, calcule las tasas de
exportaciones y las importaciones de El Salvador, en el periodo
señalado0.

10. Elabore un análisis descriptivo completo de las siguientes muestras de datos


correspondientes a un grupo de estudiantes: incluya gráficos, medidas, etc.. Y
exprese sus conclusiones.

Sexo Edad Matricula Estatura Peso Trabaja | Salario Estado


Celular Rendimiento Fuente
21
Civil
1.68 143 no 3
20 1.6 104 si 3
25 1.7 140 si 3 P
22 1.4 110 no no 3
20 1.6 117 no

m 24 1.77 160 no no

1.65 131 si 2
27 1.67 120 no

26 1.56 135 no 3

28 1.53 112 si 5

m 24 1.68 129 SI

m 19 120 no

19 1.8 137 no no

f 24 1.65 120 SI

18 1.65 136 SI
P
19 1.7 105 no

21 1.65 115 no no

20 1.7 150

m 19 1.91 176 si no

20 1.5 106 no

22 1.54 101 si

22 1.89 179 si no

1.58 115 no

24 1..69 132 si 2

21 1.65 142 si

m 155 no

1.78
m 21
172 no

1.7 100 no P
m 21 1.71 210 no

20 1.71 138 si 2 S

19 1.63 105 no

22 1.6 135
m 21 1.69 153 SI

41
Estado Celular Rendimiento
Estatura Peso Trabaja
Salario Civil
nO
Fuente
Sexo Edad Matricula
SI 3
I.51 105
no 3
1.6 105
21
116 no
29 1.64
118 SI
1.67
1.67 150 si

125 SI si
26 1.62 S

155 no
1.3 SI
20

21 1.6 140 no

140 SI 4
24 1.67 S
SI
no
22 1.7 164 S
si 3
si 2
19 1.75 170 si 2
S
no
19 1.7 120 si 3
SI
21 1.54 130 3
S si
130 no
21 1.83
si 3
110 no
21 1.57
si 3
22 1.55 105 si
no 3
M 25 1.64 125 Si
si 2
m 21 1.79 168 si P
Si 3
31 1.5 160 Si
no 3
m 25 2 1.72 118 SI

1.81 180 SI si 3
m 23

m 24 1.72 175 Si Si

f 21 1 1.65 si S si P

f 23 2 I.65 180 SI S no 2

m 20 1.683 142 no si 3
1.4
22 110 no
1 S no 3 t

1. Sexo: f: femenino m: masculino


2. Institución: 0: Oficial 1: Privada
3. Salario: -1: No trabaja 1: menos de 2: $100 < $400
3: $400<$700 4:
$100
más de $700
4. Estado civil: s: soltero(a) C:
v: viudofa)
casado(a) a: acompañado(a)
d: divorciadola)
5. Rendimiento 1: deficiente 2: regular 3: buenoo
4: excelente
6. Fuente de información: t: televisión
P: periódico r: radio
i: internet

También podría gustarte