Está en la página 1de 109

CAPÍTULO 2

26/10/21
FACULTAD DE INGNERIA ELECTRÓNICA
Mg. Wilfredo Domínguez C.

1) MEDIDAS ADICIONALES DE TENDENCIA CENTRAL


En las notas de clase Parte 1; se estudió una medida de
tendencia central llamada media muestral o media
aritmética o promedio o simplemente media; sin lugar a
dudas este promedio es el más importante de todos, pero
no es el único que y hay otras que también tienen sus
aplicaciones; por ejemplo también son medidas de
tendencia central los siguientes:

 Moda: M d
 Mediana: M e
 Cuartiles: Q1 ; Q2  M e ; Q3
 Deciles
 Centiles
 Percentiles o cuantiles
 Media Geométrica: M G
 Media armónica: M H WW
Se dará énfasis a la M d ; M e ; Q1 ; Q2  M e ; Q3 (cuartiles ) ; se
estudiará en primer lugar la Moda.
ww
2) MODA (Md)

2
Por definición la Moda es el valor de la variable que se
repite o se presenta más veces.

Ejemplo 1. Los siguientes datos corresponden a las


edades en años de un grupo de amigos en la universidad:
21 23 24 21 25 22 21 20 22 21
Claramente la edad que se presenta más veces es 21
años (4 veces); luego M d  21 años (Unimodal: una sola
moda)

Ejemplo 2. Se ha tomado una muestra de un grupo de


personas de la tercera edad que padecen diabetes y se
les ha registrado sus respectivos pesos en kilos;
resultando:
76 67 62 80 66 62 77 71 62 80 71 89 71
Observamos que hay dos valores de la variable que se
presentan 3 veces, ambos valores son modas; es decir:
M d  62 años; M d  71 años (bimodal: dos modas)
1 2

Ejemplo 3. En nuestra universidad existen


numerosos cursos en las diferentes facultades;
inevitablemente en cada curso existen alumnos que
abandonan el curso en que se ha matriculado. Se tomó
una muestra de cursos y se contó el número de alumnos
que han abandonado en n=25 cursos , resultando:
ww

0 1 2 1 3 2 2 3 3 4 1 2 2 3 4 2 3 0 2 1 2 3 4 5 1
. . . . . . . . . . . . . . . . . . . . . . . . .

2
Los datos se organizaran en una tabla contando el
número de veces que se repite cada valor de la variable
distinto; es decir hallando las frecuencias absolutas.

Xi
0: 0 0 f1  2
1: 1 1 1 1 1 f2  5
2: 2 2 2 2 2 2 2 2 f3  8
3: 3 3 3 3 3 3 f4  6
4: 4 4 4 f5  3
5: 5 f6  1

El esquema anterior puede ser puesto verticalmente y


esto nos dará una idea de la forma de la distribución de
los datos.
Observe que en el gráfico anterior están los mismos
datos; contando cuantas veces se repiten cada valor
distinto de la variable.
Las veces que se repiten los valores distintos se llaman
frecuencias absolutas y se representan por fi . ww

f1=2 f2=5 f3=8 f4=6 f5=3 .f6=1


x
x
x x
x x x
x x x
x x x x
x x x x x
x x x x x x
X 0 1 2 3 4 5
i

2
La moda evidentemente 2; pues se repite 8 veces; es
decir la moda es el valor de la variable con mayor
frecuencia absoluta; por lo tanto
M d  2 alumnos (Unimodal)

Observaciones:

1) La moda existe y no necesariamente es única; sin


embargo la media muestral existe y es única.
2) La moda también se define como el valor de la
variable con mayor frecuencia absoluta.
3) La moda se puede definir así: es la abscisa (eje
horizontal) con mayor ordenada (eje vertical)
4) Matemáticamente la moda es la abscisa donde
ocurre un máximo de la curva.

Ejemplo 4. Las notas de un grupo de alumnos en la


escala vigesimal; resultando:
11 10 12 13 17
Todas las notas se presentan una vez; es decir todos son
modas; es un caso multimodal; es decir:
M d  10 puntos;
1
M d  11 puntos;
2
M d  12 puntos; M d  13 puntos
3 4

M d  17 puntos
5

Ejemplo 5. En base al siguiente cuadro


correspondiente al número de televisores por familia en
una muestra tomada en el distrito de San Miguel; se pide
calcular la moda:

Xi fi fi X i

2
0 1
1 7
3 10
4 2
5 1
n=21

Observamos que el valor de la variable que se repite más


veces es 3 (frecuencia absoluta 10); luego se tiene:

M d  3 televisores (unimodal)

Ejemplo 6. El siguiente cuadro muestra el número de


dormitorios por familia: ww
fi Xi
fi X i
1 0
11 1
11 3
4 4
2 5
n=2
9
Este es un caso bimodal; pues el 1 y el 3 se repiten 11
veces; luego M d  1 dormitorio; M d  3 dormitorios.
1 2

3) MODA EN EL CASO CONTINUO

Ejemplo 7. El siguiente cuadro muestra las notas en


la escala vigesimal de un grupo de alumnos.(Caso
continuo)

Intervalo Xi fi

2
s
[8; 10> 9 3
[10; 12> 1 6
1
Interv. Modal
[12; 14> 1 9
3
[14; 16> 1 5
5
[16; 18] 1 3
7
Totales n=2
6

El intervalo de clase [12; 14> (intervalo modal: intervalo


con mayor frecuencia absoluta) tiene mayor frecuencia
absoluta ( f 3  9) ; se puede asumir que la marca de clase
del intervalo modal es la moda:
M d  13 puntos .
Existe una fórmula de refinamiento para hallar la moda
para el caso continuo.
La fórmula a aplicar es:

 ( f j  f j 1 ) 
M d  x *j 1  c  
 ( f j
 f j 1
)  ( f j
 f j 1
) 
Donde:
 x*j 1 : límite inferior del intervalo modal; en nuestro
0

caso x j1  12
 c : amplitud del intervalo de clase; para el ejemplo
c2
 f j : frecuencia absoluta del intervalo modal; en

nuestro ejemplo f j  9

2
 f j 1 : frecuencia absoluta inmediato anterior del

intervalo modal. Para el ejemplo f j1  6


 f j 1 : frecuencia absoluta intervalo inmediato
superior del intervalo modal. En nuestro caso f j1  5
Reemplazando los valores dados anteriormente:

 ( f j  f j 1 )   (9  6) 
M d  x *j 1  c    12  2  (9  6)  (9  5) 
 ( f j  f j 1 )  ( f j  f j 1 )   
 3  3
M d  12  2    12  2    12,8571 puntos
 3  4   
7

Ejemplo 8. El siguiente cuadro muestra los sueldos


en soles de un grupo de empleados de esta universidad:
Intervalos X i fi
[1200; 13
1300>
[1300; 16
1400>
[1400; fj-1= 190
1500>
[1500; fj =200 Interval
1600> o Modal
[1600; 1700] fj+1= 23
Totales n=442

Hallar la moda e interpretar.


Necesitamos las siguientes cantidades:
a) Intervalo Modal = [1500; 1600>
Límite inferior del Intervalo Modal = x j 1  1500
*
b)
c) Longitud del Intervalo modal= c  100

2
d) fj-1=190; fj=200; fj+1=23
Reemplazando
 (200  190) 
M d  1500  100 
 (200  190)  (200  23) 
 10 
M d  1500  100  1505,3475
10  177 
Es decir el sueldo que se presenta más veces es de
1505,3475 soles.

Ejemplo 9. Se tiene el sueldo mensual en soles de un


grupo de trabajadores de una gran empresa:
850 850 850 850 11000 15000 850
a) Hallar el sueldo promedio mensual de los siete
trabajadores.
b) Hallar la Moda de este grupo de trabajadores.
c) ¿Qué medida de tendencia central es más
representativa?
Solución:
5(850)  11000  15000 30250
X    4321,4285
a) 7 7 soles
mensuales.
b) Moda= M d =850 soles mensuales ww
c) Evidentemente la Moda es más representativa que
la media muestral; pues la mayoría gana 850 soles.

Ejemplo 10. El siguiente muestra el tiempo en minutos


de permanencia en la cola de un banco de la capital:

Intervalo Xi fi
s

2
[1; 5> 11
[5; 10> 17
[10; 15> 19
[15; 20> 25
[20; 25> 30
[25;30] 45 Interval
o Modal
Totales n=14
7

En este caso el intervalo modal es [25; 30]


.f j= 45; fj-1=30; fj+1=0

Reemplazando:
 (45  30)  15 15
M d  25  5   25  5[ ]  25[ ]
 (45  30)  (45  0)  15  25 15  45
45
M d  25  5[ ]  28,75 min utos
60

Ejemplo 11. El siguiente cuadro muestra las edades en


años de un grupo de estudiantes universitarios en una
reunión de confraternidad son:
ww
Intervalo Xi fi
s
[17; 19> 11
[19; 21> 13 Interval
o Modal
1
[21; 23> 10
[23; 25> 13 Interval
o Modal
2

2
[25; 27> 8
[27;29] 4
Totales n=5
9

Este es una caso bimodal; existen dos intervalos


modales:
 [19; 21>; M d : fj=13; fj-1=11; fj+1=10; c=2
1

Reemplazando:
 (13  11)  2
M d  19  2    19  2[ ]  19,8 años
1
 (13  11)  (13  10 )  2  3

 [23; 25>; M d : fj=13; fj-1=10; fj+1=8; c=2


2

 (13  10)  3
M d  23  2    23  2[ ]  23,75 años
 (13  10)  (13  8)  35
2

Ejercicio 1 El siguiente cuadro correspondiente al


peso de recién nacidos en gramos un hospital de la
capital son:
ww
Intervalos Xi fi
[1700; 03
1900>
[1900; 12
2100>
[2100; 9
2300>
[2300; 10

2
2500>
[2500; 8
2700>
[2700;2900> 7
[2900; 6
3100>
[3100; 3300] 12
Totales n=6
7

Hallar la moda o modas: interprete.

Ejercicio 2 Sea el conjunto de datos correspondiente


a las estaturas en metros de un grupo de personas
adultas:

1,67 1,79 1,72 1,71 1,80 1,72 1,71 1,72 1,72

Hallar dos medidas de tendencia central e interprételas.

4) MEDIANA: ( M e )
Aparte de la media muestral ( X ) y de la Moda ( M d ) existen
otras medidas de tendencia central; por ejemplo la
Mediana; la cual tiene algunas aplicaciones importante en
el área de educación, psicología y en general en muchas
otras áreas de la investigación científica.

Por definición la Mediana es el término central de los


datos ordenados de menor a mayor.

2
Esto significa que para calcular mediana primero hay que
ordenar los datos de menor a mayor.

Ejemplo 12. Los siguientes datos corresponden a los


pesos en kilos de un grupo de personas:

X 1  54; X 2  71; X 3  52; X 4  81; X 5  79; X 6  57; X 7  51

Como se observa los n=7 datos están desordenados;


cuando están desordenados dichos datos se representan
por X i i  1;2;...; n .
Cuando se ordenan los datos de menor a mayor se
denota por X ( i ) ; i  1;2;...; n .Observe que cuando hay orden
los subíndices van entre paréntesis; es decir:

X (1)  51; X ( 2)  52; X (3)  54; X ( 4)  57; X (5)  71; X ( 6)  79; X ( 7 )  81

En este caso se cumple:


X (1)  X ( 2 )  ....  X ( 7 )
En general para una muestra de tamaño n ww

X (1)  X ( 2 )  ....  X ( n1)  X ( n )

Ejemplo 13. Hallar la mediana de los siete pesos de


personas ordenadas de menor a mayor.
Los datos ordenados de menor a mayor son:
X (1)  51; X ( 2)  52; X (3)  54; X ( 4)  57; X (5)  71; X ( 6)  79; X ( 7 )  81

Observamos que el término central ocupa la cuarta


posición contando de menor a mayor, es decir X ( 4 )  57

2
kilos es la mediana de este conjunto de n=7 (impar) de
datos; este valor deja 3 valores a la izquierda de la
mediana y 3 valores a su derecha.
Por lo M e  X ( 4 )  57 con n=7 (impar de datos)
En general la Mediana es el término central de los datos
ordenados de menor a mayor que deja el 50% de las
observaciones a su izquierda y 50% a su derecha.

Ejemplo 14. Hallar la mediana de los datos:


X (1)  51; X ( 2)  52 ; X (3)  54 ; X ( 4)  57 ; [ X (5)  71] ; X ( 6)  79 ; X ( 7 )  81; X (8)  83; X (9)  85

Claramente el quinto término está en el centro de los


datos de menor a mayor; luego M e  71 kilos. ; con n=9
datos (impar).
En general si se tienen n datos (impar); la mediana ocupa
n 1
la posición 2 ; es decir:
Me  X n 1
; n impar
( )
2

ww
Ejemplo 15. Se tienen las notas de cinco alumnos en la
escala vigesimal:
12 13 10 13 11
Para calcular Mediana, primero hay que ordenar los datos
de menor a mayor:
10; 11; 12; 13; 13; n=5 impar
Por definición Me  12 puntos
Según la fórmula general la mediana ocupa la posición

2
n 1 5 1
 3
2 2 ; es decir ocupa la tercera posición de los
datos ordenados de menor a mayor; es decir

Me  X n 1 X 51  X ( 3)  12 puntos; n  5 impar


( ) ( )
2 2

Ejemplo 16. El siguiente cuadro de distribución de


frecuencias muestra el número de cursos matriculados
en una Escuela Profesional de esta universidad:

Xi 1 2 3 4 5
fi 3 4 5 2 1 n=15

Observe que en este cuadro hay un orden implícito de


menor a mayor; es decir el cuadro equivale a la data:

1 1 1 2 2 2 2 3 3 3 3 3 4 4 5
ww
Como n=15 impar la mediana ocupa la posición
n  1 15  1
 8
2 2

Entonces
Me  X n 1
X 151
 X (8 )  3 cursos; n  15 impar
( ) ( )
2 2

Ejemplo 17. En base al siguiente cuadro


correspondiente al número de televisores por familia en

2
una muestra tomada en el distrito de San Miguel; se pide
calcular la mediana:

Xi fi fi X i
0 1
1 7
3 10
4 2
5 1
n=2
1

En este caso n=21 (impar) entonces la mediana ocupa la


n  1 21  1
  11
posición 2 2

Para localizar la mediana es suficiente considerar la


frecuencias absolutas: El 0 tiene frecuencia absoluta
1(f1=1); el 1 tiene frecuencia absoluta 7 (f2=7). ww
Si se suma estas dos frecuencias absolutas f1+f2=8; el
siguiente valor de la variable es 3 con f3=10; si se suman
estas tres frecuencias absolutas:
f1+f2+f3=1+7+10=18; esto significa que la Mediana
necesariamente es 3; pues la mediana ocupa la posición
11; es decir:
Me  X n 1
X 211
 X (11)  3 tv.; n  21 impar
( ) ( )
2 2

2
Ejemplo 18. Se realizó un examen odontológico a un
grupo de niños de un colegio del cercado de Lima
observándose el número de dientes careados por
alumno; resultando el siguiente cuadro de distribución de
frecuencias:

Xi fi fi X i
1 1 1
2 6 12
3 9 27
4 6 24
5 1 5
n=2 69
3

Calcular la media muestral; la Moda y la Mediana.


69
X   3 dientes careados
23
M d  3 dientes careados ww
Para el cálculo de la mediana se suman las frecuencias
absolutas f1+f2+f3=1+6+9=16
n  1 23  1
  12
La mediana ocupa la posición 2 2

Luego la mediana tiene que ser 3; es decir:


Me  X n 1
X 231
 X (12 )  3 dientes careados.; n  23 impar
( ) ( )
2 2

Observe que las tres medidas de tendencia central son


iguales. ¿Es una coincidencia?

2
La respuesta no es una coincidencia; pues la distribución
es simétrica alrededor de la abscisa 3; observe el
siguiente gráfico: SPSS 21 (programa estadístico)

Statistics

x
Valid
(válid 23
n os)
Missin
0
g
Mean X 3,0000
Median M e 3,0000
Mode M d 3,0000
Variance
2 0,909
S
Range
R  X max X min 4,00
Minimum
X min 1,00

2
Maximum
5,00
Sum
69,00
 fi X i

Ejercicio 3 Con el siguiente cuadro de distribución de


frecuencias:
Xifi fi X i
1 1
2 6
3 9
4 6
6 1
n=2
3
Calcular las tres medidas de tendencia central ¿Por qué
no coinciden?
En general si la distribución es estrictamente simétrica y
unimodal, se cumple: X  M d  M e
ww
Ejemplo 19. En este caso se estudiará el cálculo de la
mediana para el caso par.
Sean los siguientes datos de la talla en centímetros de
un grupo de estudiantes de secundaria:

160 165 149 161 166 160 n=6 (par)

También como en el caso impar para el cálculo de la


mediana hay que ordenar los datos de menor a mayor:

2
X (1)  149 X ( 2 )  160 X ( 3)  160 X ( 4 )  161 X ( 5)  165 X ( 5)  166
En este caso como n=6 es par, no hay un único término
central y son dos los términos centrales el tercero y el
cuarto; el dato ordenado que ocupa el tercer lugar; es
n 6 n 6
 3 1  1  3 1  4
decir 2 2 ; el término cuarto es 2 2

En el caso n par por definición se saca el semi promedio


de los dos términos centrales; es decir:
X X X X
n
( )
n
( 1)
6
( )
6
( 1) X ( 3)  X ( 4 ) 160  161
M e 2 2
 2 2
   160,5 cms.
2 2 2 2

Ejemplo 20. Consideremos los siguientes datos:


X (1)  51; X ( 2 )  52 ; X ( 3)  54 ; X ( 4 )  57 ;
X ( 5)  71 ; X ( 6 )  73
X ( 7 )  79 ; X (8)  81; X ( 9 )  83 ; X (10 )  85
Los datos ya están ordenados de menor a mayor y
corresponden a pesos en kilos de un grupo de personas.
Como de observa n=10 (par) y hay dos términos centrales
el quinto y el sexto; por lo tanto:

X X X X
n
( )
n
( 1) (
10
) (
10
1) X (5)  X ( 6) 71  73
M e 2 2
 2 2
   72 kilos.
2 2 2 2

En general para tamaño de muestra n par se tiene:

X n X n
( ) ( 1)
M e 2 2
; n par
2

2
5) MEDIANA CASO CONTINUO
La mediana para el caso continuo en tablas de
distribución de frecuencias agrupados en intervalos de
clase tiene una fórmula que se explicará en detalle en un
ejemplo, la fórmula se aplica igual para el caso par o
impar:

n 
*  2  F j 1 
M e x j 1  c  
 F j  F j 1 
 
Donde:
*
x j 1 : límite inferior del intervalo de clase que contiene a la
mediana.
c : tamaño común de los intervalos de clase
n : tamaño de la muestra ww
F j : Frecuencia Absoluta Acumulada del intervalo que
contiene a la mediana. (Ver detalles en Ejemplo que
sigue)
F j 1 : Frecuencia Absoluta Acumulada del intervalo
anterior que contiene a la mediana.

Ejemplo 21.
El siguiente cuadro muestra las notas en la escala
vigesimal de un grupo de alumnos.(Caso continuo)

Intervalo Xi fi Fj
s

2
[8; 10> 3 3
[10; 12> 6 9=Fj-1
[12; 14> 9 18=Fj Me

[14; 16> 5 23
[16; 18> 3 26
[18; 20] 2 28
Totales n=2
8

Para el caso del cálculo de la mediana en el caso


continuo se trabaja igual para el caso impar o par; los
pasos a seguir son:
n n 28
  14
1) Se calcula 2 ; en nuestro caso 2 2 ww
2) Se busca la menor Frecuencia Absoluta Acumulada
Fj n F j  18
mayor o igual a 2 . En nuestro caso . Luego el
intervalo que contiene a la mediana es [12; 14>
3) Se busca la Frecuencia Absoluta Acumulada
anterior al F j .En nuestro caso F j 1  9
Aplicando la fórmula:

n   28 
  F   2  9 
j 1
5
M e x j 1  c  2
*

  12  2    12  2  
 F j  F j 1   18  9  9 
   
M e  13,1111 puntos.
Ejemplo 22. Hallar la Mediana en el siguiente cuadro de
distribución de frecuencias referentes a las notas en
escala vigesimal:
Intervalo Xi fi Fj

2
s
[6; 8> 1 1
[8; 10> 3 4
[10; 12> 6 10=Fj-1
[12; 14> 9 19=Fj
[14; 16> 5 24
[16; 18> 3 27
[18; 20] 2 29
Total n=2 ww
9

Seguimos los mismos pasos del Ejemplo anterior


n n 29
  14,5
1) Se calcula 2 ; en nuestro caso 2 2
2) Se busca la menor Frecuencia Absoluta Acumulada
Fj n F j  19
mayor o igual a 2 . En nuestro caso . Luego el
intervalo que contiene a la mediana es [12; 14>

3) Se busca la Frecuencia Absoluta Acumulada


anterior al F j .En nuestro caso F j1  10
Aplicando la fórmula:

n   29 
2  F   2  10 
* j 1
 4,5 
M e x j 1  c    12  2    12  2  
 F j  F j 1   19  10   9 
   
M e  13 puntos.

Ejemplo 23. El siguiente cuadro de distribución de


frecuencias muestra la temperatura corporal de un grupo

2
de pacientes afectados de corona virus después del día
diez de contagio:
Intervalo Xi fi Fj fi X i
s
[36; 36,5> 3 36,25
3 108,75
[36,5; 37> 5 36,75
8 183,75
[37; 37,5> 7 37,25
15 260,75
[37,5; 38> 9 37,75
24 339,75
[38; 38,5> 5 38,25
29 191,25
[38,5; 39> 3 38,75
32 116,25
[39; 39,5] 2 39,25
34 78,5
Total n=3 1279w
4 w
Hallar las tres medidas de tendencia central estudiadas
hasta el momento
1279
X   37,61764706 grados
 34

 (9  7)   2 
M d  37,5  0,5   37,5  0,5  37,6666 grados
 (9  7)  (9  5)   2  4 
 34 
 2  15 
M e  37,5  0,5   37,6111 grados
 24  15 
  

Ejemplo 24. El siguiente cuadro es similar al


presentado en el Ejemplo anterior
Intervalo Xi fi Fj fi X i
s
[36; 36,5> 36,2 3 3 108,75

2
5
[36,5; 37> 36,7 5 8 183,75
5
[37; 37,5> 37,2 7 15 260,75
5
[37,5; 38> 37,7 9 24 339,75
5
[38; 38,5> 38,2 7 31 267,75
5
[38,5; 39> 38,7 5 36 193,75
5
[39; 39,5] 39,2 3 39 117,75
5
Total n=3 1472,2
9 5

1472
X   37,75 grados
 39
ww
 (9  7)   2 
M d  37,5  0,5   37,5  0,5  37,75 grados
  (9  7)  (9  7)   2  2 
n   39 
2  F   2  15 
* j 1
 4,5 
M e x j 1  c    37,5  0,5   37,5  0,5 
 F j  F j 1   24  15   9 
   
 M e  37,75 grados

Observe que las tres medidas de tendencia central


coinciden; esto ocurre pues la distribución es simétrica.

Ejercicio 4 Calcular las tres medidas de tendencia


central del siguiente cuadro de distribución de

2
frecuencias correspondiente a la temperatura corporal en
grados centígrados de un grupo de pacientes: ¿Por qué
no coinciden?

Intervalo Xi fi Fj fi X i
s
[36; 36,5> 36,2 3
5
[36,5; 37> 36,7 8
5
[37; 37,5> 37,2 7
5
[37,5; 38> 37,7 9
5
[38; 38,5> 38,2 7
5
[38,5; 39> 38,7 4
5
[39; 39,5] 39,2 3
5
Total n=4
1

6) CUARTILES CASO CONTINUO (Q1; Q2=Me; Q3)


Los cuartiles son tres Q1; Q2=Me; Q3 y dividen a la masa
ordenados de menor a mayor y extienden el concepto de
mediana. La mediana Q2=Me divide la masa de datos
ordenados de menor a mayor en dos grupos, de forma tal
que a la derecha de la mediana deja el 50% de los datos y
su izquierda el 50%.

2
Los cuartiles (Q1; Q2=Me; Q3) dividen a la masa de datos
en cuatro grupos de los datos ordenados de menor a
mayor; de forma tal que:

X(1) Q1 Q2 Q3 X(n)

Q1: Deja 25% de los datos ordenados a su izquierda y


75% a su derecha.

Q2=Me: Deja 50% de los datos ordenados a su izquierda y


50% a su derecha

Q3: Deja 75% de los datos ordenados a su izquierda y


25% a su derecha

El cálculo de los cuartiles es muy parecido que el de la


mediana; incluso el segundo cuartil ya se sabe la forma
de calcularlo.
Las fórmulas para el cálculo de los tres cuartiles son:

n
 Fl 1
*
Q1  xl 1  c[ 4 ]
Fl  Fl 1

 2n 
  F j 1 
Q2  M e x*j 1  c  4 
 F j  F j 1 
 
ww

2
3n
 Fk 1
*
Q3  xk 1  c[ 4 ]
Fk  Fk 1

Ejemplo 25. Calcular los tres cuartiles del siguiente


cuadro de distribución de frecuencias correspondiente a
la temperatura corporal en grados centígrados de un
grupo de pacientes.

Intervalo X i fi Fj fi X i
s
[36; 36,5> 36,2 3 3
5
[36,5; 37> 36,7 8 11 Q1
5
[37; 37,5> 37,2 7 18
5
[37,5; 38> 37,7 9 27 Q2
5
[38; 38,5> 38,2 7 34 Q3
5
[38,5; 39> 38,7 4 38
5
[39; 39,5] 39,2 3 41
5
Total n=4
1

Para el cálculo del primer cuartil se hacen los siguientes


pasos
n n 41
  10,25
i) Se calcula 4 ; en nuestro caso 4 4

2
ii) Se halla la menor Frecuencia Absoluta Acumulada
n
que supera o es igual a 4 :
En nuestro caso Fi=11 y Fi-1=3
El intervalo que contiene es [36,5;37>
Aplico la fórmula:
ww
n
 Fl 1
*
4 10,25  3
Q1  xl 1  c[ ]  36,5  0,5[ ]  36,9531 grados
Fl  Fl 1 11  3

Para el cálculo del segundo cuartil no es necesario


explicación, pues ya se hizo:

n 
  F j 1 
Q2  M e x j 1  c  2
*


 F j  F j 1 
 
20,5  18
Q2  M e  37,5  0,5[ ]  37,6388 grados
27  18

Para el cálculo del tercer cuartil se hacen los siguientes


pasos
3n 3n 3(41)
  30,75
iii) Se calcula 4 ; en nuestro caso 4 4
iv) Se halla la menor Frecuencia Absoluta Acumulada
3n
 30,75
que supera o es igual a 4 :
En nuestro caso Fk=34 y Fk-1=27
El intervalo que contiene es [38;38,5>
Aplico la fórmula:

2
3n
 Fk 1
*
4 30,75  27
Q3  xk 1  c[ ]  38  0,5[ ]  38,2678 grados
Fk  Fk 1 34  27

Ejemplo 26. Calcular los tres cuartiles del siguiente


cuadro de distribución de frecuencias correspondiente a
la temperatura corporal en grados centígrados de un
grupo de pacientes.
Intervalos Xi fi Fi fi X i
[36; 36,5> 36,2 3 3
5
[36,5; 37> 36,7 8 11 Q1
5
[37; 37,5> 37,2 7 18
5
[37,5; 38> 37,7 9 27 Q2
5
[38; 38,5> 38,2 7 34 Q3
5
[38,5; 38,7 4 38
39> 5
[39; 39,5] 39,2 3 41
5
[39,5;40] 39,7 2 43
5
Total n=4
3

Hallar los tres cuartiles e interpretar


Solución:

2
n
 Fl 1
4 10,75  3
Q1  xl 1  c[
*
]  36,5  0,5[ ]  36,98 grados
Fl  Fl 1 11  3

n 
  F j  1 
Q2  M e x *j 1  c  2 
 F j
 F j 1 
 
21,5  18
Q2  M e  37,5  0,5[ ]  37,6944 grados
27  18

3n
 Fk 1
4 32,25  27
Q3  xk 1  c[
*
]  38  0,5[ ]  38,375 grados
Fk  Fk 1 34  27

Ejercicio 5 En un gran colegio donde existen


alumnos de kínder, de primaria y secundaria se tomó una
muestra y la variable de interés es la estatura en
centímetros, resultando el siguiente cuadro de
distribución de frecuencias.
Intervalos Xi fi hi Fi Hi fi X i 2
fi X i
[80;90> 85 3 0,0681 3 0.0681 255
[90;100> 95 6 0,1363 9 0,2044 570
[100;110> 105 8 0,1818 17 0,3962 840
[110;120> 115 1 0,0227 18 0,4089 115
[120;130> 125 6 0,1363 24 0,5452 750
[130;140> 135 4 0,0909 28 0,6361 540
[140;150> 145 7 0,1590 35 0,7951 1015
[150;160] 155 9 0,2045 44 0,9996 1395
Totales n=44 0,9996

2
a) Completar el cuadro de distribución de frecuencias.
b) Obtener e interpretar X ; M d ; M e
2
c) Calcular S ; S .
d) ¿Varianza grande o pequeña?
e) Hallar los tres cuartiles Q1; Q2 y Q3
f) Si los tres cuartiles obtenidos en e) dividen a la
masa de datos ordenados de menor a mayor en cuatro
partes; los deciles son nueve: di i=1,2,3,….,9 y dividen a
la masa de datos ordenados en 10 partes.
Calcular el decil 3, es decir d3 e interpretar.

7) RELACIÓN ENTRE LA MEDIA MUESTRAL ( X ) ; LA


MODA ( M d) Y LA MEDIANA ( M e )

Existe una relación entre las tres medidas de tendencia


central estudiadas para distribuciones unimodales y son
las siguientes:

a) Para distribuciones simétricas como el de la Figura


1; en este caso se cumple:

2
X  M d M e
b) En distribuciones asimétricas, con asimetría
positiva (sesgo a la derecha) se verifica:
Md  Me  X

c) Para distribuciones asimétricas, con asimetría


negativa (asimetría negativa); se cumple:
X  Me  Md

Ejercicio 6 Sea la siguiente distribución de una


variable discreta:
Xi 0 1 2 3 4 5 6
fi 1 2 17 8 5 1 1
a) Haga un gráfico ¿es asimétrica? ¿qué tipo de
asimetría tiene?
b) Halla las tres medidas de tendencia central.

Ejercicios 1

2
1)
Las notas (escala de 0-10) de inglés de una clase de
40 estudiantes han sido las siguientes:

1 7 9 2 5 4 4 3 7 8
4 5 6 7 6 4 3 1 5 9
2 6 4 6 5 2 2 8 3 6
4 5 2 4 3 5 6 5 2 4

a) Calcular la nota promedio; sin hacer tabulación


de datos (no hacer intervalos de clase)
Solución.-
n

X i
184
n  40; X  i 1
  4,6 puntos
n 40
b) Si las cinco primeras columnas de la data
anterior corresponden a las notas obtenidas por los
hombres y las cinco últimas columnas a las
mujeres; hallar las notas de ambos grupos por
separado.
Hombres Mujeres
1 7 9 2 5 4 4 3 7 8
4 5 6 7 6 4 3 1 5 9
2 6 4 6 5 2 2 8 3 6
4 5 2 4 3 5 6 5 2 4
Solución.-
20 20

 X Hi 93
X Mi
91
XH  i 1
  4,65 puntos X M  i 1
  4,55 puntos
nH 20 ; nM 20
c) Usando la propiedad de la media aritmética
conocida como la “media global”; obtener el
resultado de la parte a)
Solución.-
n A X H  n M X M 20(4,65)  20(4,55) 184
XG     4,6 puntos.
nH  nM 20  20 40
d) Hallar el recorrido de la variable asociada y
usar la fórmula de Sturges para hallar el número de

2
intervalos de clase; la amplitud de cada intervalo y
los límites de dichos intervalos.
Solución.-
R  X max  X min  9  1  8 puntos
k  1  3,3 log(n)  1  3,3 log(40)  6,2864 ; se tomará k 6
intervalos de clase.
R 8
c   1,3
k 6 ; es suficiente tomar un decimal más
precisión; pues los datos tienen 0 decimales. Por lo
tanto los k=6 intervalos de clase son:
[1,0-2,3>; [2,3-3,6>; [3,6-4,9>;[4,9-6,2>; [6,2-7,5>;
[7,5-8,8>: el último intervalo se extiende hasta llegar
al X max  9 puntos.
Por lo tanto este intervalo es [7,5-9]

e) Realizar el conteo para obtener las frecuencias


absolutas e interpretar f3
Solución.-
I .C. fi
[1,0  2,3  8
[2,3  3,6  4
[3,6  4,9  8
[4,9  6,2  13
[6,2  7,5  3
[7,5  9] 4
n  40

f3  8 :
existen 8 alumnos que han obtenido notas
entre 3,6 y 4,9 puntos.

f) Con los resultados obtenidos en la parte e)


calcular la media aritmética y compararlos con la
parte a)
Solución.-

2
I .C. fi Xi fi X i
[1,0  2,3  8 1,65 13,2
[2,3  3,6  4 2,95 11,8
[3,6  4,9  8 4,25 34,0
[4,9  6,2  13 5,55 72,15
[6,2  7,5  3 6,85 20,55
[7,5  9] 4 8,25 33,0
n  40 184,7

184,7 n
X e) 
40
 4,6175 puntos X i
185
n  40; X a)  i 1
  4,6 puntos
; n 40
Observe que existe una pequeña diferencia; esto
ocurre porqué se hacen intervalos de clase se
pierden los datos originales; pues todos los datos
en un intervalo de clase pasan a ser reemplazados
por su marca de clase.

g) Completar el cuadro de distribución de


frecuencias; también obtenga la suma y suma de
cuadrados de datos.
Solución.-

I .C. fi Xi fi X i hi Fi Hi f i X i2
[1,0  2,3  8 1,65 13,2 0,2 8 0,2 21,78
[2,3  3,6  4 2,95 11,8 0,1 12 0,3 34,81
[3,6  4,9  8 4,25 34,0 0,2 20 0,6 144,5
[4,9  6,2  13 5,55 72,15 0,325 33 0,925 400,4325
[6,2  7,5  3 6,85 20,55 0,075 36 0,925 140,7675
[7,5  9] 4 8,25 33,0 0,1 40 1 272,25
n  40 184,7 1 1014,54

h) Obtenga la moda de los datos originales.


Solución.-

2
La data original tiene n=40; hay que ordenar de
menor a mayor:

X: puntaje escala de 0-10


Frecue Porcen
ncia taje
1,00 2 5,0
2,00 6 15,0
3,00 4 10,0
4,00 8 20,0
5,00 7 17,5
Válid
6,00 6 15,0
os
7,00 3 7,5
8,00 2 5,0
9,00 2 5,0
Tota
40 100,0
l

Md  4 puntos :
es la nota con mayor incidencia o es la
nota que se presenta más frecuencia.

i) Hallar la moda para los datos para los datos


tabulados en intervalos.
Solución.-

I .C. fi Xi fi X i hi Fi Hi f i X i2
[1,0  2,3  8 1,65 13,2 0,2 8 0,2 21,78
[2,3  3,6  4 2,95 11,8 0,1 12 0,3 34,81
[3,6  4,9  8 4,25 34,0 0,2 20 M e 0,6 144,5
[4,9  6,2  13M d 5,55 72,15 0,325 33 0,925 400,4325
[6,2  7,5  3 6,85 20,55 0,075 36 0,925 140,7675
[7,5  9] 4 8,25 33,0 0,1 40 1 272,25
n  40 184,7 1 1014,54

2
 (13  8)  5
M d  4,9  1,3   4,9  1,3   5,3333 puntos
 (13  8)  (13  3)  15 
j) Hallar la mediana para los datos sin tabular
Solución.-
X X
n
( )
n
( ) 1 X ( 20 )  X ( 21) 45
n  40; par ; M e  2 2
   4,5 puntos.
2 2 2

k) Hallar la mediana para casos tabulados en


intervalos de clase.
Solución.-
 40 
 2  12 
M e  3,6  1,3   3,6  1,3(1)  4,9 puntos.
 20  12 
 
l) La escala de medición para la calificación es de
cero a diez; se desea modificar la escala de
calificación a la escala vigesimal. Hallar la nueva
media; la moda y la nueva mediana.
Solución.-
Sea la variable X que denota la nota en la escala de
cero a diez; por lo tanto Y  2 X son las notas en la
escala vigesimal.
Por lo tanto si se considera estas medidas de
tendencia central obtenidas cuando se han hecho
intervalos de clase en la escala de calificación de
cero a diez; se tiene:

184,7
X e)   4,6175 puntos
40 ;
 (13  8)  5
M d  4,9  1,3   4,9  1,3   5,3333 puntos
 (13  8)  (13  3)  15 
 40 
 2  12 
M e  3,6  1,3   3,6  1,3(1)  4,9 puntos.
 20  12 
 
Por lo tanto en la escala de calificación vigesimal se

2
tiene:
M [Y ]  M [2 X ]  2 M [ X ]  2(4,6175)  9,235 puntos.
M d [Y ]  M d [2 X ]  2 M d [ X ]  2(5,3333)  10,6666 puntos.
M e [Y ]  M e [2 X ]  2 M e [ X ]  2(4,9)  9,8 puntos.

m) Hallar tres medidas de dispersión con los datos


tabulados.
Solución.-

I .C. fi Xi fi X i hi Fi Hi f i X i2
[1,0  2,3  8 1,65 13,2 0,2 8 0,2 21,78
[2,3  3,6  4 2,95 11,8 0,1 12 0,3 34,81
[3,6  4,9  8 4,25 34,0 0,2 20 M e 0,6 144,5
[4,9  6,2  13M d 5,55 72,15 0,325 33 0,925 400,4325
[6,2  7,5  3 6,85 20,55 0,075 36 0,925 140,7675
[7,5  9] 4 8,25 33,0 0,1 40 1 272,25
n  40 184,7 1 1014,54

(184,7) 2
1014,54 
S 40  2,0361 puntos.
 39
 S 2  (2,0361) 2  4,1457 puntos 2
 R  9  1  8 puntos.

2)
En una clase de Educación Física se medido en
centímetros la altura de los 25 alumnos. Sus
medidas, y sus correspondientes pesos en kilos
(entre paréntesis)
167(62) 159(55) 164(62) 170(68) 164(61)
151(57) 168(65) 174(71) 158(56) 163(63)
160(58) 175(73) 150(49) 172(71) 169(67)
159(58) 158(55) 153(55) 157(58) 156(52)
173(65) 165(66) 164(65) 158(57) 163(61)

2
a) Elabora una tabla que represente estos
resultados de las estaturas con sus frecuencias
absolutas, relativas y porcentajes. Toma intervalos
de amplitud 5 cm comenzando por 150.
Solución.-

I .C. Xi fi hi Fi Hi fi X i f i X i2
[150 155  152,5 3 457,5 69768,75
[155 160  157,5 7 1102,5 173643,75
[160 165  162,5 6 975,0 158437,5
[165 170  167,5 4 670,0 112225,0
[170  175] 172,5 5 862,5 148781,25
n  25 4067,5 662856,25

b) Hallar la talla promedio en centímetros y


también la desviación estándar.
Solución.-
4067,5
X   162,7 centímetros.
25
(4067,5) 2
662856,25 
S 25  6,6895 centímetros.
24
c) Hacer un histograma de frecuencias absolutas.
Solución.-

2
d) Hallar la estatura promedio y la desviación
estándar expresada en pulgadas
Solución.-
Se conoce 1 pulgada------2,54 centímetros
y-------------- 100
centímetros
y=100/2,54 = 39,37 pulgadas.
Luego sean
W : medición en pu lg adas; X : medición en centímetros
1
W  X
2,54 ; por lo tanto:
1 1 1
M [W ]  M [ X] M[X ]  [162,7]  64,0551 pu lg adas.
2,54 2,54 2,54
2 2
1  1   1 
Var[W ]  Var[ X]   Var[ X ]    (6,6895)
2

2,54  2,54   2,54 


 1  1
SW  Var[W ]   (6,6895) 2   (6,6895)  2,6336 pu lg adas.
 2,54  2,54

e) El Índice de Masa Corporal se define mediante


la fórmula:

2
PESO ( KILOS ) 85
IMC    30,47
( ESTATURA) ( METROS ) (1,67) 2
2

Hallar el IMC para los datos usados en la parte a)`


IMC en rojo: (POR COMODIDAD SÓLO SE DA UN
DECIMAL)

167(62) 159(55) 164(62) 170(68) 164(61)


22,2 21,7 23,0 23,5 22,6
151(57) 168(65) 174(71) 158(56) 163(63)
24.9 23,0 23,4 22,4 23,7
160(58) 175(73) 150(49) 172(71) 169(67)
22,6 23,8 21,7 23,9 23,4
159(58) 158(55) 153(55) 157(58) 156(52)
22,9 22,0 23,4 23,5 21,3
173(65) 165(66) 164(65) 158(57) 163(61)
21,7 24,2 24,1 22,8 23,2

¿Qué porcentaje de los participantes están con un


peso normal? Sin hacer intervalos de clase;
obtenga las características más resaltante de la
data.

2
Solución.-

x
n
Válido 25
s

22,996
Media
0
23,000
Mediana
0
Moda 21,70a
Desviación 0,9025
standar 3
Varianza
,815
muestral
Rango 3,60
Mínimo 21,30
Máximo 24,90
Suma 574,90
Q 1 22,300
25
0
Percent Q 2 23,000
50
iles 0
Q 3 23,600
75
0
a. Existen varias
modas. Se mostrará
el menor de los
valores.

2
21,3
1 4,0 1 4,0
0
21,7
3 12,0 4 16,0
0
22,0
1 4,0 5 20,0
0
22,2
1 4,0 6 24,0
0
22,4
1 4,0 7 28,0
0
22,6
2 8,0 9 36,0
0
22,8
1 4,0 10 40,0
0
22,9
1 4,0 11 44,0
0
23,0
2 8,0 13 52,0
0
23,2
1 4,0 14 56,0
0
23,4
3 12,0 17 68,0
0
23,5
2 8,0 19 76,0
0
23,7
1 4,0 20 80,0
0
23,8
1 4,0 21 84,0
0
23,9
1 4,0 22 88,0
0
24,1
1 4,0 23 92,0
0
24,2
1 4,0 24 96,0
0

2
24,9
1 4,0 n=25 100,0
0
Tota
25 100,0
l

Según la tabla que usan los médicos y dietistas; se


tiene:
<20 [20-25> [25-30> [30-35>
(peso bajo) (normal) (sobrepeso) (obesidad
1)

En nuestro caso: Xmin=21,3; Xmax=24,9 todos están


con un peso normal.

f) Redondear el IMC de data dada e) al entero más


próximo y rehacer lo pedido en e)
Solución.-

167(62) 22 159(55) 164(62 170(68 164(61


22 ) ) )
23 24 23
151(57) 168(65) 174(71 158(56 163(63

2
25 23 ) ) )
23 22 24
160(58) 175(73) 150(49 172(71 169(67
23 24 ) ) )
22 24 23
159(58) 158(55) 153(55 157(58 156(52
23 22 ) ) )
23 24 21
173(65) 165(66) 164(65 158(57 163(61
22 24 ) ) )
24 23 23
Estadísticos
x
n
25
Válidos

Media 22,9600
Mediana 23,0000
Moda 23,00
Desv. típ. 1,01980
Varianza 1,040
Rango 4,00
Mínimo 21,00
Máximo 25,00
Suma 574,00
25  Q1 22,0000
Percentile  Q
50 2 23,0000
s
75  Q3 24,0000

x
fi 100hi Fi 100 H i
21,0
2 8,0 2 8,0
0

2
22,0
6 24,0 8 32,0
0
23,0
9 36,0 17 68,0
0
24,0
7 28,0 24 96,0
0
25,0
1 4,0 n=25 100,0
0
Tota
n=25 100,0
l

3) En un examen de matemáticas los 30 alumnos


de una clase han obtenido las puntuaciones
recogidas en la siguiente tabla:

IC Xi fi hi Fi Hi fi X i f i X i2
[0 1  0,5 2 1
[1  2  1,5 2 3
[2  3  2,5 3 7,5
[3  4  3,5 6 21
[4  5  4,5 7 31,5
[5  6  5,5 6 33
[6  7  6,5 1 6,5
[7  8  7,5 1 7,5
[8  9  8,5 1 8,5

2
[9  10] 9,5 1 9,5
n  30 129

a) Calcular la media aritmética.


Solución.-
129
X   4,3 puntos
30
b) Aparte de las medidas de dispersión
presentadas como la desviación estándar; la
varianza y el recorrido; existen otras medidas de
dispersión como la Desviación Media (DM) y el
Recorrido Intercuartílico (RI); dadas por:
n k

 Xi  X f i Xi  X
DM  i 1
(datos sin tabular ); DM  i 1
(datos tabulados )
n n
En nuestro caso de datos tabulados:
k

f
i 1
i Xi  X
2 0,5  4,3  2 1,5  4,3  3 2,5  4,3  6 3,5  4,3  7 4,5  4,3
DM  
n 30
 6 5,5  4,3  1 6,5  4,3  1 7,5  4,3  1 8,5  4,3  1 9,5  4,3
30
2  3,8  2  2,8  3  1,8  6  0,8  7 0,2  6 1,2  1 2,2  1 3,2  1 4,2  1 5,2

30
2(3,8)  2(2,8)  3(1,8)  6(0,8)  7(0,2)  6(1,2)  2,2  3,2  4,2  5,2

30
45,8
DM   1,5266 puntos.
30

Halla la varianza y la desviación típica.

Solución:

Varianza = 4,23 Desviación típica = 2,06.

2
Pregunta 4

En una clase de 25 alumnos hemos preguntado la


edad de cada uno, obteniendo estos resultados:

14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14, 15, 16, 14,
15, 13, 14, 15, 13, 14, 14, 14, 15, 14

Haz una tabla donde aparezcan las frecuencias


absolutas acumuladas y las frecuencias relativas
acumuladas.

Solución:

Edad F. absoluta F. absoluta acumulada F. relativa F. relativa acumulada


13 4 4 0,16 0,16
14 13 17 0,52 0,68
15 7 24 0,28 0,96
16 1 25 0,04 1

Pregunta 5

Calcula la varianza y la desviación típica de los


siguientes datos:

4, 7, 5, 3, 6.

Solución:

Varianza = 2

Desviación típica = 1,41.

Pregunta 6

2
Halla el número medio de hijos por mujer en 1998
en España a partir de los datos de las comunidades
autónomas:

Andalucía 1,28
Aragón 1,05
Asturas (Principado de) 0,8
Baleares (Islas) 1,44
Canarias 1,24
Cantabria 0,94
Castilla y León 0,91
Castilla-La Mancha 1,24
Cataluña 1,21
Comunidad Valenciana 1,17
Extremadura 1,2
Galicia 0,9
Madrid (Comunidad de) 1,19
Murcia (Región de) 1,41
Navarra (C. Foral de) 1,7
País Vasco 0,97
Rioja (La) 1,12
Ceuta y Melilla 1,87
(Fuente: INE)

Solución:
Nº medio de hijos por mujer = 1,20.
Pregunta 7

Calcula el percentil P65 de los siguientes datos:

x i fi

2 12
4 10
6 8
8 7
10 5
12 8
14 10

Solución:

P65 = 10.

Pregunta 8

2
Calcula la media de viajeros en establecimientos
hoteleros durante 1999. Después calcula la
desviación típica para ver si esa media es
representativa de todos los meses del año.

Mes Viajeros
Enero 2.775.738
Febrero 3.205.892
Marzo 4.143.343
Abril 4.931.385
Mayo 5.724.555
Junio 5.834.331
Julio 6.415.298
Agosto 6.986.211
Septiembre 6.349.504
Octubre 5.447.890
Noviembre 3.570.715
Diciembre 3.204.082
(Fuente: INE)

Solución:

Media = 4.882.412 viajeros.

Desviación típica = 1.390.381 viajeros.

La desviación típica es alta, por lo que podemos


deducir que hay algunos meses que difieren mucho
de la media.

Pregunta 9

Representa mediante diagrama de barras las


ganancias medias de los trabajadores, según el
sexo, en el cuarto trimestre de 1999, que se recogen
en la siguiente tabla:

2
Sueldo en ptas.
Sector Varones Mujeres
Industria 284.363 206.204
Construcción 214.446 205.372
Servicios 263.554 195.447
(Fuente: INE)

Solución:

Sueldo medio en ptas.

300,000
250,000
200,000 Varones
Mujeres
150,000
100,000
50,000
0
Industria

Construcción

Servicios

Pregunta 10

Haz un diagrama de sectores que represente la


procedencia de los extranjeros residentes en
España, en diciembre de 1999, recogidos en la
siguiente tabla:

Procedencia
Europa 353.556
América 166.709
Asia 66.340
África 213.012
Oceanía 1.013
Desconocida 699
(Fuente: INE)

2
Solución:

Procedencia de extranjeros en España

Des
con
Oce ocid
anía a
Áfri
ca
Eur
opa
Asia

Am
éric
a

Pregunta 11

Calcula la media de la población en las


Comunidades Autónomas que nos indica la
siguiente tabla:

2
CCAA Habitantes
Andalucía 7.236.459
Aragón 1.183.234
Asturias 1.081.834
Baleares (Islas) 796.483
Canarias 1.630.015
Cantabria 527.137
Castilla y León 2.484.603
Castilla-La Mancha 1.716.152
Cataluña 6.147.610
Ceuta 72.117
Comunidad Valenciana 4.023.441
Extremadura 1.069.419
Galicia 2.724.544
Madrid 5.091.336
Melilla 60.108
Murcia 1.115.068
Navarra 530.819
País Vasco 2.098.628
Rioja (La) 263.644
TOTAL ESPAÑA 39.852.651

Solución:

2.490.791 habitantes.

Pregunta 12

Se ha hecho una encuesta sobre el número de hijos


en 50 familias, con los siguientes resultados:

0 2 1 2 5 2 1 1 1 4 0 0 2
0 4 4 1 1 2 2 3 1 2 3 0
3 1 3 2 2 3 3 1 5 4 3 3
1 2 2 2 3 2 2 1 0 2 2 1
1

Haz una tabla donde se recojan estos datos con sus


frecuencias absolutas acumuladas y relativas
acumuladas.

Solución:

2
Nº hijos F. absoluta F. absoluta acumulada F. relativa F. relativa acumulada
0 6 6 0,12 0,12
1 13 19 0,26 0,38
2 16 35 0,32 0,7
3 9 44 0,18 0,88
4 4 48 0,08 0,96
5 2 50 0,04 1

Pregunta 13

Las edades de los jugadores de un equipo de


baloncesto son: 27, 18, 28, 26, 25, 19, 31, 19, 24 y 26
años. ¿Cuál es la edad media?

Solución:

24'3 (redondeando, 24 años).

Pregunta 14

Lanzamos un dado 25 veces y obtenemos los


siguientes resultados:

5, 3, 2, 6, 5, 1, 2, 3, 2, 1, 5, 1, 5, 2, 4, 5, 6, 1, 2, 4, 4, 2,
2, 4, 3.

Calcula el percentil P30.

Solución:

P30 = 2.

Pregunta 15

Representa mediante un diagrama de barras las

2
ciudades más pobladas (en 1995):

Ciudad Habitantes (en millones)


Tokio (Japón) 26,8
Sao Paulo (Brasil) 16,4
Nueva York (EE.UU.) 16,3
C. De México (México) 15,6
Bombay (India) 15,1
Shangai (China) 15,1
Los Ángeles (EE.UU.) 12,4
Pekín (China) 12,4
Calcuta (India) 11,7
Seúl (Corea del Sur) 11,6
(Fuente: Naciones Unidas)

Solución:

30
25
20
15
10
5
0
Tokio (Japón)

Sao Paulo (Brasil)

Nueva York (EEUU)

C. de México (México)

Bombay (India)

Shangai (China)

Los Ángeles (EEUU)

Pekín (China)

Calcuta (India)

Seúl (Corea del Sur)

Pregunta 16

En una clase de un IES hemos medido la altura de


los 25 alumnos. Sus medidas, en cm, se reflejan en
la siguiente tabla agrupados en intervalos:

2
Alturas Nº alumnos (fi)
[150,155) 3
[155,160) 7
[160,165) 6
[165,170) 4
[170,175) 5

Calcula la varianza y la desviación típica.

Solución:

Varianza = 42,96

Desviación típica = 6,55.

Pregunta 17

Calcula el sueldo medio en España de varones y


mujeres en la industria y los servicios, según los
datos de 1999 ofrecidos por el INE:

Sueldo medio
CC.AA.
Varones Mujeres
Andalucía 248.389 158.901
Aragón 282.054 156.485
Asturias (Principado de) 275.406 177.203
Baleares (Islas) 253.681 176.835
Canarias 217.843 167.953
Cantabria 270.570 163.153
Castilla y León 260.336 171.002
Castilla-La Mancha 226.887 146.525
Cataluña 281.496 195.771
Comunidad Valenciana 244.350 159.117
Extremadura 220.644 133.952
Galicia 229.395 163.609
Madrid (Comunidad de) 308.122 235.456
Murcia (Región de) 218.924 144.544
Navarra (C. Foral de) 289.006 195.560
País Vasco 322.222 232.367
Rioja (La) 255.193 166.257

Solución:

2
Sueldo medio de varones = 259.089.

Sueldo medio de mujeres = 173.217.

Pregunta 18

Las calificaciones de 180 alumnos se recogen en la


siguiente tabla:

Calificación Alumnos
0 1
1 5
2 15
3 20
4 30
5 35
6 22
7 14
8 16
9 14
10 8

Calcula P90.

Solución:

P90 = 9.

Pregunta 19

La siguiente tabla muestra el uso del suelo español,

2
calcula los porcentajes que hay de cada tipo.

Uso del suelo español Superficie (Ha.)


Cultivos herbáceos 11.123.000
Cultivos leñosos 5.060.000
Barbechos 4.048.000
Prados y pastizales 2.530.000
Forestal desarbolado 12.650.000
Forestal arbolado ralo 4.048.000
Forestal arbolado normal 8.602.000
Otros usos 2.530.000
(Fuente: INE)

Solución:

Uso del suelo español Superficie (Ha.) Porcentaje


Cultivos herbáceos 11.123.000 22%
Cultivos leñosos 5.060.000 10%
Barbechos 4.048.000 8%
Prados y pastizales 2.530.000 5%
Forestal desarbolado 12.650.000 25%
Forestal arbolado ralo 4.048.000 8%
Forestal arbolado normal 8.602.000 17%
Otros usos 2.530.000 5%

Pregunta 20

Se han pesado 40 piezas. Los resultados de las


pesadas, expresados en gramos, son:

64,1 66,4 64 66,7 65,3 64,4 63,9 63 65,4 64,3


68,8 66,6 65,1 64,2 68,5 65,7 65,8 63,1 64,6 63,5
65 66,4 67,3 65,7 64 61,5 64,1 65 63 63,2
66,9 66,3 67 66,1 66,8 65,3 64,4 64,5 63,1 65,5

Confecciona una tabla estadística para presentar


los resultados agrupando en intervalos los valores
observados y donde aparezcan también las
frecuencias absolutas acumuladas y las frecuencias
relativas acumuladas. Toma intervalos de amplitud
de 1 cm. comenzando por 61.

2
Solución:

Peso F. absoluta F. absoluta acumulada F. relativa F. relativa acumulada


[61, 62) 1 1 0,025 0,025
[62, 63) 0 1 0 0,025
[63, 64) 7 8 0,175 0,2
[64, 65) 10 18 0,25 0,45
[65, 66) 10 28 0,25 0,7
[66, 67) 8 36 0,2 0,9
[67, 68) 2 38 0,05 0,95
[68, 69) 2 40 0,05 1

Pregunta 21

Halla la media del número de establecimientos


hoteleros que hay en las distintas Comunidades
Autónomas de España. Después, con ayuda de la
desviación típica, comenta si esta media es
representativa de todas las comunidades
autónomas.

CC.AA. Nº establecimientos
hoteleros
Andalucía 2.266
Aragón 712
Asturas (Principado de) 620
Baleares (Islas) 1.483
Canarias 532
Cantabria 496
Castilla y León 1.452
Castilla-La Mancha 842
Cataluña 2.713
Comunidad Valenciana 1.019
Extremadura 418
Galicia 1.526
Madrid (Comunidad de) 1.242
Murcia (Región de) 209
Navarra (C. Foral de) 150
País Vasco 396
Rioja (La) 117
Ceuta y Melilla 36
(Fuente: INE)

2
Solución:

Media = 902 establecimientos hoteleros por


comunidad.

Desviación típica = 731,14.

Como la desviación típica es muy alta, esto me


indica que los datos reales se diferencian mucho de
la media, luego el dato de la media no es
representativo.

Pregunta 22

Calcula el porcentaje de participación en las


elecciones a Cortes Generales de marzo de 2000,
teniendo en cuenta los datos de la tabla siguiente:

Total electores con derecho a voto Votantes


Andalucía 5.916.783 4.068.793
Aragón 1.019.845 728.060
Asturias (Principado de) 981.504 657.553
Baleares (Islas) 652.009 400.559
Canarias 1.393.410 845.348
Cantabria 468.607 336.508
Castilla y León 2.186.659 1.586.950
Castilla-La Mancha 1.420.894 1.084.236
Cataluña 5.293.465 3.388.128
Comunidad Valenciana 3.366.210 2.447.384
Extremadura 878.292 662.393
Galicia 2.547.784 1.656.662
Madrid (Comunidad de) 4.317.146 3.111.662
Murcia (Región de) 917.217 674.516
Navarra (C. Foral de) 463.892 306.494
País Vasco 1.810.666 1.155.999
Rioja (La) 230.427 170.997
Ceuta 55.848 30.801
Melilla 48.985 26.450
ESPAÑA 33.969.640 23.339.490
(Fuente: INE)

Solución:

2
Total electores con derecho a voto Votantes % Participación
Andalucía 5.916.783 4.068.793 68,77
Aragón 1.019.845 728.060 71,39
Asturias (Principado de) 981.504 657.553 66,99
Baleares (Islas) 652.009 400.559 61,43
Canarias 1.393.410 845.348 60,67
Cantabria 468.607 336.508 71,81
Castilla y León 2.186.659 1.586.950 72,57
Castilla-La Mancha 1.420.894 1.084.236 76,13
Cataluña 5.293.465 3.388.128 64,01
Comunidad Valenciana 3.366.210 2.447.384 72,7
Extremadura 878.292 662.393 75,42
Galicia 2.547.784 1.656.662 65,02
Madrid (Comunidad de) 4.317.146 3.111.662 72,08
Murcia (Región de) 917.217 674.516 73,54
Navarra (C. Foral de) 463.892 306.494 66,07
País Vasco 1.810.666 1.155.999 63,84
Rioja (La) 230.427 170.997 74,21
Ceuta 55.848 30.801 55,15
Melilla 48.985 26.450 54
ESPAÑA 33.969.640 23.339.490 68,71

Pregunta 23

Representa mediante un gráfico de sectores la


distribución de escaños en las elecciones a Cortes
Generales de 2000.

Partidos políticos Escaños


PP 183
PSOE 125
CIU 15
IU 8
EAJ-PNV 7
CC 4
Otros* 8

(* BNG, PA, ERC, IC-V, EA, CHA)

2
(Fuente: INE)

Solución:

Ejercicios 1 (Parte 2)

1) En una industria; dos operarios en siete días


de trabajo, son capaces de producir, por día, y en
forma individual una cantidad de adornos de pared.

Operario 105 106 104 102 103 100 101


A
Operario 103 102 107 101 105 102 103
B

Hallar:

a) Producción media de cada operario.


Solución.-
105  106  ...  101 721
XA    103 artículos por día
7 7

2
103  102  ...  103 723
XB    103,2857 artículos por dìa.
7 7

b) Moda del operario A.


Solución.-
M d1  100; M d2  101; ... M d7  106; (Multimodal)
c) Moda del operario B.
M d1  102; M d 2  103; (bimodal)
d) Juntando la producción de ambos obreros;
hallar tres medidas de tendencia central y
tres medidas de dispersión.
Solución.-
La media global es:
7(103)  7(103,2857) 1444,9999
XG    103,14285
77 14 artículos
por día.
Para el cálculo de la moda junto en total
7+7=14 datos:
105 106 104 102 103 100 101
103 102 107 101 105 102 103
Se puede hacer un cuadro de distribución de
frecuencias
Xi 100 101 102 103 104 105 106 107
fi 1 2 3 3 1 2 1 1
M d1  102 artículos por día

2
M d 2  103 artículos por día
Se piden tres medidas de dispersión:
S; S2; R=Xmax - Xmin
Considerando los n=14 datos
14

X
i 1
i  1(100)  2(101)  3(102)  3(103)  1(104)  2(105)  1(106)  1(107)

 1444
8

f X
i 1
i i
2
 1(100) 2  2(101) 2  3(102) 2  3(103) 2  1(104) 2  2(105) 2  1(106) 2  1(107) 2

 148992

(1444) 2
148992 
S 14  2,0326
 14  1 (artículos)
 S 2  (2,0326) 2  4,1314 (artículos)2

R  Re corrido muestral  X max  X min  107  100  7 artículos

2) Se hace una encuesta a 100 personas acerca


del número de horas diarias que se dedican a ver
televisión, obteniéndose la siguiente información:

Xi fi
0–1 30
2–3 20
4–5 15
6-7 32
8–9 1

2
10 – 11 2
n 100
Calcule la media, la mediana y la moda.

Solución.-

Intervalos Xi fi fi X i Fi

[0 – 1> 0,5 30 15 30
[2 – 3> 2,5 20 50 50Me
[4 – 5> 4,5 15 67,5 65
[6 – 7> 6,5 32 Md 208 97
[8 – 9> 8,5 1 8,5 98
[10 – 11] 10,5 2 21 100
n=100 370

370
X   3,7
 100 horas.
 (32  15)   17  17
M d  6  (1)    6   6   6,3541
  (32  15)  (32  1)  17  31 48 horas.
 n/2=100/2=50
 100 
 2  30 
M e  2  (1)  3
 50  30 
  horas.

2
3) De un total de 100 datos, 20 son 4, 40 son 5, 30
son 6 y el resto 7. Hallar la media; la moda y la
mediana.
Solución.-

4) Cuatro grupos de estudiantes, consistentes en


15, 20, 10 y 18 individuos, dieron pesos de 60, 72, 55
y 65 kilos. Hallar el peso medio de los estudiantes.
5) Las notas de un estudiante en sus exámenes
han sido 84, 78, 72, 68, 87 y 78. Hallar la media, la
mediana y la moda.
6) La siguiente tabla corresponde a la estatura de
80 estudiantes de una determinada carrera.

Xi fi
1,65 – 6
1,69
1,70 – 12
1,74
1,75 – 30
1,79
1,80 – 22
1,84
1,85 – 8

2
1,89
1,90 – 2
1,94
Total 80

a) Hallar la media, mediana y moda de la


estatura.
b) Si a cada edad en metros se le suma dos
centímetros. Hallar tres medidas de tendencia
central y tres medidas de dispersión. ¿Quién o
quienes cambian? ¿Por qué?

7) La oficina de Censo hizo un muestreo y


proporcionó las edades de hombres y mujeres
divorciados (en miles de personas de 15 años de
edad o más).

Edad Hombre Mujer


15 – 19 2 2
20 – 24 80 210
25 – 29 174 303
30 – 34 210 315
35 – 39 385 656

2
40 – 44 450 656
45 – 49 295 409
50 – 54 174 200
Total 1770 2751
ww

a) Obtener las medidas de tendencia central por


separado.
Solución.-

Edad Hombre
Intervalos (fi) f i Xi Fi
[15 – 19> 2 2(17)= 34 2
[20 – 24> 80 80(22)=1760 82
[25 – 29> 174 174(27)=4698 256
[30 – 34> 210 210(32)=6720 466
[35 – 39> 385 385(37)=14245 851
[40 – 44> 450 450(42)=18900 1301
Moda Mediana
[45 – 49> 295 295(47)= 1596
13865
[50 – 54] 174 174(52)= 9048 1770
Total 1770 69270
Solución.-

2
69270
X   39,1355 años
1770
 ( 450  385)   65 
M d  40  4    40  4   41,1818 años
 ( 450  385)  ( 450  295)   65  155 

 1770 
 2  851  34 
M e  40  4    45  4   45,3022 años
 1301  851   450 
 

Edad Xi Mujer fi fiXi Fi


15 – 19 17 2 34 2
20 – 24 22 210 4620 212
25 – 29 27 303 8181 515
30 – 34 32 315 10080 830
35 – 39 37 656 Md1 24272 1486
Me
40 – 44 42 656 Md2 27552 2142
45 – 49 47 409 19223 2551
50 – 54 52 200 10400 2751
Total 2751 104362

104362
X   37,9360 años
2751

 (656  315)   341


M d 1  35  4    35  4   39 años.
 (656  315)  (656  626)   341

 (656  656) 
M d 2  40  4    40 años.
 (656  656)  (656  409) 

2
n 2751
  1375,5
2 2

1375,5  830   545,5 


M e  35  4    35  4    38,3262 años.
 1486  830   656 

b) Obtener tres medidas de dispersión por


separado.
Solución.-

Edad Hombre
Intervalos (fi) fi Xi fi Xi 2
[15 – 19> 2 2(17)= 34 578

[20 – 24> 80 80(22)=1760 38720

[25 – 29> 174 174(27)=4698 126846

[30 – 34> 210 210(32)=6720 215000

[35 – 39> 385 385(37)=14245 527065

[40 – 44> 450 450(42)=18900 793800

[45 – 49> 295 295(47)= 651655


13865
[50 – 54] 174 174(52)= 9048 470496

2
Total 1770 69270 2824160

(69270) 2
2824160 
S 1770  8,1639 años
1770  1

S 2  (8,1639) 2  66,6492 (años ) 2

R  X max  X min  54  15  39 años

Edad Xi Mujer fi fiXi fiXi2


15 – 19 17 2 34 578
20 – 24 22 210 4620 101640
25 – 29 27 303 8181 220887
30 – 34 32 315 10080 322560
35 – 39 37 656 24272 898064
40 – 44 42 656 27552 1157184
45 – 49 47 409 19223 903481
50 – 54 52 200 10400 540800
Total 2751 104362 4145191

(104362) 2
4145191 
S 2751  8,2266 años
2750

S 2  (8,2266) 2  64,6769 (años ) 2

2
c) Si se juntan hombres y mujeres en una sola
muestra; hallar tres medidas de tendencia
central y tres medidas de dispersión. ¿Varianza
grande o pequeña? ww

Solución.-

Ed Hom Muj Tot fi X i f i X i2 Fi

ad bre er al
15 2 2 4 4(17)=68 4(172)=1156 4

19
20 80 210 290 290(22)=63 290(222)=140 29
– 80 360 4
24
25 174 303 477 477(27)=12 477(272)=347 77
– 879 733 1
29
30 210 315 525 525(32)168 525(322)=537 12
– 00 600 96
34
35 385 656 104 1041(37)=3 1041(372)=14 23
– 1 8517 25129 37

2
39 **
40 450 656 110 1106(42)=4 1106(422)=19 34
– 6* 6452 50984 43
44
45 295 409 704 704(47)=33 704(472)=155 41
– 088 5136 47
49
50 174 200 374 374(52)=19 374(522)=101 45
– 448 1296 21
54
Tot 1770 275 452 173632 6969394
al 1 1

173632
X   38,4056 años
4521
 (1106  1041)   65 
M d  44  4    44  4   44,5567 años
*  (1106  10)  (1106  704)   65  402 
n 4521
  2260,5
2 2
 2260,5  1296   964,5 
M e  35  4    35  4   38,7060 años
**  2337  1296   1041 
(173632) 2
6969394 
S 4521  8,1596 años
4520
S 2  (8,1596) 2  66,5791 (años ) 2 ; R  54  15  39 años

Ejercicios 2 Parte 2 (11/06/21)

2
1) (ok)Sea una muestra conformada por los
siguientes números impares: 3, 5, 7, 9, 11, , 2n  1 . Hallar
la varianza muestral asociada.
Solución.-
Los elementos de la muestra forman una serie
aritmética cuya razón es r=2 y la frecuencia
absoluta de cada uno de los elementos es fi  1 .

Xi fi X i2

3 1 32
5 1 52
7 1 72
9 1 92

2n  1 1 2n  12


2n  1 1 2n  12

Se pide calcular la varianza muestral:


Solución.-
Se conoce que es una progresión aritmética de
razón r =2 ; se tienen las siguientes fórmulas:
an=a1+(n-1)r; Sn=(n(a1+an)) / 2; n=[(an - a1) / r ] +1
Por lo tanto el número de términos en esta P.A. es:
n=[(2n+1)-3) / 2 ] +1 = n

2
n

n
( X i ) 2
X i
2
 i 1
n
Var  X   i 1
n 1
n
n(a1  an ) n(3  (2n  1))
X i  3  5  7  9  11   2n  1  2n  1    2n  n 2
i 1 2 2
2

 n( n  1) 
  n( n  1)(2n  1) 
n n n

X
i 1
i
2
  (3  (i  1)(2))   1  4i  4i 2  n  4 
i 1 i 1  2 

 4
 6 
n
4n  12n  11n
3 2


i 1
X i2 
3

Entonces:
n

n
( X i ) 2
4n 3  12n 2  11n (n 2  2n) 2 n 4  n 2
X i
2
 i 1
n

Var  X   i 1
 3 n  3n
n 1 n 1 n 1

n3  n
Var ( X ) 
3(n  1)

Verificaremos la valides de la fórmula para el caso


n=3 con los datos 3; 5; 7.
3 3

X
i 1
i  3  5  7  15
; X
i 1
i
2
 32  52  7 2  83
. Entonces
(15) 2
83 
Var ( X )  3  8 4
(3  1) 2

n3  n 33  3 24
S 2  Var ( X )    4
Según la fórmula 3(n  1) 3(3  1) 6

2) (0k)Los salarios de una empresa son, en


promedio 500 $ mensuales; luego se incorporan a

2
la empresa un grupo nuevo de obreros igual al 25%
de los que estaban anteriormente.
El nuevo grupo ingresa a la empresa con un salario
medio igual al 60% de los antiguos. Dos meses más
tarde la empresa concede a todos un aumento de
salario de 30 $. Determinar:
a) El promedio de salarios del total de los dos
grupos obreros.
b) Si el aumento hubiera sido del 20% de los
salarios, cuál habría sido la media de los salarios
así ajustados.
Solución:

a) Sea:
n1 : Número de obreros antiguos

X1 : Promedio de los salarios de los obreros


antiguos X 1  500  dólares mensuales.
n2 : Número de obreros incorporados n2  0,25 n1 

X2 : Promedio de los salarios de los obreros


incorporados X 2  0,6500  300 $ mensuales.
n: Número total de obreros actuales n  n1  n2  1,25 n1 

2
X: Promedio de los salarios de todos los obreros
actuales.

X  n1 X 1  n2 X 2  n  500 n1  3000,25 n1  1,25 n1

X  460 $ (promedio mensual de todos los obreros


de la empresa actual)

Promedio con aumento de salario de 30 $


Si Xi : salario actual de los obreros, Yi : nuevo salario
de los obreros considerando el aumento de 30 $
Yi  X i  30
La media: M Yi   M  X i  30  X  30  460  30  490 $

b) Promedio con un aumento de salario del 20%


La media de Yi  X i  0,2 X i  1,2 X i

M Yi   M 1,2 X i   1,2 X X  1,2460   552 $.

3) La siguiente tabla presenta la distribución de


sueldos de un grupo trabajadores de una
Universidad Nacional durante el mes de julio del
2020.
Por el incremento del costo de vida se plantean dos
alternativas de aumento de sueldo para el mes
siguiente (Agosto).

2
El cuadro de ingresos soles se muestran en el
siguiente cuadro:
Haberes Número de
En soles trabajadores
600, 1000 5
1000, 1500 10
1500, 2100 20
2100, 2500 8
2500, 2600 7
n=50
Observe que los intervalos de clase son de distinta
longitud; pero se trabaja de manera similar como si
fuesen de la misma longitud.
a) Hallar el sueldo promedio de este grupo de
trabajadores su media muestral y también su
varianza muestral.
Solución.-
Es necesario construir un cuadro de distribución de
frecuencias.
Sueldo Xi fi fi X i f i X i2

Mensual
600, 1000 800 5 4000 3200000
1000, 1500 1250 10 12500 15625000

2
1800 20 36000 64800000
2100, 2500 2300 8 18400 42320000
2500, 2600 2550 7 17850 45517500
Total n=50 88 750 171 462 500
88750
X  1775
50 soles.
(88750) 2
171462500 
S 2  Var ( X )  50  284311,2245
49 (soles)2.
d .e.  S  Var ( X )  533,2084 (soles)

Por el incremento del costo de vida se plantean dos


alternativas de aumento de sueldo para el mes
siguiente (Agosto).

b) La primera propuesta consiste en un aumento


general de 350 soles mensuales. Hallar el nuevo
sueldo promedio mensual.
Solución.-
Sea Yi  X i  350 el nuevo sueldo mensual.
Entonces Y  X  350  1775  350  2125 soles.

c) Hallar el sueldo promedio de los trabajadores


que ganen menos de 2100 soles.
Solución.-
Hay que usar los tres primeros intervalos de clase
del primer cuadro; resultando:

2
5(800)  10(1250)  20(1800) 52500
X1    1500
5  10  20 35 soles.

d) Hallar el sueldo promedio de los trabajadores


que ganan más de 2100 soles.
Solución.-
En este caso hay que considerar los dos últimos
intervalos de clase; resultando:
8(2300)  7(2550) 36250
X2    2416,6666
87 15 soles.
También se puede hallar el sueldo promedio de los
n=50 trabajadores usando la propiedad de la media
global:
35(1500)  15(2416,6666) 88749,999
X   1774,9999  1775
35  15 50 soles.
Interva fi Xi fi X i Interva fi Xi fi X i

los lo
600, 1000 5 800 4000 2100; 2500 8 2300 1840
0
1000, 1500 10 125 1250 2500, 2600 7 2550 1785
0 0 0
1500, 2100 20 180 3600
0 0
TOTA 35 5250 TOTA 15 3625
L 0 L 0

2
e) La segunda propuesta para subir los salarios
consiste en un aumento del 30% de los salarios
de Julio a los trabajadores que ganan menos de
2100 soles y del 5% a los trabajadores que
ganan más de 2100 soles y un aumento adicional
de 100 soles para todos los trabajadores para
gastos de movilidad.
Solución.-
 Sea: Yi1 : nuevo salario para los que ganan menos
de 210 mil intis
Y1i  X i  30% X i   100

Y1i  1,3 X i  100

Media: Y1  1,3 X 1  100

Y1  1,31500   100  2050 soles.

 Sea: Y2i : nuevo salario para los que ganan más


de 2100 soles,
Y2i  X i  5% X i   100

Y2i  1,05 X i  100

Media: Y2  1,05 X 2  100

Y2  1,052416,6666  100  2637,4999 soles

2
Promedio de los salarios de los trabajadores con
aumento de acuerdo a la segunda propuesta:

Y  n1 Y1  n2 Y2  n1  n2   35  2050  15  2637,4999  50  2226,2499

f) ¿Cuál de las propuestas convendría a los


trabajadores?
Solución.-
g) Para los trabajadores que ganan menos de 2100
soles, ¿qué propuesta convendría?
h) Si se acepta la segunda propuesta, ¿en la
distribución de salarios del mes de Agosto es
más homogénea que la distribución de salarios
del mes de Julio?
Solución: Completamos el cuadro de frecuencias.

El sueldo promedio global es:

 52500   36250 
35   15 
   88750
X  35   50    1775
35  15 50 soles.

Promedio de los salarios de la segunda propuesta:

 Sea: Yi1 : nuevo salario para los que ganan menos


de 210 mil intis
Y1i  X i  30% X i   100

2
Y1i  1,3 X i  100

Media: Y1  1,3 X 1  100

Y1  1,31500   100  2050 soles.

 Sea: Y2i : nuevo salario para los que ganan más


de 210 mil intis
Y2i  X i  5% X i   100

Y2i  1,05 X i  100

Media: Y2  1,05 X 2  100

Y2  1,052416,6666  100  2637,4999 soles

Promedio de los salarios de los trabajadores con


aumento de acuerdo a la segunda propuesta:

Y  n1 Y1  n2 Y2  n1  n2   35  2050  15  2637,4999  50  2226,2499


soles.

a) Primera propuesta
Sea: W: nuevo salario con aumento de 350 soles.
Wi  X i  350  W  X  350  1775  350  2125 soles,
Segunda propuesta: Y  2226,2499

Comparando los promedios convendría la segunda


propuesta por que la media de la segunda
propuesta es mayor a la primera propuesta.

2
b) Primera propuesta: Yi  X i  350 

Y1  X 1  35  1500  350  1850 soles.


Segunda propuesta: Y1  2050

Conviene la segunda propuesta puesto que su


media es mayor.
c) La distribución del mes de Julio está dado por el
cuadro siguiente:

Xi ni X i ni X i 
2
 X ni

80 5 400 47531.25
125 10 1250 27562.00
180 20 3600 125.00 Promedio:
X  8875 50  177.5
230 8 1840 22050.00
255 7 1785 42043.75 Desviación:
S X2  139312 50
50 8875 139312.00
S X  52.78

Para la distribución del mes de Agosto tenemos


que:
Yi  1.3 X i  10 , i  1, 2, 3

Yi  1.05 X i  10 , i  3, 4

La distribución para la segunda propuesta está


dada por:

2
Yi ni X i ni Y  Y  n
i
2
i

114.00 5 570 58996.95


172.50 10 1725 25125.52
244.00 20 4880 9137.81
251.50 8 2012 6670.12
277.75 7 1944.25 21271.36
50 11131.25 121201.77

Promedio: Y  1131.25 50

Y  222.625

S Y2  121201.77 50  2424.0354

S Y  49.23

Para determinar que distribución es más


homogénea se debe comparar las varianzas o
desviaciones típicas, el de menor varianza será más
homogénea, luego como SY es menor que SX los
salarios del mes de Agosto será más homogénea.

4) En una empresa Química, la distribución de los


sueldos (en miles de intis) de los 50 trabajadores en
el mes de setiembre se presenta en la siguiente

2
tabla de frecuencias. Por incremento del costo de
vida la gerencia de la empresa propone dos
alternativas de aumento a partir de Octubre.

Nº de
SUELDOS
trabajadores
100, 150 10
150, 200 14
200, 300 20
300, 400 6
TOTAL 50

PRIMERA PROPUESTA: Consiste en un aumento de


60,000 intis a todos los trabajadores.
SEGUNDA PROPUESTA: Consiste en un aumento
del 35% de sus sueldos.
¿Cuál de las propuestas conviene más a los
trabajadores?

Solución

Li , Li 1 Xi ni X i ni

100, 150 125 10 1250

2
175 14 2450
200, 300 250 20 5000
300, 400 350 6 2100
TOTAL 50 10800

1) Cálculo del sueldo promedio actual


X  1 n   X n 
i i

X  10800 50  216 mil intis


ó 216,000 intis
2) Análisis de las propuestas usando las
propiedades de la media.

PRIMERA PROPUESTA: Sea Z : el nuevo sueldo a


partir del mes de octubre de acuerdo a la primera
propuesta,
Z i  X i  60000 , propiedad de la media
Z  X  60000  216000  60000  276000 intis

SEGUNDA PROPUESTA: Aumento del 35% de susu


sueldos.
Z i  0.35 X i  X i  1.35 X i , por propiedad de la media
Z  1.35 X  1.35216000   291600 intis

2
De acuerdo a los nuevos sueldos, parecería que la
segunda alternativa es la que conviene, porque es
291600 intis contra 276000 intis de la primera
alternativa.

De acuerdo a la segunda alternativa los


trabajadores que ganen entre 30,,, y 40,000 intis
recibirán un aumento promedio de: 350,000  0.35  122,500

intis, mientras que los que ganan entre 10,000 y


15,000 intis recibirán en promedio 125,000  0.35  43,750

intis de aumento, por lo que esta alternativa no será


adecuada ya que según la primera alternativa
recibirán 60,000 intis, independientemente del
sueldo actual, que será más justo.

Ejercicios 3 Parte2 (C.V.C.)

1) (ok) Calcular la media, la mediana y la moda de


los datos 2 5 5 6 6 6 7 7 60. Comentar los

2
resultados. ¿Cuál de las medias calculadas
describe mejor el centro de la distribución de
los datos?
Respuesta: X  11,5555 , M 0  6 , M e  6 . La medida o
promedio que mejor describe el centro de la
distribución de datos es la Moda.

2) El siguiente conjunto de datos, corresponde a


los porcentajes de humedad en diferentes
lugares en una determinada región: 90, 63, 20,
18, 12, 60, 24, 28, 14, 11, 85, 29, 25, 8, 10, 86, 16,
25, 6, 11, 80, 16, 20, 16, 6.
a) Calcula le media y la desviación estándar s .

Respuesta: x  31.1600 s   27.2597

b) ¿Qué porcentaje de datos está en el


intervalo x  2s , x  2s ?

3) A continuación se presenta la distribución de 53


tiendas de abarrotes de acuerdo al número de
empleados que tienen:

Número de Número de
empleados tiendas

2
2 11
3 16
4 17
5 9

Usar la información de la tabla para calcular la


media, la mediana y la desviación estándar del
número de empleados.

4) Los siguientes resultados indican el


rendimiento de dos marcas de llantas:

Mediana en Media en
Llanta
kilómetros kilómetros
A 25000 27000
B 27000 25000

Si las llantas de cualquier marca se venden al


mismo precio, ¿qué marca de llanta se
recomienda?

2
5) Los datos siguientes corresponden al tiempo,
en minutos, que demora una oficina “en darle
trámite” a 50 documentos que ha recibido.

400 392 358 304 108 156 438 60 360 168


448 224 576 384 194 216 120 208 232 72
264 168 128 256 72 136 168 308 340 64
480 114 80 246 224 184 104 112 184 152
152 536 224 464 72 152 168 288 264 208

a) A partir de la tabla de frecuencias, construir


el histograma de frecuencias relativas.
Graficar el polígono de frecuencias relativas.
Indicar las características de la distribución.
b) Calcula la media, varianzas, desviación
estándar y el coeficiente de variación de los
datos.
c) Calcular la mediana, utilizando directamente
los datos y utilizando la ojiva de la
frecuencia acumulada relativa.
d) Calcular los porcentajes C10 , C 20 , C 75 y c90 .

2
6) Se informa que en el salón B las notas de
Historia de los alumnos que lo forman se
distribuyen tal como lo indica la siguiente tabla
y en donde fi son las frecuencias relativas.

Notas fi

8, 12 f1

12, 16 f2

16, 20 f3

Calcular aproximadamente la media de las notas


en B si el 45% tiene una nota inferior a 11 y el
70% tiene una nota inferior a 17.
Respuesta: Los valores respectivos de las
frecuencias relativas son 0.60, 0 y 0.4. La
media es 13.2

7) Indicar una lista de 10 números de forma que la


desviación estándar sea lo más grande posible
con la condición de que:
a) cada número sea un 1 o un 5.
b) cada número sea un 1 o un 5 o un 9 y, a lo
más, dos de ellos sean 5.

2
8) Un investigador toma una muestra de 100
hombres cuyas edades están comprendidas
entre 18 y 24 años de edad en una ciudad
determinada. Otro investigador toma una
muestra de 1000 hombres cuyas edades
también están entre 18 y 24 años.
a) ¿Habrá una muestra con una edad media de
los hombres más elevada o serán ambas
parecidas?
b) ¿Habrá una muestra con una desviación
estándar de la edad de los hombres más
elevada o serán ambas parecidas?

9) Tres profesores están comparando las notas de


los exámenes finales. Cada profesor tiene 99
alumnos. En la clase A, un estudiante obtuvo 1
punto, otro obtuvo 99 puntos, y el resto
obtuvieron 50 puntos. En la clase B, 49
estudiantes lograron una puntuación de 1, un
estudiante logró 50 puntos y 49 alumnos
llegaron a los 99 puntos. En la clase C, un
estudiante logró 1 punto, otro estudiante 2

2
puntos, otro estudiante 3 puntos y así
sucesivamente hasta llegar el estudiante
número 99 que logró los 99 puntos.
a) ¿Existe alguna clase que tenga una media
de notas superior a las demás o todas las
medias son iguales?
b) ¿Existe alguna clase que tenga una
desviación estándar de notas superior a las
demás o todas las desviaciones estándar
son iguales?

10) En un conjunto de números positivos, ¿puede


ser mayor la desviación estándar que la media
en alguna ocasión?

11) Un conjunto está formado por 10 números. Cada


número es: o el 1, o el 2 o el 3.
a) La media es 2 y la desviación estándar es 0.
¿Cómo es el conjunto de datos
exactamente?
b) La desviación estándar es 1. ¿Cómo es el
conjunto exactamente?

2
c) ¿Puede ser la desviación estándar superior
a 1?

12) Un profesor está haciendo a sus alumnos un


examen que tiene una calificación máxima de 20
puntos. Su sistema es tal, que las notas deben
ser necesariamente múltiplos de 5. Al final, una
vez corregidos los exámenes obtiene la
siguiente distribución de notas: 40% obtuvieron
la nota 20, 30% obtuvieron 15, 20% obtuvieron
10 y 20% obtuvieron 5.
a) Si se supone que hay 20 alumnos, ¿se
puede hallar la media y la desviación
estándar?
b) Si no se sabe el número de alumnos, ¿se
puede calcular la media y la desviación
estándar?

13) La repartición de un grupo de 75 alumnos de un


colegio de acuerdo a su talla en cm, es como se
indica en la siguiente tabla:

Talla Frecuencia

2
4
85, 90 14
90, 95 23
95, 100 17
100, 105 11
105, 110 6

a) Graficar la frecuencia relativa y la frecuencia


acumulada relativa.
b) Usar las marcas de clase para aproximar la
media, la mediana y la desviación estándar.

14) A continuación se presenta la distribución de


los tiempos totales, en minutos, que diferentes
estaciones de radio dedican a los avisos
comerciales entre las 8:00 a.m. y 12:00 m.

Tiempo Número de radios


0.5, 6.5 1

2
2
12.5, 18.5 18
18.5, 24.5 2
24.5, 30.5 1
30.5, 36.5 10
36.5, 42.5 0
42.5,48.5 0
48.5, 54.5 2
54.5, 60.5 14

a) Usar las marcas de clase para aproximar la


media y la desviación estándar del tiempo
que las estaciones de radio dedican a los
avisos comerciales entre las 8:00 a.m. y las
12:00 m.
b) Calcular el porcentaje de tiempo de avisos
comerciales que están en el intervalo
x  3s , x  3s  .
c) Calcular la mediana, utilizando la ojiva de la
frecuencia acumulada relativa.

15) Los 100 alumnos de una sección A se


distribuyen de acuerdo a sus notas de Historia

2
tal como indica la siguiente tabla ( ni indica la
frecuencia).

Notas ni

8, 10 28
10, 12 50
12, 14 22

De manera aproximada, calcular la nota debajo


de la cual está 40% de las notas. También
calcular, aproximadamente, la mediana.
Respuesta: El percentil 40 es 10.48.

16) Se encontró que en 800 datos la media


aritmética y la desviación estándar eran 9.496 y
0.345, respectivamente. Una revisión de los
resultados mostró que en lugar del valor 9.56 se
introdujo 1.56. Recalcular la media aritmética y
la desviación estándar.
Respuesta: 9.506, 0.200.

17) Calcular la media de un grupo de 80 datos que


ha sido dividido en tres subgrupos: A, B y C,

2
para los cuales se tienen las medias y el número
de datos correspondiente:
x A  50 , N A   A  10 , x B  80 , N B  B   20 , xC  60 ,

N C  C   50

Respuesta: 63.75.

18) Aplicando las propiedades de la media, probar


que si x1 , , xm , es un conjunto de datos cuya
media es x, entonces el conjunto de datos
y1 , , ym , obtenidos al realizar la transformación
y i  axi  b , a b
donde y son constantes, tienen
media y  ax  b .

19) Calcular la media y la desviación estándar de un


grupo de 30 datos que ha sido dividido en dos
grupos A y B, para los cuales se tiene:
x A  50 , N A  10 , s A  5 , x B  80 , N B  20 , s B  8

Respuesta: La media es 70 y la desviación


estándar, 15.84.

20) El 70% del personal de una compañía son


varones y el resto, mujeres. El promedio de los
sueldos de los valores es $ 700 y el promedio en

2
el grupo de mujeres es $ 600. Hallar el sueldo
promedio del personal de la compañía.

21) La media y la varianza de los tiempos x1 , , xn ,


n
utilizados en realizar tareas similares son 14 y
2.89, respectivamente. El costo por realizar cada
tarea es y i  10  0.5 xi  0.1xi2 , hallar la media de los
costos.

22) En una empresa pública el promedio de los


sueldos de los obreros es 40 unidades
monetarias (u. m.) y el de los empleados, 50 u.
m. Si la empresa decide aumentar 20 u. m. a
cada empleado y obrero; hallar el promedio
general de los sueldos actuales (considerando
el aumento) si el número de obreros es el 10%
del número de empleados.
Respuesta: 69.09.

23) Durante el mes de marzo el sueldo promedio de


los trabajadores del sector industrial era de
$100. Para el mes de abril se considera para
cada trabajador un aumento del 30%, con
respecto del mes de marzo más un adicional de

2
%50. Si el coeficiente de variación en marzo era
de 0.25, ¿se puede decir que la distribución de
sueldos en abril es más homogénea?
Respuesta: Si, el nuevo coeficiente de variación
es 0.1805.

24) En el mes de enero, el promedio de los salarios


de los empleados de una empresa era 40 u. m.;
en el mes de febrero, la empresa consideró un
incremento del 25% en el número de empleados
y con un salario igual al 80% del promedio de
los salarios de los antiguos empleados. En el
mes de marzo, la empresa hizo efectivo un
aumento del 25% en el salario de cada uno de
los empleados, más una asignación de 20 u. m.
por escolaridad. Hallar el sueldo promedio de
los salarios de los empleados en el mes de
marzo.

25) El coeficiente de variación de un grupo de


datos es 0.1. Si a cada dato se le aumenta
primero el 20% de su valor y luego 5 unidades,
el coeficiente de variación es igual a 0.05. Halle

2
el valor de la media y la varianza de los datos
originales. Halle el valor de la media y la
varianza después del aumento.
Respuesta: La media y la desviación estándar
originales son: 4.1666, 0.4166.

26) El tiempo que 30 operarios demoraron en


ejecutar una tarea fue registrado en minutos,
obteniéndose:

7.0 9.0 11.4 7.2 10.2 13.5 17.0 14.0 14.5 8.0
9.1 9.4 13.1 8.5 10.4 15.5 12.0 11.0 11.2 9.6
9.2 9.5 15.6 8.4 10.8 13.0 12.5 12.4 10.5 7.8

Construir una distribución de frecuencias con


cinco intervalos de igual longitud y a partir de
ésta estudiar, usando medidas estadísticas
adecuadas las siguientes afirmaciones:
a) “Calculando una medida central
representativa para esta distribución, se
deduce que el tiempo promedio de ejecución
de la tarea por operario llega a superar los
11 minutos”

2
b) “La mitad de los operarios no demoró más
de 10.8 minutos”
c) “Un operario cualquiera nunca demoró un
tiempo que excedió al tiempo medio en más
de dos desviaciones estándar”
Si se eligiera al azar uno de los operarios y se
deseara predecir el tiempo en que éste ejecutó
la tarea, da tal manera que el promedio de los
cuadrados de los errores fuera mínimo, ¿cuál
sería el valor de predicción?”

Si se eligiera al azar uno de los operarios y se


deseara predecir el tiempo en que éste ejecutó
la tarea, da tal manera que el promedio de los
errores en valor absoluto fuera mínimo, ¿cuál
sería el valor de predicción?”

27) La distribución de mujeres cuyas edades


fluctúan entre 40 y 50 años, de acuerdo al
número de hijos en las comunidades A y B es
como se indica en la siguiente tabla:

Número de mujeres

2
Número de hijos A B
0 6 8
1 9 15
2 23 20
3 28 15
4 22 10

Comparar las distribuciones en A y B usando


las medias y los coeficientes de variación.
a) ¿Las mujeres, de qué comunidad, tienen el
mayor promedio de hijos?
b) ¿Para qué comunidad, la distribución del
número de hijos es más homogénea?

28) En un grupo de datos, el 1 se repite el 25% de


las veces y el 2 se repite el 75% restante. Para
a
tal grupo, hallar el valor que hace que la suma
1  a 2   1  a   2  a  
2 2
 2  a 
2
, sea mínima.
Respuesta: 1.75.

29) Las ciudades A, B y C (en ese orden) están


unidas en línea recta por una carretera. La
distancia entre las ciudades A y B es 4 km,

2
mientras que entre B y C la distancia es 5 km.
Se desea construir un centro de recreo en un
punto de la carretera para un total de 200 niños
distribuidos de la siguiente manera: 25% de los
niños viven en A, 35% de los niños viven en B y
el resto vive en C. ¿Cuál debe ser la ubicación
del centro de recreo si se considera que el costo
de transporte por cada niño es proporcional a la
distancia recorrida y el costo total al transportar
a todos los niños debe ser mínima?
Respuesta: La respuesta corresponde a la
mediana de los valores: 0, repetido 50 veces, 4
repetido 70 veces y 9 repetido 50 veces.

30) Usando los datos del ejercicio 5, calcular los


percentiles 10, 20, 50 y 70.

31) Usando los datos de la tabla del ejercicio 8,


calcular aproximadamente el intercuartil.

32) Durante cuatro años consecutivos un banco


aumentó su capital en 100%, 150%, 300% y
400%. Indicar la tasa de aumento promedio del
capital si al inicio fue 50 millones de dólares.

2
33) El aumento de la tasa de cambio en el país
durante las cuatro semanas del mes de Junio y
con respecto a la semana anterior fue como
sigue: 1%, 2%, 3%, y 2%. Calcular, usando la
media geométrica, el aumento promedio de la
tasa de cambio. Si al comenzar la primera
semana de Junio el dólar costaba 2.10 soles,
estimar el precio del dólar al comenzar la
primera semana de Julio.
Respuesta: El aumento promedio de la tasa de
cambio es 1.9975%.

34) Determinar la tasa de crecimiento promedio de


la población en los últimos tres años si en 1992
la población fue 18000000, en 1993 fue 2000000
y en 1994 fue 25500000. Indicar por qué la media
aritmética no es adecuada para indicar el
cambio promedio de crecimiento.

35) La velocidad con que escriben tres personas el


mismo texto es 60, 70 y 65 palabras por minuto,
respectivamente. Calcular la velocidad
promedio.

2
Respuesta: 64.74 palabras por minuto.

36) En la siguiente tabla se registrar: el tiempo que


emplean 5 obreros en fabricar un artículo así
como el tiempo total trabajado por cada uno de
ellos. Calcular el tiempo promedio que se utiliza
en fabricar un artículo.

Tiempo total Tiempo usado


Obreros trabajado en por artículo en
minutos minuto
1 480 0.80
2 480 1.00
3 480 1.20
4 480 1.20
5 240 1.50

37) Dos alumnos desarrollaron, cada uno, una


prueba que tenía 40 “ítems”. El primero hizo una
pregunta cada 2 minutos y el segundo una
pregunta cada 2.5 minutos. Calcular el promedio
de preguntas desarrolladas cada 5 minutos.
Respuesta: 2.22 preguntas cada 5 minutos.

2
38) Una propiedad importante de la media dice que
si x1 , , xn tienen media x y si y  f x  es una
función cóncava hacia abajo entonces
n
1
f x    f x  (Desigualdad de Jensen).
i
n i 1

Usando la desigualdad de Jensen, probar que


Gx, en donde G es la media geométrica de los
datos.

39) Para los datos del ejercicio 5, hallar el sesgo y el


coeficiente de curtosis. ¿A qué tipo de curva
corresponde?

40) El índice de Gini puede usarse también para


analizar la concentración de la población de una
determinada región. A partir de la siguiente
información, analizar la concentración de la
población.

Número de Población
Habitantes
distritos total
500, 1000 320 192000
1000, 1500 130 143000

2
110 187000
2000, 2500 80 192000
2500, 3000 30 79500
3500, 4000 10 34500

También podría gustarte