Módulo I. Estadística Descriptiva PDF
Módulo I. Estadística Descriptiva PDF
CAPITULO I.
ESTADÍSTICA DESCRIPTIVA
1.1. SIGNIFICADO DE LA ESTADÍSTICA. La palabra ―Estadística‖ se
origina en la Edad Antigua del término ―Estado‖ debido a que fueron los gobiernos
quienes manejaban grandes conjunto de datos demográficos y económicos importantes para
el Estado como registros de la población ; nacimientos ; defunciones ; cosechas ;
impuestos y otras actividades de conteo. A partir de este modesto comienzo la Estadística
se ha ido convirtiendo en uno de las principales disciplinas de las matemáticas y en un
método científico de análisis y aplicación a todas las ciencias sociales y naturales; así
como también a la empresa como la estadística económica (ingreso nacional; empleo;
precios) y en fin a diversos asuntos del quehacer cotidiano. Un ejemplo de aplicación
podemos considerar las encuestas de opinión para conocer el probable triunfo de un
candidato a ocupar un cargo; digamos se consulta a un conjunto de 100 votantes (muestra)
de los cuales 55 de ellos están a favor, diremos entonces que el 55 % de electores votarían
por el candidato. En la Edad Media con el Cálculo de Probabilidades, la Estadística se
estructura como una ciencia o un método de investigación científica; es decir que a partir de
un problema determinado, se formulan hipótesis; se recopila datos; se procesa; presenta;
describe; interpreta; analiza; se extrae conclusiones y emite sugerencias
1.2.2. UNIDAD DE ANÁLISIS. Llamada también unidad experimental, i.e.; son los
sujetos u objetos en estudio. Asia : alumnos; docentes ; trabajadores; clientes ; pacientes;
gerente; empresa; aula; Centro educativo; familiar; comunidad campesina; sindicato;
asociación ; cultivo ; crianza; ovino; vacuno; unidad ganadera; maquinaria; motor;
vehículo; refinería; producto; etc.
Algunos universos, pueden ser: Todos los vehículos taxi-tico; todos los vehículos taxis;
todos los vehículos del parque automotor; en la ciudad de Piura, en el mes de diciembre
del 2007.
a) Determinar el rango, R :
En cualquiera de los casos el valor de ―m‖ debe obedece redondearse por exceso. El
Método arbitrario, obedece a un valor pre-establecido, donde el valor de ―m‖ puede variar
entre 5 a 8 ; 10 a 15; u otro valor, depende del valor de ―n ―; valor de R o los valores de Xi (
enteros o decimales )
R
Si R y C , fueran conocidos, entonces el valor de m = , Al redondearse por exceso
c
tenemos un nuevo rango R* = m.C > R ; R*– R = E : exceso que debe distribuirse
E
equitativamente en ambos extremos ( ), obteniendo los límites inferior y superior
2
E E
del cuadro. Límite Inf. = Xmín ; Límite superior : Xmáx
2 2
d) Determinar los intervalos Generalmente de la forma: [... .) ó ( ]. El
software Statgraphics, utiliza los intervalos: ( ]
A partir del primer límite inferior, se obtiene los demás límites sumando sucesivamente la
amplitud de cada intervalo ―Ci ― que por lo general es constante .Así:
Cm Xm – ´ X m nm
m
C1 = C2 =... = C = Cte. n. = n
1
i
SOLUCION:
Según el método de Sturges, el número de intervalos es m = 1 + 3.3 log.40 = 6.28 = 7
58
R = 576 – 519 + 1 = 58 ; C= = 8.3 = 9 ; R* = m.C = 7x9 = 63. Se obtiene
7
exceso E, donde este exceso E = 63 –58 = 5. Distribuyendo el exceso en ambos
extremos: ± 2.5, tenemos: Límite Inf. = 519 – 2.5 = 516.5 = 517 ; Límite Sup. = 576
+ 2.5 = 578.5 = 579; obteniendo el cuadro siguiente:
Ci [. S/mes ) ni o fi
C1 517 --- 526 2
C2 526 --- 535 3
C3 535---- 544 10
C4 544--- - 553 13
C5 553---- 562 6
C6 562--- - 571 4
C7 571---- 580 2
m = 7 ; C1 = C2 =... = C = 9 = Cte n = 40
FUENTE: ENCUESTA A LOS ALUMNOS.
Los demás métodos (raíz cuadrada y arbitraria), queda como ejercicio para el lector
B. CUADROS CON VALORES AISLADOS ( sin intervalos )
a) Los límites de clase o límites de intervalos. Estos pueden ser simplemente límites
de clase, si lo son cerrados en ambos extremos; límites reales de clases, si lo son
semicerrados, de modo que un :
b). Punto medio. Llamado también marca de clase, es la semisuma de los límites de un
intervalo; simbolizaremos por Xi, donde:
LímiteInf . LímiteSup .
Xi = = Xi-1 + C = Xi+1 – C
2
C C
= Límite Inf. + = Límite Sup. ─ ; donde i = 1 , 2, 3, ..., m
2 2
NOTA: El punto medio reemplaza al conjunto de valores del intervalo; puede
considerarse como valor aislado de la variable.
ni
b) Relativa simples: hi = , dado en decimal o porcentaje;
n
i
c) Acumuladas simples: Ni = n j = Ni-1 + ni
1
i
d) Acumuladas relativas: Hi = h j = Hi-1 + hi, indicados en decimal o porcentaje.
1
m Xm nm o fm Nm o Hm
m = Nº de intervalos; C = Cte. n o 1.00
10. 12. C C
X3 = = X2 + C = X4 – C = 10. + = 12 – ;
2 2 2
22 2 2
X3 = = 9 + 2 = 14 – 2 = 10. + = 12 – = 11. Significa que 8 empresas arrojan
2 2 2
b) Frecuencias:
ni 3
b.1) Relativa simple: h1 = = = 0.075 = 7.5 %. Significa que el 7.5 % de las
n 40
empresas tiene utilidades mayores o iguales a 6mil y menores que 8 mil dólares
30
20
10
0
516 525 534 543 552 561 570 579
Gastos Soles por mes
30
20
10
0
511.5 520.5 529.5 538.5 547.5 556.5 565.5 574.5 583.5
Gastos Soles por mes
80
60
40
20
0
516 525 534 543 552 561 570 579
Gastos Soles por mes
------------------------------------------------------------------------
Frrecuencias Simples. Frecuencias Acumuladas
Categoría Absolutas Relativas Absolutas Relativas
------------------------------------------------------------------------
A 5 0.1250 5 0.1250
B 10 0.2500 15 0.3750
C 13 0.3250 28 0.7000
D 6 0.1500 34 0.8500
E 6 0.1500 40 1.0000
------------------------------------------------------------------------
12
0
A B C D E
Categorías de gastos
32.50%
65 72 52 75 63 63 50 38 30 36 44 62 63 39 89 59 69 74 75 63
67 64 87 58 82 61 59 38 53 95 87 79 76 75 68 81 52 84 53 43
75 77 73 82 95 69 72 84 48 49 55 66 73 59 70 48
b). Monto de compras S/día por diferentes conceptos en una tienda comercial:
52 42 59 63 47 65 64 34 55 35 54 50 48 55 55 58 58 40 39 58 48
53 48 52 43 39 72 53 46 52 51 62 51 63 38 42 45 69 50 46 49 56
133 107 90 115 136 108 95 130 93 93 107 120 122 104 124 108
140 118 98 124 99 110 97 96 114 112 109 115 130 105 118 106
108 110 102 110 92 102 103 125
e) Para una campaña de ventas, la gerencia de una compañía, convoca y administra un test
de suficiencia a 50 candidatos. Los resultados, son los siguientes :
88 53 42 35 41 60 39 65 61 94 77 94 35 55 54 84 55 98 74 74 69
33 57 59 63 81 68 67 52 41 45 65 50 78 76 67 91 66 89 64 48 60
65 63 66 71 47 85 85 80
60 65 15 35 65 55 31 45 56 30 39 51 56 54 47 43 55 57 24 49 77
48 25 58 68 21 41 54 64 53 24 57 50 59 33 74 34 28 69 12 23 67
45 43 40 44 41 64 36 38
52.5 48.6 43.2 45.2 47.2 58.1 46.2 49.1 55.4 40.2 51.3 64.5 63.1
58.3 53.2 46.2 34.2 58.1 62.5 59.3 50.3 52.1 42.4 65.2 61.4 44.3
51.2 42.5 54.1 48.3 38.3 65.2 55.2 72.3 50.3 53.1 35.8 53.1 63.2
55.2 39.2 69.2 47.2 52.4 56.3
ESTADISTICA DESCRIPTIVA.- UNP. 17
2.5 1.2 2.0 1.5 2.3 3.8 2.8 1.1 1.7 3.3 1.3 0.8 0.9 4.8 1.0 6.1
1.4 5.0 1.4 1.0 1.7 1.2 2.0 1.3
SOLUCIÓN:
a.1) m = 6.7 =7 (Sturges) ; C = 9.4 = 10; Exceso = 4 ; Límite Inf. = 28; Límite Sup.= 97
a.2) m = 8 (arbitrario) ; C = 8.3 = 9 ; Exceso = 6 ; Límite Inf. = 27 ; Límite Sup. = 98
a.1) Método de Sturges a.2) Método arbitrario
[ ) ni [ ) ni
28 --- 38 2 27 --- 36 1
38 - ---48 5 36 -- - 45 6
48 --- 58 9 45 -- 54 8
58 -- 68 14 54 --- 63 7
68 --- 78 15 63 -- 72 12
78 - 88 8 72 -- 81 12
88 - 98 3 81 - 90 8
90 -- 99 2
m = 7 ; C = 10 n = 56 m=8 ; C=9 n = 56
b) R = 72 ─ 34 +1 = 39 ( por ser datos numéricos enteros )
m = 6.3 = 7 (Sturges) ; C = 5.5 = 6 ; Exceso = 3 ; Límite Inf. = 33 ; Límite Sup. = 74
M NC NC NC NC B B B M M M R NC NC R B R B R R NC
M B R R NC NC NC
Formar un cuadro de distribución de frecuencias y presentarlo gráficamente.
[Link] DE POSICIÓN.
n
X i
a) Media aritmética: x 1
n
n
log . X .i
b) Media geométrica: x g Anti log 1
n
n
c) Media armónica: x h
1
X
i
d) Mediana, Me : para calcularse esta medida debe ordenarse primero los datos Xi ,
ya sea en forma ascendente o descendente, obteniendo : X(1); X(2); X(3);...;X(n), luego :
ESTADISTICA DESCRIPTIVA.- UNP. 19
n 1
X : n..impar
2
Me = n n
X 2 X 2 1
: [Link]. par
2
e) Moda o valor modal: Md = Xi más común o más frecuente; puede haber más
de una valor modal o puede no existir el Xi común.
El uso de una sola medida estadística (promedio) para describir un conjuntote datos puede
ser incompleto y se puede estar ocultando características importantes. Así, si tenemos dos
conjuntos de datos que arrojan el mismo promedio, no significa necesariamente que se trata
de los mismos valores, uno de los grupos puede estar más disperso alrededor de su
promedio que el otro. Por esta razón es necesario calcular también una medida de
dispersión, variación o esparcimiento para describir mejor un conjunto de datos. Las
medidas de dispersión más utilizadas son: rango ; desviación estándar y coeficiente de
variación. Así:
( X i x) 2 X i
2
n
2
b) Varianza: S2 = 1 1
.x
n 1 n 1 n 1
c) Desviación estándar: S = S 2
S
d) Coeficiente de variación: CV = , decimal o porcentaje.
x
El rango y la desviación estándar se expresan en unidades originales de la variable y se usan
para comparar la variación de dos o más conjuntos de datos con la misma variable. En
ocasiones hay un solo conjunto de datos o dos o más conjuntos expresados en unidades
diferentes; en estos casos utilizaremos el coeficiente de variación. Para un solo conjunto de
datos se tiene lo siguiente:
a).Medidas de posición:
n
X i
6 9 ... 2 29
Media aritmética: x 1
= 4.83 millones de $.
n 6 6
n
log . X .i
Media geométrica: x g Anti log 1
=
n
log .6 log .9 ... log 2
= Anti log Anti log .0.6326 4.3178 millones de $.
6
n 6 6
Media armónica: x h = 3.843 millones de $.
1 1 1 1
X ...
6 9 2
1.5611
i
n n
X X 1
Me =
2 2 = X 3 X 4 5 4 4.5 millones de $ . El 50 % de
2 2 2
las donaciones ( es decir 3 de ellas ) ascienden a 4.5 millones de dólares.
( X i x) 2 X i
2
n
2
Varianza: S2 = 1 1
.x =
n 1 n 1 n 1
62 92 ... 22 6
= .(4.83)2 6.2053 millones2
5 5
S 2.491
Coeficiente de variación: CV = = 0.516 = 51.6 %,
x 4.83
NOTA: La media geométrica, se utiliza cuando las Xi son razones o proporciones;
crecimiento poblacional; interés compuesto, con tasa de crecimiento constante.
ESTADISTICA DESCRIPTIVA.- UNP. 21
La media armónica, se usa cuando las Xi son velocidades; precios u otros valores
análogos.
n 1
Luego la mediana es: Me = X = X(3) = 14 puntos.
2
EJEMPLO .Los salarios de los trabajadores de las empresas ―1‖ y ―2‖ son :
Empresa ―1‖ : x1 = 1500 $ con S1 = 500 $; Empresa ―2‖ : x2 = 5000 $ con S2 = 300$
Comparar la variabilidad de los salarios de los trabajadores de las dos empresas en
términos: a) absolutos y b) Con respecto al salario promedio.
500
b) En la variabilidad relativa, se obtiene: CV1 0.333 33.3% y
1500
300
CV2 0.06 6.0% .Se concluye que la variabilidad de los salarios en la
5000
empresa ―1‖ es poco más de 5 veces la variabilidad en los salarios de la empresa ―2‖
1.6.2. MUCHOS DATOS. Dado Xi: X1; X2; X3; ... ; Xn, donde ―n‖ es grande.
Podemos calcular las medidas estadísticas utilizando las mismas fórmulas de pocos datos.
Sin embargo, se sugiere ordenar los datos, por que estos son muchos, en un cuadro de
distribución de frecuencias y luego utilizar nuevas fórmulas. Así:
i [ ) Xi ni Ni hi Hi Xini X i2 ni Zi Zini Z i2 ni
1 X1 n1 N1 h1 H1 X1n1 Z1 Z1n1
2 X2 n2 N2 h2 H2 X2n2 Z2 Z2n2
3
..
m Xm nm Nm hm Nm Xmnm Zm Zmnm
Totales ni = n 1.00 X i ni X i2ni Zi ni Zi2ni
A. MEDIDAS DE POSICIÓN:
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 22
X i ni m Z n i i m
X i Ot
x 1
X i hi C 1
Ot C Z i hi Ot ; Donde Zi
,
n 1 n 1 C
variable que simplifica el procedimiento; Ot llamado origen de trabajo , equivalente al
Xi central, si m es impar o cualquiera de los dos centrales, si m es par.
n .log .X
i i m
xg Anti log . 1
Anti log . hi . log . X i
n 1
n
C. Media armónica : xh m
;
ni
1 X
i
n
2 N j 1 0.5 H j 1
d). Mediana, Me = Lj + .C j L j .C j ; donde:
n j
h j
n
ó 0.5 : término pívot, señala el intervalo donde se encuentra el valor de Me ;
2
Nj o hj : frecuencia correspondiente al intervalo de Me ;
1
e) Moda: Md = Lj + .C j ; donde: 1 n j n j 1 h j h j 1
1 2
i.n i
100 N j 1 100 H j 1
Pi = Lj + .C j L j .C j ; para i = 1; 2; 3; ...; 99, donde :
nj hj
i.n i
..ó.. : Término pívot, señala el intervalo donde se encuentra el percentil ;
100 100
nj o hj : frecuencia simple correspondiente al intervalo percentil ;
Si i = 25; 50 ; 75: los percentiles reciben el nombre de cuartiles. Son tres medidas que
simbolizamos como: P25 = Q1 ; P50 = Q2 ; P75 = Q3 y que dividen al conjunto de
datos ordenados en forma ascendente o descendente en cuatro partes iguales. Así:
0% 25% 50% 75% 100%
Q1 Q2 Q3
er
Q1 = 1 cuartil, contiene 25% de las observaciones menores o iguales a él y el 75%
superiores a él.
Q2 = 2do cuartil, coincide con la mediana.
Q3 = 3er cuartil, contiene 75% de las observaciones inferiores o iguales a él y el 25% del
resto son superiores a éestge valor. Debe notarse que entre dos cuartiles consecutivos
se halla el 25% del número de valores.
Si i = 10; 20, ... ; 90, los percentiles se llaman deciles. Son nueve medidas que
m m m 2 m
2
n n n n
S
d) Coeficiente de variación o dispersión: CV.= , decimal o porcentaje; cuyo valor:
x
Si es menor del 10% se dice que hay poca dispersión; oscila entre el 10% y el 33% la
dispersión es aceptable o regular; si oscila entre el 33% y el 50% se dice que hay alta
dispersión y si es mayor del 50% se dice que la dispersión es muy alta.
ni
Si los datos están dados en frecuencias relativas, reemplazar en las fórmulas: hi =
n
C. MEDIDAS DE DEFORMACIÓN:
Puede ser de interés conocer el sentido o dirección de la variación (deformación). Esta dirección
puede ser horizontal (medida de asimetría) o vertical (medida de curtosis o apuntamiento)
..0
3.x Me
a). Coeficiente de asimetría (de Pearson): As = .. ..0 ; recibiendo los nombres
S ..0
de: asimetría positiva o a la derecha; asimetría nula o simetría y asimetría negativa o a la
izquierda, respectivamente
ni ni
Md M e X X Me Md
0.263
q3 q1
b). Coeficiente de apuntamiento: K = . ...0.263 ; recibiendo el
2.P90 P10 . 0.263
nombre, respectivamente: Platicúrtica; mesocúrtica y leptocúrtica.
X
La distribución mesocúrtica es una gráfica ideal, ni muy levantada ni muy plana, llamada
también normal
El software Statgraphics calcula las medidas estadísticas según fórmulas de pocos datos.
X i ni 7435.6 1 Zi ni 45
a.1).Media x 1
C Ot 2.5 92.05 90.678 pts.
n 82 n 82
El promedio de notas por alumno es 90.678 pts. O la nota promedio de los alumnos es
90.678 pts.
n
2 N j 1 41 14
a.2) Mediana, Me = Lj + .C j 88.3 x 2.5 90.477 pts.:.El 50 %
n j 31
de los alumnos obtuvieron notas menores de 90.477 pts.; en tanto que el otro 50 %,
obtuvieron notas mayores o iguales a 90.477 pts.
1 21
a.3) Moda: Md = Lj + .C j 88.3 x2.5 90.244 pts...Las notas más
1 2 21 6
frecuentes es 90.244 pts. O la mayoría de los alumnos obtienen notas iguales o se aproximan a
90.244 pts.
10.n
100 N j 1 8.2 4
P10 = Lj + .C j 85.8 x 2.5 86.85 puntos;
nj 10
ESTADISTICA DESCRIPTIVA.- UNP. 27
25.n
100 N j 1 20.5 14
P25 = Lj + .C j 88.3 x 2.5 88.824 puntos
nj 31
75.n
100 N j 1 61.5 45
P75 = Lj + .C j 90.8 x 2.5 92.45 puntos
nj 25
X i
2
.ni
674972.585
x (90.678) 2 8.8646 pts2
2 1 2
b.2) Varianza: S =
n 82
m 2 m
2
Z i .ni Z i .ni 45
2
2 2 1
S =C . 1 2 141
(2.5) . 8.8646 pts.
2
n n 82 82
c).Medidas de deformación
ni
[ ) Xi ni Ni Xini X i2 ni [Link] [Link] Zi Zini Z i2 ni
Xi
-- 35 32.5 4 4 130.0 4225.00 1.5119 6.0475 –4 –16 64 0.1231
35--40 37.5 7 11 262.5 9847.75 1.5740 11.0182 –3 –21 63 0.1867
40--45 42.7 10
45--50 47.5 13
50--55 52.5 20
55--60 57.5 15
60--65 62.5 6
65--70 67.5 3
70—75 72.5 2 80 145.0 10512.5 1.8603 3.7207 4 8 32 0.0276
h 1 ; h2 ; ...; hk : Así :
i Atributos Frecuencias
Absolutas Relativas
1 A1 n1 h1
2 A2 n2 h2
k Ak nk hk
ni = n 1.00
MM MM MM MM MM MM MM MM M M M M M M M M M
M R R R R R R R R R R R R R R R R
R R R R B B B B B B B MB MB MB MB MB
i Atributos Frecuencias
Absolutas: ni Relativas: %
1 MM 8 16
2 M 10 20
3 R 20 40
4 B 7 14
5 MB 5 10
ni = 50 100
FUENTE. DATOS DE ENCUESTA
16
12
0
MM M R B MB
40.00%
ESTADISTICA DESCRIPTIVA.- UNP. 31
a) Si Xi = K, constante. Entonces:
x xh xg M e Md qi K ; Rx = S2 = S = CV = 0; As y K (curtosis), no están
definidas.
1 2 ….... k
x1 ; S12 ; n1 x 2 ; S 22 ; n2 x k ; S k2 ; nk
……
n .x i i
EJEMPLO. La empresa ―X‖ tiene 100 empleados con un sueldo promedio mensual por
empleado de S/.1500. La empresa ―Y‖ tiene 200 empleados con un sueldo promedio
mensual de S/. 1400.
a) ¿ Cuál es el sueldo promedio mensual de los trabajadores de la dos empresas ?
b) Si a las dos empresas se agrega una tercera empresa ―Z‖ con 50 empleados y un sueldo
promedio mensual por empleado de S/. 1600 . ¿ Cuál es el sueldo promedio de los
trabajadores de las tres empresas?
SOLUCION
a) nx = 100 ; x 1500 ; ny = 200 ; y 1400 ;
x.n [Link] x 1500 x100 1400 x200
Promedio de x+y = 1433.33
nx n y 100 200
02. Se sabe que los salarios en dólares semanales ( enteros ) de los 60 trabajadores de una
empresa oscila entre 95 a 78. Según Sturges definir los intervalos semicerrados [......) del
rango total.
2.5 1.2 2.0 1.5 2.3 3.8 2.8 1.1 1.7 3.3 1.3 0.8 0.9 4.8 1.0 6.1
1.4 5.0 1.4 1.0 1.7 1.2 2.0 1.3.
Ordenar los datos en un cuadro de distribución de frecuencias con 6 intervalos.
04. Los siguientes datos representan gastos $/semana de un conjunto de estudiantes de una
Facultad:
32 30 33 32 36 36 41 43 28 32 31 45 41 39 39 45 30 38
36 41 32 35 34 35 38 43 36 35 32 38 40 42 30 23 31 29
31 35 37 38 33 30 22 40 37 27 26 37 28 33
Según el método de Sturges ordene los datos en un cuadro de frecuencias :
[ $/semana ) Vs Ni
03.
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 34
[ $/semana ) 20---24 24—28 28—32 32—36 36- -40 40---44 44--48 Total
ni 2 2 10 13 13 8 2 50
Ni 2 4 14 27 40 48 50
05.
i [ Xi : Notas ) Xi hi % ni Ni Hi %
1 - 5 3..5 10.7 6 10.7 100.0
2 5 a 8 6.5 17.9 10 28.6 89.3
3 8 a 11 9..5 32.1 18 60.7 71.4
4 11 a 14 12..5 21.4 12 82.1 39.3
5 14 a 17 15..5 12..5 7 94.6 17.9
6 17 a más 18.5 5.4 3 100.0 5.4
06.
Minutos 5 6 7 8 9 10 > 10 Total
Vehículos 1 6 9 7 4 2 1 30
02. Los siguientes datos representan salarios de trabajadores de una empresa en dólares por
mes: ($):
94 89 96 77 80 112 87 107 98 86 80 89 73 86 116 100 79 104 97 88 67 105
105 92 96 91 87 87 107 66 79 103 87 77 87 77 69 97 78 86 74 90 83 98 95
86 93 82 93 94 65 68 73 75 85 91 95 93 90 97 98 105 107 110 115
ESTADISTICA DESCRIPTIVA.- UNP. 35
03. Los siguientes datos representan el consumo de energía eléctrica Kwh por un conjunto de
familias de una urbanización: ( m = 10 ; C = 5 ; n = 100 )
[ Kwh ) <5 5 a 10 10 a 15 15 a 20 20 a 25 25 a 30 30 a 35 35 a 40 40 a 45 45 a +
Familias 2 5 8 12 24 18 13 10 7 1
a.1) X5 ; n7 ; h9 ; N4 ; H3 ≤ ; H4 : ≥ (3 pts.)
a.2) 15 ≤ X < 20 ; 10 ≤ X < 30 ; X < 35 ; X ≥ 15 : (2 pts.)
E D A E A B A B A D A B A C A C A B A C A C A B A B
A B A B A B A B A C A C A D A B E B A A B D A E
a) Presentar los datos en un cuadro de frecuencias h i % : ( 2 pts.)
b) Graficar los datos del cuadro anterior a través de :
b.1) Sectores circulares ( círculo de radio = 5 cm.) ; b.2) Barras verticales : ( 2 pts.)
01. 02.
[ $/mes ) [ $/mes ) ni Ni
39.8 a 43.1 63 a 71 5 5
43.1 a 46.4 71 a 79 8 13
46.4 a 49.7 79 a 87 11 24
49.7 a 53.0 87 a 95 18 42
53.0 a 56.3 95 a 103 11 53
56.3 a 59.6 103 a 111 9 62
59.6 a 62.9 111 a 119 3 65
62.9 a 66.2
66.2 a 69.5
69.5 a 72.8
m = 10 ; C = 3.3 ; n = 500 m = 7 ; C = 8 ; n = 65
03.
I [ Kwh ) Xi ni hi % Ni Hi %
1 - 5 2..5 2 2 2 2 100
2 5 a 10 7..5 5 5 7 7 98
3 10 a 15 12..5 8 18 15 15 93
4 15 a 20 17..5 12 12 27 27 85
5 20 a 25 22..5 24 24 51 51 73
6 25 a 30 27..5 18 18 69 69 49
7 30 a 35 32.5 13 13 82 82 31
8 35 a 40 37.5 10 10 92 92 18
9 40 a 45 42.5 7 7 99 99 8
10 45 a más 47.5 1 1 100 100 1
m = 10 ; C = 5 ; n = 100
04.
Atributos A B C D E Total
ni 23 13 6 4 4 50
% 46 26 12 8 8 100
Gº 165.6 93.6 43.2 28.8 28.8 360
Puntajes : X % de trabajadores
Menos de 45 5.00
45 a 50 8.75
50 a 55 12.50
55 a 60 16.25
60 a 65 25.00
65 a 70 18.75
70 a 75 7.50
75 a 80 3.75
80 a + 2.50
100.00
2 .Si la edad promedio del 25% de un grupo de personas es de 40 años ¿cuál es la edad
del resto, Si la edad promedio de todos es de 30 años? R: 262/3
3. Las medias aritméticas de las inversas de 3 números calculados tomando de dos en dos
son 4, 5 y 6. Hallar la media aritmética de los 3 números originales. R: 0,22
4. Hallar la media aritmética de: 1,1,1,...,1; 2, 2,2,...2,2; 3, 3,3,...,3;.....; 9, 9,9,...,9. Dar como
respuesta la suma de cifras de la media aritmética. ( En cada caso hay 10 dígitos iguales )
R: 5n
5. En un salón de clase de 20 alumnos la nota promedio en matemáticas es 14; en el mismo
curso la nota promedio para otra aula de 30 alumnos es de 11¿Cuál será la nota promedio si
se juntan a los 50 alumnos? R: 12,2
7. En la huerta, donde hay 80 animales entre conejos y pavos, se observa que el promedio de
las patas es 2,75. Si al cabo de una semana se han venido vendiendo cierto número de
pavos y han nacido ese mismo número de conejos, se tiene que el promedio ahora es 3,5.
Determinar cuántos animales nacieron ? R:30
9. En una empresa se hace un estudio sobre el número de horas que el personal deja de laborar
durante la semana. Los resultados son: 10 hs, 3 obreros ; 3 hs, 7 obreros ; 9 hs, 1 obrero ; 4
hs, 2 obreros ; 8 hs, 5 obreros ; 5 hs, 8 obreros ; 6 hs, 6 obreros. Se pide identificar : a) La
población ; b) La variable y tipo ; c) El número de valores de la variable ; d) Los valores de :
X 3 , n 2 , H 6 , h4
10. En una gran empresa, los jornales de los obreros tienen una media de $225/mes y una
desviación estándar de $50. Como solución a un conflicto laboral se proponen dos
alternativas: a) Un aumento del 20% en los salarios ; b) Un aumento del 15% en los
salarios, más una bonificación mensual de $25 a cada obrero. ¿ Cuál de las dos
alternativas le conviene aceptar al sindicato si se quiere que la distribución de los salarios
sea lo mejor posible?
[Link] conjunto de 20 valores tienen una media aritmética igual a 50, otro conjunto de 20
valores tienen una media igual a 30, la desviación estándar de los 40 valores considerados
conjuntamente es igual a 10. Calcular valor de CV del conjunto de 40 valores.
12. Sean los datos: salarios en dólares/mes de un conjunto de trabajadores de una empresa:
548, 532, 535, 528, 553, 557, 558, 542, 540, 563, 552, 568, 535, 545,
547, 519, 556, 545, 564, 550, 538, 536, 549, 546, 565, 573, 576, 561,
550, 540, 538, 542, 544, 525, 544, 526, 547, 535, 554, 546
Ordenar los datos en un cuadro de distribución de frecuencias, con: a) Límite inferior =
518 y C = 5 ; b) Método de Sturges.
17. Presente los datos gráficamente. Utilice diagramas de barras; sectores circulares y gráficas
lineales. En cada caso determine y describa las medidas estadísticas más importantes :
Donde:
(1): Procedencia de alumnos; (2) : Preferencia de postulantes a una universidad ; (3) :
Ventas de una Cía ( en miles de $ ). ; (4): accidentes de tránsito por consumo de alcohol.