Está en la página 1de 12

Guía de Ejercicios 1

Probabilidad y Estadística INMT-51 CIMT-35 MEMT-33


Lunes 21 de Marzo 2022

Mario Rojas P. Jimmy Reyes R.


Yuri Iriarte S. Pedro Cortés O.

1. En las siguientes situaciones identifique los siguientes conceptos : población, elementos, variable
y tipo de variable. Además redacte un título para una posible tabla de frecuencia.

Ejemplo

Se desea analizar el número de accidentes por turno en un mes de un grupo de trabajaores per-
tenecientes a la empresa Metalcom Ltda.
Población : Empresa Metalcom Ltda.
Elementos : Trabajadores.
Variable : Número de accidentes por turno en un mes determinado.
Tipo de variable : Cuantitativa – discreta.

Título : Distribución de trabajadores según el número de accidentes por turno en un mes deter-
minado en la empresa Metalcom Ltda.

Se desea analizar a la fecha

a) Si un estudiante ha rendido o no la Prueba de Selección Universitaria (PSU) en la segunda


región.
b) La cantidad de veces que una persona fue al cine en el último año.
c) El tiempo que una persona ha demorado en obtener una licencia de conducir.
d) Pulsaciones por minuto de un trabajador en una faena en altura.
e) El número de fichas que una persona ha llenado el último año en el consultorio norte.
f ) La distancia que un vehículo recorre en un año en la carretera.
g) Actitud ente la actividad física de jovenes de la UA.
h) Cantidad de partículas contaminantes en un período de cinco minutos en una calle de Anto-
fagasta.
i) Cantidad de trabajadores accidentados por turno en la empresa LIDER.
j) Porcentaje de cobre obtenido mediante un proceso de producción en muestras de mineral de
la minera BETA.
k) Número de cheques protestados por mes en el Banco del estado del País.
l) Cargos de los empleados de la empresa ALFA.
m) Sueldos de los empleados del Supermercado Líder.
n) Notas obtenida por los alumnos en el primer control de probabilidad y estadística.

1
2. Considere los siguientes datos sobre el tipo de problema de salud ( J = articulación hinchada,
F = fatiga, B = dolor de espalda, M = debilidad muscular, T = tos, N = nariz con flujo
o irritación, O = otro) presentado por agricultores. Obtenga una tabla de frecuencia lo más

O O N J T F B B F O
J O O M O F F O O N
O N J F J B O T J O
J J F N O B M O J M
O B O F J O O B N T
O O O M B F J O F N

completa posible y comente algunas inquietudes que Ud. tenga con respecto al contexto del
problema. La información que Ud. extraiga a de ser coerente con los resultados publicados en el
artículo científico “Physiological Effects of Work Stress and Pesticide Exposure in Tree Planting
by British Columbia Silviculture Workers". Ergonomics, 1993, pp.951-961).

3. Unos traductores de temperatura de cierto tipo se embarcan en lotes de 50. Se seleccionó una
muestra de 60 lotes y se determinó la cantidad de traductores en cada lote que no se apegaban
a las especificaciones de diseño; y resultaron los siguientes datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

a) Determine las frecuencias absolutas y relativas para los valores observados de x : cantidad de
traductores defectuosos en un lote.
b) ¿Qué proporción de lotes en la muestra tienen cuando más cinco traductores defectuosos?.
¿Qué proporción tienen menos que cinco?. ¿Qué proporción tienen cuando menos cinco
unidades defectuosas?.
c) Trace una representación gráfica y comente.

4. Loa datos siguientes representan la cantidad de trabajadores accidentados en la unidad de chan-


cado de la empresa minera El Hoyo, por día, durante 52 días de trabajo en el año 2007.

0 2 0 1 3 4 0 2 1 3 0 2 2
1 0 5 2 6 1 2 1 4 1 1 0 1
1 1 2 0 5 2 0 4 3 2 4 3 2
1 6 2 3 3 5 1 3 6 1 3 4 5

a) Identifique los siguientes conceptos : Población analizada , elementos de la población , variable


en estudio y el tipo de variable.
b) Construya una tabla de frecuencias completa para estos datos, escríbale un título y anéxele
un gráfico adecuado.
c) Con la tabla construida anteriormente entregue la siguiente información
i) ¿En cuántos días hubieron a lo más 3 accidentados?.
ii) ¿En cuántos días hubieron a lo menos 2 accidentados?.
iii) ¿En qué porcentaje de los días hubieron exactamente 5 accidentados?.

2
5. La siguiente información corresponde al peso (en Kilos) de un lote de 40 sacos de mineral en la
Empresa minera Santa María en agosto de 2012:

i Peso Ci ni
1 [100 , 110] 105 2
2 (110 , 120] 115 6
3 (120 , 130] 125 6
4 (130 , 140] 135 7
5 (140 , 150] 145 18
6 (150 , 160] 155 1
Total 40

a) Escriba un título a la tabla.


b) Realice un histograma de frecuencia, asociada a la información entregada.
c) Realice un polígono de frecuencia, asociada a la información entregada.
d) Obtega e interprete el valor de n7 , f3 , N5 y F6 .

6. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en


la vulnerabilidad a enfermedades alérgicas. El artículo (“Dust Sampling Methods for Endotoxin-
An Essential, But Underestimated Issue”, Indoor Air, 2006: 20-27) consideró temas asociados
con la determinación de concentración de endotoxina. Los siguientes datos sobre concentración
(EU/mg) en polvo asentado de una muestra de hogares urbanos y otra de casas campestres
fueron amablemente suministrados por los autores del artículo citado.

U 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
C 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3
11 11 15 15
u2i , c2i .
P P P P
a) Obtenga los valores de ui , ci y
i=1 i=1 i=1 i=1
b) Determine la media muestral de cada muestra, usando la información obtenida en a). ¿Cómo
se comparan?.
c) Determine la media muestral de cada muestra, usando la calculadora.
d) Determine la mediana muestral de cada muestra. ¿Cómo se comparan?. ¿Por qué es la me-
diana de la muestra urbana tan diferente de la media de dicha muestra?.

7. Se determinó el valor del módulo de Young (GPa) de placas fundidas compuestas de ciertos
sustratos intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and
Modulus of a Molybdenum-Coated Ti- 25A1-10Nb-3U-1Mo Intermetallic”, J. of Materials Engr.
and Performance, 1997: 46-50):

116.4 115.9 114.6 115.2 115.8


5 5
x2i .
P P
a) Determine el valor de xi y
i=1 i=1
b) A partir de la información obtenida en a), calcule la varianza.
n
1X
Sx2 = x2 − x2
n i=1 i

c) Usando calculadora determine el valor de Sx2 .


d) Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora
calcule la varianza muestral de estos valores transformados y compárela con Sx2 de los datos
originales.

3
8. Los siguientes valores de gravedad especifíca para diferentes tipos de madera usadas en cons-
trucción aparecieron en el artículo “Bolted Connection Desing Values Based on European Yield
Model"(J. of Structural Engr., 1993, pp. 2169 - 2186)

0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40 0.40


0.41 0.41 0.42 0.42 0.42 0.42 0.42 0.43 0.44
0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51 0.54
0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.68 0.75

a) Determine el porcentaje de observaciones que pertenecen al intervalo [x − Sx ; x + Sx ].


b) Determine el porcentaje de observaciones que pertenecen al intervalo [x − 2Sx ; x + 2Sx ].
c) Determine el porcentaje de observaciones que pertenecen al intervalo [x − 3Sx ; x + 3Sx ].
d) Construya una tabla de frecuencias con siete intervalos de clase para los datos proporcionados,
escríbale un título y anéxele un gráfico adecuado.
e) Con la tabla construida anteriormente responda lo siguiente
7 7
Ci2 ni .
P P
i) Obtenga los valores de Ci n i ,
i=1 i=1
2i) Con la información obtenida en i), obtenga la media aritmética y la desviación estándar.
3i) Use calculadora para obtener los valores de la media aritmética y la desviación estándar.
4i) Determine el porcentaje de observaciones que pertenecen al intervalo [x − 2Sx ; x + 2Sx ].
5i) Obtenga e interprete la moda y la mediana.
6i) Determine el porcentaje de muestras con una gravedad específica inferior o igual a 0.43.

9. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un artículo en
Technometrics (vol. 19, p. 425), revista dedicada a las aplicaciones estadísticas en ciencias físicas
e ingeniería.

88.5 95.6 88.3 94.2 89.2 93.3 89.8 87.7 93.3 87.6
92.7 88.3 91.8 89.6 83.4 94.7 84.3 93.2 85.3 92.3
87.4 86.7 91.1 86.7 91.0 87.9 90.4 88.9 87.5 91.0
88.2 90.3 88.6 90.1 91.2 91.5 94.2 90.8 93.4 90.9
93.0 89.3 88.6 87.8 88.3 88.5 89.0 88.7 94.4 100.3
89.9 98.8 90.1 96.1 89.9 92.7 91.8 90.4 92.2 91.6
89.3 92.2 90.4 89.7 91.2 91.1 90.3 91.0 92.6 91.6
92.2 89.8 90.5 90.0 90.6 93.7 90.7 91.1 92.7 93.7

a) Construya una tabla de frecuencias lo más completa posible para los datos proporcionados,
escríbale un título y anéxele un gráfico adecuado.
b) Con la tabla construida anteriormente responda lo siguiente
i) Obtenga e Interprete n6 , F5 , N3 y f4 .
ii) Obtenga e interprete P28 y Q3 .
iii) Obtenga e interprete la moda y la mediana.
iv) Si el 15 % de las muestras con menor octanaje son consideradas como de mala calidad,
el 20 % de las muestras con mayor octanaje se consideran de calidad superior y las
demás muestras son consideradas como normales.¿Entre qué valores una muestra será
considerada como normal?.
v) Determine el porcentaje de muestras con un octanaje superior o igual a 89.0.
m m
Ci2 ni .
P P
c) Obtenga los valores de Ci n i ,
i=1 i=1
d) Con la información obtenida en c), obtenga la media aritmética y la desviación estándar.
e) Use calculadora para obtener los valores de la media aritmética y la desviación estándar.

4
10. La tabla siguiente corresponde al peso de 127 sacos de mineral (en Kgs). obtenidos en la empresa
minera Cerro Amarillo en agosto de 2013.

i Peso ni
1 [40 ; 50] 2
2 (50 ; 60] 12
3 (60 ; 70] 36
4 (70 ; 80] 40
5 (80 ; 90] 28
6 (90 ; 100] 5
7 (100 ; 110] 4

a) Escribale un título a la tabla.


b) Determine para el peso de los sacos la moda y el cuartil 3 interpretando los valores obtenidos
por separado según el enunciado del problema.
c) Determine un intervalo para el peso que contenga el 60 % central de la distribución de los
sacos.
d) Determine el porcentaje de sacos con un peso mayor o igual a 83 kilos. Fundamente su
respuesta.

11. La siguiente tabla muestra el análisis de la edad de 200 trabajadores de la empresa constructora
Ladrillos Ltda. en marzo de 2008.

i Edad ni fi Ni Fi
1 [15 ; 25] 16
2 (25 ; 35] 0.23 0.31
3 (35 ; 45] 52 114
4 (45 ; 55] 0.76
5 (55 ; 65] 30
6 (65 ; 75] 0.09

a) Escribale un título a la tabla adjunta.


b) Complete la tabla dada e interprete los valores n5 , f2 , N4 y F5 .
c) ¿ Qué porcentaje de trabajadores tiene una edad mayor o igual a 30 y menor o igual a 60
años?.
d) Construya un polígono de frecuencias asociado a la tabla adjunta..

12. Un diagrama de Pareto es una variación de un histograma para datos categóricos resultantes
de un estudio de control de calidad. Cada categoría representa un tipo diferente de inconformi-
dad con el producto, o problema de producción. Las categorías están ordenadas de modo que
aquella que tiene la frecuencia más grande aparece a la extrema izquierda, luego la categoría
con la segunda frecuencia más grande, y así sucesivamente. Suponga que se obtiene la siguiente
información por inconformidad en paquetes de circuito : componente con falla, 126; componente
incorrecto, 210; soldadura insuficiente, 67; soldadura excesiva, 54; y componente faltante, 131.
Construya un diagrama de Pareto y comente.

5
13. I) En años recientes, se ha utilizado con éxito un resumen gráfico llamado gráfica de caja o
Box Plot para describir varias de las características más prominentes de un conjunto de
datos. Estas características incluyen 1) el centro, 2) la dispersión, 3) el grado y naturaleza
de cualquier alejamiento de la simetría y 4) la identificación de las observaciones “extremas
o apartadas” inusualmente alejadas del cuerpo principal de los datos.

El diagrama se basa en cinco cantidades xmin , P25 , mediana, P75 y xmax . Primero, se traza
una escala vertical de medición. A continuación, se pone un rectángulo sobre este eje; su orilla
inferior está en P25 y la superior en P75 , por lo que el ancho de la caja = fs (fs = P75 − P25 ).
Se traza un segmento de recta horizontal dentro del rectángulo, en lugar de la mediana. Por
último, se trazan bigotes o brazos que salen de ambos lados del rectángulo, hacia las obser-
vaciones mínima y máxima.

Observación
a) La posición del símbolo de la mediana en relación a las dos orillas plasma la información
de asimetría en el 50 % intermedio de los datos.
b) Toda observación inferior a P25 −1,5fs o bien superior a P75 +1,5fs es inusual. Un valor
inusual es extremo o atípico si es inferior a P25 − 3,0fs o bien superior a P75 + 3,0fs ,
y es moderado en cualquier otro caso.
II) Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico,
con una muestra de 26 especímenes, y se obtuvieron los siguientes datos (“The Lognor-
mal Distribution for Modeling Quality Data when the Means Is Near Zero", J. of Quality
Technology, 1990, pp. 105 - 110) Trece un diagrama de caja y comente sus particularidades.

30 30 60 63 70 79 87 90 101 102 115 118 119


119 120 125 140 145 172 182 183 191 222 244 291 511

14. Dado el siguiente gráfico correspondiente a la distribución de 40 sectores según el nivel de con-
taminación en el Área Metropolitana Septiembre 2010,responda

a) ¿Cuántos sectores no tienen índice de contaminación peligroso?.


b) Construya una tabla de frecuencia lo más completa posible.
c) Usando la tabla de frecuencia pedida en b) determine el índice de calidad más frecuente en
la región metropolitana.

6
15. El jefe de servicio donde usted trabaja le pide que dado el siguiente gráfico

a) Obtener e interpretar n2 , f3 , N4 y F3
b) Calcular e interpretar el nivel medio de colesterol de los trabajadores.
c) Calcular e interpretar la moda.
d) Calcular e interpretar la mediana.

16. Una empresa realiza su trabajo diario en tres turnos: A, B y C. Los números de trabajadores
por turno están en relación 7 : 5 : 4, constituyendo un total de 160 trabajadores. Los salarios
promedios diarios, por turno, son: $ 8000, $ 10000, $ 12000, y sus correspondientes desviaciones
estándar, son: $ 1200, $ 900, $ 1000, respectivamente. Si la empresa piensa hacer un aumento
salarial según el siguiente criterio: reajuste de 15 % más un bono de $ 1000, para cada trabajador
del turno A, reajuste del 18 % para cada trabajador del turno B, y sólo un bono de $ 700 para
cada trabajador del turno C.

a) ¿Conseguiría la empresa hacer más homogéneos los sueldos de todos los trabajadores en su
conjunto?. Justifique estadísticamente su respuesta.
b) Si la gerencia establece que la plantilla diaria no debe aumentar más del 12 %, por lo que decide
modificar el bono de los trabajadores del turno A. ¿Cuál es el mayor bono, en cantidades
enteras, que puede otorgar al turno A, además del reajuste, para lograr el objetivo de la
empresa?.

17. Una fábrica produce tres tipos de artículos: ropa, electrodomésticos y juguetes. La producción de
ropa es el doble que la de electrodomésticos y la tercera parte que la de juguetes. El costo medio
de la ropa es de $ 52000 y su desviación estándar es de $ 100.6, el costo medio de los juguetes es
de $ 3500 con una varianza de 19684.09, resultando un costo medio de todos los artículos de $
4000 y un coeficiente de variación total de 50 %. Se requiere aumentar los costos para lograr un
costo medio total de $ 5000 aumentando en un 3 % el costo de la ropa y en un 7 % el costo de
los electrodomésticos.

i) ¿Cuál es el costo medio inicial y la varianza de los electrodomésticos?.


ii) ¿En qué porcentaje variará el costo de los juguetes?.
iii) ¿En qué porcentaje cambió la desviación estándar de los costos de todos los artículos?.

7
18. Uno de los problemas más desafiantes que enfrenta el campo de control de la contaminación del
agua lo presenta la industria del curtido de pieles. Los desechos de las curtidurías son química-
mente complejos. Se caracterizan por los altos valores de demanda bioquímica de oxígeno, sólidos
volátiles y otras medidas de contaminación. Considérese los siguientes datos experimentales, que
se obtuvieron de 40 muestras de desechos químicamente tratados en un estudio que realizó el
Instituto Politécnico y Universidad Estatal de Virginia. Se registraron las lecturas de X : reduc-
ción porcentual de sólidos totales, e Y : reducción porcentual en la demanda química de oxígeno
para las 40 muestras.

X \Y [5 ; 16] (16 ; 27] (27 ; 38] (38 ; 49] Total


[3 ; 15] 4 2 1 0 7
(15 ; 27] 2 0 2 0 4
(27 ; 39] 0 3 13 3 19
(39 ; 51] 0 0 1 9 10
Total 6 5 17 12 40
4 4 4 4 4 P
4
Ci2 ni• , Dj2 n•j y
P P P P P
b) Obtenga los valores de Ci ni• , Dj n•j , Ci Dj nij .
i=1 i=1 j=1 i=1 i=1 j=1
c) Se cree que la reducción porcentual en la demanda química de oxígeno es más homogénea
en aquellas muetras cuya reducción porcentual de sólidos es superior o igual a 3 e inferior
o igual a 15, que en aquellas muetras cuya reducción porcentual de sólidos es superior 27
e inferior o igual a 39. ¿Cuál es su opinión?, justifique plenamente su respuesta mediante
algún estadigrafo visto en clases.
d) Con la información obtenida en b), obtenga la covarianza.
e) Mediante algún estadigrafo visto en clases justifique el tipo de relación que existe entre la
reducción porcentual de sólidos totales y la reducción porcentual en la demanda química de
oxígeno.

19. La relación de eficiencia para un espécimen de acero sumergido en un tanque de fosfatizado es


el peso del recubrimiento de fosfato dividido entre la pérdida de metal (ambos en mg/pie2 ). El
artículo “Statistical Process Control of a Phosphate Coating Line"(Wire J. Intl., mayo de 1997,
pp. 78 - 91) contenía los siguientes datos sobre temperatura del tanque (X) y relación de eficiencia
(Y ).

X 170 172 173 174 174 175 176 177 180 180 180 180
Y 0.84 1.31 1.42 1.03 1.07 1.08 1.04 1.80 1.45 1.60 1.61 2.13

X 180 181 181 182 182 182 182 184 184 185 186 188
Y 2.15 0.84 1.43 0.90 1.81 1.94 2.68 1.49 2.52 3.00 1.87 3.08

a) Con los datos anteriores complete la siguiente tabla de frecuencias.


X \Y [0.84 ; 1.40] (1.40 ; 1.96] (1.96 ; 2.52] (2.52 ; 3.08]
[170 ; 176]
(176 ; 182]
(182 ; 188]
Las siguientes preguntas deberán ser contestadas a partir de la tabla anterior.
b) Cree Ud. que la relación de eficiencia es más homogenea que la temperatura. Justifique su
respuesta mediante algún estadigrafo estudiado en clases.
c) ¿ El valor de la relación de eficiencia está directamente o inversamente relacionado con la
temperatura?. Justifique su respuesta mediante algún estadigrafo estudiado en clases.

8
20. En una planta mecánica se analiza la relación entre la velocidad X de un motor (revoluciones
por minuto) y la temperatura Y (en o C) obteniéndose la siguiente información.

X \Y [50 ; 60] (60 ; 70] (70 ; 80] (80 ; 90] (90 ; 100] Total
[600 ; 800] 4 2 0 0 0 6
(800 ; 1000] 3 6 1 0 0 10
(1000 ; 1200] 0 1 5 2 0 8
(1200 ; 1400] 0 0 3 2 1 6
Total 7 9 9 4 1 30

a) Construya una tabla completa y un gráfico adecuado para mostrar la velocidad de los motores
y en la tabla calcule e interprete, N3 , F2 y la mediana.
b) Para la temperatura de los motores determine un intervalo centrado en la media aritmética
y de longitud dos veces la desviación estándar. ¿Qué porcentaje de casos cae dentro de este
intervalo?.
c) El encargado del Departamento de control considera que el 20 % de los motores de más baja
temperatura y el 15 % de los motores de más alta temperatura no cumplen las normas de
calidad. Determine los límites de calidad para tomar tal decisión.
d) El mecánico jefe afirma que la velocidad de los motores es más homogénea cuando la tempe-
ratura está entre 60 o C y 70 o C que cuando la temperatura está entre 70 o C y 80 o C. ¿Qué
opina usted al respecto?. Justifique su respuesta con cifras estadísticas indicadoras.

21. Responda las siguientes situaciones justificando con conceptos estadisticos vistos en clases y
realizando un desarrollo adecuado cuando sea necesario.

a) ¿Qué tipo de gráficos son adecuados para representar la distribución de frecuencias de una
variable cuantitativa discreta?. Nómbrelos.
b) Sea Y − 2X = 3, 2 =3
SX y X = 40. Calcule el valor de Y y SY .
c) Los registros del peso de 10 sacos de mineral, marcan en promedio 200 kg. En la oficina de
control se pierde el registro del peso de un saco y se sabe que el promedio del resto es 190
kg. ¿Cuál es el peso del saco al que le perdieron su registro?.
d) ¿Qué información se puede obtener al calcular la covarianza entre dos variables?.
e) El promedio y la desviación estándar de la longitud de los tornillos producidos en una fábrica
son 5 cm. y 1.5 cm., respectivamente. Si el instrumento con el cual se ha medido la longitud
está descalibrado, registrando sólo el 90 % de la longitud correcta, más 0.5 cm. Obtenga el
coeficiente de variación de la longitud correcta de los tornillos.
f ) Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol
en la sangre de un grupo de trabajadores, ¿Qué medida estadística es la adecuada para
hacer la comparación?.
g) ¿Qué gráficos son adecuados para representar la distribución de frecuencias de una variable
cualitativa ordinal?.
h) ¿Qué tipos de gráficos es adecuado para representar la distribución de frecuencias de una
variable cuantitativa discreta?.
i) El promedio y la desviación estándar de la longitud de los tornillos producidos en una fábrica
son 5 cm. y 1.5 cm., respectivamente. Si el instrumento con el cual se ha medido la longitud
está descalibrado, registrando sólo el 90 % de la longitud correcta, más 0.5 cm. Obtenga el
coeficiente de variación de la longitud correcta de los tornillos.
j) Los registros del peso de 10 sacos de mineral, marcan en promedio 200 kg. En la oficina de
control se pierde el registro del peso de un saco y se sabe que el promedio del resto es 190
kg. ¿Cuál es el peso del saco al que le perdieron su registro?.

9
k) Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol
en la sangre de un grupo de trabajadores, ¿Qué medida estadística es la adecuada para
hacer la comparación?.
l) ¿Cuál es la medida del ángulo del sector circular, en un gráfico sectorial o circular, que repre-
senta a una categoría, cuya frecuencia absoluta es 80, de un total de 400 datos?
m) Para comparar la dispersión relativa del índice de masa corporal y el peso de un grupo de
trabajadores, ¿Qué medida estadística es la adecuada para hacer la comparación?
n) El sueldo promedio de todos los trabajadores de una fábrica es de $580000. Si el sueldo
promedio pagado a hombres y mujeres es de $620000 y $520000 respectivamente. ¿Cuál es
el porcentaje de hombres y mujeres que hay en la fábrica?.
ñ) ¿Qué medida de tendencia central se puede obtener sin importar la naturaleza de la variable?.

10
FORMULARIO
ESTADISTICA DESCRIPTIVA
PROBABILIDAD Y ESTADÍSTICA

Estadígrafo Datos no agrupados Datos agrupados

n m
1 P 1 P
Media Aritmética x= n xi x= n Ci n i
i=1 i=1
h i
ni −ni−1
Moda Mo Mo = Lim Inf i + (ni −ni−1 )+(ni −ni+1 ) A
h n −N i
i−1
Mediana Me Me = Lim Inf i + 2
ni A
 i·n

−Nk−1
Percentiles Pi Pi = Lim Inf k + 100
nk A

n m
1 1
Sx2 = x2i − x2 Sx2 = Ci2 ni − x2
P P
Varianza n n
i=1 i=1

Sx Sx
Coeficiente de Variación C.V = x 100 % C.V = x 100 %

Percentiles datos no agrupados

(n + 1) · i (n + 1) · i
   
Pi = (k + 1) − x(k) + − k x(k+1)
100 100

11
Media Aritmética Total para k-submuestras
k
1X
xT = ni xi
n i=1
k
X ni
= pi xi , donde pi = i = 1, 2, . . . , k.
i=1
n

Varianza Total para k-submuestras

k k
!2
1X 1X
ST2 = ni (Si2 + xi 2 ) − ni xi
n i=1 n i=1
k k
!2
X X ni
= pi (Si2 2
+ xi ) − pi xi , donde pi = i = 1, 2, . . . , k.
i=1 i=1
n

Covarianza datos no agrupados


n
1X
Cov(x, y) = x i yi − x y
n i=1

Covarianza datos agrupados


m X r
1X
Cov(x, y) = Ci Dj nij − x y
n i=1 j=1

12

También podría gustarte