Está en la página 1de 15

TALLER DE ESTADÍSTICA II

INTEGRANTES:

 CASTRO PEREZ STEBAN JOSE - 1193530985


 CLAVIJO RANGEL KEVIN ALEJANDRO – 1096958850
 PEÑALOZA GAMBA NICOLÁS - 1007398299
 ROZO GUERRERO JIMMY DADNOVER – 1053347453

ENTREGADO A:
GLADYS MONTAÑEZ ACEVEDO

UNIVERSIDAD DE PAMPLONA
FACULTAD DE INGENIERÍAS Y ARQUITECTURA
INGENIERÍA DE SISTEMAS
ESTADÍSTICA II
PAMPLONA, NORTE DE SANTANDER
2020
1. Una población consta de los cinco valores siguientes: 2,2,4,4,8

a. ¿Cuál es la media poblacional μ?


Respuesta:
(𝟐+𝟐+𝟒+𝟒+𝟖)
𝛍= 𝟓
= 4; Es la media poblacional

b. ¿Cuántas muestras de tamaño 2 sin remplazamiento hay?


Respuesta:
N Combinatoria de 2 = NC2
Siendo N = 5, por ser la población
Usando la fórmula de la combinatoria:
5!
5C2 = (2!(5−2)!)
= 10

c. ¿Cuáles son las muestras?


Respuesta:
Supongamos que
A = 2, B = 2, C = 4, D = 4, E = 8. Que son cinco valores (población).
En muestras de 2 sin reemplazo las muestras serían las siguientes:
(A, B) (A, C) (A, D) (A, E) (B, C) (B, D) (B, E) (C, D) (C, E) (D, E)
Que reemplazando las letras por lo números seria:
(2, 2) (2, 4) (2, 4) (2, 8) (2, 4) (2, 4) (2, 8) (4, 4) (4, 8) (4, 8)
Siendo estas las diez muestras posibles de tamaño 2

d. ¿Cuál es la media de cada muestra?


Respuesta:
2+2
x̅i (2,2) = 2 = 2
2+4
x̅i (2,4) = 2
=3
2+4
x̅i (2,4) = =3
2
2+8
x̅i (2,8) = 2
=5
2+4
x̅i (2,4) = =3
2
2+4
x̅i (2,4) = =3
2
2+8
x̅i (2,8) = 2
=5
4+4
x̅i (4,4) = 2
=4
4+8
x̅i (4,8) = =6
2
4+8
x̅i (4,8) = 2
=6
e. Cuál es la media de las medias μx. Puede asegurar que μ = μx
Respuesta:
2+3+3+5+3+3+5+4+6+6
𝜇𝑥 = 10
= 4; Media de las medias
(𝟐+𝟐+𝟒+𝟒+𝟖)
μ= 𝟓
= 4; Es la media poblacional
Entonces μ = μx; La media de las medias es igual a la media
poblacional

f. Cuál es la distribución de muestreo de medias. Realice una gráfica sobre la


distribución de medias muestrales. En el plano cartesiano P(x) y x̅i
Respuesta:
La distribución de medias es μx
N de muestras
Promedios:
2 se repite 1 vez
3 se repite 4 veces
5 se repite 2 veces
4 se repite 1 vez
6 se repite 2 veces

Para un total de 10 muestras


Entonces 10/100 = 0.1%

Probabilidad
2 tiene la probabilidad de 1*0.1 = 0.1 Veces que se repite * 0.1 es la
3 tiene la probabilidad de 4*0.1 = 0.4 probabilidad
5 tiene la probabilidad de 2*0.1 = 0.2
4 tiene la probabilidad de 1*0.1 = 0.1
6 tiene la probabilidad de 2*0.2 = 0.2

 Grafica

0,5

0,4

0,3

0,2

0,1

0
2 3 4 5 6
2. La variable aleatoria X, que representa el número de cerezas en una torta, tiene la
siguiente distribución de probabilidad:

X 4 5 6 7
P(X=x) 0.2 0.4 0.3 0.1

a. Calcule e interprete la media poblacional μ y la desviación σ de X


Respuesta:
Media poblacional:
4+5+6+7
𝜇 = = 5,5
4
Desviación Poblacional:
(4 − 5,5)2 (5 − 5,5)2 (6 − 5,5)2 (7 − 5,5)2
𝜎= √ + + + = 1,18
4 4 4 4

b. Calcule la media μx y la σx̅ 2de la media x̅ para muestras aleatorias de 36


tortas de cereza.
Respuesta:
La media 𝜇𝑥:
𝝁𝒙 = 𝝁 = 𝟓, 𝟓

La varianza media para una muestra aleatoria de n = 36 tortas de


cereza:
𝝈𝟐 (𝟏, 𝟏𝟏𝟖)𝟐
𝝈𝒙 𝟐 = = = 𝟎. 𝟎𝟑𝟒𝟕
𝒏 𝟑𝟔

c. Calcula la probabilidad de que el numero promedio de cerezas 36 tortas sea


menor que 5.5
Respuesta:

̅ − 𝝁𝒙
𝒙 ̅ 𝟓. 𝟓 − 𝟓. 𝟓
𝑷( 𝒙 < 𝟓. 𝟓 ) = 𝑷 (𝒛 < ) = 𝑷 (𝒛 < ) = 𝑷(𝒛 < 𝟎) = 𝟎. 𝟓
̅
𝝈𝒙 𝟏. 𝟏𝟖
√𝟑𝟔
La probabilidad de que el número de cerezas en 36 tortas sea menor que
5.5 es 0.5 (50%)
3. La vida media de una máquina para elaborar pan es de 7 años, con una desviación
estándar de 1 año. Suponga que la vida de estas máquinas sigue aproximadamente
una distribución normal y calcule
a. La probabilidad de que la vida media de una muestra aleatoria de 9 de estas
máquinas caiga entre 6.4 y 7.2 años.
Respuesta:

X = Vida útil de una máquina de hacer pasta (Variable aleatoria)


μ = 7 Años (Media poblacional)
σ = 1 Año
n = 9 maquinas
σ 1 1
𝑁 (𝜇, ) = 𝑁 (7, ) = 𝑁 (7, )
√𝑛 √9 3

𝟔. 𝟒 − 𝟕 𝑿 − 𝛍 𝟕. 𝟐 − 𝟕
𝑷(𝟔. 𝟒 < 𝑿 < 𝟕. 𝟐) = 𝑷 ( < 𝛔 < )
𝟏 𝟏
𝟑 √𝒏 𝟑
= 𝑷(−𝟏. 𝟖 < 𝒛 < 𝟎. 𝟔) = 𝑷(𝒛 < 𝟎. 𝟔) − 𝑷(𝒛 < −𝟏. 𝟖)

Usando la tabla para buscar los “z”:

= 𝟎. 𝟕𝟐𝟓𝟕 − 𝟎. 𝟎𝟑𝟓𝟗 = 𝟎. 𝟔𝟖𝟗𝟖

La probabilidad de que la vida de una muestra de 9 máquinas caiga


entre 6.4 años y 7.2 años es de 0.6898 (68.98%)

4. El número de accidentes laborales/mes en la empresa MILPA S.A con tres sedes


(Bogotá, Panamá y Brasil) se presenta en la siguiente tabla:
Por Por no poseer la Por imprudencia Imprevistos
seguridad Dotación indicada del operario
industrial
23 9 16 25
43 7 25 4
12 5 25 7
33 0 34 6
34 8 53 7
45 10 18 8
65 12 22 9
82 5 15 11
28 5 7 17
25 2 12 8
40 1 10 7
26 8 8 22
a. Calcule e interpreta los parámetros para cada uno de las columnas
Respuesta:
Por seguridad industrial
23 + 43 + 12 + 33 + 34 + 45 + 65 + 82 + 28 + 25 + 40 + 26
𝝁= = 38
12
(23 − 38)2 + (43 − 38)2 + (12 − 38)2 + (33 − 38)2 + (34 − 38)2 + (45 − 38)2
𝝈𝟐 =
12
(65 − 38)2 +(82 − 38)2 +(28 − 38)2 +(25 − 38)2 +(40 − 38)2 +(26 − 38)2
+
12
= 𝟑𝟒𝟏. 𝟓
Por no poseer la Dotación indicada
9 + 7 + 5 + 0 + 8 + 10 + 12 + 5 + 5 + 2 + 1 + 8
𝝁𝒙 = =6
12
(9 − 6)2 + (7 − 6)2 + (5 − 6)2 + (0 − 6)2 + (8 − 6)2 +(10 − 6)2 +(12 − 6)2
𝝈𝟐 =
12
(5 − 6)2 + (5 − 6)2 + (2 − 6)2 + (1 − 6)2 + (8 − 6)2
+ = 𝟏𝟐. 𝟓
12
Por imprudencia del operario
16 + 25 + 25 + 34 + 53 + 18 + 22 + 15 + 7 + 12 + 10 + 8
𝝁= = 20.41666
12

𝟐
(16 − 20.42)2 + (25 − 20.42)2 + (25 − 20.42)2 + (34 − 20.42)2 + (53 − 20.42)2
𝝈 =
12
+(18 − 20.42)2 + (22 − 20.42)2 + (15 − 20.42)2 + (7 − 20.42)2 + (12 − 20.42)2 +
+
12
(10 − 20.42)2 + (8 − 20.42)2
+ = 𝟏𝟓𝟒, 𝟗𝟎𝟗𝟕𝟐𝟐𝟐𝟐
12
Imprevistos
25 + 4 + 7 + 6 + 7 + 8 + 9 + 11 + 17 + 8 + 7 + 22
𝝁= = 10.91666
12
(25 − 10.92)2 + (4 − 10.92)2 + (7 − 10.92)2 + (6 − 10.92)2 + (7 − 10.92)2
𝝈𝟐 =
12
+(8 − 10.92)2 + (9 − 10.92)2 + (11 − 10.92)2 + (17 − 10.92)2 + (8 − 10.92)2 +
+
12
(7 − 10.92)2 + (2 − 10.92)2
+ = 𝟒𝟏, 𝟒𝟎𝟗𝟕𝟐𝟐
12

b. Tome una muestra aleatoria de cada uno de las columnas de cinco


elementos. Calcule e interprete los estadísticos.
Respuesta:
Muestreo de la Columna de Por Seguridad Industrial: 23, 12, 33, 65, 26

23 + 12 + 33 + 65 + 26
𝝁𝒙 = = 31.8
5
(23 − 31.8) + (12 − 31.8) + (33 − 31.8) + (65 − 31.8) + (26 − 31.8)
𝜎 2𝑥 =
5−1
= 401,7
Muestreo de la Columna de Por no tener la Dotación Adecuada: 7, 5, 0,
5, 1

7+5+0+5+1
𝝁𝒙 = = 3.6
5
(7 − 3.6) + (5 − 3.6) + (0 − 3.6) + (5 − 3.6) + (1 − 3.6)
𝜎 2𝑥 = = 8.8
5−1

Muestreo de la Columna de Por imprudencia del Operario: 25, 53, 15, 7,


8

25 + 53 + 15 + 7 + 8
𝝁𝒙 = = 21.6
5
(25 − 21.6) + (53 − 21.6) + (15 − 21.6) + (7 − 21.6) + (8 − 21.6)
𝜎 2𝑥 =
5−1
= 359.8

Muestreo de la Columna de Imprevistos: 6, 7, 9, 17, 22

6 + 7 + 9 + 17 + 22
𝝁𝒙 = = 12.2
5
(6 − 12.2) + (7 − 12.2) + (9 − 12.2) + (17 − 12.2) + (22 − 12.2)
𝜎 2𝑥 =
5−1
= 48.7

c. Para la columna “Accidentes laborales por Seguridad industrial” Halle los


errores de muestreo
Respuesta:
Tomando como porcentaje de confianza 95%
𝛼 = 5% = 0.05
1 − 𝛼 = 0.95
𝛼
= 0.025
2
0.95 + 0.025 = 0.975
Al buscar 0.975 en la tabla Z se obtiene el valor
Z = 1.95

Usando la formular de error muestral


𝝈
𝑬𝒓𝒓𝒐𝒓 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 = 𝒁
√𝒏
2
Tenemos 𝜎 = 401.7 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 √𝜎 2
= √401.7
𝑝𝑎𝑟𝑎 𝑜𝑏𝑡𝑒𝑛𝑒𝑟 𝜎 = 20.0424549395
Reemplazando en la formula
(20.0424549395)
𝑬𝒓𝒓𝒐𝒓 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 = (1.95) = 𝟏𝟕. 𝟒𝟕𝟖𝟑𝟓𝟑𝟕𝟓𝟓𝟓
√5
El error muestral es de 17.4783537555
d. A fin de tomar decisiones, presente la situación de accidentes laborales en
la empresa MILPA S.A en una gráfica.
Respuesta:

Media Poblacional
40

35

30

25

20

15

10

0
Por seguridad industrial Por no poseer la Por imprudencia del Imprevistos
dotación indicada operario

Accidentes laborales

e. Busque una definición sobre “Diagrama de Pareto”. Cómo podría


relacionarlo con el asunto del ítem d.
Respuesta:

El diagrama de Pareto es una gráfica que organiza valores, los cuales están
separados por barras y organizados de mayor a menor, de izquierda a
derecha respectivamente.
Esta gráfica permite asignar un orden de prioridades para la toma de
decisiones de una organización y determinar cuáles son los problemas más
graves que se deben resolver primero.
Su finalidad, es hacer visibles los problemas reales que están afectando el
alcanzar los objetivos de la empresa y reducir las pérdidas que esta posee.

Agrupación de datos:

Categoría: Accidentes laborales.


Frecuencia: En un determinado número de accidentes, cuáles ocurrieron
por cuál problema.
CATEGORÍA FRECUENCIA
Por seguridad industrial 38
Por no poseer la dotación indicada 6
Por imprudencia del operario 20,41666
Imprevistos 10,91666
TOTAL 75,33332

Organización de datos:
Organizar la tabla de acuerdo con el orden decreciente de frecuencia y
agregar la frecuencia acumulada de los casos sumando la frecuencia
anterior con la siguiente.

CATEGORÍA FRECUENCIA FRECUENCIA


ACUMULADA
Por seguridad industrial 38 38
Por imprudencia del operario 20,41666 58,41666
Imprevistos 10,91666 69,33332
Por no poseer la dotación 6 75,33332
indicada
TOTAL 75,33332

Añadir valores porcentuales:

Añadir otra columna para agregar los valores porcentuales unitarios.


El cálculo se determina mediante la fórmula: La frecuencia/total de
frecuencia x 100.
Ejemplo: Por seguridad industrial= (38/75,33332) x 100= 50% (aproximado).

CATEGORÍA FRECUENCIA FRECUENCIA PORCENTAJE


ACUMULADA UNITARIO (%)
Por seguridad 38 38 50
industrial
Por imprudencia del 20,41666 58,41666 27
operario
Imprevistos 10,91666 69,33332 15
Por no poseer la 6 75,33332 8
dotación indicada
TOTAL 75,33332 100%
Agregar los porcentajes acumulados:

Al igual que la frecuencia acumulada, se suma el porcentaje unitario anterior


con el siguiente.

CATEGORÍA FRECUENCIA FRECUENCIA PORCENTAJE PORCENTAJE


ACUMULADA UNITARIO (%) ACUMULADO
(%)
Por 38 38 50 50
seguridad
industrial
Por 20,41666 58,41666 27 77
imprudencia
del operario
Imprevistos 10,91666 69,33332 15 92
Por no 6 75,33332 8 100
poseer la
dotación
indicada
TOTAL 75,33332 100%

Media Poblacional
100%
70
90%
60 80%
70%
50
60%
40
50%
30 40%
30%
20
20%
10
10%
0 0%

Frecuencia Porcentaje acumulado


f. Estime mediante un intervalo de confianza el número de accidentes
promedio por imprevistos de la empresa MILPA S.A. Use un nivel de
significancia del 5%.
Respuesta:

Datos: 25, 4, 7, 6, 7, 8, 9, 11, 17, 8, 7, 22.

Se trata de una muestra pequeña, pues n = 12 datos. Por lo cual se aplicará


la siguiente fórmula:

𝑠 𝑠
𝑀𝑒𝑑𝑖𝑎 = [𝑥 − 𝑡 ≤𝜇≤𝑥+𝑡 ]
√𝑛 √𝑛

Para calcular a t (t-student), buscamos tabla para dos colas.


Si α = 5%, y n-1 = 11 entonces:

t 0,05 y 11 grados de libertad = 2,201.

Reemplazamos los valores en la fórmula de la media:

6,72 6,72
𝑀𝑒𝑑𝑖𝑎 = [10,916 − 2,201 ≤ 𝜇 ≤ 10,916 + 2,201 ] = [6,7 ≤ 𝜇 ≤ 15,2]
√12 √12

Se estima con una confianza del 95% que el número de los accidentes
promedio por imprevistos de la empresa MILPA S.A, oscila entre 6,7 y 15,2.
5. Considere el último directorio telefónico residencial disponible de una gran ciudad.
Asuma que se dispone de recursos (tiempo y dinero) únicamente para hacer 1000
llamadas efectivas (aquellas donde se logra obtener la información buscada) con el
fin de estimar el porcentaje de personas que han sido víctimas de algún hecho
punible (atraco, robo, lesiones personales, violación, etc.)

a. ¿Cómo recomienda que se deben seleccionar las llamadas?


Respuesta:
Se recomienda usar el muestreo probabilístico y su tipo muestreo
aleatorio simple ya que cada persona de dicha población X tendría la
misma probabilidad de ser elegida entre las 1000 llamadas que se van a
realizar, lo cual permitiría el cálculo rápido de medias y varianzas,
evitaríamos así el sesgo estadístico en la selección y estimaríamos mucho
mejor y con más precisión el porcentaje de las personas que han sido
víctimas de un hecho punible.

b. ¿Qué opinión le merece el directorio como marco muestral?


Respuesta:
Adecuado puesto que es un mecanismo que permite identificar de buena
manera los elementos que pertenecen a la población de los cuales se
necesitan estimar ciertas variables, cabe destacar que se posee el listado de
todas las personas que pertenecen a dicha población, no hay elementos los
cuales estén fuera de los que se requieren para el caso de estudio.

c. ¿Cuál sería la población objetivo?


Respuesta:
Todas las personas que pertenecen a la ciudad en donde se va a realizar el
estudio y la toma de datos.

d. ¿Cuál sería la población de muestreo?


Respuesta:
Todas las personas que pertenecen al directorio telefónico residencial.

e. ¿Cuál sería la unidad de muestreo?


Respuesta:
La unidad de muestreo sería cada habitante que pertenezca al directorio
telefónico residencial y se halla llamado para consultarle si ha sido víctima
de algún hecho punible.
f. ¿Cuáles podrían ser algunas unidades de análisis?
Respuesta:
Se podría analizar si había personas presentes en el lugar de los hechos, si
alguna intervino, en qué lugar ocurrió este hecho y las personas que
estuviesen enteradas de estos hechos antes del análisis.

6. Suponga que se desea conocer la opinión de los habitantes de un sector de alto


crecimiento urbano en una gran ciudad, con respecto a las principales necesidades
de dicho sector. Para ello se diseña una encuesta, mediante entrevista personal en
una muestra de hogares seleccionada previamente a partir de un mapa detallado
de las manzanas existentes en 2015.
a) ¿Considera que el mapa sería un marco muestral apropiado en este
caso?
 Respuesta:
El marco muestra es lo más apropiado, debido a que existe una
referencia de un mapa detallado para poder hacer entrevistas en los
hogares donde se cree que se puede obtener una mejor información
respecto a las necesidades que presenta dicho sector, ya que todos los
habitantes tendrían la misma probabilidad de participar en la entrevista
b) ¿Cuál cree que podría ser la unidad primaria de muestreo?
 Respuesta:
La unidad primaria de muestreo seria los habitantes ya que estos son
los seleccionados para el estudio de las principales necesidades del
sector que se estudia.
c) ¿Cuál cree ser la unidad secundaria de muestreo?
 Respuesta:
La unidad secundaria de muestreo seria el sector de las residencias o
las manzanas que existen.
d) ¿Cómo podría remediarse, si existen, los problemas de este marco
muestral?
 Respuesta:
Para remediar los posibles problemas del marco muestral se podría
realizar una ponderación a los resultados previamente obtenidos por
medio de la encuesta, con la finalidad de moderar los datos.

7. MEDTEC, es una fábrica de alimentos. Un supervisor de calidad desea saber si la


cantidad de líquido de cierto
producto está de acuerdo con los promedios establecidos por la empresa (2.87 y
3.15). Para llevar a cabo
dicho control se realizó un muestro de 12 frascos y registró mediciones, las cuales
se dan a continuación.

3.01 3.05 2.99 2.99 3.00, 3.02, 2.98 2.99 2.99 2.97 3.02 3.01
Estime e interprete un intervalo del 95% de confianza para la cantidad de líquido
promedio en frasco?
Respuesta:
x = (3.01+3.05+2.99+2.99+3.00+3.02+2.98+2.99+2.99+2.97+3.02+3.01)/12
x = 3.00
t = 1.96

1 – α = 0.95
α = 0.05
1 – (α/2) = 0.025
α = 1 – 0.025
α = 0.975
𝑠 𝑠
[𝑥 − 𝑡 ( ) ≤ 𝜇 ≤ 𝑥 + 𝑡 ( )]
√𝑛 √𝑛

s = 0.0216
0.0216 0.0216
[3.00 − 1.96 ( ) ≤ 𝜇 ≤ 3.00 + 1.96 ( )]
√12 √12

[2.987 ≤ 𝜇 ≤ 3.012]

8. Una máquina produce las varillas de metal utilizadas en el sistema de suspensión


de un automóvil. El administrador del proceso, toma una muestra aleatoria de 15
varillas y se mide el diámetro. Los datos obtenidos aparecen abajo. Suponga que el
diámetro de la varilla tiene una distribución normal.

8.24, 8.23, 8.20, 8.21, 8.28, 8.23, 10.5, 9.2, 9.9, 8.26, 8.24, 8.34, 8.19, 8.25, 9.0

Estime e interprete un intervalo del 99% de confianza para el diámetro medio.


Respuesta:

Datos: 8.24, 8.23, 8.20, 8.21, 8.28, 8.23, 10.5, 9.2, 9.9, 8.26, 8.24, 8.34, 8.19, 8.25,
9.0

Se trata de una muestra pequeña, pues n = 15 datos. Por lo cual se aplicará la


siguiente fórmula:

𝑠 𝑠
𝑀𝑒𝑑𝑖𝑎 = [𝑥 − 𝑡 ≤𝜇≤𝑥+𝑡 ]
√𝑛 √𝑛
Si 1 – α = 0.99, entonces α = 0.01, también tenemos que n-1 = 14.
Para calcular a t (t-student), buscamos tabla para dos colas.

t 0,01 y 14 grados de libertad = 2,98.

Reemplazamos los valores en la fórmula de la media:

0,72 0,72
𝑀𝑒𝑑𝑖𝑎 = [8,618 − 2,98 ≤ 𝜇 ≤ 8,618 + 2,98 ] = [8,06 ≤ 𝜇 ≤ 9,17]
√15 √15

Se estima con una confianza del 99% que el diámetro medio de las varillas de metal
oscila entre 6,7 y 15,2 unidades.

También podría gustarte