Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LICENCIATURA EN ADMINISTRACION
Campus poniente
ESTADISTICAS PARA LA ADMINISTRACION I
GRUPO:2L3
UNIDAD V: Muestreo y estimación aplicado al control estadístico
de procesos.
Competencia Específica: Conocer, Comprender y aplicar el muestreo,
para estimar las características de los elementos de una población.
EQUIPO #2
Hugo Javier Rosales Manrique
Luciano Emmanuel Alcocer Aban
Jesús Dorilian Martín Chulim
Addy Gabriela Fernández May
Ejemplo
¿Cómo votarán estos jóvenes en el
Cuestión - Ejemplo
referéndum?
Tamaño de la muestra
El tamaño que debe tener la muestra que se selecciona depende básicamente del
tipo de estudio que se vaya a realizar. Si el trabajo es experimental, la muestra
puede ser bastante más pequeña que si realizamos trabajos descriptivos, en los que
la única forma de controlar los muchos factores que pueden aparecerá lo largo del
proceso, es aumentar el número de elementos en la muestra.
Sin recurrir a procedimientos matemáticos, una muestra se considera pequeña
siempre que es menor de 30, aunque este dato debe aumentarse
considerablemente en el caso de investigaciones de campo. En estos estudios, y
siempre que el número de elementos que forman la población sea suficientemente
grande como para considerarlo estadísticamente infinito, es recomendable que la
muestra sea al menos el 10% de la población total. En una población de 1000
individuos, una muestra puede considerarse suficiente a partir de 100 sujetos,
siempre que el tipo de estudio así lo requiera. Ahora bien, existe un procedimiento
matemático para determinar con precisión el tamaño de la muestra, asumiendo el
investigador un pequeño error en función del nivel de confianza.
Teoría de la estimación.
Objetivos: La inferencia estadísticas ocupa, entre otras cuestiones, de los
procedimientos de estimación de parámetros desconocidos de la distribución de una
variable aleatoria de la población, a partir de la información suministrada por una
muestra de tamaño reducido, extraída al azar. La estimación de parámetros por
intervalos, permite construir un intervalo que contendrá el parámetro a estimar con
una confianza fijada a priori por el experimentador.
Parámetro: Constante que puede ser calculada con ayuda del modelo de
probabilidad de una variable aleatoria o población.
Estimación: Podrecimiento que permite determinar valores posibles de un
parámetro desconocido, a partir de los datos suministrados por nuestras extraídas al
azar.
El objetivo principal de la estadística inferencial es la estimación, esto es que
mediante el estudio de una muestra de una población se quiere generalizar las
conclusiones al total de la misma. Como vimos en la sección anterior, los
estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estándar de un estadístico, más cercanos serán unos de otros
sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual un único valor estadístico y se usa para estimar un parámetro. El
estadístico usado se denomina estimador
Una estimación por intervalo es un rango, generalmente de ancho finito, que se
espera que contenga el parámetro.
Propiedades de un Buen Estimador
Insesgado. -Se dice que un estimador puntual es un estimador insesgado des, para
todo valor posible de. En otras palabras, un estimador insesgado es aquel para el
cual la media de la distribución muestral es el parámetro estimado. Si se usa la
media muestral para estimar la media poblacional, se sabe que la, por lo tanto, la
media es un estimador insesgado.
Eficiente o con varianza mínima. -Suponga que1y2son dos estimadores insesgados
de. Entonces, aun cuando la distribución de cada estimador esté centrada en el
valor verdadero de, las dispersiones de las distribuciones alrededor del valor
verdadero pueden ser diferentes.
Teorema del Límite Central.
El teorema central del límite es un resultado matemático que garantiza que, si
sumamos variables cualesquiera (no necesariamente normales), la variable suma
también seguirá una distribución normal (esto siempre que se cumplan algunas
condiciones básicas).
Con un tamaño típico se quiere garantizar que las contribuciones tienen que “estar
controladas”, esto es, las contribuciones extremas tienen que estar controladas por
una probabilidad muy pequeña (En jerga matemática las contribuciones tienen que
tener varianza finita).
Supongamos ahora que lanzamos una moneda. La variable X que vale 1 si sale
cara y 0 si sale cruz es una variable de Bernoulli. Si lanzamos una moneda, por
ejemplo, 200 veces, la variable que mide el número de caras que salen es una suma
de 200 variables (Xi cuenta 1 o 0 si sale cara en el lanzamiento i).
Supongamos que repetimos esta operación 10 veces (cada operación es lanzar la
moneda 200 veces). La primera vez pueden salir 115 caras, la segunda 94, etc. Se
supone que el número de caras andará cerca de 100 (es la media, 200⋅0.5).
Podemos simular el experimento con R:
y=rbinom(10,200,0.5)
y
Ejemplo
La renta media de los habitantes de un país se distribuye uniformemente entre 4,0
millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al
azar a 100 personas la suma de sus rentas supere los 725 millones ptas.
Cada renta personal es una variable independiente que se distribuye según una
función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede
aplicar el Teorema Central del Límite.
m = (4 + 10) / 2 = 7
s 2 = (10 - 4) ^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye según una normal
cuya media y varianza son:
Media: n * m = 100 * 7 = 700
Varianza: n * s2 = 100 * 3 = 300
Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable normal
tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Por lo tanto, para poder calcular el intervalo de confianza para la media poblacional
vamos a tipificar los valores de x1 y x2 para transformarlos en -z de α/2 y z de α/2 y
poder así utilizar la tabla de distribución normal N(0,1):
Tipificamos el valor de x1, teniendo en cuenta que la media es la media muestral y
la desviación típica se divide entre raíz de N:
Y, por tanto, x1 será igual a la media muestral menos el error y x2 será igual a la
media muestral más el error:
Por tanto, el intervalo de confianza que quiero calcular se encuentra entre x1 y x2:
O lo que es lo mismo entre la media muestral menos el error y entre la media
muestral más el error:
Se toma una muestra de 250 personas, cuya media muestral es igual a 90:
Por tanto, quiero dos valores que entre los cuales, me encierren un porcentaje del
90%, por lo que a cada lado, me quedará un 5%:
Por tanto, en la tabla tengo que buscar el valor de z que me deje a la izquierda el
95%, que será el valor de z α/2:
Busco en la tabla de distribución normal N(0,1) el valor que deje a la izquierda 0,95
y obtengo que está entre z=1,64 y z=1,65, por lo que me quedo con 1,645. Este es z
de α/2:
Con este valor de z de α/2 calculo el error cuya fórmula es:
Para calcular nuestro intervalo de confianza al 90%, a nuestra media muestral que
es 90, le restamos y le sumamos el error:
z de α/2 y σ siguen teniendo los mismos valores, que los sustituimos en la expresión
anterior y N es lo que tenemos que calcular:
Vamos a despejar N.
Primero pasamos raíz de N multiplicando al segundo miembro:
Operamos en el primer miembro:
Operamos y nos queda que N debe ser mayor o igual a 1082,41, que redondeando
nos queda que el tamaño de la muestra N debe ser igual a 1083 personas para que
el error sea menor que 1:
Si queremos calcular el tamaño muestral necesario para que el error sea menor o
igual a una cantidad e (0.05 en este caso), hacemos
Variabilidad
La desviación estándar de la diferencia es:
La estructura de las gráficas contiene una “línea central” (LC), una línea superior que
marca el “límite superior de control” (LSC), y una línea inferior que marca el “límite
inferior de control” (LIC). Los puntos contienen información sobre las lecturas
hechas; pueden ser promedios de grupos de lecturas, o sus rangos, o bien las lecturas
individuales mismas. Los límites de control marcan el intervalo de confianza en el cual
se espera que caigan los puntos.
1.- Los ingresos mensuales que perciben los médicos de EsSalud, de una cierta área, se distribuyen normalmente
con un ingreso medio de 3500 soles y desviación estándar de 700 soles.
A) ) Si el 18% de ellospagan impuestos, ¿cuál es el ingreso mensual mínimo de un médico de esta área que paga
impuestos?
B) ) Si se escoge al azar una muestra de 150 médicos de dicha área y se registran sus ingresos, ¿cuál es la
probabilidad de que el promedio de la muestra se diferencie de su valor real en no más de 100 soles?
A) ) Sea K la cantidad mínima a partir de la cual se paga impuestos. Esto significa que un médico
pagará impuestos si X ≥ K.
En Excel:
La frase “El promedio de la muestra se diferencia de su valor real” se puede expresar simbólicamente
como | - μ | ≤ 100.
Usamos valor absoluto puesto que la diferencia puede ser positiva o negativa.
Luego
= Distr.Norm(3600,3500,700,1)-Distr.Norm(3400,3500,700,1)
Recuerde que, cuando se usa la función Distr.Norm, el último argumento debe ser 1 para que devuelva la
probabilidad acumulada.
2.- MoviClaro afirma que el tiempo que emplean los clientes en pagar sus facturas es una variable normal de
valor medio 30 días y desviación estándar 8 días.
A)Si se escogen al azar las cuentas de 40 clientes, ¿cuál es la probabilidad de observar un promedio muestral
inferior a 32 días?
B) Si la muestra es de 25 cuentas, ¿qué tan probable es de tener un promedio entre 28.5 y 32.5 días?
C) En una muestra al azar de 16 cuentas, ¿qué valor máximo tomará el promedio con probabilidad 0.90?.
Donde es μ = 30 y σ = 8
3.- De un lote de focos ahorradores enviados por un proveedor, se han tomado al azar, 12 focos. El propósito
es observar la duración del producto para determinar su conveniencia en compras futuras. Se les dejaron
encendido hasta que se quemen. Los datos (en horas) obtenidos con el experimento fueron:
120, 128, 132, 130 124, 127, 130, 135, 122, 129, 131, 130.
Si el proveedor indica que su producto tiene una duración media de 127.5 horas.
A)Calcule la media de la muestra y luego determine la probabilidad de que una muestra del mismo tamaño
arroje un promedio superior al que usted calculó.
B) ¿Cuál es la probabilidad de que la media muestral se aparte del valor real en a lo más 2 horas?
Ingrese los datos a una hoja en un nuevo libro o abra el archivo Prob01. Calculemos primero la media de la
muestra; es decir, .
Luego
4.- Un exportador de espárragos envasa sus productos en frascos cuyo contenido medio es de 300 gramos.
Para controlar el proceso automático de llenado, se selecciona cada hora una muestra de 36 frascos. Si el peso
neto medio de la muestra está entre 301 y 302 gramos, el proceso continúa; en caso contrario, se detiene y se
reajusta la máquina.
A) ¿Cuál es la probabilidad de detener el proceso que está operando con una desviación estándar de 7.5
gramos?
Como el frasco contiene 300 gramos, supondremos que este indicador constituye el contenido medio. No se
conoce la varianza.
Creo que el proceso debe ser detenido para reajustar la máquina pues el porcentaje de veces que el contenido
no está en el rango especificado es suficientemente considerable.
Dada una población formada por elementos que poseen o no cierta característica, diremos que el indicador o
parámetro π constituye la proporción de elementos que poseen dicha característica.
Si un experimento aleatorio tiene dos únicos resultados: éxito o fracaso y se ejecuta una sola vez, diremos que
la población es de Bernoulli donde π representa la proporción de éxitos y 1 – π representa la proporción de
fracasos. Si el experimento se repite n veces, podemos afirmar que la población es Binomial. Y cuando se realiza
un muestreo con reposición, se dice que la población desde donde se extrae la muestra es una población
Binomial.
Sea X1, X2,…, Xn una muestra aleatoria independiente extraída de una población de Bernoulli en donde si Xi = 1
ocurre éxito, si Xi = 0 ocurre fracaso.
Si ahora definimos a X= ∑(i=1)nXi, como el número de éxitos obtenidos en esta muestra, entonces X
constituye una variable Binomial tal que su valor esperado es E(X) = μ = nπ y su varianza V(X) = σ² =
n π(1- π).
Si definimos a p = X/n como la proporción de éxitos o la proporción, diremos que p es una variable muestral cuya
distribución de probabilidad viene dada por μp y σ2p .
5.- El gerente de McAllum Inc. cree que el 30% de los pedidos a su empresa provienen de clientes nuevos. Para
comprobar esta afirmación se toma una muestra aleatoria de 100 clientes que hicieron sus pedidos en la
empresa.
a) Suponga que el presidente está en lo correcto y que π = 0.30. ¿Cuál es la distribución muestral de p para
este estudio?
b) ¿Cuál es la probabilidad de que la proporción muestral esté a ± 0.05 o menos de la proporción poblacional?
Sea π la proporción de pedidos provenientes de clientes nuevos. Según el problema, π = 0.30. Igualmente n =
100.
= Dstr.Norm(0.35,0.3,0.04583) - Distr.Norm(0.25,0.3,0.04583)
= 0.724722
Datos:
1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más
grande que el de la muestra de las niñas es 0.1056.
2.- Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los
tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras
que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad
de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más
que la de una muestra aleatoria de 40 tubos de la compañía B.
Solución:
Datos:
A = 7.2 años
B = 6.7 años
A = 0.8 años
B = 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
3.- Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de
1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba
la primera gasolina en 35 autos y la segunda en 42 autos.
A)Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la
segunda gasolina?
B)Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a
favor de la gasolina 1?.
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que
se supondrán que son iguales.
Datos:
1 = 1.23 Km/Lto
2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
=?
A.
B. ?
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83
Km/Lto a favor de la gasolina 1 es de 0.0117.
4.- Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres
adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta
a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está
utilizando la distribución normal.
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3%
mayor que el de mujeres es de 0.4562.
5. Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos
fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
A. p(p2-p10.10) = ?
B. p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a
favor de la máquina 1 es de 0.2357.
Tamaño
Lote Defectos
muestra
1 2 17
0
2 2 24
0
3 2 16
0
4 2 26
0
5 1 15
5
6 1 15
5
7 1 20
5
8 2 18
5
9 2 26
5
10 2 10
5
11 2 25
5
12 3 21
0
13 3 40
0
14 3 24
0
15 3 46
0
16 3 32
0
17 3 30
0
18 3 34
0
19 1 11
5
20 1 14
5
21 1 30
5
22 1 17
5
23 1 18
5
24 1 20
5
a. Qué tipo de grafica de control utilizaría
En la grafica utilizaremos una grafica de control por numero de defectos tipo U.
LCS=1.69
LC=1.04
LCI=0.39
a. Grafique e interprete
b. Interpretación:
En la gráfica podemos observar la cantidad de artículos electronicos con
defectos, donde la muestras en los lotes 13 y 15 están por encima del límite
superior.
Podemos concluir que en dicho proceso no está bajo control estadístico.
Recomendado determinar la causas del problema para mejorar la calidad del
proceso.
2. En una fábrica de muebles se inspecciona a detalle el acabado de las mesas cuando salen
del departamento de laca. La cantidad de defectos que son encontrados en cada mesa son
registrados con el fin de conocer y mejorar el proceso. En la tabla se muestran los defectos
encontrados en las últimas 25 mesas.
Datos:
MESA DEFECT
OS
1 7
2 5
3 10
4 2
5 6
6 5
7 4
8 9
9 7
10 5
11 6
12 7
13 8
14 4
15 5
16 12
17 8
18 10
19 4
20 7
21 3
22 10
23 6
24 6
25 7
26 4
27 5
28 6
29 8
30 5
465 191
c. Grafique e interprete
3. Dunkin Donuts es la empresa líder en fabricación de donuts y venta de café presente en más de 1000 locales
en todo el mundo. En su filial Chiclayo, se han tomado datos de un mes en la producción de donuts con la
cantidad de producción defectuosa (mal relleno, cocción indebida, merma fin de día etc) que son calificadas
así debido a que ya no se pueden colocar en venta al público.
Datos:
Son productos defectuosos
Datos en un mes , de los cuales esas mustras son variables ya que cada dia se saca un
numeor determinado de donust.
1 320 26
2 350 18
3 280 24
4 250 14
5 350 32
6 700 52
7 650 40
8 290 28
9 360 16
1 260 28
0
1 240 20
1
1 360 29
2
1 640 62
3
1 600 32
4
1 280 14
5
1 320 22
6
1 260 22
7
1 230 11
8
1 350 34
9
2 700 39
0
2 650 22
1
2 250 17
2
2 340 25
3
2 260 16
4
25 240 23
26 350 32
27 750 20
28 700 46
29 350 17
30 320 16
c. Grafique e interprete
4. En una empresa de rubro alimenticio, se empaquetan salchichas en paquetes mediante ciertas máquinas.
Un problema que se ha tenido es que dentro del paquete sobra aire (falta de vacío). El problema se detecta
mediante inspección semi - automatizada, en donde las salchichas con aire de sobra son segregadas y después
se vuelven a abrir para recuperar las salchichas y volverlas a empaquetar.
El atributo de vacío es importante ya que si un paquete llega con aire al mercado, la vida de
anaquel se acorta, por lo que días después la salchicha cambia de color, pierde frescura y
esta situación repercute en los clientes insatisfechos y genera una mala imagen de la
compañía. Se Toma una muestra tamaño 500. Los datos obtenidos durante tres días en una
máquina se muestran en la siguiente tabla dividida por subgrupos:
Datos relevantes:
- Defectuosas
- Grafica =NP (muestra contante).
PAQUETES
SUBGRU
CON
PO
AIRE
1 15
2 5
3 8
4 10
5 6
6 5
7 5
8 7
9 2
10 4
11 9
12 17
13 4
14 5
15 3
16 10
17 7
18 5
19 4
20 9
21 7
22 5
23 7
24 4
25 2
26 3
27 5
28 3
29 6
30 5
31 7
32 9
33 5
34 3
35 8
36 15
37 4
38 6
39 8
40 5
LCS=13.9
8 LC=6.43
LCI=0.00
c. Grafique e interprete:
Por lo observado podemos concluir que el proceso no esta bajo control estadístico.
Por lo que se recomuineda identificar las causas de problemas para posibles
soluciones en la calidad que esta requiera.
54
Conclusión
Como pudimos observar en este trabajo cada uno de los temas mostrados en el
mismo can casi de la mano con diferentes constantes o bien apoyándose una de
la otra con cortos conocimiento de todas, gracias a esta investigación nos dimos la
tarea de aprender y adquirir un mejor conocimiento del tema de la estadística
enfocada a los principios de muestreo.
55
Referencias
56