Está en la página 1de 16

Universidad Tecnológica De Santiago

UTESA

Nombre: Miguel Ángel Tejeda.

Tema: Practica 3.

Matricula: 2-21-6031.

Asignatura: Estadística Industrial.

Profesor: Heriberto Herasme Herasme.


Inferencia Estadística.

Según el autor T. W. Anderson en su libro Estadística inferencial La inferencia


estadística es una rama de la estadística que se encarga de hacer conclusiones o
inferencias acerca de una población basándose en datos o muestras recogidas de
esa población.

Muestreo estratificado

En una barriada viven 140 adultos, 91 jóvenes y 84 niños. Se quiere entrevistar a


45 personas de la aldea mediante muestreo estratificado. ¿De Cuántos adultos,
jóvenes y niños estaría compuesta la muestra?

SOLUCIÓN
Adultos Jóvenes Niños Total
140 91 84 315
Población
x y z 45
Muestra

Por tanto, debemos entrevistar a 20 adultos, 13 jóvenes y 12 niños.


Métodos de estimación clásico.

Según Hogg, McKean y Craig. En el contexto de este libro, los métodos de


estimación clásicos se refieren a técnicas de estimación paramétrica que se basan
en suposiciones sobre la distribución subyacente de los datos. Esto incluye
métodos como la estimación de máxima verosimilitud (MLE), los métodos de
momentos y los intervalos de confianza clásicos.

Supongamos que tenemos una muestra de datos de una variable aleatoria X y


queremos estimar el parámetro μ de una distribución normal utilizando el método
de los momentos. La distribución normal tiene dos parámetros: la media μ y la
desviación estándar σ.

Dada una muestra de n observaciones 1, 2,…,x1,x2,…,xn, el método de los


momentos establece que el primer momento muestral (la media muestral) debe
igualar el primer momento poblacional (la media poblacional), es decir:

xˉ=μ

Donde xˉ es la media muestral.


Entonces, el estimador de momentos para μ es simplemente la media muestral xˉ.

Ahora, para ilustrar este método, supongamos que tenemos la siguiente muestra de
datos:

10,12,14,15,18

Calculamos la media muestral:

10+12+14+15+18
xˉ=
5

69
xˉ =
5

xˉ = 13.8

Por lo tanto, utilizando el método de los momentos, estimamos que la media


poblacional μ de la distribución normal a partir de esta muestra es 13.8.
Una sola muestra: estimación de la media.

Dennis D. Wackerly, en su influyente libro "Estadística Matemática con


Aplicaciones", aborda la estimación de la media como un componente crucial de la
estadística inferencial. Destaca la importancia de estimar con precisión la media
poblacional a partir de una muestra de datos y explora diversos métodos y técnicas
para lograr este objetivo.

Wackerly enfatiza la utilidad de la media muestral como un estimador insesgado y


eficiente de la media poblacional, y proporciona herramientas para evaluar la
calidad de la estimación, como la construcción de intervalos de confianza y la
realización de pruebas de hipótesis. Además, discute cómo el tamaño de la muestra
influye en la precisión de la estimación y ofrece pautas prácticas para determinar el
tamaño muestral adecuado en diferentes contextos.

Supongamos que tenemos una muestra de calificaciones de 20 estudiantes en un


examen de matemáticas:

7 8 8 9 7 8 8 9 7 8 8 9 7 8 8 9 7 8 8 9
5 0 5 0 8 2 8 2 9 3 7 4 6 1 6 1 7 4 9 3

Para estimar la media de las calificaciones de todos los estudiantes de la clase,


utilizamos el método de la media muestral, que consiste en tomar el promedio de
todas las observaciones en la muestra.

Entonces, sumamos todas las calificaciones y luego dividimos por el número total
de estudiantes en la muestra (que en este caso es 20):

75+80+85+⋯+89+93
Media muestral =
20

1770
Media muestral =
20

Media muestral = 88.5

La media estimada de las calificaciones de todos los estudiantes de la clase es de


88.5.
Error estándar de una estimación puntual.

Según Casella y Berger en su libro estadística inferencial el error estándar de una


estimación puntual se trata en el contexto de la inferencia estadística. El error
estándar es una medida de la precisión de una estimación puntual y se define como
la desviación estándar de la distribución muestral de la estadística de interés. En
otras palabras, cuantifica cuánto varía la estimación puntual promedio de la
población cuando se toman múltiples muestras aleatorias del mismo tamaño.

1- Suponga que está tratando de estimar la proporción de personas en la población que


tienen preferencia por una fórmula láctea enriquecida, y se desea tener un 95% de
confianza en sus resultados.

Se toma una muestra de 800 personas y se determina que 560 persona en la muestra
tiene preferencia por la fórmula láctea enriquecida. Determine un intervalo en el cual se
pueda esperar se encuentre la proporción poblacional y la proporción de otras
muestras que se puedan tomar de la población, con un 95% de confianza
a) Calculemos la proporción muestral p y su complemento:

p = 560/800 = 0.70

q = 1 – p = 1 – 0.70 = 0.30

b) Se conoce que la proporción se aproxima a una distribución normal a muestras de


tamaño grande (mayores a 30). Entonces, se aplica la llamada regla 68 – 95 – 99.7 y
se tiene que:

Coeficiente de confianza = z = 1.96

Error estándar = √(p*q/n)

Error estándar de estimación (EEE) = ± (1.96) *√ (0.70) *(0.30) /800) = ± 0.0318

c) A partir del error estándar de estimación se establece el intervalo en el que se


espera se encuentre la proporción poblacional con un 95% de nivel de confianza:

0.70 – 0.0318 ≤ Proporción poblacional ≤ 0.70 + 0.0318

0.6682 ≤ Proporción poblacional ≤ 0.7318


Se puede esperar que la proporción de muestra del 70% cambie hasta en 3.18 puntos
porcentuales si toma una muestra diferente de 800 individuos o que la proporción real
de la población está entre 70 – 3.18 = 66.82% y 70 + 3.18 = 73.18%.

Intervalos de predicción.
Según Peter Bruce, en su libro en su libro "Estadística Práctica para Científicos de
Datos. Bruce explica que, a diferencia de los intervalos de confianza que se utilizan
para estimar un parámetro poblacional, los intervalos de predicción se utilizan para
predecir valores futuros de la variable de interés. Destaca que los intervalos de
predicción tienen en cuenta tanto la variabilidad dentro de la muestra como la
incertidumbre asociada con la predicción de nuevos datos.

Para calcular un intervalo de predicción al 95%, necesitamos los siguientes datos:

1. La media muestral (xˉ).


2. La desviación estándar muestral (S).
3. El tamaño de la muestra (n).
4. El valor crítico de la distribución t para un intervalo de confianza del 95%
y los grados de libertad correspondiente (n-1).

El intervalo de predicción se calcula de la siguiente manera:

Intervalo de Predicción = xˉ±tα/2×SE

xˉ es la media muestra

tα/2 es el valor crítico de la distribución

SE es el error estándar de la estimación puntual.

xˉ = 3.5 días
s = 0.8 días
n = 50 paquetes
El valor crítico de la distribución t para un intervalo de confianza del 95% y 49
grados de libertad es aproximadamente 2.009.

El error estándar SE ya lo calculamos como 0.1130.113 días.

Sustituyendo estos valores en la fórmula, obtenemos:

Intervalo de Predicción = 3.5±2.009×0.113


Intervalo de Predicción ≈ 3.5±0.227

Por lo tanto, el intervalo de predicción al 95% para el tiempo de entrega de un


nuevo paquete es aproximadamente 3.727 días a 3.727días.

Límites de tolerancia.

En "Control Estadístico de Calidad" de Douglas C. Montgomery, los límites de


tolerancia son un tema fundamental dentro del contexto del control de calidad en la
producción industrial. Montgomery discute cómo los límites de tolerancia son
utilizados para definir las especificaciones de un producto o proceso y cómo se
pueden utilizar técnicas estadísticas para monitorear y controlar si el producto o
proceso cumple con estas especificaciones.

En el libro, Montgomery aborda cómo se establecen los límites de tolerancia


basados en los requisitos del cliente.

Ejercicio: Límites de Tolerancia en la Fabricación de Tornillos

Una empresa fabrica tornillos con una longitud nominal de 50 mm. Las
especificaciones del cliente indican que los tornillos deben tener una longitud
dentro del rango de 49.8 mm a 50.2 mm para ser aceptables. Se sabe que el proceso
de fabricación tiene una desviación estándar de 0.05 mm.

Calcula los límites de tolerancia superior e inferior para la longitud de los tornillos.
Si se fabrica un lote de tornillos y se encuentra que la longitud media de la muestra
es de 49.95 mm con una desviación estándar muestral de 0.03 mm, determina si el
lote cumple con las especificaciones del cliente.
Solución:

Los límites de tolerancia se calculan sumando y restando la mitad de la diferencia


entre la longitud nominal y los límites de especificación de la longitud:

Lımite inferior = 50−(50−49.8) /2=49.9mm


Lımite superior = 50+(50.2−50) /2=50.1 mm

los límites de tolerancia son de 49.9 mm a 50.1 mm.

Para determinar si el lote de tornillos cumple con las especificaciones del cliente,
utilizamos la longitud media de la muestra (49.95 mm) para calcular los límites de
control.
Lımite inferior=49.95−3(0.03) =49.86mm
Límite superior=49.95+3(0.03) =50.04mm
Como los límites de control están dentro de los límites de tolerancia establecidos
(49.9 mm a 50.1 mm), podemos concluir que el lote de tornillos cumple con las
especificaciones del cliente.

Dos muestras: estimación de la diferencia entre dos medias.

Cuando tienes dos muestras y deseas estimar la diferencia entre las medias de dos
poblaciones, puedes utilizar un intervalo de confianza para la diferencia de medias.

Supongamos que tienes dos muestras independientes, una de tamaño n1de la


población 1 con media xˉ1 y desviación estándar S1, y otra de tamaño n2 de la
población 2 con media xˉ2 y desviación estándar s2.

El intervalo de confianza para la diferencia de medias se calcula como:

(xˉ1−xˉ2) ±tα/2×SE
Donde SE es el error estándar de la diferencia de medias y se calcula como:

2 2
𝑠 𝑠
SE = √𝑛1 + 𝑛2
1 2

Y t α/2 es el valor crítico de la distribución t con n1 + n2 – 2 grados de libertad


y un nivel de confianza de 1 - α%.

Ahora, un ejemplo de cómo calcular un intervalo de confianza para la diferencia de


medias:

Supongamos que tenemos dos muestras independientes, una de 50 observaciones


con una media de 10 y una desviación estándar de 2, y la otra de 60 observaciones
con una media de 12 y una desviación estándar de 3. Queremos calcular un
intervalo de confianza del 95% para la diferencia entre las medias de las dos
poblaciones.

Calculamos el error estándar de la diferencia de medias:

2 2
SE= √250 + 360

Calculamos el valor crítico t α/2 para un nivel de confianza del 95% y 50 + 60 -


2 =108 grados de libertad. Consultando la tabla t o utilizando software
estadístico, obtenemos t α/2 ≈ 1.98.

Ahora, podemos calcular el intervalo de confianza para la diferencia de medias:

(xˉ1 - xˉ2) ± t α/2 x SE


(10 – 12) ± 1.98 X 0.48
-2 ± 0.94

El intervalo de confianza del 95% para la diferencia entre las medias de las dos
poblaciones es de aproximadamente −2.94 a −1.06. Esto significa que podemos
estar razonablemente seguros de que la diferencia entre las medias de las dos
poblaciones está dentro de este rango.
Observaciones pareadas.

David W. Hosmer Jr. define las observaciones pareadas como un tipo de diseño de
estudio en el que cada individuo o unidad en una muestra tiene dos mediciones o
valores asociados. Estas mediciones se toman en dos momentos diferentes o bajo
dos condiciones distintas. Por lo tanto, las observaciones se emparejan entre sí, ya
sea dentro del mismo individuo o entre individuos emparejados de manera similar.

Ejemplo (Prueba t dependiente)

Tabla: Resultados de dos tests de matemáticas

Nombre Antes Después Diferencia


Manuel 18 22 4
Miguel 21 25 4
José 17 1
Antonio 22 24 2
Dolores 19 16 -3
Manuela 24 29 5
Pedro 17 20 3
Lucia 21 23 2
Cecilia 23 19 -4
Juan 18 20 2
Paula 14 15 1
Francisco 16 15 -1
Angel 16 18 2
Soledad 19 26 7
Luis 18 18 0
Cristina 20 24 4
Laura 12 18 6
Carlos 22 25 3
Carmen 15 19 4
Javier 17 16 -1
La media de las diferencias es 2.05 con una desviación estándar de 2,837.
Entonces tenemos:

t = xˉD
Sd
√n

xˉD: media de las diferencias


SD: la desviación estándar de las diferencias
n: número de pares de observaciones

t = xˉD 2,05
Sd = 2,837 = 3,231.
√n √20

Una sola muestra: estimación de una proporción.

En su libro "Probabilidad y Estadística para Ingenieros y Científicos", Daniel S.


Yates aborda la estimación de una proporción en una sola muestra como parte del
análisis estadístico fundamental. Yates proporciona una explicación detallada de
los métodos utilizados para estimar una proporción poblacional a partir de una
muestra aleatoria.

Ejercicio: Estimación de la proporción de artículos defectuosos en una línea de


producción.

Supongamos que una fábrica produce cajas de bombillas y queremos estimar la


proporción de cajas que contienen al menos una bombilla defectuosa. Tomamos
una muestra aleatoria de 200 cajas de bombillas y encontramos que 30 de ellas
contienen al menos una bombilla defectuosa.

Queremos calcular un intervalo de confianza del 95% para la proporción de cajas


que contienen al menos una bombilla defectuosa en toda la línea de producción.
Solución:

Calculamos la proporción muestral de cajas que contienen al menos una bombilla


defectuosa:

p^ = número de cajas con bombillas defectuosas


= =

número total de cajas en la muestra

p^= 30 = 0.15
200 = ==

Calculamos el error estándar de la proporción muestral:


====

SE= √ 𝑝^X ( 1−𝑝^) 𝑛

Donde n es el tamaño de la muestra.

SE= √0.15x(1−0.15)
200

SE= √0.15x0.85
200

SE= √0.1275
200

SE= √0.0006375
SE= 0.02525

Calculamos el intervalo de confianza del 95% para la proporción verdadera p:

Intervalo de confianza = p^ ± z x SE

Donde Z es el valor crítico de la distribución normal estándar para un nivel de


confianza del 95%, que es aproximadamente 1.96.

Intervalo de confianza = 0.15±1.96×0.02525


Intervalo de confianza = 0.15±0.0495
Intervalo de confianza ≈ (0.1005,0.1995)
Podemos estar 95% seguros de que la verdadera proporción de cajas que contienen
al menos una bombilla defectuosa en toda la línea de producción se encuentra entre
aproximadamente el 10.05% y el 19.95%.

Dos muestras: estimación de la diferencia entre dos proporciones.

En su libro Introducción a la probabilidad y la estadística para ingenieros y


científicos Sheldon M. Ross presenta métodos estadísticos para comparar dos
proporciones muéstrales y realizar inferencias sobre la diferencia entre ellas. Este
análisis es útil cuando se desea determinar si hay una diferencia significativa en la
proporción de cierto evento o característica en dos grupos o poblaciones diferentes.

Ejemplo:

Queremos comparar la proporción de personas que prefieren la marca A con la


proporción de personas que prefieren la marca B en una población. Recolectamos
dos muestras aleatorias, una de cada marca, y encontramos lo siguiente:

Muestra de la marca A: 100 personas, de las cuales 60 prefieren la marca A.


Muestra de la marca B: 120 personas, de las cuales 70 prefieren la marca B.

Para estimar la diferencia entre las proporciones de personas que prefieren cada
marca, primero calculamos las proporciones muéstrales:

Proporción muestral de la marca A: 60/100 = 0.6


Proporción muestral de la marca B: 70/120 ≈ 0.5833

Ahora, calculamos la diferencia entre estas proporciones:

Diferencia = proporción_ A- Proporción_B


Diferencia = 0.6 – 0.5833
Diferencia ≈ 0.0167

La diferencia estimada entre las proporciones de personas que prefieren la marca A


y la marca B es aproximadamente 0.0167. Esto sugiere que, en nuestras muestras,
una mayor proporción de personas prefiere la marca A en comparación con la
marca B.
Una sola muestra: estimación de la varianza.

La estimación de la varianza, según Dennis Wackerly, implica calcular un valor


numérico que representa la variabilidad dentro de una muestra de datos. En su libro
"Estadística matemática con aplicaciones", Wackerly detalla cómo se puede
estimar la varianza utilizando técnicas estadísticas adecuadas, como el cálculo del
estimador de la varianza muestral. Este estimador proporciona una medida de la
dispersión de los datos en relación con la media muestral.

Ejemplo:

Supongamos que tenemos la siguiente muestra de datos de altura (en centímetros)


de una muestra de 15 personas:

170 165 172 168 175 171 169 173 167 174 170 172 168 170 171

Para estimar la varianza de la altura de esta muestra, seguimos los siguientes pasos:

Calcular la media de la muestra:


1
Media = ∑𝑛𝑖 = 1 𝑥𝑖
𝑛

1
Media = (170+165+172+…+170+171)
15

2553
Media = 15

Media = 170.2

Calcular las desviaciones de cada dato respecto a la media y elevarlas al cuadrado:

(170−170.2)2=0.04,
(165−170.2)2=25.04,
(172−170.2) 2=3.24,

(171−170.2)2=0.64.
Sumar todas las desviaciones al cuadrado:

∑15
𝑖 = 1 (xi−Media)2=25.04+0.04+3.24+…+0.64

∑15
𝑖 = 1 = (xi−Media)2=81.6

Dividir la suma de las desviaciones al cuadrado entre el tamaño de la muestra


menos uno para obtener una estimación sin sesgo de la varianza muestral:
1
𝑠2 = ∑𝑛𝑖 = 1 (xi – Media)2
𝑛−1

1
𝑠2 = x 81.6
15−1

81.6
𝑠2 =
14

𝑠 2 ≈ 5.83

La estimación de la varianza muestral de la altura de esta muestra es


aproximadamente 5.83 cm2

Dos muestras: estimación de la proporción de dos varianzas.

Supongamos que queremos comparar la proporción de estudiantes de dos


universidades diferentes que prefieren estudiar en el extranjero. Recolectamos dos
muestras aleatorias, una de cada universidad, y encontramos lo siguiente:

Muestra de la Universidad A: 120 estudiantes, de los cuales 45 expresan interés en


estudiar en el extranjero.
Muestra de la Universidad B: 150 estudiantes, de los cuales 60 expresan interés en
estudiar en el extranjero.

Para estimar la diferencia entre las proporciones de estudiantes que prefieren


estudiar en el extranjero en cada universidad, primero calculamos las proporciones
muestrales:
45
Proporción muestral de la Universidad A: = 0.375
120

60
Proporción muestral de la Universidad B: = 0.4
150

Ahora, calculamos la diferencia entre estas proporciones:

Diferencia = Proporcion_A−Proporcion_B
Diferencia = 0.375−0.4
Diferencia = −0.025

Entonces, la diferencia estimada entre las proporciones de estudiantes que


prefieren estudiar en el extranjero en las dos universidades es de aproximadamente
-0.025. Esto sugiere que, en nuestra muestra, una mayor proporción de estudiantes
de la Universidad B expresó interés en estudiar en el extranjero en comparación
con la Universidad A.

También podría gustarte