Está en la página 1de 37

FACULTAD DE INGENIERÍA

CARRERA DE INGENIERÍA INDUSTRIAL

UNIDAD 1: ESTIMACIÓN DE PARÁMETROS POR


INTERVALOS

Profesor: Dr. Martín Guillermo Cornejo Sarmiento


E-mail: mgcornejo@ulima.edu.pe
Web: https://cris.ulima.edu.pe/es/persons/mart%C3%ADn-guillermo-cornejo-sarmiento

DISEÑO DE EXPERIMENTOS
2023-1
Estimación de parámetros (media, varianza y proporción)
por intervalos de confianza

1) Intervalo de confianza para la media poblacional (𝝁) cuando la varianza


poblacional (𝜎 2 ) conocida.

2) Intervalo de confianza para la media poblacional (𝝁) cuando varianza


poblacional (𝜎 2 ) desconocida.

3) Intervalo de confianza para la varianza poblacional (𝜎 2 ) o desviación


Unidad 1 (Parte 1) de
estándar (𝜎). Diseño de Experimentos
4) Intervalo de confianza para la proporción poblacional (𝑝).
UNIDAD 1 (PARTE 1): Intervalos
de confianza para la varianza y
para la proporción
Contenido
 Introducción
 Estimación de parámetros por intervalos de confianza
• Construcción de intervalos de confianza
• Método de la cantidad pivotal
• Nivel de confianza
• Precisión de la estimación
 Intervalos de confianza para la varianza (o desviación estándar) poblacional
 Intervalos de confianza para la proporción poblacional
Objetivo

 Comprender los conceptos generales de la estimación de parámetros por


intervalos.
 Construir, calcular e interpretar correctamente los intervalos de confianza
para la varianza (o desviación estándar) poblacional y para la proporción
poblacional.
Introducción: Estadística Inferencial (o Inferencia Estadística)
 Conjunto de métodos con los que se hacen la generalización o la inferencia sobre una
población.
 Esos métodos utilizan la información contenida en una muestra que proviene de la población
estudiada.
 Se aplica para tomar decisiones o sacar conclusiones acerca de una población
 Las conclusiones pueden no ser ciertas en forma absoluta (medida de confiabilidad 
probabilidad)
Introducción: Estadística Inferencial (o Inferencia Estadística)

La Estadística Inferencial puede ser dividida en dos grandes áreas:

1) Estimación de parámetros
a) Estimación puntual

b) Estimación de parámetros por intervalos (estimación interválica)

2) Prueba de hipótesis
Introducción: Estadística Inferencial (o Inferencia Estadística)
EN GENERAL:

 Una población (discreta o continua) tiene una función de probabilidad 𝑓(𝑥) cuyo(s) parámetro(s) se intenta(n)
determinar.

 Si el parámetro a determinar es denotado por 𝜃, entonces, la distribución de la población será 𝑓(𝑥, 𝜃).

 Los métodos de inferencia estadística consisten en seleccionar una muestra aleatoria de la población de manera que
se pueda:

1) Determinar el valor del parámetro desconocido 𝜃  Estimación de parámetros


a) La estimación es un número único y específico  Estimación puntual de parámetros

b) La estimación es un intervalo en el que están comprendidos los valores de 𝜃  Estimación de parámetros por intervalos

2) Decidir si 𝜃, o alguna función de 𝜃, es igual (diferente, mayor o menor) a algún valor específico 𝜃0 de 𝜃  Prueba de
hipótesis
Estimación de parámetros por intervalos

 Una estimación puntual no proporciona la precisión de la estimación porque no indica cuán próximo está la
estimación al parámetro que se estima.

 Una estimación puntual no proporciona un grado de confianza de que la estimación se halla dentro de cierta
variación.

 La estimación por intervalo es la estimación de un parámetro 𝜽 dentro de un intervalo de extremos cerrados


[𝒂, 𝒃], donde los números 𝑎 y 𝑏 se obtienen a partir de la distribución de la estadística que estima puntualmente el
parámetro 𝜃 (estimador de 𝜃) y a partir de los valores de la muestra.
Estimación de parámetros por intervalos
 Sea 𝑋1 , 𝑋2 , …, 𝑋𝑛 una muestra aleatoria de tamaño 𝑛 retirada de una población cuya distribución es 𝑓 𝑥, 𝜃 , cuyos
valores específicos (valores experimentales o datos de la muestra) son 𝑥1 , 𝑥2 , …, 𝑥𝑛 , respectivamente.

෡ = 𝐻(𝑋1 , 𝑋2 , …, 𝑋𝑛 ) un estimador (estadístico para estimar al parámetro 𝜃) cuya distribución de probabilidad es


 Sea Θ
conocida.

෡ se pueden encontrar las variables aleatorias


 Si dada la probabilidad 1 − 𝛼 y si a partir de la distribución de Θ
𝐴 = 𝐻1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ) y 𝐵 = 𝐻2 𝑋1 , 𝑋2 , …, 𝑋𝑛 tales que:

𝑃 𝐴 ≤𝜃 ≤ 𝐵 =1−𝛼

 Entonces, se dice que el intervalo aleatorio [𝐴, 𝐵] es el intervalo estimador del parámetro 𝜃 con el grado o nivel de
confianza de 1 − 𝛼 100%, o que 𝜽 ∈ [𝑨, 𝑩] con probabilidad 𝟏 − 𝜶.

 Además, si 𝑎 = 𝐻1 (𝑥1 , 𝑥2 , …, 𝑥𝑛 ) y 𝑏 = 𝐻2 𝑥1 , 𝑥2 , …, 𝑥𝑛 son los valores numéricos que resultan de sustituir los datos
de la muestra en las estadísticas A y B. Entonces, se dice que el intervalo numérico [𝑎, 𝑏] es el intervalo de confianza del
parámetro 𝜃 con el grado o nivel de confianza de 1 − 𝛼 100% para 𝜃.
Estimación de parámetros por intervalos
 [𝐴, 𝐵] es un intervalo aleatorio  Se puede afirmar que 𝑃 𝐴 ≤ 𝜃 ≤ 𝐵 = 1 − 𝛼.

 [𝑎, 𝑏] es un intervalo numérico fijo (Intervalo de confianza)  No se puede afirmar que 𝑃 𝑎 ≤ 𝜃 ≤ 𝑏 = 1 − 𝛼.

 𝟏 − 𝜶 𝟏𝟎𝟎% es el grado o nivel de confianza. Los valores más utilizados son 95%, 98%, 99%, 90%, entre otros.

 𝒂 es el límite inferior de confianza y 𝒃 es el límite superior de confianza (limites del intervalo de confianza del 1 − 𝛼 100% para 𝜃).

 Interpretación del intervalo de confianza [𝒂, 𝒃] del 𝟏 − 𝜶 𝟏𝟎𝟎% para 𝜽: si, a partir de los datos de la muestra aleatoria de tamaño 𝑛,
se ha construido el intervalo [𝑎, 𝑏] con nivel de confianza 1 − 𝛼 100% (por ejemplo, 95%) para el parámetro 𝜃, podemos afirmar:

 Se tiene un nivel de confianza del 1 − 𝛼 100% (por ejemplo, del 95%) de que el parámetro 𝜃 está en el intervalo [𝑎, 𝑏].

 Suponiendo que se seleccionan repetidamente 100 muestras (subgrupos) diferentes de tamaño 𝑛, se tendrán 100 intervalos semejantes
al intervalo [𝑎, 𝑏] y se confía que 95 de estos 100 intervalos contengan al parámetro 𝜽.

 La precisión de la estimación se puede medir en términos del error de estimación (𝑬), llamado también margen de error o error

muestral: 𝑬 = 𝜃−𝜃 , siendo 𝜃෠ la estimación puntual de 𝜃 (usando al estimador Θ)
෡ obtenida a partir de la muestra aleatoria de tamaño 𝑛.
Estimación de parámetros por intervalos

Procedimiento general para construir un intervalo de confianza (IC)

1. Determinar el parámetro a estimar (𝜇, 𝜎 2 , 𝑝, etc.).

2. Fijar el nivel de confianza a usar en la estimación (1- )100%.

3. Seleccionar la muestra de tamaño 𝑛.

4. Calcular los límites del intervalo de confianza de acuerdo al método de la cantidad pivotal.

5. Interpretar los resultados del intervalo de confianza obtenido.


Estimación de parámetros por intervalos
Método de la cantidad pivotal para construir intervalos de confianza

෡ (es decir, una función de una variable aleatoria que depende de los elementos de la muestra
Cantidad pivotal (𝑸): es una función del estimador Θ
𝑋1 , 𝑋2 , …, 𝑋𝑛 y el tamaño de muestra 𝑛) y del parámetro 𝜃. La distribución de probabilidad de 𝑸 es conocida y no depende del valor de 𝜃.

෡ 𝜃 = 𝑔 𝑋1 , 𝑋2 , …, 𝑋𝑛 , 𝜃 , cuya función densidad 𝑓(𝑞) es conocida.


 𝑄 puede ser expresada como 𝑄 = 𝑔 Θ,

1. Dado que la distribución de probabilidad de 𝑸 es conocida y considerando un nivel de confianza fijo 1 − 𝛼 100%, definimos la siguiente
probabilidad que incluye los cuantiles (límites) 𝑞1 y 𝑞2 de 𝑄:

𝑃 𝑞1 ≤ 𝑄 ≤ 𝑞2 = 1 − 𝛼.

෡ 𝜃 , la probabilidad anterior puede ser expresada como:


2. Dado que 𝑄 = 𝑔 Θ,

෡ 𝜃 ≤ 𝑞2 = 1 − 𝛼.
𝑃 𝑞1 ≤ 𝑔 Θ,

3. Se despeja (algebraicamente) la probabilidad en términos del parámetro 𝜃, obteniendo la siguiente probabilidad:

𝑃 𝐻1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ) ≤ 𝜃 ≤ 𝐻2 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 1 − 𝛼,

donde 𝐻1 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 𝐴 y 𝐻2 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 𝐵 son límites aleatorios, tal que con los datos de la muestra se pueden obtener los limites 𝑎 y
𝑏 del intervalo de confianza [𝑎, 𝑏] del 1 − 𝛼 100% para 𝜃:

𝒂 = 𝑯𝟏 (𝒙𝟏 , 𝒙𝟐 , …, 𝒙𝒏 ) y 𝒃 = 𝑯𝟐 𝒙𝟏 , 𝒙𝟐 , …, 𝒙𝒏
Estimación de parámetros (media, varianza y proporción)
por intervalos de confianza

1) Intervalo de confianza para la media poblacional (𝝁) cuando la varianza


poblacional (𝜎 2 ) conocida.

2) Intervalo de confianza para la media poblacional (𝝁) cuando varianza


poblacional (𝜎 2 ) desconocida.

3) Intervalo de confianza para la varianza poblacional (𝜎 2 ) o desviación


Unidad 1 (Parte 1) de
estándar (𝜎). Diseño de Experimentos
4) Intervalo de confianza para la proporción poblacional (𝑝).
FORMULARIO: Cálculos de intervalos de confianza
(IC) y tamaño de muestra (𝒏) en R
Intervalo de confianza para la varianza
poblacional (𝝈𝟐 )
Sea 𝑋1 , 𝑋2 ,…, 𝑋𝑛 es una muestra aleatoria de tamaño 𝑛 extraída de una población normal con varianza
poblacional desconocida 𝜎 2 .

2 2 2 σ𝑛 ത 2
𝑖=1(𝑋𝑖 −𝑋) σ𝑛 2 ത2
𝑖=1 𝑋𝑖 −𝑛𝑋
 Un estimador puntual del parámetro 𝜎 es la varianza muestral 𝑆 : 𝑆 = 𝑛−1
= 𝑛−1
, cuyo

valor 𝑠 2 es la estimación puntual de 𝜎 2

 Para determinar el intervalo de confianza para la varianza 𝜎 2 se puede utilizar la estadística (cantidad
𝑆2 2
pivotal): 𝑌 = (𝑛 − 1) 𝜎2 ~𝜒𝑛−1

2
 Dado el grado de confianza 1 − 𝛼, en la distribución 𝜒𝑛−1 se pueden

encontrar los valores 𝜒𝛼2 Τ2,𝑛−1 y 𝜒1−𝛼


2
Τ2,𝑛−1 tales que:

𝑷 𝝌𝟐𝜶,𝒏−𝟏 ≤ 𝒀 ≤ 𝝌𝟐𝟏−𝜶,𝒏−𝟏 = 1 − 𝛼 𝑌
𝟐 𝟐
Intervalo de confianza para la varianza
poblacional (𝝈𝟐 )
Método de la cantidad pivotal para construir el intervalo de confianza

𝑷 𝝌𝟐𝜶, 𝒏−𝟏 ≤ 𝒀 ≤ 𝝌𝟐𝟏−𝜶, 𝒏−𝟏 = 1 − 𝛼


𝟐 𝟐

𝑆2
 Sustituyendo 𝑌 = (𝑛 − 1) 𝜎2, se tiene:

𝑆2 𝑌
𝑃 𝜒𝛼2, 𝑛−1 2
≤ (𝑛 − 1) 2 ≤ 𝜒1−𝛼 =1−𝛼
2 𝜎 2
, 𝑛−1

 Despejando al parámetro 𝜎 2 , se tiene:

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃 ≤𝜎 ≤ =1−𝛼
𝜒2 𝛼 𝜒𝛼2
1− 2 , 𝑛−1
2 , 𝑛−1
Intervalo de confianza para la varianza
poblacional (𝝈𝟐 )
Si 𝑠 2 es la varianza de una muestra aleatoria de tamaño 𝑛 seleccionada de una población normal, entonces, el
intervalo de confianza del 1 − 𝛼 100% para 𝜎 2 es:

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
≤ 𝜎2 ≤
𝜒2 𝛼 𝜒𝛼2
1− , 𝑛−1
2 2
, 𝑛−1 𝑌

(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
Limites de confianza inferior y superior de la varianza poblacional (𝜎 2 ): 𝒂 = 𝜒2 y𝒃= 2
𝛼 𝜒𝛼
1− , 𝑛−1 , 𝑛−1
2 2

NOTA:
σ𝑛 ത 2
𝑖=1 𝑋𝑖 −𝑋 σ𝑛 2 ത2
𝑖=1 𝑋𝑖 −𝑛𝑋
• 𝑆2 = =
𝑛−1 𝑛−1

(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
• Limites de confianza inferior y superior de la desviación estándar poblacional (𝜎): 𝒂 = y𝒃=
𝜒2 𝛼 2
𝜒𝛼
1− 2 , 𝑛−1 2 , 𝑛−1
Cálculos de intervalos de confianza (IC) para la
varianza (o desviación estándar) en R
7.

Sea 𝑋: consumo de gasolina de un motor experimental, donde 𝑋~𝑁(𝜇, 𝜎)

Muestra: 𝑛 = 16 y 𝑆 = 2.2

Se pide el IC del 99% para 𝜎:

2 2 2 2
Como 1 − 𝛼 = 0.99, entonces 𝜒1− 𝛼
, 𝑛−1
= 𝜒0.995,15 = 32.80 y 𝜒𝛼
, 𝑛−1
= 𝜒0.005,15 = 4.601. Por lo tanto:
2 2

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
≤𝜎≤
𝜒2 𝛼 𝜒𝛼2
1− , 𝑛−1 , 𝑛−1
2 2

(16 − 1)2.22 (16 − 1)2.22


≤𝜎≤
32.80 4.601
1.49 ≤ 𝜎 ≤ 3.97
7.
Sea 𝑋: resistencia a la tensión de una fibra sintética, donde 𝑋~𝑁(𝜇, 𝜎)
Muestra: 𝑛 = 16 (𝑥1 = 48.89, 𝑥2 = 52.07, … , 𝑥16 = 51.57)
a) Se pide el IC del 98% para 𝜇 (caso 𝝈𝟐 desconocido)
De la muestra de tamaño 𝑛 = 16, se tiene: 𝑥ҧ = 49.864 y 𝑠 = 1.661
Como 1 − 𝛼 = 0.98, entonces 𝑡1−𝛼Τ2, 𝑛−1 = 𝑡0.99, 15 = 2.602. Por lo tanto:

𝑠 𝑠
𝑥ҧ − 𝑡1−𝛼Τ2, 𝑛−1 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡1−𝛼Τ2, 𝑛−1
𝑛 𝑛
1.661 1.661
49.864 − 2.602 ≤ 𝜇 ≤ 49.864 + 2.602
16 16
𝟒𝟖. 𝟕𝟖𝟒 ≤ 𝝁 ≤ 𝟓𝟎. 𝟗𝟒𝟓
Sea 𝑋: resistencia a la tensión de una fibra sintética, donde 𝑋~𝑁(𝜇, 𝜎)
Muestra: 𝑛 = 16 y 𝑥1 = 48.89, 𝑥2 = 52.07, … , 𝑥16 = 51.57

b) Se pide el IC del 98% para 𝜎:


De la muestra de tamaño 𝑛 = 16, se tiene: 𝑥ҧ = 49.864 y 𝑠 = 1.661
2
Como 1 − 𝛼 = 0.98, entonces 𝜒1− 𝛼
, 𝑛−1
2
= 𝜒0.99,15 = 30.58 y 𝜒𝛼2, 𝑛−1 = 𝜒0.01,15
2
= 5.229. Por lo tanto:
2 2

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
≤𝜎≤
𝜒2 𝛼 𝜒𝛼2
1− 2 , 𝑛−1
2 , 𝑛−1

(16 − 1)1.6612 (16 − 1)1.6612


≤𝜎≤
30.58 5.229
1.164 ≤ 𝜎 ≤ 2.814
Intervalo de confianza para la
proporción poblacional (𝒑)
Sea 𝑋1 , 𝑋2 ,…, 𝑋𝑛 es una muestra aleatoria de tamaño 𝑛 extraída de una población de Bernoulli: 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) o 𝐵𝑖𝑛(1, 𝑝),
cuyo parámetro 𝑝 es la proporción de éxitos de la población (en la muestra cada 𝑋𝑖 = 1, si hay éxito con probabilidad 𝑝, y
cada 𝑋𝑖 = 0, si no hay éxito con probabilidad 1 − 𝑝).

 Un estimador puntual del parámetro 𝑝 es la estadística 𝑃ത (proporción de éxitos en la muestra o proporción muestral)
𝑛
σ 𝑋𝑖
definida por: 𝑃ത = 𝑖=1 o ത = 𝑌 , donde la variable aleatoria 𝑌 = σ𝑛𝑖=1 𝑋𝑖 es el número de éxitos en la muestra y cuya
𝑃
𝑛 𝑛

distribución es Binomial 𝐵𝑖𝑛(𝑛, 𝑝).

𝑦
 El valor 𝑝ҧ = 𝑛, que se obtiene del estimador 𝑃ത para una muestra especifica, es la estimación puntual del parámetro 𝑝

 Aplicando el TLC (tamaño de la muestra suficientemente grande 𝑛 ≥ 30), la proporción muestral 𝑃ത es aproximadamente

𝑝(1−𝑝) ത
𝑃−𝑝

normal: 𝑃~𝑁 𝜇𝑃ത = 𝑝, 𝜎𝑃ത = . Entonces: 𝑍 = es aproximadamente 𝑁(0, 1)
𝑛 𝑝(1−𝑝)
𝑛
Intervalo de confianza para la
proporción poblacional (𝒑)
Método de la cantidad pivotal para construir el intervalo de confianza
 Para determinar el intervalo de confianza para la proporción poblacional 𝑝 se puede utilizar la estadística (cantidad


𝑃−𝑝
pivotal): 𝑍 = que es aproximadamente 𝑁(0, 1)
𝑝(1−𝑝)
𝑛

 Dado el grado de confianza 1 − 𝛼, en la distribución de 𝑍 (𝑁 0, 1 ) se puede encontrar el valor 𝑧1−𝛼Τ2 tal que:

𝑃 −𝑧1−𝛼 ≤ 𝑍 ≤ 𝑧1−𝛼 = 1 − 𝛼
2 2


𝑃−𝑝 ത
𝑃−𝑝
 Sustituyendo 𝑍 = , se tiene: 𝑃 −𝑧1−𝛼 ≤ 𝑍 = ≤ 𝑧1−𝛼 = 1 − 𝛼
𝑝(1−𝑝) 2 𝑝(1−𝑝) 2
𝑛 𝑛

𝑝 1−𝑝 𝑝(1−𝑝)
 Despejando al parámetro 𝑝, se tiene: 𝑃 𝑃ത − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑃ത + 𝑧1−𝛼 =1−𝛼
2 𝑛 2 𝑛

ҧ
𝑝(1− 𝑝)ҧ
 El error estándar de 𝑃ത (𝜎𝑃ത ) se estima por 𝜎ො 𝑃ത = 𝑛
Intervalo de confianza para la
proporción poblacional (𝒑)
Si 𝑝ҧ es la proporción de éxitos en una muestra aleatoria de tamaño 𝑛, entonces, el intervalo de confianza
del 1 − 𝛼 100% para 𝑝 es:

ഥ(𝟏 − 𝒑
𝒑 ഥ) ഥ(𝟏 − 𝒑
𝒑 ഥ)
ഥ − 𝒛𝟏−𝜶
𝒑 ഥ + 𝒛𝟏−𝜶
≤𝒑≤𝒑
𝟐 𝒏 𝟐 𝒏

ഥ(𝟏−ഥ
𝒑 𝒑) ഥ(𝟏−ഥ
𝒑 𝒑)
ഥ − 𝒛𝟏−𝜶
Limites de confianza inferior y superior de 𝑝: 𝒂 = 𝒑 ഥ + 𝒛𝟏−𝜶
y𝒃=𝒑
𝟐 𝒏 𝟐 𝒏
Intervalo de confianza para la
proporción poblacional (𝒑)
ERROR DE ESTIMACIÓN (𝑬)

Si 𝑝ҧ estima a 𝑝, entonces, el Error de estimación o Margen de error (𝑬) de 𝒑 es el valor numérico que mide la precisión de
la estimación y está definido por:

ഥ−𝒑
𝑬= 𝒑

𝒑 𝟏−𝒑 𝒑 𝟏−𝒑
ഥ−𝒑 ≤ 𝒛𝟏−𝜶
Notar que 𝑬 = 𝒑 , donde 𝜎𝑃ത = es conocida como error estándar de 𝑃ത
𝟐 𝒏 𝒏

 𝑬𝒎𝒊𝒏 = 𝟎 (cuando 𝑝ҧ estima exactamente a 𝑝)

𝒑 𝟏−𝒑 𝑝 1−𝑝
 𝑬𝒎á𝒙 = 𝒛𝟏−𝜶 (se tiene una confianza del 1 − 𝛼 100% de que 𝐸 no será superior a 𝑧1−𝛼 )
𝟐 𝒏 2 𝑛

𝑝 1−𝑝 𝑏−𝑎 𝑝 1−𝑝


Notar que: 𝐴𝑛𝑐ℎ𝑜 = 𝑏 − 𝑎 = 2𝑧1−𝛼 = 2𝐸𝑚á𝑥 y, por lo tanto: 𝐸𝑚á𝑥 = = 𝑧1−𝛼
2 𝑛 2 2 𝑛

𝐴𝑛𝑐ℎ𝑜 𝑏−𝑎 ഥ 𝟏−ഥ


𝒑 𝒑
Cuando no se conoce el valor de 𝑝, se puede usar una estimación 𝑝,ҧ entonces: 𝑬𝒎á𝒙 = = = 𝒛𝟏−𝜶
2 2 𝟐 𝒏
Intervalo de confianza para la proporción
poblacional (𝒑)
TAMAÑO DE MUESTRA (𝒏) CON ERROR DE ESTIMACIÓN ESPECIFICADO

ഥ −𝒑 ) no excederá un valor especificado 𝑬𝒎á𝒙 cuando


Si 𝑝ҧ estima a 𝑝, se tiene una confianza del 1 − 𝛼 100% de que el error de estimación (𝑬 = 𝒑
el tamaño de la muestra sea:

𝒛𝟏−𝜶 𝟐
𝟐
𝒏≈ 𝒑(𝟏 − 𝒑)
𝑬𝒎á𝒙

 Una estimación de 𝑝 es requerida en la ecuación anterior para poder obtener el valor de 𝑛, por ejemplo, 𝒑
ෝ=𝒑
ഥ , entonces:

𝑧1−𝛼 2
2
𝑛≈ ҧ − 𝑝)ҧ
𝑝(1
𝐸𝑚á𝑥

 Cuando no se tenga información de 𝒑 (por muestra preliminar o experiencia pasada): dado que 𝑝 1 − 𝑝 ≤ 0.25, el máximo valor de
𝑝 1 − 𝑝 ocurre cuando 𝑝 = 0.5, es decir, para un 𝑝 = 0.5, el valor de 𝑛 será máximo. Por lo tanto, con una confianza mínima de 1 − 𝛼 100%, el
error de estimación máximo es 𝑬𝒎á𝒙 cuando el tamaño de la muestra es:

𝒛𝟏−𝜶 𝟐
𝟐
𝒏≈ 𝟎. 𝟐𝟓
𝑬𝒎á𝒙

NOTA. Al igual que los IC de 𝜇, el valor de 𝑛 debe ser redondeado al entero superior próximo (redondeo por exceso) para que 𝑬 no exceda 𝑬𝒎á𝒙 .
Cálculos de intervalos de confianza (IC) para la
proporción y tamaño de muestra (𝒏) en R
15.

Sea:
ത proporción de manivelas con rugosidad no conforme en la muestra de tamaño 𝑛 = 85 (extraída del lote)
𝑃:
𝑦 10
𝑌: Cantidad de manivelas con rugosidad no conforme en la muestra de tamaño 𝑛 = 85, donde 𝑝ҧ = 𝑛 = 85 = 0.1176
𝑝: proporción de manivelas del lote con rugosidad no conforme (proporción poblacional) o probabilidad de que una
manivela presente rugosidad no conforme

a) El IC del 95% para 𝑝 es:

Si 1 − 𝛼 = 0.95, entonces: 𝑧1−𝛼 = 𝑧0.975 = 1.96


2

𝑝ҧ 1−𝑝ҧ 𝑝ҧ 1−𝑝ҧ
𝑝ҧ − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑝ҧ + 𝑧1−𝛼
2 𝑛 2 𝑛

0.1176 1−0.1176 0.1176 1−0.1176


0.1176 − 1.96 ≤ 𝑝 ≤ 0.1176 + 1.96
85 85

0.049 ≤ 𝑝 ≤ 0.186
15.
15.

b) Si 1 − 𝛼 = 0.95, entonces: 𝑧1−𝛼 = 𝑧0.975 = 1.96


2
𝑦 10
𝐸𝑚á𝑥 = 0.05 y tenemos una estimativa de 𝑝: 𝑝ҧ = = = 0.1176 que será usada en el calculo de 𝑛
𝑛 85

𝑧 𝛼
2
1−
2 1.96 2
𝑛≈ 𝑝ҧ 1 − 𝑝ҧ ≈ 0.1176 1 − 0.1176 = 159.51, entonces 𝑛 = 160
𝐸𝑚á𝑥 0.05

c) Para un 𝑝 = 0.5 podemos obtener el valor máximo de 𝑛:


𝑧1−𝛼 2 1.96
2
2
𝑛≈ 0.25 ≈ 0.25 ≈ 384.15
𝐸𝑚á𝑥 0.05

Por lo tanto, con un tamaño de muestra de 𝑛 = 385, el error de estimación no será mayor a 0.05 con un nivel de
confianza de por lo menos el 95%
15.
12.

ത proporción muestral de pacientes en donde el fármaco fue eficaz para el tratamiento del cáncer de piel (𝑛 = 400)
𝑃:
𝑌: Cantidad de pacientes en la muestra de tamaño 𝑛 = 400 en donde el fármaco fue eficaz para el tratamiento del cáncer
𝑦 208
de piel, donde 𝑝ҧ = 𝑛 = 400 = 0. 52
𝑝: proporción de pacientes con cáncer de piel en donde el fármaco sería eficaz para el tratamiento de dicho cáncer.
El IC del 95% para 𝑝 es:

Si 1 − 𝛼 = 0.95, entonces: 𝑧1−𝛼 = 𝑧0.975 = 1.96


2

𝑝ҧ 1−𝑝ҧ 𝑝ҧ 1−𝑝ҧ
𝑝ҧ − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑝ҧ + 𝑧1−𝛼
2 𝑛 2 𝑛

0.52 1−0.52 0.52 1−0.52


0.52 − 1.96 400
≤ 𝑝 ≤ 0.52 + 1.96 400

Dado que 0.4710 ≤ 𝑝 ≤ 0.5690, con un 95% de confianza y en base a una muestra de 400 pacientes, no se podría
concluir que hay evidencia suficiente para afirmar que el fármaco es efectivo (considerando que la efectividad debería ser
por lo menos del 50%)
¿Preguntas?

¡GRACIAS!
Profesor: Dr. Martín Guillermo Cornejo Sarmiento
E-mail: mgcornejo@ulima.edu.pe
Web: https://cris.ulima.edu.pe/es/persons/mart%C3%ADn-guillermo-cornejo-sarmiento

También podría gustarte