Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISEÑO DE EXPERIMENTOS
2023-1
Estimación de parámetros (media, varianza y proporción)
por intervalos de confianza
1) Estimación de parámetros
a) Estimación puntual
2) Prueba de hipótesis
Introducción: Estadística Inferencial (o Inferencia Estadística)
EN GENERAL:
Una población (discreta o continua) tiene una función de probabilidad 𝑓(𝑥) cuyo(s) parámetro(s) se intenta(n)
determinar.
Si el parámetro a determinar es denotado por 𝜃, entonces, la distribución de la población será 𝑓(𝑥, 𝜃).
Los métodos de inferencia estadística consisten en seleccionar una muestra aleatoria de la población de manera que
se pueda:
b) La estimación es un intervalo en el que están comprendidos los valores de 𝜃 Estimación de parámetros por intervalos
2) Decidir si 𝜃, o alguna función de 𝜃, es igual (diferente, mayor o menor) a algún valor específico 𝜃0 de 𝜃 Prueba de
hipótesis
Estimación de parámetros por intervalos
Una estimación puntual no proporciona la precisión de la estimación porque no indica cuán próximo está la
estimación al parámetro que se estima.
Una estimación puntual no proporciona un grado de confianza de que la estimación se halla dentro de cierta
variación.
𝑃 𝐴 ≤𝜃 ≤ 𝐵 =1−𝛼
Entonces, se dice que el intervalo aleatorio [𝐴, 𝐵] es el intervalo estimador del parámetro 𝜃 con el grado o nivel de
confianza de 1 − 𝛼 100%, o que 𝜽 ∈ [𝑨, 𝑩] con probabilidad 𝟏 − 𝜶.
Además, si 𝑎 = 𝐻1 (𝑥1 , 𝑥2 , …, 𝑥𝑛 ) y 𝑏 = 𝐻2 𝑥1 , 𝑥2 , …, 𝑥𝑛 son los valores numéricos que resultan de sustituir los datos
de la muestra en las estadísticas A y B. Entonces, se dice que el intervalo numérico [𝑎, 𝑏] es el intervalo de confianza del
parámetro 𝜃 con el grado o nivel de confianza de 1 − 𝛼 100% para 𝜃.
Estimación de parámetros por intervalos
[𝐴, 𝐵] es un intervalo aleatorio Se puede afirmar que 𝑃 𝐴 ≤ 𝜃 ≤ 𝐵 = 1 − 𝛼.
𝟏 − 𝜶 𝟏𝟎𝟎% es el grado o nivel de confianza. Los valores más utilizados son 95%, 98%, 99%, 90%, entre otros.
𝒂 es el límite inferior de confianza y 𝒃 es el límite superior de confianza (limites del intervalo de confianza del 1 − 𝛼 100% para 𝜃).
Interpretación del intervalo de confianza [𝒂, 𝒃] del 𝟏 − 𝜶 𝟏𝟎𝟎% para 𝜽: si, a partir de los datos de la muestra aleatoria de tamaño 𝑛,
se ha construido el intervalo [𝑎, 𝑏] con nivel de confianza 1 − 𝛼 100% (por ejemplo, 95%) para el parámetro 𝜃, podemos afirmar:
Se tiene un nivel de confianza del 1 − 𝛼 100% (por ejemplo, del 95%) de que el parámetro 𝜃 está en el intervalo [𝑎, 𝑏].
Suponiendo que se seleccionan repetidamente 100 muestras (subgrupos) diferentes de tamaño 𝑛, se tendrán 100 intervalos semejantes
al intervalo [𝑎, 𝑏] y se confía que 95 de estos 100 intervalos contengan al parámetro 𝜽.
La precisión de la estimación se puede medir en términos del error de estimación (𝑬), llamado también margen de error o error
muestral: 𝑬 = 𝜃−𝜃 , siendo 𝜃 la estimación puntual de 𝜃 (usando al estimador Θ)
obtenida a partir de la muestra aleatoria de tamaño 𝑛.
Estimación de parámetros por intervalos
4. Calcular los límites del intervalo de confianza de acuerdo al método de la cantidad pivotal.
(es decir, una función de una variable aleatoria que depende de los elementos de la muestra
Cantidad pivotal (𝑸): es una función del estimador Θ
𝑋1 , 𝑋2 , …, 𝑋𝑛 y el tamaño de muestra 𝑛) y del parámetro 𝜃. La distribución de probabilidad de 𝑸 es conocida y no depende del valor de 𝜃.
1. Dado que la distribución de probabilidad de 𝑸 es conocida y considerando un nivel de confianza fijo 1 − 𝛼 100%, definimos la siguiente
probabilidad que incluye los cuantiles (límites) 𝑞1 y 𝑞2 de 𝑄:
𝑃 𝑞1 ≤ 𝑄 ≤ 𝑞2 = 1 − 𝛼.
𝜃 ≤ 𝑞2 = 1 − 𝛼.
𝑃 𝑞1 ≤ 𝑔 Θ,
𝑃 𝐻1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ) ≤ 𝜃 ≤ 𝐻2 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 1 − 𝛼,
donde 𝐻1 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 𝐴 y 𝐻2 𝑋1 , 𝑋2 , …, 𝑋𝑛 = 𝐵 son límites aleatorios, tal que con los datos de la muestra se pueden obtener los limites 𝑎 y
𝑏 del intervalo de confianza [𝑎, 𝑏] del 1 − 𝛼 100% para 𝜃:
𝒂 = 𝑯𝟏 (𝒙𝟏 , 𝒙𝟐 , …, 𝒙𝒏 ) y 𝒃 = 𝑯𝟐 𝒙𝟏 , 𝒙𝟐 , …, 𝒙𝒏
Estimación de parámetros (media, varianza y proporción)
por intervalos de confianza
2 2 2 σ𝑛 ത 2
𝑖=1(𝑋𝑖 −𝑋) σ𝑛 2 ത2
𝑖=1 𝑋𝑖 −𝑛𝑋
Un estimador puntual del parámetro 𝜎 es la varianza muestral 𝑆 : 𝑆 = 𝑛−1
= 𝑛−1
, cuyo
Para determinar el intervalo de confianza para la varianza 𝜎 2 se puede utilizar la estadística (cantidad
𝑆2 2
pivotal): 𝑌 = (𝑛 − 1) 𝜎2 ~𝜒𝑛−1
2
Dado el grado de confianza 1 − 𝛼, en la distribución 𝜒𝑛−1 se pueden
𝑷 𝝌𝟐𝜶,𝒏−𝟏 ≤ 𝒀 ≤ 𝝌𝟐𝟏−𝜶,𝒏−𝟏 = 1 − 𝛼 𝑌
𝟐 𝟐
Intervalo de confianza para la varianza
poblacional (𝝈𝟐 )
Método de la cantidad pivotal para construir el intervalo de confianza
𝑆2
Sustituyendo 𝑌 = (𝑛 − 1) 𝜎2, se tiene:
𝑆2 𝑌
𝑃 𝜒𝛼2, 𝑛−1 2
≤ (𝑛 − 1) 2 ≤ 𝜒1−𝛼 =1−𝛼
2 𝜎 2
, 𝑛−1
(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃 ≤𝜎 ≤ =1−𝛼
𝜒2 𝛼 𝜒𝛼2
1− 2 , 𝑛−1
2 , 𝑛−1
Intervalo de confianza para la varianza
poblacional (𝝈𝟐 )
Si 𝑠 2 es la varianza de una muestra aleatoria de tamaño 𝑛 seleccionada de una población normal, entonces, el
intervalo de confianza del 1 − 𝛼 100% para 𝜎 2 es:
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
≤ 𝜎2 ≤
𝜒2 𝛼 𝜒𝛼2
1− , 𝑛−1
2 2
, 𝑛−1 𝑌
(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
Limites de confianza inferior y superior de la varianza poblacional (𝜎 2 ): 𝒂 = 𝜒2 y𝒃= 2
𝛼 𝜒𝛼
1− , 𝑛−1 , 𝑛−1
2 2
NOTA:
σ𝑛 ത 2
𝑖=1 𝑋𝑖 −𝑋 σ𝑛 2 ത2
𝑖=1 𝑋𝑖 −𝑛𝑋
• 𝑆2 = =
𝑛−1 𝑛−1
(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
• Limites de confianza inferior y superior de la desviación estándar poblacional (𝜎): 𝒂 = y𝒃=
𝜒2 𝛼 2
𝜒𝛼
1− 2 , 𝑛−1 2 , 𝑛−1
Cálculos de intervalos de confianza (IC) para la
varianza (o desviación estándar) en R
7.
Muestra: 𝑛 = 16 y 𝑆 = 2.2
2 2 2 2
Como 1 − 𝛼 = 0.99, entonces 𝜒1− 𝛼
, 𝑛−1
= 𝜒0.995,15 = 32.80 y 𝜒𝛼
, 𝑛−1
= 𝜒0.005,15 = 4.601. Por lo tanto:
2 2
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
≤𝜎≤
𝜒2 𝛼 𝜒𝛼2
1− , 𝑛−1 , 𝑛−1
2 2
𝑠 𝑠
𝑥ҧ − 𝑡1−𝛼Τ2, 𝑛−1 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡1−𝛼Τ2, 𝑛−1
𝑛 𝑛
1.661 1.661
49.864 − 2.602 ≤ 𝜇 ≤ 49.864 + 2.602
16 16
𝟒𝟖. 𝟕𝟖𝟒 ≤ 𝝁 ≤ 𝟓𝟎. 𝟗𝟒𝟓
Sea 𝑋: resistencia a la tensión de una fibra sintética, donde 𝑋~𝑁(𝜇, 𝜎)
Muestra: 𝑛 = 16 y 𝑥1 = 48.89, 𝑥2 = 52.07, … , 𝑥16 = 51.57
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
≤𝜎≤
𝜒2 𝛼 𝜒𝛼2
1− 2 , 𝑛−1
2 , 𝑛−1
Un estimador puntual del parámetro 𝑝 es la estadística 𝑃ത (proporción de éxitos en la muestra o proporción muestral)
𝑛
σ 𝑋𝑖
definida por: 𝑃ത = 𝑖=1 o ത = 𝑌 , donde la variable aleatoria 𝑌 = σ𝑛𝑖=1 𝑋𝑖 es el número de éxitos en la muestra y cuya
𝑃
𝑛 𝑛
𝑦
El valor 𝑝ҧ = 𝑛, que se obtiene del estimador 𝑃ത para una muestra especifica, es la estimación puntual del parámetro 𝑝
Aplicando el TLC (tamaño de la muestra suficientemente grande 𝑛 ≥ 30), la proporción muestral 𝑃ത es aproximadamente
𝑝(1−𝑝) ത
𝑃−𝑝
ത
normal: 𝑃~𝑁 𝜇𝑃ത = 𝑝, 𝜎𝑃ത = . Entonces: 𝑍 = es aproximadamente 𝑁(0, 1)
𝑛 𝑝(1−𝑝)
𝑛
Intervalo de confianza para la
proporción poblacional (𝒑)
Método de la cantidad pivotal para construir el intervalo de confianza
Para determinar el intervalo de confianza para la proporción poblacional 𝑝 se puede utilizar la estadística (cantidad
ത
𝑃−𝑝
pivotal): 𝑍 = que es aproximadamente 𝑁(0, 1)
𝑝(1−𝑝)
𝑛
Dado el grado de confianza 1 − 𝛼, en la distribución de 𝑍 (𝑁 0, 1 ) se puede encontrar el valor 𝑧1−𝛼Τ2 tal que:
𝑃 −𝑧1−𝛼 ≤ 𝑍 ≤ 𝑧1−𝛼 = 1 − 𝛼
2 2
ത
𝑃−𝑝 ത
𝑃−𝑝
Sustituyendo 𝑍 = , se tiene: 𝑃 −𝑧1−𝛼 ≤ 𝑍 = ≤ 𝑧1−𝛼 = 1 − 𝛼
𝑝(1−𝑝) 2 𝑝(1−𝑝) 2
𝑛 𝑛
𝑝 1−𝑝 𝑝(1−𝑝)
Despejando al parámetro 𝑝, se tiene: 𝑃 𝑃ത − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑃ത + 𝑧1−𝛼 =1−𝛼
2 𝑛 2 𝑛
ҧ
𝑝(1− 𝑝)ҧ
El error estándar de 𝑃ത (𝜎𝑃ത ) se estima por 𝜎ො 𝑃ത = 𝑛
Intervalo de confianza para la
proporción poblacional (𝒑)
Si 𝑝ҧ es la proporción de éxitos en una muestra aleatoria de tamaño 𝑛, entonces, el intervalo de confianza
del 1 − 𝛼 100% para 𝑝 es:
ഥ(𝟏 − 𝒑
𝒑 ഥ) ഥ(𝟏 − 𝒑
𝒑 ഥ)
ഥ − 𝒛𝟏−𝜶
𝒑 ഥ + 𝒛𝟏−𝜶
≤𝒑≤𝒑
𝟐 𝒏 𝟐 𝒏
ഥ(𝟏−ഥ
𝒑 𝒑) ഥ(𝟏−ഥ
𝒑 𝒑)
ഥ − 𝒛𝟏−𝜶
Limites de confianza inferior y superior de 𝑝: 𝒂 = 𝒑 ഥ + 𝒛𝟏−𝜶
y𝒃=𝒑
𝟐 𝒏 𝟐 𝒏
Intervalo de confianza para la
proporción poblacional (𝒑)
ERROR DE ESTIMACIÓN (𝑬)
Si 𝑝ҧ estima a 𝑝, entonces, el Error de estimación o Margen de error (𝑬) de 𝒑 es el valor numérico que mide la precisión de
la estimación y está definido por:
ഥ−𝒑
𝑬= 𝒑
𝒑 𝟏−𝒑 𝒑 𝟏−𝒑
ഥ−𝒑 ≤ 𝒛𝟏−𝜶
Notar que 𝑬 = 𝒑 , donde 𝜎𝑃ത = es conocida como error estándar de 𝑃ത
𝟐 𝒏 𝒏
𝒑 𝟏−𝒑 𝑝 1−𝑝
𝑬𝒎á𝒙 = 𝒛𝟏−𝜶 (se tiene una confianza del 1 − 𝛼 100% de que 𝐸 no será superior a 𝑧1−𝛼 )
𝟐 𝒏 2 𝑛
𝒛𝟏−𝜶 𝟐
𝟐
𝒏≈ 𝒑(𝟏 − 𝒑)
𝑬𝒎á𝒙
Una estimación de 𝑝 es requerida en la ecuación anterior para poder obtener el valor de 𝑛, por ejemplo, 𝒑
ෝ=𝒑
ഥ , entonces:
𝑧1−𝛼 2
2
𝑛≈ ҧ − 𝑝)ҧ
𝑝(1
𝐸𝑚á𝑥
Cuando no se tenga información de 𝒑 (por muestra preliminar o experiencia pasada): dado que 𝑝 1 − 𝑝 ≤ 0.25, el máximo valor de
𝑝 1 − 𝑝 ocurre cuando 𝑝 = 0.5, es decir, para un 𝑝 = 0.5, el valor de 𝑛 será máximo. Por lo tanto, con una confianza mínima de 1 − 𝛼 100%, el
error de estimación máximo es 𝑬𝒎á𝒙 cuando el tamaño de la muestra es:
𝒛𝟏−𝜶 𝟐
𝟐
𝒏≈ 𝟎. 𝟐𝟓
𝑬𝒎á𝒙
NOTA. Al igual que los IC de 𝜇, el valor de 𝑛 debe ser redondeado al entero superior próximo (redondeo por exceso) para que 𝑬 no exceda 𝑬𝒎á𝒙 .
Cálculos de intervalos de confianza (IC) para la
proporción y tamaño de muestra (𝒏) en R
15.
Sea:
ത proporción de manivelas con rugosidad no conforme en la muestra de tamaño 𝑛 = 85 (extraída del lote)
𝑃:
𝑦 10
𝑌: Cantidad de manivelas con rugosidad no conforme en la muestra de tamaño 𝑛 = 85, donde 𝑝ҧ = 𝑛 = 85 = 0.1176
𝑝: proporción de manivelas del lote con rugosidad no conforme (proporción poblacional) o probabilidad de que una
manivela presente rugosidad no conforme
𝑝ҧ 1−𝑝ҧ 𝑝ҧ 1−𝑝ҧ
𝑝ҧ − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑝ҧ + 𝑧1−𝛼
2 𝑛 2 𝑛
0.049 ≤ 𝑝 ≤ 0.186
15.
15.
𝑧 𝛼
2
1−
2 1.96 2
𝑛≈ 𝑝ҧ 1 − 𝑝ҧ ≈ 0.1176 1 − 0.1176 = 159.51, entonces 𝑛 = 160
𝐸𝑚á𝑥 0.05
Por lo tanto, con un tamaño de muestra de 𝑛 = 385, el error de estimación no será mayor a 0.05 con un nivel de
confianza de por lo menos el 95%
15.
12.
ത proporción muestral de pacientes en donde el fármaco fue eficaz para el tratamiento del cáncer de piel (𝑛 = 400)
𝑃:
𝑌: Cantidad de pacientes en la muestra de tamaño 𝑛 = 400 en donde el fármaco fue eficaz para el tratamiento del cáncer
𝑦 208
de piel, donde 𝑝ҧ = 𝑛 = 400 = 0. 52
𝑝: proporción de pacientes con cáncer de piel en donde el fármaco sería eficaz para el tratamiento de dicho cáncer.
El IC del 95% para 𝑝 es:
𝑝ҧ 1−𝑝ҧ 𝑝ҧ 1−𝑝ҧ
𝑝ҧ − 𝑧1−𝛼 ≤ 𝑝 ≤ 𝑝ҧ + 𝑧1−𝛼
2 𝑛 2 𝑛
Dado que 0.4710 ≤ 𝑝 ≤ 0.5690, con un 95% de confianza y en base a una muestra de 400 pacientes, no se podría
concluir que hay evidencia suficiente para afirmar que el fármaco es efectivo (considerando que la efectividad debería ser
por lo menos del 50%)
¿Preguntas?
¡GRACIAS!
Profesor: Dr. Martín Guillermo Cornejo Sarmiento
E-mail: mgcornejo@ulima.edu.pe
Web: https://cris.ulima.edu.pe/es/persons/mart%C3%ADn-guillermo-cornejo-sarmiento