Está en la página 1de 22

Bioestadística II

Profesor Boanerges Dominguez


Intervalos de confianza y tamaño
de la muestra

• Intervalos de confianza para la media


cuando se conoce σ y el tamaño de la
muestra
Contenido • Intervalos de confianza para la media
cuando se desconoce σ
• Intervalos de confianza y tamaño de la
muestra para estimar las proporciones.
• Intervalos de confianza de la varianzas
y la desviación estándar
Conceptos
o Una estimación puntual: se elige una muestra aleatoria de una población con media poblacional µ y
desviación estándar σ : la muestra se representa por X1, X2… Xn .
o Una estimación puntual es una estimación del verdadero valor del parámetro.
o Cuatro parámetros de interés: media poblacional (µ), proporción poblacional (P), varianza poblacional (𝜎 2 ) y
desviación estándar poblacional (σ)
o Cuatro estimaciones puntuales de interés : media muestral ( ), proporción muestral (𝑃) ෠ , varianza
muestral (S2 ) y
desviación estándar muestral (S)
o los estimadores ,(𝑃) ෠ y S2 son los mejores estimadores de µ, P y 𝜎 2
o Propiedades de un buen estimador: consistente, insesgado y eficiente
o La media de es igual a la media poblacional (µ =µx).
o La varianza de es igual a la varianza población sobre n (𝜎 2 . =𝜎 2 /n)
𝑁−𝑛
o Para la varianza de (muestreo sin reemplazo hay que multiplicar por factor 𝑁−1 (factor de corrección).
𝜎
o Error estándar o típico, ee( )= 𝜎𝑥ҧ =√𝑛
o
El margen de error, también llamado error máximo de la estimación es la máxima diferencia probable entre
la estimación puntual de un parámetro y el valor real del mismo.
o Estimación por intervalo: una estimación por intervalo de un parámetro es un intervalo o un rango de valores utilizados para estimar el
parámetro. Esta estimación puede o no contener el valor del parámetro que se estima.
o El nivel de confianza de una estimación por intervalo de un parámetro es la probabilidad de que la estimación de intervalo contenga el
parámetro.
o Un intervalo de confianza es una estimación de intervalo específico de un parámetro determinado por los datos obtenidos de una muestra
aleatoria
o Los intervalos construidos de esta manera se llaman intervalos de confianza. Se utilizan tres intervalos de confianza comunes: el 90%, el
95% y el 99%.
o Intervalos de confianza para la media poblacional cuando se conoce σ: estimación puntual ± margen de error
𝝈 𝝈
o ഥ − 𝒛𝜶
Fórmula: 𝑿 ഥ + 𝒛𝜶
<𝝁<𝑿 nivel de confianza 90% (1-α=0.90) α =0.10 Z=±1.65
𝟐 𝒏 𝟐 𝒏

o nivel de confianza 95% (1-α=0.95) α =0.05 Z=±1.96


o nivel de confianza 99% (1-α=0.01) α =0.01 Z=±2.58

o Supuestos: 1)La muestra es aleatoria 2) n ≥ 30 o la población se distribuye normalmente cuando n < 30.
𝐄𝐧𝐜𝐨𝐧𝐭𝐫𝐚𝐫 𝐳𝛂/𝟐 para un intervalo de confianza del 98%: valores críticos z = ±2.33
Intervalos de confianza para la media cuando se conoce σ : se usa la distribución normal

𝝈 𝝈
ഥ − 𝒛𝜶
Fórmula: 𝑿 ഥ + 𝒛𝜶
<𝝁<𝑿
𝟐 𝒏 𝟐 𝒏

Para un nivel de confianza(nc) del 90%, 𝒛𝜶/𝟐 = 1.65, para un nc del 95%, 𝒛𝜶/𝟐 = 1.96 y para un nc del 99%, 𝒛𝜶/𝟐 = 2.58.

Supuestos: 1)La muestra es aleatoria 2) n ≥ 30 o la población se distribuye normalmente cuando n < 30.
Ejemplo. En un centro de emergencia asistido por 4 doctores desea estimar el número de pacientes
que son atendidos por hora. Se elijen los registros de una muestra de 42 horas, la muestra arrojó
media de 18 pacientes por hora. Supongamos que la desviación estándar poblacional es conocida y
es igual 3.2.
a) Interprete la media de la muestra.
b) Encuentre el error estándar de la media muestral. Interprete.
c) Encuentre el margen de error si la confianza es de 99%.
d) Construya el intervalo de confianza de 99% para la media. Interpretación
Solución
a) Los 4 doctores ven aproximadamente en promedio 18 pacientes por hora.
𝜎 3.2
b) ee(𝑥)ҧ =𝜎𝑥ҧ = = = 0.494, aproximadamente los promedios se van a desviar 0.5 del
𝑛 42
verdadero valor de la media
𝜎
c) E= 𝑧𝛼/2 = 2.58(0.494)= 1.27
𝑛
d) 𝑥ҧ − 𝐸 < 𝜇 < 𝑥ҧ + 𝐸: 18 − 1.27 < 𝜇 <18 +1.27 17< 𝝁 <19
Tengo una confianza de 99% de que el verdadero promedio de pacientes por hora que ven los 4 doctores está entre 17 y 19
Ejercicio:
o A continuación se indica el número de gramos de carbohidratos en 36 sándwiches (subs de 7 pulgadas) seleccionado aleatoriamente:

63 67 61 64 51 42 56 70 61 55 60 55 57 60 60 66 55 58
70 65 49 51 61 54 50 55 56 53 65 68 63 48 54 56 57 52

La desviación estándar de la población es de 6.46. Obtenga e interprete


o 1. la estimación puntual de la media poblacional
o 2. el error estándar de la media muestral
o 3. el margen de error (E) con una confianza de 95%
o 4. el intervalo de confianza del 95% para la media poblacional
Tamaño de la muestra para estimar la media poblacional

o La determinación del tamaño de la muestra está estrechamente relacionada con la estimación estadística. Muy a
menudo pregunta, ¿Qué tamaño de muestra es necesario para hacer una estimación precisa? La respuesta no es
simple, depende de tres cosas: el margen de error, la desviación estándar de la población y el nivel de confianza. Por
ejemplo, ¿cuán cerca de la verdadera media desea estar (2 unidades, 5 unidades, etc.), y cuánta confianza quieres tener
(90, 95, 99%, etc.)?
𝜎 𝒛∙ 𝝈 𝟐
o La formula se deriva del margen de error, E= 𝑧𝛼/2 , simplemente se despeja la n, n =
𝑛 𝑬

𝑛0 𝒛∙ 𝝈 𝟐
o Para poblaciones finitas (N<10,000) use n= 𝑛 donde n0 =
1+( 0) 𝑬
𝑁

o Ejemplo: el presidente del colegio medico pide a un estadístico que estime la edad promedio de los pasantes médicos en
los hospitales públicos de Santo Domingo. ¿Cuál es el tamaño mínimo de muestra necesaria? El estadístico quiere estar
99% seguro de que la estimación debe estar dentro de 1 año. De un estudio anterior, se sabe que la desviación estándar
de las edades es de 3 años.
Ejercicio:
Un investigador desea estimar la cantidad promedio de minutos por día que una persona usa el internet. Qué
tan grande debe ser una muestra si el investigador desea estar 90% segura de que el la media de la población
está dentro de los 10 minutos de la media muestral (a) si la población es mayor a 10,000, (b) si la población es
de 2000 . Suponga que la desviación estándar de la población es 42 minutos
Intervalos de confianza para la media cuando no se conoce σ: se usa la distribución t-student

o Nota histórica: la distribución t fue formulada en 1908 por un empleado de una cervecería llamado W. S. Gosset. Gosset participó en la investigación
de nuevos métodos de fabricación de cerveza. Los empleados no podían publicar resultados con su nombre, Gosset publicó su hallazgo usando el
seudónimo de student, de ahí su origen, se denomina distribución t student
o Distribución t-student
o Cuando se elige una muestra alaetoria de tamaño n de una población con distribución normal con media µ y desviación estándar σ .
o
𝜎
o tiene distribución normal con media con media µ 𝑦 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑛
o

ത µ
𝑋−
o Z= 𝜎 tiene distribucion normal estandar con media cero y desviacion estandar de 1
𝑛
Intervalos de confianza para la media cuando no se conoce σ: se usa la
distribución t-student

𝑠 𝑠
ത − 𝑡𝛼/2
o𝑋 < 𝜇 < 𝑋ത + 𝑡𝛼/2
𝑛 𝑛
Los grados de libertad son n-1

Supuestos :
1. La muestra es una muestra aleatoria.
2. O bien n ≥ 30 o la población se distribuye normalmente cuando n <
30.
Tabla t-student
La distribución t (de Student)
o La distribución t es similar a la distribución normal estándar en estos
aspectos:
1. Tiene forma de campana.
2. Es simétrica respecto a la media.
3. La media, la mediana y la moda son iguales a 0 y se encuentran en el centro
de la distribución.
4. La curva se aproxima pero nunca toca el eje x.
o Difiere de la distribución normal estándar de las siguientes maneras:
1. La varianza es mayor que 1.
2. Es una familia de curvas basadas en el concepto de grados de libertad, que
está relacionado con el tamaño de la muestra.
3. A medida que el tamaño de la muestra aumenta, se aproxima a la
distribución normal estándar.
Ejemplo
o Los datos son una muestra aleatoria del número de pacientes recibidos en
emergencias con grados de quemaduras los últimos años en una gran ciudad.
Encuentre el intervalo de confianza del 99% para el número medio de pacientes
con quemaduras cada año.
5460 5900 6090 6310 7160 8440 9930

𝑠 𝑠
𝑋ത − 𝑡𝛼/2 < 𝜇 < 𝑋ത + 𝑡𝛼/2
𝑛 𝑛
Paso 1. Encontrar la media y la desviación estándar de los datos. 𝑋=ത 7041.4, S= 1610.3
Paso 2. Encuentra 𝑡𝛼/2 en la Tabla F. Use el intervalo de confianza del 99% con gl = 6. → 3.707.
Paso 3. Sustituir en la fórmula y resolver
1610.3 1610.3
7041.4−3.707 < 𝜇 < 7041.4 + 3.707
7 7

7041.4−2256.2 < 𝜇 < 7041.4 + 2256.2

4785.2 < 𝜇 < 9297.6


Intervalos de confianza y tamaño de la muestra
para las proporciones.
Símbolos utilizados en la notación de proporción
P = proporción poblacional
𝑝Ƹ = proporción muestral

𝑋 𝑛−𝑋
Para la proporción muestral 𝑝Ƹ = y 𝑞ො = o 𝑞ො = 1 - 𝑝Ƹ
𝑛 𝑛
donde X = número de unidades de muestra que poseen las
características de interés y n = tamaño de la muestra.
Fórmula para un intervalo de confianza para una
proporción
𝑝Ƹ 𝑞ො 𝑝Ƹ 𝑞ො
𝑝Ƹ − 𝑧𝛼/2 < 𝑝 < 𝑝Ƹ + 𝑧𝛼/2
𝑛 𝑛

Donde 𝑛𝑝Ƹ y 𝑛𝑞ො son cada uno mayor o igual a 5

Supuestos para encontrar un intervalo de confianza para una proporción


poblacional:
1. La muestra es una muestra aleatoria.
2. Se cumplen las condiciones para un experimento binómial
Ejemplo
Una encuesta realizada por Sallie Mae y Gallup a 1404 encuestados encontró
que 323 doctores pagaron su educación con préstamos estudiantiles.
Encuentre el intervalo de confianza del 90% de la verdadera proporción de
doctores que pagaron su educación por préstamos estudiantiles.

Paso 3. Sustituya la fórmula


ෝy𝒒
o Paso 1. Determine 𝒑 ෝ
𝑝Ƹ 𝑞ො 𝑝Ƹ 𝑞ො
𝑝Ƹ − 𝑧𝛼/2 < 𝑝 < 𝑝Ƹ + 𝑧𝛼/2
𝑛 𝑛
𝑝Ƹ = 𝑋𝑛 = 1404
323
= 0.23 𝑞ො = 1 - 𝑝Ƹ = 1- 0.23 = 0.77

0.23 0.77 0.23 0.77


0.23−1.65 < 𝑝 < 0.23 + 1.65
1404 1404
o Paso 2. Determine el valor critico

𝛼 0.10 0.23 – 0.019 < 𝑝 < 0.23 + 0.019


α = 1 − 0.90 = 0.10 = = 0.05 0.211 < 𝑝 < 0.249
2 2 21.1% < 𝑝 < 24.9%
𝑧𝛼/2 = 1.65
Fórmula para el tamaño mínimo de muestra necesario para la
estimación del intervalo de una proporción de población
𝑍𝛼 2
2
n= 𝑝Ƹ 𝑞ො
𝐸

Ejemplo. Un investigador desea estimar, con un 95% de confianza, la


proporción de estudiantes de medicina que no tenían un estetoscopio.
Un estudio previo muestra que el 40% de los entrevistados no tenían
un estetoscopio. El investigador desea ser preciso dentro del 2% de la
proporción real. Encuentra el tamaño mínimo de muestra necesario.
Intervalos de confianza para varianzas y
desviaciones estándar
o Fórmula
(𝑛 − 1)𝑠 2 2 <
(𝑛 − 1)𝑠 2
< 𝜎
2𝑑𝑒𝑟𝑒𝑐ℎ𝑎 2𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎

(𝑛−1)𝑠2 (𝑛−1)𝑠2
<𝜎<
 2
𝑑𝑒𝑟𝑒𝑐ℎ𝑎 2𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎

Grados de libertad= n-1


Ejemplo
o Un estudio de 30 enfermeras encontró que la desviación estándar de sus edades
era de 5.2 años. Encuentre el 95% de intervalo de confianza de la varianza para la
variable de edad. Asume que la variable está distribuida normalmente.

Dado que α = 0.05, los dos valores críticos, para los niveles de 0.025 y 0.975 para 29
grados de libertad son 45.722 y 16.047.

(𝑛 − 1)𝑠 2 2 <
(𝑛 − 1)𝑠 2
< 𝜎
2𝑑𝑒𝑟𝑒𝑐ℎ𝑎 2𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎

(30 − 1)(5.2)2 (30 − 1)(5.2)2


< 𝜎2 <
45.722 16.047

17.2< 𝜎 2 <48.9

También podría gustarte