Está en la página 1de 38

Estimaciones y

tamaños de muestra
Informática en Salud
Mg. Adiel Omar FLORES RAMOS

2
Propósito semanal
• Realiza inferencias estadísticas
basados en el cálculo de
parámetros.
Contenido

• Distribuciones muestrales
• Estimadores
• Intervalo de confianza para un
parámetro
• Intervalos de confianza para dos
parámetros
Estimadores
Estimador
• Un estimador es un estadístico usado para estimar un
parámetro desconocido de la población.
• Por ejemplo, si se desea conocer el precio medio de un
artículo (el parámetro desconocido) se recogerán
observaciones del precio de dicho artículo en diversos
establecimientos (la muestra) y la media aritmética de las
observaciones puede utilizarse como estimador del precio
medio.
Ejemplo

Inferencia

ഥ =240 cc
× µ
Estimador
• Para cada parámetro pueden existir varios estimadores
diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes, como insesgadez,
eficiencia, convergencia y robustez.
• El valor de un estimador proporciona una estimación
puntual del valor del parámetro en estudio.
• En general, se suele preferir realizar una estimación mediante
un intervalo, esto es, obtener un intervalo [a,b] dentro del
cual se espera esté el valor real del parámetro con un
cierto nivel de confianza.
Ejemplo

Inferencia

[235;245] µ
Estimación puntual
Intervalos de
confianza para un
parámetro
Intervalos
• Un intervalo, significa sustituir la estimación puntual, por un
intervalo de posibles valores.
• Esto es una estimación por intervalo o intervalo de confianza,
es decir, un intervalo de valores posibles para el parámetro
que se estima.
• El grado de posibilidades se especifica por un nivel de
confianza, de modo que hablaremos de un intervalo de
confianza de 95% (nivel de confianza de 95%) o intervalo al
99%.
Intervalos de
confianza para una
proporción
¿Funciona la terapia de contacto? (Triola, p.319)
• Ensayos realizados: 280
• Aciertos (éxitos): 123
• Estimador puntual (éxitos):
123
𝑝Ƹ = = 0.439285 = 44%
280

𝑞ො = 56%
Intervalo de confianza
• Nivel de confianza: 95%

0,381 < p < 0,497

“Tenemos una confianza de 95% de que el intervalo


de 0,381 a 0,497 realmente contiene el valor de p”

“Existe un 95% de probabilidad de que el valor real de p


esté entre 0,381 y 0,497”.
Cálculo del intervalo de confianza

𝑝Ƹ − 𝐸 < 𝑝 < 𝑝Ƹ + 𝐸

• Donde
E : Margen de error
Margen de Error
• El margen de error E también se denomina error máximo del
estimado y se calcula como se indica en la fórmula:

• Donde:
Zα/2 es el valor crítico
Valor crítico
Ejemplo: cálculo del valor crítico
• Nos proponemos un nivel de confianza del 95%
1. Hallamos la diferencia respecto al 100% expresado en decimales
100%-95%=5% = 0.05
α = 0.05
2. Dividimos entre 2 para obtener la proporción en cada cola:
α/2 = 0.05/2 = 0.025
3. Calculamos z de acuerdo al área:
Área a la izquierda: 0.025 → de la tabla A-2 hallamos Z=-1.96
Área a la derecha: 1-0.025=0.975 → de la tabla A-2 hallamos Z=1.96
Valor crítico

=INV.NORM.ESTAND(0.025)
=INV.NORM.ESTAND(0.975)
Intervalo y nivel de confianza
Calculando el intervalo

𝑝Ƹ − 𝐸 < 𝑝 < 𝑝Ƹ + 𝐸

𝑝Ƹ = 0.439285
𝑞ො = 0.560712
n = 280
𝑍α/2 = 1.96
Solución
Requisitos
1. La muestra es aleatoria simple.
2. Las condiciones para la distribución binomial se satisfacen.
Esto es, hay un número fijo de ensayos, los ensayos son
independientes, hay dos categorías de resultados y las
probabilidades permanecen constantes para cada ensayo.
3. Existen al menos 5 éxitos y al menos 5 fracasos. (Cuando p y
q se desconocen, estimamos sus valores utilizando la
proporción muestral, de manera que este requisito es una
forma de verificar que np >= 5 y nq >= 5 se cumplan para
que la distribución normal sea una aproximación adecuada
para la distribución binomial.
Determinación del
tamaño muestral para
la proporción
Determinación del tamaño muestral
• Suponga que queremos reunir datos muestrales con el
objetivo de estimar alguna proporción de la población. ¿Cómo
sabemos cuántos elementos muestrales deben obtenerse?
Ejemplo: Tamaño muestral para una
encuesta por correo electrónico
• Las formas en las que nos comunicamos se han visto afectadas
drásticamente por el uso de máquinas contestadoras
telefónicas, máquinas de fax, correo de voz y correo
electrónico. Suponga que un sociólogo quiere determinar el
porcentaje actual de hogares en Estados Unidos que utilizan el
correo electrónico.
• ¿Cuántos hogares deben encuestarse para tener una confianza
del 95% de que el porcentaje muestral es erróneo por no más
de 4 puntos porcentuales?
Ejemplo: Tamaño muestral para una
encuesta por correo electrónico
a. Utilice el siguiente resultado de un estudio pionero: en
1997, el 16.9% de los hogares estadounidenses usaban
correo electrónico (según datos de The World Almanac and
Book of Facts).
b. Suponga que no tenemos información previa que sugiera un
posible valor de p’
Solución
Intervalos de
confianza para dos
parámetros
Intervalos de
confianza para dos
medias
El caso de estudio
• Se lleva a cabo un estudio para comparar el tiempo que tardan
hombres y mujeres para realizar determinada tarea. Las
experiencias anteriores indican que la distribución de tiempos
tanto para hombres como para mujeres es normal con varianzas
diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han
dado los siguientes tiempos en minutos:
Hombres 12 28 10 25 24 19 22 33 17
Mujeres 16 20 16 20 16 17 15 21
• Mediante un intervalo de confianza del 95% para la verdadera
diferencia de los promedios de tiempos de hombres y mujeres,
¿se puede concluir que los hombres emplean mayor tiempo que
las mujeres para hacer la tarea?.
Intervalo de confianza
−2.681 < 𝜇1 − 𝜇2 < 9.653

Tenemos una confianza del 95% de que los límites de -2.681 min y 9.653
min realmente contienen la diferencia entre las dos medias
poblacionales. Puesto que esos límites contienen a 0, este intervalo de
confianza sugiere que es muy posible que las medias de las dos
poblaciones sean iguales. No existe una diferencia significativa entre las
dos medias.
Cálculo del intervalo de confianza

𝑥1 − 𝑥2 − 𝐸 < 𝜇1 − 𝜇2 < 𝑥1 − 𝑥2 + 𝐸

• Donde
E : Margen de error

• Además, de los datos muestrales obtenemos:


• nh: 9 xh: 21.111 sh: 7.4237
• nm : 8 xm: 17.625 sm: 2.3261
Margen de Error
• Varianza poblacional conocida

𝜎12 𝜎22
𝐸 = 𝑧𝛼/2 +
𝑛1 𝑛2

• Varianza poblacional desconocida

𝑠12 𝑠22
𝐸 = 𝑡𝛼/2 +
𝑛1 𝑛2
Valor crítico tα/2
• Para un intervalo de confianza del 95%
Calcular 100% - 95% = 5% = 0.05
• Grados de libertad:
nh: 9 → gl=9-1=8
nm: 8 → gl=8-1=7
• Para 7 grados de libertad a 2 colas:
• De la tabla A-3 se obtiene que tα/2=2.365 =INV.T.2C(0.05;7)
Solución

𝑠12 𝑠22 7.42372 2.32612


𝐸 = 𝑡𝛼/2 + 𝐸 = 2.365 + = 6.167
𝑛1 𝑛2 9 8

3.486 − 6.167 < 𝜇1 − 𝜇2 < 3.486 + 6.167

−2.681 < 𝜇1 − 𝜇2 < 9.653


Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423

También podría gustarte