Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE HIPÓTESIS.
Inferencia estadística
↑ rapidez
↑ facilidad
↑ exactitud
MUESTRA
INFERENCIA
RESULTADOS
ESTIMACIÓN DE PARÁMETROS
En general, dada una población en la que
se observa un fenómeno, sus parámetros
nos son desconocidos
• ¿cuál es la prevalencia de alérgicos a productos
lácteos?
• ¿cuál es la proporción de fumadores varones
mayores de 16 años?
• ¿cuál es la renta media anual por familia?
• ¿cuál será el porcentaje de curación del nuevo
fármaco?
• Etc, etc,…
Estadística inferencial
• Extrae conclusiones de la colección
de datos observados
Finalidades:
1) Estimación de parámetros
(puntual y por intervalos)
2) Contraste de hipótesis
OBJETIVO DE LOS ESTUDIOS
EPIDEMIOLÓGICOS
FUENTES DE ERROR
•ERROR ALEATORIO (azar)
•ERROR SISTEMÁTICO
FUENTES DE ERROR EN
ESTUDIOS EPIDEMIOLÓGICOS
X XXX
X
X X X XX
X
X XX
X X
X
X X
ERROR
ALEATORIO SISTEMÁTICO
(SESGO)
Causa -Muestreo -Diseño, ejecución y análisis:
-Variabilidad del Selección de los sujetos
parámetro Obtención de la información
Disminuye al
aumentar el Sí No
tamaño muestral
Afecta a Precisión Validez
VALIDEZ DEL ESTUDIO
Población de
Población de referencia:
referencia población donde se quiere
extrapolar los resultados.
Población de
estudio Población de estudio: sujetos
elegibles o seleccionados para
Muestra llevar a cabo el estudio.
Muestra: se obtienen para
realizar el estudio y desean
participar.
VALIDEZ DEL ESTUDIO
La validez expresa el grado en que la
prueba puede medir realmente lo que
pretende medir.
Validez externa
VALIDEZ INTERNA
Enfermos Sanos
No expuestos No expuestos
La muestra
no representa
a la población
diana
NO PROBABILÍSTICO:
•Muestreo por cuotas.
•Muestreo por conveniencia.
•Muestreo por oportunidad.
•Muestreo consecutivo.
MUESTREO ALEATORIO SIMPLE (M.A.S.)
• Se aplica cuando es difícil tener una lista de todos los individuos que forman
parte de la población de estudio, pero sin embargo sabemos que se
encuentran agrupados naturalmente en grupos. Las unidades de muestreo NO son
individuos sino GRUPOS de individuos
Población: p=22,9%
Resultados de nuestras distribuciones muestrales
• Es aproximadamente normal.
μ
Teorema Central del Límite
Supongamos la siguiente población de 25000 individuos, que
claramente no sigue una distribución normal.
5000
N = 25000
4000
DE = 70,3
3000
Media = 63,9
2000
1000
0
100
120
140
160
180
200
220
240
260
280
300
20
40
60
80
0
Teorema Central del Límite
Tomamos 100 muestras aleatorias de tamaño 30. Obteniendo la
siguiente distribución de medias muestrales:
30
N = 100 MUESTRA
DE = 13,6
20
Media = 62,6
10
0
20 30 40 50 60 70 80 90 100
5000
N = 25000 POBLACIÓN
4000
DE = 70,3
3000
Media = 63,9
2000
1000
0
100
120
140
160
180
200
220
240
260
280
300
20
40
60
80
0
Teorema Central del Límite
Por el teorema central del límite se tiene que la distribución de las
medias muestrales sigue una distribución normal con media: la
media poblacional y desviación estándar: el error estándar de la
media
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90 100
DE 70.3
En nuestro ejemplo, el EE de la media sería 12.8 13.6
n 30
Error estándar de la proporción
p
Características de la N(μ,σ)
Simétrica con forma de campana
Cumple que:
P([μ-1σ, μ+1σ ]) ≈ 68%
P([μ-2σ, μ+2σ ]) ≈ 95%
P([μ-3σ, μ+3σ ]) ≈ 99%
- 2EEM + 2EEM
μ
DISTRIBUCIÓN NORMAL
TIPIFICADA N(0,1)
1-α
- Z α/2 + Z α/2
Z alfa/2
Valor que define en una normal teórica el 95% de confianza con un error
del 5% a ambos lados
Este valor deja un área por debajo de 0,975 y por encima 0,025
Luego entre el valor negativo -1,96 y el valor positivo +1,96 esta el 0,950
z = (x – μ) / (σ/√n)
1-α
- Z α/2 + Z α/2
μ estará en el intervalo:
[x – zα/2 σ/√n, x + zα/2 σ/√n]
Recordar que para α=0.05,
zα/2=1.96
INTERVALO DE CONFIANZA DE
UNA MEDIA. EJEMPLO
En una muestra de 100 individuos se ha determinado
el valor del pulso, se ha encontrado una media de 74
pulsaciones por minuto, con una desviación típica de
10 pulsaciones por minuto. Calcular el intervalo de
confianza del 95% de la media.
Error Estandar √ pq
↓ con n
n
0i p 02
INTERVALO DE CONFIANZA DE
UNA PROPORCIÓN
Ahora lo que hemos hecho es estimar una
proporción po en una muestra de tamaño n y
queremos construir un intervalo que tiene
una probabilidad de 1-α de contener a la
proporción poblacional p.
p estará en el intervalo:
[po- zα/2√poqo/n, po+ zα/2√poqo/n]
α = 10%
90%
5% 5%
- Z α/2 + Z α/2
INTERVALO DE CONFIANZA DE
UNA MEDIA. EJEMPLO
32.8 ≤ √n (32.8)2 ≤ n