Está en la página 1de 15

De la muestra a la poblacin

PRINCIPIOS DEL ANLISIS ESTADSTICO


De la muestra a la poblacin

Cuando a partir de una muestra se desea extrapolar las


conclusiones a una poblacin las preguntas que se
pueden plantear son:
Cunto difieren nuestros datos de la poblacin objetivo?
O, si obtenemos otra muestra de la misma poblacin,
Qu tan diferente ser de la primera aunque se hayan
cumplido los requisitos para que la muestra sea
representativa?
La estadstica nos proporciona una medida de la
incertidumbre a la que nos vemos sometidos cuando
elegimos una muestra.
Variabilidad de las medias muestrales

La variabilidad ser menor cuanto mayor sea el


tamao muestra
La variabilidad ser menor que la variabilidad de los
datos de la poblacin
La variabilidad ser menor cuanto menor sea la
variabilidad de los datos de la poblacin
Distribucin de las medias muestrales

El valor esperado (esperanza matemtica) de la


distribucin de medias muestrales es el mismo que la
media poblacional
El valor esperado del desvo estndar de las medias
muestrales es /n. Es el error estndar de la media.
Para estimarlo a partir de una muestra tomamos el
desvo estndar de la muestra s en lugar de
La distribucin de las medias muestrales ser normal
si la distribucin de los datos en la poblacin es
normal
Teorema central del lmite

Si una poblacin (no necesariamente normal) tiene


una media y un desvo estndar , la distribucin
de las muestras aleatorias de esa poblacin tienden
al aumentar el tamao de la muestra n a una normal
con media y a un desvo estndar /n
Por ejemplo si los datos son categricos y el tamao
de la muestra n de ms de cien individuos y la
proporcin del nmero de enfermos , entonces a
travs de n. obtendramos la media y el desvo
estndar se calculara como .(1- )/n
Problema

Partimos de un establecimiento educacional con mil alumnos


Con un nuevo programa de enseanza el promedio de asistencia
es de 83
Promedio histrico 80 DS 10
Cul es la probabilidad de que haya un verdadero incremento de la
asistencia?
Las diferencias se deben solo al azar?
Hiptesis: 1- Del Investigador. El promedio de asistencia se
increment
2- Hiptesis nula: Las diferencias se deben solo al azar
Muestra de 100 alumnos
Prueba z= 83-80/1=3 z=3 equivale a p=0.0013
Intervalos de confianza para una muestra

El IC muestra la incertidumbre en la estimacin del estadstico


de inters
Los elementos necesarios para construir un IC son:
La media poblacional, que la infiero a partir de la media
muestral
El desvo estndar de la poblacin, que si no lo conozco lo
infiero a partir del EEM
La confianza que pretendo tener al suponer que ese sea uno de
los intervalos que contengan la verdadera media poblacional
En nuestro ej. IC 95% = 83 1.69 * 10/100
Es entonces 81.31 a 84.69
Comparacin de grupos

Nmero de grupos de observaciones


1- Un grupo
2- Dos grupos
3- Ms de dos grupos
Tipo de observaciones
1- Independientes
2- Relacionadas
Tipo de datos
1- Continuos
2- Categricos u ordinales
Distribucin de los datos
Distribucin normal

Es unimodal, un solo modo


Es simtrica con respecto a la media, la mitad de la curva es
igual a la otra mitad
La base est dada por unidades de desvo estndar, un desvo
estndar (s) corresponde a un z, 2.5 s a 2.5 z
La media la mediana y el modo coinciden en el mismo punto
El rea bajo la curva (z) es 1
Prueba z se basa en la normal estndar
z= X- en nuestro ej. Z= 83-80 = 3
(/n) (10/100)
Cola inferior z, cola superior 1- z, dos colas 2*(1- z)
Distribucin t de Student

Es una distribucin de medias muestrales cuando el


tamao de la muestra es pequeo
Es similar a la normal
La diferencia est en las colas, cuando se incrementa el
tamao de muestra usar uno u otro mtodo es igual
Se debe tener en cuenta el parmetro grados de libertad que
se calcula restando uno a n
Comparacin de una media con un valor especfico:
Peso de RN de madres con CC vs. Peso de RN de MN
t= x-k t= 2658 -3388 = -3.98 p<0.006
SD/n 913/16
Pruebas no paramtricas

Test del signo: si no hay diferencias entre los valores de la


media y el promedio histrico, esperaramos encontrar
tantos valores por encima como por debajo del ltimo. En
nuestro caso hay 13 valores por debajo y solo 3 por encima
del valor de referencia.
Test de Wilcoxon (Rank sum test):
1- Se calcula la diferencia entre cada observacin y el
valor de inters
2- Se ignora el signo de la diferencia y se obtiene un rango
3- por ltimo se suman los rangos por encima y por
debajo del valor promedio
Dos grupos de observaciones apareadas

Paramtricos
Test t para muestras apareadas
t= (d-0)/ES se entra a la tabla por el valor de t y los
grados de libertad
Intervalos de confianza para la diferencia de medias:
x t* ES
No paramtricos
Test del Signo
Test de Wilcoxon
Comparacin de muestras independientes

Mtodo paramtrico
Test de t para muestras independientes
t= x1-x2
se (x1-x2)
Intervalos de confianza para muestras
independientes.
IC = x1-x2t 0.975* se(x1-x2)
Mtodo no paramtrico
Test de Mann-Whitney
Comparacin de dos grupos de observaciones independientes

La distribucin es normal
en ambos grupos?
Si ii No

El Nro.de
Tienen iguales observaciones es
varianzas? grande?
No
Si No Si
Las distribuciones
Test Z son similares salvo
Test de en la posicin?
Test t Welch
Si No

Test de Test de la
Mann-Whitney Mediana
Comparacin de dos grupos de
observaciones apareadas

La distribucin es normal en ambos grupos?

Si No
Test t El Nmero de observaciones
es grande?
Si No
Test z
La distribucin es
Si simtrica? No

Wilcoxon Signo

También podría gustarte