Está en la página 1de 24

Inferencia estadstica

Principales conceptos.
Muestreo. Distribucin
muestral de un
estadstico. Principales
distribuciones
muestrales.

Principales conceptos en inferencia


estadstica
Idea bsica: Hacer inferencias sobre la
poblacin a partir de la muestra que hemos
extrado de la misma.
Ello nos lleva a tratar (brevemente) el tema del
muestreo. Pensemos que la muestra habr de
ser representativa de la poblacin, para que
podamos efectuar inferencias que tengan
sentido.

Muestreo
Definicin: Proceso que nos permite la
extraccin de una muestra a partir de una
poblacin
Hay dos tipos bsicos de muestreo:
1. Muestreo probabilstico. En este tipo de muestreo, la
probabilidad de aparicin en una muestra de cualquier
elemento de la poblacin es conocida (o calculable). Es
el nico cientficamente vlido, y es sobre el que nos
extenderemos especialmente.
2. Muestreo no probabilstico. Es aquel en el que la
seleccin de los elementos de la muestra no se hacen al
azar.

Muestreo probabilstico
Este muestreo garantiza que, a la larga, las muestras que se
van obteniendo de la poblacin sean representativas de la
misma. Vamos a ver varios tipos de muestreo probabilstico.

1. Muestreo aleatorio simple


2. Muestreo estratificado
3. Muestreo por conglomerados
4. Muestreo por etapas (o polietpico)
5. Muestreo sistemtico (?)

Muestreo probabilstico

1. Muestreo aleatorio simple


Es aquel en el que, a priori, todos los elementos de la muestra
tienen la misma probabilidad de aparicin.
Supongamos que tengamos una poblacin de 50.000
individuos, y que tenemos un listado con sus nombres. Si
queremos elegir 100 personas, lo que necesitamos es que el
ordenador elija al azar a 100 individuos de esos 50.000.

Muestreo probabilstico

2. Muestreo estratificado
En el muestreo estratificado, los investigadores
han de dividir a los sujetos en diferentes
subpoblaciones (o estratos), en funcin de cierta
caracterstica relevante, y despus lo que hacen
es un muestro aleatorio simple de cada estrato.
Evidentemente, cada individuo debe pertenecer a
un estrato (y solo uno), y cada individuo del
estrato habr de tener la misma probabilidad de
ser escogido como parte de la muestra.
Ejemplo: Supongamos que, en Valencia, 70% de los
nios de primaria van a escuela pblica y el 30% a
concertada. Si queremos 1,000 nios, lo que
haremos es dividir los alumnos en 2 estratos
(pblica y concertada) y se eligen aleatoriamente
700 nios de la pblica y aleatoriamente 300 de la

Muestreo probabilstico

3. Muestreo por conglomerados


En el muestreo por conglomerados, en lugar de
considerar cada elemento de la poblacin, lo que
consideramos son conglomerados de elementos.
El proceso es elegir aleatoriamente uno o varios
conglomerados y la muestra estar formada por
TODOS los elementos de los conglomerados.
Ejemplos:
-En las encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales,
y lo que se hace es escoger algunas mesas al azar
(y de ah se toman todos los votos de las mesas
seleccionadas).
-En otros ejemplos, los conglomerados pueden ser

Muestreo probabilstico

4. Muestreo por etapas


En este caso se combina el muestreo
aleatorio simple con el muestreo por
conglomerados:
Primero se realiza un muestreo por conglomerados
(v.g., si los conglomerados son colegios en
Valencia, se seleccionan aleatoriamente varios de
ellos).
Segundo, no se eligen todos los alumnos (como
ocurrira en un muestro por conglomerados), sino
que se elige una muestra aleatoria. (Dicha
muestra puede ser obtenida por muestreo
aleatorio simple o puede ser estratificado.)

Muestreo probabilstico

5. Muestreo aleatorio sistemtico


Supongamos que tengamos una lista de N
elementos (e.g., estudiantes de secundaria) y
queramos una muestra de tamao n. En
este caso, lo que se hace es ordenarlos (v.g.,
en funcin de los apellidos) y despus se elige
aleatoriamente un elemento entre los N/n=k
primeros, y luego se elige de manera
sistemtica el que est k lugares despus del
primer elemento, y as sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una
lista) y queremos obtener una muestra de 100
estudiantes. Primero elegimos al azar un
estudiante entre los 10000/100=100 primeros
(supongamos que salga el 26), el segundo

Muestreo no probabilstico

1. Muestreo sin norma (o de conveniencia)


Se elige a una muestra por ser conveniente,
fcil, econmica. Pero no se hace en base a
un criterio de aleatoridad.
Ejemplo: las encuestas en los peridicos
electrnicos; el muestreo habitual en los
trabajos en psicologa.
2. Muestreo intencional
En este caso, si bien el muestreo no es
probabilstico, los investigadores procuran
que se garantice la representatividad de la

Distribucin muestral de un
estadstico
Supongamos que tenemos una variable
aleatoria, cuya distribucin es f(x)
Supongamos, por simplicidad, que
obtenemos una muestra aleatoria simple
con tamao n
X1, X2, ... Xn

Entonces, un estadstico es cualquier


funcin h definida sobre X1, X2, ... Xn y que no
incluye parmetro desconocido alguno:

Distribucin muestral de un
estadstico
Observad:
f(x) es la distribucin de la v.a. bajo estudio
g(y) es la distribucin del estadstico que
tenemos
Es vital conocer la distribucin muestral del
estadstico de inters para poder efectuar
inferencias sobre el parmetro
correspondiente.

X
Esto es, para efectuar inferencias sobre la
media poblacional , necesitamos conocer

Distribucin muestral de la media


Veremos primero el caso de que la
2

distribucin subyacente
seanormal,
con
media
y varianza

La media de la distribucin muestral de 2 / n


medias es
La varianza de la distribucin muestral de
La forma de
medias
esla distribucin muestral de la media es normal.
Nota: La desviacin tpica de la distribucin muestral suele ser
denominada: error tpico de tal estadstico (v.g., error tpico de la
media, etc.)

Distribucin muestral de la media.


Ejemplo 1
Distribucin poblacional
subyacente (dist.
Normal):

400

La lnea (en este y sucesivos ejemplos) es una


curva normal

Media=100

300

(Varianza=225)
Desv.Tpica=15
200

100
Desv. tp. = 4.75
Media = 99.9
N = 3600.00

N10

En este y sucesivos grficos: Nmero de


rplicas

Distribucin muestral
de la media:
Tamao muestral=10
Media=100
(Varianza=225/10=22.
5)
22.5 4.74
Desv.tpica=

Distribucin muestral de la media.


Ejemplo 2
Distribucin poblacional
subyacente (dist.
Normal):

500

Media=100

400

Desv.Tpica=15
300

200

Distribucin muestral
de la media:

100
Desv. tp. = 3.36
Media = 100.0
N = 3600.00

N20

Tamao muestral=20
Media=100
(Varianza=225/20=11.
3)
Desv.tpica=3.35

Distribucin muestral de la media.


Ejemplo 3
Distribucin poblacional
subyacente (dist.
Normal):

700

600

Media=100
Desv.Tpica=15

500

400

300

Distribucin muestral
de la media:

200
Desv. tp. = 2.12

100

Media = 99.95
N = 3600.00

Tamao muestral=50
Media=100
(Varianza=225/50=4.5)

N50

Desv.tpica=2.12

Distribucin muestral de la media


Veremos ahora el caso de que la

distribucin subyacente sea arbitraria,


si
bien sabemos
que la media es
y la
2
varianza sea

La media de la distribucin muestral de 2


/n
medias es
La varianza de la distribucin muestral de
medias
es
La forma de la distribucin muestral de la media TAMBIN tiende a ser
normal. En concreto, la distribucin muestral se acercar ms y ms a
la distribucin normal (media y varianza 2/n) a medida que se
aumente el tamao de cada muestra.

Distribucin muestral de la media.


Ejemplo 4
Distribucin poblacional
subyacente (dist.
p 100
GAMMA):

100

La distribucin GAMMA tiene 2


parmetros:

Media=100= p

p que es un parmetro de forma (100)

Varianza=100=

100
100
12

que es un parmetro de escala (1)

Distribucin muestral de la media.


Ejemplo 4
Distribucin poblacional
subyacente (dist.
GAMMA):

500

Media=100
400

Varianza=100

300

200

Distribucin muestral
de la media:

100
Desv. tp. = 3.12
Media = 100.0
N = 3600.00

Tamao muestral=10
Media=100
(Varianza=100/10=10)

DISGAMMA

Desv.tpica=10 3.16

Distribucin muestral de la media.


Ejemplo 5
Distribucin poblacional
(dist. EXPONENCIAL):
Media=0.1=1/

La distribucin EXPONENCIAL tiene 1


parmetro: (en el ejemplo: 10)

Varianza=0.01=1/2

Ejemplo de distr.exponencial en psicologa: v.g., tiempo transcurrido


entre 2 pulsaciones de una rata en una caja de Skinner.

Distribucin muestral de la media.


Ejemplo 5a
Distribucin poblacional
(dist. EXPONENCIAL):

400

Media=0.1=1/
Varianza=0.01=1/2

300

200

100
Desv. tp. = .03
Media = .100
N = 3600.00

Distribucin muestral
de la media:
Tamao muestral=10
Media=.100

EXPON10

Observad que la dist. muestral se aproxima a la


normal

(Varianza=0.01/10=.00
1)
Desv.tpica=.03

Distribucin muestral de la media.


Ejemplo 5b

500

Distribucin poblacional
(dist. EXPONENCIAL):
400

Media=0.1=1/
Varianza=0.01=1/2

300

200

100
Desv. tp. = .02
Media = .099
N = 3600.00

Distribucin muestral
de la media:
Tamao muestral=20

EXPON20

Observad que la distribucin muestral se


aproxima ms a la normal (al elevar el tamao
muestral).

Media=.100
(Varianza=0.01/20=.00
05)
Desv.tpica=.022

OTRAS DISTRIBUCIONES MUESTRALES (1)

X
Distribucin muestral de
s%/ n

Cuando la distribucin de la que obtenemos las medias


muestrales es gaussiana (distr.normal), la expresin anterior
se distribuye segn la distribucin t de Student con t n-1 grados
de libertad. (Esta distribucin es bsica para efectuar
inferencias entre dos medias.)
2
s%
1
Asumiendo
2
Distribucin muestral de
s%
varianzas
2
poblacionales
iguales
Cuando las distribuciones de la que obtenemos las varianzas
muestrales son gaussianas, la expresin anterior se distribuye
segn la distribucin F de Fisher con n1-1 grados de libertad en
el numerador y n2-1 grados de libertad en el denominador.
(Recordad que la distribucin F es bsica para la razn de
varianzas: ANOVA.)

OTRAS DISTRIBUCIONES MUESTRALES (2)


2
Distribucin muestral ns
de
/ 2

Cuando las distribucin de la que obtenemos la varianza


muestral es gaussiana, la anterior expresin se distribuye
segn la distribucin chi-cuadrado con n-1 grados de libertad.

También podría gustarte