Está en la página 1de 24

Tema.12.

Inferencia estadstica
Principales conceptos.
Muestreo. Distribucin
muestral de un estadstico.
Principales distribuciones
muestrales.

Principales conceptos en inferencia estadstica

Idea bsica: Hacer inferencias sobre la poblacin a


partir de la muestra que hemos extrado de la misma.

Ello nos lleva a tratar (brevemente) el tema del


muestreo. Pensemos que la muestra habr de ser
representativa de la poblacin, para que podamos
efectuar inferencias que tengan sentido.

Muestreo
Definicin: Proceso que nos permite la extraccin de
una muestra a partir de una poblacin

Hay dos tipos bsicos de muestreo:


1. Muestreo probabilstico. En este tipo de muestreo, la
probabilidad de aparicin en una muestra de cualquier elemento
de la poblacin es conocida (o calculable). Es el nico
cientficamente vlido, y es sobre el que nos extenderemos
especialmente.
2. Muestreo no probabilstico. Es aquel en el que la seleccin de
los elementos de la muestra no se hacen al azar.

Muestreo probabilstico
Este muestreo garantiza que, a la larga, las muestras que se van
obteniendo de la poblacin sean representativas de la misma. Vamos a
ver varios tipos de muestreo probabilstico.

1. Muestreo aleatorio simple


2. Muestreo estratificado
3. Muestreo por conglomerados
4. Muestreo por etapas (o polietpico)
5. Muestreo sistemtico (?)

Muestreo probabilstico

1. Muestreo aleatorio simple


Es aquel en el que, a priori, todos los elementos de la muestra tienen la
misma probabilidad de aparicin.

Supongamos que tengamos una poblacin de 50.000 individuos, y que


tenemos un listado con sus nombres. Si queremos elegir 100 personas,
lo que necesitamos es que el ordenador elija al azar a 100 individuos de
esos 50.000.

Muestreo probabilstico

2. Muestreo estratificado
En el muestreo estratificado, los investigadores han de
dividir a los sujetos en diferentes subpoblaciones (o
estratos), en funcin de cierta caracterstica relevante, y
despus lo que hacen es un muestro aleatorio simple de
cada estrato.
Evidentemente, cada individuo debe pertenecer a un estrato
(y solo uno), y cada individuo del estrato habr de tener la
misma probabilidad de ser escogido como parte de la
muestra.
Ejemplo: Supongamos que, en Valencia, 70% de los nios de
primaria van a escuela pblica y el 30% a concertada. Si
queremos 1,000 nios, lo que haremos es dividir los
alumnos en 2 estratos (pblica y concertada) y se eligen
aleatoriamente 700 nios de la pblica y aleatoriamente 300
de la concertada.

Muestreo probabilstico

3. Muestreo por conglomerados


En el muestreo por conglomerados, en lugar de considerar
cada elemento de la poblacin, lo que consideramos son
conglomerados de elementos. El proceso es elegir
aleatoriamente uno o varios conglomerados y la muestra
estar formada por TODOS los elementos de los
conglomerados.

Ejemplos:
-En las encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales, y lo que
se hace es escoger algunas mesas al azar (y de ah se toman
todos los votos de las mesas seleccionadas).
-En otros ejemplos, los conglomerados pueden ser los
bloques de viviendas, los municipios, etc.

Muestreo probabilstico

4. Muestreo por etapas

En este caso se combina el muestreo aleatorio


simple con el muestreo por conglomerados:
Primero se realiza un muestreo por conglomerados (v.g., si
los conglomerados son colegios en Valencia, se seleccionan
aleatoriamente varios de ellos).
Segundo, no se eligen todos los alumnos (como ocurrira en
un muestro por conglomerados), sino que se elige una
muestra aleatoria. (Dicha muestra puede ser obtenida por
muestreo aleatorio simple o puede ser estratificado.)
Es decir, hemos tenido 2 etapas de muestreo. Y claro est,
es posible tener ms de 2 etapas...

Muestreo probabilstico

5. Muestreo aleatorio sistemtico


Supongamos que tengamos una lista de N elementos
(e.g., estudiantes de secundaria) y queramos una
muestra de tamao n. En este caso, lo que se hace
es ordenarlos (v.g., en funcin de los apellidos) y
despus se elige aleatoriamente un elemento entre los
N/n=k primeros, y luego se elige de manera sistemtica
el que est k lugares despus del primer elemento, y
as sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una lista) y
queremos obtener una muestra de 100 estudiantes.
Primero elegimos al azar un estudiante entre los
10000/100=100 primeros (supongamos que salga el
26), el segundo elemento ser el estudiante 100+26
(126), el siguiente ser el 226, luego el 326, etc.

Muestreo no probabilstico

1. Muestreo sin norma (o de conveniencia)


Se elige a una muestra por ser conveniente, fcil,
econmica. Pero no se hace en base a un criterio de
aleatoridad.
Ejemplo: las encuestas en los peridicos
electrnicos; el muestreo habitual en los trabajos en
psicologa.

2. Muestreo intencional
En este caso, si bien el muestreo no es
probabilstico, los investigadores procuran que se
garantice la representatividad de la muestra

Distribucin muestral de un estadstico


Supongamos que tenemos una variable aleatoria,
cuya distribucin es f(x)
Supongamos, por simplicidad, que obtenemos una
muestra aleatoria simple con tamao n
X1, X2, ... Xn

Entonces, un estadstico es cualquier funcin h


definida sobre X1, X2, ... Xn y que no incluye parmetro
desconocido alguno:
Y=h(X1, X2, ... Xn)
La distribucin de dicho estadstico Y la vamos a denominar g(y)

Distribucin muestral de un estadstico


Observad:
f(x) es la distribucin de la v.a. bajo estudio
g(y) es la distribucin del estadstico que tenemos

Es vital conocer la distribucin muestral del


estadstico de inters para poder efectuar
inferencias sobre el parmetro correspondiente.

Esto es, para efectuar inferencias sobre la media


poblacional , necesitamos conocer la distribucin
muestral de X

Distribucin muestral de la media


Veremos primero el caso de que la distribucin
subyacente sea normal, con media y varianza 2

La media de la distribucin muestral de medias es


La varianza de la distribucin muestral de medias es

La forma de la distribucin muestral de la media es normal.


Nota: La desviacin tpica de la distribucin muestral suele ser denominada:
error tpico de tal estadstico (v.g., error tpico de la media, etc.)

2 /n

Distribucin muestral de la media. Ejemplo 1


Distribucin poblacional
subyacente (dist. Normal):

400

La lnea (en este y sucesivos ejemplos) es una curva


normal

Media=100
(Varianza=225)

300

Desv.Tpica=15
200

100
Desv. tp. = 4.75
Media = 99.9
N = 3600.00

Distribucin muestral de la
media:
Tamao muestral=10
Media=100
(Varianza=225/10=22.5)

N10

En este y sucesivos grficos: Nmero de rplicas

Desv.tpica= 22.5 4.74

Distribucin muestral de la media. Ejemplo 2


Distribucin poblacional
subyacente (dist. Normal):

500

Media=100
Desv.Tpica=15

400

300

200

Distribucin muestral de la
media:

100
Desv. tp. = 3.36
Media = 100.0
N = 3600.00

Tamao muestral=20
Media=100
(Varianza=225/20=11.3)

N20

Desv.tpica=3.35

Distribucin muestral de la media. Ejemplo 3


Distribucin poblacional
subyacente (dist. Normal):

700

Media=100

600

Desv.Tpica=15
500

400

300

Distribucin muestral de la
media:

200
Desv. tp. = 2.12

100

Media = 99.95
N = 3600.00

Tamao muestral=50
Media=100
(Varianza=225/50=4.5)

N50

Desv.tpica=2.12

Distribucin muestral de la media


Veremos ahora el caso de que la distribucin
subyacente sea arbitraria, si bien sabemos que la
media es y la varianza sea 2
La media de la distribucin muestral de medias es

La varianza de la distribucin muestral de medias es 2 / n

La forma de la distribucin muestral de la media TAMBIN tiende a ser normal.


En concreto, la distribucin muestral se acercar ms y ms a la distribucin
normal (media y varianza 2/n) a medida que se aumente el tamao de cada
muestra.

Distribucin muestral de la media. Ejemplo 4


Distribucin poblacional
subyacente (dist. GAMMA):
Media=100=

p 100

100

Varianza=100=

p 100

100
2 12

La distribucin GAMMA tiene 2 parmetros:


que es un parmetro de escala (1)
p que es un parmetro de forma (100)

Distribucin muestral de la media. Ejemplo 4


Distribucin poblacional
subyacente (dist. GAMMA):
500

Media=100
Varianza=100

400

300

200

Distribucin muestral de la
media:

100
Desv. tp. = 3.12
Media = 100.0
N = 3600.00

Tamao muestral=10
Media=100
(Varianza=100/10=10)

DISGAMMA

Desv.tpica= 10 3.16

Distribucin muestral de la media. Ejemplo 5


Distribucin poblacional (dist.
EXPONENCIAL):
Media=0.1=1/

La distribucin EXPONENCIAL tiene 1


parmetro: (en el ejemplo: 10)

Varianza=0.01=1/2

Ejemplo de distr.exponencial en psicologa: v.g., tiempo transcurrido entre 2


pulsaciones de una rata en una caja de Skinner.

Distribucin muestral de la media. Ejemplo 5a


Distribucin poblacional (dist.
EXPONENCIAL):

400

Media=0.1=1/
Varianza=0.01=1/2

300

200

100
Desv. tp. = .03
Media = .100
N = 3600.00

Distribucin muestral de la
media:
Tamao muestral=10
Media=.100

EXPON10

Observad que la dist. muestral se aproxima a la normal

(Varianza=0.01/10=.001)
Desv.tpica=.03

Distribucin muestral de la media. Ejemplo 5b


500

Distribucin poblacional (dist.


EXPONENCIAL):
400

Media=0.1=1/
Varianza=0.01=1/2

300

200

100
Desv. tp. = .02
Media = .099
N = 3600.00

Distribucin muestral de la
media:
Tamao muestral=20

EXPON20

Observad que la distribucin muestral se aproxima


ms a la normal (al elevar el tamao muestral).

Media=.100
(Varianza=0.01/20=.0005)
Desv.tpica=.022

OTRAS DISTRIBUCIONES MUESTRALES (1)

Distribucin muestral de

X
s%/ n

Cuando la distribucin de la que obtenemos las medias muestrales es


gaussiana (distr.normal), la expresin anterior se distribuye segn la
distribucin t de Student con tn-1 grados de libertad. (Esta distribucin es
bsica para efectuar inferencias entre dos medias.)

Distribucin muestral de

2
s%
1

s%
2
2

Asumiendo varianzas
poblacionales iguales

Cuando las distribuciones de la que obtenemos las varianzas muestrales


son gaussianas, la expresin anterior se distribuye segn la distribucin
F de Fisher con n1-1 grados de libertad en el numerador y n2-1 grados
de libertad en el denominador. (Recordad que la distribucin F es bsica
para la razn de varianzas: ANOVA.)

OTRAS DISTRIBUCIONES MUESTRALES (2)

Distribucin muestral de ns 2 / 2
Cuando las distribucin de la que obtenemos la varianza muestral es
gaussiana, la anterior expresin se distribuye segn la distribucin chicuadrado con n-1 grados de libertad.

También podría gustarte