Está en la página 1de 24

Inferencia estadstica Principales conceptos. Muestreo. Distribucin muestral de un estadstico. Principales distribuciones muestrales.

Principales conceptos en inferencia estadstica

Idea bsica: Hacer inferencias sobre la poblacin a partir de la muestra que hemos extrado de la misma.

Ello nos lleva a tratar (brevemente) el tema del muestreo. Pensemos que la muestra habr de ser representativa de la poblacin, para que podamos efectuar inferencias que tengan sentido.

Muestreo
Definicin: Proceso que nos permite la extraccin de una muestra a partir de una poblacin

Hay dos tipos bsicos de muestreo: 1. Muestreo probabilstico. En este tipo de muestreo, la probabilidad de aparicin en una muestra de cualquier elemento de la poblacin es conocida (o calculable). Es el nico cientficamente vlido, y es sobre el que nos extenderemos especialmente. 2. Muestreo no probabilstico. Es aquel en el que la seleccin de los elementos de la muestra no se hacen al azar.

Muestreo probabilstico
Este muestreo garantiza que, a la larga, las muestras que se van obteniendo de la poblacin sean representativas de la misma. Vamos a ver varios tipos de muestreo probabilstico.

1. Muestreo aleatorio simple 2. Muestreo estratificado 3. Muestreo por conglomerados * (Opcional) 4. Muestreo por etapas (o polietpico) * (Opcional) 5. Muestreo sistemtico

Muestreo probabilstico

1. Muestreo aleatorio simple


Es aquel en el que, a priori, todos los elementos de la muestra tienen la misma probabilidad de aparicin.

Supongamos que tengamos una poblacin de 50.000 individuos, y que tenemos un listado con sus nombres. Si queremos elegir 100 personas, lo que necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.

Muestreo probabilstico

2. Muestreo estratificado

En el muestreo estratificado, los investigadores han de dividir a los sujetos en diferentes subpoblaciones (o estratos), en funcin de cierta caracterstica relevante, y despus lo que hacen es un muestro aleatorio simple de cada estrato. Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno), y cada individuo del estrato habr de tener la misma probabilidad de ser escogido como parte de la muestra. Ejemplo: Supongamos que, en Valencia, 70% de los nios de primaria van a escuela pblica y el 30% a concertada. Si queremos 1,000 nios, lo que haremos es dividir los alumnos en 2 estratos (pblica y concertada) y se eligen aleatoriamente 700 nios de la pblica y aleatoriamente 300 de la concertada.

Muestreo probabilstico

3. Muestreo por conglomerados

* (Opcional)

En el muestreo por conglomerados, en lugar de considerar cada elemento de la poblacin, lo que consideramos son conglomerados de elementos. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estar formada por TODOS los elementos de los conglomerados.

Ejemplos: -En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ah se toman todos los votos de las mesas seleccionadas). -En otros ejemplos, los conglomerados pueden ser los bloques de viviendas, los municipios, etc.

Muestreo probabilstico

4. Muestreo por etapas * (Opcional)

En este caso se combina el muestreo aleatorio simple con el muestreo por conglomerados:

Primero se realiza un muestreo por conglomerados (v.g., si los conglomerados son colegios en Valencia, se seleccionan aleatoriamente varios de ellos). Segundo, no se eligen todos los alumnos (como ocurrira en un muestro por conglomerados), sino que se elige una muestra aleatoria. (Dicha muestra puede ser obtenida por muestreo aleatorio simple o puede ser estratificado.) Es decir, hemos tenido 2 etapas de muestreo. Y claro est, es posible tener ms de 2 etapas...

Muestreo probabilstico

5. Muestreo aleatorio sistemtico Supongamos que tengamos una lista de N elementos (e.g., estudiantes de secundaria) y queramos una muestra de tamao n. En este caso, lo que se hace es ordenarlos (v.g., en funcin de los apellidos) y despus se elige aleatoriamente un elemento entre los N/n=k primeros, y luego se elige de manera sistemtica el que est k lugares despus del primer elemento, y as sucesivamente. Ejemplo: Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de 100 estudiantes. Primero elegimos al azar un estudiante entre los 10000/100=100 primeros (supongamos que salga el 26), el segundo elemento ser el estudiante 100+26 (126), el siguiente ser el 226, luego el 326, etc.

Muestreo no probabilstico

1. Muestreo sin norma (o de conveniencia) Se elige a una muestra por ser conveniente, fcil, econmica. Pero no se hace en base a un criterio de aleatoridad. Ejemplo: las encuestas en los peridicos electrnicos; el muestreo habitual en los trabajos en psicologa.

2. Muestreo intencional En este caso, si bien el muestreo no es probabilstico, los investigadores procuran que se garantice la representatividad de la muestra

Distribucin muestral de un estadstico

Supongamos que tenemos una variable aleatoria, cuya distribucin es f(x) Supongamos, por simplicidad, que obtenemos una muestra aleatoria simple con tamao n X1, X2, ... Xn Entonces, un estadstico es cualquier funcin h definida sobre X1, X2, ... Xn y que no incluye parmetro desconocido alguno: Y=h(X1, X2, ... Xn)
La distribucin de dicho estadstico Y la vamos a denominar g(y)

Distribucin muestral de un estadstico


Observen: f(x) es la distribucin de la v.a. bajo estudio g(y) es la distribucin del estadstico que tenemos

Es vital conocer la distribucin muestral del estadstico de inters para poder efectuar inferencias sobre el parmetro correspondiente.

Esto es, para efectuar inferencias sobre la media poblacional Q, necesitamos conocer la distribucin muestral de X

Distribucin muestral de la media


Veremos primero el caso de que la distribucin subyacente sea normal, con media Q y varianza W 2

La media de la distribucin muestral de medias es La varianza de la distribucin muestral de medias es

Q
W2 /n

La forma de la distribucin muestral de la media es normal. Nota: La desviacin tpica de la distribucin muestral suele ser denominada: error tpico de tal estadstico (v.g., error tpico de la media, etc.)

Distribucin muestral de la media. Ejemplo 1


400

La lnea (en este y sucesivos ejemplos) es una curva normal

Distribucin poblacional subyacente (dist. Normal): Media=100 (Varianza=225) Desv.Tpica=15

300

200

100 Desv. tp. = 4.75 Media = 99.9 0 N = 3600.00

Distribucin muestral de la media: Tamao muestral=10 Media=100 (Varianza=225/10=22.5) Desv.tpica= 22.5 ! 4.74

N10

0 6. 11 0 4. 11 0 2. 11 .0 0 11 0 8. 10 .0 6 10 0 4. 10 .0 2 10 0 0. 10 .0 98 .0 96 .0 94 .0 92 .0 90 .0 88 .0 86 .0 84 .0 82

En este y sucesivos grficos: Nmero de repeticiones

Distribucin muestral de la media. Ejemplo 2


Distribucin poblacional subyacente (dist. Normal): Media=100
400

500

Desv.Tpica=15

300

200

Distribucin muestral de la media:


100 Desv. tp. = 3.36 Media = 100.0 0 N = 3600.00

Tamao muestral=20 Media=100 (Varianza=225/20=11.3) Desv.tpica=3.35

N20

0 4. 11 0 2. 11 0 0. 11 0 8. 10 0 6. 10 0 4. 10 0 2. 10 0 0. 10 .0 98 .0 96 .0 94 .0 92 .0 90 .0 88

Distribucin muestral de la media. Ejemplo 3


Distribucin poblacional subyacente (dist. Normal): Media=100 Desv.Tpica=15
500

700

600

400

300

200 Desv. tp. = 2.12 Media = 99.95 0 N = 3600.00

Distribucin muestral de la media: Tamao muestral=50 Media=100 (Varianza=225/50=4.5) Desv.tpica=2.12

100

N50

5 .2 93

5 .2 95

5 .2 97

5 .2 99

25 1. 10

25 3. 10

25 5. 10

25 7. 10

25 9. 10

Distribucin muestral de la media


Veremos ahora el caso de que la distribucin poblacional subyacente sea arbitraria, si bien sabemos Q que la media es y la varianza 2sea W

La media de la distribucin muestral de medias es

Q
W2 /n

La varianza de la distribucin muestral de medias es

La forma de la distribucin muestral de la media TAMBIN tiende a ser normal. En concreto, la distribucin muestral se acercar ms y ms a la distribucin normal (media Q y varianza W2/n) a medida que se aumente el tamao de cada muestra.

Distribucin muestral de la media. Ejemplo 4


Distribucin poblacional subyacente (dist. GAMMA): Media=100=
p 100 ! ! 100 P 1

La distribucin GAMMA tiene 2 parmetros: P que es un parmetro de escala (1) p que es un parmetro de forma (100)

Varianza=100= p2 ! 100 ! 100 2


P 1

0.045 0.04 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 80 85 90 95 100 105 110 115 120

Distribucin muestral de la media. Ejemplo 4


Distribucin poblacional subyacente (dist. GAMMA):
500

Media=100 Varianza=100

400

300

200

Distribucin muestral de la media:


Desv. tp. = 3.12 Media = 100.0

100

Tamao muestral=10 Media=100 (Varianza=100/10=10) Desv.tpica= 10 ! 3.16

N = 3600.00

DISGAMMA

.0 90

.0 92

.0 94

.0 96

.0 98

0 0. 11 0 8. 10 0 6. 10 0 4. 10 0 2. 10 0 0. 10

Distribucin muestral de la media. Ejemplo 5


Distribucin poblacional (dist. EXPONENCIAL): Media=0.1=1/P Varianza=0.01=1/P2

La distribucin EXPONENCIAL tiene 1 parmetro: P(en el ejemplo: 10)

12 10 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5 0.6

Ejemplo de distr.exponencial en economa: tiempo transcurrido entre la llegada de dos aviones a un aeropuerto.

Distribucin muestral de la media. Ejemplo 5a


400

Distribucin poblacional (dist. EXPONENCIAL): Media=0.1=1/P

300

Varianza=0.01=1/P2

200

100 Desv. tp. = .03 Media = .100 0 N = 3600.00

Distribucin muestral de la media: Tamao muestral=10 Media=.100 (Varianza=0.01/10=.001) Desv.tpica=.03

EXPON10

Observar que la dist. muestral se aproxima a la normal

44 .2 31 .2 19 .2 06 .2 94 .1 81 .1 69 .1 56 .1 44 .1 31 .1 19 .1 06 .1 94 .0 81 .0 69 .0 56 .0 44 .0 31 .0

Distribucin muestral de la media. Ejemplo 5b


500

Distribucin poblacional (dist. EXPONENCIAL):


400

Media=0.1=1/P
300

Varianza=0.01=1/P2

200

100 Desv. tp. = .02 Media = .099 0 N = 3600.00

Distribucin muestral de la media: Tamao muestral=20 Media=.100 (Varianza=0.01/20=.0005) Desv.tpica=.022

EXPON20

Observar que la distribucin muestral se aproxima ms a la normal (al elevar el tamao muestral).

94 .1 81 .1 69 .1 56 .1 44 .1 31 .1 19 .1 06 .1 94 .0 81 .0 69 .0 56 .0 44 .0

OTRAS DISTRIBUCIONES MUESTRALES (1)

X Q Distribucin muestral de t ! S n
Cuando la distribucin de la que obtenemos las medias muestrales es gaussiana (distr.normal), pero la varianza poblacional es desconocida y el tamao de muestra es pequeo,la variable aleatoria t no sigue una distribucin normal, sino que la expresin anterior se distribuye segn la distribucin t de Student con tn-1 grados de libertad. (Esta distribucin es bsica para efectuar inferencias entre dos medias.)

Distribucin muestral de

 s12

 s

2 2

Asumiendo varianzas poblacionales iguales

Cuando las distribuciones de la que obtenemos las varianzas muestrales son gaussianas, la expresin anterior se distribuye segn la distribucin F de Fisher con n1-1 grados de libertad en el numerador y n2-1 grados de libertad en el denominador. (Recordad que la distribucin F es bsica para la razn de varianzas: ANOVA.)

OTRAS DISTRIBUCIONES MUESTRALES (2)

Distribucin muestral de

(n  1) S 2 / W 2

Cuando las distribucin de la que obtenemos la varianza muestral es normal, la anterior expresin se distribuye segn la distribucin chicuadrado con n-1 grados de libertad.

También podría gustarte