Está en la página 1de 3

MEDIA Y VARIANZA MUESTRALES

COMO VARIABLES ALEATORIAS  y 2 son dos características numéricas de


1 3 la población, es decir, dos parámetros.
Supongamos que ignoramos tales parámetros y
GALIBERT, Ma. SILVIA 1 2
queremos estimarlos a partir de muestras de tamaño
PANO, CARLOS O.
2. Vamos a considerar el siguiente método:

Muestreo aleatorio con reposición


A efectos puramente didácticos imaginaremos Media de la población (o media de X)
que estamos interesados en estudiar una población Se sortea al azar una de las cuatro personas,
compuesta por sólo cuatro sujetos que reciben La media de la población de valores de X (o se registra su número de sesiones semanales de
terapia psicológica semanal: Laura, Inés, Claudia y media de X) es análisis y se devuelve la bolilla con la que se sorteó
Matías. La característica de interés es el número de al bolillero. Nuevamente se elige una persona al azar
sesiones semanales de análisis. Laura e Inés reciben 1 1 2  3 7 entre las cuatro y se registra su número de sesiones
una sesión semanal, Claudia dos y Matías tres. μ   1,75
4 4 semanales. Así se realiza lo que llamamos un
Población de individuos: conjunto de las muestreo al azar con reposición para obtener una
personas mencionadas.
La hemos designado con la letra  para muestra aleatoria de tamaño dos.
diferenciarla de x que es la media de una muestra de Este tipo de muestreo es útil es desde un
la población. punto de vista teórico pues la teoría estadística
Laura Matías desarrollada sobre él es mucho más sencilla que la
Inés Claudia basada sobre el muestreo sin reposición, más
Varianza de la población (o varianza de X) = razonable en la práctica. Sin embargo los resultados
V(X) que se deducen del método de muestreo con
reposición pueden ser usados como una muy buena
Supongamos que elegimos aleatoriamente La designaremos con la letra 2. Cuando la aproximación en el muestreo sin reposición siempre
una persona de esta población, por ejemplo población es finita -como en este caso- se calcula que el tamaño de muestra sea pequeño en relación
sorteando uno de estos cuatro nombres, y como el promedio de los cuadrados de los desvíos al tamaño poblacional (el presente ejemplo no es tal
registramos el número de sesiones. Así queda respecto de la media. caso pues la muestra es el 50% de la población
definida la variable aleatoria pero, como dijimos al principio, tomamos una
V(X) = 2 = población reducida para mayor simplicidad
X = número de sesiones semanales de didáctica).
análisis que recibe la persona elegida. (1 1,75) 2  (1 1,75) 2  (2  1,75) 2  (3  1,75) 2 Las muestras que se pueden obtener en este
= =
4 ejemplo por el método antedicho son:
Luego, la población de valores de X es {1, 1, 2, 3} =0,6875
1era. elección 2da. elección 2 1 son seleccionadas al azar. Para designarlas hemos
2 1 usado letras mayúsculas a fin de distinguirlas de
Laura Laura 2 2 cada valor en particular. Además
Laura Inés 2 3
Laura Claudia 3 1 X1  X 2 (X1  X)2  (X2  X)2
Laura Matías 3 1 X y S 2

Inés Laura 3 2 2 1
Inés Inés 3 3
Inés Claudia por lo que X y S 2 están en función de los valores
Inés Matías Para cada una de las 16 muestras posibles muestrales X1 y X 2 ; por eso X y S 2 son
Claudia Laura podríamos calcular la media x y la varianza s 2 con estadísticos. Como cada valor x de X es una
Claudia Inés lo que obtendríamos estimación de  y cada valor s 2 de S 2 es una
Claudia Claudia
Claudia Matías estimación de 2 decimos que X y S 2 son,
x s2 además, estimadores.
Matías Laura
Matías Inés Un estimador se dice insesgado cuando su
1 0 media coincide con el parámetro que pretende
Matías Claudia
1 0 estimar.
Matías Matías
1,5 0,5 Promediando los valores de X obtenemos
2 2
Llamando X1 y X2 al número de sesiones
1 0
correspondientes a las personas elegidas en primero 1 4  1,5  4  2  5  2,5  2  3 28 7
y segundo lugar respectivamente para integrar la
1 0    1,75
1,5 0,5 16 16 4
muestra, tenemos, en correspondencia con la lista
2 2
anterior,
1,5 0,5 que coincide con Por eso decimos que
X1 X2
1,5 0,5
2 0 X es un estimador insesgado de 
1 1
2,5 0,5
1 1
2 2 Análogamente, promediando los valores de S 2
1 2
2 2 obtenemos
1 3
2,5 0,5
1 1
3 0 0  6  0,5  6  2  4 11
1 1
  0,6875
1 2 2 16 16
1 3 Así vemos que X y S son variables aleatorias
pues sus valores varían con las muestras, las cuales
que coincide con 2 por lo que
Observemos a partir de esta expresión que
S es un estimador insesgado de  .
2 2 cuanto mayor es el tamaño muestral menor es la
variabilidad de la media.
Observemos que la varianza muestral que hemos
usado es la que se obtiene de dividir por el tamaño Distribución de la media muestral X
muestral menos 1; esto se hace justamente para
obtener un estimador insesgado de la varianza Cuando el tamaño muestral es suficientemente
poblacional. grande, la distribución de X es aproximadamente
La varianza de la población de valores de X normal (tanto más normal cuanto mayor el tamaño de
es V( X ) = muestra) con media  y varianza 2 / n.
Esto es un corolario del Teorema Central del
Límite, muy importante en estadística.
(1 1,75) 2  4  (1,5  1,75) 2  4  (2  1,75) 2  5  ...
= Estandarizando X obtenemos el estadístico
16
X-μ
...  (2,5  1,75) 2  2  (3  1,75) 2 5,5 σ
  0,34375
16 16 n

que es la mitad de la varianza de X por provenir de que sigue aproximadamente la distribución normal
una muestra de tamaño 2. estándar y se usa en inferencia estadística para probar
hipótesis acerca de la media poblacional.
En general, si la muestra es de tamaño n la
varianza de la variable X se reduce a la n-ésima
parte de la varianza de la variable X:

V(X) σ2
V( X ) = 
n n

de donde el desvío estándar de X es


σ
DS( X ) =
n

También podría gustarte