Está en la página 1de 7

TEOREMA DEL LIMITE CENTRAL

Muestreo de poblaciones no normales


Del tema anterior podemos concluir que cuando la población está distribuida normalmente, la
distribución de muestreo de la media también es normal. Sin embargo, los responsables de tomar
decisiones deben lidiar con muchas poblaciones que no están distribuidas normalmente. ¿Cómo
reacciona la distribución de muestreo de la media cuando la población de la que se extraen las
muestras no es normal? Una ilustración nos ayudará a responder esta pregunta. Consideremos los
datos de la tabla 6-9, referentes a cinco propietarios de motocicletas y la duración de sus llantas.
Dado que están involucradas sólo cinco personas, la población es demasiado pequeña para ser
aproximada por una distribución normal. Tomaremos todas las muestras posibles de los
propietarios en grupos de tres, calcularemos las medias de muestra (𝑥̅ ), las enumeraremos y
calcularemos la media de la distribución de muestreo (𝜇𝑥̅ ),. La tabla 6-10 lista estas operaciones.
Estos cálculos muestran que incluso en un caso en el que la población no está normalmente
distribuida, 𝜇𝑥̅ , la media de la distribución de muestreo sigue siendo igual a la media de la población,
µ.

Ahora remitámonos a la figura 6-6. La gráfica (a) de la misma es la distribución de población de la


duración de las llantas para los cinco propietarios de las motocicletas, una distribución que puede
ser todo menos una distribución normal. En la gráfica (b) de la figura 6-6, mostramos la distribución
de muestreo de la media para un tamaño de muestra de tres, tomando la información de la tabla 6-
10. Observe la diferencia que existe entre las distribuciones de probabilidad de las gráficas (a) y (b)

1
de la figura 6-6. En la (b), la distribución se parece un poco más a la forma de campana de la
distribución normal.

Si tuviéramos mucho tiempo y espacio, podríamos repetir este ejemplo y agrandar el tamaño de la
población a 40. Entonces podríamos tomar muestras de diferentes tamaños. A continuación
representaremos gráficamente las distribuciones de muestreo de la media que se tendría para los
diferentes tamaños. Esto demostraría enfáticamente lo rápido que la distribución de muestreo de
la media se acerca a la normalidad, sin importar la forma de la distribución de la población. La figura
6-7 simula este proceso gráficamente sin efectuar todos los cálculos.

2
EL TEOREMA DEL LÍMITE CENTRAL
El ejemplo de la tabla 6-10 y las cuatro distribuciones de probabilidad de la figura 6-7 deberían
sugerir varias cosas. Primero, la media de la distribución de muestreo de la media será igual a la
media de la población, sin importar el tamaño de la muestra, incluso si la población no es normal.
Segundo, al incrementarse el tamaño de la muestra, la distribución de muestreo de la media se
acercará a la normalidad, sin importar la forma de la distribución de la población.

Esta relación entre la forma de la distribución de la población y la forma de la distribución de


muestreo se denomina teorema del límite central. El teorema del límite central es, tal vez, el más
importante de toda la inferencia estadística, pues asegura que la distribución de muestreo de la
media se aproxima a la normal al incrementarse el tamaño de la muestra.

Hay situaciones teóricas en las que el teorema del límite central no se cumple, pero casi nunca se
encuentran en la toma de decisiones práctica. De hecho, una muestra no tiene que ser muy grande
para que la distribución de muestreo de la media se acerque a la normal. Los especialistas en
estadística utilizan la distribución normal como una aproximación a la distribución de muestreo
siempre que el tamaño de la muestra sea de al menos 30, pero la distribución de muestreo de la
media puede ser casi normal con muestras de incluso la mitad de ese tamaño. La importancia del
teorema del límite central es que nos permite usar estadísticas de muestra para hacer inferencias
con respecto a los parámetros de población, sin saber sobre la forma de la distribución de
frecuencia de esa población más que lo que podamos obtener de la muestra.

Ilustremos el uso del teorema del límite central. La distribución de los ingresos anuales de todos los
cajeros de un banco con cinco años de experiencia está sesgada de manera negativa, como la gráfica
(a) de la figura 6-8 lo muestra. Esta distribución tiene una media de $19,000 y una desviación
estándar de $2,000. Si extraemos una muestra aleatoria de 30 cajeros,
¿cuál es la probabilidad de que sus ganancias promedien más de $19,750 anualmente? La gráfica
(b) de la figura 6-8 ilustra la distribución de muestreo de la media que resultaría, y hemos sombreado
el área que representa los “ingresos por encima de $19,750”.

Nuestra primera tarea es calcular el error estándar de la media de la desviación estándar de la


población, de la siguiente manera:

3
Como estamos frente a una distribución de muestreo, ahora debemos utilizar la ecuación de
estandarización que ya conocemos y la tabla de cálculo de distribución de probabilidad normal
estándar.
Para x = $19,750:

Esto nos da un área de 0.4798 para un valor de z de 2.05. Mostramos esta área en la figura 6-8 como
el área entre la media y $19,750. Puesto que la mitad, o 0.5000, del área bajo la curva cae entre la
media y la cola de la derecha, el área sombreada debe ser:

_ 0.5000 ← (Área entre la media y la cola derecha)


- 0.4798 ← (Área entre la media y $19,750)
_ 0.0202 ← (Área entre la cola derecha y $19,750)

Por tanto, hemos determinado que hay ligeramente más del 2% de probabilidad de que los ingresos
promedio sean mayores que $19,750 anualmente en un grupo de 30 cajeros.

Una consideración operacional en el muestreo: la relación entre el tamaño


de muestra y el error estándar

Antes, vimos que el error estándar, 𝜎𝑥̅ , es una medición de dispersión de las medias de muestras
alrededor de la media de población. Si la dispersión disminuye (si 𝜎𝑥̅ se hace más pequeña),
entonces los valores tomados por la media de la muestra tienden a agruparse más cercanamente
alrededor de µ. Por el contrario, si la dispersión se incrementa (si 𝜎𝑥̅ se hace más grande), los
valores tomados por la media de la muestra tienden a agruparse menos cercanamente alrededor
de µ. Podemos concebir esta relación así: al disminuir el error estándar, el valor de cualquier media
de muestra probablemente se acercará al valor de la media de población.

4
Los especialistas en estadística describen este fenómeno de otra manera: al disminuir el error
estándar, se incrementa la precisión con la que se puede usar la media de muestra para estimar la
media de población. Si nos remitimos a la ecuación utilizada para calcular 𝜎𝑥̅ :

Podemos ver que al aumentar n, 𝜎𝑥̅ disminuye. Esto sucede porque un denominador grande (en la
parte derecha) produciría una 𝜎𝑥̅ menor (en la parte izquierda). Dos ejemplos mostrarán esta
relación; ambos suponen la misma desviación estándar de población σ de 100.

¿Qué hemos mostrado? Al aumentar nuestro tamaño de muestra de 10 a 100 (un incremento de 10
veces), el error estándar disminuyó de 31.63 a 10, lo que es sólo aproximadamente un tercio de su
valor inicial. Nuestros ejemplos muestran que, debido al hecho de que 𝝈𝒙̅ varía inversamente
con la raíz cuadrada de n, hay una utilidad decreciente en el muestreo.

Es cierto que muestrear más elementos disminuye el error estándar, pero este beneficio puede no
valer el costo. Un estadístico diría: “El aumento de precisión no vale el costo del muestreo
adicional”. En un sentido estadístico, rara vez vale la pena tomar muestras excesivamente grandes.
Los administradores debieran evaluar siempre tanto el valor como el costo de la precisión adicional
que obtendrían de una muestra mayor antes de comprometer recursos para tomarla.

El multiplicador de población finita


Hasta este punto en nuestros análisis de las distribuciones de muestreo hemos utilizado esta
ecuación, para calcular el error estándar de la media:

Esta ecuación está diseñada para situaciones en las que la población es infinita, o en las que
tomamos muestras de una población finita con reemplazo (es decir, después de que se ha

5
muestreado cada elemento, éste se regresa a la población antes de elegir el siguiente elemento, de
tal manera que es posible que el mismo elemento sea elegido más de una vez).

Muchas de las poblaciones que examinan los responsables de las decisiones son finitas, es decir, de
tamaño establecido o limitado. Ejemplos de éstas incluyen a los empleados de una compañía dada,
a los clientes de una agencia de servicios sociales de una ciudad, a los estudiantes de una clase
específica y a la producción de un día en una determinada planta de manufactura. Ninguna de estas
poblaciones es infinita, así que necesitamos modificar la ecuación arriba citada, para trabajar con
ellas. La fórmula diseñada para encontrar el error estándar de la media cuando la población es finita
y el muestreo se hace sin reemplazo, es:

En la que:
• N = tamaño de la población
• n = tamaño de la muestra

Este nuevo término que aparece del lado derecho de la ecuación y que multiplica a nuestro error
estándar original se conoce como multiplicador de población finita:

Unos cuantos ejemplos nos ayudarán a familiarizarnos con la interpretación y el uso de esta
ecuación. Supongamos que estamos interesados en una población de 20 compañías textiles del
mismo tamaño, todas estas fábricas experimentan una producción excesiva de trabajo. Nuestro
estudio indica que la desviación estándar de la distribución de la producción anual es igual a 75
empleados. Si muestreamos cinco de estas compañías textiles, sin reemplazo, y deseamos calcular
el error estándar de la media, usaríamos la ecuación de la siguiente manera:

6
En este ejemplo, un multiplicador de población finita de 0.888 redujo el error estándar de 33.54 a
29.8. En casos en los que la población es muy grande en relación con el tamaño de la muestra, este
multiplicador de población finita adquiere un valor cercano a 1 y tiene poco efecto sobre el cálculo
del error estándar. Digamos que tenemos una población de 1,000 elementos y que hemos tomado
una muestra de 20. Si calculamos el multiplicador de población finita, el resultado sería

El uso de este multiplicador de 0.99 tendría poco efecto en el cálculo del error estándar de la media.
Este último ejemplo pone de manifiesto que cuando muestreamos una pequeña fracción de la
población entera (es decir, cuando el tamaño de la población N es muy grande en relación con el
tamaño de la muestra n), el multiplicador de población finita toma un valor cercano a 1.0. Los
especialistas en estadística se refieren a la fracción n/N como la fracción de muestreo, porque es la
fracción de la población N contenida en la muestra.

Cuando la fracción de muestreo es pequeña, el error estándar de la media para poblaciones finitas
es tan cercano a la media para poblaciones infinitas que bien podríamos utilizar la misma fórmula
para ambas desviaciones, es decir, la ecuación 𝜎𝑥̅ = 𝜎/√𝑛 .La regla generalmente aceptada es: si
la fracción de muestreo es menor a 0.05, no es necesario usar el multiplicador de población finita.
Cuando utilizamos la ecuación 𝜎𝑥̅ = 𝜎/√𝑛, 𝜎 es constante, y por tanto lo es también la medida de
la precisión de muestreo, 𝜎𝑥̅ , depende sólo del tamaño de la muestra n y no de la fracción de la
población muestreada. Es decir, para hacer 𝜎𝑥̅ más pequeña sólo es necesario agrandar n. En
consecuencia, resulta que el tamaño absoluto de la muestra (y no el de la fracción de la población
muestreada) es el que determina la precisión del muestreo.

Bibliografía: Levin, Richard. Rubin, David. Estadística para Administración y Economía. Séptima
edición. Pearson Educación, México, 2004.

También podría gustarte