Balvas

También podría gustarte

Está en la página 1de 3

Teorema de limite central

El conocer la distribución de probabilidad de los estadísticos, permite obtener


conclusiones a partir de una muestra hacia la población en general, proporcionar
una medida del error que se puede cometer en dichas conclusiones y también
permite dar una medida de confianza de que ese sea el error y no otro más
grande. Existe un teorema de mucha importancia práctica, que especifica la
regularidad estadística de los promedios (medias aritméticas) obtenidos de las
mediciones numéricas en las unidades experimentales analizadas en muestras de
tamaño n. Es el teorema de límite central, que dice:

En muestras de tamaño n, tomadas de una población en la que la regularidad


estadística no sigue una distribución normal (puede ser de cualquier forma), que
tiene una media poblacional y varianza poblacional 2 , entonces si n es grande, el
proceso de tomar muchas muestras y en cada una de ellas tomar su media, el
promedio muestral produce una regularidad estadística de los valores de la media
que se modela con la distribución normal con media y varianza 2 / n

Se podría preguntar en el teorema ¿qué tan grande debe ser el tamaño n de la


muestra ? La respuesta es que depende del grado de alejamiento de la
distribución de “muchas medias muestrales”. Si el alejamiento es muy fuerte,
distribuciones asimétricas con mayores probabilidades en los extremos, o con
varias modas, una tamaño de muestra de 30 o más ya probabilidades en los
extremos, o con varias modas, una tamaño de muestra de 30 o más ya produce la
distribución normal. Sin embargo, si la distribución de la población es normal con
muestras de tamaño 10 o más se tiene la normalidad. Si la distribución de
población no es normal, pero no se aleja mucho de ella, es simétrica o casi, con la
media casi igual a la moda y la mediana, entonces con muestras de tamaño 15 ó
20 dependiendo de que tan cercana es la distribución de la población a la
distribución normal. Es importante recordar que no se puede decir que una
variable dada o sus promedios siguen estrictamente una distribución normal. Esta
distribución es una idealización que no se da en realidad, lo que importa es que la
distribución real esté cercana a la normal y este supuesto produzca conclusiones
correctas. Frecuentemente en muchas mediciones no pueden ocurrir valores
negativos, pesos áreas, concentraciones de sustancias, etc.; sin embargo, la
normal asigna probabilidad mayor que cero a valores negativos. En la medida que
dicha posibilidad sea muy pequeña, esa inconsistencia del modelo con la realidad
no es grave. A la desviación estándar 2 / n de la distribución de las medias
muestrales, se le llama error estándar de la media ya que provee una medida del
grado de dispersión de los errores de las medias alrededor de . Si se quiere
conocer el error estándar da una idea del grado de error que se comete.
Frecuentemente en las investigaciones al reportar promedios se da el valor
promedio, seguido de un otro número que es el error estándar del promedio, el
error estándar se denota como:
σ

Ejemplo:
Una empresa de mensajería que opera en la ciudad tarda una media de 35
minutos en llevar un paquete, con una desviación típica de 8 minutos.
Supongamos que durante el día de hoy han repartido 200 paquetes. a) ¿Cuál es la
probabilidad de que la media de los tiempos de entrega de hoy esté entre 30 y 35
minutos?. b) ¿Cuál es la probabilidad de que, en total, para los doscientos
paquetes hayan estado más de 115 horas?. Consideremos la variable X =
“Tiempo de entrega del paquete”. Sabemos que su media es 35 minutos y su
desviación típica, 8. Pero fijaos en que no sabemos si esta variable sigue una
distribución normal. Durante el día de hoy se han entregado n = 200 paquetes. Es
decir, tenemos una muestra x1, x2, ..., xn de nuestra variable. Por el teorema del
límite central sabemos que la media muestral se comporta como una normal de
esperanza 35 y desviación típica:

8
=0.566
√ 200
Si utilizamos esta aproximación, ya podemos contestar a la pregunta a. Debemos
calcular:

P ( 20≤ X ≤ 35 ) P ( 30−35 ≤
X−35 35−35
0.566 0.566

0.566 )

que es aproximadamente igual a la probabilidad siguiente:

P( 30−35
0.566
≤Z≤
35−35
0.566 )
=P (−8.83 ≤ Z ≤ 0 ) =P ( Z ≤ 0 ) −P ( Z ≤−0.883 )=0.5−0=0.5
donde Z es una normal (0,1). Es decir, tenemos una probabilidad aproximada del
0,4616 de que la media del tiempo de entrega de hoy haya estado entre 30 y 35
minutos.

Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a
minutos, ya que ésta es la unidad con la que nos viene dada la variable. Observad
que 115 horas por 60 minutos nos dan 6.900 minutos. Se nos pide que calculemos
la probabilidad siguiente:

6900
(
P Z>
200 )
=P ( X >34.5 )

y como que sabemos que la media se distribuye aproximadamente como una


normal de media 35 y desviación típica 0,566 (supondremos siempre que la
distribución de la media es normal, ya sea porque la variable de interés es normal
o porque la muestra es lo bastante grande), esta probabilidad se puede aproximar
por la probabilidad de una distribución normal estándar Z:

34.5−35
(
P Z>
2000.566)=P ( Z >0.88 )=1−P ( Z <0.88 )=1−0.1894=0.8194

También podría gustarte