Está en la página 1de 8

SUMA DE VARIABLES ALEATORIAS

Con el Teorema Central del Límite nos referiremos a todo teorema que se arma bajo ciertas
hipótesis, que la distribución de probabilidades de la suma de un número muy grande de variables
aleatorias se aproxima a una distribución normal. El término Central, se debió a Polyá (1920),
significa fundamental, o de importancia central, este describe el rol que cumple este teorema en la
teoría de probabilidades.

Teorema del Límite Central. Sean X1 , X 2 , X 3 , . . . una secuencia de variables aleatorias


independientes idénticamente independientes, con E( Xi) = i y V(Xi) =  i2 , i = 1, 2, …. Sea X = X1+
X2 + …. + Xn, entonces:
n
X   i
Zn  i 1
Tiene aproximadamente la distribución N(0, 1) cuando n  
n


i 1
i
2

Veamos ahora un caso especial del teorema central del límite:

Caso 1

Sean X1 , X 2 , X 3 , ..., X n n variables aleatorias independientes. Idénticamente distribuidas, con


𝐸(𝑋𝑖 ) = 𝜇 y 𝑉(𝑋𝑖 ) = 𝜎 2 (media y varianza común y finitas).

Sea 𝑆𝑛= 𝑋1 + 𝑋2 + 𝑋3 + … … … … … . . + 𝑋𝑛 ó 𝑆𝑛= ∑𝑛𝑖=1 𝑋𝑖 , entonces la variable aleatoria

∑𝑛
𝑖=1 𝑋𝑖 –𝑛.𝜇
𝑍𝑛 =
𝜎 √𝑛

para n grande tenemos que Zn tiene aproximadamente la distribución N(0,1)

Del enunciado anterior se desprende que: 𝑆𝑛 ~ N [E (𝑆𝑛 ), V (𝑆𝑛 )], donde:


E (𝑆𝑛 ) = E( 𝑋1 + 𝑋2 + 𝑋3 + … … … … … . . + 𝑋𝑛 ) = E(X1) + E(X2) + … + E(Xn ) = nµ

V (𝑆𝑛 ) = V( 𝑋1 + 𝑋2 + 𝑋3 + … … … … … . . + 𝑋𝑛 ) = V(X1) + V(X2) + … + V(Xn ) = n𝜎 2


Ejemplo 1:

Suponga que 30 instrumentos electrónicos, 𝐷1 , 𝐷2 , 𝐷3 , … … … … … . . , 𝐷30, se usan de la manera


siguiente: tan pronto como 𝐷1 falla empieza a actuar 𝐷2, cuando 𝐷2 falla empieza aa actuar 𝐷3 . etc.
Suponga que el tiempo para fallar 𝐷𝑖 es una variable aleatoria distribuida exponencialmente con
parámetro 𝜆 = 0.1 por hora. Sea T el tiempo total de la operación de los 30 instrumentos
electrónicos. ¿Cuál es la probabilidad de que T exceda a 350 horas?

Acción: Poner en funcionamiento a los treinta instrumentos electrónicos


Interesa: Observar el tiempo de duración de los 30 instrumentos

Sea la Variable aleatoria X: tiempo de duración del instrumento D


Cuyo recorrido es: RX: { x   / x > 0 }
Y su fdp es f(x) = 0.1e- 0.1x, E(X) = 1 / 0.1 = 10 V(X) = 1/ 0.01 = 100

LIC. MARÍA A. ZACARÍAS D. 52


Sean las variables aleatorias:

𝑋1 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑞𝑢𝑒 𝑑𝑢𝑟𝑎 𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐷1 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎 .

𝑋2 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑞𝑢𝑒 𝑑𝑢𝑟𝑎 𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐷2 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎 .

𝑋30 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑞𝑢𝑒 𝑑𝑢𝑟𝑎 𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐷30 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎

Cada una de estas variables tiene la misma fdp de la variable aleatoria X

Sea la variable aleatoria:

T: tiempo total del funcionamiento de los 30 instrumentos hasta su falla.


30

𝑇 = ∑ 𝑋𝑖
𝑖=1

RT: { t   / t > 0}

E(T) = 30*10 = 300 V(T) = 30*100 = 3000

Como n = 30 grande, entonces T ~ N( 300, 3000)

Sea el evento:

A: El tiempo total exceda a 350 horas.

P(A) = P[T > 350] = 𝑃[𝑇 = ∑30


𝑖=1 𝑋𝑖 > 350]

∑30
𝑖=1 𝑋𝑖 –𝑛.𝜇 350−30(10)
P(A) = 𝑃 [ 𝜎 √𝑛
> 10√30
]

50
= P [𝑍30 > 54.77] , teorema central de límite

50 50
= 1 - P [𝑍30 ≤ 54.77] = 1- 𝐹 (54.77) = 1 − 𝐹(0.91) = 1- 0.8186

P(A) = 0.1814.

Quiere decir que la probabilidad de que el tiempo total del funcionamiento de los 30
instrumentos electrónicos hasta su falla sea mayor a 350 horas es de 0.1814.

Ejemplo 2
Se supone que la probabilidad de que una persona sobreviva a un ataque de cólera
(con asistencia médica) es 0.4 ¿Cuál es la probabilidad de que cuando menos la mitad de 100
pacientes con este mal sobrevivan?

LIC. MARÍA A. ZACARÍAS D. 53


Solución
Sea la variable X: Nro. De personas que sobreviven a un taque de cólera en una sola selección.
Cuyo recorrido es: RX= 0, 1
Y su función de cuantía P(X=k) = (0.4)k (0.6)1-k
Su E(X) = 0.4 y su V(X) = 0.24
Se tiene 100 pacientes con este mal.

Sean las variables aleatorias:

𝑋1 : 𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝑞𝑢𝑒 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑒 𝑎 𝑢𝑛 𝑎𝑡𝑎𝑞𝑢𝑒 𝑑𝑒 𝑐ó𝑙𝑒𝑟𝑎

𝑋2 : 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑞𝑢𝑒 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑒 𝑎 𝑢𝑛 𝑎𝑡𝑎𝑞𝑢𝑒 𝑑𝑒 𝑐ó𝑙𝑒𝑟𝑎.

𝑋100 : 𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝑞𝑢𝑒 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑒 𝑎 𝑢𝑛 𝑎𝑡𝑎𝑞𝑢𝑒 𝑑𝑒 𝑐ó𝑙𝑒𝑟𝑎

Cada una de estas variables tiene la misma función de probabilidad que la variable aleatoria X es
decir Bernoulli.

Sea la variable aleatoria:

T: Total de personas que sobreviven a un ataque de cólera


100

𝑇 = ∑ 𝑋𝑖
𝑖=1

RT: 0, 1, 2, … , 100

E(T) = E(X1) + E(X2) + … + E(X100) = 100*0.4 = 40

V(T) = V(X1) + V(X2) + … + V(X100) = 100*0.24 = 24

Como n = 100 grande, entonces T ~ N( 40, 24)

Sea el evento:

A: 50 o más pacientes sobrevivan un ataque de cólera

P(A) = P[T > 50] = 𝑃[∑100


𝑖=1 𝑋𝑖 > 50]

∑100
𝑖=1 𝑋𝑖 –𝑛.𝜇 50−40
P(A) = 𝑃 [ 𝜎 √𝑛
> ]
√24

10
= P [𝑍30 > ] , teorema central de límite
4.898979

= 1 - P[𝑍30 ≤ 2.04] = 1 - 𝐹(2.04) = 1- 0.979387 = 0.020613

P(A) = 0.020613.
LIC. MARÍA A. ZACARÍAS D. 54
Interpretación: Es poco probable que más de 50 personas sobrevivan un ataque de cólera

Ejemplo 3

Una máquina automática envasa arroz en bolsas en una cantidad cuyo peso tiene una esperanza
igual a 1 Kg y una desviación estándar de 0.01 Kg. Una segunda máquina empaca las bolsas en
paquetes de 50 cada uno. Con el fin de verificar si el número de bolsas en cada paquete es exacto, se
decide, que si el peso de cada uno de estos está entre 49.8 y 50.2 Kg se acepta que el paquete tiene
50 bolsas, de otro modo se rechaza. Halle la probabilidad de que, siguiendo el método indirecto para
el recuento de bolsas, un paquete que realmente tiene 50 bolsas sea considerado como si no las
tuviera.

Solución
Sea la variable aleatoria:
X: Peso de una bolsa de arroz
Cuyo peso medio es 1 Kg y la desviación estándar 0.01 kg
No se sabe que distribución tiene, suponemos que es normal

Paquete
Bolsa

Sea la variable aleatoria:


Y: El peso total d

e 50 bolsas o peso del paquete.


50
Y= X
i 1
i

Donde Xi ~ N( 1, 0.012)
Por el teo. Del límite central

Y ~ N ( 𝜇𝑌 , 𝜎𝑌2 )
Y = 50*1 = 50 kg  Y2 = 50*0.0001 = 0.005  Y = 0.070711

Sea el evento
A: Un paquete que tiene 50 bolsas sea considerado como si no las tuviera
A = [Y< 49.8] U [Y > 50.2]
P(A) = P[Y< 49.8] + P[Y > 50.2]

 Y  Y 49.8  50 
P[Y< 49.8] = P    P(Z  2.82843)  0.002339
 Y 0.070711 
 Y  Y 50.2  50 
P[Y < 50.2] = P     P( Z  2.828427)  0.997661
  Y 0.070711 
P(A) = 0.002339 + 0.002339 = 0.004678
A partir de los ejemplos mostrados, también podemos indicar, que cuando se considera un número
grande de variables aleatorias, sean discretas o continuas la suma de estas tienen distribución
normal
LIC. MARÍA A. ZACARÍAS D. 55
Caso 2

Sean X1 , X 2 , X 3 , ..., X n n variables aleatorias independientes. Idénticamente distribuidas, con


𝐸(𝑋𝑖 ) = 𝜇 y 𝑉(𝑋𝑖 ) = 𝜎 2 (media y varianza común y finitas).

Xn  1 𝑛
Sea la variable Z n   N (0,1) Donde 𝑋𝑛 = ∑ 𝑋 para n grande.
 𝑛 𝑖=1 𝑖
n

Del enunciado anterior se desprende que:

X i
Xn  i 1
es una variable aleatoria, cuya:
n

 n 
  Xi  1  n  n
 
a. E X n  E  i 1     E  Xi  
 n  n  i 1  n

 
 
 n

  Xi  1  n  n 2  2
 
b. V X n  V  i 1   2  V  X i    2 
 n  n  i 1  n n
 
 
Y 𝑋̅𝑛 ~ N[ E(𝑋̅𝑛 ), V(𝑋̅𝑛 )] es decir 𝑋̅𝑛 ~ N[ µ, 𝜎 2 ⁄𝑛 ] cuando n  

Veamos el comportamiento de la variable aleatoria X n para diferentes valores de n, asimismo


asumamos un valor para  y para  .
2

Sea  = 50 y  = 25
25
entonces 𝜎𝑋2̅ =
2
n=5
5

Sea  = 50 y  = 25
25
entonces 𝜎𝑋2̅ = 10
2
n = 10

Gráfica de distribución de la media muestral


Normal; Media=12

Desv .Est.
0,25 2,24
1,58

0,20 n=10
Densidad

0,15

0,10

0,05

0,00
n=5
5,0 7,5 10,0 12,5 15,0 17,5 20,0
Media muestral

LIC. MARÍA A. ZACARÍAS D. 56


Esta gráfica nos dice, que cuando el tamaño de muestra aumenta la dispersión de los datos de la
media muestral es menor, es decir los datos de la media muestral están más cerca de 

Ejemplo

Una máquina que empaqueta bolsas de café automáticamente, está regulada para embalar bolsas
cuyos pesos se distribuyen normalmente con media 500 gramos y desviación estándar 10 gramos. Se
sabe también que, a veces la máquina se desregula y cuando esto ocurre, el único parámetro que se
altera es la media (500 gr) permaneciendo la varianza. Para mantener la producción bajo control se
selecciona una m. a. de 110 bolsas y luego se pesa. Calcular la probabilidad de que el peso medio de
las 110 bolsas defiera de 500 en menos de 2 gramos.
Asimismo halle la probabilidad de los siguientes eventos

a. Es menor de 497 gr.


b. Es mayor de 498

Solución

UO: Bolsas de café

Variable aleatoria, X: peso de la bolsa de café

X N (  X ,  X2 ) , donde  X  500 gr ,  X2  100 gr 2


Para mantener la producción bajo control se selecciona una muestra aleatoria de 110 bolsas

Cada bolsa genera una variable aleatoria, siendo estas:

𝑋1 : 𝑃𝑒𝑠𝑜 𝑑𝑒 𝑙𝑎 𝑏𝑜𝑙𝑠𝑎 1

𝑋2 : 𝑃𝑒𝑠𝑜 𝑑𝑒 𝑙𝑎 𝑏𝑜𝑙𝑠𝑎 2.

𝑋110 : 𝑃𝑒𝑠𝑜 𝑑𝑒 𝑙𝑎 𝑏𝑜𝑙𝑠𝑎 110

Cada Xi, i = 1, 2, … , 110 tiene la misma distribución de probabilidades de X

100

X i
Se define la variable aleatoria X i 1

Cuya

110

 E( X ) i
500  500  ...  500 110*500
X  E( X )  i 1
   500
110 110 110

LIC. MARÍA A. ZACARÍAS D. 57


110 110 110

 Xi V ( X i )  2
X
n X2  X2 100
 X2  V ( X )  V ( i 1 ) i 1
 i 1
  
n n2 n2 n2 n 110
 X  0.953463
Cuya distribución de probabilidades es:

100

X i
X i 1
N (  X ,  X2 )
n

Respondiendo a las preguntas

Sea el evento:

B: El peso medio de las 110 bolsas difiera de 500 en menos de 2 gr.

B = [498 < 𝑋̅ < 502]

Gráfica de distribución
Normal; Media=500; Desv.Est.=0,953463
0,9641
0,4

0,3
Densidad

0,2

0,1

0,0
498 500 502
Media muestral

498−500 502−500
P(B) = P[498 < 𝑋̅ < 502] = P[ < 𝑍̅ < ]
0.953463 0.953463

P(B) = P[ - 2.09762 < 𝑍̅ < 2.09762] = 0.9641

Sea el evento:

a. A: El peso medio de las 110 bolsas es menor a 495 gr

A = P [𝑋̅ < 497]

Gráfica de distribución
Normal; Media=500; Desv.Est.=0,953463

0,4

0,3
Densidad

0,2

0,1
0,1471

0,0
499 500
Media muestral

LIC. MARÍA A. ZACARÍAS D. 58


 497  500 
P(A) = P  X  497  = P  Z   P  Z   3.14643  0.000826
 0.953463 

b. C: El peso medio de las 110 bolsas es mayor de 498

C = [𝑋̅ > 498] = 0.9820

Gráfica de distribución
Normal; Media=500; Desv.Est.=0,953463

0,4
0,9820

0,3
Densidad

0,2

0,1

0,0
498 500
Media muestral

Ejercicios

Un antropólogo desea estimar la altura promedio de hombres de cierta raza. Si la desviación


estándar poblacional es de 2.5 pulgadas y si él selecciona una m. a. de 100 hombres, encontrar la
probabilidad de que la diferencia entre la media muestral y la media poblacional verdadera no
exceda 0.5 pulgadas

Supongamos que el antropólogo del ejercicio anterior, desea que la diferencia entre la media
muestral y media poblacional sea menor que 0.4 pulgadas con probabilidad 0.95. ¿Cuál debe ser el
tamaño de la muestra para que consiga este objetivo?

Una firma de investigación de opinión publica entrevista a 1200 electores para estimar la proporción
de los que planean votar por el candidato A. ¿Cuál debe ser la verdadera proporción P para que el
candidato A pueda estar 95% seguro de que la mayoría de los entrevistados votaría por él?

Suponga que el candidato A del problema anterior, insiste que el tamaño de la muestra debe ser tal
que si 51% de todos los electores lo favorecen, él puede estar 95% seguro de obtener la mayoría de
votos en la muestra. ¿Cuál debe ser el valor de n?

LIC. MARÍA A. ZACARÍAS D. 59