Está en la página 1de 9

SUMA DE VARIABLES ALEATORIAS

Con el Teorema Central del Límite nos referiremos, a que, bajo ciertas condiciones, la distribución de
probabilidades de una variable aleatoria definida como la suma de un número muy grande de variables
aleatorias se aproxima a una distribución normal.
El término Central, se debió a Polyá (1920), significa fundamental o de importancia central, este
describe el rol que cumple este teorema en la teoría de probabilidades.

Teorema del Límite Central. Sean X 1 , X 2 , X 3 , . . . una secuencia de variables aleatorias


independientes e idénticamente distribuidas probabilisticamente, con E( Xi) = i y V(Xi) =  i2 , i = 1, 2,
…. , si se define la variable: Sn = X1+ X2 + …. + Xn, entonces:

𝑆𝑛 − ∑𝑛
𝑖=1 𝜇𝑖
𝑍𝑛 = , Tiene aproximadamente la distribución N(0, 1) cuando n → 
√∑𝑛 2
𝑖=1 𝜎𝑖

A partir del enunciado podemos decir que Sn ≅ 𝑁(∑ 𝜇𝑖, , ∑ 𝜎𝑖2 )

Veamos ahora dos casos especiales del teorema central del límite:

CASO 1

Sean X 1 , X 2 , X 3 , . . ., X n n variables aleatorias independientes, Idénticamente distribuidas, con


𝐸(𝑋𝑖 ) = 𝜇 y 𝑉(𝑋𝑖 ) = 𝜎 2 (media y varianza común y finitas).

Sea 𝑆𝑛 = 𝑋1 + 𝑋2 + 𝑋3 + ⋯ … … + 𝑋𝑛 ó 𝑆𝑛= ∑𝑛𝑖=1 𝑋𝑖 ,

si n ∞ entonces 𝑆𝑛 ≅ 𝑁[𝐸(𝑆𝑛 ), 𝑉(𝑆𝑛 )]

donde:
E (𝑆𝑛 ) = E( 𝑋1 + 𝑋2 + 𝑋3 + … … … … … . . + 𝑋𝑛 ) = E(X1) + E(X2) + … + E(Xn ) = nµ

V (𝑆𝑛 ) = V( 𝑋1 + 𝑋2 + 𝑋3 + … … … … … . . + 𝑋𝑛 ) = V(X1) + V(X2) + … + V(Xn ) = n𝜎 2

Ejemplo 1
Lanzar un dado y observar si sale o no el número 3

Este experimento es un ensayo Bernoulli, como tal genera la variable,


X1: Número de veces que sale el número 3 en un solo lanzamiento
RX: 0, 1
Con función de cuantía

LIC. MARÍA A. ZACARÍAS D. 52


1𝑘 51−𝑘
P(X1 = k) = 6 6
, k = 0, 1

E(X1) = 1/6 V(X1) = (1/6)(5/6)= 5 /36

Se lanza otra vez el dado y se observa si sale el número 3 o no

Este segundo lanzamiento es un ensayo Bernoulli, que genera la variable,


X2: Número de veces que sale el número 3 en un solo lanzamiento
RX: 0, 1
Cuya función de cuantía es:
1𝑘 51−𝑘
P(X2 = k) = 6 6
, k = 0, 1

E(X2) = 1/6 V(X2) = (1/6)(5/6)= 5 /36

Definamos la variable aleatoria


S = X1 + X2, donde las 𝑋𝑖 ~ 𝐵(1, 𝑃 = 1/6), 𝑖 = 1, 2
El nombre de esta variable es:
S: Número de veces que sale el número 3 al lanzar un dado 2 veces,
Luego RS: 0, 1, 2
La variable S es la suma de dos variables aleatorias y no se puede aplicar el teorema de limite central,
porque falla en la condición de contar con un numero grande de variables, mínimo 30, aunque las otras
condiciones si las cumple, en conclusión, no se puede decir que S tiene distribución normal.

S variable aleatoria, ¿Cuál es su función de cuantía o probabilidad?

S: Número de veces que sale el número 3 al lanzar un dado 2 veces


La variable S está asociada al experimento lanzar un dado 2 veces y observar si sale o no sale el número
3 en cada dado, este es un experimento binomial, en consecuencia, su recorrido y su función de
cuantía son:
RX: 0, 1, 2
1𝑘 52−𝑘
P(X = K) = 𝐶𝑘2 6 6
, k = 0, 1, 2

Nota: la suma de 2 variables aleatorias Bernoulli no es una variable aleatoria Bernoulli.

Ejemplo 2
Si, de la gráfica siguiente tomamos 30 dados, los lanzamos simultáneamente y observamos los dados
cuyas caras que caen hacia arriba tienen el número 3, este experimento genera la variable aleatoria:

LIC. MARÍA A. ZACARÍAS D. 53


S: Número de dados que muestran el número 3 de los 30 dados lanzados
RS: 0, 1, ….. , 30

P(S = k) = 𝑐𝑘30 𝑃𝑘 𝑄 30−𝑘 , k : 0, 1 , … , 30


Donde: E(S) = 30*(1/6) = 5

V(S) = 30*(1/6)*(5/6) = 4.1667

Cuyo comportamiento probabilístico es:

Comportamiento probabilistico de S
0.25
0.2
0.15
P(S)

0.1
0.05

0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
S

Interpretación: de los 30 dados lanzados es más probable que 5 de ellos presenten el número 3 y es
poco probable que 14 dados presenten el número 3.

Aplicando el Teorema central del limite

Al lanzar 30 dados y observar la presencia o no del número tres en los dados, el lanzamiento cada dado
constituye un ensayo Bernoulli, por lo tanto se tiene 30 ensayos Bernoulli en consecuencia, surgen las
variables Xi, i = 1, 2, …. , 30 donde cada una tiene distribución de probabilidad Bernoulli con la misma
media, E(X)=P= 1/6 y la misma varianza V(X) = 5/36, y asumamos que estas variables son
independientes.
Definamos la variable, S: Número de dados que presentan el número 3.
Definamos S en términos de las variables Bernoulli, S = X1 + X2 + ….. + X30
Cuya esperanza, varianza y desviación estándar son:

E(S) = E(X1 + X2 + ….. + X30) = E(X1)) +E(X2 ) + ….. +E(X30 ) = P + P + …. +P = 30*1/6 = 5

V(S) =V(X1 + X2 + ….. + X30 ) = V(X1)) +V X2 ) + ….. +V( X30 ) = 30*PQ = 30(1/6)(5/6) = 4.16667

𝜎𝑆 = 2.04124

LIC. MARÍA A. ZACARÍAS D. 54


Cómo el número de variables es 30, por el Teo de límite central, la distribución de probabilidades de S
es: S ≅ 𝑁(5, 4.16667) ( S tiene aproximadamente una distribución normal)
con recorrido:

RS: ( 𝐸(𝑆) − 4𝜎𝑆 , 𝐸(𝑆) + 4𝜎𝑆 ) = (5 – 8.165, 5 + 8.165) = (- 3.165, 13.165)


Y su comportamiento probabilístico es:
Comportamiento probabilistico de S según TLC
0.25
0.2
0.15
0.1
0.05
0
-5 0 5 10 15

Por cierto, esta variable no toma valores negativos, es una aproximación, sin embargo, si comparamos
este comportamiento probabilístico con el comportamiento de la variable S cuando es tratada como
una binomial, ambos comportamientos son parecidos.

Ejemplo 3
Suponga que 30 instrumentos electrónicos, se usan de la manera siguiente: tan pronto como falla el
instrumento 1 empieza a actuar el instrumento 2, cuando falla el instrumento 2 empieza a actuar el
instrumento 3. etc. El tiempo de funcionamiento del i-esimo instrumento se denota con 𝑋𝑖 , i = 1, 2,
…… , 30 y es una variable aleatoria distribuida exponencialmente con parámetro 𝜆 = 0.1 por hora. Sea
T el tiempo total de funcionamiento de los 30 instrumentos electrónicos. ¿Cuál es la probabilidad de
que T exceda a 350 horas?

Solución
Piden hallar la probabilidad de T exceda las 350 horas.
El evento es, A: [T exceda las 350 horas]
Para hallar P(A) se debe conocer la distribución de probabilidades de la variable aleatoria T.

Por lo qué procedemos de la siguiente manera:


Sea la Variable aleatoria X: tiempo de funcionamiento de un instrumento I
Cuyo recorrido es: RX: {x   / x > 0 }
Y su fdp es f(x) = 0.1e- 0.1x, E(X) = 1 / 0.1 = 10 hr V(X) = 1/ 0.01 = 100 hr2

Comportamiento probabilistico de X
0.12
0.1
0.08
f(x)

0.06
0.04
0.02
0
0 10 20 30 40 50
x

LIC. MARÍA A. ZACARÍAS D. 55


Sean las variables aleatorias:

𝑋1 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐼1 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎 .

𝑋2 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐼2 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎 .

𝑋30 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑖𝑛𝑠𝑡𝑟𝑢𝑚𝑒𝑛𝑡𝑜 𝐼30 , ℎ𝑎𝑠𝑡𝑎 𝑞𝑢𝑒 𝑓𝑎𝑙𝑙𝑎

Cada una de estas variables tiene la misma fdp de la variable aleatoria X


Sea la variable aleatoria:
T: tiempo total del funcionamiento de los 30 instrumentos hasta su falla.
30

𝑇 = ∑ 𝑋𝑖
𝑖=1

RT: {t   / t > 0}

E(T) = 30*10 = 300 V(T) = 30*100 = 3000

Como n = 30 grande, entonces T ~ N( 300, 3000)

Comportamiento probabilistico de T
0.008
0.006
f(t)

0.004
0.002
0
0 100 200 300 400 500 600
t

Sea el evento:

A: El tiempo total exceda a 350 horas.

P(A) = P[T > 350] = 𝑃[𝑇 = ∑30 𝑖=1 𝑋𝑖 > 350]


P(A) = 1 – P(T < 350) = 1 - 0,819344786
P(A) = 0.1806

Quiere decir que la probabilidad de que el tiempo total de funcionamiento de los 30 instrumentos
electrónicos hasta que su falla sea mayor a 350 horas, es de 0.1806.

CASO 2
Sean X 1 , X 2 , X 3 , . . ., X n n variables aleatorias independientes. Idénticamente distribuidas, con
𝐸(𝑋𝑖 ) = 𝜇𝑋 y 𝑉(𝑋𝑖 ) = 𝜎𝑋2 (media y varianza común y finitas).
LIC. MARÍA A. ZACARÍAS D. 56
𝑋
Sea la variable aleatoria 𝑋̅𝑛 = ∑𝑛𝑖=1 𝑛𝑖,

que cuando n ∞ entonces 𝑋̅𝑛 ≅ 𝑁[𝐸(𝑋̅𝑛 ), 𝑉(𝑋̅𝑛 )]

Donde:
𝑛
∑ 𝑋𝑖 ∑𝑛
𝑖=1 𝐸(𝑋𝑖 ) 𝑛𝜇𝑋
a. 𝐸(𝑋̅𝑛 ) = 𝐸 ( 𝑖=1
𝑛
)= 𝑛
= 𝑛
= 𝜇𝑋

𝑛
∑ 𝑋 ∑𝑛
𝑖=1 𝑉(𝑋𝑖 ) 𝑛𝜎𝑋 2
𝜎𝑋2
b. 𝑉(𝑋̅𝑛 ) = 𝑉 ( 𝑖=1 𝑖 ) = = = = 𝜎𝑋2̅
𝑛 𝑛2 𝑛 2 𝑛

es decir 𝑋̅𝑛 ≅ N[ µX, 𝜎𝑋2 ⁄𝑛 ]


El nombre de esta variable aleatoria 𝑋̅𝑛 es: MEDIA MUESTRAL de la variable aleatoria X
Y su función de densidad de probabilidad es:
1 1 𝑥̅ − 𝜇𝑋 2
𝑓(𝑥̅ ) = 𝑒𝑥𝑝 − ( ) , −∞ < 𝑥̅ < ∞
𝜎𝑋
̅√ 2∗𝜋 2 𝜎𝑋
̅

𝜇𝑋 𝑋̅

Ejemplo 4
Sea la variable aleatoria X, con E(X) = 𝜇𝑋 V(X) = 𝜎𝑋2 y con fdp 𝑓𝑋 (𝑥) normal

X
𝜇𝑋
Sean las variables aleatorias X1, X2
Y sea la variable aleatoria:
M: Media muestral de X
𝑋 +𝑋
M = 1 2 cuya
2

𝐸(𝑋1 )+𝐸(𝑋2 ) 𝜇 +𝜇
E(M) = 2
= 𝑋 2 𝑋 = 𝜇𝑋
2 2 2
𝑋 +𝑋 𝑉(𝑋1 )+𝑉(𝑋2 )
V(M) = 𝑉 ( 1 2 2) = 4
=𝜎𝑋+4 𝜎𝑋 = 𝜎𝑋
2
= 𝜎𝑀2
𝜎𝑋
𝜎𝑀 =
√2
RM: (𝐸(𝑀) − 4𝜎𝑀 , 𝐸(𝑀) + 4𝜎𝑀 )

fM(m) función de densidad de probabilidad


1 1 𝑀− 𝜇 2
𝑓𝑀 (𝑚) = 𝜎 𝑒𝑥𝑝 − 2( ) , −∞ < 𝑀 < ∞
𝑀 √2∗𝜋 𝜎𝑀

Si asumimos que X: talla del estudiante sanmarquino, con 𝜇𝑋 = 170 cm y 𝜎𝑋2 = 16 cm2
Entonces RX: (154, 186) y su fdp es normal

LIC. MARÍA A. ZACARÍAS D. 57


𝜇𝑋 = 170 X

Sea la variable aleatoria M: media muestral de la talla, donde:


𝑋 +𝑋
M = 1 2 esta variable aleatoria tiene distribución normal, porque las Xi son normales y suma de
2
normales es normal, luego su recorrido es:
𝑅𝑀 : (158.68, 181.32)

Y su comportamiento probabilístico es:

𝜇 = 170 M

Se selecciona una muestra de 2 estudiantes y se les pregunta cuál es su talla, y se calcula su talla media
m1 = (168 + 173)2 = 170.5 cm

Se selecciona una muestra de 2 estudiantes y se les pregunta cuál es su talla, y se calcula su talla media
m2=(164+169)/2 =166.5

Se selecciona una muestra de 2 estudiantes y se les pregunta cuál es su talla, y se calcula su talla media
m3 =(165+172)/2 = 168.5

Si se ubica cada valor de la media muestral (m) dentro del recorrido de la variable aleatoria Media
muestral de la talla (M), vemos que están en torno al valor de 𝜇𝑋= 170 cm que es el valor de la media
poblacional de la variable X

Ejemplo 5
Las barras de pan de centeno que cierta panadería distribuye a las tiendas locales tienen una longitud
media de 30 centímetros y una desviación estándar de 2 centímetros. Se supone que la longitud está
distribuida normalmente. De la producción de pan de la mañana de un día, el dueño de la panadería
tomó una muestra aleatoria de 5 barras de pan de centeno para medir su longitud, ¿Cuál es la
probabilidad de que la media muestral de la longitud, sea
a. Mayor de 31.5 cm?
b. Este entre 29.5 y 31.8 cm?
c. Menor que 28.8 cm?

Solución
Piden hallar la probabilidad de que la media muestral de la longitud, sea mayor de 31.5 cm
Sea el evento A: que la media muestral de la longitud, sea mayor de 31.5 cm
La variable que involucra este evento es la media muestral (M) de la cual se debe conocer su
distribución de probabilidades para hallar P(A)
LIC. MARÍA A. ZACARÍAS D. 58
Por lo qué procedemos de la siguiente manera
X: Longitud de la barra de pan de centeno
RX: (22, 38)
𝜇𝑋 = 30 cm 𝜎𝑋2 = 4 cm2
1 1 𝑥− 30 2
𝑓(𝑥) = 𝑒𝑥𝑝 − ( ) ,
2√ 2∗𝜋 2 2

Selecciona una muestra de 5 barras de pan de centeno

X1: X2: X3 X4 X5
Sea la variable, M: Media muestral de la longitud de la barra de pan de centeno

𝑋 +𝑋 +𝑋 +𝑋 +𝑋
M = 1 2 53 4 5
E(M)= 30 V(M) = 4/5 𝜎𝑀 = 0.89
1 1 𝑚− 30 2
fM(m)= 𝑒𝑥𝑝 − ( ) ,
0.89√ 2∗𝜋 2 0.89

Sean los eventos:


A: La media muestral de la longitud de las barras de pan de centeno sea mayor que 31.5 cm
A = [M > 31.5]
P(A) = P[M > 31.5] = 1 - P[M < 31.5]= 1 – 0.954 = 0.046

B: Este entre 29.5 y 31.8 cm?


B: [ 29.5 < M < 31.8]
P(B) = P[ 29.5 < M < 31.8] = P[M < 31.8] - P[ M < 29.5]= 0.9784-0.2871 =0.6913

C: Menor que 28.8 cm?


C = [M < 28.8]
P[C] = P [M < 28.8]= 0.088

COMPORTAMIENTO PROBABILÍSTICO DE X n PARA DIFERENTES VALORES DE “n”

Veamos el comportamiento de la variable aleatoria X n para diferentes valores de n, asimismo


asumamos un valor para  y para 2.

➢ Sea la variable X con fdp normal cuya  = 12 y  = 25 tomemos una muestra de


2

25
tamaño n = 5, entonces la variable aleatoria 𝑋̅ tiene como E(𝑋̅)= 12, V(𝑋̅ ) = 𝜎𝑋2̅ = 5 =5
➢ Sea la variable X con fdp normal, cuya  = 12 y  = 25 tomemos una muestra de
2

25
tamaño n = 10, entonces la variable aleatoria 𝑋̅ tiene como E(𝑋̅)= 12, V(𝑋̅ ) = 𝜎𝑋2̅ = 10 =2.5

LIC. MARÍA A. ZACARÍAS D. 59


Gráfica de distribución de la media muestral
Normal; Media=12
Desv .Est.
0,25 2,24
1,58
n= 10
0,20
Densidad

0,15

0,10

0,05

0,00
5,0 7,5 10,0 12,5 15,0 17,5 20,0
Media muestral

Esta gráfica nos dice, que las medias muestrales obtenidas para muestras de tamaño 10, sus valores
están más cerca de 12 que es el valor de la media poblacional  a diferencia de las medias muestrales
obtenidas para muestras de tamaño 5, sus valores están más alejadas de 12, es decir, cuando el tamaño
de muestra aumenta la dispersión de los valores que toma la media muestral es menor, es decir el
valor de la media muestral está más cerca de 

LIC. MARÍA A. ZACARÍAS D. 60

También podría gustarte