Está en la página 1de 37

M.Sc. Eder C.

Vicuña Galindo
1
Teorema del Límite Central

Teorema: Si 𝑋ത es la media de una
muestra aleatoria de tamaño n
tomada de una población que tiene
la media µ y la varianza finita 2,
entonces
X 
Z

n
es una variable aleatoria cuya Exponencial Uniforme
función de distribución se aproxima
a la de distribución normal en tanto
n
x  
n
Teorema del Límite Central…
Dada una población con media μ y desviación estándar σ (finita),
la distribución muestral de la media basada en muestras
aleatorias repetidas de tamaño n (grande) tiene las siguientes
propiedades:
1. La media de la distribución muestral de 𝑥,ҧ es decir, el valor
esperado μx = E(𝑥)ҧ de la distribución de probabilidad de𝑥,ҧ es
igual a la media μx de la distribución de probabilidad de la
variable X.
2. La desviación estándar en la distribución muestral de 𝑥ҧ es
𝜎
igual a . Esta cantidad es denominada error estándar de la
𝑛
media (SEM).
Teorema del Límite Central…
3. Con muestras de tamaño grande, la distribución muestral de
𝑥sigue
ҧ un modelo teórico denominado modelo de distribución
normal, sin importar la forma de la distribución de la
población original, siempre que se cumplan las condiciones
mencionadas.
Teorema del límite central:
Independiente de la distribución que tenga la variable aleatoria
X, siempre que tenga media μ y varianza σ2 finitas, al hacerse lo
bastante grande, 25 o 30 como mínimo, el tamaño de muestra n,
ҧ
𝑥−𝜇
entonces la distribución del estadístico 𝑍 = es Normal con
𝜎/ 𝑛
media 0 y varianza 1, es decir, N(0, 1).
Teorema del Límite Central…

Ejemplo:
Una fábrica productora de alimentos envasa mermelada de frutas
por medio de un proceso automático. El peso neto de un frasco
se considera una variable aleatoria con un promedio de 420 g y
una desviación estándar de 15 g, el peso neto de cada frasco no
afecta ni es afectado por el peso neto de los otros. Una vez llenos
los frascos se empacan en cajas de 72 frascos cada una. ¿Cuál es
la probabilidad de que una caja contenga menos de 30 kg de
mermelada?
Se usará el teorema del límite central, porque el tamaño muestral
es 72, no importando la naturaleza de la distribución de
probabilidad de la variable estudiada:
Teorema del Límite Central…
Adecuando la fórmula de la distribución muestral
 x   nx  n   S n  n 
P xmuestral  x   P z    P  z    P  z  
 / n  n / n   n 

n = 72;
 = 420 g  0,420 kg
 = 15 g  0,015 kg
Sn = 30 kg
 S n  n   30  72  0,42 
P( S n  30)  P z  
  P z    P z  1,8856
 n   72  0,015 
P( S n  30)  0,0297
Comparación de Medias de dos
Poblaciones
• Con frecuencia queremos hacer comparaciones de
dos grupos respecto a sus medias.
• Los métodos estadísticos usados para la comparación
de dos medias dependen de cómo las dos medias
fueron obtenidas. Los datos pueden ser obtenidos de
muestras pareadas o no pareadas.
• La ventaja de usar datos pareados es que se eliminan
los errores aleatorios asociados al fenómeno o
proceso.
Datos pareados
• ¿Cómo obtenemos datos pareados?
➢ Muestras apareadas ocurren cuando las observaciones
individuales en la primera muestra son pareadas a las
observaciones individuales de la segunda muestra, bajo las
mimas condiciones.
• Ejemplos en la química para las pruebas
pareadas:
➢ Dos muestras del mismo lugar y a las mismas condiciones
ambientales son analizadas mediante dos instrumentos.
➢ Se evalúa la eficiencia de dos catalizadores en un
determinado proceso efectuado bajo las mismas
condiciones operacionales.
Contraste para la diferencia de medias
de muestras pareadas
Tamaño de muestras pequeño
Sea X1, X2, …, Xn una muestra aleatoria de una población X →
N(µ1, σ), apareada con una muestra Y1, Y2, …, Yn de una
población Y → N(µ2, σ).
Estadístico de contraste:
D  D
D  Di T
sD2
n
sD 
Di  D  2
n
n 1
Donde 𝐷ഥ es la diferencia de las medias muestrales (𝑥ҧ – 𝑦)
ത y 𝑠𝐷
es la desviación estándar muestral de la diferencias
experimentales de los datos pareados.
Contraste para la diferencia de medias
de muestras pareadas
Tamaño de muestras grande
Sea X1, X2, …, Xn una muestra aleatoria de una población X →
N(µ1, σ), apareada con una muestra Y1, Y2, …, Yn de una
población Y → N(µ2, σ).
Estadístico de contraste:
D  D
z
sD2
n

Dado varianzas poblacionales desconocidas, pero para tamaños


muestrales mayores a 30.
Contraste para la diferencia de medias
de muestras pareadas
Ventajas y Desventajas:
➢ Se controlan las fuentes conocidas de sesgo potencial. (+)
➢ La desviación estándar del estadístico de la prueba suele ser
menor, haciendo que la potencia de su prueba sea
proporcionalmente mayor. (+)
➢ Las pruebas pareadas pueden ser relativamente costosas de
hacer, porque se tiene que encontrar las mismas condiciones,
y puede que se pierda algo debido a la presión de
conseguirlas. (-)
➢ Si rechaza la hipótesis nula, puede tener dificultades para
argumentar que la diferencia se debe a eventos globales en
lugar de un "efecto práctico" de prueba-reevaluación. (-)
Contraste para la diferencia de
medias de muestras pareadas
Ejemplo:
Se desea comparar dos métodos para predecir la resistencia al
corte de vigas de placa de acero. Con este fin se selecciona una
muestra de 9 vigas, a las que se aplican los dos métodos. Los
datos se presentan en la siguiente tabla:

Método 1 1,186 1,151 1,322 1,339 1,200 1,402 1,365 1,537 1,559

Método 2 1,061 0,992 1,063 1,062 1,065 1,178 1,037 1,086 1,052

Contrastar al 5 % de significación si existe alguna diferencia


entre estos dos métodos
Contraste para la diferencia de
medias de muestras pareadas
Ejemplo…:
Llamamos D a la diferencia de resistencia entre el método 1 y el
método 2 y el contraste es:
H0 : µD = 0
H1 : µD  0
Los valores muestrales de D son:

D 0,119 0,159 0,259 0,277 0,138 0,224 0,328 0,451 0,507

ഥ = 0,2736 y una desviación 𝑠𝐷 =


que proporcionan una media 𝐷
0,1356.
Contraste para la diferencia de
medias de muestras pareadas
Ejemplo…:
El estadístico de contraste observado es:
0,2736  0
t  6,05
2
0,1356
9
tα/2, n−1 = t0,025; 8 = −2,306 y t1−α/2, n−1 = t0,975; 8 = 2,306.
Al ser 6,05 mayor que 2,306, rechazamos H0; es decir, hay
evidencia de esta muestra de que los métodos proporcionan
resultados diferentes.
Distribución chi cuadrado ( 2)
• Para poder estimar la varianza de una población normal
se utilizará la distribución chi-cuadrada.
• Si se elige una muestra de tamaño n de una población
normal con varianza 2, el estadístico:
( n  1) s 2
2 
 2

tiene una distribución muestral que es una distribución


ji-cuadrado con grados de libertad = n - 1 y se denota 2
( es la minúscula de la letra griega ji o chi). Donde n es
el tamaño de la muestra, s2 la varianza muestral y 2 la
varianza de la población de donde se extrajo la muestra.
Distribución chi cuadrado ( 2)…

Propiedades de las distribuciones ji-cuadrada


➢ Los valores de 2 son mayores o iguales que 0.
➢ La forma de una distribución 2 depende de los g.l. = n-1. En
consecuencia, hay un número infinito de distribuciones 2.
➢ El área bajo una curva ji-cuadrada es 1.
➢ Las distribuciones 2 no son simétricas, Tienen colas
estrechas que se extienden (sesgadas) a la derecha.
➢ Cuando n > 2, la media de una distribución 2 es n-1 y la
varianza es 2(n-1).
➢ El valor modal de una distribución 2 se da en el valor (n-3).
Distribución chi cuadrado ( 2)…

Función de densidad de probabilidad


Distribución chi cuadrado ( 2)…

Función de
distribución
de
probabilidad
Distribución chi cuadrado ( 2)…
Distribución chi cuadrado ( 2)…
Distribución chi cuadrado ( 2)…
Ejemplo:
Suponga que los tiempos requeridos por un cierto autobús
para alcanzar uno de sus destinos en una gran ciudad forman
una distribución normal con una desviación estándar  = 1
minuto. Si se elige al azar una muestra de 17 tiempos,
encuentre la probabilidad de que la varianza muestral sea
mayor que 2.
Primero se encontrará el valor de ji-cuadrada
correspondiente a s2 = 2 como sigue:
(n  1) s 2 (17  1)(2)
 
2
  32
2 (1) 2
Distribución chi cuadrado ( 2)…
• El valor de 32 se busca dentro de la tabla en el renglón de 16
grados de libertad y se encuentra que a este valor le
corresponde un área a la derecha de 0,01, En consecuencia, el
valor de la probabilidad es P(s2>2)

p = 1   = 0,99  = 0,01
2 = 32
Distribución chi cuadrado ( 2)…
El contenido de azúcar del jarabe en latas de duraznos en almíbar
tiene una distribución normal, y se piensa que la varianza es  2 =
18 (mg)2. Si una muestra aleatoria de n igual a 10 latas da como
resultado una desviación estándar muestral de s = 4,8 mg. Use 
= 0,01.
a)¿Será 2  18?
n  1s 2
10  14,8 2
2    11,52  2 0,005; 9  23,59
 2
18
b) ¿Será 2 > 18?
 2 0,01; 9  21,66
Distribución chi cuadrado ( 2)…
La forma estándar de medir la succión Succión (en cm2)
de agua en el suelo por un tensiómetro. Medido por Sonda de
Un nuevo instrumento para la medición el Resistividad
de este parámetro es una sonda de Tensiómetro Eléctrica
resistividad eléctrica. Un comprador se 355 365
305 300
interesa por la variabilidad de las 360 375
indicaciones dadas por el nuevo 330 360
instrumento. El comprador pone ambos 345 340
instrumentos en un gran recipiente de 315 320
suelo en diez lugares diferentes, ambos 375 385
350 380
instrumentos lado al lado en cada lugar, 330 330
y obtuvo los siguientes resultados 350 390
Distribución chi cuadrado ( 2)…
Se sabe a partir de mediciones extensas que la varianza de las
lecturas del tensiómetro en un recipiente de suelo de este tipo
debe ser de 350 cm2. Elija un nivel adecuado de significancia y
compruebe si la sonda de resistividad eléctrica da una mayor
variabilidad de lo esperado.
En primer lugar examinemos la información de los dos
instrumentos:

Tensiómetro Sonda
n 10 10
𝑥ҧ 341,5 354,5
s 21,35 30,50
Distribución chi cuadrado ( 2)…
• 2 = 350 cm2 σ 𝑛 2
2 𝑖=1 𝑥𝑖 − 𝑥ҧ
𝑠 =
𝑛−1
(n  1) s 2 9(930,28)
 
2
  23,92
2 350

 02,05;9  16,92
Para  = 9 grados de libertad:
Como 2 es mayor que 𝜒0,05;9
2
, entonces la sonda de resistividad
eléctrica da una mayor variabilidad de lo esperado
Distribución F
• Si 𝑠12 y 𝑠22 son las varianzas muestrales de dos
variables aleatorias independientes de tamaños n1 y
n2 tomadas de poblaciones normales con varianzas
𝜎12 y 𝜎22 , entonces, la relación

s / 2
s 2 2 2
F 
1 1 1 2

s / 2
2 s 2
2
2
2
2
1

tiene una distribución F con n1  1 y n2  1 grados de


libertad.
Distribución F…

• Esta distribución de probabilidad se emplea para probar si


dos muestras provienen de poblaciones que poseen
varianzas iguales. Esta prueba es útil para determinar si
una población normal tiene una mayor variación que la
otra.
• También se aplica cuando se trata de comparar
simultáneamente varias medias poblacionales. La
comparación simultánea de varias medias poblacionales
se conoce como análisis de varianza (ANOVA). En
ambas situaciones, las poblaciones deben ser normales.
Distribución F…
• Características de la distribución F
➢ Existe una "familia" de distribuciones F. Un miembro
específico se determina por dos parámetros: los grados de
libertad en el numerador y en el denominador.
➢ La distribución F es una distribución continua.
➢ F, el parámetro, no puede ser negativa.
➢ La distribución F tiene un sesgo positivo.
➢ A medida que aumentan los valores, la curva se aproxima al
eje x, pero nunca lo toca.
➢ En el caso particular de que 𝜎12 = 𝜎22 , también se puede usar
𝑠12
la prueba F para .
𝑠22
Distribución F…Tablas
Distribución F…Tablas
Distribución F…
• Ejemplo:
Se requiere determinar si existe menos variabilidad en el
plateado realizado por la compañía 1 que el efectuado
por la compañía 2. Si muestras aleatorias (de tamaño 12)
del trabajo desempeñado por ambas compañías producen
s1 = 0,035 mm y s2 = 0,062 mm, pruebe la hipótesis nula
de que 𝜎12 = 𝜎22 contra la hipótesis alterna de que 𝜎22 >
𝜎12 , con un nivel de significancia de 0,05.
Use esta otra hipótesis alterna 𝜎12 < 𝜎22 y la siguiente
1
propiedad de F: 𝐹𝛼,𝜈1 ,𝜈2 =
𝐹1−𝛼,𝜈2,𝜈1
Intervalo de confianza para la
Varianza de una población
• Se usa el estadístico del chi cuadrado (2)

(n  1) s 2
(n  1) s 2
 
2

 / 2
2
 2
1 / 2
Intervalo de confianza para la
Varianza de una población…
• Los siguientes son los pesos, en decagramos, de 10 paquetes
de semillas de pasto distribuidas por cierta compañía: 46,4,
46,1, 45,8, 47,0, 46,1, 45,9, 45,8, 46,9, 45,2 y 46,0. Encuentre
un intervalo de confianza de 95% para la varianza de todos los
paquetes de semillas de pasto que distribuye esta compañía,
suponga una población normal.

 ix  x 2
(46,40  46,12) 2  (46,10  46,12) 2  ...  (46,00  46,12) 2
s 
n 1 10  1
 0,5347

• s2 = 0,286
Intervalo de confianza para la
Varianza de una población…
10  1 0,286  min 
10  1 0,286  0,135

2
2
max   0,953
2,70 19,023

Por lo tanto, el intervalo de confianza de 95% para la varianza


es:

P = 1   = 0,95
 02,025 = 2,70  02,975 = 19,023
 max
2
 0,953  min
2
 0,135
Intervalo de confianza para la
Varianza de una población…
• Se desea estimar la varianza del nivel de
nistamina en un ungüento. Se conoce por larga
experiencia que su distribución sigue una
distribución Normal. Se toma una muestra de 9
ungüentos, dando el nivel siguiente (en
millones de unidades/gr): 1,0; 0,9; 1,5; 2,8;
3,1; 3,2; 2,5; 1,9; 2,0. Estimar la varianza
mediante dos intervalos de confianza al nivel
de confianza del 99% y del 95%.
Intervalo de confianza para el
cociente de Varianzas de 2
poblaciones
2 2
s1 s1
s 2
2
s 2
2
 1
 2

F / 2 2
2 F1 / 2