Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPITULO I
MUESTREO: ESTADÍSTICOS Y SUS DISTRIBUCIONES
1.1. Definiciones
1.1.1. Población
1.1.2. Muestra
1
La Estadística es un método general, un lenguaje común, referido a conjuntos y sus
relaciones, sirve para obtener conclusiones probables de poblaciones imperfectamente
conocidas. M.G. Kendall
Texto guía – Estadística I (Inferencia Estadística) 2
N!
NCn Ecuación 1
( N n)!n!
Una muestra puede ser vista como un espacio n dimensional con las coordenadas
x1, x2,...,xn
x x 1 , x 2 , x 3 ,..., x n x
La relación que existe entre población y muestra en estadística, es que esta última
puede ser representativa de la primera (y de hecho la muestra es un subconjunto
de la población) siempre que conserve sus mismas características.
Cuando comienza el cálculo de probabilidades, por ejemplo en el Liber de Ludo Aleae de Cardano, se
relaciona la aleatoriedad con la equiprobabilidad de los diferentes resultados, es decir, un fenómeno sería
aleatorio si todos los resultados son igualmente probables. Esta definición se aceptó con facilidad, por que los
primeros desarrollos del cálculo de probabilidades estuvieron muy ligados a los juegos de azar, en donde el
número de posibilidades es finito y el principio de indiferencia de las diferentes posibilidades puede
considerarse razonable.
Hacia finales del siglo XVIII y principios del XIX se amplía el número de situaciones consideradas aleatorias,
incluyendo no solo los juegos de azar, sino muchos fenómenos naturales. Paralelamente, se produce un
cambio en el concepto de aleatoriedad, que se hace progresivamente más formalizado, introduciendo la idea
de “independencia”, que se considera imprescindible para asegurar la aleatoriedad de un suceso en
experimentos repetidos (Batanero, Carmen. Didáctica de la estadística, 2001) .
Ejemplo: Se tiene una población de 100 bolas: 90 de color azul y 10 de color rojo,
para que una muestra sea representativa de esta población, deberá contener
bolas con colores en la misma proporción. Si se extraen 10 bolas de dicha
población y se obtiene 8 bolas azules y 2 rojas.
2Azar: Del árabe zahr, flor en una cara del dado balanceado que se usaba en los juegos de mesa
o hechar suertes.
Texto guía – Estadística I (Inferencia Estadística) 3
Las muestras pueden ser aleatorias, situación que las convierte en probabilísticas.
Para garantizar la representatividad muestral ésta debe ser elegida aleatoriamente
(es decir, objetivamente), esto permitirá cuantificar la probabilidad de error que se
puede cometer al estimar un parámetro con los resultados de una muestra.
Con reemplazo
Probabilístico
(Aleatorio)
Sin reemplazo
Muestreo
No probabilística
(A conveniencia)
El concepto de muestra nos introduce en la inferencia estadística estableciendo otro puente entre
estadística y probabilidad. Esta idea es muy importante porque todo nuestro conocimiento y juicios
sobre el mundo o las personas se basan en el muestreo. El conocimiento científico se adquiere a
partir de las experiencias empíricas y estas son siempre limitadas. La idea de muestreo tiene en sí
dos características contradictorias: representatividad y variabilidad: La representatividad indica que
la muestra se parece a la población. La variabilidad indica que una muestra puede ser diferente de
otra. (Batanero, 2000)
El número de puntos del espacio muestral está dado por: Nn, es decir, N: número
de elementos distintos en la población, elevado a la n, tamaño de la muestra.
En el ejercicio anterior puede observarse que al comparar los dos muestreos las
probabilidades se diferencian en una pequeña proporción.
Las variables aleatorias pueden ser discretas y continuas, las primeras son
aquellas cuyo conjunto de resultados es contable, por su parte las continuas
toman su conjunto de valores en una escala continua.
En este caso la variable aleatoria, X, número de caras puede tomar los valores
0,1, 2 y 3
Texto guía – Estadística I (Inferencia Estadística) 6
Distribución se refiere a la forma como se organizan los distintos valores que toma
la variable aleatoria de acuerdo con la frecuencia de ocurrencia
La variable aleatoria toma cada uno de sus valores con cierta probabilidad, en el
caso de la moneda lanzada 3 veces:
xi 0 1 2 3
P(X=xi) 1/8 3/8 3/8 1/8
Diagrama de barras
Texto guía – Estadística I (Inferencia Estadística) 7
x2
, 1 x 2
f ( x) 3
0 en cualquier caso
2
x2 x3 2 8 1
Verificando condición 2.
f ( x ) dx
1
3
dx 1
9 1 9 9
1 1
x2 x3 1 1
Verificando condición 3. p (0 X 1) f ( x)dx dx
0 0
3 9 0 9
Texto guía – Estadística I (Inferencia Estadística) 8
Ni
f n ( xi )
n
Texto guía – Estadística I (Inferencia Estadística) 9
Ejemplo: Una bolsa contiene 1.000 bolas, todas de igual tamaño y marcadas con
cuatro números distintos, en la siguiente cuantía: 400 con el número 1, 100 con el
numero 2, 300 con el número 3 y las restantes 200 con el número 4.
Ahora tomamos una muestra aleatoria de tamaño 100 (con reemplazo) siendo los
resultados 42 bolas con 1, 8 bolas con el número 2, 29 bolas con el número 3 y 21
bolas con el número 4. La distribución de frecuencia de la muestra obtenida es la
siguiente:
P(x=1)=0.42
P(x=2)=0.08
P(x=3)=0.29
P(x=4)=0.21
Q( X ) Q( X 1 , X 2 ,..., X n )
n
Q1 ( X ) X 1 X 2 ... X n X i
i 1
n
( X 1 X 2 ... X n ) Xi
Q2 ( X ) X
n i 1 n
n
( X 1 X ) ( X 2 X ) ... ( X n X ) )
2 2 2 (X i X )2
Q3 ( X ) i 1
n 1 n 1
Q4 ( X ) M 1 Min( X 1 , X 2 ,..., X n )
Q5 ( X ) M 2 Max( X 1, X 2 ,..., X n )
0.7
0.2
0.1 X
E(X) = μ = ∑ Xi*P(Xi)
S2 = V(x) = E (X- μ)2
E(Xi) = ∑ Xi P(Xi) = (1*0.1)+(2*0.2)+( 3*0.7)
E(Xi) = µ = 2.6
Para elegir todas las posibles muestras de tamaño tres recordemos el curso de
probabilidades. El número de muestras posibles con repetición y con orden es Nr =
33 = 27
11 21 31
1 12 22 32
13 23 33
Texto guía – Estadística I (Inferencia Estadística) 12
11 21 31
2 12 22 32
13 23 33
11 21 31
3 12 22 32
13 23 33
X = ∑ Xi/n = 3/3 = 1
P(x1=1) = p (1)* p (1)*p (1) = 0.13 = 0.001
X = ∑ Xi/n = 4/3
P (1, 1,2) = p (1)* p (1)*p (2) = 0.12*0.2 = 0.002
Se suman todas las probabilidades asociadas a cada valor diferente que tome la
media muestral.
P(X = 1) = 0.001
P(X = 4/3) = 0.006
P(X = 5/3) = 0.033
P(X = 6/3) = 0.092
P(X = 7/3) = 0.231
P(X = 8/3) = 0.294
P(X = 9/3) = 0.343
Texto guía – Estadística I (Inferencia Estadística) 2
1 0,001 3,00
4/3 0,006 2,67
5/3 0,033 2,33
2 0,092 X 2,00
1,33
8/3 0,294
1
3 0,343
0,00 0,10 0,20 0,30 0,40
P(X)
Esperanza matemática:
E( X )=∑ X P( X 1)
= (1*0.001) + (4/3*0.006) + (5/3*0.033) + (2*0.092) + (7/3*0.231) + (8/3*0.294) +
(3*0.343)
= 2.6
Varianza:
V( X ) = E( X 2) – [E( X )]2
= 6.9067-(2.6)2
= 0.1467
V ( X ) 0.44
Como puede observarse la E ( X ) = E(X)=μ y V (X ) 0.1467
n 3
X es un estimador de la media y la varianza de la media muestral es la varianza de la
población dividida entre el tamaño de muestra.
Texto guía – Estadística I (Inferencia Estadística) 3
En una muestra aleatoria X su tamaño (x1, x2,..., xn) de una variable aleatoria E se define
la media con respecto al origen como a r= Σxir/n
1 n 1 n r
ar (Xi ) n
n i 1
r
i 1
Xi
dk+
1
d
k
0 X1 X2 Xk Xk+
X 1
d1
d2
1
n
1 1
Ear E X 1r E X 1r r
n n
2
1 1 n 1 1
n2
V ( X r
1 )
n2
V ( X )
n2
V ( X )
n
V ( X )
n
E ( X E ( X))
1 1
(E( X2r ) (E( X r))2 (2r r )
2
n n
Texto guía – Estadística I (Inferencia Estadística) 4
Recuerde que:
Interpretación geométrica
dk+1
Estamos interesados en calcular el segundo
dk momento muestral a la media (varianza).
m2 =1/n∑ (Xi- X )2
x x X x Xk+
d2
d1
2
1 1
S 2
n
(Xi X )
n
2
(X i X )
( X
1 2
S2 i ) (X )
n
( X
1 2
S2 i ) (X )
n
( X
1
S2 i ) 2 2 ( X i )( X ) ( X ) 2
n
( X
1
S2 i ) 2 2 ( X i )( X ) ( X ) 2
n
1
S2
n
(X i 2) 2 ( X i )( X ) ( X )2 )
( X
1
S2 i ) 2 n ( X ) 2 2 ( X )( n X n )
n
( X
1
S2 i r ) 2 n( X ) 2 2n ( X ) 2
n
( X
1
S2 i ) 2 n( X ) 2
n
E (S 2 )
1
n
E ( X i ) 2 nE ( X ) 2 Calculemos el valor
2
E(X i )2 2; E(X )
n
1 2
E (S 2 ) n
2
n n
1 1
E ( S 2 ) ( n 2 2 ) ( 2 ( n 1))
n n
n 1 2
E (S 2 )
n El valor esperado de la varianza es sesgada
S
2 ( X 1 )2
1
n 1
S 2 ( X 1 )2
n
( n 1) S 1 nS 2
2
n n n n 1 2
S 12 S 2 E ( S 12 ) E ( S2 ) = * 2
n 1 n 1 n 1 n
E ( S 12 )
Texto guía – Estadística I (Inferencia Estadística) 6
( x ) 2
1
f (X ) e 2 2
dx
2
Propiedades:
1. Simétrica
2. Asintótica: no toca el eje de las x
3. Tiene su máxima altura en la media, moda mediana.
4. La curva normal se aproxima en forma asintótica al eje horizontal, a medida que
avanza en uno u otro sentido a partir de la media.
5. El área total bajo la curva y por encima del eje horizontal es igual a 1.
b
P(a X b) f ( x) dx
a
( x )2
b 1
P(a X b) a 2
e 2 2
dx
Texto guía – Estadística I (Inferencia Estadística) 7
P(X)
=5 =10 =15
b) Efecto de la varianza σ2
Texto guía – Estadística I (Inferencia Estadística) 8
δ²=1σ2 = 1
δ²=5 σ2 = 5
δ²=a5 σ2 = 10
x
Z
Si X cae entre x1 y x2 entonces Z estará entre
x1 x2
z1 y z2
La distribución normal estándar es aquélla que tiene media cero (µ=0) y desviación
estándar uno (σ=1), por tanto:
1 x2
( 1 / 2 ) ( x ) / 2
P ( x1 X x 2 )
2
x1
e dx
Al transformarse queda:
1 z2
2
P ( z1 X z 2 ) ez / 2)
dz
2 z1
Texto guía – Estadística I (Inferencia Estadística) 9
Ejemplos:
1. P (Z≤0.8) = 0.7881
0 0.8
-1 0 0.8
0 0.8
Texto guía – Estadística I (Inferencia Estadística) 10
1.5.2.1. Estandarización
x x 1 1
Z E(Z ) E( ) E(x ) E ( x) 1 0
x x 1 1 2
Z V (Z ) V ( ) V (x ) V x 1
2
2
2
a) P(X≤20)
b) P(24≤X≤36)
c) P(X>38)
d) P(X≤20)
a) Z
X 2030 10
1. 67
σ 6 6
P(X 20) P(Z 1.67) 0.0475
μ=30 σ=6
μ=1 =0
20 30 -1.67 0
Texto guía – Estadística I (Inferencia Estadística) 11
b. P (24≤X≤36)
X1
2 30 6
Z1 1
6 6
X 36 30 6
Z2 2 1
6 6
24 30 36 -1 0 1
c. P (X≥38)
X 38 30 8
Z 1,33
6 6
P X 38 PZ 1,33 1 P Z 1,33 1 0,9082 0,0918
30 38 0 1.33
Texto guía – Estadística I (Inferencia Estadística) 12
Existen experimentos de ensayos repetidos, cada uno con sólo dos posibles
resultados, que se conocen como éxito y fracaso. Ejemplo la salida de productos de un
proceso, puede ser defectuoso o no defectuoso. Este tipo de experimentos se conoce
como binomial y tiene las siguientes propiedades:
n
b( x; n, p ) p x q n x , x 0,1,2,...., n
x
Ejemplo:
Una encuesta a personas adultas realizada en Pereira, revela que casi el 70% rechazo
el hábito de fumar diariamente, según informe del periódico local, Si se seleccionan 12
personas al azar y se les pide su opinión, obtenga la probabilidad de que el número de
quienes rechazan fumar cotidianamente sea de
a) entre 7 y 9
9
12 12 12
P(7 x 9) b( x;12,0.7) 0.7 7 0.3127 0.7 8 0.3128 0.7 9 0.3129
x 7 7 8 9
b) cuando más 5
5
12 12 12
P(0 x 5) b( x;12,0.7) 0.7 0 0.3120 0.710.3121 0.7 2 0.312 2
x 0 0 1 2
12
........ 0.7 5 0.3125
5
Texto guía – Estadística I (Inferencia Estadística) 13
c) No menos de 8
12
12 12 12
P(8 x 12) b( x;12,0.7) 0.7 8 0.3128 0.7 9 0.3129 0.710 0.31210
x 8 8 9 10
12
........ 0.712 0.31212
12
6
20 20 20
P( x 6) b( x;20,0.25) 0.250 0.75 200 0.2510.75 201 ... 0.256 0.75 206
x 0 0 1 6
7 7
20
P( x 8) 1 b( x;20,0.25) 0.25 x 0.75 20 x
x 0 x 0 x
También puede aplicarse la distribución normal para resolver este problema donde
Texto guía – Estadística I (Inferencia Estadística) 14
nP 20 * 0.25 5
σ nPq 20 * 0.25 * 0.75 1.93
X 65
a ) P(X 6) Z1 0.52
σ 1.93
P(X 6) P( Z 0.52) 0.6985
85 3 = 1.55
b) P(X 8) 1 P(X 8) Z
1.93 1.93
3 3
P(X 8) P( Z ) 1 P( Z ) 1- P(Z
1.93 1.93
Al estandarizar se tiene
CAPITULO II
TEORIA DE LA ESTIMACIÓN
Es el proceso por el cual se hace inferencia a cerca del valor que puede tomar un
parámetro o la combinación de varios parámetros. Ejemplo:
1. Se desea estimar la media de una población μ
2. Se desea estimar la diferencia de medias o proporciones de las poblaciones
3. La varianza de una población etc. esta estimación se realizara a través de
estadísticas evaluadas en la muestra aleatoria.
A continuación presentamos las estadísticas para los tres Ejemplos anteriores:
1. Población Muestr
a X1
X2
µ
Xn
X =Σ(Xi)/n
Estimador
Población 1 Muestra Población 2 Muestra
X1 X1
µ1 µ2
X2 X2
Xn p2 Xn
p1
X1 =Σ(Xi)/n
2 =∑(Xi)/n
1 -X2 es un estimador de µ1- µ2
p̂1 - p̂2 es un estimador de P1- P2
Población 3 Muestra
X1
σ2 X2 Estimador σ2= ∑(X1 – X )2/(n-1)
X3
Texto guía – Estadística I (Inferencia Estadística) 16
2.1.1.1. Insesgado
Ejemplo: Se toma una muestra aleatoria de tamaño X1, X2,..., Xn y se desea estimar la
media poblacional, esto la realizamos con dos estadísticas
a) X
X i
E( X ) E(
X i
) E(
Xi n
)
n n n n
b) Con Xi: la observación iésima
E( X i )
E ( X i ) 0
2.1.1.2. Eficiente
Si se considera todos los posibles estimadores insesgados del parámetro θ, aquel que
tenga la varianza mas pequeña se le llamara estimador eficiente.
Texto guía – Estadística I (Inferencia Estadística) 17
X1 1 n 2 2
V (X ) V 2 V ( X i)
n n n2 n
V ( X ) V ( X ) 2
Estimadores:
1 X
X i
ˆ 2 X X i
X max X min
θ ˆ 3
2
La grafica anterior ilustra como el estadístico ˆ1 x tiene una menor varianza que ˆ2 ,
por lo tanto en el proceso de estimación a través de una muestra puede dar resultados
del estadístico más cercano al parámetro θ con ˆ1
Es lógico pensar que debe tomarse aquellos estimadores que tengan el menor ECM. Si
el estimador tiene menor ECM que cualquier otro estimador de este estimador
recibe el nombre de estimador óptimo.
ECM 1
ECM 2
En nuestro ejemplo:
2 2
ECM (1 ) ECM ( X ) 0 2
n n
ECM ( 2 ) ECM ( X ) 0 2
2 2
2
ECM (1 ) 1
n2 1
ECM ( 2 ) n
Si X1, X2,. . . Xn constituyen variables aleatorias con distribución normal para toda i= 1,
2,. . . n se tiene que:
E(X )=µ
X ≈ N (µ,σ2/n)
Expresión que se debe leer de la siguiente manera X tiene una distribución normal con
media µ y varianza σ2/n.
Si x1, x2,..., xn es una muestra aleatoria de tamaño n tomada de una población n>=30
(finita o infinita) con media y varianza 2/n el estadístico X se distribuye normal con
media μ y varianza σ2 si el tamaño de la muestra es grande n→∞.
Analizando que tan grande debe ser n para tener una buena aproximación a la normal
de X se dará el siguiente ejemplo: en el lanzamiento de un dado su distribución es
discreta y uniforme. 1
PX1
6
Ejemplo 1: Una compañía electrónica fabrica resistores que tienen una resistencia
promedio de 100 y una desviación estándar de 10. La distribución de la resistencia
es normal. Encuentre la probabilidad de que al tomar una muestra n =25 resistores, la
resistencia promedio de ésta será menor que 95.
X
σ = 10 Ω Z σ 2 .5
n
P (X 95 ) P ( Z 2 .5 ) 0 .0062
µ=100Ω 95 100
Z
2
2 .5
10
X 2
n 25
X =10
Ejemplo 2: En cierto municipio los salarios diarios por hora están distribuidos normal
con media =1650 y desviación estándar de 950. Si se toma una muestra de tamaño 30
hallar las siguientes probabilidades:
P ( X ≤2000)
P ( X ≥1800)
P (1500 ≤ X ≤1700)
Supongamos que se tienen dos poblaciones normales con medias de 1, 2, y
desviación estándar 1, 2, y que se sacan muestras de tamaño n1, n2. Utilizando el
hecho de que combinaciones lineales de variables aleatorias normales independientes
también es normal.
X X X X 1 2
1 2 1 2
12 22
2
X1 X 2
2
X1
2
X2
n1 n2
Combinaciones lineales de variables aleatorias normales independientes también son
normales.
X 11 X 12
X 22
µ1 X 21 µ2
. .
σ1 σ2 .
.
X n2
X n1 n2
X N ,2
X N1n1, 1
El número de restas posibles es (N1n1 ). (N2n2 ) número bastante grande si N y ni son
grandes.
Si se tiene dos poblaciones independientes con medias 1, 2, y varianza σ12, σ 22, y si
X 1 y X 2 son las medias de dos muestras aleatorias independientes de tamaño n 1 y n2
de estas poblaciones, entonces la distribución de muestreo de:
X 1 X 2 ( 1 2 )
Z
1 2 / n1 2 2 / n2
E ( X 1- X 2) = µ1-µ2
V ( X 1- X 2) =1 22
2
n n
1 2
X 1 X 2 ( 1 2)
Z
1 2 / n1 2 2 / n 2
Texto guía – Estadística I (Inferencia Estadística) 22
Ejemplo: La vida eficaz de un componente de una turbina tiene una distribución normal
con media de 5000 horas y desviación estándar de 40 horas. El fabricante mejora en el
proceso de fabricación de este componente de tal manera que aumenta la vida eficaz
en 5050 y disminuye la desviación estándar a 30 horas. Supóngase que se toma del
proceso antiguo una muestra aleatoria de n1=16 componentes y para el nuevo proceso
se toma una muestra aleatoria de n2=15 componentes. ¿Cuál es la probabilidad que las
diferencias entre las dos medias muestrales X 1- X 2 sea al menos 25 horas?
X 1 N (5000, 40 ) N (5000,10)
16
X 2 N (5050, 30 ) N (5050,16)
25
12 22
X 1 X 2 N ( 1 2 , ) N (50,12.649)
n1 n2
X 1 X 2 ( 1 2)
Z
1 2 / n1 2 2 / n2
25 50
Z 1.976
160
P( X 2 X 1 25) P( Z 1.976) 1 P( Z 1.976) 0.976
25 30 X1-X2
Texto guía – Estadística I (Inferencia Estadística) 23
Sea X una variable dicotómica (que toma solo uno de dos valores) definida sobre una
población de tamaño N. Sea A el número de elementos de X con la característica A y N-
A el número de elementos en X que no tienen A. La proporción de la población se
define como: P =A/N
Pq
pˆ N ( pˆ , pˆ ) pPˆ N ( P, )
n
Pq
pˆ P pˆ
n
Estandarizando se tiene:
Pˆ P
Z
Pq
n
a ). P ( pˆ 0 .11)
b ). P (0 .05 pˆ 0 .12 )
c ). P ( pˆ 0 .10 )
Pq 0 .08 * 0 .92
a ) pˆ P 0 .08; pˆ 0 .022
n 150
P ( pˆ 0 .11)
pˆ P 0 .11 0 .08
Z 1 .36
pq 0 .022
n
P ( pˆ 0 .11) P ( Z 1 .36 ) 0 .9131
b) P (0.05≤ p̂ ≤0.12)
Sea Z1, Z2,..., Zk variables aleatorias distribuidas normal estándar. Entonces la variable
aleatoria X= (Z1)2+ (Z2)2+...+ (Zk)2 tiene una distribución de probabilidad:
1
f ( x) X k / 2 1 e x / 2 x>0
2 ( k / 2)
k /2
=k
2=2k
P(x>=20.05,10)=P(x>18.31)=0.05
18.31 X210
Texto guía – Estadística I (Inferencia Estadística) 26
P(x>=20.1,20)=P(x>28.41)=0.1
28.41 X220
Teorema: Sea y1, y2,..., yp variables aleatorias chi cuadrado independientes con k 1,
k2,..., kp grados de libertad respectivamente. Entonces la cantidad y= y 1+y2+...+yp sigue
una distribución chi cuadrado con k grados de libertad donde:
p
k ki
i 1
Sea x1, x2,..., xn una muestra aleatoria tomada de una población normal, con media y
( n 1) s 2
varianza 2. La función de la varianza muestral esta distribuido como 2n-1.
2
Demostración:
(n - 1) s 2
(x1 x )2
2 2
n n
i1
i
2
0
n n n n
i1
i
2
i1
2
i1
i i
n n
(x
i 1
i ) 2 (x i x ) 2 n ( x ) 2
i 1
n n
(x i )2 ( xi - x ) 2
n( x - ) 2
i 1
i n
2 2 2
n n
(x i ) 2
( xi x ) 2
( x )2
i 1
i 1
2 2 2 n
(x i )2
x )2
i 1
x ;2
x12
Como 2 n
2
(x - x) 2
x n21
Por ser la Chi cuadrado aditiva entonces:
2
( n - 1) S 2
Como la función x 2n -1
2
(30 1)26.7 2
Tenemos: 33.61
24.8 2
Ejemplo 2: Una enlatadora que produce latas de 8 onzas en promedio, con una
varianza de 0.001. Los ingenieros de control de calidad han determinado que el proceso
esta funcionando correctamente cuando la variación verdadera 2 de la cantidad de
llenado por lata es menos de 0.0025. Se selecciona una muestra aleatoria de tamaño
10 latas de la producción de un día y se registra la cantidad de llenado en onzas.
Calcule la probabilidad de que S2 sea mayor que 0.0025. Suponga que las cantidades
de llenado tienen una distribución normal.
(n - 1) S 2 9 * (0.0025)
2 = 2n-1 22.5
2
0.001
P (29>22.5)=, 20.010,9=21.67 , y, 20.005,9=23.59
X2= 4*0.815/1=3.26
X24, 0.50=3.26 0.50≤≤0.90
2
X 4, 0.90=1.06
P (0.90 P(X24) <=3.26)=0.50
0.90
0.50
1.06 3.26
1.06X2113.36
Sea z una variable aleatoria con distribución normal estándar y v una variable aleatoria
Chi cuadrado con k grados de libertad. Si z y v son independientes, entonces la variable
aleatoria:
z
t Distribución t con k grados de libertad.
v k
[( k 1) / 2 ]
F ( x)
k [ ( k / 2 )][( x 2 / k ) 1]( k 1) / 2
t=0, donde
( r ) x r 1e x ( r 1)( r 1)
0
Texto guía – Estadística I (Inferencia Estadística) 30
K=30
K=10
K=5
Las probabilidades para la distribución t y normal son casi iguales para k>30. Para el
cálculo de probabilidades debe calcularse la siguiente integral:
P (t t ,k ) t f (t ) dt
,k
Ejemplo:
Propiedades:
Simétrica
Asintótica
Tiene su máxima altura en la media, mediana y la moda.
Por ser simétrica se tiene que: t1-/2, k=- t/2, k
/2 /2
t1-/2,k 0 t/2,k
Texto guía – Estadística I (Inferencia Estadística) 31
x
T
S/ n
Si reemplazamos S por 2
se tiene la distribución de N (0,1) normal estándar.
Debido a que no conocemos 2 y debe estimarse con una muestra, cual es la
distribución de la expresión anterior:
x
T
S / n
Dividiendo numerador y denominador por 2, se tiene:
x - x- x - x -
T = / n / n / n
S = =
S S 2
(n - 1) S 2
n 2
( n - 1 ) 2
Z
T
v
( n 1)
2.1.7.1. Aplicaciones de la T
1. Un fabricante de bombillos afirma que su producción tiene una tasa promedio de vida
de 500 horas. Para investigar esta afirmación, el fabricante prueba 25 bombillos, dicha
muestra arrojó los siguientes resultados: =518 horas y S=40 horas.
t0.05, 24 = 1.711
Por tanto el fabricante debe estar satisfecho y lo más probable es que la tasa promedio
de vida de los bombillos es un poco mayor a 500 horas, es decir mejor de lo que el
pensaba.
P(t≤1.325)-P(t≤k)=0.075
P(t≤k)= P(t≤-1.325)-0.07
K -1.325 2.
P (t≤k)= P (t≤1.7613)-0.045
P (t≤k)=0.05-0.045
P (t≤k)=0.005 k=2.977
Texto guía – Estadística I (Inferencia Estadística) 33
Fue dado a conocer por R.A Fisher, es utilizado en la comparación de dos varianzas
poblaciones y en la comparación de varias medias poblacionales. El estadístico F se
define como la razón de dos variables aleatorias independientes con distribución Chi
cuadrados dividida cada una entre sus grados de libertad:
Función de probabilidad F
w/u
F
y/v
(u / 2)1
(u v / 2)(u / v ) u / 2 x
f ( x)
(u v ) / 2 0<x<
(u / 2)(v / 2)[(u / v ) x 1]
La media y varianza de F son =v/ (u-2), u>2
2v 2 (u v 2) v>4
2
u (v 2) 2 (v 4)
f1-,u,v f ,u,v
P ( F f , u , v ) 1 P ( F f ,u , v ) 1 F ( f )df
fu ,v
Texto guía – Estadística I (Inferencia Estadística) 34
1
f 1 ,u,v
f 1 ,v,u
Por ejemplo:
1 1
f 0 . 9 5 , 5 ,10 0 .2 11
f 0 .0 5 1 0 , 5 4 .74
1 1
f 0.95 ,6 ,10 = = =0.24
f 0.0510 ,6 4.06
1 1
f 0.99 ,15, 20 0.296
f 0.0120 ,15 3.37
( n 1 - 1) s 12 (n2 -1)s22
12
2
2
2
1
2 2
Tiene distribución Chi cuadrado con n1-1 y n2-1 respectivamente y la razón de las
variables:
Texto guía – Estadística I (Inferencia Estadística) 35
( n1 1) s12 s12
12 /( n1 1) ( n1 1) 12 2 22 s12
1
2 2 f n1 -1, n2 -1
22 /( n 2 1) ( n 2 1) s 22 2
s2 s2
1
( n 2 1) 22 22
.
2.1.8.1. Aplicaciones de la F
2 2
Si S1 y S2 representan las varianzas de muestras aleatorias independientes de tamaño
n1=8 y n2=12, tomadas de poblaciones normales con varianzas iguales calcule P
2 2
(S1 /S2 <=4.89).
2 2 2 2
P (S1 /S2 <=4.89) = 1-P(S1 /S2 >4.89)= 1-0.01=0.99
F0.01, 7.11=4.89
Texto guía – Estadística I (Inferencia Estadística) 36
P (L<=θ<=U)=1-α
1-
P( ˆ >L)=1- Límite inferior
L θ ˆ
U ̂
Texto guía – Estadística I (Inferencia Estadística) 37
P (L ˆ U)=1-α
La probabilidad de que ̂ se halle entre los limites L y U es de 1-. El objetivo a lograr
consiste en despejar θ de expresión ̂ y observar los valores de los limites inferior y
superior L y U.
X
ˆ Z Tiene una distribución normal estándar.
n
Texto guía – Estadística I (Inferencia Estadística) 38
Luego,
X -
P(-Z / 2 Z / 2 ) 1-
/ n
P (- Z / 2 /
n X - Z /2 /
n ) 1-
P (- Z / 2 / n - X - Z / 2 / n - X ) 1 -
P( - Z / 2 / n Z / 2 / n ) 1 -
Z 2 / 2 2
n
E2
Los intervalos bilaterales se calculan de la siguiente manera: P (L<=μ<=U) dado que:
U = X +Z / 2 L X Z / 2
n n
El intervalo unilateral inferior se calcula de la siguiente manera:
P L X - Z 1
n
Texto guía – Estadística I (Inferencia Estadística) 39
P U X Z 1
n
Ejemplo 1: Un método para medir la conductividad térmica del hierro armco. Al utilizar
una temperatura de 100 ° F y una potencia de 550w, se obtiene de una muestra de
tamaño 10 los siguientes resultados: =41.924 y S=0.284, se sabe que la desviación
estándar de estimación es de =0.30, construir un intervalo de confianza del:
a. 95%
b. 99%
a.
L = X - Z / 2 U X Z / 2
n n
L= 41.924-1.96(0.30)/√10 U= 41.924+1.96(0.30)/√10
L= 41.924-0.186 U= 414.924+0.186
L= 41.738 U= 42.110
b.
L = X - Z / 2 U = X +Z / 2
n n
L= 41.924-2.58(0.30)/√10 U= 41.924+2.58(0.30)/√10
L= 41.68 U= 42.17
Inferior
L X - Z = 41.924 –1.645(0.30)/√10
n
μ≥L=41.7679
Superior
U X Z = 41.924+1.645(0.30)/√10
n
μ≤ U= 42.08
X EE X / n 0 . 30 / 10 0 . 0949
Texto guía – Estadística I (Inferencia Estadística) 41
X t / 2 ,n 1 S / n X t / 2 ,n 1 S / n
Donde tα/2, n-1 es el punto crítico superior que corresponde al porcentaje de α/2 de la
distribución t con n-1 grados de libertad.
Demostración:
-tα/2 tα/2 t
x
T
S
n
P ( t / 2, n 1 T t / 2., n 1 1
x
P ( t / 2 , n 1 t / 2., n 1 1
S
n
Despejando µ se tiene:
P X t / 2 ,n 1 S / n X t / 2 ,n 1 S / n 1
Texto guía – Estadística I (Inferencia Estadística) 42
S
Inferior P ( L X t ,n1 ) 1
n
S
Superior P ( U X t ,n1 ) 1
n
Inferior
L X t0.95,14 S / n 96 1.761(9.04) 80.08
P (μ>=80.08)=0.95
Unilateral
Superior
U X t 0.05,14 S / n 96 1.761(9.04) 111 .92
P (μ<=111.92)=0.95
Texto guía – Estadística I (Inferencia Estadística) 43
Sean X11, X12, X13,… X1n una muestra aleatoria de tamaño n1 de la población con media
2
μ1 desconocida y varianza 1 conocida, y X21, X22, X23,… X2n otra muestra aleatoria de
2
tamaño n2, de una población con media μ2 desconocida y varianza 2 conocida. Sí
1 y 2 son las medias muéstrales, se desea encontrar un intervalo de confianza
para la diferencia de medias μ1-μ2.
El estadístico
Z
X 1
- X 2 - 1 2
12 22
n1 n2
Tiene una distribución normal estándar, si las dos poblaciones son normales o se
cumple las condiciones del teorema central de límite:
-Z/2 -Z/2
P (- Z / 2 Z Z / 2 ) 1 -
P (- Z / 2
X 1
- X 2 - 1 - 2
Z / 2 ) 1
2
2
1
2
n1 n2
Texto guía – Estadística I (Inferencia Estadística) 44
2 2 2 2
n1 n2
n1 n2
P X1 - X2 - Z/ 2 1 2 1 - 2 X1 - X2 Z/ 2 1 2 1-
E=Z / 2X1 X2
12 22
E = Z / 2 +
n1 n2
12 22 12 22
E Z / 2 X1 X2
Z / 2 Z / 2
n1 n2 n
12 22
E Z / 2
2 2
n
Z 2 / 2 12 22
n E2
1 - 2 L X 1 - X 2 - Z
12 22
Inferior:
n1 n2
Texto guía – Estadística I (Inferencia Estadística) 45
Superior:
1 - 2 U X 1 - X 2 Z 12
n1
22
n2
Ejemplo: Se llevan acabo pruebas para medir la resistencia a la tensión de dos clases
de largueros de aluminio. Los datos obtenidos en dichas pruebas aparecen a
continuación:
12 22 1.0 2 1.52
L =( X 1 -X2 ) - Z / 2 + =( 87.6 - 74.5 ) -1.645 +
n1 n2 10 12
L= 12.22
12 22 1.0 2 1.5 2
U =( X 1 - X 2 ) + Z / 2 + =( 87.6 - 74.5 ) +1.645 +
n1 n2 10 12
U= 13.98
Texto guía – Estadística I (Inferencia Estadística) 46
a. σ1=σ2
Si X 1 , S21 X 2 , S22 son las medias y las varianzas de dos muestras aleatorias de
tamaño n1 y n2 respectivamente, tomadas de dos poblaciones normales independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(1-
α) por ciento para la diferencia de medias μ 1-μ2 es:
P(L 1 2 U) 1
1 1
U X 1 X 2 t / 2,n1 n2 2 S p
n1 n 2
1 1
L X 1 X 2 t / 2 ,n1 n2 2 S p
n1 n 2
Demostración:
( X 1 X 2 ) 1 2 ( X 1 X 2 ) 1 2
t
S p2 S p2 1 1
Sp
n1 n2 n1 n 2
Texto guía – Estadística I (Inferencia Estadística) 47
b. σ1≠σ2
Si X 1 , X 2 y S21, S22 son las medias y las varianzas de dos muestras aleatorias de
tamaño n1 y n2 respectivamente, tomadas de dos poblaciones normales independientes
con varianzas desconocidas y diferentes, entonces un intervalo de confianza del 100(1-
α) por ciento para la diferencia de medias μ 1-μ2 es:
P(L 1 2 U) 1
2 2
S1 S 2
L X 1 X 2 t / 2,v
n1 n 2
2 2
S1 S 2
U X 1 X 2 t / 2,v
n
n
1 2
V
S12 / n1 S 22 / n2
2
2
Donde:
S12 / n1 S 22 / n2
2 2
n1 1 n2 1
V
2 2
S1 / n1 S 2 / n2
2
S12 / n1
2
S 22 / n2
2
n1 1 n2 1
Texto guía – Estadística I (Inferencia Estadística) 48
a) σ1 = σ2
1 1
1 2 L X 1 X 2 t ,n n 2 S p (Inferior)
1 n2
n
1 2
1 1
1 2 U X 1 X 2 t ,n n 2 S p (Superior)
1 n2
n
1 2
b. σ1≠σ2
S 21 S 2 2
1 2 L X 1 X 2 t ,v
n1
n2 (Inferior)
S 21 S 2 2
1 2 U X 1 X 2 t ,v
n1
n2 (Superior)
Ejemplo: Los niveles bajos de calcio indican que el mecanismo de hidratación del
cemento queda bloqueado y esto permite que el agua ataque varias partes de una
estructura de cemento. Al tomar diez muestras de cemento estándar se encontró que el
peso promedio de calcio es X 1 =90 con una desviación estándar de S1=5.0; los
resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de
X 2 =87 y S2=4.0.
Respuestas
a. σ1=σ2
S 2
n1 1S12 n 2 1S 22
9(5.0) 2 14( 4.0) 2
19.52
p
n1 n 2 2 23
S p 19.52 4.4
1 1 1 1
P(X1 X2) T0.025,23Sp 1 2 (X1 X2) T0.025,23Sp 0.95
n n
1 2 n1 n2
1 1 1 1
P(9087) 2.069(4.4) 1 2 (9087) 2.069(4.4) 0.95
10 15 10 15
P 0.72 1 2 6.72 0.95
b. σ1σ2
2 2
S2 2 52 42
1 S2
n1 n2 10 15
12.7211
V 2 2 2 17.9 18
2 2 2 2 0.639
S2 S2 52 42
1 2
n1 n2 10 15
n1 1 n2 1 11 16
S 12 S22 S 12 S22
P( X 1 X 2 ) T0.025,18 1 2 ( X 1 X 2 ) T0.025,18 0.95
n1 n2 n1 n2
25 16 25 16
P(90 87) 2.101 1 2 (90 87) 2.101 0.95
10 15 10 15
Texto guía – Estadística I (Inferencia Estadística) 50
P 0.968 1 2 6.968 0.95
2.2.6. Intervalos de confianza para 1-2 observaciones pareadas
Sd Sd
d - t /2,n -1 d d t /2,n -1
n n
Donde t/2, n-1 es el punto critico superior que corresponde a /2 y n-1 grados de libertad.
Sigue una distribución t, n-1.
Texto guía – Estadística I (Inferencia Estadística) 51
Como:
d
t d
Sd
n
d D
P ( t / 2,n1 t / 2,n1 ) 1
SD
n
Despejando D se tiene:
S S
P ( d t / 2,n1 d d d t / 2,n1 d ) 1
n n
Texto guía – Estadística I (Inferencia Estadística) 52
d
d i
242
20.17
12 12
S d2
d i d
2
5885.67
Sd
5885.67
23.13
n 1 11 11
Sd 23.13
6.68
n 12
Texto guía – Estadística I (Inferencia Estadística) 53
S S
P(d t / 2,n1 d d d t / 2,n1 d ) 1
n n
t/2,n-1=t0.025,11=2.201
P ( 34 . 87 d 5 . 47 ) 0 .95
n 1S 2 2 n 1S 2
P 1
2
/ 2,n1 2
1 / 2,n1
Donde 2 / 2 , n 1 , 12 / 2 , n 1 son los puntos críticos superiores e inferiores de una Chi
cuadrado con n-1 grados de libertad.
2
n 1S 2
(Inferior)
2 ,,n1
2
n 1S 2
(Superior)
12 ,n1
Texto guía – Estadística I (Inferencia Estadística) 54
Demostración:
( n 1) S 2
El estadístico X n21
2
Ejemplo 1: Un fabricante de baterías para automóviles aseguró que las baterías que
produce duran en promedio 2 años con una desviación estándar de 0.5 años, si cinco
de estas baterías tienen una duración de 1.5, 2.5, 2.9, 3.2 y 4.6 años, determine un
intervalo de confianza del 95% para σ 2. Indique si es válida la afirmación del fabricante.
n 1S 2 n 1S 2
P 2
2
0.95
2 (n-1)=5-1=4
/ 2,n 1 1 / 2, n 1
X
2
1 X
S 2
1.273
n 1
Texto guía – Estadística I (Inferencia Estadística) 55
4 * 1.273 2 4 * 1.273
P 0.95
11 .143 0.484
P 0.457
2
10.52 0.95
Como el fabricante afirma que su producción tiene una varianza de 0.25= (0.5) 2 y dicha
varianza no se encuentra en el interior del intervalo, decimos que la afirmación del
fabricante no es valida, y por lo tanto los datos muestran evidencia que su producción
tiene una varianza mayor.
2
n 1S
2
n 1S
2
19 * 0.0153
0.0287 P (
2
0.0287) 0.95
2 2
1 ,n 1 0.95,19 10.117
P ( 0.17 ) 0.95
Con frecuencia se quiere comparar dos varianzas poblacionales, para lograrlo se forma
la razón:
12
Si las varianzas son iguales la razón es igual a 1.
22
Debido a que las varianzas poblacionales se desconocen debe utilizarse una
estimación a dicha varianzas.
2
2 º
Texto guía – Estadística I (Inferencia Estadística) 57
s 12 2
P ( f 1 / 2 , n1 1 ,n 2 1 2
f / 2 ,n1 1 ,n 2 1 ) 1
s 22 1
2
12 s12 s 22
22 f ( 1 , n 1 , n
1 2 1 )
Superior
12 s12 s 22
2 2
f ( , n 1, n 1 )
1 2
Inferior
n1=25 n2=14
X 1 19 X 2 17
S12=1.8 S22=1.5
Texto guía – Estadística I (Inferencia Estadística) 58
0.90
0.05 0.05
F (0.95,24,13) F(0.05,24,13)
F (0.05, 24,13)=2.41
1 1
0.4587
f (0.05,13,24) 2.18
1.2 12 1 .2
P( ) 0.90
2.41 22 0.4587
12
P(0.498 2 2.616) 0.90
2
El 90% de las muestras seleccionadas contendrán una razón de varianzas entre 0.498
y 2.616.
Ejemplo: Durante un periodo de 15 días se tomaron los tiempos gastados por dos
estudiantes para transportarse de sus casas a la universidad las medias y varianzas
fueron:
X 1 42.54 X 2 40.33
2
S1 =2.96 S2 2 =1.53
s12
1.935
s22
F (0.05, 14,14)= 2.46
F (0.95, 14,14)=
1.935 𝜎 1.935
𝑃( ≤ ≤ ) = 0.9
2.46 𝜎 0.41
𝜎
𝑃(0.787 ≤ ≤ 4.72) = 0.9
𝜎
pˆ qˆ pˆ qˆ
P ( pˆ z 2 P pˆ z 2 ) 1
n n
Donde z 2 es el punto crítico superior que corresponde al porcentaje 2 de la
distribución normal estándar.
Demostración:
El estadístico pˆ P
Z
pq
n
Tiene una distribución normal estándar
Texto guía – Estadística I (Inferencia Estadística) 60
P ( z 2 Z z 2 ) 1
pˆ P
P ( z 2 z 2 ) 1
pq
n
pq pq
P ( pˆ z 2 P pˆ z 2 ) 1
n n
1
2 2
z2 / 2 pˆ qˆ
n
2
Los intervalos de confianza unilaterales están dados por la siguiente expresión:
pq
p pˆ z Unilateral superior
n
pq
p pˆ z Unilateral inferior
n
Ejemplo: A una muestra aleatoria de 344 mayoristas industriales se les pregunto ¿cuál
es la política de su empresa con respecto a la aceptación por parte del personal de
Texto guía – Estadística I (Inferencia Estadística) 61
83 z / 2 z0.05 1.645
pˆ 0.241 qˆ 1 pˆ 0.759
344
pˆ qˆ pˆ qˆ
p pˆ z / 2 p pˆ z / 2 0 .90
n n
0.241 * 0.759 0.241 * 0.759
p 0.241 1.645 p 0.241 1.645 0.90
344 344
pˆ qˆ1 pˆ 2qˆ2 pˆ qˆ pˆ qˆ
p pˆ1 pˆ 2 z/ 2 p1 p2 pˆ1 pˆ 2 Z/ 2 1 1 2 2 1
n1 n2 n1 n2
Donde Zα/2 es el punto crítico superior que corresponde α/2 de la distribución normal
estándar. Y sus intervalos unilaterales son:
pˆ 1qˆ1 pˆ 2 qˆ 2
pˆ 1 pˆ 2 z p1 p 2 Inferior
n1 n2
pˆ1qˆ1 pˆ 2 qˆ 2
pˆ1 pˆ 2 z p1 p 2
n1 n2 Superior
Texto guía – Estadística I (Inferencia Estadística) 62
pˆ 1 pˆ 2 0.12 z / 2 1.96
p 0.22 1.96(0.051) pˆ1 pˆ 2 0.02 1.96(0.051) 0.95
p 0.22 pˆ1 pˆ 2 0.02 0.95
Texto guía – Estadística I (Inferencia Estadística) 63
CAPÍTULO III
PRUEBAS DE HIPÓTESIS
En los temas anteriores el interés consistía en estimar una media, proporción, varianza,
diferencia de medias, diferencia de proporciones y razón de varianzas a través de una
estimación puntual o por intervalos. Sin embargo muchos problemas de ingeniería,
administración y científicos requieren aceptar o rechazar una hipótesis sobre uno o más
parámetros. Para esto estudiaremos la prueba de hipótesis.
Ejemplo:
Con el fin de explicar las partes que conforman una prueba de hipótesis se dará un
pequeño Ejemplo:
Ho 50cm / s
Ha 50 cm / s
Bilateral Unilateral
Ho 50cm / s Ho 50 Ho 50
Ha 50 cm / s Ha 50 Ha 50
Retomando nuestro ejemplo suponga que se toma una muestra de tamaño n=10 y
2.5 y se calcula la media de esta muestra x , dicha media es una variable aleatoria
que puede tomar muchos valores.
Texto guía – Estadística I (Inferencia Estadística) 64
R.A.
R.R.
R.R.
48.5 50 51.5
x1 x2
z1 z2
n n
48.5 50 51.5 50
z1 1.90 z2 1.90
2. 5 2 .5
10 10
Esto significa que el 5.74% de todas las muestras conducen a rechazar H o cuando la
rapidez a la combustión verdadera neta es de 50 cm/s.
48 48.5 50 51.5 52
P ( x 48 )+P ( x 52 )
48 50 52 50
z1 2.53 z2 2.53
2 .5 2 .5
10 10
Supongamos que se toma una muestra de tamaño n=16 (en vez de n=10):
P (48.5 x 51.5)
48.5 50 51.5 50
z1 2.40 z2 2.40
2 .5 2 .5
16 16
Con el fin de evaluar el error tipo II se hace necesario dar valor al parámetro valor
verdadero de la rapidez a la combustión, supongamos que =52
48.5 52 51.5 52
Z1 4.43 z2 0.63
2 .5 2 .5
10 10
Ejemplo: si µ=50.5
Ejemplo: Hallar el error tipo II para n=16, 2.5 y la verdadera media es =52
Recuerde que para n=10, =52, 2.5 , 0.2643 , a continuación se resume el valor
de y para distintos valores de y n
Conclusiones
Ejemplo:
Solución
Ho 50
Ha 50
0.05
Texto guía – Estadística I (Inferencia Estadística) 69
x 0 51.3 50
z Estadístico de Prueba z0 3.25
2
n 25
Para un nivel de significación del 0.05 y con una muestra de tamaño 25 la rapidez de
promedio de combustión es diferente de 25.
R.R. R.R.
0.025 0.025
0.95
pˆqˆ pˆqˆ
2 p pˆ z / 2
n n
a) Aplicando la fórmula:
El error tipo II depende del verdadero valor que toma el parámetro, del tamaño de
muestra, del tamaño del error tipo I ( )
Consideremos la siguiente hipótesis bilateral
Ho o
Ha o
Supóngase que la hipótesis nula es falsa y que el verdadero valor de la media
o donde 0
x o x o
El estadístico de prueba z o
n n n
x o n o o n
E z o E E
n n
0 n n
E zo
n
V ( zo ) V
x o
n 1 V (z )
o
n
Normal estándar
Constante
Texto guía – Estadística I (Inferencia Estadística) 71
n
Por lo tanto z o N ,1
La probabilidad de error tipo II se presenta si z / 2 z o z / 2
P ( z / 2 z z / 2 ) P( zo z / 2 ) P( z0 z / 2 )
n
z / 2
z / 2 E ( zo )
z01
zo 1
n
z / 2
z / 2 E ( z o )
z 02
zo 1
Por lo tanto
Ejemplo
Ho 50 0 51=50+ 1
Ho 50 z / 2 z 0.025 1.96
1 25 1 25
P ( z o 1.96 ) P ( z o 1.96 )
P( z o 0.54) P( z o 4.46) =0.2946-0=0.2946
| o | 1
Ho 50
2
Ho 50
1
En la nueva curva característica de operación para , n=25, 0.05 se puede
2
determinar que Error tipo II=0.30
Ejemplo
En el problema de combustión supongamos que al analista le gustaría diseñar la
prueba de modo que si el verdadero valor de combustión difiere de 1 cm/s del valor de
50 cm/s la prueba identifica (rechaza Ho 50 ) con una probabilidad de 0.90, con
=0.05. Hallar el tamaño de muestra
| 0 | 1
2
1 P 1-β=0.90 β=0.10
1
Para =0.05, 0.10, en la curva característica n=40
2
Texto guía – Estadística I (Inferencia Estadística) 73
n n
P ( z0 z / 2 ) P( z 0 z / 2 )
n
Puesto que P ( z 0 z / 2 )0
Se tiene que
n
z z / 2
n
z / 2 z
n
z / 2 z 2
2
2
n
Esta aproximación es buena si P ( z 0 z / 2 ) es pequeña comparado con .
Ejemplo
En el problema del combustible sólido 2 δ=51-50=1
, 0.05, 0.10, z / 2 z0.025 1.96, z z0.10 1.28
n
1.96 1.28 2 2
2
42
12
Valor muy próximo utilizando la curva característica.
n
2
Existe una relación entre las pruebas de hipótesis y los intervalos de confianza que se
puede resumir de la siguiente manera. Si el valor del parámetro que plantea la hipótesis
nula se ubica dentro del intervalo para un nivel de confianza 1 se aceptara la
hipótesis nula de lo contrario ésta es rechazada.
Texto guía – Estadística I (Inferencia Estadística) 74
Cuando se prueba una hipótesis sobre la media de una población con desconocida
se plantea el procedimiento anterior si el tamaño de muestra es grande n>30 por el
teorema central del límite, si el tamaño de muestra es menor a 30 y se supone que la
población es normal, se empleará el estadístico t para dichas pruebas:
X
t0
S
n
Donde S es una estimación de .
Ejemplo:
Suponga que la carga donde proviene los datos tiene una distribución normal, utilice un
nivel de significancia de = 0.05 para probar dicha hipótesis
2. Ho μ = 10
Ha μ > 10 la carga promedio de falla es mayor a 10
3. = 0.05
13.71 10
4. el estadístico de prueba t0 4.90
3.55
22
Ejemplo
X 1 X 2 ( 1 2 )
Z0
21 22
n1 n2
12 22
Sigue una distribución normal X 1 X 2 ( 1 2 , )
n1 n2
X1 X 2
Z
12 22
n1 n2
X 1 121 X 2 112
1. Los datos 1 8 2 8
n1 10 n2 10
2. Ho μ1 = μ2
Ha μ1 > μ2
Si se rechaza Ho si el nuevo ingrediente disminuye el tiempo promedio deseado.
3. = 0.05
4. Estadístico de prueba
X1 X 2 121 112
Z = 2.52
12 22 82 8 2
n1 n2 10 10
Las curvas características son empleadas para evaluar el error tipo II y calcular el
tamaño de muestra bajo la condición que n1= n2. El valor de d para una prueba bilateral
y unilateral se calcula de la siguiente manera:
1 2
d Bilateral si Ha, μ1 μ 2
2
1
2
2 22
2
1
1 2
d Unilateral superior si Ha, μ 1 > μ 2
12 22 12 22
2 1
d Unilateral inferior si Ha, μ 1 < μ2
12 22 12 22
( Z / 2 Z ) 2 ( 12 22 )
n Bilateral
2
( Z Z ) 2 ( 12 22 )
n Unilateral
2
1 2 10
d 0.88
2
1
2
2 8 82 2
( Z Z ) 2 ( 12 22 ) (1.645 1.28) 2 (8 2 8 2 )
n =
2 10 2
Texto guía – Estadística I (Inferencia Estadística) 78
Caso I 12 22
El estadístico de prueba para esta hipótesis fue desarrollado en la estimación puntual y
por intervalo
X 1 92.215 X 21 92.733
1. S1 2.34 S 2 2.48
n1 8 n2 8
2. Ho µ1=µ2
Ha µ1≠µ2
3. α=0.05
X 1 X 2 ( 1 2 ) ( nn 1) S12 ( n2 1) S 22
2 7 * ( 2.34) 2 7( 2.48) 2
4. T0
1 1
SP n1 n2 2
882
Sp
n1 n2
X1 X 2 0 92.215 92.733 0
T0 0.38
1 1 1 1
Sp 2.70
n1 n 2 8 8
5.
t / 2,n n 2 t 0.025,14 2.145;t 0.025,14 2.145
1 2
Conclusión:
Caso II σ12≠σ22
X 1 X 2 (1 2 )
T0
2 2
S1 S
2
n1 n2
1. Datos
x1 24.2 x 2 23.9
S12 10 S 22 20
n1 15 n 2 10
2. Ho µ1=µ2
Ha µ1≠µ2
3. α=0.10
4. El estadístico de prueba
X1 X 2 0 24.2 23.9
T0 = 0.18
S2
2
10 20
S1
2
15 10
n1 n2
Texto guía – Estadística I (Inferencia Estadística) 81
Las curvas características de operación se utilizan para evaluar el error tipo II para el
caso donde σ12= σ22.
Cuando σ12≠ σ22 no existe curva característica de operación disponible.
| 1 2 |
Bilateral Ha µ1≠µ2
2 2
2
1 Unilateral superior Ha µ1>µ2
2 2
2 1
Unilateral inferior Ha µ1<µ2
2 2
n 1
En la curva característica operacional se tiene que n*=20 por tanto n
2
21
n 10.5
2
n1 n2 11
Cuando las observaciones sobre las dos poblaciones de interés se recopilan por pares,
cada par de observaciones, se toman bajo condiciones homogéneas.
Es estadístico de prueba para observaciones pareadas es el siguiente:
di D
2
t
D
Donde D
di SD
Sd n n 1
n
2. Ho µD=0
Ha µD≠0
Texto guía – Estadística I (Inferencia Estadística) 83
3. α=0.05
d 0.2736
4. El estadístico de prueba t0 6.080
SD 0.135099
n 9
x02
n 1 S 2
02
2. Ho σ2=0.01
Ha σ2≥0.01
Texto guía – Estadística I (Inferencia Estadística) 84
3. α=0.05
4. Estadístico de prueba x
2
n 1 S 2
19 * 0.0153
29.07
0 2
0 0.01
5. x0.05,19 30.14
2
Puesto que x02 29.07 x02.05,19 30.14 se concluye que no hay ninguna evidencia fuerte
de que la varianza del volumen de llenado sea mayor a 0.01.
Si las dos muestras que permiten realizar las pruebas sobre las varianzas poblacionales
provienen de poblaciones normales, se utilizará el siguiente estadístico de prueba.
S12
F 2
S2
El cual tiene una distribución f con n1-1 grados de libertad en el numerador y n2-1
grados de libertad en el denominador, si la hipótesis nula es cierta Ho σ 12= σ22 para la
prueba
Ho σ12= σ22
Ha σ12≠ σ22
f o f / 2 ,n1 1,n 2 1
Se rechaza Ho si ó
f o f 1 / 2 , n1 1 , n 2 1
1
Además f1 / 2 ,n11,n 2 1
f / 2 ,n 2 1,n11
σ12 es la varianza que se propone como mayor por lo tanto una prueba de hipótesis
unilateral es de la siguiente forma:
Ho σ12= σ22
Ha σ 12> σ22
f o f , n1 1, n 2 1
Texto guía – Estadística I (Inferencia Estadística) 85
Ho 1 2
2 2
2.
Ha 2 2
1 2
3. α=0.05
Para realizar las pruebas de hipótesis para una proporción, se realiza el siguiente
procedimiento:
1. Datos n p̂ p
2. Ho p p0 Ha p p0
3. Nivel de significancia: α
4.
𝑝̂ − 𝑝
𝑍=
𝑝𝑞
𝑛
Texto guía – Estadística I (Inferencia Estadística) 86
5. Decisión estadística
𝑧 ⁄ +𝑧 (𝑝𝑞)
𝑛=
𝜀
123
1. Datos n=300 pˆ 0.41
300
2. Ho p 0.50 Ha p 0.50
Para realizar las pruebas de hipótesis para comparar dos proporciones poblacionales,
se realiza el siguiente procedimiento:
2. Ho p 2 p1 0
Ha p2 p1 0
3. Nivel de significancia: α
4.
Texto guía – Estadística I (Inferencia Estadística) 87
(𝑝 − 𝑝 ) − (𝑝 − 𝑝 )
𝑍=
𝑝 𝑞 𝑝 𝑞
+
𝑛 𝑛
5. Decisión estadística
Para calcular el tamaño de muestra en diferencia de proporciones se utiliza la fórmula:
𝑧 ⁄ +𝑧 (𝑝 𝑞 + 𝑝 𝑞 )
𝑛=
𝜀
78 90
1. Datos n1=100 pˆ 1 0.78 n2=100 pˆ 2 0.90
100 100
2. Ho p 2 p1 0
Ha p 2 p1 0.50
6. Conclusión: Estos datos sugieren que el nuevo tratamiento es más efectivo que el
habitual. (Valor de p=0.0102)
3
RONALD E. WALPDE, REYMOND H. MYERS. Probabilidad y estadística para ingenieros, tercera
edición. Editorial iberoamericana 1987, p.340.
Texto guía – Estadística I (Inferencia Estadística) 88
1
𝑓(𝑥) = , 𝑥 = 1, 2, … . , 6
6
Suponer que el dado es lanzado 120 veces y que se registra cada resultado.
Teóricamente, si el dado esta balanceado, se podrá esperar que cada cara ocurriera
120 veces. Los resultados se proporcionan en la siguiente tabla:
Caras
1 2 3 4 5 6
Observada 20 22 17 18 19 24
Esperada 20 20 20 20 20 20
“La prueba de bondad de ajuste entre las frecuencias observada y esperada se basa en
la cantidad
𝑘
(𝑜𝑖 − 𝑒𝑖 )2
𝑥2 =
𝑒𝑖
𝑖=1
(20 − 20)2 (22 − 20)2 (17 − 20)2 (18 − 20)2 (19 − 20)2 (24 − 20)2
𝑋2 = + + + + + = 1.7
20 20 20 20 20 20
Como 1.7 es menor que el valor crítico, se decide no rechazar H 0 para concluir que la
distribución es uniforme. En otras palabras, el dado esta balanceado.
Nivel de ingreso
Reforma fiscal Bajo Medio Alto Total
A favor 182 213 203 598
En contra 154 138 110 402
Total 336 351 313 1000
4
RONALD E. WALPDE, REYMOND H. MYERS. Probabilidad y estadística para ingenieros, tercera
edición. Editorial iberoamericana 1987, p.344.
Texto guía – Estadística I (Inferencia Estadística) 90
𝑃(𝐹) = 𝑃(𝐴) =
336 598
𝑃(𝐿 ∩ 𝐹) = 𝑃(𝐿) 𝑃(𝐹) =
1000 1000
336 402
𝑃(𝐿 ∩ 𝐴) = 𝑃(𝐿) 𝑃(𝐴) =
1000 1000
351 598
𝑃(𝑀 ∩ 𝐹) = 𝑃(𝑀) 𝑃(𝐹) =
1000 1000
351 402
𝑃(𝑀 ∩ 𝐴) = 𝑃(𝑀) 𝑃(𝐴) =
1000 1000
313 598
𝑃(𝐻 ∩ 𝐹) = 𝑃(𝐻) 𝑃(𝐹) =
1000 1000
313 402
𝑃(𝐻 ∩ 𝐴) = 𝑃(𝐻) 𝑃(𝐴) =
1000 1000
Texto guía – Estadística I (Inferencia Estadística) 91
En la siguiente tabla, entre paréntesis, la frecuencia esperada para cada celda al lado
del valor real observado. Nótese que las frecuencias esperadas en cualquier renglón o
columna suman el total marginal correspondiente.
Niveles de ingreso
Reforma fiscal Bajo Medio Alto Total
A favor 182(200.9) 213(209.9) 203(187.2) 598
En contra 154(135.1) 138(141.1) 110(125.8) 402
Total 336 351 313 1000
v = (r - 1) (c - 1)
Calcular
(𝑜𝑖 − 𝑒𝑖 )2
𝑋2 =
𝑒𝑖
𝑖
2 (|𝑜𝑖 − 𝑒𝑖 | − 0.5)2
𝑋 (𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑎) =
𝑒𝑖
𝑖
Cuando las frecuencias esperadas están entre cinco y diez, debe aplicarse la
corrección de Yates.