Está en la página 1de 26

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE CIENCIA
DEPARTAMENTO DE MATEMÁTICA Y CIENCIAS DE LA COMPUTACIÓN

ANÁLISIS ESTADÍSTICO PARA INGENIERÍA

FRANCISCO VALENZUELA ROJAS


Segundo Semestre 2023
Presentación 10: Inferencia Estadística: Estimación, Pruebas de Hipótesis
(Pruebas de hipótesis estadísticas)
Correo Electrónico: francisco.valenzuela.r@usach.cl

FRANCISCO VALENZUELA ROJAS 0


Prueba (Dócima) de Hipótesis estadística

Es un proceso mediante el cual se trata de comprobar si una afirmación sobre


alguna propiedad de la población puede sostenerse con la información que
entrega la muestra.

Es entendida como un método estadístico de toma de decisiones, es un


procedimiento que permite decidir si una proposición acerca de una característica
de la población puede mantenerse o ser rechazada.

Ejemplos:

1. La media de la edad de los estudiantes universitarios chilenos es a lo más 25


años.

2. El valor del parámetro λ en una distribución exponencial es λ=0,8

3. La distribución de los puntajes PSU 2012 en Chile es normal

4. Etc.

FRANCISCO VALENZUELA ROJAS 1


HIPÓTESIS NULA Y ALTERNATIVA

Hipótesis nula (H0): Es la hipótesis que se somete a prueba. Se llama nula porque
H0 representa la hipótesis que se mantiene, a no ser que los datos muestrales
indiquen su falsedad, y debe entenderse en el sentido de que es neutra.

Frecuentemente se utiliza en su interpretación la frase “no hay diferencia”.


Una hipótesis nula debe contener una proposición con los símbolos =, <=, >= (es
decir, debe contener la igualdad, sea estricta o no).
Hipótesis alternativa (H1): Es la aseveración contraria a la hipótesis nula. También
se le llama hipótesis del investigador (puesto que es la hipótesis que el investigador
desea verificar).

Una dócima de hipótesis, o test de hipótesis es una partición del espacio muestral
en dos regiones: una llamada REGIÓN CRÍTICA (R.C.)o de RECHAZO, y una
REGIÓN DE ACEPTACIÓN (R.A.). Se considera

α = nivel de significancia = tamaño de la región crítica.


(también se reporta en forma porcentual)

FRANCISCO VALENZUELA ROJAS 2


Matemáticamente:

Ω = 𝑅𝐶 ∪ 𝑅𝐴, 𝑅𝐶 ∩ 𝑅𝐴 = 𝜙

RC y RA son las regiones


críticas (rechazo) y
aceptación, respectivamente.
Ω es el conjunto de
todas las muestras
posibles, resumidas en
un estadístico (por
ejemplo, la media Se debe determinar un valor del estadístico que
muestral) delimite a las dos regiones (a este valor le llama-
remos valor crítico).

FRANCISCO VALENZUELA ROJAS 3


TIPOS DE ERRORES

Deseamos que la decisión con respecto a H0 sea la correcta, pero a veces


no lo será. Existen dos tipos de decisiones incorrectas:

Decisión Estado real de H0


con Verdadera Falsa
respecto a
H0
Rechazar Decisión incorrecta Decisión correcta
H0 (Error tipo 1) 1-β=P(rechazar H0|H0 falsa)
α=P(rechazar H0|H0 verdadera) Potencia del test
Nivel de significancia

No Decisión correcta Decisión incorrecta


rechazar 1 - α=P(no rechazar H0|H0 (Error tipo II)
H0 verdadera) β=P(no rechazar H0|H0 falsa)

FRANCISCO VALENZUELA ROJAS 4


DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 CONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, 𝜎 "

X -µ 0
Estadístico de prueba bajo H0: Z = ~ N (0,1) (µ0=media bajo H0)
s n

Hipótesis Hipótesis Hipótesis


H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧!"$⁄% 𝑅𝐶 = 𝑍/𝑍 < −𝑧!"$ 𝑅𝐶 = 𝑍/𝑍 > 𝑧!"$

+ !
,-.
En los tres casos, se rechaza H0 si 𝑍#$%&'()*# = " ϵ 𝑅. 𝐶.
#
FRANCISCO VALENZUELA ROJAS 5
Ejemplo 1: La variable coeficiente intelectual (CI), se distribuye en la
población chilena de manera normal, con media 100 y desviación estándar
15. Un investigador educacional está interesado en probar que las personas
que hablan más de un idioma tienen un CI superior a la media, aunque
igualmente distribuido. Se tomó una muestra aleatoria de n=25 personas, que
hablan más de un idioma, y se obtuvo un promedio muestral de 102. Con esta
información, ¿se sostiene la idea del investigador, con una significancia del 5%?

Solución: Siendo X = coeficiente intelectual de los chilenos

Supuesto: 𝑋~𝑁 𝜇, 𝜎 " , nivel de significancia = α = 0,05


& 𝐻 : 𝜇 ≤ 100
1. Hipótesis: !𝐻 : 𝜇 > 100 R.C.
!

2. Región Crítica: 𝑅𝐶 = 𝑍/𝑍 > 𝑧&,() = 1,645 0,95

3.Valor observado del Estadístico 1,645

de prueba, bajo H0: 4. Decisión: No se rechaza H0


102 − 100 5. Conclusión: No hay evidencia suficiente
𝑍$%& = ≈ 0,6667 ∉ 𝑅. 𝐶.
15⁄ 25 para pensar que las personas que hablan
más de un idioma tienen mayor C.I.
FRANCISCO VALENZUELA ROJAS 6
DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 DESCONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, 𝜎 "


X -µ 0
Estadístico de prueba bajo H0: T = ~ t(n -1) (µ0=media bajo H0)
S n
Hipótesis Hipótesis Hipótesis
H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝒕𝟏"𝜶⁄𝟐;𝒏"𝟏 𝑅𝐶 = 𝑇/𝑇 < −𝒕𝟏"𝜶;𝒏"𝟏 𝑅𝐶 = 𝑇/𝑇 > 𝒕𝟏"𝜶;𝒏"𝟏

+ !
,-.
En los tres casos, se rechaza H0 si 𝑇#$%&'()*# = ' ϵ 𝑅. 𝐶.
#
FRANCISCO VALENZUELA ROJAS 7
Ejemplo 2: Un fabricante de pólvora ha encontrado una nueva mezcla, que es
capaz de producir una velocidad de salida media del proyectil de 3.000 (pies/seg.)
Se elige una muestra aleatoria de tamaño 15, y se mide la velocidad de salida cuando
se disparan los proyectiles, en (pie/seg.), resultando:
3005 2995 2925 3005 2935 2935 2935 2965 2905 2945 2964 2948 2930 3003 2951
Con esta información, y suponiendo normalidad en la distribución de las velocidades,
¿existe evidencia suficiente para indicar que la velocidad media difiere de 3.000
(pies/seg.), con un 5% de significación?
Solución: Si X = velocidad de salida del proyectil (pie/seg.)
De la muestra dada, se tiene: 𝑋 = 2.956,4 𝑆 = 32,1221 𝛼 = 0,05 ⇒ 1 − 𝛼 = 0,95

𝐻/ : 𝜇 = 3.000 3.Valor observado del


1. Planteamiento de hipótesis: .
𝐻0 : 𝜇 ≠ 3.000 Estadístico de prueba,
bajo H0:
2. Región Crítica: 𝑅𝐶 = 𝑇/ 𝑇 > 𝑡&,(/);!0 = 2,145 2.956,4 − 3.000
𝑇= ≈ −5,257 ∈ 𝑅. 𝐶.
32,1221⁄ 15

4. Decisión: Se rechaza H0
0,95 5. Conclusión: Hay evidencia para pensar
que la velocidad media difiere de 3.000
(pie/seg.), con una significancia del 5%.
−2,145 2,145

6. Valor p = 𝑃 𝑇 > 𝑇!"# = 2 6 0,0001 = 0,0002

FRANCISCO VALENZUELA ROJAS 8


DÓCIMA PARA LA VARIANZA σ2 , EN UNA DISTRIBUCIÓN NORMAL

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, 𝜎 "


𝑛 − 1 𝑆;
Estadístico de prueba bajo H0:
;
𝜒 = ; ~𝜒 ;=>? (𝜎!" = varianza bajo H! )
𝜎<

Hipótesis Hipótesis Hipótesis


𝐻+ : 𝜎 $ = 𝜎+$ 𝐻+ : 𝜎 $ ≥ 𝜎+$ 𝐻+ : 𝜎 $ ≤ 𝜎+$
𝐻* : 𝜎 $ ≠ 𝜎+$ 𝐻* : 𝜎 $ < 𝜎+$ 𝐻* : 𝜎 $ > 𝜎+$

Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝜒 $ /𝜒 $ < 𝜒&$ ⁄$;()* ∨ $


$
𝑅𝐶 = 𝜒 $ /𝜒 $ > 𝜒*)&;()*
𝑅𝐶 = $ 𝑅𝐶 = 𝜒 $ /𝜒 $ < 𝜒&;()*
𝜒 $ > 𝜒*) & ⁄$;()*

;
En los tres casos, se rechaza H0 si 𝜒$%&@ABCD$ = 𝑛 − 1 𝑆 ; /𝜎<; ∈ 𝑅. 𝐶.

FRANCISCO VALENZUELA ROJAS 9


Ejemplo 3: Una compañía fabrica partes de un automóvil, cuyos diámetros debieran
tener una varianza no mayor a 0,0002 pulgadas2. Un investigador piensa que la
varianza es superior a dicho valor estipulado.

Se toma una muestra aleatoria de 10 partes, las cuales arrojan una varianza muestral
de 0,0004. Con un nivel de significancia de 5%, ¿qué conclusión puede obtenerse?.
Suponga normalidad en la distribución de los diámetros.

Solución: Siendo X = diámetros de las partes del automóvil , 𝑋! ~𝑁 𝜇, 𝜎 "


𝑆 % = 0,0004 , 𝛼 = 0,05

𝐻/ : 𝜎 " ≤ 0,0002 R.C.


1. Planteamiento de hipótesis: 4
𝐻0 : 𝜎 " > 0,0002

2. Región Crítica: )
𝑅𝐶 = 𝜒 ) /𝜒 ) > 𝜒*,,-;, = 16,919 1-α
3.Valor observado del 𝜒 ,(,)*;) = 16,919

Estadístico de prueba, 4. Decisión: Se rechaza H0


bajo H0: 5. Conclusión: Hay evidencia para pensar que
la varianza de los diámetros es mayor a 0,0002
) 9 ⋅ 0,0004 pulgadas2, con un 5% de significancia.
𝜒!"#$%&'(! = = 18 ∈ 𝑅. 𝐶.
0,0002 6. Valor p = )
𝑃 𝜒 ) > 𝜒!"#$%&'(! = 0,0352
FRANCISCO VALENZUELA ROJAS 10
DÓCIMA PARA EL PARÁMETRO DE PROPORCIÓN p (D. BINOMIAL)
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋9 ~𝐵𝑖𝑛 1, 𝑝
pˆ - p 0 𝑋 n° de éxitos
Estadístico de prueba Z = ~ N (0,1) 𝑝̂ = =
bajo H0: p0 (1 - p0 ) C . L
T . 𝑛 𝑛
n 𝑝& = proporción bajo H&

Hipótesis Hipótesis Hipótesis


H0: p=p0 H0: p≥p0 H0: p≤p0
H1: p≠p0 H1: p<p0 H1: p>p0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧!"$⁄% 𝑅𝐶 = 𝑍/𝑍 < −𝑧!"$ 𝑅𝐶 = 𝑍/𝑍 > 𝑧!"$

En los tres casos, se rechaza H0 si 𝑍:;<=>?@A: = (𝑝6 − 𝑝& )⁄ 𝑝& (1 − 𝑝& )⁄𝑛 ∈ 𝑅. 𝐶.
FRANCISCO VALENZUELA ROJAS 11
Ejemplo 4: Se sabe que aproximadamente uno de cada 10 fumadores prefieren la
marca LL. Después de una campaña publicitaria se encuestó a 200 fumadores, para
determinar la efectividad de la campaña. La encuesta mostró que 26 fumadores
preferían la marca LL.
¿Muestran estos datos evidencia suficiente que indique un aumento en la aceptación
de la marca? Utilice un nivel de significancia α=0,05
Solución: Siendo X = número de fumadores que prefieren la marca LL,
en la muestra de tamaño 200.
26 1 9
𝑝̂ = . Suponiendo válida H0, se tiene que 𝑝< = ⇒ 1 − 𝑝< =
200 10 10
𝐻< : 𝑝 ≤ 1⁄10
1. Planteamiento de hipótesis: @
𝐻? : 𝑝 > 1⁄10
R.C.
2. Región Crítica: 𝑅. 𝐶. = 𝑍/𝑍 > 𝑧*,,- = 1,645 ≡
0,95

3.Valor observado del 𝑧!,#$ = 1,645

Estadístico de prueba, 4. Decisión: No se rechaza H0


bajo H0: 5. Conclusión: Los datos NO muestran
evidencia suficiente que indique un
26⁄200 − 1⁄10 aumento de aceptación de la marca, a un
𝑍!"# = ≈ 1,4142 ∉ 𝑅. 𝐶.
1⁄10 9⁄10 5% de significancia.
200 6. Valor p = 𝑃 𝑍 > 𝑍!"# = 0,0787
FRANCISCO VALENZUELA ROJAS 12
DÓCIMAS PARA DOS POBLACIONES NORMALES INDEPENDIENTES
Diferencia de medias, varianzas conocidas
"
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, , 𝜎,
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌! ~𝑁 𝜇@ , 𝜎@"

Estadístico de prueba bajo H0: Z =


(X - Y )-d 0
~ N (0,1)
s 2
X n +s 2
Y m
𝛿( = diferencia de medias, bajo H(

Hipótesis Hipótesis Hipótesis


H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧/02⁄) 𝑅𝐶 = 𝑍/𝑍 < −𝑧/02 𝑅𝐶 = 𝑍/𝑍 > 𝑧/02


3 53 06#
40
En los tres casos, se rechaza H0 si 𝑍!"#$%&'(! =
%⁄
ϵ 𝑅. 𝐶.
7$ 897&% ⁄:

FRANCISCO VALENZUELA ROJAS 13


Ejemplo 5: Un investigador educacional plantea que las mujeres tienen un
desempeño medio mejor que los hombres, en el área de lengua castellana y comuni-
cación, en la Prueba de Selección universitaria (PSU). Se sabe que las desviaciones
estándar poblacionales de los puntajes PSU 2012 de hombres y mujeres son, respecti-
vamente, 100 y 97 puntos. Se toman dos muestras aleatorias de cada género, arro-
jando los siguientes resultados:
Género Media Muestral n
(puntajes)
Hombres 504 25
Mujeres 506 30

Considerando α=0,01, y suponiendo normalidad, ¿Qué se puede concluir?


Solución: 𝐻 : 𝜇 ≥ 𝜇C ≡ 𝜇B − 𝜇C ≥ 0
! & B
1. Planteamiento de hipótesis: 𝐻! : 𝜇B < 𝜇C ≡ 𝜇B − 𝜇C < 0

2. Región Crítica: 𝑅𝐶 = 𝑍/𝑍 < −𝑧+,BB ≈ −2,33 4. Decisión: No se rechaza H0


3.Valor observado del 5. Conclusión: La evidencia es insufi-
Estadístico de prueba, ciente para pensar que las mujeres
bajo H0: rinden, en promedio, mejor que los
hombres en lenguaje, con una signifi-
504 − 506 − 0 cancia de α=0,01
𝑍= ≈ −0,075 ∉ 𝑅. 𝐶.
100) ⁄25 + 97) ⁄30 FRANCISCO VALENZUELA ROJAS 14
Diferencia de medias, varianzas desconocidas e iguales
"
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, , 𝜎
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌! ~𝑁 𝜇@ , 𝜎 "
(
Estadístico de prueba bajo T = X - Y -d 0 ~ t )
(n + m - 2 ) ,
𝑛 − 1 𝑆(" + 𝑚 − 1 𝑆)"
𝑆' =
H 0: S p 1 n +1 m 𝑛+𝑚−2

(Sp, estimador combinado de la desviación Estándar) 𝛿* = diferencia de medias, bajo H*


Hipótesis Hipótesis Hipótesis
H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡/02⁄);89:0) 𝑅𝐶 = 𝑇/𝑇 < −𝑡/02;89:0) 𝑅𝐶 = 𝑇/𝑇 > 𝑡/02;89:0)

+ @+ -H!
,-
En los tres casos, se rechaza H0 si 𝑇#$%&'()*# = ϵ 𝑅. 𝐶.
IW 0⁄KL0⁄M

FRANCISCO VALENZUELA ROJAS 15


Ejemplo 6: Se toman muestras aleatorias de las golillas producidas por dos
máquinas, en un día determinado, y se miden los diámetros, obteniéndose:
Máquina 𝑋 𝑆 𝑛
A 2,33 cm 0,24 cm 21
B 2,61 cm 0,30 cm 21
Docime la hipótesis de que los diámetros de las golillas producidas por ambas
máquinas son iguales, para α=0,05, suponiendo que la distribución de los diámetros
de ambas máquinas son normales y con varianzas iguales, con m.a. independientes.
Solución: Siendo XA = diámetros de golillas, máquina A
XB = diámetros de golillas, máquina B
𝐻( : 𝜇/ − 𝜇0 = 0 ≡ 𝜇/ = 𝜇0 ;𝛼 = 0,05
1. Planteamiento de hipótesis: 20 ⋅ 0,24, + 0,30,
𝐻1 : 𝜇/ − 𝜇0 ≠ 0 ≡ 𝜇/ ≠ 𝜇0 ;𝑆2 = ≈ 0,2717
40

2. Región Crítica: 𝑅. 𝐶. = 𝑇/ 𝑇 > 𝑡!,+,-;/! = 2,021 ≡

3.Valor observado del 0,95


Estadístico de prueba, bajo H0: 𝑡 ^<
−2,021 2,021
2,33 − 2,61 − 0
𝑇012 = ≈ −3,339 ∈ 𝑅. 𝐶.
0,2717 ⋅ 1⁄21 + 1⁄21 5. Conclusión: Hay evidencia para
suponer que los diámetros medios
difieren entre ambas máquinas, α=0,05
4. Decisión: Se rechaza H0.
FRANCISCO VALENZUELA ROJAS 16
Diferencia de medias, varianzas desconocidas y diferentes
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, , 𝜎,"
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌! ~𝑁 𝜇@ , 𝜎@"
( )
Estadístico de prueba T = X - Y -d 0 ~ t(u ) 𝜈=
𝑆C$ ⁄𝑛 + 𝑆D$ ⁄𝑚 $
𝑆C$ ⁄𝑛 $ ⁄ 𝑛 − 1 + 𝑆D$ ⁄𝑚 $ ⁄ 𝑚 − 1
bajo H0: S X n + SY m
2 2

𝛿* = diferencia de medias, bajo H*

Hipótesis Hipótesis Hipótesis


H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡/02⁄);& 𝑅𝐶 = 𝑇/𝑇 < −𝑡/02;& 𝑅𝐶 = 𝑇/𝑇 > 𝑡/02;&

J LJ "MO
K"
En los tres casos, se rechaza H0 si 𝑇:;<=>?@A: = Q ⁄OPN Q⁄Q
ϵ 𝑅. 𝐶.
NP R

FRANCISCO VALENZUELA ROJAS 17


DÓCIMA PARA RAZÓN DE VARIANZAS
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋! ~𝑁 𝜇, , 𝜎,"
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌! ~𝑁 𝜇@ , 𝜎@"
𝑆4)
Estadístico de prueba bajo H0: 𝐹 = ) ~𝐹 80/,:0/
𝑆5

Hipótesis Hipótesis Hipótesis


𝐻+ : 𝜎C$ = 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ = 1 𝐻+ : 𝜎C$ ≥ 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ ≥ 1 𝐻+ : 𝜎C$ ≤ 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ ≤ 1
𝐻* : 𝜎C$ ≠ 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ ≠ 1 𝐻* : 𝜎C$ < 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ < 1 𝐻* : 𝜎C$ > 𝜎D$ ≡ 𝜎C$ ⁄𝜎D$ > 1

Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝐹/𝐹 < 𝐹&⁄$;()*;E)* ∨


𝑅𝐶 = 𝑅𝐶 = 𝐹/𝐹 < 𝐹2;80/;:0/ 𝑅𝐶 = 𝐹/𝐹 > 𝐹/02;80/;:0/
𝐹 > 𝐹*)&⁄$;()*;E)*

𝑆4)
En los tres casos, se rechaza H0 si 𝐹!"#$%&'(! = ) ∈ 𝑅. 𝐶.
𝑆5

FRANCISCO VALENZUELA ROJAS 18


Ejemplo 7: Un distribuidor mayorista de lápices plumones está considerando dos
marcas (A y B), que tienen el mismo precio. Los fabricantes de la marca B afirman
que sus lápices duran más, debido a un sistema especial de esparcimiento de la tinta
que hace que se requiera menor cantidad para un mismo trazo.

El comerciante decide tomar una muestra aleatoria de 10 lápices marca A y 15 lápices


marca B, y probar la longitud de un trazo continuado de cada uno de ellos, hasta que
se agote la tinta. Con un nivel de significación 0,05, ¿cuál debería ser la decisión
del comerciante, si los resultados obtenidos son los siguientes?

Media muestral, longitud marca A 𝑋 = 34,33 m

Media muestral, longitud marca B 𝑌 = 34,87 m

Varianza muestral, longitud marca A


𝑆_; = 0,0428 m2

Varianza muestral, longitud marca B 𝑆`; = 0,1820 m2

FRANCISCO VALENZUELA ROJAS 19


Solución: Es claro que en este caso, se procede a realizar el test de diferencia
de medias, pero el inconveniente inicial es saber si se puede o no suponer
igualdad de varianzas, por lo tanto, antes de aplicar la dócima de diferencia
de medias, se procede a realizar la dócima de razón de varianzas:

1. Planteamiento de hipótesis: ]
𝐻* : 𝜎4) = 𝜎5) ≡ 𝜎4) ⁄𝜎5) = 1
𝐻/ : 𝜎4) ≠ 𝜎5) ≡ 𝜎4) ⁄𝜎5) ≠ 1

2. Región Crítica:
1 1
𝑅𝐶 = 𝐹/𝐹 < 𝑓*,*)-;,;/S = = = 0.2633 ∨ 𝐹 > 𝑓*,,T-;,;/S = 3.2093
𝑓*,,T-;/S;, 3.7976

0.95
𝐹 9,14
0.2633 3.2093
3. Valor observado del 0,0428
Estadístico de prueba, bajo H0: 𝐹!"#$%&'(! = ≈ 𝟎, 𝟐𝟑𝟓𝟐 ∈ 𝑅. 𝐶.
0,1820
4. Decisión: Se rechaza H0.
5. Conclusión: Hay evidencia para suponer que las varianzas de las
longitudes para las marcas A y B son diferentes, con una significancia del 5%.
FRANCISCO VALENZUELA ROJAS 20
Al saber que podemos suponer varianzas desconocidas y diferentes, procedemos
a aplicar la correspondiente dócima. Para este caso, el número de grados de
libertad de la distribución T serán (ver página 17):

0,0428⁄10 + 0,1820⁄15 "


𝑔. 𝑙. = 𝜈 = = 21,46434. . . = 21
0,0428⁄10 " ⁄9 + 0,1820⁄15 " ⁄14

Note que si hubiésemos supuesto varianzas iguales, v = 10 + 15 – 2 = 23 g.l.

𝐻 : 𝜇 − 𝜇Z ≥ 0 ≡ 𝜇Y ≥ 𝜇Z ;𝛼 = 0,05
1. Planteamiento de hipótesis: ! & Y
𝐻! : 𝜇Y − 𝜇Z < 0 ≡ 𝜇Y < 𝜇Z

2. Región Crítica:

𝑅𝐶 = 𝑇/𝑇 < −𝑡/,PQ;"0 = −1,7207 0,95


𝑡(21)
3.Valor del Estadístico de −1,7207
prueba bajo H0: 4. Decisión: Se rechaza H0
5. Conclusión: Hay evidencia para pensar
34,33 − 34,87 − 0 que los lápices de la marca B duran más
𝑇= = −4,215 ∈ 𝑅. 𝐶. en promedio, que los de la marca A, α=0,05
0,0428⁄10 + 0,1820⁄15
FRANCISCO VALENZUELA ROJAS 21
MUESTRAS PAREADAS
Supuestos: (X1, Y1),(X2,Y2),…,(Xn,,Yn), n pares., donde 𝐸 𝑋U = 𝜇U 𝐸 𝑌U = 𝜇U + 𝜇V
( $
∑(FG* 𝐷F − 𝐷
𝐷a = 𝑌a − 𝑋a ~𝑁 𝜇b , 𝜎b; 𝐷 = ^ 𝐷F ]𝑛 𝑆H =
𝑛−1
D -d 0
FG*

Estadístico de prueba bajo H0: T = ~ t(n-1) 𝛿+ = diferencia de medias, bajo H+


SD n
Hipótesis Hipótesis Hipótesis
H0: µD=δ0 H0: µD≥δ0 H0: µD≤δ0
H1: µD≠δ0 H1: µD<δ0 H1: µD>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡/02⁄);80/ 𝑅𝐶 = 𝑇/𝑇 < −𝑡/02;80/ 𝑅𝐶 = 𝑇/𝑇 > 𝑡/02;80/

S
En los tres casos, se rechaza H0 si 𝑇#$%&'()*# = T-H! ϵ 𝑅. 𝐶.
I ⁄ K
c

FRANCISCO VALENZUELA ROJAS 22


Ejemplo 8: Los siguientes datos fueron recabados en un experimento diseñado
para verificar si existe una diferencia sistemática en los pesos obtenidos con dos
balanzas diferentes:
Muestra Peso (en gramos)
Balanza 1 Balanza II
1 11,23 11,27
2 14,36 14,41
3 8,33 8,35
4 10,50 10,52
5 23,42 23,41
6 9,15 9,17
7 13,47 13,52
8 6,47 6,46
9 12,40 12,45
10 19,38 19,35

Con un nivel de significancia α=0,05, pruebe si la diferencia de las medias en los


pesos obtenidos con las dos balanzas es significativa.
FRANCISCO VALENZUELA ROJAS 23
Solución: Si X = pesos balanza 1 (gramos), Y = pesos balanza 2 (gramos)
Note que los valores de X e y están emparejados, por lo cual trataremos este
caso como muestras pareadas. Calculando los valores necesarios:
/*

𝐷 = h 𝐷U g10 = 0,02 α=0,05


Muestra Peso en gramos Di UW/

Balanza Balanza (Yi - Xi) $


∑*+
FG* 𝐷F − 𝐷
1 II 𝑆H = ≈ 0,0287
9

1 11,23 11,27 1. Planteamiento de hipótesis:


0,04
𝐻+ : 𝜇H = 0
2 14,36 14,41 0,05 𝐻* : 𝜇H ≠ 0

3 8,33 8,35 0,02 2. Región Crítica:


𝑅𝐶 = 𝑇/ 𝑇 > 𝑡+,BIJ;B = 2,262
4 10,50 10,52 0,02
5 23,42 23,41 3. Valor observado del
-0,01 Estadístico de prueba, bajo H0:
6 9,15 9,17 0,02 0,02 − 0
𝑇!"#$%&'(! = ≈ 2,2037 ∉ 𝑅. 𝐶.
7 13,47 13,52 0,0287⁄ 10
0,05
8 6,47 6,46 -0,01 4. Decisión: No se rechaza H0.
9 12,40 12,45 0,05 5. Conclusión: Con α=0,05, la evidencia
es insuficiente para pensar que hay
10 19,38 19,35 -0,03 diferencia significativa entre los
pesos que miden ambas balanzas.
FRANCISCO VALENZUELA ROJAS 24
VALOR P EN UN TEST DE HIPÓTESIS
Se define el valor p de una prueba de hipótesis a la menor probabilidad que se
tiene, para el cual la hipótesis nula puede ser rechazada. Es una forma ampliamente
usada, especialmente por software de análisis de datos, para reportar una dócima y
decidir si se rechaza o no la hipótesis nula.

En la práctica: 𝑉𝑎𝑙𝑜𝑟 𝑝 > 𝛼 ⇒ No se rechaza H/


𝑉𝑎𝑙𝑜𝑟 𝑝 < 𝛼 ⇒ Se rechaza H/

Ejemplo: Para la dócima anterior, 𝑇$%& ≈ 2,2037 ∉ 𝑅. 𝐶.

H0

2,2037
0,95

t(9)
−2,262 2,262

De acuerdo a esta región crítica:


𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃 𝑇 > 2,2037 = 2𝑃 𝑇 > 2,2037 ≈ 0,06 > 𝛼 = 0,05 ⇒ No se rechaza H0
(probabilidad calculada con Excel) FRANCISCO VALENZUELA ROJAS 25

También podría gustarte