Está en la página 1de 40

Pruebas de hipótesis

Ya estudiamos cómo estimar los


parámetros de una población mediante
información de las muestras. La
segunda manera de hacer inferencias a
partir de una muestra para una población,
es a través de pruebas de hipótesis
“ no diferencia”,
“proposición de
HIPOTESIS no cambio”,
NULA H0 “no efecto”, en
la población.
HIPOTESIS
Es lo que el
HIPOTESIS investigador de-
ALTERNA H1 sea que sea
verdadera, los
cambios que es-
tá observando
en la pobl.
Prueba estadistica de una hipótesis o
estadístico de prueba

Es una regla que cuando


no rechazar (acep-
los valores experimentales
tar) o rechazar la
son observados nos con-
hipótesis bajo consi-
ducen a tomar una
deración.
decisión:
La zona de rechazo, o La Región de Aceptación,
región crítica (RC),
contiene los valores para los
Son los valores del cuales no se rechaza la
estadístico para los hipótesis
cuales la información
muestral contradice la
hipótesis nula

Regla de decisión Si para la muestra particular el


estadístico de prueba cae dentro de la región
crítica, rechazaremos la hipótesis nula.
Prueba de cola inferior o Prueba de la cola supe-
prueba del lado izquierdo: rior o prueba de la cola
derecha.
H0: θ = θ0 ; H1 : θ < θ0
H0 :θ =θ0 ; H1 :θ >θ0

Prueba de dos colas o bilaterales.

H0 : θ = θ0 ; H1 : θ ≠ θ0
Ejemplo 16.- Se está estudiando un nuevo
fármaco para utilizarlo en el tratamiento del
cáncer a la piel. Se espera que sea eficaz en
la mayoría de los pacientes sobre los que se
aplica. La empresa farmacéutica quiere
verificar mediante una prueba estadística tal
afirmación. Sea p la proporción de pacientes
para los cuales el fármaco será efectivo. De
modo que las dos hipótesis en juego son
H o
: p ≤ 0 .5
H 1 : p > 0 .5
Una vez que se ha seleccionado una muestra,
y se han recogido los datos, debe tomarse una
decisión. Esta será rechazar Ho o no
rechazarla. La decisión se toma observando el
valor del estadístico cuya distribución de
probabilidades, bajo el supuesto que H0 sea
verdadera, se conozca. A tal estadístico se le
denomina test estadístico o estadístico de
prueba. Esto significa que al final de cualquier
estudio de pruebas de hipótesis nos veremos
forzosamente en una de las siguientes
situaciones:
Decisión Ho H1 verdadera
verdadera
Aceptar Ho Decisión Error tipo II
correcta

Aceptar H1 Error tipo I Decisión


correcta
Ejemplo 17.- En USA en promedio un 8% del
contenido de las basuras caseras era metal.
Debido al incremento de los procesos de
reciclaje se espera que esta cifra se haya
reducido. Se realiza un experimento para
verificar esta suposición.
Construir la hipótesis nula y la alternativa
apropiada para el experimento. Obsérvese que
el parámetro de interés es µ, la cantidad media
de desperdicios caseros.
Explicar en términos prácticos que ocurre si se
comete error tipo I.
Explicar en términos prácticos que ocurre si se
comete error tipo II.
El nivel de significación β = P[error tipo II] =
α = P[error tipo I] = =P[aceptar H0 | H0 es falsa]
=P[rechazar H0 | H0 es verd.]= =P[rechazar H1 | H1 es verd.]

= P[aceptar H1 | H1 es falsa]

La potencia de una prueba de hipótesis es


π(θ) = 1 - β
Elección de la prueba.
El estadístico de prueba es algún estadístico que se
puede calcular a partir de los datos de la muestra.
Existen muchos valores posibles del estadístico de
prueba y depende de la muestra extraída.
El estadístico de prueba sirve para tomar
decisiones, ya que la decisión de rechazar o no la
hipótesis nula depende de la magnitud del
estadístico de prueba.
Al igual que para los intervalos de confianza la
clave para la inferencia estadística es la
distribución muestral del estadístico de interés.
Recordemos que
α = P[error tipo I] = P[rechazar H0 | H0 es verd.]

El valor-p de un estadístico es la prob.


de que el estadístico asuma un valor tan
extremo o más extremo que el que
observamos cuando suponemos que el
valor de la hipótesis nula es correcto
Los datos se dicen que son
estadísticamente significativos si se
rechaza la hip. nula a favor de la alterna.
Si el valor-p es ≤ α se rechaza H0 y
los datos son estadísticamente
significativos
Si el valor-p es > α se acepta H0 y los
datos no son estadísticamente
significativos
El valor-p nos da la probab. que el
estadístico de prueba T(X), tome valores
tanto o más alejados que su valor
observado T(x), en la dirección de la
hipótesis alternativa H1, dado que la
hipótesis nula es verdadera.
Hipótesis nula y alternativa Valor-p (probabilidad de significación)

H0: θ ≥ θ0 Ha: θ < θ0 Valor-p = P(T(X) ≤ T(x)/ θ = θ0)

H0: θ ≤ θ0 Ha: θ > θ0 Valor-p = P(T(X) ≥T(x)/ θ = θ0)

H0: θ = θ0 Ha: θ ≠ θ0 Valor-p = 2P(T(X) ≤ T(x) si T(x) < θ0 )

Valor-p = 2P(T(X) ≥ T(x) si T(x) > θ0)


Valor-p Conclusión

valor-p < 0.01 Existe evidencia muy fuerte


contra H0

0.01 < valor-p < 0.05 Existe evidencia fuerte


contra H0

0.05 < valor-p < 0.1 Existe evidencia débil


contra H0
valor-p > 0.1 No existe evidencia
contra H0
En resumen, los pasos para la prueba de
hipótesis, relativa al parámetro θ de una
población puede resumirse como sigue:
a) Formular la hipótesis nula y alternativa de
acuerdo al problema.
H0 : θ = θ0
H1 : cualquiera de las alternativa, θ < θ0, θ >θ0
ó θ ≠ θ0
b) Escoger un nivel de significación o riesgo
α.
c)Escoger el estadístico de prueba apropiado,
cuya distribución por muestreo sea conocida
en el supuesto de que H0 es cierta.
d)Establecer la región crítica. Es decir,
determinar el valor (o valores) crítico.
e)Calcular los valores de la prueba estadística
de una muestra aleatoria de tamaño n
f) Conclusión : rechazar H0 si la estadística
tiene un valor en la región crítica y no
rechazar (aceptar), en otro caso
PRUEBAS DE HIPOTESIS PARA
LA MEDIA

Varianza conocida Varianza desconocida

Pobl.Normal M. grandes Pobl. Normal

X − µ X − µ
Z = 0 T = 0
c
σ c
S
n n
Varianza conocida
Hip. Alternativa Estadístico Región
de Prueba Crítica

µ < µ0 Zc < - z1-α


x − µ0
Zc =
µ > µ0 σ Z c > z1−α
n Zc < −z1−α / 2 o
µ ≠ µ0
Zc > z1−α / 2
Varianzas desconocidas. P. Normales
Hip. Alternativa Estadístico Región
de Prueba Crítica

Tc < - t1-α, n - 1
µ < µ0
x − µ0
Tc = Tc > t1−α , n−1
µ > µ0 S
n
Tc < −t1−α / 2, n−1 o
µ ≠ µ0
Tc > t1−α / 2, n−1
Prueba de hipótesis para la varianza
poblacional
Hip. Alternativa Estadístico Región
de Prueba Crítica

σ 2
< σ 2 Xc < χα, n - 1
0

(n −1)S 2
σ 2
> σ 2
0 Xc = X c > χ 12−α
σ 02
X c < χα / 2 o
σ 2
≠ σ 2
0
X c > χ 12−α / 2
Ejemplo 21.- Se ha tomado un examen durante
varios años con µ = 70 y σ2 = 9. Una escuela
que utiliza por primera vez este examen lo toma
a 25 alumnos, que obtuvieron y una
varianza s2 = 12 (Suponga que los puntajes se
x =71
distribuyen normal)
•¿Hay razón para creer que las calificaciones
de todos los estudiantes de escuela tuvieron
una varianza de 9 con un nivel de significación
del 10%?.
•Se cree que el puntaje promedio de esta
escuela es superior a 70 ¿Corroboran los datos
esta creencia?
Pruebas relativas a proporciones

Hipótesis Estadístico de prueba Región de rechazo


alternativa

p < p0
Zc < - z1-α
pˆ − p 0
Zc =
p > p0 p0q0 Z c > z1−α
n
p ≠ p0 Zc <−z1−α/2 o Zc >z1−α/2
Pruebas de hipótesis para la diferencia
entre dos proporciones
En este caso la hipótesis nula toma la forma
H0:p1 = p2 = p
Hipótesis Estadístico de Región de
alternativa prueba rechazo

p < p0 pˆ1 − pˆ 2 Z c < − z1−α


Zc =
p > p0 1 1 Z c > z1−α
pq + 
p ≠ p0  n1 n2  Z <−z o Zc > z1−α/ 2
c 1−α/ 2
Ejemplo 23.- Un investigador selecciona
muestras aleatorias de 120 psicólogos y 80
psiquiatras para investigar sus opiniones
acerca de si la esquizofrenia es causada por
anormalidad bioquímica o una inadaptación
originado en la niñez. La tabla que sigue son
los resultados de esta investigación.
Psicólogos Psiquiatras
Anormalidad bioquímica 60 50

Inadaptación de la niñez 60 30

Total 120 80
Si usted está dispuesto a rechazar una
hipótesis verdadera no más de una vez en 100,
¿rechazaría la hipótesis que las opiniones de
psicólogos y psiquiatras acerca de las causas
de la esquizofrenia son las mismas?
Pruebas de hipótesis sobre la diferencia
entre medias
Desviaciones estándar σX y σY conocidas,
Poblaciones normales y/o Muestras Grandes.
Hipótesis Estadístico de Región de
alterna prueba rechazo

µ X < µY Zc < − z1−α


X −Y −(µX −µY)
µ X > µY Zc = Z c > z1−α
σX2 σY2
+
µ X ≠ µY n m Zc <−z1−α/2 o Zc >z1−α/2

Estadístico de prueba Región de rechazo


Ejemplo 24.- Dos grupos de 50 niños de una
escuela elemental, han sido enseñados a leer
por dos métodos diferentes. Una vez terminada
la instrucción, una prueba de lectura da los
siguientes resultados:
x = 73.4, y = 70.2 sX = 9 sY = 10
Probar la hipótesis que las medias son iguales
Ejemplo 25.- Los siguientes datos dan el
aumento de peso de 20 conejos de los cuales
la mitad recibió su proteína de maní crudo y la
otra mitad de maní tostado. Probar si el tostado
de maní ha tenido un menor efecto en el
aumento del peso de los conejos. Los
aumentos de peso están registrados en
gramos. Use α = 0.05
Crudo 61 60 56 63 56 63 59 56 44 61
Tosta 55 54 47 59 51 61 57 54 62 58
do
Prueba de hipótesis sobre la diferencia de
medias: varianzas desconocidas pero
iguales.
Hipótesis Estadístico de prueba Región de rechazo
alternativa

µ X < µY X − X −(µ −µ ) Tc < - t1-α


T= 1 2 1 2
µ X > µY Sc +
1 1 T c > t1−α
n1 n2
µX ≠ µY Tc <−t1−α/ 2 o Tc >t1−α/ 2
Ejemplo 26.- En un estudio de características
corporales de las gaviotas de pico anillado, la
variable considerada es la longitud del pico. Se
dispone de la siguiente datos:
Hembras Machos

n 51 41

x 59.1 mm 65.2 mm

s 1.9 mm 2.0 mm

No se han detectado diferencias en la


varianzas poblacionales. ¿Hay razón para
sostener el argumento que la longitud media
del pico de los machos es mayor que en las
hembras?
Prueba de diferencia pareada

Muestra Diferencia

Observación 1 2 Di

1 X11 X21 D1 = X11- X21

2 X12 X22 D2 = X12 – X22

i X1i X2i Di = X1i – X2i

n X1n X2n Dn = X1n – X2n


Hipótesis Estadístico de Región de rechazo
alternativa prueba

Zc < - z1-α
µ X < µY
D
Zc =
µ X > µY SD n Z c
> z 1−α

µX ≠ µY Z c < − z1−α / 2 o Z c > z1−α / 2


Ejemplo 27.- Para comparar la efectividad de
un programa de seguridad en el trabajo, se
observó en 6 distintas plantas el número de
accidentes por mes antes y después del
programa. Los datos aparecen en la tabla
siguiente. ¿Proporcionan estos datos evidencia
suficiente para indicar que el programa ha sido
efectivo al reducir el número de accidentes
laborales por mes?. Haga la prueba al α = 0.1
de nivel de significación.
PLANTA NUMERO

1 2 3 4 5 6
Antes del 38 64 42 70 58 30
programa
Después del 31 58 43 65 52 29
programa
Prueba de hipótesis de cocientes de las
varianzas de dos poblaciones
Hipótesis Estadístico de Región de rechazo
alternativa prueba

σ X2 < σ Y2
2
Fc < Fα , n −1, n −1
1 2
S
Fc = X
2
σ X2 > σY2 , S Y Fc > F1−α , n −1, n −1
2 1

σ X2 ≠ σY2 Fc <Fα/2,n −1,n−1 Fc >F1−α/2,n −1,n−1


2 1 2 1
var ianza muestral mayor
F= ~ Fω , υ
var ianza muestral menor

Donde ϖ son los grados de libertad de la


muestra con varianza muestral mayor -1 y ν
son los grados de libertad de la muestra con
varianza muestral menor –1.
Ejemplo 28.- Se ha puesto un examen durante
varios años con µ = 70 y σ2 = 9. Una escuela
que utiliza por primera vez este examen lo
puso para 25 alumnos, que obtuvieron y una
varianza s2 = 12 ¿hay razón para creer que las
calificaciones de todos los estudiantes de
escuela tuvieron una misma varianza con un
nivel de significación del 10%.

También podría gustarte