Está en la página 1de 20

PRUEBAS DE HIPÓTESIS

Hipótesis y pruebas de hipótesis


Definición: una hipótesis estadística es una aserción o una
conjetura acerca de un parámetro o parámetros de una población.

Ejemplo. La media de las edades de los estudiantes de primer


semestre en las universidades de Colombia es de 18 años.

Definición: una prueba de hipótesis es un procedimiento basado


en evidencia muestral y en la teoría de probabilidad que se
emplea para determinar si la hipótesis es un enunciado razonable
y no debe rechazarse, o si es irrazonable y debe ser rechazada.
Procedimiento para hacer una prueba de
hipótesis
1. Plantear la hipótesis
nula y alternativa

2. Seleccionar un nivel
Pasos de significancia

3. Identificar el
estadístico de prueba

4. Formular una regla


de decisión

5. Tomar una muestra


y llegar a una decisión
Paso 1. La hipótesis nula y la hipótesis alternativa.

Definición: Hipótesis Nula (H0). Es una afirmación o enunciado


tentativo que se realiza acerca del valor de un parámetro
poblacional. Por lo común es una afirmación en la que el
parámetro poblacional tiene un valor específico.

Definición: Hipótesis Alternativa (H1). Es una afirmación o


enunciado que se aceptará si los datos muestrales proporcionan
amplia evidencia de que la hipótesis nula no puede ser aceptada.
Paso 2. Nivel de significación

Definición: Nivel de significación. Es el riesgo que se asume al


rechazar la hipótesis nula cuando en realidad debe aceptarse por
ser verdadera. El nivel de significación se denota mediante a y
también se denomina nivel de riesgo.

Error tipo I. La probabilidad de rechazar la hipótesis nula, H0,


cuando en realidad es verdadera. Este error se denota a.

Error tipo II. La probabilidad de aceptar la hipótesis nula cuando


en realidad es falsa. Este error se denota b.
El investigador
Acepta H0 Rechaza H0
Si H0 es verdadera Decisión correcta Error Tipo I

Si H0 es falsa Error Tipo II Decisión correcta.


Paso 3. El valor estadístico de la prueba

Definición: El valor estadístico de prueba es un valor


determinado a partir de la información muestral, que se utiliza
para aceptar o rechazar la hipótesis nula. El valor estadístico de
prueba que se utilizará, por ejemplo, para las medias es el
llamado valor z dado por

𝑥̅ − 𝜇
𝑧= 𝜎
𝑛
Estadisticos de prueba (una población)
Media. Muestra grande o 𝜎 𝑥̅ − 𝜇
𝑧= 𝜎
conocida
𝑛
Media. Muestra pequeña o 𝜎 𝑥̅ − 𝜇
𝑡= 𝑠
desconocida
𝑛

Proporción. Muestra grande 𝑝̅ − 𝑝


𝑧=
𝑝(1 − 𝑝)
𝑛
/
Varianza. Muestra pequeña 𝑛 − 1 𝑠
𝑥/ =
𝜎/
Desviación. Muestra grande 𝑠−𝜎
𝑧= 𝜎
2𝑛
Estadisticos de prueba (dos poblaciones)
Dos medias. Muestras independientes, (𝑥̅1 −𝑥̅/ ) − (𝜇1 − 𝜇/ )
𝑧=
grandes 𝜎1 y 𝜎/ conocidas
𝜎1/ 𝜎//
+
𝑛1 𝑛/

Dos medias. Muestras independientes, 𝜎1 y (𝑥̅1 −𝑥̅/ ) − (𝜇1 − 𝜇/ )


𝑡=
𝜎/ desconocidas y no se supone que sean
iguales. 𝑠1/ 𝑠//
+
𝑛1 𝑛/
Grados de libertad el mínimo entre 𝑛1 − 1 y
𝑛/ − 1

Dos medias. Muestras pequeñas (𝑥̅1 −𝑥̅/ ) − (𝜇1 − 𝜇/ )


𝑡=
independientes, 𝜎1 y 𝜎/ desconocidas y se
supone que sean iguales. 𝑛1 − 1 𝑠1/ + 𝑛/ − 1 𝑠// 1 1
+
𝑛1 + 𝑛/ − 2 𝑛1 𝑛/
Grados de libertad 𝑛1 + 𝑛/ − 2
Dos proporciones (𝑝1̅ − 𝑝/̅ ) − (𝑝1 − 𝑝/ )
𝑧=
𝑝1 (1 − 𝑝1 ) 𝑝/ (1 − 𝑝/ )
+
𝑛1 𝑛/
Dos varianzas. Suponiendo 𝑠1/ ≥ 𝑠// 𝑠1/
𝐹= /
𝑠/
Paso 4. La regla de decisión.

Una regla de decisión simplemente es una afirmación de las


condiciones bajo las cuales se acepta o rechaza la hipótesis nula. El
área de rechazo define la ubicación de todos los valores que son
demasiado grandes o demasiado pequeños, por lo que la probabilidad
de que ocurran según una hipótesis nula verdadera es muy remota.

Definición: Valor crítico. Valor que separa la región de aceptación y la


región de rechazo.

La elección de las hipótesis nula y alternativa definen si la prueba es a


dos colas o a una cola, en otras palabras, si hay uno o dos valores
críticos.

Paso 5. Toma de una decisión.


Ejemplo

Las calificaciones de eficiencia de los trabajadores de una empresa, han estado


distribuidas normalmente en un periodo de muchos años. La media µ de la
distribución es 200, y la desviación estándar s vale 16. Sin embargo,
empleados jóvenes han sido contratados recientemente y se han establecido
nuevos métodos de adiestramiento y producción. Utilizando el nivel de
significancia de 0.01, se desea probar la hipótesis de que la media es aún 200.

Desarrollo

Paso 1.
La hipótesis nula es: “la media poblacional es 200”. La hipótesis alternativa es:
”La media es diferente de 200”
𝐻0: µ = 200
𝐻1: µ ¹ 200

Como la hipótesis alternativa no establece una dirección de la diferencia, esta


prueba es lo que se llama de dos colas.
Paso 2.

Como se observó, se utilizará el nivel de significación 0.01 que es


a, la probabilidad de cometer un error de Tipo I. Es decir, es la
probabilidad de rechazar una hipótesis verdadera.

Paso 3. El valor estadístico de prueba para este tipo de problema


es

𝑥̅ − 𝜇
𝑧= 𝜎
𝑛
Paso 4.
La regla de decisión se formula hallando el valor crítico de z a partir de
la tabla de la distribución normal estándar. Puesto que ésta es una
prueba de dos colas, la mitad de 0.01 está en cada extremidad. El área
de aceptación, que se localiza entre las dos colas, es, por consiguiente,
0.99. De la tabla se sabe que tal área está entre los dos valores críticos a
saber -2.58 y 2.58.

Por consiguiente, la regla de decisión es: rechazar la hipótesis nula y


aceptar la hipótesis alternativa si el valor calculado de z no queda en la
región entre -2.58 y 2.58. En caso contrario, no se rechaza la hipótesis
nula.
Paso 5.

Se toma una muestra de la población (calificaciones de


eficiencia), se calcula z, y con base en la regla de decisión, se
llega a rechazar H0 o no.

Ej. Se Analizaron las calificaciones de eficiencia de 100


empleados de producción. La media de la muestral es 203.5.

De ahí que z = 2.19, y como tal valor no cae en la región de


rechazo no se descarta H0, se acepta. Por tanto, se concluye que la
media de la población no es distinta de 200.
Ejercicios

1. La tasa anual media del resurtido de un medicamento es 6.0. La desviación


estándar es de 0.5. Se sospecha que el volumen de ventas promedio no es 6.0.
Se utilizará el nivel de significación 0.05 para demostrar esta hipótesis. Si se
selecciona una muestra de 64 frascos de este fármaco y se calcula que la tasa
media de ventas es 5.84. ¿Debe rechazarse la hipótesis nula en el nivel 0.05?

2. Un contratista ha construido un gran número de casas aproximadamente del


mismo tamaño y del mismo precio. El contratista afirma que el valor
promedio de estas casas no excede de $35,000 dólares. Un corredor de bienes
raíces selecciona aleatoria mente 5 de las casas construidas recientemente
por el contratista y averigua los precios que resultan ser:
$34,500, $37,000, $36,000, $35,000 y $35,500. ¿Contradicen estas cinco
observaciones la afirmación del contratista acerca del valor promedio de sus
casas? Use a =0.05

3. El National Safety Council (de EU) informa que 52% de los automovilistas
que usan carreteras de cuota en ese país, son varones. Una muestra de 300
autos que viajaron hacia el este en cierto día por la vía Ohio, reveló que 170
fueron conducidos por hombres. Al nivel de significanción de 0.01, ¿se puede
concluir que una proporción mayor de varones conducía auto por la Ohio, que
lo que indican las estadisticas nacionales?
1. Para probar la efectividad de un nuevo analgésico, se administró a 80
pacientes de una clínica una píldora que contenía el analgésico y a otros 80 se
les dio un placebo que sólo contenía azúcar. Si 56 de los pacientes del primer
grupo y 38 del segundo grupo sintieron un efecto benéfico, ¿Qué podemos
concluir, en el nivel de significancia de 0.01, acerca de la efectividad del
nuevo medicamento?

2. Ejercicio 2. De 2200 hombres, pasajeros de automóvil, mayores de 8 años de


edad, elegidos al azar, el 72% utiliza el cinturón de seguridad. De 2380
mujeres, pasajeras de automóvil, mayores de 8 años de edad, elegidas al azar,
el 84% utiliza el cinturón de seguridad. Utilice un nivel de significancia de
0,05 para probar la aseveración de que el porcentaje de uso del cinturón de
seguridad entre géneros difiere en 8%.

3. Un fabricante afirma que la resistencia a la tensión promedio del hilo A excede


la resistencia a la tensión promedio del hilo B, en al menos 12 kilogramos.
Para probar esta afirmación, se prueban 50 piezas de cada tipo de hilo bajo
condiciones similares. El hilo tipo A tiene una resistencia a la tensión
promedio de 86.7 kilogramos con una desviación estándar de 6.28 kilogramos;
mientras que el hilo tipo B tiene una resistencia a la tensión promedio de 77.8
kilogramos con una desviación estándar de 5.61 kilogramos. ¿Con un nivel de
confianza del 95%, puede concluirse que el fabricante tiene razón en su
afirmación?
Caso particular: prueba de hipótesis dos
desviaciones
La prueba de una hipótesis nula que consistente en afirmar que
las desviaciones estándar de dos poblaciones son iguales, 𝜎1 = 𝜎/ ,
sigue los mismos pasos para probar una hipótesis cualquiera
siempre que la tipificación este dada por

89: 8::
𝐹= 8::
o𝐹= 89:

en donde s1 y s2 son las desviaciones estándar de las muestras de


tamaño n1 y n2 de las poblaciones 1 y 2, respectivamente, y F es
el valor correspondiente a la tipificación dentro de una
distribución F.
Para la toma de decisión se tendrá en cuenta:
Ejercicios.

1. Los tiempos requeridos por el doctor L para hacer revisiones de rutina de seguro de 25
pacientes tiene una desviación estándar de 4.2, mientras que los tiempos requeridos por
el doctor M para efectuar el mismo procedimiento con 21 pacientes tiene una
desviación de 3.0 minutos. Suponiendo que estos datos constituyen muestras aleatorias
independientes, pruebe en el nivel de significancia 0.05 si los tiempos requeridos para
este procedimiento por los doctores tiene la misma variabilidad o si son más variables
en el caso del doctor L.

2. Un fabricante de baterías para automóvil afirma que la duración de sus baterías se


distribuye de forma aproximadamente normal con una desviación estándar igual a 0.9
años. Si una muestra aleatoria de 10 de tales baterías tiene una desviación estándar de
1.2 años, ¿considera que la desviación es mayor que 0.9 años? Utilice un nivel de
significancia de 0.05.

3. Se cree tradicionalmente que la variación del puntaje del ICFES en Ciencias, para
colegios privados y públicos es igual. Un estudio recogió al azar el puntaje de 61
estudiantes de colegios privados y 41 de colegios públicos, arrojando desviaciones
estándar de 10 y 5 puntos respectivamente. ¿Es esto evidencia significativa para creer,
con una significancia de 0.025, que la desviación de los puntajes de los colegios
privados es mayor que la de los colegios públicos?

También podría gustarte