U3 Pruebas de Hipótesis y Análisis de Varianza

U3 PRUEBAS DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
Propósitos de Formación
 Estudiar el concepto hipótesis estadística.

 Conocer las pruebas para la media de una distribución normal.
 Entender el concepto del p-valor.
 Estudiar las diferencias de los distintos modelos de estudio de varianzas.
Pruebas de Hipótesis. Análisis de Varianza

Unidad 3 de la asignatura, que trata las Pruebas de Hipótesis y el Análisis de Varianza.
Video 1: https://s3-eu-west-
1.amazonaws.com/iep1738.frooze.tv/3ba672f72d1eb92a9e52e5d0499df8efUnidad3.
mp4
Prueba de Hipótesis
¿Qué es una hipótesis estadística?
Hipótesis Estadística: se trata de una afirmación o conjetura acerca de una distribución de una o
más variables aleatorias. Tipos:
 Hipótesis Simple. Si se especifica por completo la probabilidad en cuestión.
 Hipótesis Compuesta. Si no se especifica por completo la probabilidad en cuestión.
PRUEBAS DE HIPÓTESIS
Tipos de Errores:
Región Crítica: es la región de rechazo de Ho.
Nivel de Significancia: es la probabilidad de cometer el error de tipo I.

EJEMPLO
Se cree que el nivel medio de protrombina en una población normal es de 20 mg/100 ml de plasma
con una desviación típica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40
individuos en los que la media es de 18.5 mg/100 ml. ¿Se puede aceptar la hipótesis, con un nivel de
significación del 5%?
1. Enunciamos las hipótesis nula y alternativa:
H0 : μ =20 mg/100 ml
H1 : μ ≠ 20 mg/100 ml
2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: z = 1.96.
Determinamos el intervalo de confianza para la media:
(20 -1.96 . 4/√20 ; 20 + 1.96 . 4)/√20 = (18.77 ; 21.23)
3. Verificación.
Valor obtenido de la media de la muestra: 18.5.
4. Decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.
Pruebas de Hipótesis
¿Cuáles son las pruebas para la media de una distribución normal?
Al decir una o dos colas nos estamos refiriendo a las gráficas unilaterales y bilaterales,
respectivamente.
Una prueba es de una cola cuando la hipótesis alternativa H1 indica una sola dirección. Si no se
especifica dirección en la hipótesis alternativa, se acusa una prueba de dos colas.
¿Qué es el p-Valor?
Es el nivel más bajo de significancia, al cual se puede rechazar la hipótesis nula.
Usted pone a prueba 35 automóviles y descubre que las millas por galón que registran los vehículos varían de
14.4 a 28.8. Después de colocar los datos en la columna MPG, usted realiza la prueba t de Minitab (el
comando de menú Estadísticas > Estadísticas básicas > t de 1 muestra, o el comando de sesión TTEST) y
obtiene estos resultados:
Los resultados revelan que la media de la muestra de 35 vehículos es 23.657. Sin embargo, la media de millas
por galón de todos los automóviles de este tipo (μ) podría seguir siendo 25. Necesita saber si hay suficiente
evidencia en la muestra para rechazar H0. La manera más común es comparando el valor p con el nivel de
significancia (α). α es la probabilidad de rechazar H0 cuando H0 es verdadera.
Para cualquier valor de α > valor p, usted no puede rechazar H0, y para cualquier valor de α ≤ valor p,
usted rechaza H0.
En nuestro ejemplo de la prueba t, el estadístico de prueba depende de la media y el valor p es .026. Esto
indica que el 2.6% de las muestras con un tamaño de 35, extraídas de la población donde μ = 25, producirá
una media que proporciona una evidencia tan (o más) fuerte que la muestra actual de que μ no es igual a 25.
Suponemos que el valor de α es .05. El valor p de .026 indica que la media de millas por galón de todos los
automóviles de este tipo (no solo la media de los 35 vehículos incluidos en el estudio) probablemente no sea
igual a 25.
Una forma más correcta de señalar esto, en términos estadísticos, es la siguiente:
“a un nivel de significancia de 0.05, la media de millas por galón parece ser significativamente diferente
de 25”.
¿Cuáles son las distintas pruebas de hipótesis en dos poblaciones?
Se propone un ejemplo de contraste de diferencia de medias en dos muestras dependientes:

A las personas que sufren de tensión alta se les recomienda seguir una dieta libre de sal. Queremos
realizar un estudio para comprobar si esta dieta es efectivamente ventajosa. Para el estudio se toma
una muestra de 8 personas y se mide la tensión antes de empezar la dieta y dos semanas después.
Los resultados obtenidos han sido los siguientes:
 Antes 93 106 87 92 102 95 88 110
 Después 92 102 89 92 101 96 88 105
PRUEBAS DE HIPÓTESIS
Denotamos µA y µB a las medias poblacionales de tensión antes y después de empezar la dieta,
respectivamente. De este modo, el contraste de hipótesis que debemos plantear es:
H0: µA = µB
H1: µA < µB ( ≠ ; > )
Observación: en el caso que tuviéramos la creencia de que el hacer dieta supone una disminución de la
presión de 2 puntos, entonces el contraste debería plantearse de la siguiente forma.
H0: µA - µB = 2
H1: µA - µB < 2 ( ≠ ; > )
Para realizar el contraste observamos en primer lugar que las muestras de antes, XA, y después de la dieta,
XB, son dependientes, puesto que se han tomado del mismo individuo.
Para realizar este contraste consideramos la diferencia de ambas muestras: d = XA - XB. Denotaremos por µd
= µA-µB y σd a su media y desviación estándar respectivamente. Observamos pues que el contraste anterior
es equivalente al contraste:
H0: µd = 0
H1: µA < 0 ( ≠ ; > )
Supuesto: XA y XB siguen una distribución normal. Observación: d = XA-XB ∼ N(µA-µB ,σd) . El intervalo
de confianza, a nivel 1-α, para µd = µA-µB viene dado por la expresión:
donde t(n-1,α/2) es el valor que, en una t-Student con n-1 grados de libertad, deja a su derecha un área de α/2 ,
y Sd es la desviación estándar muestral de la v.a. d.
El estadístico de contraste para el test
En nuestro ejemplo µo= 0.
En el caso de la observación donde sospechábamos que la tensión bajaba dos puntos, µo= 2. Así siguiendo
nuestro ejemplo: d = −1 y = 2.390 d S.
Entonces con un 95% de confianza ∈ (−3,1) µ d . Y el estadístico de contraste es t* = -1.18. Mirando la tabla
de la t (7, 0.05) =1.895. De este modo, como t* < -1.18 no tenemos evidencias significativas que realmente
hacer dieta sea ventajoso.
Análisis de Varianza
¿Qué diferencia a los modelos de efectos aleatorios y fijos?
 De efectos fijos: es aquel en el que los tratamientos son fijados de antemano para el estudio
de interés. Aquí el interés se centra en la existencia de diferencias significativas entre
estimaciones.
 De efectos aleatorios: es aquel en el que los tratamientos son escogidos de manera aleatoria
para el estudio de interés.
Análisis de Varianza
¿Qué distintos supuestos de modelo existen para el diseño no balanceado?
Nos topamos con un diseño no balanceado cuando nos encontramos con un solo factor que contiene
distintos números de observaciones por cada nivel de factor.
El hecho de que la descomposición de la varianza por grupos, dentro y entre los tratamientos,
explique la variabilidad de las medias de los tratamientos, depende enteramente de que el modelo
asociado al diseño cumpla con unos supuestos.
SUPUESTOS DE NORMALIDAD
Un procedimiento es hacer una gráfica para verificar las definiciones de la normal con el llamado Q-Q plot. Pruebas formales
acogidas como estándar para la verificación del supuesto.
HOMOGENEIDAD DE VARIANZA: Indica que la varianza es constante en todos los errores.
SUPUESTOS DE AUTOCORRELACIÓN: Indica que los errores deben ser incorrelacionados o no

correlacionados entre sí.
Errores de Tipo I
El siguiente vídeo trata de explicar a través de un ejemplo cuáles son los errores de tipo I.
1.amazonaws.com/iep1738.frooze.tv/f3c2af3c2818940055b5b53fe2861cfd3.Errorest
ipo1.mp4

Ejercicio
Selecciona solo la opción que consideres correcta
¿Qué es un error de tipo I?
a) Cuando se acepta la Hipótesis Nula (H0) siendo H0 falsa.

b) Cuando se rechaza la Hipótesis Nula (H0) siendo H0 cierta.
¡EXCELENTE!
Esta es la respuesta correcta. Dicha definición correspondería al error de tipo I, con probabilidad
α.
Pruebas de Una y Dos Colas

El siguiente vídeo trata de explicar a través de un ejemplo las pruebas tanto para una como para dos
colas.
1.amazonaws.com/iep1738.frooze.tv/acf4bddc13412d085b5c7384a6b61c893.1Prueb
asdeunaydoscolas.mp4
Ejercicio
Selecciona solo la opción que consideres correcta
A través de la prueba de una cola, ¿qué importante dato se obtiene?
a) El intervalo de confianza.
b) El p-Valor.
¡EXCELENTE!
Esta es la respuesta correcta. El p-Valor es el nivel de significancia al cual se pude rechazar la
Hipótesis Nula (H 0 ).

U3 Pruebas de Hipótesis y Análisis de Varianza

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

U3 Pruebas de Hipótesis y Análisis de Varianza

Cargado por

Copyright:

Formatos disponibles

U3 PRUEBAS DE HIPÓTESIS Y ANÁLISIS DE VARIANZA

 Estudiar el concepto hipótesis estadística.

Pruebas de Hipótesis. Análisis de Varianza

Región Crítica: es la región de rechazo de Ho.

Nivel de Significancia: es la probabilidad de cometer el error de tipo I.

Es el nivel más bajo de significancia, al cual se puede rechazar la hipótesis nula.

Una forma más correcta de señalar esto, en términos estadísticos, es la siguiente:

Se propone un ejemplo de contraste de diferencia de medias en dos muestras dependientes:

El estadístico de contraste para el test

En nuestro ejemplo µo= 0.

SUPUESTOS DE AUTOCORRELACIÓN: Indica que los errores deben ser incorrelacionados o no

¿Qué es un error de tipo I?

a) Cuando se acepta la Hipótesis Nula (H0) siendo H0 falsa.

Pruebas de Una y Dos Colas

También podría gustarte