Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Antes de iniciar estudiaremos lo relacionado a probar diferentes tipos de hipótesis, empezando por
definir que es una hipótesis y una prueba de hipótesis, enlistaremos los pasos para probar una
hipótesis, y realizaremos pruebas de hipótesis relativas a la media de una población y a las medias
de dos poblaciones.
Aunque se pueden establecer pruebas de hipótesis para la proporción, para la varianza de una
población o para dos poblaciones. Esto último ya se presentó en clase.
Son ejemplos de hipótesis, o afirmaciones hechas sobre un parámetro poblacional las siguientes:
Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes que no es
factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar la población
entera es tomar una muestra de la población de interés. De esta manera podemos probar una
afirmación para determinar si la evidencia soporta o no la afirmación.
Una prueba de hipótesis comienza con una afirmación o suposición acerca de un parámetro
poblacional, tal como la media poblacional. Una hipótesis podría ser que la colegiatura que pagan los
estudiantes universitarios de la República Mexicana es en promedio de 3000 pesos. Para comprobar
esta hipótesis no podríamos contactar a todos los estudiantes universitarios de la república, el costo
sería exorbitante. Para probar la validez de esta afirmación podríamos seleccionar una muestra de la
población de estudiantes y basados en ciertas reglas de decisión, aceptar o rechazar la hipótesis. Si
la media muestral fuera de 1000 pesos ciertamente tendríamos que rechazar la hipótesis, pero si la
media muestral fuera 2990 pesos ¿podríamos asumir que la media poblacional si es de 3000 pesos?,
¿podemos atribuir al error de muestreo la diferencia de 10 pesos entre las dos medias, o es una
diferencia significativa?
El primer paso es establecer la hipótesis a ser probada. Esta es llamada la hipótesis nula,
simbolizada por H0, el subíndice cero implica “cero diferencia”. Usualmente el término “no” es
encontrado en la hipótesis nula significando “no cambio”. La hipótesis nula de la introducción podría
ser “la colegiatura mensual promedio de los estudiantes universitarios no es diferente de 3000 pesos”.
Esto es lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puede simbolizar H0: µ =
3000.
La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no nos proveen de
evidencia convincente de que es falsa, es decir, si se acepta la hipótesis nula decimos que la
evidencia no es suficiente para rechazarla pero no podemos afirmar que es verdadera.
La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesis nula. Esta hipótesis,
también llamada hipótesis de investigación, se simboliza con Ha. La hipótesis alterna es aceptada si
la evidencia proporcionada por la muestra es suficiente para afirmar que la Ho es falsa.
Ho: µ = 3000
Ha: µ ≠ 3000
Aceptar Ho Rechazar Ho
Error
Decisión
Ho verdadera
correcta
Tipo I
Error
Decisión
Ho falsa
correcta
Tipo II
No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de
probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es aplicado a proyectos de investigación, el
nivel .01 a control de calidad, y .10 a sondeos políticos. Tú como investigador debes decidir el nivel
de significancia antes de colectar la muestra de datos.
Cuanto se trata de hipótesis sobre la varianza se usa la distribución Chi2 y cuando se trata de
hipótesis entre varianzas de dos poblaciones se usa la distribución F.
El área crítica cuando la hipótesis alterna tiene el símbolo ( ≠ ) se divide en dos y se dice que el
problema es de dos colas, y cada cola vale α/2. Si la Ha tiene el signo (<) el problema es de la cola
izquierda, si tiene el signo(>) es de la cola derecha, y en ambos casos la cola vale α. Este problema
es de dos colas:
Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula es rechazada o
no rechazada. Si el estadístico de prueba queda dentro de la zona crítica la hipótesis nula deberá ser
rechazada. Si el estadístico de prueba queda fuera de la zona crítica la hipótesis nula no deberá ser
rechazada.
En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuera de la zona crítica la
hipótesis nula no puede ser rechazada. La conclusión podría ser la siguiente:
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes
universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
Sin embargo en la clase se presentó otra forma de tomar la conclusión usando el valor p o p value.
En este ejemplo se trata de una hipótesis bilateral y el valor de referencia es alfa = 0.05. A partir del
resultado del estadístico de prueba t = -0.097 (menos cero punto noventa y siete) se obtiene en R el
p value correspondiente con la instrucción pt(-0.097,19) de donde resulta un p value de 0.4618711
(observe que esta es un area bajo la curva hacia la derecha)
Dado que le valor p es mayor que el valor de referencia, entonces se dice que no existe evidencia
para rechazar la Hipótesis nula. Es decir que
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes
universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
El siguiente ejemplo nos muestra el procedimiento de prueba de hipótesis relativas a la media de dos
poblaciones.
Ejemplo
Se realizó un estudio con un nivel de significancia de .05 para investigar si el número de u.e.a´s que
se dan de baja en la quinta semana es diferente entre los estudiantes de ingeniería de la UAM
iztapalapa y los estudiantes de ingeniería de la UAM Azcapotzalco. Se obtuvieron dos muestras
representativas de 40 estudiantes. La muestra 1 (UAM I) tuvo un puntaje medio de 3.5 (es decir dan
de baja en promedio 3.5 u.e.a´s) con una desviación estándar de 2, mientras que la muestra 2 (UAM
A) tuvo una media de 3 con una desviación de 2.2.
Ho: µ1 ≤ µ2
Ho: « El número de u.e.aás que dan de baja no es mayor en la UAM I que en la UAM A »
Ha: µ1 > µ2
Ha: « El número de u.e.a´s que dan de baja en la UAM I es mayor que en la UAM A ».
Como en este problema, la hipótesis alternativa o alterna contiene el signo (>) el problema es de una
cola, es decir, la región crítica se ubica en el extremo derecho de la curva. Para determinar que tipo
de distribución se utilizará primero deberiamos estudiar si la muestra es pequeña o grande, vamos a
suponer que 30 es el limite:
El valor .05 no está en la tabla, pero debería encontrarse entre estas dos cantidades
Z 4 ? 5
1.6 .05050 .05 .04947
Z1 Z Z2
Z 4 ? 5
1.6 .05050 .05 .04947
Α1 A Α2
(A1 - A) (.05050-.05)
Z= Z1 + ( Z2 – Z1) = 1.64 + (1.65 -1.64) = 1.6448
(A1 – A2) (.05050-.04947)
Pero usted tiene suerte pues con R puede obtener el valor exacto con la instrucción qnorm(0.05,
lower.tail = F) ide donde resulta1.644854
En este ejemplo vamos a suponer que las varianzas de las dos poblaciones son iguales (aunque en
el examen usted deberá probar si esta hipótesis es plausible o valida).
El estadístico de prueba queda localizado fuera de la zona crítica, entonces no podemos rechazar la
hipótesis nula ( Ho), de tal suerte que se concluye lo siguiente:
No hay evidencia suficiente, con un nivel de significancia de .05, de que la prensa popular
tenga una mayor orientación al tema sexual que la prensa de clase media
Ejemplo:
Supongamos que queremos probar la hipótesis de que la probabilidad de obtener un as al
arrojar un dado, es de 1/6 , y con tal fin arrojamos un dado 600 veces .
Si se obtienen 600 ases, este resultado es improbable bajo la hipótesis supuesta, lo cual nos lleva
a rechazarla pues la evidencia indica que ella es falsa.
Si se obtienen 100 ases, este resultado no sería improbable bajo la hipótesis supuesta, y sin duda
la hipótesis no será rechazada, por falta de evidencia.
Obteniendo resultados como éstos, la intuición y el sentido común son suficientes para tomar una
decisión. Sin embargo, en la práctica los experimentos no conducen a conclusiones tan obvias, de
donde surge la necesidad de un método para probar la hipótesis, y esto implica establecer reglas
de decisión.
El hecho de rechazar una hipótesis no significa que ésta sea falsa, como tampoco el no rechazarla
significa que sea verdadera. La decisión tomada no está libre de error. Se pueden cometer dos
tipos de error que los denominaremos error de tipo I y error de tipo II, y que consisten en:
Error I :Rechazar una hipótesis que es verdadera .
Error II : No rechazar una hipótesis que es falsa .
La forma de medir estos errores es mediante la probabilidad. Es deseable que estas dos
probabilidades de error sean pequeñas. Una forma cómoda de especificar lo que se requiere de
un procedimiento de prueba es concentrar la atención en dos conjuntos posibles de valores del
parámetro, es decir, en dos hipótesis estadísticas, a las cuales llamaremos hipótesis nula
designada por H0 e hipótesis alternativa designada por H1 .
La prueba de hipótesis es un procedimiento de toma de decisiones, relacionada
principalmente con la elección de una acción entre dos posibles. Por lo tanto, cada hipótesis (nula
y alternativa) la asociaremos con una de las acciones. Esta designación, en principio, es arbitraria,
pero típicamente la hipótesis nula corresponde a la ausencia de una modificación en la variable de
la población investigada, pudiendo considerar que nulifica el efecto de un tratamiento , y por lo
tanto se especifica de una forma exacta : H0 : θ = θ 0 ; en tanto que la hipótesis alternativa
generalmente indica una variación de valores que prevalecería si la variable de la población sufre
alguna modificación, pudiendo pensar que el tratamiento fue efectivo , por lo cual esta hipótesis
(alternativa) se especifica de manera más general :
H1: θ ≠ θ 0 ó H1 : θ > θ 0 ó H1 : θ < θ 0.
Observemos que en general la hipótesis alternativa es compuesta. Raramente la hipótesis
alternativa es una hipótesis simple, como por ejemplo: H1: θ = θ 1, sino que, normalmente ésta
es el complemento de la hipótesis nula.
La práctica de probar la hipótesis nula contra una alternativa, sobre la base de la información de
la muestra, conduce a dos tipos posibles de error, debido a fluctuaciones al azar en el muestreo.
Es posible que la hipótesis nula sea verdadera pero rechazada debido a que los datos obtenidos en
la muestra sean incompatibles con ella; como también puede ocurrir que la hipótesis nula sea
falsa pero no se la rechace debido a que la muestra obtenida no fuese incompatible con ella.
Consideremos el caso de una hipótesis nula simple contra una hipótesis alternativa también
simple.
H0 : θ = θ 0 ; H1 : θ = θ 1
α=P (eI ) =P (θ>c /θ=θo ) =P ( rech .H o / H o es verd
adera
β=P (eII )= P (θ < c /θ = θ1) =P(n
o rech .H o / H o es fa
lso
d
ond
e f o (θ
) y f 1 (θ ) so
n la
s fu
ncio
nes d
e d
ensid
ad d
e la
o θ=θ1 r
esp
ectiva m
ente .
Caso I
H o :µ = µo
H 1 :µ > µo
c
pa ra µ 1 > µ o : β = P ( µ ∈ A / µ = µ 1) = P( µ < c / µ = µ 1 ) = ∫ f1 ( µ / µ 1 ).dµ
−∞
Caso II
Ho : µ = µ o
H1: µ < µ o
∞
p a ra µ 1 < µ o : β = P( µ ∈ A / µ = µ 1 ) = P ( µ > c / µ = µ 1 ) = ∫ f1 ( µ / µ 1 ).dµ
c
Caso III
Ho : µ = µ o
H1: µ ≠ µ o
c2
p a r a µ1 ≠ µ o : β = P( µ ∈ A / µ = µ 1 ) = P(c1 < µ < c2 / µ = µ 1) = ∫ f1( µ / µ 1).dµ
c1
Observaciones:
Sólo se toma en cuenta el error de tipo I. Por lo tanto, el test es significativo si se rechaza la
hipótesis nula, pues en este caso se conoce la probabilidad de haber cometido un error. En
función de esto, se deberá decidir cuál de las hipótesis debe ser la nula y cuál la alternativa,
como también cuál debe ser el nivel de significación.
Prueba de hipótesis de la media en poblaciones normales
Sea ( X1 , X2 , ... , Xn ) una muestra aleatoria extraída de una población normal, luego, ∀ i =
1 .. n :
Xi ~ N( µ , σ ) .
Por lo tanto tenemos que: X1, X2, ... , Xn iid N( µ , σ ).
1 σ X−µ
X= ∑ X i ~ N ( µ, ) , ∴ ~ N (0 , 1)
n n σ
n
H0 : µ = µ 0 vs H1 : µ ≠ µ 0
X − µ0
Si la hipótesis nula H0 es verdadera, entonces µ =µ y por lo tanto ~ N (0 , 1)
0
σ
n
Como la prueba es bilateral, se rechazará la hipótesis nula tanto cuando se tenga evidencia de
que la media poblacional sea mayor que el valor postulado o bien cuando se tenga evidencia de
que sea menor que el valor postulado. Luego, se calculan dos valores críticos (z1 y z2) para la
variable pivotal o estadístico de prueba, que son los valores de la distribución Normal que dejan
una probabilidad de α/2 por debajo y por encima respectivamente: z1 es tal que Φ (z1) = α/2
y z2 es tal que Φ (z2) = 1 - α/2
X ∑ Xi
De donde se deduce que la proporción muestral h= =
n n
también tiene una distribución aproximadamente normal :
h−p
1 pq ~ N( 0 , 1 )
h = ∑ X i ~ N p, , ∴ pq
n n
n
H0 : p = p0 vs H1 : p ≠ p0
h − p0
~ N( 0 , 1 )
Si la hipótesis nula H0 es verdadera, entonces p = p0 y por lo tanto p 0 (1 − p 0)
n
Como la prueba es bilateral, se rechazará la hipótesis nula tanto cuando se tenga evidencia de
que la proporción poblacional sea mayor que el valor postulado o bien cuando se tenga evidencia
de que sea menor que el valor postulado. Luego, se calculan dos valores críticos (z1 y z2) para la
variable pivotal o estadístico de prueba, que son los valores de la distribución Normal que dejan
una probabilidad de α/2 por debajo y por encima respectivamente: z1 es tal que Φ (z1) = α/2
y z2 es tal que Φ (z2) = 1 - α/2
Sean (X1 , X2 , ... , Xn ) una muestra aleatoria extraída de una población normal, luego ∀
i=1,.,n
Xi ~ N(µ , σ ).
Por lo tanto tenemos que X1 , X2 , ... , Xn iid N(µ , σ ). de donde se deduce que:
X ~ N μ ,
σ
n que implica
−μ
X
σ
~ N 0,1
n
2
n
X i− μ
y ∑ ~ χ 2n
i =1 σ
Reemplazando en esta expresión, la media poblacional por la muestral (es decir, por su
estimador), obtenemos la distribución de la variancia muestral :
2
χ (n −
1) S ( x )
χ
n 2
X i −X 2 2
1 ⇔
∑
1
i=
σ ~ n−
σ2
~ n− 1
µ
Puede demostrarse que X y S2(x) son independientes, y por lo tanto también lo son
− 1) S (2x )
(n −
σ
X
σ n
y 2
, de distribución normal y
X −µ
σ
n
~ t n −1
(n−1) S (2x )
σ2 ( n −1)
(X − ) µσ
n
=
X − µ~ t n−
S ( x) 1
S( x )
n
σ
H0 : µ = µ 0 vs H1 : µ ≠ µ 0
Si la hipótesis nula H0 es verdadera, entonces µ =µ 0 y por lo tanto
X −0
S ( x)
µ~ t n−
1
n
Como la prueba es bilateral, se rechazará la hipótesis nula cuando se tenga evidencia de que la
media poblacional sea mayor que el valor postulado como cuando se tenga evidencia de que sea
menor que el valor postulado. Luego, se calculan dos valores críticos (tc1 y tc2) para la variable
pivotal o estadístico de prueba, que son los valores de la distribución t-Student con n-1
grados de libertad que dejan una probabilidad de α/2 por debajo y por encima respectivamente
: tc1 es tal que P(tn-1 < tc1) = α/2 y tc2 es tal que P(tn-1 > tc2) = α/2 .
Nota: Para tamaños grandes de muestra, esta distribución tiende a la distribución normal con
parámetros µ =0 y σ =1.
X −0 µ~ N (0,1) (n →
∞)
S ( x)
n