Está en la página 1de 23

PRUEBAS DE HIPÓTESIS

Una hipótesis estadística es una suposición acerca de


o los valores que pueden tener o bien tomar un o
varios parámetros acerca de la forma de una
distribución de una población en estudio. Es decir,
siempre que efectuamos una investigación, debemos
formular una hipótesis la cual procederá a
comprobar con base en las observaciones tomadas.

Los datos obtenidos de una muestra, debido a su


inherente variabilidad provocan que los juicios que
se realicen acerca de la población estén gobernados
por ciertos riesgos y errores que son necesarios
acotar.

1
¿Qué es una hipótesis?

 Una creencia sobre la población, principalmente sus


parámetros:
 Media.

 Varianza o Desviación Estándar.

 Proporción/Tasa.

 OJO: Si queremos contrastarla, debe establecerse antes


del análisis.

2
PRUEBAS DE HIPÓTESIS

Siempre que se planifica un experimento a partir de


ciertas suposiciones, debemos formular el juego de
hipótesis estadísticas:

H0 : Hipótesis Nula  Hipótesis conservadora o tradicional.

H1 Hipótesis Alternativa  Hipótesis innovadora, la cual deriva de


la investigación.

Cualquiera sea la hipótesis aceptar o rechazar vía la


investigación, se pueden cometer dos errores:

Error Tipo I: Rechazar Ho/Ho verdadera = 

Error Tipo II: Aceptar Ho/Ho falsa = 


3
Algunos ejemplos
Ejemplo 1: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 2: Parece que hay una incidencia de enfermedad más alta de lo normal

No especulativa
 H0: Hipótesis nula

-El nuevo tratamiento no tiene efecto


-No hay nada que destacar

 H1: Hipótesis alternativa


-El nuevo tratamiento es útil Especulativa
-Hay una situación anormal

4
Hipótesis Hipótesis
verdadera falsa

Se acepta correcto Error tipo II


=0.05 ó 0.01
significancia

Error tipo I correcto


Se rechaza

= 0.8 ó más
poder de prueba

5
PRUEBAS DE HIPÓTESIS
Principales supuestos en las pruebas de
hipótesis.

1. Normalidad de la variable
2. Conocimiento de la varianza
3. Colas de la hipótesis
4. Región crítica y nivel de significación

6
1. Normalidad de la variable
 Significa suponer que la muestra se ha tomado desde una
población con distribución normal.

2. Conocimiento de la varianza
 La muestra es pequeña y s2 es sólo un estimador de s2.
 La muestra es lo suficientemente grande para considerar que
se conoce s2 (o bien se conoce por antecedentes previos)

3. Colas de la hipótesis
 Significa definirla priori desde la hipótesis.
 Por ejemplo, no es lo mismo la idea: “la estatura de los
hombres es diferente de la estatura de las mujeres” que la
idea “la estatura de los hombres es mayor que la de las
mujeres” (dos y una cola, respectivamente).
7
Ejemplos: Colas de la hipótesis
 La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: m40

Unilateral Unilateral

H1: m<40 H1: m>40


8
4. Región crítica y nivel de significación.
Región crítica Nivel de significación: 
 Valores ‘improbables’ si...  Número pequeño: 1% , 5%

 Es conocida antes de realizar el  Fijado de antemano por el


experimento: resultados investigador
experimentales que refutarían H0  Es la probabilidad de
rechazar H0 cuando es cierta

=0,05
Reg. Crit. Reg. Crit.
=0,025 =0,025

No rechazo H0

-1,96 +1,96
H0: m=40 9
PRUEBAS DE HIPÓTESIS

Esquema ordenado para hacer pruebas de


hipótesis.
1. Establecer las hipótesis Nula y Alternativa.
2. Cuidar que se cumplan los supuestos. Ellos
comprenden:
• Distribución que se supone representa la
situación,
• Selección al azar de la muestra en estudio.
3. Determinar las regiones críticas, para los niveles
de significación establecidos
4. Calcular el estadístico de prueba utilizando los
datos de la muestra.
5. Decisión y Conclusión.

10
PRUEBAS DE HIPÓTESIS

Prueba de la media de la muestra con varianza conocida


Esta situación se conoce la varianza poblacional, por lo tanto la
distribución acompañante es la Normal, para el estadístico de prueba:

x-m x-m
Zc  
sx s
n
.
Región crítica y decisión:

a) Ho: Parámetro = x Rechazar Ho si Zc Z1-


H1: Parámetro  x
b) Ho: Parámetro =x Rechazar Ho si Zc  - Z
H1: Parámetro<x

c) Ho: Parámetro = x Rechazar Ho si Zc  -Z/2 o Zc  Z1-/2


H1: Parámetro  x
11
PRUEBAS DE HIPÓTESIS

El peso en kilos de una muestra aleatoria de bebés de seis meses


siguen una distribución normal con una desviación de 500 gramos.
Según se ha establecido, en promedio un bebé de esta edad debe
pesar alrededor de 6.363 gramos. Un pediatra sin embargo considera
que ahora los bebés han variado su peso y para ello ha considerado
el peso de 100 bebés
. de esta edad obteniendo un peso medio de
6.500 gramos. Con un nivel de significación del 5%, pruebe si el
pediatra tiene razón en lo planteado.

12
Estimación por intervalos
Estimación por intervalo para la media. Varianza Conocida s2

Si se tiene un estimación puntual de la media de una


población, podemos aumentar la utilidad de
x esta
estimación puntual calculando un intervalo dentro del cual
se encuentra el valor del parámetro, con niveles de
probabilidad.

 s   s 
m  x - Z    m  x + Z  
2
n 2
n

El valor Z se llama coeficiente de confianza el cual


2
dependen del porcentaje de veces que esperamos que el
valor verdadero de la media poblacional de encuentre
dentro del intervalo calculado.
13
PRUEBAS DE HIPÓTESIS

Prueba de la media de la muestra con varianza desconocida.


Si no se conoce la varianza la distribución acompañantes es la t-
Student y el estadístico de prueba es:

x-m x-m
tc  
sx s
n
con  grados de libertad, según el tamaño de la muestra. En este caso
se obtiene el valor =. n-1
Región crítica y decisión:

a) Ho: Parámetro = x Rechazar Ho si tc tn-1,1-


H1: Parámetro  x
b) Ho: Parámetro =x Rechazar Ho si tc  - tn-1;
H1: Parámetro < x
c) Ho: Parámetro = x Rechazar Ho si tc tn-1;1-/2 o tc  - tn-1;/2
H1: Parámetro  x 14
PRUEBAS DE HIPÓTESIS

Ejemplo:

Una muestra aleatoria de 8 cigarrillos de una marca


determinada tiene un contenido promedio de nicotina de 2.6
miligramos y una desviación estándar de 0.9 miligramos.
¿Existe suficiente evidencia estadística para decir que el
contenido promedio
.
real de nicotina de esta marca de
cigarros en particular es de 2.4 miligramos? Utilice nivel de
significación del 5% para probar la hipótesis.

15
Estimación por intervalos
Estimación por intervalo para la media. Varianza
Desconocida, (s2=?)

Como sucede en muchas situaciones prácticas, no se


conoce la varianza poblacional. Sin embargo, esta se
estima a partir de los datos de la muestra. Entoces el
Intervalo de Confianza para la media poblacional será
acompañado con la Distribución t-Student, así:

 s   s 
m  x - t    m  x + t  
2
; n -1
 n 2
; n -1
 n

t
El valor n -1; 2 se llama coeficiente de confianza el cual
se obtiene desde la t-Student con  grados de libertad,
según el tamaño de la muestra. En este caso se obtiene
el valor = n-1
16
PRUEBAS DE HIPÓTESIS

Prueba de Hipótesis para la media de dos muestras, con


varianza conocida.

En muchos experimentos surgen dos series de datos sobre los


cuales se desea probar si provienen de la misma o diferentes
poblaciones. En este caso, se debe contestar: ¿Las medias de
las dos poblaciones deben considerarse las mismas o no?. Si se
.
conoce la desviación estándar de las dos poblaciones; de la que
se tomaron las muestras, y si además estás desviaciones
estándar son similares. La distribución en este caso se referirá,
no a los individuos sino a las diferencias entre las medias de
todos los pares de muestras posibles, de tamaño n. Si se
supone que la distribución de estas diferencias es Normal,
podemos hacer una hipótesis basada en la curva Normal.
17
PRUEBAS DE HIPÓTESIS
Prueba de Hipótesis para la media de dos muestras,
con varianza conocida.

El estadístico de prueba es:

x1 - x2 x1 - x2 x1 - x2
Zc   
1 1 sx s 12 + s 22
s + 1 - x2

n1 n2 n1 n2

.
La distribución acompañante es la Normal, para las hipótesis:

Región crítica y decisión:


a) Ho: µ1=µ2 Rechazar Ho si Zc Z1-
H1: µ1>µ2
b) Ho: µ1=µ2 Rechazar Ho si Zc  -Z
H1: µ1<µ2
c) Ho: µ1=µ2 Rechazar Ho si Zc ≤-Z/2 o Zc ≥ Z1-/2
H1: µ1≠µ2
18
PRUEBAS DE HIPÓTESIS

Ejemplo:

Un experimento de física requiere que se hagan


mediciones durante dos días. El equipo de medición está
sujeto a cambios y por ello comprobamos el instrumento
cada uno de los dos días, haciendo una serie de mediciones
de un patrón. Nos interesa saber si las mediciones de los
dos días son iguales. Si nuestra suposición es que no
existen diferencias el instrumento estará trabajando de la
.

misma forma los dos días y que podremos combinar con


confianza las mediciones.
Se hacen cuatro mediciones el primer día y se obtiene un
promedio de 25. El segundo día cinco mediciones con
promedio 26. El experiencia indica que la desviación típica
es 1,0

Respuesta.
19
Estimación por intervalos
Estimación por intervalo para la diferencia de las medias de dos
poblaciones. Varianza conocida s2

Cuando se desea estimar el tamaño de la diferencia entre las


medias poblaciones con varianzas conocidas se aplica:

  
(m1 - m2 )  ( x1 - x2 ) - Z  s x1 - x2  (m1 - m2 )  ( x1 - x2 ) + Z  s x1 - x2 
2 2

La aplicación de esta regla requiere que se tenga conocimiento


del error típico de la diferencia entre los promedios de las
muestras s x1 - x2 y el nivel de confianza.
Si se supone observaciones independientes el error típico de las
diferencias de los promedios es:

 s 12   s 22 
s x -x    +  
 n1   n2 
1 2
20
PRUEBAS DE HIPÓTESIS
Prueba de las medias de dos muestras con varianza
desconocida
Si obtenemos diversas observaciones de un proceso que sigue una
distribución normal, y de la cual no se conoce su desviación típica, el
estadístico de prueba para probar si la media de las muestras proviene
de la misma población es:

t 
x1 - x 2
1 1 Sp 
n1 - 1* S12 + n2 - 1* S2 2
+ DONDE
Sp *
n1 n2 . n1 + n2 - 2

Región crítica y decisión:


a) Ho: Ho: µ1=µ2 Rechazar Ho si tc tn1+n2-2;1-
H1: Ho: µ1>µ2
b) Ho: Ho: µ1=µ2 Rechazar Ho si tc tn1+n2-2;
H1: Ho: µ1<µ2

c) Ho: Ho: µ1=µ2 Rechazar Ho si tc tn1+n2-2;1-/2 o tc -tn1+n2-2;/2


H1: Ho: µ1≠µ2
21
PRUEBAS DE HIPÓTESIS

Ejemplo:

Un experimento comenzó dividiendo un grupo de ratas de 20 días de


edad en dos grupos al azar. El primer grupo recibió ATRO (atropina)
combinada con SPI (spiroperidol) y el otro recibió solamente SPI
(spiroperidol). Una hora después que la droga fuera suministrada se
midió el tiempo en segundo de reacción de cada rata ante un estímulo.
Se obtuvieron los siguientes tiempos de reacción en segundos:

.
ATRO 16 5,9 11,5 4,4 17,7 13,5 13
SPI 25,8 10,5 10,5 5,2 20,9 14,2 19,6

Pruebe si existe diferencia estadísticamente significativa en los


tiempos de reacción a un estímulo entre las ratas con ATROPINA
combinada con SPIROPRRIDOL y aquellas solamente tratadas con
SPIROPERIDOL. Utilice nivel de confianza del 5%

Respuesta
22
Estimación por intervalos
Estimación por intervalo para la diferencia de las medias de dos
poblaciones. Varianza desconocida s2
Se puede calcular límites de confianza para la diferencia entre las medias de dos
poblaciones sin conocimiento previo de las desviaciones típicas. Para ello se utiliza la
distribución t-Student, la cual acompaña la siguiente fórmula:

( x1 - x2 ) - t
;n1 + n2 - 2
S   (m - m )  ( x - x ) + t
x1 - x2 1 2 1 2 
;n1 + n2 - 2
S 
x1 - x2
2 2

Si suponemos que ambas poblaciones tienen la misma variabilidad un valor


común de s , hallamos un estimación mancomunada de esta desviación típica
a partir de los dos valores y S2 por un método que pondera más la
S1
desviación típica de la muestra con el mayor número de grados de libertad, ya
que concedemos más validez al estadístico tomado de la muestra mayor:

(n1 - 1) * S1 + (n2 - 1) * S 2  1 1 
2 2
S x1 - x2  *  + 
n1 + n2 - 2  n1 n2 
23

También podría gustarte