Está en la página 1de 63

HIPÓTESIS CON

UNA SOLA MUESTRA

ESTADISTICA III
CONTENIDO

Conceptos Básicos :Elementos de una prueba de hipótesis , Niveles de


significación observados: p values
Prueba de hipótesis acerca de la media poblacional
 Prueba de hipótesis sobre una media poblacional de muestras grandes
 Prueba de hipótesis sobre una media poblacional de muestras pequeñas
Prueba de hipótesis acerca de la proporción poblacional
 Prueba de hipótesis sobre una proporción poblacional de muestras
grande
INTRODUCCIÓN
 En el tema anterior se ha mostrado
cómo puede estimarse un
parámetro a partir de los datos
contenidos en una muestra.

 Sin embargo, muchos problemas


de ingeniería, ciencia,
administración, etc. requieren que
se tome una decisión entre aceptar
o rechazar una proposición sobre
algún parámetro.
Pruebas de Hipótesis
Introducción
 La experiencia sobre el comportamiento de algún índice de un
proceso, o la exigencia del cumplimiento de alguna norma nos
lleva a realizar proposiciones sobre el valor de algún parámetro
estadístico.

 Estas proposiciones se deben contrastar con la realidad


(mediante el muestreo de datos) para tomar una decisión
entre aceptar o rechazar la proposición

 Estas proposiciones se denominan Hipótesis y el procedimiento


para decidir si se aceptan o se rechazan se denomina Prueba
de Hipótesis.

 Una prueba de hipótesis es una herramienta de análisis de


datos que puede en general formar parte de un experimento
comparativo más completo.
PLANTEAMIENTO DEL PROBLEMA
 En la formulación del problema se debe determinar: el tipo
de datos que es necesario recoger, las técnicas de recogida
adecuadas para ello y los procedimientos estadísticos que se
utilizarán en el análisis.

 Además cuando formulamos el problema delimitamos


nuestro estudio, es decir, si éste se dirige a toda una
población, tendremos que pensar en procedimientos de la
estadística descriptiva, mientras que si nos limitamos al
estudio de una muestra, habremos de recurrir a la
estadística inferencial.
FORMULACION DE HIPOTESIS

 Una hipótesis es una solución por adelantado que se da al


problema de investigación que formulamos; es una
conjetura, una solución posible.

 La formulación de hipótesis no puede hacerse sin tener en


cuenta las técnicas estadísticas que permiten su
contrastación.

 El investigador se ve en la necesidad de salvaguardar la


coherencia entre la teoría, la hipótesis y el posterior análisis
estadístico que le permitirá aceptarla o rechazarla.
Contrastando una hipótesis
Son
demasiados...

Creo que la edad


media es 40 años...

¡Gran
diferencia!

Muestra Rechazo la
aleatoria hipótesis

X  20 años
7
¿Qué es una hipótesis?
Creo que el porcentaje
de enfermos será el
5%
 Una creencia sobre la población,
principalmente sus parámetros:
 Media
 Varianza
 Proporción/Tasa

 OJO: Si queremos contrastarla, debe


establecerse antes del análisis.
 Dicha creencia puede ser o no ser
verdadera

8
Identificación de hipótesis
 Hipótesis nula Ho  Hipótesis Alternativa H1
 La que contrastamos  Niega a H0

 Los datos pueden refutarla  Los datos pueden mostrar evidencia a


favor

 No debería ser rechazada sin una buena  No debería ser aceptada sin una gran
razón. evidencia a favor.

H 0 : p  50% , , 
 , , 
 H1 : p  50%

9
¿Quién es H0?
 Problema:
¿La altura media o promedio de los estudiantes de la UPC es 1.60 m?

 Solución:

 Traducir a lenguaje estadístico:   1.60


 Establecer su opuesto:

 Seleccionar la hipótesis nula


  1.60

H 0 :   1.60

10
¿Quién es H0?
 Problema: El tiempo de vida promedio de una determinada pieza usada en
el ensamblaje de una marca de computadoras es de 20,000 horas.

 Solución:

  20,000
 Traducir a lenguaje estadístico:

 Establecer su opuesto:
  20,000
 Seleccionar la hipótesis nula

H 0 :   20,000

11
¿Quién es H0?
 Problema: El porcentaje de personas atacadas por cierta epidemia es
una ciudad grande, no es mayor del 10%.

 Solución:

 Traducir a lenguaje estadístico:

 Establecer su opuesto: p  0.10


 Seleccionar la hipótesis nula p  0.10
H 0 : p  0.10

12
Ejercicios:

 Durante los últimos semestres, el


profesor de Estadística de una
universidad ha registrado que el
rendimiento medio de sus alumnos es
de 14 puntos. Este año le ha tocado
40 alumnos sobresalientes porque su
rendimiento medio ha sido 17 puntos
y el profesor les proclama como
superiores a todos los alumnos que ha
tenido en la fecha.
 Qué hipótesis plantearía?

H 0 :   14 H1 :   14

13
HIPÓTESIS ESTADÍSTICA
 Definición.- Es una aseveración que se hace acerca de la
distribución de una o más variables aleatorias (o
poblaciones) la cual puede o no ser verdadera.

 Se puede especificar una hipótesis, dando el tipo de


distribución y el valor o valores del parámetro o los
parámetros que la definen.

 EJEMPLOS:

a. X tiene una distribución binomial con p=0,4.


b. Z tiene una distribución normal con media μ=75 y σ2=81.
CONCEPTOS BÁSICOS: Tipos de Hipótesis

(A) Hipótesis: Suposición acerca del parámetro.


 Hipótesis planteada o nula. Hp ó H0
Es la suposición que el parámetro tome un
determinado valor.

Ejemplo: La hipótesis nula es que la media de la


población es igual a 200.
Ho :  = 200
CONCEPTOS BÁSICOS :Tipos de Hipótesis
 Hipótesis alternativa (Ha o H1)
Es el complemento de la hipótesis nula. Se acepta
cuando se rechaza la hipótesis nula.
Formas
Si Ho :  = 200 Ha :  200
Si Ho :   200 Ha :  > 200
Si Ho :   200 Ha :  < 200
La condición “igual” siempre se considera en la
hipótesis nula
CONCEPTOS BÁSICOS: ejemplos
Las siguientes afirmaciones son hipótesis estadísticas.
 La media de vida de los peruanos es de 72 años.
 La eficacia de dos medicamentos para curar el cáncer es
similar.
 Las notas de la el aula sigue un modelo normal de media de
12 y desviación estándar de 2.5
Una prueba de hipótesis permite aceptar o rechazar si
determinadas afirmaciones son ciertas o falsas en función de
los datos observados en una muestra.
(B) Objetivo de la prueba de hipótesis.

El propósito de la prueba de hipótesis no es


cuestionar el valor calculado del estadístico
(muestral), sino hacer un juicio con respecto a la
diferencia entre estadístico de muestra y un valor
planteado del parámetro.
Contrastando una hipótesis
Son
demasiados...

Creo que la edad


media es 40 años...

¡Gran
diferencia!

Muestra Rechazo la
aleatoria hipótesis

X  20 años
19
(C) Nivel de significación ()

(1 - )
/2 /2
Zona de
Aceptación

-z/2 z/2 Z

Si suponemos que la hipótesis planteada es verdadera, entonces,


el nivel de significación indicará la probabilidad de no aceptarla,
Es decir, estén fuera de área de aceptación.

El nivel de confianza (1-), indica la probabilidad de aceptar la hipótesis


planteada, cuando es verdadera en la población.
Región crítica y nivel de significación
Región crítica Nivel de significación: 
 Valores ‘improbables’ si...  Número pequeño: 1% , 5%
 Es conocida antes de realizar el  Fijado de antemano por el investigador
experimento: resultados experimentales  Es la probabilidad de rechazar H0 cuando
que refutarían H0
es cierta

=5%

Reg. Crit. Reg. Crit.

No rechazo H0
H0: =40

21
(D) Tipos de errores

Cualquiera sea la decisión tomada a partir de una


prueba de hipótesis, ya sea de aceptación de la Hp o
de la Ha, puede incurrirse en error:

La muestra seleccionada conduce a


EN LA POBLACIÓN ACEPTAR Hp RECHAZAR Hp

Hp es cierta Decisión correcta Error tipo I ó 

Hp es falsa Error tipo II ó  Decisión correcta


Representación grafica

(1 - ) Zona de rechazo
si Hp es cierta 

o
Hp   o
Poder de la prueba
Ha   o
(1 - )


Zona de aceptación Hp
1
Zona de Rechazo Hp
Si la hipótesis planteada, Hp :  
0 , es cierta, la zona de rechazo,
, medirá la probabilidad de que Zona de rechazo
se rechace dicha hipótesis siendo si Hp es cierta 
cierta, incurriendo en Error Tipo
I o .

Supongamos que la hipótesis


planteada es falsa, Hp:   0 , y Poder de la prueba
que la alternante Ha:  >  0 es
verdadera, y si los resultados de
la muestra nos conducen a
 (1 - )
aceptar la hipótesis planteada,
estamos cometiendo el Error
Zona de aceptación Hp Zona de
Tipo II ó  Rechazo H p
(D) Tipos de errores

La magnitud del Error  depende de la magnitud del Error  y


de la discrepancia entre  0 y  1
Se observa la existencia de una relación inversa entre la
magnitud de los errores  y  : conforme  aumenta, 
disminuye.
Esto obliga a establecer con cuidado el valor de  para las
pruebas estadísticas. Lo ideal sería establecer  y .
En la práctica se establece el nivel  y para disminuir el Error 
se incrementa el número de observaciones en la muestra, pues
así se acortan los limites de confianza respecto a la hipótesis
planteada.
(D) Tipos de errores

La meta de las pruebas estadísticas es rechazar la hipótesis


planteada. En otras palabras, es deseable aumentar 
cuando ésta es verdadera, o sea, incrementar lo que se llama
poder de la prueba (1- )
La aceptación de la hipótesis planteada debe interpretarse
como que la información aleatoria de la muestra disponible
no permite detectar la falsedad de esta hipótesis.
NIVEL DE SIGNIFICACIÓN

Nivel de Significación () = P (rechazar Ho / Ho es


cierta)

Críticas a la selección Nivel significación


· El resultado es arbitrario (Rechazo con  del
5% y acepto con  del 4 %
· Dar solo el resultado no permite diferenciar el
grado de evidencia de la muestra a favor ó en
contra de Ho
Significación: p


H0:  = 40
Significación: p

No se rechaza
H0:  = 40


X  43
Significación: p
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del
estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la
obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>

No se
rechaza P
H0:  =40

X  43
Significación : p

Se rechaza H0:  =40

Se acepta H1:  >40


X  50
Significación : p
El contraste es estadísticamente significativo cuando p < 
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

 P

Se rechaza H0:  =40

Se acepta H1:  >40


 P

X  50
Resumen: , p y criterio de rechazo

 Sobre   Sobre p
 Es número pequeño, preelegido al  Es conocido tras realizar el experimento
diseñar el experimento

 Conocido p sabemos todo sobre el


 Conocido  sabemos todo sobre la resultado del experimento
región crítica

 Sobre el criterio de rechazo


 El contraste es significativo si p menor que 

Pruebas de hipótesis Bioestadística. 33


NIVEL CRITICO “p”

“p” es la Probabilidad de obtener una discrepancia


mayor o igual que la observada en la muestra n cuando
Ho es cierta

El valor de “p” no se fija a priori, sino que se determina a


partir de la muestra

A menor valor de “p” , menor es la credibilidad de Ho


PASOS A SEGUIR PARA REALIZAR UNA PRUEBA DE HIPOTESIS
1.-Formular la hipótesis nula Ho y la alternativa H1, de acuerdo al problema.
2.-Escoger un nivel de significancia o riesgo a.
3.-Elegir la estadística de prueba apropiada, cuya distribución por muestreo sea
conocida en el supuesto de que Ho es cierta.
4.-Con base Ho y Ha, determinar el valor (o valores) críticos y con ellos se
establece la región de aceptación y rechazo.
5.-Calcular los valores de la prueba estadística a partir de la muestra aleatoria.
6.-Tomar la decisión de aceptar Ho si el valor experimental cae en la región de
aceptación y rechazarla si dicho valor cae en la región crítica o de rechazo.
7.-Plantear las conclusiones correspondientes.
Contrastes: Tipos de prueba
La posición de la región crítica depende de la hipótesis alternativa
Unilateral
Bilateral H1: 20

H1: >20

Unilateral

H1: <20
E) Tipos de prueba

a) Prueba bilateral o de dos extremos: la


hipótesis planteada se formula con la igualdad

Ejemplo
/2 /2
Hp :  = 200
Ha :   200
-z/2 z/2 Z
E) Tipos de prueba
b) Pruebas unilateral o de un extremo: la
hipótesis planteada se formula con  o
.
Hp :   200 Hp :   200
Ha :  < 200 Ha :  > 200


 (1 - ) (1 - )
PRUEBA DE HIPÓTESIS ACERCA
DE LA MEDIA POBLACIONAL
Prueba de hipótesis acerca de la media
poblacional
 Caso A: Cuando la varianza poblacional es conocida y el
tamaño de la muestra es grande o se sabe que la
población tiene una distribución normal, la estadística
de prueba es:

x
Z0 

n
Prueba de hipótesis acerca de la media
poblacional
(A) Con varianzas conocidas (muestras grandes)
Ejemplo:
Se afirma que el salario diario medio de los
técnicos de una cierta zona minera es de
S/.65,42, con una desviación estándar S/. 2,32.
Una muestra de 144 técnicos que laboran en esa
zona reciben un salario diario medio de 64,82
soles. ¿Puede considerarse este resultado como
sustento para afirmar que técnicos de esa zona
tienen un salario diario diferente de S/. 65,42 a
un nivel de significación  = 0,05 ?.
Procedimiento

1) Plantear las hipótesis:


Hp :  = 65,42
Ha :   65,42
2) Seleccionar el nivel de significación:  = 0.05
3) Elegir la prueba estadística: x -
c 
x
Los supuestos son:
• la población está normalmente distribuida.
• la muestra ha sido seleccionada al azar.
4) Determinación de los criterios de decisión

/2 /2
(1 - )

-Z0 Z0
-1.96 1,96
Si { -1.96  Zc  1.96 } se acepta la Ho, en caso contrario
se rechaza.
5) Cálculos: 64,82  65,42
c   3,10
2,32
144
6) Conclusiones
(1) Se rechaza la hipótesis planteada y se acepta
la hipótesis alternante a un nivel de
significación de 0,05. La prueba resultó ser
significativa.
(2) La evidencia estadística permite rechazar
la hipótesis planteada.
(3) Por lo tanto los datos muestrales confirman
que el promedio de salarios diarios de los
técnicos de la zona de estudio es menor de
S/.65,42.
EJEMPLO
El administrador de un centro de salud desea saber si el tiempo
medio invertido por los pacientes en la sala de espera es mayor
que 20 minutos. Una muestra de 100 pacientes permanecieron,
en promedio, 23 minutos en la sala de espera entre el registro y la
atención por algún médico del centro de salud. La desviación
estándar de la muestra fue de 10. Sea =0.05

1. Plantear las hipótesis


Ho :   20
Ha :   20
2.Definir la prueba estadística: Como n = 100,
entonces se aplica PRUEBA Z
3. Seleccionar el nivel de significación  = 0,05
4. Determinar el valor crítico: Como  = 0,05 y es de
una sola cola, entonces Z = 1.645
Criterios de decisión
Si prueba Z es mayor que
1,645, se rechaza Ho.
Si prueba Z es menor o
     
0   igual que 1,645, se acepta
1,645
Ho.
5. Realizar el cálculo del estadístico Z
x   23  20 3
Z   3
sx 10 1
100
6. Conclusiones
(A) Se rechaza la hipótesis planteada, se acepta la
hipótesis alternante a un nivel de significación de 0,05. La
prueba resultó significativa
(B) Los datos disponibles como evidencia empírica, han
permitido rechazar la hipótesis planteada.
(C) El tiempo que espera un paciente muy
probablemente sea mayor a los 20 minutos.
EJEMPLO

Una encuesta en 64 laboratorios médicos reveló


que el precio medio cobrado por realizar cierta
prueba es de S/. 12.00 con una desviación
estándar de S/. 6.00. ¿ Proveen estos datos la
suficiente información para indicar que la media
de la población es mayor que 10?. Sea  = 0.01
Prueba de hipótesis acerca de la media poblacional

 Caso B: Cuando no se conoce la varianza


poblacional es conocida y el tamaño de la
muestra es pequeña.

x
t T(n-1) g.l.
s
n
(B) Con varianzas desconocidas (muestras
pequeñas)
Ejemplo: En un programa de mejoramiento del
desempeño en un centro de salud los participantes
miden su progreso mediante el tiempo que les toma
realizar cierto proceso.
Se tomó una muestra de 25 sujetos de esta empresa
para medirles el tiempo que requieren para culminar
el proceso (en minutos) de otorgar una cita a un
paciente, encontrándose una media muestral de 11,7
minutos y una desviación de estándar de 2,3 minutos.
¿Se puede afirmar que el tiempo medio para culminar
este proceso es inferior de 12 minutos?. Utilice un
nivel de significación  = 0,05.
Solución

1) Hipótesis: Hp :   12
Ha :   12
2) Nivel de significación:  = 0,05
3) Prueba estadística:
x-
tc 
S
Los supuestos son: n
•la población se distribuye normalmente.
•la muestra elegida al azar.
4) Criterios de decisión
to con GL = 24 y  = 0,05
Si { tc>-1,711} se acepta la Hp en caso contrario se rechaza

 (1 - )
5) Cálculos:
-t0
11,70  12 -1.711
tc 
2,3
 0,6522
25
6) Conclusiones

 Se acepta la hipótesis planteada a un nivel de


significación de  = 0,05. La prueba resultó no
significativa.
 Los datos muestrales no permiten afirmar que el
tiempo requerido para culminar la tarea es inferior a 12
minutos.
Prueba de Hipótesis para la proporción
poblacional: p
Prueba de Hipótesis acerca de la
proporción poblacional: p o Π
 Se trata de efectuar una prueba de hipótesis
acerca de la proporción p de elementos con cierto
atributo en una población.

P  p0
Z0  x
p0 (1  p0 ) P
n n
Prueba de hipótesis acerca de la
proporción poblacional ()
Ejemplo 1:
El Gerente de la Clínica Santa María afirma que por
lo menos 55% de los pacientes se encuentra
plenamente satisfecho con los servicios recibidos.
¿Qué conclusión puede obtenerse si de una muestra
aleatoria de 500 pacientes 245 manifestaron su
preferencia?. Utilice un nivel de significación  =
0,01 para comprobar la afirmación.
Proporción 245
muestral : p=  0,49
500
Procedimiento
1) Planteo de Hipótesis:
Hp :   0,55
Ha :   0,55
2) Nivel de significación:  = 0,01
3) Prueba estadística: p -
c 
p
Los supuestos son:
• la población se distribuye normalmente.
• la muestra ha sido seleccionada al azar.
4) Criterios de decisión

Si { Zc>-2,33} se acepta la (1 - )

hipótesis planteada, en
caso contrario se rechaza. Z 
5) Cálculos -2,33
 (1   )
p  p 
(0,55)( 0,45)
 0,022
n 500

Reemplazando valores en Z: 0,49  0,55 0,06


Z   2,73
0,022 0,022
Conclusiones

1) Se rechaza la hipótesis planteada y se acepta la


hipótesis alternante a un nivel de
significación  = 0,01. La prueba resultó ser
altamente significativa.
2) La evidencia empírica nos permite rechazar la
hipótesis planteada.
3) El Gerente de Clínica está equivocado en su
afirmación, puesto que el resultado de la
prueba indica que los pacientes que se
encuentran plenamente satisfechos es menor
a 55%.
Ejemplo 2 :
 El gerente de producción de una empresa de cereales está
preocupado por el proceso de sellado de las cajas llenas. Cuando el
paquete de cereal que se coloca en la caja está lleno, se supone que
éste se sella de modo que quede hermético. Basándose en la
experiencia anterior, se sabe que uno de cada diez cajas no cumplen
con las normas de sellado y deben ser revisados. Para modificar esta
situación, suponga que el gerente instrumenta un sistema de sellado
que se acaba de desarrollar. Después de un período de prueba, el
gerente toma una muestra de 200 cajas que representan la
producción diaria en la planta, y encuentra, mediante una
inspección, que 11 de ellas deben ser vueltas a sellar. El gerente
desea determinar si existe alguna evidencia de que con el nuevo
sistema de sellado, la proporción de paquetes defectuosos ha
mejorado. Decida si puede afirmarse que ha mejorado.
SOLUCION
 Para dar respuesta a la incógnita planteada, debemos plantearnos una
prueba de hipótesis sobre la proporción poblacional de cajas defectuosas,
donde tenemos:
1) Ho: p  0,1
Ha: p < 0,1
2) Tenemos un nivel de significación de 0,05,
3)La región de rechazo de Ho constituida por el intervalo para valores de Z de Z
< -1,645 y en cualquier otro caso no se rechaza Ho.
4) El estadístico de prueba viene dado por:
11
 0,1
p̂  p
Z  200  2,12
p(1 - p) 0,1)(0,9)
n 200
.

5) El calculo también es equivalentemente

X  np 11  200(0,1)
Z   2,12
np(1 - p) 200(0,1)(0,9)
6) Conclusión:
Finalmente, puesto que –2,12 < -1,645, rechazamos Ho, por lo que el
gerente puede afirmar que existe evidencia de que la proporción de cajas
defectuosas con el nuevo proceso es menor a 0,1.

También podría gustarte