Está en la página 1de 7

Estadística I

Tema 9 / Parte 2

Pruebas de Hipótesis Paramétricas

PRUEBAS DE HIPÓTESIS
En estadística, un supuesto es una afirmación que se hace acerca del valor de un
parámetro y que aún no ha sido probada. A los supuestos que se hacen sobre los
valores de los parámetros de una población se les denomina hipótesis.
En una investigación estadística se tiene como propósito verificar la racionalidad
de estos supuestos o hipótesis. Al proceso de verificar la racionalidad de estos
supuestos se le denomina prueba de hipótesis.
Una prueba de hipótesis es un procedimiento basado en la evidencia muestral y
en la teoría de la probabilidad, empleado para determinar si la hipótesis es un
enunciado razonable. La estadística inferencial es la encargada de usar
información de una muestra aleatoria para llevar a cabo las pruebas de hipótesis.
En estadística inferencial podemos encontrar dos tipos de pruebas de hipótesis:
pruebas de hipótesis paramétricas y pruebas de hipótesis No paramétricas.

Tipos de Hipótesis:
Teniendo en cuenta que un proceso de decisión debe conducir a resultados sin
ambigüedades, es necesario que el rango de valores de un parámetro sea
particionado en dos hipótesis mutuamente excluyentes y complementarias.

Hipótesis Planteada o Nula (Hp)


Es el supuesto que se hace acerca del valor de un parámetro, cuya validez será
verificada de acuerdo con la evidencia muestral captada.
Este supuesto debe incluir al valor del parámetro.
Hipótesis Alternante (Ha)
Es la hipótesis que se debe aceptar en caso de ser rechazada la hipótesis planteada.
Este supuesto es el complemento de la hipótesis planteada.
La prueba de hipótesis es un procedimiento de decisión para establecer la
aceptación o rechazo de una hipótesis planteada.
Los procedimientos de pruebas de hipótesis se han desarrollado para tomar
decisiones sobre las hipótesis planteadas. La decisión que se tome sobre la
hipótesis alternante será una consecuencia de la decisión tomada sobre la
hipótesis planteada.
Los resultados que se derivan de la decisión tomada están sujetos a ciertos niveles
de confiabilidad y riesgo, lo cual supone que es también posible tomar decisiones
erradas.

TIPOS DE ERROR
Cuando se establece una Hp, se debe tomar una decisión sobre la racionalidad de
esta, ésta puede ser aceptarla o rechazarla. Sin embargo al conocer a la población
real o el verdadero valor del parámetro, la Hp será Verdadera (V) o Falsa (F), esto
nos llevará a una de las siguientes situaciones:

Si aceptamos Si rechazamos
Hp (V) Decisión correcta ERROR TIPO I
Hp (F) ERROR TIPO II Decisión correcta.

ERROR TIPO I
Ocurre al rechazar una hipótesis planteada cuando ésta es realmente Verdadera.
La probabilidad de cometer error tipo I es representada por , esto es:

 = P[cometer ERROR TIPO I]

ERROR TIPO II
Ocurre al aceptar una hipótesis planteada cuando ésta es realmente Falsa.
La probabilidad de cometer error tipo II es representada por , esto es:

 = P [cometer ERROR TIPO II]


Consideraciones para  y 
* El valor máximo de  es establecido por el investigador (se define en la
Población Hipotética).
* El valor de  se determina en base a la distribución real (Población Real).
* Los valores  y  están inversamente relacionados.
* 0<+<1

Potencia de Prueba
Es la probabilidad de rechazar una hipótesis planteada o nula cuando ésta es
realmente Falsa. Es decir, es la probabilidad de tomar una decisión correcta
cuando Hp es Falsa.

Potencia de Prueba = 1 - 

Región crítica o Región de rechazo


Área o región donde se rechaza la Hp. Es el conjunto de valores del estadístico de
prueba para los cuales se rechaza Hp.
Valor Crítico o Valor Tabular
Es el valor o valores que define(n) los límites de la(s) región(es) crítica(s).
Nivel de significancia
Es la máxima probabilidad, establecida por el investigador, con el fin de hacer
mínimo el error tipo I.
Nivel de Significancia = Máx P[cometer Error Tipo I]

Es la probabilidad más alta de rechazar Hp cuando es verdadera.

Nota:
Para el proceso de prueba de hipótesis utilizaremos la siguiente simbología:
: Nivel de significación de la prueba.
: Parámetro sobre el cual se desea probar un supuesto.
0: Valor hipotético del parámetro.
E: Estadístico de prueba a usar (Z, T, 2 , etc.)
E1: Valor tabular o punto crítico de la izquierda.
E2: Valor tabular o punto crítico de la derecha.
Procedimiento general para realizar una prueba de hipótesis:
Ante un evidente supuesto: (parámetro >, , <, , =,  valor hipotético), podríamos
establecer un orden para llevar a cabo el proceso de prueba de hipótesis:
1° Planteamiento de la hipótesis.
CASO A: Prueba bilateral Hp:  = 0; Ha:   0
CASO B: Prueba Unilateral a la derecha: Hp:   0 (Hp:  = 0); Ha:  > 0
CASO C: Prueba Unilateral a la izquierda: Hp:   0 (Hp:  = 0); Ha:  < 0
2° Elección del nivel de significación 
Usar dato según prueba unilateral o bilateral.
3° Determinación de la prueba a usar (E).
Establecer los supuestos de la prueba.
4° Obtención de los puntos críticos o valores tabulares.
Establecer los criterios de decisión.
CASO A: Pruebas bilaterales
Región de
Aceptación
Región de Región de
Rechazo Rechazo Se acepta Hp si: E1  ECAL  E2
/2 1-  /2 Se rechaza Hp si: ECAL < E1 ó ECAL > E2

E1 E2
CASO B: Pruebas Unilaterales a la Derecha

Región de Región de
Aceptación Rechazo

Se acepta Hp si: ECAL  E2


1-  
Se rechaza Hp si: ECAL > E2

E2
CASO C: Pruebas Unilaterales a la Izquierda
Región de Región de
Rechazo Aceptación

 Se acepta Hp si: ECAL  E1


1- 
Se rechaza Hp si: ECAL < E1

E1
5° Cálculo del valor de la prueba.
6° Decisión y conclusiones.
Supuestos de los parámetros para Pruebas de Hipótesis Paramétricas
1. Para la media: .
i. las observaciones son elegidas aleatoriamente.
ii. las observaciones elegidas provienen de una distribución normal.

2. Para la proporción: .
i. las observaciones son elegidas aleatoriamente.
ii. el tamaño de muestra es suficientemente grande.

PRUEBAS ESTADÍSTICAS PARAMÉTRICAS Y VALORES TABULARES


[Utilice:  =  / 2 para pruebas bilaterales y  =  para pruebas unilaterales.]

1. Hipótesis sobre la media poblacional (μ)

a) Si la varianza poblacional ( 2 ) es conocida, la prueba estadística es:

x − x
Z= Valores tabulares: Z1 = Z(); Z2 = Z(1-)
x

b) Si la varianza poblacional ( 2 ) no es conocida, la prueba estadística es:

x − x
T=  T(n −1) Valores tabulares: T1 = T(,n-1); T2 = T(1-,n-1)
Sx

2. Hipótesis sobre la proporción poblacional ()


La prueba estadística es:

p−
Z= Valores tabulares: Z1 = Z(); Z2 = Z(1-)
p
Ejercicio de aplicación:
En un estudio realizado en las cadenas de tiendas del Hipermercado CARREFUR
se eligieron al azar 37 clientes de la ciudad A y 35 clientes de la ciudad B, siendo
uno de los objetivos el analizar las compras de víveres mediante tarjetas de crédito.
Mediante las muestras tomadas el último fin de semana se encontró la siguiente
información sobre los montos de las compras a crédito y el número de clientes que
van a cancelar su compra en 3 cuotas:

Monto promedio de N° de clientes que


Desviación
Ciudad n compra a crédito van a cancelar en
estándar
(soles) tres cuotas
A 37 126 53.6 30
B 35 202 72.9 32

Use  = 0.05 para pruebas unilaterales y  = 0.10 para pruebas bilaterales.

a) La gerencia sospecha que la verdadera media de los montos de compra a


crédito en víveres de los clientes de la ciudad B es mayor a 200 soles. ¿Qué
puede concluir al respecto?

b) Si realmente la verdadera media de los montos de compra a crédito en víveres


de los clientes de la ciudad B es 205 soles, ¿cometió algún error en su decisión
anterior?
Si su respuesta es afirmativa, ¿qué tipo de error cometió?

c) La gerencia afirma que la verdadera proporción de clientes en la ciudad A que


van a cancelar sus compras en tres cuotas es menor a 0.85. ¿Está Ud. de
acuerdo con esta afirmación?

d) Si la verdadera proporción de clientes que van a cancelar en tres cuotas en la


ciudad A es 0.81, ¿cometió algún error en su decisión anterior?
Si su respuesta es afirmativa, ¿qué tipo de error cometió?
Prueba para DATOS PAREADOS o Correlacionados.
Cuando se realizan dos mediciones en momentos o condiciones diferentes para las
mismas unidades de muestreo, correspondientes a una misma variable, se generan
dos conjuntos de datos que no son independientes entre sí, debido a que los datos
están relacionados con el mismo elemento de la población.
A los pares generados por este mecanismo se les denomina datos pareados y se
supone que siguen una distribución normal o aproximadamente normal.
Sean: (X1,Y1), (X2,Y2), …,(Xn,Yn), los “n” datos pareados.
Se supone que: Xi ≈ N(1, 12 ) y que: Yi ≈ N(2,  22 )

Además que Xi e Yi no son Independientes, pero sí lo son: (Xi,Yi) de (Xj,Yj), para ij.
El parámetro en estudio será: d = X −  Y

Procedimiento:
(1) Planteamiento de la hipótesis:
Hp: d ≥ r Hp: d ≤ r Hp: d = r
Ha: d < r Ha: d > r Ha: d  r
(2) Elección de “”.
d − d
(3) Prueba Estadística: T=  T(n −1)
Sd

Donde cada di se obtiene a partir de: di = Xi - Yi


n n
2
 di S2
 d2i − nd
Además: d = i =1 = X−Y; S2 = d ; S2
d =
i =1
n d n n −1

(4) Punto(s) crítico(s) para establecer los CRITERIOS DE DECISIÓN.


(5) Cálculo del valor de la Prueba: TCAL.
(6) Decisión y Conclusiones.

Nota:
1. Se usa T de Student porque no se conoce la varianza poblacional y se supone
que se tiene una distribución normal para las diferencias.
2. Se utiliza solo una muestra aleatoria.

También podría gustarte