Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Índice
1. Hipótesis 2
5. p-valor 25
1
Inferencia Estadística 1. Hipótesis
1 Hipótesis
Hipótesis Estadística
Una hipótesis estadística o simplemente hipótesis es una pretensión, conjetura o aseveración sobre
el valor de uno o mas parámetros (característica de una población).
Las hipótesis pueden envolver parámetros de diferentes poblaciones
A fin de conocer la verdad o falsedad de una hipótesis estadística será evaluada por tomar una muestra
aleatoria de la poblacion en estudio. Los datos colectados, sirven para proporcionar evidencia para
aceptar o rechazar la hipótesis.
Ejemplo 1.1
Algunos ejemplos de hipótesis estadísticas
la proporción de personas que tienen un seguro de salud en Arequipa es mayor que 40 %, p > 40 %
La duración media del neumático de la marca A es mayor que la del neumático B, µA > µB
En prueba de hipótesis, se tomará dos decisiones: aceptar o rechazar la hipótesis nula, H0 . Pero esta
decisión será tomada llevando en cuenta lo siguiente:
Ejemplo 1.2
De las hipótesis, H0 : µ=0.75 contra la alternativa H1 : µ ,0.75. Se rechazará H0 sólo si los datos
muestrales sugieren fuertemente que µ es diferente de 0.75. Si los datos no muestran evidencia para ello,
H0 no deberá ser rechazada, puesto que sigue siendo bastante plausible.
En el presente curso serán considerados las siguientes hipótesis nula con sus respectivas hipótesis
alternativas
hipótesis nula H0 : θ = θ0 H0 : θ ≥ θ0 H0 : θ ≤ θ0
hipótesis alternativa H1 : θ , θ0 H1 : θ < θ0 H1 : θ > θ0
Nótese que la H1 no tiene posibilidad de ser una igualdad, i.e., no se puede plantear H1 como por lo
menos en las pruebas de hipótesis a estudiar mas adelante
H1 : θ = θ0 ó H1 : θ ≤ θ0 ó H1 : θ ≥ θ0
2
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
Una región crítica o de rechazo es un subconjunto del espacio muestral en que H0 será
rechazada.
La H0 será rechazada si y sólo si el valor calculado (observado) del estadístico de prueba está en la
región crítica.
Notación:
La región crítica será denotado por RC
Ejemplo 2.1
Suponga una prueba de hipótesis indica que H0 es rechazada si la media muestral es mayor que 3.
RC = {(x1 , x2 , . . . , xn ) : x > 3} ,
RC = (3; ∞)
3
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
Error tipo I
El Error Tipo I: consiste en rechazar la hipótesis nula cuando eta es verdadera.
La probabilidad condicional de cometer el error tipo I
La probabilidad del error tipo I se denomina también nivel de significación de la prueba, nivel de
significancia o nivel de la prueba.
Casi siempre, se utiliza valores menores o iguales a 0.10,
α ≤ 0.10
Error Tipo II
El Error Tipo II: consiste en aceptar la hipótesis nula cuando esta es falsa.
La probabilidad condicional de cometer el error tipo II es
Estado real
Decisión H0 es verdadera H0 es falsa
Error tipo I
Rechazar H0 Correcta
α
Error tipo II
No Rechazar H0 Correcta
β
4
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
1−α
α
5
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
1−α
6
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
1−α
α α
2 2
Se puede resumir los tipos de prueba que se serán utilizados. Se tiene que enfatizar el hecho que el tipo
de prueba depende de la H1 .
Unilateral
Bilateral
lado izquierdo lado derecho
H0 : θ = θ0 H0 : θ ≥ θ0 H0 : θ ≤ θ0
H1 : θ , θ0 H1 : θ < θ0 H1 : θ > θ0
7
Inferencia Estadística 2. Prueba de una Hipótesis Estadística
2. Nivel de significación: α
8
Inferencia Estadística 3. PH para µ: varianza es desconocida
σ2 ≈ s2 ,
9
Inferencia Estadística 3. PH para µ: varianza es desconocida
1. Hipótesis:
2. Nivel de la prueba: α
3. Estadístico de prueba:
X − µ0
Z= √ ∼ N(0, 1),
s/ n
4. Región crítica
5. Valor calculado:
x − µ0
zc = √
s/ n
10
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.1
Una muestra aleatoria de 64 bolsas de palomitas con queso chedar pesan en promedio 5.23 onzas, con
una desviación estándar de 0.24 onzas. Pruebe la hipótesis de que µ ≥ 5.5 onzas contra la hipótesis
alternativa de que µ < 5.5 onzas, con un nivel de prueba α =0.05.
Solución:
Del problema se tiene que la muestra es grande y la varianza poblacional σ2 es desconocida, además
1. Hipótesis:
lado izquierdo
H0 : µ ≥ 5.5
H1 : µ < 5.5
3. Estadístico de prueba:
X − 5.5
Z= √ ∼ N(0, 1),
s/ n
4. Región crítica: Lado izquierdo ó cola izquierda
5. Valor calculado:
5.23 − 5.5
zc = √ = −9
0.24/ 64
6. Decisión y conclusión: El valor calculado zc esta en la región crítica (región de rechazo), entonces
se rechaza H0 .
Las bolsas de palomitas con queso chedar pesan en promedio menos que 5.5.
11
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.2
Una empresa de material eléctrico fabrica bombillas que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas. Pruebe la hipótesis de que µ =800 horas contra la
alternativa de que µ ,800 horas, si una muestra aleatoria de 30 bombillas tiene una duración promedio
de 788 horas con una desviación estándar de s = 39. Use α = 0.05
Solución:
Del problema se tiene que la muestra es grande y la varianza poblacional σ2 es desconocida, además
1. Hipótesis:
bilateral
H0 : µ = 800
H1 : µ , 800
3. Estadístico de prueba:
X − 800
Z= √ ∼ N(0, 1),
s/ n
4. Región crítica: bilateral o 2 lados
α α
2 2
−4 −2 0 2 4
5. Valor calculado:
788 − 800
zc = √ = −1.6853
39/ 30
6. Decisión y conclusión: El valor calculado zc =-1.6853 no esta en la región crítica (región de
rechazo), entonces no se rechaza H0 .
12
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.3
En Estados Unidos un hogar paga en promedio $32.79 mensuales por el servicio de Internet (CNBC, 18
de enero de 2006). En una muestra de 50 hogares de un estado del sur la media muestral fue $30.63 con
una desviación estándar de $5.60.
a) Formule las hipótesis para una prueba en la que se quiere determinar si los datos muestrales
favorecen la conclusión de que la cantidad media pagada por el servicio de Internet, en este estado
del sur, es menor a la media de todo el país, que es $32.79.
13
Inferencia Estadística 3. PH para µ: varianza es desconocida
X − µ0
T= √ ∼ tν , ν= n−1
S/ n
1. Planteo de hipótesis:
2. Nivel de la prueba: α
3. Estadístico de prueba
X − µ0
T= √ ∼ tν , ν= n−1
S/ n
4. Región crítica
5. Valor calculado:
x − µ0
tc = √
s/ n
14
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.4
Un método de enderezar alambre antes de enrollarlo para fabricar resortes se llama “enderezado con
rodillos”. El artículo “The Effect of Roller and Spinner Wire Straightening on Coiling Performance
and Wire Properties” (Springs 1987: 27-28) reporta sobre las propiedades de la tensión de alambre.
Suponga que se selecciona una muestra de 16 alambres y cada uno se somete a prueba para determinar
su resistencia a la tensión (N/mm2 ). La media y desviación estándar muestrales resultantes son 2160
y 30, respectivamente. En una máquina enderezadora rotatoria se sabe que la resistencia media a la
tensión de resortes es de 2150 N/mm2 .
¿Existe evidencia para indicar que la resistencia media a la tensión del método de rodillos excede de
2150 N/mm2 ?. Suponga la resistencia a la tensión es aproximadamente normal y considere α = 0.05
Solución:
La muestra es pequeña, n = 16, y la distribución de la resistencia a la tensión es aproximadamente
normal.
n = 16, x = 2160, sx = 30, α = 0.05
1. Hipótesis: Se indica que la resistencia media a la tensión del método de rodillos excede de 2150,
así las hipótesis son
H0 : µ ≤ 2150
H1 : µ > 2150, lado derecho.
3. Estadístico de prueba:
X − µ0
T= √ ∼ tν , ν = n − 1 = 16 − 1 = 15,
S/ n
H1 : µ > 2150 →RC = tα,ν, +∞
RC = (1.753, +∞) 1−α
α
−4 −2 0 2 4
5. Valor calculado:
x − µ0 2160 − 2150
tc = √ = √ = 1.3333
s/ n 30/ 16
15
Inferencia Estadística 3. PH para µ: varianza es desconocida
16
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.5
El artículo “Orchard Floor Management Utilizing Soil Applied Coal Dust for Frost Protection” (Agri.
and Forest Meteorology, 1988: 71-82) reporta los siguientes valores de flujo de calor a través del suelo de
ocho solares cubiertos con polvo de hulla.
El flujo de calor medio a través del suelo en solares cubiertos sólo con césped es de 29.0. Suponiendo que
la distribución del flujo de calor es aproximadamente normal, ¿sugieren los datos que el polvo de hulla
es eficaz para incrementar el flujo medio de calor sobre el del césped? Pruebe las hipótesis apropiadas
con α =0.05.
17
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.6
Joans Nursery se especializa en jardines de zonas residenciales, de acuerdo con el diseño del cliente. La
estimación del precio de un proyecto se basa en el número de árboles, arbustos, etc., a emplear en el
proyecto. Para propósitos de estimación de costos, los administradores consideran que se requieren dos
horas de trabajo para plantar un árbol mediano. A continuación se presentan los tiempos (en horas)
realmente requeridos en una muestra de 10 árboles plantados el mes pasado.
1. Hipótesis: De acuerdo con el enunciado, se desea saber si el tiempo necesario promedio para
plantar los árboles difiere (diferente) de 2 horas, así las hipótesis son
H0 : µ = 2
H1 : µ , 2, bilateral.
2. Nivel de la prueba: α=0.05
3. Estadístico de prueba:
X − µ0
T= √ ∼ tν , ν = n − 1 = 10 − 1 = 9,
S/ n
4. Región crítica: dos lados o bilateral
H1 :µ > 2150
RC = (−∞, −tα/2 ) ∪ (tα/2 , +∞) 1−α
= (−∞, −2.262) ∪ (2.262, +∞) α α
2 2
−4 −2 0 2 4
5. Valor calculado:
x − µ0 2.2 − 2
tc = √ = √ = 1.2247
s/ n 0.5164/ 10
6. Decisión: el tc no pertenece a la región crítica, luego no se rechaza H0 . Luego, existe evidencia
para indicar que se requieren dos horas de trabajo en media para plantar un árbol mediano.
18
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.7
Usted es gerente de un restaurante que entrega pizzas en la residencia universitaria de la universidad
Continental. Hace poco modificó su proceso de entrega en un esfuerzo por reducir el tiempo medio
que transcurre actualmente entre el pedido y la entrega que es de 25 minutos. Una muestra de 26
pedidos que se atienden con el nuevo proceso de entrega produce una media muestral de 22.4 minutos y
una desviación estándar muestral de 6 minutos. ¿Existe evidencia de que el tiempo medio de entrega
poblacional es menor que 25 minutos? Use α = 0.05 y suponga que los datos son tomados de una
población normal.
19
Inferencia Estadística 3. PH para µ: varianza es desconocida
Ejemplo 3.8
Un documental televisivo acerca de comer en exceso afirmaba que los estadounidenses tienen un
sobrepeso aproximado de 10 libras en promedio. Para probar esta afirmación, examinaron a 18 individuos
elegidos aleatoriamente, y encontraron que su sobrepeso promedio era 12.4 libras, con una desviación
estándar de la muestra de 2.7 libras.
A un nivel de significancia de 0.01, ¿hay alguna razón para dudar de la validez del valor afirmado de 10
libras?. Suponga que la muestra es tomada de una población aproximadamente normal.
20
Inferencia Estadística 4. PH para p: Muestra grande
1. Planteo de hipótesis
2. Nivel de la prueba: α
3. Estadístico de prueba:
P̂ − p0
Z= q ∼ N (0, 1)
p0 (1−p0 )
n
4. Región crítica:
5. Valor calculado:
p̂ − p0
zc = q
p0 (1−p0 )
n
21
Inferencia Estadística 4. PH para p: Muestra grande
Ejemplo 4.1
Una muestra aleatoria de 300 componentes electrónicos fabricados mediante un proceso específico
se muestrea y se encuentra que 25 están defectuosos. Sea p la proporción de componentes fabricados
mediante este proceso que presentan defectos. El ingeniero responsable de la producción afirma que
p ≤0.06. ¿La muestra proporciona suficientes evidencias para rechazar la afirmación?. Use α = 0.05
Solución:
Del problema se tiene que la muestra es grande
25
n = 300, p=
b = 0.0833, α = 0.05
300
1. Planteo de hipótesis
Lado derecho
H0 : p ≤ 0.06
H1 : p > 0.06
3. Estadístico de prueba:
P̂ − p0
Z= q ∼ N (0, 1)
p0 (1−p0 )
n
4. Región crítica:
−4 −2 0 2 4
5. Valor calculado:
p̂ − p0 0.0833 − 0.06
zc = q = q = 1.6993
p0 (1−p0 ) 0.06(1−0.06)
n 300
6. Decisión y conclusión: El valor calculado zc =1.6993 esta en la región crítica (región de rechazo),
entonces se rechaza H0 .
La muestra proporciona evidencia suficiente para rechazar la afirmación del ingeniero, con α =
0.05.
22
Inferencia Estadística 4. PH para p: Muestra grande
Ejemplo 4.2
Un fabricante de estaciones de trabajo de computadora está probando un nuevo proceso de ensamble
automatizado. El proceso actual tiene una tasa de defectos de 5 %. En una muestra de 400 estaciones de
trabajo ensambladas con el nuevo proceso, 15 tenían defectos. ¿Se puede concluir que el nuevo proceso
tiene una tasa menor de defectos? Use α = 0.10.
23
Inferencia Estadística 4. PH para p: Muestra grande
Ejemplo 4.3
Una empresa telefónica desea investigar la conveniencia de iniciar una campaña de marketing que
ofrezca a los clientes el derecho de contratar una linea telefónica adicional a un costo de instalación
muy reducido. La campaña se iniciará si existe evidencia de que del 20 % de los clientes consideran la
posibilidad contratar una linea telefónica adicional. Se selecciona una muestra aleatoria de 500 hogares.
Los resultados indican que 135 de hogares contratarían la linea telefónica adicional. Con un nivel de
significación de α = 0.05, ¿existe evidencia de que más del 20 % de los clientes contratarían la línea
telefónica adicional?
24
Inferencia Estadística 5. p-valor
5 p-valor
En el procedimiento de una prueba de hipótesis, se supone que la hipótesis nula es verdadera, esto
permitirá indicar el estadístico de prueba a menos que los datos proporcionen un evidencia de H0 . Para
rechazar la H0 , el valor calculado del estadístico de prueba debe estar en la RC.
Una forma alterna para rechazar H0 es por medio del uso del p-valor, conocido también como valor p
(en ingles es conocido como p-value).
Casi todos los programas de computadora para análisis de datos incluyen el p-valor cuando se
ejecuta una prueba de hipótesis.
Nota: El p-valor es también denominado nivel de significación observado.
25