Está en la página 1de 10

ALGUNOS EJEMPLOS RESUELTOS SOBRE ESTIMACIÓN PUNTUAL Y POR

INTERVALOS Y PRUEBAS DE HIPÓTESIS.

Ejemplo 1:
Para probar la efectividad de un nuevo spray para controlar ácaros del tizón nos gustaría comparar el
rendimiento medio para árboles tratados con el rendimiento promedio para árboles no tratados
manifestado en años anteriores. Se tomó una muestra aleatoria de 30 arboledas de ½ hectárea y se
rociaron con el spray de acuerdo al plan recomendado. El rendimiento medio para la muestra de los 30
árboles fue de 830 bojes (el árbol dominante en todas las arboledas) con una desviación estándar de 91.
Rendimientos de arboledas en la misma área sin el rocío de control del ácaro del tizón había promediado
760 bojes, en los años anteriores. ¿Presentan los datos suficiente evidencia para afirmar que el
rendimiento medio para arboledas rociadas con la nueva presentación es superior a 760 bojes, el
promedio sobre los años anteriores sin rociadura? ¿Es ésta una prueba de una cola o de dos colas? Usa
 = .05

Solución:
Aquí y = número de bojes en una arboleda, mientras que  = número medio de bojes por arboleda.
Hipótesis: H 0 :   760 vs. H A :   760 (prueba de una cola).  =0.05.
Datos: y  830 bojes, s = 91 bojes, n = 30. Luego podemos suponer que   s .
Cálculo del estadístico de prueba:
830  760
z  4.21
91 30
Región de rechazo: Rechace H0 si z  z . Aquí, z  z 0.05  1.645 . Como z  4.21  z 0.05  1.645 ,
rechazamos H0. Tenemos suficiente evidencia para afirmar que el número medio de bojes por arboleda
rociada es mayor que 760.

P  P( z  4.21)  0.00003 .

Ejemplo 2:
Refiriéndose al ejercicio 3, un médico tomó una muestra de 35 hombres saludables (en forma aleatoria).
Las capacidades de ejercicio (tiempo en minutos) fueron:

23 19 36 12 41 43 19
28 14 44 15 46 36 25
35 25 29 17 51 33 47
42 45 23 29 18 14 48
21 49 27 39 44 18 13

Esta muestra de 35 milicianos fue seleccionada de un grupo grande de personal nuevo que estaban siendo
sujetos a un nuevo programa de acondicionamiento físico (y se esperaba que fuera mejor que los
anteriores). Suponga que las pruebas anteriores con varios miles de militares sobre los años previos
habían demostrado una capacidad de ejercicio promedio de 29 minutos. Realiza una prueba estadística
para la hipótesis de investigación de que la capacidad de ejercicio promedio es mejor con el nuevo
programa de acondicionamiento. Da el nivel de significación de la prueba.

1
Solución:
y = capacidad de ejercicio (minutos) de militares bajo el nuevo programa de acondicionamiento físico.
 = capacidad media de ejercicio de esos militares.
Hipótesis: H 0 :   29 min. vs. H 0 :   29 min (prueba de una cola).
Se propone usar  =0.05.
Datos y cálculos: n = 35, y  30.51 min., s = 12.36 min. Podemos suponer que   s .
Cálculo del estadístico de prueba:
30.51  29
z  0.72
12.36 35
Región de rechazo: Rechace H0 si z  z . Aquí, z  z 0.05  1.645 . Como z  0.72  z 0.05  1.645 ,
no rechazamos H0. Los datos muestrales no presentan suficiente evidencia para afirmar que el nuevo
programa de acondicionamiento físico es mejor que el años anteriores.

P  P( z  0.72)  0.2358

Ejemplo 3:
Para cada uno de los siguientes problemas:
a) Formula las hipótesis nula y alternativa apropiadas.
b) Establece si la prueba estadística implicada es de una cola o de dos colas.
c) Establece tus conclusiones en las palabras de cada problema, con base en el valor p y el valor de
 dado en cada uno.

i. Los investigadores clínicos especulan que los niños que toman leche fortificada con calcio tienden
a desarrollar huesos más fuertes y más densos cuando lleguen a adultos y, consecuentemente, es
menos probable que sufran de osteoporosis (una enfermedad que hace los huesos quebradizos).
Si diseñó un estudio efectuado en el Centro de Salud de una universidad norteamericana
(American Journal of Clinical Nutrition, Agosto 1985) para probar si la densidad media de los
huesos de mujeres que tomaron leche en cada comida cuando niñas es mayor que la densidad
media de mujeres de un grupo de control, cuyo valor  0 era conocido. Valor p= .033,  = .05.

ii. Un investigador de la SEMARNAT quiere determinar si el nivel medio de un cierto tipo de


contaminante diseminado en la atmósfera para una compañía química cumple con las normas de
la Secretaría, que es de 3 partes por millón como máximo. Para ello decide tomar una muestra de
mediciones diarias del contaminante, y probar si la compañía está violando la ley. Valor p= .866,
 = .01.

iii. Un investigador biomédico quiere determinar si la edad media de los pacientes de un hospital
admitidos a causa de una enfermedad coronaria es menor que la registrada el año pasado e igual
a  0  48 . Valor p= .025,  = .01.

2
Solución:
i) a) H0:    0 vs. HA:    0
b) De una cola (superior)
c) Como p=0.033 <   0.05 , rechace H0. Los datos presentan suficiente evidencia para afirmar que
la densidad media de los huesos de mujeres que tomaban leche cuando niñas es mayor que  0 .

ii) a) H0:   3 ppm vs. HA:   3 ppm


b) De una cola (superior)
c) Como p=0.866 >   0.01, no rechace H0. La muestra de mediciones no presenta suficiente
evidencia para afirmar que el nivel medio del contaminante es mayor que el máximo señalado
por las normas de la SEMARNAT.

iii) a) H0:   48 vs. HA:   48


b) De una cola (inferior)
c) Como p=0.025 >   0.01, no rechace H0. Los datos tomados por el investigador no presentan
evidencias para afirmar que la edad media de los pacientes del hospital admitidos por enfermedad
coronaria es menor que la registrada el año pasado (que fue de 48 años).

Ejemplo 4:
Un guardabosque afirma que el peso promedio de un venado adulto en una reserva es de 85kg con
una desviación estándar de 7kg. Un cazador furtivo capturó 12 venados cuyo peso promedio era de
90kg. ¿Podemos concluir con una significación del 1%, que el peso promedio de un venado adulto en
la reserva es mayor que 85kg?

Solución:
y = peso de un venado adulto en la reserva (en kg.)
μ = peso medio de un venado adulto en la reserva (en kg.)

H0:   85 kg. vs. HA:   85 kg.;   0.01


Datos: n = 12, y  90 kg., s = 7 kg., GL = n–1=11.
y  0 90  85
Estadístico de prueba: t   2.47
s n 7 12
Región de rechazo: t ,GL  t 0.05,11  2.718
Por tanto, no rechace H0. P = 0.0156.

3
Ejemplo 5:
Uno de los depredadores más temidos en el océano es el gran tiburón blanco. Aunque se sabe que el
gran tiburón blanco crece a una longitud media de 6.5m, un biólogo marino cree que los grandes
tiburones blancos alrededor de la costa de las Bermudas crecen mucho más debido a sus hábitos de
alimentación poco usuales. Para probar ésta afirmación, los investigadores planean capturar una
cantidad de grandes tiburones blancos (que hayan alcanzado un crecimiento completo) alrededor de
la costa de las Bermudas, medirlos y luego liberarlos. Sin embargo, capturar tiburones es muy difícil,
costoso y muy peligroso, por lo que sólo 3 fueron capturados. Sus longitudes son: 7.3m, 6.1m y 6.7m.
a) ¿Proporcionan los datos suficiente evidencia para apoyar la afirmación del biólogo marino?
Prueba a un nivel de significación  = .05.
b) ¿Qué suposiciones se requieren para que la prueba de hipótesis de la parte a. sea válida? ¿Piensas
que éstas suposiciones son posibles de satisfacer en ésta situación experimental particular?

Solución:
a) y = longitud del gran tiburón blanco de las Bermudas (en m.)
μ = longitud media del gran tiburón blanco de las Bermudas (en m.)

H0:   6.5 m. vs. HA:   6.5 m.;   0.05


Datos: n = 3, y  6.7 m., s = 0.6 m., GL = n–1=2.
y  0 6.7  6.5
Estadístico de prueba: t   0.577
s n 0.6 3
Región de rechazo: t ,GL  t 0.05,3  2.920
Por tanto, no rechace H0. P = 0.3022.

Los datos no proporcionan suficiente evidencia para apoyar la afirmación del biólogo marino.

b) Que la variable y se distribuya normalmente. Es difícil que uno tenga elementos suficientes para
asegurar que y satisfaga la normalidad con tan poco datos.

Ejemplo 6:
Una muestra de 20 cangrejos de río de todos tamaños fueron capturados de un lago grande para estimar
la proporción de cangrejos de río que exhibían más de 9 ppb de mercurio. De los que se muestrearon,
8 excedieron las 9 unidades. Usa estos datos para estimar la proporción de todos los cangrejos de río
con un nivel de mercurio mayor que 9 ppb, usando un intervalo del 95% de confianza.

Solución:
Sea π la proporción de todos los cangrejos de río en la población que habita el lago con niveles de
mercurio mayores a 9 ppb.
Y 8
Datos: n = 20, Y = 8, p  ˆ    0.4 . Entonces: q  1  ˆ  0.6 . Notamos que el intervalo:
n 20
pq (0.4)( 0.6)
p3  0.4  3 es: [0.071,0.729], el cual no incluye ni a 0, ni a 1; por tanto, podemos
n 20

4
pq
aplicar la fórmula del intervalo de confianza para p, para muestras grandes: p  z / 2 .
n
1    .95  z / 2  t 0.025  1.96

(0.4)( 0.6)
Intervalo para p: 0.4  (1.96)
20
LIC = 0.185
LSC = 0.615
con una confianza del 95%.

Ejemplo 7:
13. Las personas mayores de 40 años tienden a notar cambios en sus sistemas digestivos que alteran
tanto lo que pueden como la cantidad que deben comer. Se realizó una observación para ver si ésta
observación se aplica en los diferentes segmentos étnicos de nuestra sociedad. Se obtuvieron muestras
aleatorias de Anglo-sajones, Alemanes, Latinoamericanos, Italianos, Españoles y negros. Los datos
de ésta encuesta se resumieron aquí:

Tamaño de muestra que Número que reportó alteración


Grupo étnico respondieron (60 de c/grupo del sistema digestivo.
fueron contactados)
Anglo-sajón 55 7
Alemán 58 6
Latino-americano 52 34
Italiano 54 38
Español 30 20
Negro 49 21

a) Calcula intervalos de confianza del 95% para las proporciones de los individuos de cada grupo
étnico, en cuanto a la alteración del sistema digestivo.
b) Grafica los intervalos de confianza calculados en el inciso a, indicando el grupo étnico en el eje
horizontal y el tamaño de la muestra.

Solución:
a) Se estimará π = proporción de personas con alteración del sistema digestivo, para cada grupo
étnico. Sean Y el número de personas que reportaron alteración en el sistema digestivo y p la
proporción en cada muestra de personas con alteración del sistema digestivo, para cada grupo
étnico; q = 1 – p. Por los tamaños de muestra, se puede usar la fórmula para muestras grandes de
pq
estimación de π por medio de un intervalo del (1–α)×100% de confianza: p  z / 2 . En este
n
caso: 1    .95  z / 2  t 0.025  1.96 . Los límites inferior y superior de confianza (LIC y LSC,
respectivamente) para π se dan en la tabla de abajo.
5
Grupo étnico n Y p Y /n q  1 p LIC LSC
Anglo-sajón 55 7 0.127 0.873 0.039 0.215
Alemán 58 6 0.103 0.897 0.025 0.182
Latino-americano 52 34 0.654 0.346 0.524 0.783
Italiano 54 38 0.704 0.296 0.582 0.825
Español 30 20 0.667 0.333 0.498 0.835
Negro 49 21 0.429 0.571 0.290 0.567

0.9

0.8

0.7 0.704
0.667
0.654

0.6
Proporción

0.5

0.429
0.4

0.3

0.2

0.127
0.1 0.103

0
Anglo-sajón (55) Alemán (58) Latinoamericano (52) Italiano (54) Español (30) Negro (49)

Grupo étnico

Intervalos de confianza del 95% (líneas verticales) para la proporción de personas de seis grupos étnicos que
reportaron alteraciones en su sistema digestivo. La línea horizontal es la proporción estimada. Entre paréntesis, se
da el tamaño de muestra junto a cada grupo étnico.

Ejemplo 8:
Los apicultores de un centro experimental de la Facultad de Veterinaria y Zootecnia utilizan dos
máquinas para llenar con miel botellas de plástico con un volumen neto de 0.6 litros. El proceso de
llenado puede considerarse normal con desviaciones estándar  12 y  22 . En el departamento de
Control de Calidad se sospecha que una máquina está llenando las botellas de una forma muy
variable, ocasionando que a veces se rebosen, o bien, no se llenen con el volumen establecido. De
cada línea de llenado se tomó una muestra aleatoria, y se midieron los volúmenes correspondientes:
6
Volúmenes medidos (en litros)
MÁQUINA 1 MÁQUINA 2
.603 .601 .602 .603
.604 .596 .597 .604
.605 .598 .596 .602
.605 .602 .601 .601
.602 .599 .599 .600

¿Presentan los datos suficiente evidencia para apoyar la hipótesis de investigación de que las dos
máquinas difieren respecto a la desviación estándar de los volúmenes de llenado?

Solución:
La comparación de las desviaciones estándares es equivalente a la comparación de las varianzas.

Llenado de botellas de miel


Máquina 1 Máquina 2
H0:  12   22 n1  10 n2  10
HA:  12   22 y 1  0.6015 l. y 2  0.6005 l.
  0.1 s1  3.027  10 l.3
s 2  2.549  10 3 l.
s12  9.1667  10 6 l2. s 22  6.5  10 6 l2.
GL1  n1  1  9 GL2  n2  1  9

s12 9.1667  10 6
Estadístico de prueba: F   1.4103
s 22 6.5  10 6
Región de rechazo: F  F / 2,GL1 ,GL2 .

Aquí: F / 2,GL1 ,GL2  F0.05,9,9  3.18 . Por tanto, no rechace H0 al nivel de significación   0.1.
[P=0.088]. Los datos observados no presentan suficiente evidencia para afirmar que las desviaciones
estándares de los volúmenes de llenado de las máquinas 1 y 2 son diferentes.
La varianza ponderada es:
GL1 s12  GL2 s 22 (9  9.1667  10 6 )  (9  6.5  10 6 )
sp 
2
  7.833  10 6 l2. Esta es la varianza
GL1  GL2 99
común de los volúmenes de llenado para ambas máquinas.

Ejemplo 9:
Una estación experimental agrícola está interesada en comparar los rendimientos para dos nuevas
variedades de maíz. Debido a que los investigadores piensan que podría haber una mayor distribución
de la variabilidad del rendimiento de un terreno de cultivo a otro, cada variedad fue asignada
aleatoriamente a una parcela de ½ ha, de cada uno de 7 terrenos de cultivo. Se plantaron las parcelas
de ½ ha, y el maíz fue cosechado al llegar su madurez. Los resultados del experimento (en metros
cúbicos de maíz) fueron:

7
TERRENO DE CULTIVO 1 2 3 4 5 6 7
Variedad A 1.70 1.57 1.75 1.43 1.92 1.66 1.81
Variedad B 1.46 1.41 1.55 1.45 1.75 1.47 1.65

Usa éstos datos para probar la hipótesis nula de que no hay diferencia en los rendimientos medios
para las dos variedades de maíz. Usa  = .05.

Solución:
El diseño es de muestras pareadas, cuyo análisis se presenta en la tabla de abajo:

Rendimiento de maíz (m3/0.5ha)


j Variedad A (y1j) Variedad B (y2j) dj = y1j – y2j
1 1.70 1.46 0.24
2 1.57 1.41 0.16
3 1.75 1.55 0.20
4 1.43 1.45 –0.02
5 1.92 1.75 0.17
6 1.66 1.47 0.19
7 1.81 1.65 0.16
d  0.157 , s d  0.083 , GL  n  1  6
n =7
sd  sd n  0.083 7  0.031

H0:  d  0 vs. HA:  d  0 .


 = .05
d 0.157
Estadístico de prueba: t    5.009
s d 0.031
Región de rechazo: t  t / 2,GL . Aquí: t / 2,GL  t 0.025,6  2.447 . Por tanto, rechace H0 al nivel
  0.05 ; los datos observados presentan suficiente evidencia para afirmar de que el rendimiento
medio de la variedad de maíz A es diferente al rendimiento medio de la variedad B. [P=0.0024].

Ejemplo 10:
Se determinaron las concentraciones de óxidos de nitrógeno y de hidrocarburos en una cierta área urbana
en Mérida (registros en  g/m).

a) Prueba la hipótesis de que ambas clases de contaminantes del aire están presentes con la misma
concentración media (fundamenta porqué los datos deben parearse).
b) Calcula el intervalo de confianza del 95% para  d , la media de las diferencias de las cantidades
de los dos contaminantes.
8
Día Óxidos de Nitrógeno Hidrocarburos
1 104 108
2 116 118
3 84 89
4 77 71
5 61 66
6 84 83
7 81 88
8 72 76
9 61 68
10 97 96
11 84 81

Solución:

Concentración (μg/m)
Día Óxidos de Hidrocarburos
dj = y1j – y2j
j Nitrógeno (y1j) (y2j)
1 104 108 –4
2 116 118 –2
3 84 89 –5
4 77 71 6
5 61 66 –5
6 84 83 1
7 81 88 –7
8 72 76 –4
9 61 68 –7
10 97 96 1
11 84 81 3
n=11 d  2.09 , s d  1.29 , GL  n  1  10

a) Los datos deben parearse porque las mediciones de ambos contaminantes se efectúan el mismo
día, pudiendo haber más o menos emisión de ellos en días distintos. El apareamiento controla el
efecto de la variación entre días respecto a las emisiones de contaminantes.

Análisis.
H0:  d  0 vs. HA:  d  0 .
Sea  = .05

9
d  2.09
Estadístico de prueba: t    1.621
sd 1.29
Región de rechazo: t  t / 2,GL . Aquí: t  1.621  t / 2,GL  t 0.025,10  2.228 . Por tanto, no
rechazamos H0 al nivel   0.05 ; los datos observados no presentan suficiente evidencia para
afirmar que las concentraciones de óxido de nitrógeno y de hidrocarburos son diferentes.
[P=0.1360].

b)  d  media de las diferencias y1j – y2j. Se tiene: 1    .95  t / 2,GL  t 0.025,10  2.228
Intervalo de confianza del 95% para  d : d  t / 2,GL sd  2.09  (2.228)(1.29) , Así:
LIC = –4.96 μg/m, LSC = 0.78 μg/m, con una confianza del 95%.

10