Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA NO
PARAMÉTRICA
INTEGRANTES:
LARA JORDI
MAXI KARINA
ORTIZ EDUARDO
PESANTEZ FABIANA
GRUPO: EC 03-04
DOCENTE: ECO. FANNY CABRERA
A.- DEL LIBRO DE NEWBOLD ET AL (2008) CAPÍTULO 14
CAPITULO 14: ESTADÍSTICA NO PARAMÉTRICA
14.2 En 2008, se realizó una encuesta para averiguar cuáles eran los deportes acuáticos favoritos en
Australia y se observó que el 45% de los encuestados votó por el Surfing, el 40% votó por el
submarinismo y el resto votó por otros deportes acuáticos. En 2001, se realizó una encuesta parecida:
de una muestra de 200 encuestados, 102 declararon que preferían el Surfing: 82 eligieron el
submarinismo y los 16 restantes seleccionaron otros deportes acuáticos. ¿Es posible concluir al nivel
del 5% que en 2011 estas referencias seguirían siendo las mismas?
Solución:
Deportes Preferencias %
Surfing 102 45%
Submarinismo 82 40%
Otros Deportes 16 15%
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 8.18 𝑋2,0.05 = 5.99
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑋2,0.05
Se rechaza la hipótesis nula, a un nivel de significancia del 5%, por lo que se puede afirmar que los
gustos con respecto a los deportes cambiaron.
14.3 En una encuesta en línea realizada por un periódico de Hong Kong, el 45% de la gente declaró
que va al gimnasio una vez a la semana, el 25% declaró que va dos veces, el 10% declaró que va tres
veces y el resto declaró que no va. Se recogieron datos por medio de entrevistas telefónicas a 650
personas; 230 respondieron que no van al gimnasio, 150 respondieron que van una vez a la semana,
200 respondieron que van dos veces a las semanas y el resto respondió que va tres veces a la semana.
a) ¿Se puede considerar que es un experimento multinomial? ¿Qué características debe tener para que
se considere como tal?
Se puede afirmar que, si es un experimento multinomial, dado que se va a analizar resultados muestrales,
además este mismo nos permite estudiar más de un hecho, puesto que en este caso se va a analizar a las
personas que van al gimnasio una vez a la semana, dos veces a la semana, tres veces a la semana y
también se analizar a aquellas personas que no asisten.
Una de las principales características que tiene los experimentos multinomiales, es que tengan un
conjunto de datos categorizados, que el resultado de cada ensayo se localiza dentro de una de las “k”
categorías.
b) ¿Utilizaría un contraste de bondad del ajuste? ¿Por qué?
Para el experimento mencionado si, utilizaría el contrate de bondad de ajuste con posibilidades
específicas, dado que nos dan un conjunto de datos independientes con “k” categorías, y que a cada una
de ellas le pertenece una observación y para finalizar nos dan el porcentaje de afirmación para cada
observación.
c) ¿Qué conclusiones extraería? ¿Coinciden los resultados de la encuesta en línea con las entrevistas
telefónicas?
En conclusión, se puede decir que se rechaza la hipótesis nula, con un nivel de significancia del 5%,
por lo que se puede afirmar que lo resultados no coinciden de la encuesta en línea con las entrevistas
telefónicas.
d) En caso contrario ¿podría sugerir alguna razón por la que son diferente?
Bajo mi criterio, se puede afirmar que las personas tienden a ser más honestas en una entrevista, dado
que en una llamada telefónica no se puede predecir al encuestado su nivel de ocupación.
14.5 Una institución benéfica solicita donaciones por teléfono. Se ha observado que el 60 % de todas
las personas contactadas por teléfono se niega a hacer una donación; el 30 % pide más información
por correo con la promesa de que considerará al menos la posibilidad de donar; y el 10 % hace
inmediatamente una donación por medio de una tarjeta de crédito. En una muestra aleatoria de 100
llamadas realizadas esta semana, 65 personas se negaron a donar, 31 solicitaron más información por
correo y cuatro hicieron inmediatamente una donación por medio de una tarjeta de crédito. Contraste
al nivel del 10 % la hipótesis nula de que la pauta de resultados de esta semana es similar a la pauta
habitual.
Información sobre la donación PREFERENCIAS %
Se niega totalmente a donar 65 60%
Con la posibilidad de más información, considerará donar 31 30%
Inmediatamente dona con su T.C 4 10%
Solución:
Información sobre la donación 𝜗1 𝐸𝑖 (𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜) (𝜗𝑖 − 𝐸𝑖 )2⁄
𝐸𝑖
Se niega totalmente a donar 65 60 0.42
Con la posibilidad de más 31 30 0.03
información, considerará donar
Inmediatamente dona con su T.C 4 10 3.6
TOTAL 100 100 4.05
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 4.05 𝑋2,0.10 = 4.61
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 < 𝑋3,0.10
No se rechaza la hipótesis nula, a un nivel de significancia del 10%, por lo que se puede afirmar que la
pauta de resultados de esta semana si es similar a la pauta habitual.
14.7 En un supermercado se venden varios tipos de yogur. El dueño del supermercado sabe, por un
estudio anterior sobre los sabores elegidos por los clientes, que el 20 % pidió el sabor A, el 35 % pidió
el sabor B, el 18 % pidió el sabor C, el 12 % pidió el sabor D y el resto pidió el sabor E. Ahora el
dueño, que piensa que las preferencias de los clientes han cambiado, toma una muestra aleatoria de
80 clientes y observa que 12 prefieren el A, 16 prefieren el B, 30 prefieren el C, 7 prefieren el E y el
resto prefiere el D. Averigüe si las preferencias de los clientes han cambiado desde el estudio anterior
SABORES PREFERENCIAS %
Sabor A 12 20%
Sabor B 16 35%
Sabor C 30 18%
Sabor D 15 12%
Sabor E 7 15%
Solución:
Sabores 𝜗1 (𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) 𝐸𝑖 (𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜) (𝜗𝑖 − 𝐸𝑖 )2⁄
𝐸𝑖 (Ji − Cuadrado)
Sabor A 12 16 1
Sabor B 16 28 5.14
Sabor C 30 14.4 16.9
Sabor D 15 9.6 3.04
Sabor E 7 12 2.08
TOTAL 80 80 28.16
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 28.16 𝑋4,0.05 = 9.49
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑋4,0.05
Se rechaza la hipótesis nula, a un nivel de significancia del 5%, por lo que se puede afirmar que los
clientes si han cambiado de preferencia con respecto al estudio anterior
14.10. Se ha pedido a una muestra aleatoria de profesores de estadística que contesten a una encuesta
que contiene preguntas sobre el contenido del plan de estudios, la integración del uso de ordenadores
y las preferencias por los programas informáticos. De las 250 respuestas, 100 profesores han indicado
que prefieren el paquete estadístico M y 80 el programa informático E, mientras que el resto está
repartido por igual entre el programa informático S y el P. ¿Indican los datos que los profesores
prefieren alguno de estos programas informáticos?
Paquete Informático 𝜗𝑖 𝐸𝑖 (𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜) (𝜗𝑖 − 𝐸𝑖 )2⁄
𝐸𝑖 (Ji-Cuadrado)
M (Paquete Estadístico) 100 62.5 22.5
E (Programa Informático) 80 62.5 4.9
S (Paquete de S) 35 62.5 12.1
P (Paquete de P) 35 62.5 12.1
TOTAL 250 250 51.6
𝑃 = 1⁄4 = 0.25
Contraste de Hipótesis:
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 51.6 𝑋3,0.05 = 7.82
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑋3,0.05
Se rechaza la hipótesis nula, a un nivel de significancia del 5%, por lo que se puede afirmar que los
profesores no prefieren algunos de esos programas.
14.11. Durante un periodo de 100 semanas, se observó el número semanal de averías de una máquina
y se anotó en la tabla adjunta. Se observó que el número semanal medio de averías fue de 2,1 en este
periodo. Contraste la hipótesis nula de que la distribución poblacional de las averías es de Poisson.
Respuesta:
Valor Esperado (𝐸1 ) =P(x) * Total 𝜆 = 2.1
𝑒 −𝜆 ∗ 𝜆𝑥
𝑃(𝑥) =
𝑋!
𝑒 −0.021 ∗ 0.0210 𝑒 −0.021 ∗ 0.0214
𝑃(0) = = 0.122 𝑃(4) = = 0.099
0! 4!
𝑒 −0.021 ∗ 0.0211
𝑃(1) = = 0.257 𝑃(≥ 5) = 1 − 𝑃(𝑥 < 5) = 0.063
1!
𝑒 −0.021 ∗ 0.0212
𝑃(2) = = 0.27
2!
𝑒 −0.021 ∗ 0.0213
𝑃(3) = = 0.189
3!
Numero de 𝜗1 (𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) 𝐸1 (𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜) 𝜗 − 𝐸1 (𝜗 − 𝐸1 )2 (𝜗 − 𝐸1 )2
Averías 𝐸1
0 10 (0.122*100) =12.2 -2.2 4.84 0.396
1 24 (0.257*100) =25.7 -1.7 2.89 0.112
2 32 (0.270*100) =27 5 25 0.925
3 23 (0.189*100) =18.9 -5.9 34.81 0.889
4 6 (0.099 *100) =9.9 -3.9 15.21 1.536
5 o mas 5 (0.063*100) =6.3 -1.3 1.69 0.268
TOTAL 100 -------- ----- ------- 4.126
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 4.126 𝑋4,0.05 = 9.488
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 < 𝑋4,0.05
No se rechaza la hipótesis nula, a un nivel de significancia del 5%
14.12 En un periodo de 100 minutos, pasó por el puesto de peaje de una autopista un total de 190
vehículos. La tabla adjunta muestra la frecuencia de llegadas por minuto en este periodo. Contraste la
hipótesis nula de que la distribución poblacional es de Poisson.
Respuesta:
Valor Esperado (𝐸1 ) =P(x) * Total 𝜆 = 1.9
𝑒 −𝜆 ∗ 𝜆𝑥
𝑃(𝑥) =
𝑋!
𝑒 −1.9 ∗ 1.90
𝑃(0) = = 0.149 𝑃(≥ 4) = 1 − 𝑃(𝑥 < 5) = 0.128
0!
𝑒 −1.9 ∗ 1.91
𝑃(1) = = 0.284
1!
𝑒 −1.9 ∗ 1.92
𝑃(2) = = 0.269
2!
𝑒 −1.9 ∗ 1.93
𝑃(3) = = 0.170
3!
Llegadas por 𝜗1 (𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) 𝐸1 (𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜) 𝜗 − 𝐸1 (𝜗 − 𝐸1 )2 (𝜗 − 𝐸1 )2
minuto 𝐸1
0 10 (0.149*100) =14.9 -4.9 24.01 1.61
1 26 (0.284*100) =28.4 -2.4 5.76 0.20
2 35 (0.269*100) =26.9 8.1 65.61 2.44
3 24 (0.170*100) =17 7 49 2.88
4 o mas 5 (0.128 *100) =12.8 -7.8 60.84 4.75
TOTAL 100 -------- ----- ------- 11.88
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 11.88 𝑋3,0.05 = 7.815
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑋4,0.005
Se rechaza la hipótesis nula, a un nivel de significancia del 5%
14.16 Una muestra aleatoria de 125 saldos de titulares de una tarjeta de crédito indica que el sesgo
muestral es 0,55 y la curtosis muestral es 2,77. Contraste la hipótesis nula de que la distribución
poblacional es normal.
Respuesta:
(𝑆𝑒𝑠𝑔𝑜)2 (𝐶𝑢𝑟𝑡𝑜𝑠𝑖𝑠 − 3)2
𝐽𝑎𝑟𝑞𝑢𝑒 𝐵𝑒𝑟𝑎(𝐽𝐵) = 𝑛 [ + ]
6 24
(0.55)2 (2.77 − 3)2
𝐽𝑎𝑟𝑞𝑢𝑒 𝐵𝑒𝑟𝑎(𝐽𝐵) = 125 [ + ]
6 24
𝐽𝑎𝑟𝑞𝑢𝑒 𝐵𝑒𝑟𝑎(𝐽𝐵) = 6.58
Contraste de hipótesis:
𝐽𝐵𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 6.58
𝐽𝐵125,0.5 = 4.34
14.18 Las autoridades universitarias han recogido la siguiente información sobre la calificación media
de los alumnos y la carrera que han estudiado. Averigüe si existe alguna asociación entre la
calificación media y los estudios realizados.
Resolución:
Estudios Realizados Calificación media <3.0 Calificación media 3.0 o mas TOTAL
Humanidades 50 35 85
Empresariales 45 30 75
Música 15 25 40
TOTAL 110 90 200
Observaciones esperadas:
𝑅𝑖 ∗ 𝐶𝑗
𝐸𝑖𝑗 (𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜) =
𝑛
85 ∗ 110 85 ∗ 90
𝐸𝑖𝑗 = = 46.75 𝐸𝑖𝑗 = = 38.25
200 200
75 ∗ 110 75 ∗ 90
𝐸𝑖𝑗 = = 41.25 𝐸𝑖𝑗 = = 33.75
200 200
40 ∗ 110 40 ∗ 90
𝐸𝑖𝑗 = = 22 𝐸𝑖𝑗 = = 18
200 200
Estudios Realizados Calificación media <3.0 Calificación media 3.0 o mas
Humanidades 46.75 38.25
Empresariales 41.25 33.75
Música 22 18
𝑟 𝑐
2 (𝐽𝑖
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )2
𝑋 − 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜) = ∑ ∑( )
𝐸𝑖𝑗
𝑖=1 𝑗=1
Contraste de hipótesis
𝑋 2 = 0.23 + 0.34 + 2.23 + 0.27 + 0.42 + 2.72
2 2
𝑋𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 6.21 𝑋2,0.5 = 5.99 (𝑗𝑖 − 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑎𝑑𝑜)
2 2
𝑋𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 6.21 > 𝑋2,0.5 = 5.99
Conclusión: Por lo tanto, se rechaza la hipótesis nula a un nivel de significancia del 5%, por lo que no
existe alguna asociación entre la calificación media y los estudios realizados.
14.19 Un creciente número de distritos escolares públicos está utilizando el iPad como instrumento
didáctico. Por ejemplo, un centro de enseñanza secundaria de Long Island distribuyó recientemente 47
iPads entre los alumnos y los maestros de dos clases de humanidades y tiene la esperanza de que con
el tiempo los 1.100 alumnos tengan un iPad (Hu, 2011). Los educadores discrepan sobre los beneficios
académicos del iPad. Es necesario realizar muchas investigaciones para saber si el iPad mejora el
aprendizaje o es simplemente otra moda tecnológica. Suponga que se encuestara a una muestra
aleatoria de maestros de enseñanza secundaria (de matemáticas, historia, ciencias y lengua) y se les
preguntará si creen que el iPad mejora el aprendizaje. Averigüe si existe una asociación entre la
materia enseñada y la respuesta a esta pregunta.
¿Mejora el iPad el aprendizaje?
Materias Si No TOTAL
Matemáticas 68 32 100
Historia 70 30 100
Ciencias 60 50 110
Lengua 50 40 90
TOTAL 248 152 400
Observaciones esperadas:
𝑅𝑖 ∗ 𝐶𝑗
𝐸𝑖𝑗 (𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜) =
𝑛
100 ∗ 248 100 ∗ 152
𝐸𝑖𝑗 = = 62 𝐸𝑖𝑗 = = 38
400 400
100 ∗ 248 100 ∗ 152
𝐸𝑖𝑗 = = 62 𝐸𝑖𝑗 = = 38
400 400
110 ∗ 248 110 ∗ 152
𝐸𝑖𝑗 = = 68.2 𝐸𝑖𝑗 = = 41.8
400 400
90 ∗ 248 90 ∗ 152
𝐸𝑖𝑗 = = 55.8 𝐸𝑖𝑗 = = 34.2
400 400
𝑟 𝑐
2 (𝐽𝑖
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )2
𝑋 − 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜) = ∑ ∑( )
𝐸𝑖𝑗
𝑖=1 𝑗=1
Contraste de hipótesis:
𝑋 2 = 0.58 + 1.03 + 0.99 + 0.60 + 0.95 + 1.68 + 1.61 + 0.98
2 2
𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 8.42 𝑋3,0.5 = 7.82 (𝑗𝑖 − 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑎𝑑𝑜)
2 2
𝑋𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 8.42 > 𝑋3,0.5 = 7.82
Conclusión: Se rechaza la hipótesis nula, a un nivel de significancia del 5%, por lo tanto, no existe
asociación entre la materia enseñada.
14.20. ¿Cómo se enteran los clientes de la existencia de un nuevo producto? Se ha encuestado a una
muestra aleatoria de 200 usuarios de un nuevo producto para averiguarlo. También se han recogido
otros datos demográficos como la edad. Los encuestados eran 50 personas de menos de 21 años y 90
de entre 21 y 35; el resto tenía más de 35 años. El 60 % de las personas de menos de 21 años había
oído hablar del producto a un amigo y el resto había visto un anuncio en la prensa local. Un tercio de
las personas del grupo de edad 21-35 había visto el anuncio en la prensa local. Los otros dos tercios
habían oído hablar del producto a un amigo. Solo el 30 % de las personas de más de 35 años había
oído hablar del producto a un amigo, mientras que el resto había visto el anuncio en la prensa local.
Elabore una tabla de contingencia para las variables edad y forma de enterarse de la existencia del
producto. ¿Existe una asociación entre la edad del consumidor y el método por el que se enteró de la
existencia del nuevo producto?
Solución:
50 30 20
90 60 30
60 18 42
1.-Hipotesis
𝐻0: 𝐸𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑛𝑢𝑛𝑔𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑓𝑜𝑟𝑚𝑎 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑛𝑡𝑒𝑟𝑎𝑟𝑜𝑛 𝑑𝑒𝑙 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜
𝐻1: 𝐶𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
2.Tabla de observaciones esperadas
Se rechaza la hipótesis nula de que no existe alguna asociación entre la edad y el medio de enterarse
de la existencia del nuevo producto con un nivel de significancia del 1%.
14.22. Se pide a una muestra aleatoria de 12 analistas financieros que predigan cuánto subirán en
términos porcentuales los precios de las acciones ordinarias de dos empresas el próximo año. La
tabla muestra los resultados obtenidos. Utilice el contraste de signos para contrastar la hipótesis
nula de que en la población de analistas no hay una preferencia general por la subida del precio de
las acciones de una de las empresas o por la subida del precio de las acciones de la otra.
14.24. Se pregunta a una muestra de 11 encargados de supermercados que tienen una caja rápida si
sus clientes tienen una actitud positiva hacia la caja rápida. Siete contestan «sí» y cuatro contestan
«no». Contraste la hipótesis nula de que, en la población de encargados, las respuestas se reparten
por igual entre «sí» y «no» frente a una hipótesis alternativa bilateral.
Actitud del
Encargados
cliente
7 Si
4 No
𝑛 = 11
𝑆 = 7 𝜇 = 𝑛𝑝 = 0.5 ∗ 𝑛 = 0.5 ∗ 11 = 5.5
𝜎 = 𝑛𝑝(1 − 𝑝) = √0.25𝑛 = 0.5√𝑛 = 0.5√11 = 1.66
𝑆∗ − 𝜇
𝑧=
𝜎
𝑆 = 7 > 𝜇 = 5.5 𝑆 ∗ = 𝑆 − 0.5 = 7 − 0.5 = 6.5
6.5 − 5.5
𝑧= = 0.6
1.66
𝑧 = 0.6 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 ∗ (0.2743) = 0.5486
Se puede rechazar la hipótesis nula de que en la población de los encargados se reparten por igual
entre sí y no a todos los niveles de significancia superior a 54,8%.
14.25. Se ha examinado una muestra de 75 empresas que recompraron franquicias. En estos casos,
los rendimientos de las acciones ordinarias en torno a la fecha de anuncio de la recompra fueron
positivos 52 veces, negativos 15 y cero 8. Contraste la hipótesis nula de que los rendimientos
positivos y los negativos son igual de probables frente a la hipótesis alternativa de que los positivos
son más probables.
Rendimientos Signo
52 positivos
15 negativos
8 cero
Total 67
𝑛 = 67
S = 52
1.Hipotesis
𝐻0 : 𝑃 = 0.5 𝑙𝑜𝑠 𝑟𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 𝑦 𝑙𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙 𝑑𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠
𝐻1 : 𝑃 > 0.5 𝑚𝑎𝑠 𝑑𝑒𝑙 50% 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 𝑠𝑜𝑛 𝑚𝑎𝑠 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠
𝜇 = 𝑛𝑝 = 0.5 ∗ n = 0.5 ∗ 67 = 33.5
𝜎 = 𝑛𝑝(1 − 𝑝) = √0.25𝑛 = 0.5√𝑛 = 0.5√67 = 4.09
2.Estadistico del contraste
𝑆∗ − 𝜇
𝑧= 𝑆 = 52 > 𝜇 = 33.5 𝑆 ∗ = 𝑆 − 0.5 = 52 − 0.5 = 51.5
𝜎
51.5 − 33.5
𝑧= = 4.4
4.09
14.28. Se pide a una muestra aleatoria de 120 compradores que comparen dos nuevas bebidas
energéticas. Sesenta y cinco miembros de la muestra preferían la bebida A, 53 preferían la B y dos no
manifestaron ninguna preferencia. Utilice la aproximación normal para averiguar si hay una
preferencia general por una de las dos bebidas.
Miembros A B ninguna Total
Preferencia 65 53 2 118
S = 65
1.Hipotesis
𝐻0 : 𝑃 = 0.5 𝑛𝑜 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎
𝐻1 : 𝑃 ≠ 0.5 𝑡𝑖𝑒𝑛𝑒𝑛 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑝𝑜𝑟 𝑎𝑙𝑔𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑜𝑠
𝜇 = 𝑛𝑝 = 0.5 ∗ n = 0.5 ∗ 118 = 59
𝜎 = 𝑛𝑝(1 − 𝑝) = √0.25𝑛 = 0.5√𝑛 = 0.5√118 = 5.43
2.Estadistico del contraste
𝑆∗ − 𝜇 𝑆 = 65 > 𝜇 = 59 𝑆 ∗ = 𝑆 − 0.5 = 59 − 0.5 = 58.5
𝑧=
𝜎
58.5 − 59
𝑧= = −0.09
5.43
𝑧 = −0.09 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.9282
Para valores mayores de significancia del 9% se rechaza la hipótesis nula de que no se tiene
preferencia.
14.29. Se pide a una muestra aleatoria de diez estudiantes que valoren en una cata a ciegas la
calidad de dos marcas de helado, una con poco azúcar y una normal. Las valoraciones se basan en
una escala de 1 (mala) a 10 (excelente). La tabla adjunta muestra los resultados. Utilice el contraste
de Wilcoxon para contrastar la hipótesis nula de que la distribución de las diferencias pareadas está
centrada en 0 frente a la hipótesis alternativa de que la población de todos los estudiantes
consumidores de helado prefiere la marca normal.
Poco
Estudiante azúcar Normal Diferencia Puesto (+) puesto (-)
A 2 6 -4 7.5
B 3 5 -2 4
C 7 6 1 1.5
D 8 8 0
E 7 5 2 4
F 4 8 -4 7.5
G 3 9 -6 9
H 4 6 -2 4
I 5 4 1 1.5
J 6 9 -3 6
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑝𝑢𝑒𝑠𝑡𝑜𝑠 7; 38
𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 𝑇 𝑑𝑒 𝑤𝑖𝑙𝑐𝑜𝑛𝑥𝑜𝑛 min (7,38)
𝐻0 : 𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑝𝑎𝑟𝑒𝑎𝑑𝑎𝑠 𝑒𝑠𝑡𝑎 𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑎 𝑒𝑛 0
𝐻𝑎 : 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑐𝑜𝑛𝑠𝑢𝑚𝑖𝑑𝑜𝑟𝑒𝑠 𝑑𝑒 ℎ𝑒𝑙𝑎𝑑𝑜 𝑝𝑟𝑒𝑓𝑖𝑒𝑟𝑒 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝑇𝛼 = 9
Contraste
𝑇 = 7 < 𝑇0.05 = 9
Se rechaza la hipótesis nula con un nivel de confiabilidad del 95% es decir que si existen diferencias y
no está centrada en 0. Y se rechaza a los niveles de alfa superiores a 3.8%.
𝜎𝑇 = 74.397
Contraste
𝑇 − 𝑢𝑇 281 − 410
𝑧= 𝑧= = −1.73
𝜎𝑇 74.397
14.32. Un consultor tiene interés en saber cómo afecta la introducción de un programa de gestión de
la calidad total a la satisfacción de los trabajadores en el trabajo. Se pide a una muestra aleatoria de
30 trabajadores que valore el nivel de satisfacción en una escala de 1 (muy insatisfecho) a 10 (muy
satisfecho) tres meses antes de que se introduzca el programa. Se pide a los miembros de esta misma
muestra que hagan esta valoración de nuevo tres meses después de la introducción del programa. Se
calculan las 30 diferencias entre los pares de valoraciones y se ordenan las diferencias absolutas. La
suma menor de todas las sumas de los puestos, que es la de los que están más satisfechos antes de la
introducción del programa, es de 169. ¿Qué conclusiones pueden extraerse de este resultado?
𝑛 = 30
𝐿𝑎 𝑠𝑢𝑚𝑎 𝑚𝑒𝑛𝑜𝑟 = 169 = 𝑇
𝐻0 : 𝐿𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑣𝑎𝑙𝑜𝑟𝑎𝑛 𝑑𝑒 𝑖𝑔𝑢𝑎𝑙 𝑎𝑛𝑡𝑒𝑠 𝑦 𝑑𝑒𝑠𝑝𝑢𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 3 𝑚𝑒𝑠𝑒𝑠
14.33. Se toma una muestra aleatoria de 80 propietarios de magnetoscopios. Se pide a cada uno de
los miembros de la muestra que valore la cantidad de tiempo que dedica al mes a ver los programas
de televisión que ha grabado y a ver las cintas alquiladas. A continuación, se calculan las 80
diferencias entre las cantidades de tiempo y se ordenan sus valores absolutos. La menor de las sumas
de los puestos correspondientes a los programas de televisión grabados es de 1.502. Analice las
implicaciones de este resultado.
𝑛 = 80
𝐿𝑎 𝑠𝑢𝑚𝑎 𝑚𝑒𝑛𝑜𝑟 = 1502 = 𝑇
𝐻0 : 𝐿𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑚𝑖𝑒𝑚𝑏𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑎𝑛 𝑝𝑜𝑟 𝑖𝑔𝑢𝑎𝑙 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑞𝑢𝑒 𝑑𝑒𝑑𝑖𝑐𝑎 𝑎𝑙 𝑚𝑒𝑠 𝑎 𝑣𝑒𝑟 𝑙𝑜𝑠 𝑝𝑟𝑜𝑔𝑟𝑎𝑚
𝐻𝑎 : 𝐿𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑚𝑖𝑒𝑚𝑏𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑎𝑛 𝑚𝑎𝑠 𝑙𝑜𝑠 𝑝𝑟𝑜𝑔𝑟𝑎𝑚𝑎𝑠 𝑒𝑛 𝑐𝑖𝑛𝑡𝑎𝑠 𝑎𝑙𝑞𝑢𝑖𝑙𝑎𝑑𝑎𝑠
𝑛(𝑛 + 1) 80(80 + 1)
𝐸(𝑇) = 𝜇𝑇 = 𝜇𝑇 = = 1620
4 4
𝜎𝑇 = 510.71
𝑛(𝑛 + 1)(2𝑛 + 1) 80(80 + 1)(2 ∗ 80 + 1)
𝑉𝑎𝑟(𝑇) = 𝜎𝑇2 = 𝜎𝑇2 = = 43470
24 24
Contraste
𝑇 − 𝑢𝑇 1502 − 1620
𝑧= 𝑧= = −0.566
𝜎𝑇 208.49
¿Indican estos datos que existe una diferencia entre las valoraciones basadas en la carrera
estudiada?
1.Hipotesis
𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑛𝑖𝑛𝑔𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑣𝑎𝑙𝑜𝑟𝑎𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑙 𝑦 𝑙𝑎 𝑐𝑎𝑟𝑟𝑒𝑟𝑎 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑑𝑎
𝐻𝑎 : 𝐶𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛
2.Tabla de observaciones esperadas
Excelente Bueno Medio TOTAL
Administración de empresas 19.1134752 18.4184397 11.4680851 49
Economía 15.212766 14.6595745 9.12765957 39
𝑅𝐼𝐽 𝐶𝐼𝐽
Matemáticas 7.80141844 7.5177305 4.68085106 20 𝐸𝐼𝐽 =
𝑛
Resto 12.8723404 12.4042553 7.72340426 33
TOTAL 55 53 33 141
14.58 Las pautas de turismo son difíciles de predecir; normalmente varían de unos países a otros y a
veces incluso de unos lugares a otros próximos entre sí. En Hong Kong, se realizó una encuesta a
1.600 personas en la que se les preguntó cuál era su destino asiático favorito para pasar unas cortas
vacaciones. Los resultados fueron los siguientes: el 43 % va a China, el 23 % va a Tailandia, el 20 %
va a Filipinas, el 5 % va a Camboya y el resto elige otros países. Esta misma encuesta se ha
realizado en Macao (China), que está solo a una hora de Hong Kong en lancha motora, y los
resultados son los siguientes: 48 %, China; 20 %, Tailandia; 22 %, Filipinas; 3 %, Camboya; y el
resto, otros destinos. ¿Concluiría que las pautas son las mismas en las dos ciudades?
14.59 Un fabricante de electrodomésticos quería saber si existía relación entre el tamaño de las
familias y el tamaño de la lavadora que compraban. Estaba preparando unas directrices para el
personal de ventas y quería saber si este debía hacer recomendaciones específicas a los clientes. Se
preguntó a una muestra aleatoria de 300 familias por su tamaño y por el tamaño de la lavadora. En
las 40 familias en las que había una o dos personas, 25 tenían una lavadora de cinco kilos, diez tenían
una lavadora de seis kilos y cinco tenían una lavadora de siete kilos. En las 140 familias en las que
había tres o cuatro personas, 37 tenían una lavadora de cinco kilos, 62 tenían una lavadora de 6 kilos
y 41 tenían una lavadora de cinco kilos. En las 120 familias restantes en las que había cinco personas
o más, ocho tenían una lavadora de cinco kilos, 53 tenían una lavadora de seis kilos y 59 tenían una
lavadora de siete kilos. Basándose en estos resultados, ¿qué conclusiones pueden extraerse sobre el
tamaño de la familia y el tamaño de la lavadora? Construya una tabla de doble entrada, formule la
hipótesis, calcule el estadístico y extraiga sus conclusiones.
Tamaño de la lavadora
Tamaño de familia 5 6 7 Total
kilos kilos kilos
1o2 25 10 5 40
3o4 37 62 41 140
mas de 5 8 53 59 120
Total 70 125 105 300
𝑋 2 = 58,2
𝑥 2 4,0.05 = 9,487
Se rechaza la hipótesis a un nivel de significancia del 5%lo que significa q no existe asociación entre
el tamaño de la población y el tamaño de las lavadoras.
14.64 ¿Cree que el gobierno debería rescatar a la industria automovilística? Suponga que se hizo
recientemente esta pregunta a 460 estadounidenses. También se les pidió que seleccionaran la
categoría correspondiente a su edad (menos de 30 años; entre 30 y 50; o más de 50). Se observó que
120 encuestados tenían menos de 30 años; 220 pertenecían al grupo de edad de 30 a 50 años; y 120
tenían más de 50 años. En el grupo de encuestados que tenían menos de 30 años, 60 se oponían al
rescate, 40 no tenían opinión y el resto estaba a favor. En el grupo de encuestados de más de 50 años,
dos tercios se oponían al rescate; el resto estaba a favor; y en el grupo de edad de 30 a 50 años, el 60
% se oponía; el 10 % estaba a favor; y el resto no tenía opinión. ¿Existe una relación entre la opinión
y la edad de los encuestados?
Decisión
edad oposición A favor total
menos de 30 60 20 80
30 a 50 132 22 154
más de 50 80 40 120
total 272 82 354
(80)(272) (80)(82)
𝐸11 = = 62,47 𝐸12 = = 18,53
354 354
(154)(272) (154)(82)
𝐸21 = = 118,33 𝐸22 = = 35,67
354 354
(120)(272) (120)(82)
𝐸31 = = 92,20 𝐸32 = = 27,80
354 354
Oi Ei (oi-Ei)^2 (oi-
Ei)^2/Ei
60 61,47 2,16 0,035
20 18,53 2,16 0,117
132 118,33 186,87 1,579
22 35,67 186,87 5,239
80 92,2 148,84 1,614
40 27,8 148,84 5,354
tot 675,74 13,94
𝑋 2 = 58,2
𝑥 2 2,0.05 = 5,9915
Se rechaza la hipótesis nula a un nivel de significancia del 5% lo q quiere decir que no existe
asociación entre la opinión de los encuestados y sus decisiones.
14.73 En una muestra aleatoria de 12 analistas, siete creen que el próximo año las ventas de
automóviles en Estados Unidos probablemente serán mayores que este año, dos creen que serán
mucho menores y los demás prevén que serán más o menos iguales que este año. ¿Qué conclusión
podemos extraer de estos datos?
Es un experimento con solo dos resultados. Sea k el número de veces que observamos el resultado
deseado de n pruebas realizadas del experimento.
Sea p la probabilidad de obtener el resultado deseado en una sola prueba, la distribución binomial
para la variable aleatoria k sería igual a
𝑛
Pr(𝐾 = 𝑘) = ( ) 𝑝𝑘 (1 − 𝑝)𝑛−𝑘
𝑘
𝐻𝑜 : 𝑃 = 0,05
𝐻𝑜 : 𝑃 > 0,05
Entonces:
𝑃 = 0,05
𝑛 = (7 + 2) = 9
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = Pr (𝑥 ≥ 7)
1 − [Pr(𝑋 = 8) + Pr (𝑥 = 9)]
9 9
1 − [( ) 0,58 . 0,5 + ( ) . 0,59 ]
8 8
1 − 0,9805
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,0195
𝑇 = min (13; 8)
𝑇=8
𝑛=6
𝛼 = 0,05
𝑇 2 0.05 = 3
𝑇 = 8 > 𝑇 2 0.05 = 3
Se rechaza la hipótesis nula a un nivel de significancia del 5%.
Libro de Mendenhall- Wackerl
14.2 Registros previos de inscripciones en una gran universidad indican que del número total de
personas que solicitan admisión, 60% son admitidos incondicionalmente, 5% son admitidos
condicionalmente y el resto son rechazados. De 500 solicitantes para el año siguiente, 329 fueron
admitidos incondicionalmente, 43 fueron admitidos condicionalmente y el resto no fueron admitidos.
¿Estos datos indican una desviación de los porcentajes previos de admisión?
𝑋 2 = 28,386
𝑋 2 2,0.05 = 5,99
14.4 ¿Odia usted los lunes? Investigadores en Alemania han dado otra razón para hacerlo:
concluyeron que el riesgo de ataque al corazón en un lunes, para una persona que trabaja, puede ser
hasta 50% mayor que en cualquier otro día. Los investigadores registraron ataques al corazón y
paros cardiacos en un periodo de 5 años entre 330 000 personas que vivían cerca de Augsberg,
Alemania. En un intento por verificar lo dicho por el investigador, se encuestaron 200 trabajadores
que habían tenido ataques al corazón recientemente. El día en el que ocurrieron sus ataques al
corazón aparecen en la tabla siguiente.
¿Estos datos presentan suficiente evidencia para indicar que hay una diferencia en los porcentajes de
ataques al corazón que ocurren en diferentes días de la semana? Pruebe usando α = .05.
Categoría Domingo Lunes Martes Miércoles Jueves Viernes Sábado Total
Numero esperado 28,571 28,571 28,571 28,571 28,571 28,571 28,571 200
Oi Ei (Oi-Ei)^2 (Oi-
Ei)^2/Ei
24 28,571 20,894041 0,7313024
36 28,571 55,190041 1,93168041 𝑋 2 = 3,63 𝑥 2 6.0.05 = 12,59
27 28,571 2,468041 0,08638273
26 28,571 6,610041 0,23135491
32 28,571 11,758041 0,41153761
26 28,571 6,610041 0,23135491
29 28,571 0,184041 0,00644153
Tot 3,6300545
14.4 Imagine que las suposiciones asociadas con un experimento multinomial están todas satisfechas.
Entonces (vea la Sección 5.9) cada una de las ni, i = 1, 2, . . . , k, tienen una distribución binomial con
parámetros n y pi. Además, Cov (ni, nj) = −npi pj si i ≠ j.
a ¿Cuál es E (ni − nj)?
𝐸(𝑛𝑖 − 𝑛𝑗 ) = 𝐸𝑛𝑖 − 𝐸𝑛𝑗 = 𝑛𝑝𝑖 − 𝑛𝑝𝑗
b Consulte el inciso a. Proporcione un estimador insesgado para pi − pj .
𝑛𝑖
𝑝̂𝑖 =
𝑛
𝑛𝑗
𝑝̂𝑗 =
𝑛
𝑝̂𝑖 − 𝑝̂𝑗
14.15 Suponga que las entradas en una tabla de contingencia que aparecen en el renglón i y la
columna j están denotadas por nij, para i = 1, 2, . . . , r y j = 1, 2, . . . , c; que los totales de renglón y
columna están denotados por ri, para i = 1, 2, . . . , r, y cj, para j = 1, 2, . . . , c; y que el tamaño
muestral total es n.
a Demuestre que
Observe que esta fórmula proporciona una forma más eficiente desde el punto de vista computacional
para calcular el valor de X 2.
b Usando la fórmula anterior, ¿qué le ocurre al valor de X 2 si toda entrada en la tabla de contingencia
se multiplica por la misma constante entera k > 0?
14.08 La teoría de Mendel dice que el número de un tipo de chícharos que cae en las clasificaciones
redonda y amarilla, arrugada y amarilla, redonda y verde, y arrugada y verde debe estar en la
proporción 9:3:3:1. Suponga que 100 de estos chícharos revelaron 56, 19, 17 y 8 en las respectivas
categorías. ¿Estos datos son consistentes con el modelo? Use a = .05. (La expresión 9:3:3:1 significa
que 9/16 de los chícharos deben ser redondos y amarillos, 3/16 deben ser arrugados y amarillos, etc.)
Carácter 1 2 3 4
Observaciones 56 19 17 8
Probabilidad 0.56 0.19 0.19 0.06
Esperado 56.25 18.75 18.75 6.25
Ji-cuadrado calculado
𝐾
2
(𝑂𝑖− 𝐸𝑖 )2
𝑋 =∑ 𝑋 2 = 0.001 + 0.003 + 0.163 + 0.49 = 0.658
𝐸𝑖
𝑖=1
Ji - crítico con tres grados de libertad
2 2
𝑋4−1;0.05 = 𝑥3; 0,05 = 7.81473
Contraste
2
𝑋 2 = 0.658 < 𝑥3; 0,05 = 7.81473
Conclusión: No podemos rechazar Ho no hay suficiente evidencia para concluir que la proporción no
es 9:3:3:1.
14.11 Los datos de la tabla siguiente son los conteos de frecuencia para 400 observaciones del
número de colonias bacterianas dentro del campo de un microscopio, usando muestras de película de
leche.2 ¿Hay suficiente evidencia para decir que los datos no se ajustan a la distribución de Poisson?
(Use a = .05.)
1 976
𝜆 = 𝑦̅ = ∑ 𝑦𝑖 𝑓𝑖 = = 2.44
400 400
𝑖
Como a partir de 7 números de colonias por campo el numero de frecuencia es menor a 5 entonces se
considera la siguiente forma
Número de
Frecuencia de Frecuencia
colonias por Pi
observación esperada
campo
0 56 0.0872 34.86
1 104 0.2127 85.07
2 80 0.2595 103.78
3 62 0.2110 84.41
4 42 0.1287 51.49
5 27 0.0628 25.13
6 9 0.0255 10.22
7 y mas 20 0.0126 5.03
Total 400 1.00 400.00
Profesores participantes
Entrada Entrada Entrada Total
Asignación de autoría
elevada media baja
Asesor como primer autor, estudiante 4 0 0 4
Estudiante como primer autor, asesor 15 12 3 30
Estudiante como primer autor, asesor 2 7 7 16
Estudiante como único autor 2 3 5 10
Total 23 22 15 60
Estudiantes participantes
Entrada Entrada Entrada Total
Asignación de autoría
elevada media baja
1 Hipotesis
𝐻0: 𝐸𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑛𝑢𝑛𝑔𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑎𝑠𝑖𝑔𝑛𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑎𝑢𝑡𝑜𝑟𝑖𝑎 𝑐𝑜𝑛 𝑙𝑎 𝑝𝑎𝑟𝑡𝑖𝑐𝑖𝑝𝑎𝑐𝑖𝑜𝑛
𝐻0: 𝐶𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
2.Tabla de observaciones esperadas
Profesores participantes
Entrada Entrada Entrada Total
Asignación de autoría elevada media baja
Asesor como primer autor, estudiante 1.53 1.47 1.00 4
Estudiante como primer autor, asesor 11.50 11.00 7.50 30
Estudiante como primer autor, asesor 6.13 5.87 4.00 16
Estudiante como único autor 3.83 3.67 2.50 10
Total 23 22 15 60
Estudiantes participantes
Entrada Entrada Entrada Total
Asignación de autoría elevada media baja
Asesor como primer autor, estudiante 6.8757764 9.5590062 10.565217 27
Estudiante como primer autor, asesor 22.15528 30.801242 34.043478 87
Estudiante como primer autor, asesor 10.440994 14.515528 16.043478 41
Estudiante como único autor 1.5279503 2.1242236 2.3478261 6
Total 41 57 63 161
a) ¿Hay suficiente evidencia para indicar una dependencia entre la asignación de autoría y la
entrada del asesor, según lo consideren los miembros del profesorado? Pruebe usando a=.01.
Se encontró suficiente evidencia par decir que si existe una relación entre la asignación de
autoría y la entrada del asesor 𝑋21 = 19.0434 > 𝒳(4−1)(3−1),0.01
2
= 𝒳6,2 0.01 = 16.8119
b) ¿Hay suficiente evidencia para indicar una dependencia entre la asignación de autoría y la
entrada del asesor, según lo consideren los estudiantes? Pruebe usando a = .01.
Usando la segunda salida, Chi- cuadrado=60,139, con un valor de p aproximadamente a 0,
puede concluir con un Alpha igual 0,01 que las variables son dependientes.
c) ¿Han sido violadas algunas de las suposiciones necesarias para un análisis válido en los
incisos a y b? ¿Qué efecto podría tener esto en la validez de sus conclusiones?
Algunos de los recuentos de celdas esperados son inferiores a 5, por lo que la aproximación de
chi-cuadrado puede no ser válido ya que la aproximación funciona bien si no más del 20% de
los números esperados es menor a 5 y en este caso representa el 58%.
Si a y d son grandes con respecto a b y c, estaríamos inclinados a decir que las especies tienden a
segregarse. (Casi todas las vecinas de las A son del tipo A, y casi todas las vecinas de las B son del
tipo B.) Si b y c son grandes en comparación con a y d, diríamos que las especies tienden a estar
demasiado revueltas. En cualquiera de estos casos (segregación o demasiado revueltas), una prueba
x2 debe dar un valor grande y la hipótesis de mezcla aleatoria se rechazaría. Para cada uno de los
casos siguientes, pruebe la hipótesis de mezcla aleatoria (o bien, de manera equivalente, la hipótesis
que afi rma que la especie de una planta es independiente de la especie de su vecina más cercana).
Use a = .05 en cada caso.
A.- a = 20, b = 4, c = 8, d = 18.
B.- a = 4, b = 20, c = 18, d = 8.
C.- a = 20, b = 4, c = 18, d = 8.
Vec más
Vec. más Parte B
cerca
Parte A cerca Total
Total Planta
Planta A B
muestreada
muestreada A B
A 4 20 24
A 20 4 24 B 18 8 26
B 8 18 26 Total 22 28 50
Total 28 22 50
Vec más
Parte C
cerca
Total
Planta
A B
muestreada
A 20 4 24
B 18 8 26
Total 38 12 50
1.-- Hipótesis
𝐻0: 𝐴𝑓𝑖𝑟𝑚𝑎 𝑞𝑢𝑒 𝑙𝑎 𝑒𝑠𝑝𝑒𝑐𝑖𝑒 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑙𝑎𝑛𝑡𝑎 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑒𝑠𝑝𝑒𝑐𝑖𝑒 𝑑𝑒 𝑠𝑢 𝑣𝑒𝑐𝑖𝑛𝑎 𝑚𝑎𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑎
Vecina más
Parte C cercana Total
Planta muestreada A B
A 18.2 5.76 24
B 19.8 6.24 26
38 12 50
1.-Se rechaza la hipótesis nula existe relación entre la asignación y la participación en los dos casos A
segregación de especies y B especies mezcladas.
2.- No se rechaza la hipótesis nula existe una independencia
15.10 Se lleva a cabo un experimento de observaciones pareadas que usa n pares de observaciones,
si T+ = la suma de las columnas de los valores absolutos de las diferencias positivas y T – = la suma
de las columnas de los valores absolutos de las diferencias negativas, ¿por qué es T+ + T− = n (n +
1) /2?
𝑛(𝑛 + 1) 𝑛(𝑛 + 1) 𝑛(𝑛 + 1)
𝑇= − 𝑇∗ > 𝐷𝑒𝑏𝑒 𝑠𝑒𝑟 𝑎𝑠𝑖 𝑇 <
2 4 4
Por lo tanto
𝑇 = min(𝑇 ∗ , 𝑇) 𝑇 = 𝑇
15.15 A ocho personas se les pidió ejecutaran un sencillo trabajo de ensamblar un rompecabezas
en condiciones normales y en condiciones de estrés. Durante la condición de estrés, a las personas se
les indicó que se les aplicaría una ligera descarga eléctrica 3 minutos después de empezar el
experimento y cada 30 segundos de ahí en adelante hasta terminar el trabajo. Las lecturas de presión
sanguínea se tomaron en ambas condiciones. Los datos de la siguiente tabla representan la lectura
más alta durante el experimento.
¿Los datos presentan suficiente evidencia para indicar lecturas de presión sanguínea más alta
durante las condiciones de estrés? Analice los datos usando la prueba de rangos con signo de
Wilcoxon para un experimento de observaciones pareadas. Proporcione el valor p apropiado.
1 126 130 -4 5
2 117 118 -1 1
3 115 125 -10 8
4 118 120 -2 2
5 118 121 -3 3.5
6 128 125 3 3.5
7 125 130 -5 6
8 126 120 6 7
Suma de puestos 3.5 32.5
15.16 Se emplearon dos métodos, A y B, para controlar el tránsito en cada uno de n = 12 cruceros
durante una semana. Los números de accidentes que ocurrieron durante este tiempo se registraron en
la siguiente tabla. El orden de uso (cuál método se empleó para la primera semana) se eligió
aleatoriamente para cada crucero
1 5 4 1 +
2 6 4 2 +
3 8 9 -1 -
4 3 2 1 +
5 6 3 3 +
6 1 0 1 +
7 2 3 -1 -
8 4 2 2 +
9 7 9 -2 -
10 5 2 3 +
11 6 5 1 +
12 1 1 0
𝑛 = 11 𝑆= 8
𝐻0 : 𝑝 = 0.5 𝑁𝑜 ℎ𝑎𝑦 𝑡𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑎 𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑟 𝑎𝑙𝑔𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑚𝑒𝑡𝑜𝑑𝑜𝑠
𝐻𝑎 : 𝑝 ≠ 0.5 𝑒𝑥𝑖𝑠𝑡𝑒 𝑡𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑒𝑛 𝑎𝑙𝑔𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑜𝑠 𝑚𝑒𝑡𝑜𝑑𝑜𝑠
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2𝑝(𝑥 ≥ 𝑠) = 2𝑝(𝑥 ≥ 8) = 0.226
Contraste
𝑝 = 0.5 > 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.226
Conclusión; Se rechaza la hipótesis nula de que no hay tendencia a preferir alguno de los métodos.
b Analice estos datos usando la prueba de rangos con signo de Wilcoxon para un experimento de
observaciones pareadas.
1 5 4 1 3.5
2 6 4 2 8.0
3 8 9 -1 3.5
4 3 2 1 3.5
5 6 3 3 10.5
6 1 0 1 3.5
7 2 3 -1 3.5
8 4 2 2 8.0
9 7 9 -2 8
10 5 2 3 10.5
11 6 5 1 3.5
12 1 1 0
Suma de puestos 51 15
Como en la parte a, defina Di = Yi – ξ0 y clasifique el Di de acuerdo con sus valores absolutos según
la prueba de rango firmado de Wilcoxon. Según Teorema del capítulo 15.
15.20 El vocero de una organización que apoya reducciones en impuesto a la propiedad, de cierta
sección de una ciudad, expresó que el ingreso medio anual de los jefes de familia en esa sección era
de $15 000. Una muestra aleatoria de diez jefes de familia de esa sección reveló los siguientes
ingresos anuales:
Con a = .10, pruebe la hipótesis de que el ingreso medio para la población de esa sección es $15 000
contra la alternativa de que sea mayor que $15 000.
a Use la prueba de signos.
Diferencia Signo
-200 -
1900 +
3000 +
4100 +
-1800 -
3500 +
5000 +
𝑛 = 10
S= 2
𝐻0 : 𝑃 = 0.5 𝑒𝑙 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑚𝑒𝑑𝑖𝑜 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 15000
𝐻1 : 𝑃 > 0.5 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑎 15000
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃 ≤ 𝑆 = 𝑃 ≤ 2 = 0.055
𝑃 = 0.5 > 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.055
Conclusión: Se rechaza la hipótesis nula de que el ingreso medio es igual a 15000