Está en la página 1de 111

Laboratorio de Estadística Industrial 2016

“Año de la consolidación del Mar de Grau”

UNIVERSIDAD NACIONAL MAYOR


DE SAN MARCOS

E.A.P. INGENIERÍA INDUSTRIAL

Laboratorio de Estadística Industrial

 Profesor
Ing. Pérez Quispe, Víctor

 Integrantes

 Rondon Quispe, Mario Carlo


 Santillán Villegas, Carolina
 Solis Quipe, Jackeline Milagros

Ciudad Universitaria, 24 de noviembre del 2016

0
Laboratorio de Estadística Industrial 2016

INDICE

Problemas desarrollados utilizando la Distribución Normal………………………………….

…………………… 2

Problemas de Distribución de Muestras Pequeñas (n<30)…………………………………..

…………...………11

Problemas de Regresión

Simple……………………………………………………………………………………………….20

Problemas de Regresión

Múltiple……………………………………………………………………………….……..…..31

Distribución de Bondad de Ajuste: Chi

Cuadrada........................................................................47

Prueba de Independencia

………………………………………………………………………………………………….……53

Problemas aplicando la Distribución de Poisson

………………………………………………………………..……57

Métodos no

Paramétricos……………………………………………………………………………………………….

………61

Prueba de Wilcoxon………………………………………………………….

…………………………………………….………74

1
Laboratorio de Estadística Industrial 2016

Prueba de Mann-Whitney-

Wilcoxon…………………………………………………………………………………….….82

Prueba de Kruskal-Wallis…………………………………………….

………………………………………………………….88

Series de Tiempo…………………………………………………..

……………………………………………………………….94

Problemas aplicativos de Distribución Normal

Problema n°1:

Le han pedido que evalúe la respuesta de las empresas a una nueva obligación legal de
incrementar las prestaciones sanitarias que ofrecen a sus empleados. Tiene una muestra
aleatoria de 76 cambios porcentuales de las prestaciones sanitarias prometidas. La media
muestral de los cambios porcentuales es 0.078 y la desviación típica muestral es 0.201.
Halle e interprete el valor p de un contraste de la hipótesis nula de que la media
poblacional de los cambios porcentuales es 0 frente a la hipótesis alternativa bilateral.

Solución:

Z de una muestra

Prueba de mu = 0 vs. no = 0
La desviación estándar supuesta = 0.201

2
Laboratorio de Estadística Industrial 2016

Error estándar de la
N Media media IC de 99% Z P
76 0.0780 0.0231 (0.0186, 0.1374) 3.38 0.001

p=0.1% <1% entonces se rechaza la hipótesis nula H0.

Problema n°2:
El director de producción de Rodamientos Niquelados, S.A., le ha pedido ayuda para
evaluar el proceso modificado de producción de rodamientos. Cuando el proceso funciona
correctamente, produce rodamientos cuyo peso sigue una distribución normal de media
poblacional 5 onzas y desviación típica poblacional 0.1 onzas. Se ha recurrido a un nuevo
proveedor de materia prima para un lote reciente de producción y el director quiere
saber si, como consecuencia del cambio, el peso medio de los rodamientos es menor. No
hay razón alguna para sospechar que el nuevo proveedor plantea problemas y el director
continuará recurriendo a él a menos que existan pruebas contundentes de que están
produciéndose rodamientos de menor peso que antes. En este problema obtenemos una
muestra aleatoria de n = 16 observaciones y la media muestral es 4.962. Tome la
decisión realizando una prueba de hipótesis por el método clásico y utilizando el valor p.

Haga la prueba con un nivel de significancia = 0.05.

Solución:

En este caso nos interesa saber si existen pruebas contundentes para concluir que están
produciéndose rodamientos de menor peso. Por lo tanto, contrastamos la hipótesis.

Frente a la hipótesis alternativa

Z de una muestra

3
Laboratorio de Estadística Industrial 2016

Prueba de m = 5 vs. < 5


La desviación estándar supuesta = 0.1

Error Estándar Límite de la superior


N Media media 90% Z P
16 4.9620 0.0250 4.9940 -1.52 0.064

Al encontrar p=0.064>0.05 no se rechaza la hipótesis nula Ho.

4
Laboratorio de Estadística Industrial 2016

Problema n°3:

En un estudio se extrajeron muestras aleatorias de empleados de restaurantes de comida


rápida en los que el empresario da formación. En una muestra de 67 empleados que no
habían terminado los estudios secundarios, 11 habían participado en un programa de
formación de la empresa. En una muestra aleatoria independiente de 113 empleados que
habían terminado los estudios secundarios, pero no habían ido a la universidad, habían
participado 27. Contraste al nivel del 1 por ciento la hipótesis nula de que las tasas de
participación de los dos grupos son iguales frente a la hipótesis alternativa de que la tasa
es mucho más baja en el caso de los que no habían terminado los estudios secundarios.

Solución

Prueba e IC para dos proporciones

Muestra X N Muestra p
1 11 67 0.164179
2 27 113 0.238938

Diferencia = p (1) - p (2)

Estimado de la diferencia: -0.0747589

Límite superior 99% de la diferencia: 0.0659300

Prueba para la diferencia = 0 vs. < 0: Z = -1.19 Valor P = 0.117

Valor P = 0.159

p=0.16% <1% entonces se rechaza hipótesis nula H0.

5
Laboratorio de Estadística Industrial 2016

Problema n°4:

En un estudio se tomaron muestras aleatorias independientes de hombres y


mujeres clientes de Centro de Iniciativa Empresarial. Estos clientes estaban
considerando la posibilidad de montar una empresa. De 94 hombres clientes, 53
montaron de hecho una empresa, al igual que 47 de 68 mujeres clientes. Halle e
interprete el valor p de un contraste de la igualdad de las proporciones
poblacionales frente a la hipótesis alternativa de que la proporción de mujeres
clientes que montaron realmente una empresa es mayor que la de hombres.

Solución:

Prueba e IC para dos proporciones

Muestra X N P
1 53 94 0.563830
2 47 68 0.691176

Diferencia = p (1) - p (2)

Estimado de la diferencia: -0.127347

Límite superior 99% de la diferencia: 0.0491375

Prueba para la diferencia = 0 vs. < 0: Z = -1.65 Valor P = 0.050

Prueba exacta de Fisher: Valor P = 0.069

Interpretación: p=5% >1% entonces NO se rechaza hipótesis nula H0.

6
Laboratorio de Estadística Industrial 2016

Problema n° 5:
El precio de venta promedio nacional para casas unifamiliares es de 181900 dólares. Para
una muestra de ventas de 40 casa unifamiliares nuevas en el sur se observó una media
muestral de 166400 dólares y una desviación estándar de 33500 dólares.

a) Formule las hipótesis nula y alternativa que servirán para determinar si los datos
de la muestra sustentan la conclusión de que el precio de ventas promedio
poblacional para las casas unifamiliares nuevas en el sur es menor que la media
nacional de 181900 dólares.
b) ¿Cuál es el valor del estadístico de prueba?
c) ¿Cuál es el valor de p?
d) Con α = 0.01, ¿Cuál es su conclusión?

Solución:

a)

b)

Z de una muestra

Prueba de mu = 181900 vs. < 181900


La desviación estándar supuesta = 33500

Error
Estándar Límite
De la superior
N Media media 99% Z P
40 166400 5297 178722 -2.93 0.002

p=0.2% <1% entonces se rechaza hipótesis nula H0.

7
Laboratorio de Estadística Industrial 2016

Problema n°6:

Investigación de Mercados, S.A., basa sus tarifas en la hipótesis de que las


preguntas de una encuesta telefónica se pueden contestar en un tiempo medio de
15 minutos o menos. Si es necesario un mayor tiempo de encuesta, se aplica una
tarifa adicional. Suponga que en una muestra de 35 conferencias se obtiene una
media de 17 minutos y una desviación estándar de 4 minutos. ¿Se justifica la tarifa
adicional?

a. Formule la hipótesis nula y alternativa para esta aplicación.


b. Calcule el valor del estadístico de prueba
c. ¿Cuál es el valor p?
d. Con = 0.01, ¿cuál es su conclusión?

Solución:

Z de una muestra

Prueba de mu = 15 vs. > 15


La desviación estándar supuesta = 4

N Error Media 99% Z P


Estándar de Límite
la Media Inferior
35 17.000 0.676 15.427 2.96 0.002

p=0.2% <1% entonces se rechaza hipótesis nula H0.

8
Laboratorio de Estadística Industrial 2016

Problema n°7:

El expendio de pollos a la brasa de RikoPollo S.A asegura que 90% de sus órdenes se
entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron
dentro de ese lapso. ¿Puede concluirse, en el nivel de significancia 0.1, que menos de
90% de las órdenes se entregan en menos de 10 minutos?

Solución:

H0:

H1:

Prueba e IC para una proporción

Prueba de p = 0.9 vs. p < 0.9

Límite
Muestra X N Muestra p superior 99% Valor Z Valor P
1 82 100 0.820000 0.909375 -2.67 0.004

Uso de la aproximación normal.

p=0.4% <1% entonces se rechaza hipótesis nula H0.

Problema n° 8:
9
Laboratorio de Estadística Industrial 2016

El consejo de seguridad nacional de un país encuentra que 52% de los conductores en las
autopistas son hombres. Ayer se encontró en una muestra de 300 autos que viajaban por
una determinada autopista, que 170 de los conductores eran hombres.
¿Puede concluirse, en el nivel de significancia 0.01, que en esta autopista conducían más
hombres que los que indican las estadísticas nacionales?

Solución:

H0:

H1:

Prueba e IC para una proporción

Prueba de p = 0.52 vs. p > 0.52

99% Límite
Muestra X N Muestra p inferior Valor Z Valor P
1 170 300 0.566667 0.500110 1.62 0.053

p=5.3% >1% entonces NO se rechaza hipótesis nula H0.

Problema n°9:

10
Laboratorio de Estadística Industrial 2016

Una encuesta nacional reciente, revela que el costo por el gas de cocina promedio en la
Ciudad de Lima para el día de mañana será de 35.00 soles. Al día siguiente se realiza una
muestra aleatoria por todos los departamentos del país no incluyendo a Lima de 40
observaciones donde se encontró una media muestra de 36.05 y una desviación estándar
muestral 1.2 soles. El nivel de significancia de α=0,05. ¿El precio del gas de cocina es
igual en todo el país?

Solució

Según datos del problema:

HO µ = 35.00
H1 µ ≠ 35.00
HO µ = 35.00 porque lo que se trata de saber es que el precio del gas para cocina
sea igual en todo el territorio nacional.
Nivel de confianza de la prueba es α=0,05. Buscando en la tabla distribución normal
estándar se obtiene como punto crítico PC= +1,96 o -1,96. (Dos colas)
Debido a que la muestra tiene 40 observaciones se puede trabajar como una
distribución normal.

Aplicando el paquete minita

Error
Estándar
De la
N Media IC de 95% Z P
40 35,500 0,190 (35,128; 35,872) 2,64 0,008

Con lo cual podemos concluir que la empresa el valor de P es 0.008 y el nivel de


significancia de la prueba es 0.025
P <α
Se rechaza la HO

La empresa de la encuesta revela que en todos los departamentos del Perú no es


igual el mismo precio para la compra de gas.

11
Laboratorio de Estadística Industrial 2016

Problemas aplicativos de Distribución de Muestras Pequeñas

Probleman°1:

Los registros de la empresa Yellows indican que la duración media de un juego de bujías
es 22 100 millas. La distribución de los tiempos de vida útil de las bujías es
aproximadamente normal.

Un fabricante de bujías afirma que sus bujías tienen una duración media superior a 22
100 millas. El dueño de los camiones compra muchos de estos juegos. En una muestra de
18 juegos el tiempo medio de vida útil fu 23400 millas y la desviación estándar 1 500
millas ¿hay suficientes evidencias, con el nivel de significancia 0.05, que apoyen la
afirmación?

Solución:

Ho: mu<=22100

H1: mu >22100

T de una muestra

Prueba de mu = 22100 vs. > 22100

Error

estándar

de la 95% Límite

N Media Desv.Est. media inferior T P

18 23400 1500 354 22785 3.68 0.001

Interpretación:

Al encontrar un p de 0.1% <5% se rechaza Ho Con lo que la vida media de las bujías es
mayor a 22 100 millas.

12
Laboratorio de Estadística Industrial 2016

Problema n°2:

Un criador de pollos sabe por experiencia que el peso de los pollos de cinco meses es
4.35 libras. Los pesos siguen una distribución normal .para tratar de aumentar el peso de
dichas aves se le agrega un aditivo al alimento .en una muestra de pollos de cinco meses
se obtuvieron los siguientes pesos (en libras).

4.41 4.37 4.33 4.35 4.30 4.39 4.36 4.38 4.40 4.39

En el nivel 0.01 ¿el aditivo ha aumentado el peso de los pollos?

Ho: mu<=4.35

H1: mu >4.35

Prueba de mu = 4.35 vs. > 4.35

Error

Estándar

de la 99% Límite

Variable N Media Desv.Est. media inferior T P

A 10 4.3680 0.0339 0.0107 4.3377 1.68 0.064

Como p=6.4%>1% se acepta la hipótesis nula Ho. El aditivo no ha aumentado el peso de


los pollos.

Problema n°3:

13
Laboratorio de Estadística Industrial 2016

Una muestra de las calificaciones en un examen presentado en un curso de estadística


es:

Hombres 72 69 98 66 85 76 79 80 77

Mujeres 81 67 90 78 81 80 76

A nivel de significancia de 0.01.¿la calificación media de las mujeres es mas alta


que la calificación media de los hombres?

Solución:

Ho: mu2<=mu1

H1: mu2>mu1

Prueba T e IC de dos muestras: mujeres, hombres

N Media Desviación Media


Estándar

Mujeres 7 79 6.88 2.6

Hombres 9 78 9.49 3.2

T de dos muestras para mujeres vs. Hombres

Diferencia = mu (mujeres) - mu (hombres)

Estimado de la diferencia: 1.00

Límite inferior 99% de la diferencia: -10.20

Prueba T de diferencia = 0 (vs. >): Valor T = 0.23 Valor P = 0.409 GL = 14

Ambos utilizan Desviación Estándar agrupada = 8.4684

Como p=40.9%>1% se acepta Ho. La calificación media de las mujeres no es más


alta que la de los varones.

Problema n°4:

14
Laboratorio de Estadística Industrial 2016

Lisa Monnin es directora de presupuesto en la empresa new process , desea comparar los
gastos diarios de transportes del equipo de ventas y del personal de cobranzas recopilo
la siguiente información muestral (en dólares).

VENTAS 131 135 146 165 136 142

COBRANZAS 130 102 129 143 149 120 139

Al nivel de significancia de 0.10. ¿Puede concluirse que los gastos medios diarios
del equipo de ventas son mayores?

Ho: muv<=muc

H1: muv>muc

Prueba T e IC de dos muestras: VENTAS, COBRANZA

T de dos muestras para VENTAS vs. COBRANZA

Error

estándar

de la

N Media Desv.Est. media

VENTAS 6 142.5 12.2 5.0

COBRANZA 7 130.3 15.8 6.0

Diferencia = mu (ventas) - mu (cobranza)

Estimado de la diferencia: 12.21

Límite inferior 90% de la diferencia: 1.38

Prueba T de diferencia = 0 (vs. >): Valor T = 1.54 Valor P = 0.076 GL = 11

Ambos utilizan Desv. Est. Agrupada = 14.2858Con un p=7.6%<10% se rechaza


Ho. Con lo que se concluye que los gastos medios del equipo de ventas son
mayores a los de cobranzas

Problema n°5:

15
Laboratorio de Estadística Industrial 2016

Recuerde que la empresa Nikel Saving desea comparar las dos agencias que
utiliza para realizar avalúos de casas. Para esto selecciono una muestra de 10
propiedades residenciales y programó un avaluó por cada agencia. los resultados,
reportados en miles de dólares, son:

Casa Bowyer Schadek

1 135 128

2 110 105

3 131 119

4 142 140

5 105 98

6 130 123

7 131 127

8 110 115

9 125 122

10 149 145

16
Laboratorio de Estadística Industrial 2016

Al nivel de significancia de 0.05. ¿Puede concluirse que hay una diferencia en los
avalúos medios de las casas?

Ho: mu=0

H1: mu<>0

IC y Prueba T pareada: Schadek, Bowyer

T pareada para Schadek - Bowyer

Error

estándar

de la

N Media Desv.Est. media

Schadek 10 127.80 15.89 5.03

Bowyer 10 122.20 14.29 4.52

Diferencia 10 5.60 4.86 1.54

IC de 95% para la diferencia media:: (2.12, 9.08)

Prueba t de diferencia media = 0 (vs. no = 0): Valor T = 3.65 Valor P = 0.005

17
Laboratorio de Estadística Industrial 2016

Problema n°6:

Lammers Limo ofrece servicio de limusinas desde el edificio del ayuntamiento de la


ciudad de Toledo, Ohio, hasta el aeropuerto Metro, en Detroit. El presidente de la
compañía ,San Lammers, está considerando dos rutas,una via es la ruta US25 y la otra
es vía la autopista I75 .Desea estudiar el tiempo necesario para llegar al aeropuerto por
cada uno de estos caminos y después comparar (en minutos ). Utilizando el nivel de
significancia de 0.10¿existe alguna diferencia en la variación de los tiempos de recorrido
por ambas rutas?

Ruta US25 Interestatal 75

52 59

67 60

56 61

45 51

70 56

54 63

64 57

65

Ho: varianza1=varianza2

H1: varianaza1<>varianza2

Prueba e IC para dos varianzas: us, i

Método

Hipótesis nula Sigma(us) / Sigma(i) = 1

Hipótesis alterna Sigma(us) / Sigma(i) not = 1

Nivel de significancia Alfa = 0.1

18
Laboratorio de Estadística Industrial 2016

Variable N Desv.Est. Varianza

US 7 8.995 80.905

I75 8 4.375 19.143

Relación de deviaciones estándar = 2.056

Relación de varianzas = 4.226

Intervalos de confianza de 90%

IC para IC para

Distribución relación de relación de

de los datos Desv.Est. varianza

Normal (1.046, 4.217) (1.093, 17.779)

Continuo (1.037, 5.381) (1.075, 28.950)

Pruebas

Método GL1 GL2 de prueba Valor P

Prueba F (normal) 6 7 4.23 0.081

Prueba de Levene (cualquiera continua) 1 13 3.40 0.088

Problemas Aplicativos de Regresión Simple

19
Laboratorio de Estadística Industrial 2016

Problema n°1:

Se llevó a cabo un estudio en el Instituto Politécnico y Universidad Estatal de Virginia


para determinar si ciertas medidas de resistencia estática del brazo (Kg.) tienen alguna
influencia en las características de "elevación dinámica (milímetros)" de un individuo. Se
sometieron a pruebas de resistencia a 10 individuos y después se les pidió realizar una
prueba de levantamiento de pesas en la que el peso se debía levantar en forma dinámica
por arriba de la cabeza.

Los datos son los siguientes:

Individuo Resistencia del Levantamiento


brazo dinámico

1 17.3 71.7

2 19.3 48.3

3 29.6 78.3

4 29.6 60.0

5 19.5 88.3

6 29.9 71.7

7 19.7 75.0

8 30.3 85.0

9 22.9 91.7

10 31.3 85.0

20
Laboratorio de Estadística Industrial 2016

Graficas de puntos:

21
Laboratorio de Estadística Industrial 2016

Gráfica de dispersión de levantamiento di vs. Resistencia del

90
amico

80
ientodin

70
levantam

60

50

16 18 20 22 24 26 28 30 32
Resistencia del brazo

Gráfica de dispersión de levantamiento di vs. Resistencia del

90
amico

80
ientodin

70
levantam

60

50

16 18 20 22 24 26 28 30 32
Resistencia del brazo

Gráfica de línea ajustada


levantamiento dinamico = 65,50 + 0,4009 Resistencia del brazo
120 Regresión
I C de 95%
110 I P de 95%
ico

100 S 14,0422
R-cuad. 2,9%
ientodinam

90 R-cuad.(ajustado) 0,0%

80

70
levantam

60

50

40

30
16 18 20 22 24 26 28 30 32
Resistencia del brazo

22
Laboratorio de Estadística Industrial 2016

Al encontrar un r2 de 2.9% no se ajusta a una regresión lineal

Análisis de regresión: levantamiento dinámico vs. Resistencia del brazo


La ecuación de regresión es

Levantamiento dinámico = 65,5 + 0,401 Resistencia del brazo

Predictor Coef SE Coef T P

Constante 65,50 21,09 3,11 0,015

Resistencia del brazo 0,4009 0,8266 0,48 0,641

S = 14,0422 R-cuad. = 2,9% R-cuad.(ajustado) = 0,0%

Análisis de varianza

Fuente GL SC CM F P

Regresión 1 46,4 46,4 0,24 0,641

Error residual 8 1577,5 197,2

Total 9 1623,8

Valores pronosticados para nuevas observaciones

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 77,53 6,10 (63,46. 91,60) (42,22. 112,83)

Valores de predictores para nuevas observaciones

Resistencia

Nueva obs del brazo

1 30,0

23
Laboratorio de Estadística Industrial 2016

Problema n°2:

El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y


Galés en el período de 1970-72. Cada grupo está formado por trabajadores de la misma
profesión (médicos, trabajadores textiles, decoradores,...etc.,) y en cada uno de los
veinticinco grupos muestreados se han observado dos variables: el índice estandarizado
de consumo de cigarrillos y el índice de muertes por cáncer de pulmón. (Occupational
mortality: the registar general.s decennial supplement for England andWales, 1970-72,
series Ds, n.1, London: HMSO, 149).

24
Laboratorio de Estadística Industrial 2016

Estudiar la regresión lineal del índice de mortalidad frente al índice de fumadores.

Gráfica de dispersión de MUERTES POR CANC vs. CONSUMO DE CI GAR

150
MUERTESPORCANCERDEPULMON

125

100

75

50
60 70 80 90 100 110 120 130 140
CONSUMO DE CIGARRILLOS

25
Laboratorio de Estadística Industrial 2016

Gráfica de dispersión de MUERTES POR CANC vs. CONSUMO DE CI GAR

150
MUERTESPOR CANCER DEPULMON

125

100

75

50
60 70 80 90 100 110 120 130 140
CONSUMO DE CIGARRILLOS

Gráfica de línea ajustada


MUERTES POR CANCER DE PULMON = - 2,89 + 1,088 CONSUMO DE CIGARRILLOS
200 Regresión
I C de 95%
MUERTES POR CANCER DE PULMON

I P de 95%

S 18,6154
150 R-cuad. 51,3%
R-cuad.(ajustado) 49,2%

100

50

Análisis de regresión:
60 70 80 90 100 110 120 130 140
CONSUMO DE CIGARRILLOS
MUERTES POR CANC vs. CONSUMO DE CIGAR

La ecuación de regresión es

MUERTES POR CANCER DE PULMON = - 2,9 + 1,09 CONSUMO DE CIGARRILLOS

Predictor Coef SE Coef T P

Constante -2,89 23,03 -0,13 0,901

CONSUMO DE CIGARRILLOS 1,0875 0,2209 4,92 0,000

No es conveniente un ajuste lineal al encontrar un R2 de 51.3%

S = 18,6154 R-cuad. = 51,3% R-cuad.(ajustado) = 49,2%

26

Análisis de varianza
Laboratorio de Estadística Industrial 2016

*AJUSTE: Para un valor x=120

Valores pronosticados para nuevas observaciones

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 127,62 5,31 (116,64. 138,60) (87,58. 167,66)

Valores de predictores para nuevas observaciones

CONSUMO DE

Nueva obs CIGARRILLOS

1 120

Problema n°3:

27
Laboratorio de Estadística Industrial 2016

En 34 lotes de 120 libras de cacahuetes se observó el nivel medio de aáatoxin


(partes por billón) (X) y el porcentaje de cacahuetes no contaminados (Y):

Analizar estos datos e investigar la relación entre estas dos variables para predecir

Y en función de X. ¿Es adecuado el ajuste lineal?

Gráfica de dispersión de Y vs. X


100,0

99,9
Y

99,8

99,7

99,6
0 20 40 60 80 100 120
X

28
Laboratorio de Estadística Industrial 2016

Gráfica de dispersión de Y vs. X


100,0

99,9

99,8
Y

99,7

99,6
0 20 40 60 80 100 120
X

Gráfica de línea ajustada


Y = 100,0 - 0,002904 X
100,1 Regresión
I C de 95%
I P de 95%
100,0 S 0,0393282
R-cuad. 82,9%
R-cuad.(ajustado) 82,3%
99,9
Y

99,8

99,7

99,6

0 20 40 60 80 100 120
X

Al encontrar un R-cuad=82.9% resulta conveniente trazar un ajuste lineal

29
La ecuación de regresión es

Y = 100 - 0,00290 X
Laboratorio de Estadística Industrial 2016

Predictor Coef SE Coef T P

Constante 100,002 0,011 9184,91 0,000

X -0,0029035 0,0002335 -12,43 0,000

S = 0,0393282 R-cuad. = 82,9% R-cuad.(ajustado) = 82,3%

Análisis de varianza

Fuente Ajuste a un x=100


GL SC CM F P
Observaciones poco comunes
Regresión 1 0,23915 0,23915 154,62 0,000
EE de Residuo
Error residual 32 0,04949 0,00155
Obs X Y Ajuste ajuste Residuo estándar
Total 33 0,28864
28 111 99,6580 99,6792 0,0187 -0,0212 -0,61 X

X denota una observación cuyo valor X le concede gran apalancamiento.

Valores pronosticados para nuevas observaciones

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 99,7117 0,0163 (99,6786. 99,7449) (99,6251. 99,7984)

Valores de predictores para nuevas observaciones

Nueva obs X

1 100

Problemas Aplicativos de Regresión Múltiple

30
Laboratorio de Estadística Industrial 2016

Problema n°1:

En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de


la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la
asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos
registran notas promedios en las asignaturas de Algoritmos, Base de Datos y
Programación como se muestran en el siguiente cuadro.

Alumn PHP Algoritmos Base de Programación


o Datos
1 13 15 15 13
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
8 13 16 14 15
9 13 15 14 13
10 13 14 13 10
11 11 12 12 10
12 14 16 11 14
13 15 17 16 15
14 15 19 14 16
15 15 13 15 10

Lo que buscamos es construir un modelo para determinar la dependencia que


exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las
notas de las asignaturas Algoritmos, Programación.

Determine la ecuación de regresión.

Calcule e interprete.

Estimar la nota del curso de PHP si se sabe que en Algoritmos tiene 15 , Base de
Datos 16 y Programación 17.

Solución:

31
Laboratorio de Estadística Industrial 2016

Coeficiente de determinación: es 0.697, entonces el 69.70% del aprendizaje del Curso de


PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos,
Base de Datos y Programación.

32
Laboratorio de Estadística Industrial 2016

Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de


P=0.003 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al
menos un coeficiente de regresión no es 0.

Podemos observar que hay una buena relación de linealidad entre las variables
dependientes con la dependiente.

33
Laboratorio de Estadística Industrial 2016

34
Laboratorio de Estadística Industrial 2016

35
Laboratorio de Estadística Industrial 2016

Probema n°2:

Montgomery y Peck (1982) describen el empleo de un modelo de regresión para


relacionar la cantidad de tiempo requerido por un vendedor de ruta (chofer) para
abastecer una maquina vendedora de refrescos con el número de latas que incluye la
misma, y la distancia del vehículo de servicio a la ubicación de la máquina. Este modelo
se empleó para el diseño de la ruta, el programa y el despacho de vehículos. La tabla
presenta 25 observaciones respecto al tiempo de entrega tomadas del mismo estudio
descrito por Montgomery y Peck.

Numero de Tiempo Numero Distancias(pie

36
Laboratorio de Estadística Industrial 2016

observacione de de latas s)
s entrega
(min.)
1 9.95 2 50
2 24.45 8 110
3 31.75 11 120
4 35.00 10 550
5 25.02 8 295
6 16.8 4 200
7 14.38 2 375
8 9.60 2 52
9 24.35 9 100
10 27.50 8 300
11 17.08 4 412
12 37.00 11 400
13 41.95 12 500
14 11.66 2 360
15 21.65 4 205
16 17.89 4 400
17 69.00 20 600
18 10.30 1 585
19 34.93 10 540
20 46.59 15 250
21 44.88 15 290
22 54.12 16 510
23 56.63 17 590
24 22.13 6 100
25 21.15 5 400

Determine la ecuación de regresión. Calcule e interprete.

Estimar el tiempo de entrega si se sabe que el número de latas es 20 y la distancia del


vehículo es 110.

37
Laboratorio de Estadística Industrial 2016

Solución:

38
Laboratorio de Estadística Industrial 2016

Coeficiente de determinación: es 0.981, entonces el 98.1% del tiempo de un vendedor


para abastecer una maquina vendedora puede ser explicado mediante el número de latas
y la distancia del camión.

Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de


P=0.000 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al
menos un coeficiente de regresión no es 0.

Observamos un relación lineal entre la variable dependiente Nro. De latas con respecto
al T.de entrega (Variable independiente), y en menor grado de linealidad Distancia Vs
Tiempo de entrega.

39
Laboratorio de Estadística Industrial 2016

Contribución de la variable X1 sabiendo que X2 está incluida

40
Laboratorio de Estadística Industrial 2016

SSR(X1 / X2) = SSR(X1 y X2) – SSR(X2)

=5992.4-5887.3=105.1

Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,20.23>4.3

Entonces la variable X1(nro de latas), si contribuye significativamente a la ecuación de


regresión

Contribución de la variable X2 sabiendo que X1 está incluida

SSR(X2 / X1) =SSR(X1 y X2) – SSR(X1)

=5992.4-1483.9=4508.5

Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,867.019>4.3

Entonces la variable X2(distancia), si contribuye significativamente a la ecuación de


regresión, y podríamos concluir que es más importante que la varia X1.

41
Laboratorio de Estadística Industrial 2016

42
Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Chi Cuadrada

Distribución de Bondad de Ajuste: Chi Cuadrada


Problema n°1:

Probar la hipótesis siguiente usando la prueba de bondad de ajuste X2.

H0: pA=0.40, pB=0.40 y pc=0.20

H1: pA≠0.40, pB≠0.40 y pc≠0.20

En una muestra de 200 elementos se tiene que 60 pertenecen a la categoría A, 120 a la


categoría B y 20 a la categoría C.

Use α=0.01 y pruebe si las proporciones son las afirmadas en H0.

Solución:

Calculamos las frecuencias esperadas con n=200:

Categoría A = 0.40(200) = 80

Categoría B = 0.40(200) = 80

Categoría C = 0.20(200) = 40

Calculamos el estadístico de prueba chi-cuadrada (X2):

Categoría Número Número f - ei (f - (f -


s observados(f esperados(e ei)2 ei)2/ ei
) i)

A 60 80 -20 400 5

B 120 80 40 1600 20

C 20 40 -20 400 1
0

TOTAL X2=35

43
Laboratorio de Estadística Industrial 2016

Para k-1=3-1=2 grados de libertad, con X2=35. Mediante tabla el valor-p es menor a
0.005. Entonces el valor-p≤ α=0.01, por tanto, se rechaza H0.

44
Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =35, se calcula el valor-p que se aproxima a 0. Por tanto el
valor-p≤0.01. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que
no tienen la misma proporción en las poblaciones.

Durante las primeras 13 semanas, se registraron las proporciones siguientes de


televidentes los sábados de 8 a 9 de la noche: ABC 29%, CBS 28%, NBC 25% e
independientes 18%. Dos semanas después en una muestra de 300 hogares se obtuvieron
las audiencias siguientes en sábados por la noche: ABC 95 hogares, CBS 70 hogares,
NBC 89 hogares e independientes 46 hogares. Use α=0.05 para determinar si han
variado las proporciones en la audiencia de televidentes.

Solución:

H0: pA=0.29, pB=0.28, pc=0.25 y pD=0.18

H1: pA≠0.29, pB≠0.28 y pc≠0.25 y pD≠0.18

Nivel de significancia α=0.05.

Calculamos las frecuencias esperadas con n=300:

ABC = 0.29(300) = 87

CBS = 0.28(300) = 84

NBC = 0.25(300) = 75

Independiente = 0.18(300) = 54

Calculamos el estadístico de prueba chi-cuadrada (X2):

TELEVISORA Número Número f - ei (f - (f - ei)2/


S observados(f esperados(e ei)2 ei
) i)

45
Laboratorio de Estadística Industrial 2016

ABC 95 87 8 64 0.7356

CBC 70 84 16 2.3333
-14

NBC 89 75 1 2.6133
4 196

Independient 46 54 -8 64 1.1852
e

TOTAL X2=6.86
74

Para k-1=4-1=3 grados de libertad, con X2=6.8674. Mediante tabla el valor-p esta entre
0.10 y 0.05. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.

Mediante el Minitab con X2 =6.86748, se calcula el valor-p =0.0762436. Por tanto el


valor-p≥ α=0.05. Entonces se comprueba el no rechazo de la hipótesis nula, concluyendo
que tienen la misma proporción en las poblaciones.

M&M/Mars, fabricantes de los chocolates M&M, realizaron un sondeo nacional en el que


más de 10 millones de personas dieron su preferencia para un nuevo color. El resultado
de este sondeo fue el reemplazo de un color café claro por uno azul. En el prospecto
“Colors” de M&M/Mars, la distribución de los colores de estos chocolates es el siguiente:

café amarillo rojo anaranjad verde azul

46
Laboratorio de Estadística Industrial 2016

30% 20% 20% 10% 10% 10%

En un estudio anterior se emplearon como muestra bolsas de 1 libra para determinar si


los porcentajes dados eran reales. En la muestra de 506 dulces los resultados
encontrados fueron los siguientes:

café amarillo rojo anaranjad verde azul


o

17 13 79 41 36 38
7 5

Use α=0.05 para determinar si estos datos coinciden con los datos por la empresa.

Solución:

H0: pA=0.30, pB=0.20, pc=0.20, pD=0.10, pE=0.10 y pf=0.10

H1: pA≠0.30, pB≠0.20, pc≠0.20, pD≠0.10, pE≠0.10 y pf≠0.10

Nivel de significancia α=0.05.

Calculamos las frecuencias esperadas con n=506:

Café = 0.30(506) = 151.8

Amarillo = 0.20(506) = 101.2

Rojo = 0.20(506) = 101.2

Anaranjado = 0.10(506) = 50.6

Verde = 0.10(506) = 50.6

Azul = 0.10(506) = 50.6

Calculamos el estadístico de prueba chi-cuadrada (X2):

47
Laboratorio de Estadística Industrial 2016

Colores de Númer Número f - ei (f - ei)2 (f -


chocolates o esperados(e ei)2/ ei
observados(f i)
)

Café 177 151.8 25.20 635.04 4.1834

Amarillo 135 101.2 33.80 1142.44 11.2889

Rojo 79 101.2 -22.20 492.84 4.8700

Anaranjad 41 50.6 -9.6 92.16 1.8213


o

Verde 36 50.6 -14.6 213.16 4.2126

Azul 38 50.6 -12.6 158.76 3.1375

TOTAL X2=29.5
1

Para k-1=5-1=4 grados de libertad, con X2=29.51. Mediante tabla el valor-p es


menor que 0.005. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.

Mediante el Minitab con X2 =29.5138, se calcula el valor-p =0.0000061. Por tanto el


valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo
que no tienen la misma proporción en las poblaciones.

48
Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Prueba de Independencia

La siguiente tabla de contingencia 2x3 contiene las frecuencias observadas de una


muestra de tamaño de 200. Pruebe la independencia de las variables de renglón y de la
columna usando la prueba X2 con α=0.05.

Vari Variable de Columna


able de
A B C
Renglones

P 20 44 50

Q 30 26 30

Solución:

H0: Las variables de renglón son independientes a las variables columna.

H1: Las variables de renglón no son independientes a las variables columna.

Tabla de contingencia:

Variable de Variable de Columna


Renglones
A B C TOTA
L

P 20 44 50 114

Q 30 26 30 86

TOTAL 50 70 80 200

Hallando las frecuencias esperadas de cada celda:

49
Laboratorio de Estadística Industrial 2016

eij=

e11= =28.5 e12= =39.9 e13= =45.6

e21= =21.5 e22= =30.1 e23= =34.4

Tabla de números observados y esperados:

Rengló Columna Número Número fi - ei (fi (fi -


n observados(fi) esperados( -ei)2 ei)2/ei
ei)

P A 20 28.5 -8.5 72.25 2.5351

P B 44 39.9 4.1 16.81 0.4213

P C 50 45.6 4.4 19.36 0.4246

Q A 30 21.5 8.5 72.25 3.3605

Q B 26 30.1 -4.1 16.81 0.5585

Q A 30 34.4 -4.4 19.36 0.5628

TOTAL X2=7.862
8

Para (2-1) x (3-1) = 2 grados de libertad y mediante tabla para X2=7.8628, se calcula el
valor-p que esta entre 0.025 y 0.01. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la
hipótesis nula.

50
Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =7.863, se calcula el valor-p = 0.020. Por tanto el valor-p≤
α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay
independencia entre variable renglón y variable columna.

Una de las preguntas a los suscriptores de Bussiness Week fue, “En sus viajes de
negocios de los último 12 meses, ¿Qué tipo de boleto ha comprado?” Los datos obtenidos
se presentan en la tabla de contingencia siguiente.

Tipo de Boleto Tipo de Vuelo

Vuelo Vuelo
Nacional Internacional

Primera Clase 29 22

Clase 95 121
negocio/ejecutiva

Vuelo 518 135


tradicional/ clase
económica

Solución:

H0: Los tipo de boleto son independientes con los tipos de vuelo.

H1: Los tipo de boleto son no independientes con los tipos de vuelo.

Tabla de contingencia:

Tipo Tipo de Vuelo


de Boleto
V. Nacional V. TOTAL
Internacional

51
Laboratorio de Estadística Industrial 2016

Primera 20 44 64
clase

Clase 30 26 56
negocio

Vuelo 518 135 653


tradicional

TOTAL 568 205 773

Hallando las frecuencias esperadas de cada celda:

eij=

e11= =28.5 e12= =39.9 e21= =45.6

e22= =21.5 e31= =30.1 e32= =34.4

Tabla de números observados y esperados:

Tipo de Tipo de Número Número f- (f (f -


boleto vuelo observados(f esperados(e ei ei)2 ei)2/ei
) i)

Primera Nacional 20 47.03 27.0 730.6 15.535


3 2

Primera Internacion 44 16.97 27.0 730.6 43.054

52
Laboratorio de Estadística Industrial 2016

al 3 2

Negocio Nacional 30 41.15 - 124.3 3.0212


11.1 2
5

Negocio Internacion 26 14.85 11.1 124.3 8.3719


al 5 2

Tradiciona Nacional 518 479.82 38.1 1457. 3.0380


l 8 7

Tradiciona Internacion 135 173.18 38.1 1457. 8.4173


l al 8 7

TOTAL X2=81.4
37

Para (3-1)x(2-1) = 2 grados de libertad y mediante tabla para X2=81.437, se calcula el


valor-p que es menor a 0.005. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la
hipótesis nula.

Mediante el Minitab con X2 =81.413, se calcula el valor-p = 0.000. Por tanto el valor-p≤
α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay
independencia entre los tipos de boleto y los tipos de vuelo.

53
Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de la Distribución de Poisson

A continuación se presenta el número de ocurrencia por lapso de tiempo y su frecuencia


observada. Use α=0.05 y la prueba de bondad de ajuste para verificar su estos datos se
ajustan a un distribución de Poisson.

Número de F. Observada
Ocurrencia

0 39

1 30

2 30

3 18

4 3

Solución:

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 120.

Media de ocurrencias: μ = = 1.31

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=1.31

Número de Probabilidad Número


ocurrencias de Poisson esperado

54
Laboratorio de Estadística Industrial 2016

f(x) 120.f(x)

0 0.2698 32.376

1 0.3535 42.420

2 0.2315 27.780

3 0.1011 12.132

4 0.0331 3.972

5 o más 0.0110 1.320

Cálculo del estadístico de prueba Chi-Cuadrado X2:

Número Número Número f - ei (f ei)2 (f


de observados(f esperados(e -ei)2/ei
ocurrencia ) i)
s

0 39 32.376 6.624 43.877 1.355

1 30 42.420 -12.42 154.25 3.636


6

2 30 27.780 2.22 4.928 0.177

3 18 12.132 5.868 34.433 2.838

4 o más 3 5.292 -2.292 5.253 0.993

TOTAL X2=8.99
9

Para k-p-1=5-2=3 grados de libertad, con X2=8.999 mediante tabla el valor-p esta entre
0.05 y 0.025. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.

55
Laboratorio de Estadística Industrial 2016

Mediante Minitab con X2=8.99683, se calcula el valor-p=0.0293330. Por tanto el valor-p


≤ α=0.05. Entonces se rechaza la hipótesis nula y se concluye que la población no tiene
una distribución Poisson.

Al parecer el número de accidentes automovilísticos por día en una determinada ciudad


tiene una distribución de Poisson. A continuación se presentan los datos de una muestra
de 80 días del año anterior. ¿Estos datos apoyan la creencia de que el número de
accidentes por día tiene una distribución de Poisson? Use α=0.05.

56
Laboratorio de Estadística Industrial 2016

Número de F. Observada(días)
Accidentes

0 34

1 25

2 11

3 7

4 3

Solución:

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 80.

Media de ocurrencias: μ = =1

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=1

Número Probabilidad Número


de ocurrencias de Poisson f(x) esperado
80.f(x)

0 0.3679 29.432

1 0.3679 29.432

2 0.1839 14.712

57
Laboratorio de Estadística Industrial 2016

3 0.0613 4.904

4 0.0153 1.224

5 o más 0.0037 0.296

Cálculo del estadístico de prueba Chi-Cuadrado X2:

Número Número Número f - ei (f - ei)2 (f - ei)2/


de observados(f esperados(e ei
ocurrencia ) i)
s

0 34 29.432 4.568 20.867 0.7095

1 25 29.432 -4.568 19.643 0.6669

2 11 14.712 -3.712 13.779 0.9381

3 o más 10 6.424 3.712 12.788 1.9905

TOTAL X2=4.30

Para k-p-1=4-2=2 grados de libertad, con X2=4.3 mediante tabla el valor-p esta entre
0.90 y 0.10. Entonces el valor-p> α=0.05, por tanto, no se rechaza H0.

58
Laboratorio de Estadística Industrial 2016

Mediante Minitab con X2=4.30491, se calcula el valor-p=0.116199. Por tanto el valor-p


>α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene
una distribución Poisson.

El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa
tiene una distribución de Poisson. Use α=0.05 y los datos siguientes para probar esta
suposición.

Número de Frecuencia
llamadas Observada
telefónicas que
llegan por
minuto

0 15

1 31

2 20

3 15

4 13

5 4

6 2

Solución:

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 100.

Media de ocurrencias: μ = =2

59
Laboratorio de Estadística Industrial 2016

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=2

Número Probabilidad de Número


de ocurrencias Poisson f(x) esperado
100.f(x)

0 0.1353 13.53

1 0.2707 27.07

2 0.2707 27.07

3 0.1804 18.04

4 0.0902 9.02

5 0.0361 3.61

6 0.0120 1.20

7 o más 0.0047 0.47

Cálculo del estadístico de prueba Chi-Cuadrado X2:

Número Número Número f - ei (f - (f - ei)2/


de observados(f esperados(e ei)2 ei
ocurrencia ) i)
s

0 15 13.53 1.47 2. 0.1


1609 597

1 31 27.07 3.93 15.4449 0.5706

2 20 27.07 -7.07 49.9849 1.8465

60
Laboratorio de Estadística Industrial 2016

3 15 18.04 -3.04 9.2416 0.5123

4 13 9.02 3.98 15.8404 1.7561

5 o más 6 5.28 0.72 0.5184 0.0982

TOTAL 100 X2=4.94


34

Para k-p-1=6-2=4 grados de libertad, con X2=4.9434 mediante tabla el valor-p esta
entre 0.90 y 0.10. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.

Mediante Minitab con X2=4.945411, se calcula el valor-p=0.292945. Por tanto el valor-p


>α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene
una distribución Poisson.

Problemas Aplicativos de Métodos no Paramétricos

Prueba de Signos
¿Las divisiones de acciones son benéficas para los accionistas? La empresa SNL
Securities estudió, a lo largo de 18 meses, las divisiones de las acciones de la industria de
la banca y encontró que las divisiones de las acciones de un individuo. Admita que en
una muestra de 20 recientes divisiones de acciones, 14 hayan llevado a un aumento de su
valor, cuatro hayan llevado a una disminución de su valor y dos no hayan ocasionado

61
Laboratorio de Estadística Industrial 2016

ningún cambio. Suponga que realiza un estudio para determinar si las divisiones de
acciones aún benefician a los poseedores de acciones bancarias.

¿Cuáles son las hipótesis nula y alternativa?

¿A qué conclusión se llega con α=0.05?

Solución:

p = es la proporción de poseedores bancarios beneficiarios (aumente su valor).

H0: p≤0.5

H1: p>0.5

Nivel de significancia α=0.05.

Tabla de probabilidades binomiales para n=18 y p=0.5.

Número de Probabilidade
signos más s

0 0.0000

1 0.0001

2 0.0006

3 0.0031

4 0.0117

5 0.0327

6 0.0708

7 0.1214

8 0.1669

9 0.1855

10 0.1669

11 0.1214

12 0.0708

13 0.0327

14 0.0117

62
Laboratorio de Estadística Industrial 2016

15 0.0031

16 0.0006

17 0.0001

18 0.0000

El número de signos más para el valor de poseedores bancarios beneficiarios es x=14,


entonces su probabilidad está en la cola superior:

P(x≥ 14) =
P(14)+P(15)+P(16)+P(17)+P(18)=0.0117+0.0031+0.0006+0.0001+0.0000=0.0154

Como es para una cola el valor-p = 0.0154. Además el valor-p≤ α=0.05, entonces se
rechaza H0.

63
Laboratorio de Estadística Industrial 2016

La empresa Nielson Media Research identificó que American Idol y a Dancing whit the
Stars como los 2 programas de televisión de mayor rating en febrero de 2006. En un
estudio local acerca del programa de televisión preferido, de 750 encuestados 330
votaron por American Idol, 270 por Dancing whit the Stars, y 150 por otros programas de
televisión. Con 0.05 como nivel de significancia prueba la hipótesis de que American Idol
y Dancing whit the Stars tiene el mismo nivel de preferencia. ¿A qué conclusión llega?

Solución:

p = es la proporción que ven American Idol.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

La muestra es n=600, entonces es una distribución normal donde:

μ = 0.50(600) = 300

= =12.25

El número de signo más es x=330, se halla el estadístico de prueba Z:

Z= = 2.45

Mediante tabla para Z=2.45, se calcula para 2 colas el valor-p= 2(1-0.9929)= 0.0142.
Como el valor-p≤ α=0.05, entonces se rechaza H0.

64
Laboratorio de Estadística Industrial 2016

En el mercado de computadoras personales la competencia es intensa. En una muestra


de 500 compras, se encontró que 202 eran compras de la marca A, 158 de la marca B y
140 de otras marcas. Con un nivel de significancia de 0.05 pruebe la hipótesis de que las
marcas A y B tienen la misma participación en el mercado de las computadoras
personales ¿Cuál es su conclusión?

Solución:

p = es la proporción de los que compran computadoras de la marca A.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

La muestra es n=360, entonces es una distribución normal donde:

μ = 0.50(360) = 180

= =9.49

El número de signo más es x=202, se halla el estadístico de prueba Z:

Z= = 2.32

Mediante tabla para Z=2.32, se calcula para 2 colas el valor-p= 2(1-0.9898)= 0.0204.
Como el valor-p≤ α=0.05, entonces se rechaza H0.

En una muestra de 150 partidos de basquetbol universitario, el equipo de casa ganó 98


partidos. Realice una prueba para determinar su los datos sustentan la hipótesis de que

65
Laboratorio de Estadística Industrial 2016

en el basquetbol universitario el equipo de casa tiene ventaja. ¿A qué conclusión llega


con α=0.05?

Solución:

p = es la proporción de partidos que gana un equipo en casa.

H0: p≤0.5

H1: p>0.5

Nivel de significancia α=0.05.

La muestra es n=150, entonces es una distribución normal donde:

μ = 0.50(150) = 75

= =6.12

El número de signo más es x=98, se halla el estadístico de prueba Z:

Z= = 3.76

Mediante tabla para Z=3.76, se calcula para una cola el valor-p= 1- 0.9999 ≈ 0.00. Como
el valor-p≤ α=0.05, entonces se rechaza H0.

En la tabla se presentan las preferencias de 10 personas respecto a dos marcas de un


producto.

PERSONA MARCA A

66
Laboratorio de Estadística Industrial 2016

FRENTEA
MARCA B

1 +

2 +

3 +

4 -

5 +

6 +

7 -

8 +

9 -

10 +

Emplee α=0.05 y pruebe si existe alguna diferencia significativa de preferencia por estas
dos marcas. Un signo más indica preferencia por la marca A sobre la marca B.

Solución:

p = es la proporción de preferencia por la marca A.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

67
Laboratorio de Estadística Industrial 2016

Tabla de probabilidades binomiales para n=10 y p=0.5.

Número de Probabilidade
signos más s

0 0.0010

1 0.0098

2 0.0439

3 0.1172

4 0.2051

5 0.2461

6 0.2051

7 0.1172

8 0.0439

9 0.0098

10 0.0010

El número de signos más para la marca A es x=7, entonces su probabilidad está en la


cola superior:

P(x≥ 7) = P(7)+P(8)+P(9)+P(10)=0.1172+0.0439+0.0098+0.0010=0.1719.

Como es para dos cola el valor-p = 2(0.0154)=0.8438. Además el valor-p≥ α=0.05

Entonces no se rechaza H0.

68
Laboratorio de Estadística Industrial 2016

Realice la prueba de hipótesis siguiente:

H0: Mediana ≤150

H1: Mediana >150

En una muestra de tamaño 30 se obtuvieron 22 casos cuyo valor fue mayor que 150, tres
cuyo valor fue exactamente 150 y cinco cuyo valor fue menor que 150. Con α=0.01
realice una prueba de hipótesis.

Solución:

Con nivel de significancia α=0.01.

El número de la muestra es n = 27, asume una distribución normal.

μ = 0.50(27) = 13.5

= =2.60

El número de signo más es x=22, se halla el estadístico de prueba Z:

Z= = 3.27

Mediante tabla para Z=3.27, se calcula para una cola el valor-p= 1- 0.990 = 0.001.

Como el valor-p≤ α=0.01.

Entonces se rechaza H0.

69
Laboratorio de Estadística Industrial 2016

El ingreso mediano anual de los suscriptores de la Barron es $131 000. Suponga que en
una muestra de 300 suscriptores a The Wall Street Journal, 165 suscriptores posean un
ingreso mayor que $131 000 y 135 poseen un ingreso menor que $131 000. ¿Puede
concluir que hay diferencia entre los ingresos medianos de los dos grupos de
suscriptores? Emplee como nivel de significancia α=0.05, ¿a qué conclusión llega?

Solución:

H0: Mediana = $131 000

H1: Mediana ≠ $131 000

Con nivel de significancia α=0.01.

El número de la muestra es n = 300, asume una distribución normal.

μ = 0.50(300) = 150

= = 8.66

El número de signo más es x=165, se halla el estadístico de prueba Z:

Z= = 1.73

Mediante tabla para Z=1.73, se calcula para dos colas el valor-p=2(1- 0.9582) = 0.0836.
Como el valor-p≥ α=0.01, entonces no se rechaza H0.

70
Laboratorio de Estadística Industrial 2016

De acuerdo con un estudio nacional, el ingreso anual mediano que los adultos dicen
harían realidad sus sueños es $152 000. Suponga que en Ohio, de 225 personas tomadas
en una muestra, 122 indican que el ingreso necesario para hacer realidad sus sueños sea
menor que $152 000, y 103 informan que esta cantidad sea mayor que $152 000. Pruebe
la hipótesis nula de que en Ohio, el ingreso medio anual para que una persona haga
realidad sus sueños es $152 000. Use α=0.05, ¿a qué conclusión llega?

Solución:

H0: Mediana = $152 000

H1: Mediana ≠ $152 000

Con nivel de significancia α=0.01.

El número de la muestra es n = 225, asume una distribución normal.

μ = 0.50(225) = 112.5

= = 7.5

El número de signo más es x=122, se halla el estadístico de prueba Z:

Z= = 1.27

Mediante tabla para Z=1.27, se calcula para dos colas el valor-p=2(1- 0.8980) = 0.204.
Como el valor-p≥ α=0.01, entonces no se rechaza H0.

71
Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de la Prueba de Wilcoxon


Con efecto de determinar el rendimiento de la gasolina en millas por galón en los
automóviles de pasajeros, se prueban dos aditivos para gasolina. A continuación
aparecen los resultados de esta prueba en 12 automóviles; en cada automóvil se
probaron los dos aditivos. Use nivel de significancia α=0.05 y la prueba de los rangos con
signo de Wilcoxon para determinar su existe una diferencia significativa.

AUTÓMOVI Aditivos
L
1(milla 2(milla
s/galón) s/galón)

1 20.12 18.05

2 23.56 21.77

3 22.03 22.57

4 19.15 17.06

5 21.23 21.22

6 24.77 23.80

7 16.16 17.20

8 18.55 14.98

9 21.87 20.03

10 24.23 21.15

11 23.21 22.78

12 25.02 23.70

72
Laboratorio de Estadística Industrial 2016

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

H1: Las poblaciones no son idénticas en relación a los aditivos.

AUTÓMOVI Aditivos Diferenci Valorabs.d Rang Rang


L a e o o con
1(milla 2(milla diferencia signo
s/galón) s/galón)

1 20.12 18.05 2.0 2.07 9 9


7

2 23.56 21.77 1.7 1.79 7 7


9

3 22.03 22.57 -0.54 0.54 3 -3

4 19.15 17.06 2.0 2.09 10 10


9

5 21.23 21.22 0.0 0.01 1 1


1

6 24.77 23.80 0.9 0.97 4 4


7

7 16.16 17.20 -1.04 1.04 5 -5

8 18.55 14.98 3.5 3.57 12 12


7

9 21.87 20.03 1.8 1.84 8 8


4

10 24.23 21.15 3.0 3.08 11 11


8

11 23.21 22.78 0.4 0.43 2 2


3

12 25.02 23.70 1.3 1.32 6 6


2

73
Laboratorio de Estadística Industrial 2016

Suma de signos: 62

Media: µt=0

Desviación: t= = = 25.50

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el


valor de T=62. Se obtiene el valor para el estadístico de prueba:

Z= = =2

De la tabla para Z=2.43 se halla para dos colas el valor-p=2(1-0.9925)=0.015. Como el


valor-p ≤ α=0.05, se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el


valor-p (P)=0.017, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de
H0. Entonces las dos poblaciones son distintas.

74
Laboratorio de Estadística Industrial 2016

En 10 de los principales aeropuertos se muestran los precios de la gasolina para


automóviles rentados. A continuación se presentan los datos correspondientes a las
empresas Avis y Budget. Use α = 0.05 para probar la hipótesis de que hay diferencia
entre las 2 poblaciones. ¿Cuál es su conclusión?

Aeropuertos Empresas

Avis Budget

Boston 1.58 1.39


Logan

Chicago 1.60 1.55


Ohare

Chicago 1.53 1.55


Midway

Denver 1.55 1.51

Fort 1.57 1.58


Lauderdale

Los Ángeles 1.80 1.74

Miami 1.62 1.60

Nuevo York 1.69 1.60

Orange 1.75 1.59


Country

Washington 1.55 1.54


W.

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

H1: Las poblaciones no son idénticas en relación a los aditivos.

75
Laboratorio de Estadística Industrial 2016

Aero Empresas Diferenci Valor Rang Rang


puertos a abs. de o o con
Avis Budget
diferenci signo
a

Boston 1.58 1.39 0.1 0.1 10 10


Logan 9 9

Chicago 1.60 1.55 0.0 0.0 6 6


Ohare 5 5

Chicago 1.53 1.55 -0.02 0.02 3.5 -3.5


Midway

Denver 1.55 1.51 0.0 0.04 5 5


4

Fort 1.57 1.58 -0.01 0.01 1.5 -1.5


Lauderdale

Los 1.80 1.74 0.0 0.06 7 7


Ángeles 6

Miami 1.62 1.60 0.0 0.02 3.5 3.5


2

Nuevo York 1.69 1.60 0.0 0.09 8 8


9

Orange 1.75 1.59 0.1 0.1 9 9


Country 6 6

Washingto 1.55 1.54 0.0 0.0 1.5 1.5


n W. 1 1

Suma de signos=45

Media: µt=0

Desviación: t= = = 19.62

76
Laboratorio de Estadística Industrial 2016

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el


valor de T=45. Se obtiene el valor para el estadístico de prueba:

Z= = = 2.29

De la tabla para Z= 2.29, se halla para dos colas el valor-p=2(1-0.9890)=0.0220 como el


valor-p ≤ 0.05, Se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el


valor-p (P)=0.025, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de
H0. Entonces las dos poblaciones son distintas.

77
Laboratorio de Estadística Industrial 2016

El campeonato de los jugadores de la PGA tuvo lugar, del 23 al 26 de marzo del 2006, en
el campeonato de golf TPC Sangras en Ponte Vendra Beach, Florida. A continuación se
presentan puntuaciones obtenidas, en la primera y segunda ronda, por 11 golfistas de la
muestra. Use α = 0.05 y determinar si existe una diferencia significativa entre las
puntuaciones obtenidas por los golfistas en la primera y segunda ronda. ¿Cuál es su
conclusión?

Entregas Rondas

Fred 69 73
Couples

John Dab 70 73

Ernie Els 72 70

Jim Furyk 65 71

Phil 70 73
Mickelson

Rocco 69 74
Mediate

Nick Price 72 71

Vijay Singh 68 70

Sergio 70 68
García

Mike Weir 71 71

Tiger 72 69
Woods

78
Laboratorio de Estadística Industrial 2016

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

H1: Las poblaciones no son idénticas en relación a los aditivos.

Entregas Servicios Diferenci Valorabs.d Rang Rang


a e o o con
1 2
diferencia signo

Fred 69 73 -4 4 8 -8
Couples

John Dab 70 73 -3 3 6 -6

Ernie Els 72 70 2 2 3 3

Jim Furyk 65 71 -6 6 10 -10

Phil 70 73 -3 3 6 -6
Mickelson

Rocco 69 74 -5 5 9 -9
Mediate

Nick Price 72 71 1 1 1 1

Vijay 68 70 -2 2 3 -3
Singh

Sergio 70 68 2 2 3 3
García

Mike Weir 71 71 0 0 -- --

Tiger 72 69 3 3 6 6
Woods

Suma de signos = -29

Media: µt=0

Desviación: t= = = 19.62

79
Laboratorio de Estadística Industrial 2016

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el


valor de T=-29. Se obtiene el valor para el estadístico de prueba:

Z= = = -1.48

De la tabla para Z= 1.48, se halla para dos colas el valor-p = 2(1-0.99306)=0.1388, como
el valor-p ≥ 0.05, No se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el


valor-p (P)=0.154, el cual es mayor a α = 0.05, por lo tanto se comprueba el no rechazo
de H0. Entonces las dos poblaciones son idénticas.

80
Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de la Prueba de Mann-Whitney-Wilcoxon

Para poder comprobar el efecto de dos aditivos sobre el rendimiento de gasolina,


siete automóviles usan aditivo 1 y nueve automóviles el aditivo 2. En los datos siguientes
se presenta el rendimiento en millas por galón obtenido con cada uno de los dos aditivos.
Use α = 0.05 y la prueba de MWW para determinar si existe una diferencia significativa
en el efecto que tiene los dos aditivos sobre el rendimiento.

ADITIVO 1 ADITIVO 2

17.3 18.7

18.4 17.8

19.1 21.3

16.7 21.0

18.2 22.1

18.6 18.7

17.5 19.8

20.7

20.2

Solución:

H0: las dos poblaciones son idénticas en término de rendimiento.

H1: las dos poblaciones no son idénticas en términos de rendimiento.

Nivel de significancia que se toma α=0.05.

ADITI RAN ADITI RAN


VO 1 GO VO 2 GO

81
Laboratorio de Estadística Industrial 2016

16.7 1 17.8 4

17.3 2 18.7 8.5

17.5 3 18.7 8.5

18.2 5 19.8 11

18.4 6 20.2 12

18.6 7 20.7 13

19.1 10 21.0 14

21.3 15

22.1 16

Suma de rangos: 34 102

Se toma la suma de rangos de la primera muestra para el valor de T=34.

82
Laboratorio de Estadística Industrial 2016

Para un nivel de significancia α=0.05, de la tabla se encuentra el valor crítico Tl


en la cola inferior para el estadístico de prueba MWW con n1=7 y n2=9 es Tl=41. El
valor crítico en la cola superior para el estadístico de prueba MWW es:

Tu=n1 (n1 +n2 +1)- Tl=7(7+9+1) – 41=78

La decisión que se tomara es:

Rechazar H0 si T<41 v T> 78.

Se concluye, como: T=34, además 34 < 41, entonces se rechaza H0.

Minitab:

Conclusión:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces


ambas poblaciones no son idénticas en términos de rendimiento según el aditivo usado.

83
Laboratorio de Estadística Industrial 2016

A continuación se muestra los datos muestrales de los salarios iniciales de


contadores públicos y planificadores financieros. Los salarios anuales están dados en
millones de dólares.

Use 0.05 como nivel de significancia y prueba la hipótesis de que no hay diferencia
entre los salarios anuales iniciales de los contadores públicos y los planificadores
financieros.

Contador Público Planificador


Financiero

45.2 44.0

45.9 44.2

46.9 48.1

49.2 50.9

50.0 46.9

51.3 48.6

52.0 44.7

53.2 48.9

53.8 46.8

54.5 43.9

Solución:

H0: las dos poblaciones son idénticas en término de salarios iniciales.

H1: las dos poblaciones no son idénticas en términos de salarios iniciales.

Nivel de significancia que se toma α=0.05.

84
Laboratorio de Estadística Industrial 2016

Contador Planificador
Público Financiero

Sal Ran Sal Ran


ario go ario go

45. 5 43. 1
2 9

45. 6 44. 2
9 0

46. 8.5 44. 3


9 2

49. 13 44. 4
2 7

50. 14 46. 7
0 8

51. 16 46. 8.5


3 9

52. 17 48. 10
0 1

53. 18 48. 11
2 6

53. 19 48. 12
8 9

54. 20 50. 15
5 9

Suma de Rangos 136.5 73.5

La suma de los rangos que se toma es de la primera muestra: T=136.5.

Como n1=10 y n2=10 se usa la aproximación normal de la distribución muestral de


la suma de rangos T:

85
Laboratorio de Estadística Industrial 2016

µt= n1(n1+n2+1) = 10(10+10+1) =105

t= = = 13.23

Para T= 136.5 y nivel de significancia 0.05 se halla el estadístico de prueba:

Z= = = 2.38

Mediante tabla para Z=2.38, se halla para 2 colas el valor-p=2(1-0.9913)=0.0174. Como


valor-p≤α=0.05, entonces se rechaza H0.

Minitab:

Conclusión:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces


ambas poblaciones no son idénticas en términos de salarios entre la población de
contadores públicos y de planificadores financieros.

86
Laboratorio de Estadística Industrial 2016

La brecha entre los salarios de hombres y mujeres con la misma preparación


disminuye cada vez más, pero aún no se ha cerrado totalmente. A continuación se
presenta datos de muestras de 7 hombres y 7 mujeres con licenciatura. Los datos se dan
en miles dólares.

Hombre 3 7 4 6 3 4 5
0.6 5.5 5.2 2.2 8.2 9.9 5.3

Mujeres 4 3 2 4 2 4 2
4.5 5.4 7.9 0.5 5.8 7.5 4.8

Solución:

H0: las dos poblaciones son idénticas en término de salarios iniciales.

H1: las dos poblaciones no son idénticas en términos de salarios iniciales.

Nivel de significancia que se toma α=0.05.

Hombres Mujeres

Sal Ran Sal Ran


ario go ario go

30. 4 24. 1
6 8

38. 6 25. 2
2 8

45. 9 27. 3
2 9

49. 11 35. 5
9 4

55. 12 40. 7
3 5

62. 13 44. 8

87
Laboratorio de Estadística Industrial 2016

2 5

75. 14 47. 10
5 5

Suma de Rangos 69 36

La suma de rangos que se toma es de la primera muestra: T=69.

Para un nivel de significancia de 0.05. La cota inferior para un estadístico de


prueba MWW mediante tabla es Tl= 37. La cota superior para un estadístico de prueba
MWW se calcula:

Tu=n1 (n1 +n2 +1)- Tl=7(7+7+1) – 37 = 68

La decisión que se tomara es:

Rechazar H0 si T<37 v T> 68.

Se concluye, como: T=69, además 69 > 68, entonces se rechaza H0.

Minitab:

88
Laboratorio de Estadística Industrial 2016

Conclusión:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces


ambas poblaciones no son idénticas en términos de salarios entre mujeres y hombres

Prueba de Kruskal-Wallis
Las calificaciones dadas a productos por un panel de 15 consumidores son las
siguientes:

PRODUCTO

A B C

50 80 60

62 95 45

75 98 30

48 87 58

65 90 57

Use la prueba de Kruskal-Wallis y α=0.05 para determinar si existe una diferencia


significativa entre las clasificaciones dadas de los tres productos.

89
Laboratorio de Estadística Industrial 2016

Solución:

PRODUCTO

A RANGO B RANGO C RANGO

4 3 8 1 3 1
8 0 1 0

5 4 8 1 4 2
0 7 2 5

6 8 9 1 5 5
2 0 3 7

6 9 9 1 5 6
5 5 4 8

7 1 9 1 6 7
5 0 8 5 0

TOTAL 3 6 2
4 5 1

H0: Todas poblaciones son idénticas.

H1: No todas las poblaciones son idénticas.

90
Laboratorio de Estadística Industrial 2016

Nivel de significancia y α=0.05.

Los tamaños de las muestras son:

n1=5, n2=5, n3=5 y nT=15

Calculamos el estadístico de prueba W:

W=

W = 10.22

Para k-1=3-1=2 grados de libertad.

X2= 9.210 su área de cola superior = 0.01

X2= 10.597 su área de cola superior = 0.005

Entonces el valor-p esta entre 0.01 y 0.005, por tanto valor-p ≤ α=0.05, se rechaza
H0.

91
Laboratorio de Estadística Industrial 2016

Minitab:

Conclusión:

El valor-p que se calcula es 0.006, por tanto, valor-p=0.006 ≤ α=0.05, se rechaza


H0.

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre
la clasificación entre los 3 productos.

92
Laboratorio de Estadística Industrial 2016

Para un examen de admisión se evalúan tres programas de preparación. Las


calificaciones obtenidas por las 20 personas de una muestra empleada para probar los
programas de preparación son las siguientes. Use la prueba de Kruskal-Wallis para
determinar su hay diferencia significativa entre los tres programas de preparación. Use
α=0.01.

PROGRAMAS

A B C

540 450 600

400 540 630

490 400 580

530 410 490

490 480 590

610 370 620

550 570

93
Laboratorio de Estadística Industrial 2016

Solución:

PROGRAMAS

A RANGO B RANGO C RANGO

400 2.5 370 1 490 8

490 8 400 2.5 570 14

490 8 410 4 580 15

530 10 450 5 590 16

540 11.5 480 6 600 17

610 18 540 11.5 620 19

550 13 630 20

TOTAL 58 43 109

H0: Todas poblaciones son idénticas.

H1: No todas las poblaciones son idénticas.

Nivel de significancia y α=0.01.

Los tamaños de las muestras son:

n1=6, n2=7, n3=7 y nT=20

Calculamos el estadístico de prueba W:

94
Laboratorio de Estadística Industrial 2016

W=

W = 9.06

Para k-1=3-1=2 grados de libertad.

X2= 7.378 su área de cola superior = 0.025

X2= 9.210 su área de cola superior = 0.01

Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza
H0.

Minitab:

95
Laboratorio de Estadística Industrial 2016

Conclusión:

El valor-p que se calcula es 0.011, por tanto, valor-p=0.011 ≤ α=0.05, se rechaza


H0.

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre
los tres programas de calificación.

Para bajar de peso basta con practicar una de las siguientes disciplinas tres veces
por semana durante 40 minutos. En la tabla siguiente se muestra la cantidad de calorías
que se quema en 40 minutos de cada una de estas disciplinas. ¿Estos datos indican que
exista diferencia en la cantidad de calorías quemadas con cada una de estas disciplinas?
De su conclusión.

DISCIPLINAS

NAT TENI AND


ACIÓN S AR EN
BICICLETA

408 415 385

380 485 250

425 450 295

400 420 402

427 530 268

Solución:

DISCIPLINAS

96
Laboratorio de Estadística Industrial 2016

NATACIÓN RANGO TENIS RANGO ANDAR EN RANGO


BICICLETA

380 4 415 9 250 1

400 6 420 10 268 2

408 8 450 13 295 3

425 11 485 14 385 4

427 12 530 15 402 7

TOTAL 41 61 17

H0: Todas poblaciones son idénticas.

H1: No todas las poblaciones son idénticas.

Nivel de significancia y α=0.05.

Los tamaños de las muestras son:

n1=5, n2=5, n3=5 y nT=15

Calculamos el estadístico de prueba W:

W=

W = 9.26

97
Laboratorio de Estadística Industrial 2016

Para k-1=3-1=2 grados de libertad.

X2= 7.378 su área de cola superior = 0.025

X2= 9.210 su área de cola superior = 0.01

Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza
H0.

Minitab:

Conclusión:

El valor-p que se calcula es 0.010, por tanto, valor-p=0.010 ≤ α=0.05, se rechaza


H0.

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre
los la cantidad de calorías quemadas con cada una de las disciplinas.

98
Laboratorio de Estadística Industrial 2016

Series de Tiempo
Año Ventas ( miles de
dólares)

La empresa 1973 1 “Alicorp.Sac” tiene en


su base de datos el registro de ventas
desde el año 1973 a 1974 2 1994, con dichos datos
calcular el promedio 1975 3 móvil de 3 años.

1976 4

1977 5

1978 4

1979 3

1980 2

1981 3

1982 4

1983 5

1984 6

1985 5

1986 4

1987 3

1988 4
Solución:
1989 5
Gráfica de los promedios móviles
1990 6

1991 7

1992 6

1993 5

1994 4

1995 5

99 1996 6

1997 7

1998 8
Laboratorio de Estadística Industrial 2016

Gráfica de análisis de tendencia de Ventas

100
Laboratorio de Estadística Industrial 2016

Gráfica de promedio móvil de 7 años

101
Laboratorio de Estadística Industrial 2016

En la compañía “Graña y Montero S.A”, los porcentajes mensuales de los


embarques recibidos durante los últimos 12 meses fueron:

Meses Porcenta
jes

1 80

2 82

3 84

4 83

5 83

6 84

7 85

8 84

9 82

10 83

11 84

12 83

102
Laboratorio de Estadística Industrial 2016

Compare el pronóstico de promedio móvil de tres meses con el suavizamiento con


α=0.2. ¿Con cuál se obtiene mejor pronóstico?

Cuáles son los pronósticos por cada método para el próximo mes.

Solución:

Pronóstico con promedios móviles.

Gráfica de suavizamiento con promedios móviles

103
Laboratorio de Estadística Industrial 2016

Pronóstico
con el método de
suavizamiento exponencial

Grafica de suavizamiento exponencial

104
Laboratorio de Estadística Industrial 2016

105
Laboratorio de Estadística Industrial 2016

Las ventas, en miles de millones de dólares de la empresa “Petroperú”, para el


2006 hasta el 2012 son:

Año Ventas

2007 7.45

2008 7.83

2009 8.07

2010 7.94

2011 7.76

2012 7.90

Graficar el análisis de tendencia

Usar método de los promedios móviles de 3 semanas.

Usar el método de suavizamiento por mínimos cuadrados.

Estime las ventas netas para el año 2013.

106
Laboratorio de Estadística Industrial 2016

Solución:

Análisis de tendencia:

107
Laboratorio de Estadística Industrial 2016

108
Laboratorio de Estadística Industrial 2016

109
Laboratorio de Estadística Industrial 2016

Análisis de Regresión Ventas por Año:

110

También podría gustarte