Está en la página 1de 56

Ing. de Sistemas e Informtica Ing.

Industrial

UAP
Inferencia Estadstica

REGRESIN Y CORRELACIN
Si a cada unidad estadstica se le observa simultneamente dos variables cuantitativas
entonces se obtiene dos series de datos emparejados. En este caso con frecuencia se desea
conocer si ambas variables estn relacionadas o si son independientes.
Unidad estadstica
Variable: X
Variable: Y

:
:
:

1
X1

2
X2

3
X3

Y1

Y2

Y3

............
............

n
Xn

Yn

Es decir, se tiene n observaciones bidimensionales:

( X i , Yi ) :

(X1 , Y1) , (X2 , Y2) , ........ ,

(Xn , Yn)

Diagrama de esparcimiento
Cada par de datos representa un punto en el sistema cartesiano.

Este conjunto de puntos ( X i , Yi ) se llama diagrama de esparcimiento, diagrama de


dispersin, dispersigrama o nube de puntos.
El diagrama de dispersin puede tomar diferentes formas:

Entonces, segn la forma del diagrama de dispersin; podemos pensar en un modelo


matemtico que mejor describa la relacin existente entre X e Y.
El sentido de la regresin es el de prediccin de una variable basndonos en el conocimiento
de otra.
Profesora: Gladys Enrquez Mantilla

272

UAP

Ing. de Sistemas e Informtica Ing. Industrial

Inferencia Estadstica
Regresin
Es un mtodo que se emplea para encontrar una funcin que se adapte o ajuste a un diagrama
de esparcimiento con la finalidad de poder obtener una prediccin aproximada de una de las
variables a partir de la otra.
El objetivo de un anlisis de regresin es investigar la relacin estadstica que existe entre
una variable dependiente Y y una o ms variables independientes X1 , X2 , ...... , X k . Para
poder realizar esta investigacin, se debe postular una relacin funcional entre las variables.
Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la prctica es la
relacin lineal. Cuando solo existe una variable independiente, esto se reduce a una lnea
recta:
Y f (X)
Donde:
X : variable predictora (variable independiente o explicativa)
Y : variable predictando o variable respuesta (variable dependiente o explicada).
Al analizar los siguientes diagramas de dispersin:
La nube de puntos parece ajustarse bien
a una recta.

Una lnea recta de pendiente positiva


puede aproximarse a casi todos los
puntos.
Un anlisis de regresin est justificado.

No hay indicios de existencia de relacin.

Cualquier recta que se trace deja a


muchos puntos alejados de ella.
Hacer un anlisis de regresin no tiene
sentido.

El ajuste lineal no parece adecuado para


este dispersigrama.

Existen observaciones atpicas (outliers).

Existe relacin pero no lineal.

Probablemente influyan en la estimacin


de la recta.

Correlacin
Es el mtodo empleado para determinar el grado de relacin entre las variables que se
estudian para as determinar en qu medida una relacin funcional describe o explica de una
forma adecuada la relacin entre estas variables. Explica el grado de la bondad del ajuste del
modelo de regresin.

Profesora: Gladys Enrquez Mantilla

273

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Coeficiente de Correlacin Lineal Simple:

r (Coeficiente de Pearson)

Indica si hay relacin lineal entre dos variables y el grado de esta relacin (alta, baja o nula).
Permite contestar qu tan estrecha es la relacin entre X e Y?
El signo de r tiene que ver slo con la direccin de la relacin entre dos variables, ya sea
directa o inversa y la magnitud del coeficiente tiene que ver con la intensidad o estrechez de
la relacin. El valor de r puede ser positivo, negativo o cero.

1 r 1

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 +1 y es tanto ms dbil


a medida que se aproxima a 0.
Nota:

Si r 0,75 la recta de regresin ser una buena estimacin.

Todo r 0 indica cierto grado de relacin entre dos variables

Una correlacin baja no siempre significa ausencia de relacin ya que puede existir
una correlacin curvilnea muy estrecha.

r 1
Existe una relacin lineal directa perfecta
(positiva) entre las dos variables. Es decir, las
puntuaciones bajas de X se asocian con las
puntuaciones bajas de Y, mientras las
puntuaciones altas de X se asocian con los
valores altos de la variable Y.

r 1
Existe una relacin lineal inversa perfecta
(negativa) entre las dos variables. Es decir, las
puntuaciones bajas en X se asocian con los
valores altos en Y, y las puntuaciones altas en
X se asocian con los valores bajos en Y.

r 0
No existe una relacin lineal entre las dos variables estudiadas.

Profesora: Gladys Enrquez Mantilla

274

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Frmulas para calcular el Coeficiente de Correlacin Lineal de Pearson:

XY X Y
2
2
n
2
2
X X n Y Y
n

Forma de Regresin:

Conociendo a y b :

b . b

Y b XY n Y2
Y2 n Y2

Ejemplo:
Una encuesta entre vendedores de autos usados para determinar la relacin entre la cantidad
de anuncios clasificados y la venta de autos usados, dio los siguientes resultados del nmero
de avisos clasificados y el nmero de automviles usados vendidos para cada uno de los
negocios que no utilizaron ningn otro medio publicitario.
N Anuncios clasificados
N Autos vendidos

:
:

74
139

45
110

50
95

38
78

29
60

17
54

Calcular e interpretar el coeficiente de correlacin.


Solucin:

6 25608 253 536


( 6 12575 253 2 ) ( 6 53046 536 2 )

0.958

Un modelo lineal es confiable, por lo tanto se pueden realizar pronsticos.

Estadsticas Estadsticas Bsicas Correlacin

Al hacer clic en Aceptar.

Profesora: Gladys Enrquez Mantilla

275

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

r2

Coeficiente de Determinacin:

Determina el porcentaje de la variacin total de Y que queda explicada por la ecuacin de


regresin. Mide la bondad del ajuste de la lnea de regresin.

0 r2 1
Ejemplo:

r 0.958

r2 0.9582 100 92%

El 92% de los cambios que se producen en el nmero de autos vendidos pueden ser atribuidos
a los cambios que se producen en el nmero de anuncios clasificados, mientras que el 8% de
dichos cambios se pueden atribuir a otros factores que no han sido tomados en cuenta en
este caso o a efectos aleatorios.
Covarianza:

S xy

La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones


estn relacionadas entre s. El signo de la covarianza nos dice si el aspecto de la nube de
puntos es creciente o decreciente, pero no nos dice nada sobre el grado de relacin entre las
variables.
La frmula para calcular la covarianza es:

SXY Cov ( X , Y )

XY X . Y
n

Una covarianza positiva significa que existe una relacin lineal positiva entre las dos variables,
cuando es negativa significa que existe una relacin lineal inversa (negativa) entre las dos
variables; cuando es cero se interpreta como la no existencia de una relacin lineal entre las
dos variables estudiadas.
Ejemplo.
Usando los datos de la encuesta entre vendedores de autos usados para determinar la relacin
entre la cantidad de anuncios clasificados y la venta de autos usados, se tiene:

SXY

25608
253
536

501 .11
6
6
6

Como la covarianza es positiva entonces podemos concluir que existe una relacin lineal
positiva entre el nmero de autos vendidos y el nmero de avisos clasificados.
Modelos de Regresin:
Estudian la relacin cuantitativa (estocstica) entre una variable de inters Y (respuesta o
dependiente), y un conjunto de variables explicativas ( x1 , x 2 , .... , x n ) (regresoras o
independientes)

Profesora: Gladys Enrquez Mantilla

276

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

MODELO DE REGRESION BIVARIABLE LINEAL


Modelo de Regresin de Y sobre X:
Sea ( x1, y1 ) , ( x 2 , y 2 ) , ..... . ( x n , y n ) observaciones de las variables X e Y para una muestra
de tamao n, donde ( y1 , y 2 , .... , y n ) son independientes. El modelo de regresin lineal
simple est dado por:

Yi X i e i
Donde y
son parmetros desconocidos, ( x1 , x 2 , .... , x n ) son valores fijos y
( e1 , e 2 , ... , e n ) son errores aleatorios.
Recta de Regresin de Y sobre X:

a bX
Y

Se llama as a la recta que atraviesa el diagrama de esparcimiento y que mejor se ajusta a l.


Si llegamos a conocer la ecuacin, se podr llegar a estimar valores de Y desconocidos a partir
de valores de X conocidos.
Y = f(X)
Variable
Predictando

Variable
Predictora

Y : variable predictando, predicha, explicada o respuesta.


X : variable predictora o explicativa.
Y = a + bX + ei

e : error de estimacin, residuo, error residual.

Error o residuo: e i
Es la distancia que hay del valor observado a la
recta de regresin. Puede ser positivo o negativo.
El error de cada dato se calcula mediante:
i
ei y i y
El promedio de los errores es igual a cero, al igual
que la suma.

Recta de Regresin de X sobre Y:

a' b' X
X

Si se hubiera tomado Y como variable predictora o explicativa y X como predictando o


explicada, la recta de regresin estima X a partir de los valores de Y.
X = f(Y)
Variable
Predictando

= a + bY + ei
X

Profesora: Gladys Enrquez Mantilla

Variable
Predictora
ei : errores de estimacin.

277

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Rectas de Regresin de Y sobre X y de X sobre Y

Ambas rectas de regresin, se cortan en el punto cuyas coordenadas corresponden a las


medias de ambas variables: ( x , y ) , a este punto se le suele llamar centro de gravedad G de
la distribucin
Por lo general: a a y b b Por lo tanto la ecuacin de regresin de Y sobre X difiere
de la ecuacin de regresin de X sobre Y.
Slo cuando la coincidencia entre los puntos reales y la recta de regresin sea perfecta,
entonces ambas rectas de regresin sern iguales.

a a'

b b'

En este caso, las dos rectas de regresin son coincidentes, entonces los datos quedan
perfectamente descritos por una relacin lineal. La prediccin es perfecta.

Los datos presentan una mejor


relacin lineal a medida que las dos
rectas se acercan.

Si ambas rectas son perpendiculares


entonces los datos no presentan una
relacin lineal.

Interpretacin de a y b
a:

es la interseccin de la recta de regresin con el eje Y.


Es el valor que toma la variable predictando Y cuando la variable predictora X es cero.

b:

Coeficiente de regresin. Es la pendiente de la recta.


Debe tener el mismo signo que r.
Es la cantidad de cambio de la variable predictando Y asociada a un cambio unitario
de la variable predictora X.

Profesora: Gladys Enrquez Mantilla

278

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Si la recta presenta pendiente positiva: b > 0

Existe una relacin lineal directa o positiva


(cuando X aumenta Y tambin aumenta).

Ejemplo:
Si Y = 2 + 0.7 X

donde:

X : Horas de estudio

Y : N de respuestas correctas.

Horas de estudio
a =2
Cuando la alumna no estudia, se espera que obtenga 2 respuestas correctas.
b = 0.7

Por cada hora que se incremente en las horas de estudio, se espera que el nmero de
respuestas correctas se incremente en aproximadamente 1.
Si la recta presenta pendiente negativa: b < 0

Existe una relacin lineal inversa o negativa.


(cuando X aumenta Y disminuye)

Ejemplo:
Si Y = 19 2.2 X

donde:

X: Horas de estudio

Y : N de errores cometidos.

Horas de estudio
Profesora: Gladys Enrquez Mantilla

279

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
a = 19

Cuando la alumna no estudia, se espera que cometa 19 errores.


b = -2.2

-2

Por cada hora que se incremente en las horas de estudio, se espera que el nmero de errores
disminuya en aproximadamente 2.
En algunas situaciones, a no tiene una interpretacin realista si el cero no es un punto del
rango de la X. Por ejemplo, al estudiar la relacin entre las variables peso y estatura de un
grupo de personas; no podra decirse que si la estatura de una persona es 0, se espera que
su peso sea tal.

Segn el signo de b, se tiene:

b 0
Existe relacin lineal
directa

b0
Existe relacin lineal
Inversa

b 0
No existe
Relacin

Segn el signo de a y b, un modelo lineal puede presentar cualquiera de las siguientes formas:

a0
b0

a0
b0

a0
b0

a0
b0

Un valor atpico o outlier modifica de forma importante la recta de regresin ajustada.

Profesora: Gladys Enrquez Mantilla

280

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

MTODO DE MINIMOS CUADRADOS


Al observar el diagrama de esparcimiento se puede ver que ninguna recta pasar por todos
los puntos, entonces cul ser la mejor? El mtodo de mnimos cuadrados es una tcnica
empleada para llegar a la ecuacin de regresin minimizando la suma de los cuadrados de las
distancias verticales entre los valores Y verdaderos y los valores pronosticados de Y.
Este mtodo supone que la recta de mejor ajuste es aquella para la cual la suma de los
cuadrados de las distancias verticales de los puntos (Xi , Yi) a la recta es mnima.

Si entre estas variables existiera una relacin lineal perfecta, entonces todos los puntos
caeran sobre la recta de regresin, que tambin ha sido trazada y que muestra la relacin
promedio que existe entre las dos variables.
En la prctica, se observa que la mayora de los puntos no caen directamente sobre la recta,
sino que estn dispersos en torno a ella. Esta dispersin representa la variacin en Y que
no puede atribuirse a la variacin en X.

Y abX

MODELO DE REGRESIN DE Y SOBRE X

i )2
( Yi Y
d2i e2i

Esta expresin se minimiza derivando:


S
0
a

i )2

( Yi Y
a
a
a

( Yi a bX i )2 2
a

=
=
=

na

Xi

Profesora: Gladys Enrquez Mantilla

mnimo

S
0
b

( Y (a bX ) 0
i

( Yi a bX i )(1)
2 ( Yi a b Xi )
2 Yi 2 a 2 b Xi
Yi n a b Xi 0
Yi

281

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

i )2

( Yi Y
b
b

( Yi a bX i )2
b

=
=
a

Xi

X2i

( Y

(a bX i ) )2 0

( Yi a bX i ) (Xi )
2 ( Xi Yi a Xi b X2i )
2 Xi Yi 2 a Xi 2 b X2i
X i Yi a X i b X2
i 0

2
=

Xi Yi

Estas ecuaciones se llaman Ecuaciones Normales:


na
a

Xi

Xi
b X2
i
b

Yi
Xi Yi

Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

X2 Y X XY
2
n X2 X

MODELO DE REGRESIN DE X SOBRE Y

XY X Y
2
n X 2 X

X a b Y

Las ecuaciones normales o paramtricas de regresin son:

a n b

a
Y b

Y
Y2

X
X Y

Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

a'

Y2 X Y XY
2
n Y 2 Y

b'

XY Y X
2
n Y 2 Y

Forma matricial
Ecuacin de Regresin de Y sobre X:

a n

b
X

X Y

X2 XY

Profesora: Gladys Enrquez Mantilla

Ecuacin de Regresin de X sobre Y:

a n

b
Y

Y X

Y2 XY
282

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Ejemplo:

Tomando los datos de la cantidad de anuncios clasificados y el nmero de autos vendidos:


N Anuncios clasificados
N Autos vendidos
a)

:
:

74
139

45
110

50
95

38
78

29
60

17
54

Trazar el diagrama de esparcimiento.

1. Digitar los datos.

2. Graph Scatterplot

Clic en OK.
3. Ingresar las variables correspondientes.

Clic en OK

Profesora: Gladys Enrquez Mantilla

283

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Entonces, se muestra el siguiente diagrama de dispersin:


Scatterplot of AutosVend:Y vs Anuncios:X
140
130

AutosVend:Y

120
110
100
90
80
70
60
50
10

b)

20

30

40
50
Anuncios:X

70

80

Hallar las ecuaciones normales:

a n bX Y

a X bX X Y
c)

60

6 a 253 b 536

253 a 12575 b 25608

Ajustar un modelo lineal a los datos:

a bX
Y

X2 Y X XY
2
n X2 X

XY X Y
2
n X 2 X

22.80 1.58 X
Y

12575 536 253 25608


6 12575 253 2

6 25608 253 536


6 12575 253 2

22.80

1.58

Interpretando a y b:
a = 22,8 23 autos vendidos.
Cuando no se publican anuncios clasificados, se espera vender aproximadamente 23
autos.
b = 1,58 2 autos vendidos
Por cada anuncio clasificado que se incremente, se espera que el nmero de autos
vendidos se incremente en aproximadamente 2.

Profesora: Gladys Enrquez Mantilla

284

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Stat Regresin Fitted Line Plot

Clic en OK

Fitted Line Plot

AutosVend:Y = 22,85 + 1,577 Anuncios:X


S
R-Sq
R-Sq(adj)

140
130

10,2770
91,8%
89,8%

AutosVend:Y

120
110
100
90
80
70
60
50
10

d)

20

30

40
50
Anuncios:X

60

70

80

Hallar los valores estimados y los residuos o errores de estimacin:


Valores Reales u observados
N Anuncios
N Autos vend.
X
Y
74
45
50
38
29
17

139
110
95
78
60
54

Valores Estimados
22.8 1.6 X
Y
141.2
94.8
102.8
83.6
69.2
50.0

Residuos

ei Y Y
- 2.2
15.2
- 7.8
- 5.6
- 9.2
4.0

Al observar la columna de los residuos o errores de estimacin se puede apreciar que


la mayora son negativos, eso significa que se estn realizando estimaciones por
encima del valor real.

Profesora: Gladys Enrquez Mantilla

285

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Error Estndar de Estimacin (

SL )

En un diagrama de dispersin no todos los puntos coinciden con la lnea de regresin. Si


todos los puntos estuvieran sobre la lnea no habra error al predecir la variable respuesta Y
basndose en la variable predictora X.
El error estndar de estimacin nos da una medida de la desviacin promedio de los errores
de prediccin en torno a la lnea de regresin. Mide la dispersin de los valores observados
alrededor de la recta de regresin.
Es el mismo concepto de la desviacin estndar. La desviacin estndar mide la dispersin
de los datos alrededor de la media aritmtica, el error estndar de estimacin mide la
dispersin de los valores observados alrededor de los valores estimados (recta de regresin).
El error estndar de estimacin se determina por medio de:

S Y /X

n 2

XY

Ejemplo:
Continuando con el ejemplo de la cantidad de anuncios clasificados y el nmero de autos
vendidos:
N Anuncios clasificados
N Autos vendidos

SY/X

:
:

74
139

45
110

50
95

38
78

29
60

53046 22.8456 536 1.5768 25608


4

17
54

10.27

En promedio los valores reales se alejan con respecto a la recta de regresin en


aproximadamente 10 autos.

Intervalo de pronstico para un valor futuro de Y:

L
Li Y
s

Es frecuente desear obtener un intervalo de valores razonables para el valor de Y asociado


con algn experimento futuro cuando la variable predictora X tenga un valor x 0

a b x0 t0 SL

1
n ( x0 x )2

2
n
n X2 ( X )

t 0 t1 - /2 , n2

Profesora: Gladys Enrquez Mantilla

286

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Ejemplo:
N Anuncios clasificados
N Autos vendidos

:
:

74
139

45
110

50
95

38
78

29
60

17
54

Para 55 avisos clasificados, hallar un intervalo de pronstico del 95% para el nmero de autos
vendidos.
Solucin:

t o t1 - /2 , n 2 t 0.975 , 4 2.776

22.8456 1.5768 55 2.776 10.27

x 0 55

x 42.17

1
6 ( 55 42.17 )2

6
6 12575 253 2

141 .48
77 .65 Y

Con una confianza del 95%, para 55 avisos clasificados se espera que el nmero de autos
vendidos sea aproximadamente como mnimo 78 y como mximo 141.

1. Digitar los datos:

2. Stat Regression Regression

3. Clic en Options.

Clic en OK y luego en OK.

Profesora: Gladys Enrquez Mantilla

287

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Intervalo de confianza para
Un intervalo de confianza del ( 1 )%
regresin es: L i L s

para la pendiente

de la verdadera recta de

Este intervalo est centrado en la estimacin puntual del parmetro y la cantidad que se
extiende a cada lado de la estimacin depende del nivel de confianza deseado y de la cantidad
de variabilidad del estimador.

SL

b to

t o t1 - /2 , n2

Ejemplo:
N Anuncios clasificados
N Autos vendidos

:
:

74
139

45
110

50
95

38
78

29
60

17
54

Hallar un intervalo de confianza del 95% para el coeficiente de regresin


Solucin:

to t1 - /2 , n2 t0.975 , 4 2.776

1.5768 2.776

10.27
253 2
12575
6

0.92 2.23

Con una confianza del 95% se espera que el coeficiente de regresin est variando entre
0.92 y 2.23.
ANLISIS DE VARIANZA (ANOVA) DE REGRESIN
El anlisis de varianza consiste en descomponer la variabilidad de la variable predictando o
respuesta en variabilidad explicada por el modelo ms variabilidad no explicada o residual,
esto permitir contrastar si el modelo es significativo o no.
El ANOVA trata de responder a la siguiente pregunta: es mejor usar X para predecir la
variabilidad de Y, o por el contrario se puede conseguir la misma explicacin de Y sin tener
en cuenta los valores de X, simplemente usando el valor ms representativo de Y, esto es, su
media? Si sucediera esto ltimo, la recta del modelo tendra pendiente cero, por lo que las
hiptesis a verificar son:
H0 : 0

H1 : 0

Si se acepta
variables.

H0

la variable predictora no influye y no hay relacin lineal entre ambas

Profesora: Gladys Enrquez Mantilla

288

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Con frecuencia el problema de analizar la calidad de la lnea de regresin estimada se maneja


a travs de un enfoque de Anlisis de Varianza, donde la suma de cuadrados total se
particiona en dos componentes:
SCT = SCR + SCE

Donde:
SCR
SCE

:
:

Refleja la cantidad de variacin de los valores de Y explicados por el


lineal.

modelo

Refleja la variacin alrededor de la lnea de regresin. Mide cunta variacin en Y


es dejada sin explicacin por el modelo, es decir cunto no se puede atribuir a
una relacin lineal.

Y X i ei

Modelo de Regresin poblacional Lineal Simple:

a bX
Y

Lnea de Regresin estimada o ajustada:


Procedimiento ANOVA de regresin:
1.

2.

3.

Hiptesis:

H0 : 0

El modelo es Y , es decir la variacin de Y resulta de


fluctuaciones aleatorias que son independientes de los valores
de X. No existe relacin lineal entre las variables.

H1 : 0

El modelo es Y X , es decir la variacin de Y se puede


atribuir a las variaciones de X. El modelo lineal es significativo.

F1 , 1 , n 2

Valor Crtico:

Estadstica de Prueba:

CMR
CME

Tabla de Anlisis de Varianza


Fuente de
Variacin
Regresin

Grados de
Libertad

Suma de
Cuadrados

Cuadrado
Medio

SCR

SCR
CMR
1

SCE
CME
n- 2

Error

n-2

SCE

Total

n-1

SCT

Suma de Cuadrados Total (Variacin Total):

SCT

Profesora: Gladys Enrquez Mantilla

CMR
CME

Y )2
n

289

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Suma de Cuadrados de Regresin (Variacin Explicada):

(
X )2
2
2

SCR b
X

Suma de Cuadrados del Error (Variacin no Explicada):


4.

SCE = SCT - SCR

Decisin:
Si F pertenece a la regin de aceptacin, entonces aceptar H0

5.

Conclusin:

0 la variable predictora X no influye y


Con una confianza del (1-) %, si se acepta
no hay relacin lineal entre ambas variables. En caso contrario, s existe una relacin
lineal entre ambas variables.

Ejemplo:
N Anuncios clasificados
N Autos vendidos

:
:

74
139

45
110

50
95

38
78

29
60

17
54

Se puede afirmar que las variaciones en el nmero de autos vendidos se deben a


fluctuaciones aleatorias que son independientes del nmero de anuncios clasificados?
Solucin:
1.

Hiptesis:

H0 : 0
H1 : 0

2.

Valor Crtico:

F1 , 1, n 2

F0.95 , 1 , 4 7.71
7.71

3.

CMR
F
44.90
CME

Estadstica de Prueba:

Tabla de Anlisis de Varianza


Fuente de
Variacin
Regresin
Error (residual)
Total

SCT

Grados de
Libertad
1
4
5

Suma de
Cuadrados
4740.96
422.37
5163.33

53046

Profesora: Gladys Enrquez Mantilla

Cuadrado
Medio
4740.96
105.59

F
44.90

536 2
5163 .33
6

290

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

SCR b

1.5768 2

253 2
12575
4740 .96
6

SCE SCT SCR 5163 .33 4740 .96 422 .37


4.

Decisin:
F = 44.90 pertenece a la regin de rechazo, entonces rechazamos H0 y aceptamos H1

5.

Conclusin:
Con una confianza del 95% no se puede afirmar que las variaciones en el nmero de
autos vendidos se deben a fluctuaciones aleatorias independientes del nmero de
anuncios clasificados.

Digitar los datos:

Stat Regression Regression

Clic en Options.

Clic en OK y luego en OK.

Profesora: Gladys Enrquez Mantilla

291

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

REGRESIN Y CORRELACIN CUADRTICA SIMPLE


La parbola por lo general se aplica en aquellos casos en que se presenta una parte
ascendente y en seguida una descendente o viceversa.
En la prctica su uso es poco frecuente sin embargo a veces se utiliza para proyecciones de
utilidad, ingresos.
Ecuacin de Regresin Cuadrtica
Su grfico:

a b X c X2
Y

Para hallar los valores de a, b y c se deben resolver las siguientes ecuaciones normales:

an
aX

b X c X2 Y
b X2 c X3 X Y

a X2 b X3 c X 4 X2 Y
Forma matricial

n
a

X
b
c

X2

X X2

X2 X3
X3 X4

XY

X2Y

Coeficiente de correlacin cuadrtico

Y b XY c X2 Y n Y
Y2 n Y2

Error estndar de Estimacin cuadrtico

SC

Y2

Profesora: Gladys Enrquez Mantilla

XY

n 3

X2 Y

292

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Ejemplo:

En la una fbrica se tienen los siguientes datos correspondientes a las horas trabajadas (en
miles) que producen cierto producto (en unidades).
Horas trabajadas
Produccin

: 1
: 25

2
15

4
10

5
10

7
15

a)

Trazar el diagrama de esparcimiento.

b)

Ajustar a los datos un modelo cuadrtico.

8
10

8
20

9
20

10
35

12
45

Al trazar el diagrama de esparcimiento, se observa que el modelo cuadrtico sera un


modelo adecuado.
a b X c X2
Y

205 10 a 66 b 548 c
1560 66 a 548 b 5022 c
14750 548 a 5022 b 48788 c

10
66
548
66 548
5022
548 5022 48788
205
66
548
a 1560
548
5022
14750 5022 48788

10
205
66 1560
548 14750

548
5022
48788

10
66
205
c 66 548 1560
548 5022 14750

1 337 672

40 072 580
29.957
1 337 672

10 578 600
7.908
1 337 672

1 043 220
0.780
1 337 672

29.96 7.91 X 0.78 X2


Y

Profesora: Gladys Enrquez Mantilla

293

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
c)

Hallar el volumen de produccin esperado para 14 mil horas.


Si X = 14:

29.96 7.91 14 0.78 142 72


Y
d)

Calculando el coeficiente de correlacin cuadrtico.

29.957 205 7.908 1560 0.780 14750 10 20.52


5425 10 20.52

r 0.95

e)

Un modelo cuadrtico s es confiable es decir, se pueden realizar pronsticos.

Calculando el coeficiente de determinacin cuadrtico.

r2 0.952 90%
El 90% de las variaciones que se producen en la produccin se pueden atribuir a las
variaciones producidas en el nmero de horas trabajadas, el 10% restante de estas
variaciones son debidas a otros factores o a efectos aleatorios.
f)

Calculando el error de estimacin cuadrtico.

SC

5425 29.95696 205 7.90822 1560 0.77988 14750


7

4.096

En promedio los valores reales se alejan con respecto a la ecuacin de regresin


cuadrtica en aproximadamente 4 unidades.

Digitar los datos:

Stat Regression Fitted Line Plot

Clic en OK

Profesora: Gladys Enrquez Mantilla

294

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Fitted Line Plot

Producc:Y = 29,96 - 7,908 HorasTrabaj:X


+ 0,7799 HorasTrabaj:X**2
50

S
R-Sq
R-Sq(adj)

4,09621
90,4%
87,6%

Producc:Y

40

30

20

10
0

6
8
HorasTrabaj:X

10

12

Modelo Cuadrtico

Error estndar
de estimacin

b)

Coeficiente de
Determinacin

Calcular los valores estimados y errores de estimacin del modelo parablico.


Valores estimados

Profesora: Gladys Enrquez Mantilla

Errores de estimacin

295

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

REGRESIN Y CORRELACIN EXPONENCIAL

Al graficar los valores X e Y se obtiene una curva creciente o decreciente, es decir que la
variable predictora evoluciona en forma aritmtica y la variable predictando evoluciona en
forma geomtrica.
En la prctica son numerosas las variables que presentan un crecimiento geomtrico: la
poblacin, ventas, salarios, ingresos, etc.

Ecuacin de Regresin Exponencial:

a . bX
Y
Para facilitar la determinacin de las ecuaciones normales, la funcin anterior se linealiza
aplicando logaritmos:
Log Y = Log a + X log b
Ecuaciones normales:

log Y n log a
X log Y log a . X

X
log b . X 2

log b .

Coeficiente de Correlacin Exponencial:

X log Y X . log Y
n X2 ( X )2 n ( log y )2 ( log Y )2
n

Ejemplo:
La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de dlares)
en un pas desde 2008 hasta 2012 fue:
Gastos de Publicidad
Demanda de TV
a)

:
:

2
3

4
6

5
12

7
24

12
45

Trazar el diagrama de esparcimiento.

Profesora: Gladys Enrquez Mantilla

296

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
b)

Ajustar a los datos un modelo exponencial:


a . bX
Y
Log Y = Log a + X log b

5.37 5 log a 30 log b


38.96 30 log a 238 log b

log a

log b

5.37
30
38.96 208
290
5
5.37
30 38.96

290

5
30
290
30 238

109 .26
0.38
290

33.7
0.12
290

a 2.38

b 1.31

Por lo tanto el modelo exponencial ser:

2.38 . 1.31X
Y
c)

Calcular el coeficiente de correlacin exponencial:

d)

5 38.96 30 5.37

5 238 30 5 6.64 5.37


2

0.95 Es confiable.

Realizar e interpretar un pronstico:


Si X = 13:

2.38 . 1.3113 79.63 80 unidades


Y
Cuando los gastos de publicidad sean de 1300 dlares, se espera que la demanda de
televisores sea 80 000.

a)

Trazar el diagrama de esparcimiento.


1. Ingresar los datos y escribir en C3:
LogY

2. Graph Plot

Clic en Aceptar.
Profesora: Gladys Enrquez Mantilla

297

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Clic en Aceptar.
Se obtiene el siguiente diagrama de esparcimiento:
Grfica de dispersin de DemandaTV:Y vs. GastosPublic:X
50

DemandaTV:Y

40

30

20

10

0
2

6
8
GastosPublic:X

10

12

b) Hallar la ecuacin de regresin exponencial.


Calc Calculator

Entonces aparecer:

Clic en Aceptar.
Profesora: Gladys Enrquez Mantilla

298

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Stat Regression Regression

Clic en Aceptar.

a = Antilog (0.375) = 2.37


b = Antilog (0.116) = 1.31

2.37 1.31X
Y

Error estndar de
estimacin
c)

Coeficiente de
Determinacin

Calcular los valores estimados y errores de estimacin del modelo exponencial.

Profesora: Gladys Enrquez Mantilla

299

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

REGRESIN Y CORRELACIN MLTIPLE


En la mayor parte de los problemas que se generan en la industria en que se aplica el anlisis
de regresin, se requiere ms de una variable independiente en el modelo de regresin. La
complejidad de la mayora de los mecanismos cientficos es tal que, con objeto de estar en
condiciones de pronosticar una respuesta, se necesita un modelo de regresin mltiple.
Por lo tanto, es razonable pensar que puedan
existir varias variables independientes X i
que contribuyan a explicar la variable
dependiente Y. Es entonces cuando se utiliza
el modelo de regresin lineal mltiple.

Regresin Mltiple
En la regresin mltiple se trata de predecir una sola variable respuesta a partir de dos o ms
variables predictoras. Permite utilizar una mayor informacin disponible para estimar la
variable respuesta, de esta forma se trata de aumentar la precisin del estimado.

Variable
dependiente

f ( X1 , X 2 , .... , X p )

Variables
independientes

Modelo de Regresin Mltiple:


Un modelo de regresin mltiple expresa una relacin lineal entre una variable dependiente
y dos o ms variables independientes ( X1 , X 2 , .... , X p ) .

Y 0 1 X1 2 X 2 .... p X p e i
i mide el cambio esperado en la variable respuesta Y cuando X i aumenta en una unidad y
el resto de las variables predictoras permanecen constantes.

El modelo de regresin lineal simple presenta dos componentes:

Profesora: Gladys Enrquez Mantilla

300

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Ecuacin de Regresin para tres variables:

Los estadsticos a travs de los cuales estimaremos los valores de 0 , 1 y 2 vienen dados
por las expresiones de b 0 , b1 y b 2

Y b0 b1 X1 b2X2

Y
X1 y X 2
b0
b1 y b 2

:
:
:
:

Variable predictando (dependiente o respuesta)


Variables predictoras (independiente).
constante de regresin.
coeficientes de regresin parcial.

La ecuacin de regresin lineal mltiple de


Y sobre
en un sistema
X1 y X 2
tridimensional
de
coordenadas
rectangulares, representa un plano que se
llama plano de regresin y es una
generalizacin de la recta de regresin para
dos variables.
Esta ecuacin de regresin (plano de regresin) puede escribirse como:

Y b 0.12 b 01. 2 X1 b 02.1 X 2


Donde:
Y
b 0. 12
b 01. 2

b 02. 1

Vara parcialmente debido a la variacin unitaria de X 1 y X 2


Es el intercepto del plano de regresin con el eje Y. Mide la variacin

:
:
:

de Y cuando X 1 y X 2 permanecen constantes.


Es la pendiente asociada a X 1 .

Indica el cambio (aumento o disminucin) que sufrir Y parcialmente


por cada variacin unitaria de X 1 cuando X 2 permanece constante.
Es la pendiente asociada a X 2 .
Indica el cambio (aumento o disminucin) que sufrir Y parcialmente
por cada variacin unitaria de X 2 cuando X 1 permanece constante.

El criterio de mnimos cuadrados localizar el plano que minimice la suma de los cuadrados
de los errores de estimacin, obtenindose las ecuaciones normales:

b0 n

b1 X1

b2 X 2

X1
b0 X 2

b1

b 2 X1 X 2

b0

X12

b1 X1 X 2 b 2 X 22

Y
X1 Y
X2 Y

Al resolver simultneamente estas ecuaciones por el mtodo de determinantes, se obtienen


los valores de b 0 , b1 y b 2 .
Forma matricial

b1 n

b 2 X1
b
3 X 2

Profesora: Gladys Enrquez Mantilla

X1
X12
X1 X 2

X 2
X1X 2
X 22

Y
X1 Y
X 2 Y
301

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Supuestos del modelo de regresin lineal mltiple:


Si tenemos dos variables predictoras X 1 y
X 2 el modelo de regresin lineal mltiple
requiere las mismas condiciones que el modelo de regresin lineal simple.
Linealidad
Los datos deben satisfacer una relacin lineal. Los puntos se ajustan a un plano.

Si hay slo dos variables predictoras X 1 y


X 2 entonces los datos deben estar
aproximadamente contenidos en un plano.

Para tres o ms variables predictoras, la ecuacin de regresin es un hiperplano y no podemos


visualizar los datos grficamente.
Homocedasticidad
La varianza debe ser constante:
Var ( e i ) 2

i :1, 2 , .... , n

La nube de puntos tiene el mismo grosor (su


aspecto es de una almohada plana y de
grosor constante).

Homogeneidad
El valor esperado o promedio de lo errores de estimacin e i es cero:

E( ei ) 0 ,

i : 1, 2 , .... , n

Independencia
Los errores o residuos e i son variables aleatorias independientes. Es decir, una observacin
no debe dar informacin sobre las dems.
Normalidad
Los errores e i tienen distribucin normal: e i ~ N ( 0 , 2 ) .
Coeficientes de Correlacin Simple
Slo comparan dos variables, sin tener en cuenta la tercera. Miden la proporcin de la
varianza de Y explicada por X 1 y X 2 exclusivamente.

r01
r02
r12

: Correlacin simple entre Y y X 1


: Correlacin simple entre Y y X 2
: Correlacin simple entre X 1 y

Profesora: Gladys Enrquez Mantilla

X2

302

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
Coeficiente de Determinacin Mltiple:

R 20. 12

Es una medida que representa la proporcin de la variacin total de Y que est explicada por
el plano de regresin es decir por la influencia conjunta de X 1 , X 2 y por el azar. Mide la
tasa porcentual de los cambios de Y que pueden ser explicados por X 1 y
X2
simultneamente.
0 R 20. 12 1
Cuanto ms se acerca a 1, tanto menor es la dispersin de los puntos alrededor del plano de
regresin y tanto mejor es el ajuste.

R 20 . 12

b0

b1 X1 Y b 2 X 2 Y n Y

Y2

nY

Interpretacin de R 20. 12 :
Si

X 1 : Gastos de publicidad

X 2 : Precio

R 20. 12 0.95

: Ventas

El 95% de las variaciones en las ventas han sido explicadas por las variaciones en los gastos
de publicidad y en el precio, quedando un 5% de la variacin de las ventas que slo puede ser
explicado por factores que no han sido tomados en consideracin en nuestro anlisis o por
aleatoriedad inherente.
Correlacin Mltiple
La correlacin mltiple indica qu tanto de la variacin total de la variable respuesta o
predictando puede explicarse por todas las variables predictoras actuando conjuntamente.
Coeficiente de Correlacin Mltiple:

R 0 . 12

Expresa el grado de relacin existente entre tres a ms variables. Si todos los valores de las
variables, varan en forma proporcional ya sea directa o inversamente, es decir satisfacen
exactamente una ecuacin, se dice que las variables estn correlacionadas perfectamente o
que existe una relacin perfecta entre ellas.

1 R 0 . 12 1
Error estndar de estimacin mltiple
La estimacin se hace ms precisa conforme el grado de dispersin alrededor del plano de
regresin se hace ms pequeo.

SM

( Yi

)2
Y
i

n p 1

Y : Valores observados en la muestra


: Valores estimados a partir a partir de la ecuacin de regresin
Y
n : Nmero de datos
p : Nmero de variables independientes

Profesora: Gladys Enrquez Mantilla

303

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Error estndar de estimacin para dos variables predictoras:

S Y , X1 , X2

b0 Y b1 X1 Y b2 X 2 Y
n3

CORRELACIN PARCIAL
Es la correlacin entre dos variables cualquiera cuando los efectos de las otras variables se
han controlado.
Coeficiente de Correlacin Parcial
Mide la correlacin entre la variable predictando y una variable predictora determinada,
cuando todas las dems variables predictoras permanecen constantes, es decir cuando se
elimina el efecto de las variables restantes.
Las correlaciones parciales son importantes para decidir si incluir o no ms variables
predictoras.
Coeficiente de Correlacin Parcial para tres variables

Y f ( X2 , X3 )
Frmula de primer orden parcial:

rij

rij rik r jk
2
(1 rik
) (1 r 2
jk )

Indica la correlacin entre las variables i y j

Ejemplo:

r12 . 3

r12 r13 r23


2
2
(1 r13
) (1 r23
)

Correlacin parcial entre

Y y

X 2 cuando X3 se

Y y

X3 cuando X 2 se

mantiene constante.

r13 . 2

r13 r12 r32


2
2
(1 r12
) (1 r32
)

Correlacin parcial entre


mantiene constante.

r23 . 1

r23 r21 r31


2
2
(1 r21
) (1 r31
)

Correlacin parcial entre

X2

X3 cuando Y se

mantiene constante.

Profesora: Gladys Enrquez Mantilla

304

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Coeficiente de Correlacin Parcial para cuatro variables

Y f ( X2 , X3 , X 4 )
Frmula de segundo orden parcial:

ri j . l rik . l r jk . l

ri j . k l

2
2
(1 rik
. l ) (1 r jk . l )

Puede permutarse k por l.

Ejemplo:

r12

34

r13 . 4 r23 . 4

r12 . 4

Correlacin parcial entre Y y X2 cuando X3 y

2
2
(1 r13
. 4 ) (1 r23
. 4)

X4 se mantienen constantes.
Coeficiente de Correlacin Parcial para cinco variables

Y f ( X2 , X3 , X4 , X5 )
Frmula de tercer orden parcial:

rij .

klm

rij .

kl

(1

rim .
2
rim
. kl

kl

) (1

r jm .

kl

r2
jm . kl )

Indica la correlacin entre las variables i y j

Ejemplo:
La siguiente tabla muestra las ventas de un artculo (en cientos), los gastos de publicidad por
radio y los gastos de publicidad en peridicos (en miles de soles).
Gastos de publicidad en
radio (miles de soles)
X1
4
7
9
12
a)

Gastos de publicidad en
peridico (miles de soles)
X2
1
2
5
8

Ventas
(cientos)
Y
7
12
17
20

Hallar la ecuacin del plano de regresin.


Las sumas obtenidas son:

X1 32
X12 290
X1 Y 505

X 2 16
X22 94
X 2 Y 276

Para hallar el plano de regresin:

Profesora: Gladys Enrquez Mantilla

56

Y2 882
X1 X 2 159

b b X b X
Y
0
1 1
2 2

305

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

Debern formarse las ecuaciones normales

4 b 0 32 b1 16 b 2

56

32 b 0 290 b1 159 b 2

505

16 b 0 159 b1 94 b 2

276

Luego, usando el mtodo de Cramer se calcularn:

b 0 , b1 y b 2

4
32 16
32 290 159 236
16 159 94

b0

56 32 16
505 290 159
276 159 94

b1

b2

b)

c)

236
4 56 16
32 505 159
16 276 94
236

4 32
32 290
16 159
236

56
505
276

152
0.644
236

392
1.661
236

4
0.017
236

La ecuacin del plano de regresin es:

0.644 1.661 X 0.017 X


Y
1
2

Interpretar : b 0 , b1 y b 2

b0 0.644 64 unid.

Es el incremento promedio en las ventas cuando los


gastos de publicidad en radio y los gastos de
publicidad en peridico permanecen constantes.

b1 1.661 166 unid.

El promedio de ventas esperadas crece en aprox. 166


unidades cuando los gastos de publicidad en radio
aumentan en S/.1000, mantenindose constante los
gastos de publicidad en peridicos.

b2 0.017 2 unid.

El promedio de ventas esperadas crece en aprox. 2


unidades cuando los gastos de publicidad en peridico
aumentan en S/.1000, mantenindose constante los
gastos de publicidad en radio.

Calcular el coeficiente de correlacin lineal mltiple.

R0 .12
R 0 .12 0.987

0.644 56 1.661 505 0.017 276 4 142


882 4 142
Por lo tanto un modelo lineal s es adecuado.

Profesora: Gladys Enrquez Mantilla

306

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
d)

Calcular el coeficiente de determinacin mltiple.


R 2 0 .12 ( 0.987 )2 0.975 = 97.5%

Alrededor del 98% de la variacin total de las ventas se explica por medio de la
ecuacin de regresin.
e)

Calcular los coeficientes de correlacin lineal:

r01

r02

r12

f)

4 505 56 32
( 4 882 56 2 ) ( 4 290 32 2 )
4 276 56 16
( 4 882 56 2 ) ( 4 94 16 2 )
4 159 32 16
( 4 290 32 2 ) ( 4 94 16 2 )

r12 , r13 , r23

0.9875

0.959

0.9706

Calcular los coeficientes de correlacin parcial:

r01. 2

r12 r13 r23


2
(1 r13

2
(1 r23
)

0.9875 0.959 0.9706


(1 0.959 2 ) (1 0.9706 2 )

0.831

Si los gastos de publicidad en peridicos fueran constantes, existira correlacin


lineal alta entre las ventas y los gastos de publicidad en radio.

r02 .1

r13 r12 r32


2
2
(1 r12
) (1 r32
)

0.959 0.9875 0.9706


(1 0.9875 2 ) (1 0.9706 2 )

0.014

Si los gastos de publicidad en radio fueran constantes, existira correlacin lineal


casi nula entre las ventas y los gastos de publicidad en peridicos.

r12 . 0

r23 r21 r31


2
2
(1 r21
) (1 r31
)

0.9706 0.9875 0.959


(1 0.9875 2 ) (1 0.959 2 )

0.528

Si las ventas fueran constantes, existira correlacin lineal baja entre los gastos de
publicidad en radio y los gastos de publicidad en peridico peridicos.

Profesora: Gladys Enrquez Mantilla

307

UAP

Ing. de Sistemas e Informtica Ing. Industrial

Inferencia Estadstica

1. Digitar los datos:

2. Stat Regression Regression

3. Clic en Ok.

Profesora: Gladys Enrquez Mantilla

308

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica

EJERCICIOS PROPUESTOS
Regresin y Correlacin Lineal, No Lineal y Mltiple

1.-

Como parte de la evaluacin de un sistema de computadora, un gerente de sistemas


quiere predecir el tiempo de respuesta de las terminales de la computadora. El tiempo
de respuesta de una terminal se define como el tiempo (en segundos) que la
computadora tarda en responder a un comando enviado desde una terminal
oprimiendo una de las teclas de funcin de programa de la terminal. Aunque son
muchas las variables que influyen en el tiempo de respuesta de las terminales, el
gerente de sistemas va a modelar dicho tiempo como una funcin del nmero de
usuarios simultneos (es decir, el nmero de usuarios que estn accediendo a la
unidad central de procesamiento en el momento en que se enva el comando). El
gerente ha recabado los datos de muestra que se presentan a continuacin. Encuentre
un modelo lineal adecuado.
N usuarios simultneos
Tiempo de respuesta (seg.)

:
:

1
0.22

2
0.59

3
1.01

4
1.36

5
1.42

Podr el gerente predecir el tiempo el tiempo de respuesta de las terminales de la


computadora usando un modelo lineal?
2.-

Una compaa presenta los siguientes datos con respecto a las ventas de un producto
durante siete aos.
Aos
Ventas
a)
b)
c)
d)
e)
f)

3.-

:
:

2007
36

2008
28

2009
34

2010
52

2011
58

2012
62

2013
67

Ajustar a los datos un modelo parablico.


Se puede afirmar que el modelo hallado ser eficiente para realizar
pronsticos?
Si tuvieras que elegir entre un modelo lineal y uno parablico. Por cul te
decidiras?
Interpretar a , b y c.
Qu porcentaje de los cambios producidos en las ventas, no es explicado por
el modelo parablico?
Estimar las ventas para el ao 2018.

Un nuevo paquete de software de consulta para computadora se dise con el objetivo


de lograr un acceso y un mantenimiento ms eficientes de los conjuntos de datos a
gran escala. La eficiencia se mide en trminos del nmero de operaciones de
entrada/salida (E/S) de disco (llamadas bloques de almacenamiento) necesarias para
acceder al conjunto de datos y darle mantenimiento; cuanto menor sea el nmero de
bloques ledos, con mayor rapidez se efectuar la operacin. A fin de evaluar el
desempeo del nuevo sistema de software, se registr el nmero de operaciones de
E/S de disco necesarias para acceder a un conjunto de datos a gran escala, para cada
uno de una muestra de ocho conjuntos de datos de diversos tamaos (donde el tamao
se mide como el nmero de registros contenidos en el conjunto de datos).
N de Registros
(millares)
N de E/S a disco
(millares)

350

200

450

36

20

45

50
5

400

150

350

300

40

18

38

32

Es confiable un modelo lineal? Si lo es, hallar dicho modelo de regresin.

Profesora: Gladys Enrquez Mantilla

309

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
4.-

Se tiene las siguientes variables:


Y
X1
X2

5.-

a)

si

b)

interpretar:
r02 = 0,96
r12 = 0,97

Y = 0,6 + 1,6X1 + 0,02X2

a)
b)
c)
d)
e)

:
:

28
5

r01.2 = 0,83
r12. 0 = 0,53

b0

b1

b2

R20. 12 = 0,98
R0. 12 = 0,99

32
8

46
4

24
7

28
10

36
4

42
3

37
4

51
3

42
4

Hallar la ecuacin de regresin parablica.


Estimar la edad para una persona que solicita 6 permisos en el mes.
Es un modelo parablico, el ms adecuado? por qu?
Qu porcentaje de los cambios que se producen en la variable predictando se
pueden atribuir a otros factores o al azar?
Si se usa un modelo lineal, se puede afirmar que los cambios de la predictando
se deben a los cambios en la predictora?

Se tienen los siguientes datos correspondientes a las horas de estudio y al nmero de


errores cometidos en un examen de Inferencia Estadstica por un grupo de alumnos
del IV ciclo de Ingeniera de Sistemas de la UAP.
Horas de estudio
N de errores
N de alumnos
a)
b)
c)
d)
e)
f)
g)

7.-

interpretar:

Un fabricante quiere establecer si hay una relacin parablica entre las ausencias al
trabajo. X: nmero de permisos al mes e Y: edad del trabajador. Para ello selecciona
una muestra aleatoria de 10 trabajadores, obteniendo la siguiente informacin:
Y
X

6.-

: rendimiento acadmico.
: horas de estudio.
: inasistencias.

:
:
:

5
7
3

2
14
1

9
6
5

6
7
3

7
5
3

3
8
1

4
10
2

8
4
4

Realiza un anlisis grafico y contesta Qu tipo de relacin existe entre ambas


variables? Por qu?
Podemos afirmar que los pronsticos que realicemos con este modelo estarn
cercanos a la realidad? Por qu?
Podemos afirmar que las variaciones que se producen en la variable
predictando se pueden atribuir a efectos aleatorios? Por qu?
Qu porcentaje de las variaciones en el nmero de errores se deben a los
cambios que se producen en las horas de estudio?
Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto a
la recta de regresin?
1.4738
Cuntos errores espera cometer como mximo, un alumno que dedica 12
horas al estudio?
5.331
Qu se puede decir acerca de la pendiente del modelo de regresin
poblacional? Obtener una conclusin altamente significativa.
-1.32 ; -0.46

Una fraccin importante del esfuerzo que se invierte en la creacin de software


comercial para computadora tiene que ver con la prueba de programas. Se emprendi
un estudio con el fin de evaluar la utilidad potencial de diversas variables relacionadas
con productos y procesos para identificar el software propenso a errores. Se ajust un
modelo de lnea recta, el cual relaciona el nmero de defectos en un mdulo (Y) con el
nmero de operandos (X) nicos en el mdulo, a los datos obtenidos de una muestra
de mdulos de software. El coeficiente de determinacin para este anlisis fue 0,74.
Inferira usted que el modelo de lnea recta es un predictor til del nmero de defectos
en un mdulo? Explique.

Profesora: Gladys Enrquez Mantilla

310

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
8.-

Una compaa recab los datos adjuntos para comparar el precio de venta de casas
nuevas con el tamao de la construccin en cientos de pies cuadrados.
Espacio construido
:
20
22
18
30
23
25
Precio de venta
:
116
118
91
145
105
121
a)
Podemos afirmar que a mayor espacio construido mayor precio de venta?
Justifique su respuesta.
b)
Hallar un intervalo altamente significativo para el coeficiente de regresin.
c)
Si el espacio construido es de 32 cul es el precio de venta mnimo y mximo
que se espera?

9.-

Se tiene la siguiente informacin con respecto a la produccin total (miles de unidades)


y el costo total (miles de dlares) de cierto artculo en una compaa.
Costo total
Produccin
a)
b)
c)
d)

10.-

11.-

30
10

36
20

40
30

48
40

50
50

54
60

66
70

88
80

Ajustar a los datos un modelo exponencial.


Podemos afirmar sin temor a equivocarnos que un modelo exponencial sera
de mayor utilidad que un modelo lineal? Justifique.
Si se tiene una produccin de 53000 unidades, cul ser el costo total
esperado? Use el mejor modelo.
Qu porcentaje de los cambios en Y se pueden atribuir a otras variables o a
efectos aleatorios?

Los siguientes datos son las puntuaciones obtenidas por un grupo de alumnos en dos
tests, que se quieren utilizar como previsores de la calificacin media de los alumnos
en el rea de Lenguaje y las calificaciones medias reales obtenidas por dichos alumnos,
ms tarde, en su curso de lenguaje.
Calificac. : 8,8
5,5
8,7
6,8
6,5
8,7
8,4
9,7
5,8
Test 1
:
8,9
4,9
8,6
6,3
5,0
8,0
8,7
9,4
5,5
Test 2
:
9,2
5,6
9,0
6,7
6,2
8,5
9,0
9,9
6,0
a)

Calcular e interpretar:

b)
c)

0,9862
0,9920
Hallar el plano de regresin.
Se puede afirmar que un modelo de regresin mltiple explica la relacin entre
la variable predictando y las variables predictoras? Por qu?

r12

r13
r23
0,9664

Se tienen las estaturas (pulgadas) de un grupo de padres y sus hijos mayores.


Padres
Hijos

12.-

:
:

:
:

65
68

63
66

64
68

68
69

62
66

a)

Podemos afirmar que existe una relacin inversa entre la estatura de los
padres y sus hijos? Por qu?

b)

Hallar los valores mnimo y mximo para el verdadero cambio de la variable


predictando cuando la variable predictora aumenta una unidad.

Para los siguientes datos correspondientes a las ventas de un producto durante el


periodo 2005-2011:
Aos
Ventas
a)
b)
c)
d)

:
:

2005
545

2006
755

2007
919

2008
1200

2009
1600

2010
2500

2011
4200

Ajustar a los datos una curva exponencial.


Estimar las ventas para los aos 2020 y 2025.
Se puede afirmar que estos pronsticos son cercanos a la realidad? Por qu?
Calcular los errores de estimacin para cada ao.

Profesora: Gladys Enrquez Mantilla

311

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
13.-

Una compaa desea determinar si el nmero de anuncios transmitidos por televisin


estn correlacionados linealmente o no con las ventas de su producto, para lo cual
obtuvo la siguiente informacin de algunas ciudades.
Ciudad
N comerciales TV
Unidades vendidas
a)
b)
c)
d)
e)

14.-

15.-

:
:
:

A
12
7

B
6
5

C
9
10

D
15
14

E
11
12

F
15
9

G
8
6

Podemos afirmar que las variaciones en las unidades vendidas resultan de


fluctuaciones aleatorias que son independientes del nmero de comerciales de
TV.?
Estaras dispuesto a invertir en publicidad? Por qu?
Con una confianza del 99%, realiza un pronstico.
Qu tanto se alejan los valores estimados con respecto a los valores
observados?
Calcular los errores de estimacin.

El departamento de contabilidad de un fbrica de papel desea estimar la cantidad


mensual de gastos generales de la fbrica (gastos indirectos de produccin, en miles
de dlares). En el pasado, la firma ha estimado estos gastos sobre la base del nmero
esperado de horas directas de trabajo. En los ltimos aos, sin embargo, los gastos
estimados se han vuelto un predictor errtico de los gastos reales. Como resultado, la
firma est buscando otro factor con el cual se pueda mejorar la ecuacin de
estimacin. El departamento de contabilidad mantiene un historial del nmero de
horas (en cientos) durante las cuales han estado en produccin las mquinas de la
firma. Se tienen los siguientes datos para los ltimos diez meses.
Y :
X2 :
X3 :

Gastos generales actuales de la fbrica (miles de dlares)


Horas de trabajo directas (en cientos)
Horas de mquina (en cientos).

Y :
X2 :
X3 :

29
45
16

24
42
14

27
44
15

25
45
13

26
43
13

28
46
14

30
44
16

28
45
16

28
44
15

27
43
15

a)

Se puede combinar esta informacin con los datos de horas de trabajo directas
y obtener una ecuacin de estimacin ms precisa para los gastos generales de
la fbrica?

b)

Si quisieras hallar un modelo lineal, cul variable descartaras? Por qu?

c)

Se podra afirmar que los cambios que se producen en la variable predictando


se pueden atribuir a los cambios de la mejor variable predictora?

d)

En cunto se alejan los puntos del dispersigrama con respecto a la recta de


regresin?

e)

Al hallar un modelo lineal, se puede decir que la relacin es directa? Por qu?

Se tienen los siguientes datos:


Temperatura (C)
N de helados vendidos
a)
b)
c)
d)
e)
f)

:
:

10
5

15
12

20
24

25
38

30
70

34
130

Trazar el diagrama de esparcimiento.


Hallar el modelo ms adecuado.
Cuntos refrescos se esperara vender si la temperatura fuera 27C?
Es confiable este modelo? Por qu?
Calcular e interpretar el coeficiente de determinacin.
Hallar los valores mximo y mnimo de la verdadera pendiente:

Profesora: Gladys Enrquez Mantilla

312

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
16.-

Se desea hacer un estudio para examinar el papel que juega la televisin en la vida de
un grupo preseleccionado de personas de edades superiores a los 65 aos. El propsito
de dicho estudio es proporcionar informacin que permita hacer una programacin
adecuada a las necesidades de este grupo. Una muestra aleatoria de siete personas de
edades superiores a los 65 aos fue seleccionada y a cada persona le fue solicitada la
siguiente informacin:
N de horas TV
Edad
Escolaridad (aos)
a)
b)

d)
e)
f)

a)
b)
c)

0,9
69
10

1,6
81
12

2,8
71
12

3,0
75
6

3,3
79
6

:
:

20
18,3

30
18,8

40
19,1

50
19,3

60
19,5

70
19,7

80
19,8

Qu porcentaje de las variaciones en el consumo se pueden atribuir a otros


factores o a efectos aleatorios?
Con una confianza del 99%, se puede afirmar que un modelo lineal explica la
relacin existente entre velocidad y consumo?
Con una confianza del 90%, cul sera el mximo valor esperado para el
coeficiente de regresin poblacional?

Los siguientes datos indican las ventas mensuales (en miles de soles) y los aos de
experiencia en ventas de diez vendedores de una fbrica.
A.E.
Ventas
a)
b)
c)

19.-

0,8
65
10

Las pruebas acerca del consumo de combustible de un vehculo que viaja a diferentes
velocidades produjeron los siguientes resultados:
Velocidad
Consumo

18.-

0,5
73
14

Hallar la ecuacin del plano de regresin.


Cul de las dos variables predictoras, explican mejor la variabilidad de la
variable predictando?
Sera confiable un modelo lineal usando nicamente la mejor variable
predictora? Si es as encuentre dicho modelo.
Usando un modelo lineal, realizar un pronstico con un nivel del 1%.
Qu tanto se alejan los valores observados con respecto a los valores
estimados?
Se puede afirmar que a medida que aumenta la variable predictora, se espera
que la variable predictando tambin crezca. Por qu?

c)

17.-

:
:
:

:
:

4
5

5
6

2
4

5
5

6
7

7
10

1
3

8
11

3
4

7
9

Hallar un modelo de regresin cuadrtico.


Podemos afirmar que una curva parablica expresa adecuadamente la
relacin entre las variables consideradas? Por qu?
Cunto se ganar en confiabilidad si se elige el mejor modelo entre un
cuadrtico y un lineal?

Los siguientes datos corresponden a las horas de estudio para una prueba y al nmero
de respuestas correctas obtenidas en dicha prueba por 17 alumnos.
Horas de estudio
Respuestas correctas
N de alumnos
a)
b)
c)
d)
e)

:
:
:

1
2
1

5
11
3

6
20
4

2
10
3

7
14
4

3
12
2

Si un modelo lineal es confiable, hallar un pronstico altamente significativo e


interpretarlo.
Qu tipo de relacin existe entre las variables involucradas? Por qu?
Hallar los valores estimados.
Calcular los errores de estimacin.
Cul ser el valor mximo esperado para el verdadero coeficiente de regresin?

Profesora: Gladys Enrquez Mantilla

313

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
20.-

El gerente de personal de una empresa considera que puede haber una relacin entre
el ausentismo (das) , Salario (en miles de soles) y la edad (aos). Selecciona una
muestra aleatoria de 8 empleados, con los resultados siguientes:
Das ausente
Edad
Salario
a)
b)
c)
d)
e)
f)
g)

21.-

6
61
16,4

10
37
14,3

18
23
8,0

9
46
14,7

7
58
14,0

14
29
11,2

11
36
15,3

Una compaa asigna diferentes precios a un equipo de sonido particular en ocho


regiones diferentes del pas. Los siguientes datos muestran el nmero de unidades
vendidas y los precios correspondientes (en miles de soles).

a)
b)
c)

:
:

5
15

8
7

10
3

13
6

16
14

22
36

28
62

Se puede afirmar que el modelo parablico es el mejor ajuste?


Hallar el modelo de regresin parablico.
Se puede afirmar que hay una buena asociacin parablica entre las
variables?

Se realiz un estudio para determinar los efectos de no dormir en la capacidad de las


personas para resolver problemas sencillos. Un grupo de personas particip en el
estudio que consisti en dar a cada persona, despus de un periodo especfico sin
dormir, un conjunto de problemas sencillos de sumar y se registr el nmero de
errores. Se obtuvieron los siguientes resultados:
N de errores
N horas sin dormir
N de personas
a)
b)
c)
d)
e)

23.-

15
27
8,5

Encontrar los coeficientes de regresin mltiple.


Interprete el significado de las pendientes.
Predecir el nmero de das de ausencia de un empleado de 40 aos de edad
que gana S/ 13 000 al ao.
Sera adecuado un modelo lineal, usando la mejor variable predictora?
Hallar dicho modelo lineal, si fuera confiable.
Usando dicho modelo, realizar una estimacin intervlica.
Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto al
plano de regresin?

Ventas
Precio

22.-

:
:
:

:
:
:

9
8
3

6
12
2

8
16
3

14
20
4

16
24
5

Se puede afirmar que existe una relacin directa entre nmero de errores y
nmero de horas sin dormir? Por qu?
Los pronsticos que se realicen con un modelo lineal, sern acertados?
Al nivel del 1%, Qu podemos afirmar acerca del verdadero coeficiente de
regresin?
Influye la cantidad de horas sin dormir en el nmero de errores cometidos?
Si duerme todas sus horas, cuntos errores se espera que cometa?

Los siguientes datos corresponden al grado de ansiedad de un grupo de alumnos


elegidos aleatoriamente en cierta universidad y sus calificaciones.
Ansiedad
Calificacin
a)
b)
c)
d)

:
:

8
7

10
10

12
8

16
9

14
6

18
5

22
5

23
6

19
8

26
7

Se puede afirmar que a mayor nivel de ansiedad, calificaciones ms bajas y a


la recproca?
Qu calificacin cabe esperar partiendo de una ansiedad de 20 puntos? Usar
un nivel del 1%.
Al nivel del 10, qu podemos afirmar acerca del verdadero coeficiente de
regresin?
Calcular los valores estimados con el modelo lineal.

Profesora: Gladys Enrquez Mantilla

314

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
24.-

A continuacin se presentan los datos obtenidos en un estudio realizado por una


cadena de supermercados para determinar la eficiencia de varios soportes
publicitarios sobre ventas. Los datos fueron obtenidos de las ventas semanales (en
miles de soles), de los gastos publicitarios en revistas, en televisin, en radio y en
boletines volantes distribuidos en casas.
Ventas
Revista
TV
Radio
Volante
a)
b)
c)
d)
e)
f)

25.-

:
:
:
:
:

365
61
36
13
32

441
56
14
8
41

807
62
28
6
34

450
41
31
3
33

828
69
21
0
32

314
73
36
5
7

472
88
38
6
8

Sobre cul soporte publicitario se debera invertir? Por qu?


Hallar el modelo de regresin que permita estimar las ventas, teniendo en cuenta
los dos soportes publicitarios ms eficientes.
Calcular los residuos del plano de regresin.
Hallar la ecuacin de un modelo lineal usando la mejor predictora.
Al nivel del 10%, las ventas dependen de la publicidad en la mejor predictora?
Qu porcentaje de las variaciones en las ventas se pueden atribuir a otros
factores o al azar?

Se tienen los datos correspondientes a las calificaciones en una prueba de inteligencia,


el nmero de clases perdidas y las calificaciones en el curso de Inferencia Estadstica
de un grupo de alumnos del IV ciclo de Ingeniera de sistemas de la universidad Alas
Peruanas.
Prueba de Inteligencia
Calific. Estadstica
Clases perdidas
a)
b)
c)
d)
e)

26.-

649
48
40
7
36

:
:
:

50
7
6

54
12
7

62
13
5

70
17
2

75
18
1

80
19
3

90
20
2

Estimar la calificacin de estadstica de un estudiante que ha perdido 4 clases y


tiene una puntuacin de 60 en la prueba de inteligencia.
Encuentre un modelo lineal usando la mejor variable predictora.
Se puede afirmar que los cambios de la variable predictando se pueden atribuir
a los cambios de la variable predictora? Por qu?
Realizar un pronstico al nivel del 5% e interpretarlo.
Qu tan lejos se encuentra el dispersigrama con respecto a la recta de
regresin?

Se intenta estudiar la relacin existente entre el nmero de aos de afiliacin a un


partido poltico, la motivacin por pertenecer a ese partido y el nivel de satisfaccin
con dicho partido. Para ello se parte de los datos de ocho individuos tomados al azar.
Satisfaccin
:
Aos de afiliacin :
Fuerza motivacin :
a)
b)
c)
d)
e)
f)
g)
h)

6
8
4

7
7
5

4
10
3

9
3
7

10
6
8

9
13
8

9
4
9

5
12
2

Calcular e interpretar:
r12
r13
r23
-0,256
0,8735
-0,2753
encontrar la ecuacin del plano de regresin de Y sobre X2 y X3
Estimar la satisfaccin de una persona que lleva 9 aos afiliada a su partido
poltico y tiene una motivacin de 7.
Si tuvieras que descartar una de las variables predictoras, cul sera?
Hallar un modelo lineal usando la mejor predictora.
Qu porcentaje de los cambio que se producen en Y, se pueden atribuir a
otros factores o al azar?
Al nivel del 1%, se puede concluir que los cambios que se producen en la
variable respuesta se deben a efectos aleatorios?
Calcular los valores estimados con el plano de regresin.

Profesora: Gladys Enrquez Mantilla

315

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
27.-

La empresa "Autos S.A.", fabricante de automviles, vende stos por medio de


distribuidores repartidos en todo el pas. El gerente de dicha compaa, ha logrado
desde el ao 1995 un crecimiento de las ventas de 28%. Muy orgulloso de este
resultado, lo atribuye sobre todo a la experiencia de sus vendedores. El ha recolectado
los siguientes datos mensuales de ventas en unidades y del nmero de vendedores:
Ventas (unidades)
N de vendedores
a)

35
12

33
9

44
16

28
10

20
6

Se tienen los siguientes datos que corresponden al espritu de iniciativa personal en


las situaciones de solucin de problemas. Se tom una muestra aleatoria de
ingenieros de sistemas.
Iniciativa Personal
:
Madurez Emocional
:
Seguridad en s mismo:
a)
b)
c)
d)
e)
f)
g)

29.-

25
7

El gerente concluye que el 95% de la variacin de las ventas son explicadas por
la variacin del nmero de vendedores, razn por la cual propone al Director,
contratar ms vendedores. Es vlida la conclusin del gerente? Explique por
qu.
Se afirma que por cada vendedor que se contrate, el nmero de unidades
vendidas se incrementar. Es correcta la afirmacin?

b)

28.-

:
:

9
10
8

11
10
12

10
18
15

14
15
17

18
20
23

16
16
21

19
22
26

24
20
35

Si tuviera que hallar un modelo slo con una variable predictora, a cul
elegiras? Por qu?
Hallar un modelo lineal adecuado usando la mejor variable predictora.
Se puede afirmar que tanto la variable predictando como la variable
predictora, varan en el mismo sentido? Explica.
Podemos afirmar que la variacin de Y se puede atribuir a la variacin de X,
o se debe a fluctuaciones aleatorias?
Podemos afirmar que a mayor seguridad en s mismo, se espera una mayor
iniciativa personal? Por qu?
Un investigador sostiene que utilizando la misma variable predictora de b), un
modelo exponencial permitira realizar pronsticos ms confiables, ests de
acuerdo? Explica.
Qu puntaje se esperara en Iniciativa Personal para un ingeniero que tiene
30 en seguridad en s mismo y 19 en Madurez Emocional?

Las calificaciones de un grupo de estudiantes en su reporte de medio ao y los


exmenes finales fueron las siguientes:
Medio Ao
Final
a)
b)
c)
d)
e)
f)
g)
h)
i)

:
:

77
82

50
66

71
78

72
34

81
47

94
85

96
99

Se puede concluir que existe una relacin directa entre las calificaciones de
medio ao y final de ao? Por qu?
Sern acertados los pronsticos que se realicen usando un modelo lineal?
Encuentre un modelo lineal.
Interpretar a y b.
Realizar un pronstico al nivel del 99%.
Cul ser el valor mximo esperado para el verdadero cambio de la variable
respuesta cada vez que la variable predictora se incrementa en un punto?
Las calificaciones de final de ao, se ven explicadas por las notas de medio ao?
Calcular los residuos del modelo lineal.
En cunto se aleja el diagrama de esparcimiento con respecto a la recta de
regresin?

Profesora: Gladys Enrquez Mantilla

316

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
30.-

En una investigacin sobre la relacin que existe entre el nmero de veces que se
repite una tarea y los errores que se cometen se ha constatado la relacin curvilnea
existente entre ambas variables.
Veces repite
N errores
a)
b)
c)
d)

31.-

6
26

8
18

11
10

13
8

16
6

17
4

18
2

Hallar la ecuacin de regresin exponencial de la variable Y sobre X.


Calcular e interpretar el coeficiente de correlacin.
Realizar un pronstico puntual.
Un modelo exponencial, genera pronsticos ms confiables? Por qu?

La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de


dlares) en un pas, desde 2007 hasta 2013 fue:
Demanda
Publicidad
a)
b)

32.-

:
:

:
:

50
1,1

60
2,0

68
3,0

88
3,8

125
5,0

135
5,5

184
6,5

Si tuvieras que elegir entre un modelo lineal y un modelo exponencial, cul


crees que sera de mayor utilidad? Por qu?
Hallar dicho modelo.

Una firma cree que sus ingresos anuales dependen de sus gastos por investigacin.
Se tiene la informacin de los ltimos seis aos (en miles de dlares).
Ingreso Anual
Gastos en Investigacin

:
:

31
5

40
11

30
4

34
5

25
3

20
2

a) Qu tipo de relacin existe entre el ingreso anual y los gastos en investigacin?


b) Qu tan lejos se encuentran los valores estimados con respecto a los valores
reales?
c) Influyen los gastos en investigacin en los ingresos anuales de la firma?
33.-

Los siguientes datos corresponden a los CI verbal y no verbal as como las


calificaciones en Ingls, de un grupo de estudiantes del IV ciclo de ingeniera de
sistemas.
Calificacin
CI Verbal
CI No Verbal
a)
b)
c)
d)
e)

34.-

:
:
:

70
110
120

60
90
92

80
100
104

95
140
135

90
120
118

Cul de las dos predictoras permiten realizar mejores pronsticos?


Hallar la ecuacin del plano de regresin.
Interpretar la constante y los coeficientes de regresin.
Influye la mejor predictora en la variable predictando?
Qu porcentaje de los cambios en la variable respuesta es explicado por la
segunda predictora?

El departamento de ventas de una compaa desea hallar un modelo exponencial que


le permita estimar la demanda (en miles de dlares) de refrigeradoras para los
prximos aos, tomando en cuenta los datos histricos decrecientes desde el ao 2007
hasta 2013.
Demanda
Aos
a)
b)
c)
d)
e)

:
:

550
2007

400
2008

250
2009

200
2010

100
2011

70
2012

90
2013

Hallar un modelo exponencial que se ajuste a los datos.


Podemos confiar en el modelo encontrado para realizar pronsticos?
Cul ser la demanda esperada para los aos: 2018, 2020 y 2022?
Calcular los valores estimados con el modelo exponencial.
Hallar los residuos del modelo exponencial.

Profesora: Gladys Enrquez Mantilla

317

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
35.-

Un psiclogo experimental afirma que en un experimento controlado, cuanta ms edad


tenga un nio tanto menor ser su nmero de respuestas irrelevantes. Los siguientes
datos fueron recopilados para comprobar su aseveracin.
Edad
N Rptas.Irrelev.
a)
b)
c)
d)
e)
f)
g)

36.-

5
9

6
7

6
12

7
8

9
6

9
9

10
7

12
5

Para los siguientes datos:


N turistas
13
17
38
42
40
34
30

a)

Ajustar a los datos un modelo de


Regresin parablica.

b)

Calcular el coeficiente de correlacin.

c)

Estimar cuntos turistas se espera recibir


para el mes de diciembre.

Una compaa desea encontrar un modelo que explique la relacin existente entre la
produccin (miles de unidades por ao) y el costo marginal de produccin (dlares por
unidad).
Produccin
Costo Marg.
a)
b)
c)
d)

38.-

4
13

Parece vlida la afirmacin del psiclogo?


Hallar la ecuacin de un modelo lineal, slo si es confiable.
Influye la variable predictora sobre la variable predictando?
Hallar los lmites esperados para el verdadero cambio que se produce en la
variable predictando cuando la predictora se incrementa en una unidad.
Realiza e interpreta un pronstico altamente confiable.
Calcular los errores de estimacin.
Si tuvieras que decidir entre un modelo lineal y un exponencial, cul elegiras
y por qu?

Meses
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
37.-

: 2
: 12

:
:

5
20

7
60

9
60

9
100

11
120

12
120

12
180

14
240

16
280

El asesor estadstico de la compaa asegura que el modelo que mejor describe


la relacin entre estas dos variables es un modelo exponencial, ests de acuerdo
con l? Por qu?
Hallar la ecuacin del modelo ms adecuado.
Realiza un pronstico puntual.
Si el modelo lineal es el mejor, realiza e interpreta un pronstico en forma de
intervalo.

Se tienen los datos correspondientes a las edades (aos), los ingresos (dlares) y el
nmero de aos desde que salieron de la universidad de un grupo ingenieros de
sistemas que trabajan para la misma institucin.
Edad
N de aos
Ingresos
a)
b)
c)
d)
e)
f)
g)

:
:
:

57
13
512

60
19
650

45
14
550

42
16
500

36
12
540

45
16
680

62
25
680

36
10
456

52
18
590

Hallar un modelo lineal usando la mejor variable predictora.


Interpretar a y b.
Qu tipo de relacin existe entre ambas variables? Por qu?
Hallar el plano de regresin de Y sobre X2 y X3
Interpretar b1 , b2. , b3
Qu tanto se alejan los puntos del dispersigrama con respecto al plano de
regresin?
Calcular los errores de estimacin del plano de regresin.

Profesora: Gladys Enrquez Mantilla

318

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
39.-

Los siguientes datos son los ingresos por ventas mensuales, en centenas de $ que
obtuvo una compaa.
Mes
:
Ingresos :
a)

2
43

f)
g)
h)

4
85

5
118

6
164

7
228

8
316

9
444

10
611

Un fabricante de juguetes que vende su produccin en ms de cien distritos de ventas,


el ao pasado introdujo un nuevo juguete de bajo precio y desea estimar las ventas de
este nuevo juguete en el prximo ao en trminos de gastos de publicidad.
Ventas (miles)
Gastos de Publicidad.($)
a)
b)
c)

41.-

3
61

Podemos afirmar que un modelo exponencial es el ms adecuado en este caso?


por qu?
Encuentre la ecuacin del modelo ms adecuado.
Realice un pronstico puntual e interprete.
Calcular los valores estimados y los errores de estimacin.
Usando un modelo lineal, qu tan lejos estn los puntos del diagrama de
dispersin con respecto al modelo hallado?
Influye linealmente la variable predictora sobre la variable predictando.
Qu porcentaje de los cambios de Y no son explicados por un modelo lineal?
Hallar el valor mnimo esperado para el coeficiente de regresin.

b)
c)
d)
e)

40.-

1
31

:
:

120
50

180
60

135
65

147
72

185
84

Encontrar dicho modelo de regresin lineal.


Interpretar el coeficiente de regresin.
Al nivel del 2%, Qu se puede afirmar acerca del verdadero coeficiente de
regresin?

El director ejecutivo de una asociacin de ejecutivos nacionales de ventas sabe la


relacin que existe entre los resultados de un vendedor en las pruebas de aptitud, el
nmero de aos de experiencia en este campo y las ventas anuales de la persona. La
informacin siguiente fue recogida para seis vendedores escogidos al azar.
Y

: Ventas anuales ( $ 10 000)

Y :
X2 :
X3 :

36
84
7

28
74
5

39
89
8

30
78
7

X2 : Resultado de aptitud
X3 : Aos de experiencia.
45
22
92
70
10
3

Si un vendedor obtuvo 83 en la prueba de aptitud y tiene 7 aos de experiencia,


cules sern las ventas que podrn esperarse de esta persona?
42.-

Una compaa distribuye un test de aptitud entre todos sus nuevos representantes de
ventas. La direccin tiene inters en conocer la capacidad del test para predecir el
eventual xito de estos representantes. Los datos adjuntos recogen el valor (en miles
de soles) de las ventas semanales medias y las puntuaciones obtenidas en el test de
aptitud para una muestra aleatoria de ocho representantes.
Ventas semanales
Puntuacin Test
a)
b)
c)
d)
e)

:
:

10
55

12
60

28
85

24
75

18
80

16
85

15
65

12
60

Interpretar la pendiente estimada de la recta de regresin.


Se puede afirmar que un modelo lineal es un buen ajuste? Por qu?
Podemos afirmar que a mayor puntuacin obtenida en el test, se espera que
sus ventas semanales sean mayores? Por qu?
Qu porcentaje de los cambios en las ventas se pueden atribuir a otros
factores diferentes de la puntuacin en el test?
Si un representante obtuvo 70 puntos en el test, cul ser su venta semanal
esperada?

Profesora: Gladys Enrquez Mantilla

319

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
43.-

Una muestra muestra aleatoria de cinco familias da la siguiente informacin en


relacin al ingreso familiar anual y los gastos anuales en bienes durables
(refrigeradoras, lavadoras, televisores, etc.)
Ingreso Anual (miles de soles)
Gastos (cientos de soles)

:
:

5
7

8
14

7
8

10
15

15
20

Se puede atribuir la variacin en los gastos anuales a las variaciones en el ingreso


anual?
44.-

Una firma de renta de automviles recab los datos adjuntos sobre los costos de
mantenimiento (en dlares) y las millas recorridas (en miles) para siete de sus
automviles.
Automvil
Millas recorridas
Costo Mantenimiento

:
:
:

A
55
299

B
27
160

C
36
215

D
42
255

E
65
350

F
48
275

G
29
207

Se pueden realizar pronsticos confiables usando un modelo lineal?


45.-

Un estadstico de una fbrica de automviles quiere desarrollar un modelo estadstico


para predecir el tiempo de entrega (el nmero de das entre la fecha del pedido y la
fecha de entrega del automvil) de automviles nuevos ordenados con mucho equipo
opcional y la distancia de traslado (en cientos de millas). El estadstico selecciona una
muestra aleatoria de 7 automviles con los resultados siguientes:
Opciones ordenadas :
Distanc. Traslado
:
Tiempo de entrega
:

46.-

3
7.5
25

4
13.3
32

4
4.7
26

7
14.6
38

7
8.4
34

8
12.6
41

9
6.2
39

13.6 2.34 X 2 0.621 X 3


Y

a)

Hallar el plano de regresin.

b)

Cmo es la correlacin entre la variable predictando y la mejor predictora para


valores constantes de la otra predictora? Por qu?
0.988

c)

Usando un modelo lineal con la mejor predictora y con un margen de error del
1%, qu valor se espera obtener en la variable respuesta partiendo de un valor
de 15 en la variable predictora?
34.84 ; 77.30

d)

Se puede afirmar que los cambios que se producen en la variable respuesta


se deben a los cambios de la variable predictora?
S
26.52

Una tienda especialista en trajes para personas de negocios con xito intenta
determinar las variables que pueden explicar el nivel de compras de sus clientes. Se
recogieron datos de las compras por cada visita en dlares, los ingresos de los clientes
en miles y los aos de permanencia del cliente en su empleo. Se pensaba que la ltima
variable mide hasta dnde ha subido el cliente en la escala de puestos de la empresa
y, por tanto, refleja su necesidad de vestir con elegancia.
Compras
:
Ingresos
:
Aos Perm. :

630
107
12

550
95
12

320
54
6

820
141
16

450
76
10

755
130
15

750
127
14

330
55
9

950
174
22

655
110
13

Despus de recoger los datos, el director de la tienda se confiesa nulo en estadstica y


no tiene ni idea de qu hacer con ellos, puede ayudarle?
a)
b)
c)

Hallar la ecuacin del plano de regresin.


Si el director tiene la oportunidad de servir a un cliente con un ao ms de
experiencia o a uno con 1000 ms de ingreso, a quin debe atender?
Permiten los datos determinar qu variable es la ms importante para explicar
las compras? Por qu?

Profesora: Gladys Enrquez Mantilla

320

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
47.-

Se desea analizar el nmero de errores cometidos por una persona en relacin con las
horas que lleva desarrollando un trabajo.
Errores cometidos
Horas trabajadas

:
:

10
1

10
2

8
3

6
4

5
5

3
6

4
7

2
8

5
9

8
10

9
11

10
12

Podemos afirmar que el nmero de errores por hora disminuir si la persona se vuelve
ms eficiente en la tarea, pero despus aumentara debido a otros factores como por
ejemplo la fatiga y el aburrimiento?
48.-

Los siguientes datos corresponden a las calificaciones y las puntuaciones en ansiedad


obtenidas por un grupo de estudiantes:
Ansiedad :
Calificac. :
a)
b)
c)
d)
e)
f)
g)

49.-

8
12

10
10

16
9

14
8

18
7

22
5

23
6

19
8

26
5

28
3

27
4

Sera apropiado utilizar un modelo lineal para realizar pronsticos?


Qu porcentaje de la variable predictando explica el modelo de regresin?
Calcular el error estndar de estimacin.
Con un margen de error del 5%, qu calificacin cabe esperar partiendo de
una ansiedad de 20 puntos?
4.868 , 8.394
Hallar un intervalo de confianza del 95% para la cantidad por la cual un
estudiante de la poblacin de la que se efectu el muestreo puede esperar
cambiar su calificacin aumentando un punto en su ansiedad.
Con una confianza del 90%, se puede afirmar que los cambios que se
producen en la variable predictando se pueden atribuir a los cambios de la
variable predictora?
Se puede afirmar que existe una buena asociacin lineal entre X e Y?

Durante los ltimos cuatro aos, los gastos en publicidad y las ventas de una empresa
(en millones de pesetas) han sido:
Ventas
Gastos
a)
b)
c)
d)
e)
f)

50.-

12
9

:
:

100
1.0

126
1.3

180
1.7

210
2.0

Ser un modelo lineal un buen ajuste? Por qu?


Si en el quinto ao la empresa ha previsto tener un gasto de 2,17 millones de
pesetas, y suponiendo que las condiciones de mercado no se alteran, qu
ventas obtendr dicha empresa?
Con qu fiabilidad debe esperarse el resultado anterior?
Qu porcentaje de las variaciones en las ventas no se debe a los gastos en
publicidad?
Se podra afirmar que los cambios que se producen en las ventas no se deben
a efectos aleatorios?
Entre qu valores se espera que est variando el coeficiente de regresin?

Se sospecha que la tasa de fallos de cierto componente electrnico est relacionada


con la temperatura. Se obtiene la siguiente muestra de la variable bidimensional:
(Temperatura grados Fahrenheit , Fallos en una hora x 106) = (X , Y)
55;1.90
a)
b)
c)
d)
e)

65;1.93

75;1.97

85;2.00

95;2.01

105;2.01

Trazar la nube de puntos de la muestra.


Hallar la recta de regresin de la tasa de fallos sobre la temperatura.
Calcular e interpretar el coeficiente de correlacin lineal de Pearson.
Qu nmero de fallos puedes predecir que se producirn en hora a 70
Fahrenheit?
Qu tan alejados estn los puntos del diagrama de esparcimiento con respecto
al modelo lineal de regresin?

Profesora: Gladys Enrquez Mantilla

321

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
51.-

Estamos interesados en investigar cmo vara el peso (libras) con la altura (pulgadas)
y edad (aos) en los nios con una cierta deficiencia nutricional. Para tal efecto se
obtiene una muestra aleatoria de nios, obtenindose los siguientes resultados:
Peso
Altura
Edad
a)
b)
c)
d)
e)

52.-

64
57
8

71
59
10

53
49
6

67
62
11

55
51
8

58
50
7

77
55
10

57
48
9

56
42
10

51
42
6

76
61
12

68
57
9

Podemos afirmar que ambas variables son buenas predictoras? Por qu?
Hallar un modelo lineal o mltiple que permita realizar pronsticos que estn
muy cercanos a la realidad.
Qu tanto de los cambios de la variable predictando se ven explicados por el
modelo de regresin hallado?
En qu medida se alejan los valores observados con respecto al modelo de
regresin?
Realizar e interpretar un pronstico.

Una empresa que fabrica circuitos electrnicos aplica un riguroso control de calidad.
La produccin se lanza por lote de 100 circuitos y luego se prueba cada circuito. Los
circuitos defectuosos (por lote) son inmediatamente reparados por el servicio de
reparacin. Para poder planear adecuadamente la rotacin del personal obrero en el
servicio de reparacin, es importante poder predecir el tiempo (en minutos) requerido
en este servicio despus de la produccin de un lote. La empresa dispone de los datos
siguientes:
N defectuosos
Tiempo reparac.

1
23

2
29

3
49

4
64

4
74

5
87

6
96

6
97

7
109

8
119

a) Sera apropiado utilizar un modelo lineal para realizar pronsticos? Por qu?
b) Qu porcentaje de la variable predictando es explicado por un modelo de regresin
lineal?
c) Calcular e interpretar el error estndar de estimacin.
5.12
d) Con un margen de error del 5%, qu tiempo se utilizar en la reparacin cuando
se tienen 10 artculos defectuosos?
143.94 ; 164
e) Hallar un intervalo de confianza del 95% para la verdadera variacin que se
produce en el tiempo de reparacin por cada artculo defectuoso que se incremente.
12.90 ; 16.46
f) Con una confianza del 90%, se puede afirmar que los cambios que se producen
en la variable predictando se pueden atribuir a los cambios de la variable
predictora? Por qu?
53.-

Una empresa de desarrollo de software establece relacionar sus ventas en funcin del
nmero de pedidos de los tipos de software que desarrolla (Sistemas Educativos y
Automatizaciones Empresariales), para atender 10 proyectos en el presente ao. En la
siguiente tabla se muestra las ventas (en miles de soles), el nmero de pedidos de
sistemas, el nmero de pedidos de Aplicaciones Educativas y el nmero de pedidos de
Automatizaciones empresariales.
Ventas
N Pedid. Sistemas
N pedid. Aplic.Educat.
N pedid. Automat.Empres.
a)
b)
c)
d)

:
:
:
:

440
50
105
75

455
40
140
68

470
35
110
70

510
45
130
64

506
51
125
67

480
55
115
72

460
53
100
70

500
48
103
73

490
38
118
69

Hallar la ecuacin del plano de regresin. Interpretar: b1 , b 2 y b 3


Qu tanto explica el plano de regresin hallado la relacin entre las variables
involucradas?
Realizar e interpretar un pronstico.
Hallar un modelo lineal usando la mejor predictora.

Profesora: Gladys Enrquez Mantilla

322

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
54.-

En una empresa de servicio de Internet busca relacionar las ganancias que obtiene
cada computadora con el nmero de usuarios que ingresan a dicha cabina
diariamente. En la tabla representa las ganancias S/. y el nmero de usuarios.
Ganancia
N de usuarios
a)
b)

55.-

:
:

100
116

102
105

102
99

111
106

97
100

104
109

102
98

96
108

Una empresa informtica tiene un registro de productos de software al cual se les


midi el nmero de errores encontrados (en cientos de mdulos) y el nmero de lneas
de cdigo que posee (miles de lneas). Los datos se encuentran resumidos en la tabla
siguiente:

a)
b)
c)
d)
e)
f)

:
:
:

10
1
10

15
1
7

15
2
6

20
2
5

20
3
4

25
3
3

25
4
1

35
4
1

35
5
2

Si se usa un modelo lineal, seran acertados los pronsticos? Por qu?


Hallar el modelo lineal. Interpretar a y b.
En promedio, qu tanto se alejan los valores verdaderos con respecto a los
valores estimados?
Se puede afirmar que las variaciones en el nmero de errores encontrados son
independientes del nmero de lneas de cdigo?
Si el producto tiene 37000 lneas de cdigo, cuntos errores se espera
encontrar? Usar un nivel del 10%.
Entre qu valores se espera que est variando el verdadero coeficiente de
regresin?

Los datos de la tabla adjunta muestran el tiempo en horas de impresin de trabajos


que se han impreso en una impresora lser de marca HP. Se est interesado en
estudiar la relacin existente entre la variable de inters tiempo de impresin de un
trabajo y la variable explicativa nmero de pginas del trabajo. Hacer el estudio en
base a los datos obtenidos en el muestreo y que son los siguientes:
Tiempo
N Pgs.
a)
b)
c)
d)
e)
f)

57.-

99
110

Hallar un modelo que le permita realizar buenos pronsticos.


Con una confianza del 99%, realizar e interpretar un pronstico.

N lneas de cdigo
N errores encontrados
N de productos

56.-

98
96

:
:

1
0.60

2
0.9

3
1.40

4
1.80

5
2.50

6
3.2

7
3.4

8
4.5

Hallar la recta de regresin considerando el tiempo como variable predictora.


Hallar una recta usando el nmero de pginas como variable explicativa.
Realizar una estimacin altamente confiable del nmero de pginas que se
imprimiran en 12 horas.
Al nivel del 1%, estimar el tiempo de impresin mximo si el nmero de pginas
es 850.
Qu se puede afirmar acerca del verdadero coeficiente de regresin?
Se puede afirmar que las variaciones en el tiempo de impresin son
independientes del nmero de pginas?

Se est estudiando la relacin entre el nmero de aos que una persona est afiliada
al sindicato y el nivel de satisfaccin con la actuacin de dicho sindicato. Para ello se
toma aleatoriamente a un grupo de personas adscritas a sindicatos, obtenindose:
Aos
Satisfaccin
a)
b)
c)

:
:

8
7

7
5

10
8

3
5

6
9

13
9

4
3

Calcular el coeficiente de correlacin lineal. Comentar el resultado obtenido.


Predecir el ndice de satisfaccin de una persona que lleva 11 aos
perteneciendo al sindicato.
Conociendo que el ndice de satisfaccin es de 6 predecir los aos que lleva en
el sindicato.

Profesora: Gladys Enrquez Mantilla

323

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
58.-

Supongamos que el Gerente de Ventas no est satisfecho con el modelo lineal con una
variable, y decide incorporar las calificaciones obtenidas en la fase 1 del programa
inicial de entrenamiento. Igualmente, decide incorporar ms datos correspondientes a
otros vendedores. De forma tal que nuestros datos son:
vendedor
1
2
3
4
5
6
7
8
9
10
11
12

Puntuacin de
la prueba
4
7
3
6
10
9
2
5
9
2
1
3

Calificacin de
desempeo
2
5
1
4
6
5
10
5
4
6
1
1

Hallar el plano de regresin e interpretar b1 , b2 , b3


Qu tan lejos estn los puntos del dispersigrama con respecto al plano de
regresin?
Si usamos la mejor variable predictora, sera til un modelo lineal? Por qu?
Hallar el modelo lineal e interpretar a y b.
Se puede afirmar que los cambios que se producen en la variable predictando
se deben a fluctuaciones aleatorias que son independientes de los cambios de
la mejor variable predictora?
Qu podemos afirmar acerca del verdadero cambio que se produce en la
variable predictando cada vez que la variable predictora se incrementa en un
punto?

a)
b)
c)
d)
e)
f)

59.-

Ventas semanales
(en miles de soles)
5
12
4
8
11
4
30
14
6
14
4
5

Un socilogo asignado a una institucin correccional estuvo interesado en estudiar la


relacin entre inteligencia y delincuencia. Un ndice de delincuencia (variando de 0 a
50) fue formulado para medir la gravedad y frecuencia de crmenes cometidos,
mientras la inteligencia fue medida por IQ. La tabla muestra el ndice de delincuencia
(ID) y el IQ para una muestra aleatoria de convictos menores.
ID
IQ

a)
b)
c)
d)
e)
f)
g)
h)

:
:

26.2
110

33.0
89

28.5
102

35.5
85

38
73

30
90

25.25
98

20.3
110

31.9
98

21.1
122

22.7
119

22.1
120

Un modelo lineal, permitir realizar pronsticos cercanos a la realidad? Por


qu?
Si el modelo lineal es confiable, hallar dicho modelo.
Se puede afirmar que mientras ms inteligente es el sujeto, se espera un
mayor ndice de delincuencia? Por qu?
Qu tanto de los cambios en la variable predictando se pueden atribuir a los
cambios en la variable predictora?
Influye el IQ en el ndice de delincuencia?
Con una confianza del 90%, cunto se espera que sea como mximo el
verdadero coeficiente de regresin?
Realizar un pronstico altamente confiable.
Calcular e interpretar la covarianza.

Profesora: Gladys Enrquez Mantilla

324

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
60.-

El ingreso anual disponible y los gastos de consumo de 9 familias, seleccionadas


aleatoriamente, en una zona de cierta ciudad han sido en miles de dlares los
siguientes:
Gasto
Ingreso

:
:

7
8

12
15

18
20

30
35

20
28

24
25

8
8

11
13

8
7

Haciendo uso de esta informacin, responder a las siguientes preguntas:


a) Ajuste por mnimos cuadrados una recta en la que el consumo sea funcin de los
ingresos.
b) Comente el significado del coeficiente de la recta ajustada.
c) Proporcione una medida de la bondad del ajuste.
d) Se puede concluir que los cambios de la variable predictando se deben a efectos
aleatorios?
e) Hallar el alejamiento de los puntos del diagrama de dispersin con respecto al
modelo hallado.
f) Calcular los errores de estimacin.
61.-

Un gerente de recursos humanos desea determinar el salario que debe pagar a cierta
categora de obreros. Para determinar dicho salario se realiza un estudio en el que
intervienen las variables Salario Mensual ($), Nivel de Produccin Anual en la Empresa
(en miles de dlares) y Nivel de Especializacin media del trabajador (de 0 a 10). El
gerente obtiene los siguientes resultados:
Salario ($)
Produccin
Especializacin
a)
b)
c)
d)
e)
f)
g)

62.-

:
:
:

123.4
300.5
4.3

135.7
325.9
5.5

115.9
298.6
7.8

100.6
200.9
4.9

98.7
300.4
4.3

150.4
359.8
8.5

124.6
279.6
6.4

110.0
215.6
5.6

Hallar la ecuacin del plano de regresin lineal mnimo cuadrtico que explica
el salario en funcin de la produccin y del nivel de especializacin.
Qu salario se debera pagar si el nivel de produccin fuese de 315 mil dlares
y el nivel medio de especializacin de 6.6?
Calcular los valores estimados usando el plano de regresin.
Hallar los residuos.
Hallar la ecuacin de la recta de regresin usando la mejor predictora.
Explica la mejor predictora a la variable predictando?
Qu tanto se alejan los puntos del dispersigrama con respecto a la recta de
regresin?

Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que
permita predecir las ventas (en miles de euros) en funcin de los gastos en publicidad
infantil en televisin (en miles de euros), el tiempo diario de aparicin en televisin (en
minutos) y los gastos en publicidad en los peridicos (en miles de euros). Se realiza un
estudio en el que se renen los datos mensuales correspondientes a los ltimos 20
meses. Estos datos aparecen en la siguiente tabla:
Ventas
Public. TV
Tiempo TV
Public.Per.
a)
b)
c)
d)
e)
f)

:
:
:
:

10
1.0
50
0.4

12
1.2
57
0.4

13
1.3
56
0.5

12
1.4
55
0.5

14
1.5
60
0.4

16
1.7
65
0.4

12
1.8
69
0.6

14
1.3
67
0.5

11
1.4
68
1.1

10
0.9
67
0.3

19
0.8
97
0.5

8
0.9
66
0.6

Hallar el plano de regresin usando las dos mejores predictoras.


Hallar los valores estimados.
Calcular los errores de estimacin.
Hallar la ecuacin de un modelo lineal e interpretar la constante y el coeficiente
de regresin.
Al nivel del 10%, qu podemos afirmar acerca del verdadero coeficiente de
regresin?
Realizar un pronstico al nivel del 98%.

Profesora: Gladys Enrquez Mantilla

325

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
63.-

Veintitrs estudiantes de pedagoga tomaron parte en un programa de evaluacin


diseado para medir la eficacia de los profesores y determinar qu factores son
importantes. Participaron 11 instructoras. La medicin de la respuesta fue una
evaluacin cuantitativa del maestro colaborador. Las variables regresoras fueron las
calificaciones de cuatro pruebas estandarizadas entregadas a cada instructor. Los
datos son los siguientes.
Eficacia
410
569
425
344
324
505
235
501
400
584
434
a)
b)
c)
d)
e)

64.-

P2
125
131
141
122
141
152
141
132
157
166
141

P3
59
31
80
75
49
49
60
41
50
32
54

P4
55
63
45
46
41
43
41
64
42
57
58

Hallar el modelo de regresin usando las dos mejores predictoras.


El plano de regresin hallado, permitir realizar pronsticos confiables? Por
qu?
Utilizando la mejor predictora, hallar la ecuacin de regresin.
Se puede afirmar que los cambios que se producen en la variable predictando
se pueden atribuir a los cambios de la mejor predictora?
Qu tanto se alejan los puntos del diagrama de dispersin con respecto a la
recta de regresin?

En base a una muestra de doce datos se quiere ajustar un modelo de regresin de la


variable respuesta, precio en euros por el que se adquiri una impresora lser,
respecto a las variables regresoras: nmero de pginas por minuto que es capaz de
imprimir y aos de antigedad de la impresora. Los datos del estudio son los
siguientes:
Precio
N pgs.
Antig.
a)
b)
c)

65.-

P1
69
57
77
81
0
53
77
76
65
97
76

:
:
:

466
6
6

418
6
4

434
6
2

487
6
0

516
8
6

462
8
4

475
8
2

501
8
0

594
12
6

553
12
4

551
12
2

589
12
0

Hallar el modelo de regresin.


Qu tanto de los cambios de Y pueden ser explicados por el modelo de
regresin hallado?
Realiza e interpreta un pronstico.

En base a una muestra de datos se quiere ajustar un modelo de regresin de la variable


Rendimiento de un sistema informtico, respecto a las variables regresoras: nmero
de buffers y nmero de procesadores. Los datos del estudio son los siguientes:
Buffers
Proces.
Rend.
a)
b)
c)
d)

:
:
:

5
8
9

10
8
20

15
8
30

20
8
39

25
12
50

5
12
10

10
12
19

15
12
30

20
20
40

25
20
50

5
20
11

10
25
21

15
25
31

20
25
42

25
25
51

Hallar la ecuacin de regresin usando ambas predictoras.


Hallar un modelo lineal usando la mejor predictora.
Influye la mejor predictora en la variable predictando?
Al nivel del 10%, cunto se espera que sea como mximo el rendimiento si la
variable predictora asume el valor 15?

Profesora: Gladys Enrquez Mantilla

326

Ing. de Sistemas e Informtica Ing. Industrial

UAP
Inferencia Estadstica
66.-

En una clase de estudiantes se realiza un estudio para determinar la relacin existente


entre la variable Nota obtenida por el estudiante en la asignatura de Estadstica y
las variables: Nota esperada por el estudiante, Horas semanales de estudio
dedicadas a la asignatura y Nota media del estudiante en las dems asignaturas.
Para ello se tienen en cuenta los siguientes datos:
Estadstica
Nota esperada
Horas estudio
Nota media
a)

12
14
10
14

h)
i)

9
11
8
11

14
13
12
13

12
14
13
14

11
9
7
12

17
18
15
16

14
15
14
15

18
16
20
16

16
14
15
14

10
11
10
12

8
10
8
11

Un programa informtico realiza un clculo con un nmero. Se desea estudiar la


relacin entre el tiempo de ejecucin y la regresora nmero de dgitos del nmero. Para
ello se ha recogido una muestra de observaciones:
Tiempo de ejecucin
N de dgitos del nmero
a)
b)
c)
d)
e)
f)

68.-

15
17
14
14

Cul de las variables predictoras explica mejor la nota obtenida por el


estudiante en la asignatura de Estadstica? Por qu?
Realizar e interpretar un pronstico usando las dos mejores predictoras.
Interpretar la constante y los coeficientes del plano de regresin.
Al nivel del 1%, realiza un pronstico usando la mejor predictora.
Influye la mejor predictora en la nota obtenida en estadstica?
Qu tipo de relacin existe entre la variable predictando y la mejor predictora?
Qu porcentaje de los cambios en la variable respuesta es explicado por el
modelo de regresin lineal.
Calcular los valores estimados con el plano de regresin.
Hallar los residuos de la recta de regresin.

b)
c)
d)
e)
f)
g)

67.-

:
:
:
:

:
:

1
1

1
2

2
4

2
5

3
8

3
9

4
14

4
16

5
20

5
25

Ajustar un modelo de segundo grado a partir de la muestra dada.


Calcular la prediccin del tiempo de ejecucin para un nmero de 6 dgitos.
Sern acertados los pronsticos que se realicen con el modelo cuadrtico?
Hallar los valores estimados.
Calcular los residuos.
Entre un modelo lineal y uno cuadrtico, cul permitira realizar mejores
pronsticos? Por qu?

Se mide en una muestra aleatoria de estudiantes universitarios el tiempo semanal


(horas) que pasan frente al televisor y los puntos obtenidos en una prueba de
competencia lectora con escala de 0 a 20 puntos (0=mnima competencia y 20=mxima
competencia). El propsito del estudio es determinar la posible asociacin entre las
variables.
Tiempo TV (hrs.)
Competencia lectora (ptos.)
a)
b)
c)
d)
e)
f)

:
:

9
15

16
11

20
8

7
18

10
14

25
7

5
12

18
10

Sera adecuado utilizar un modelo lineal para realizar pronsticos? Por


qu?
Interpretar a y b en el modelo lineal.
Qu se puede afirmar acerca del verdadero coeficiente de regresin?
Podemos afirmar que los cambios producidos en la variable respuesta los
podemos atribuir a las variaciones de la variable predictora?
Calcular e interpretar el error estndar de estimacin.
Obtener una conclusin altamente significativa acerca del verdadero
cambio que se produce en la variable predictando cuando la variable
predictora se incrementa en una unidad.

Profesora: Gladys Enrquez Mantilla

327