Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Coeficient e lineal
Donde 2 Coeficient e cuadrático
3 Coeficient e cúbico
Cabe destacar que lo que se busca y se prefiere en forma general es un polinomio de un
orden relativamente bajo; se deberá evitar el empleo de potencias muy grandes de la
variable de predicción.
Muchas veces un modelo completo de segundo orden que contiene términos lineales,
cuadráticos y de interacción, proporciona una aproximación funcional excelente.
Y 0 1 X 2 X 2
Solución
El diagrama de dispersión revela una curvatura, lo cual indica que debe intentarse el
ajuste con un modelo cuadrático, cuya ecuación de regresión muestral es:
Y = a n + b1 X + b2 X 2
XY = a X + b1 X2 + b2 X3
X2Y = a X2 + b1 X3 + b2 X4
Diagrama de dispersión
350
300
Demanada (unidades)
250
200
150
100
10 12 14 16 18
Precio (dólares)
Y = 497 - 24,4 X
Por lo pronto estamos aceptando que el modelo es lineal, con un R 2 = 75.8% Enseguida
trataremos de ver si el modelo cuadrático es el que mejor relaciona a dichas variables.
a Y b1 XY b2 X 2 Y
Y
2
Y 2
n
Análisis de Varianza
Fuente de Variación GL SC CM F P
Regresión 2 78777 39388 58,69 0,000
Error Residual 8 5369 671
Total 10 84146
Análisis de varianza adicional; nos muestra la Suma de Cuadrados explicada por cada
variable que entre en el orden dado:
X 1 63815
X**2 1 14962
300
250
Y
200
150
100
10 12 14 16 18
X
log a
X log Y X X log Y
2
n X X 2 2
n X log Y X log Y
log b
n X 2 X
2
logY 2
n
Solución
X Y Log Y X**2 X*log Y
2 19 1,278754 4 2,557508
4 37 1,568202 16 6,272808
6 72 1,857332 36 11,143992
8 142 2,152288 64 17,218304
10 295 2,469822 100 24,698220
12 584 2,766413 144 33,196956
14 995 2,997823 196 41,969522
56 15,09063 560 137,057310
Diagrama de dispersión
1000
800
Nº de células
600
400
200
0
2 4 6 8 10 12 14
Tiempo (horas)
En donde
La ecuación de regresión es
Log Y = 0,989 + 0,146 X
Análisis de varianza
Fuente GL SC CM F P
Regresión 1 2,3816 2,3816 4936,30 0,000
Error residual 5 0,0024 0,0005
Total 6 2,3840
800
600
400
200
0
2 4 6 8 10 12 14
Tiempo (horas)
Yˆ a e bx Ln Y Ln a b X
En donde Ln Y 34.74748
L n Yˆ 2.27775 0.335771 X
Donde: log a
n log X log X
2 2
b
n log X log Y log X log Y
n log X log X
2 2
log a log Y
logY
b log X log Y
2
2
n
Yˆ 24.619544 X
0.55508
20,0
17,5
Y
15,0
12,5
10,0
1 2 3 4 5 6
X
Nota.- Un modelo puede reportar un coeficiente de determinación más alto que otro
(eso es bueno) mientras que tiene un error estándar de estimación mayor (eso es malo).
La pregunta sería ¿Cuál modelo utilizar?
La respuesta depende, al menos en parte, del propósito para el cual está destinado el
modelo. Si se desea, utilizar el modelo para explicar los valores presentes de Y; y
comprender porqué se comportan como lo hacen, se utiliza el modelo con el coeficiente
de determinación más alto.
Si por otra parte, el propósito del modelo es predecir los valores futuros de Y, se utiliza
el modelo con el error estándar de estimación más bajo. Si se desea predecir, se gozará
de más éxito con el modelo que genera el menor error de predicción.