Está en la página 1de 55

ESTADÍSTICA GENERAL

Semana 10: Diseños Factorial de dos


niveles. Superficies de respuesta
Docente: Dr. Soria Quijaite Juan
Jesús
Web of Science ID: AAP-4832-2020
Scopus Author ID: 57204497093
Investigador RENACYT: P0057631
ORCID: 0000-0002-4415-8622
Estadística General Semana 10
Diseño Factorial de dos niveles: Superficies respuesta
TEMARIO

1. Diseño factorial de dos niveles


2. Análisis de superficies de respuesta
LOGRO DE APRENDIZAJE

Al finalizar la sesión de clase, el


estudiante comprende la importancia
del análisis factorial con dos niveles y
superficies de respuesta con ejemplos
prácticos.
AJUSTE A UNA REGRESIÓN MÚLTIPLE
Regresión Cuadrática
AJUSTE A UNA REGRESIÓN MÚLTIPLE
Ejemplo de Regresión Cuadrática
Determinar el modelo de regresión cuadrática

11 15 ????
11 ??? 185
10a  b(140)  c(2528)  1300

a(140)  b( 2528)  c(51296)  21040
a(2528)  b(51296)  c(1107008 )  408184

 10 140 2528  a   1300 
 140 2528 51296  b    21040 
    
2528 51296 1107008  c  408184
a  60.147708
b    4.970289  P ( x)  a  bx  cx 2
   
 c   0.001061 
P( x)  60.147708  4.970289x  0.001061x 2
P ( x)  a  bx  cx 2

P( x)  60.147708  4.970289x  0.001061x 2

a) Restaurante11 x=15 y=????

x  15  P(15)  60.147708  4.970289(15)  0.001061(15) 2

b) Rest11 X=??? Y=185

185  60.147708  4.970289 x  0.001061x 2


0  124.8523  4.970289x  0.001061x 2

 (4.970289)  (4.970289) 2  4(0.001061)( 124.8523)


x1; 2 
2(0.001061)
P( x)  60.147708  4.970289x  0.001061x 2

La ecuación de regresión es
Ventas(yi) = 60.15 + 4.970 PoblaciónE(xi) + 0.00106 PoblaciónE(xi)^2
R-cuad.
S R-cuad. (ajustado)
14.7840 90.27% 87.49%

Gráfica de línea ajustada Gráfica de probabilidad normal


Ventas(yi) = 60.15 + 4.970 PoblaciónE(xi)
Resumen del modelo
(la respuesta es Ventas(yi))
+ 0.00106 PoblaciónE(xi)^2
99
250 Regresión
IP de 95% 95
S 14.7840 90
200
R-cuad. 90.3%
R-cuad.(ajustado) 87.5% 80
70

Porcentaje
150
Ventas(yi)

60
50
40
100 30
20

10
50
5

0 1
-30 -20 -10 0 10 20 30
0 5 10 15 20 25
Residuo
PoblaciónE(xi)
P ( x)  a  bx  cx 2
Análisis de Varianza
Fuente GL SC MC F P
Regresión 2 14200.0 7100.01 32.48 0.000
Error 7 1530.0 218.57    
Total 9 15730.0      

Análisis de varianza secuencial


Fuente GL SC F P
Lineal 1 14200.0 74.25 0.000
Cuadrático 1 0.0 0.00 0.992
AJUSTE A UNA REGRESIÓN MÚLTIPLE
Regresión Cuadrática: Taller PRÁCTICA CALIFICADA

Ejemplo 2: Hallar el modelo de regresión cuadrática en los datos (TAREA)


AJUSTE A UNA REGRESIÓN MÚLTIPLE
Regresión Cúbica
REGRESIÓN LINEAL MULTIVARIADA
Ejemplo de regresión cúbica
Ejemplo: Hallar el modelo de regresión cúbica en los datos
10a  b(140)  c(2528)  d (51296)  1300
a(140)  b(2528)  c(51296)  d (1107008)  21040


a(2528)  b(51296)  c(1107008)  d (24805760)  408184
a(51296)  b(1107008)  c(24805760)  d (570629888)  8636848

P ( x )  a  bx  cx 2  dx 3
P ( x)  36.9274  13.1711x  0.6999x 2  0.0167 x 3
P ( x)  36.9274  13.1711x  0.6999x 2  0.0167 x 3

a) Restaurante11 x=15 y=????

x  15  P(15)  36.9274  13.1711(15)  0.6999(15) 2  0.0167(15) 3

b) Rest11 X=??? Y=185

185  36.9274  13.1711x  0.6999 x 2  0.0167 x 3


0  148.0726  13.1711x  0.6999 x 2  0.0167 x 3
AJUSTE A UNA REGRESIÓN MÚLTIPLE
Regresión Cúbica: Taller PRÁCTICA CALIFICADA
AJUSTE A UNA REGRESIÓN MÚLTIPLE
Regresión Cúbica: Taller
Ejemplo 2: Hallar el modelo de regresión cúbica en los datos
DISEÑO FACTORIAL A DOS NIVELES: Interacción
Ejemplo
DISEÑO FACTORIAL A DOS NIVELES: Interacción
Ejemplo
DISEÑO FACTORIAL A DOS NIVELES: Interacción
Ejemplo
na0  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y

na0  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y

na0  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y

na0  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y

na0  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y
na  a1  x1  a 2  x 2  a3  x3 a 4  x 4 a5  x5   Y
 0
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
Se debe maximizar el rendimiento
Se ajusto un modelo de grado 2
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
Encontrar las coordenadas de temperatura y concentración
que maximicen el rendimiento.
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
DISEÑO FACTORIAL DE DOS NIVELES
Superficie de respuesta
REGRESIÓN LINEAL MULTIVARIADA
Ecuación general de regresión Múltiple
La forma descriptiva general de una ecuación lineal múltiple se muestra en la
fórmula (1). Se utiliza k para representar el número de variables independientes. Por
lo tanto, k puede ser cualquier número entero positivo.

^
Y  a  b1 X 1  b2 X 2  b3 X 3    bk X k (1)
donde:
a es la intersección, el valor de Y cuando todas las X son cero.
bj es la cantidad en que Y cambia cuando esa Xj particular aumenta una unidad,
cuando los valores de todas las demás variables independientes se mantienen
constantes. El subíndice j es sólo un identificador de cada variable independiente; no
se emplea en los cálculos. En general, el subíndice es un número entero entre 1 y k,
el cual es el número de variables independientes. Sin embargo, el subíndice también
puede ser un identificador breve o abreviado. Por ejemplo, la edad puede servir
como un subíndice.
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
EJEMPLO 2. La Cincinnati Paint Company vende marcas de calidad de pinturas en ferreterías en
Estados Unidos. La compañía mantiene una fuerza laboral numerosa, cuya tarea es atender a
clientes actuales, así como buscar nuevos. El gerente nacional de ventas investiga la relación
entre el número de llamadas de ventas y las millas recorridas por los agentes de ventas. ¿Ganan
más en comisiones por ventas los agentes que recorren más millas y hacen más llamadas de
ventas? Para investigar esto, el vicepresidente de ventas seleccionó una muestra de 25 agentes y
determinó:
 La cantidad ganada en comisiones el mes pasado (Y).
 El número de millas recorridas el mes pasado (X1).
 El número de llamadas de ventas del mes pasado (X2). La información se reporta en la
siguiente tabla:
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple

Formule una ecuación de regresión que incluya un término de interacción. ¿Hay una interacción
significativa entre el número de llamadas de ventas y las millas recorridas?
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
EJEMPLO 3. Un coleccionista de arte estudia la relación entre el precio de venta de una pintura y
dos variables independientes. Las dos variables independientes son el número de postores en la
subasta particular y la antigüedad de la pintura, en años. Una muestra de 25 pinturas reveló la
siguiente información muestral.
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
a) Formule una ecuación de regresión múltiple con el número de variables independientes de
postores y la antigüedad de la pintura para estimar el precio en la subasta de la variable
dependiente. Analice la ecuación. ¿Le sorprende que haya una relación inversa entre el
número de postores en el precio de la pintura?
b) Formule una variable de interacción e inclúyala en la ecuación de regresión. Explique el
significado de la interacción. ¿Es significativa esta variable?
c) Utilice el método por pasos y las variables independientes para el número de postores, la
antigüedad de la pintura y la interacción entre el número de postores y la antigüedad de la
pintura. ¿Qué variables seleccionaría?
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
EJEMPLO 4. Un constructor de bienes raíces desea estudiar la relación entre el tamaño de una
casa que compraría un cliente (en pies cuadrados) y otras variables. Las posibles variables
independientes son el ingreso familiar, el número de miembros en la familia, si hay un adulto
mayor viviendo con la familia (1 para sí, 0 para no) y los años totales de educación adicionales al
bachillerato del esposo y la esposa. La información muestral se reporta en la siguiente tabla.

Formule una ecuación de regresión múltiple apropiada. ¿Qué variables independientes incluiría en la
ecuación de regresión final? Utilice el método por pasos.
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
EJEMPLO 5. Suponga que el gerente de ventas de un distribuidor grande de partes automotrices
desea estimar en el mes de abril las ventas totales anuales de una región. Con base en las ventas
regionales, también se pueden estimar las ventas totales de la compañía. Si, con base en la
experiencia pasada, se determina que los estimados de abril de las ventas anuales tienen una
precisión razonable, en años futuros la predicción de abril serviría para revisar los programas de
producción y mantener el inventario correcto en las tiendas de descuento minoristas. Parece
que varios factores están relacionados con las ventas, como el número de tiendas de descuento
minoristas en la región que venden componentes de la compañía, el número de automóviles en
la región registrados desde el 1 de abril, y el ingreso total personal del primer trimestre del año.
Al final se seleccionaron cinco variables independientes como las más importantes (según el
gerente de ventas). Luego se recopilaron los datos de un año reciente. También se registraron las
ventas totales anuales en ese año por cada región. En la siguiente tabla observe que en la región
1 había 1 739 tiendas de descuento minoristas que vendían los componentes automotrices de la
compañía y 9 270 000 automóviles registrados en la región desde el 1 de abril. Las ventas en ese
año fueron $37 702 000.
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
a) Considere la siguiente matriz de correlación. ¿Qué variable individual tiene la correlación
más fuerte con la variable dependiente? Las correlaciones entre las variables
independientes, tiendas de descuento e ingreso y entre automóviles y tiendas de
descuento, son muy fuertes. ¿Esto puede representar un problema? ¿Cómo se denomina
esta condición?
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
b) En la siguiente tabla se presenta el resultado de la ecuación de regresión de las cinco
variables. ¿Qué porcentaje de la variación se explica mediante la ecuación de regresión?
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
c) Realice una prueba global de hipótesis para determinar si alguno(s) de los
coeficientes de regresión no son cero. Utilice el nivel de significancia 0.05.
d) Realice una prueba de hipótesis en cada una de las variables independientes.
¿Consideraría eliminar “tiendas de descuento” y “supervisores”? Utilice el nivel
de significancia 0.05.
e) Se vuelve a correr la regresión, pero ahora sin “tiendas de descuento” y
“supervisores”, como se muestra a continuación. Calcule el coeficiente de
determinación. ¿Cuánto cambió R^2 a partir del análisis anterior?
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
EJEMPLO 6. Mike Wilde es el
presidente del sindicato de maestros
del Otsego School District. A fin de
prepararse para negociaciones
próximas, le gustaría investigar la
estructura de los salarios de los
maestros en el distrito. Wilde
considera que hay tres factores que
influyen en el salario de un maestro:
sus años de experiencia, la
calificación de su eficiencia como
docente por parte del director y si
cuenta con un posgrado. Una
muestra de 20 maestros generó los
siguientes datos
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
Ejemplo 07: Obtenga la ecuación de regresión multivariada de   a 0  a1u  a 2 v  a 3 z
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple
Ejemplo 08: Obtenga la ecuación de regresión multivariada de   a 0  a1u  a 2 v  a 3 z
REGRESIÓN LINEAL SIMPLE
Regresión Lineal Múltiple Estaturas (en pulgadas) de madres, padres y sus hijas
Ejemplo 09: Estaturas de madres, padres e hijas
La tabla incluye una muestra aleatoria simple de las estaturas
de madres, padres y sus hijas (según datos de la National
Health and Nutrition Examination). Encuentre la ecuación de
regresión múltiple donde la variable de respuesta (y) es la
estatura de una hija y las variables de predicción (x) son las
estaturas de la madre y del padre.

  a 0  a1u  a 2 v
REGRESIÓN LINEAL SIMPLE
Evaluación continua
Predicción del tamaño de la familia a partir de la basura desechada
El conjunto de datos incluye el tamaño de la familia (número de integrantes) y
los pesos individuales de materiales de desecho como metal, papel, plástico,
vidrio, alimentos, basura de jardín, materiales textiles y todo tipo de artículos,
así como el peso total de desechos de 62 hogares. Uno de los objetivos del
estudio era determinar si podrían hacerse conteos de población al medir la
basura desechada. Considere algunas o todas las variables de predicción y
determine la ecuación de regresión múltiple que predice mejor el tamaño de la
familia. ¿La mejor ecuación de regresión múltiple es una buena ecuación para
predecir el tamaño de la familia?
REGRESIÓN LINEAL SIMPLE MULTIVARIADA
Predicción del tamaño de la familia a partir de la basura desechada
REGRESIÓN LINEAL SIMPLE MULTIVARIADA
Predicción del tamaño de la familia a partir de la basura desechada
EJERCICIO INDIVIDUAL

Resolveremos el
siguiente ejercicio
de manera
individual
8 minutos!!

También podría gustarte