Está en la página 1de 22

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE QUIMICA E INGENIERIA QUIMICA


DISEÑO EXPERIMENTAL
TEMA: Regresión y Correlación
EVALUACIÓN N°12

PROFESOR:

Núñez Vega, Oscar Julio

ESTUDIANTES:                                                         CÓDIGO

 Miñope Ramos, Gianpierre 18070028


 Velasquez Valencia, Roger Jack 18070037
 Leon Bravo, Jean Pierre 18070105
 Saavedra Carrasco, Paul Martin 18070132
 Gonzales Catay, Cristhian Ener 18070098

Fecha de realización de la clase: 08/01/21

Fecha límite de entrega de la evaluación: 16/01/21

Lima Perú

2020
ÍNDICE
EJERCICIO 1....................................................................................................................................3
DESARROLLO-Excel....................................................................................................................4
DESARROLLO-ANÁLITICO/SCILAB..............................................................................................7
DESARROLLO-Minitab 17.........................................................................................................11
DESARROLLO-SCILAB (regresión lineal)...................................................................................13
DESARROLLO-Excel (regresión lineal)......................................................................................15
DESARROLLO-Infostat (regresión lineal).................................................................................15
Ejercicio 2.....................................................................................................................................17
DESARROLLO-EXCEL.................................................................................................................17
Ejercicio 3.....................................................................................................................................19
DESARROLLO-EXCEL.................................................................................................................19
Ejercicio 4.....................................................................................................................................21
DESARROLLO-EXCEL.................................................................................................................21
EJERCICIO 1

1. Proyectar la Oferta de cierto producto tomado en cuenta los datos obtenidos en el


estudio de mercado de los cuales calcular e interpretar el coeficiente de correlación
parabólica.

DESARROLLO- Excel
Paso 1  Identificamos la variable dependiente (y) y la variable independiente (x),
de los datos se observa que la oferta va variando en función del tiempo, por lo tanto,
se puede establecer lo siguiente:
Tiempo  Eje x
Oferta  Eje y
Paso 2  Hacemos una gráfica de dispersión en Excel
Abrimos ExcelClic en InsertarDirigimos a sección
graficas Clic en Dispersión
 Se muestra la siguiente ventana y hacemos lo siguiente:
Clic derecho en el cuadro en blanco mostradoSeleccionar Datos

 Se muestra la
siguiente ventana: Clic en AgregarSe muestra la ventana “Modificar
serie”Escribimos el nombre de la serie Tiempo vs Oferta Arrastramos las
celdas de tiempo y oferta en los valores X de la serie y valores Y de la serie
respectivamente  Aceptar

 Se tiene la gráfica de dispersión, el cual aún no se sabe si


es un modelo línea o no lineal, para ello se tiene que linealizar o hacer un ajuste
de modelo no lineal, para obtener el valor de R2 más cercano a 1 (R2> 0,95).

Figura 1. Grafica de dispersión


El valor de R2 o coeficiente de determinación. Este coeficiente nos indica el grado de ajuste
de la recta de regresión a los valores de la muestra, y se define como la proporción de la
varianza explicada por la recta de regresión, es decir:
Varianza explicada por laregresion
R 2=
Varianza total de datos
Este valor R2 está influenciado según la correlación a tomar y variara su ajuste según el
tipo de ecuación que se tome para ajustar dichos puntos al mejor modelo ya sea línea o no
lineal.
 Con Excel, mostraremos la gráfica que mas se ajuste a un R2 optimo (R2> 0,95),
pero según el ejercicio nos dice que usemos la forma “Parabólica”. Para
determinar el grado de esta función parabólica con el mejor R2 se hace una
prueba de ensayo y error en Excel, de la siguiente forma:
Paso 3  Clic en la gráfica de dispersión (Figura 1) Clic en el símbolo “+” En

Línea de tendencia damos clic en el símbolo ▸Clic en Mas opciones.


Se muestra la siguiente ventana. Realizamos los siguientes pasos: Clic
en polinómica  Grado 2 (por defecto)  Clic en Presentar ecuación
en el grafico y Clic en Presentar el valor R cuadrado en el grafico

Se muestra la siguiente ventana, donde se puede ver la ecuación


parabólica y el valor de R2, donde se observa que el valor de R2 esta
alejado de la unidad, pues se tiene lo siguiente el siguiente valor de
R2
:
R2=0,8615
Y la siguiente ecuación parabólica: y=−113,64 x 2+ 13492 x +88167

DESARROLLO-ANÁLITICO/SCILAB
El ejercicio nos pide calcular el coeficiente de correlación, a continuación, lo haremos de
manera analítica:
 Sabemos que la ecuación de la parábola por mínimos cuadrados tiene la siguiente
forma: Y =a+bX +c X 2, sin embargo, para una mayor exactitud se podría usar una
ecuación parabólica de mayor grado, para este caso haremos la demostración
analítica para la ecuación parabólica cuadrática (grado 2).
 Sabemos que las ecuaciones normales para la regresión parabólica tienen la
siguiente forma:

aN + b ∑ X +c ∑ X 2=¿ ∑ Y ¿

a ∑ X+ b ∑ X 2 +c ∑ X 3 =¿ ∑ XY ¿

a ∑ X 2+ b ∑ X 3 +c ∑ X 4 =¿ ∑ X 2 Y ¿
10 10 10
n=10 ∑ X=55 ∑ X 2=385 ∑ Y =1580000
i=1 i=1 i=1

11 11 11 10
2 3
∑ X=55 ∑ X =385 ∑ X =3 025 ∑ X Y =9700000
i=1 i=1 i=1 i=1

10 10 10 10

∑ X 2=385 ∑ X 3 =3025 ∑ X 4 =25333 ∑ X 2 Y =71880000


i=1 i=1 i=1 i=1

Tenemos las siguientes ecuaciones


10 a+55 b+385 c=1580000
55 a+385 b+ 3025 c=9700000
385 a+3025 b+ 25333 c=71880000
Para hallar las constantes a, b y c se puede hacer uso de Scilab con la eliminación de Gauss.
En SciNotes digitamos el
código proporcionado
en clase, lo guardamos y
hacemos correr.
En la consola,
digitamos la
cantidad de ecuaciones n=3 e ingresamos
los valores de los coeficientes fila por fila
en el siguiente orden.

Obtenemos los siguientes valores:


Por lo tanto, la ecuación parabólica de grado 2 tiene la siguiente forma:

y=−133.64 x2 +13492.42 x+ 88166.67


Igual a la del software Excel

Calculo del coeficiente de determinación R2


Determinación la YEstimada reemplazando los valores de X en la ecuación parabólica de grado
2 hallada líneas arriba. Tenemos el siguiente cuadro:

DESARROLLO-Minitab
17
Paso 1Digitamos la Oferta y el Tiempo
en la hoja de trabajo de Minitab 17, como se
muestra en la siguiente imagen
Paso 2: Clic en estadísticas Clic en regresión  Clic en Grafica de línea ajustada

Paso 3: Se
muestra la
siguiente
ventana
Clic en Oferta (Respuesta Y) y clic en Tiempo (Predictor X)  Clic en Cuadrático
 Aceptar
Se observa la gráfica de línea ajustada a una ecuación parabólica de grado 2 con la
siguiente ecuación, Rcuad y R-cuad(ajustado):
Oferta=88167+ 13492 x−133.6 x 2
Rcuad=86.2 %
Rcuad−ajustado=83 %

DESARROLLO-SCILAB (REGRESIÓN LINEAL)


En Scilab se calculó la regresión lineal de la ecuación para comparar el valor de R2 y ver
que tan buen ajuste tiene respecto al polinómico.

En SciNotes digitamos el siguiente código  Lo hacemos correr


En la Consola nos da la siguiente matriz y la grafica de regresión.
Por lo tanto, la ecuación de regresión es la siguiente:
y=90666.667+12242.424 x
DESARROLLO-Excel (regresión lineal)
Se puede corroborar la regresión lineal hecha en Scilab con Excel, nos da la misma ecuación. (Se
sigue el mismo procedimiento que la regresión polinómica, con la diferencia en que se da Clic en
“Lineal”

TIempo vs Oferta
250000

200000 f(x) = 12242.42 x + 90666.67


R² = 0.86
150000
Oferta

100000

50000

0
0 2 4 6 8 10 12
Tiempo

DESARROLLO-Infostat (regresión lineal)


Paso 1: Se digita la tabla, los valores de Tiempo y Oferta Clic en
EstadísticasClic en regresión Lineal
Paso 2: Se muestra la siguiente ventana: Clic en Oferta (Variable dependiente) y
Clic en Tiempo (Variable dependiente)  Aceptar

Paso 3: Se muestra la gráfica de regresión Lineal


INTERPRETACIÓN DEL COEFICIENTE DE CORRELACION
El valor del coeficiente de determinación R2 obtenido  0.86 (regresión parabólica de
segundo orden), muestra un mejor ajuste que la regresión lineal (0.83) debido a que se
ajusta mejor porque tiene más coeficientes, lo cual hace que esta función sea más exacta y
represente de manera más precisa los tratamientos en la gráfica de dispersión. Sin embargo,
este valor de R2 obtenido, así como la recta de regresión polinómica no tienen un buen
ajuste y no se puede predecir de manera satisfactoria la Oferta según el tiempo en que se
quiera predecir, porque en Ingeniería se usa un R2 ≥ 0.95.

//Los ejercicios del 2 al 4 se desarrollará con Excel, sin embargo, se


demostró que se pueden usar diversos software para enfrentar este tipo de
ejercicios.

Ejercicio 2
La demanda de un producto sigue la siguiente ecuación: Q=e(a−b / p) si se tiene
los siguientes datos:

Calcular e interpretar el Coeficiente de Correlación para la función de


producción.
DESARROLLO-EXCEL
Nos damos cuenta de que hay 3 columnas: Año, Oferta y Precio. Sin embargo,
solo se analiza 2 variables porque el Año y el precio guardan analogía,
entonces establecemos las siguientes variables:
Variable dependiente: Precio
Variable independiente: Demanda
La Demanda lo calcularemos de la siguiente forma:
Demanda=Oferta∗Precio

Tenemos el siguiente cuadro a plotear en Excel, además nos damos cuenta de


que el ejercicio nos da el dato de Q=e(a−b / p), por lo tanto, se asume que el
mejor ajuste para este problema es la función de regresión de tipo
exponencial. Asimismo, tendremos la siguiente tabla a plotear.

Ploteamos en Excel con la regresión Exponencial.

Año vs Demanda
90
80 f(x) = 6.96 exp( 0.52 x )
70 R² = 0.97
60
Demanda

50
40
30
20
10
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Año

INTERPRETACION DEL COEFICIENTE DE CORRELACION


El coeficiente de correlación R2 = 0.97 obtenido demuestra que la regresión
exponencial tiene un modelo no lineal con buen ajuste de tipo creciente,
debido a: Si “x” crece, “y” crece. Además, el valor de R2 sobrepasa el valor
mínimo de 0.95 establecido con el nivel de significancia α = 5%. En
conclusión, la ecuación exponencial y=6.9637 e0.5214 x representa de manera
correcta el comportamiento de la Demanda según el Año que se quiera
calcular y es útil para hacer predicciones futuras.

Ejercicio 3

Proyectar la demanda en función del ingreso, teniendo como demanda historia


lo siguiente:

DESARROLLO-EXCEL

En primer lugar, establecemos nuestra variable dependiente (y) y la variable


independiente (x) de la siguiente forma:
variable dependiente (y)  Demanda
variable independiente (x) Ingreso
Debido a que la Demanda que tiene una persona está en función de la cantidad
de Ingresos que esta tenga.
Ploteamos la tabla Ingreso vs Demanda en Excel, sin embargo, tendremos una
interrogante, ya que no sabemos cual es el mejor ajuste para la gráfica de
dispersión, por tanto, analizamos como están distribuidos los puntos para
elegir el mejor ajuste viendo la gráfica.
INTERPRETACION
Según la gráfica de dispersión podemos notar que el mejor ajuste es una
función parabólica porque los tratamientos tienen comportamiento en forma
de parábola, no olvidar que el grado de la función parabólica esta relacionada
con el valor del R2, por lo tanto, un mayor grado de la ecuación significara un
mejor ajuste y en consecuencia un valor de R2 mas cercano a la unidad.
Establecemos la regresión parabólica de segundo orden, porque demuestra un
valor bueno de R2 mayor a 0.95 y se puede establecer que tiene un buen
comportamiento que se puede predecir con esta función porque el R2 obtenido
es 0.985 aproximadamente.

Ingreso vs Demanda
9
8
f(x) = − 0.24 x² + 2.32 x + 2.21
7 R² = 0.99
6
Demanda

5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
Ingreso
Ejercicio 4

Un analista de mercado revela la producción de cierto producto y el costo total


del mismo en la siguiente tabla adjunta, calcular e interpretar el coeficiente de
correlación.

DESARROLLO- EXCEL
Establecemos nuestra variable dependiente (y) y la variable independiente (x)
de la siguiente forma:
variable dependiente (y)  producción
variable independiente (x) costo total
Para establecer la variable dependiente e independiente nos guiamos de la
siguiente gráfica de Economía, de ella se deduce que el Costo está en función
de la producción.
Una vez definido la variable dependiente e independiente hacemos la gráfica
de dispersión en Excel

Producción vs Costo Total


120

100

80
Costo Total

60

40

20

0
0 5 10 15 20 25 30
Producción Produccion vs Costo Total
120

100 f(x) = − 0.03 x² + 3.64 x + 33.46


R² = 0.99
80
Costo Total

60

40
INTERPRETACION
20
Según la gráfica de
0
dispersión podemos notar 0 5 10 15 20 25 30
que el mejor ajuste es una Producción
función lineal, porque los
tratamientos tienen este
comportamiento, sin embargo, si queremos tener un mejor ajuste se puede
establecer una ecuación cuadrática porque tendrá más coeficientes que hará
mas precisa y exacta la regresión y correlación.
De la grafica obtenida en Excel se observa que el valor de R2 es 0.989 y, por
lo tanto, mayor a 0.95 con nivel de significancia para ingeniería (α = 0.05%).
Entonces, se puede establecer que la ecuación y = -0.0268x2 + 3.6387x +
33.458, representa una función que pronostica el comportamiento del Costo
Total según la Producción que se tenga para posteriores análisis de este
problema.

También podría gustarte