Está en la página 1de 28

“UNIVERSIDAD NACIONAL DE TRUJILLO”

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS


ESCUELA PROFESIONAL DE ESTADÍSTICA

PRACTICAS 1 Y 2 – SEMANA 11

ANÁLISIS DE REGRESIÓN II

ALUMNOS

GARCIA ROSAS, Cinthia Verónica

ZAVALA VERA, Alejandro Enrique

ASESORES:

Lic. IPANAQUÉ CENTENO, Enrique

GRUPO: 03

TRUJILLO – PERÚ 2022


INGENIERÍA

TAREA 01 – SEMANA 11
Ejercicio 1:
Explique y ejemplifique a los modelos de regresión intrínsecamente lineales e
intrínsecamente no lineales.

Sol:
REGRESIÓN INTRÍNSECAMENTE LINEALES
Los modelos intrínsecamente lineales son susceptibles de ser linealizados
mediante sencillas transformaciones matemáticas, de tal manera que les
pueden ser aplicados los métodos de estimación e inferencia propios de las
regresiones lineales.
Suponiendo que el modelo intrínsecamente lineal, una vez transformado en
un modelo lineal, cumple las hipótesis clásicas, el método de estimación
adecuado a aplicar es el de mínimos cuadrados ordinarios.
Este procedimiento consiste en minimizar la suma de los cuadrados de los
residuos definidos como la diferencia entre el verdadero valor y la estimación
de la endógena estimada, lo cual resulta en la obtención del estimador de
mínimos cuadrados ordinarios, cuya expresión matricial es la siguiente:

REGRESIÓN INTRÍSECAMENTE NO LINEALES


En los modelos de regresión intrínsecamente no lineales, los valores de los
coeficientes no pueden obtenerse de manera explícita o analítica. Estos
deben calcularse de manera numérica, es decir, mediante procedimientos
iterativos.
Existen varios métodos, o algoritmos, para determinar los valores de los
coeficientes de los modelos no lineales:
1) Búsqueda directa o método de ensayo y error: Se van dando valores a
los coeficientes hasta obtener unos valores que minimicen la suma de
cuadrados del error.
2) Optimización directa: Proceso iterativo semejante al anterior, pero
partiendo de las soluciones no explícitas obtenidas del sistema de
ecuaciones normales en el procedimiento de mínimos cuadrados.
3) Modelos de linealización iterativa: En este método se linealiza la
ecuación no lineal alrededor de algunos valores iniciales de los
coeficientes. Se calcula la ecuación linealizada mediante el

2
INGENIERÍA

procedimiento de mínimos cuadrados y los valores elegidos al


principio se ajustan. Tales valores ajustados se emplean para volver a
linealizar el modelo y de nuevo éstos se calculan mediante mínimos
cuadrados y se ajustan los valores de los coeficientes.
Ejem:
Función de producción CES: en economía, la función de producción de
elasticidad de sustitución constante, constituye un claro ejemplo de modelo
no lineal estricto, es decir, no susceptible de ser linealizado.

Su expresión es la siguiente:

Y = A[δK-β+(1-δ) L-β]-v/β
donde 𝑌 representa la producción, 𝐾 el factor capital, 𝐿 el recurso productivo
trabajo, 𝐴 es el parámetro de eficiencia referente al estado de la tecnología,
𝛿 el denominado parámetro de distribución que indica la participación
relativa de cada factor en la producción, 𝛽 el parámetro de sustitución y 𝑣 el
parámetro relativo a los rendimientos a escala.

Ejercicio 2:
Explique el ejemplo 01 del módulo de aprendizaje. Pág. 3 al 5

Sol:
Ejemplo 01.- Comisiones por consultoría y tamaño de los activos

Relación entre la comisión por consultoría y los activos del fondo.

3
INGENIERÍA

Mediante el programa EViews, se obtuvo los siguientes resultados de la regresión:


Dependent Variable: COMISION
Method: Leas t Squares (Gaus s -Newton / Marquardt s teps )
Date: 11/04/18 Tim e: 11:56
Sam ple: 1 12
Included obs ervations : 12
Convergence achieved after 7 iterations
Coefficient covariance com puted us ing outer product of gradients
COMISION= C(1)*EXP(C(2)*ACTIVOS)

Coefficient Std. Error t-Statis tic Prob.

C(1) 0.508902 0.007459 68.22451 0.0000


C(2) -0.005965 0.000484 -12.31499 0.0000

R-s quared 0.938535 Mean dependent var 0.432317


Adjus ted R-s quared 0.932388 S.D. dependent var 0.050129
S.E. of regres s ion 0.013035 Akaike info criterion -5.691383
Sum s quared res id 0.001699 Schwarz criterion -5.610566
Log likelihood 36.14830 Hannan-Quinn criter. -5.721305
Durbin-Wats on s tat 0.349343

A partir de estos resultados se obtuvo el siguiente modelo:



comisión  0.508902e0.005965Activo
Respecto de las propiedades de los estimadores de MCNL, recuerde que, en el caso
de los modelos de regresión lineales con términos de error distribuidos
normalmente, se puede desarrollar procesos de inferencia exactos (es decir, pruebas
de hipótesis) con las pruebas t, F y ji cuadrada en muestras pequeñas y grandes.
No es el caso con los MRNL, aunque tengan términos de error distribuidos
normalmente. Los estimadores de MCNL no están distribuidos normalmente, no son
insesgados y no tienen varianza mínima en muestras pequeñas o finitas.
Como resultado, no sirve la prueba t (para probar la significancia de un coeficiente
individual) ni la F (para probar la significancia global de la regresión estimada), pues
no puede obtenerse una estimación insesgada de la varianza del error σ2 a partir de
los residuos estimados. Es más, los residuos (la diferencia entre los valores Y reales
y los valores Y estimados obtenidos del MRNL) no necesariamente suman cero.
La suma de SCE y SCR no necesariamente da como resultado la SCT; por tanto,
R2 = SCE/SCT puede no ser un estadístico descriptivo importante para tales modelos.

4
INGENIERÍA

Se calcula la tasa de cambio de Y (= comisión) respecto de X (el tamaño de los


activos). Con las reglas básicas de las derivadas, se puede ver que la tasa de cambio
de Y respecto de X es:

Si X = 20 (millones), la tasa esperada de cambio en las comisiones cobradas se


obtiene de la expresión anterior, la cual resulta casi del –0.0031%.
Por supuesto, esta respuesta cambia en función del valor X con que se calcule. Si se
juzga con la R2 es igual a 0.9385 sugiere que el MRNL elegido se ajusta muy bien a
los datos de la tabla El valor Durbin-Watson estimado (igual a 0.3493) puede sugerir
una autocorrelación o tal vez un error de especificación del modelo. Aunque existen
procedimientos que se encargan de estos problemas, así como de la
heterocedasticidad en MRNL, no se examinarán esos temas.

Ejercicio 3:
Explique el ejemplo 02 del módulo de aprendizaje. Pág. 6.

Sol:
Ejemplo 02.-La tabla que se presenta a continuación tiene datos reales sobre el PIB,
trabajo y capital de México de 1955 a 1974.

Resultados según Eviews:

5
INGENIERÍA

Por tanto, la función de producción Cobb-Douglas estimada es:



 t

PIB  0.529235 Trabajo 0.181060
t Capital 0.882769
t
Interpretada de manera asintótica, la ecuación muestra que en el modelo sólo el
coeficiente del insumo capital es significativo.

Ejercicio 4:
Explique el ejemplo 03 del módulo de aprendizaje. Pág. 7 al 9.

Sol:
Ejemplo 03.-Los datos de la tabla corresponden a la población de Estados Unidos (en
millones de personas) de 1970 a 2007.

6
INGENIERÍA

Se puede medir algunas poblaciones con un modelo logístico del siguiente tipo:

Dónde:
Y = población, en millones
t = tiempo (medido cronológicamente)
β son los parámetros.
Este modelo es no lineal en los parámetros; no existe una manera sencilla de
convertirlo en un modelo lineal en los parámetros. Por tanto, es necesario un
método de estimación no lineal para estimar los parámetros. Observe una
característica interesante de este modelo: a pesar de que sólo tiene dos variables,
población y tiempo, hay tres parámetros desconocidos, lo cual muestra que en un
MRNL puede haber más parámetros que variables. Un intento por ajustar dicha
ecuación a los datos no tuvo éxito, porque todos los coeficientes estimados fueron
estadísticamente insignificantes. Tal vez esto no deba sorprender, pues, si se grafica
la población contra el tiempo, se obtiene la figura.

Esta figura demuestra una relación casi lineal entre las dos variables.
Si se grafica el logaritmo de la población contra el tiempo, se obtiene la siguiente
figura:

7
INGENIERÍA

La pendiente de esta figura (multiplicada por 100) da la tasa de crecimiento de la


población.
Si se efectúa una regresión del logaritmo de la población sobre el tiempo, obtenemos
los siguientes resultados:

Esta tabla muestra que, de 1970 a 2007, la población de Estados Unidos creció con
una tasa aproximada de 1.06 por ciento anual.
El valor R2 de 0.998 revela un ajuste casi perfecto. Este ejemplo pone de manifiesto
un punto importante: a veces, un modelo lineal (en los parámetros) es preferible a
uno no lineal (en los parámetros).

Ejercicio 5:
Analice y explique el contenido del link: 37.-CAPÍTULO IX - ANÁLISIS DE REGRESIÓN
NO LINEAL
Sol:

8
INGENIERÍA

Existen situaciones donde es evidente un modelo lineal en todas las variables


independientes que es inadecuado, ejemplo de ello tenemos es un modelo de
regresión que predice Y, la puntuación de las preferencias en una prueba de sabor
de una bebida de lima, como función lineal de X1 (concentración de lima) y X2
(dulzura) es muy dudosa.
En la regresión múltiple, el efecto de las variables entre sí puede oscurecer la
ausencia de linealidad. Por lo que una estrategia seria ajustar un modelo de primer
orden y después representar gráficamente los residuos de este modelo con cada
variable independiente.
Las interacciones entre las variables son más difíciles de descubrir en los diagramas
de dispersión. Si X1 y X2 interactúan al determinar Y, hay 3 variables involucradas,
desafortunadas los diagramas tridimensionales son más difíciles de trazar e
interpretar.
Para el caso especial en que una de las variables independientes es una variable
cualitativa representada por una o más variables ficticias (dummy), la interacción se
puede descubrir trazando gráficas de los residuos contra otras variables
independientes. Si los diagramas de los residuos por separado son más o menos
paralelos, se deberían considerar la posible presencia de algún tipo de interacción.

En la figura a: es notorio que existe un patrón sistemático entre las dos


variables, la cual sugiere que hay heterocedasticidad en los datos.
En las figuras b a e: muestran patrones definidos.
En la figura c: sugiere una relación lineal.
En la figura d y e: indican una relación cuadrática.
Los modelos de regresión no lineal son muy variados. Algunos modelos se
presentan a continuación:

9
INGENIERÍA

En la columna 1 aparecen el modelo lineal, el semilogaritmo inverso en Y, el modelo


inverso logarítmico en X, doble logarítmico.
En la columna 2 aparecen el modelo cuadrático, el modelo cuadrático inverso
logarítmico en Y, el modelo recíproco, el modelo de parábola logarítmica.
En la columna 3 aparecen los modelos polinomiales.
Entre los modelos intrínsecamente lineales más usuales en la práctica tenemos:
El modelo lineal: Útil en los casos de ajuste no lineal porque sirve como
patrón de comparación.

El modelo recíproco: donde una de la variable va aumentando y la otra va


disminuyendo.

10
INGENIERÍA

El modelo gamma: es muy utilizado en ajustes de curvas de producción


lechera.

El modelo potencial: utilizado en ajuste de precio – demanda

Modelaje, Modelado o Modelización


Es la construcción de un modelo que se sabe a ciencia cierta, la respuesta que
produce.
Modelado Matemático – Estadístico
Es una función que describe un proceso o fenómeno. El tipo o función queda
determinado por:
Gráfico de la función
Algún principio subyacente a los datos
Mejor criterio de ajuste
Buen ajuste
Es el grado de semejanza entre las respuestas reales (Yi) y las obtenidas con el
modelo.

11
INGENIERÍA

Definición de Mejor Modelo


Más fiable
Menor error estándar en los estimadores
Más sencillo
Menos suposiciones para construirlo

Pautas para usar la ecuación de regresión lineal


Si no hay una correlación lineal significativa, no use la ecuación de regresión
para hacer predicciones.
No use la ER para hacer predicciones fuera del rango de valores muestreados.
Una ER basada en datos viejos no necesariamente sigue siendo válida en el
presente.
No haga predicciones acerca de una población distintas de la población de la
cual se extrajo la muestra de datos

Ejercicio 6:
Analizar y explicar: Ver link pág. 89-101

REGRESIÓN NO LINEAL GUILLERMO RIVAS M. ESTADÍSTICO, UNIVERSIDAD


NACIONAL DE COLOMBIA

Sol:
En el presente artículo se pretende dar una visión general de lo que es la regresión
no lineal, para esto, se tratan aspectos tales como: la no linealidad de un modelo, la
forma de saber si un modelo es lineal o no, también se discute la forma de estimar
los parámetros en este tipo de modelos, así como sus propiedades asintóticas y la-
construcción asintótica de intervalos de confianza y pruebas de hipótesis.
MODELOS NO LINEALES
Un modelo se puede definir como una ecuación o conjunto de ecuaciones que
describen el comportamiento de algún sistema. Hay fenómenos observables que no
pueden ser explicados por modelos lineales, por ejemplo, el desarrollo de una teoría
en la química o la física, en tales situaciones un modelo no lineal en los parámetros
se puede ajustar mejor.

Donde Y es el valor medido de una o más respuestas, ε es el error experimental


asociado con esta medida f (Φ, β) es una función que contiene p parámetros Φ1, …,
Φp.
SUPUESTO SOBRE LOS ERRORES

12
INGENIERÍA

Si se supone εu ~ N (0, σ2) para u= 1, …, n; con σ2 desconocida y constante, εu y εs


independientes para u ≠ s; u,s = l , . . . , n una forma de validar estos supuestos es
haciendo un análisis de residuales.
Un modelo lineal se puede escribir de la forma:

Para alguna función gi que depende solo de los valores de () pero no de los valores
de θ (parámetros). Por consecuente los modelos que no tengan esta forma son no
lineales.
La linealidad o no linealidad del modelo se determina por la forma en que entran los
parámetros al modelo por la forma en que entran las variables, por ejemplo, una
ecuación cuadrática.
Una forma sencilla de ver si un modelo es lineal o no, es examinando las derivadas
de f con respecto a cada uno de los parámetros θi.
REGRESIÓN NO LINEAL
Se usa cuando se quieren estimar los parámetros de un modelo no lineal que
relaciona una respuesta Y con algunas variables control predictoras.
Los modelos no lineales se originan cuando un investigador obtiene, por el desarrollo
de una teoría o por otra situación, una relación funcional en la que los parámetros
son no lineales.
ETAPAS BASICAS
1. Con los datos obtenidos de Y y ζu y con la función de respuesta f (θ, ζ),
encontrar estimaciones iniciales para el vector de parámetros, o sea, obtener
θ0.
2. Usando la información de (1), obtener las estimaciones de mínimos
cuadrados para θ y producir un resumen de estadísticas por aproximación
lineal.
3. Mirar si el modelo ajustado es adecuado, si las estimaciones de los
parámetros son significativas examinando los residuales y las estimaciones de
los parámetros como en regresión lineal.
ESTIMACIÓN DE PARAMETROS
La estimación de parámetros en un modelo no lineal como se anotó anteriormente
lleva implícito el uso de métodos numéricos, en esta sección se presentarán dos
algoritmos de estimación, las cuales son:
1. Método de Gauss-Newton: Este método usa los resultados de los mínimos
cuadrados lineales en varias etapas.

13
INGENIERÍA

Al expandir en serie de Taylor la función f (θ, ζ) alrededor del punto θ0 donde


θ0 = (θ10, …, θp0)T y llevando en consideración solo la primera derivada.
2. Método de Marquardt: Este método realiza una interpolación óptima entre
el método de linealización y el método del gradiente, la aproximación está
basada en lá máxima vecindad donde la aproximación de Taylor de primer
orden da una adecuada representación del modelo no lineal. En contraste al
método de linealización, el método del gradiente calcula el vector de
correcciones 6 a partir del vector de estimaciones iniciales en la dirección del
gradiente negativo de S (θ). Así:

El subíndice g, indica que es el vector corrección dado por el método del


gradiente.
ANALISIS CUALITATIVO DEL PROBLEMA
Primero, cualquier método apropiado debe resultar en un vector corrección cuya
dirección esté dentro de 90° del gradiente negativo de S(θ). De lo contrario, los
valores de S(θ) pueden aumentar en lugar de disminuir en puntos ubicados a lo largo
del vector corrección. Segundo, debido a la forma alargada de la superficie S(θ) en la
mayoría de los problemas, b1 (vector corrección hallado por el método de
linealización) está generalmente casi a 90° de bq.
PRUEBA DE HIPOTESIS

Donde τ es algún subvector del vector de parámetros θ. Es decir, el vector θ se ha


particionado de la forma θT = (pT, τT), donde τ es el subvector qx1 de parámetros de
interés y p es el subvector rx1 de parámetros restantes.
Se distinguen 3 estadísticas de prueba en este caso:
La del cociente de verosimilitud (T)
La prueba de Wald
La prueba basada en la normalidad asintótica del estimador mínimos
cuadrados
La estadística de prueba del cociente de verosimilitud T
Es el cociente entre el estimador de máxima verosimilitud de la varianza para el
modelo reducido por la hipótesis nula, σ2 y el estimador de máxima verosimilitud de
la varianza para el modelo completo, notado por σ2.

14
INGENIERÍA

Ejercicio 7:
Analizar y explicar: ESTIMACIÓN DE MODELOS NO LINEALES ALFONSO NOVALES
DEPARTAMENTO DE ECONOMÌA CUANTITATIVA UNIVERSIDAD COMPLUTENSE
Ver link: https://www.ucm.es/data/cont/media/www/pag-
41459/Modelos%20no%20lineales.pdf
Sol:
ESTIMACIÓN DE MODELOS NO LINEALES

El interés de un modelo no lineal es que rompe con una limitación del modelo lineal,
que es que el efecto de un cambio unitario en una variable explicativa xt sobre la
variable dependiente, es constante: 𝑑𝑦𝑡 ⁄𝑑𝑥𝑡 = 𝛽.

Si f(xt; β) es no lineal únicamente en las variables explicativas xt; un cambio de


variable permite transformar el modelo anterior en un modelo lineal. Excluimos, sin
embargo, inicialmente, la estimación de relaciones implícitas, representables a partir
de un modelo general del tipo

Conviene observar que las posibles dificultades en estimación, y la necesidad de


utilizar procedimientos adecuados para el tratamiento de modelos no lineales surge
cuando el modelo es no lineal en los parámetros. Es decir, no linealidades en las
variables del modelo, por sí solas, no generan ninguna dificultad, y no requieren
procedimientos especiales de estimación. Son situaciones que se reducen a modelos
lineales mediante un cambio de variable apropiado. Por ejemplo, para estimar el
modelo:

si hacemos el cambio de variable:

tenemos un modelo lineal: 𝑦𝑡 = 𝛼 + 𝛽𝑧𝑡 + 𝑢𝑡 ; que se estima por mínimos cuadrados


ordinarios, sin ninguna dificultad.

ALGUNOS MODELOS LINEALES NO TIPICOS:

1) MODELO POTENCIAL

15
INGENIERÍA

Una especificación muy natural acerca de la relación no lineal entre variables


es:

que se reduce a una relación lineal: 𝒚𝒕 = 𝜶 + 𝜷𝒙𝒕 + 𝒖𝒕 ; bajo la restricción


𝛾 = 1. Es decir, el modelo de relación lineal entre 𝒚𝒕 y 𝒙𝒕 ∶ 𝒚𝒕 = 𝜶 + 𝜷𝒙𝒕 +
𝒖𝒕 ; es una versión restringida del modelo.
Siendo este una extensión natural del caso lineal, este modelo es muy
apropiado para analizar posibles no linealidades en la relación entre ambas
variables, una vez que se ha estimado un modelo lineal. Puede utilizarse
asimismo para analizar el carácter no lineal del efecto de una variable
explicativa 𝒙𝒕 sobre 𝒚𝒕 en una regresión múltiple. Una vez estimado el
modelo, el contraste de linealidad equivale a contrastar la hipótesis nula: H0:
ꙋ = 1 frente a la hipótesis alternativa H1: ꙋ ≠ 1.

2) Región por umbrales


2.1. Contraste de Chow: Es bien conocido por analizar la posible existencia
de cambio estructural en un modelo de regresión lineal. El test de Chow
consiste en evaluar si hay suficiente evidencia acerca de que las
estimaciones paramétricas con ambas submuestras son diferentes
entre sí. Para ello, se compara las estimaciones obtenidas con las
submuestras, con la que obtendríamos con la muestra completa. Si
concluimos que no existe dicha evidencia empírica, pensaremos que no
ha habido cambio estructural. El modelo restringido es el que estima
con toda la muestra, mientras que el modelo sin restringir es el que
considera una ecuación distinta para cada submuestra. La Suma de
Cuadrados de residuos de este modelo es el agregado de la Suma de
Cuadrados de residuos con ambas submuestras, anterior y posterior al
posible momento de cambio estructural.
2.2. Switching regressions con probabilidades exógenas: La regresión por
umbrales, o modelo switching regressions con probabilidades exógenas
surge si estamos dispuestos a suponer que el vector solo ha tomados
dos valores posibles a lo largo de la muestra, y que ello depende de los
valores que ha tomado una determinada variable z. Así, suponemos
que:

16
INGENIERÍA

La variable z puede ser una de las variables que integran el vector 𝑥𝑡 , o


no formar parte del mismo. Los parámetros a estimar son 𝟐𝒌 + 𝟏 ∶
(𝜷𝟏 , 𝜷𝟐 , 𝒛∗ ), y la estimación es condicional en nuestra elección de la
variable zt que determina el cambio de régimen. Para estimar el
modelo, condicional en un determinado valor numérico z; dividimos la
muestra en dos submuestras, según que 𝒛𝒕 < 𝒛∗ 𝒐 𝒛𝒕 > 𝒛∗ ; y estimamos
dos regresiones:

2.3. Switching Markov regression: El modelo tiene la siguiente forma

que podemos representar en función de una variable latente 𝑠𝑡 que


toma el valor 1 si estamos en el estado 1, y toma el valor 2 si estamos
en el estado 2:

La probabilidad incondicional de estar en el régimen 1 es:

mientras que la probabilidad incondicional de estar en el régimen 2 es:

La cadena de Markov se representa mediante un vector aleatorio de


indicadores de estado, 𝜀𝑡 ; cuyo elemento i-ésimo es igual a 1 si se
produce el estado i en dicho período, y es igual a 0 en caso contrario.

En una cadena con dos estados tendremos:

Pero los estados no son observables, por lo que únicamente podemos


asignar probabilidades de estar en uno u otro régimen, condicionales en
la información disponible hasta ese instante.

17
INGENIERÍA

3) Simulación de modelos
3.1. Simulación de un modelo de regresión por umbrales: Para simular una
regresión por umbrales, debemos utilizar una variable aleatoria que nos
indique en qué régimen estamos en cada período. Consideremos que
hemos estimado un modelo autoregresivo:

Con:

3.2. Simulación de un modelo GARCH: El modelo GARCH es un modelo


autoregresivo generalizado que captura las agrupaciones de volatilidad
de las rentabilidades a través de la varianza condicional.
Supongamos que hemos estimado un modelo GARCH:

y queremos simular una realización de dicha variable para T+1; T+2; …;


T+ h. Al estimar el modelo, habremos generado residuos:

así como una serie temporal de varianzas de la innovación:

3.3. Simulando un modelo GARCH con cambio de régimen (probabilidades


exógenas): Supongamos que hemos estimado un modelo GARCH con
cambio de régimen con probabilidades exógenas

Una vez estimado el modelo con datos: t = 1;2; …; T; tendremos que


generar una senda simulada para la variable zt como hemos comentado
más arriba, para {T + 1; …; T + h}. Extraeremos asimismo una realización
N(0;1) para cada uno de esos períodos.

18
INGENIERÍA

Ejercicio 8:
Analizar y explicar: MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU
APLICACIÓN EN PROBLEMAS DE INGENIERÍA 1 Claudia Minnaard Facultad de
Ingeniería. Universidad Nacional de Lomas de Zamora
Ver link:
https://digital.cic.gba.gob.ar/bitstream/handle/11746/4750/11746_4750.pdf-
PDFA.pdf?sequence=1&isAllowed=y
Sol:

En el análisis de regresión una de las dos variables, que llamamos X, puede


considerarse como variable ordinaria, es decir se puede medir sin error apreciable.
La otra variable Y, es una variable aleatoria. A X se la llama variable independiente
(algunas veces variable controlada) y nuestro interés es la dependencia de Y en
términos de X.
Supongamos que en cierto experimento aleatorio tratamos de manera simultánea
dos variables, una variable ordinaria X y una variable aleatoria Y. Efectuamos el
experimento de tal manera que seleccionamos primero n valores x1, x2, ..., xn de X
y luego para cada xj obtenemos un valor observado yj de Y.
El objetivo es hallar alguna función que describa aproximadamente el diagrama de
puntos anterior, en el rango considerado de la variable X.
A tal efecto en primer lugar elegimos una clase de funciones de donde
seleccionaremos alguna función apropiada.
Las clases de funciones más utilizadas son las siguientes:

19
INGENIERÍA

Ya elegida la clase de funciones, nos falta determinar en la misma alguna que


describa los valores dados. Para ello utilizaremos el método de mínimos cuadrados.

REGRESIÓN LINEAL
Aplicamos el método de mínimos cuadrados en el siguiente ejemplo.

Graficamos, y obtenemos:

20
INGENIERÍA

ANÁLISIS DE LA VARIANZA
Siendo y = a + bx la recta de regresión lineal, el parámetro b se llama coeficiente de
regresión. Su valor expresa el incremento de y cuando x aumenta una unidad. Si b
toma un valor positivo, la variable y crece al crecer x, y en consecuencia la recta es
creciente, lo que indica que la dependencia entre las variables es directa.
Si b toma un valor negativo, la variable y decrece al crecer x, y en consecuencia la
recta es decreciente, lo que indica que la dependencia entre las variables es inversa.
Si b = 0, la recta es horizontal y no hay dependencia entre las variables, ya que las
variaciones de x no provocan variación de y.
Usando el software XLStat, aplicamos el análisis de la varianza:

EL COEFICIENTE DE DETERMINACIÓN
Se define el coeficiente de determinación como la parte relativa de la variación total
que viene explicada por el modelo.

El coeficiente de determinación toma valores entre 0 y 1. (0 ≤ R2 ≤ 1).


Todo ajuste mínimo cuadrático debe venir acompañado de su respectivo
coeficiente de determinación para poder conocer el poder representativo de
la función de ajuste, es decir el valor explicativo del modelo.
Si R2 > 0,90 se acepta el ajuste, en caso contrario se debe buscar otro modelo.
Para el ejemplo propuesto R2 = 0,955 > 0,90, por lo tanto, la regresión lineal
es un muy buen ajuste.

21
INGENIERÍA

REGRESIONES NO LINEALES

22
INGENIERÍA

Comparamos las regresiones aplicadas, y obtenemos:

Con lo hallado podemos observar que las regresiones son muy buenas, ya que en
todos los casos se observa un R2 > 0.90.
El mejor ajuste es a través de una función exponencial (R2 = 0,978), seguido por la
regresión cuadrática (R2 = 0,971), si bien se puede observar que los dos valores
anteriores están muy cerca uno del otro.
Con todo lo obtenido anteriormente se puede concluir que la aplicación de distintas
regresiones sobre un mismo problema nos permite realizar comparaciones, sin
limitarse solamente al caso lineal.
La facilidad de que nos brindan las nuevas tecnologías permiten en poco tiempo
efectuar comparaciones que nos permitan la correcta elección de un modelo
adecuado, que describa los datos en problemas de ingeniería, así como nos
proporciona elementos de juicio suficientes para la toma de decisiones en
condiciones de incertidumbre.

Ejercicio 9:
Analizar y explicar: USANDO MINITAB
Ver link: Regresión no lineal - Bing video

23
INGENIERÍA

Sol:
Un ingeniero que labora en una distribuidora eléctrica, desea encontrar un modelo
de regresión lineal que le permita predecir el consumo de electricidad en su localidad
a partir de las temperaturas mínimas que se pronostican para el día siguiente. Los
datos de la temperatura y el consumo real son los siguiente:

TEMPERATURA CONSUMO
10 12,5
7 14
13 11
25 5,5
7,5 14,5
18,5 9
15,5 10,5
28 8,5
14,5 10
20 9,5

1. Identifique las variables de estudio


Variable independiente x: Temperatura
Variable dependiente y: Consumo

2. Realice el diagrama de dispersión

24
INGENIERÍA

Los datos presentan una tendencia no lineal por la forma de los puntos.

3. Genere los modelos de regresión no lineal y ordene según prioridad.


Modelo cuadrático:

25
INGENIERÍA

Modelo exponencial:

Modelo potencia:

26
INGENIERÍA

La prioridad de los modelos se evalúa R^2 y se concluye que el mejor sería


Cuadrático con 88.71%, continua el modelo Potencia y finalmente el modelo
Exponencial.
4. Valide el mejor modelo. ¿Qué modelo elegiría el ingeniero? Use un nivel de
significación del 6%.
Prioridad 01: Modelo Cuadrático

𝑯𝟎 = 𝞫𝟐 = 𝟎
𝑯𝟏 = 𝞫𝟐 ≠ 𝟎
Decisión: No se rechaza Ho dado que p-valor = 0.091 > 0.06
Conclusión: Con un nivel de significancia del 6% el modelo cuadrático no es
válido.

Prioridad 02: Modelo Potencia

𝑯𝟎 = 𝞫𝟏 = 𝟎
𝑯𝟏 = 𝞫𝟏 ≠ 𝟎
Decisión: Se rechaza Ho dado que p-valor = 0.001 < 0.06
Conclusión: Con un nivel de significancia del 6% el modelo potencia es válido,
por lo tanto, el ingeniero elegiría el modelo potencia.

5. Presente el modelo estimado


Modelo potencia linealizado estimado:

27
INGENIERÍA

Modelo potencia estimado:

Remplazando:

6. ¿Cuál será el consumo de energía cuando la temperatura es de 15°C?

Estimación puntual linealizada = 2.29889


Estimación puntual = exp (2.29889) =9.96312

7. Estime, con un nivel de confianza del 94%, el consumo de electricidad


cuando la temperatura es de 15°C

IC (Y) = [7.23637; 13.71733]

8. Estime, con un nivel de confianza del 94%, el consumo medio de electricidad


cuando la temperatura es de 15°C.

IC(mu (y)) =[9.04462; 10.9748]

9. Otra consideración
(Trabajar con el modelo exponencial)

Beta 0= antilog(2.873) =17.69


Beta1= - 0.03487
𝑦̂=17.69 𝑒−0.03487

28

También podría gustarte