Está en la página 1de 13

Modelos Lineales Hidrologia Aplicada

MODELOS LINEALES: REGRESION Y CORRELACION

I. INTRODUCCION
Cuando se trabaja con dos o más variables, es importante conocer la relación
entre ellas. Si una o más variables son aleatorias, no habrá una relación unívoca
entre los valores de dos de las variables, es decir, dado un valor de una variable
(la variable controlada), hay un posible rango de valores de la otra, y por lo tanto
se requiere una descripción probabilística. La relación probabilística de las
variables, que se describe con la media y la varianza de una variable aleatoria en
función de los valores de la otra variable, se conoce como análisis de regresión.

Cuando el análisis se limita a funciones lineales, se trata de una regresión lineal,


pero la regresión puede ser también de tipo no lineal. En algunos casos,
problemas de regresión no lineal pueden convertirse en lineales mediante una
transformación de las variables originales.

A continuación, estudiaremos dicho grado de relación entre dos variables en lo


que llamaremos análisis de correlación. Para representar esta relación
utilizaremos una representación gráfica llamada diagrama de dispersión y,
finalmente, estudiaremos un modelo matemático para estimar el valor de una
variable basándonos en el valor de otra, en lo que llamaremos análisis de
regresión.

II. OBJETIVOS
- Realizar el análisis de regresión para la serie de descargas del río Ramis –
Estación Puente Ramis y la serie de precipitaciones anuales de la estación
Progreso.
- Realizar el análisis de correlación para la serie de descargas del río Ramis –
Estación Puente Ramis y la serie de precipitaciones anuales de la estación
Progreso.

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 1


Modelos Lineales Hidrologia Aplicada

III. MARCO TEORICO

3.1. REGRESION LINEAL SIMPLE


Posiblemente el modelo más común usado en hidrología esta basado en la
asunción lineal entre dos variables. El objetivo de este análisis es establecer una
relación lineal entre la variable independiente (X) y la variable dependiente (Y);
Y = α + β.X. en este modelo α y β representan valores reales, sin embargo será
necesario preguntarnos: ¿Qué valores de α y β son los representativos para el
modelo?. Un criterio intuitivo nos conduce a que α y β deben tener valores que
minimice la desviación ei entre los valores observados Yi y los valores
precedidos Yˆi , los estimadores de α y β son a y b respectivamente.

∑ (Y i − Yˆi ) = ∑ ei = ∑ (Yi − αˆ − βˆ . X i ) = ∑ (Yi − a − b. X i )

La ∑e i ≅ 0 , puede ser positivo o negativo, por lo que este criterio no es del

todo conveniente ya que en la ecuación Y = a + b.Xi la ∑e i será igual a cero si

la recta pasa por dos puntos. La ∑e i será también cero cuando la recta

sobreestima un punto en la misma proporción que subestima el otro punto y de


ese modo se tienen una infinidad de líneas que hagan ∑e i = 0.

Por las consideraciones mencionadas se opta por minimizar la suma del


cuadrado de las desviaciones:

M = ∑ ei2 = ∑ (Yi − Yˆi ) 2 = ∑ (Yi − a − b. X i ) 2

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 2


Modelos Lineales Hidrologia Aplicada

Esta suma puede minimizarse para a y b, derivando parcialmente M respecto de


a y b e igualando a cero.

∂M
= −2∑ (Yi − a − b. X i ) = 0
∂a
∂M
= −2∑ Yi (Yi − a − b. X i ) = 0
∂b
La solución de estas ecuaciones normales para a y b es:


∑ X * ∑Y
i i
∑ X .*Y
i i
n ∑ ( X − X )(Y − Y i )
b= =
i i


(∑ X i ) 2 ∑(X − X )
i
2

∑X i
2

n
(∑ Yi − b∑ X i )
a= = (Y − b * X )
n
La línea Y = a + b.X es comúnmente conocida como línea de regresión de Y en
X. el procedimiento de determinación de a y b se conoce como regresión
simple.

3.2. EVALUACION DE LA REGRESION


Una segunda pregunta puede formularse: ¿Pueden los datos ser descritos
adecuadamente por la línea de regresión? Naturalmente la respuesta a esta
pregunta depende de lo que se entiende por adecuadamente. Una aproximación
puede ser cuantificando el valor de la suma de cuadrados de la variable
dependiente ya que ello representa su variabilidad.

La relación entre la suma de cuadrados total respecto a la media es denotado por


r2:

∑(X − X )2 S X2
r =b = b2 *
2 2 i
*
∑ (Y i − Y )2 S Y2

SX
r = b* , donde 0 ≤ r 2 ≤ 1
SY

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 3


Modelos Lineales Hidrologia Aplicada

∑(X − X )(Yi − Y ) S XY
r= =
i

[∑ ( X i − X) 2
∑ (Y i −Y) ]
2 1/ 2 S X * SY

Donde:
r = Coeficiente de correlación.
SX = Desviación estándar de X.
SY = Desviación estándar de Y.
SXY = Desviación estándar de X e Y.

3.3. INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPOTESIS


Si: Yi − Yˆi = Yi − a − b. X i = ε i

Similarmente: Yi − α − β . X i = ε i

La asunción de normalidad de εi, puede ser chequeada mediante pruebas de


hipótesis; al 95% de los valores de ei, debería estar entre el intervalo y sólo el
5% de los residuos deberán estar fuera del intervalo -2σ a +2σ. Bao la asunción
de normalidad tenemos: E(ε2) = 0. la variancia de ε, esta dado por:
Var (ε ) = E (ε 2 ) − E 2 (ε ) = E (ε 2 ) = σ 2

La raíz positiva de la variancia de ε, es conocida como el ERROR ESTANDAR


de la ecuación de regresión:

∑S 2
∑ (Y − Yˆi ) 2
S = =
2 i i

( n − 2) ( n − 2)

La relación entre r y S es:


( n − 2) S 2
r = 1−
2

(n − 1) S Y2

3.4. CORRELACION

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 4


Modelos Lineales Hidrologia Aplicada

El coeficiente de correlación de una población entre dos variables aleatorias X e


Y es definido en términos de la covariancia de X e Y y las variables de X e Y.

σ X ,Y
ρ X ,Y =
σ X .σ Y
El estimador de ρX,Y cuando se trabaja con muestras, esta dado por:
S X ,Y
rX ,Y =
S X .S Y
Donde:
Sx y Sy = Desviaciones estándar de X e Y.
Sx,y = Covariancia muestral entre X e Y.

a) El valor de ρx,y pueden variar entre -1 y +1.


b) Si ρx,y = ±1 implica una relación lineal perfecta entre X e Y.
c) Si ρx,y = 0 impica independencia lineal entre X e Y.

IV. METODOLOGIA
El procedimiento seguido para el análisis de regresión y correlación para las
series de descargas y precipitación del Río Ramis - Estación Puente Ramis y
estación Progreso respectivamente (ver el Cuadro 4.1) es como sigue:

4.1. REGRESION LINEAL


Para realizar el análisis de regresión lineal se empleo el programa MINITAB, el
procedimiento seguido para realizar dicho análisis se muestra a continuación:

1. Ingreso de la información al programa Minitab, ver Figura 4.1

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 5


Modelos Lineales Hidrologia Aplicada

Figura 4.1.- Ingreso de datos a Minitab

2. Selección de la prueba a realizar, en este se efectuó una regresión lineal


simple.

Figura 4.2.- Selección de la prueba a realizar

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 6


Modelos Lineales Hidrologia Aplicada

3. Ingreso de las variables a considerar en el análisis de regresión, para este


caso se consideró como variable dependiente a los caudales y como
independiente a la precipitación.

Figura 4.3.- Ingreso de variables

4. Visualización de resultados y gráfico de la relación entre variables

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 7


Modelos Lineales Hidrologia Aplicada

Figura 4.4.- Visualización de resultados

5. Interpretación de resultados obtenidos

V. RESULTADOS Y DISCUSIONES
Los resultados del análisis de regresión y correlación de la serie de descargas
medias anuales del río Ramis - Estación Puente Ramis y la serie de
precipitación anual de la Estación Progreso se muestra a continuación:

5.1. DEL ANALISIS DE REGRESION Y CORRELACION ENTRE


PRECIPITACION ANUAL Y DESCARGAS ANUALES
Los resultados del análisis de regresión entre la serie de descargas medias
anuales del río Ramis y la serie de precipitación anual se presentan en el Cuadro
5.1.

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 8


Modelos Lineales Hidrologia Aplicada

Cuadro 5.1.- Resultados del análisis de regresión entre Q(m3/s) y PP (mm)

En el Cuadro 5.1 podemos observar que los coeficientes de regresión tanto a y b


son iguales a -6.70 y 0.1279 respectivamente, por lo que la ecuación del modelo
de regresión serie de la siguiente forma:

Q (m3 / s ) = −6.70 + 0.1279 * PP (mm)

También podemos decir que el valor de r2 es igual a 45.5% ó 0.455, lo que nos
indica que el 45.5% de la variación en Q (m3/s) es explicado por la ecuación de
regresión y el 55.5% es debido a causas no explicadas.

En la Figura 5.1 se muestra la relación entre la serie de descargas medias anuales


del río Ramis - Estación Puente Ramis y la serie de precipitación anual de la
Estación Progreso, también se puede apreciar la línea de tendencia, los límites ó
intervalos de confianza e intervalos de predicción al 95%.

Según el grafico de la relación entre mostrado entre la serie de descargas medias


anuales del río Ramis - Estación Puente Ramis y la serie de precipitación anual

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 9


Modelos Lineales Hidrologia Aplicada

de la Estación Progreso mostrado en la Figura 5.1, podemos decir que los puntos
ploteados se encuentran dentro del intervalo de confianza.

Relación entre Precipitación Anual y Escorrentía


Q (m3/s) = - 6.70 + 0.1279 PP (mm)
160
S 17.6537
R-Sq 45.5%
140 R-Sq(adj) 44.0%

120

100
Q (m3/s)

80

60

40

20 Regression
95% CI
0 95% PI

300 400 500 600 700 800 900


PP (mm)

Figura 5.1.- Relación entre la precipitación anual y la escorrentía

El coeficiente de correlación (r) obtenido para la relación entre la serie de


descargas medias anuales del río Ramis - Estación Puente Ramis y la serie de
precipitación anual de la Estación Progreso es:

r = 0.675

Realizando la prueba de significancia utilizando la Distribución t nos da como


resultado:
Valor calculado (tc) = 5.562
Valor tabular (tt) = 2.045

Con lo que podemos decir que tc > tt, lo que nos indica que el valor del
coeficiente de correlación es significativo, por lo que si existe correlación
Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 10
Modelos Lineales Hidrologia Aplicada

significativa entre las variables analizadas, a su vez este valor también nos
indica que existe una estrecha relación entre ambas variables analizadas y que
puede hacerse una estimación buena del valor del caudal a partir de un valor de
precipitación.

5.2. DEL ANALISIS CORRELACION ENTRE DESCARGAS ANUALES


El coeficiente de correlación (r) obtenido para la relación entre la serie de
descargas medias anuales del río Ramis - Estación Puente Ramis es:
r = 0.185

Realizando la prueba de significancia utilizando la Distribución t nos da como


resultado:
Valor calculado (tc) = 1.128
Valor tabular (tt) = 2.040

Con lo que podemos decir que tc < tt, lo que nos indica que el valor del
coeficiente de correlación no es significativo, por lo que no existe correlación
significativa entre las variables analizadas, a su vez este valor también nos
indica que no existe una estrecha relación entre ambas variables analizadas y que
no puede hacerse una estimación del valor del caudal actual a partir de un valor
de caudal anterior.

5.3. DEL ANALISIS CORRELACION ENTRE PRECIPITACION ANUAL


El coeficiente de correlación (r) obtenido para la relación entre la serie de
precipitación anual de la Estación Progreso es:
r = -0.118

Realizando la prueba de significancia utilizando la Distribución t nos da como


resultado:
Valor calculado (tc) = 0.715

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 11


Modelos Lineales Hidrologia Aplicada

Valor tabular (tt) = 2.040


Con lo que podemos decir que tc < tt, lo que nos indica que el valor del
coeficiente de correlación es significativo, por lo que si existe correlación
significativa entre las variables analizadas, a su vez este valor también nos
indica que no existe una estrecha relación entre ambas variables analizadas y que
no puede hacerse una estimación del valor del precipitación actual a partir de un
valor de precipitación anterior.

VI. CONCLUSIONES
- La ecuación de regresión obtenida para la serie de precipitaciones anuales de la
estación Progreso (1964 – 2002) y la serie de descargas anuales del río Ramis –
Estación Puente Ramis (1964 – 2002) es: Q ( m3 / s ) = −6.70 + 0.1279 * PP ( mm) .
- El coeficiente de correlación (r) para la serie de precipitaciones anuales de la
estación Progreso (1964 – 2002) y la serie de descargas anuales del río Ramis –
Estación Puente Ramis (1964 – 2002) es 0.675, lo que nos indica la existencia de
una estrecha relación lineal entre las dos variables en análisis.
- El coeficiente de correlación (r = 0.675) es significativo, debido a que el valor de tc
> tt (5.562 > 2.045), por lo que existe correlación significativa entre las dos
variables en análisis y también que el valor de la precipitación puede usarse para
predecir las descargas.
- El coeficiente de correlación (r) de la relación entre las series de descargas anuales
del río Ramis – Estación Puente Ramis (1965 – 2002) y (1964 – 2001) es 0.185, lo
que nos indica la no existencia de una estrecha relación lineal entre las dos variables
en análisis.
- El coeficiente de correlación (r = 0.185) no es significativo, debido a que el valor de
tc < tt (1.128 < 2.040), por lo que no existe correlación significativa entre las dos
variables en análisis y también que el valor de la descarga del año anterior no puede
ser usada para estimar la descarga actual.
- El coeficiente de correlación (r) de la relación entre las series de precipitaciones
anuales de la Estación Progreso (1965 – 2002) y (1964 – 2001) es -0.118, lo que
nos indica la no existencia de una estrecha relación lineal entre las dos variables en
análisis.

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 12


Modelos Lineales Hidrologia Aplicada

- El coeficiente de correlación (r = -0.118) no es significativo, debido a que el valor


de tc < tt (0.715 < 2.040), por lo que no existe correlación significativa entre las dos
variables en análisis y también que el valor de precipitación del año anterior no
puede ser usada para estimar la precipitación actual.

VII. BIBLIOGRAFIA
- Benjamín R, Jack, Cornell A, C., 1970, “Probabilidad y Estadística en Ingeniería
Civil”, Editorial McGRAW-HILL, Bogotá, Colombia.
- Mejia M., Abel, 1991, “Métodos Estadísticos en Hidrología”, UNALM – DRAT,
Lima, Perú.
- Villón B, Máximo, 2002, “Hidrología Estadística”, Editorial Villón, Lima, Perú.

Docente: Mg. Sc, Ing. Miguel Angel Flores Barriga pág. 13

También podría gustarte