Está en la página 1de 13

Análisis datos precipitación

En el presente informe hacemos un análisis de algunas medidas descriptivas de centralidad y


dispersión para los datos correspondientes al volumen de precipitaciones de lluvias mensuales
obtenidas en la red de estaciones hidrológicas de la Corporación Autónoma Regional de
Cundinamarca (CAR). Los datos corresponden a los meses de enero y diciembre, se tiene un total
de 208 datos correspondientes a las precipitaciones de lluvias medidas en mm para cada mes y
fueron obtenidos de la plataforma Datos Abiertos, en la sección de Ambiente y Desarrollo sostenible
(https://www.datos.gov.co/Ambiente-y-Desarrollo-Sostenible/Precipitaciones-Totales-
Mensuales/mb4n-6m2g). También realizamos un análisis de regresión para estudiar si las
precipitaciones en enero tienen alguna influencia en las precipitaciones en diciembre. Los
resultados obtenidos se presentan a continuación.

PRECIPITACIÓN ENERO

 Datos sin agrupar:

Promedio 47,277
Varianza 3409,166
Desv. Estándar 58,388
P15 6,41
P45 22,905
P75 59,8
CV 1,235

La precipitación media en enero fue de 47,277mm con una desviación estándar de


58,388mm. Además, el 15% de las precipitaciones más bajas en enero se encontró por
debajo de 6,41mm, el 45% de las precipitaciones más bajas por debajo de 22,905 y el 25%
de las precipitaciones más altas por encima de 59,8mm. Además, tenemos un coeficiente
de variación de 1,235% que es muy bajo, lo que nos indica que los datos no son muy
variables.

Min 0
Q1 13,075
Q2 27,05
Q3 59,8
Max 399,3

Además, la precipitación mínima en enero fue de 0mm y la máxima de 399,3mm, el 50% de


las precipitaciones medias se encuentra entre 13,075mm y 59,8mm. Notamos en el
siguiente diagrama de caja, que los datos se acumulan en los valores inferiores.
Diagrama de caja
Precipitaciones Enero
450

400

350

300

250

200

150

100

50

0
1

 Datos agrupados:
Para la precipitación de las lluvias en enero tenemos la siguiente tabla de frecuencias. El
rango de estos datos es 399,3 y se agruparon, según la regla de Sturges, en 9 intervalos de
amplitud de 44,367mm cada uno.

Lim Lim
Int inferior superior Xi fi Fi hi Hi Xi*fi (Xi-X)^2*fi
1 0 44,367 22,183 136 136 0,65385 0,6538 3016,93333 117837,634
2 44,367 88,733 66,550 41 177 0,19712 0,8510 2728,55 9140,43508
3 88,733 133,100 110,917 15 192 0,07212 0,9231 1663,75 52743,3587
4 133,100 177,467 155,283 9 201 0,04327 0,9663 1397,55 96716,8135
5 177,467 221,833 199,650 2 203 0,00962 0,9760 399,3 43826,4071
6 221,833 266,200 244,017 1 204 0,00481 0,9808 244,016667 37016,8967
7 266,200 310,567 288,383 2 206 0,00962 0,9904 576,766667 112114,784
8 310,567 354,933 332,750 1 207 0,00481 0,9952 332,75 79034,6896
9 354,933 399,300 377,117 1 208 0,00481 1 377,116667 105948,789

Gráficamente notamos que los datos se acumulan en valores inferiores de precipitación y


es poco frecuente para valores de precipitación superiores a 155mm, esto nos indica que
en enero no se presentó muchas lluvias.
Precipitaciones Enero
160

140

120

100
Frecuencia

80

60

40

20

0
22,183 66,550 110,917 155,283 199,650 244,017 288,383 332,750 377,117
Precipitaciones

Precipitaciones Enero
160

140

120

100
Frecuencia

80

60

40

20

0
22,183 66,550 110,917 155,283 199,650 244,017 288,383 332,750 377,117
Precipitaciones

Para los datos agrupados, las medidas de centralidad y dispersión obtenidas son:

Promedio 51,619
Varianza 3146,057
Desv. Estándar 56,090
P15 10,178
P45 30,535
P75 66,009
CV 1,0866

Notamos que, al agrupar los datos, el promedio de precipitaciones fue mayor, mientras que
la varianza y la desviación estándar disminuyen, aunque estos cambios no son muy grandes,
y en general, tenemos medidas muy similares para datos agrupados y sin agrupar.

Min 0
Q1 16,9637
Q2 33,9275
Q3 66,0089
Max 399,3

Por otro lado, notamos que el valor de los cuartiles de precipitación aumento para datos
agrupados, aunque no en gran medida, por lo cual, el diagrama de cajas y bigotes es muy
similar para datos agrupados y sin agrupar.

Diagrama de caja
Precipitaciones Enero
450

400

350

300

250

200

150

100

50

0
1

PRECIPITACIÓN DICIEMBRE

 Datos sin agrupar:

Promedio 69,867
Varianza 4867,836
Desv. Estándar 69,770
P15 7,81
P45 44,145
P75 91,625
CV 0,9986

La precipitación media en diciembre fue de 69,867mm con una desviación estándar de


69,770mm. Además, el 15% de las precipitaciones más bajas en diciembre se encontró por
debajo de 7,81mm, el 45% de las precipitaciones más bajas por debajo de 44,145 y el 25%
de las precipitaciones más altas por encima de 91,625mm. Además, tenemos un coeficiente
de variación de 0,9986% que es muy bajo, lo que nos indica que los datos no son muy
variables.

Min 0
Q1 24,95
Q2 47,55
Q3 91,625
Max 357

Además, la precipitación mínima en diciembre fue de 0mm y la máxima de 357mm, el 50%


de las precipitaciones medias se encuentra entre 24,95mm y 91,625mm. Notamos en el
siguiente diagrama de caja, que los datos se acumulan en los valores inferiores, pero se
repartieron más homogéneamente que las de enero y se tuvo valores superiores.

Diagrama de caja
Precipitaciones Diciembre
400

350

300

250

200

150

100

50

0
1

 Datos agrupados:
Para la precipitación de las lluvias en diciembre tenemos la siguiente tabla de frecuencias.
El rango de estos datos es 357 y se agruparon, según la regla de Sturges, en 9 intervalos de
amplitud de 39,667mm cada uno.
Lim Lim
Int inferior superior Xi fi Fi hi Hi Xi*fi (Xi-X)^2*fi
1 0 39,667 19,833 83 83 0,39904 0,3990 1646,16667 229943,427
2 39,667 79,333 59,500 64 147 0,30769 0,7067 3808 10762,7324
3 79,333 119,000 99,167 25 172 0,12019 0,8269 2479,16667 17820,5385
4 119,000 158,667 138,833 14 186 0,06731 0,8942 1943,66667 61661,0999
5 158,667 198,333 178,500 6 192 0,02885 0,9231 1071 67456,7754
6 198,333 238,000 218,167 7 199 0,03365 0,9567 1527,16667 148596,815
7 238,000 277,667 257,833 3 202 0,01442 0,9712 773,5 103080,977
8 277,667 317,333 297,500 5 207 0,02404 0,9952 1487,5 253197,121
9 317,333 357,000 337,167 1 208 0,00481 1 337,166667 70065,4113

Gráficamente notamos que los datos se acumulan en valores inferiores de precipitación y es poco
frecuente para valores de precipitación superiores a 178mm, aunque también hubo una
concentración en valores bajos de precipitación, para diciembre las precipitaciones fueron
frecuentes en valores mayores que en enero.

Precipitaciones Diciembre
90
80
70
60
Frecuencia

50
40
30
20
10
0

Precipitaciones
Precipitaciones Diciembre
90
80
70
60
Frecuencia

50
40
30
20
10
0
19,833 59,500 99,167 138,833 178,500 218,167 257,833 297,500 337,167
Precipitaciones

Para los datos agrupados, las medidas de centralidad y dispersión obtenidas son:

Promedio 72,468
Varianza 4627,812
Desv. Estándar 68,028
P15 14,911
P45 46,236
P75 93,613
CV 0,939

Notamos que, al agrupar los datos, el promedio, la varianza y la desviación estándar de


precipitaciones fue mayor, aunque estos cambios no son muy grandes, y en general,
tenemos medidas muy similares para datos agrupados y sin agrupar.

Min 0
Q1 24,8514
Q2 52,6823
Q3 93,6133
Max 337,167

Por otro lado, notamos que el valor de los cuartiles de precipitación aumento para datos
agrupados, aunque no en gran medida, por lo cual, el diagrama de cajas y bigotes es muy
similar para datos agrupados y sin agrupar.
Diagrama de caja
Precipitaciones Diciembre

400

350

300

250

200

150

100

50

0
1

REGRESIÓN LINEAL

Nos interesa saber si las precipitaciones de las lluvias del mes de diciembre tienen relación con las
de diciembre, además de encontrar una recta de regresión que permita predecir las precipitaciones
en diciembre a partir de las de enero. Tomando como variable predictora X las precipitaciones en
enero y como variable dependiente Y las precipitaciones en diciembre y con el siguiente resumen
de medidas descriptivas hallamos los coeficientes de regresión lineal.

Enero (X) Diciembre(Y)


PROMEDIO 47,2774 69,8673
VARIANZA 3392,7759 4867,8364
DESV ESTANDAR 58,2475 69,7699
COV(X,Y) 3933,3603
Así,
𝐶𝑜𝑣(𝑋, 𝑌) 3933,3603
𝑏= = = 1,1593
𝑉𝑎𝑟(𝑋) 3392,7759
𝑎 = 𝑦̅ − 𝑏𝑥̅ = 69,867 − 1,1593 × 47,2774 = 15,0570
Es decir, la recta de regresión lineal que permite predecir las precipitaciones en diciembre a partir
de las de enero es

𝑦̂ = 15,0570 + 1,1593𝑥
Con esta recta, hallamos los valores estimados de precipitación en diciembre para cada valor de
precipitación en enero, y con esto obtenemos los residuos, y por lo tanto, el error de estimación y
el coeficiente de correlación lineal.

El error de estimación es
𝑆𝐶𝐸 (𝑦𝑖 − 𝑦̂)2 64013,7088
𝑥𝑦 = √
𝑠̂ =√ =√ = 17,6280
𝑛−2 𝑛−2 206

Y el coeficiente de correlación lineal es:


𝐶𝑜𝑣(𝑋, 𝑌) 3933,3603
𝑟= = = 0,96787
√𝑉𝑎𝑟(𝑋)𝑉𝑎𝑟(𝑌) 58,2475 × 69,7699

Como tenemos que el coeficiente de correlación lineal es muy cercano a 1, entonces se tiene que
las precipitaciones en enero y diciembre tienen una correlación lineal fuerte y directa, es decir, a
medida que aumentan o disminuyen las precipitaciones en enero lo hacen también las de diciembre.
Esta relación se puede apreciar gráficamente en el siguiente diagrama de dispersión donde notamos
que los datos se acercan mucho a la recta de regresión obtenida.

Dispersión precipitaciones ENE-DIC


600
y = 1,1593x + 15,057
Precipitaciones Diciembre

500
R² = 0,9368
400

300

200

100

0
0 50 100 150 200 250 300 350 400 450
Precipitaciones Enero

INTERVALOS DE CONFIANZA

 Medias con varianza conocida:

Para la media de las precipitaciones de las lluvias en enero sin agrupar, con varianza
conocida un intervalo de confianza del 95% es:

𝜎 𝜎
(𝑥̅ − 𝑍0,975 ( ) , 𝑥̅ − 𝑍0,975 ( ))
√𝑛 √𝑛
58,388 58,388
= (47,277 − 1,96 ( ) ; 47,277 + 1,96 ( )) = (39,3425; 55,2123)
√208 √208

Para la media de las precipitaciones de las lluvias en enero de los datos agrupados, con
varianza conocida un intervalo de confianza del 95% es:
𝜎 𝜎
(𝑥̅ − 𝑍0,975 ( ) , 𝑥̅ − 𝑍0,975 ( ))
√𝑛 √𝑛
56,089 56,089
= (51,618 − 1,96 ( ) ; 51,618 + 1,96 ( )) = (43,9515; 59,2863)
√208 √208

Para la media de las precipitaciones de las lluvias en diciembre sin agrupar, con varianza
conocida un intervalo de confianza del 95% es:

𝜎 𝜎
(𝑥̅ − 𝑍0,975 ( ) , 𝑥̅ − 𝑍0,975 ( ))
√𝑛 √𝑛
69,769 69,769
= (69,867 − 1,96 ( ) ; 69,867 + 1,96 ( )) = (60,3856; 79,3490)
√208 √208

Para la media de las precipitaciones de las lluvias en diciembre de los datos agrupados, con
varianza conocida un intervalo de confianza del 95% es:

𝜎 𝜎
(𝑥̅ − 𝑍0,975 ( ) , 𝑥̅ − 𝑍0,975 ( ))
√𝑛 √𝑛
68,028 68,028
= (72,467 − 1,96 ( ) ; 72,467 + 1,96 ( )) = (63,2230; 81,7129)
√208 √208

 Medias con varianza desconocida:

Para la media de las precipitaciones de las lluvias en enero sin agrupar, con varianza
desconocida un intervalo de confianza del 95% es:

𝑠 𝑠
(𝑥̅ − 𝑡0,975,207 ( ) , 𝑥̅ − 𝑡0,975;207 ( ))
√𝑛 √𝑛
58,388 58,388
= (47,277 − 1,971 ( ) ; 47,277 + 1,971 ( )) = (39,2959; 55,2590)
√208 √208

Para la media de las precipitaciones de las lluvias en enero de los datos agrupados, con
varianza desconocida un intervalo de confianza del 95% es:

𝑠 𝑠
(𝑥̅ − 𝑡0,975,207 ( ) , 𝑥̅ − 𝑡0,975,207 ( ))
√𝑛 √𝑛
56,089 56,089
= (51,618 − 1,971 ( ) ; 51,618 + 1,971 ( )) = (39,2959; 55,2590)
√208 √208

Para la media de las precipitaciones de las lluvias en diciembre sin agrupar, con varianza
desconocida un intervalo de confianza del 95% es:

𝑠 𝑠
(𝑥̅ − 𝑡0,975,207 ( ) , 𝑥̅ − 𝑡0,975,207 ( ))
√𝑛 √𝑛
69,769 69,769
= (69,867 − 1,971 ( ) ; 69,867 + 1,971 ( )) = (61,8858; 77,8489)
√208 √208

Para la media de las precipitaciones de las lluvias en diciembre de los datos agrupados, con
varianza desconocida un intervalo de confianza del 95% es:

𝑠 𝑠
(𝑥̅ − 𝑡0,975,207 ( ) , 𝑥̅ − 𝑡0,975,207 ( ))
√𝑛 √𝑛
68,028 68,028
= (72,467 − 1,971 ( ) ; 72,467 + 1,971 ( )) = (63,1686; 81,7673)
√208 √208

 Diferencia de medias con varianzas conocidas:

Para la diferencia entre las medias de las precipitaciones de enero agrupadas y sin agrupar,
tenemos que la varianza agrupada es

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 (207 × 3409,166) + (207 × 3146,0567)


𝑠𝑝2 = = = 3277,611
𝑛1 + 𝑛2 − 2 208 + 208 − 2

Entonces un intervalo de confianza del 95% para la diferencia entre las medias de las
precipitaciones de enero agrupadas y sin agrupar es

1 1 1 1
̅̅̅1 − ̅̅̅
(𝑋 𝑋2 − 𝑍0,975 𝑠𝑝 √ + ; ̅̅̅
𝑋1 − ̅̅̅
𝑋2 − 𝑍0,975 𝑠𝑝 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

1 1
= (47,277 − 51,618 − 1,96 × 57,250√ + ; 47,277 − 51,618 + 1,96
208 208

1 1
× 57,250√ + ) = (−15,3445; 6,6615)
208 208
Para la diferencia entre las medias de las precipitaciones de diciembre agrupadas y sin
agrupar, tenemos que la varianza agrupada es

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 (207 × 4867,836) + (207 × 4627,812)


𝑠𝑝2 = = = 4747,824
𝑛1 + 𝑛2 − 2 208 + 208 − 2

Entonces un intervalo de confianza del 95% para la diferencia entre las medias de las
precipitaciones de diciembre agrupadas y sin agrupar es

1 1 1 1
̅̅̅1 − ̅̅̅
(𝑋 𝑋2 − 𝑍0,975 𝑠𝑝 √ + ; ̅̅̅
𝑋1 − ̅̅̅
𝑋2 − 𝑍0,975 𝑠𝑝 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

1 1
= (69,867 − 72,467 − 1,96 × 68,904√ + ; 69,867 − 72,467 + 1,96
208 208

1 1
× 68,904√ + ) = (−15,8434; 10,6421)
208 208
 Proporción:

183
Para enero, la proporción de precipitaciones menor a 100 mm es 𝑝̂ = 208 = 0,8798.
Entonces un intervalo de confianza del 95% para la proporción de precipitaciones menor a
100 mm es
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
(𝑝̂ − 𝑧0,975 √ ; 𝑝̂ + 𝑧0,975 √ )
𝑛 𝑛

0,88 × 0,12 0,88 × 0,12


= (0,88 − 1,96√ ; 0,88 − 1,96√ ) = (0,8356; 0,9240)
208 208

167
Para diciembre, la proporción de precipitaciones menor a 100 mm es 𝑝̂ = 208 = 0,8028.
Entonces un intervalo de confianza del 95% para la proporción de precipitaciones menor a
100 mm es
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
(𝑝̂ − 𝑧0,975 √ ; 𝑝̂ + 𝑧0,975 √ )
𝑛 𝑛

0,80 × 0,20 0,80 × 0,20


= (0,80 − 1,96√ ; 0,80 − 1,96√ ) = (0,7488; 0,8569)
208 208

 Varianzas:
Un intervalo de confianza del 95% para la varianza de las precipitaciones de enero sin agrupar
es

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2 207 × 3409,166 207 × 3409,166


( 2 ; 2 )=( ; )
𝜒0,975;207 𝜒0,025;207 248,739 169,047

= (2837,104; 4174,554)

Un intervalo de confianza del 95% para la varianza de las precipitaciones de enero de datos
agrupados es

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2 207 × 3146,05677 207 × 3146,05677


( 2 ; 2 )=( ; )
𝜒0,975;207 𝜒0,025;207 248,739 169,047

= (2618,145; 3852,375)

Un intervalo de confianza del 95% para la varianza de las precipitaciones de diciembre de datos
sin agrupar es

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2 207 × 4867,836 207 × 4867,836


( 2 ; 2 )=( ; )
𝜒0,975;207 𝜒0,025;207 248,739 169,047

= (4051,008; 5960,709)

Un intervalo de confianza del 95% para la varianza de las precipitaciones de diciembre de datos
agrupados es

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2 207 × 4627,81201 207 × 4627,81201


( 2 ; 2 )=( ; )
𝜒0,975;207 𝜒0,025;207 248,739 169,047

= (3851,260; 5960,709)

También podría gustarte