Está en la página 1de 25

Datos del problema

Datos P(µg/L) Clα (µg/L)


1 5 1.4
2 7 3
3 8 1.7
4 10 2.1
5 10 2
6 15 6
7 18 4.9
8 24 22
9 29 8.2
10 30 12
11 32 25
12 33 14
13 38 12
14 41 20
15 42 24
16 43 30
17 48 20
18 68 42
19 84 84
20 92 103
21 96 120

a) Coef. De correlación P vs Cl Este valor de correlación nos muestra una correlación positiva muy fuerte
0.9368610002 Indica una dependencia alta entre las dos variables, cuando una de las concentracione
aumenta, la concentración de clorofila también lo hace, casi en proporción cons

b) Coef. De correlación Cl vs P La curva de regresión se ajusta a los datos que se brindan, si se


0.9368610002 por lo tanto la curva esta ajustada de la misma forma, solo está reflejada, por es
Hablando matemáticamente, la ecuación para hallar el coeficiente de correlación

c)

Log P Log Clα


0.698970 0.146128035678238
0.845098 0.477121254719662
0.903090 0.230448921378274 Datos obt
1.000000 0.322219294733919 Resumen
1.000000 0.301029995663981
1.176091 0.778151250383644 Estadísticas de la regresión
1.255273 0.690196080028514 Coeficiente de correlación múltiple 0.961527447119603
1.380211 1.34242268082221 Coeficiente de determinación R^2 0.924535031564342
1.462398 0.913813852383717 R^2 ajustado 0.920563191120359
1.477121 1.07918124604762 Error típico 0.164347475702366
1.505150 1.39794000867204 Observaciones 21
1.518514 1.14612803567824
1.579784 1.07918124604762 ANÁLISIS DE VARIANZA 1
1.612784 1.30102999566398 Grados de libertad
1.623249 1.38021124171161 Regresión 1
1.633468 1.47712125471966 Residuos 19
1.681241 1.30102999566398 Total 20
1.832509 1.6232492903979
1.924279 1.92427928606188 Coeficientes
1.963788 2.01283722470517 Intercepción -1.03705307808463
1.982271 2.07918124604762 Log P 1.48995455442995

Gráfica del comportamiento de Log Clα

2.5

2
2.5

1.5

0.5

0
0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2

Datos

i xi yi xiyi xi2
1 0.698970 0.146128035678238 0.102139113731632 0.49
2 0.845098 0.477121254719662 0.40321423721273 0.71
3 0.903090 0.230448921378274 0.208116113409813 0.82
4 1.000000 0.322219294733919 0.322219294733919 1.00
5 1.000000 0.301029995663981 0.301029995663981 1.00
6 1.176091 0.778151250383644 0.915176883799452 1.38
7 1.255273 0.690196080028514 0.866384162389874 1.58
8 1.380211 1.34242268082221 1.85282687519944 1.90
9 1.462398 0.913813852383717 1.33635954817828 2.14
10 1.477121 1.07918124604762 1.5940815562318 2.18
11 1.505150 1.39794000867204 2.10410937374525 2.27
12 1.518514 1.14612803567824 1.74041139906227 2.31
13 1.579784 1.07918124604762 1.70487283028253 2.50
14 1.612784 1.30102999566398 2.09828017411502 2.60
15 1.623249 1.38021124171161 2.24042691870757 2.63
16 1.633468 1.47712125471966 2.41283097465071 2.67
17 1.681241 1.30102999566398 2.18734527977287 2.83
18 1.832509 1.6232492903979 2.97461879219823 3.36
19 1.924279 1.92427928606188 3.70285077076682 3.70
20 1.963788 2.01283722470517 3.95278524030403 3.86
21 1.982271 2.07918124604762 4.12150117231557 3.93
Sumatoria 30.055 23.00290 37.14158 45.85

a1= 1.48995455400
a0= -1.03705308

6.800397

0.513192

0.9245350316
Error típico 0.1643474757

1
DETERMINACION DE LOS GRADOS DE LIBERTAD

Variables Grados de libertad


Regresión 2 1
Residuos 20 19
Total 21 20

3
DETERMINACION DE LOS PROMEDIOS DE LOS CUADRADOS

Grados de libertad Suma de cuadrados Promedio de los cuadrados


Regresión 1 6.29 6.287205472

Grados de libertad Suma de cuadrados Promedio de los cuadrados


Residuos 19 0.51 0.02701009277
SIGNIFICADOS Suma de cuadrados:
La suma de cuadrados es la d
Grados de libertad: datos, todo eso al cuadrado)
Los grados de libertad pueden ser interpretados como el número de valores de la muestra que pueden datos. La suma de cuadrados
ser fijados arbitrariamente y su cuantificación depende del número de variables o del tamaño de la suma de cuadrados del resid
muestra .Una muestra de tamaño n tiene (n – 1) grados de libertad, si hay restricciones los niveles de cuadrados es la suma del SC
libertad se reducen. En nuestro problema los grados de libertad para el total de datos es 20, para los que obtuvimos por excel no
residuos 19 y para la regresión 1.

Promedio de cuadrados: F calculado y F crítico:


Es la divison de la suma de los cuadrados entre el grado de libertad, para la regresión y para los residuos, El F mide el valor de probab
respectivamente. promedio de la regresión co
Es importante este calculo, ya que nos ayuda a determinar el F de la regresión. El F crítico nos ayuda a dete
correlación es estadísticame
0.05, esto indica que existe
indica que se rechaza la hip
Entonces, por lo menos 1 de
con nuestros ao y a1 hallado

COEFICIENTE DE CORRELACIÓN AJUSTADO


Coeficiente de correlación ajustado:
El R cuadrado ajustado (o coeficiente
ver el grado de intensidad o efectivid
dependiente. En este caso, como el c
n 21 independiente explica efectivamente
Coef de determinación R2 0.9245350316
Raj2 0.9205631911 El coeficiente de determinación:
Permitio evaluar la bondad del ajuste
encuentra entre valores de 0 y 1. En n
un buen ajuste y las predicciones son
Si nuestro (R2) fuese 1 todos los pun
permitiria tener la prediccion de Y sin
independiente explica efectivamente

El coeficiente de determinación:
Permitio evaluar la bondad del ajuste
encuentra entre valores de 0 y 1. En n
k=1 (1 variable dependiente) un buen ajuste y las predicciones son
Si nuestro (R2) fuese 1 todos los pun
permitiria tener la prediccion de Y sin
orrelación positiva muy fuerte.
ndo una de las concentraciones de fosforo
hace, casi en proporción constante.

los datos que se brindan, si se cambia el x por el y, son los mismos datos,
ma, solo está reflejada, por esto es que el coeficiente de correlación sale exactamente igual.
r el coeficiente de correlación es simétrica, por eso que cambiendo los datos x e y salen igual

Datos obtenidos usando "Análisis de datos" de excel

2 3 4
Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
6.28720547152476 6.28720547152476 232.772450103 4.081290057683E-12
0.513191762625056 0.02701009276974
6.80039723414981

Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%
0.144296183223511 -7.18697511546974 7.92469082E-07 -1.33906846053075 -0.7350376956 -1.339068460531
0.097657866715975 15.2568820570625 4.08129006E-12 1.28555429029122 1.6943548186 1.285554290291
Datos obtenidos usando mínimos cuadrados

(yi-a0-a1xi)2
2.00923743E-02 0.901072189317652 0.00438046 1.190271827 0.0200923743 0.536167036122
6.50334966E-02 0.382239250212253 0.22210460 0.762603398 0.0650334966 0.343520525883
6.09352587E-03 0.748099299217916 0.30850996 0.619158571 0.0060935259 0.27890470768
1.70778325E-02 0.597771691261299 0.45290148 0.412773847 0.0170778325 0.185937132071
2.30649465E-02 0.63098598594044 0.45290148 0.412773847 0.0230649465 0.185937132071
3.95412090E-03 0.100631706037553 0.71526945 0.144481187 0.0039541209 0.065082654035
2.04632531E-02 0.164170977362273 0.83324591 0.068712321 0.0204632531 0.030951989818
1.04344333E-01 0.061031934577283 1.01939895 0.005772552 0.1043443326 0.00260029007
5.20020712E-02 0.032964907465336 1.14185348 0.002160132 0.0520020712 0.000973047965
7.15871947E-03 0.000262278441766 1.16379046 0.004680503 0.0071587195 0.002108368463
3.70131510E-02 0.091544822667198 1.20555199 0.012138691 0.037013151 0.005467966132
6.29414478E-03 0.002575742844652 1.22546368 0.016922738 0.0062941448 0.007622976509
5.64401891E-02 0.000262278441766 1.31675269 0.049007523 0.0564401891 0.022075812989
4.21091693E-03 0.042293459438927 1.36592157 0.073194767 0.0042109169 0.032971142269
1.69872851E-06 0.081130967424892 1.38151459 0.081875147 1.6987285E-06 0.036881285582
6.46103579E-03 0.145729241822102 1.39674069 0.090820518 0.0064610358 0.040910796263
2.78522602E-02 0.042293459438927 1.46791996 0.138788809 0.0278522602 0.062518479485
4.90737116E-03 0.278649937367224 1.69330192 0.357515098 0.0049073712 0.161045407319
8.88187096E-03 0.687080228413699 1.83003561 0.539724358 0.008881871 0.243122960482
1.53600543E-02 0.841734623749116 1.88890154 0.629682369 0.0153600543 0.283645233692
2.64843965E-02 0.96787225270754 1.91644097 0.674147265 0.0264843965 0.303674785479
0.513192 6.800397234 23.00290 6.287205468 0.5131918 2.83211973
2
DETERMINACION DE LA SUMA DE CUADRADOS

SCE= 0.51

SCR= 6.29

STC= 6.80

4
DETERMINACION DE F y F crítico

Promedio de los cuadrados F F crítico


6.287205472
232.7724501 0.00E+00
0.02701009277
Suma de cuadrados:
La suma de cuadrados es la diferencia de los y calculados en la regresión, con el y promedio de los
datos, todo eso al cuadrado). Eso representa la desviación de la regresión respecto al promedio de
datos. La suma de cuadrados en la regresión representa el SCR lel cual tiene un valor de 6.29 y la
suma de cuadrados del residuo representa el SCE el cual tiene un valor de 0.51 y la suma toptal de
cuadrados es la suma del SCR y el SCE el cual es igual a 6.80 Los datos obtenidos por tabla y el
que obtuvimos por excel no difieren mucho, lo cual nos indica que el cálculo está correcto.

F calculado y F crítico:
El F mide el valor de probabilidad en la meidcion estadistica que hacemos. Se obtiene dividiendo el
promedio de la regresión con el promedio de los residuos.
El F crítico nos ayuda a determinar la significacia estadistica del problema. En nuestro caso, la
correlación es estadísticamente significativo, ya que nuestro valor se acerca a cero y es menor que
0.05, esto indica que existe una relación positiva significativa entre las variables (x y y). También nos
indica que se rechaza la hipotesis nula, que me indica que los coeficientes de regresión son 0.
Entonces, por lo menos 1 de los coeficientes de regresión son distintos de 0. Y esto se comprueba
con nuestros ao y a1 hallados de la regresión (son distintos de 0)

ente de correlación ajustado:


adrado ajustado (o coeficiente de determinación ajustado) se utiliza en la regresión múltiple para
grado de intensidad o efectividad que tienen las variables independientes en explicar la variable
diente. En este caso, como el coeficiente de correlación ajustado se acerca a 1, la variable
ndiente explica efectivamente la dependiente.

ciente de determinación:
o evaluar la bondad del ajuste, es decir si el modelo se ajusta bien o mal a los datos y este se
ntra entre valores de 0 y 1. En nuestro caso el (R 2) es muy cercano a 1 lo cual nos indica que es
n ajuste y las predicciones son muy fiables.
tro (R2) fuese 1 todos los puntos caerian en la línea de regresión, ya que al conocer X nos
tiria tener la prediccion de Y sin error alguno.
ndiente explica efectivamente la dependiente.

ciente de determinación:
o evaluar la bondad del ajuste, es decir si el modelo se ajusta bien o mal a los datos y este se
ntra entre valores de 0 y 1. En nuestro caso el (R 2) es muy cercano a 1 lo cual nos indica que es
n ajuste y las predicciones son muy fiables.
tro (R2) fuese 1 todos los puntos caerian en la línea de regresión, ya que al conocer X nos
tiria tener la prediccion de Y sin error alguno.
Superior 95.0%
-0.735037695638517
1.69435481856869
0.695072086245973
0.362363116563957
0.45678049034963
0.333388592945474
0.342525509418719
0.080928230606065
0.071284068485009
-0.012597647932172
-0.00566360628399
-0.000743625977994
0.022373287418149
0.004431120309727
-0.002406243925986
0.037342518235979
0.05470113690912
0.077213336424161
0.051421034375921
0.21183789241481
0.408711364193021
0.48862461466881
0.542142415526096
4.219730
Problema 1

Datos del problema Datos aplicando Log 10


Datos P(µg/L) Clα (µg/L) Log P Log Clα
1 5 1.4 0.698970 0.146128035678238
2 7 3 0.845098 0.477121254719662
3 8 1.7 0.903090 0.230448921378274
4 10 2.1 1.000000 0.322219294733919
5 10 2 1.000000 0.301029995663981
6 15 6 1.176091 0.778151250383644
7 18 4.9 1.255273 0.690196080028514
8 24 22 1.380211 1.34242268082221
9 29 8.2 1.462398 0.913813852383717
10 30 12 1.477121 1.07918124604762
11 32 25 1.505150 1.39794000867204
12 33 14 1.518514 1.14612803567824
13 38 12 1.579784 1.07918124604762
14 41 20 1.612784 1.30102999566398
15 42 24 1.623249 1.38021124171161
16 43 30 1.633468 1.47712125471966
17 48 20 1.681241 1.30102999566398
18 68 42 1.832509 1.6232492903979
19 84 84 1.924279 1.92427928606188
20 92 103 1.963788 2.01283722470517
21 96 120 1.982271 2.07918124604762

a) Coef. De correlación P vs Cl Este valor de correlación nos muestra una correlación positiva muy fuerte.
0.9368610002 Indica una dependencia alta entre las dos variables, cuando una de las concentraciones de fosforo
aumenta, la concentración de clorofila también lo hace, casi en proporción constante.

b) Coef. De correlación Cl vs P La curva de regresión se ajusta a los datos que se brindan, si se cambia el x
0.9368610002 por lo tanto la curva esta ajustada de la misma forma, solo está reflejada, por esto es que el
Hablando matemáticamente, la ecuación para hallar el coeficiente de correlación es simétrica

c) Resumen

Estadísticas de la regresión
Coef correlación 0.961527447119603
Coef determinación 0.924535031564342 *Este valor de correlación nos muestra una correlación positiva muy fuerte entre las variables.
R^2 ajustado 0.920563191120359 *Puede interpretarse como una corrección que realiza la regresión ajustada
Error típico 0.164347475702366 *Son los valores que se alejan de la recta estimada, o sea la desviación de las distancias de
Observaciones 21

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Regresión 1 6.28720547152476 6.28720547152476 232.772450103115
Residuos 19 0.513191762625056 0.02701009276974
Total 20 6.80039723414981

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -1.03705307808463 0.144296183223511 -7.18697511546974 7.92469082499871E-07
Log P 1.48995455442995 0.097657866715975 15.2568820570625 4.08129005768346E-12
*(El punto en y cuando x vale 0
*Aumenta 1.48995455442995 aproximadamente según nuestra regresión

Análisis de los residuales


Log Clα Pronóstico Log Clα
Observación Pronóstico Log Clα Residuos
2.5
1 0.004380463285742 0.141747572392496
2 0.222104595574435 0.255016659145227
3 0.3085099610941 -0.07806103971583
2
4 0.452901476345319 -0.1306821816114
5 0.452901476345319 -0.15187148068134
6 0.715269449770636 0.062881800613007
1.5
Log Clα

1
2

1.5
7 0.833245907944734 -0.14304982791622

Log Clα
8 1.01939894757899 0.323023733243212
9 1.14185347927416 -0.22803962689045
1
10 1.16379046283021 -0.08460921678259
11 1.20555198721326 0.192388021458783
12 1.2254636826018 -0.07933564692356
0.5
13 1.31675268670831 -0.23757144066069
14 1.36592157454604 -0.06489157888206
15 1.38151459511891 -0.0013033534073
0
16 1.39674068682383 0.08038056789583 0.6 0.8 1 1.2 1.4 1.6 1
17 1.46791996063857 -0.16688996497459 Log P
18 1.6933019224355 -0.0700526320376
19 1.83003560817849 0.094243677883396
20 1.88890153920298 0.123935685502193
21 1.91644097369815 0.162740272349475
correlación positiva muy fuerte.
uando una de las concentraciones de fosforo
lo hace, casi en proporción constante.

a a los datos que se brindan, si se cambia el x por el y, son los mismos datos,
orma, solo está reflejada, por esto es que el coeficiente de correlación sale exactamente igual.
llar el coeficiente de correlación es simétrica, por eso que cambiendo los datos x e y salen igual

va muy fuerte entre las variables.


za la regresión ajustada
mada, o sea la desviación de las distancias de los valores de la variable independiente y las estimaciones realizadas de la recta de la regresión

Valor crítico de F
4.08129005768347E-12 *Es menor a 0.05 (valor de significación establecido) Se rechaza la hipotesis nula, que me indica que los coeficiente

Inferior 95% Superior 95%


-1.33906846053075 -0.7350376956385
1.28555429029122 1.6943548185687
*A un intervalo de confianza del 95%, ese es el intervalo que va a variar nuestra estimación de las concentraciones.

Log Clα Pronóstico Log Clα


1.2 1.4 1.6 1.8 2 2.2

Log P
e indica que los coeficientes de regresión son 0. Entonces, por lo menos 1 de los coeficientes de regresión son distintos de 0.

También podría gustarte