Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.
2.
3.
4.
30
32
34
36
38 Edad
40
42
44
46
48
3. Descripciones numricas
Se necesita una medida numrica que complemente al grfico y que, independientemente de las dimensiones de los valores de las variables, nos informe sobre la fuerza de la relacin existente. Una medida es el Coeficiente de correlacin
Ejemplos reales
Situacin 1
95 90 85 80 75 150 160 170 180 Temperatura
95 90 85 80 75 150 160 170 Temperatura 180
Situacin 2
95 90 85 80 75 150
Situacin 3
180
r = 0,983
p-value: 0,000
r = 0,887
p-value: 0,000
r = 0,230
p-value: 0,108
Un valor de r distinto de 0 no implica relacin lineal Es necesario que sea significativamente distinto de cero
200
100
0 0 10 20 30
400 Tiempo
350
300
250 30 32 34 36 38 40 Edad 42 44 46 48
y=y+
r sy sx
(x x)
xi X
b1 =
r sy sx
b1 1 b0 x
ei = yi yi
ei
R-Sq = 78,6 %
R-Sq(adj) = 78,2 %
Rendi2
85
Regression
75
95% CI 95% PI
150 160 170 180
Temperatura
Regresin no lineal
La relacin entre x e y no tiene porqu ser lineal. Los softwares informticos ajustan los datos a curvas no lineales (exponenciales, parablicas, etc.) y calculan el valor de r2 para medir la fuerza de esa relacin.
Fitted Line Plot
Tiempo = - 1550 + 95,80 Edad - 1,193 Edad**2 450
S R-Sq R-Sq(adj) 38,3533 37,1% 35,0%
400 Tiempo
350
300
250 30 32 34 36 38 40 Edad 42 44 46 48
Regresin mltiple
La regresin mltiple expresa el valor de la variable dependiente Y, como funcin de las variables independientes X1, X2, ...,Xk La ms simple es la regresin lineal y el modelo al que se debieran ajustar los datos es:
Yi = + 1 X 1i + 2 X 2i + ... + + k X ki + i
Regresin mltiple
Comprobar si el rendimiento de un proceso qumico depende, adems de la temperatura de la presin a la que se realiza.
R-Sq = 90,8%
R-Sq(adj) = 89,9%
R =r
(y = 1 (y
i i
yi ) 2 yi ) 2
El r2 proporciona, al igual que en el caso simple, una medida de la fuerza de la relacin entre Y y sus predicciones, a partir del modelo de regresin propuesto (plano de regresin) Se pueden definir tambin, coeficientes de correlacin parciales, rYXi , miden la relacin entre Y y Xi eliminando los efectos del resto de Xj
Tambin al igual que en el caso simple, ser necesaria la comprobacin de la adecuidad del modelo con el anlisis y estudio de sus residuos: stos deben de ser normales, centrados en 0 y con variabilidad constante.
Percent
450
90 50 10 1 0,1
400 Tiempo
-100
0 Residual
100
-100
320
380
350
Frequency
300
30
32
34
36
38 40 Edad
42
44
46
48
1 5 10 15 20 25 30 35 40 45 50 55 60 65 Observation Order
90 50 10 1 0,1
400 Tiempo
-100
-50
0 Residual
50
100
280
300
360
350
16 Frequency
300
12 8 4 0
250 30 32 34 36 38 40 Edad 42 44 46 48
-40
-20
20 40 Residual
60
80
100
1 5 10 15 20 25 30 35 40 45 50 55 60 65 Observation Order
Para la Regresin Mltiple, existen varias opciones: Stat/Regression/Regression Stat/Regression/Best Subsets Stat/Regression/Stepwise
Cuidado!!
R-Sq = 80,4%
R-Sq(adj) = 77,2%
Analysis of Variance Source Regression Residual Error Total DF 9 55 64 SS 116566 28339 144905 MS 12952 515 F 25,14
Linealidad significativa
Unusual Observations Obs Edad Tiempo 19 36,0 408,00 32 37,0 407,00 36 37,0 325,00
Tiempo
360 300 48
Edad
40 32 80
Peso
70 60 5,0
Experiencia
2,5 0,0 90
EnCarrera
60 30 450
EnBici
300 150 20
EnNatacin
10 0 70
CoCarrera
60 50 70
CoBici
60 50
CoNatacin
Experien -0,436 EnCarrer -0,469 EnBici -0,492 EnNataci -0,430 CoCarrer -0,695 CoBici -0,647 CoNataci -0,596
0,254 -0,090 -0,091 0,132 -0,506 -0,474 -0,340 0,349 0,137 -0,005 0,183 0,146 0,134 0,792 0,479 0,255 0,376 0,478 0,691 0,147 0,323 0,415 0,160 0,090 0,380 0,695 0,548 0,652
Step Constant CoCarrer T-Value P-Value EnBici T-Value P-Value Experien T-Value P-Value Edad T-Value P-Value EnCarrer T-Value P-Value S R-Sq R-Sq(adj) C-p
3 704,1 -4,82 -8,37 0,000 -0,187 -5,24 0,000 -10,7 -3,94 0,000
4 532,8 -3,96 -6,81 0,000 -0,128 -3,51 0,001 -16,9 -5,56 0,000 3,03 3,56 0,001
5 516,1 -4,09 -7,45 0,000 -0,242 -4,69 0,000 -20,8 -6,61 0,000 3,53 4,32 0,000 0,80 2,96 0,004
Response is Tiempo E E x n E C n o C o
p C E N C C N e a n a a o a E P r r B t r B t d e i r i a r i a a s e e c c e c c Vars 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 R-Sq 48,3 41,8 63,8 58,8 71,3 71,2 76,2 75,1 79,3 76,9 79,5 79,5 80,1 79,7 80,4 80,1 80,4 R-Sq(adj) 47,5 40,9 62,6 57,4 69,9 69,7 74,6 73,5 77,5 75,0 77,4 77,3 77,6 77,2 77,6 77,3 77,2 C-p 84,4 102,6 42,8 57,0 23,8 24,1 12,0 14,9 5,3 11,9 6,7 6,8 7,0 8,1 8,2 8,9 10,0 S 34,482 36,578 29,081 31,050 26,117 26,177 23,987 24,500 22,573 23,801 22,631 22,651 22,506 22,721 22,535 22,687 22,699 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X d o n r i i r i i X X
X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X
R-Sq = 79,3%
R-Sq(adj) = 77,5%
Analysis of Variance Source Regression Residual Error Total DF 5 59 64 SS 114844 30062 144905 MS 22969 510 F 45,08 P 0,000
The regression equation is Tiempo = 521 + 3,39 Edad - 20,6 Experiencia + 0,758 EnCarrera - 0,215 EnBici - 4,07 CoCarrera - 0,582 EnNatacin Predictor Constant Edad Experien EnCarrer EnBici CoCarrer EnNataci S = 22,65 Coef 520,92 3,3875 -20,612 0,7583 -0,21535 -4,0746 -0,5823 SE Coef 55,06 0,8434 3,157 0,2742 0,06217 0,5512 0,7581 T 9,46 4,02 -6,53 2,77 -3,46 -7,39 -0,77 P 0,000 0,000 0,000 0,008 0,001 0,000 0,446
R-Sq = 79,5%
R-Sq(adj) = 77,3%
R-Sq = 76,2%
R-Sq(adj) = 74,6%
Analysis of Variance Source Regression Residual Error Total DF 4 60 64 SS 110381 34524 144905 MS 27595 575 F 47,96 P 0,000
50 10 1 0,1
Residual
-40 0 Residual 40 80
Percent
90
-80
Frequency
Residual
-40 -20 0 20 Residual 40 60
9 6 3 0