Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EJEMPLOS DE ANLISIS DE
VARIANZA, CORRELACIN Y
REGRESIN.
CON EL USO PRCTICO DEL PAQUETE SAS
28
Variable Dependiente: Y
Suma de
Cuadrados
1908.209643
1370.677143
3278.886786
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
24
27
R-Cuadrada
0.581969
Raz CME
7.557218
Coef. Var.
26.97974
Fuente de Variacin
T
GL
3
Cuadrado Medio
636.069881
57.111548
F Value
11.14
Pr > F
<.0001
Cuadrado Medio
636.069881
F Value
11.14
Pr > F
<.0001
Y Media
28.01071
Anova SC
1908.209643
Esto ya es el ANAVA o ANOVA en ingles que nos dice que la H 0 (hiptesis nula) que todos los tratamientos
tienen el mismo efecto y la Ha (hiptesis alternativa) que por lo menos un tratamiento es diferente de los
dems, rechazndose la hiptesis nula cuando el P value (Pr) es menor que el alfa al que se tenga planteado
probar el experimento, en este caso se rechaza H 0 diciendo entonces que al menos un tratamiento tiene un
efecto diferente es decir que al menos una dosis de nitrgeno produce un rendimiento diferente a las dems.
En este diseo el modelo tiene el mismo valor que la fuente de variacin, ya que es la nica fuente de variacin
dentro del modelo.
Nmero de observaciones
1 2 3
16
El Procedimiento GLM
Variable Dependiente: Y
Suma de
Cuadrados
31.15333333
10.03666667
41.19000000
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
13
15
R-Cuadrada
0.756332
Raz CME
0.878664
Coef. Var.
18.02389
Cuadrado Medio
15.57666667
0.77205128
F Value
20.18
Pr > F
0.0001
Y Media
4.875000
Fuente de Variacin
T
GL
2
SC Tipo I
31.15333333
Cuadrado Medio
15.57666667
F Value
20.18
Pr > F
0.0001
Fuente de variacin
T
GL
2
SC Tipo III
31.15333333
Cuadrado Medio
15.57666667
F Value
20.18
Pr > F
0.0001
En este anlisis por estar desbalanceado primero hace una regresin lineal, y despus el ANAVA.
Teniendo para este caso ya con los valores corregidos que al menos uno de los tratamientos producen efecto
diferente es decir que por lo menos en uno de los tratamientos el hipoctilo de frijol creci de manera diferente
a los otros, considerando un alfa del 0.05.
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.934375
Raz CME
1.143168
Coef. Var.
22.53288
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
24.8091111
1.3068333
F Value
18.98
Pr > F
0.0002
F Value
7.14
24.91
Pr > F
0.0166
0.0001
Y Media
5.073333
Anova SC
18.6653333
130.1893333
Cuadrado Medio
9.3326667
32.5473333
Tenemos en este ejemplo que del modelo se desprenden 2 fuentes de variacin los tratamientos y los bloques
y que en este caso ambos tienen diferencias significativas. Solo que en bloques es un poco ms fuertes, pero
en ambos casos se concluye que al menos una variedad es diferente a las dems en cuanto a su rendimiento
y que estas en conjunto en los bloques presentan tambin diferencias significativas es decir se comportan
diferente en cada bloque.
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
12
12
24
R-Cuadrada
0.910314
Raz CME
74.99382
Coef. Var.
8.539103
Fuentes de Variacin
C
H
T
GL
4
4
4
Cuadrado Medio
57084.6400
5624.0733
F Value
10.15
Pr > F
0.0002
F Value
0.46
18.94
11.06
Pr > F
0.7667
<.0001
0.0005
Y Media
878.2400
Anova SC
10252.5600
426061.7600
248701.3600
Cuadrado Medio
2563.1400
106515.4400
62175.3400
En este Diseo experimental se tienen el mismo nmero de Tratamientos, de Columnas y de Hileras, es una
caracterstica del diseo, y en este caso se concluye que la fertilidad en este caso no tiene reaccin con el
rendimiento, pero la humedad, si causa un efecto diferente entre hileras, adems de que las variedades tienen
diferencias significativas entre ellas con un alfa de 0.05.
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.797821
Raz CME
0.363433
Coef. Var.
5.328274
Fuentes de Variacin
TRA
BLO
TRA*BLO
GL
3
2
6
Cuadrado Medio
0.56859848
0.13208333
F Value
4.30
Pr > F
0.0092
F Value
10.53
0.54
2.45
Pr > F
0.0011
0.5949
0.0881
Y Media
6.820833
Anova SC
4.17125000
0.14333333
1.94000000
Cuadrado Medio
1.39041667
0.07166667
0.32333333
En este caso segn este anlisis podemos interpretar que el gradiente de humedad existente en el
experimento no presenta diferencias significativas en cuanto a rendimiento por corte, mientras que los
tratamientos con aplicaciones foliares de fertilizantes si presentan una diferencia significativa, adems se
concluye como no se rechaz H0 de la interaccin, que no existe interaccin por lo que se hubiera podido
ocupar el diseo bloques al azar pero como no se saba, estuvo bien ocupado el modelo.
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
R-Cuadrada
0.875466
Raz CME
5.034878
Coef. Var.
3.165595
Fuentes de Variacin
A
B
A*B
GL
1
1
1
Cuadrado Medio
950.450000
25.350000
F Value
37.49
Pr > F
<.0001
F Value
103.43
8.33
0.71
Pr > F
<.0001
0.0107
0.4112
F Value
37.49
Pr > F
<.0001
Y Media
159.0500
Anova SC
2622.050000
211.250000
18.050000
Cuadrado Medio
2622.050000
211.250000
18.050000
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
TRA
4
1 2 3 4
Number of observations
20
The ANOVA Procedure
Variable Dependiente: Y
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
Suma de
Cuadrados
2851.350000
405.600000
3256.950000
Cuadrado Medio
950.450000
25.350000
R-Cuadrada
0.875466
Coef. Var.
3.165595
Fuentes de Variacin
TRA
Raz CME
5.034878
GL
3
Y Media
159.0500
Anova SC
2851.350000
Cuadrado Medio
950.450000
F Value
37.49
Pr > F
<.0001
En este caso podemos concluir que las dosis de nitrgeno influye significativamente en el rendimiento de
forraje en el cultivo de alfalfa, de igual manera las dosis de fsforo tambin influye de una manera significativa
en el rendimiento de forraje, pero no existe interaccin entre las dosis de nitrgeno y fsforo, es decir que
ambas dosis siguen la misma tendencia en las repeticiones, adems en esta prueba es necesario decir que
existe una diferencia significativa entre las combinaciones de dosis de nitrgeno y de fsforo.
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
15
44
59
R-Cuadrada
0.898560
Raz CME
0.744215
Coef. Var.
14.23881
Fuentes de Variacin
BLO
V
N
V*N
GL
4
3
2
6
Cuadrado Medio
14.3911778
0.5538561
F Value
25.98
Pr > F
<.0001
F Value
1.29
58.18
101.03
1.33
Pr > F
0.2878
<.0001
<.0001
0.2638
Y Media
5.226667
Anova SC
2.8623333
96.6733333
111.9083333
4.4236667
Cuadrado Medio
0.7155833
32.2244444
55.9541667
0.7372778
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
COVN
12
V1N1 V1N2 V1N3 V2N1 V2N2 V2N3 V3N1 V3N2 V3N3 V4N1 V4N2 V4N3
Nmero de observaciones
60
Variable Dependiente: Y
Suma de
Cuadrados
215.8676667
24.3696667
240.2373333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
15
44
59
R-Cuadrada
0.898560
Raz CME
0.744215
Coef. Var.
14.23881
Fuentes de Variacin
BLO
COVN
GL
4
11
Cuadrado Medio
14.3911778
0.5538561
F Value
25.98
Pr > F
<.0001
F Value
1.29
34.96
Pr > F
0.2878
<.0001
Y Media
5.226667
Anova SC
2.8623333
213.0053333
Cuadrado Medio
0.7155833
19.3641212
En este ejemplo podemos interpretar por estos datos que la influencia de los bloques es no significativa,
mientras que tanto las variedades de maz y las diferentes dosis de nitrgeno tienen diferencias significativas
entre ellos, y que no existe interaccin entre variedades y dosis de nitrgeno, es decir que tienen la misma
tendencia entre bloques y entre ellos mismos, as tambin podemos observar que existe diferencias
significativas entre las diferentes combinaciones de variedades por dosis de nitrgeno, lo que nos indica de
que al menos una combinacin es diferente a las dems.
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
V
H
V*H
F
V*F
H*F
V*H*F
GL
1
2
2
1
1
2
2
Cuadrado Medio
3.37500000
0.54166667
F Value
6.23
Pr > F
0.0019
F Value
13.00
24.92
0.31
0.08
0.08
2.15
0.31
Pr > F
0.0036
<.0001
0.7408
0.7862
0.7862
0.1588
0.7408
Y Media
13.62500
Anova SC
7.04166667
27.00000000
0.33333333
0.04166667
0.04166667
2.33333333
0.33333333
Cuadrado Medio
7.04166667
13.50000000
0.16666667
0.04166667
0.04166667
1.16666667
0.16666667
10
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVH
6
V1H1 V1H2 V1H3 V2H1 V2H2 V2H3
F
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMVH
F
COMVH*F
GL
5
1
5
Cuadrado Medio
3.37500000
0.54166667
F Value
6.23
Pr > F
0.0019
F Value
12.69
0.08
1.00
Pr > F
0.0002
0.7862
0.4582
F Value
6.23
Pr > F
0.0019
F Value
4.38
24.92
0.92
Pr > F
0.0265
<.0001
0.5119
F Value
6.23
Pr > F
0.0019
F Value
10.85
13.00
0.26
Pr > F
0.0004
0.0036
0.9256
Y Media
13.62500
Anova SC
34.37500000
0.04166667
2.70833333
Cuadrado Medio
6.87500000
0.04166667
0.54166667
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVF
4
V1F1 V1F2 V2F1 V2F2
H
3
1 2 3
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMVF
H
COMVF*H
GL
3
2
6
Cuadrado Medio
3.37500000
0.54166667
Y Media
13.62500
Anova SC
7.12500000
27.00000000
3.00000000
Cuadrado Medio
2.37500000
13.50000000
0.50000000
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMHF
6
H1F1 H1F2 H2F1 H2F2 H3F1 H3F2
V
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMHF
V
COMHF*V
GL
5
1
5
Cuadrado Medio
3.37500000
0.54166667
Y Media
13.62500
Anova SC
29.37500000
7.04166667
0.70833333
Cuadrado Medio
5.87500000
7.04166667
0.14166667
11
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVHF
12 V1H1F1 V1H1F2 V1H2F1 V1H2F2 V1H3F1 V1H3F2 V2H1F1 V2H1F2 V2H2F1 V2H2F2 V2H3F1
V2H3F2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
30.79166667
12.83333333
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.705826
Raz CME
1.034139
Coef. Var.
7.590014
Fuentes de Variacin
COMVHF
GL
11
Cuadrado Medio
2.79924242
1.06944444
F Value
2.62
Pr > F
0.0564
F Value
2.62
Pr > F
0.0564
Y Media
13.62500
Anova SC
30.79166667
Cuadrado Medio
2.79924242
En este caso tenemos de que del primer anlisis de varianza se concluye que V y H si tienen diferencias
significativas lo que quiere decir que al menos uno de sus efectos es diferente a los dems, mientras que F
resulta que todos los tratamientos de fertilizantes foliares, todos causan el mismo efecto, y tambin se puede
interpretar de que no existen interacciones en este experimento, puesto que todas se rechazan, en cuanto a
las combinaciones se puede decir que la combinacin VH sali con diferencias significativas lo que quiere
decir que no todas las combinaciones VH producen el mismo efecto, las combinaciones VF tambin salieron
con diferencias significativas lo que quiere decir de que no todas las combinaciones producen el mismo efecto,
al igual que las combinaciones HF con diferencias significativas, mientras que las combinaciones VHF es
decir la combinacin de los tres factores no presenta diferencias significativas.
12
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Cuadrado Medio
1848.14815
364.28571
F Value
5.07
Pr > F
0.0036
Y Media
148.3333
13
Fuentes de Variacin
BLO
N
P
N*P
K
N*K
P*K
N*P*K
GL
2
1
1
1
1
1
1
1
Anova SC
1033.33333
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667
Cuadrado Medio
516.66667
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667
F Value
1.42
2.24
35.87
0.05
2.24
1.65
0.05
0.73
Pr > F
0.2749
0.1565
<.0001
0.8337
0.1565
0.2202
0.8337
0.4066
F Value
5.07
Pr > F
0.0036
F Value
1.42
12.72
2.24
0.81
Pr > F
0.2749
0.0003
0.1565
0.5101
F Value
5.07
Pr > F
0.0036
F Value
1.42
2.04
35.87
0.27
Pr > F
0.2749
0.1540
<.0001
0.8428
F Value
5.07
Pr > F
0.0036
F Value
1.42
12.72
2.24
0.81
Pr > F
0.2749
0.0003
0.1565
0.5101
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
CONP
4
N1P1 N1P2 N2P1 N2P2
K
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
CONP
K
CONP*K
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
13900.00000
816.66667
883.33333
Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
CONK
4
N1K1 N1K2 N2K1 N2K2
P
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
CONK
P
CONK*P
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
2233.33333
13066.66667
300.00000
Cuadrado Medio
516.66667
744.44444
13066.66667
100.00000
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
COPK
4
P1K1 P1K2 P2K1 P2K2
N
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
COPK
N
COPK*N
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
13900.00000
816.66667
883.33333
Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444
14
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
CONPK
8
N1P1K1 N1P1K2 N1P2K1 N1P2K2 N2P1K1 N2P1K2 N2P2K1 N2P2K2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
15600.00000
6133.33333
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
7
16
23
R-Cuadrada
0.717791
Raz CME
19.57890
Coef. Var.
13.19926
Fuentes de Variacin
CONPK
GL
7
Cuadrado Medio
2228.57143
383.33333
F Value
5.81
Pr > F
0.0017
F Value
5.81
Pr > F
0.0017
Y Media
148.3333
Anova SC
15600.00000
Cuadrado Medio
2228.57143
En el ANAVA de este experimento podemos interpretar que en los elementos solos, solamente el P es el que
presenta diferencias significativas es decir por lo menos un tratamiento se comporta de manera diferente a
los dems en cuanto a rendimiento de berenjena mientras que N y K no presentaron diferencias significativas
dentro del rendimiento de esta hortaliza, en cuanto a las interacciones, podemos decir que todas presentan
la misma tendencia dentro de las dems es decir no existe interaccin, en cuanto a las combinaciones
podemos mencionar que la combinacin NP tiene diferencias significativas, al igual que la PK es decir que al
menos una combinacin causa un efecto diferente de las otras combinaciones, mientras que la combinacin
NK no presenta dichas diferencias por lo que todas las combinaciones producen el mismo efecto en el
rendimiento de este cultivo; mientras que la combinacin de los tres elementos tambin presenta diferencias
significativas es decir al menos una combinacin causa un efecto diferente que a las dems combinaciones.
15
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
6
17
R-Cuadrada
0.928623
Raz CME
1.418724
Coef. Var.
9.539422
Fuentes de Variacin
L
R(L)
N
L*N
GL
2
3
2
4
Cuadrado Medio
14.2835859
2.0127778
F Value
7.10
Pr > F
0.0127
F Value
9.20
1.39
18.95
4.40
Pr > F
0.0149
0.3331
0.0026
0.0533
Y Media
14.87222
Anova SC
37.03444444
8.40833333
76.28111111
35.39555556
Cuadrado Medio
18.51722222
2.80277778
38.14055556
8.84888889
GL
2
Anova SC
37.03444444
Cuadrado Medio
18.51722222
F Value
6.61
Pr > F
0.0796
En este ejemplo podemos observar que el factor L es decir lnea de maz es significativo, pero no est bien
probado con el error dado por SAS por lo que se tiene que pedir que se pruebe contra otro error al cual le
llamaremos error tipo a por lo que en este ejemplo podemos concluir de que L ya probado con el error tipo a
no es significativo y N probado con el error de SAS el cual si est bien probado es significativo es decir no
16
todas las dosis de nitrgeno causan el mismo efecto en cuanto al rendimiento de las lneas de maz, y no
existe interaccin lo que quiere decir que todas las dosis de N siguen la misma tendencia en cada lnea de
maz.
17
N;
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
18
PROC PRINT;
PROC ANOVA;
CLASS BLO V N;
MODEL Y=BLO V N BLO*V V*N;
TEST H=BLO V E=BLO*V;
RUN;
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
23
36
59
R-Cuadrada
0.696250
Raz CME
14.51674
Coef. Var.
16.58962
Fuentes de Variacin
BLO
V
N
BLO*V
V*N
GL
3
2
4
6
8
Cuadrado Medio
756.07124
210.73583
F Value
3.59
Pr > F
0.0003
F Value
2.97
21.11
3.37
1.14
1.38
Pr > F
0.0446
<.0001
0.0193
0.3570
0.2378
Y Media
87.50500
Anova SC
1877.784500
8896.693000
2839.224333
1447.423000
2328.513667
Cuadrado Medio
625.928167
4448.346500
709.806083
241.237167
291.064208
GL
3
2
Anova SC
1877.784500
8896.693000
Cuadrado Medio
625.928167
4448.346500
F Value
2.59
18.44
Pr > F
0.1478
0.0027
En este ejemplo podemos interpretar lo siguiente: que en lo que se refiere a bloques, todos los bloques causan
el mismo efecto en cuanto al rendimiento, mientras que variedades y dosis de N si presentas diferencias
significativas, pero las dosis de N presentan la misma tendencia en cada Variedad. Por lo que podemos decir
que ni existe interaccin entre variedades y dosis de N.
19
20
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
8
16
24
R-Cuadrada
0.764091
Raz CME
3.408079
Coef. Var.
8.045511
Fuentes de Variacin
BLO
V
GL
4
4
Cuadrado Medio
75.2400000
11.6150000
F Value
6.48
Pr > F
0.0008
F Value
10.50
2.46
Pr > F
0.0002
0.0877
F Value
2.47
Pr > F
0.0589
F Value
3.13
1.81
Pr > F
0.0445
0.1757
F Value
3.47
Pr > F
0.0012
F Value
7.40
1.54
2.33
4.51
Pr > F
0.0105
0.2151
0.0771
0.0010
Y Media
42.36000
Anova SC
487.7600000
114.1600000
Cuadrado Medio
121.9400000
28.5400000
Localidad 2
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
5
1 2 3 4 5
Nmero de observaciones
25
Variable Dependiente: Y
Suma de
Cuadrados
993.280000
804.560000
1797.840000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
8
16
24
R-Cuadrada
0.552485
Raz CME
7.091192
Coef. Var.
18.62183
Fuentes de Variacin
BLO
V
General del experimento
GL
4
4
Cuadrado Medio
124.160000
50.285000
Y Media
38.08000
Anova SC
628.6400000
364.6400000
Cuadrado Medio
157.1600000
91.1600000
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
L
2
1 2
V
5
1 2 3 4 5
Nmero de observaciones
50
Variable Dependiente: Y
Suma de
Cuadrados
1824.180000
990.400000
2814.580000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
17
32
49
R-Cuadrada
0.648118
Raz CME
5.563272
Coef. Var.
13.83210
Fuentes de Variacin
L
V
L*V
BLO(L)
GL
1
4
4
8
Cuadrado Medio
107.304706
30.950000
Y Media
40.22000
Anova SC
228.980000
190.280000
288.520000
1116.400000
Cuadrado Medio
228.980000
47.570000
72.130000
139.550000
En este tipo de experimentos primero se evala como un simple bloques al azar por cada localidad, y despus
se evala junto, por lo que podemos decir que en la localidad 1 solo existen diferencias significativas en cuanto
a los bloques, no en cuanto a las variedades de trigo, de igual manera se presenta la localidad 2 es decir
solamente los bloque presentan diferencias significativas, no variedades, en cuanto al general podemos decir
que localidades si presenta diferencias significativas, es decir son diferentes, as tambin son significativos
21
los bloques anidados en localidades, lo que pudimos ver al correr los datos por localidad. Tanto las variedades
como la interaccin localidades por variedades, no son significativos, estamos tomando en cuenta que es un
modelo fijo por lo que todas las hiptesis se prueban con el error experimental.
22
23
Nivel
Valor
BLO
1 2 3 4 5
1 2
1 2 3 4 5
Nmero de observaciones
50
Variable Dependiente: Y
Suma de
Fuentes de Variacin
GL
Cuadrados
Modelo
17
1824.180000
107.304706
Error
32
990.400000
30.950000
Total Corregido
49
2814.580000
R-Cuadrada
Coef. Var.
Raz CME
Y Media
13.83210
5.563272
40.22000
0.648118
Fuentes de Variacin
GL
Anova SC
Cuadrado Medio
F Value
3.47
Pr > F
0.0012
Cuadrado Medio
F Value
Pr > F
228.980000
228.980000
7.40
0.0105
190.280000
47.570000
1.54
0.2151
L*V
288.520000
72.130000
2.33
0.0771
BLO(L)
1116.400000
139.550000
4.51
0.0010
GL
Anova SC
190.2800000
Cuadrado Medio
F Value
Pr > F
47.5700000
0.66
0.6517
En este caso aunque se prob a la F. V. Variedades, con la interaccin L*V no es significativa pero tambin
hay que decir que el termino Lugares no tiene termino para probarlo por lo que se dice que No Existe Prueba
Exacta (NEPE)., y solo estn bien probados con el Error Experimental de SAS L*V y BLO(L) y de estas
solamente bloques anidados en lugares tiene diferencias significativas, con un alfa igual a 0.05 es decir con
el 5% de probabilidad de equivocarnos
24
25
Fuente de Variacin
L
V
L*V
BLO(L)
Error
MIVQUE(0) Matriz de SC
L
V
625.00000
2.7719E-30
2.7719E-30
400.00000
125.00000
200.00000
125.00000
9.3459E-31
25.00000
40.00000
L*V
125.00000
200.00000
225.00000
25.00000
45.00000
Fuente de Variacin
L
V
L*V
BLO(L)
Error
MIVQUE(0) Matriz de SC
BLO(L)
Error
125.00000
25.00000
9.3459E-31
40.00000
25.00000
45.00000
225.00000
45.00000
45.00000
49.00000
Y
5724.5
1902.8
3538.9
6726.9
2814.6
Y
1.93000
-2.45600
8.23600
21.72000
30.95000
En este caso en especial tenemos que la varianza estimada de V es negativa por lo que hay que checar los
datos porque probablemente exista un error en la toma o en la trascripcin, si no diramos que los datos no
son confiables y por lo tanto no se deben utilizar para realizar algn anlisis estadstico.
26
27
2
4
1
1
2
5
1
3
2
7
1
1
2
6
1
7
2
6
1
1
2
2
1
1
2
1
1
4
2
5
1
2
2
2
1
2
2
1
1
4
2
3
1
6
2
5
1
5
2
1
1
7
2
5
1
7
2
2
1
5
2
5
1
5
2
3
1
4
2
4
1
3
2
4
1
3
2
2
;
proc print;
proc lattice;
run;
30
31
31
32
32
33
33
34
34
35
35
36
36
37
37
38
38
39
39
40
40
41
41
42
42
43
43
44
44
45
45
46
46
47
47
48
48
49
49
2883
3002
3199
2712
3295
2806
2053
3020
2275
3286
4033
3056
3182
2815
3089
3119
3130
2780
2254
1902
2662
3354
3280
3506
3949
3102
3250
3541
3772
1878
1692
3081
3237
2476
2506
1944
2864
2381
2456
GL
1
12
12
48
36
48
97
Suma de
Cuadrados
19461
2899741
2899741
21493124
5825300
8725041
30237625
Cuadrado
Medio
19461
241645
241645
447773
161814
181772
311728
SAS solamente da algunos resultados para la operacin ltice pero los datos restantes hay que hacerlos a
mano, como lo son las Fc para ver si se rechaza o no la H0 para realizarlo se utilizan los datos ya antes
obtenidos por SAS por lo que para conseguir la Fc se divide el cuadro medio de tratamientos entre el cuadrado
medio del error efectivo y para la Ft se obtiene Buscando a F con los grados de libertad de tratamientos en el
numerador y los grados de libertad del error intrabloque y un en este caso 0.05.
Quedando que la Fc= 447773/181772= 2.46 y tenemos una F t= 4.69 tomando en cuenta que en las tablas
tenemos solamente 40 grados de libertad en lugar de 48 y 36 puesto que no existen tablas con estos valores,
28
lo que obtenemos es que no se rechaza H0 por lo que no existe diferencia entre tratamientos, pero como la
eficiencia relativa es menor al 110% no podemos realizar el anlisis en bloque al azar donde grupos
(repeticiones) es bloque, por lo que tenemos que dejar de esta manera el anlisis estadstico.
29
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
8
11
R-Cuadrada
0.652001
Raz CME
1.405451
Coef. Var.
6.262686
Cuadrado Medio
9.86894129
1.97529285
F Value
5.00
Pr > F
0.0306
Y Media
22.44167
Fuentes de Variacin
T
X
GL
2
1
SC Tipo I
24.82666667
4.78015720
Cuadrado Medio
12.41333333
4.78015720
F Value
6.28
2.42
Pr > F
0.0229
0.1584
Fuentes de Variacin
T
X
GL
2
1
SC Tipo III
22.26403038
4.78015720
Cuadrado Medio
11.13201519
4.78015720
F Value
5.64
2.42
Pr > F
0.0297
0.1584
Procedimiento GLM
Cuadrado Medio Mnimo
T
Y LSMEAN
1
23.9652342
2
22.7118169
3
20.6479489
Para este caso en especial, se concluye de que tratamientos tiene diferencias significativas tanto en los datos
normales como en los datos ajustados, pero la covariable no tiene influencia en la variable respuesta, si lo
hubiera se toma la Pr > F de los datos ajustados, si no como es este caso se toma de los datos originales.
30
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
6
5
11
R-Cuadrada
0.977595
Raz CME
0.451089
Coef. Var.
3.625628
Cuadrado Medio
7.39862707
0.20348085
F Value
36.36
Pr > F
0.0006
Y Media
12.44167
Fuentes de Variacin
BLO
TRA
X
GL
3
2
1
SC Tipo I
19.39583333
24.82666667
0.16926243
Cuadrado Medio
6.46527778
12.41333333
0.16926243
F Value
31.77
61.00
0.83
Pr > F
0.0011
0.0003
0.4036
Fuentes de Variacin
BLO
TRA
X
GL
3
2
1
SC Tipo III
14.49515300
24.77225276
0.16926243
Cuadrado Medio
4.83171767
12.38612638
0.16926243
F Value
23.75
60.87
0.83
Pr > F
0.0022
0.0003
0.4036
Procedimiento GLM
Cuadrado Medio Mnimo
TRA
Y LSMEAN
1
13.8486418
2
13.0490879
3
10.4272703
En este anlisis podemos concluir que tanto los bloques como los tratamientos son significativamente
diferentes pero la covariable no es significativa, esto es tanto en los valores normales como en los valores
ajustados, esto quiere decir que tanto los tratamientos de paclobutrazol como los bloque que son por la
humedad en el suelo, son significativos, no as el dimetro del tronco.
31
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
En este caso en particular podemos decir que el mejor tratamiento es el nmero 1, seguido del nmero 2 pero
sin superar al nmero 3 y que el cuatro sin ser superado por el tres es el peor tratamiento, este es
considerando un 5% de error es decir con esa probabilidad de equivocarnos en la comparacin
32
Procedimiento ANOVA
Prueba t (LSD) para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Valor Crtico de t
2.79694
Diferencia Mnima Significativa
11.298
Medias con la misma letra no tienen diferencias significativas.
Groupo t
A
B
A
B
B
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
Este es el mismo experimento pero solamente que ahora se le da un valor de alfa diferente, es decir que en
este ejemplo tenemos la probabilidad de equivocarnos del 1% en lugar del anterior que es del 5% por lo que
podemos decir que el tratamiento 1 es el mejor pero sin superar estadsticamente al tratamiento 2, mientras
que los tratamientos 2, 3 y 4 no presentan diferencias estadsticas.
33
Medias
5.9600
5.7600
3.5000
N
5
5
5
T
1
2
3
Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.05
Grados de libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor Critico del Rango Studentizado 4.88575
Diferencia Mnima Significativa
3.2246
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
A
B
B
Medias
8.0667
7.8000
6.2667
2.5333
0.7000
N
3
3
3
3
3
B
1
2
4
3
5
En este ejemplo por ser bloques al azar podemos observar de que existe una prueba para tratamientos y otra
para bloques, en el primero nos menciona que con una probabilidad de error tipo I de un 5% tenemos que el
tratamiento 1 sin superar al tratamiento 2 son los mejores, mientras que el tres si presenta diferencias con los
otros dos. En cuanto a bloques podemos decir que el mejor es el 1 sin superar al 2 y al 4 pero el 3 y el 5 son
los peores bloques.
34
Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.01
Grados de Libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor crtico del Rango Studentizado 5.63531
Diferencia Mnima Significativa
2.881
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
A
Medias
5.9600
5.7600
3.5000
N
5
5
5
T
1
2
3
Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.01
Grados de libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor Critico del Rango Studentizado 6.62515
Diferencia Mnima Significativa
4.3727
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
B A
B
C
C
Medias
8.0667
7.8000
6.2667
2.5333
0.7000
N
3
3
3
3
3
B
1
2
4
3
5
En este caso es la misma prueba que el anterior pero ahora con una probabilidad de error del 1%, por lo que
tenemos que tratamientos no presentan diferencias significativas, lo que quiere decir que todos los
tratamientos son iguales, mientras que en bloques tenemos tres grupos Tukey los mejores son el bloque 1 si
superar al 2 y al 4 pero el 4 no supera al 3 y el 5 es el peor pero sin ser superado estadsticamente del 3.
35
2
8.337
3
8.756
4
9.026
En esta prueba es con alfa igual a 0.05, y podemos observar que el tratamiento 1 es el mejor y no lo igualan
estadsticamente los dems tratamientos, en segundo lugar el tratamiento 2 pero sin superar estadsticamente
al 3, y el peor es el tratamiento 4 pero sin ser superado estadsticamente con el tres, como ya se dijo esta es
una prueba de rangos mltiples lo que quiere decir de que por ejemplo para comparar el tratamiento 1 con el
tres se cuentan los tratamientos que se Encuentran all obviamente contando los que vamos a comparar en
36
este caso 3 entonces se toma el valor critico de nmero de medias 3 y si la diferencia es superior a este valor
entonces son diferentes estadsticamente.
Procedimiento ANOVA
Prueba de Rangos Mltiples de Duncan para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Crtico
2
11.30
3
11.78
4
12.11
En este caso con un alfa de 0.01 solamente tenemos dos grupos Duncan el primero con el mejor tratamiento
que es el 1 sin superar estadsticamente al 2 pero el 2, 3 y 4 no presentan diferencias significativas
estadsticamente hablando.
37
2
8.3371399
3
10.0878
4
11.143415
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
En este caso y con un alfa del 0.05 podemos decir que el tratamiento 1 es el mejor tratamiento, y el 2, 3 y 4
no presentan diferencias significativas entre ellos, se sigue el mismo procedimiento que para la prueba de
Duncan pero solamente que el valor crtico, es decir la diferencia mnima significativa, son diferentes a
Duncan, puesto que esta utiliza las tablas de Tukey.
38
Procedimiento ANOVA
Prueba Student-Newman-Keuls para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Critico
2
11.298964
3
12.982623
4
14.014182
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
Para este caso la prueba SNK se realiz con un alfa de 0.01 y tenemos los siguientes resultados, el
tratamiento 1 es el mejor pero sin superar el tratamiento 2 pero los tratamientos 2,3 y 4 no presentan
diferencias significativas estadsticamente hablando es decir son iguales.
39
Diferencia
entre Medias
-11.043
-19.000
-21.000
Lmite de confianza
Simultanea al 95%
-21.169
-0.917 ***
-29.126
-8.874 ***
-31.126 -10.874 ***
En este caso podemos observar que todos los tratamientos son diferentes significativamente con respecto al
testigo, se pueden realizar a mano las pruebas entre los tratamientos con la diferencia mnima significativa, si
as lo requiere el investigador.
40
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
TRAT2,TRAT3,TRAT4" T 3 -1 -1 -1;
TRAT1,TRAT3,TRAT4" T -1 3 -1 -1;
TRAT1,TRAT2,TRAT4" T -1 -1 3 -1;
TRAT1,TRAT2,TRAT3" T -1 -1 -1 3;
TRAT2,TRAT3" T 2 -1 -1 0;
TRAT2,TRAT4" T 2 -1 0 -1;
TRAT3,TRAT4" T 2 0 -1 -1;
TRAT1,TRAT3" T -1 2 -1 0;
TRAT1,TRAT4" T -1 2 0 -1;
TRAT3,TRAT4" T 0 2 -1 -1;
TRAT1,TRAT2" T -1 -1 2 0;
TRAT1,TRAT4" T -1 0 2 -1;
TRAT2,TRAT4" T 0 -1 2 -1;
TRAT1,TRAT2" T -1 -1 0 2;
TRAT1,TRAT3" T -1 0 -1 2;
TRAT2,TRAT3" T 0 -1 -1 2;
TRAT2" T 1 -1 0 0;
TRAT3" T 1 0 -1 0;
TRAT4" T 1 0 0 -1;
TRAT3" T 0 1 -1 0;
TRAT4" T 0 1 0 -1;
TRAT4" T 0 0 1 -1;
41
GL
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Contraste SC
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000
Cuadrado Medio
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000
F Value
26.61
0.48
6.36
11.09
18.44
20.97
32.68
0.19
0.02
6.56
14.84
5.90
0.72
19.58
10.81
2.92
7.47
22.12
27.03
3.88
6.08
0.25
Pr > F
<.0001
0.4941
0.0187
0.0028
0.0003
0.0001
<.0001
0.6631
0.8780
0.0172
0.0008
0.0230
0.4029
0.0002
0.0031
0.1004
0.0116
<.0001
<.0001
0.0605
0.0212
0.6250
En estos datos lo que se tiene que hacer es comparar el Pr > F si este es menor al alfa con la que estamos
comparando entonces si hay diferencias significativas, si no , despus de esto se ordenan y se le pueden
poner letras, pero realmente es bastante complejo, por ejemplo de este ejemplo pudiramos decir el
tratamiento 1 es diferente significativamente de los tratamientos 2,3 y 4; el tratamiento 3 y el tratamiento 4 al
igual que el 1 es diferente estadsticamente de los otros tres tratamientos, y as hay que evaluar cada uno de
los contrastes, la verdad se recomienda solo poner los contrastes que realmente el investigador considere
ms importantes si no es un mundo de informacin casi no interpretable.
42
Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
YTRC
3.24037
2.91548
1.58114
2.73861
0.70711
3.08221
3.08221
1.87083
2.54951
1.22474
2.12132
2.34521
1.22474
2.34521
0.70711
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTRC
Suma de
Cuadrados
9.90767710
0.44829939
10.35597649
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.956711
Raz CME
0.236722
Coef. Var.
11.18874
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
1.65127952
0.05603742
F Value
29.47
Pr > F
<.0001
F Value
9.36
39.52
Pr > F
0.0080
<.0001
Y Media
2.115719
Anova SC
1.04946413
8.85821297
Cuadrado Medio
0.52473206
2.21455324
En este caso podemos ver que en el print aparece la fila de datos transformados, y con esta se realiza el
anlisis de varianza evitando problemas de Normalidad y Homogeneidad de Varianzas.
43
Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
YTLD
1.04139
0.95424
0.47712
0.90309
0.00000
1.00000
1.00000
0.60206
0.84510
0.30103
0.69897
0.77815
0.30103
0.77815
0.00000
YTLN
2.39790
2.19722
1.09861
2.07944
0.00000
2.30259
2.30259
1.38629
1.94591
0.69315
1.60944
1.79176
0.69315
1.79176
0.00000
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTLD
Suma de
Cuadrados
1.68598239
0.06255258
1.74853498
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.964226
Raz CME
0.088426
Coef. Var.
13.70182
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
0.28099707
0.00781907
F Value
35.94
Pr > F
<.0001
F Value
9.51
49.15
Pr > F
0.0077
<.0001
Y Media
0.645356
Anova SC
0.14872544
1.53725695
Cuadrado Medio
0.07436272
0.38431424
44
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTLN
Suma de
Cuadrados
8.93890687
0.33164742
9.27055429
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.964226
Raz CME
0.203607
Coef. Var.
13.70182
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
1.48981781
0.04145593
F Value
35.94
Pr > F
<.0001
F Value
9.51
49.15
Pr > F
0.0077
<.0001
Y Media
1.485987
Anova SC
0.78852714
8.15037973
Cuadrado Medio
0.39426357
2.03759493
En ambos casos podemos observar que los datos aparecen en el print al igual que en el caso anterior pero
en cada uno de los anlisis de varianza es diferente pero el resultado es el mismo en cuanto a la F calculada
y la prueba de P value
45
Y
14.823
14.676
14.720
14.514
15.065
25.151
25.401
25.131
25.031
25.267
32.605
32.460
32.256
32.669
32.111
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
YTAS
22.6441
22.5253
22.5609
22.3939
22.8385
30.0997
30.2645
30.0865
30.0204
30.1763
34.8205
34.7318
34.6069
34.8596
34.5180
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
Nmero de observaciones
15
Variable Dependiente: YTAS
Suma de
Cuadrados
374.2162599
0.2257303
374.4419903
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
12
14
R-Cuadrada
0.999397
Raz CME
0.137153
Coef. Var.
0.470618
Fuente de Variacin
T
GL
2
Cuadrado Medio
187.1081300
0.0188109
F Value
9946.81
Pr > F
<.0001
F Value
9946.81
Pr > F
<.0001
Y Media
29.14313
Anova SC
374.2162599
Cuadrado Medio
187.1081300
En este caso podemos apreciar al igual que en el anterior que los datos transformados aparecen en el print,
pero esta transformacin de datos es para obtener solamente los requerimientos bsicos para poder realizar
la prueba de anlisis de la varianza.
46
H 0 : V1 V2 V3 V4
H a : i j Vi V j
V1
V2
V3
V4
23
3.5
132
38
106
32
46
11
51
13
49
12
75
23.5
36
8
26
5
172
40
59
17.5
23
3.5
29
6
129
36
82
28
62
20
37
9
55
14
57
15.5
83
29
18
2
57
15.5
128
35
77
25.5
66
21
131
37
75
23.5
16
1
33
7
115
34
61
19
94
30
77
25.5
108
33
101
31
79
27
59
17.5
135
39
70
22
44
10
Donde
R1 = 109.5; R2 =298.5; R3 = 247; R4 = 165; k = Nm. De tratamientos= 4.
n1 = n2 = n3 = n4= 10; N = 40. Donde:
k R2
12
j 3N 1 15.53
N N 1 j 1 n j
2
c
N Nk Nk 1
entonces i j
12
47
Tambin puede utilizarse la prueba HSD de Tukey para la comparacin de rangos medios mediante la
siguiente regla de decisin
Si
R i R j q , , k
Donde
N N 1 1 1
entonces i j
n n
24
j
i
O puede utilizarse la comparacin de rangos medios de Nemanyi mediante la siguiente regla de decisin
Si R i R j q , , k
k N 1
entonces i j
12
Para la prueba de Nemanyi se aplica esta frmula cuando todos los tratamientos tienen el mismo nmero de
repeticiones, de lo contrario se debe aplicar
q , , k
N N 1 1 1
.
n n
12
2
i
j
48
En todos los casos dan la misma respuesta debido a que se basan en el mismo caso y cualquiera de ellas es
correcta.
49
H 0 : 1 2 3
H a : i j i j
Bloque
1
2
3
4
5
6
7
8
9
10
T1
855
2
1113
3
719
2
924
2
1115
3
921
3
1106
3
912
2
1170
3
1190
3
T2
760
1
504
1
412
1
673
1
808
1
764
2
356
1
951
3
856
2
560
2
T3
999
3
645
2
880
3
1245
3
883
2
422
1
970
2
416
1
143
1
118
1
c2
Ri2 3b k 1 6.2
bk k 1 i 1
12
Como c2 es mayor que t2 , se rechaza la hiptesis nula, lo que quiere decir que no todos los tratamientos
provocan el mismo efecto en este caso no todas las variedades tienen el mismo peso de fruto
k k 1
bk k 1
entonces i j
6
50
Quedando que el tratamiento 1 es el mejor, sin ser superado estadsticamente por el 3, y el peor es el 2 sin
ser superado estadsticamente por el 3.
) de Nemanyi se debe
En este sentido cuando se pretende hacer la prueba por los rangos medios (
emplear la siguiente regla de decisin
Si R i R j
q , , k
k k 1
entonces i j
6b
2
En ambos casos, al igual que con la prueba Kruskal-Wallis, dan la misma respuesta debido a que se basan
en el mismo caso y cualquiera de ellas es correcta.
51
longest
densest longlam epidsup epidinf
3.03 110.66
11.88
1.80
1.34
3.24 112.39
13.16
1.48
0.87
3.03 105.48
10.27
1.66
1.08
2.87 143.52
9.17
1.29
0.80
2.52 131.99
10.28
1.41
1.00
3.08 167.72
11.58
1.93
1.30
3.14 172.33
12.41
1.76
1.28
2.78 140.06
10.70
2.03
1.34
2.79 209.22
11.62
1.93
1.20
3.00 141.21
12.56
1.74
1.17
2.93 168.30
14.31
2.49
1.31
3.08 144.67
13.39
2.02
1.16
3.05 159.66
10.76
1.93
1.03
2.99 131.41
10.78
1.73
1.01
2.82 193.66
10.56
2.09
1.33
2.97 147.55
12.33
1.75
1.03
3.30 167.15
14.71
1.93
1.14
3.43 184.44
16.63
2.24
1.30
2.94 152.16
11.02
2.01
1.18
3.07 188.47
10.34
1.81
1.00
3.30 134.87
9.67
1.65
0.96
3.21 129.11
10.92
1.42
1.07
3.30 125.08
9.60
1.83
1.23
3.24 167.72
11.05
1.58
0.96
3.13 133.14
9.74
1.44
1.14
3.00 186.16
11.26
1.52
1.04
3.15 177.52
12.03
1.52
1.06
3.03 171.76
12.54
1.81
1.15
3.04 197.12
11.55
1.92
1.08
3.15 187.90
12.18
1.74
0.96
3.11 132.57
10.77
1.83
1.06
2.96 141.79
10.93
2.21
1.47
3.14 164.27
9.69
1.69
1.11
3.24 142.94
10.75
2.10
1.50
3.01 158.50
9.11
2.05
1.36
xy rxy
n n
xi y i
n
xi y i i 1 i 1
n
i 1
n
xi
n
2
xi i 1
n
i 1
yi
n
y i2 i 1
n
i 1
52
11.88
13.16
10.27
9.17
10.28
11.58
12.41
10.70
11.62
12.56
14.31
13.39
10.76
10.78
10.56
12.33
14.71
16.63
11.02
10.34
9.67
10.92
9.60
11.05
9.74
11.26
12.03
12.54
11.55
12.18
10.77
10.93
9.69
10.75
9.11
1.80
1.48
1.66
1.29
1.41
1.93
1.76
2.03
1.93
1.74
2.49
2.02
1.93
1.73
2.09
1.75
1.93
2.24
2.01
1.81
1.65
1.42
1.83
1.58
1.44
1.52
1.52
1.81
1.92
1.74
1.83
2.21
1.69
2.10
2.05
1.34
0.87
1.08
0.80
1.00
1.30
1.28
1.34
1.20
1.17
1.31
1.16
1.03
1.01
1.33
1.03
1.14
1.30
1.18
1.00
0.96
1.07
1.23
0.96
1.14
1.04
1.06
1.15
1.08
0.96
1.06
1.47
1.11
1.50
1.36
y2
Variable
y1
y2
y3
y4
y5
Media
3.05914
154.92857
11.43571
1.80971
1.14343
N
35
35
35
35
35
y3
y4
y5
Estadsticas Simples
Desv Est
Suma
0.17744
107.07
26.24091
5423
1.61783
400.25
0.26372
63.34
0.16439
40.02
Mnimo
2.52
105.48
9.11
1.29
0.80
Mximo
3.43
209.22
16.63
2.49
1.50
y2
-0.04712
0.7881
y3
0.30602
0.0738
y4
0.00383
0.9826
y5
-0.03317
0.8500
y2
-0.04712
0.7881
1.00000
0.26719
0.1207
0.30275
0.0771
0.07212
0.6805
y3
0.30602
0.0738
0.26719
0.1207
1.00000
0.40063
0.0171
0.14947
0.3915
y4
0.00383
0.9826
0.30275
0.0771
0.40063
0.0171
1.00000
0.74121
<.0001
y5
-0.03317
0.8500
0.07212
0.6805
0.14947
0.3915
0.74121
<.0001
1.00000
y1
53
H0 :
0
Ha :
0
Es decir, H0 dice que no existe correlacin entre las dos variables, para hacer las pruebas de hiptesis se
realizar mediante el P-value donde se rechaza H0 si P-value < , si = 0.05 tenemos:
Para y1 y y2 el P-value es de 0.7881, por lo que no se rechaza H0
Para y1 y y3 el P-value es de 0.0738, por lo que no se rechaza H0
Para y1 y y4 el P-value es de 0.9826, por lo que no se rechaza H0
Para y1 y y5 el P-value es de 0.8500, por lo que no se rechaza H0
Para y2 y y3 el P-value es de 0.1207, por lo que no se rechaza H0
Para y2 y y4 el P-value es de 0.0771, por lo que no se rechaza H0
Para y2 y y5 el P-value es de 0.6805, por lo que no se rechaza H0
Para y3 y y4 el P-value es de 0.0171, por lo que se rechaza H0
Para y3 y y5 el P-value es de 0.3915, por lo que no se rechaza H0
Para y4 y y5 el P-value es de 0.0001, por lo que se rechaza H0
Es decir las correlaciones que son significativas con un nivel de confianza del 95 % son:
Entre la variables y3 y y4 y entre y4 y y5 todas las otras correlaciones no son estadsticamente diferentes de 0
es decir no existe correlacin estadsticamente significativas
54
Prdida de peso en mg
8.98
8.14
6.67
6.08
5.90
5.83
4.68
4.20
3.72
0
1x
y
Modelo:
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
GL
Anlisis de Varianza
Suma de
GL
Cuadrados
1
23.51449
7
0.61606
8
24.13056
0.29666
6.02222
4.92614
R-Cuadrada
R-Cua Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
Cuadrado
medio
23.51449
0.08801
F Value
267.18
Pr > F
<.0001
0.9745
0.9708
t Value
Pr > |t|
8.70403
0.19156
45.44
<.0001
-0.05322
0.00326
-16.35
<.0001
55
Empezaremos para 0
0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2
0 9.1573
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 0 esta entre
el intervalo [8.2513, 9.1573]
Y para
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
1 0.0609
1 0.05322 2.3646 0.00326
1 0.0455
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de
1 esta entre
0 *0
H0 :
56
0 *0
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:
tc
0 *0
s 0
tt t
n 2 ,
2
tc
0 0
s 0
t c 8.7043 0
0.19156
t c 45.44
Clculos para tt
tt t
9 2 ,0.05
2
t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt
Y para
1 *1
H0 :
1 *1
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:
tc
1 *1
s 1
tt t
n 2 ,
2
tc
*1 0
1 0
s 1
t c 0.05322 0
0.00326
t c 16.35
Clculos para tt
tt t
9 2 ,0.05
2
57
t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt
-16.35 < -4.3646; por lo tanto se Rechaza H0, lo que significa que
un nivel de confianza de 95 %
considerar que = 0.05 llegando el mismo resultado anterior. Por lo anterior se concluye que la humedad
relativa influye significativamente en la prdida de peso de los coleoteros
y 8.7043 0.05322x
Uso de residuales
x
0
12
29.5
43
53
62.5
75.5
85
93
y
8.98
8.14
6.67
6.08
5.9
5.83
4.68
4.2
3.72
yp
8.7043
8.06566
7.13431
6.41584
5.88364
5.37805
4.68619
4.1806
3.75484
residual
0.2757
0.07434
-0.46431
-0.33584
0.01636
0.45195
-0.00619
0.0194
-0.03484
58
grfico de residuales
0.6
0.4
residual
0.2
0
3.5
4.5
5.5
6.5
7.5
8.5
9.5
-0.2
-0.4
-0.6
y predicha
Este grfico representa la distribucin entre los valores obtenidos de la ecuacin estimada de regresin y los
residuales es decir el valor obtenido de la variable dependiente y el valor predicho, esto tiene una
interpretacin de que si los residuales estn distribuidos al azar, como en este ejemplo, entonces se cumplen
los supuestos de la regresin (Normalidad, Homogeneidad de varianzas e Independencia)
59
y 1 x
1x
Modelo: y
Variable Dependiente: y
NOTA: No intercepcin en el modelo. La R-cuadrada es redefinida.
Fuente de Variacin
Modelo
Error
Total Uncorregido
Anlisis de Varianza
Suma de
GL
Cuadrados
1
168.22628
8
182.30872
9
350.53500
Raz CME
Media Dependiente
Coef. Var.
4.77374
6.02222
79.26874
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
1
R-Cuadrada
R-Cua Ajust
0.07349
0.02705
Cuadrado
medio
168.22628
22.78859
F Value
7.38
Pr > F
0.0264
0.4799
0.4149
t Value
Pr > |t|
2.72
0.0264
la humedad relativa
1 R2 = 0.5201 se refiere a que el 52.01 % de la variabilidad de la prdida de peso no se debe al efecto
de la humedad relativa. Por lo que se trata de un modelo no muy confiable
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
60
1 esta entre
61
Dosis de P
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100
Dosis de K
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
Rendimiento
5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5
5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5
62
;
proc print;
proc reg;
model y=x1 x2 x3;
run;
0
1 x1
2 x2
3 x3
y
Modelo:
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
23
26
Raz CME
Media Dependiente
Coef. Var.
Variable
GL
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
163.64778
54.54926
22.93519
0.99718
186.58296
0.99859
9.33704
10.69493
R-Cuadrada
R-Cua Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
54.70
Pr > F
<.0001
0.8771
0.8610
t Value
Pr > |t|
6.54815
0.45070
14.53
<.0001
0.03011
0.00235
12.79
<.0001
-0.00211
0.00471
-0.45
0.6580
-0.00292
0.00588
-0.50
0.6248
Interpretacin de datos
Interpretacin de los resultados:
R2 = 0.8771 se refiere a que el 87.71 % de la variabilidad del rendimiento se debe o se le atribuye a las
variables del modelo en este caso las dosis de N P K
1 R2 = 0.1229 se refiere a que el 12.29 % de la variabilidad del rendimiento no se debe o se le atribuye
a las variables del modelo en este caso las dosis de N P K
Intervalos de confianza para 0 ,
1 , 2 y 3
Empezaremos para 0
0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2
0 6.54815 t
0.4507
27 2 ,0.05
2
0 5.6199
0 6.54815 2.0595 0.4507
0 7.4764
63
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 0 esta entre
el intervalo [5.6199, 7.4764]
Y para
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
1 0.3011 t
0.00235
0
.
05
27 2 ,
2
1 esta entre
2
s 2
2 , 2 t
2 t n 2 , s
n2 ,
2
2
2 0.00211 t
0.00471
27 2 ,0.05
2
2 esta entre
3
s 3
3 , 3 t
3 t n 2 , s
n 2 ,
2
2
64
3 0.00292 t
0.00588
27 2 ,0.05
2
3 0.0150
3 0.00292 2.0595 0.00588
3 0.0092
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 3 esta entre
el intervalo [-0.0150, 0.0092]
H 0 : 0 1 2 3 0
H a : i j i j
esta prueba se realiza con el P-value de la prueba de F del anlisis de varianza de la regresin y se rechaza
H0 si el P-value es menor a en este caso = 0.05
el P-value en nuestro ejemplo es de 0.0001 por lo tanto se rechaza H0 es decir al menos un parmetro es
diferente de 0
Pruebas de hiptesis individuales usando P-value.
Las hiptesis son:
i *i
H0 :
i *i
Ha :
donde i = en nuestro caso (0, 1, 2, 3) y *i 0 es decir todos los parmetros son iguales a 0, utilizando la
prueba de t-value y se rechaza H0, si el P-value es menor a en este caso = 0.05
Parmetro
1
2
3
Lo que significa que solo los parmetros 0 y
P-value
0.0001
Decisin
Se rechaza H0
0.0001
Se rechaza H0
0.6580
No se rechaza H0
0.6248
No se rechaza H0
0 ) no tiene una explicacin lgica, pero 1 que es el coeficiente que representa el N es decir para este
ejemplo el nico que influye significativamente en el rendimiento es el N
65
0
H0 : 1
2 0
0
Ha : 1
2 0
para lo cual se hace una regresin aceptando la H0, es decir, un modelo reducido solo con los estimadores
de todos que no estn en la hiptesis, y probndose con una prueba de F con la siguiente Fc
Fc
CM H
CM E MC
donde
el
CM H
SC H
GLH
este
su
vez
se
descompone
en
En este ejemplo
R2
0
1 x1
2 x2
3 x3
y
0
1 x1
2 x2
y
0
1 x1
3 x3
y
0.8771
Nmero de
parmetros
4
Seleccin
Seleccionado 4
0.8758
Seleccionado 3
0.8760
Seleccionado 2
0
2 x2
3 x3
y
0.0024
0
1 x1
y
0
2 x2
y
0.8747
No
seleccionado
Seleccionado 1
0.0011
0
3 x3
y
0.0013
No
seleccionado
No
seleccionado
Aunque el modelo con cuatro parmetros es el de mxima R2 se decide seleccionar el modelo con menos de
0
1 x1 puesto que
0.05 en R2 pero con menor nmero de parmetros seleccionndose el modelo y
presenta un valor de R2 similar a la mxima pero con menos parmetros.
66
Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
0
1
y
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536
Procedimiento REG
Modelo:
0 x log e
1
log e y log e
Variable Dependiente: ly
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.34136
1.34136
0.18317
0.03053
1.52453
0.17472
3.04908
5.73040
R-cuadrada
R-Cuad. Ajust
F Value
43.94
Pr > F
0.0006
0.8798
0.8598
67
Variable
0
log e
1
log e
GL
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
t Value
Pr > |t|
0.81521
0.34262
2.38
0.0548
0.08935
0.01348
6.63
0.0006
0 lo siguiente
0 e 0.81521 2.2597 y para
Teniendo para
ecuacin de regresin
y 2.2597 1.0935 x
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305
Procedimiento REG
Modelo:
0 x log 10
1
log 10 y log 10
Variable Dependiente: ly
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
0
log e
1
log e
GL
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.25300
0.25300
0.03455
0.00576
0.28754
0.07588
1.32420
5.73040
R-cuadrada
R-cuad Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
43.94
Pr > F
0.0006
0.8798
0.8598
t Value
Pr > |t|
0.35404
0.14880
2.38
0.0548
0.03881
0.00585
6.63
0.0006
0 lo siguiente
0 10 0.35404 2.2597 y para
1 10 0.03881 1.0935 teniendo la
Teniendo para
siguiente ecuacin de regresin
68
Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
0 x 1
Obteniendo as la ecuacin de regresin y
Teniendo el siguiente programa, utilizando logaritmo natural, en SAS
data rp1v;
input x y;
ly= log(y);
lx=log (x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536
lx
2.89037
2.99573
3.09104
3.17805
3.25810
3.33220
3.40120
3.46574
Procedimiento REG
Modelo:
0
1 log e x
log e y log e
Variable Dependiente: ly
Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef Var
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.25624
1.25624
0.26828
0.04471
1.52453
0.21146
3.04908
6.93510
R-cuadrada
R-cuad Ajust
F Value
28.10
Pr > F
0.0018
0.8240
0.7947
69
Variable
0
log e
1
GL
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
t Value
Pr > |t|
-3.70968
1.27731
-2.90
0.0272
2.11109
0.39828
5.30
0.0018
0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 e 3.70968 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente
y 0.0245 x 2.1111
Y utilizando logaritmo base 10 se tiene el siguiente programa en SAS
data rp1v;
input x y;
ly= log10(y);
lx=log10(x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;
ly
lx
1
2
3
4
5
6
7
8
18
20
22
24
26
28
30
32
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305
1.25527
1.30103
1.34242
1.38021
1.41497
1.44716
1.47712
1.50515
Procedimiento REG
Modelo:
0
1 log 10 x
log 10 y log 10
Variable Dependiente: ly
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
0
log 10
1
GL
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.23694
0.23694
0.05060
0.00843
0.28754
0.09183
1.32420
6.93510
R-cuadrada
R-cuad Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
28.10
Pr > F
0.0018
0.8240
0.7947
t Value
Pr > |t|
-1.61109
0.55473
-2.90
0.0272
2.11109
0.39828
5.30
0.0018
0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 10 1.61109 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente
70
Rendimiento en
toneladas
12
15.5
17
28
37
28
27.5
18.5
19
15
10
Y se probar el modelo y 0 1 x 2 x 2 .
El programa en SAS es el siguiente
data rcs;
input x y;
xx=x*x;
cards;
0
12
10 15.5
20 17
30 28
40 37
50 28
60 27.5
70 18.5
80 19
90 15
100 10
;
proc print;
proc reg;
model y=x xx;
run;
x
0
10
20
30
40
50
60
70
80
90
100
y
12.0
15.5
17.0
28.0
37.0
28.0
27.5
18.5
19.0
15.0
10.0
xx
0
100
400
900
1600
2500
3600
4900
6400
8100
10000
Procedimiento REG
Modelo:
0
1x
2 x2
y
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
GL
2
8
10
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
522.36620
261.18310
167.27016
20.90877
689.63636
4.57261
R-cuadrada
F Value
12.49
Pr > F
0.0035
0.7575
71
Media Dependiente
Coef. Var.
20.68182
22.10933
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
R-cuad Ajust
0.6968
t Value
Pr > |t|
10.66783
3.48366
3.06
0.0155
0.74078
0.16208
4.57
0.0018
-0.00772
0.00156
-4.95
0.0011
este
un
buen
modelo
de
regresin
la
ecuacin
de
regresin
es
y
10.66783 0.74078x 0.00772x 2
x x
y
0 0.74078 2 0.00772x
x
y
0.74078 0.01544x
x
Igualando con 0 la primera derivada
y
0
x
0.74078 0.01544 x 0
0.01544 x 0.74078
x 0.74078
0.01544
x 47.9780
Este es el valor crtico, es decir el valor ptimo ahora hay que obtener la segunda derivada para saber si es
un mnimo o un mximo esto es solo para informacin de interpretacin
y 0.74078 0.01544x
x x x
y 0 0.01544
x x
y 0.01544
x x
72
al ser la segunda derivada menor a 0 entonces se trata de un mximo; por lo que esto se interpreta de la
siguiente manera: cuando la dosis de auxinas es de 47 .978 48 mg/l el rendimiento en manzana es el
mximo posible.
73
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
Rendimiento en
toneladas
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3
18.2
17
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1
Y se probar el modelo
y 0 1 x1 2 x12 3 x 2 4 x 22 5 x3 6 x32 7 x1 x 2 8 x1 x3 9 x 2 x3 .
El programa en SAS es el siguiente
data a;
input n p k y;
np=n*p;
nk=n*k;
pk=p*k;
nn=n*n;
pp=p*p;
kk=k*k;
cards;
0
0
0
0
0
50
0
0
100
0
40
0
0
40
50
0
40
100
0
80
0
0
80
50
0
80
100
100
0
0
100
0
50
100
0
100
100
40
0
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3
74
100
40
50
18.2
100
40
100
17
100
80
0
17.1
100
80
50
17.8
100
80
100
16.6
150
0
0
14.5
150
0
50
15.6
150
0
100
14.3
150
40
0
14.9
150
40
50
15.8
150
40
100
14.6
150
80
0
14.6
150
80
50
15.4
150
80
100
14.1
;
proc print;
proc reg;
model y=n p k nn pp kk np nk pk;
run;
n
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150
p
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
k
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
y
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11.0
11.0
16.8
17.2
16.9
17.3
18.2
17.0
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1
np
0
0
0
0
0
0
0
0
0
0
0
0
4000
4000
4000
8000
8000
8000
0
0
0
6000
6000
6000
12000
12000
12000
nk
0
0
0
0
0
0
0
0
0
0
5000
10000
0
5000
10000
0
5000
10000
0
7500
15000
0
7500
15000
0
7500
15000
pk
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000
nn
0
0
0
0
0
0
0
0
0
10000
10000
10000
10000
10000
10000
10000
10000
10000
22500
22500
22500
22500
22500
22500
22500
22500
22500
pp
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400
kk
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
Procedimiento REG
Modelo:
0
1 x1
2 x12
3 x2
4 x 22
5 x3
6 x32
7 x1 x 2
8 x1 x3
9 x 2 x3
y
Variable Dependiente: y
Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef. Var.
Variable
Intercept
n
p
k
nn
pp
kk
np
nk
pk
GL
1
1
1
1
1
1
1
1
1
1
GL
9
17
26
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
185.41560
20.60173
1.16737
0.06867
186.58296
0.26205
14.33704
1.82776
R-cuadrada
R-cuad Ajust
Parmetros
Parmetro
Estimado
10.22315
0.13906
0.02240
0.03313
-0.00073111
-0.00022569
-0.00027778
-0.00001548
-0.00005095
-0.00004167
Estimados
Error
Estndar
0.19274
0.00351
0.00623
0.00499
0.00002179
0.00006686
0.00004279
0.00002476
0.00001981
0.00003782
F Value
300.02
Pr > F
<.0001
0.9937
0.9904
t Value
53.04
39.64
3.59
6.65
-33.55
-3.38
-6.49
-0.63
-2.57
-1.10
Pr > |t|
<.0001
<.0001
0.0022
<.0001
<.0001
0.0036
<.0001
0.5403
0.0198
0.2860
75
R2 = 0.9937 se refiere a que el 99.37 % de la variabilidad del rendimiento se debe o se le atribuye a las
dosis de N P K
1 R2 = 0.2425 se refiere a que el 0.63 % de la variabilidad del rendimiento no se debe al efecto de la
dosis de N P K
Siendo
este
un
excelente
modelo
de
regresin
la
ecuacin
de
regresin
es:
y
x1 x1
y
0.13906 2 0.00073111x1 0.00001548x 2 0.00005095x3
x1
y
0.13906 0.00146222x1 0.00001548x 2 0.00005095x3
x1
Para x2
y
x 2 x 2
y
0.0224 2 0.00022569x 2 0.00001548x1 0.00004167x3
x 2
y
0.0224 0.00001548x1 0.00045138x 2 0.00004167x3
x 2
para x3
y
x 3 x 3
y
0.03313 2 0.00027778x3 0.00005095x1 0.00004167x 2
x3
y
0.03313 0.00005095x1 0.00004167x 2 0.00055556x3
x3
Igualando a 0 las tres derivadas y resolviendo el sistema de ecuaciones de tres ecuaciones con tres variables.
x1
Que se resolver mediante matrices donde x A b y cada termino significa x x 2
x3
1
76
se
A 1 b
multiplica
para
obtener
los
valores
de
x1,
x2
x3.
Teniendo
que
x1 92.9863
x 42.0096
2
x3 47.9549
para obtener la segunda derivada se realiza una matriz hessiana y se obtienen las determinantes que son
los determinantes principales (mnimos o mximos principales)
y
x x
1 1
y
H
x1 x 2
y
x1 x3
x1
y
x 2 x 2
y
x 2 x3
x 2
x3 x1
x3 x 2
x3 x3
0.13906 0.00146222x1
x 0.00001548x 2
1 0.00005095x3
0
.
0224
0
.
00001548
x
H 0.00045138x 2
x1
0.00004167x3
0.03313 0.00005095x1
x 0.00004167x 2
1 0.00055556x
3
0.13906 0.00146222x1
0.00001548x 2
0.00005095x
0.0224 0.00001548x1
0.00045138x
2
x 2
0.00004167x3
0.03313 0.00005095x1
0.00004167x
2
x 2
0.00055556x3
x 2
0.13906 0.00146222x1
0.00001548x 2
0.00005095x
0.0224 0.00001548x1
0.00045138x
2
x3
0.00004167x3
0.03313 0.00005095x1
0.00004167x
2
x3
0.00055556x3
x3
Det1 0.00146222
Determinante 2.
Determinante 3.
77
Interpretacin.
N 92.9863
Cuando los niveles de fertilizacin de P 42.0096 se obtiene el mximo rendimiento, para el ejemplo
K 47.9549
dado.
Utilizando este tipo de regresin se puede estimar los valores ptimos ya sean mnimos o mximos, segn
sea el caso, y as poder dar una recomendacin, de fertilizacin en este caso, as como otros aspectos.
78
Multicolinealidad.
Para ejemplificar multicolinealidad se utilizar el ejemplo visto en clase pero obteniendo los coeficiente VIF
con SAS.
11.9
22.8
18.7
20.1
12.9
21.7
27.1
25.4
21.3
19.3
25.4
27.2
11.7
17.8
12.8
23.9
22.6
25.4
14.8
21.1
0
1 x1
2 x2
3 x3
y
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
396.98461
132.32820
98.40489
6.15031
495.38950
Raz CME
Media Dependiente
Coef. Var.
2.47998
20.19500
12.28017
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
Pr > F
<.0001
0.8014
0.7641
t Value
Pr > |t|
Inflacin
de la Varianza
117.08469
99.78240
1.17
0.2578
4.33409
3.01551
1.44
0.1699
708.84291
-2.85685
2.58202
-1.11
0.2849
564.34339
-2.18606
1.59550
-1.37
0.1896
104.60601
El procedimiento CORR
3 Variables:
x1
Variable
x1
x2
x3
R-cuadrada
R-cuad Ajust
F Value
21.52
N
20
20
20
x2
x3
Media
25.30500
51.17000
27.62000
Estadsticas Simples
Desv Est
Suma
5.02326
506.10000
5.23461
1023
3.64715
552.40000
Mnimo
14.60000
42.20000
21.30000
Mximo
31.40000
58.60000
37.00000
79
x2
x3
x1
1.00000
0.92384
<.0001
0.45778
0.0424
x2
0.92384
<.0001
1.00000
0.08467
0.7227
x3
0.45778
0.0424
0.08467
0.7227
1.00000
Interpretacin.
Para interpretar si existe multicolinealidad, existen tres datos que evidencian este problema, el primero es
rechazar H0 en la prueba conjunta y no rechazarla en las pruebas individuales, valores de VIF (Factor de
Inflacin de la Varianza) mayores a 10 y correlacin significativa entre las variables independientes, en este
ejemplo el primer indicador se cumple en la salida de SAS, los valores VIF son mayores incluso de 100, y
existen correlaciones entre las variables x 1 y x2 y entre x1 y x3 por lo que para poder corregirlo lo ms viable
sera quitar x1 por ser el de mayor valor VIF
0
2 x2
3 x3
y
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
17
19
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
384.27972
192.13986
111.10978
6.53587
495.38950
Raz CME
Media Dependiente
Coef. Var.
2.55653
20.19500
12.65925
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
R-cuadrada
R-cuad Ajust
F Value
29.40
Pr > F
<.0001
0.7757
0.7493
t Value
Pr > |t|
Inflacin
de la Varianza
-25.99695
6.99732
-3.72
0.0017
0.85088
0.11245
7.57
<.0001
1.00722
0.09603
0.16139
0.60
0.5597
1.00722
Corrigindose el problema al reducir los coeficientes VIF a menos de 10, y teniendo concordancia entre la
prueba global y las individuales.
80