Está en la página 1de 81

UNIVERSIDAD DE GUANAJUATO

CAMPUS CELAYA SALVATIERRA


DIVISIN DE CIENCIAS DE LA SALUD E INGENIERAS
DEPARTAMENTO DE INGENIERA AGROINDUSTRIAL
PROGRAMA ACADMICO DE INGENIERA EN BIOTECNOLOGA

EJEMPLOS DE ANLISIS DE
VARIANZA, CORRELACIN Y
REGRESIN.
CON EL USO PRCTICO DEL PAQUETE SAS

Dr. Carlos A. Nez-Coln.


UDA: Diseos Experimentales (GN1808)

ANAVA en Diseo Experimental Completamente al Azar.


En un experimento donde se probaron 4 dosis de Nitrgeno en el cultivo de Ans donde la variable respuesta
fue el rendimiento en gramos por parcela.
Teniendo el siguiente programa para SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
RUN;

Obteniendo los siguientes resultados:


El procedimiento del ANAVA
Informacin del Nivel de Clase
Clase
Niveles
Valores
T
4
1 2 3 4
Nmero de observaciones

28

Variable Dependiente: Y
Suma de
Cuadrados
1908.209643
1370.677143
3278.886786

Fuente de Variacin
Modelo
Error
Total Corregido

GL
3
24
27

R-Cuadrada
0.581969

Raz CME
7.557218

Coef. Var.
26.97974

Fuente de Variacin
T

GL
3

Cuadrado Medio
636.069881
57.111548

F Value
11.14

Pr > F
<.0001

Cuadrado Medio
636.069881

F Value
11.14

Pr > F
<.0001

Y Media
28.01071

Anova SC
1908.209643

Esto ya es el ANAVA o ANOVA en ingles que nos dice que la H 0 (hiptesis nula) que todos los tratamientos
tienen el mismo efecto y la Ha (hiptesis alternativa) que por lo menos un tratamiento es diferente de los
dems, rechazndose la hiptesis nula cuando el P value (Pr) es menor que el alfa al que se tenga planteado
probar el experimento, en este caso se rechaza H 0 diciendo entonces que al menos un tratamiento tiene un
efecto diferente es decir que al menos una dosis de nitrgeno produce un rendimiento diferente a las dems.
En este diseo el modelo tiene el mismo valor que la fuente de variacin, ya que es la nica fuente de variacin
dentro del modelo.

ANAVA en Diseo Experimental Completamente al Azar Desbalanceado.


En este experimento donde se aplicaron reguladores de crecimiento a plntulas de frijol, se midi la variable
respuesta longitud del primer entrenudo.
Teniendo el siguiente programa para SAS:
DATA CA2;
INPUT Y T;
CARDS;
3.0 1
2.5 1
3.0 1
3.3 1
4.0 1
2.9 1
6.1 2
6.8 2
5.2 2
7.0 2
4.8 2
3.8 2
5.9 3
7.1 3
6.7 3
5.9 3
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T;
RUN;

Obteniendo los siguientes resultados:


Procedimiento GLM
Informacin de niveles de Clase
Clase
Niveles Valores
T

Nmero de observaciones

1 2 3
16

El Procedimiento GLM
Variable Dependiente: Y
Suma de
Cuadrados
31.15333333
10.03666667
41.19000000

Fuente de Variacin
Modelo
Error
Total Corregido

GL
2
13
15

R-Cuadrada
0.756332

Raz CME
0.878664

Coef. Var.
18.02389

Cuadrado Medio
15.57666667
0.77205128

F Value
20.18

Pr > F
0.0001

Y Media
4.875000

Fuente de Variacin
T

GL
2

SC Tipo I
31.15333333

Cuadrado Medio
15.57666667

F Value
20.18

Pr > F
0.0001

Fuente de variacin
T

GL
2

SC Tipo III
31.15333333

Cuadrado Medio
15.57666667

F Value
20.18

Pr > F
0.0001

En este anlisis por estar desbalanceado primero hace una regresin lineal, y despus el ANAVA.
Teniendo para este caso ya con los valores corregidos que al menos uno de los tratamientos producen efecto
diferente es decir que por lo menos en uno de los tratamientos el hipoctilo de frijol creci de manera diferente
a los otros, considerando un alfa del 0.05.

ANAVA en diseo Bloques al Azar.


El Experimento consto de una prueba de variedades de Maz, pero se hizo en bloques al azar por presentar
un gradiente de variacin en la fertilidad del suelo.
Teniendo el siguiente programa para SAS:
DATA BA1;
INPUT Y T B;
CARDS;
10.1 1 1
8.9 1 2
2.6 1 3
7.4 1 4
0.8 1 5
9.2 2 1
9.3 2 2
3.1 2 3
6.0 2 4
1.2 2 5
4.9 3 1
5.2 3 2
1.9 3 3
5.4 3 4
0.1 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL Y=T B;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: Y
Suma de
Cuadrados
148.8546667
10.4546667
159.3093333

Fuente de Variacin
Modelo
Error
Total Corregido

GL
6
8
14

R-Cuadrada
0.934375

Raz CME
1.143168

Coef. Var.
22.53288

Fuente de Variacin
T
B

GL
2
4

Cuadrado Medio
24.8091111
1.3068333

F Value
18.98

Pr > F
0.0002

F Value
7.14
24.91

Pr > F
0.0166
0.0001

Y Media
5.073333

Anova SC
18.6653333
130.1893333

Cuadrado Medio
9.3326667
32.5473333

Tenemos en este ejemplo que del modelo se desprenden 2 fuentes de variacin los tratamientos y los bloques
y que en este caso ambos tienen diferencias significativas. Solo que en bloques es un poco ms fuertes, pero
en ambos casos se concluye que al menos una variedad es diferente a las dems en cuanto a su rendimiento
y que estas en conjunto en los bloques presentan tambin diferencias significativas es decir se comportan
diferente en cada bloque.

ANAVA en Diseo Experimental Cuadrado Latino.


En el experimento de variedades de trigo que funciona como tratamiento se tenan dos gradientes de variacin
que era para columnas fertilidad del suelo y para hileras humedad del mismo y utilizando parcelas de 15 m 2
y la variable respuesta de rendimiento de grano en gramos por parcela.
Teniendo el siguiente programa de SAS:
DATA CL1;
INPUT Y C H T;
CARDS;
732
1 1 4
728
1 2 1
1010 1 3 5
900
1 4 3
980
1 5 2
854
2 1 5
730
2 2 2
750
2 3 1
1100 2 4 4
970
2 5 3
641
3 1 3
854
3 2 4
860
3 3 2
860
3 4 1
1250 3 5 5
610
4 1 2
762
4 2 3
720
4 3 4
1200 4 4 5
930
4 5 1
549
5 1 1
976
5 2 5
1000 5 3 3
920
5 4 2
1070 5 5 4
;
PROC PRINT;
PROC ANOVA;
CLASS C H T;
MODEL Y=C H T;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
C
5
1 2 3 4 5
H
5
1 2 3 4 5
T
5
1 2 3 4 5
Nmero de observaciones
25
Variable Dependiente: Y
Suma de
Cuadrados
685015.6800
67488.8800
752504.5600

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
12
12
24

R-Cuadrada
0.910314

Raz CME
74.99382

Coef. Var.
8.539103

Fuentes de Variacin
C
H
T

GL
4
4
4

Cuadrado Medio
57084.6400
5624.0733

F Value
10.15

Pr > F
0.0002

F Value
0.46
18.94
11.06

Pr > F
0.7667
<.0001
0.0005

Y Media
878.2400

Anova SC
10252.5600
426061.7600
248701.3600

Cuadrado Medio
2563.1400
106515.4400
62175.3400

En este Diseo experimental se tienen el mismo nmero de Tratamientos, de Columnas y de Hileras, es una
caracterstica del diseo, y en este caso se concluye que la fertilidad en este caso no tiene reaccin con el
rendimiento, pero la humedad, si causa un efecto diferente entre hileras, adems de que las variedades tienen
diferencias significativas entre ellas con un alfa de 0.05.

ANAVA en Diseo Experimental Bloques al Azar Generalizado.


El experimento se realiz en bloques porque existe un gradiente de variacin pero se sospecha que puede
haber interaccin por lo que en lugar de utilizar el diseo bloques al azar, se utiliza el diseo bloques al azar
generalizado, que la nica diferencia de que este presenta repeticin de bloques. En este caso se trata del
rendimiento de tomate por corte por hectrea extrapolado, con un bloque que se trata de un gradiente de
variacin de humedad, y los tratamientos son aplicaciones foliares de abono nitrogenado.
Teniendo el siguiente programa de SAS:
DATA BAG1;
INPUT Y TRA BLO;
CARDS;
7.3 1 1
7.2 1 2
7.6 1 3
7.2 1 1
7.5 1 2
7.6 1 3
6.8 2 1
5.5 2 2
6.8 2 3
6.5 2 1
6.8 2 2
7.1 2 3
6.7 3 1
7.3 3 2
6.8 3 3
7.4 3 1
7.5 3 2
6.3 3 3
5.7 4 1
6.9 4 2
6.4 4 3
6.1 4 1
6.4 4 2
6.3 4 3
;
PROC PRINT;
PROC ANOVA;
CLASS TRA BLO;
MODEL Y=TRA BLO TRA*BLO;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
TRA
4
1 2 3 4
BLO
3
1 2 3
Numero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
6.25458333
1.58500000
7.83958333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.797821

Raz CME
0.363433

Coef. Var.
5.328274

Fuentes de Variacin
TRA
BLO
TRA*BLO

GL
3
2
6

Cuadrado Medio
0.56859848
0.13208333

F Value
4.30

Pr > F
0.0092

F Value
10.53
0.54
2.45

Pr > F
0.0011
0.5949
0.0881

Y Media
6.820833

Anova SC
4.17125000
0.14333333
1.94000000

Cuadrado Medio
1.39041667
0.07166667
0.32333333

En este caso segn este anlisis podemos interpretar que el gradiente de humedad existente en el
experimento no presenta diferencias significativas en cuanto a rendimiento por corte, mientras que los
tratamientos con aplicaciones foliares de fertilizantes si presentan una diferencia significativa, adems se
concluye como no se rechaz H0 de la interaccin, que no existe interaccin por lo que se hubiera podido
ocupar el diseo bloques al azar pero como no se saba, estuvo bien ocupado el modelo.

ANAVA de un Factorial de 2 en Completamente al Azar.


En este tipo de experimentos se tienen ms de un factor a evaluar, en este caso se tienen 2 factores a evaluar
por la misma variable respuesta.
En este caso se trata de rendimiento de forraje de alfalfa en toneladas por hectrea con una dosis de nitrgeno
como factor A y de fsforo como factor B.
Teniendo el siguiente programa de SAS:
DATA F2CA1;
INPUT Y TRA A B;
CARDS;
140 1 1 1
150 1 1 1
136 1 1 1
143 1 1 1
148 1 1 1
155 2 1 2
149 2 1 2
156 2 1 2
147 2 1 2
152 2 1 2
168 3 2 1
174 3 2 1
171 3 2 1
166 3 2 1
162 3 2 1
180 4 2 2
165 4 2 2
176 4 2 2
173 4 2 2
170 4 2 2
;
PROC PRINT;
PROC ANOVA;
CLASS A B;
MODEL Y=A B A*B;
PROC ANOVA;
CLASS TRA;
MODEL Y=TRA;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
A
2
1 2
B
2
1 2
Nmero de observaciones
20
Variable Dependiente: Y
Suma de
Cuadrados
2851.350000
405.600000
3256.950000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
3
16
19

R-Cuadrada
0.875466

Raz CME
5.034878

Coef. Var.
3.165595

Fuentes de Variacin
A
B
A*B

GL
1
1
1

Cuadrado Medio
950.450000
25.350000

F Value
37.49

Pr > F
<.0001

F Value
103.43
8.33
0.71

Pr > F
<.0001
0.0107
0.4112

F Value
37.49

Pr > F
<.0001

Y Media
159.0500

Anova SC
2622.050000
211.250000
18.050000

Cuadrado Medio
2622.050000
211.250000
18.050000

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
TRA
4
1 2 3 4
Number of observations
20
The ANOVA Procedure
Variable Dependiente: Y
Fuentes de Variacin
Modelo
Error
Total Corregido

GL
3
16
19

Suma de
Cuadrados
2851.350000
405.600000
3256.950000

Cuadrado Medio
950.450000
25.350000

R-Cuadrada
0.875466

Coef. Var.
3.165595

Fuentes de Variacin
TRA

Raz CME
5.034878
GL
3

Y Media
159.0500

Anova SC
2851.350000

Cuadrado Medio
950.450000

F Value
37.49

Pr > F
<.0001

En este caso podemos concluir que las dosis de nitrgeno influye significativamente en el rendimiento de
forraje en el cultivo de alfalfa, de igual manera las dosis de fsforo tambin influye de una manera significativa
en el rendimiento de forraje, pero no existe interaccin entre las dosis de nitrgeno y fsforo, es decir que
ambas dosis siguen la misma tendencia en las repeticiones, adems en esta prueba es necesario decir que
existe una diferencia significativa entre las combinaciones de dosis de nitrgeno y de fsforo.

ANAVA de un Factorial 2 en Diseo Bloque al Azar


Este se utiliza cuando se van a evaluar ms de dos factores de variacin y se tiene un gradiente de variacin
en las unidades experimentales. Este experimento se trata de evaluar a diferentes variedades de maz con
distintas dosis de nitrgeno, para evaluar la produccin de grano en toneladas por hectrea, con un gradiente
de humedad del suelo para formar los bloques.
Teniendo el siguiente programa para SAS:
DATA F2BA1;
INPUT Y BLO V N COVN$;
CARDS;
3.3 1 1 1 V1N1
4.2 1 1 2 V1N2
6.1 1 1 3 V1N3
5.4 1 2 1 V2N1
6.5 1 2 2 V2N2
7.2 1 2 3 V2N3
2.3 1 3 1 V3N1
2.5 1 3 2 V3N2
5.8 1 3 3 V3N3
4.7 1 4 1 V4N1
6.0 1 4 2 V4N2
7.2 1 4 3 V4N3
2.9 2 1 1 V1N1
4.4 2 1 2 V1N2
5.1 2 1 3 V1N3
5.2 2 2 1 V2N1
5.1 2 2 2 V2N2
8.0 2 2 3 V2N3
1.9 2 3 1 V3N1
2.3 2 3 2 V3N2
4.5 2 3 3 V3N3
5.5 2 4 1 V4N1
6.3 2 4 2 V4N2
8.6 2 4 3 V4N3
3.7 3 1 1 V1N1
4.2 3 1 2 V1N2
6.4 3 1 3 V1N3
6.3 3 2 1 V2N1
6.2 3 2 2 V2N2
8.3 3 2 3 V2N3
1.7 3 3 1 V3N1
3.9 3 3 2 V3N2
5.2 3 3 3 V3N3
4.3 3 4 1 V4N1
5.5 3 4 2 V4N2
7.4 3 4 3 V4N3
3.0 4 1 1 V1N1
5.4 4 1 2 V1N2
7.5 4 1 3 V1N3
6.6 4 2 1 V2N1
7.3 4 2 2 V2N2
9.0 4 2 3 V2N3
2.3 4 3 1 V3N1
3.3 4 3 2 V3N2
6.2 4 3 3 V3N3
3.3 4 4 1 V4N1
5.4 4 4 2 V4N2
8.2 4 4 3 V4N3
2.3 5 1 1 V1N1
5.5 5 1 2 V1N2
6.6 5 1 3 V1N3
5.6 5 2 1 V2N1
7.7 5 2 2 V2N2
8.9 5 2 3 V2N3
1.8 5 3 1 V3N1
2.2 5 3 2 V3N2
6.3 5 3 3 V3N3
2.6 5 4 1 V4N1
4.3 5 4 2 V4N2
8.2 5 4 3 V4N3
;
PROC PRINT;
PROC ANOVA;
CLASS BLO V N;
MODEL Y=BLO V N V*N;
PROC ANOVA;
CLASS BLO COVN;

MODEL Y=BLO COVN;


RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
4
1 2 3 4
N
3
1 2 3
Nmero de observaciones
60
Variable Dependiente: Y
Suma de
Cuadrados
215.8676667
24.3696667
240.2373333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
15
44
59

R-Cuadrada
0.898560

Raz CME
0.744215

Coef. Var.
14.23881

Fuentes de Variacin
BLO
V
N
V*N

GL
4
3
2
6

Cuadrado Medio
14.3911778
0.5538561

F Value
25.98

Pr > F
<.0001

F Value
1.29
58.18
101.03
1.33

Pr > F
0.2878
<.0001
<.0001
0.2638

Y Media
5.226667

Anova SC
2.8623333
96.6733333
111.9083333
4.4236667

Cuadrado Medio
0.7155833
32.2244444
55.9541667
0.7372778

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
COVN
12
V1N1 V1N2 V1N3 V2N1 V2N2 V2N3 V3N1 V3N2 V3N3 V4N1 V4N2 V4N3
Nmero de observaciones
60
Variable Dependiente: Y
Suma de
Cuadrados
215.8676667
24.3696667
240.2373333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
15
44
59

R-Cuadrada
0.898560

Raz CME
0.744215

Coef. Var.
14.23881

Fuentes de Variacin
BLO
COVN

GL
4
11

Cuadrado Medio
14.3911778
0.5538561

F Value
25.98

Pr > F
<.0001

F Value
1.29
34.96

Pr > F
0.2878
<.0001

Y Media
5.226667

Anova SC
2.8623333
213.0053333

Cuadrado Medio
0.7155833
19.3641212

En este ejemplo podemos interpretar por estos datos que la influencia de los bloques es no significativa,
mientras que tanto las variedades de maz y las diferentes dosis de nitrgeno tienen diferencias significativas
entre ellos, y que no existe interaccin entre variedades y dosis de nitrgeno, es decir que tienen la misma
tendencia entre bloques y entre ellos mismos, as tambin podemos observar que existe diferencias
significativas entre las diferentes combinaciones de variedades por dosis de nitrgeno, lo que nos indica de
que al menos una combinacin es diferente a las dems.

ANAVA de un Factorial de 3 en Completamente al Azar.


Este experimento evalo tres factores en el diseo experimental completamente al azar que quiere decir que
todas las unidades experimentales son homogneas, en este caso se trata de evaluar variedades de trigo(V),
aplicacin de hormonas(H) y de fertilizantes foliares(F) para evaluar la variable respuesta altura de planta.
Teniendo el siguiente programa para SAS:
DATA F3CA1;
INPUT Y V H F COMVH$ COMVF$ COMHF$ COMVHF$;
CARDS;
12 1 1 1 V1H1 V1F1 H1F1 V1H1F1
10 1 1 1 V1H1 V1F1 H1F1 V1H1F1
13 1 1 2 V1H1 V1F2 H1F2 V1H1F2
11 1 1 2 V1H1 V1F2 H1F2 V1H1F2
14 1 2 1 V1H2 V1F1 H2F1 V1H2F1
14 1 2 1 V1H2 V1F1 H2F1 V1H2F1
13 1 2 2 V1H2 V1F2 H2F2 V1H2F2
14 1 2 2 V1H2 V1F2 H2F2 V1H2F2
15 1 3 1 V1H3 V1F1 H3F1 V1H3F1
14 1 3 1 V1H3 V1F1 H3F1 V1H3F1
13 1 3 2 V1H3 V1F2 H3F2 V1H3F2
14 1 3 2 V1H3 V1F2 H3F2 V1H3F2
12 2 1 1 V2H1 V2F1 H1F1 V2H1F1
13 2 1 1 V2H1 V2F1 H1F1 V2H1F1
13 2 1 2 V2H1 V2F2 H1F2 V2H1F2
13 2 1 2 V2H1 V2F2 H1F2 V2H1F2
15 2 2 1 V2H2 V2F1 H2F1 V2H2F1
15 2 2 1 V2H2 V2F1 H2F1 V2H2F1
15 2 2 2 V2H2 V2F2 H2F2 V2H2F2
15 2 2 2 V2H2 V2F2 H2F2 V2H2F2
15 2 3 1 V2H3 V2F1 H3F1 V2H3F1
15 2 3 1 V2H3 V2F1 H3F1 V2H3F1
14 2 3 2 V2H3 V2F2 H3F2 V2H3F2
15 2 3 2 V2H3 V2F2 H3F2 V2H3F2
;
PROC PRINT;
PROC ANOVA;
CLASS V H F;
MODEL Y=V H V*H F V*F H*F V*H*F;
PROC ANOVA;
CLASS COMVH F;
MODEL Y=COMVH F COMVH*F;
PROC ANOVA;
CLASS COMVF H;
MODEL Y=COMVF H COMVF*H;
PROC ANOVA;
CLASS COMHF V;
MODEL Y=COMHF V COMHF*V;
PROC ANOVA;
CLASS COMVHF;
MODEL Y=COMVHF;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
V
2
1 2
H
3
1 2 3
F
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.851003

Raz CME
0.735980

Coef. Var.
5.401689

Fuentes de Variacin
V
H
V*H
F
V*F
H*F
V*H*F

GL
1
2
2
1
1
2
2

Cuadrado Medio
3.37500000
0.54166667

F Value
6.23

Pr > F
0.0019

F Value
13.00
24.92
0.31
0.08
0.08
2.15
0.31

Pr > F
0.0036
<.0001
0.7408
0.7862
0.7862
0.1588
0.7408

Y Media
13.62500

Anova SC
7.04166667
27.00000000
0.33333333
0.04166667
0.04166667
2.33333333
0.33333333

Cuadrado Medio
7.04166667
13.50000000
0.16666667
0.04166667
0.04166667
1.16666667
0.16666667

10

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVH
6
V1H1 V1H2 V1H3 V2H1 V2H2 V2H3
F
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.851003

Raz CME
0.735980

Coef. Var.
5.401689

Fuentes de Variacin
COMVH
F
COMVH*F

GL
5
1
5

Cuadrado Medio
3.37500000
0.54166667

F Value
6.23

Pr > F
0.0019

F Value
12.69
0.08
1.00

Pr > F
0.0002
0.7862
0.4582

F Value
6.23

Pr > F
0.0019

F Value
4.38
24.92
0.92

Pr > F
0.0265
<.0001
0.5119

F Value
6.23

Pr > F
0.0019

F Value
10.85
13.00
0.26

Pr > F
0.0004
0.0036
0.9256

Y Media
13.62500

Anova SC
34.37500000
0.04166667
2.70833333

Cuadrado Medio
6.87500000
0.04166667
0.54166667

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVF
4
V1F1 V1F2 V2F1 V2F2
H
3
1 2 3
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.851003

Raz CME
0.735980

Coef. Var.
5.401689

Fuentes de Variacin
COMVF
H
COMVF*H

GL
3
2
6

Cuadrado Medio
3.37500000
0.54166667

Y Media
13.62500

Anova SC
7.12500000
27.00000000
3.00000000

Cuadrado Medio
2.37500000
13.50000000
0.50000000

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMHF
6
H1F1 H1F2 H2F1 H2F2 H3F1 H3F2
V
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.851003

Raz CME
0.735980

Coef. Var.
5.401689

Fuentes de Variacin
COMHF
V
COMHF*V

GL
5
1
5

Cuadrado Medio
3.37500000
0.54166667

Y Media
13.62500

Anova SC
29.37500000
7.04166667
0.70833333

Cuadrado Medio
5.87500000
7.04166667
0.14166667

11

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
COMVHF
12 V1H1F1 V1H1F2 V1H2F1 V1H2F2 V1H3F1 V1H3F2 V2H1F1 V2H1F2 V2H2F1 V2H2F2 V2H3F1
V2H3F2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
30.79166667
12.83333333
43.62500000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
12
23

R-Cuadrada
0.705826

Raz CME
1.034139

Coef. Var.
7.590014

Fuentes de Variacin
COMVHF

GL
11

Cuadrado Medio
2.79924242
1.06944444

F Value
2.62

Pr > F
0.0564

F Value
2.62

Pr > F
0.0564

Y Media
13.62500

Anova SC
30.79166667

Cuadrado Medio
2.79924242

En este caso tenemos de que del primer anlisis de varianza se concluye que V y H si tienen diferencias
significativas lo que quiere decir que al menos uno de sus efectos es diferente a los dems, mientras que F
resulta que todos los tratamientos de fertilizantes foliares, todos causan el mismo efecto, y tambin se puede
interpretar de que no existen interacciones en este experimento, puesto que todas se rechazan, en cuanto a
las combinaciones se puede decir que la combinacin VH sali con diferencias significativas lo que quiere
decir que no todas las combinaciones VH producen el mismo efecto, las combinaciones VF tambin salieron
con diferencias significativas lo que quiere decir de que no todas las combinaciones producen el mismo efecto,
al igual que las combinaciones HF con diferencias significativas, mientras que las combinaciones VHF es
decir la combinacin de los tres factores no presenta diferencias significativas.

12

ANAVA de un Factorial de 3 en Bloques al Azar.


Esto es cuando se tienen un gradiente de humedad del suelo, es para diferentes dosis de fertilizacin N-P-K
en el cultivo de berenjena donde la variable respuesta es rendimiento de fruta en toneladas por hectrea.
Para ver cual dosis de cada elemento y cul de sus combinaciones tiene el mejor rendimiento.
Teniendo el siguiente programa en SAS:
DATA F3BA1;
INPUT Y N P K BLO CONP$ CONK$ COPK$ CONPK$;
CARDS;
130 1 1 1 1 N1P1 N1K1 P1K1 N1P1K1
100 1 1 1 2 N1P1 N1K1 P1K1 N1P1K1
130 1 1 1 3 N1P1 N1K1 P1K1 N1P1K1
110 2 1 1 1 N2P1 N2K1 P1K1 N2P1K1
100 2 1 1 2 N2P1 N2K1 P1K1 N2P1K1
140 2 1 1 3 N2P1 N2K1 P1K1 N2P1K1
150 1 2 1 1 N1P2 N1K1 P2K1 N1P2K1
150 1 2 1 2 N1P2 N1K1 P2K1 N1P2K1
190 1 2 1 3 N1P2 N1K1 P2K1 N1P2K1
170 2 2 1 1 N2P2 N2K1 P2K1 N2P2K1
190 2 2 1 2 N2P2 N2K1 P2K1 N2P2K1
150 2 2 1 3 N2P2 N2K1 P2K1 N2P2K1
120 1 1 2 1 N1P1 N1K2 P1K2 N1P1K2
100 1 1 2 2 N1P1 N1K2 P1K2 N1P1K2
130 1 1 2 3 N1P1 N1K2 P1K2 N1P1K2
150 2 1 2 1 N2P1 N2K2 P1K2 N2P1K2
130 2 1 2 2 N2P1 N2K2 P1K2 N2P1K2
160 2 1 2 3 N2P1 N2K2 P1K2 N2P1K2
180 1 2 2 1 N1P2 N1K2 P2K2 N1P2K2
170 1 2 2 2 N1P2 N1K2 P2K2 N1P2K2
160 1 2 2 3 N1P2 N1K2 P2K2 N1P2K2
150 2 2 2 1 N2P2 N2K2 P2K2 N2P2K2
200 2 2 2 2 N2P2 N2K2 P2K2 N2P2K2
200 2 2 2 3 N2P2 N2K2 P2K2 N2P2K2
;
PROC PRINT;
PROC ANOVA;
CLASS BLO N P K;
MODEL Y=BLO N P N*P K N*K P*K N*P*K;
PROC ANOVA;
CLASS BLO CONP K;
MODEL Y=BLO CONP K CONP*K;
PROC ANOVA;
CLASS BLO CONK P;
MODEL Y=BLO CONK P CONK*P;
PROC ANOVA;
CLASS BLO COPK N;
MODEL Y=BLO COPK N COPK*N;
PROC ANOVA;
CLASS CONPK;
MODEL Y=CONPK;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
N
2
1 2
P
2
1 2
K
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
9
14
23

R-Cuadrada
0.765337

Raz CME
19.08627

Coef. Var.
12.86715

Cuadrado Medio
1848.14815
364.28571

F Value
5.07

Pr > F
0.0036

Y Media
148.3333

13

Fuentes de Variacin
BLO
N
P
N*P
K
N*K
P*K
N*P*K

GL
2
1
1
1
1
1
1
1

Anova SC
1033.33333
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667

Cuadrado Medio
516.66667
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667

F Value
1.42
2.24
35.87
0.05
2.24
1.65
0.05
0.73

Pr > F
0.2749
0.1565
<.0001
0.8337
0.1565
0.2202
0.8337
0.4066

F Value
5.07

Pr > F
0.0036

F Value
1.42
12.72
2.24
0.81

Pr > F
0.2749
0.0003
0.1565
0.5101

F Value
5.07

Pr > F
0.0036

F Value
1.42
2.04
35.87
0.27

Pr > F
0.2749
0.1540
<.0001
0.8428

F Value
5.07

Pr > F
0.0036

F Value
1.42
12.72
2.24
0.81

Pr > F
0.2749
0.0003
0.1565
0.5101

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
CONP
4
N1P1 N1P2 N2P1 N2P2
K
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
9
14
23

R-Cuadrada
0.765337

Raz CME
19.08627

Coef. Var.
12.86715

Fuentes de Variacin
BLO
CONP
K
CONP*K

GL
2
3
1
3

Cuadrado Medio
1848.14815
364.28571

Y Media
148.3333

Anova SC
1033.33333
13900.00000
816.66667
883.33333

Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
CONK
4
N1K1 N1K2 N2K1 N2K2
P
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
9
14
23

R-Cuadrada
0.765337

Raz CME
19.08627

Coef. Var.
12.86715

Fuentes de Variacin
BLO
CONK
P
CONK*P

GL
2
3
1
3

Cuadrado Medio
1848.14815
364.28571

Y Media
148.3333

Anova SC
1033.33333
2233.33333
13066.66667
300.00000

Cuadrado Medio
516.66667
744.44444
13066.66667
100.00000

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
3
1 2 3
COPK
4
P1K1 P1K2 P2K1 P2K2
N
2
1 2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
9
14
23

R-Cuadrada
0.765337

Raz CME
19.08627

Coef. Var.
12.86715

Fuentes de Variacin
BLO
COPK
N
COPK*N

GL
2
3
1
3

Cuadrado Medio
1848.14815
364.28571

Y Media
148.3333

Anova SC
1033.33333
13900.00000
816.66667
883.33333

Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444

14

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
CONPK
8
N1P1K1 N1P1K2 N1P2K1 N1P2K2 N2P1K1 N2P1K2 N2P2K1 N2P2K2
Nmero de observaciones
24
Variable Dependiente: Y
Suma de
Cuadrados
15600.00000
6133.33333
21733.33333

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
7
16
23

R-Cuadrada
0.717791

Raz CME
19.57890

Coef. Var.
13.19926

Fuentes de Variacin
CONPK

GL
7

Cuadrado Medio
2228.57143
383.33333

F Value
5.81

Pr > F
0.0017

F Value
5.81

Pr > F
0.0017

Y Media
148.3333

Anova SC
15600.00000

Cuadrado Medio
2228.57143

En el ANAVA de este experimento podemos interpretar que en los elementos solos, solamente el P es el que
presenta diferencias significativas es decir por lo menos un tratamiento se comporta de manera diferente a
los dems en cuanto a rendimiento de berenjena mientras que N y K no presentaron diferencias significativas
dentro del rendimiento de esta hortaliza, en cuanto a las interacciones, podemos decir que todas presentan
la misma tendencia dentro de las dems es decir no existe interaccin, en cuanto a las combinaciones
podemos mencionar que la combinacin NP tiene diferencias significativas, al igual que la PK es decir que al
menos una combinacin causa un efecto diferente de las otras combinaciones, mientras que la combinacin
NK no presenta dichas diferencias por lo que todas las combinaciones producen el mismo efecto en el
rendimiento de este cultivo; mientras que la combinacin de los tres elementos tambin presenta diferencias
significativas es decir al menos una combinacin causa un efecto diferente que a las dems combinaciones.

15

ANAVA en Parcelas Divididas en Completamente al Azar.


En este tipo de diseos experimentales no todas las fuentes de variacin se prueban contra el error estndar,
si es que existen dos errores, como SAS no lo hace por default hay que programarlo, en este ejemplo se
evalu el rendimiento de lneas de maz en toneladas por hectrea, y dosis de nitrgeno, donde parcela grande
es las lneas de maz y la parcela chica es las dosis de nitrgeno.
El error A estar dado por el anidamiento de repeticiones en lneas es decir (R:L).
Teniendo el siguiente programa de SAS:
DATA PDCA1;
INPUT Y R L N;
CARDS;
13.5 1 1 1
11.0 2 1 1
11.2 1 1 2
10.9 2 1 2
15.9 1 1 3
15.7 2 1 3
17.4 1 2 1
19.6 2 2 1
12.7 1 2 2
11.6 2 2 2
15.4 1 2 3
13.6 2 2 3
18.5 1 3 1
17.0 2 3 1
15.1 1 3 2
10.3 2 3 2
19.2 1 3 3
19.1 2 3 3
;
PROC PRINT;
PROC ANOVA;
CLASS R L N;
MODEL Y=L R(L) N L*N;
TEST H=L E=R(L);
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
R
2
1 2
L
3
1 2 3
N
3
1 2 3
Nmero de observaciones
18
Variable Dependiente: Y
Suma de
Cuadrados
157.1194444
12.0766667
169.1961111

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
11
6
17

R-Cuadrada
0.928623

Raz CME
1.418724

Coef. Var.
9.539422

Fuentes de Variacin
L
R(L)
N
L*N

GL
2
3
2
4

Cuadrado Medio
14.2835859
2.0127778

F Value
7.10

Pr > F
0.0127

F Value
9.20
1.39
18.95
4.40

Pr > F
0.0149
0.3331
0.0026
0.0533

Y Media
14.87222

Anova SC
37.03444444
8.40833333
76.28111111
35.39555556

Cuadrado Medio
18.51722222
2.80277778
38.14055556
8.84888889

Prueba de la Hiptesis Usando el ANOVA CM de R(L) como el Error tipo a


Fuentes de Variacin
L

GL
2

Anova SC
37.03444444

Cuadrado Medio
18.51722222

F Value
6.61

Pr > F
0.0796

En este ejemplo podemos observar que el factor L es decir lnea de maz es significativo, pero no est bien
probado con el error dado por SAS por lo que se tiene que pedir que se pruebe contra otro error al cual le
llamaremos error tipo a por lo que en este ejemplo podemos concluir de que L ya probado con el error tipo a
no es significativo y N probado con el error de SAS el cual si est bien probado es significativo es decir no

16

todas las dosis de nitrgeno causan el mismo efecto en cuanto al rendimiento de las lneas de maz, y no
existe interaccin lo que quiere decir que todas las dosis de N siguen la misma tendencia en cada lnea de
maz.

17

ANAVA en Parcelas Divididas en Bloques al Azar.


En este diseo al igual que el anterior es en parcelas divididas, pero esta est diseado en bloques al azar,
es decir existe un gradiente de variacin en las unidades experimentales, pero hay que decir que adems de
la parcela grande tambin bloques se prueba contra el error tipo a no contra el error que da SAS, teniendo
para este ejemplo que tenemos como gradiente de variacin la salinidad del suelo, y como parcela grande
variedades de jitomate y como parcela pequea dosis de nitrgeno, evaluando dentro de un invernadero
hidropnico como variable respuesta rendimiento.
Teniendo el siguiente programa de SAS:
DATA PDBA1;
INPUT Y BLO
CARDS;
83.7
1 1
107.8
1 1
115.9
1 1
120.6
1 1
120.0
1 1
90.5
1 2
84.5
1 2
84.9
1 2
84.3
1 2
85.2
1 2
153.4
1 3
61.4
1 3
81.9
1 3
72.9
1 3
83.2
1 3
85.8
2 1
89.7
2 1
105.9
2 1
120.9
2 1
105.8
2 1
71.6
2 2
82.6
2 2
83.8
2 2
105.8
2 2
118.9
2 2
58.4
2 3
70.7
2 3
84.2
2 3
78.7
2 3
81.9
2 3
72.5
3 1
103.5
3 1
95.2
3 1
114.1
3 1
126.4
3 1
82.9
3 2
80.3
3 2
79.6
3 2
87.3
3 2
93.0
3 2
55.7
3 3
64.0
3 3
65.0
3 3
75.8
3 3
74.7
3 3
84.0
4 1
95.6
4 1
82.6
4 1
104.2
4 1
119.0
4 1
70.4
4 2
79.4
4 2
85.8
4 2
83.6
4 2
105.8
4 2
48.7
4 3
57.8
4 3
64.3
4 3
59.9
4 3
64.3
4 3
;

N;

1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

18

PROC PRINT;
PROC ANOVA;
CLASS BLO V N;
MODEL Y=BLO V N BLO*V V*N;
TEST H=BLO V E=BLO*V;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
4
1 2 3 4
V
3
1 2 3
N
5
1 2 3 4 5
Nmero de observaciones
60
Variable Dependiente: Y
Suma de
Cuadrados
17389.63850
7586.49000
24976.12850

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
23
36
59

R-Cuadrada
0.696250

Raz CME
14.51674

Coef. Var.
16.58962

Fuentes de Variacin
BLO
V
N
BLO*V
V*N

GL
3
2
4
6
8

Cuadrado Medio
756.07124
210.73583

F Value
3.59

Pr > F
0.0003

F Value
2.97
21.11
3.37
1.14
1.38

Pr > F
0.0446
<.0001
0.0193
0.3570
0.2378

Y Media
87.50500

Anova SC
1877.784500
8896.693000
2839.224333
1447.423000
2328.513667

Cuadrado Medio
625.928167
4448.346500
709.806083
241.237167
291.064208

Prueba de la Hiptesis Usando el ANOVA CM de BLO*V como el Error Tipo a


Fuentes de Variacin
BLO
V

GL
3
2

Anova SC
1877.784500
8896.693000

Cuadrado Medio
625.928167
4448.346500

F Value
2.59
18.44

Pr > F
0.1478
0.0027

En este ejemplo podemos interpretar lo siguiente: que en lo que se refiere a bloques, todos los bloques causan
el mismo efecto en cuanto al rendimiento, mientras que variedades y dosis de N si presentas diferencias
significativas, pero las dosis de N presentan la misma tendencia en cada Variedad. Por lo que podemos decir
que ni existe interaccin entre variedades y dosis de N.

19

ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Fijo.


Esta se debe de realizar cuando se tengan diferentes experimentos sobre un mismo tema.
Por ejemplo el siguiente se trata de un ensayo comparativo de cinco variedades de trigo, en dos campos
diferentes y se toma como variable respuesta los rendimientos obtenidos en 5 repeticiones en bloque es decir
5 bloques diferentes:
Teniendo el siguiente programa de SAS:
OPTIONS NODATE NOCENTER;
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC ANOVA; BY L;
CLASS BLO V;
MODEL Y= BLO V;
PROC ANOVA;
CLASS BLO L V;
MODEL Y=L V L*V BLO(L);
RUN;

20

Obteniendo los siguientes resultados: Primero por localidades, luego general.


Localidad 1
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
5
1 2 3 4 5
Nmero de observaciones
25
Variable Dependiente: Y
Suma de
Cuadrados
601.9200000
185.8400000
787.7600000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
8
16
24

R-Cuadrada
0.764091

Raz CME
3.408079

Coef. Var.
8.045511

Fuentes de Variacin
BLO
V

GL
4
4

Cuadrado Medio
75.2400000
11.6150000

F Value
6.48

Pr > F
0.0008

F Value
10.50
2.46

Pr > F
0.0002
0.0877

F Value
2.47

Pr > F
0.0589

F Value
3.13
1.81

Pr > F
0.0445
0.1757

F Value
3.47

Pr > F
0.0012

F Value
7.40
1.54
2.33
4.51

Pr > F
0.0105
0.2151
0.0771
0.0010

Y Media
42.36000

Anova SC
487.7600000
114.1600000

Cuadrado Medio
121.9400000
28.5400000

Localidad 2
Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
5
1 2 3 4 5
Nmero de observaciones
25
Variable Dependiente: Y
Suma de
Cuadrados
993.280000
804.560000
1797.840000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
8
16
24

R-Cuadrada
0.552485

Raz CME
7.091192

Coef. Var.
18.62183

Fuentes de Variacin
BLO
V
General del experimento

GL
4
4

Cuadrado Medio
124.160000
50.285000

Y Media
38.08000

Anova SC
628.6400000
364.6400000

Cuadrado Medio
157.1600000
91.1600000

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
L
2
1 2
V
5
1 2 3 4 5
Nmero de observaciones
50
Variable Dependiente: Y
Suma de
Cuadrados
1824.180000
990.400000
2814.580000

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
17
32
49

R-Cuadrada
0.648118

Raz CME
5.563272

Coef. Var.
13.83210

Fuentes de Variacin
L
V
L*V
BLO(L)

GL
1
4
4
8

Cuadrado Medio
107.304706
30.950000

Y Media
40.22000

Anova SC
228.980000
190.280000
288.520000
1116.400000

Cuadrado Medio
228.980000
47.570000
72.130000
139.550000

En este tipo de experimentos primero se evala como un simple bloques al azar por cada localidad, y despus
se evala junto, por lo que podemos decir que en la localidad 1 solo existen diferencias significativas en cuanto
a los bloques, no en cuanto a las variedades de trigo, de igual manera se presenta la localidad 2 es decir
solamente los bloque presentan diferencias significativas, no variedades, en cuanto al general podemos decir
que localidades si presenta diferencias significativas, es decir son diferentes, as tambin son significativos

21

los bloques anidados en localidades, lo que pudimos ver al correr los datos por localidad. Tanto las variedades
como la interaccin localidades por variedades, no son significativos, estamos tomando en cuenta que es un
modelo fijo por lo que todas las hiptesis se prueban con el error experimental.

22

ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Aleatorio.


Esto es cuando todas las F. V. son aleatorias, para este caso no todas las F. V. para obtener Fc se prueban
contra el error experimental para SAS por lo que hay que hacer pruebas, segn la F. V. por sus componentes
de Varianza, es decir su Esperanza de Cuadrado Medio.
Por lo que se tendra el siguiente programa en SAS:
OPTIONS NODATE NOCENTER;
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC ANOVA;
CLASS BLO L V;
MODEL Y=L V L*V BLO(L);
TEST H=V E=L*V;
RUN;

23

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Informacin de Niveles de Clases
Clase

Nivel

Valor

BLO

1 2 3 4 5

1 2

1 2 3 4 5

Nmero de observaciones

50

Variable Dependiente: Y
Suma de
Fuentes de Variacin

GL

Cuadrados

Modelo

17

1824.180000

107.304706

Error

32

990.400000

30.950000

Total Corregido

49

2814.580000

R-Cuadrada

Coef. Var.

Raz CME

Y Media

13.83210

5.563272

40.22000

0.648118

Fuentes de Variacin

GL

Anova SC

Cuadrado Medio

F Value
3.47

Pr > F
0.0012

Cuadrado Medio

F Value

Pr > F

228.980000

228.980000

7.40

0.0105

190.280000

47.570000

1.54

0.2151

L*V

288.520000

72.130000

2.33

0.0771

BLO(L)

1116.400000

139.550000

4.51

0.0010

Prueba de Hiptesis usando el CM de L*V como el trmino del Error


Fuentes de Variacin
V

GL

Anova SC

190.2800000

Cuadrado Medio

F Value

Pr > F

47.5700000

0.66

0.6517

En este caso aunque se prob a la F. V. Variedades, con la interaccin L*V no es significativa pero tambin
hay que decir que el termino Lugares no tiene termino para probarlo por lo que se dice que No Existe Prueba
Exacta (NEPE)., y solo estn bien probados con el Error Experimental de SAS L*V y BLO(L) y de estas
solamente bloques anidados en lugares tiene diferencias significativas, con un alfa igual a 0.05 es decir con
el 5% de probabilidad de equivocarnos

24

Componentes de Varianza de una Serie de Experimentos en Bloques al Azar.


Esto es para calculas los estimadores de Varianza para ver la confiabilidad de los datos obtenidos en campo,
por lo que varianzas negativas se supone que no son confiables puesto que por ser cuadrados no puede
haber negativos, por lo que si tenemos varianzas negativas debemos no utilizar los datos para realizar el
Anlisis Estadstico.
Para este procedimiento el programa de SAS es el siguiente:
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC VARCOMP;
CLASS BLO L V;
MODEL Y=L V L*V BLO(L);
RUN;

Obteniendo los siguientes resultados:


Procedimiento de Estimacin de Componentes de Varianza
Informacin de Niveles de Clases
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
L
2
1 2
V
5
1 2 3 4 5
Nmero de observaciones
50

25

Fuente de Variacin
L
V
L*V
BLO(L)
Error

MIVQUE(0) Matriz de SC
L
V
625.00000
2.7719E-30
2.7719E-30
400.00000
125.00000
200.00000
125.00000
9.3459E-31
25.00000
40.00000

L*V
125.00000
200.00000
225.00000
25.00000
45.00000

Fuente de Variacin
L
V
L*V
BLO(L)
Error

MIVQUE(0) Matriz de SC
BLO(L)
Error
125.00000
25.00000
9.3459E-31
40.00000
25.00000
45.00000
225.00000
45.00000
45.00000
49.00000

Y
5724.5
1902.8
3538.9
6726.9
2814.6

Procedimiento de Estimacin de Componentes de Varianza


MIVQUE(0) Estimados
Componente de Varianza
Var(L)
Var(V)
Var(L*V)
Var(BLO(L))
Var(Error)

Y
1.93000
-2.45600
8.23600
21.72000
30.95000

En este caso en especial tenemos que la varianza estimada de V es negativa por lo que hay que checar los
datos porque probablemente exista un error en la toma o en la trascripcin, si no diramos que los datos no
son confiables y por lo tanto no se deben utilizar para realizar algn anlisis estadstico.

26

ANAVA de un Diseo Experimental Ltice.


Este diseo se utiliza cuando se tienen bloques incompletos para poder formar los bloques completos, como
repeticiones, este solo se puede hacerse si el nmero de tratamientos es un cuadrado perfecto excepto para
el cuadrado de 6.
En este caso tenemos un ltice 7 por 7 del cual la variable respuesta es rendimiento, este experimento fue
realizado en variedades de trigo y triticale con un gradiente de variacin para bloques de fertilidad de suelos
y un nmero base para K de 7; y un =1 es decir 49 tratamientos que son las variedades de trigo y triticale 7
unidades experimentales por bloque incompleto los primeros 35 tratamientos son de trigo y los restantes de
triticale, se utilizaron dos repeticiones.
Teniendo el siguiente programa de SAS:
data latice1;
input group block treatment y;
cards;
1
5
1
2782
2
7
1
3145
1
3
2
2281
2
1
2
2106
1
7
3
2509
2
7
3
2825
1
7
4
3131
2
1
4
2775
1
6
5
1866
2
3
5
1155
1
4
6
2092
2
1
6
3188
1
7
7
3335
2
4
7
2795
1
2
8
2669
2
6
8
2947
1
5
9
2574
2
6
9
1672
1
4
10
2399
2
7
10
3418
1
2
11
3522
2
7
11
2914
1
2
12
3617
2
5
12
2235
1
1
13
3501
2
7
13
3462
1
3
14
2992
2
5
14
2928
1
6
15
2681
2
7
15
2633
1
4
16
2414
2
2
16
2971
1
3
17
2514
2
6
17
3140
1
3
18
2758
2
3
18
2431
1
7
19
3909
2
3
19
2812
1
5
20
3227
2
4
20
3159
1
6
21
3346
2
6
21
3439
1
6
22
3798
2
4
22
3389
1
6
23
3270
2
2
23
3387
1
1
24
3505
2
4
24
2776
1
1
25
2838
2
3
25
2841
1
2
26
3206
2
3
26
2339
1
5
27
2799
2
2
27
3315
1
4
28
2909
2
6
28
2931
1
6
29
2542
2
1
29
3272
1
2
30
1333

27

2
4
1
1
2
5
1
3
2
7
1
1
2
6
1
7
2
6
1
1
2
2
1
1
2
1
1
4
2
5
1
2
2
2
1
2
2
1
1
4
2
3
1
6
2
5
1
5
2
1
1
7
2
5
1
7
2
2
1
5
2
5
1
5
2
3
1
4
2
4
1
3
2
4
1
3
2
2
;
proc print;
proc lattice;
run;

30
31
31
32
32
33
33
34
34
35
35
36
36
37
37
38
38
39
39
40
40
41
41
42
42
43
43
44
44
45
45
46
46
47
47
48
48
49
49

2883
3002
3199
2712
3295
2806
2053
3020
2275
3286
4033
3056
3182
2815
3089
3119
3130
2780
2254
1902
2662
3354
3280
3506
3949
3102
3250
3541
3772
1878
1692
3081
3237
2476
2506
1944
2864
2381
2456

Obteniendo los siguientes resultados:


El procedimiento Ltice
Anlisis de Varianza para y
Fuente de Variacin
Repeticiones
Bloques dentro de Repeticiones (Ajus.)
Componente B
Tratamientos (Sin ajus.)
Error Intra Bloque
Error Efectivo del Bloque Completo
Total

GL
1
12
12
48
36
48
97

Suma de
Cuadrados
19461
2899741
2899741
21493124
5825300
8725041
30237625

Cuadrado
Medio
19461
241645
241645
447773
161814
181772
311728

Estadsticas Adicionales para y


Descripcin
Valor
Varianza de Diferencia
161814
LSD con =0.01
1078.95
LSD con =0.05
808.80
Eficiencia Relativa de RCBD
103.76

SAS solamente da algunos resultados para la operacin ltice pero los datos restantes hay que hacerlos a
mano, como lo son las Fc para ver si se rechaza o no la H0 para realizarlo se utilizan los datos ya antes
obtenidos por SAS por lo que para conseguir la Fc se divide el cuadro medio de tratamientos entre el cuadrado
medio del error efectivo y para la Ft se obtiene Buscando a F con los grados de libertad de tratamientos en el
numerador y los grados de libertad del error intrabloque y un en este caso 0.05.

Quedando que la Fc= 447773/181772= 2.46 y tenemos una F t= 4.69 tomando en cuenta que en las tablas
tenemos solamente 40 grados de libertad en lugar de 48 y 36 puesto que no existen tablas con estos valores,

28

lo que obtenemos es que no se rechaza H0 por lo que no existe diferencia entre tratamientos, pero como la
eficiencia relativa es menor al 110% no podemos realizar el anlisis en bloque al azar donde grupos
(repeticiones) es bloque, por lo que tenemos que dejar de esta manera el anlisis estadstico.

29

ANACOVA en Diseo Experimental Completamente al Azar


Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que
no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento de una
huerta de Durazno, la covariable es grosor de la rama tratada, y los tratamientos son dosis de un fertilizante
foliar orgnico.
Teniendo el siguiente programa de SAS:
DATA ANACOCA2;
INPUT X Y T;
CARDS;
25.0 22.0 1
24.5 21.5 2
27.0 18.6 3
23.1 23.0 1
22.8 22.6 2
20.0 19.8 3
25.2 25.0 1
21.0 24.0 2
23.4 21.0 3
20.0 25.5 1
20.3 23.8 2
24.0 22.5 3
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T X;
LSMEANS T;
RUN;

Obteniendo los siguientes resultados:


Procedimiento GLM
Informacin de Niveles de Clases
Clase
Nivel
Valor
T
3
1 2 3
Nmero de observaciones
12
Variable Dependiente: Y
Suma de
Cuadrados
29.60682387
15.80234280
45.40916667

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
3
8
11

R-Cuadrada
0.652001

Raz CME
1.405451

Coef. Var.
6.262686

Cuadrado Medio
9.86894129
1.97529285

F Value
5.00

Pr > F
0.0306

Y Media
22.44167

Fuentes de Variacin
T
X

GL
2
1

SC Tipo I
24.82666667
4.78015720

Cuadrado Medio
12.41333333
4.78015720

F Value
6.28
2.42

Pr > F
0.0229
0.1584

Fuentes de Variacin
T
X

GL
2
1

SC Tipo III
22.26403038
4.78015720

Cuadrado Medio
11.13201519
4.78015720

F Value
5.64
2.42

Pr > F
0.0297
0.1584

Procedimiento GLM
Cuadrado Medio Mnimo
T
Y LSMEAN
1
23.9652342
2
22.7118169
3
20.6479489

Para este caso en especial, se concluye de que tratamientos tiene diferencias significativas tanto en los datos
normales como en los datos ajustados, pero la covariable no tiene influencia en la variable respuesta, si lo
hubiera se toma la Pr > F de los datos ajustados, si no como es este caso se toma de los datos originales.

30

ANACOVA en diseo Experimental Bloques al Azar.


Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que
no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento en una
huerta de mango y la covariable es el grueso del tronco del rbol y los tratamientos son dosis de paclobutrazol
y un gradiente de variacin de humedad en el suelo.
Teniendo el siguiente programa de SAS:
DATA ANACOBA1;
INPUT X Y TRA BLO;
CARDS;
20.0 12.0 1 1
19.5 11.5 2 1
22.0 08.6 3 1
18.0 13.0 1 2
17.8 12.6 2 2
15.0 09.8 3 2
20.0 15.0 1 3
16.0 14.0 2 3
18.0 11.0 3 3
15.0 15.5 1 4
15.0 13.8 2 4
19.0 12.5 3 4
;
PROC PRINT;
PROC GLM;
CLASS TRA BLO;
MODEL Y=BLO TRA X;
LSMEANS TRA;
RUN;

Obteniendo los siguientes resultados:


Procedimiento GLM
Informacin de Niveles de Clases
Clase
Nivel
Valor
TRA
3
1 2 3
BLO
4
1 2 3 4
Nmero de observaciones
12
Variable Dependiente: Y
Suma de
Cuadrados
44.39176243
1.01740424
45.40916667

Fuentes de Variacin
Modelo
Error
Total Corregido

GL
6
5
11

R-Cuadrada
0.977595

Raz CME
0.451089

Coef. Var.
3.625628

Cuadrado Medio
7.39862707
0.20348085

F Value
36.36

Pr > F
0.0006

Y Media
12.44167

Fuentes de Variacin
BLO
TRA
X

GL
3
2
1

SC Tipo I
19.39583333
24.82666667
0.16926243

Cuadrado Medio
6.46527778
12.41333333
0.16926243

F Value
31.77
61.00
0.83

Pr > F
0.0011
0.0003
0.4036

Fuentes de Variacin
BLO
TRA
X

GL
3
2
1

SC Tipo III
14.49515300
24.77225276
0.16926243

Cuadrado Medio
4.83171767
12.38612638
0.16926243

F Value
23.75
60.87
0.83

Pr > F
0.0022
0.0003
0.4036

Procedimiento GLM
Cuadrado Medio Mnimo
TRA
Y LSMEAN
1
13.8486418
2
13.0490879
3
10.4272703

Esto ltimo es para poder hacer pruebas de medias.

En este anlisis podemos concluir que tanto los bloques como los tratamientos son significativamente
diferentes pero la covariable no es significativa, esto es tanto en los valores normales como en los valores
ajustados, esto quiere decir que tanto los tratamientos de paclobutrazol como los bloque que son por la
humedad en el suelo, son significativos, no as el dimetro del tronco.

31

Prueba de Comparacin de Medias DMS (LSD).


Esta prueba nos muestra en anlisis de varianza las diferencias que existen entre las medias de los
tratamientos de todos los diseos bsicos y de los factoriales.
En este caso ocuparemos el ejemplo del problema de completamente al azar.
Teniendo el siguiente programa para SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /LSD ALPHA=0.05
MEANS T /LSD ALPHA=0.01
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Prueba t (LSD) para Y
Alpha
0.05
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Valor Crtico de t
2.06390
Diferencia Mnima Significativa
8.3371
Medias con la misma letra no tienen diferencias significativas.
Groupo t
A
B
C
B
C

Media
40.771
29.729
21.771
19.771

N
7
7
7
7

T
1
2
3
4

En este caso en particular podemos decir que el mejor tratamiento es el nmero 1, seguido del nmero 2 pero
sin superar al nmero 3 y que el cuatro sin ser superado por el tres es el peor tratamiento, este es
considerando un 5% de error es decir con esa probabilidad de equivocarnos en la comparacin

32

Procedimiento ANOVA
Prueba t (LSD) para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Valor Crtico de t
2.79694
Diferencia Mnima Significativa
11.298
Medias con la misma letra no tienen diferencias significativas.
Groupo t
A
B
A
B
B

Media
40.771
29.729
21.771
19.771

N
7
7
7
7

T
1
2
3
4

Este es el mismo experimento pero solamente que ahora se le da un valor de alfa diferente, es decir que en
este ejemplo tenemos la probabilidad de equivocarnos del 1% en lugar del anterior que es del 5% por lo que
podemos decir que el tratamiento 1 es el mejor pero sin superar estadsticamente al tratamiento 2, mientras
que los tratamientos 2, 3 y 4 no presentan diferencias estadsticas.

33

Prueba de comparacin de Medias Tukey.


Esta es la prueba ms segura puesto que es la ms precisa, pero solo sirve para pruebas balanceadas.
En este caso utilizaremos el ejemplo de bloques al azar.
Teniendo el siguiente programa de SAS:
DATA BA1;
INPUT Y T B;
CARDS;
10.1 1 1
8.9 1 2
2.6 1 3
7.4 1 4
0.8 1 5
9.2 2 1
9.3 2 2
3.1 2 3
6.0 2 4
1.2 2 5
4.9 3 1
5.2 3 2
1.9 3 3
5.4 3 4
0.1 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL Y=T B;
MEANS Y B/TUKEY ALPHA=0.05;
MEANS Y B/TUKEY ALPHA=0.01;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.05
Grados de libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor Critico del Rango Studentizado 4.04101
Diferencia Mnima Significativa
2.0659
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
B

Medias
5.9600
5.7600
3.5000

N
5
5
5

T
1
2
3

Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.05
Grados de libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor Critico del Rango Studentizado 4.88575
Diferencia Mnima Significativa
3.2246
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
A
B
B

Medias
8.0667
7.8000
6.2667
2.5333
0.7000

N
3
3
3
3
3

B
1
2
4
3
5

En este ejemplo por ser bloques al azar podemos observar de que existe una prueba para tratamientos y otra
para bloques, en el primero nos menciona que con una probabilidad de error tipo I de un 5% tenemos que el
tratamiento 1 sin superar al tratamiento 2 son los mejores, mientras que el tres si presenta diferencias con los
otros dos. En cuanto a bloques podemos decir que el mejor es el 1 sin superar al 2 y al 4 pero el 3 y el 5 son
los peores bloques.

34

Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.01
Grados de Libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor crtico del Rango Studentizado 5.63531
Diferencia Mnima Significativa
2.881
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
A

Medias
5.9600
5.7600
3.5000

N
5
5
5

T
1
2
3

Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.01
Grados de libertad del Error
8
Cuadrado Medio del Error
1.306833
Valor Critico del Rango Studentizado 6.62515
Diferencia Mnima Significativa
4.3727
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
B A
B
C
C

Medias
8.0667
7.8000
6.2667
2.5333
0.7000

N
3
3
3
3
3

B
1
2
4
3
5

En este caso es la misma prueba que el anterior pero ahora con una probabilidad de error del 1%, por lo que
tenemos que tratamientos no presentan diferencias significativas, lo que quiere decir que todos los
tratamientos son iguales, mientras que en bloques tenemos tres grupos Tukey los mejores son el bloque 1 si
superar al 2 y al 4 pero el 4 no supera al 3 y el 5 es el peor pero sin ser superado estadsticamente del 3.

35

Pruebas de Comparacin de Medias de Rangos Mltiple de Duncan.


Es una de las pruebas ms utilizadas en experimentos en frutales, sobre todo para la comparacin de medias
de tratamientos para adelantar cosecha en Mango, el problema de esta prueba es que no es tan estricta como
Tukey pero s bastante confiable.
La utilizaremos en un ejemplo en Completamente al Azar.
Para lo que tenemos el siguiente Programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /DUNCAN ALPHA=0.05;
MEANS T /DUNCAN ALPHA=0.01;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Prueba de Rangos Mltiples de Duncan para Y
Alpha
0.05
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Crtico

2
8.337

3
8.756

4
9.026

Medias con la misma letra no presentan diferencias significativas


Grupo
Duncan
Medias
N
T
A
40.771
7
1
B
29.729
7
2
C
B
21.771
7
3
C
19.771
7
4

En esta prueba es con alfa igual a 0.05, y podemos observar que el tratamiento 1 es el mejor y no lo igualan
estadsticamente los dems tratamientos, en segundo lugar el tratamiento 2 pero sin superar estadsticamente
al 3, y el peor es el tratamiento 4 pero sin ser superado estadsticamente con el tres, como ya se dijo esta es
una prueba de rangos mltiples lo que quiere decir de que por ejemplo para comparar el tratamiento 1 con el
tres se cuentan los tratamientos que se Encuentran all obviamente contando los que vamos a comparar en

36

este caso 3 entonces se toma el valor critico de nmero de medias 3 y si la diferencia es superior a este valor
entonces son diferentes estadsticamente.
Procedimiento ANOVA
Prueba de Rangos Mltiples de Duncan para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Crtico

2
11.30

3
11.78

4
12.11

Medias con la misma letra no presentan diferencias significativas


Grupo
Duncan
Medias
N
T
A
40.771
7
1
B
A
29.729
7
2
B
21.771
7
3
B
19.771
7
4

En este caso con un alfa de 0.01 solamente tenemos dos grupos Duncan el primero con el mejor tratamiento
que es el 1 sin superar estadsticamente al 2 pero el 2, 3 y 4 no presentan diferencias significativas
estadsticamente hablando.

37

Prueba de Comparacin de Medias SNK (Student-Newman-Keuls).


Esta es muy parecida a la prueba de rangos mltiples de Duncan pero solamente que esta ocupa las tablas
de Tukey para obtener la diferencia mnima significativa
Utilizando el mismo ejemplo de Duncan en completamente al Azar.
Teniendo el siguiente programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T/ SNK ALPHA=0.05;
MEANS T/ SNK ALPHA=0.01;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Prueba Student-Newman-Keuls para Y
Alpha
0.05
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Crtico

2
8.3371399

3
10.0878

4
11.143415

Medias con la misma letra no presentan diferencias significativas


Grupo
SNK
A
B
B
B

Media
40.771
29.729
21.771
19.771

N
7
7
7
7

T
1
2
3
4

En este caso y con un alfa del 0.05 podemos decir que el tratamiento 1 es el mejor tratamiento, y el 2, 3 y 4
no presentan diferencias significativas entre ellos, se sigue el mismo procedimiento que para la prueba de
Duncan pero solamente que el valor crtico, es decir la diferencia mnima significativa, son diferentes a
Duncan, puesto que esta utiliza las tablas de Tukey.

38

Procedimiento ANOVA
Prueba Student-Newman-Keuls para Y
Alpha
0.01
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Nmero de Medias
Rango Critico

2
11.298964

3
12.982623

4
14.014182

Medias con la misma letra no presentan deferencias significativas


Grupo
SNK
A
B A
B
B

Media
40.771
29.729
21.771
19.771

N
7
7
7
7

T
1
2
3
4

Para este caso la prueba SNK se realiz con un alfa de 0.01 y tenemos los siguientes resultados, el
tratamiento 1 es el mejor pero sin superar el tratamiento 2 pero los tratamientos 2,3 y 4 no presentan
diferencias significativas estadsticamente hablando es decir son iguales.

39

Prueba de Comparacin de Medias de Dunnett.


Esta prueba no es muy popular entre los investigadores, por su dificultad de interpretar y por no formar grupos,
adems de solamente comparar el tratamiento testigo con todos los otros tratamientos y no los dems
tratamientos entre s.
Para lo que ocuparemos el mismo ejemplo que para Duncan utilizando como testigo el tratamiento 1.
Para lo que tenemos el siguiente programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /DUNNETT;
/*TRATAMIENTO 1 ES EL TESTIGO PARA SAS*/;
RUN;

Obteniendo los siguientes resultados:


Procedimiento ANOVA
Prueba t de Dunnett para Y
Alpha
0.05
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Valor Crtico de T de Dunnett
2.50672
Diferencia Mnima Significativa
10.126
Comparacin significativa con un nivel de 0.05 es indicado con ***.
Comparacin T
2
- 1
3
- 1
4
- 1

Diferencia
entre Medias
-11.043
-19.000
-21.000

Lmite de confianza
Simultanea al 95%
-21.169
-0.917 ***
-29.126
-8.874 ***
-31.126 -10.874 ***

En este caso podemos observar que todos los tratamientos son diferentes significativamente con respecto al
testigo, se pueden realizar a mano las pruebas entre los tratamientos con la diferencia mnima significativa, si
as lo requiere el investigador.

40

Prueba de Comparacin de Medias de Sheff.


Esta es una prueba de contrastes ortogonales por lo que para programarla en SAS primero se deben de tener
los contrastes que se van a realizar y se realiza para la comparacin de una media con varias o de una contra
una o ms medias, pero tambin al igual que la anterior no es la ms fcil de interpretar, por lo que aunque
es usada no es de las populares entre la comunidad cientfica mundial, adems esta prueba es utilizada en
el Procedimiento GLM no en el procedimiento ANOVA.
Realizaremos la prueba con los mismos datos completamente al azar utilizados en las pruebas anteriores
Por lo que tenemos el siguiente programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T;
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT3
CONTRAST "TRAT4
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT3
CONTRAST "TRAT3
CONTRAST "TRAT3
CONTRAST "TRAT4
CONTRAST "TRAT4
CONTRAST "TRAT4
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT3
RUN;

VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS

TRAT2,TRAT3,TRAT4" T 3 -1 -1 -1;
TRAT1,TRAT3,TRAT4" T -1 3 -1 -1;
TRAT1,TRAT2,TRAT4" T -1 -1 3 -1;
TRAT1,TRAT2,TRAT3" T -1 -1 -1 3;
TRAT2,TRAT3" T 2 -1 -1 0;
TRAT2,TRAT4" T 2 -1 0 -1;
TRAT3,TRAT4" T 2 0 -1 -1;
TRAT1,TRAT3" T -1 2 -1 0;
TRAT1,TRAT4" T -1 2 0 -1;
TRAT3,TRAT4" T 0 2 -1 -1;
TRAT1,TRAT2" T -1 -1 2 0;
TRAT1,TRAT4" T -1 0 2 -1;
TRAT2,TRAT4" T 0 -1 2 -1;
TRAT1,TRAT2" T -1 -1 0 2;
TRAT1,TRAT3" T -1 0 -1 2;
TRAT2,TRAT3" T 0 -1 -1 2;
TRAT2" T 1 -1 0 0;
TRAT3" T 1 0 -1 0;
TRAT4" T 1 0 0 -1;
TRAT3" T 0 1 -1 0;
TRAT4" T 0 1 0 -1;
TRAT4" T 0 0 1 -1;

(NOTA: Tambin puede utilizarse estimate en lugar de contrast, la diferencia es el estadstico de


prueba, estimate utiliza t de Student y contrast utiliza F)

41

Obteniendo los siguientes resultados:


Procedimiento GLM
Variable dependiente Y
Contraste
TRAT1 VS TRAT2,TRAT3,TRAT4
TRAT2 VS TRAT1,TRAT3,TRAT4
TRAT3 VS TRAT1,TRAT2,TRAT4
TRAT4 VS TRAT1,TRAT2,TRAT3
TRAT1 VS TRAT2,TRAT3
TRAT1 VS TRAT2,TRAT4
TRAT1 VS TRAT3,TRAT4
TRAT2 VS TRAT1,TRAT3
TRAT2 VS TRAT1,TRAT4
TRAT2 VS TRAT3,TRAT4
TRAT3 VS TRAT1,TRAT2
TRAT3 VS TRAT1,TRAT4
TRAT3 VS TRAT2,TRAT4
TRAT4 VS TRAT1,TRAT2
TRAT4 VS TRAT1,TRAT3
TRAT4 VS TRAT2,TRAT3
TRAT1 VS TRAT2
TRAT1 VS TRAT3
TRAT1 VS TRAT4
TRAT2 VS TRAT3
TRAT2 VS TRAT4
TRAT3 VS TRAT4

GL
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Contraste SC
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000

Cuadrado Medio
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000

F Value
26.61
0.48
6.36
11.09
18.44
20.97
32.68
0.19
0.02
6.56
14.84
5.90
0.72
19.58
10.81
2.92
7.47
22.12
27.03
3.88
6.08
0.25

Pr > F
<.0001
0.4941
0.0187
0.0028
0.0003
0.0001
<.0001
0.6631
0.8780
0.0172
0.0008
0.0230
0.4029
0.0002
0.0031
0.1004
0.0116
<.0001
<.0001
0.0605
0.0212
0.6250

En estos datos lo que se tiene que hacer es comparar el Pr > F si este es menor al alfa con la que estamos
comparando entonces si hay diferencias significativas, si no , despus de esto se ordenan y se le pueden
poner letras, pero realmente es bastante complejo, por ejemplo de este ejemplo pudiramos decir el
tratamiento 1 es diferente significativamente de los tratamientos 2,3 y 4; el tratamiento 3 y el tratamiento 4 al
igual que el 1 es diferente estadsticamente de los otros tres tratamientos, y as hay que evaluar cada uno de
los contrastes, la verdad se recomienda solo poner los contrastes que realmente el investigador considere
ms importantes si no es un mundo de informacin casi no interpretable.

42

Transformacin de Datos mediante Raz Cuadrada.


Esto se realiza cuando uno sospeche que los datos no tienen una distribucin normal o varianzas
homogneas, es decir las condiciones para poder realizar el Anlisis de Varianza.
En este caso utilizaremos un experimento en bloques al azar donde la variable respuesta fue nmero de frutos
por pancula en rboles de Mango, donde el gradiente de variacin es que se tom como un bloque a un
rbol.
Teniendo el siguiente programa de SAS
DATA BA1;
INPUT Y T B;
YTRC=SQRT(Y+0.5);
CARDS;
10 1 1
8 1 2
2 1 3
7 1 4
0 1 5
9 2 1
9 2 2
3 2 3
6 2 4
1 2 5
4 3 1
5 3 2
1 3 3
5 3 4
0 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL YTRC=T B;
RUN;

Obteniendo los siguientes resultados:


Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0

T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3

B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

YTRC
3.24037
2.91548
1.58114
2.73861
0.70711
3.08221
3.08221
1.87083
2.54951
1.22474
2.12132
2.34521
1.22474
2.34521
0.70711

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valor
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTRC
Suma de
Cuadrados
9.90767710
0.44829939
10.35597649

Fuente de Variacin
Modelo
Error
Total Corregido

GL
6
8
14

R-Cuadrada
0.956711

Raz CME
0.236722

Coef. Var.
11.18874

Fuente de Variacin
T
B

GL
2
4

Cuadrado Medio
1.65127952
0.05603742

F Value
29.47

Pr > F
<.0001

F Value
9.36
39.52

Pr > F
0.0080
<.0001

Y Media
2.115719

Anova SC
1.04946413
8.85821297

Cuadrado Medio
0.52473206
2.21455324

En este caso podemos ver que en el print aparece la fila de datos transformados, y con esta se realiza el
anlisis de varianza evitando problemas de Normalidad y Homogeneidad de Varianzas.

43

Transformacin de Datos mediante Logaritmo natural y en base 10.


Para esto se utilizara el ejemplo anterior pero para ambos tipos de logaritmos, pero como existen ceros
entonces se les suma una constante que en este caso en 1.
Teniendo el siguiente programa para SAS:
DATA BA1;
INPUT Y T B;
YTLD=LOG10(Y+1);
YTLN=LOG(Y+1);
CARDS;
10 1 1
8 1 2
2 1 3
7 1 4
0 1 5
9 2 1
9 2 2
3 2 3
6 2 4
1 2 5
4 3 1
5 3 2
1 3 3
5 3 4
0 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL YTLD=T B;
PROC ANOVA;
CLASS T B;
MODEL YTLN=T B;
RUN;

Obteniendo los siguientes resultados:


Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0

T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3

B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

YTLD
1.04139
0.95424
0.47712
0.90309
0.00000
1.00000
1.00000
0.60206
0.84510
0.30103
0.69897
0.77815
0.30103
0.77815
0.00000

YTLN
2.39790
2.19722
1.09861
2.07944
0.00000
2.30259
2.30259
1.38629
1.94591
0.69315
1.60944
1.79176
0.69315
1.79176
0.00000

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTLD
Suma de
Cuadrados
1.68598239
0.06255258
1.74853498

Fuente de Variacin
Modelo
Error
Total Corregido

GL
6
8
14

R-Cuadrada
0.964226

Raz CME
0.088426

Coef. Var.
13.70182

Fuente de Variacin
T
B

GL
2
4

Cuadrado Medio
0.28099707
0.00781907

F Value
35.94

Pr > F
<.0001

F Value
9.51
49.15

Pr > F
0.0077
<.0001

Y Media
0.645356

Anova SC
0.14872544
1.53725695

Cuadrado Medio
0.07436272
0.38431424

44

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
Nmero de observaciones
15
Variable Dependiente: YTLN
Suma de
Cuadrados
8.93890687
0.33164742
9.27055429

Fuente de Variacin
Modelo
Error
Total Corregido

GL
6
8
14

R-Cuadrada
0.964226

Raz CME
0.203607

Coef. Var.
13.70182

Fuente de Variacin
T
B

GL
2
4

Cuadrado Medio
1.48981781
0.04145593

F Value
35.94

Pr > F
<.0001

F Value
9.51
49.15

Pr > F
0.0077
<.0001

Y Media
1.485987

Anova SC
0.78852714
8.15037973

Cuadrado Medio
0.39426357
2.03759493

En ambos casos podemos observar que los datos aparecen en el print al igual que en el caso anterior pero
en cada uno de los anlisis de varianza es diferente pero el resultado es el mismo en cuanto a la F calculada
y la prueba de P value

45

Transformacin de Datos Angular (Para Porcentajes)


En este caso este tipo de transformacin se recomienda a casos donde se tengan como resultados
porcentajes, adems hay que recordar que SAS trabaja en radianes por lo que hay que convertirlos a grados,
esto al igual que en los ejemplos anteriores es cuando se tiene la sospecha de que los datos no cumplen con
la Normalidad o la homogeneidad de Varianzas. El ejemplo es porcentaje de cido ctrico en frutos de mango
Teniendo el siguiente programa para SAS:
DATA CA1;
INPUT Y T;
YTAS=ARSIN(SQRT(Y/100))*(180/3.1416);
CARDS;
14.823 1
14.676 1
14.720 1
14.514 1
15.065 1
25.151 2
25.401 2
25.131 2
25.031 2
25.267 2
32.605 3
32.460 3
32.256 3
32.669 3
32.111 3
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL YTAS=T;
RUN;

Obteniendo los siguientes resultados:


Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Y
14.823
14.676
14.720
14.514
15.065
25.151
25.401
25.131
25.031
25.267
32.605
32.460
32.256
32.669
32.111

T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3

YTAS
22.6441
22.5253
22.5609
22.3939
22.8385
30.0997
30.2645
30.0865
30.0204
30.1763
34.8205
34.7318
34.6069
34.8596
34.5180

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
Nmero de observaciones
15
Variable Dependiente: YTAS
Suma de
Cuadrados
374.2162599
0.2257303
374.4419903

Fuente de Variacin
Modelo
Error
Total Corregido

GL
2
12
14

R-Cuadrada
0.999397

Raz CME
0.137153

Coef. Var.
0.470618

Fuente de Variacin
T

GL
2

Cuadrado Medio
187.1081300
0.0188109

F Value
9946.81

Pr > F
<.0001

F Value
9946.81

Pr > F
<.0001

Y Media
29.14313

Anova SC
374.2162599

Cuadrado Medio
187.1081300

En este caso podemos apreciar al igual que en el anterior que los datos transformados aparecen en el print,
pero esta transformacin de datos es para obtener solamente los requerimientos bsicos para poder realizar
la prueba de anlisis de la varianza.

46

Prueba de estadstica no paramtrica de Kruskal-Wallis.


Esta prueba para datos no paramtricos, en este caso veremos una evaluacin de cuatro variedades de
Chirimoya en donde se cuantifico el nmero de semillas por fruto, teniendo los siguientes resultados y juegos
de hiptesis.

H 0 : V1 V2 V3 V4

H a : i j Vi V j
V1
V2
V3
V4

23
3.5
132
38
106
32
46
11

51
13
49
12
75
23.5
36
8

26
5
172
40
59
17.5
23
3.5

29
6
129
36
82
28
62
20

37
9
55
14
57
15.5
83
29

18
2
57
15.5
128
35
77
25.5

66
21
131
37
75
23.5
16
1

33
7
115
34
61
19
94
30

77
25.5
108
33
101
31
79
27

59
17.5
135
39
70
22
44
10

Donde
R1 = 109.5; R2 =298.5; R3 = 247; R4 = 165; k = Nm. De tratamientos= 4.
n1 = n2 = n3 = n4= 10; N = 40. Donde:
k R2
12

j 3N 1 15.53
N N 1 j 1 n j
2
c

t2 k21, 32,0.05 7.81


Como c2 es mayor que t2 , se rechaza la H0, lo que quiere decir que no todos los tratamientos producen el
mismo efecto, en este ejemplo no todas las variedades tienen el mismo nmero de semillas.

Prueba de Comparacin Mltiple de Medias.


Para hacer la comparacin de rangos se utilizar la prueba de rangos HSD de Tukey con la siguiente regla
de decisin
Si Ri R j q , , k

N Nk Nk 1
entonces i j
12

En donde el valor honestamente significativo nico es 134.2


Y el valor absoluto de las diferencias es de:
|R1 R2| = 189.0 > 134.2 por lo tanto i j
|R1 R3| = 137.5 > 134.2 por lo tanto i j
|R1 R4| = 055.5 < 134.2 por lo tanto i = j
|R2 R3| = 051.5 < 134.2 por lo tanto i = j
|R2 R4| = 133.5 < 134.2 por lo tanto i = j
|R3 R4| = 082.0 < 134.2 por lo tanto i = j

47

Por lo que quedara representado de la siguiente manera:


T2 298.5 a
T3 247.0 a
T4 165.0 a b
T1 109.5

Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1


es el peor tratamiento, pero sin ser superado estadsticamente por el 4.

Tambin puede utilizarse la prueba HSD de Tukey para la comparacin de rangos medios mediante la
siguiente regla de decisin
Si

R i R j q , , k

Donde

N N 1 1 1
entonces i j

n n
24
j
i

En donde el valor honestamente significativo nico es 13.42


Y el valor absoluto de las diferencias es de:
|R1 R2| = 18.90 > 13.42 por lo tanto i j
|R1 R3| = 13.75 > 13.42 por lo tanto i j
|R1 R4| = 05.55 < 13.42 por lo tanto i = j
|R2 R3| = 05.15 < 13.42 por lo tanto i = j
|R2 R4| = 13.35 < 13.42 por lo tanto i = j
|R3 R4| = 08.20 < 13.42 por lo tanto i = j

Por lo que quedara representado de la siguiente manera:


T2 29.85 a
T3 24.70 a
T4 16.50 a b
T1 10.95

Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1


es el peor tratamiento, pero sin ser superado estadsticamente por el 4.

O puede utilizarse la comparacin de rangos medios de Nemanyi mediante la siguiente regla de decisin
Si R i R j q , , k

k N 1
entonces i j
12

Para la prueba de Nemanyi se aplica esta frmula cuando todos los tratamientos tienen el mismo nmero de
repeticiones, de lo contrario se debe aplicar

q , , k
N N 1 1 1
.

n n
12
2
i
j

48

En donde el valor mnimamente significativo nico es 13.42


Y el valor absoluto de las diferencias es de:
|R1 R2| = 18.90 > 13.42 por lo tanto i j
|R1 R3| = 13.75 > 13.42 por lo tanto i j
|R1 R4| = 05.55 < 13.42 por lo tanto i = j
|R2 R3| = 05.15 < 13.42 por lo tanto i = j
|R2 R4| = 13.35 < 13.42 por lo tanto i = j
|R3 R4| = 08.20 < 13.42 por lo tanto i = j

Por lo que quedara representado de la siguiente manera:


T2 29.85 a
T3 24.70 a
T4 16.50 a b
T1 10.95

En todos los casos dan la misma respuesta debido a que se basan en el mismo caso y cualquiera de ellas es
correcta.

49

Prueba de estadstica no paramtrica de Friedman.


Para esta prueba se tom un experimento de frutos de Chirimoya, donde se cuantifico el peso de frutos de
tres variedades, teniendo como gradiente de variacin la edad del rbol, teniendo los siguientes resultados y
juego de hiptesis

H 0 : 1 2 3

H a : i j i j
Bloque
1
2
3
4
5
6
7
8
9
10

T1
855
2
1113
3
719
2
924
2
1115
3
921
3
1106
3
912
2
1170
3
1190
3

T2
760
1
504
1
412
1
673
1
808
1
764
2
356
1
951
3
856
2
560
2

T3
999
3
645
2
880
3
1245
3
883
2
422
1
970
2
416
1
143
1
118
1

Teniendo que R1 =26; R2 =15; R3 =19; b =10 y k =3


Donde
y

c2
Ri2 3b k 1 6.2

bk k 1 i 1
12

t2 k21, 22,0.05 5.99

Como c2 es mayor que t2 , se rechaza la hiptesis nula, lo que quiere decir que no todos los tratamientos
provocan el mismo efecto en este caso no todas las variedades tienen el mismo peso de fruto

Prueba de Comparacin de Medias.


Esto es igual que la prueba Kruskal-Wallis, la siguiente frmula es para comparar los rangos ( ).
Teniendo la siguiente regla de decisin: Ri R j Z

k k 1

bk k 1
entonces i j
6

En donde el valor mnimamente significativo nico es 10.68


Y el valor absoluto de las diferencias es de:
|R1 R2| = 11 > 10.68 por lo tanto i j
|R1 R3| = 07 < 10.68 por lo tanto i = j
|R2 R3| = 04 < 10.68 por lo tanto i = j

50

Lo que quedara representado de la siguiente manera.


T1 26 a
T3 19 a b
T2 15

Quedando que el tratamiento 1 es el mejor, sin ser superado estadsticamente por el 3, y el peor es el 2 sin
ser superado estadsticamente por el 3.

) de Nemanyi se debe
En este sentido cuando se pretende hacer la prueba por los rangos medios (
emplear la siguiente regla de decisin
Si R i R j

q , , k
k k 1

entonces i j
6b
2

En donde el valor honestamente significativo nico es 1.07


Y el valor absoluto de las diferencias es de:
|R1 R2| = 1.10 > 1.07 por lo tanto i j
|R1 R3| = 0.70 < 1.07 por lo tanto i = j
|R2 R3| = 0.40 < 1.07por lo tanto i = j

Lo que quedara representado de la siguiente manera.


T1 2.6 a
T3 1.9 a b
T2 1.5

En ambos casos, al igual que con la prueba Kruskal-Wallis, dan la misma respuesta debido a que se basan
en el mismo caso y cualquiera de ellas es correcta.

51

Correlacin Simple (Momento Producto De Pearson).


Para ejemplificar la correlacin lineal simple se tomarn datos de 5 caractersticas de la anatoma de 7
genotipos de durazno, recordando que la correlacin debe hacerse entre variables aleatorias.
genotipo
almendro
almendro
almendro
almendro
almendro
jalatzingo
jalatzingo
jalatzingo
jalatzingo
jalatzingo
misantla
misantla
misantla
misantla
misantla
nemaguard
nemaguard
nemaguard
nemaguard
nemaguard
temascaltepec
temascaltepec
temascaltepec
temascaltepec
temascaltepec
tulancingo, oax
tulancingo, oax
tulancingo, oax
tulancingo, oax
tulancingo, oax
sombrerete
sombrerete
sombrerete
sombrerete
sombrerete

longest
densest longlam epidsup epidinf
3.03 110.66
11.88
1.80
1.34
3.24 112.39
13.16
1.48
0.87
3.03 105.48
10.27
1.66
1.08
2.87 143.52
9.17
1.29
0.80
2.52 131.99
10.28
1.41
1.00
3.08 167.72
11.58
1.93
1.30
3.14 172.33
12.41
1.76
1.28
2.78 140.06
10.70
2.03
1.34
2.79 209.22
11.62
1.93
1.20
3.00 141.21
12.56
1.74
1.17
2.93 168.30
14.31
2.49
1.31
3.08 144.67
13.39
2.02
1.16
3.05 159.66
10.76
1.93
1.03
2.99 131.41
10.78
1.73
1.01
2.82 193.66
10.56
2.09
1.33
2.97 147.55
12.33
1.75
1.03
3.30 167.15
14.71
1.93
1.14
3.43 184.44
16.63
2.24
1.30
2.94 152.16
11.02
2.01
1.18
3.07 188.47
10.34
1.81
1.00
3.30 134.87
9.67
1.65
0.96
3.21 129.11
10.92
1.42
1.07
3.30 125.08
9.60
1.83
1.23
3.24 167.72
11.05
1.58
0.96
3.13 133.14
9.74
1.44
1.14
3.00 186.16
11.26
1.52
1.04
3.15 177.52
12.03
1.52
1.06
3.03 171.76
12.54
1.81
1.15
3.04 197.12
11.55
1.92
1.08
3.15 187.90
12.18
1.74
0.96
3.11 132.57
10.77
1.83
1.06
2.96 141.79
10.93
2.21
1.47
3.14 164.27
9.69
1.69
1.11
3.24 142.94
10.75
2.10
1.50
3.01 158.50
9.11
2.05
1.36

Las variables aleatorias se comparan en pares mediante la frmula:

xy rxy

n n

xi y i
n
xi y i i 1 i 1

n
i 1
n
xi
n
2
xi i 1

n
i 1

yi
n
y i2 i 1

n
i 1

52

El programa en SAS es el siguiente:


data corr;
input x$ y1-y5;
cards;
alm
3.03
110.66
alm
3.24
112.39
alm
3.03
105.48
alm
2.87
143.52
alm
2.52
131.99
jal
3.08
167.72
jal
3.14
172.33
jal
2.78
140.06
jal
2.79
209.22
jal
3.00
141.21
mis
2.93
168.30
mis
3.08
144.67
mis
3.05
159.66
mis
2.99
131.41
mis
2.82
193.66
nem
2.97
147.55
nem
3.30
167.15
nem
3.43
184.44
nem
2.94
152.16
nem
3.07
188.47
tem
3.30
134.87
tem
3.21
129.11
tem
3.30
125.08
tem
3.24
167.72
tem
3.13
133.14
tul
3.00
186.16
tul
3.15
177.52
tul
3.03
171.76
tul
3.04
197.12
tul
3.15
187.90
som
3.11
132.57
som
2.96
141.79
som
3.14
164.27
som
3.24
142.94
som
3.01
158.50
;
proc print;
proc corr;
var y1-y5;
run;

11.88
13.16
10.27
9.17
10.28
11.58
12.41
10.70
11.62
12.56
14.31
13.39
10.76
10.78
10.56
12.33
14.71
16.63
11.02
10.34
9.67
10.92
9.60
11.05
9.74
11.26
12.03
12.54
11.55
12.18
10.77
10.93
9.69
10.75
9.11

1.80
1.48
1.66
1.29
1.41
1.93
1.76
2.03
1.93
1.74
2.49
2.02
1.93
1.73
2.09
1.75
1.93
2.24
2.01
1.81
1.65
1.42
1.83
1.58
1.44
1.52
1.52
1.81
1.92
1.74
1.83
2.21
1.69
2.10
2.05

1.34
0.87
1.08
0.80
1.00
1.30
1.28
1.34
1.20
1.17
1.31
1.16
1.03
1.01
1.33
1.03
1.14
1.30
1.18
1.00
0.96
1.07
1.23
0.96
1.14
1.04
1.06
1.15
1.08
0.96
1.06
1.47
1.11
1.50
1.36

y la salida nos da la siguiente informacin


El procedimiento CORR
5 Variables:
y1

y2

Variable
y1
y2
y3
y4
y5

Media
3.05914
154.92857
11.43571
1.80971
1.14343

N
35
35
35
35
35

y3

y4

y5

Estadsticas Simples
Desv Est
Suma
0.17744
107.07
26.24091
5423
1.61783
400.25
0.26372
63.34
0.16439
40.02

Mnimo
2.52
105.48
9.11
1.29
0.80

Mximo
3.43
209.22
16.63
2.49
1.50

Coeficientes de Correlacin Pearson, N = 35


Prob > |r| bajo H0: Rho=0
y1
1.00000

y2
-0.04712
0.7881

y3
0.30602
0.0738

y4
0.00383
0.9826

y5
-0.03317
0.8500

y2

-0.04712
0.7881

1.00000

0.26719
0.1207

0.30275
0.0771

0.07212
0.6805

y3

0.30602
0.0738

0.26719
0.1207

1.00000

0.40063
0.0171

0.14947
0.3915

y4

0.00383
0.9826

0.30275
0.0771

0.40063
0.0171

1.00000

0.74121
<.0001

y5

-0.03317
0.8500

0.07212
0.6805

0.14947
0.3915

0.74121
<.0001

1.00000

y1

53

Interpretacin de los resultados:


Se hace las siguientes hiptesis

H0 :
0
Ha :
0
Es decir, H0 dice que no existe correlacin entre las dos variables, para hacer las pruebas de hiptesis se
realizar mediante el P-value donde se rechaza H0 si P-value < , si = 0.05 tenemos:
Para y1 y y2 el P-value es de 0.7881, por lo que no se rechaza H0
Para y1 y y3 el P-value es de 0.0738, por lo que no se rechaza H0
Para y1 y y4 el P-value es de 0.9826, por lo que no se rechaza H0
Para y1 y y5 el P-value es de 0.8500, por lo que no se rechaza H0
Para y2 y y3 el P-value es de 0.1207, por lo que no se rechaza H0
Para y2 y y4 el P-value es de 0.0771, por lo que no se rechaza H0
Para y2 y y5 el P-value es de 0.6805, por lo que no se rechaza H0
Para y3 y y4 el P-value es de 0.0171, por lo que se rechaza H0
Para y3 y y5 el P-value es de 0.3915, por lo que no se rechaza H0
Para y4 y y5 el P-value es de 0.0001, por lo que se rechaza H0
Es decir las correlaciones que son significativas con un nivel de confianza del 95 % son:
Entre la variables y3 y y4 y entre y4 y y5 todas las otras correlaciones no son estadsticamente diferentes de 0
es decir no existe correlacin estadsticamente significativas

54

Regresin Lineal Simple


Para ejemplificar la RLS se tomaron datos de prdida de peso de un coleoptero a diferentes humedades
relativas y se trata de saber cmo calcular la prdida de peso de acuerdo a su humedad
muestra
1
2
3
4
5
6
7
8
9

Humedad relativa (%)


0
12
29.5
43.6
53.5
62.5
75.5
85
93

Prdida de peso en mg
8.98
8.14
6.67
6.08
5.90
5.83
4.68
4.20
3.72

Y se probar el modelo y 0 1 x ; y = variable dependiente, x = variable independiente


El programa en SAS es el siguiente
data rls;
input x y;
cards;
0 8.98
12 8.14
29.5 6.67
43 6.08
53 5.9
62.5 5.83
75.5 4.68
85 4.2
93 3.72
;
proc print;
proc reg;
model y=x;
run;

y la salida nos da la siguiente informacin


Procedimiento REG

0
1x
y

Modelo:

Variable Dependiente: y

Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.

Variable

GL

Anlisis de Varianza
Suma de
GL
Cuadrados
1
23.51449
7
0.61606
8
24.13056
0.29666
6.02222
4.92614

R-Cuadrada
R-Cua Ajust

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

Cuadrado
medio
23.51449
0.08801

F Value
267.18

Pr > F
<.0001

0.9745
0.9708

t Value

Pr > |t|

8.70403

0.19156

45.44

<.0001

-0.05322

0.00326

-16.35

<.0001

Interpretacin de los resultados:


R2 = 0.9745 se refiere a que el 97.45 % de la variabilidad de la prdida de peso se debe o se le atribuye a
la humedad relativa
1 R2 = 0.0255 se refiere a que el 2.55 % de la variabilidad de la prdida de peso no se debe al efecto de
la humedad relativa

55

Intervalos de confianza para 0 y

Empezaremos para 0

0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2

0 8.7043 t 0.05 0.19156


9 2 ,
2

0 8.7043 t 0.05 0.19156


7,
2

0 8.7043 2.3646 0.19156

0 8.7043 2.3646 0.19156


0 8.2513
0 8.7043 2.3646 0.19156

0 9.1573
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 0 esta entre
el intervalo [8.2513, 9.1573]
Y para

1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2

1 0.05322 t 0.05 0.00326


92 ,
2

1 0.05322 t 0.05 0.00326


7,
2

1 0.05322 2.3646 0.00326


1 0.05322 2.3646 0.00326

1 0.0609
1 0.05322 2.3646 0.00326
1 0.0455
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de

1 esta entre

el intervalo [-0.0609, -0.0455]


Pruebas de hiptesis para 0 y

Empezaremos para 0 , las hiptesis son:

0 *0
H0 :

56

0 *0
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:

tc

0 *0

s 0

tt t

n 2 ,
2

Clculos para tc donde *0 0

tc

0 0

s 0

t c 8.7043 0
0.19156
t c 45.44
Clculos para tt

tt t

9 2 ,0.05
2

t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt

0 es estadsticamente diferente de 0 con


45.44 > 4.3646; por lo tanto se Rechaza H0, lo que significa que
un nivel de confianza de 95 %

Y para

1 , las hiptesis son:

1 *1
H0 :
1 *1
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:

tc

1 *1

s 1

tt t

n 2 ,
2

Clculos para tc donde

tc

*1 0

1 0

s 1

t c 0.05322 0
0.00326
t c 16.35
Clculos para tt

tt t

9 2 ,0.05
2

57

t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt
-16.35 < -4.3646; por lo tanto se Rechaza H0, lo que significa que

1 es estadsticamente diferente de 0 con

un nivel de confianza de 95 %

Pruebas de hiptesis usando la prueba del P-value


En este caso se toma el valor el P-value y se compara con y se rechaza H0 si P-value <
En este caso tanto para 0 y

1 el valor de P-value es de <0.0001; Rechazando H0 en ambos casos al

considerar que = 0.05 llegando el mismo resultado anterior. Por lo anterior se concluye que la humedad
relativa influye significativamente en la prdida de peso de los coleoteros

Ecuacin de regresin estimada


La ecuacin de regresin es la siguiente:

y 8.7043 0.05322x
Uso de residuales
x
0
12
29.5
43
53
62.5
75.5
85
93

y
8.98
8.14
6.67
6.08
5.9
5.83
4.68
4.2
3.72

yp
8.7043
8.06566
7.13431
6.41584
5.88364
5.37805
4.68619
4.1806
3.75484

residual
0.2757
0.07434
-0.46431
-0.33584
0.01636
0.45195
-0.00619
0.0194
-0.03484

58

grfico de residuales

0.6

0.4

residual

0.2

0
3.5

4.5

5.5

6.5

7.5

8.5

9.5

-0.2

-0.4

-0.6
y predicha

Este grfico representa la distribucin entre los valores obtenidos de la ecuacin estimada de regresin y los
residuales es decir el valor obtenido de la variable dependiente y el valor predicho, esto tiene una
interpretacin de que si los residuales estn distribuidos al azar, como en este ejemplo, entonces se cumplen
los supuestos de la regresin (Normalidad, Homogeneidad de varianzas e Independencia)

59

Regresin lineal simple con ordenada al origen.


Utilizando el mismo ejemplo que para regresin lineal simple se probar ahora pero con ordenada al origen
es decir sin el parmetro 0 , es decir, probando el modelo

y 1 x

El programa en SAS es el siguiente


data rls;
input x y;
cards;
0 8.98
12 8.14
29.5 6.67
43 6.08
53 5.9
62.5 5.83
75.5 4.68
85 4.2
93 3.72
;
proc reg;
model y=x noint;
run;

Con los siguientes resultados


Procedimiento REG

1x
Modelo: y
Variable Dependiente: y
NOTA: No intercepcin en el modelo. La R-cuadrada es redefinida.
Fuente de Variacin
Modelo
Error
Total Uncorregido

Anlisis de Varianza
Suma de
GL
Cuadrados
1
168.22628
8
182.30872
9
350.53500

Raz CME
Media Dependiente
Coef. Var.

4.77374
6.02222
79.26874

Variable

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

GL
1

R-Cuadrada
R-Cua Ajust

0.07349

0.02705

Cuadrado
medio
168.22628
22.78859

F Value
7.38

Pr > F
0.0264

0.4799
0.4149

t Value

Pr > |t|

2.72

0.0264

Interpretacin de los resultados:


R2

= 0.4799 se refiere a que el 47.99 % de la variabilidad de la prdida de peso se debe o se le atribuye a

la humedad relativa
1 R2 = 0.5201 se refiere a que el 52.01 % de la variabilidad de la prdida de peso no se debe al efecto
de la humedad relativa. Por lo que se trata de un modelo no muy confiable

Intervalos de confianza para

1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2

1 0.07349 t 0.05 0.02705


92 ,
2

1 0.07349 t 0.05 0.02705


7,
2

60

1 0.07349 2.3646 0.02705


1 0.07349 2.3646 0.02705
1 0.1375

1 0.07349 2.3646 0.02705


1 0.0095
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de

1 esta entre

el intervalo [-0.1375, -0.0095]

Prueba de hiptesis mediante el P-value


Con un = 0.05 y un P-value calculado de

1 de 0.0274 por lo que se rechaza H0, es decir, que el parmetro

es estadsticamente de manera significativa diferente de 0

0 0 , el nivel de confiabilidad disminuye, normalmente pasa lo


En este caso particular al hacer que
contrario, pero en este caso no, por lo que se recomienda incluir este parmetro.

61

Regresin lineal mltiple


Para ejemplificar la RLM se utilizar un ejemplo de diferentes dosis de fertilizacin N P K con el rendimiento
de cultivo de zarzamora en toneladas por hectrea
Dosis de N
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
200
200
200
200
200
200
200
200
200

Dosis de P
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100

Dosis de K
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80

Rendimiento
5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5

Y se probar el modelo y 0 1 x1 2 x 2 3 x3 ; y = variable dependiente, x1, x2 y x3 = variables


independientes

El programa en SAS es el siguiente:


data rlm;
input x1 x2 x3 y;
cards;
0
0
0
0
0
40
0
0
80
0
50
0
0
50
40
0
50
80
0
100
0
0
100
40
0
100
80
100
0
0
100
0
40
100
0
80
100
50
0
100
50
40
100
50
80
100
100
0
100
100
40
100
100
80
200
0
0
200
0
40
200
0
80
200
50
0
200
50
40
200
50
80
200
100
0
200
100
40
200
100
80

5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5

62

;
proc print;
proc reg;
model y=x1 x2 x3;
run;

y la salida nos da la siguiente informacin


Procedimiento REG

0
1 x1
2 x2
3 x3
y

Modelo:

Variable Dependiente: y

Fuente de Variacin
Modelo
Error
Total Corregido

GL
3
23
26

Raz CME
Media Dependiente
Coef. Var.

Variable

GL

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
163.64778
54.54926
22.93519
0.99718
186.58296

0.99859
9.33704
10.69493

R-Cuadrada
R-Cua Ajust

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

F Value
54.70

Pr > F
<.0001

0.8771
0.8610

t Value

Pr > |t|

6.54815

0.45070

14.53

<.0001

0.03011

0.00235

12.79

<.0001

-0.00211

0.00471

-0.45

0.6580

-0.00292

0.00588

-0.50

0.6248

Interpretacin de datos
Interpretacin de los resultados:
R2 = 0.8771 se refiere a que el 87.71 % de la variabilidad del rendimiento se debe o se le atribuye a las
variables del modelo en este caso las dosis de N P K
1 R2 = 0.1229 se refiere a que el 12.29 % de la variabilidad del rendimiento no se debe o se le atribuye
a las variables del modelo en este caso las dosis de N P K
Intervalos de confianza para 0 ,

1 , 2 y 3

Empezaremos para 0

0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2

0 6.54815 t
0.4507
27 2 ,0.05
2

0 6.54815 t 0.05 0.4507


25,
2

0 6.54815 2.0595 0.4507


0 6.54815 2.0595 0.4507

0 5.6199
0 6.54815 2.0595 0.4507

0 7.4764

63

Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 0 esta entre
el intervalo [5.6199, 7.4764]
Y para

1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2

1 0.3011 t
0.00235
0
.
05
27 2 ,
2

1 0.3011 t 0.05 0.00235


25,
2

1 0.3011 2.0595 0.00235


1 0.3011 2.0595 0.00235
1 0.2963

1 0.3011 2.0595 0.00235


1 0.3059
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de

1 esta entre

el intervalo [0.2963, 0.3059]


Y para

2
s 2
2 , 2 t
2 t n 2 , s

n2 ,
2
2

2 0.00211 t
0.00471
27 2 ,0.05
2

2 0.00211 t 0.05 0.00471


25,
2

2 0.00211 2.0595 0.00471

2 0.00211 2.0595 0.00471


2 0.0118
2 0.00211 2.0595 0.00471
2 0.0076
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de

2 esta entre

el intervalo [-0.0118, 0.0076]


Y para 3

3
s 3
3 , 3 t
3 t n 2 , s
n 2 ,
2
2

64

3 0.00292 t
0.00588
27 2 ,0.05
2

3 0.00292 t 0.05 0.00588


25,
2

3 0.00292 2.0595 0.00588


3 0.00292 2.0595 0.00588

3 0.0150
3 0.00292 2.0595 0.00588

3 0.0092
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 3 esta entre
el intervalo [-0.0150, 0.0092]

Prueba de hiptesis conjunta usando P-value.


La hiptesis es:

H 0 : 0 1 2 3 0

H a : i j i j
esta prueba se realiza con el P-value de la prueba de F del anlisis de varianza de la regresin y se rechaza
H0 si el P-value es menor a en este caso = 0.05
el P-value en nuestro ejemplo es de 0.0001 por lo tanto se rechaza H0 es decir al menos un parmetro es
diferente de 0
Pruebas de hiptesis individuales usando P-value.
Las hiptesis son:

i *i
H0 :
i *i
Ha :
donde i = en nuestro caso (0, 1, 2, 3) y *i 0 es decir todos los parmetros son iguales a 0, utilizando la
prueba de t-value y se rechaza H0, si el P-value es menor a en este caso = 0.05
Parmetro

1
2
3
Lo que significa que solo los parmetros 0 y

P-value
0.0001

Decisin
Se rechaza H0

0.0001

Se rechaza H0

0.6580

No se rechaza H0

0.6248

No se rechaza H0

1 influyen significativamente en y; la intercepcin al origen (

0 ) no tiene una explicacin lgica, pero 1 que es el coeficiente que representa el N es decir para este
ejemplo el nico que influye significativamente en el rendimiento es el N

65

Prueba de hiptesis conjunta


Estas se realizan cuando se quieren comparar dos o ms parmetros; menos de los parmetros totales,
evitando 0 ; para este caso la hiptesis es:

0
H0 : 1
2 0
0
Ha : 1
2 0
para lo cual se hace una regresin aceptando la H0, es decir, un modelo reducido solo con los estimadores
de todos que no estn en la hiptesis, y probndose con una prueba de F con la siguiente Fc

Fc

CM H
CM E MC

donde

el

CM H

SC H
GLH

este

su

vez

se

descompone

en

SCH SCE MR SCE MC y GLH GLE MR GLE MC donde el MR significa el


modelo reducido y el MC el modelo completo.
Y el Ft
GL H
Ft FGL
E MC ,

En este ejemplo

SCH 186.33796 22.93519 163.40277 ; GLH 25 23 2

CM H 163 .40277 81 .7014


2
Fc 81 .7014 80 .9296 y Ft F232 ,0.05 4.28
0.99718
como Fc > Ft se rechaza H0 es decir al menos uno de los dos parmetros es diferente de 0

Eleccin del mejor modelo


Para seleccionar el mejor modelo se utiliza los criterios de mxima R2 y parsimonia para este caso tenemos
Modelo

R2

0
1 x1
2 x2
3 x3
y
0
1 x1
2 x2
y
0
1 x1
3 x3
y

0.8771

Nmero de
parmetros
4

Seleccin
Seleccionado 4

0.8758

Seleccionado 3

0.8760

Seleccionado 2

0
2 x2
3 x3
y

0.0024

0
1 x1
y
0
2 x2
y

0.8747

No
seleccionado
Seleccionado 1

0.0011

0
3 x3
y

0.0013

No
seleccionado
No
seleccionado

Aunque el modelo con cuatro parmetros es el de mxima R2 se decide seleccionar el modelo con menos de

0
1 x1 puesto que
0.05 en R2 pero con menor nmero de parmetros seleccionndose el modelo y
presenta un valor de R2 similar a la mxima pero con menos parmetros.

66

Regresin exponencial con una variable independiente


Para ejemplificar la RE1V se utilizar un ejemplo de crecimiento de Escherichia coli (en miles de unidades) a
diferentes temperaturas de incubacin
Temperatura
C
18
20
22
24
26
28
30
32
Y se probar el modelo

Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

y 0 1 ; para linealizar este modelo se realizan logaritmos teniendo el


x

siguiente modelo linealizado:

log e y log e 0 x log e 1 log e o log 10 y log 10 0 x log 10 1 log 10


Calculando la regresin como RLS y luego se obtienen los antilogaritmos de los parmetros obtenidos en la
RLS
Obteniendo as la ecuacin de regresin

0
1
y

Teniendo el siguiente programa, utilizando logaritmo natural, en SAS


data re1v;
input x y;
ly= log(y);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=x;
run;

y los siguientes resultados:


Obs
1
2
3
4
5
6
7
8

x
18
20
22
24
26
28
30
32

y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536

Procedimiento REG
Modelo:

0 x log e
1
log e y log e

Variable Dependiente: ly

Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.

GL
1
6
7

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.34136
1.34136
0.18317
0.03053
1.52453

0.17472
3.04908
5.73040

R-cuadrada
R-Cuad. Ajust

F Value
43.94

Pr > F
0.0006

0.8798
0.8598

67

Variable

0
log e
1
log e

GL

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

t Value

Pr > |t|

0.81521

0.34262

2.38

0.0548

0.08935

0.01348

6.63

0.0006

Para determinar los verdaderos parmetros se obtiene el antilogaritmo de ambos parmetros

0 lo siguiente
0 e 0.81521 2.2597 y para
Teniendo para
ecuacin de regresin

1 e 0.08935 1.0935 teniendo la siguiente

y 2.2597 1.0935 x

Y utilizando logaritmo base 10 se tiene el siguiente programa en SAS


Data re1v;
input x y;
ly= log10(y);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=x;
run;

y los siguientes resultados:


Obs
1
2
3
4
5
6
7
8

x
18
20
22
24
26
28
30
32

y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

ly
1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305

Procedimiento REG
Modelo:

0 x log 10
1
log 10 y log 10

Variable Dependiente: ly

Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.

Variable

0
log e
1
log e

GL

GL
1
6
7

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.25300
0.25300
0.03455
0.00576
0.28754

0.07588
1.32420
5.73040

R-cuadrada
R-cuad Ajust

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

F Value
43.94

Pr > F
0.0006

0.8798
0.8598

t Value

Pr > |t|

0.35404

0.14880

2.38

0.0548

0.03881

0.00585

6.63

0.0006

Para determinar los verdaderos parmetros se obtiene el antilogaritmo de ambos parmetros

0 lo siguiente
0 10 0.35404 2.2597 y para
1 10 0.03881 1.0935 teniendo la
Teniendo para
siguiente ecuacin de regresin

y 2.2597 1.0935 x , la misma utilizando el logaritmo natural

68

Regresin de potencia con una variable independiente


Para ejemplificar la RP1V se utilizar el mismo ejemplo de crecimiento de Escherichia coli (en miles de
unidades) a diferentes temperaturas de incubacin
Temperatura
C
18
20
22
24
26
28
30
32

Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

Y se probar el modelo y 0 x 1 ; para linealizar este modelo se realizan logaritmos teniendo el


siguiente modelo linealizado:

log e y log e 0 1 log e x log e o log 10 y log 10 0 1 log 10 x log 10


Calculando la regresin como RLS y luego se obtienen los antilogaritmos de los parmetros obtenidos en la
RLS

0 x 1
Obteniendo as la ecuacin de regresin y
Teniendo el siguiente programa, utilizando logaritmo natural, en SAS
data rp1v;
input x y;
ly= log(y);
lx=log (x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;

y los siguientes resultados:


Obs
1
2
3
4
5
6
7
8

x
18
20
22
24
26
28
30
32

y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536

lx
2.89037
2.99573
3.09104
3.17805
3.25810
3.33220
3.40120
3.46574

Procedimiento REG
Modelo:

0
1 log e x
log e y log e

Variable Dependiente: ly

Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef Var

GL
1
6
7

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.25624
1.25624
0.26828
0.04471
1.52453

0.21146
3.04908
6.93510

R-cuadrada
R-cuad Ajust

F Value
28.10

Pr > F
0.0018

0.8240
0.7947

69

Variable

0
log e
1

GL

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

t Value

Pr > |t|

-3.70968

1.27731

-2.90

0.0272

2.11109

0.39828

5.30

0.0018

0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 e 3.70968 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente

y 0.0245 x 2.1111
Y utilizando logaritmo base 10 se tiene el siguiente programa en SAS
data rp1v;
input x y;
ly= log10(y);
lx=log10(x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;

y los siguientes resultados:


Obs

ly

lx

1
2
3
4
5
6
7
8

18
20
22
24
26
28
30
32

13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2

1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305

1.25527
1.30103
1.34242
1.38021
1.41497
1.44716
1.47712
1.50515

Procedimiento REG
Modelo:

0
1 log 10 x
log 10 y log 10

Variable Dependiente: ly

Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.

Variable

0
log 10
1

GL

GL
1
6
7

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.23694
0.23694
0.05060
0.00843
0.28754

0.09183
1.32420
6.93510

R-cuadrada
R-cuad Ajust

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

F Value
28.10

Pr > F
0.0018

0.8240
0.7947

t Value

Pr > |t|

-1.61109

0.55473

-2.90

0.0272

2.11109

0.39828

5.30

0.0018

0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 10 1.61109 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente

y 0.0245 x 2.1111 , la misma que con el logaritmo natural

70

Regresin polinomial de segundo grado con una variable indepediente


Para ejemplificar la RCS se utilizar un ejemplo de dosis de auxinas en mg/l y el rendimiento de manzana y
se pretende realizar regresin polinomial de segundo grado para calcular la ecuacin de regresin y obtener
la dosis ptima para un mximo rendimiento
Dosis de
auxinas
0
10
20
30
40
50
60
70
80
90
100

Rendimiento en
toneladas
12
15.5
17
28
37
28
27.5
18.5
19
15
10

Y se probar el modelo y 0 1 x 2 x 2 .
El programa en SAS es el siguiente
data rcs;
input x y;
xx=x*x;
cards;
0
12
10 15.5
20 17
30 28
40 37
50 28
60 27.5
70 18.5
80 19
90 15
100 10
;
proc print;
proc reg;
model y=x xx;
run;

y la salida nos da la siguiente informacin


Obs
1
2
3
4
5
6
7
8
9
10
11

x
0
10
20
30
40
50
60
70
80
90
100

y
12.0
15.5
17.0
28.0
37.0
28.0
27.5
18.5
19.0
15.0
10.0

xx
0
100
400
900
1600
2500
3600
4900
6400
8100
10000

Procedimiento REG
Modelo:

0
1x
2 x2
y

Variable Dependiente: y

Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME

GL
2
8
10

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
522.36620
261.18310
167.27016
20.90877
689.63636

4.57261

R-cuadrada

F Value
12.49

Pr > F
0.0035

0.7575

71

Media Dependiente
Coef. Var.

20.68182
22.10933

Variable

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

GL

R-cuad Ajust

0.6968

t Value

Pr > |t|

10.66783

3.48366

3.06

0.0155

0.74078

0.16208

4.57

0.0018

-0.00772

0.00156

-4.95

0.0011

R2 = 0.7575 se refiere a que el 75.75 % de la variabilidad del rendimiento se debe o se le atribuye a la


dosis de auxina
1 R2 = 0.2425 se refiere a que el 24.25 % de la variabilidad del rendimiento no se debe al efecto de la
dosis de auxina
Siendo

este

un

buen

modelo

de

regresin

la

ecuacin

de

regresin

es

y 10.66783 0.74078x 0.00772x 2


Determinacin del valor ptimo (mnimo o mximo) de la RCS
Para determinarlo se obtiene mediante derivadas, primero se obtiene la primera derivada y esta se iguala a 0
para despejar el valor de x, y acto seguido se obtiene la segunda derivada para saber si es un mnimo o un
mximo
Obteniendo la primera derivada:

y
10.66783 0.74078x 0.00772x 2
x x
y
0 0.74078 2 0.00772x
x
y
0.74078 0.01544x
x
Igualando con 0 la primera derivada

y
0
x
0.74078 0.01544 x 0
0.01544 x 0.74078
x 0.74078
0.01544

x 47.9780
Este es el valor crtico, es decir el valor ptimo ahora hay que obtener la segunda derivada para saber si es
un mnimo o un mximo esto es solo para informacin de interpretacin

y 0.74078 0.01544x

x x x

y 0 0.01544

x x
y 0.01544

x x

72

al ser la segunda derivada menor a 0 entonces se trata de un mximo; por lo que esto se interpreta de la
siguiente manera: cuando la dosis de auxinas es de 47 .978 48 mg/l el rendimiento en manzana es el
mximo posible.

73

Regresin polinomial de segundo grado con ms de una variable independiente


Para ejemplificar la RCM se utilizar un ejemplo de diferentes dosis de N P K en el rendimiento en ton/1000
m. del cultivo de tomate de cscara y se pretende realizar regresin polinomial de segundo grado completa
para calcular la ecuacin de regresin y obtener la dosis ptima para un mximo rendimiento
N

0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150

0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80

0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100

Rendimiento en
toneladas
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3
18.2
17
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1

Y se probar el modelo

y 0 1 x1 2 x12 3 x 2 4 x 22 5 x3 6 x32 7 x1 x 2 8 x1 x3 9 x 2 x3 .
El programa en SAS es el siguiente
data a;
input n p k y;
np=n*p;
nk=n*k;
pk=p*k;
nn=n*n;
pp=p*p;
kk=k*k;
cards;
0
0
0
0
0
50
0
0
100
0
40
0
0
40
50
0
40
100
0
80
0
0
80
50
0
80
100
100
0
0
100
0
50
100
0
100
100
40
0

10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3

74

100
40
50
18.2
100
40
100
17
100
80
0
17.1
100
80
50
17.8
100
80
100
16.6
150
0
0
14.5
150
0
50
15.6
150
0
100
14.3
150
40
0
14.9
150
40
50
15.8
150
40
100
14.6
150
80
0
14.6
150
80
50
15.4
150
80
100
14.1
;
proc print;
proc reg;
model y=n p k nn pp kk np nk pk;
run;

y la salida nos da la siguiente informacin


Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

n
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150

p
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80

k
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100

y
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11.0
11.0
16.8
17.2
16.9
17.3
18.2
17.0
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1

np
0
0
0
0
0
0
0
0
0
0
0
0
4000
4000
4000
8000
8000
8000
0
0
0
6000
6000
6000
12000
12000
12000

nk
0
0
0
0
0
0
0
0
0
0
5000
10000
0
5000
10000
0
5000
10000
0
7500
15000
0
7500
15000
0
7500
15000

pk
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000

nn
0
0
0
0
0
0
0
0
0
10000
10000
10000
10000
10000
10000
10000
10000
10000
22500
22500
22500
22500
22500
22500
22500
22500
22500

pp
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400

kk
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000

Procedimiento REG
Modelo:

0
1 x1
2 x12
3 x2
4 x 22
5 x3
6 x32
7 x1 x 2
8 x1 x3
9 x 2 x3
y

Variable Dependiente: y

Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef. Var.

Variable
Intercept
n
p
k
nn
pp
kk
np
nk
pk

GL
1
1
1
1
1
1
1
1
1
1

GL
9
17
26

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
185.41560
20.60173
1.16737
0.06867
186.58296

0.26205
14.33704
1.82776

R-cuadrada
R-cuad Ajust

Parmetros
Parmetro
Estimado
10.22315
0.13906
0.02240
0.03313
-0.00073111
-0.00022569
-0.00027778
-0.00001548
-0.00005095
-0.00004167

Estimados
Error
Estndar
0.19274
0.00351
0.00623
0.00499
0.00002179
0.00006686
0.00004279
0.00002476
0.00001981
0.00003782

F Value
300.02

Pr > F
<.0001

0.9937
0.9904

t Value
53.04
39.64
3.59
6.65
-33.55
-3.38
-6.49
-0.63
-2.57
-1.10

Pr > |t|
<.0001
<.0001
0.0022
<.0001
<.0001
0.0036
<.0001
0.5403
0.0198
0.2860

75

R2 = 0.9937 se refiere a que el 99.37 % de la variabilidad del rendimiento se debe o se le atribuye a las
dosis de N P K
1 R2 = 0.2425 se refiere a que el 0.63 % de la variabilidad del rendimiento no se debe al efecto de la
dosis de N P K
Siendo

este

un

excelente

modelo

de

regresin

la

ecuacin

de

regresin

es:

y 10.22315 0.13906x1 0.0224x2 0.03313x3 0.00073111x12 0.00022569x22 0.00027778x32


0.00001548x1 x2 0.00005095x1 x3 0.00004167x2 x3
Determinacin del valor ptimo (mnimo o mximo) de la RCM
Se obtienen las primeras derivadas con respecto a cada una de las variables y estas se igualan a 0 y se
obtienen los valores crticos, despus mediante una matriz hessiana se obtienen las determinantes principales
para saber si se trata de un mnimo o un mximo.
Obteniendo las primeras derivadas:
Para x1

y

x1 x1

10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32

0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3

y
0.13906 2 0.00073111x1 0.00001548x 2 0.00005095x3
x1
y
0.13906 0.00146222x1 0.00001548x 2 0.00005095x3
x1
Para x2

y

x 2 x 2

10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32

0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3

y
0.0224 2 0.00022569x 2 0.00001548x1 0.00004167x3
x 2
y
0.0224 0.00001548x1 0.00045138x 2 0.00004167x3
x 2
para x3

y

x 3 x 3

10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32

0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3

y
0.03313 2 0.00027778x3 0.00005095x1 0.00004167x 2
x3
y
0.03313 0.00005095x1 0.00004167x 2 0.00055556x3
x3
Igualando a 0 las tres derivadas y resolviendo el sistema de ecuaciones de tres ecuaciones con tres variables.

x1

Que se resolver mediante matrices donde x A b y cada termino significa x x 2

x3
1

76

0.00146222 0.00001548 0.00005095 686.226787 17.8478014 61.5946737


A 1 inversa0.00001548 0.00045138 0.00004167 17.8478014 2231.33961 165.725711
0.00005095 0.00004167 0.00055556 61.5946737 165.725711 1818.06473
0.13906
b 0.02240
0.03313
y

se

A 1 b

multiplica

para

obtener

los

valores

de

x1,

x2

686.226787 17.8478014 61.5946737 0.13906 92.9863


x 17.8478014 2231.33961 165.725711 0.02240 42.0096 por lo que
61.5946737 165.725711 1818.06473 0.03313 47.9549

x3.

Teniendo

que

x1 92.9863
x 42.0096
2

x3 47.9549

para obtener la segunda derivada se realiza una matriz hessiana y se obtienen las determinantes que son
los determinantes principales (mnimos o mximos principales)

y
x x
1 1
y
H

x1 x 2

y
x1 x3

x1
y

x 2 x 2
y

x 2 x3

x 2

x3 x1

x3 x 2

x3 x3

0.13906 0.00146222x1

x 0.00001548x 2

1 0.00005095x3

0
.
0224

0
.
00001548
x

H 0.00045138x 2

x1

0.00004167x3

0.03313 0.00005095x1

x 0.00004167x 2

1 0.00055556x
3

0.13906 0.00146222x1

0.00001548x 2

0.00005095x

0.0224 0.00001548x1

0.00045138x

2
x 2

0.00004167x3

0.03313 0.00005095x1

0.00004167x

2
x 2

0.00055556x3

x 2

0.13906 0.00146222x1

0.00001548x 2

0.00005095x

0.0224 0.00001548x1

0.00045138x

2
x3

0.00004167x3

0.03313 0.00005095x1

0.00004167x

2
x3

0.00055556x3

x3

0.00146222 0.00001548 0.00005095


H 0.00001548 0.00045138 0.00004167
0.00005095 0.00004167 0.00055556
Determinantes principales
Como hay 3 variables existen tres determinantes
Determinante 1.

Det1 0.00146222
Determinante 2.

Det 2 0.00146222 0.00045138 0.00001548 0.00000066


2

Determinante 3.

77

Det 3 0.00146222 0.00045138 0.00055556 0.00001548 0.00005095 0.00004167


2

3.6668 10 10 1.8001 10 27 3.6667 10 10


Como se empieza con negativo y se intercalan signos se trata de un mximo

Interpretacin.

N 92.9863

Cuando los niveles de fertilizacin de P 42.0096 se obtiene el mximo rendimiento, para el ejemplo

K 47.9549
dado.

Utilizando este tipo de regresin se puede estimar los valores ptimos ya sean mnimos o mximos, segn
sea el caso, y as poder dar una recomendacin, de fertilizacin en este caso, as como otros aspectos.

78

Multicolinealidad.
Para ejemplificar multicolinealidad se utilizar el ejemplo visto en clase pero obteniendo los coeficiente VIF
con SAS.

El programa en SAS es el siguiente:


data multico;
input x1-x3 y;
cards;
19.5
43.1
29.1
24.7
49.8
28.2
30.7
51.9
37
29.8
54.3
31.1
19.1
42.2
30.9
25.6
53.9
23.7
31.4
58.5
27.6
27.9
52.1
30.6
22.1
49.9
23.2
25.5
53.5
24.8
31.1
56.6
30
30.4
56.7
28.3
18.7
46.5
23
19.7
44.2
28.6
14.6
42.7
21.3
29.5
54.4
30.1
27.7
55.3
25.7
30.2
58.6
24.6
22.7
48.2
27.1
25.2
51
27.5
;
proc print;
proc reg;
model y=x1-x3/vif;
proc corr;
var x1-x3;
run;

11.9
22.8
18.7
20.1
12.9
21.7
27.1
25.4
21.3
19.3
25.4
27.2
11.7
17.8
12.8
23.9
22.6
25.4
14.8
21.1

y la salida nos da la siguiente informacin


Procedimiento REG
Modelo:

0
1 x1
2 x2
3 x3
y

Variable Dependiente: y

Fuente de Variacin
Modelo
Error
Total Corregido

GL
3
16
19

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
396.98461
132.32820
98.40489
6.15031
495.38950

Raz CME
Media Dependiente
Coef. Var.

2.47998
20.19500
12.28017

Variable

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

GL

Pr > F
<.0001

0.8014
0.7641

t Value

Pr > |t|

Inflacin
de la Varianza

117.08469

99.78240

1.17

0.2578

4.33409

3.01551

1.44

0.1699

708.84291

-2.85685

2.58202

-1.11

0.2849

564.34339

-2.18606

1.59550

-1.37

0.1896

104.60601

El procedimiento CORR
3 Variables:
x1
Variable
x1
x2
x3

R-cuadrada
R-cuad Ajust

F Value
21.52

N
20
20
20

x2

x3

Media
25.30500
51.17000
27.62000

Estadsticas Simples
Desv Est
Suma
5.02326
506.10000
5.23461
1023
3.64715
552.40000

Mnimo
14.60000
42.20000
21.30000

Mximo
31.40000
58.60000
37.00000

79

Coeficientes de Correlacin Pearson, N = 20


Prob > |r| bajo H0: Rho=0
x1

x2

x3

x1

1.00000

0.92384
<.0001

0.45778
0.0424

x2

0.92384
<.0001

1.00000

0.08467
0.7227

x3

0.45778
0.0424

0.08467
0.7227

1.00000

Interpretacin.
Para interpretar si existe multicolinealidad, existen tres datos que evidencian este problema, el primero es
rechazar H0 en la prueba conjunta y no rechazarla en las pruebas individuales, valores de VIF (Factor de
Inflacin de la Varianza) mayores a 10 y correlacin significativa entre las variables independientes, en este
ejemplo el primer indicador se cumple en la salida de SAS, los valores VIF son mayores incluso de 100, y
existen correlaciones entre las variables x 1 y x2 y entre x1 y x3 por lo que para poder corregirlo lo ms viable
sera quitar x1 por ser el de mayor valor VIF

Al hacer esto los datos cambian en SAS de la siguiente manera:


Procedimiento REG
Modelo:

0
2 x2
3 x3
y

Variable Dependiente: y

Fuente de Variacin
Modelo
Error
Total Corregido

GL
2
17
19

Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
384.27972
192.13986
111.10978
6.53587
495.38950

Raz CME
Media Dependiente
Coef. Var.

2.55653
20.19500
12.65925

Variable

Parmetros Estimados
Parmetro
Error
Estimado
Estndar

GL

R-cuadrada
R-cuad Ajust

F Value
29.40

Pr > F
<.0001

0.7757
0.7493

t Value

Pr > |t|

Inflacin
de la Varianza

-25.99695

6.99732

-3.72

0.0017

0.85088

0.11245

7.57

<.0001

1.00722

0.09603

0.16139

0.60

0.5597

1.00722

Corrigindose el problema al reducir los coeficientes VIF a menos de 10, y teniendo concordancia entre la
prueba global y las individuales.

80

También podría gustarte