Ejemplos SAS1

UNIVERSIDAD DE GUANAJUATO
CAMPUS CELAYA SALVATIERRA

DIVISIN DE CIENCIAS DE LA SALUD E INGENIERAS
DEPARTAMENTO DE INGENIERA AGROINDUSTRIAL
PROGRAMA ACADMICO DE INGENIERA EN BIOTECNOLOGA
EJEMPLOS DE ANLISIS DE
VARIANZA, CORRELACIN Y
REGRESIN.
CON EL USO PRCTICO DEL PAQUETE SAS
Dr. Carlos A. Nez-Coln.

UDA: Diseos Experimentales (GN1808)
ANAVA en Diseo Experimental Completamente al Azar.

En un experimento donde se probaron 4 dosis de Nitrgeno en el cultivo de Ans donde la variable respuesta
fue el rendimiento en gramos por parcela.
Teniendo el siguiente programa para SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
RUN;
Obteniendo los siguientes resultados:

El procedimiento del ANAVA
Informacin del Nivel de Clase
Clase
Niveles
Valores
T
4
1 2 3 4
Nmero de observaciones
28
Variable Dependiente: Y
Suma de
Cuadrados
1908.209643
1370.677143
3278.886786
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
24
27
R-Cuadrada
0.581969
Raz CME
7.557218
Coef. Var.
26.97974
Fuente de Variacin
T
GL
3
Cuadrado Medio
636.069881
57.111548
F Value
11.14
Pr > F
<.0001
Cuadrado Medio
636.069881
F Value
11.14
Pr > F
<.0001
Y Media
28.01071
Anova SC
1908.209643
Esto ya es el ANAVA o ANOVA en ingles que nos dice que la H 0 (hiptesis nula) que todos los tratamientos
tienen el mismo efecto y la Ha (hiptesis alternativa) que por lo menos un tratamiento es diferente de los
dems, rechazndose la hiptesis nula cuando el P value (Pr) es menor que el alfa al que se tenga planteado
probar el experimento, en este caso se rechaza H 0 diciendo entonces que al menos un tratamiento tiene un
efecto diferente es decir que al menos una dosis de nitrgeno produce un rendimiento diferente a las dems.
En este diseo el modelo tiene el mismo valor que la fuente de variacin, ya que es la nica fuente de variacin
dentro del modelo.
ANAVA en Diseo Experimental Completamente al Azar Desbalanceado.

En este experimento donde se aplicaron reguladores de crecimiento a plntulas de frijol, se midi la variable
respuesta longitud del primer entrenudo.
DATA CA2;
INPUT Y T;
CARDS;
3.0 1
2.5 1
3.0 1
3.3 1
4.0 1
2.9 1
6.1 2
6.8 2
5.2 2
7.0 2
4.8 2
3.8 2
5.9 3
7.1 3
6.7 3
5.9 3
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T;
RUN;

Procedimiento GLM
Informacin de niveles de Clase
Clase
Niveles Valores
T
1 2 3
16
El Procedimiento GLM
Suma de
Cuadrados
31.15333333
10.03666667
41.19000000
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
13
15
R-Cuadrada
0.756332
Raz CME
0.878664
Coef. Var.
18.02389
Cuadrado Medio
15.57666667
0.77205128
F Value
20.18
Pr > F
0.0001
Y Media
4.875000
Fuente de Variacin
T
GL
2
SC Tipo I
31.15333333
Cuadrado Medio
15.57666667
F Value
20.18
Pr > F
0.0001
Fuente de variacin
T
GL
2
SC Tipo III
31.15333333
Cuadrado Medio
15.57666667
F Value
20.18
Pr > F
0.0001
En este anlisis por estar desbalanceado primero hace una regresin lineal, y despus el ANAVA.
Teniendo para este caso ya con los valores corregidos que al menos uno de los tratamientos producen efecto
diferente es decir que por lo menos en uno de los tratamientos el hipoctilo de frijol creci de manera diferente
a los otros, considerando un alfa del 0.05.
ANAVA en diseo Bloques al Azar.

El Experimento consto de una prueba de variedades de Maz, pero se hizo en bloques al azar por presentar
un gradiente de variacin en la fertilidad del suelo.
DATA BA1;
INPUT Y T B;
CARDS;
10.1 1 1
8.9 1 2
2.6 1 3
7.4 1 4
0.8 1 5
9.2 2 1
9.3 2 2
3.1 2 3
6.0 2 4
1.2 2 5
4.9 3 1
5.2 3 2
1.9 3 3
5.4 3 4
0.1 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL Y=T B;
RUN;

Procedimiento ANOVA
Informacin de Niveles de Clases
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
15
Suma de
Cuadrados
148.8546667
10.4546667
159.3093333
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.934375
Raz CME
1.143168
Coef. Var.
22.53288
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
24.8091111
1.3068333
F Value
18.98
Pr > F
0.0002
F Value
7.14
24.91
Pr > F
0.0166
0.0001
Y Media
5.073333
Anova SC
18.6653333
130.1893333
Cuadrado Medio
9.3326667
32.5473333
Tenemos en este ejemplo que del modelo se desprenden 2 fuentes de variacin los tratamientos y los bloques
y que en este caso ambos tienen diferencias significativas. Solo que en bloques es un poco ms fuertes, pero
en ambos casos se concluye que al menos una variedad es diferente a las dems en cuanto a su rendimiento
y que estas en conjunto en los bloques presentan tambin diferencias significativas es decir se comportan
diferente en cada bloque.
ANAVA en Diseo Experimental Cuadrado Latino.

En el experimento de variedades de trigo que funciona como tratamiento se tenan dos gradientes de variacin
que era para columnas fertilidad del suelo y para hileras humedad del mismo y utilizando parcelas de 15 m 2
y la variable respuesta de rendimiento de grano en gramos por parcela.
Teniendo el siguiente programa de SAS:
DATA CL1;
INPUT Y C H T;
CARDS;
732
1 1 4
728
1 2 1
1010 1 3 5
900
1 4 3
980
1 5 2
854
2 1 5
730
2 2 2
750
2 3 1
1100 2 4 4
970
2 5 3
641
3 1 3
854
3 2 4
860
3 3 2
860
3 4 1
1250 3 5 5
610
4 1 2
762
4 2 3
720
4 3 4
1200 4 4 5
930
4 5 1
549
5 1 1
976
5 2 5
1000 5 3 3
920
5 4 2
1070 5 5 4
;
PROC PRINT;
PROC ANOVA;
CLASS C H T;
MODEL Y=C H T;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
C
5
1 2 3 4 5
H
5
1 2 3 4 5
T
5
1 2 3 4 5
25
Suma de
Cuadrados
685015.6800
67488.8800
752504.5600
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
12
12
24
R-Cuadrada
0.910314
Raz CME
74.99382
Coef. Var.
8.539103
Fuentes de Variacin
C
H
T
GL
4
4
4
Cuadrado Medio
57084.6400
5624.0733
F Value
10.15
Pr > F
0.0002
F Value
0.46
18.94
11.06
Pr > F
0.7667
<.0001
0.0005
Y Media
878.2400
Anova SC
10252.5600
426061.7600
248701.3600
Cuadrado Medio
2563.1400
106515.4400
62175.3400
En este Diseo experimental se tienen el mismo nmero de Tratamientos, de Columnas y de Hileras, es una
caracterstica del diseo, y en este caso se concluye que la fertilidad en este caso no tiene reaccin con el
rendimiento, pero la humedad, si causa un efecto diferente entre hileras, adems de que las variedades tienen
diferencias significativas entre ellas con un alfa de 0.05.
ANAVA en Diseo Experimental Bloques al Azar Generalizado.

El experimento se realiz en bloques porque existe un gradiente de variacin pero se sospecha que puede
haber interaccin por lo que en lugar de utilizar el diseo bloques al azar, se utiliza el diseo bloques al azar
generalizado, que la nica diferencia de que este presenta repeticin de bloques. En este caso se trata del
rendimiento de tomate por corte por hectrea extrapolado, con un bloque que se trata de un gradiente de
variacin de humedad, y los tratamientos son aplicaciones foliares de abono nitrogenado.
DATA BAG1;
INPUT Y TRA BLO;
CARDS;
7.3 1 1
7.2 1 2
7.6 1 3
7.2 1 1
7.5 1 2
7.6 1 3
6.8 2 1
5.5 2 2
6.8 2 3
6.5 2 1
6.8 2 2
7.1 2 3
6.7 3 1
7.3 3 2
6.8 3 3
7.4 3 1
7.5 3 2
6.3 3 3
5.7 4 1
6.9 4 2
6.4 4 3
6.1 4 1
6.4 4 2
6.3 4 3
;
PROC PRINT;
PROC ANOVA;
CLASS TRA BLO;
MODEL Y=TRA BLO TRA*BLO;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
TRA
4
1 2 3 4
BLO
3
1 2 3
Numero de observaciones
24
Suma de
Cuadrados
6.25458333
1.58500000
7.83958333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.797821
Raz CME
0.363433
Coef. Var.
5.328274
Fuentes de Variacin
TRA
BLO
TRA*BLO
GL
3
2
6
Cuadrado Medio
0.56859848
0.13208333
F Value
4.30
Pr > F
0.0092
F Value
10.53
0.54
2.45
Pr > F
0.0011
0.5949
0.0881
Y Media
6.820833
Anova SC
4.17125000
0.14333333
1.94000000
Cuadrado Medio
1.39041667
0.07166667
0.32333333
En este caso segn este anlisis podemos interpretar que el gradiente de humedad existente en el
experimento no presenta diferencias significativas en cuanto a rendimiento por corte, mientras que los
tratamientos con aplicaciones foliares de fertilizantes si presentan una diferencia significativa, adems se
concluye como no se rechaz H0 de la interaccin, que no existe interaccin por lo que se hubiera podido
ocupar el diseo bloques al azar pero como no se saba, estuvo bien ocupado el modelo.
ANAVA de un Factorial de 2 en Completamente al Azar.

En este tipo de experimentos se tienen ms de un factor a evaluar, en este caso se tienen 2 factores a evaluar
por la misma variable respuesta.
En este caso se trata de rendimiento de forraje de alfalfa en toneladas por hectrea con una dosis de nitrgeno
como factor A y de fsforo como factor B.
DATA F2CA1;
INPUT Y TRA A B;
CARDS;
140 1 1 1
150 1 1 1
136 1 1 1
143 1 1 1
148 1 1 1
155 2 1 2
149 2 1 2
156 2 1 2
147 2 1 2
152 2 1 2
168 3 2 1
174 3 2 1
171 3 2 1
166 3 2 1
162 3 2 1
180 4 2 2
165 4 2 2
176 4 2 2
173 4 2 2
170 4 2 2
;
PROC PRINT;
PROC ANOVA;
CLASS A B;
MODEL Y=A B A*B;
PROC ANOVA;
CLASS TRA;
MODEL Y=TRA;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
A
2
1 2
B
2
1 2
20
Suma de
Cuadrados
2851.350000
405.600000
3256.950000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
R-Cuadrada
0.875466
Raz CME
5.034878
Coef. Var.
3.165595
Fuentes de Variacin
A
B
A*B
GL
1
1
1
Cuadrado Medio
950.450000
25.350000
F Value
37.49
Pr > F
<.0001
F Value
103.43
8.33
0.71
Pr > F
<.0001
0.0107
0.4112
F Value
37.49
Pr > F
<.0001
Y Media
159.0500
Anova SC
2622.050000
211.250000
18.050000
Cuadrado Medio
2622.050000
211.250000
18.050000
Procedimiento ANOVA
Clase
Nivel
Valor
TRA
4
1 2 3 4
Number of observations
20
The ANOVA Procedure
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
Suma de
Cuadrados
2851.350000
405.600000
3256.950000
Cuadrado Medio
950.450000
25.350000
R-Cuadrada
0.875466
Coef. Var.
3.165595
Fuentes de Variacin
TRA
Raz CME
5.034878
GL
3
Y Media
159.0500
Anova SC
2851.350000
Cuadrado Medio
950.450000
F Value
37.49
Pr > F
<.0001
En este caso podemos concluir que las dosis de nitrgeno influye significativamente en el rendimiento de
forraje en el cultivo de alfalfa, de igual manera las dosis de fsforo tambin influye de una manera significativa
en el rendimiento de forraje, pero no existe interaccin entre las dosis de nitrgeno y fsforo, es decir que
ambas dosis siguen la misma tendencia en las repeticiones, adems en esta prueba es necesario decir que
existe una diferencia significativa entre las combinaciones de dosis de nitrgeno y de fsforo.
ANAVA de un Factorial 2 en Diseo Bloque al Azar

Este se utiliza cuando se van a evaluar ms de dos factores de variacin y se tiene un gradiente de variacin
en las unidades experimentales. Este experimento se trata de evaluar a diferentes variedades de maz con
distintas dosis de nitrgeno, para evaluar la produccin de grano en toneladas por hectrea, con un gradiente
de humedad del suelo para formar los bloques.
DATA F2BA1;
INPUT Y BLO V N COVN$;
CARDS;
3.3 1 1 1 V1N1
4.2 1 1 2 V1N2
6.1 1 1 3 V1N3
5.4 1 2 1 V2N1
6.5 1 2 2 V2N2
7.2 1 2 3 V2N3
2.3 1 3 1 V3N1
2.5 1 3 2 V3N2
5.8 1 3 3 V3N3
4.7 1 4 1 V4N1
6.0 1 4 2 V4N2
7.2 1 4 3 V4N3
2.9 2 1 1 V1N1
4.4 2 1 2 V1N2
5.1 2 1 3 V1N3
5.2 2 2 1 V2N1
5.1 2 2 2 V2N2
8.0 2 2 3 V2N3
1.9 2 3 1 V3N1
2.3 2 3 2 V3N2
4.5 2 3 3 V3N3
5.5 2 4 1 V4N1
6.3 2 4 2 V4N2
8.6 2 4 3 V4N3
3.7 3 1 1 V1N1
4.2 3 1 2 V1N2
6.4 3 1 3 V1N3
6.3 3 2 1 V2N1
6.2 3 2 2 V2N2
8.3 3 2 3 V2N3
1.7 3 3 1 V3N1
3.9 3 3 2 V3N2
5.2 3 3 3 V3N3
4.3 3 4 1 V4N1
5.5 3 4 2 V4N2
7.4 3 4 3 V4N3
3.0 4 1 1 V1N1
5.4 4 1 2 V1N2
7.5 4 1 3 V1N3
6.6 4 2 1 V2N1
7.3 4 2 2 V2N2
9.0 4 2 3 V2N3
2.3 4 3 1 V3N1
3.3 4 3 2 V3N2
6.2 4 3 3 V3N3
3.3 4 4 1 V4N1
5.4 4 4 2 V4N2
8.2 4 4 3 V4N3
2.3 5 1 1 V1N1
5.5 5 1 2 V1N2
6.6 5 1 3 V1N3
5.6 5 2 1 V2N1
7.7 5 2 2 V2N2
8.9 5 2 3 V2N3
1.8 5 3 1 V3N1
2.2 5 3 2 V3N2
6.3 5 3 3 V3N3
2.6 5 4 1 V4N1
4.3 5 4 2 V4N2
8.2 5 4 3 V4N3
;
PROC PRINT;
PROC ANOVA;
CLASS BLO V N;
MODEL Y=BLO V N V*N;
PROC ANOVA;
CLASS BLO COVN;
MODEL Y=BLO COVN;

RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
4
1 2 3 4
N
3
1 2 3
60
Suma de
Cuadrados
215.8676667
24.3696667
240.2373333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
15
44
59
R-Cuadrada
0.898560
Raz CME
0.744215
Coef. Var.
14.23881
Fuentes de Variacin
BLO
V
N
V*N
GL
4
3
2
6
Cuadrado Medio
14.3911778
0.5538561
F Value
25.98
Pr > F
<.0001
F Value
1.29
58.18
101.03
1.33
Pr > F
0.2878
<.0001
<.0001
0.2638
Y Media
5.226667
Anova SC
2.8623333
96.6733333
111.9083333
4.4236667
Cuadrado Medio
0.7155833
32.2244444
55.9541667
0.7372778
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
COVN
12
V1N1 V1N2 V1N3 V2N1 V2N2 V2N3 V3N1 V3N2 V3N3 V4N1 V4N2 V4N3
60
Suma de
Cuadrados
215.8676667
24.3696667
240.2373333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
15
44
59
R-Cuadrada
0.898560
Raz CME
0.744215
Coef. Var.
14.23881
Fuentes de Variacin
BLO
COVN
GL
4
11
Cuadrado Medio
14.3911778
0.5538561
F Value
25.98
Pr > F
<.0001
F Value
1.29
34.96
Pr > F
0.2878
<.0001
Y Media
5.226667
Anova SC
2.8623333
213.0053333
Cuadrado Medio
0.7155833
19.3641212
En este ejemplo podemos interpretar por estos datos que la influencia de los bloques es no significativa,
mientras que tanto las variedades de maz y las diferentes dosis de nitrgeno tienen diferencias significativas
entre ellos, y que no existe interaccin entre variedades y dosis de nitrgeno, es decir que tienen la misma
tendencia entre bloques y entre ellos mismos, as tambin podemos observar que existe diferencias
significativas entre las diferentes combinaciones de variedades por dosis de nitrgeno, lo que nos indica de
que al menos una combinacin es diferente a las dems.
ANAVA de un Factorial de 3 en Completamente al Azar.

Este experimento evalo tres factores en el diseo experimental completamente al azar que quiere decir que
todas las unidades experimentales son homogneas, en este caso se trata de evaluar variedades de trigo(V),
aplicacin de hormonas(H) y de fertilizantes foliares(F) para evaluar la variable respuesta altura de planta.
DATA F3CA1;
INPUT Y V H F COMVH$ COMVF$ COMHF$ COMVHF$;
CARDS;
12 1 1 1 V1H1 V1F1 H1F1 V1H1F1
10 1 1 1 V1H1 V1F1 H1F1 V1H1F1
13 1 1 2 V1H1 V1F2 H1F2 V1H1F2
11 1 1 2 V1H1 V1F2 H1F2 V1H1F2
14 1 2 1 V1H2 V1F1 H2F1 V1H2F1
14 1 2 1 V1H2 V1F1 H2F1 V1H2F1
13 1 2 2 V1H2 V1F2 H2F2 V1H2F2
14 1 2 2 V1H2 V1F2 H2F2 V1H2F2
15 1 3 1 V1H3 V1F1 H3F1 V1H3F1
14 1 3 1 V1H3 V1F1 H3F1 V1H3F1
13 1 3 2 V1H3 V1F2 H3F2 V1H3F2
14 1 3 2 V1H3 V1F2 H3F2 V1H3F2
12 2 1 1 V2H1 V2F1 H1F1 V2H1F1
13 2 1 1 V2H1 V2F1 H1F1 V2H1F1
13 2 1 2 V2H1 V2F2 H1F2 V2H1F2
13 2 1 2 V2H1 V2F2 H1F2 V2H1F2
15 2 2 1 V2H2 V2F1 H2F1 V2H2F1
15 2 2 1 V2H2 V2F1 H2F1 V2H2F1
15 2 2 2 V2H2 V2F2 H2F2 V2H2F2
15 2 2 2 V2H2 V2F2 H2F2 V2H2F2
15 2 3 1 V2H3 V2F1 H3F1 V2H3F1
15 2 3 1 V2H3 V2F1 H3F1 V2H3F1
14 2 3 2 V2H3 V2F2 H3F2 V2H3F2
15 2 3 2 V2H3 V2F2 H3F2 V2H3F2
;
PROC PRINT;
PROC ANOVA;
CLASS V H F;
MODEL Y=V H V*H F V*F H*F V*H*F;
PROC ANOVA;
CLASS COMVH F;
MODEL Y=COMVH F COMVH*F;
PROC ANOVA;
CLASS COMVF H;
MODEL Y=COMVF H COMVF*H;
PROC ANOVA;
CLASS COMHF V;
MODEL Y=COMHF V COMHF*V;
PROC ANOVA;
CLASS COMVHF;
MODEL Y=COMVHF;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
V
2
1 2
H
3
1 2 3
F
2
1 2
24
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
V
H
V*H
F
V*F
H*F
V*H*F
GL
1
2
2
1
1
2
2
Cuadrado Medio
3.37500000
0.54166667
F Value
6.23
Pr > F
0.0019
F Value
13.00
24.92
0.31
0.08
0.08
2.15
0.31
Pr > F
0.0036
<.0001
0.7408
0.7862
0.7862
0.1588
0.7408
Y Media
13.62500
Anova SC
7.04166667
27.00000000
0.33333333
0.04166667
0.04166667
2.33333333
0.33333333
Cuadrado Medio
7.04166667
13.50000000
0.16666667
0.04166667
0.04166667
1.16666667
0.16666667
10
Procedimiento ANOVA
Clase
Nivel
Valor
COMVH
6
V1H1 V1H2 V1H3 V2H1 V2H2 V2H3
F
2
1 2
24
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMVH
F
COMVH*F
GL
5
1
5
Cuadrado Medio
3.37500000
0.54166667
F Value
6.23
Pr > F
0.0019
F Value
12.69
0.08
1.00
Pr > F
0.0002
0.7862
0.4582
F Value
6.23
Pr > F
0.0019
F Value
4.38
24.92
0.92
Pr > F
0.0265
<.0001
0.5119
F Value
6.23
Pr > F
0.0019
F Value
10.85
13.00
0.26
Pr > F
0.0004
0.0036
0.9256
Y Media
13.62500
Anova SC
34.37500000
0.04166667
2.70833333
Cuadrado Medio
6.87500000
0.04166667
0.54166667
Procedimiento ANOVA
Clase
Nivel
Valor
COMVF
4
V1F1 V1F2 V2F1 V2F2
H
3
1 2 3
24
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMVF
H
COMVF*H
GL
3
2
6
Cuadrado Medio
3.37500000
0.54166667
Y Media
13.62500
Anova SC
7.12500000
27.00000000
3.00000000
Cuadrado Medio
2.37500000
13.50000000
0.50000000
Procedimiento ANOVA
Clase
Nivel
Valor
COMHF
6
H1F1 H1F2 H2F1 H2F2 H3F1 H3F2
V
2
1 2
24
Suma de
Cuadrados
37.12500000
6.50000000
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.851003
Raz CME
0.735980
Coef. Var.
5.401689
Fuentes de Variacin
COMHF
V
COMHF*V
GL
5
1
5
Cuadrado Medio
3.37500000
0.54166667
Y Media
13.62500
Anova SC
29.37500000
7.04166667
0.70833333
Cuadrado Medio
5.87500000
7.04166667
0.14166667
11
Procedimiento ANOVA
Clase
Nivel
Valor
COMVHF
12 V1H1F1 V1H1F2 V1H2F1 V1H2F2 V1H3F1 V1H3F2 V2H1F1 V2H1F2 V2H2F1 V2H2F2 V2H3F1
V2H3F2
24
Suma de
Cuadrados
30.79166667
12.83333333
43.62500000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
12
23
R-Cuadrada
0.705826
Raz CME
1.034139
Coef. Var.
7.590014
Fuentes de Variacin
COMVHF
GL
11
Cuadrado Medio
2.79924242
1.06944444
F Value
2.62
Pr > F
0.0564
F Value
2.62
Pr > F
0.0564
Y Media
13.62500
Anova SC
30.79166667
Cuadrado Medio
2.79924242
En este caso tenemos de que del primer anlisis de varianza se concluye que V y H si tienen diferencias
significativas lo que quiere decir que al menos uno de sus efectos es diferente a los dems, mientras que F
resulta que todos los tratamientos de fertilizantes foliares, todos causan el mismo efecto, y tambin se puede
interpretar de que no existen interacciones en este experimento, puesto que todas se rechazan, en cuanto a
las combinaciones se puede decir que la combinacin VH sali con diferencias significativas lo que quiere
decir que no todas las combinaciones VH producen el mismo efecto, las combinaciones VF tambin salieron
con diferencias significativas lo que quiere decir de que no todas las combinaciones producen el mismo efecto,
al igual que las combinaciones HF con diferencias significativas, mientras que las combinaciones VHF es
decir la combinacin de los tres factores no presenta diferencias significativas.
12
ANAVA de un Factorial de 3 en Bloques al Azar.

Esto es cuando se tienen un gradiente de humedad del suelo, es para diferentes dosis de fertilizacin N-P-K
en el cultivo de berenjena donde la variable respuesta es rendimiento de fruta en toneladas por hectrea.
Para ver cual dosis de cada elemento y cul de sus combinaciones tiene el mejor rendimiento.
Teniendo el siguiente programa en SAS:
DATA F3BA1;
INPUT Y N P K BLO CONP$ CONK$ COPK$ CONPK$;
CARDS;
130 1 1 1 1 N1P1 N1K1 P1K1 N1P1K1
100 1 1 1 2 N1P1 N1K1 P1K1 N1P1K1
130 1 1 1 3 N1P1 N1K1 P1K1 N1P1K1
110 2 1 1 1 N2P1 N2K1 P1K1 N2P1K1
100 2 1 1 2 N2P1 N2K1 P1K1 N2P1K1
140 2 1 1 3 N2P1 N2K1 P1K1 N2P1K1
150 1 2 1 1 N1P2 N1K1 P2K1 N1P2K1
150 1 2 1 2 N1P2 N1K1 P2K1 N1P2K1
190 1 2 1 3 N1P2 N1K1 P2K1 N1P2K1
170 2 2 1 1 N2P2 N2K1 P2K1 N2P2K1
190 2 2 1 2 N2P2 N2K1 P2K1 N2P2K1
150 2 2 1 3 N2P2 N2K1 P2K1 N2P2K1
120 1 1 2 1 N1P1 N1K2 P1K2 N1P1K2
100 1 1 2 2 N1P1 N1K2 P1K2 N1P1K2
130 1 1 2 3 N1P1 N1K2 P1K2 N1P1K2
150 2 1 2 1 N2P1 N2K2 P1K2 N2P1K2
130 2 1 2 2 N2P1 N2K2 P1K2 N2P1K2
160 2 1 2 3 N2P1 N2K2 P1K2 N2P1K2
180 1 2 2 1 N1P2 N1K2 P2K2 N1P2K2
170 1 2 2 2 N1P2 N1K2 P2K2 N1P2K2
160 1 2 2 3 N1P2 N1K2 P2K2 N1P2K2
150 2 2 2 1 N2P2 N2K2 P2K2 N2P2K2
200 2 2 2 2 N2P2 N2K2 P2K2 N2P2K2
200 2 2 2 3 N2P2 N2K2 P2K2 N2P2K2
;
PROC PRINT;
PROC ANOVA;
CLASS BLO N P K;
MODEL Y=BLO N P N*P K N*K P*K N*P*K;
PROC ANOVA;
CLASS BLO CONP K;
MODEL Y=BLO CONP K CONP*K;
PROC ANOVA;
CLASS BLO CONK P;
MODEL Y=BLO CONK P CONK*P;
PROC ANOVA;
CLASS BLO COPK N;
MODEL Y=BLO COPK N COPK*N;
PROC ANOVA;
CLASS CONPK;
MODEL Y=CONPK;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
BLO
3
1 2 3
N
2
1 2
P
2
1 2
K
2
1 2
24
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Cuadrado Medio
1848.14815
364.28571
F Value
5.07
Pr > F
0.0036
Y Media
148.3333
13
Fuentes de Variacin
BLO
N
P
N*P
K
N*K
P*K
N*P*K
GL
2
1
1
1
1
1
1
1
Anova SC
1033.33333
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667
Cuadrado Medio
516.66667
816.66667
13066.66667
16.66667
816.66667
600.00000
16.66667
266.66667
F Value
1.42
2.24
35.87
0.05
2.24
1.65
0.05
0.73
Pr > F
0.2749
0.1565
<.0001
0.8337
0.1565
0.2202
0.8337
0.4066
F Value
5.07
Pr > F
0.0036
F Value
1.42
12.72
2.24
0.81
Pr > F
0.2749
0.0003
0.1565
0.5101
F Value
5.07
Pr > F
0.0036
F Value
1.42
2.04
35.87
0.27
Pr > F
0.2749
0.1540
<.0001
0.8428
F Value
5.07
Pr > F
0.0036
F Value
1.42
12.72
2.24
0.81
Pr > F
0.2749
0.0003
0.1565
0.5101
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
3
1 2 3
CONP
4
N1P1 N1P2 N2P1 N2P2
K
2
1 2
24
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
CONP
K
CONP*K
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
13900.00000
816.66667
883.33333
Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
3
1 2 3
CONK
4
N1K1 N1K2 N2K1 N2K2
P
2
1 2
24
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
CONK
P
CONK*P
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
2233.33333
13066.66667
300.00000
Cuadrado Medio
516.66667
744.44444
13066.66667
100.00000
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
3
1 2 3
COPK
4
P1K1 P1K2 P2K1 P2K2
N
2
1 2
24
Suma de
Cuadrados
16633.33333
5100.00000
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
9
14
23
R-Cuadrada
0.765337
Raz CME
19.08627
Coef. Var.
12.86715
Fuentes de Variacin
BLO
COPK
N
COPK*N
GL
2
3
1
3
Cuadrado Medio
1848.14815
364.28571
Y Media
148.3333
Anova SC
1033.33333
13900.00000
816.66667
883.33333
Cuadrado Medio
516.66667
4633.33333
816.66667
294.44444
14
Procedimiento ANOVA
Clase
Nivel
Valor
CONPK
8
N1P1K1 N1P1K2 N1P2K1 N1P2K2 N2P1K1 N2P1K2 N2P2K1 N2P2K2
24
Suma de
Cuadrados
15600.00000
6133.33333
21733.33333
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
7
16
23
R-Cuadrada
0.717791
Raz CME
19.57890
Coef. Var.
13.19926
Fuentes de Variacin
CONPK
GL
7
Cuadrado Medio
2228.57143
383.33333
F Value
5.81
Pr > F
0.0017
F Value
5.81
Pr > F
0.0017
Y Media
148.3333
Anova SC
15600.00000
Cuadrado Medio
2228.57143
En el ANAVA de este experimento podemos interpretar que en los elementos solos, solamente el P es el que
presenta diferencias significativas es decir por lo menos un tratamiento se comporta de manera diferente a
los dems en cuanto a rendimiento de berenjena mientras que N y K no presentaron diferencias significativas
dentro del rendimiento de esta hortaliza, en cuanto a las interacciones, podemos decir que todas presentan
la misma tendencia dentro de las dems es decir no existe interaccin, en cuanto a las combinaciones
podemos mencionar que la combinacin NP tiene diferencias significativas, al igual que la PK es decir que al
menos una combinacin causa un efecto diferente de las otras combinaciones, mientras que la combinacin
NK no presenta dichas diferencias por lo que todas las combinaciones producen el mismo efecto en el
rendimiento de este cultivo; mientras que la combinacin de los tres elementos tambin presenta diferencias
significativas es decir al menos una combinacin causa un efecto diferente que a las dems combinaciones.
15
ANAVA en Parcelas Divididas en Completamente al Azar.

En este tipo de diseos experimentales no todas las fuentes de variacin se prueban contra el error estndar,
si es que existen dos errores, como SAS no lo hace por default hay que programarlo, en este ejemplo se
evalu el rendimiento de lneas de maz en toneladas por hectrea, y dosis de nitrgeno, donde parcela grande
es las lneas de maz y la parcela chica es las dosis de nitrgeno.
El error A estar dado por el anidamiento de repeticiones en lneas es decir (R:L).
DATA PDCA1;
INPUT Y R L N;
CARDS;
13.5 1 1 1
11.0 2 1 1
11.2 1 1 2
10.9 2 1 2
15.9 1 1 3
15.7 2 1 3
17.4 1 2 1
19.6 2 2 1
12.7 1 2 2
11.6 2 2 2
15.4 1 2 3
13.6 2 2 3
18.5 1 3 1
17.0 2 3 1
15.1 1 3 2
10.3 2 3 2
19.2 1 3 3
19.1 2 3 3
;
PROC PRINT;
PROC ANOVA;
CLASS R L N;
MODEL Y=L R(L) N L*N;
TEST H=L E=R(L);
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
R
2
1 2
L
3
1 2 3
N
3
1 2 3
18
Suma de
Cuadrados
157.1194444
12.0766667
169.1961111
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
11
6
17
R-Cuadrada
0.928623
Raz CME
1.418724
Coef. Var.
9.539422
Fuentes de Variacin
L
R(L)
N
L*N
GL
2
3
2
4
Cuadrado Medio
14.2835859
2.0127778
F Value
7.10
Pr > F
0.0127
F Value
9.20
1.39
18.95
4.40
Pr > F
0.0149
0.3331
0.0026
0.0533
Y Media
14.87222
Anova SC
37.03444444
8.40833333
76.28111111
35.39555556
Cuadrado Medio
18.51722222
2.80277778
38.14055556
8.84888889
Prueba de la Hiptesis Usando el ANOVA CM de R(L) como el Error tipo a

Fuentes de Variacin
L
GL
2
Anova SC
37.03444444
Cuadrado Medio
18.51722222
F Value
6.61
Pr > F
0.0796
En este ejemplo podemos observar que el factor L es decir lnea de maz es significativo, pero no est bien
probado con el error dado por SAS por lo que se tiene que pedir que se pruebe contra otro error al cual le
llamaremos error tipo a por lo que en este ejemplo podemos concluir de que L ya probado con el error tipo a
no es significativo y N probado con el error de SAS el cual si est bien probado es significativo es decir no
16
todas las dosis de nitrgeno causan el mismo efecto en cuanto al rendimiento de las lneas de maz, y no
existe interaccin lo que quiere decir que todas las dosis de N siguen la misma tendencia en cada lnea de
maz.
17
ANAVA en Parcelas Divididas en Bloques al Azar.

En este diseo al igual que el anterior es en parcelas divididas, pero esta est diseado en bloques al azar,
es decir existe un gradiente de variacin en las unidades experimentales, pero hay que decir que adems de
la parcela grande tambin bloques se prueba contra el error tipo a no contra el error que da SAS, teniendo
para este ejemplo que tenemos como gradiente de variacin la salinidad del suelo, y como parcela grande
variedades de jitomate y como parcela pequea dosis de nitrgeno, evaluando dentro de un invernadero
hidropnico como variable respuesta rendimiento.
DATA PDBA1;
INPUT Y BLO
CARDS;
83.7
1 1
107.8
1 1
115.9
1 1
120.6
1 1
120.0
1 1
90.5
1 2
84.5
1 2
84.9
1 2
84.3
1 2
85.2
1 2
153.4
1 3
61.4
1 3
81.9
1 3
72.9
1 3
83.2
1 3
85.8
2 1
89.7
2 1
105.9
2 1
120.9
2 1
105.8
2 1
71.6
2 2
82.6
2 2
83.8
2 2
105.8
2 2
118.9
2 2
58.4
2 3
70.7
2 3
84.2
2 3
78.7
2 3
81.9
2 3
72.5
3 1
103.5
3 1
95.2
3 1
114.1
3 1
126.4
3 1
82.9
3 2
80.3
3 2
79.6
3 2
87.3
3 2
93.0
3 2
55.7
3 3
64.0
3 3
65.0
3 3
75.8
3 3
74.7
3 3
84.0
4 1
95.6
4 1
82.6
4 1
104.2
4 1
119.0
4 1
70.4
4 2
79.4
4 2
85.8
4 2
83.6
4 2
105.8
4 2
48.7
4 3
57.8
4 3
64.3
4 3
59.9
4 3
64.3
4 3
;
N;
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
18
PROC PRINT;
PROC ANOVA;
CLASS BLO V N;
MODEL Y=BLO V N BLO*V V*N;
TEST H=BLO V E=BLO*V;
RUN;

Procedimiento ANOVA
Clase
Nivel
Valor
BLO
4
1 2 3 4
V
3
1 2 3
N
5
1 2 3 4 5
60
Suma de
Cuadrados
17389.63850
7586.49000
24976.12850
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
23
36
59
R-Cuadrada
0.696250
Raz CME
14.51674
Coef. Var.
16.58962
Fuentes de Variacin
BLO
V
N
BLO*V
V*N
GL
3
2
4
6
8
Cuadrado Medio
756.07124
210.73583
F Value
3.59
Pr > F
0.0003
F Value
2.97
21.11
3.37
1.14
1.38
Pr > F
0.0446
<.0001
0.0193
0.3570
0.2378
Y Media
87.50500
Anova SC
1877.784500
8896.693000
2839.224333
1447.423000
2328.513667
Cuadrado Medio
625.928167
4448.346500
709.806083
241.237167
291.064208
Prueba de la Hiptesis Usando el ANOVA CM de BLO*V como el Error Tipo a

Fuentes de Variacin
BLO
V
GL
3
2
Anova SC
1877.784500
8896.693000
Cuadrado Medio
625.928167
4448.346500
F Value
2.59
18.44
Pr > F
0.1478
0.0027
En este ejemplo podemos interpretar lo siguiente: que en lo que se refiere a bloques, todos los bloques causan
el mismo efecto en cuanto al rendimiento, mientras que variedades y dosis de N si presentas diferencias
significativas, pero las dosis de N presentan la misma tendencia en cada Variedad. Por lo que podemos decir
que ni existe interaccin entre variedades y dosis de N.
19
ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Fijo.

Esta se debe de realizar cuando se tengan diferentes experimentos sobre un mismo tema.
Por ejemplo el siguiente se trata de un ensayo comparativo de cinco variedades de trigo, en dos campos
diferentes y se toma como variable respuesta los rendimientos obtenidos en 5 repeticiones en bloque es decir
5 bloques diferentes:
OPTIONS NODATE NOCENTER;
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC ANOVA; BY L;
CLASS BLO V;
MODEL Y= BLO V;
PROC ANOVA;
CLASS BLO L V;
MODEL Y=L V L*V BLO(L);
RUN;
20
Obteniendo los siguientes resultados: Primero por localidades, luego general.

Localidad 1
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
5
1 2 3 4 5
25
Suma de
Cuadrados
601.9200000
185.8400000
787.7600000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
8
16
24
R-Cuadrada
0.764091
Raz CME
3.408079
Coef. Var.
8.045511
Fuentes de Variacin
BLO
V
GL
4
4
Cuadrado Medio
75.2400000
11.6150000
F Value
6.48
Pr > F
0.0008
F Value
10.50
2.46
Pr > F
0.0002
0.0877
F Value
2.47
Pr > F
0.0589
F Value
3.13
1.81
Pr > F
0.0445
0.1757
F Value
3.47
Pr > F
0.0012
F Value
7.40
1.54
2.33
4.51
Pr > F
0.0105
0.2151
0.0771
0.0010
Y Media
42.36000
Anova SC
487.7600000
114.1600000
Cuadrado Medio
121.9400000
28.5400000
Localidad 2
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
V
5
1 2 3 4 5
25
Suma de
Cuadrados
993.280000
804.560000
1797.840000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
8
16
24
R-Cuadrada
0.552485
Raz CME
7.091192
Coef. Var.
18.62183
Fuentes de Variacin
BLO
V
General del experimento
GL
4
4
Cuadrado Medio
124.160000
50.285000
Y Media
38.08000
Anova SC
628.6400000
364.6400000
Cuadrado Medio
157.1600000
91.1600000
Procedimiento ANOVA
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
L
2
1 2
V
5
1 2 3 4 5
50
Suma de
Cuadrados
1824.180000
990.400000
2814.580000
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
17
32
49
R-Cuadrada
0.648118
Raz CME
5.563272
Coef. Var.
13.83210
Fuentes de Variacin
L
V
L*V
BLO(L)
GL
1
4
4
8
Cuadrado Medio
107.304706
30.950000
Y Media
40.22000
Anova SC
228.980000
190.280000
288.520000
1116.400000
Cuadrado Medio
228.980000
47.570000
72.130000
139.550000
En este tipo de experimentos primero se evala como un simple bloques al azar por cada localidad, y despus
se evala junto, por lo que podemos decir que en la localidad 1 solo existen diferencias significativas en cuanto
a los bloques, no en cuanto a las variedades de trigo, de igual manera se presenta la localidad 2 es decir
solamente los bloque presentan diferencias significativas, no variedades, en cuanto al general podemos decir
que localidades si presenta diferencias significativas, es decir son diferentes, as tambin son significativos
21
los bloques anidados en localidades, lo que pudimos ver al correr los datos por localidad. Tanto las variedades
como la interaccin localidades por variedades, no son significativos, estamos tomando en cuenta que es un
modelo fijo por lo que todas las hiptesis se prueban con el error experimental.
22
ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Aleatorio.

Esto es cuando todas las F. V. son aleatorias, para este caso no todas las F. V. para obtener Fc se prueban
contra el error experimental para SAS por lo que hay que hacer pruebas, segn la F. V. por sus componentes
de Varianza, es decir su Esperanza de Cuadrado Medio.
Por lo que se tendra el siguiente programa en SAS:
OPTIONS NODATE NOCENTER;
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC ANOVA;
CLASS BLO L V;
TEST H=V E=L*V;
RUN;
23

Procedimiento ANOVA
Clase
Nivel
Valor
BLO
1 2 3 4 5
1 2
1 2 3 4 5
50
Suma de
Fuentes de Variacin
GL
Cuadrados
Modelo
17
1824.180000
107.304706
Error
32
990.400000
30.950000
Total Corregido
49
2814.580000
R-Cuadrada
Coef. Var.
Raz CME
Y Media
13.83210
5.563272
40.22000
0.648118
Fuentes de Variacin
GL
Anova SC
Cuadrado Medio
F Value
3.47
Pr > F
0.0012
Cuadrado Medio
F Value
Pr > F
228.980000
228.980000
7.40
0.0105
190.280000
47.570000
1.54
0.2151
L*V
288.520000
72.130000
2.33
0.0771
BLO(L)
1116.400000
139.550000
4.51
0.0010
Prueba de Hiptesis usando el CM de L*V como el trmino del Error

Fuentes de Variacin
V
GL
Anova SC
190.2800000
Cuadrado Medio
F Value
Pr > F
47.5700000
0.66
0.6517
En este caso aunque se prob a la F. V. Variedades, con la interaccin L*V no es significativa pero tambin
hay que decir que el termino Lugares no tiene termino para probarlo por lo que se dice que No Existe Prueba
Exacta (NEPE)., y solo estn bien probados con el Error Experimental de SAS L*V y BLO(L) y de estas
solamente bloques anidados en lugares tiene diferencias significativas, con un alfa igual a 0.05 es decir con
el 5% de probabilidad de equivocarnos
24
Componentes de Varianza de una Serie de Experimentos en Bloques al Azar.

Esto es para calculas los estimadores de Varianza para ver la confiabilidad de los datos obtenidos en campo,
por lo que varianzas negativas se supone que no son confiables puesto que por ser cuadrados no puede
haber negativos, por lo que si tenemos varianzas negativas debemos no utilizar los datos para realizar el
Anlisis Estadstico.
Para este procedimiento el programa de SAS es el siguiente:
DATA SEBA1;
INPUT Y V L BLO;
CARDS;
48 1 1 1
51 1 1 2
38 1 1 3
43 1 1 4
43 1 1 5
50 2 1 1
51 2 1 2
38 2 1 3
46 2 1 4
36 2 1 5
42 3 1 1
42 3 1 2
36 3 1 3
40 3 1 4
35 3 1 5
46 4 1 1
49 4 1 2
45 4 1 3
47 4 1 4
29 4 1 5
45 5 1 1
46 5 1 2
39 5 1 3
38 5 1 4
36 5 1 5
41 1 2 1
36 1 2 2
36 1 2 3
46 1 2 4
37 1 2 5
48 2 2 1
30 2 2 2
35 2 2 3
32 2 2 4
20 2 2 5
56 3 2 1
54 3 2 2
31 3 2 3
37 3 2 4
31 3 2 5
47 4 2 1
46 4 2 2
33 4 2 3
39 4 2 4
46 4 2 5
43 5 2 1
25 5 2 2
33 5 2 3
39 5 2 4
31 5 2 5
;
PROC PRINT;
PROC VARCOMP;
CLASS BLO L V;
RUN;

Procedimiento de Estimacin de Componentes de Varianza
Clase
Nivel
Valor
BLO
5
1 2 3 4 5
L
2
1 2
V
5
1 2 3 4 5
50
25
Fuente de Variacin
L
V
L*V
BLO(L)
Error
MIVQUE(0) Matriz de SC
L
V
625.00000
2.7719E-30
2.7719E-30
400.00000
125.00000
200.00000
125.00000
9.3459E-31
25.00000
40.00000
L*V
125.00000
200.00000
225.00000
25.00000
45.00000
Fuente de Variacin
L
V
L*V
BLO(L)
Error
MIVQUE(0) Matriz de SC
BLO(L)
Error
125.00000
25.00000
9.3459E-31
40.00000
25.00000
45.00000
225.00000
45.00000
45.00000
49.00000
Y
5724.5
1902.8
3538.9
6726.9
2814.6
Procedimiento de Estimacin de Componentes de Varianza

MIVQUE(0) Estimados
Componente de Varianza
Var(L)
Var(V)
Var(L*V)
Var(BLO(L))
Var(Error)
Y
1.93000
-2.45600
8.23600
21.72000
30.95000
En este caso en especial tenemos que la varianza estimada de V es negativa por lo que hay que checar los
datos porque probablemente exista un error en la toma o en la trascripcin, si no diramos que los datos no
son confiables y por lo tanto no se deben utilizar para realizar algn anlisis estadstico.
26
ANAVA de un Diseo Experimental Ltice.

Este diseo se utiliza cuando se tienen bloques incompletos para poder formar los bloques completos, como
repeticiones, este solo se puede hacerse si el nmero de tratamientos es un cuadrado perfecto excepto para
el cuadrado de 6.
En este caso tenemos un ltice 7 por 7 del cual la variable respuesta es rendimiento, este experimento fue
realizado en variedades de trigo y triticale con un gradiente de variacin para bloques de fertilidad de suelos
y un nmero base para K de 7; y un =1 es decir 49 tratamientos que son las variedades de trigo y triticale 7
unidades experimentales por bloque incompleto los primeros 35 tratamientos son de trigo y los restantes de
triticale, se utilizaron dos repeticiones.
data latice1;
input group block treatment y;
cards;
1
5
1
2782
2
7
1
3145
1
3
2
2281
2
1
2
2106
1
7
3
2509
2
7
3
2825
1
7
4
3131
2
1
4
2775
1
6
5
1866
2
3
5
1155
1
4
6
2092
2
1
6
3188
1
7
7
3335
2
4
7
2795
1
2
8
2669
2
6
8
2947
1
5
9
2574
2
6
9
1672
1
4
10
2399
2
7
10
3418
1
2
11
3522
2
7
11
2914
1
2
12
3617
2
5
12
2235
1
1
13
3501
2
7
13
3462
1
3
14
2992
2
5
14
2928
1
6
15
2681
2
7
15
2633
1
4
16
2414
2
2
16
2971
1
3
17
2514
2
6
17
3140
1
3
18
2758
2
3
18
2431
1
7
19
3909
2
3
19
2812
1
5
20
3227
2
4
20
3159
1
6
21
3346
2
6
21
3439
1
6
22
3798
2
4
22
3389
1
6
23
3270
2
2
23
3387
1
1
24
3505
2
4
24
2776
1
1
25
2838
2
3
25
2841
1
2
26
3206
2
3
26
2339
1
5
27
2799
2
2
27
3315
1
4
28
2909
2
6
28
2931
1
6
29
2542
2
1
29
3272
1
2
30
1333
27
2
4
1
1
2
5
1
3
2
7
1
1
2
6
1
7
2
6
1
1
2
2
1
1
2
1
1
4
2
5
1
2
2
2
1
2
2
1
1
4
2
3
1
6
2
5
1
5
2
1
1
7
2
5
1
7
2
2
1
5
2
5
1
5
2
3
1
4
2
4
1
3
2
4
1
3
2
2
;
proc print;
proc lattice;
run;
30
31
31
32
32
33
33
34
34
35
35
36
36
37
37
38
38
39
39
40
40
41
41
42
42
43
43
44
44
45
45
46
46
47
47
48
48
49
49
2883
3002
3199
2712
3295
2806
2053
3020
2275
3286
4033
3056
3182
2815
3089
3119
3130
2780
2254
1902
2662
3354
3280
3506
3949
3102
3250
3541
3772
1878
1692
3081
3237
2476
2506
1944
2864
2381
2456

El procedimiento Ltice
Anlisis de Varianza para y
Fuente de Variacin
Repeticiones
Bloques dentro de Repeticiones (Ajus.)
Componente B
Tratamientos (Sin ajus.)
Error Intra Bloque
Error Efectivo del Bloque Completo
Total
GL
1
12
12
48
36
48
97
Suma de
Cuadrados
19461
2899741
2899741
21493124
5825300
8725041
30237625
Cuadrado
Medio
19461
241645
241645
447773
161814
181772
311728
Estadsticas Adicionales para y

Descripcin
Valor
Varianza de Diferencia
161814
LSD con =0.01
1078.95
LSD con =0.05
808.80
Eficiencia Relativa de RCBD
103.76
SAS solamente da algunos resultados para la operacin ltice pero los datos restantes hay que hacerlos a
mano, como lo son las Fc para ver si se rechaza o no la H0 para realizarlo se utilizan los datos ya antes
obtenidos por SAS por lo que para conseguir la Fc se divide el cuadro medio de tratamientos entre el cuadrado
medio del error efectivo y para la Ft se obtiene Buscando a F con los grados de libertad de tratamientos en el
numerador y los grados de libertad del error intrabloque y un en este caso 0.05.
Quedando que la Fc= 447773/181772= 2.46 y tenemos una F t= 4.69 tomando en cuenta que en las tablas
tenemos solamente 40 grados de libertad en lugar de 48 y 36 puesto que no existen tablas con estos valores,
28
lo que obtenemos es que no se rechaza H0 por lo que no existe diferencia entre tratamientos, pero como la
eficiencia relativa es menor al 110% no podemos realizar el anlisis en bloque al azar donde grupos
(repeticiones) es bloque, por lo que tenemos que dejar de esta manera el anlisis estadstico.
29
ANACOVA en Diseo Experimental Completamente al Azar

Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que
no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento de una
huerta de Durazno, la covariable es grosor de la rama tratada, y los tratamientos son dosis de un fertilizante
foliar orgnico.
DATA ANACOCA2;
INPUT X Y T;
CARDS;
25.0 22.0 1
24.5 21.5 2
27.0 18.6 3
23.1 23.0 1
22.8 22.6 2
20.0 19.8 3
25.2 25.0 1
21.0 24.0 2
23.4 21.0 3
20.0 25.5 1
20.3 23.8 2
24.0 22.5 3
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T X;
LSMEANS T;
RUN;

Procedimiento GLM
Clase
Nivel
Valor
T
3
1 2 3
12
Suma de
Cuadrados
29.60682387
15.80234280
45.40916667
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
3
8
11
R-Cuadrada
0.652001
Raz CME
1.405451
Coef. Var.
6.262686
Cuadrado Medio
9.86894129
1.97529285
F Value
5.00
Pr > F
0.0306
Y Media
22.44167
Fuentes de Variacin
T
X
GL
2
1
SC Tipo I
24.82666667
4.78015720
Cuadrado Medio
12.41333333
4.78015720
F Value
6.28
2.42
Pr > F
0.0229
0.1584
Fuentes de Variacin
T
X
GL
2
1
SC Tipo III
22.26403038
4.78015720
Cuadrado Medio
11.13201519
4.78015720
F Value
5.64
2.42
Pr > F
0.0297
0.1584
Procedimiento GLM
Cuadrado Medio Mnimo
T
Y LSMEAN
1
23.9652342
2
22.7118169
3
20.6479489
Para este caso en especial, se concluye de que tratamientos tiene diferencias significativas tanto en los datos
normales como en los datos ajustados, pero la covariable no tiene influencia en la variable respuesta, si lo
hubiera se toma la Pr > F de los datos ajustados, si no como es este caso se toma de los datos originales.
30
ANACOVA en diseo Experimental Bloques al Azar.

Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que
no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento en una
huerta de mango y la covariable es el grueso del tronco del rbol y los tratamientos son dosis de paclobutrazol
y un gradiente de variacin de humedad en el suelo.
DATA ANACOBA1;
INPUT X Y TRA BLO;
CARDS;
20.0 12.0 1 1
19.5 11.5 2 1
22.0 08.6 3 1
18.0 13.0 1 2
17.8 12.6 2 2
15.0 09.8 3 2
20.0 15.0 1 3
16.0 14.0 2 3
18.0 11.0 3 3
15.0 15.5 1 4
15.0 13.8 2 4
19.0 12.5 3 4
;
PROC PRINT;
PROC GLM;
CLASS TRA BLO;
MODEL Y=BLO TRA X;
LSMEANS TRA;
RUN;

Procedimiento GLM
Clase
Nivel
Valor
TRA
3
1 2 3
BLO
4
1 2 3 4
12
Suma de
Cuadrados
44.39176243
1.01740424
45.40916667
Fuentes de Variacin
Modelo
Error
Total Corregido
GL
6
5
11
R-Cuadrada
0.977595
Raz CME
0.451089
Coef. Var.
3.625628
Cuadrado Medio
7.39862707
0.20348085
F Value
36.36
Pr > F
0.0006
Y Media
12.44167
Fuentes de Variacin
BLO
TRA
X
GL
3
2
1
SC Tipo I
19.39583333
24.82666667
0.16926243
Cuadrado Medio
6.46527778
12.41333333
0.16926243
F Value
31.77
61.00
0.83
Pr > F
0.0011
0.0003
0.4036
Fuentes de Variacin
BLO
TRA
X
GL
3
2
1
SC Tipo III
14.49515300
24.77225276
0.16926243
Cuadrado Medio
4.83171767
12.38612638
0.16926243
F Value
23.75
60.87
0.83
Pr > F
0.0022
0.0003
0.4036
Procedimiento GLM
Cuadrado Medio Mnimo
TRA
Y LSMEAN
1
13.8486418
2
13.0490879
3
10.4272703
Esto ltimo es para poder hacer pruebas de medias.
En este anlisis podemos concluir que tanto los bloques como los tratamientos son significativamente
diferentes pero la covariable no es significativa, esto es tanto en los valores normales como en los valores
ajustados, esto quiere decir que tanto los tratamientos de paclobutrazol como los bloque que son por la
humedad en el suelo, son significativos, no as el dimetro del tronco.
31
Prueba de Comparacin de Medias DMS (LSD).

Esta prueba nos muestra en anlisis de varianza las diferencias que existen entre las medias de los
tratamientos de todos los diseos bsicos y de los factoriales.
En este caso ocuparemos el ejemplo del problema de completamente al azar.
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /LSD ALPHA=0.05
MEANS T /LSD ALPHA=0.01
RUN;

Procedimiento ANOVA
Prueba t (LSD) para Y
Alpha
0.05
Grados de Libertad del Error
24
Cuadrado Medio del Error
57.11155
Valor Crtico de t
2.06390
Diferencia Mnima Significativa
8.3371
Medias con la misma letra no tienen diferencias significativas.
Groupo t
A
B
C
B
C
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
En este caso en particular podemos decir que el mejor tratamiento es el nmero 1, seguido del nmero 2 pero
sin superar al nmero 3 y que el cuatro sin ser superado por el tres es el peor tratamiento, este es
considerando un 5% de error es decir con esa probabilidad de equivocarnos en la comparacin
32
Procedimiento ANOVA
Prueba t (LSD) para Y
Alpha
0.01
24
57.11155
Valor Crtico de t
2.79694
11.298
Medias con la misma letra no tienen diferencias significativas.
Groupo t
A
B
A
B
B
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
Este es el mismo experimento pero solamente que ahora se le da un valor de alfa diferente, es decir que en
este ejemplo tenemos la probabilidad de equivocarnos del 1% en lugar del anterior que es del 5% por lo que
podemos decir que el tratamiento 1 es el mejor pero sin superar estadsticamente al tratamiento 2, mientras
que los tratamientos 2, 3 y 4 no presentan diferencias estadsticas.
33
Prueba de comparacin de Medias Tukey.

Esta es la prueba ms segura puesto que es la ms precisa, pero solo sirve para pruebas balanceadas.
En este caso utilizaremos el ejemplo de bloques al azar.
DATA BA1;
INPUT Y T B;
CARDS;
10.1 1 1
8.9 1 2
2.6 1 3
7.4 1 4
0.8 1 5
9.2 2 1
9.3 2 2
3.1 2 3
6.0 2 4
1.2 2 5
4.9 3 1
5.2 3 2
1.9 3 3
5.4 3 4
0.1 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL Y=T B;
MEANS Y B/TUKEY ALPHA=0.05;
MEANS Y B/TUKEY ALPHA=0.01;
RUN;

Procedimiento ANOVA
Prueba de Rango Studentizado de Tukey (HSD) para Y
Alpha
0.05
Grados de libertad del Error
8
1.306833
Valor Critico del Rango Studentizado 4.04101
2.0659
Medias con la misma letra no presentan diferencias significativas.
Grupo
Tukey
A
A
B
Medias
5.9600
5.7600
3.5000
N
5
5
5
T
1
2
3
Procedimiento ANOVA
Alpha
0.05
8
1.306833
3.2246
Grupo
Tukey
A
A
A
B
B
Medias
8.0667
7.8000
6.2667
2.5333
0.7000
N
3
3
3
3
3
B
1
2
4
3
5
En este ejemplo por ser bloques al azar podemos observar de que existe una prueba para tratamientos y otra
para bloques, en el primero nos menciona que con una probabilidad de error tipo I de un 5% tenemos que el
tratamiento 1 sin superar al tratamiento 2 son los mejores, mientras que el tres si presenta diferencias con los
otros dos. En cuanto a bloques podemos decir que el mejor es el 1 sin superar al 2 y al 4 pero el 3 y el 5 son
los peores bloques.
34
Procedimiento ANOVA
Alpha
0.01
8
1.306833
Valor crtico del Rango Studentizado 5.63531
2.881
Grupo
Tukey
A
A
A
Medias
5.9600
5.7600
3.5000
N
5
5
5
T
1
2
3
Procedimiento ANOVA
Alpha
0.01
8
1.306833
4.3727
Grupo
Tukey
A
A
B A
B
C
C
Medias
8.0667
7.8000
6.2667
2.5333
0.7000
N
3
3
3
3
3
B
1
2
4
3
5
En este caso es la misma prueba que el anterior pero ahora con una probabilidad de error del 1%, por lo que
tenemos que tratamientos no presentan diferencias significativas, lo que quiere decir que todos los
tratamientos son iguales, mientras que en bloques tenemos tres grupos Tukey los mejores son el bloque 1 si
superar al 2 y al 4 pero el 4 no supera al 3 y el 5 es el peor pero sin ser superado estadsticamente del 3.
35
Pruebas de Comparacin de Medias de Rangos Mltiple de Duncan.

Es una de las pruebas ms utilizadas en experimentos en frutales, sobre todo para la comparacin de medias
de tratamientos para adelantar cosecha en Mango, el problema de esta prueba es que no es tan estricta como
Tukey pero s bastante confiable.
La utilizaremos en un ejemplo en Completamente al Azar.
Para lo que tenemos el siguiente Programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /DUNCAN ALPHA=0.05;
MEANS T /DUNCAN ALPHA=0.01;
RUN;

Procedimiento ANOVA
Prueba de Rangos Mltiples de Duncan para Y
Alpha
0.05
24
57.11155
Nmero de Medias
Rango Crtico
2
8.337
3
8.756
4
9.026
Medias con la misma letra no presentan diferencias significativas

Grupo
Duncan
Medias
N
T
A
40.771
7
1
B
29.729
7
2
C
B
21.771
7
3
C
19.771
7
4
En esta prueba es con alfa igual a 0.05, y podemos observar que el tratamiento 1 es el mejor y no lo igualan
estadsticamente los dems tratamientos, en segundo lugar el tratamiento 2 pero sin superar estadsticamente
al 3, y el peor es el tratamiento 4 pero sin ser superado estadsticamente con el tres, como ya se dijo esta es
una prueba de rangos mltiples lo que quiere decir de que por ejemplo para comparar el tratamiento 1 con el
tres se cuentan los tratamientos que se Encuentran all obviamente contando los que vamos a comparar en
36
este caso 3 entonces se toma el valor critico de nmero de medias 3 y si la diferencia es superior a este valor
entonces son diferentes estadsticamente.
Procedimiento ANOVA
Prueba de Rangos Mltiples de Duncan para Y
Alpha
0.01
24
57.11155
Nmero de Medias
Rango Crtico
2
11.30
3
11.78
4
12.11

Grupo
Duncan
Medias
N
T
A
40.771
7
1
B
A
29.729
7
2
B
21.771
7
3
B
19.771
7
4
En este caso con un alfa de 0.01 solamente tenemos dos grupos Duncan el primero con el mejor tratamiento
que es el 1 sin superar estadsticamente al 2 pero el 2, 3 y 4 no presentan diferencias significativas
estadsticamente hablando.
37
Prueba de Comparacin de Medias SNK (Student-Newman-Keuls).

Esta es muy parecida a la prueba de rangos mltiples de Duncan pero solamente que esta ocupa las tablas
de Tukey para obtener la diferencia mnima significativa
Utilizando el mismo ejemplo de Duncan en completamente al Azar.
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T/ SNK ALPHA=0.05;
MEANS T/ SNK ALPHA=0.01;
RUN;

Procedimiento ANOVA
Prueba Student-Newman-Keuls para Y
Alpha
0.05
24
57.11155
Nmero de Medias
Rango Crtico
2
8.3371399
3
10.0878
4
11.143415

Grupo
SNK
A
B
B
B
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
En este caso y con un alfa del 0.05 podemos decir que el tratamiento 1 es el mejor tratamiento, y el 2, 3 y 4
no presentan diferencias significativas entre ellos, se sigue el mismo procedimiento que para la prueba de
Duncan pero solamente que el valor crtico, es decir la diferencia mnima significativa, son diferentes a
Duncan, puesto que esta utiliza las tablas de Tukey.
38
Procedimiento ANOVA
Prueba Student-Newman-Keuls para Y
Alpha
0.01
24
57.11155
Nmero de Medias
Rango Critico
2
11.298964
3
12.982623
4
14.014182
Medias con la misma letra no presentan deferencias significativas

Grupo
SNK
A
B A
B
B
Media
40.771
29.729
21.771
19.771
N
7
7
7
7
T
1
2
3
4
Para este caso la prueba SNK se realiz con un alfa de 0.01 y tenemos los siguientes resultados, el
tratamiento 1 es el mejor pero sin superar el tratamiento 2 pero los tratamientos 2,3 y 4 no presentan
diferencias significativas estadsticamente hablando es decir son iguales.
39
Prueba de Comparacin de Medias de Dunnett.

Esta prueba no es muy popular entre los investigadores, por su dificultad de interpretar y por no formar grupos,
adems de solamente comparar el tratamiento testigo con todos los otros tratamientos y no los dems
tratamientos entre s.
Para lo que ocuparemos el mismo ejemplo que para Duncan utilizando como testigo el tratamiento 1.
Para lo que tenemos el siguiente programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL Y=T;
MEANS T /DUNNETT;
/*TRATAMIENTO 1 ES EL TESTIGO PARA SAS*/;
RUN;

Procedimiento ANOVA
Prueba t de Dunnett para Y
Alpha
0.05
24
57.11155
Valor Crtico de T de Dunnett
2.50672
10.126
Comparacin significativa con un nivel de 0.05 es indicado con ***.
Comparacin T
2
- 1
3
- 1
4
- 1
Diferencia
entre Medias
-11.043
-19.000
-21.000
Lmite de confianza
Simultanea al 95%
-21.169
-0.917 ***
-29.126
-8.874 ***
-31.126 -10.874 ***
En este caso podemos observar que todos los tratamientos son diferentes significativamente con respecto al
testigo, se pueden realizar a mano las pruebas entre los tratamientos con la diferencia mnima significativa, si
as lo requiere el investigador.
40
Prueba de Comparacin de Medias de Sheff.

Esta es una prueba de contrastes ortogonales por lo que para programarla en SAS primero se deben de tener
los contrastes que se van a realizar y se realiza para la comparacin de una media con varias o de una contra
una o ms medias, pero tambin al igual que la anterior no es la ms fcil de interpretar, por lo que aunque
es usada no es de las populares entre la comunidad cientfica mundial, adems esta prueba es utilizada en
el Procedimiento GLM no en el procedimiento ANOVA.
Realizaremos la prueba con los mismos datos completamente al azar utilizados en las pruebas anteriores
Por lo que tenemos el siguiente programa de SAS:
DATA CA2;
INPUT Y T;
CARDS;
34.4 1
27.3 1
65.0 1
31.3 1
48.5 1
38.4 1
40.5 1
25.0 2
23.2 2
45.2 2
26.4 2
26.8 2
32.7 2
28.8 2
20.9 3
22.2 3
27.8 3
19.6 3
20.1 3
22.1 3
19.7 3
19.7 4
21.7 4
21.1 4
18.5 4
16.0 4
20.2 4
21.2 4
;
PROC PRINT;
PROC GLM;
CLASS T;
MODEL Y=T;
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT3
CONTRAST "TRAT4
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT3
CONTRAST "TRAT3
CONTRAST "TRAT3
CONTRAST "TRAT4
CONTRAST "TRAT4
CONTRAST "TRAT4
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT1
CONTRAST "TRAT2
CONTRAST "TRAT2
CONTRAST "TRAT3
RUN;
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
VS
TRAT2,TRAT3,TRAT4" T 3 -1 -1 -1;
TRAT1,TRAT3,TRAT4" T -1 3 -1 -1;
TRAT1,TRAT2,TRAT4" T -1 -1 3 -1;
TRAT1,TRAT2,TRAT3" T -1 -1 -1 3;
TRAT2,TRAT3" T 2 -1 -1 0;
TRAT2,TRAT4" T 2 -1 0 -1;
TRAT3,TRAT4" T 2 0 -1 -1;
TRAT1,TRAT3" T -1 2 -1 0;
TRAT1,TRAT4" T -1 2 0 -1;
TRAT3,TRAT4" T 0 2 -1 -1;
TRAT1,TRAT2" T -1 -1 2 0;
TRAT1,TRAT4" T -1 0 2 -1;
TRAT2,TRAT4" T 0 -1 2 -1;
TRAT1,TRAT2" T -1 -1 0 2;
TRAT1,TRAT3" T -1 0 -1 2;
TRAT2,TRAT3" T 0 -1 -1 2;
TRAT2" T 1 -1 0 0;
TRAT3" T 1 0 -1 0;
TRAT4" T 1 0 0 -1;
TRAT3" T 0 1 -1 0;
TRAT4" T 0 1 0 -1;
TRAT4" T 0 0 1 -1;
(NOTA: Tambin puede utilizarse estimate en lugar de contrast, la diferencia es el estadstico de

prueba, estimate utiliza t de Student y contrast utiliza F)
41

Procedimiento GLM
Variable dependiente Y
Contraste
TRAT1 VS TRAT2,TRAT3,TRAT4
TRAT1 VS TRAT2,TRAT3
TRAT1 VS TRAT2
TRAT1 VS TRAT3
TRAT1 VS TRAT4
TRAT2 VS TRAT3
TRAT2 VS TRAT4
TRAT3 VS TRAT4
GL
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Contraste SC
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000
Cuadrado Medio
1519.801071
27.542976
363.334405
633.601071
1053.002143
1197.868810
1866.666667
11.108571
1.375238
374.408571
847.802143
337.166667
41.402143
1118.068810
617.166667
166.802143
426.806429
1263.500000
1543.500000
221.606429
347.006429
14.000000
F Value
26.61
0.48
6.36
11.09
18.44
20.97
32.68
0.19
0.02
6.56
14.84
5.90
0.72
19.58
10.81
2.92
7.47
22.12
27.03
3.88
6.08
0.25
Pr > F
<.0001
0.4941
0.0187
0.0028
0.0003
0.0001
<.0001
0.6631
0.8780
0.0172
0.0008
0.0230
0.4029
0.0002
0.0031
0.1004
0.0116
<.0001
<.0001
0.0605
0.0212
0.6250
En estos datos lo que se tiene que hacer es comparar el Pr > F si este es menor al alfa con la que estamos
comparando entonces si hay diferencias significativas, si no , despus de esto se ordenan y se le pueden
poner letras, pero realmente es bastante complejo, por ejemplo de este ejemplo pudiramos decir el
tratamiento 1 es diferente significativamente de los tratamientos 2,3 y 4; el tratamiento 3 y el tratamiento 4 al
igual que el 1 es diferente estadsticamente de los otros tres tratamientos, y as hay que evaluar cada uno de
los contrastes, la verdad se recomienda solo poner los contrastes que realmente el investigador considere
ms importantes si no es un mundo de informacin casi no interpretable.
42
Transformacin de Datos mediante Raz Cuadrada.

Esto se realiza cuando uno sospeche que los datos no tienen una distribucin normal o varianzas
homogneas, es decir las condiciones para poder realizar el Anlisis de Varianza.
En este caso utilizaremos un experimento en bloques al azar donde la variable respuesta fue nmero de frutos
por pancula en rboles de Mango, donde el gradiente de variacin es que se tom como un bloque a un
rbol.
Teniendo el siguiente programa de SAS
DATA BA1;
INPUT Y T B;
YTRC=SQRT(Y+0.5);
CARDS;
10 1 1
8 1 2
2 1 3
7 1 4
0 1 5
9 2 1
9 2 2
3 2 3
6 2 4
1 2 5
4 3 1
5 3 2
1 3 3
5 3 4
0 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL YTRC=T B;
RUN;

Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
YTRC
3.24037
2.91548
1.58114
2.73861
0.70711
3.08221
3.08221
1.87083
2.54951
1.22474
2.12132
2.34521
1.22474
2.34521
0.70711
Procedimiento ANOVA
Clase
Nivel
Valor
T
3
1 2 3
B
5
1 2 3 4 5
15
Variable Dependiente: YTRC
Suma de
Cuadrados
9.90767710
0.44829939
10.35597649
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.956711
Raz CME
0.236722
Coef. Var.
11.18874
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
1.65127952
0.05603742
F Value
29.47
Pr > F
<.0001
F Value
9.36
39.52
Pr > F
0.0080
<.0001
Y Media
2.115719
Anova SC
1.04946413
8.85821297
Cuadrado Medio
0.52473206
2.21455324
En este caso podemos ver que en el print aparece la fila de datos transformados, y con esta se realiza el
anlisis de varianza evitando problemas de Normalidad y Homogeneidad de Varianzas.
43
Transformacin de Datos mediante Logaritmo natural y en base 10.

Para esto se utilizara el ejemplo anterior pero para ambos tipos de logaritmos, pero como existen ceros
entonces se les suma una constante que en este caso en 1.
DATA BA1;
INPUT Y T B;
YTLD=LOG10(Y+1);
YTLN=LOG(Y+1);
CARDS;
10 1 1
8 1 2
2 1 3
7 1 4
0 1 5
9 2 1
9 2 2
3 2 3
6 2 4
1 2 5
4 3 1
5 3 2
1 3 3
5 3 4
0 3 5
;
PROC PRINT;
PROC ANOVA;
CLASS T B;
MODEL YTLD=T B;
PROC ANOVA;
CLASS T B;
MODEL YTLN=T B;
RUN;

Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Y
10
8
2
7
0
9
9
3
6
1
4
5
1
5
0
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
B
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
YTLD
1.04139
0.95424
0.47712
0.90309
0.00000
1.00000
1.00000
0.60206
0.84510
0.30103
0.69897
0.77815
0.30103
0.77815
0.00000
YTLN
2.39790
2.19722
1.09861
2.07944
0.00000
2.30259
2.30259
1.38629
1.94591
0.69315
1.60944
1.79176
0.69315
1.79176
0.00000
Procedimiento ANOVA
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
15
Variable Dependiente: YTLD
Suma de
Cuadrados
1.68598239
0.06255258
1.74853498
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.964226
Raz CME
0.088426
Coef. Var.
13.70182
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
0.28099707
0.00781907
F Value
35.94
Pr > F
<.0001
F Value
9.51
49.15
Pr > F
0.0077
<.0001
Y Media
0.645356
Anova SC
0.14872544
1.53725695
Cuadrado Medio
0.07436272
0.38431424
44
Procedimiento ANOVA
Clase
Nivel
Valores
T
3
1 2 3
B
5
1 2 3 4 5
15
Variable Dependiente: YTLN
Suma de
Cuadrados
8.93890687
0.33164742
9.27055429
Fuente de Variacin
Modelo
Error
Total Corregido
GL
6
8
14
R-Cuadrada
0.964226
Raz CME
0.203607
Coef. Var.
13.70182
Fuente de Variacin
T
B
GL
2
4
Cuadrado Medio
1.48981781
0.04145593
F Value
35.94
Pr > F
<.0001
F Value
9.51
49.15
Pr > F
0.0077
<.0001
Y Media
1.485987
Anova SC
0.78852714
8.15037973
Cuadrado Medio
0.39426357
2.03759493
En ambos casos podemos observar que los datos aparecen en el print al igual que en el caso anterior pero
en cada uno de los anlisis de varianza es diferente pero el resultado es el mismo en cuanto a la F calculada
y la prueba de P value
45
Transformacin de Datos Angular (Para Porcentajes)

En este caso este tipo de transformacin se recomienda a casos donde se tengan como resultados
porcentajes, adems hay que recordar que SAS trabaja en radianes por lo que hay que convertirlos a grados,
esto al igual que en los ejemplos anteriores es cuando se tiene la sospecha de que los datos no cumplen con
la Normalidad o la homogeneidad de Varianzas. El ejemplo es porcentaje de cido ctrico en frutos de mango
DATA CA1;
INPUT Y T;
YTAS=ARSIN(SQRT(Y/100))*(180/3.1416);
CARDS;
14.823 1
14.676 1
14.720 1
14.514 1
15.065 1
25.151 2
25.401 2
25.131 2
25.031 2
25.267 2
32.605 3
32.460 3
32.256 3
32.669 3
32.111 3
;
PROC PRINT;
PROC ANOVA;
CLASS T;
MODEL YTAS=T;
RUN;

Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Y
14.823
14.676
14.720
14.514
15.065
25.151
25.401
25.131
25.031
25.267
32.605
32.460
32.256
32.669
32.111
T
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
YTAS
22.6441
22.5253
22.5609
22.3939
22.8385
30.0997
30.2645
30.0865
30.0204
30.1763
34.8205
34.7318
34.6069
34.8596
34.5180
Procedimiento ANOVA
Clase
Nivel
Valores
T
3
1 2 3
15
Variable Dependiente: YTAS
Suma de
Cuadrados
374.2162599
0.2257303
374.4419903
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
12
14
R-Cuadrada
0.999397
Raz CME
0.137153
Coef. Var.
0.470618
Fuente de Variacin
T
GL
2
Cuadrado Medio
187.1081300
0.0188109
F Value
9946.81
Pr > F
<.0001
F Value
9946.81
Pr > F
<.0001
Y Media
29.14313
Anova SC
374.2162599
Cuadrado Medio
187.1081300
En este caso podemos apreciar al igual que en el anterior que los datos transformados aparecen en el print,
pero esta transformacin de datos es para obtener solamente los requerimientos bsicos para poder realizar
la prueba de anlisis de la varianza.
46
Prueba de estadstica no paramtrica de Kruskal-Wallis.

Esta prueba para datos no paramtricos, en este caso veremos una evaluacin de cuatro variedades de
Chirimoya en donde se cuantifico el nmero de semillas por fruto, teniendo los siguientes resultados y juegos
de hiptesis.
H 0 : V1 V2 V3 V4
H a : i j Vi V j
V1
V2
V3
V4
23
3.5
132
38
106
32
46
11
51
13
49
12
75
23.5
36
8
26
5
172
40
59
17.5
23
3.5
29
6
129
36
82
28
62
20
37
9
55
14
57
15.5
83
29
18
2
57
15.5
128
35
77
25.5
66
21
131
37
75
23.5
16
1
33
7
115
34
61
19
94
30
77
25.5
108
33
101
31
79
27
59
17.5
135
39
70
22
44
10
Donde
R1 = 109.5; R2 =298.5; R3 = 247; R4 = 165; k = Nm. De tratamientos= 4.
n1 = n2 = n3 = n4= 10; N = 40. Donde:
k R2
12

j 3N 1 15.53
N N 1 j 1 n j
2
c
t2 k21, 32,0.05 7.81

Como c2 es mayor que t2 , se rechaza la H0, lo que quiere decir que no todos los tratamientos producen el
mismo efecto, en este ejemplo no todas las variedades tienen el mismo nmero de semillas.
Prueba de Comparacin Mltiple de Medias.

Para hacer la comparacin de rangos se utilizar la prueba de rangos HSD de Tukey con la siguiente regla
de decisin
Si Ri R j q , , k
N Nk Nk 1
entonces i j
12
En donde el valor honestamente significativo nico es 134.2

Y el valor absoluto de las diferencias es de:
|R1 R2| = 189.0 > 134.2 por lo tanto i j
|R1 R3| = 137.5 > 134.2 por lo tanto i j
|R1 R4| = 055.5 < 134.2 por lo tanto i = j
|R2 R3| = 051.5 < 134.2 por lo tanto i = j
|R2 R4| = 133.5 < 134.2 por lo tanto i = j
|R3 R4| = 082.0 < 134.2 por lo tanto i = j
47
Por lo que quedara representado de la siguiente manera:

T2 298.5 a
T3 247.0 a
T4 165.0 a b
T1 109.5
Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1

es el peor tratamiento, pero sin ser superado estadsticamente por el 4.
Tambin puede utilizarse la prueba HSD de Tukey para la comparacin de rangos medios mediante la
siguiente regla de decisin
Si
R i R j q , , k
Donde
N N 1 1 1
entonces i j
n n
24
j
i

|R1 R2| = 18.90 > 13.42 por lo tanto i j
|R1 R3| = 13.75 > 13.42 por lo tanto i j
|R1 R4| = 05.55 < 13.42 por lo tanto i = j
|R2 R3| = 05.15 < 13.42 por lo tanto i = j
|R2 R4| = 13.35 < 13.42 por lo tanto i = j
|R3 R4| = 08.20 < 13.42 por lo tanto i = j

T2 29.85 a
T3 24.70 a
T4 16.50 a b
T1 10.95
Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1

es el peor tratamiento, pero sin ser superado estadsticamente por el 4.
O puede utilizarse la comparacin de rangos medios de Nemanyi mediante la siguiente regla de decisin
Si R i R j q , , k
k N 1
entonces i j
12
Para la prueba de Nemanyi se aplica esta frmula cuando todos los tratamientos tienen el mismo nmero de
repeticiones, de lo contrario se debe aplicar
q , , k
N N 1 1 1
.
n n
12
2
i
j
48
En donde el valor mnimamente significativo nico es 13.42

|R1 R2| = 18.90 > 13.42 por lo tanto i j
|R1 R3| = 13.75 > 13.42 por lo tanto i j
|R1 R4| = 05.55 < 13.42 por lo tanto i = j
|R2 R3| = 05.15 < 13.42 por lo tanto i = j
|R2 R4| = 13.35 < 13.42 por lo tanto i = j
|R3 R4| = 08.20 < 13.42 por lo tanto i = j

T2 29.85 a
T3 24.70 a
T4 16.50 a b
T1 10.95
En todos los casos dan la misma respuesta debido a que se basan en el mismo caso y cualquiera de ellas es
correcta.
49
Prueba de estadstica no paramtrica de Friedman.

Para esta prueba se tom un experimento de frutos de Chirimoya, donde se cuantifico el peso de frutos de
tres variedades, teniendo como gradiente de variacin la edad del rbol, teniendo los siguientes resultados y
juego de hiptesis
H 0 : 1 2 3
H a : i j i j
Bloque
1
2
3
4
5
6
7
8
9
10
T1
855
2
1113
3
719
2
924
2
1115
3
921
3
1106
3
912
2
1170
3
1190
3
T2
760
1
504
1
412
1
673
1
808
1
764
2
356
1
951
3
856
2
560
2
T3
999
3
645
2
880
3
1245
3
883
2
422
1
970
2
416
1
143
1
118
1
Teniendo que R1 =26; R2 =15; R3 =19; b =10 y k =3

Donde
y
c2
Ri2 3b k 1 6.2
bk k 1 i 1
12
t2 k21, 22,0.05 5.99
Como c2 es mayor que t2 , se rechaza la hiptesis nula, lo que quiere decir que no todos los tratamientos
provocan el mismo efecto en este caso no todas las variedades tienen el mismo peso de fruto
Prueba de Comparacin de Medias.

Esto es igual que la prueba Kruskal-Wallis, la siguiente frmula es para comparar los rangos ( ).
Teniendo la siguiente regla de decisin: Ri R j Z
k k 1
bk k 1
entonces i j
6
En donde el valor mnimamente significativo nico es 10.68

|R1 R2| = 11 > 10.68 por lo tanto i j
|R1 R3| = 07 < 10.68 por lo tanto i = j
|R2 R3| = 04 < 10.68 por lo tanto i = j
50
Lo que quedara representado de la siguiente manera.

T1 26 a
T3 19 a b
T2 15
Quedando que el tratamiento 1 es el mejor, sin ser superado estadsticamente por el 3, y el peor es el 2 sin
ser superado estadsticamente por el 3.
) de Nemanyi se debe
En este sentido cuando se pretende hacer la prueba por los rangos medios (
emplear la siguiente regla de decisin
Si R i R j
q , , k
k k 1
entonces i j
6b
2

|R1 R2| = 1.10 > 1.07 por lo tanto i j
|R1 R3| = 0.70 < 1.07 por lo tanto i = j
|R2 R3| = 0.40 < 1.07por lo tanto i = j
Lo que quedara representado de la siguiente manera.

T1 2.6 a
T3 1.9 a b
T2 1.5
En ambos casos, al igual que con la prueba Kruskal-Wallis, dan la misma respuesta debido a que se basan
en el mismo caso y cualquiera de ellas es correcta.
51
Correlacin Simple (Momento Producto De Pearson).

Para ejemplificar la correlacin lineal simple se tomarn datos de 5 caractersticas de la anatoma de 7
genotipos de durazno, recordando que la correlacin debe hacerse entre variables aleatorias.
genotipo
almendro
almendro
almendro
almendro
almendro
jalatzingo
jalatzingo
jalatzingo
jalatzingo
jalatzingo
misantla
misantla
misantla
misantla
misantla
nemaguard
nemaguard
nemaguard
nemaguard
nemaguard
temascaltepec
temascaltepec
temascaltepec
temascaltepec
temascaltepec
tulancingo, oax
tulancingo, oax
tulancingo, oax
tulancingo, oax
tulancingo, oax
sombrerete
sombrerete
sombrerete
sombrerete
sombrerete
longest
densest longlam epidsup epidinf
3.03 110.66
11.88
1.80
1.34
3.24 112.39
13.16
1.48
0.87
3.03 105.48
10.27
1.66
1.08
2.87 143.52
9.17
1.29
0.80
2.52 131.99
10.28
1.41
1.00
3.08 167.72
11.58
1.93
1.30
3.14 172.33
12.41
1.76
1.28
2.78 140.06
10.70
2.03
1.34
2.79 209.22
11.62
1.93
1.20
3.00 141.21
12.56
1.74
1.17
2.93 168.30
14.31
2.49
1.31
3.08 144.67
13.39
2.02
1.16
3.05 159.66
10.76
1.93
1.03
2.99 131.41
10.78
1.73
1.01
2.82 193.66
10.56
2.09
1.33
2.97 147.55
12.33
1.75
1.03
3.30 167.15
14.71
1.93
1.14
3.43 184.44
16.63
2.24
1.30
2.94 152.16
11.02
2.01
1.18
3.07 188.47
10.34
1.81
1.00
3.30 134.87
9.67
1.65
0.96
3.21 129.11
10.92
1.42
1.07
3.30 125.08
9.60
1.83
1.23
3.24 167.72
11.05
1.58
0.96
3.13 133.14
9.74
1.44
1.14
3.00 186.16
11.26
1.52
1.04
3.15 177.52
12.03
1.52
1.06
3.03 171.76
12.54
1.81
1.15
3.04 197.12
11.55
1.92
1.08
3.15 187.90
12.18
1.74
0.96
3.11 132.57
10.77
1.83
1.06
2.96 141.79
10.93
2.21
1.47
3.14 164.27
9.69
1.69
1.11
3.24 142.94
10.75
2.10
1.50
3.01 158.50
9.11
2.05
1.36
Las variables aleatorias se comparan en pares mediante la frmula:
xy rxy
n n
xi y i
n
xi y i i 1 i 1
n
i 1
n
xi
n
2
xi i 1
n
i 1
yi
n
y i2 i 1
n
i 1
52
El programa en SAS es el siguiente:

data corr;
input x$ y1-y5;
cards;
alm
3.03
110.66
alm
3.24
112.39
alm
3.03
105.48
alm
2.87
143.52
alm
2.52
131.99
jal
3.08
167.72
jal
3.14
172.33
jal
2.78
140.06
jal
2.79
209.22
jal
3.00
141.21
mis
2.93
168.30
mis
3.08
144.67
mis
3.05
159.66
mis
2.99
131.41
mis
2.82
193.66
nem
2.97
147.55
nem
3.30
167.15
nem
3.43
184.44
nem
2.94
152.16
nem
3.07
188.47
tem
3.30
134.87
tem
3.21
129.11
tem
3.30
125.08
tem
3.24
167.72
tem
3.13
133.14
tul
3.00
186.16
tul
3.15
177.52
tul
3.03
171.76
tul
3.04
197.12
tul
3.15
187.90
som
3.11
132.57
som
2.96
141.79
som
3.14
164.27
som
3.24
142.94
som
3.01
158.50
;
proc print;
proc corr;
var y1-y5;
run;
11.88
13.16
10.27
9.17
10.28
11.58
12.41
10.70
11.62
12.56
14.31
13.39
10.76
10.78
10.56
12.33
14.71
16.63
11.02
10.34
9.67
10.92
9.60
11.05
9.74
11.26
12.03
12.54
11.55
12.18
10.77
10.93
9.69
10.75
9.11
1.80
1.48
1.66
1.29
1.41
1.93
1.76
2.03
1.93
1.74
2.49
2.02
1.93
1.73
2.09
1.75
1.93
2.24
2.01
1.81
1.65
1.42
1.83
1.58
1.44
1.52
1.52
1.81
1.92
1.74
1.83
2.21
1.69
2.10
2.05
1.34
0.87
1.08
0.80
1.00
1.30
1.28
1.34
1.20
1.17
1.31
1.16
1.03
1.01
1.33
1.03
1.14
1.30
1.18
1.00
0.96
1.07
1.23
0.96
1.14
1.04
1.06
1.15
1.08
0.96
1.06
1.47
1.11
1.50
1.36
y la salida nos da la siguiente informacin

El procedimiento CORR
5 Variables:
y1
y2
Variable
y1
y2
y3
y4
y5
Media
3.05914
154.92857
11.43571
1.80971
1.14343
N
35
35
35
35
35
y3
y4
y5
Estadsticas Simples
Desv Est
Suma
0.17744
107.07
26.24091
5423
1.61783
400.25
0.26372
63.34
0.16439
40.02
Mnimo
2.52
105.48
9.11
1.29
0.80
Mximo
3.43
209.22
16.63
2.49
1.50
Coeficientes de Correlacin Pearson, N = 35

Prob > |r| bajo H0: Rho=0
y1
1.00000
y2
-0.04712
0.7881
y3
0.30602
0.0738
y4
0.00383
0.9826
y5
-0.03317
0.8500
y2
-0.04712
0.7881
1.00000
0.26719
0.1207
0.30275
0.0771
0.07212
0.6805
y3
0.30602
0.0738
0.26719
0.1207
1.00000
0.40063
0.0171
0.14947
0.3915
y4
0.00383
0.9826
0.30275
0.0771
0.40063
0.0171
1.00000
0.74121
<.0001
y5
-0.03317
0.8500
0.07212
0.6805
0.14947
0.3915
0.74121
<.0001
1.00000
y1
53
Interpretacin de los resultados:

Se hace las siguientes hiptesis
H0 :
0
Ha :
0
Es decir, H0 dice que no existe correlacin entre las dos variables, para hacer las pruebas de hiptesis se
realizar mediante el P-value donde se rechaza H0 si P-value < , si = 0.05 tenemos:
Para y1 y y2 el P-value es de 0.7881, por lo que no se rechaza H0
Para y3 y y4 el P-value es de 0.0171, por lo que se rechaza H0
Para y4 y y5 el P-value es de 0.0001, por lo que se rechaza H0
Es decir las correlaciones que son significativas con un nivel de confianza del 95 % son:
Entre la variables y3 y y4 y entre y4 y y5 todas las otras correlaciones no son estadsticamente diferentes de 0
es decir no existe correlacin estadsticamente significativas
54
Regresin Lineal Simple

Para ejemplificar la RLS se tomaron datos de prdida de peso de un coleoptero a diferentes humedades
relativas y se trata de saber cmo calcular la prdida de peso de acuerdo a su humedad
muestra
1
2
3
4
5
6
7
8
9
Humedad relativa (%)

0
12
29.5
43.6
53.5
62.5
75.5
85
93
Prdida de peso en mg
8.98
8.14
6.67
6.08
5.90
5.83
4.68
4.20
3.72
Y se probar el modelo y 0 1 x ; y = variable dependiente, x = variable independiente

El programa en SAS es el siguiente
data rls;
input x y;
cards;
0 8.98
12 8.14
29.5 6.67
43 6.08
53 5.9
62.5 5.83
75.5 4.68
85 4.2
93 3.72
;
proc print;
proc reg;
model y=x;
run;

Procedimiento REG
0
1x
y
Modelo:
Variable Dependiente: y
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
GL
Anlisis de Varianza
Suma de
GL
Cuadrados
1
23.51449
7
0.61606
8
24.13056
0.29666
6.02222
4.92614
R-Cuadrada
R-Cua Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
Cuadrado
medio
23.51449
0.08801
F Value
267.18
Pr > F
<.0001
0.9745
0.9708
t Value
Pr > |t|
8.70403
0.19156
45.44
<.0001
-0.05322
0.00326
-16.35
<.0001

R2 = 0.9745 se refiere a que el 97.45 % de la variabilidad de la prdida de peso se debe o se le atribuye a
la humedad relativa
1 R2 = 0.0255 se refiere a que el 2.55 % de la variabilidad de la prdida de peso no se debe al efecto de
la humedad relativa
55
Intervalos de confianza para 0 y
Empezaremos para 0
0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2
0 8.7043 t 0.05 0.19156

9 2 ,
2
0 8.7043 t 0.05 0.19156

7,
2
0 8.7043 2.3646 0.19156
0 8.7043 2.3646 0.19156

0 8.2513
0 8.7043 2.3646 0.19156
0 9.1573
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de 0 esta entre
el intervalo [8.2513, 9.1573]
Y para
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
1 0.05322 t 0.05 0.00326

92 ,
2
1 0.05322 t 0.05 0.00326

7,
2
1 0.05322 2.3646 0.00326

1 0.05322 2.3646 0.00326
1 0.0609
1 0.05322 2.3646 0.00326
1 0.0455
Esto significa que con un 95 % de confiabilidad de no equivocarnos, se concluye que el valor de
1 esta entre
el intervalo [-0.0609, -0.0455]

Pruebas de hiptesis para 0 y
Empezaremos para 0 , las hiptesis son:
0 *0
H0 :
56
0 *0
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:
tc
0 *0
s 0
tt t
n 2 ,
2
Clculos para tc donde *0 0
tc
0 0
s 0
t c 8.7043 0
0.19156
t c 45.44
Clculos para tt
tt t
9 2 ,0.05
2
t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt
0 es estadsticamente diferente de 0 con

45.44 > 4.3646; por lo tanto se Rechaza H0, lo que significa que
un nivel de confianza de 95 %
Y para
1 , las hiptesis son:
1 *1
H0 :
1 *1
Ha :
Para probar se hace por una prueba de t donde tc y tt son los siguientes:
tc
1 *1
s 1
tt t
n 2 ,
2
Clculos para tc donde
tc
*1 0
1 0
s 1
t c 0.05322 0
0.00326
t c 16.35
Clculos para tt
tt t
9 2 ,0.05
2
57
t t t 7 ,0.025
t t 4.3646
Regla de decisin: Rechazar H0 si tc > tt o si tc < -tt
-16.35 < -4.3646; por lo tanto se Rechaza H0, lo que significa que
1 es estadsticamente diferente de 0 con
un nivel de confianza de 95 %
Pruebas de hiptesis usando la prueba del P-value

En este caso se toma el valor el P-value y se compara con y se rechaza H0 si P-value <
En este caso tanto para 0 y
1 el valor de P-value es de <0.0001; Rechazando H0 en ambos casos al
considerar que = 0.05 llegando el mismo resultado anterior. Por lo anterior se concluye que la humedad
relativa influye significativamente en la prdida de peso de los coleoteros
Ecuacin de regresin estimada

La ecuacin de regresin es la siguiente:
y 8.7043 0.05322x
Uso de residuales
x
0
12
29.5
43
53
62.5
75.5
85
93
y
8.98
8.14
6.67
6.08
5.9
5.83
4.68
4.2
3.72
yp
8.7043
8.06566
7.13431
6.41584
5.88364
5.37805
4.68619
4.1806
3.75484
residual
0.2757
0.07434
-0.46431
-0.33584
0.01636
0.45195
-0.00619
0.0194
-0.03484
58
grfico de residuales
0.6
0.4
residual
0.2
0
3.5
4.5
5.5
6.5
7.5
8.5
9.5
-0.2
-0.4
-0.6
y predicha
Este grfico representa la distribucin entre los valores obtenidos de la ecuacin estimada de regresin y los
residuales es decir el valor obtenido de la variable dependiente y el valor predicho, esto tiene una
interpretacin de que si los residuales estn distribuidos al azar, como en este ejemplo, entonces se cumplen
los supuestos de la regresin (Normalidad, Homogeneidad de varianzas e Independencia)
59
Regresin lineal simple con ordenada al origen.

Utilizando el mismo ejemplo que para regresin lineal simple se probar ahora pero con ordenada al origen
es decir sin el parmetro 0 , es decir, probando el modelo
y 1 x

data rls;
input x y;
cards;
0 8.98
12 8.14
29.5 6.67
43 6.08
53 5.9
62.5 5.83
75.5 4.68
85 4.2
93 3.72
;
proc reg;
model y=x noint;
run;
Con los siguientes resultados

Procedimiento REG
1x
Modelo: y
NOTA: No intercepcin en el modelo. La R-cuadrada es redefinida.
Fuente de Variacin
Modelo
Error
Total Uncorregido
Anlisis de Varianza
Suma de
GL
Cuadrados
1
168.22628
8
182.30872
9
350.53500
Raz CME
Media Dependiente
Coef. Var.
4.77374
6.02222
79.26874
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
1
R-Cuadrada
R-Cua Ajust
0.07349
0.02705
Cuadrado
medio
168.22628
22.78859
F Value
7.38
Pr > F
0.0264
0.4799
0.4149
t Value
Pr > |t|
2.72
0.0264

R2
= 0.4799 se refiere a que el 47.99 % de la variabilidad de la prdida de peso se debe o se le atribuye a
la humedad relativa
1 R2 = 0.5201 se refiere a que el 52.01 % de la variabilidad de la prdida de peso no se debe al efecto
de la humedad relativa. Por lo que se trata de un modelo no muy confiable
Intervalos de confianza para
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
1 0.07349 t 0.05 0.02705

92 ,
2
1 0.07349 t 0.05 0.02705

7,
2
60
1 0.07349 2.3646 0.02705

1 0.07349 2.3646 0.02705
1 0.1375
1 0.07349 2.3646 0.02705

1 0.0095
1 esta entre
el intervalo [-0.1375, -0.0095]
Prueba de hiptesis mediante el P-value

Con un = 0.05 y un P-value calculado de
1 de 0.0274 por lo que se rechaza H0, es decir, que el parmetro
es estadsticamente de manera significativa diferente de 0
0 0 , el nivel de confiabilidad disminuye, normalmente pasa lo

En este caso particular al hacer que
contrario, pero en este caso no, por lo que se recomienda incluir este parmetro.
61
Regresin lineal mltiple

Para ejemplificar la RLM se utilizar un ejemplo de diferentes dosis de fertilizacin N P K con el rendimiento
de cultivo de zarzamora en toneladas por hectrea
Dosis de N
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
200
200
200
200
200
200
200
200
200
Dosis de P
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100
0
0
0
50
50
50
100
100
100
Dosis de K
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
0
40
80
Rendimiento
5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5
Y se probar el modelo y 0 1 x1 2 x 2 3 x3 ; y = variable dependiente, x1, x2 y x3 = variables

independientes

data rlm;
input x1 x2 x3 y;
cards;
0
0
0
0
0
40
0
0
80
0
50
0
0
50
40
0
50
80
0
100
0
0
100
40
0
100
80
100
0
0
100
0
40
100
0
80
100
50
0
100
50
40
100
50
80
100
100
0
100
100
40
100
100
80
200
0
0
200
0
40
200
0
80
200
50
0
200
50
40
200
50
80
200
100
0
200
100
40
200
100
80
5.5
5.8
5.7
5.9
6.3
6.0
5.9
6.3
6.0
9.9
9.6
10.6
10.8
10.4
9.3
9.6
9.1
11.8
12.3
12.1
12.2
13.2
12.8
11.9
12.0
11.6
9.5
62
;
proc print;
proc reg;
model y=x1 x2 x3;
run;

Procedimiento REG
0
1 x1
2 x2
3 x3
y
Modelo:
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
23
26
Raz CME
Media Dependiente
Coef. Var.
Variable
GL
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
163.64778
54.54926
22.93519
0.99718
186.58296
0.99859
9.33704
10.69493
R-Cuadrada
R-Cua Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
54.70
Pr > F
<.0001
0.8771
0.8610
t Value
Pr > |t|
6.54815
0.45070
14.53
<.0001
0.03011
0.00235
12.79
<.0001
-0.00211
0.00471
-0.45
0.6580
-0.00292
0.00588
-0.50
0.6248
Interpretacin de datos
R2 = 0.8771 se refiere a que el 87.71 % de la variabilidad del rendimiento se debe o se le atribuye a las
variables del modelo en este caso las dosis de N P K
1 R2 = 0.1229 se refiere a que el 12.29 % de la variabilidad del rendimiento no se debe o se le atribuye
a las variables del modelo en este caso las dosis de N P K
Intervalos de confianza para 0 ,
1 , 2 y 3
Empezaremos para 0
0
s 0
0 , 0 t
0 t n 2 , s
n 2 ,
2
2
0 6.54815 t
0.4507
27 2 ,0.05
2
0 6.54815 t 0.05 0.4507

25,
2
0 6.54815 2.0595 0.4507

0 6.54815 2.0595 0.4507
0 5.6199
0 6.54815 2.0595 0.4507
0 7.4764
63
el intervalo [5.6199, 7.4764]
Y para
1
s 1
1 ,1 t
1 t n 2 , s
n 2 ,
2
2
1 0.3011 t
0.00235
0
.
05
27 2 ,
2
1 0.3011 t 0.05 0.00235

25,
2
1 0.3011 2.0595 0.00235

1 0.3011 2.0595 0.00235
1 0.2963
1 0.3011 2.0595 0.00235

1 0.3059
1 esta entre
el intervalo [0.2963, 0.3059]

Y para
2
s 2
2 , 2 t
2 t n 2 , s
n2 ,
2
2
2 0.00211 t
0.00471
27 2 ,0.05
2
2 0.00211 t 0.05 0.00471

25,
2
2 0.00211 2.0595 0.00471
2 0.00211 2.0595 0.00471

2 0.0118
2 0.00211 2.0595 0.00471
2 0.0076
2 esta entre
el intervalo [-0.0118, 0.0076]

Y para 3
3
s 3
3 , 3 t
3 t n 2 , s
n 2 ,
2
2
64
3 0.00292 t
0.00588
27 2 ,0.05
2
3 0.00292 t 0.05 0.00588

25,
2
3 0.00292 2.0595 0.00588

3 0.00292 2.0595 0.00588
3 0.0150
3 0.00292 2.0595 0.00588
3 0.0092
el intervalo [-0.0150, 0.0092]
Prueba de hiptesis conjunta usando P-value.

La hiptesis es:
H 0 : 0 1 2 3 0
H a : i j i j
esta prueba se realiza con el P-value de la prueba de F del anlisis de varianza de la regresin y se rechaza
H0 si el P-value es menor a en este caso = 0.05
el P-value en nuestro ejemplo es de 0.0001 por lo tanto se rechaza H0 es decir al menos un parmetro es
diferente de 0
Pruebas de hiptesis individuales usando P-value.
Las hiptesis son:
i *i
H0 :
i *i
Ha :
donde i = en nuestro caso (0, 1, 2, 3) y *i 0 es decir todos los parmetros son iguales a 0, utilizando la
prueba de t-value y se rechaza H0, si el P-value es menor a en este caso = 0.05
Parmetro
1
2
3
Lo que significa que solo los parmetros 0 y
P-value
0.0001
Decisin
Se rechaza H0
0.0001
Se rechaza H0
0.6580
No se rechaza H0
0.6248
No se rechaza H0
1 influyen significativamente en y; la intercepcin al origen (
0 ) no tiene una explicacin lgica, pero 1 que es el coeficiente que representa el N es decir para este
ejemplo el nico que influye significativamente en el rendimiento es el N
65
Prueba de hiptesis conjunta

Estas se realizan cuando se quieren comparar dos o ms parmetros; menos de los parmetros totales,
evitando 0 ; para este caso la hiptesis es:
0
H0 : 1
2 0
0
Ha : 1
2 0
para lo cual se hace una regresin aceptando la H0, es decir, un modelo reducido solo con los estimadores
de todos que no estn en la hiptesis, y probndose con una prueba de F con la siguiente Fc
Fc
CM H
CM E MC
donde
el
CM H
SC H
GLH
este
su
vez
se
descompone
en
SCH SCE MR SCE MC y GLH GLE MR GLE MC donde el MR significa el

modelo reducido y el MC el modelo completo.
Y el Ft
GL H
Ft FGL
E MC ,
En este ejemplo
SCH 186.33796 22.93519 163.40277 ; GLH 25 23 2
CM H 163 .40277 81 .7014

2
Fc 81 .7014 80 .9296 y Ft F232 ,0.05 4.28
0.99718
como Fc > Ft se rechaza H0 es decir al menos uno de los dos parmetros es diferente de 0
Eleccin del mejor modelo

Para seleccionar el mejor modelo se utiliza los criterios de mxima R2 y parsimonia para este caso tenemos
Modelo
R2
0
1 x1
2 x2
3 x3
y
0
1 x1
2 x2
y
0
1 x1
3 x3
y
0.8771
Nmero de
parmetros
4
Seleccin
Seleccionado 4
0.8758
Seleccionado 3
0.8760
Seleccionado 2
0
2 x2
3 x3
y
0.0024
0
1 x1
y
0
2 x2
y
0.8747
No
seleccionado
Seleccionado 1
0.0011
0
3 x3
y
0.0013
No
seleccionado
No
seleccionado
Aunque el modelo con cuatro parmetros es el de mxima R2 se decide seleccionar el modelo con menos de
0
1 x1 puesto que
0.05 en R2 pero con menor nmero de parmetros seleccionndose el modelo y
presenta un valor de R2 similar a la mxima pero con menos parmetros.
66
Regresin exponencial con una variable independiente

Para ejemplificar la RE1V se utilizar un ejemplo de crecimiento de Escherichia coli (en miles de unidades) a
diferentes temperaturas de incubacin
Temperatura
C
18
20
22
24
26
28
30
32
Y se probar el modelo
Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
y 0 1 ; para linealizar este modelo se realizan logaritmos teniendo el

x
siguiente modelo linealizado:
log e y log e 0 x log e 1 log e o log 10 y log 10 0 x log 10 1 log 10

Calculando la regresin como RLS y luego se obtienen los antilogaritmos de los parmetros obtenidos en la
RLS
Obteniendo as la ecuacin de regresin
0
1
y
Teniendo el siguiente programa, utilizando logaritmo natural, en SAS

data re1v;
input x y;
ly= log(y);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=x;
run;
y los siguientes resultados:

Obs
1
2
3
4
5
6
7
8
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536
Procedimiento REG
Modelo:
0 x log e
1
log e y log e
Variable Dependiente: ly
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.34136
1.34136
0.18317
0.03053
1.52453
0.17472
3.04908
5.73040
R-cuadrada
R-Cuad. Ajust
F Value
43.94
Pr > F
0.0006
0.8798
0.8598
67
Variable
0
log e
1
log e
GL
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
t Value
Pr > |t|
0.81521
0.34262
2.38
0.0548
0.08935
0.01348
6.63
0.0006
Para determinar los verdaderos parmetros se obtiene el antilogaritmo de ambos parmetros
0 lo siguiente
0 e 0.81521 2.2597 y para
Teniendo para
ecuacin de regresin
1 e 0.08935 1.0935 teniendo la siguiente
y 2.2597 1.0935 x
Y utilizando logaritmo base 10 se tiene el siguiente programa en SAS

Data re1v;
input x y;
ly= log10(y);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=x;
run;

Obs
1
2
3
4
5
6
7
8
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305
Procedimiento REG
Modelo:
0 x log 10
1
log 10 y log 10
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
0
log e
1
log e
GL
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.25300
0.25300
0.03455
0.00576
0.28754
0.07588
1.32420
5.73040
R-cuadrada
R-cuad Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
43.94
Pr > F
0.0006
0.8798
0.8598
t Value
Pr > |t|
0.35404
0.14880
2.38
0.0548
0.03881
0.00585
6.63
0.0006
Para determinar los verdaderos parmetros se obtiene el antilogaritmo de ambos parmetros
0 lo siguiente
0 10 0.35404 2.2597 y para
1 10 0.03881 1.0935 teniendo la
Teniendo para
siguiente ecuacin de regresin
y 2.2597 1.0935 x , la misma utilizando el logaritmo natural
68
Regresin de potencia con una variable independiente

Para ejemplificar la RP1V se utilizar el mismo ejemplo de crecimiento de Escherichia coli (en miles de
unidades) a diferentes temperaturas de incubacin
Temperatura
C
18
20
22
24
26
28
30
32
Crecimiento
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
Y se probar el modelo y 0 x 1 ; para linealizar este modelo se realizan logaritmos teniendo el

siguiente modelo linealizado:
log e y log e 0 1 log e x log e o log 10 y log 10 0 1 log 10 x log 10

Calculando la regresin como RLS y luego se obtienen los antilogaritmos de los parmetros obtenidos en la
RLS
0 x 1
Obteniendo as la ecuacin de regresin y
Teniendo el siguiente programa, utilizando logaritmo natural, en SAS
data rp1v;
input x y;
ly= log(y);
lx=log (x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;

Obs
1
2
3
4
5
6
7
8
x
18
20
22
24
26
28
30
32
y
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
ly
2.61007
2.72130
2.66026
2.74727
2.97553
3.25037
3.55249
3.87536
lx
2.89037
2.99573
3.09104
3.17805
3.25810
3.33220
3.40120
3.46574
Procedimiento REG
Modelo:
0
1 log e x
log e y log e
Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef Var
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
1.25624
1.25624
0.26828
0.04471
1.52453
0.21146
3.04908
6.93510
R-cuadrada
R-cuad Ajust
F Value
28.10
Pr > F
0.0018
0.8240
0.7947
69
Variable
0
log e
1
GL
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
t Value
Pr > |t|
-3.70968
1.27731
-2.90
0.0272
2.11109
0.39828
5.30
0.0018
0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 e 3.70968 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente
y 0.0245 x 2.1111
Y utilizando logaritmo base 10 se tiene el siguiente programa en SAS
data rp1v;
input x y;
ly= log10(y);
lx=log10(x);
cards;
18
13.6
20
15.2
22
14.3
24
15.6
26
19.6
28
25.8
30
34.9
32
48.2
;
proc print;
proc reg;
model ly=lx;
run;

Obs
ly
lx
1
2
3
4
5
6
7
8
18
20
22
24
26
28
30
32
13.6
15.2
14.3
15.6
19.6
25.8
34.9
48.2
1.13354
1.18184
1.15534
1.19312
1.29226
1.41162
1.54283
1.68305
1.25527
1.30103
1.34242
1.38021
1.41497
1.44716
1.47712
1.50515
Procedimiento REG
Modelo:
0
1 log 10 x
log 10 y log 10
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
Media Dependiente
Coef. Var.
Variable
0
log 10
1
GL
GL
1
6
7
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
0.23694
0.23694
0.05060
0.00843
0.28754
0.09183
1.32420
6.93510
R-cuadrada
R-cuad Ajust
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
F Value
28.10
Pr > F
0.0018
0.8240
0.7947
t Value
Pr > |t|
-1.61109
0.55473
-2.90
0.0272
2.11109
0.39828
5.30
0.0018
0
Para determinar los verdaderos parmetros se obtiene el antilogaritmo del parmetro
0 10 1.61109 0.0245 teniendo la siguiente ecuacin de regresin
Teniendo lo siguiente
y 0.0245 x 2.1111 , la misma que con el logaritmo natural
70
Regresin polinomial de segundo grado con una variable indepediente

Para ejemplificar la RCS se utilizar un ejemplo de dosis de auxinas en mg/l y el rendimiento de manzana y
se pretende realizar regresin polinomial de segundo grado para calcular la ecuacin de regresin y obtener
la dosis ptima para un mximo rendimiento
Dosis de
auxinas
0
10
20
30
40
50
60
70
80
90
100
Rendimiento en
toneladas
12
15.5
17
28
37
28
27.5
18.5
19
15
10
Y se probar el modelo y 0 1 x 2 x 2 .
data rcs;
input x y;
xx=x*x;
cards;
0
12
10 15.5
20 17
30 28
40 37
50 28
60 27.5
70 18.5
80 19
90 15
100 10
;
proc print;
proc reg;
model y=x xx;
run;

Obs
1
2
3
4
5
6
7
8
9
10
11
x
0
10
20
30
40
50
60
70
80
90
100
y
12.0
15.5
17.0
28.0
37.0
28.0
27.5
18.5
19.0
15.0
10.0
xx
0
100
400
900
1600
2500
3600
4900
6400
8100
10000
Procedimiento REG
Modelo:
0
1x
2 x2
y
Fuente de Variacin
Modelo
Error
Total Corregido
Raz CME
GL
2
8
10
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
522.36620
261.18310
167.27016
20.90877
689.63636
4.57261
R-cuadrada
F Value
12.49
Pr > F
0.0035
0.7575
71
Media Dependiente
Coef. Var.
20.68182
22.10933
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
R-cuad Ajust
0.6968
t Value
Pr > |t|
10.66783
3.48366
3.06
0.0155
0.74078
0.16208
4.57
0.0018
-0.00772
0.00156
-4.95
0.0011
R2 = 0.7575 se refiere a que el 75.75 % de la variabilidad del rendimiento se debe o se le atribuye a la

dosis de auxina
1 R2 = 0.2425 se refiere a que el 24.25 % de la variabilidad del rendimiento no se debe al efecto de la
dosis de auxina
Siendo
este
un
buen
modelo
de
regresin
la
ecuacin
de
regresin
es
y 10.66783 0.74078x 0.00772x 2

Determinacin del valor ptimo (mnimo o mximo) de la RCS
Para determinarlo se obtiene mediante derivadas, primero se obtiene la primera derivada y esta se iguala a 0
para despejar el valor de x, y acto seguido se obtiene la segunda derivada para saber si es un mnimo o un
mximo
Obteniendo la primera derivada:
y
10.66783 0.74078x 0.00772x 2
x x
y
0 0.74078 2 0.00772x
x
y
0.74078 0.01544x
x
Igualando con 0 la primera derivada
y
0
x
0.74078 0.01544 x 0
0.01544 x 0.74078
x 0.74078
0.01544
x 47.9780
Este es el valor crtico, es decir el valor ptimo ahora hay que obtener la segunda derivada para saber si es
un mnimo o un mximo esto es solo para informacin de interpretacin
y 0.74078 0.01544x

x x x
y 0 0.01544

x x
y 0.01544

x x
72
al ser la segunda derivada menor a 0 entonces se trata de un mximo; por lo que esto se interpreta de la
siguiente manera: cuando la dosis de auxinas es de 47 .978 48 mg/l el rendimiento en manzana es el
mximo posible.
73
Regresin polinomial de segundo grado con ms de una variable independiente

Para ejemplificar la RCM se utilizar un ejemplo de diferentes dosis de N P K en el rendimiento en ton/1000
m. del cultivo de tomate de cscara y se pretende realizar regresin polinomial de segundo grado completa
para calcular la ecuacin de regresin y obtener la dosis ptima para un mximo rendimiento
N
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
Rendimiento en
toneladas
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3
18.2
17
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1
Y se probar el modelo
y 0 1 x1 2 x12 3 x 2 4 x 22 5 x3 6 x32 7 x1 x 2 8 x1 x3 9 x 2 x3 .
data a;
input n p k y;
np=n*p;
nk=n*k;
pk=p*k;
nn=n*n;
pp=p*p;
kk=k*k;
cards;
0
0
0
0
0
50
0
0
100
0
40
0
0
40
50
0
40
100
0
80
0
0
80
50
0
80
100
100
0
0
100
0
50
100
0
100
100
40
0
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11
11
16.8
17.2
16.9
17.3
74
100
40
50
18.2
100
40
100
17
100
80
0
17.1
100
80
50
17.8
100
80
100
16.6
150
0
0
14.5
150
0
50
15.6
150
0
100
14.3
150
40
0
14.9
150
40
50
15.8
150
40
100
14.6
150
80
0
14.6
150
80
50
15.4
150
80
100
14.1
;
proc print;
proc reg;
model y=n p k nn pp kk np nk pk;
run;

Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
n
0
0
0
0
0
0
0
0
0
100
100
100
100
100
100
100
100
100
150
150
150
150
150
150
150
150
150
p
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
0
0
0
40
40
40
80
80
80
k
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
0
50
100
y
10.5
10.9
10.9
10.8
11.3
11.3
10.7
11.0
11.0
16.8
17.2
16.9
17.3
18.2
17.0
17.1
17.8
16.6
14.5
15.6
14.3
14.9
15.8
14.6
14.6
15.4
14.1
np
0
0
0
0
0
0
0
0
0
0
0
0
4000
4000
4000
8000
8000
8000
0
0
0
6000
6000
6000
12000
12000
12000
nk
0
0
0
0
0
0
0
0
0
0
5000
10000
0
5000
10000
0
5000
10000
0
7500
15000
0
7500
15000
0
7500
15000
pk
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000
0
0
0
0
2000
4000
0
4000
8000
nn
0
0
0
0
0
0
0
0
0
10000
10000
10000
10000
10000
10000
10000
10000
10000
22500
22500
22500
22500
22500
22500
22500
22500
22500
pp
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400
0
0
0
1600
1600
1600
6400
6400
6400
kk
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
0
2500
10000
Procedimiento REG
Modelo:
0
1 x1
2 x12
3 x2
4 x 22
5 x3
6 x32
7 x1 x 2
8 x1 x3
9 x 2 x3
y
Fuente de Variacin
Model
Error
Corrected Total
Raz CME
Media Dependiente
Coef. Var.
Variable
Intercept
n
p
k
nn
pp
kk
np
nk
pk
GL
1
1
1
1
1
1
1
1
1
1
GL
9
17
26
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
185.41560
20.60173
1.16737
0.06867
186.58296
0.26205
14.33704
1.82776
R-cuadrada
R-cuad Ajust
Parmetros
Parmetro
Estimado
10.22315
0.13906
0.02240
0.03313
-0.00073111
-0.00022569
-0.00027778
-0.00001548
-0.00005095
-0.00004167
Estimados
Error
Estndar
0.19274
0.00351
0.00623
0.00499
0.00002179
0.00006686
0.00004279
0.00002476
0.00001981
0.00003782
F Value
300.02
Pr > F
<.0001
0.9937
0.9904
t Value
53.04
39.64
3.59
6.65
-33.55
-3.38
-6.49
-0.63
-2.57
-1.10
Pr > |t|
<.0001
<.0001
0.0022
<.0001
<.0001
0.0036
<.0001
0.5403
0.0198
0.2860
75
R2 = 0.9937 se refiere a que el 99.37 % de la variabilidad del rendimiento se debe o se le atribuye a las
dosis de N P K
1 R2 = 0.2425 se refiere a que el 0.63 % de la variabilidad del rendimiento no se debe al efecto de la
dosis de N P K
Siendo
este
un
excelente
modelo
de
regresin
la
ecuacin
de
regresin
es:
y 10.22315 0.13906x1 0.0224x2 0.03313x3 0.00073111x12 0.00022569x22 0.00027778x32

0.00001548x1 x2 0.00005095x1 x3 0.00004167x2 x3
Determinacin del valor ptimo (mnimo o mximo) de la RCM
Se obtienen las primeras derivadas con respecto a cada una de las variables y estas se igualan a 0 y se
obtienen los valores crticos, despus mediante una matriz hessiana se obtienen las determinantes principales
para saber si se trata de un mnimo o un mximo.
Obteniendo las primeras derivadas:
Para x1
y

x1 x1
10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32
0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3
y
0.13906 2 0.00073111x1 0.00001548x 2 0.00005095x3
x1
y
0.13906 0.00146222x1 0.00001548x 2 0.00005095x3
x1
Para x2
y

x 2 x 2
10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32
0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3
y
0.0224 2 0.00022569x 2 0.00001548x1 0.00004167x3
x 2
y
0.0224 0.00001548x1 0.00045138x 2 0.00004167x3
x 2
para x3
y

x 3 x 3
10 .22315 0.13906 x1 0.0224 x 2 0.03313 x 3 0.00073111 x12 0.00022569 x 22 0.00027778 x 32
0.00001548 x1 x 2 0.00005095 x1 x 3 0.00004167 x 2 x 3
y
0.03313 2 0.00027778x3 0.00005095x1 0.00004167x 2
x3
y
0.03313 0.00005095x1 0.00004167x 2 0.00055556x3
x3
Igualando a 0 las tres derivadas y resolviendo el sistema de ecuaciones de tres ecuaciones con tres variables.
x1

Que se resolver mediante matrices donde x A b y cada termino significa x x 2

x3
1
76
0.00146222 0.00001548 0.00005095 686.226787 17.8478014 61.5946737

A 1 inversa0.00001548 0.00045138 0.00004167 17.8478014 2231.33961 165.725711
0.00005095 0.00004167 0.00055556 61.5946737 165.725711 1818.06473
0.13906
b 0.02240
0.03313
y
se
A 1 b
multiplica
para
obtener
los
valores
de
x1,
x2
686.226787 17.8478014 61.5946737 0.13906 92.9863

x 17.8478014 2231.33961 165.725711 0.02240 42.0096 por lo que
61.5946737 165.725711 1818.06473 0.03313 47.9549
x3.
Teniendo
que
x1 92.9863
x 42.0096
2
x3 47.9549
para obtener la segunda derivada se realiza una matriz hessiana y se obtienen las determinantes que son
los determinantes principales (mnimos o mximos principales)
y
x x
1 1
y
H
x1 x 2
y
x1 x3
x1
y
x 2 x 2
y
x 2 x3
x 2
x3 x1
x3 x 2
x3 x3
0.13906 0.00146222x1
x 0.00001548x 2
1 0.00005095x3
0
.
0224
0
.
00001548
x
H 0.00045138x 2
x1
0.00004167x3
0.03313 0.00005095x1
x 0.00004167x 2
1 0.00055556x
3
0.13906 0.00146222x1
0.00001548x 2
0.00005095x
0.0224 0.00001548x1
0.00045138x
2
x 2
0.00004167x3
0.03313 0.00005095x1
0.00004167x
2
x 2
0.00055556x3
x 2
0.13906 0.00146222x1
0.00001548x 2
0.00005095x
0.0224 0.00001548x1
0.00045138x
2
x3
0.00004167x3
0.03313 0.00005095x1
0.00004167x
2
x3
0.00055556x3
x3
0.00146222 0.00001548 0.00005095

H 0.00001548 0.00045138 0.00004167
0.00005095 0.00004167 0.00055556
Determinantes principales
Como hay 3 variables existen tres determinantes
Determinante 1.
Det1 0.00146222
Determinante 2.
Det 2 0.00146222 0.00045138 0.00001548 0.00000066

2
Determinante 3.
77
Det 3 0.00146222 0.00045138 0.00055556 0.00001548 0.00005095 0.00004167

2
3.6668 10 10 1.8001 10 27 3.6667 10 10

Como se empieza con negativo y se intercalan signos se trata de un mximo
Interpretacin.
N 92.9863

Cuando los niveles de fertilizacin de P 42.0096 se obtiene el mximo rendimiento, para el ejemplo

K 47.9549
dado.
Utilizando este tipo de regresin se puede estimar los valores ptimos ya sean mnimos o mximos, segn
sea el caso, y as poder dar una recomendacin, de fertilizacin en este caso, as como otros aspectos.
78
Multicolinealidad.
Para ejemplificar multicolinealidad se utilizar el ejemplo visto en clase pero obteniendo los coeficiente VIF
con SAS.

data multico;
input x1-x3 y;
cards;
19.5
43.1
29.1
24.7
49.8
28.2
30.7
51.9
37
29.8
54.3
31.1
19.1
42.2
30.9
25.6
53.9
23.7
31.4
58.5
27.6
27.9
52.1
30.6
22.1
49.9
23.2
25.5
53.5
24.8
31.1
56.6
30
30.4
56.7
28.3
18.7
46.5
23
19.7
44.2
28.6
14.6
42.7
21.3
29.5
54.4
30.1
27.7
55.3
25.7
30.2
58.6
24.6
22.7
48.2
27.1
25.2
51
27.5
;
proc print;
proc reg;
model y=x1-x3/vif;
proc corr;
var x1-x3;
run;
11.9
22.8
18.7
20.1
12.9
21.7
27.1
25.4
21.3
19.3
25.4
27.2
11.7
17.8
12.8
23.9
22.6
25.4
14.8
21.1

Procedimiento REG
Modelo:
0
1 x1
2 x2
3 x3
y
Fuente de Variacin
Modelo
Error
Total Corregido
GL
3
16
19
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
396.98461
132.32820
98.40489
6.15031
495.38950
Raz CME
Media Dependiente
Coef. Var.
2.47998
20.19500
12.28017
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
Pr > F
<.0001
0.8014
0.7641
t Value
Pr > |t|
Inflacin
de la Varianza
117.08469
99.78240
1.17
0.2578
4.33409
3.01551
1.44
0.1699
708.84291
-2.85685
2.58202
-1.11
0.2849
564.34339
-2.18606
1.59550
-1.37
0.1896
104.60601
El procedimiento CORR
3 Variables:
x1
Variable
x1
x2
x3
R-cuadrada
R-cuad Ajust
F Value
21.52
N
20
20
20
x2
x3
Media
25.30500
51.17000
27.62000
Estadsticas Simples
Desv Est
Suma
5.02326
506.10000
5.23461
1023
3.64715
552.40000
Mnimo
14.60000
42.20000
21.30000
Mximo
31.40000
58.60000
37.00000
79
Coeficientes de Correlacin Pearson, N = 20

Prob > |r| bajo H0: Rho=0
x1
x2
x3
x1
1.00000
0.92384
<.0001
0.45778
0.0424
x2
0.92384
<.0001
1.00000
0.08467
0.7227
x3
0.45778
0.0424
0.08467
0.7227
1.00000
Interpretacin.
Para interpretar si existe multicolinealidad, existen tres datos que evidencian este problema, el primero es
rechazar H0 en la prueba conjunta y no rechazarla en las pruebas individuales, valores de VIF (Factor de
Inflacin de la Varianza) mayores a 10 y correlacin significativa entre las variables independientes, en este
ejemplo el primer indicador se cumple en la salida de SAS, los valores VIF son mayores incluso de 100, y
existen correlaciones entre las variables x 1 y x2 y entre x1 y x3 por lo que para poder corregirlo lo ms viable
sera quitar x1 por ser el de mayor valor VIF
Al hacer esto los datos cambian en SAS de la siguiente manera:

Procedimiento REG
Modelo:
0
2 x2
3 x3
y
Fuente de Variacin
Modelo
Error
Total Corregido
GL
2
17
19
Anlisis de Varianza
Suma de
Cuadrado
cuadrados
medio
384.27972
192.13986
111.10978
6.53587
495.38950
Raz CME
Media Dependiente
Coef. Var.
2.55653
20.19500
12.65925
Variable
Parmetros Estimados
Parmetro
Error
Estimado
Estndar
GL
R-cuadrada
R-cuad Ajust
F Value
29.40
Pr > F
<.0001
0.7757
0.7493
t Value
Pr > |t|
Inflacin
de la Varianza
-25.99695
6.99732
-3.72
0.0017
0.85088
0.11245
7.57
<.0001
1.00722
0.09603
0.16139
0.60
0.5597
1.00722
Corrigindose el problema al reducir los coeficientes VIF a menos de 10, y teniendo concordancia entre la
prueba global y las individuales.
80

Ejemplos SAS1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ejemplos SAS1

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE GUANAJUATO

CAMPUS CELAYA SALVATIERRA

Dr. Carlos A. Nez-Coln.

ANAVA en Diseo Experimental Completamente al Azar.

Obteniendo los siguientes resultados:

ANAVA en Diseo Experimental Completamente al Azar Desbalanceado.

Obteniendo los siguientes resultados:

ANAVA en diseo Bloques al Azar.

Obteniendo los siguientes resultados:

ANAVA en Diseo Experimental Cuadrado Latino.

Obteniendo los siguientes resultados:

ANAVA en Diseo Experimental Bloques al Azar Generalizado.

Obteniendo los siguientes resultados:

ANAVA de un Factorial de 2 en Completamente al Azar.

Obteniendo los siguientes resultados:

ANAVA de un Factorial 2 en Diseo Bloque al Azar

MODEL Y=BLO COVN;

Obteniendo los siguientes resultados:

ANAVA de un Factorial de 3 en Completamente al Azar.

Obteniendo los siguientes resultados:

ANAVA de un Factorial de 3 en Bloques al Azar.

Obteniendo los siguientes resultados:

ANAVA en Parcelas Divididas en Completamente al Azar.

Obteniendo los siguientes resultados:

Prueba de la Hiptesis Usando el ANOVA CM de R(L) como el Error tipo a

ANAVA en Parcelas Divididas en Bloques al Azar.

Obteniendo los siguientes resultados:

Prueba de la Hiptesis Usando el ANOVA CM de BLO*V como el Error Tipo a

ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Fijo.

Obteniendo los siguientes resultados: Primero por localidades, luego general.

ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Aleatorio.

Obteniendo los siguientes resultados:

Prueba de Hiptesis usando el CM de L*V como el trmino del Error

Componentes de Varianza de una Serie de Experimentos en Bloques al Azar.

Obteniendo los siguientes resultados:

Procedimiento de Estimacin de Componentes de Varianza

ANAVA de un Diseo Experimental Ltice.

Obteniendo los siguientes resultados:

Estadsticas Adicionales para y

ANACOVA en Diseo Experimental Completamente al Azar

Obteniendo los siguientes resultados:

ANACOVA en diseo Experimental Bloques al Azar.

Obteniendo los siguientes resultados:

Esto ltimo es para poder hacer pruebas de medias.

Prueba de Comparacin de Medias DMS (LSD).

Obteniendo los siguientes resultados:

Prueba de comparacin de Medias Tukey.

Obteniendo los siguientes resultados:

Pruebas de Comparacin de Medias de Rangos Mltiple de Duncan.

Obteniendo los siguientes resultados:

Medias con la misma letra no presentan diferencias significativas

Medias con la misma letra no presentan diferencias significativas

Prueba de Comparacin de Medias SNK (Student-Newman-Keuls).

Obteniendo los siguientes resultados:

Medias con la misma letra no presentan diferencias significativas

Medias con la misma letra no presentan deferencias significativas

Prueba de Comparacin de Medias de Dunnett.

Obteniendo los siguientes resultados:

Prueba de Comparacin de Medias de Sheff.

(NOTA: Tambin puede utilizarse estimate en lugar de contrast, la diferencia es el estadstico de

Obteniendo los siguientes resultados:

Transformacin de Datos mediante Raz Cuadrada.

Obteniendo los siguientes resultados:

Transformacin de Datos mediante Logaritmo natural y en base 10.