Está en la página 1de 48

Centro guatemalteco de

investigacin y capacitacin de
la caa de azcar.
-CENGICAA-

Joel Morales, Jos Luis Quem y Mario Melgar.

Primera Edicin

Santa Lucia Cotz. Agosto 2009.

InfoStat
Contenido

Aspectos generales de InfoStat .......................................................................................................................................... 1


Aspecto de la base de datos: Video. ............................................................................................................................. 1
C mo importar una base de datos desde Excel? .................................................................................................. 1
C mo pegar una base de datos desde Excel? ....................................................................................................... 2
Transformacin de datos ................................................................................................................................................ 3
Prueba de hiptesis .............................................................................................................................................................. 4
Trminos de importancia al realizar una prueba de hiptesis .................................................................................. 4
Pasos para evaluar una hiptesis estadstica. .............................................................................................................. 5
Prueba de hiptesis acerca de una media poblacional normal. Video .................................................................... 5
Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video ................................................................ 8
Prueba de hiptesis acerca de dos medias independientes. Video ......................................................................... 9
Diseo completamente al azar ......................................................................................................................................... 10
Caractersticas generales............................................................................................................................................... 10
Utilizacin del d iseo.................................................................................................................................................... 10
Supuestos del modelo.................................................................................................................................................... 10
Diseo de bloques completos al azar .............................................................................................................................. 14
Hiptesis del modelo ..................................................................................................................................................... 14
Supuestos del modelo .................................................................................................................................................... 14
Serie de Experimentos....................................................................................................................................................... 19
Anlisis de experimentos factoriales .............................................................................................................................. 23
Arreglos combinatorios................................................................................................................................................. 24
Parcelas div ididas .......................................................................................................................................................... 28
Franjas divid idas ............................................................................................................................................................ 31
Anlisis de correlacin lineal simp le. ............................................................................................................................. 34
Regresin Lineal................................................................................................................................................................. 36
RL Simple ....................................................................................................................................................................... 36
Supuestos del modelo de regresin ........................................................................................................................ 37
RL M ltiple ..................................................................................................................................................................... 41
Bibliografa.......................................................................................................................................................................... 42
Anexos ................................................................................................................................................................................. 43

Manual de uso

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Aspectos generales de InfoStat


Aspecto de la base de datos: Video.
La base de datos es la matriz de informacin, sobre la que se trabaja. La forma de ingreso
de la informacin es en base a los criterios de organizacin de datos, donde se colocan en
las columnas las variables y en las filas las observaciones, por lo que cada fila es un
individuo o unidad experimental y cada celda contiene el dato o el valor que pertenece a
cada variable para cada observacin.
Cmo importar una base de datos desde Excel?
InfoStat posee grandes ventajas respecto a la facilidad en el manejo de datos, es muy
verstil en la importacin de datos desde Excel (versin 2003 o anterior), esto es
importante, pues este ltimo es muy utilizado en la generacin de bases de datos tomados
en campo.
Es posible importar directamente una base de datos desde Excel y otros formatos. Esto
facilita el manejo y presentacin de los mismos.

Figura 1: S eleccin de la hoja de clculo importada desde Excel.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cmo pegar una base de datos desde Excel?


Muchas veces poseemos la base de datos de tal forma, que no coincide la primera fila y la
primera columna con informacin propia de la base , o se poseen objetos distintos como
grficas o logotipos. Considerando esto, es relativamente fcil, el copiar la base de datos
que se desea analizar de forma directa a la tabla de InfoStat. Para esto se puede incluir la
primera fila como el nombre de las columnas o no. Se debe de presionar el botn derecho
del ratn y seleccionar la opcin pegar o pegar incluyendo nombre de columnas.
2

Figura 2: Como pegar una base de datos en la tabla de InfoS tat.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Transformacin de datos
Muchas veces se trabaja con variables cualitativas o datos no paramtricos, los cuales no
cumplen con el supuesto de normalidad. Por lo anterior es necesario
realizar
transformacin de estos datos.
InfoStat ofrece una gran cantidad de transformaciones para una variable, y a la vez permite
la operacin entre variables.

Figura 3: Men a seleccionar para realizar una transformacin

Para realizar la transformacin se debe de seleccionar la variable, luego de indicar que se


desea realizar una transformacin.

Figura 4: Opciones de trasformacin

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis

Hiptesis Nula (Ho)

Esta es la que el investigador evala y est dispuesto a sostener como probable, a menos
que la evidencia experimental en su contra sea sustancial.

Hiptesis alternativa (Ha)

Es la negacin de la hiptesis nula.


4

Trminos de importancia al realizar una prueba de hiptesis

Error tipo I ()

Es la probabilidad de rechazar una Ho cuando es falsa.

Error tipo II ()

Es la probabilidad de no rechazar una Ho Cundo es falsa .


Cuadro 1: Posibles errores.

Tomada de Anderson, E; Black, W. et al. 1999.

Nivel de significancia

Es el valor de probabilidad de error tipo I, que el investigador est dispuesto a aceptar.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Pasos para evaluar una hiptesis estadstica.


1.

Definir la hiptesis nula y alternativa adecuada para el caso de evaluacin .

Cuadro 2: Casos de hiptesis a evaluar

5
2. Seleccionar el estadstico de prueba, necesario para evaluar la hiptesis.
Cuadro 3: Estadsticos utilizados en la prueba de hiptesis

Tomado de Lpez, E. 2008.

3. Especificar el nivel de significancia.


4. Establecer la regla de decisin.
5. Establecer los valores del estadstico seleccionado de la prueba y comparar lo con el
valor critico establecido.
6. Conclusin.

Prueba de hiptesis acerca de una media poblacional normal. Video


Ejemplo:
En una regin caera se siembra predominantemente una variedad de caa de azcar que
tiene un TCH promedio de 103.5 toneladas ha -1 . Un programa de mejoramiento ha
desarrollado una nueva variedad, comnmente usada, con rendimientos mayores a la
variedad predominante. Para probar esta aseveracin se siembran nueve lotes
experimentales con la nueva variedad y se obtienen los siguientes rendimientos:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cuadro 4: Rendimiento en toneladas de caa por hectrea, tomado de 9 lotes distintos.

Lote

TCH

1
2
3
4
5
6
7
8
9
Prom.

103.15
103.92
104.26
103.36
103.72
104.19
103.42
104.38
104.5
103.88

Identificacin del parmetro sobre el cual se desea inferir en base a la muestra:


Media ()
Hiptesis a probar:
Ho: 103.5 Ha: >103.5
Eleccin del modelo probabilstico bajo el cual se operar:
La t de Student
Especificacin del nivel de significancia.
= 5% o 0.05
Establecer la regla de decisin:
Se Rechaza la Ho si p

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Figura 5: Ubicacin de la prueba

Se debe de seleccionar la columna a analizar y se debe de indicar el parmetro con el cual


se realizar la comparacin.
Prueba T para un parmetro
Valor del parmetro probado: 103.5
Variable
n
Media
DE
LI(95)
TCH
9
103.88
0.49 103.57

T
2.32

p(Unilateral D)
0.0246

La regla de desicin:
En base a la prueba T, se observa una probabilidad de p = 0.0246. Este valor es menor a la
probabilidad permitida (= 0.05), por lo que se rechaza Ho.
Conclusin:
La muestra apoya la aseverain del programa de mejoramiento.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video


Cuadro 5: Rendimientos en toneladas de caa por hectarea, de dos variedades tamados de 6 lotes.

NF

CP72-2086

CG97-77

1
2
3
4
5
6
Prom.

160
112
184
186
104
152
150

130
118
225
149
168
139
155

Es importante que se ingresen los datos en dos columnas, una para cada poblacin o
conjunto de datos.

Figura 6: Ubicacin de la prueba

En este caso la hiptesis a evaluar es:


Ho: la diferencia entre las medias es igual a cero, que es igual a decir que ambas medias
son iguales 1 = 2.
Ha: 1 2.
Prueba T (muestras apareadas)
Obs(1) Obs(2)
CG97-77 CP72-2086

media(dif)
5.17

Media(1)
154.83

Media(2)
149.67

DE(dif) T
40.23 0.31

Bilateral
0.7658

Conclusin:
En base a las evidencias se puede aseverar que los tonelajes de ambas variedades son
semejantes.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis acerca de dos medias independientes. Video


Cuadro 6: Rendimientos en toneladas de caa por hectrea, bajo dos tratamientos de aplicacin de fosforo.

Fosforo 0
P0
150
155
149
153

Fosforo 240
P240
165
167
168
167

Es necesario que para ingresar los datos en InfoStat, se debe de crear una columna donde se
coloque el nombre o cdigo de la variable, til para la clasificacin, y una columna donde
se ingrese el valor de la variable a estudiar.

Figura 7: Ubicacin de la prueba

Prueba T para muestras Independientes


Variab Grupo(1)Grupo(2)
TCH {P0}
{P240}

media(1)
151.75

media(2)
166.75

p(Var.Hom.) T
0.2307-9.91

p
0.0001

Conclusin:
Al observar la salida del anlisis, se puede decir que el rendimiento del tratamiento P240 es
mayor que el rendimiento del tratamiento P0.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Diseo completamente al azar


Es importante que al momento de realizar un anlisis de varianza, se tenga bien claro las
fuentes de variacin consideradas por dicho modelo.

10

Tomado de Lpez, E. 2008

Como la media general y el error experimental son trminos que poseen en comn todos los
modelos, no es necesario el indicarlos entre las fuentes de variacin.

Caractersticas generales

Se usa cuando las unidades experimentales son homogneas


Con el se puede probar cualquier nmero de tratamientos (ya sean niveles de un
solo factor o combinaciones de nivel de varios factores)
Los tratamientos se aplican a las unidades experimentales al azar.
Cualquier nmero de repeticiones por tratamiento es posible.

Utilizacin del diseo


Este diseo se recomienda cuando existe homogeneidad entre unidades experimentales,
esto quiere decir que no existe influencia de la ubicacin de la unidad experimental sobre el
efecto del tratamiento, esto es muy utilizado en ensayos a nivel de laboratorio, cuando se
utilizan macetas o medios de cultivos, donde las condiciones son las mismas para todas las
unidades experimentales.

Supuestos del modelo.

Los errores son independientes.


Los errores estn normalmente distribuidos con media cero y varianza constante
Existe homogeneidad de varianzas entre los tratamientos
El modelo es lineal y de efectos aditivos.
InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 7: Rendimiento (TCH), evaluando 3 frecuencias de riego.

Tratamientos

Repeticin 1

Repeticin 2

Repeticin 3

Testigo (prctica regional)

123

133

131

Riego cada 21 das

175

167

192

Riego cada 28 das

199

203

166

Riego cada 35 das

179

188

203

11

Tomado de M artnez, A. (1998).

En este caso los datos se deben de ingresar en la Tabla de InfoStat, indicando en una
columna el tratamiento evaluado y en la columna de la par la variable de respuesta
correspondiente a cada tratamiento.
Cuadro 8: Tabla de datos como se debe de ingresar a InfoS tat.

Tratamientos

TCH

Testigo (prctica regional)


Riego cada 21 das
Riego cada 28 das
Riego cada 35 das
Testigo (prctica regional)
Riego cada 21 das
Riego cada 28 das
Riego cada 35 das
Testigo (prctica regional)
Riego cada 21 das
Riego cada 28 das
Riego cada 35 das

123
175
199
179
133
167
203
188
131
192
166
203

En la pestaa estadsticas se encuentra la opcin anlisis de varianza, al aceptar aparece un


cuadro donde se debe de indicar las variables dependientes (TCH) y las variables de
clasificacin (Tratamientos). Para esto se debe de utilizar los botones de accin

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

12

Figura 8: S eleccin de las variables.

Al aceptar aparecer otro recuadro, donde se debe indicar las fuentes de variacin del
modelo, como ya se mencion la media general y el error no se indican. Esto se realiza en
la pestaa
. A un lado se encuentra la pestaa
donde se puede indicar
la prueba de media que se desea realizar, donde se encuentran varias opciones.

Figura 9: S eleccin del mtodo de comparacin de medias.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza
Variable
TCH

N
12

R
0.83

R Aj CV
0.77 7.98

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
p-valor
Modelo
7526.25
3
2508.75
13.37 0.0018
Tratamientos
7526.25
3
2508.75
13.37 0.0018
Error
1500.67
8
187.58
Total
9026.92
11

13

Test:LSD Fisher Alfa=0.05 DMS=25.78763


Error: 187.5833 gl: 8
Tratamientos
Medias
Riego cada 35 das
190.00
Riego cada 28 das
189.33
Riego cada 21 das
178.00
Testigo (prctica regional.. 129.00

n
3
3
3
3

A
A
A
B

Letras distintas indican diferencias significativas(p<= 0.05)

201.35

TCH

182.40

163.45

144.50

B
125.56

Riego cada 28 das


Testigo (prctica regional)
Riego cada 35 dias
Riego cada 21 dias

Tratamientos

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Diseo de bloques completos al azar

14

Tomado de Lpez, E. 2008.

Hiptesis del modelo


= i (todos los tratamientos producen el mismo efecto)
i para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos
distintos).

Supuestos del modelo


ij ~ NID (0,2)
Los errores son independientes y normalmente distribuidos, con media cero y varianza
constante (homogeneidad de varianzas).
No existe interaccin entre bloque y tratamiento (*)
(*) Significa que un tratamiento no debe modificar su accin (o efecto) por estar en uno u
otro bloque.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video
Cuadro 9: Rendimiento en Toneladas de caa por hectrea, caa plantilla, finca Margaritas.

Bloques

Variedad

II

III

IV

CGSP98-08
CG00-032
CGSP-98-05
CGSP-98-16
CG00-120
CG00-129
CG00-001
CG00-092
CG99-045
CG00-028
CG00-044
CG-99-014
PR75-2002
CP72-2086

177
136
166
195
231
175
170
190
164
199
188
210
249
161

182
158
193
213
213
172
171
206
163
189
181
203
217
165

182
141
158
176
216
168
179
208
179
226
208
191
227
194

166
156
186
185
188
155
185
196
175
208
192
210
231
179

Para este anlisis la base de datos se debe de ordenar de tal forma que se tenga una columna
donde se indique el tratamiento aplicado y a la par en otra columna a que bloque pertenece
y en una tercera el valor de la variable medida.
Cuadro 10: Forma de ingresar los datos a la base de datos.

Variedad

Bloque

TCH

CGSP98-08
CG00-032

I
I

177
136

CP72-2086

IV

179

Para realizar el anlisis de varianza se debe de ir a la pestaa estadsticas, se despliega un


men, donde se debe seleccionar la opcin anlisis de varianza.
Se debe de seleccionar en el apartado variables dependientes la columna del tonelaje
(TCH) y en el apartado variable de clasificacin la columna que indica el tratamiento
aplicado y la columna donde se indica a que bloque pertenece.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

15

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

16

Figura 10: S eleccin de los trminos del modelo.

Para indicar el modelo de bloques completos al azar, se observan las fuentes de variacin
en el recuadro trminos del modelo, y debajo de este se observa un botn de accin
llamado agregar interaccin en este caso no se debe de agregar, de esta forma se cumple
con uno de los supuestos del modelo.

No activar

Figura 11: Especificaci n del modelo.

Luego de elegir el mtodo de comparacin de medias, se debe de seleccionar en base a que


agrupacin se desea la comparacin.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

17
Figura 12: Agrupamiento de las medias para su comparacin.

Anlisis de la varianza
Variable
TCH

N
56

R
0.79

R Aj CV
0.71 6.80

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
p-valor
Modelo
24459.00
16
1528.69
9.40 <0.0001
Bloque
82.07
3
27.36
0.17 0.9172
Variedad
24376.93
13
1875.15
11.53 <0.0001
Error
6340.93
39
162.59
Total
30799.93
55
Test:LSD Fisher Alfa=0.05 DMS=18.23722
Error: 162.5879 gl: 39
Variedad
Medias
n
PR75-2002
231.00
4
A
CG00-120
212.00
4
B
CG00-028
205.50
4
B
CG-99-014
203.50
4
B
CG00-092
200.00
4
B
CG00-044
192.25
4
CGSP-98-16 192.25
4
CGSP98-08
176.75
4
CG00-001
176.25
4
CGSP-98-05 175.75
4
CP72-2086
174.75
4
CG99-045
170.25
4
CG00-129
167.50
4
CG00-032
147.75
4

C
C
C
C
C

D
D
D
D
D
D

E
E
E
E
E
E
F

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

En la pestaa donde se selecciona el mtodo de comparacin de medias, tambin existe una


opcin que devuelve un grfico de barras con la jerarqua del test seleccionado.
241.86
A

217.21

TCH

BC

BC

BC
CD

192.56

CD

DE

DE

18

DE

DE
E

167.92

CG00-032

CG00-129

CG99-045

CP72-2086

CGSP-98-05

CG00-001

CGSP98-08

CGSP-98-16

CG00-044

CG00-092

CG-99-014

CG00-028

CG00-120

PR75-2002

F
143.27

Variedad

Figura 13: Evaluacin de tres distintos ciclos de riego.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Serie de Experimentos
Es comn que se realicen experimentos con la misma estructura, pero en distintas
localidades. Con esto se desea obtener conclusiones vlidas para toda una regin, esto
suponiendo aleatorizacin de las localidades.
Para esto es necesario el analizar por separado las localidades y luego realizar un anlisis
que integre todas las localidades. Estos ensayos se pueden realizar no solo para localidades
distribuidas en el espacio, si no tambin ensayos distribuidos en el tiempo, por ejemplo el
realizar un ensayo de herbicidas para verano y otro en invierno con la misma estructura, y
concluir para todo el ao.
Tambin es importante que se cumpla con el supuesto de homocedasticidad entre ensayos,
esto se puede probar por medio de la prueba de Hartley.

Siendo:
Yijk = toneladas de caa por hectrea referentes al i-simo producto madurante en el
jsimo bloque o repeticin de la k-sima localidad;
= media general
i = efecto del i-simo producto madurante
j / k = efecto del j-simo bloque en la k-sima localidad,
lk = efecto de la k-sima localidad,
(l)ik = efecto de la interaccin entre el i-simo producto madurante y la k-sima localidad,
ijk = error experimental asociado a la observacin Yijk.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

19

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 11: Toneladas de caa por hectrea, plantilla, en tres localidades.

Las Margaritas

San Bonifacio

Tulul

Bloque

Bloque

Bloque

Variedad

II

III

IV

II

III

IV

II

III

IV

CGSP98-08
CG00-032
CGSP-98-05
CGSP-98-16
CG00-120
CG00-129
CG00-001
CG00-092
CG99-045
CG00-028
CG00-044
CG-99-014
PR75-2002
CP72-2086

177
136
166
195
231
175
170
190
164
199
188
210
249
161

182
158
193
213
213
172
171
206
163
189
181
203
217
165

182
141
158
176
216
168
179
208
179
226
208
191
227
194

166
156
186
185
188
155
185
196
175
208
192
210
231
179

148
115
153
153
162
153
164
171
162
172
157
144
169
130

152
124
140
117
164
127
158
133
117
103
150
152
162
123

168
104
104
111
153
144
157
157
149
109
90
156
175
155

175
141
145
179
158
99
153
181
153
107
92
151
190
153

111
95
99
125
107
105
81
50
96
131
137
108
123
83

110
90
127
82
112
117
82
99
85
122
109
99
112
100

115
68
130
119
113
115
103
97
111
135
111
127
128
106

103
125
132
107
110
119
122
92
93
100
94
136
129
112

En este caso, como se puede observar, en el modelo el efecto del bloque se encuentra
anidado en la localidad, por lo que se debe de indicar en las fuentes de variacin, para esto
se utiliza el smbolo > para indicar que el efecto del bloque se encuentra dentro de la
localidad (Localidad>Bloque) y teniendo en cuenta que el error de la localidad es
Localidad>Repeticin, como se ha mencionado en ejemplos anteriores.

Figura 14: Fuentes de variacin del modelo

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

20

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza
Variable
TCH

N
168

R
0.88

R Aj CV
0.83 11.08

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
Modelo
Localidad
Localidad>Repeticin
Variedad
Localidad*Variedad
Error
Total

SC
227787.23
177483.08
3979.12
25378.43
20946.58
30873.63
258660.85

gl
50
2
9
13
26
117
167

CM
4555.74
88741.54
442.12
1952.19
805.64
263.88

Test:LSD Fisher Alfa=0.05 DMS=8.98910


Error: 442.1250 gl: 9
Localidad
Medias
n
San Bonifacio
187.54
56
A
Las Margaritas
144.36
56
Tulul
108.02
56

F
17.26
200.72
1.68
7.40
3.05

p-valor
(Error)
<0.0001
<0.0001 (Loc>Rep)
0.1025
<0.0001
<0.0001

21

B
C

Letras distintas indican diferencias significativas(p<= 0.05)

Test:LSD Fisher Alfa=0.05 DMS=13.13374


Error: 263.8771 gl: 117
Variedad
Medias
n
PR75-2002
176.00
12
A
CG00-120
160.58
12
B
CG-99-014
157.25
12
B
CG00-028
150.08
12
B
CGSP98-08
149.08
12
B
CG00-092
148.33
12
B
CGSP-98-16 146.83
12
CGSP-98-05 144.42
12
CG00-001
143.75
12
CG00-044
142.42
12
CP72-2086
138.42
12
CG00-129
137.42
12
CG99-045
137.25
12
CG00-032
121.08
12

C
C
C
C
C
C

D
D
D
D
D
D
D
D
D
D
E

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

193.79
A

TCH

171.33

148.86

22

126.40

C
103.93
San Bonifacio

Tulul

Las Margaritas

Localidad

183.67
A

167.28
B

BCD

150.89

BCD

BCD

CD

CD

D
D

134.49

CG00-032

CG99-045

CG00-129

CP72-2086

CG00-044

CG00-001

CGSP-98-05

CGSP-98-16

CG00-092

CGSP98-08

CG00-028

CG-99-014

CG00-120

E
118.10

PR75-2002

TCH

BC

Variedad

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de experimentos factoriales


Cuando se habla de experimentos factoriales, es cuando evaluamos simultneamente el
efecto de dos o ms valores. Dependiendo del arreglo y las interacciones entre los factores
se pueden generar diversos diseos adecuados a distintas condiciones en campo.

Ventajas
a. Se logra una gran eficiencia en el uso de los recursos experimentales disponibles.
b. Se obtiene informacin respecto a las diversas interacciones.
c. Los resultados experimentales son aplicables a un rango de condiciones ms
amplio debido a las combinaciones de los diversos factores en un solo experimento.
Los resultados son de naturaleza ms comprensiva.
d. Los experimentos factoriales son ms eficientes que los experimentos simples.

Inconvenientes
a. El resultado del experimento y el anlisis estadstico resultante son ms
complejos.
b. Con un gran nmero de combinaciones de tratamientos, la relacin de unidades
experimentales homogneas es ms difcil.
c. Convencidos de que algunas de las combinaciones de tratamientos pueden ser de
muy poco o ningn inters, algunos de los recursos experimentales pueden ser
malgastados.
d. El nmero de tratamientos o combinaciones aumentan rpidamente.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

23

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Arreglos combinatorios
El modelo que se describe corresponde a un experimento bifactorial, en arreglo
combinatorio dispuesto en un diseo en bloques completos al azar, debido a que es el ms
usado.

24
Tomado de Lpez, E. 2008.

Siendo que:
Yijk = Variable de respuesta observada o medida en la ijk - sima unidad experimental
= Media general
i = Efecto del i - simo nivel del factor "A"
j = Efecto del j - simo nivel del factor "B"
()ij = Efecto de la interaccin entre el i - simo nivel del factor "A" y el j - simo nivel
del factor "B"
k = Efecto del k - simo bloque
ijk = Error experimental asociado a la ijk - sima unidad experimental

Ejemplo: Video

Cuadro 12: Rendimiento en toneladas de caa por hectrea, evaluando distintas concentraciones de tres elementos.

Tratamientos
N (Kg/ha) P (Kg/ha) K (Kg/ha)
50
0
0
150
0
0
50
100
0
150
100
0
50
0
100
150
0
100
50
100
100
150
100
100

Bloque
I
147.88
129.79
148.61
148.12
126.82
135.96
160.48
178.69

II
160.41
136.2
160.53
163.32
141.77
142.43
160.53
159.99

III
129.54
124.1
135.84
161.08
124.09
135.96
136.02
163.81

IV
105.21
111.44
130.03
151.28
127.18
129.6
141.89
148.13

Tomado de Prez, O. (2002)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Es importante que se cree una columna para indicar los distintos niveles de cada factor y
otra columna para indicar la repeticin o el bloque como tambin la variable de respuesta.
Cuadro 13: Ejemplo de cmo se debe de ingresar datos en la tabla de InfoS tat.

Nivel N Nivel P
50
150
50

Nivel K

Bloque

TCH

0
0
0

I
I
I

147.88
129.79
148.61

IV

148.13

0
0
100

150

100

100

25

Figura 15: Variables de clasificacin a seleccionar.

Se debe de agregar la interaccin de todos los elementos por medio del botn de accin
, se agregar todas las combinaciones posibles, y se debe de eliminar
las interacciones donde se relacione con el bloque.
Tambin existe la opcin de agregar contrastes en el anlisis, para esto se debe de indicar el
contraste deseado en la pestaa contrastes. Se debe de seleccionar entre que agrupaciones
se desean los contrastes y que tratamientos se desean realizar. Para esto se encuentran dos
botones, el botn

, sirve para indicar que tratamiento se desea contrastar al seleccionar

el tratamiento y luego presionar el botn de accin. Y el botn


tratamientos se realiza el contraste, es importante activar la casilla
cuando se realizan ms de un contraste. Por ltimo con el botn
contraste deseado.

indica contra que


se ingresa el

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

26

Figura 16: Fuentes de variacin del modelo.

Figura 17: Pasos para agregar contrastes ortogonales

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza
Variable
TCH

N
32

R
0.81

R Aj CV
0.71 6.31

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
Modelo
7030.28
10
703.03
Bloque
2314.84
3
771.61
Nivel N
215.64
1
215.64
Nivel P
3611.86
1
3611.86
Nivel K
152.99
1
152.99
Nivel N*Nivel P
434.46
1
434.46
Nivel N*Nivel K
146.68
1
146.68
Nivel P*Nivel K
30.99
1
30.99
Nivel N*Nivel P*Nivel K 122.81
1
122.81
Error
1695.89
21
80.76
Total
8726.17
31

F
p-valor
8.71 <0.0001
9.55 0.0004
2.67 0.1171
44.73 <0.0001
1.89 0.1832
5.38 0.0305
1.82 0.1921
0.38 0.5423
1.52 0.2311

Contrastes
Nivel N*Nivel P*Nivel K
SC
Contraste1
215.64
Contraste2
3611.86
Contraste3
152.99
Contraste4
434.46
Contraste5
146.68
Contraste6
30.99
Contraste7
122.81
Total
4715.44

gl
1
1
1
1
1
1
1
7

CM
215.64
3611.86
152.99
434.46
146.68
30.99
122.81
673.63

Coeficientes de los contrastes


Nivel N*Nivel P*Nivel K
Cont.1
50.00:0.00:0.00
-1.00
50.00:0.00:100.00
-1.00
50.00:100.00:0.00
-1.00
50.00:100.00:100.00
-1.00
150.00:0.00:0.00
1.00
150.00:0.00:100.00
1.00
150.00:100.00:0.00
1.00
150.00:100.00:100.00
1.00

Cont.3
-1.00
1.00
-1.00
1.00
-1.00
1.00
-1.00
1.00

Cont.4 Cont.5 Cont.6 Cont.7


1.00
1.00
1.00 -1.00
1.00 -1.00 -1.00
1.00
-1.00
1.00 -1.00
1.00
-1.00 -1.00
1.00 -1.00
-1.00 -1.00
1.00
1.00
-1.00
1.00 -1.00 -1.00
1.00 -1.00 -1.00 -1.00
1.00
1.00
1.00
1.00

Cont.2
-1.00
-1.00
1.00
1.00
-1.00
-1.00
1.00
1.00

F
p-valor
2.67 0.1171
44.73 <0.0001
1.89 0.1832
5.38 0.0305
1.82 0.1921
0.38 0.5423
1.52 0.2311
8.34 0.0001

Conclusin:
El anlisis indic que el efecto principal de P fue estadsticamente significativo.
Con la inclusin de ambos (N y P) se obtuvieron las mximas producciones.
No hay diferencia estadstica significativa entre 50 y 0 Kg de N/ha evaluando bajo
aplicaciones de P y K.
El nivel 150 Kg de N/ha difieren estadsticamente del nivel 0 Kg de N/ha, con aplicaciones
iguales de PK.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

27

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Parcelas divididas
En este diseo se trabajan con todas las posibles combinaciones de los factores, lo que lo
diferencia del anterior es el arreglo, por lo que se puede adecuar de mejor forma a
condiciones reales de campo.

28

Figura 16: Arreglo de parcelas divididas en el espacio.

Tomado de Lpez, E. 2008

Siendo:
Yijk = Variable de respuesta medida en la ijk - sima unidad experimental
= Media general
j = Efecto del j - simo bloque
i = Efecto del i - simo nivel del factor A.
()ij = Efecto de la interaccin del i-simo nivel del factor A con el j simo bloque, que
es utilizado como residuo de parcelas grandes y es representado por error(a)
k = Efecto del k - simo nivel del factor B
()ik = Efecto debido a la interaccin del i-simo nivel del factor A con el k simo nivel
del factor B.
ijk = Error experimental asociado a Yijk , es utilizado como residuo a nivel de parcela
pequea, y es definido como: Error(b)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 14: Efecto de dos distintas mezclas de herbicidas, en 13 variedades, evaluando altura .

Bloque

Mezcla de herbicida

M1

M2

Variedad

II

III

CP72-2086

16.2

13.8

19

CP73-1312

21.8

22

23

CP88-1165

23.2

31

29.6

RB73-2577

17.8

17

15.6

SP79-1287

31.6

28.2

27

CG98-10

26.2

30.8

26.6

CG96-78

15.6

16.4

20

CG98-78

20.4

17.2

14.8

CG99-048

33.8

30

30

MEX82-114

23

13.8

18.2

RB84-5210

21.2

29.2

28

RB87-2015

23.4

21.6

25

CG96-135

17

18.6

18.6

CP72-2086

24.8

22.4

30.6

CP73-1312

38.8

20

18.8

CP88-1165

21.4

40.8

31.2

RB73-2577

17.8

38.6

19.2

SP79-1287

25.8

20

30.4

CG98-10

19.8

21.8

26

CG96-78

21.8

20.4

34

CG98-78

26.4

24.6

18

CG99-048

17.6

26.4

21.2

MEX82-114

36.6

25.2

15.4

RB84-5210

20.6

20.6

32.4

RB87-2015

21.2

32.4

36.8

CG96-135

20

19.4

21.2

Datos tomados de Ing. Gerardo Espinoza, Fisilogo. CENGICAA.


Cuadro 15: Forma de crear la base de datos en InfoStat.

Variedad

Mezcla

Bloque

Altura

CP72-2086

M1

16.2

CP73-1312

M1

21.8

CP88-1165

M1

23.2

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

29

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Para este caso es importante el considerar las fuentes de variacin del modelo y el error del
efecto A o parcela grande. Para este caso se debe de indicar el error apropiado de dicho
efecto (Factor A*Bloque), por medio de el carcter \ (diagonal invertida), para lo cual se
utiliza el comando Alt + 93, esto es importante pues en el momento de realizar la
comparacin de medias se utiliza el error adecuado.
En este caso el factor A o parcela grande es la mezcla de herbicida, y el factor B parcela
pequea la variedad.

30

Figura 17: Ingreso del modelo de parcelas divididas a InfoS tat.

Anlisis de la varianza
Variable
Altura

N
78

R
0.49

R Aj CV
0.18 24.51

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
Modelo
Mezcla
Bloque
Mezcla*Bloque
Variedad
Mezcla*Variedad
Error
Total

SC
1545.05
139.20
14.45
10.45
737.85
643.10
1633.63
3178.68

gl
29
1
2
2
12
12
48
77

Test:Tukey Alfa=0.05 DMS=2.23128


Error: 5.2267 gl: 2
Mezcla
Medias
n
M2
25.14
39
A
M1
22.47
39

CM
53.28
139.20
7.23
5.23
61.49
53.59
34.03

F
1.57
26.63
0.21
0.15
1.81
1.57

p-valor
0.0830
0.0356
0.8094
0.8581
0.0739
0.1314

(Error)
(Mezcla*Bloque)

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Franjas divididas
Cuando las condiciones del campo o la naturaleza de los tratamientos no permiten una
completa aleatorizacin de todas las combinaciones de los factores, este diseo es
recomendable.

31

Figura 18: Arreglo de un diseo de franjas divididas.

Este es el modelo estadstico- matemtico, propuesto para dos factores y un diseo de


bloques completos al azar.
Siendo:
Yijk = Variable de respuesta medida en la ijk - sima unidad experimental
= Media general
j = Efecto del j - simo bloque
i = Efecto del i - simo nivel del factor A.
()ij = Efecto de la interaccin entre el i-simo nivel del factor A con el j - simo bloque,
o sea, es el error experimental asociado al factor A, tal que ()ij ~ N (0, 2 1 ) e
independientes, es utilizado como error(a).
k = Efecto del k - simo nivel del factor B
()jk = Efecto de la interaccin entre el k-simo nivel del factor A con el j - simo bloque,
o sea, es el error experimental asociado al factor B, tal que ()jk ~ N (0, 22 ) e
independientes, es utilizado como error(b).
()ik = Efecto debido a la interaccin del i-simo nivel del factor A con el k - simo nivel
del factor B.
()ijk = Error experimental asociado a Yijk, tal que ()ijk ~ N (0, 2) e
independientes, es utilizado como trmino de error o residuo.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 16: Evaluacin de cuatro tipos de surco y tres densidades de siembra, midiendo % Pol.

Bloque
Tipo de surco

Surco Simple

Surco doble

surco base
larga
surco base
corta

Densidad de
siembra

II

III

IV

4 TSH
6 TSH
8 TSH
4 TSH
6 TSH
8 TSH
4 TSH
6 TSH
8 TSH
4 TSH
6 TSH
8 TSH

17.67
17.31
17.49
17.19
17.21
18.04
17.39
17.39
17.69
17.19
16.78
17.86

17.23
17.6
17.3
17.85
17.26
16.38
17.54
17.67
17.02
17.57
17.57
16.85

17.43
17.05
17.68
17.44
16.71
17.23
16.61
16.77
17.34
17.72
17.79
18.12

17.61
16.91
18.27
17.56
17.52
17.14
17.51
17.61
18.02
17.73
18.27
17.94

Datos tomados de Lpez, E. 2008.

Para este caso se debe de considerar los errores de cada factor e indicarlos, pues es
necesario para que al realizar la comparacin de medias se utilice el error adecuado.

Figura 19: Fuentes de variacin para un diseo de franjas divididas.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

32

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza
Variable
% Pol

N
48

R
0.77

R Aj CV
0.39 1.89

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
Modelo
6.47
29
0.22
Tipo de surco
0.68
3
0.23
Densidad de siembra
0.28
2
0.14
Bloque
0.99
3
0.33
Tipo de surco*Densidad de .. 0.62
6
0.10
Tipo de surco*Bloque
1.62
9
0.18
Densidad de siembra*Bloque.. 2.29
6
0.38
Error
1.95
18
0.11
Total
8.42
47

Test:LSD Fisher Alfa=0.05 DMS=0.48936


Error: 0.1085 gl: 18
Tipo de surco
Densidad de siembra
surco base corta 8 TSH
Surco Simple
8 TSH
surco base corta 6 TSH
surco base corta 4 TSH
surco base larga 8 TSH
Surco doble
4 TSH
Surco Simple
4 TSH
surco base larga 6 TSH
surco base larga 4 TSH
Surco Simple
6 TSH
Surco doble
8 TSH
Surco doble
6 TSH

F
2.06
1.25
0.36
3.05
0.95
1.66
3.52

p-valor
(Error)
0.0563
0.3473 (Tipo de surco*Bloque)
0.7104 (Densidad de siembra*Bloqu..
0.0554
0.4869
0.1731
0.0175

Medias
17.69
17.69
17.60
17.55
17.52
17.51
17.49
17.36
17.26
17.22
17.20
17.18

n
4
4
4
4
4
4
4
4
4
4
4
4

A
A
A
A
A
A
A
A
A
A

B
B
B
B
B
B
B
B
B
B

C
C
C
C
C
C
C
C
C
C

Letras distintas indican diferencias significativas(p<= 0.05)

17.89

17.70

AB
ABC

% Pol

ABC
ABC

17.52

ABC

ABC

ABC
17.33
ABC
BC

C
Surco doble:6 TSH

Surco doble:8 TSH

Surco Simple:6 TSH

surco base larga:4 TSH

surco base larga:6 TSH

Surco Simple:4 TSH

Surco doble:4 TSH

surco base larga:8 TSH

surco base corta:4 TSH

surco base corta:6 TSH

Surco Simple:8 TSH

17.14

surco base corta:8 TSH

ABC

Tipo de surco*Densidad de siembra

Figura 20: Grafica resumen de la comparacin de medias.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

33

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de correlacin lineal simple.


En este anlisis se relacionan dos variables aleatorias. Para este ejemplo tomaremos como
estadstico de prueba el coeficiente de correlacin de Pearson, y se realizar una prueba de
hiptesis para evaluar si el coeficiente de Pearson () es igual a cero, lo que indicara una
ausencia de correlacin lineal.
Ejemplo: Video.
Cuadro 17: Peso de tallos y rendimiento de caa en Kg.

peso del
tallo Kg

Rendimiento
de caa Kg

1.12
1.21
0.99
1.02
0.93
1.14
0.86
1.03
1.22
1.17

7.74
8.02
8.16
8.46
6.3
10.01
4.79
7.04
7.62
7.54

Se ingresan ambas variables en la casilla de variables a analizar.

Figura 21: Ubicacin de coeficiente de correlacin.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

34

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

35
Figura 22: S eleccin del coeficiente de correlacin de Pearson.

Recordemos que se trabajar con el coeficiente de correlacin de Pearson, por lo que se


debe de seleccionar cuando InfoStat lo indique.
Coeficientes de correlacin
Correlacion de Pearson: coeficientes\probabilidades
Rendimiento de caa
peso del tallo Kg

Rendimiento de caa
1.00
0.62

peso del tallo Kg


0.05
1.00

En la matriz podemos observar en la parte inferior de la diagonal conformada por unos, los
coeficientes de correlacin que nos indica el grado de asociacin, donde un nmero
negativo indica una asociacin negativa, este valor se encuentra entre -1 y 1 y 0 indica que
no existe una correlacin lineal entre variab les. En la parte superior de la diagonal se
muestra el valor de la probabilidad (p) de la prueba de hiptesis realizada, al evaluar que el
coeficiente de Pearson es igual a cero, se debe de tener en cuenta el valor de significancia
con el que se desea trabajar, pues al trabajar con un nivel de significancia del 5%, se acepta
la hiptesis alternativa (existe correlacin entre ambas variables) si el valor de p 0.05.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Regresin Lineal
Existen casos cuando se desea conocer la relacin funcional que puede existir entre dos o
ms variables cuantitativas, en estos casos la regresin es muy til. Tambin un anlisis de
regresin nos puede servir para predecir o describir el comportamiento de una variable
respecto al comportamiento de otra, que por su naturaleza es difcil la observacin directa,
por lo que con la ayuda de un modelo se puede entender lo anterior relacionando una o ms
de una variable.
36

RL Simple
Cuando se relaciona una variable dependiente o explicada con una variable independiente o
explicativa realizamos un anlisis de regresin simple, con la finalidad de generar un
modelo que exprese el comportamiento de la variable dependiente respecto a la
independiente.

Tomado de Lpez, E. 2008.

a) El coeficiente de posicin () o intercepto, indica la posicin en la cual la recta


corta el eje Y. Si la recta pasa por el origen, entonces =0. En trminos prcticos, indica el
valor que asume la variable Y cuando la variable es X=0. En algunos casos se requiere que
la recta corte en el origen, esto siguiendo la lgica de la variable explicada.
b) El coeficiente de regresin lineal () o coeficiente angular de la regresin,
determina la pendiente de la recta. Este coeficiente indica la variacin en Y causada por la
variacin de una unidad en X.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Supuestos del modelo de regresin


1. El trmino de error es una variable aleatoria con media o valor esperado igual a cero,
esto es, E(). Esto implica que como y son constantes, E( )= y E()=.
2. La varianza de representada por 2 , es igual para todos los valores de x.
Homocedasticidad. Implicacin: la varianza de y es igual a 2 , y es la misma para todos los
valores de x.
3. Los valores de son independientes.
Implicacin: el valor de para un determinado valor de x no se relaciona con el valor de
para cualquier otro valor de x; as, el valor de y para determinado valor de x no se relaciona
con el valor de y para cualquier otro valor de x.
4. El trmino de error es una variable aleatoria con distribucin normal.
Implicacin: como y es una funcin lineal de , y es tambin una variable aleatoria
distribuida normalmente.
La siguiente figura ilustra los supuestos del modelo y sus implicaciones:

Tomado de Lpez, E. 2008.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

37

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 18: Datos de tres variables de 10 hbridos de caa de azcar.

Hbrido

peso del
tallo Kg

Rendimiento
de caa Kg

Brix Kg

1
2
3
4
5
6
7
8
9
10

1.12
1.21
0.99
1.02
0.93
1.14
0.86
1.03
1.22
1.17

7.74
8.02
8.16
8.46
6.3
10.01
4.79
7.04
7.62
7.54

0.9
0.87
0.92
0.99
0.58
1.11
0.53
0.73
0.87
0.9

Datos tomados del articulo Combining ability and yield component in five parent diallet cross in sugarcane, por el Dr. J.
D. M iller.

Se pide que se investigue la relacin Rendimiento de caa en Kg (X) y Brix en Kg (Y).


Es importante que tengamos en cuenta que al realizar el anlisis de varianza, evaluamos la
hiptesis de que (la pendiente de la recta) es igual a cero, por lo que no existe re lacin
entre ambas variables.

Figura 23: Ubicacin de la herramienta regresin lineal.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

38

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Es importante que recordemos al momento de indicar las variables a anlisis, que la


variable dependiente en este caso es Brix en Kg (Y), y la variable regresora es el
rendimiento de caa en Kg (X).

39

Figura 24: Diagnostico de la regresin lineal simple.

En el cuadro de anlisis de regresin lineal, en la pestaa diagnstico debemos de indicar


las graficas que deseamos como prueba de los supuestos y si deseamos se debe de indicar
que la presencia de las bandas de confianza y prediccin en el grfico del modelo.
Anlisis de regresin lineal
Variable
Brix Kg

N
10

R
0.92

R Aj ECMP
0.91 5.0E-03

AIC
-26.30

BIC
-25.40

Coeficientes de regresin y estadsticos asociados


Coef

Est.

const
-0.10
Rendimiento 0.12

E.E.
0.10
0.01

LI(95%) LS(95%)
-0.33
0.09

0.13
0.15

p-valor

-1.03
0.3326
9.54 <0.0001

CpMallows
82.02

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
p-valor
Modelo
0.26
1
0.26
91.03 <0.0001
Rendimiento de caa
0.26
1
0.26
91.03 <0.0001
Error
0.02
8
2.9E-03
Total
0.29
9
InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

1.33

Brix Kg

1.07

0.82

40

0.56

0.31
4.53

5.96

7.40

8.84

10.27

Rendimiento de caa
En base al anlisis de varianza se acepta la hiptesis alterna, donde se dice que es distinto
a 0, y por lo tanto la variable Y est explicada o relacionada con la variable X.
Utilizando los coeficientes de los parmetros, se puede generar un modelo que prediga el
comportamiento de la variable Brix Kg en funcin de rendimiento de caa en Kg.
Y= -0.103 + 0.125X
Donde:
Y= Kg Brix y X= Kg de caa.
Y en base al coeficiente de determinacin ajustado, se puede afirmar en un 91% de certeza
que el modelo puede predecir la realidad.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

RL Mltiple
En este caso se relaciona una variable dependiente (Y), con dos o ms variables
independientes (X). El modelo que relaciona esta variable dependiente que debe de ser
aleatoria y variables independientes que son fijas y predeterminadas, medidas sin error, se
llama ecuacin de regresin mltiple.

Este modelo se diferencia de la regresin lineal simple, ya que la adicin de una o ms


variables independientes, debe de contribuir significativamente a la prediccin de la
variable dependiente (Y), despus de haber tomado en cuenta la contribucin de la variable
independiente de la RLS.
Tambin es importante tener en cuenta un supuesto que se agrega a los de la RLS, este
considera que dos variables independientes no debes de tener correlacin entre ellas, pues
al existir esta relacin la variable dependiente es mejor explicada nicamente con una sola
variable independiente al presentar un modelo ms simple, a este supuesto se le llama
multicolinalidad.
Para realizar una RLM en InfoStat, se siguen los mismo s pasos que para realizar una RLS,
nicamente se agrega las variables independientes deseadas en la casilla de Regresoras.

Ejemplo: Video.
Con las variables del ejemplo anterior (RLS), realice un anlisis de regresin lineal
mltiple.
El primer paso es el realizar una matriz de correlacin, como ya se ha visto en incisos
anteriores.
Coeficientes de correlacin
Correlacion de Pearson: coeficientes\probabilidades
Brix Kg
% Brix
Rendimiento de caa

Brix Kg
1.000
0.595
0.959

% Brix
0.070
1.000
0.344

Rendimiento de caa
1.2E-05
0.331
1.000

Como se puede apreciar en la matriz anterior, se observa que existe correlacin entre las
variables Brix Kg y rendimiento de caa y Brix Kg y % Brix mayor a un 10% de
significancia, por lo que son tiles en la elaboracin de un modelo de RLM. Tambin se
observa que no existe correlacin entre las variables de Rendimiento de caa y % Brix, por
InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

41

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

lo que se cumple con el supuesto de multicolinalidad y ambas variables contribuyen a la


prediccin de la variable Brix Kg.
Anlisis de regresin lineal
Variable
Brix Kg

N
10

R
1.00

R Aj ECMP
1.00 1.5E-04

AIC
-70.02

BIC
-68.80

42

Coeficientes de regresin y estadsticos asociados


Coef
const
Rendimiento de caa
% Brix

Est.
-0.74
0.11
0.05

E.E. LI(95%) LS(95%) T


0.03 -0.80 -0.68 -27.50
1.5E-03
0.11
0.11 73.50
1.8E-03
0.04
0.05 25.88

p-valor CpMallows
<0.0001
<0.0001 4729.69
<0.0001
588.05

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
Modelo
0.29
2
0.14
Rendimiento de caa
0.18
1
0.18
% Brix
0.02
1
0.02
Error
2.4E-04
7
3.4E-05
Total
0.29
9

F
4184.19
5402.93
669.63

p-valor
<0.0001
<0.0001
<0.0001

El modelo tomando en cuenta los coeficientes anteriores se presentara de la siguiente


manera:
Y= -074 + 0.11X1 + 0.05X2
Donde:
Y= Brix Kg, X1 = Rendimiento de caa y X2 = % Brix.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Bibliografa
Anderson, E; Black, W; Hair, F; Tatham, R. (1999). Anlisis Multivariado. Madrid. Prentice Hall Iberia.
Hines, W; Montgomery, D. (1995). Probabilidades y estadstica para ingenieria y administracin. Mxico.
Co mpaa editorial continental, S.A. de C.V. M xico.
InfoStat. (2009). In foStat versin 2009. Grupo InfoStat, FCA, Universidad Nacional de Crdova, Argentina.
Levin, R. (1981). Estadstica para administradores. Mxico. Prentice Hall.
Lpez, E. (2008). Diseo y anlisis de experimentos, fundamentos y aplicaciones en agronoma. Guatemala.
USA C.
Lpez, E. (2008). Elaboracin de proyectos de investigacin, notas de acompaamiento de curso. Guatemala.
USA C.
Lpez, E. (2008). Estadstica, con aplicaciones en agronoma y ciencias forestales. Guatemala. USAC.
Martnez, A. (1988). Diseos experimentales: mtodos y elementos de teora. Mxico. Trillas.
Mendenhall, W; Scheaffer, R; Wackerly, D. (1986). Estadstica matemtica con aplicaciones. Mxico.
Iberoamrica.
Prez, O. (2002). Diplomado de estadstica: experimentos factoriales. Santa Lucia Cotz. CENGICA A.
Quem, J. (2002). Anlisis de regresin. Santa Luca Cotz. CENGICAA.
Quem, J. (2002). Introduccin al uso del ayudante de datos MST y MSTAT-C. Santa Luca Cotz.
CENGICAA.
Quem, J. (2002). Sitematizacin de una prueba de hiptesis, diseos completamente al azar, bloques
completos al azar y prueba de medias. Santa Luca Cotz. CENGICAA.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

42

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anexos
Cuadro 19: Resumen. Trminos a considerar en la definicin del modelo, en InfoS tat.

Diseo

Trminos del modelo.

Diseo completamente
al azar. DCA.
(1)
Diseo completamente
al azar con submuestreo
DCAsm.
Diseo de bloques
completos al azar. DBCA.

Tratamiento

Tratamiento
Repeticin*Tratamiento>Muestreo
Bloque
Tratamiento

(1)

Diseo de bloques completos


al azar con submuestreo.
DBCAs m.

Serie de experimentos
con DBCA.

Arreglo co mbinatoria en
DBCA. (Factorial)

Parcelas div ididas

Franjas divid idas

Bloque
Tratamiento
Bloque*Tratameinto>Muestreo
Localidad\Localidad>Bloque
Localidad>Bloque
Tratamiento
Localidad*Tratamiento
Bloque
Factor A
Factor B
Factor A*Factor B
Bloque
Factor A\Factor A*Bloque
Factor A*Bloque
Factor B
Factor A*Factor B
Bloque
Factor A\Factor A*Bloque
Factor A*Bloque
Factor B\Factor B* Bloque
Factor B* Bloque
Factor A*Factor B

(1)

Cuando se definen modelos con submuestro es importante que tengamos en cuenta las distintas
decisiones que debemos de tomar en el mo mento de aceptar o rechazar una hiptesis. InfoStat realiza
de forma parcial el anlisis de este modelo, por lo que se debe de seguir los siguientes pasos:

1.

Prueba de hi ptesis para e valuar la efecti vi dad del muestreo.


Ho: 2 e = 0
Ha: 2 e > 0

En este caso si se acepta la Ho, se dice que el muestreo no fue efectivo, en caso contrario, si se rechaza la Ho
se dice que el muestreo fue efectivo. Para esto se debe realizar los siguientes clculos:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

43

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Se considerar el cuadrado medio del error experimental (CM ee) y el cuadrado medio del error del muestreo
(CM e m). Se debe de encontrar el valor F, para esto se realiza la relacin CM ee/CM em. Para realizar la toma de
decisin de rechazar o aceptar la Ho, se puede estimar, en Excel, el valor p (probabilidad), para esto se utiliza
la funcin DISTR.F donde se ingresa el grado de libertad del Error experimental (g l 1 ), los grados de libertad
del erro r de muestreo (gl2 ) y el valor F (CM ee/CM em), el cual es nombrado en Excel por la letra X.
Si el valor p estimado en Excel, es menor al nivel de significancia establecido, se rechaza la Ho, por lo que se
dice que el muestreo fue efectivo.
2.

Prueba de hi ptesis para evaluar si existe diferencia entre tratameintos, cuando el muestreo es
efecti vo

La segunda hiptesis a evaluar, corresponde a la diferencia entre los tratamientos, donde:


Ho: = i (todos los tratamientos producen el mis mo efecto)
Ha: i para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos distintos).
En este caso, los valores de F y p utilizados en la toma de decisin de aceptar o rechazar la Ho, son los
proporcionados por la salida de InfoStat, de igual forma el coeficiente de variacin.
2.1. Prueba de medias, cuando el muestreo es efecti vo.
Si el muestreo fue efectivo las prueba de medias se realiza de manera co mn, de igual forma co mo se presenta
en la seccin de diseo completamente al azar.
3.

Prueba de hi ptesis para evaluar si existe diferencia entre tratamietnos, cuando el muestreo no
es efectivo.

Al no ser el muestreo efectivo, se debe de unir los errores del error experimental y el error de muestreo de la
siguiente forma:
CM ep = SCee+ SCe m / glee + gle m
Donde:
CM ep = Cuadrado med io del error ponderado
SCee = Su ma de cuadrados del error experimental
SCe m= Su ma de cuadrados del error de muestreo
glee= grados de libertad del error experimental
glem= grados de libertad del error de muestreo
Y el valor F (el valor F del tratameinto), se estima as:
F= CM Tratamiento / CM ep
Para encontrar el valor p que se utiliza para realizar la to ma de decisin respecto a la segunda hiptesis,
relacionada al efecto de los tratamientos, se debe de seguir las instrucciones mencionadas anteriormente en el
inciso 1. Y el valor del coeficiente de variacin debe de encontrarse de la siguiente forma:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

44

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

3.1. Prueba de medias, cuando el muestreo no es efecti vo


Para esto, se debe de indicar el error y los grados de libertad a utilizar (estimados previamente, de la forma
explicada anteriormente en el inciso 3) en la comparacin de medias, donde el error es el valor de CM ep y los
grados de libertad la suma de g lee y gle m.

45

Figura 25: Indicacin del error a utilizar en la comparacin de medias

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

También podría gustarte