Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hernán Echavarría Sánchez1; Guillermo Correa Londoño2; Juan Fernando Patiño Díez3;
Juan José Acosta Jaramillo4 y Jairo Alberto Rueda Restrepo5
____________________________________________________________________
RESUMEN
Se hizo un censo de los métodos estadísticos usados en los trabajos de grado y tesis realizados en
un periodo de tres años (1999-2001) en la Facultad de Ciencias Agropecuarias de la Universidad
Nacional, sede Medellín. En casi la mitad de los trabajos evaluados se encontró al menos un error
(49,2 %). A nivel de pregrado, en el programa de Ingeniería Forestal se observó el menor
porcentaje de trabajos con al menos un error; mientras que el mayor porcentaje fue observado en
Ingeniería Agrícola. La mayoría de los errores se originaron en la poca claridad sobre el papel de la
estadística como herramienta para la consecución de los objetivos planteados en los trabajos, lo
cual se reflejó en que los trabajos incluyeran resultados estadísticos que en nada contribuían al
cumplimiento de los objetivos, en que se omitieran resultados relevantes para su satisfacción y/o en
que habiéndose generado resultados pertinentes, no se les diera discusión alguna.
ABSTRACT
A census of the statistical methods used in the final projects and thesis of the Facultad de Ciencias
Agropecuarias of the Universidad Nacional de Colombia, Sede Medellín over a three-year period was
done (1999-2001). In almost half of the evaluated works (49,2 %), at least one error was found. At
the undergraduate level, the smallest proportion of at-least-one-error works was observed in the
1
Profesor Asistente. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <hechavar@unal.edu.co>
2
Profesor Asociado. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <gcorrea@unal.edu.co>
3
Ingeniero Forestal. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <jfpatino@unalmed.edu.co>
4
Ingeniero Forestal. Smurfit Kappa Cartón de Colombia S.A. Cl 15 18-109 Puerto Isaacs Yumbo, Cali, Colombia.
<juan.acosta@smurfitkappa.com.co>
5
Instructor Asociado. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779. <jarueda@unal.edu.co>
Ingeniería Forestal program, whereas the higher proportion was observed in the Ingeniería Agrícola
program. A great bulk of errors was originated in the lack of conscience about the role of statistics
as a tool for the achievement of objectives. As a consequence, some works included statistical
results that had nothing to do with the objectives; they omitted relevant results and/or failed to
discuss them when they appeared.
3566 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
100,0
80,0
Error (%)
60,0
40,0
20,0
0,0
I. Agrícola I. Agronómica I. Forestal Zootecnia Maestría Total
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3567
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
3568 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3569
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
3570 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3571
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
3572 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3573
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
3574 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
difieren, sin especificar cuáles son las diferencias entre los niveles de un factor
medias causantes de la significancia de no permanecen constantes a través de
la prueba. cada uno de los niveles de los otros
factores, resulta incorrecta la obtención
En ensayos experimentales que invo- de una diferencia promedio. Por tanto, la
lucran dos o más factores de interés, en evaluación de efectos principales sólo
ocasiones se ignora la estructura factorial procede cuando la interacción no es
de los tratamientos y se realiza el análisis significativa y el factor sí lo es. De la
de varianza que correspondería a una misma manera, resulta inadecuado
estructura unifactorial. Aunque tal forma evaluar efectos simples cuando la
de análisis no conlleva errores interacción no es significativa.
matemáticos, puede considerarse un
error metodológico, pues se En el área biológica son frecuentes los
desaprovecha la capacidad de tales ensayos en los que se realizan lecturas
estructuras de tratamientos para evaluar de una variable sobre una misma
las posibles relaciones existentes entre unidad experimental a través del
los factores evaluados y dificulta, en caso tiempo. Con ello se genera una estructura
de que tales relaciones existan, de covarianzas entre los errores
presentar recomendaciones específicas correspondientes a las diferentes lecturas
para cada uno de los niveles de los de una misma unidad experimental.
factores relacionados. Algo similar ocurre Para el análisis de este tipo de ensayos
cuando se ignora(n) alguno(s) de los deben usarse métodos que permitan
factores involucrados inicialmente en el modelar dicha estructura, la cual no es
experimento. manejable a través del análisis clásico
que asume que las covarianzas entre
Otro error detectado cuando se rea- errores son cero (errores
lizan experimentos con estructura independientes). Para tal efecto,
factorial de tratamientos consiste en pueden consultarse Littell et al. 1998,
evaluar efectos principales, a pesar de Littell et al. 1996 y SAS 1999, entre
que la interacción entre los factores otros.
resulte significativa (Petersen 1994).
Una interacción implica que las Un procedimiento que ha sido usado
diferencias entre los niveles de un factor por los investigadores para intentar
cambian, dependiendo de la obviar la modelación de la estructura de
combinación de niveles de los demás covarianzas consiste en realizar análisis
factores. La evaluación de un efecto individuales para cada uno de los
principal consiste en comparar las tiempos. Debe advertirse que este
medias de cada uno de los niveles de método no permite evaluar las ten-
un factor; estas medias se obtienen dencias de la variable respuesta a través
promediando todas las combinaciones del tiempo, por lo que no constituye un
que contengan el nivel de interés, verdadero método de análisis de medidas
estando allí involucrados todos los repetidas y, si bien puede resultar útil
niveles de los demás factores. Puesto para un análisis exploratorio, no es
que, en presencia de interacción, las
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3575
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
adecuado como método final de análisis Uno de los supuestos para el análisis de
(Littell et al. 1998). regresión es la homocedasticidad. Ésta
sólo puede evaluarse de manera objetiva
Uno de los supuestos del diseño de cuando se tienen repeticiones de los
bloques al azar es la aditividad; esto es, la valores de la variable independiente. En
no existencia de interacción entre bloques caso contrario, que es lo más frecuente,
y tratamientos. Cuando este supuesto no este supuesto se evalúa a través del
se cumple, el estimador del error gráfico de residuales estandarizados; aún
experimental es inadecuado, pues así, este procedimiento a menudo es
corresponde en realidad al efecto de tal omitido. Cuando las varianzas no son
interacción. En estos casos, no es posible homogéneas, no es posible obtener un
estimar el verdadero error experimental, a estimador adecuado de la varianza
menos que cada tratamiento esté promedio de las subpoblaciones de la
presente más de una vez dentro de cada variable dependiente para cada nivel de la
bloque (Lentner y Bishop 1986). variable independiente, razón por la cual
la inferencia realizada en tales situaciones
resulta inadecuada.
REGRESIÓN Y CORRELACIÓN
Regresión múltiple. Las
Regresión simple. Uno de los errores consideraciones hechas para los modelos
detectados obedece a que existe la de regresión simple, en general aplican
creencia de que la significancia de un también a los modelos de regresión
modelo de regresión lleva implícito el múltiple. Vale la pena, sin embargo,
buen ajuste del mismo. Esto, desde luego, resaltar algunos aspectos adicionales.
no es cierto, ya que la significancia de un
modelo de regresión lineal simple sólo El uso de modelos de regresión múltiple
indica la presencia de un efecto lineal para predecir valores de la variable
significativo, pero no da ninguna dependiente a menudo conlleva extra-
información acerca de posibles efectos polaciones, las cuales tienen las mismas
cuadráticos. implicaciones anotadas para el caso de
regresión simple. Su detección, sin
Otro error frecuente en el uso de los embargo, no es tan directa, pues no es
modelos de regresión es utilizarlo para suficiente que los valores usados para la
predecir valores de la variable respuesta a predicción estén incluidos en el rango de
partir de valores de la variable predictora valores usado para cada una de las
que están por fuera de la región usada variables independientes, sino que ten-
para ajustar el modelo. Esta acción no es dría que verificarse que la combinación
recomendable, ya que el comporta-miento evaluada esté en una región que haya
de un fenómeno en una región sido usada para el ajuste del modelo.
determinada no garantiza que dicha
tendencia se mantenga por fuera de la Exceptuando aquellos casos en los
misma, lo cual puede causar que las cuales deba respetarse el principio de
estimaciones así realizadas estén bastante jerarquía, un modelo final de regresión
alejadas de la realidad. sólo debe contener términos sig-
3576 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3577
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
se elija, deberá usarse para todas las Muchos de los errores se originaron en
agrupaciones dentro de ese nivel de la poca claridad sobre el papel de la
detalle. No es adecuado, por tanto, al estadística como herramienta para la
usar métodos de clasificación jerárquica, consecución de los objetivos plan-
fusionar subgrupos cuya disimilitud sea teados en los trabajos, lo cual se reflejó
mayor que la existente entre otros grupos en que éstos incluyeran resultados
declarados como diferentes. estadísticos que en nada contribuían al
cumplimiento de los objetivos, en que
Otros. Al plantear el esquema de se omitieran resultados relevantes para
muestreo para la caracterización de una su satisfacción y/o en que habiéndose
variable, la presencia de condiciones que generado resultados pertinentes, no se
puedan afectar su comportamiento, les diera discusión alguna.
generando subpoblaciones, hace ne-
cesario el uso de un esquema de El principal error detectado en el uso de
muestreo acorde, esto es, un muestreo los métodos de estadística descriptiva
estratificado. El uso del esquema de consistió en obtener medidas de
muestreo aleatorio simple en tales casos resumen no adecuadas para la
desaprovecha el conocimiento de tales naturaleza de los datos, ya fuera por
relaciones, haciendo ineficiente y posible- que éstos presentaban sesgo o porque
mente sesgada la caracterización de la se midieron en escala ordinal.
variable de interés.
En inferencia para una población, se
detectó que a pesar de la actual
CONCLUSIONES Y disponibilidad de herramientas tecno-
RECOMENDACIONES lógicas que facilitan la obtención del
intervalo de confianza exacto para el
En este trabajo se definieron una serie parámetro p de una población bino-
de falencias conceptuales, carencias y mial, se sigue obteniendo el intervalo de
violaciones evidentes a los supuestos, al confianza mediante la aproximación a la
aplicar métodos estadísticos. Todos distribución normal, lo cual resulta más
éstos fueron tratados y discutidos con el inadecuado cuando el tamaño de
nombre genérico de “errores”. En casi la muestra es pequeño.
mitad de los trabajos evaluados (49,2
%) se detectó al menos un error. A Los errores encontrados en los trabajos
nivel de pregrado, en Ingeniería en los que se aplicaron métodos de
Forestal se observó el menor porcentaje inferencia estadística para los pará-metros
de trabajos con al menos un error; de una y de dos poblaciones, pueden
mientras que el mayor porcentaje fue resumirse en uso inadecuado de la
observado en Ingeniería Agrícola. El aproximación normal. En algunos de los
porcentaje de errores es similar en los trabajos revisados en esta investigación
trabajos de Ingeniería Agronómica y en se obtuvieron intervalos de confianza con
los de Zootecnia; en ambos casos, tal base en dicha aproximación, sin tener en
porcentaje es cercano al 60 %. cuenta el tamaño de muestra; en otro
caso, se usó tal aproximación para
3578 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.
Evaluación de métodos estadísticos...
Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006. 3579
Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.
3580 Rev. Fac. Nac. Agron. Medellín. Vol.59, No.2. p. 3465-3580. 2006.