Está en la página 1de 16

EVALUACIN DE MTODOS ESTADSTICOS UTILIZADOS EN TRABAJOS

DE GRADO Y TESIS DE LOS PROGRAMAS DE LA FACULTAD DE CIENCIAS


AGROPECUARIAS,
AGROPECUARIAS, EN UN PERODO DE TRES AOS

Hernn Echavarra Snchez1; Guillermo Correa Londoo2; Juan Fernando Patio Dez3;
Juan Jos Acosta Jaramillo4 y Jairo Alberto Rueda Restrepo5
__________________________________________________________________________

RESUMEN

Se hizo un censo de los mtodos estadsticos usados en los trabajos de grado y tesis realizados en
un periodo de tres aos (1999-2001) en la Facultad de Ciencias Agropecuarias de la Universidad
Nacional, sede Medelln. En casi la mitad de los trabajos evaluados se encontr al menos un error
(49,2 %). A nivel de pregrado, en el programa de Ingeniera Forestal se observ el menor
porcentaje de trabajos con al menos un error; mientras que el mayor porcentaje fue observado en
Ingeniera Agrcola. La mayora de los errores se originaron en la poca claridad sobre el papel de la
estadstica como herramienta para la consecucin de los objetivos planteados en los trabajos, lo
cual se reflej en que los trabajos incluyeran resultados estadsticos que en nada contribuan al
cumplimiento de los objetivos, en que se omitieran resultados relevantes para su satisfaccin y/o
en que habindose generado resultados pertinentes, no se les diera discusin alguna.

PALABRAS CLAVE:
CLAVE Evaluacin de mtodos estadsticos, trabajos de grado, tesis.
________________________________________________________________________________________

ABSTRACT

EVALUATION
EVALUATION OF STATISTICAL METHODS USED IN FINAL PROJECTS AND THESIS OF THE FACULTAD
DE CIENCIAS AGROPECUARIAS, OVER A THREE-
THREE-YEAR PERIOD

A census of the statistical methods used in the final projects and thesis of the Facultad de Ciencias
Agropecuarias of the Universidad Nacional de Colombia, Sede Medelln over a three-year period
was done (1999-2001). In almost half of the evaluated works (49,2 %), at least one error was
found. At the undergraduate level, the smallest proportion of at-least-one-error works was

1
Profesor Asistente. Universidad Nacional de Colombia, Sede Medelln. Facultad de Ciencias Agropecuarias. A.A.
1779, Medelln, Colombia. <hechavar@unal.edu.co>
2
Profesor Asociado. Universidad Nacional de Colombia, Sede Medelln. Facultad de Ciencias Agropecuarias. A.A.
1779, Medelln, Colombia. <gcorrea@unal.edu.co>
3
Ingeniero Forestal. Universidad Nacional de Colombia, Sede Medelln. Facultad de Ciencias Agropecuarias. A.A.
1779, Medelln, Colombia. <jfpatino@unalmed.edu.co>
4
Ingeniero Forestal. Smurfit Kappa Cartn de Colombia S.A. Cl 15 18-109 Puerto Isaacs Yumbo, Cali, Colombia.
<juan.acosta@smurfitkappa.com.co>
5
Instructor Asociado. Universidad Nacional de Colombia, Sede Medelln. Facultad de Ciencias Agropecuarias.
A.A. 1779. <jarueda@unal.edu.co>

Recibido: Febrero 24 de 2006; aceptado: Agosto 10 de 2006.

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3465-3580. 2006.


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

observed in the Ingeniera Forestal program, whereas the higher proportion was observed in the
Ingeniera Agrcola program. A great bulk of errors was originated in the lack of conscience about
the role of statistics as a tool for the achievement of objectives. As a consequence, some works
included statistical results that had nothing to do with the objectives; they omitted relevant
results and/or failed to discuss them when they appeared.

Key Words:
Words Statistical methods evaluation, Final projects, Thesis.
________________________________________________________________________________________

INTRODUCCIN principales errores conceptuales en que


incurrieron los estudiantes al hacer uso
En los trabajos de grado y tesis, de los mtodos estadsticos, a fin de
requisitos parciales para obtener el proponer los cambios necesarios en los
ttulo acadmico en programas de cursos de Bioestadstica I (3000009),
pregrado y Maestra, respectivamente, Bioestadstica II (3000010) y Mtodos
los estudiantes hacen uso frecuente de Estadsticos para la Investigacin
la estadstica inferencial y, en menor (3000021).
medida, de la estadstica descriptiva,
para el anlisis y presentacin de sus
resultados. En cualquier caso, los m- MATERIALES Y MTODOS
todos deben ser seleccionados con
base en definiciones precisas de los Se realiz un censo de los trabajos de
objetivos especficos, la poblacin ob- grado y tesis realizados en la Facultad
jetivo y las restricciones existentes en la de Ciencias Agropecuarias durante el
toma o generacin de la muestra. periodo 19992001. No se tomaron en
consideracin los trabajos realizados en
La Universidad Nacional de Colombia la especializacin en Ciencia y Tecnologa
tiene un compromiso con la comunidad de Alimentos, pues la exigencia para
en general, en cuanto a la veracidad del stos es de una monografa, la cual
conocimiento que se genera a travs de generalmente no implica un anlisis
los trabajos de grado y tesis de sus estadstico. Inicialmente se consideraron
estudiantes; de ah la importancia de 189 trabajos, de los que se analizaron
detectar los principales errores concep- los 179 que usaron mtodos esta-
tuales en que se est incurriendo en los dsticos (172 trabajos de grado y 7 tesis
anlisis estadsticos que estos conllevan, de Maestra), distribuidos as: 16
con el fin de aplicar algunas medidas trabajos de grado de Ingeniera Agr-
preventivas que eviten la continuacin cola, 55 de Ingeniera Agronmica, 45
de tal situacin y que den validez de Ingeniera Forestal, 56 de Zootecnia
externa a su produccin acadmica. y 7 tesis de la Maestra en Bosques y
Conservacin Ambiental.
Mediante este trabajo se busc deter-
minar, para el perodo evaluado, el Se elabor una base de datos en la cual
porcentaje de trabajos en los cuales el se consign informacin relacionada
(los) mtodo(s) estadstico(s) utilizado(s) con los mtodos estadsticos usados en
fue(ron) inadecuado(s) e identificar los cada uno de los trabajos, se evalu el

3566 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

uso adecuado o inadecuado de los se detect al menos un error. En cuanto


mismos, definiendo para cada uno de a pregrados se refiere, en Ingeniera
ellos una lista de errores, carencias y Forestal se observ el menor porcentaje
violaciones evidentes a los supuestos; de trabajos de grado con al menos un
todos stos fueron denominados con el error; mientras que el mayor porcentaje
nombre genrico de errores. No se fue observado en Ingeniera Agrcola. El
incluy en tal lista el uso inadecuado o porcentaje de errores fue similar en los
impreciso del lenguaje tcnico. Seguida- trabajos de grado de Ingeniera
mente, se realiz un anlisis descriptivo y Agronmica y en los de Zootecnia; en
se discutieron los aspectos ms rele- ambos casos, tal porcentaje es cercano
vantes. al 60 %. El menor porcentaje global de
trabajos con al menos un error se
observ en las tesis de la Maestra en
RESULTADOS Bosques y Conservacin Ambiental. En la
Figura 1 se discriminan los trabajos por
Evaluacin de mtodos estadsticos. En programas con base en la deteccin de al
casi la mitad de los trabajos evaluados menos un error.

100,0

80,0
Error (%)

60,0

40,0

20,0

0,0
I. Agrcola I. Agronmica I. Forestal Zootecnia Maestra Total

Sin errores 37,5 41,8 71,1 42,9 85,7 50,8

Con errores 62,5 58,2 28,9 57,1 14,3 49,2

No. trabajos 16 55 45 56 7 179

Figura 1.
1. Porcentaje de trabajos por programa en la Facultad de Ciencias
Agropecuarias, con al menos un error, 1999 y 2001.

Identificacin de los principales errores inadecuado incluir resultados que no se


cometidos. Entre las carencias consi- mencionaron o analizaron en el trabajo
deradas genricamente como errores, y que, en algunos casos, ni siquiera
una muy frecuente consisti en indicar el contribuan al logro de los objetivos
uso de mtodos o pruebas, sin incluir planteados. Por otro lado, la no
ningn tipo de resultado que respaldara especificacin del diseo experimental
la discusin. Asimismo, se consider usado o la presencia de inconsistencias

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3567


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

en las tablas de resultados tambin se una poblacin binomial. Tambin se


clasific como error, ya que ello calcularon, para variables ordinales,
genera dudas acerca del grado de intervalos de confianza para los
compenetracin de los investigadores parmetros y .
con la situacin estudiada y, por tanto,
sobre su capacidad para usar la infor- Prueba de hiptesis para dos par-par-
macin disponible de manera adecuada. metros.
metros. En uno de los seis trabajos que
mencionaron este mtodo se utiliz un
Para la mencin y posterior discusin valor tabular inadecuado para la
de los diferentes errores detectados, prueba realizada.
stos se clasificaron de acuerdo al
mtodo estadstico en el cual fueron Diseo completamente al azar.
azar. En el
hallados. No se discuten los mtodos 66,67 % de los 42 trabajos en que se
en los cuales no se detectaron errores, utiliz este diseo se presentaron errores
ni aqullos donde se incluyeron tales como no aleatorizacin; no
resultados que no se analizaron o donde realizacin de pruebas de comparacin
el error consisti en no presentar de medias a pesar de que el anlisis de
resultados del mtodo utilizado. varianza result significativo o viceversa;
tras obtener Anlisis de Varianza no
Medidas de tendencia central. En el significativos se procedi a realizar
3,25 % de los 154 trabajos en que se nuevos anlisis de varianza sobre sub-
obtuvieron, se calcul la media para conjuntos de tratamientos, con el fin de
variables medidas en escala ordinal o, buscar significancia. En un trabajo se
tratndose de variables medidas en detect el uso de seudo repeticiones,
escala de razn, se us la media como en otros se us el diseo completa-
medida de tendencia central en una mente al azar, a pesar de estar
muestra conformada por datos sesgados. identificada una fuente de variacin
adicional a los tratamientos. En
Medidas de dispersin.
dispersin. En 4,84 % de algunos trabajos se detectaron incon-
los 124 trabajos en que se obtuvieron, sistencias en las tablas de anlisis de
se calcul la varianza para variables varianza presentadas y en un trabajo se
medidas en escala ordinal. hizo una interpretacin errnea de los
estadsticos calculados.
Grficos. En el 1,52% de los 132
trabajos en que utiliz este recurso se Diseo de bloques al azar. Entre el
usaron histogramas para graficar las 40 % de los 10 trabajos en que se us
frecuencias de variables categricas. este diseo se encontraron los
siguientes errores: no aleatorizacin;
Intervalos de confianza. En el 19,44 % se ignor la estructura factorial de los
de los 36 trabajos en los que se tratamientos; no se realizaron pruebas
usaron, se utiliz la aproximacin de comparacin de medias, a pesar de
normal con un nmero insuficiente que el Anlisis de Varianza result
de observaciones para hallar inter- significativo, y en un caso se utiliz el
valos de confianza del parmetro p de diseo experimental inadecuado.

3568 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

Diseo completamente al azar con cin para el uso de los bloques; no se


arreglo factorial. Entre el 65,22 % de realizaron pruebas de comparacin de
los 23 trabajos en que se us se medias a pesar de que el anlisis de
encontr como error ms frecuente el varianza fue significativo y en un trabajo
evaluar efectos principales a pesar de se utiliz como criterio de bloqueo un
que la interaccin entre los factores fue factor que presentaba interaccin
significativa. Tambin se observ que evidente con los tratamientos.
no se analizaron interacciones o se hizo
de manera incorrecta; se evaluaron Diseo de cuadrados latinos con
efectos de factores que no fueron arreglo factorial. Slo un trabajo
significativos en el anlisis de varianza; incluy este diseo pero se ingnor la
se llego a incluir menos factores de los estructura factorial de los tratamientos.
que realmente se usaron en el
experimento; se ignor la autocorre- Diseo de parcelas divididas en el
lacin entre los errores de diferentes tiempo. En seis de los 10 trabajos que
lecturas tomadas en el tiempo; se incluyeron este tipo de anlisis se encon-
evaluaron efectos simples cuando la traron los siguientes errores: interpreta-
interaccin entre los factores no haba cin errnea de los estadsticos calcula-
sido significativa; se declararon diferen- dos; desconocimiento de la auto-
cias significativas entre los tratamientos correlacin entre los errores de diferentes
sin haber realizado pruebas de com- lecturas tomadas en el tiempo; no se
paracin de medias; en un trabajo no se evalu un efecto principal significativo;
realizaron pruebas de comparacin de anlisis individuales en el tiempo sin el
medias a pesar de que el Anlisis de respaldo de un anlisis conjunto en el
Varianza fue significativo. En otros casos que se incluyera el tiempo como uno de
se us el diseo completamente al azar, los factores; conclusiones inconexas con
a pesar de estar identificada una fuente los resultados estadsticos; declaracin de
de variacin adicional a los tratamientos; diferencias significativas sin el respaldo
se hizo interpretacin errnea de los de las correspondientes pruebas de
estadsticos calculados o se detectaron medias, y en un trabajo el anlisis de las
inconsistencias en las tablas de anlisis interacciones fue incorrecto.
de varianza presentadas.
Diseo cross
crossover.
over. Este diseo se utiliz
Diseo en bloques al azar con arreglo en cinco trabajos y en tres de ellos se
factorial. En tres de los seis trabajos detectaron los siguientes errores: el
que usaron este diseo, el error que diseo era inadecuado para la situacin y
ms se present fue el no analizar las no se realizaron pruebas de comparacin
interacciones o hacerlo de manera de medias, a pesar de haberse obtenido
incorrecta; adems se evaluaron efectos un anlisis de varianza significativo.
principales a pesar de que la interaccin
entre los factores result significativa; Prueba de Kruskal
KruskalWallis. En uno de los
se detect una fuente de variacin cuatro trabajos que utilizaron esta
adicional a los tratamientos y los blo- prueba, el diseo experimental no era
ques. En un trabajo no haba justifica- completamente al azar.

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3569


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

Pruebas de comparacin de medias. Se present un modelo polinmico en el


realizaron 76 de este tipo de pruebas, cual el trmino de mayor orden no fue
de las cuales 31 presentaron algn tipo significativo; se hizo extrapolacin; en
de error. En este informe se consi- un trabajo las conclusiones no
eraron de manera agrupada pues el correspondan con los resultados; en
error sistemtico fue su uso a pesar de otro, se detect una posible auto-
que el anlisis de varianza no fue correlacin de errores pues se hicieron
significativo. Adicionalmente, en un medidas repetidas en el tiempo sobre
trabajo se inform haber usado la los mismos individuos; y en dos de los
prueba de Duncan para la evaluacin trabajos, se identific que los resi-
de contrastes y en otro trabajo se duales presentaban varianzas hetero-
detect una interpretacin errnea de gneas.
las comparaciones realizadas.
Correlacin. Este tipo de anlisis se
Regresin simple.
simple. Se detectaron los realiz en 25 trabajos y en el 56 % de
siguientes errores en 16 de los 36 ellos se detectaron errores tales como
trabajos en que se uso el mtodo: se usar los resultados del anlisis de
usaron modelos de lnea recta para correlacin como prueba de causalidad
modelar asociaciones evidentemente y el uso del coeficiente de correlacin
curvilneas; se detectaron extrapola- lineal en una asociacin no rectilnea.
ciones; se detectaron situaciones en que
los residuales presentaban varianzas Anlisis de conglomerados. En cuatro
heterogneas; en un trabajo se inclu- de los 16 trabajos que utilizaron este
yeron resultados que no coincidan con el mtodo se realizaron agrupamientos
problema planteado y en otro las dentro de un mismo dendrograma con
conclusiones no correspondan con los base en diferentes puntos de corte.
resultados estadsticos.
Muestreo
Muestreo aleatorio simple. En uno de
Regresin mltiple.
mltiple. En casi el 46 % de los ocho trabajos en que se mencion,
los 24 trabajos que utilizaron este se utiliz este esquema muestral,
mtodo se encontraron las siguientes cuando existan estratos claramente
fallas: se realizaron extrapolaciones; se identificados.
present un modelo final en el cual
algunos de los coeficientes no eran Muestreo estratificado. En el nico
significativos; se detect una posible trabajo en el que se encontr este
autocorrelacin de errores pues se esquema muestral se utiliz una
hicieron medidas repetidas en el tiempo frmula incorrecta para calcular el
sobre los mismos individuos y en otro nmero de unidades muestrales.
trabajo, se detect que los residuales
presentaban varianzas heterogneas.
DISCUSIN
Regresin polinmica. Se detectaron
los siguientes errores entre 5 de los 11 Una discusin integral de los errores
trabajos que utilizaron el mtodo: se detectados tendra que analizar el

3570 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

porqu de los mismos, lo cual se dificulta mtodos en los cuales no se detectaron


por tratarse de eventos relacionados con errores, ni aqullos donde el error
conductas acadmicas, ms que con consisti en incluir resultados que no se
fenmenos naturales y por la forma en analizaron o en no presentar resultados
que se colect la informacin. Es posible del mtodo utilizado. Esta ltima situa-
mencionar algunos eventos que, com- cin tambin fue encontrada por Olsen
binados entre s o de manera aislada, son 2003, en 14 % de los artculos revisados
determinantes en dicho proceso. El en la revista Infection and Immunity.
problema puede tener origen en una
deficiente formacin en la aplicacin de El hecho de que en 3 de los 5
los mtodos estadsticos, lo cual a su vez programas evaluados, los trabajos con
podra deberse a un inadecuado enfoque al menos un error superaran los
de las correspondientes asignaturas o a trabajos en los que no se detectaron
la poca conciencia por parte del errores y que en general casi la mitad
estudiante de la importancia de tales de los trabajos evaluados (49,2 %)
herramientas para su transcurrir acad- contena al menos un error, constituye
mico en la Universidad y su posterior una alerta para estudiantes, directores
desempeo profesional. Estos errores de trabajos y jurados, pues la veracidad
podran, asimismo, estar asociados con la del conocimiento que se gener a
inadecuada o inexistente asesora esta- travs de tales trabajos se vio afectada,
dstica, as como con un deficiente no hacindose un uso ptimo de la
seguimiento de las instrucciones suminis- informacin en los casos ms favorables,
tradas en una adecuada asesora o llegando a conclusiones totalmente
estadstica. A partir de la revisin de los incorrectas en los casos ms extremos.
informes finales, no les es posible a los
autores de este estudio determinar Aunque estos resultados son inferiores
cules de las anteriores circunstancias a los hallados por otros autores en
aplican a cada trabajo. estudios similares, ello no significa que
la situacin sea menos preocupante,
Adems, en los casos en los que las slo evidencia que no se trata de un
conclusiones no corresponden con los problema local. Kanter y Taylor 1994, al
resultados del mtodo estadstico, no revisar 57 artculos de la revista
es posible discernir si se trata de Transfusion, encontraron que el 75 %
errores involuntarios por parte del de los mismos presentaba algn tipo
estudiante o de un desconocimiento de de error estadstico; MacArthur y
la adecuada interpretacin de los Jackson 1984, quienes evaluaron 114
resultados. artculos del Journal of Infectious
Diseases, encontraron que un 95 % de
Por lo anterior, la presente discusin se los mismos present algn tipo de
centra en ilustrar las implicaciones de error estadstico. Los resultados ms
los principales errores detectados y en similares seran los de Olsen 2003,
brindar recomendaciones en muchos quien encontr errores en al menos la
de los casos, ms que en el porqu de los mitad de los 141 artculos revisados en
mismos. En tal sentido, no se discuten los la revista Infection and Immunity.

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3571


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

Teniendo en cuenta el compromiso de la media y la desviacin estndar como


la Universidad con la comunidad y los medidas de resumen, pues dado que en
importantes recursos invertidos en el este tipo de variables la distancia entre
desarrollo de los trabajos, se hace los diferentes niveles o categoras no es
urgente tomar acciones correctivas que constante, la media aritmtica no
eviten la continuacin de tal situacin y refleja la verdadera tendencia central
que den validez externa a la produccin de los datos. Consecuentemente, la
acadmica de la Facultad. desviacin estndar tampoco resulta
adecuada, por ser una medida basada
en la media. En estos casos, deben
IDENTIFICACIN DE LOS usarse la mediana y la desviacin
PRINCIPALES ERRORES mediana como medidas de resumen.

Estadstica descriptiva. Al evaluar el uso Aunque los estadsticos de forma se


de medidas de resumen, se encontr utilizan frecuentemente como valores
que en algunos trabajos en los que se de referencia para inferir sobre la
incluyeron medidas de tendencia central, distribucin normal de un conjunto de
stas no se acompaaron con al menos datos, no se recomienda su uso aislado
una medida de dispersin. Aunque el uso para tal fin; en estos casos es preferible
aislado de una medida de tendencia utilizar una prueba formal de bondad
central no se considera errneo per se, de ajuste. Una aplicacin adecuada y
sta debe ir acompaada por un poco frecuente de los estadsticos de
estadstico de dispersin siempre que forma, en particular del coeficiente de
ello sea posible, con el fin de describir asimetra, es orientar sobre la medida
de manera ms completa el conjunto de tendencia central ms adecuada
de datos. Esta carencia puede deberse para el conjunto de datos, pues la
al hecho de que las medidas de media, que es la medida de tendencia
tendencia central, a diferencia de las central ms utilizada, slo resulta
medidas de dispersin, tienen una adecuada cuando no se presenta una
interpretacin ms directa, an por asimetra muy marcada; en caso
aquellas personas que tomaron sus contrario, se recomienda el uso de la
cursos de estadstica hace mucho mediana. Por lo anterior, se sugiere
tiempo. usar siempre el coeficiente de asimetra
como gua para la eleccin de la
Los errores relacionados con las medidas medida de tendencia central (y, en
de tendencia central y de dispersin se consecuencia, de dispersin) ms
asocian con el uso indiscriminado de la adecuada.
media y la varianza sin tomar en
consideracin algunas caractersticas de En lo que a las herramientas grficas de
los datos, como la escala de medicin y la estadstica descriptiva se refiere,
la simetra de los mismos. existen dos figuras que por su forma a
menudo son confundidas: los histo-
Al evaluar caractersticas medidas en gramas de frecuencias y los diagramas
escala ordinal, resulta inadecuado utilizar de barras. Los histogramas de frecuen-

3572 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

cias se usan cuando se tienen variables sentido, se considera que los intervalos
cuantitativas; en stos las barras son de confianza deberan usarse ms a
adyacentes y su ubicacin corresponde menudo como complemento a otros
con el orden intrnseco de la variable. mtodos; en particular, en la pre-
Los diagramas de barras se deben utilizar sentacin final de los resultados, donde
cuando se tienen variables cualitativas; aportaran valiosa informacin adicional
en stos las barras estn separadas y su sobre los parmetros de inters, bien sea
ubicacin no responde a un orden en el mbito del diseo de experimentos,
particular. El uso de un histograma para la regresin o el muestreo.
la caracterizacin de una variable
cualitativa podra generar la falsa idea El uso de la aproximacin normal para
de continuidad de dicha variable. obtener intervalos de confianza del
parmetro p de una poblacin bino-
Una situacin detectada cuando se mial resulta especialmente inadecuado
haca uso de mtodos descriptivos cuando el tamao de la muestra es
consisti en hacer afirmaciones propias pequeo. En tales casos, lo ms
de la estadstica inferencial, sin usar las adecuado es obtener el intervalo de
herramientas propias de sta. Cabe confianza exacto, usando la distribucin
recordar que para generalizar a las binomial. De manera general, dada la
poblaciones los comportamientos de actual disponibilidad de herramientas
las muestras que las representan, no tecnolgicas, se recomienda obtener en
basta con reportar la magnitud de las todos los casos el intervalo de confianza
diferencias observadas; deben usarse a partir de la distribucin exacta.
mtodos inferenciales, los cuales per-
miten cuantificar la probabilidad de Tras calcular medidas de resumen para
error de las aseveraciones realizadas. variables ordinales (mediana y des-
viacin mediana), no es adecuado
construir intervalos de confianza para
ESTADSTICA INFERENCIAL los parmetros y . Lo anterior resulta
ms evidente si se tiene en cuenta que
Estimacin. En diversos campos de las y son los parmetros de una dis-
Ciencias Agropecuarias, como la tribucin normal, la cual resulta
produccin, el mejoramiento y la inadecuada para modelar fenmenos
modelacin de fenmenos naturales, medidos en escala ordinal. Olsen 2003,
entre otros, con frecuencia se busca tambin menciona esta situacin en
estimar parmetros. Si bien, tal artculos mdicos, donde se usaron
estimacin puede realizarse de manera mtodos que requeran la distribucin
puntual, los intervalos de confianza normal de los datos y stos tenan una
representan un mtodo ms completo, distrbucin sesgada.
pues adems de suministrar info.-
macin sobre la tendencia central y la Pruebas de hiptesis. El usar valores
dispersin de la variable de inters, se tabulares inadecuados, ya sea por
conoce la probabilidad de acierto en la errores en el nivel de significancia, en
estimacin del parmetro. En tal los grados de libertad o en la distribucin

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3573


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

requerida, hace que las probabilidades significativo, realizando un nuevo


reales de error no coincidan con las anlisis de los datos con base en el
nominales, lo que conlleva la sobre- anlisis de varianza de una va (Diseo
estimacin o subestimacin del riesgo Completamente al Azar).
de error o incluso la toma de decisiones
incorrectas acerca del juego de hip- Acorde con Manly 1992, la no
tesis planteado. aleatorizacin y/o el uso de seudo repeti-
ciones generan falta de independencia,
Diseo de experimentos. Se presentan lo cual afecta la estimacin del error
las siguientes consideraciones relaciona- experimental y la validez interna del
das con los errores detectados en ensayo, propiciando que los efectos de
algunos de los trabajos en los que se los tratamientos se confundan con
realizaron experimentos diseados. Uno efectos de otros factores no conside-
de los errores ms bsicos consiste en rados en el experimento (factores de
usar un diseo experimental inadecuado, confusin). Dos acciones errneas que
bien sea por la no inclusin de fuentes de hacen que el nivel de significancia real
variacin reconocidas o por la inclusin de la prueba supere el nivel de
de supuestas fuentes de variacin significancia nominal son: realizar
dentro del modelo con el nimo de pruebas de comparacin de medias
disminuir el error experimental o para un factor cuyo efecto no result
simplemente por tradicin. significativo (Lentner y Bishop 1986,
Steel y Torrie 1995) y realizar nuevos
Un caso particular de la situacin anlisis de varianza sobre subconjuntos
planteada anteriormente se presenta de tratamientos, con el fin de buscar
cuando el experimento es sometido al significancia. Estas acciones responden
esquema de aleatorizacin restringida a la creencia comn de que en todo
propio del Diseo de Bloques al Azar ensayo experimental se deben hallar
(aleatorizacin dentro de grupos), sin diferencias significativas, desconociendo
ningn criterio para ello, manteniendo que la no deteccin de stas constituye
o retirando los bloques del modelo con un resultado igualmente importante para
base en informacin a posteriori. En la aproximacin a la comprensin del
este caso se pueden cometer dos errores: fenmeno estudiado.
por un lado, evaluar la supuesta sig-
nificancia de los bloques con base en el El caso contrario ocurre cuando a pesar
valor p generado por la mayora de de que el Anlisis de Varianza resulta
programas estadsticos, lo cual, segn significativo, no se realizan pruebas de
Lenter, Arnold y Hinkelmann, citados por comparacin de medias ni contrastes,
Kuehl 1994 y Petersen 1994, resulta desconociendo que el anlisis de
incorrecto, pues no existe una prueba varianza es una prueba general que en
vlida para evaluar la significancia de ningn caso permite concluir que
tal efecto. El otro error que puede existen diferencias entre todas las
cometerse en esta situacin resulta de medias; su significancia slo implica
retirar el efecto de los bloques del que al menos dos de las medias
modelo cuando dicho efecto no resulta comparadas difieren, sin especificar

3574 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

cules son las medias causantes de la factor no permanecen constantes a


significancia de la prueba. travs de cada uno de los niveles de los
otros factores, resulta incorrecta la
En ensayos experimentales que invo- obtencin de una diferencia promedio.
lucran dos o ms factores de inters, en Por tanto, la evaluacin de efectos
ocasiones se ignora la estructura principales slo procede cuando la
factorial de los tratamientos y se realiza interaccin no es significativa y el factor
el anlisis de varianza que corres- s lo es. De la misma manera, resulta
pondera a una estructura unifactorial. inadecuado evaluar efectos simples
Aunque tal forma de anlisis no conlleva cuando la interaccin no es significativa.
errores matemticos, puede conside-
rarse un error metodolgico, pues se En el rea biolgica son frecuentes los
desaprovecha la capacidad de tales ensayos en los que se realizan lecturas
estructuras de tratamientos para evaluar de una variable sobre una misma
las posibles relaciones existentes entre unidad experimental a travs del
los factores evaluados y dificulta, en tiempo. Con ello se genera una
caso de que tales relaciones existan, estructura de covarianzas entre los
presentar recomendaciones especficas errores correspondientes a las diferentes
para cada uno de los niveles de los lecturas de una misma unidad
factores relacionados. Algo similar experimental. Para el anlisis de este
ocurre cuando se ignora(n) alguno(s) de tipo de ensayos deben usarse mtodos
los factores involucrados inicialmente en que permitan modelar dicha estruc-
el experimento. tura, la cual no es manejable a travs
del anlisis clsico que asume que las
Otro error detectado cuando se rea- covarianzas entre errores son cero
lizan experimentos con estructura (errores independientes). Para tal
factorial de tratamientos consiste en efecto, pueden consultarse Littell et al.
evaluar efectos principales, a pesar de 1998, Littell et al. 1996 y SAS 1999,
que la interaccin entre los factores entre otros.
resulte significativa (Petersen 1994).
Una interaccin implica que las Un procedimiento que ha sido usado
diferencias entre los niveles de un por los investigadores para intentar
factor cambian, dependiendo de la obviar la modelacin de la estructura
combinacin de niveles de los dems de covarianzas consiste en realizar
factores. La evaluacin de un efecto anlisis individuales para cada uno de
principal consiste en comparar las los tiempos. Debe advertirse que este
medias de cada uno de los niveles de mtodo no permite evaluar las ten-
un factor; estas medias se obtienen dencias de la variable respuesta a travs
promediando todas las combinaciones del tiempo, por lo que no constituye un
que contengan el nivel de inters, verdadero mtodo de anlisis de me-
estando all involucrados todos los didas repetidas y, si bien puede resultar
niveles de los dems factores. Puesto til para un anlisis exploratorio, no es
que, en presencia de interaccin, las adecuado como mtodo final de anlisis
diferencias entre los niveles de un (Littell et al. 1998).

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3575


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

Uno de los supuestos del diseo de slo puede evaluarse de manera objetiva
bloques al azar es la aditividad; esto es, la cuando se tienen repeticiones de los
no existencia de interaccin entre valores de la variable independiente. En
bloques y tratamientos. Cuando este caso contrario, que es lo ms frecuente,
supuesto no se cumple, el estimador del este supuesto se evala a travs del
error experimental es inadecuado, pues grfico de residuales estandarizados; an
corresponde en realidad al efecto de tal as, este procedimiento a menudo es
interaccin. En estos casos, no es posible omitido. Cuando las varianzas no son
estimar el verdadero error experimental, homogneas, no es posible obtener un
a menos que cada tratamiento est estimador adecuado de la varianza
presente ms de una vez dentro de cada promedio de las subpoblaciones de la
bloque (Lentner y Bishop 1986). variable dependiente para cada nivel de
la variable independiente, razn por la
cual la inferencia realizada en tales
REGRESIN Y CORRELACIN situaciones resulta inadecuada.

Regresin simple.
simple. Uno de los errores Regresin mltiple. Las consideraciones
detectados obedece a que existe la hechas para los modelos de regresin
creencia de que la significancia de un simple, en general aplican tambin a los
modelo de regresin lleva implcito el modelos de regresin mltiple. Vale la
buen ajuste del mismo. Esto, desde pena, sin embargo, resaltar algunos
luego, no es cierto, ya que la significancia aspectos adicionales.
de un modelo de regresin lineal simple
slo indica la presencia de un efecto El uso de modelos de regresin mltiple
lineal significativo, pero no da ninguna para predecir valores de la variable
informacin acerca de posibles efectos dependiente a menudo conlleva extra-
cuadrticos. polaciones, las cuales tienen las mismas
implicaciones anotadas para el caso de
Otro error frecuente en el uso de los regresin simple. Su deteccin, sin
modelos de regresin es utilizarlo para embargo, no es tan directa, pues no es
predecir valores de la variable respuesta a suficiente que los valores usados para la
partir de valores de la variable predictora prediccin estn incluidos en el rango
que estn por fuera de la regin usada de valores usado para cada una de las
para ajustar el modelo. Esta accin no es variables independientes, sino que ten-
recomendable, ya que el comporta- dra que verificarse que la combinacin
miento de un fenmeno en una regin evaluada est en una regin que haya
determinada no garantiza que dicha sido usada para el ajuste del modelo.
tendencia se mantenga por fuera de la
misma, lo cual puede causar que las Exceptuando aquellos casos en los
estimaciones as realizadas estn cuales deba respetarse el principio de
bastante alejadas de la realidad. jerarqua, un modelo final de regresin
slo debe contener trminos sig-
Uno de los supuestos para el anlisis de nificativos, pues de lo contrario se estara
regresin es la homocedasticidad. sta viciando el modelo con relaciones

3576 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

inexistentes, las cuales afectaran la interpretacin de ste como prueba de


capacidad predictiva del mismo, as causalidad, situacin errnea pues
como la estimacin de los coeficientes dicho coeficiente slo refleja la exis-
de regresin, que miden el grado de tencia de asociaciones lineales entre las
asociacin entre las dems variables variables analizadas, sin que de ningn
independientes y la variable respuesta. modo la significancia de una corre-
lacin implique que el comportamiento
Para el caso de los modelos de de una de las variables sea responsable
regresin, el principio de jerarqua de los valores que tome la otra.
mencionado anteriormente establece
que si un trmino de orden k resulta Como su nombre lo indica, el coeficiente
estadsticamente significativo, el mo- de correlacin lineal simple slo es ade-
delo deber contener todos los cuado para caracterizar relaciones
trminos de orden inferior a k, aunque lineales entre variables, por lo que resulta
stos no sean significativos. Este principio errneo el uso del mismo para carac-
tambin es aplicable a aquellos modelos terizar otros tipos de relaciones. Por lo
que incluyen interacciones significa- anterior, al evaluar correlacin entre dos
tivas, en cuyo caso el modelo deber variables, se recomienda acompaar el
incluir cada uno de los trminos uso del coeficiente de correlacin con el
involucrados en la interaccin, aun si correspondiente grfico de dispersin.
stos no son significativos.
Por lo anterior, la no significancia del
Una situacin ya mencionada en el coeficiente de correlacin -sin el corres-
contexto de diseo de experimentos, pondiente diagrama de dispersin- no
consistente en el uso de medidas podr interpretarse como ausencia de
repetidas en el tiempo sobre una misma relacin entre las dos variables. Slo
unidad experimental, aparece tambin podra decirse que no existe relacin
en el contexto de regresin, con las lineal entre las mismas.
mismas implicaciones all anotadas (en
este caso se habla de autocorrelacin de
errores). Adems de verse afectada cada ESTADSTICA MULTIVARIADA
lectura por los valores registrados en los
tiempos anteriores, lo que va en contra Al representar una clasificacin jerr-
del supuesto de independencia, los quica de individuos por medio de
modelos ajustados careceran de validez dendrogramas, la escogencia de los
externa, es decir, que no podran utili- grupos, para un mtodo de agrupa-
zarse para describir el comportamiento miento dado, debe estar acorde con la
de la poblacin, pues en realidad se medida de similitud/disimilitud elegida.
habra modelado el comportamiento de Si bien pueden plantearse diferentes
unos individuos. agrupamientos dependiendo del nivel
de detalle establecido, una vez que ste
Correlacin. Al evaluar relaciones entre se elija, deber usarse para todas las
variables a travs del coeficiente de agrupaciones dentro de ese nivel de
correlacin, un error consiste en la detalle. No es adecuado, por tanto, al

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3577


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

usar mtodos de clasificacin jerrquica, consecucin de los objetivos plan-


fusionar subgrupos cuya disimilitud sea teados en los trabajos, lo cual se reflej
mayor que la existente entre otros en que stos incluyeran resultados
grupos declarados como diferentes. estadsticos que en nada contribuan al
cumplimiento de los objetivos, en que
Otros. Al plantear el esquema de se omitieran resultados relevantes para
muestreo para la caracterizacin de una su satisfaccin y/o en que habindose
variable, la presencia de condiciones generado resultados pertinentes, no se
que puedan afectar su comportamiento, les diera discusin alguna.
generando subpoblaciones, hace ne-
cesario el uso de un esquema de El principal error detectado en el uso
muestreo acorde, esto es, un muestreo de los mtodos de estadstica des-
estratificado. El uso del esquema de criptiva consisti en obtener medidas
muestreo aleatorio simple en tales casos de resumen no adecuadas para la
desaprovecha el conocimiento de tales naturaleza de los datos, ya fuera por
relaciones, haciendo ineficiente y posible- que stos presentaban sesgo o porque
mente sesgada la caracterizacin de la se midieron en escala ordinal.
variable de inters.
En inferencia para una poblacin, se
detect que a pesar de la actual
CONCLUSIONES Y disponibilidad de herramientas tecno-
RECOMENDACIONES lgicas que facilitan la obtencin del
intervalo de confianza exacto para el
En este trabajo se definieron una serie parmetro p de una poblacin bino-
de falencias conceptuales, carencias y mial, se sigue obteniendo el intervalo
violaciones evidentes a los supuestos, de confianza mediante la aproximacin
al aplicar mtodos estadsticos. Todos a la distribucin normal, lo cual resulta
stos fueron tratados y discutidos con ms inadecuado cuando el tamao de
el nombre genrico de errores. En muestra es pequeo.
casi la mitad de los trabajos evaluados
(49,2 %) se detect al menos un error. Los errores encontrados en los trabajos
A nivel de pregrado, en Ingeniera en los que se aplicaron mtodos de
Forestal se observ el menor porcentaje inferencia estadstica para los par-
de trabajos con al menos un error; metros de una y de dos poblaciones,
mientras que el mayor porcentaje fue pueden resumirse en uso inadecuado de
observado en Ingeniera Agrcola. El la aproximacin normal. En algunos de
porcentaje de errores es similar en los los trabajos revisados en esta inves-
trabajos de Ingeniera Agronmica y en tigacin se obtuvieron intervalos de
los de Zootecnia; en ambos casos, tal confianza con base en dicha aproxima-
porcentaje es cercano al 60 %. cin, sin tener en cuenta el tamao de
muestra; en otro caso, se us tal
Muchos de los errores se originaron en aproximacin para modelar variables
la poca claridad sobre el papel de la ordinales, generando incluso intervalos
estadstica como herramienta para la de confianza para y .

3578 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006


Evaluacin de mtodos estadsticos...

En lo concerniente a los experimentos Este proceso debe emprenderse desde el


diseados los principales errores estu- principio de la carrera, involucrando, no
vieron asociados con una aleatoriza- slo a los miembros de la Seccin de
cin deficiente o nula, en el uso Bioestadstica, sino a todos los encar-
incompleto de las tcnicas del anlisis gados de las asignaturas donde se
de varianza, dejndose de usar los requiera el uso de tales mtodos.
contrastes de medias para responder
las preguntas planteadas en los Especficamente, se considera oportuno
objetivos, o usando pruebas de medias que en la asignatura Bioestadstica I se
forzadas (con anlisis de varianza no haga ms nfasis en el captulo de
significativo). El mayor porcentaje de inferencia estadstica, especialmente en
errores se observ en experimentos con lo relativo a pruebas de hiptesis, lo
estructura factorial donde la Inter.- cual podra hacerse a expensas de
pretacin de las interacciones en disminuir el nfasis dado a la unidad de
algunos casos no fue adecuada, pues lgebra de probabilidades, limitando
no se evaluaron efectos simples cuando sta a la presentacin de las definiciones
corresponda o se evaluaron cuando en bsicas y de las distribuciones de
realidad se deba analizar los efectos probabilidad ms usadas.
principales.
En relacin a la asignatura Bioestadstica
Entre los errores detectados al usar II, se considera innecesario continuar
mtodos de regresin, los principales incluyendo en el programa el diseo de
estaban relacionados con el no cum- cuadrado latino, dado su poco uso. En
plimiento de supuestos tales como cambio debe incluirse informacin
homocedasticidad e independencia. Con relacionada con el anlisis de medidas
menor frecuencia se presentaron mo- repetidas en el tiempo.
delos definitivos con trminos no
significativos y la extrapolacin de con- Aunque al momento de realizar el censo
clusiones por fuera del rea analizada, no existan trabajos de la Maestra en
adems del uso de modelos de lnea Ciencias Agrarias, se considera que sus
recta para modelar asociaciones tesis podran exhibir errores similares a
evidentemente curvilneas. los detectados en los dems programas
de la Facultad, dado que las interac-
El principal error detectado en el uso de ciones entre estudiantes, profesores,
coeficientes de correlacin tuvo que ver directores y jurados son, asimismo,
con su uso como prueba de causalidad. similares. Por tanto, el curso de M-
En un solo trabajo se identific su uso todos Estadsticos para la Investigacin,
para caracterizar una relacin no manteniendo sus particularidades, de-
rectilnea. ber enfocarse tambin en prevenir
sobre los errores ms frecuentemente
Como recomendacin general, se consi- encontrados.
dera necesario concientizar al estudiante
sobre la importancia del adecuado Se considera muy importante la parti-
dominio de los mtodos estadsticos. cipacin de los directores de trabajos

Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006 3579


Echavarra, H.; Correa, G.; Patio, J.F.; Acosta, J.J.; Rueda, J.A.

de grado y tesis en una revisin ms Littell, R. C., Henry, P. R. and Ammer-


detallada de la metodologa estadstica, man, C. B. 1998. Statistical analysis of
con la realizacin de las correspondientes repeated measures using SAS pro-
consultas especializadas cuando la cedures. En: Journal of Animal Science.
situacin lo amerite. Con base en los Vol. 76; p. 12161231.
correctivos que se sugieran, podran
optimizarse los recursos invertidos en los Littell, R. C.; Milliken, G. A.; Stroup, W.
trabajos, obtenindose la mayor infor- W. and Wolfinger, R. D. 1996. SAS
macin posible que apunte al logro de system for mixed models. Cary North
los objetivos y/o que pueda dar lugar a Carolina, USA: SAS Institute. 633 p.
nuevos proyectos.
Mac Arthur, R. D. and Jackson, G. G.
1984. An evaluation of the use of
RECONOCIMIENTOS statistical methodology in the Journal
of Infectious Diseases. En: Journal of
Infectious Diseases. Vol. 149, no. 3; p.
Este trabajo fue realizado con el apoyo 349-354.
financiero de la Direccin de
investigacin de la Universidad Nacional Manly, B. F. J. 1992. The design and
de Colombia, Sede Medelln DIME- analysis of research studies. New York:
proyecto 030802611. Cambridge University Press. 353 p.

Olsen, C. H. 2003. Review of the use of


BIBLIOGRAFA statistics in infection and immunity. En:
Infection and Immunity. Vol. 71; p.
6689-6692.
Kanter, M. H. and Taylor, J. R. 1994.
Accuracy of statistical methods in Petersen, R. G. 1994. Agricultural field
transfusion: a review of articles from experiments: design and analysis. New
July/August 1992 through June 1993. York: Marcel Dekker. 409 p.
En: Transfusion. Vol. 34, no. 8; p. 697-
701. SAS Institute. 1999. SAS/STAT. Guide
for personal computers. Versin 8.
Kuehl, R. O. 1994. Statistical principles Cary, NC: SAS. 378 p.
of research design and analysis. Belmont,
USA: Duxbury Press. 686 p. Steel, R. G. y Torrie, J. H. 1995.
Bioestadstica: principios y procedi-
Lentner, M. and Bishop, T. 1986. mientos. Mexico: McGraw Hill. 622 p.
Expemimental design and analysis.
Blacksburg, USA: Valley Book Zar, J. H. 1984. Biostatistical analysis.
Company. 557 p. New Jersey: Prentice-Hall. 718 p.

3580 Rev.Fac.Nal.Agr.Medelln. Vol.59,No.2. p.3565-3580. 2006

También podría gustarte