Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Louis Guttman
6/79 pp 101-127
LOUIS GUTTMAN
102
MALOS USOS EN ESTADÍSTICA
103
LOUIS GUTTMAN
INTRODUCCIÓN
Hace unos cuarenta años, Harold Hotelling señaló que los libros de texto
de estadística de aquel período estaban escritos, en su mayoría, por no mate-
máticos. Aquellos libros estaban repletos de conceptos erróneos, e ignoraban
en su mayoría los nuevos e impresionantes desarrollos de la disciplina matemá-
tica de la estadística inferencial. La situación mejoró paulatinamente a medida
que más estadísticos matemáticos comenzaron a publicar libros de texto, de
tal modo que hoy en día el péndulo parece haber ido demasiado lejos. En
algunos lugares, los símbolos más que la sustancia parecen ser los dueños.
Esto es especialmente verdad en las ciencias sociales —con las que estoy más
familiarizado— y a las cuales va dirigido (aunque no exclusivamente) este
trabajo. Por ejemplo, consejeros y editores de algunas revistas insisten en de-
corar las tablas de diversos tipos de datos con estrellas y dobles estrellas, y
en presentar listados de «errores estándar», a pesar de que las probabilidades
implícitas de significación o confianza son claramente erróneas desde el punto
de vista de la estadística inferencial (ver los problemas 3 y 1, más adelante).
Junto al mal uso de los nuevos desarrollos, persisten todavía muchos de
los antiguos falsos conceptos en los libros de texto y revistas actuales debido
a la extremadamente pobre terminología que ha sido conservada, por razones
históricas, por los estadísticos matemáticos. Los matemáticos están habituados
a tratar correctamente simbolizaciones arbitrarias e incluso confusas, dado que
están preparados para centrarse directamente en los conceptos que señalan, los
cuales, por otra parte, están bien definidos. No ocurre así con los no matemá-
ticos, quienes más bien están inclinados a reaccionar ante las etiquetas ver-
bales como si tuvieran unas implicaciones y un significado diferentes y más
allá de los conceptos técnicamente designados. Por ejemplo, el término «regre-
sión» emergió originalmente en el contexto de las investigaciones genéticas de
Francis Gal ton, anteriores a la difusión de la teoría de los genes, y ha sido
conservado desde entonces por los matemáticos para algo que no tiene que ver
nada con los procesos genéticos, ni con ningún tipo de proceso. Es cierto que
es deseable tener una palabra única para «una serie de medias aritméticas
condicionales», pero al retener la palabra «regresión» para tal serie se da a
los no matemáticos una idea de procesos dinámicos y leyes de la naturaleza en
contextos para los que tales ideas son totalmente erróneas. (Irónicamente, in-
cluso hoy en día algunos genetistas confunden el concepto estadístico de regre-
sión con una teoría genética de herencia biológica, y en consecuencia alcanzan
conclusiones falsas.)
Uno de los objetivos del presente trabajo es poner de manifiesto algunos
de los problemas básicos aún no resueltos en la estadística inferencial. La
discusión de estos problemas sirve como introducción para un segundo obje-
tivo, presentar una lista de hechos sobre la terminología estadística y las ideas
equivocadas <jue merecen ser sometidas a la atención, tanto de los matemáticos
104
MALOS USOS EN ESTADÍSTICA
105
LOUIS GUTTMAN
Prob {ai < 0i < bi, a2 < 02 < b2, ... an < 0n < b n } = 1 — «
y con alguna condición de optimización para la elección de ai y bi. Ningún
106
MALOS USOS EN ESTADÍSTICA
107
LOUIS GUTTMAN
«Pruebe algo tal como .05 ó .01 o incluso .001.» En tiempos anteriores
podría haber sugerido: «Tome algo como más o menos dos o tres errores
estándar.» El estadístico matemático podría olvidarse de recordar al investi-
gador que tomara uno y sólo uno de tales números —y con anterioridad—
para el problema. En cualquier situación, dadas varias opciones, el investiga-
dor las acepta todas y las utiliza simultáneamente, y habitualmente después
del hecho. Esta práctica por sí misma puede hacer completamente insoluole
el problema 2 anterior. La situación se torna más confusa cuando los niveles
del ómnibus se aplican todos ellos simultáneamente tal cual & una serie de
hipótesis simultáneas. ¿Qué solución puede existir para los procedimientos
utilizados en la práctica? ¿Cómo pueden convencerse los autores y editores
de revistas científicas de que cuando rellenan sus tablas de datos con una
galaxia de estrellas, dobles estrellas, e incluso triples estrellas, no están pro-
bando hipótesis, sino rechazando la propia estadística inferencial?
108
MALOS USOS EN ESTADÍSTICA
109
LOU1S GUTTMAN
110
MALOS USOS EN ESTADÍSTICA
111
LOUIS GUTTMAN
X X
peP qeP (x P —x q ) (y P — yq)
V-2 = X X
peP qeP lxp — xq¡ ¡yp —y q l
112
MALOS USOS EN ESTADÍSTICA
ma 4, anterior: también los puntos 4 y 20. Esto provoca una cuestión inte-
resante sobre cómo desarrollar una prueba realista de significación, o si la
inferencia estadística debiera siquiera mezclarse con problemas de aproxima-
ción. Ver el problema 6, anterior.)
113
LOUIS GUTTMAN
que la que pueda hacer una simple ponderación. Ver el problema 2 anterior
sobre replicación.)
114
MALOS USOS EN ESTADÍSTICA
(Se necesitan al menos dos ensayos sobre la misma muestra para con-
seguir una estimación consistente —y por supuesto no sesgada— de un coe-
ficiente de fiabilidad de población, incluso para la Habilidad de una suma
o mitades partidas. Los intentos comunes de salir del paso con un solo en-
sayo introducen supuestos que son falsos y que no anulan los sesgos respec-
tivos. Los sesgos de los supuestos habituales son acumulativos, y a menudo
conducen a serias subestimaciones. Los autores algunas veces se percatan
de esto cuando «corrigen para atenuar», y obtienen un coeficiente de corre-
lación mayor que la unidad; el sesgo es bastante universal y puede ser drás-
tico incluso si una «corrección» en un caso particular no conduce a un ab-
surdo inmediato. Muchos libros de texto en psicología educativa y en áreas
similares tratan erróneamente las fórmulas convencionales del coeficiente de
fiabilidad como si fueran consistentes, mientras que estas fórmulas no son
usualmente otra cosa que estimaciones de límites bajos del coeficiente de fia-
bilidad en cuestión.)
U5
LOUIS GUTTMAN
116
MALOS USOS EN ESTADÍSTICA
en donde /¿ÍJ, Vjk, y Wik pueden a su vez ser descompuestos de formas diver-
sas. La regresión de la población, naturalmente, es la serie de valores espe-
rados condicionales de tijk, y esta serie no necesita estimarse consistentemen-
te con el uso de una tautología restringida. A pesar de ello, los autores hafoi-
tualmente tratan de ensayar hipótesis en las que se mantiene una forma más
simplificada que cualquiera de las anteriores —usualmente varias hipótesis
simultáneamente—. Suelen calcular una serie de valores estadísticos [«ratios
de varianza»] Fi, F2, ..., F m —siendo cada Fi una especie de ayuda para el
ensayo de la hipótesis nula HOi en algún aspectos de la regresión— y reali-
zan afirmaciones referentes a «niveles de significación» ai, en donde proba-
blemente
117
LOUIS GUTTMAN
118
MALOS USOS EN ESTADÍSTICA
119
LOUIS GUTTMAN
120
MALOS USOS EN ESTADÍSTICA
121
LOUIS GUTTMAN
mostrado nadie que las matemáticas subyacentes en las rutinas actuales del
ordenador sean consistentes con las matemáticas de la teoría de la puntua-
ción del factor [«factor score theory»]. Las matemáticas del análisis factorial
demuestran que aunque se fijan los coeficientes de saturación de una manera
consistente, se continuará dejando abierta la cuestión de las puntuaciones de
factor que deben acompañar a los coeficientes de saturación: existen gene-
ralmente soluciones de puntuaciones alternativas muy diferentes que son con-
sistentes precisamente con los mismos coeficientes de saturación. Muchos li-
bros de texto no mencionan estos problemas de indeterminación e inconsis-
tencia de las puntuaciones de factor, que se encuentran en la base de la
teoría analítica factorial, y los programas de ordenador existentes ignoran es-
tos problemas.)
122
MALOS USOS EN ESTADÍSTICA
123
LOUIS GUTTMAN
124
MALOS USOS EN ESTADÍSTICA
de ratios» son nombres para hipótesis acerca de algún aspecto de ciertas cur-
vas de regresión experimentales. Algunos no-psicofísicos han tomado pres-
tada esta terminología desafortunada para contextos menos apropiados —y
por supuesto indefinidos—, y puede que desconozcan el problema de la regre-
sión psicofísica experimental original. Existe un folklore ampliamente difun-
dido acerca de «reglas» estadísticas míticas, que prohiben o permiten cálculos
que incluyen «escalas», siendo tales reglas independientes del contexto. Ver
el punto siguiente. Quizá los psicofísicos podrían sugerir una palabra mejor
que «escala» para sus hipótesis de regresión bivariante.)
125
LOUIS GUTTMAN
126
MALOS USOS EN ESTADÍSTICA
127
NOTAS