Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Malos Usos de La Estadistica PDF
Malos Usos de La Estadistica PDF
Louis Guttman
Nota del traductor
La estadstica ofrece actualmente un repertorio esplndido de instrumentos de anlisis para el socilogo. Si los utiliza adecuadamente, el. socilogo
puede estudiar un nmero creciente de problemas de investigacin. Ahora
bien, la estadstica, para que pueda cumplir su papel adecuadamente, debe
utilizarse en conjuncin con la teora y con los mtodos de investigacin. La
tecnificacin exagerada de la investigacin sociolgica que se observa en
la actualidad ha conducido, sin embargo, a una mitificacin de la estadstica, que la ha sacado de su contexto, produciendo situaciones que necesitan con urgencia ser transformadas.
El artculo de Guttman que presentamos al lector en lengua castellana
es, en nuestra opinin, el ms desmitificador que conocemos sobre el uso
y abuso de la estadstica en las ciencias sociales. Escrito por Guttman en el
cnit de su carrera investigadora, no contiene una sola cita. Recoge, ni ms
ni menos, algunos de los problemas que la estadstica matemtica no ha
podido an resolver en el campo de las ciencias sociales, y algunos de los
abusos ms corrientes que se deslizan en la prctica sociolgica de la investigacin que utiliza la estadstica inferencial, y que Guttman ha ido recogiendo a lo largo de su dilatada tarea como investigador.
6/79 pp
101-127
LOUIS GUTTMAN
102
103
LOUIS GUTTMAN
INTRODUCCIN
Hace unos cuarenta aos, Harold Hotelling seal que los libros de texto
de estadstica de aquel perodo estaban escritos, en su mayora, por no matemticos. Aquellos libros estaban repletos de conceptos errneos, e ignoraban
en su mayora los nuevos e impresionantes desarrollos de la disciplina matemtica de la estadstica inferencial. La situacin mejor paulatinamente a medida
que ms estadsticos matemticos comenzaron a publicar libros de texto, de
tal modo que hoy en da el pndulo parece haber ido demasiado lejos. En
algunos lugares, los smbolos ms que la sustancia parecen ser los dueos.
Esto es especialmente verdad en las ciencias sociales con las que estoy ms
familiarizado y a las cuales va dirigido (aunque no exclusivamente) este
trabajo. Por ejemplo, consejeros y editores de algunas revistas insisten en decorar las tablas de diversos tipos de datos con estrellas y dobles estrellas, y
en presentar listados de errores estndar, a pesar de que las probabilidades
implcitas de significacin o confianza son claramente errneas desde el punto
de vista de la estadstica inferencial (ver los problemas 3 y 1, ms adelante).
Junto al mal uso de los nuevos desarrollos, persisten todava muchos de
los antiguos falsos conceptos en los libros de texto y revistas actuales debido
a la extremadamente pobre terminologa que ha sido conservada, por razones
histricas, por los estadsticos matemticos. Los matemticos estn habituados
a tratar correctamente simbolizaciones arbitrarias e incluso confusas, dado que
estn preparados para centrarse directamente en los conceptos que sealan, los
cuales, por otra parte, estn bien definidos. No ocurre as con los no matemticos, quienes ms bien estn inclinados a reaccionar ante las etiquetas verbales como si tuvieran unas implicaciones y un significado diferentes y ms
all de los conceptos tcnicamente designados. Por ejemplo, el trmino regresin emergi originalmente en el contexto de las investigaciones genticas de
Francis Gal ton, anteriores a la difusin de la teora de los genes, y ha sido
conservado desde entonces por los matemticos para algo que no tiene que ver
nada con los procesos genticos, ni con ningn tipo de proceso. Es cierto que
es deseable tener una palabra nica para una serie de medias aritmticas
condicionales, pero al retener la palabra regresin para tal serie se da a
los no matemticos una idea de procesos dinmicos y leyes de la naturaleza en
contextos para los que tales ideas son totalmente errneas. (Irnicamente, incluso hoy en da algunos genetistas confunden el concepto estadstico de regresin con una teora gentica de herencia biolgica, y en consecuencia alcanzan
conclusiones falsas.)
Uno de los objetivos del presente trabajo es poner de manifiesto algunos
de los problemas bsicos an no resueltos en la estadstica inferencial. La
discusin de estos problemas sirve como introduccin para un segundo objetivo, presentar una lista de hechos sobre la terminologa estadstica y las ideas
equivocadas <jue merecen ser sometidas a la atencin, tanto de los matemticos
104
105
LOUIS GUTTMAN
106
107
LOUIS GUTTMAN
Pruebe algo tal como .05 .01 o incluso .001. En tiempos anteriores
podra haber sugerido: Tome algo como ms o menos dos o tres errores
estndar. El estadstico matemtico podra olvidarse de recordar al investigador que tomara uno y slo uno de tales nmeros y con anterioridad
para el problema. En cualquier situacin, dadas varias opciones, el investigador las acepta todas y las utiliza simultneamente, y habitualmente despus
del hecho. Esta prctica por s misma puede hacer completamente insoluole
el problema 2 anterior. La situacin se torna ms confusa cuando los niveles
del mnibus se aplican todos ellos simultneamente tal cual & una serie de
hiptesis simultneas. Qu solucin puede existir para los procedimientos
utilizados en la prctica? Cmo pueden convencerse los autores y editores
de revistas cientficas de que cuando rellenan sus tablas de datos con una
galaxia de estrellas, dobles estrellas, e incluso triples estrellas, no estn probando hiptesis, sino rechazando la propia estadstica inferencial?
Problema 4. Eleccin de las Hiptesis Nula o Alternativa.La teora
de Neyman-Pearson para la prueba de hiptesis requiere una formulacin
previa de y distincin entre las hiptesis nula y alternativa. No es competencia de la teora decir cmo realizar esta distincin preliminar, dejando de
nuevo al investigador en la duda. La retencin, por razones histricas, del
infortunado adjetivo nula es a estos efectos contraproducente. Una terminologa ms aclaratoria podra ser: hiptesis obligatoria (incumbent)
versus hiptesis desafiante o cuestionante (challenging). Una hiptesis nula es la obligatoria, que no se modificar al menos que exista una
evidencia abrumadora en contra (de ah que la probabilidad pueda ser 99 contra 1 para el error del tipo I, en favor de la hiptesis obligatoria). En muchas
reas de las ciencias sociales, las hiptesis simplistas tal como no diferencia
o no correlacin son habitualmente desafiantes en campos bien documentados de investigacin. Tomemos el caso de los tests de inteligencia: nadie
hasta ahora ha sido capaz de realizar un diseo a priori con dos tests mentales diferentes y seguros que correlacionan cero entre s: sta es una tarea
desafiante (casi todas las correlaciones entre tests mentales observados durante los ltimos sesenta aos son positivas). O de nuevo, la hiptesis de
Charles Spearman del nico factor comn, fue una innovacin desafiante
(ltimamente rechazada por l mismo) para un fenmeno tan complejo como
es la inteligencia. El tener un pequeo nmero de factores comunes contina
siendo una hiptesis desafiante en contra de la usual hiptesis obligatoria de
un nmero ms amplio de factores comunes. Tales casos pueden contrastarse
con campos ms problemticos e interesantes, tales como la parapsicologa y
la grafologa, por ejemplo, para los cuales la nulidad persiste como una apropiada hiptesis nula. Una ilustracin de este punto en otra rea es la ley de
Newton sobre el movimiento de un cuerpo en lnea recta con velocidad constante: desde luego que sta s fue una hiptesis desafiante! Cul fue la hip-
108
109
LOU1S
GUTTMAN
110
primeras aproximaciones, parece que es en buena medida un territorio inexplorado por parte de los estadsticos matemticos. W. Edwards Deming y otros
han hecho trabajo de caballera al sealar docenas de fuentes de error no
muestral, que deberan sensibilizar en particular a los investigadores en el
problema de la aproximacin. A pesar de ello, la confusin aparece ampliamente extendida entre los investigadores en lo que se refiere a errores de
muestreo, versus errores de aproximacin.
UNA LISTA DE LO QUE NO ES QUE
La siguiente lista de hechos (negativos) ampla y se aade a las seis clases
precedentes de temas no resueltos. Como ha mostrado la discusin anterior,
los problemas inferenciales pueden ser oscurecidos por rasgos no inferenciales.
As, una de las fuentes de falsas interpretaciones para el profesional es la dificultad de especificar dnde comienza formalmente la inferencia (el anlisis
de varianza es un buen ejemplo de ello). He tratado de resistir a la tentacin
de tratar de clasificar las variedades de falsas interpretaciones y confusiones
en la lista. Unas tropiezan con otras de manera sutil y no sutil. Puede que
sea consustancial a tales falsas interpretaciones el que todo intento de su clasificacin sea confuso, y pueda conducir a mayores equivocaciones. Por ello
he formulado cada tem sucintamente como un hecho por s mismo, y slo
intento ligeramente hacer alguna referencia cruzada, tanto dentro de la lista
como con las seis reas de problemas precedentes.
1. Las medias no miden tendencias centrales.
(En el concepto de media no est implcito un proceso dinmico, como
sugiere errneamente la palabra no matemtica tendencia. Considrese la
distribucin en forma de U. Una media puede definirse como un valor que
minimiza una funcin residual, y cualquier valor en el rea de alcance de
una variable es una media segn alguna funcin residual. Ver tambin el punto 3 ms adelante.)
2. La dispersin o desviacin de una distribucin no se define necesariamente como si estuviese alrededor de una media.
(Considrese el valor esperado de |xp x q |, en donde xp y xq son valores
de los miembros p y q de una poblacin en una variable numrica x. Analistas
de varianza tomen nota. Al contrario, el valor esperado de (x p xq)2 ocurre
que es proporcional a la varianza alrededor de la media aritmtica. Ver tambin los tems 4 y 20, ms adelante.)
3.
(De igual modo que no existe un proceso dinmico para la media [ver
el tem 1, anterior]. El verbo regresar no tiene definicin matemtica, aun-
111
LOUIS GUTTMAN
(El tomar la linearidad como punto de partida equivale atribuir a un fenmeno tan poco comn el papel generalmente incorrecto de una hiptesis nula
obligatoria. En las ciencias sociales, al menos, la linearidad debiera ser contemplada como una salida de la no linearidad, y no viceversa. Ver el proble-
112
ma 4, anterior: tambin los puntos 4 y 20. Esto provoca una cuestin interesante sobre cmo desarrollar una prueba realista de significacin, o si la
inferencia estadstica debiera siquiera mezclarse con problemas de aproximacin. Ver el problema 6, anterior.)
7. Una diferencia que se afirma que es significativa al nivel 0.1 no es
significativa al nivel .01.
(Esto es un hecho para cualquier nivel el nivel .01 se ha tomado como
ejemplo y para cualquier valor estadstico, no slo para una diferencia.
Tal afirmacin implica que el nivel se determin despus de calcular el
valor estadstico. Al ensayar una hiptesis, el nivel [y slo un nivel] debe
fijarse con anterioridad a la investigacin; la hiptesis nula se rechaza o no
subsecuentemente, de acuerdo con el valor estadstico observado y la regin
de rechazo. Proclamar un nivel de significacin despus de calcular un
valor estadstico implica un valor incorrecto para la probabilidad del error
tipo I, y de hecho hace que la probabilidad quede indeterminada. Ver el
problema 3, anterior. Si un investigador desea destacar su pertenencia a la
minora de los que realmente ensayan hiptesis, debiera decir algo parecido a
lo que sigue: El nivel .01 de significa ti vidad se eligi previamente a la
investigacin, y el estadstico obtenido es significativo a dicho nivel. Adems,
no debera poner ninguna estrella.)
8. Un ensayo de significacin estadstica no es un ensayo de importancia cientfica.
(Este es un hecho que se necesita ensear a cada generacin de estudiantes. Puede que haya pasado desapercibido a una parte de la generacin anterior que se ha convertido en editora y miembros del consejo de redaccin de
las revistas cientficas en campos tales como psicologa experimental y sociosicologa experimental dedicadas de jacto a asuntos tales como diferencias
pequeas pero significativas y efectos significativos. Hasta ahora nadie ha
publicado una ley cientfica en las ciencias sociales que haya sido desarrollada,
modelada o efectivamente sustentada en base a ensayos de significacin.
Las leyes bsicas de la fsica, desde luego, no se desarrollaron de esta forma.
La estimacin y la aproximacin pueden ser ms provechosas que la significacin en el desarrollo cientfico, sin olvidar la replicacin. Tngase en cuenta
la ley radex para la inteligencia y la ley cilindrex para las actitudes, o las
leyes de regresin poli tnica para los componentes principales de las actitudes.)
9. Un intervalo de confianza para la media de una poblacin no vale
para predecir la media de una nueva muestra.
(Y lo que es peor, una ecuacin de regresin lineal mltiple calculada
a partir de una muestra aleatoria no condicional puede con frecuencia hacer
ms dao en la prediccin de una nueva muestra aleatoria no condicional
113
LOUIS GUTTMAN
que la que pueda hacer una simple ponderacin. Ver el problema 2 anterior
sobre replicacin.)
10. La distribucin normal no es un fenmeno emprico normal.
(Raras veces, si alguna, se observa en la naturaleza. En buena medida
se genera por los estadsticos cuando desarrollan las matemticas de la teora
de las muestras. Este hecho se ha enseado correctamente durante mucho
tiempo, pero necesita que se repita constantemente a los estudiantes despus
de haber pasado por cursos de inferencia estadstica.)
11.
(De igual manera que la probabilidad condicional no parcializa nada. Todas las correlaciones bivariantes son correlaciones parciales: cada una de
ellas es condicional a la poblacin de la que se calcula. Proponer nuevas
condiciones implica la estratificacin en subpoblaciones, y las correlaciones
condicionales resultantes pueden variar ampliamente entre tales subpoblaciones. Una mejor y menos confusa terminologa sera decir siempre correlacin condicional en vez de correlacin parcial, de igual modo que los
matemticos dicen probabilidad condicional y no probabilidad parcial.)
12. Las variables independientes de una regresin son habitualmente
no independientes estadsticamente de la variable que va a predecirse a travs de la regresin.
(Si lo fueran, la regresin sera intil para la prediccin. Estas variables
independientes son generalmente mutuamente dependientes. Una terminologa ms adecuada consistira en llamarlas variables condicionales de la
regresin, o los predictores. Hotelling sugiri llamar a la variable incondicional, es decir, la que se va a predecir, la predictante (predictant) de la
regresin: los psiclogos a menudo la llaman el criterio.)
13. Las contribuciones independientes a una regresin mltiple son
habitualmente dependientes.
(Incluso en el caso de que los predictores sean independientes estadsticamente entre s, no existen garantas de que se pueda encontrar un predictor
ulterior que introduzca dependencia estadstica. Cuando hay dependencia estadstica existen muchas formas de resolverla en componentes independientes estadsticamente; la eleccin entre estas diversas formas no es un problema estadstico. Ver la discusin del milagro de la ortogonalidad en el
problema 5 anterior: ver tambin el punto 21 ms adelante sobre regresin
stepwise.)
14. Cuando se calcula a partir de un solo ensayo en una muestra una
estimacin de un coeficiente de fiabilidad para la poblacin, es generalmente
inconsistente (usualmente una subestimacin).
114
(Se necesitan al menos dos ensayos sobre la misma muestra para conseguir una estimacin consistente y por supuesto no sesgada de un coeficiente de fiabilidad de poblacin, incluso para la Habilidad de una suma
o mitades partidas. Los intentos comunes de salir del paso con un solo ensayo introducen supuestos que son falsos y que no anulan los sesgos respectivos. Los sesgos de los supuestos habituales son acumulativos, y a menudo
conducen a serias subestimaciones. Los autores algunas veces se percatan
de esto cuando corrigen para atenuar, y obtienen un coeficiente de correlacin mayor que la unidad; el sesgo es bastante universal y puede ser drstico incluso si una correccin en un caso particular no conduce a un absurdo inmediato. Muchos libros de texto en psicologa educativa y en reas
similares tratan errneamente las frmulas convencionales del coeficiente de
fiabilidad como si fueran consistentes, mientras que estas frmulas no son
usualmente otra cosa que estimaciones de lmites bajos del coeficiente de fiabilidad en cuestin.)
15. En un ensayo de items de eleccin mltiple, las diversas respuestas falsas no tienen generalmente la misma probabilidad de ser elegidas.
(Si las respuestas falsas son igualmente probables para cada miembro de
una poblacin amplia, y si existe independencia experimental entre los miembros, entonces la proporcin observada de poblacin que elija una respuesta
falsa particular ser igual a la proporcin observada que elija cada una de
las otras respuestas falsas. Habiendo revisado a lo largo de los aos cientos
de items de eleccin mltiple, an no he observado empricamente tales proporciones iguales, y no conozco a nadie que haya manifestado haber observado tal fenmeno emprico. En la prctica, los distraedores distraen diferencialmente. La tan extendida hiptesis de que existen intuiciones en los ensayos prcticos que conducen a probabilidades iguales es un ejemplo de supuestos matemticos falsos e innecesarios anclados en algunos lugares de
las ciencias sociales. Los supuestos matemticos no son un sustituto para
el estudio real de la conducta humana.)
16. El estadstico chi-cuadrado para los ensayos de independencia estadstica entre dos variables no es una medida de dependencia.
(Por ejemplo, este valor estadstico no indica cundo existe perfecta
dependencia monotnica. Existe un solo tipo de independencia estadstica,
pero muchas variedades de dependencia perfecta, y cada una de sas requiere su propia funcin residual [loss junction]. Es por esto tambin que la
prueba del chi-cuadrado, tal como se usa habitualmente, es bastante dbil:
no tiene una hiptesis alternativa particular. Generalmente se puede hacer
una prueba mejor cuando se especifica el tipo de dependencia.)
17. El concepto de variable aleatoria no se define en trminos de
muestreo aleatorio.
U5
LOUIS GUTTMAN
(El recproco es cierto. Una variable aleatoria es realmente una funcin, esto es, una funcin que tiene como dominio una poblacin con una
medida de probabilidad. El que la teora estadstica se ocupe desde el principio del concepto de funcin puede ser una de las fuentes de dificultad
en la enseanza de estadstica elemental: al menos se deben considerar simultneamente, y desde el principio, dos azares.)
18. Nada ocurre por azar.
(Azar no es un trmino estadstico. Algunos autores usan azar para
referirse a sucesos con igual probabilidad, otros pueden estar pensando en
la independencia estadstica entre variables, mientras que algunos lo utilizan
para indicar simplemente que no se conoce todava una ley definitiva. Se
puede evitar mejor la palabra en discusiones tcnicas. Igualmente, nada
ocurre al azar aunque el muestreo aleatorio sea posible a saber, al generar una distribucin multivariantes de variables estadsticamente independientes e idnticamente distribuidas.)
19.
116
residuo
en donde /J, Vjk, y Wik pueden a su vez ser descompuestos de formas diversas. La regresin de la poblacin, naturalmente, es la serie de valores esperados condicionales de tijk, y esta serie no necesita estimarse consistentemente con el uso de una tautologa restringida. A pesar de ello, los autores hafoitualmente tratan de ensayar hiptesis en las que se mantiene una forma ms
simplificada que cualquiera de las anteriores usualmente varias hiptesis
simultneamente. Suelen calcular una serie de valores estadsticos [ratios
de varianza] Fi, F2, ..., F m siendo cada Fi una especie de ayuda para el
ensayo de la hiptesis nula HOi en algn aspectos de la regresin y realizan afirmaciones referentes a niveles de significacin ai, en donde probablemente
ai = Prob{F ^ Ai I Hoi }(i = 1, 2, ..., m)
el coeficiente K se refiere al lmite entre los intervalos de rechazo y aceptacin de la hiptesis HOi. Tales afirmaciones son tpicamente errneas, tal
117
LOUIS GUTTMAN
118
119
LOUIS GUTTMAN
(Intenta simplemente ensayar la hiptesis desafiante! de que todas las correlaciones inter-tem son cero, y habitualmente a travs de una
tcnica de correlacin de puntuacin total de los items correcta. Igualmente
implica el buen deseo [wishful thinking] de que las correlaciones debieran determinar el contenido.)
30. La escalabilidad no debe ser deseada o construida.
(Decir que uno quiere construir una escala de actitudes hacia alguna
cosa, o de logro en algn rea es casi anlogo a decir que no quiere que
el mundo sea plano. Los items son las cosas a construir no la escalabilidad;
la escalabilidad es una hiptesis emprica para un universo de items en una
poblacin dada [normalmente una hiptesis alternativa a la hiptesis nula
de multidimensionalidad; ver el punto 3 3 ] . El rechazo de items que no
se ajustan a la unidimensionalidad es como rechazar la evidencia de que
el mundo es redondo.)
31. Si todas las correlaciones entre los items son positivas, ello no presupone la presencia de un solo factor comn (incluso cuando los coeficientes
son muy elevados).
(Al contrario, la observacin de que todas las correlaciones eran positivas
condujo a Charles Spearman a desarrollar y a desaprobar la hiptesis
de un solo factor comn para la inteligencia. De esta forma se desarroll el
anlisis del factor comn mltiple. Incluso cuando todas las intercorrelaciones
son muy altas del orden de 0.95 no se puede inferir nada sobre dimensionalidad a partir de esta sola informacin. Se puede hipotetizar que todas
las correlaciones sean positivas cuando las variables tienen un rango comn
considrese, por ejemplo, las primeras leyes de inteligencia y actitudes.
Un rango comn no debe confundirse con un factor comn.)
32. Que el nmero de factores comunes sea pequeo no es generalmente una hiptesis nula.
(Esto contina siendo una hiptesis desafiante en el campo de la inteligencia y de otras reas de la conducta social. Vase tambin el epgrafe
siguiente.)
120
121
LOUIS GUTTMAN
mostrado nadie que las matemticas subyacentes en las rutinas actuales del
ordenador sean consistentes con las matemticas de la teora de la puntuacin del factor [factor score theory]. Las matemticas del anlisis factorial
demuestran que aunque se fijan los coeficientes de saturacin de una manera
consistente, se continuar dejando abierta la cuestin de las puntuaciones de
factor que deben acompaar a los coeficientes de saturacin: existen generalmente soluciones de puntuaciones alternativas muy diferentes que son consistentes precisamente con los mismos coeficientes de saturacin. Muchos libros de texto no mencionan estos problemas de indeterminacin e inconsistencia de las puntuaciones de factor, que se encuentran en la base de la
teora analtica factorial, y los programas de ordenador existentes ignoran estos problemas.)
37.
122
123
LOUIS GUTTMAN
entorno. Unidades de tiempo y/o secuencias de generaciones estn generalmente ausentes de los anlisis de camino de datos sociolgicos y no genticos, a pesar del hecho de que el problema bsico en el estudio del movimiento en el tiempo sobre los caminos presuponindose que existen caminos conocidos para ser estudiados. La gentica slo tiene un modesto
marco para los caminos. Sin embargo, y de acuerdo con algunas revistas actuales, los socilogos continan descubriendo nuevos marcos de caminos fundamentales cada mes; y a los estudiantes graduados de sociologa se les obliga rutinariamente, como ejercicios de clase individuales, a que se manejen en
descubrimientos que igualen a los de Gregor Mendel. Ver tambin los puntos 27 y 39, sobre explicacin de la varianza y sobre anlisis causal.)
41.
124
de ratios son nombres para hiptesis acerca de algn aspecto de ciertas curvas de regresin experimentales. Algunos no-psicofsicos han tomado prestada esta terminologa desafortunada para contextos menos apropiados y
por supuesto indefinidos, y puede que desconozcan el problema de la regresin psicofsica experimental original. Existe un folklore ampliamente difundido acerca de reglas estadsticas mticas, que prohiben o permiten clculos
que incluyen escalas, siendo tales reglas independientes del contexto. Ver
el punto siguiente. Quiz los psicofsicos podran sugerir una palabra mejor
que escala para sus hiptesis de regresin bivariante.)
45.
(Lo que se requiere es una funcin residual [loss function] para ser minimizada. Los autores suelen demandar reglas a priori sobre lo que est
permitido hacer con sus observaciones numricas, ordenadas o desordenadas, sin referencia a una funcin residual comprensiva para su problema. En
vez de ello, deberan decir al matemtico: aqu est mi funcin residual:
cmo hago para minimizarla? La minimizacin puede requerir el tratamiento
de datos desordenados de una forma numrica y los datos numricos de una
forma desordenada. Si el matemtico concede o retiene el permiso sin
referencia a una funcin residual, puede ser accesoria la ayuda al investigador
para escapar de la realidad de definir el problema de la investigacin.)
46. El anlisis de escalas multidimensionales no mtricas, no escala dimensiones.
(Todo lo ms, escala distancias. Transforma monotnicamente informacin
inter-puntos del tipo mtricamente-ordenada, en el lenguaje de Clyde Coombs,
en una funcin de distancia [Euclidea o no Euclidea] que relaciona puntos.
Warren Torgerson emple originalmente el trmino escalabilidad multidimenr
sional en un anlisis totalmente mtrico de distancias observadas entre puntos, con la intencin de escalar realmente dimensiones, esto es, de hallar
una serie de coordenadas, que fueran cada una de ellas significativas al anlisis factorial mtrico, y con la menor dimensionalidad, para reproducir los
coeficientes de distancia observados. Los intentos no mtricos de tratar las
desemejanzas se centran solamente en el aspecto de hallar un espacio de dimensionalidad mnima, y en este sentido estn libres de coordenadas. En efecto, el crecimiento acumulativo de hallazgos de estructuras que responden a
leyes en los tests de datos actitudinales y mentales entre otros ha sido
posible por el uso de conceptos regionales para el espacio mnimo, y no por
la bsqueda de dimensiones significativas. La escala se usa tcnicamente
tan slo para una variable unidimensional [la distancia es siempre unidimensional, incluso dentro de un espacio multidimensional], por lo que la escalabilidad multidimensional puede ser una terminologa contradictoria en contextos no mtricos y en otros libres de coordenadas. Puede resultar apropiado
125
LOUIS GUTTMAN
para el anlisis factorial de multifacetas [multi-modal], y para otras perspectivas que insisten en el hallazgo de dimensiones significativas. El trmino
es innecesariamente errneo en contextos en los que slo se intenta un anlisis
del espacio mnimo, confundiendo a los investigadores y editores de revistas de nuevo acerca del punto 34, anterior.)
47.
(Considrese el ejemplo del diseo factorial de tres facetas del punto 23.
Si ninguno de los trminos en la tautologa tradicional tiene una varianza
cero, y si se mantiene la ortogonalidad, entonces la regresin tiene seis dimensiones ortogonales para las tres facetas. La hiptesis de que todas las interacciones desaparecen, equivale a la hiptesis de que la dimensionalidad de la
regresin no ser mayor que el nmero de facetas. Igualmente, en el anlisis
del espacio mnimo de una matriz de correlaciones, la dimensionalidad mnima obtenida no tiene necesariamente una conexin con el nmero de facetas de contenido en la frase tericamente diseada [mapping sentence] para
las observaciones: la dimensionalidad puede ser ms grande, igual, o ms pequea que el nmero de facetas. En efecto, uno de los problemas principales
en la construccin de teora sustantiva es el de racionalizar hiptesis viables
acerca de las relaciones de las facetas de contenido con la dimensionalidad, y
otros aspectos de los datos. Ver los puntos 20 y 50.)
48.
126
127
NOTAS