Está en la página 1de 15

El número mágico siete, más o menos dos

Algunos límites en nuestra capacidad para procesar información


George A. Miller Universidad Harvard

Este documento se leyó por primera vez como una dirección invitada ante la Asociación
de Psicología del Este en Filadelfia, el 15 de abril de 1955. La preparación del
documento fue apoyada por el Psico-acústico de Harvard.

Recibido el 4 de mayo de 1955. Mi problema es que he sido perseguido por un entero.


Durante siete años este número me ha seguido.

Comenzaré mi historia de caso contándoles algunos experimentos que probaron la


precisión con la que las personas Puede asignar números a las magnitudes de varios
aspectos de un estímulo Ahora los llamamos experimentos sobre la capacidad de las
personas para transmitir informacion. Medición de la información La "cantidad de
información" es exactamente el mismo concepto del que hemos hablado durante años
bajo el nombre de "varianza". Las ecuaciones son diferentes, pero si nos aferramos a la
idea de que cualquier cosa que aumenta la varianza también aumenta la cantidad de
información que no podemos ir muy lejos. Las ventajas de esta nueva forma de hablar
sobre la varianza son bastante simples. La varianza siempre es declarada en términos de
la unidad de medida (pulgadas, libras, voltios, etc.), mientras que la cantidad de
información es una Cantidad sin dimensiones. Dado que la información en una
distribución estadística discreta no depende de unidad de medida, podemos extender el
concepto a situaciones en las que no tenemos métricas y lo haríamos No se suele pensar
en utilizar la varianza. Y también nos permite comparar los resultados obtenidos en
bastante Diferentes situaciones experimentales en las que no tendría sentido comparar
variaciones basadas en diferentes métrica. Así que hay algunas buenas razones para
adoptar el concepto más nuevo.
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (1 de 17) [10/10/2001
10:23:08 AM]
Página 2

La similitud de la varianza y la cantidad de información puede explicarse de esta


manera: Cuando tenemos una gran variación, somos muy ignorantes acerca de lo que va
a pasar. Si somos muy ignorantes, entonces cuando Hacemos la observación que nos da
mucha información. Por otro lado, si la varianza es muy pequeña, Sabemos de
antemano cómo debe salir nuestra observación, por lo que obtenemos poca información
al hacer la observación. Si ahora imagina un sistema de comunicación, se dará cuenta de
que hay una gran variabilidad. sobre lo que entra en el sistema y también una gran
variabilidad sobre lo que sale. La entrada y por lo tanto, la salida se puede describir en
términos de su varianza (o su información). Si es un buen sistema de comunicación, sin
embargo, debe haber alguna relación sistemática entre lo que entra y lo que sale. Es
decir, la salida dependerá de la entrada, o se correlacionará con la entrada. Si Medimos
esta correlación, luego podemos decir qué parte de la variación de salida es atribuible a
la entrada. y cuánto se debe a las fluctuaciones aleatorias o al "ruido" introducido por el
sistema durante la transmisión. Asi que vemos que la medida de la información
transmitida es simplemente una medida de la correlación de entrada-salida. Hay dos
reglas simples a seguir. Cada vez que me refiero a "cantidad de información",
entenderás "diferencia." Y cada vez que haga referencia a "cantidad de información
transmitida", comprenderá "covarianza" o "correlación". La situación se puede describir
gráficamente mediante dos círculos parcialmente superpuestos. Entonces el círculo de la
izquierda puede debe tomarse para representar la varianza de la entrada, el círculo
derecho, la varianza de la salida y la superposición La covarianza de entrada y salida.
Hablaré del círculo izquierdo como la cantidad de información de entrada, la círculo
derecho como la cantidad de información de salida, y la superposición como la cantidad
de información transmitida información. En los experimentos de juicio absoluto, el
observador se considera un canal de comunicación. Entonces el círculo izquierdo
representaría la cantidad de información en los estímulos, el círculo derecho la cantidad
de información en sus respuestas, y la superposición de la correlación de estímulo-
respuesta, medida por el Cantidad de información transmitida. El problema
experimental es aumentar la cantidad de entrada. información y para medir la cantidad
de información transmitida. Si los juicios absolutos del observador son bastante
precisos, entonces casi toda la información de entrada se transmitirá y será recuperable
de sus respuestas. Si comete errores, entonces la información transmitida puede ser
considerablemente menor que la entrada. Esperamos que, a medida que aumentemos la
cantidad de información de entrada, el observador comience a comete cada vez más
errores: podemos probar los límites de precisión de sus juicios absolutos. Si el humano
El observador es un tipo razonable de sistema de comunicación, luego cuando
aumentamos la cantidad de entrada información de la información transmitida
aumentará al principio y eventualmente se estabilizará en algún Valor asintótico. Este
valor asintótico que tomamos es la capacidad del canal del observador: representa la
mayor cantidad de información que él puede darnos sobre el estímulo sobre la base de
un absoluto juicio. La capacidad del canal es el límite superior en la medida en que el
observador puede coincidir con su Respuestas a los estímulos que le damos. Ahora solo
una breve palabra sobre el bit y podemos comenzar a ver algunos datos. Un bit de
información es el Cantidad de información que necesitamos para tomar una decisión
entre dos alternativas igualmente probables. Si nosotros debe decidir si un hombre mide
menos de seis pies de altura o más de seis pies de altura y si sabemos que la las
posibilidades son 50—50, entonces necesitamos un poco de información. Tenga en
cuenta que esta unidad de información no Consulte de cualquier manera la unidad de
longitud que utilizamos: pies, pulgadas, centímetros, etc. Sin embargo, mida la La altura
del hombre, todavía necesitamos un poco de información.
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (2 de 17) [10/10/2001
10:23:08 AM]
Página 3
Dos bits de información nos permiten decidir entre cuatro alternativas igualmente
probables. Tres bits de La información nos permite decidir entre ocho alternativas
igualmente probables. Cuatro bits de información deciden entre 16 alternativas, cinco
entre 32, y así sucesivamente. Es decir, si hay 32 alternativas igualmente probables,
debemos tomar cinco decisiones binarias sucesivas, que valen un bit cada una, antes de
saber qué alternativa es correcto. Entonces, la regla general es simple: cada vez que la
cantidad de alternativas aumenta por un factor de Dos, se agrega un bit de información.
Hay dos formas en que podemos aumentar la cantidad de información de entrada.
Podríamos aumentar la tasa en que le damos información al observador, para que la
cantidad de información por unidad de tiempo incrementar. O podríamos ignorar
completamente la variable de tiempo e incrementar la cantidad de información de
entrada Aumentando el número de estímulos alternativos. En el experimento de juicio
absoluto nos interesa La segunda alternativa. Le damos al observador todo el tiempo
que desee para hacer su respuesta; nosotros simplemente aumentar el número de
estímulos alternativos entre los que debe discriminar y mirar para ver dónde Las
confusiones comienzan a ocurrir. Las confusiones aparecerán cerca del punto que
estamos llamando su "canal capacidad." Juicios Absolutos de Estímulos
Unidimensionales Ahora consideremos lo que sucede cuando hacemos juicios absolutos
de tonos. Pollack (17) preguntó Los oyentes identifican tonos asignándoles números.
Los tonos eran diferentes con respecto a Frecuencia, y cubrió el rango de 100 a 8000
cps en pasos logarítmicos iguales. Un tono sonó y el oyente respondió dando un
número. Después de que el oyente hizo su respuesta, le dijeron que correcta
identificación del tono. Cuando solo se usaban dos o tres tonos, los oyentes nunca los
confundían. Con cuatro tonos diferentes. las confusiones eran bastante raras, pero con
cinco o más tonos las confusiones eran frecuentes. Con catorce diferentes Tonos los
oyentes cometieron muchos errores. Estos datos se representan en la Fig. 1. En la parte
inferior se encuentra la cantidad de información de entrada en bits por estímulo. A
medida que el número de tonos alternativos aumentó de 2 a 14, la información de
entrada aumentó de 1 a 14. 3.8 bits. En la ordenada se grafica la cantidad de
información transmitida. La cantidad de transmitida la información se comporta de
forma muy parecida a como esperaríamos que se comportara un canal de comunicación;
el la información transmitida aumenta linealmente hasta aproximadamente 2 bits y
luego se desvía hacia una asíntota en alrededor de 2,5 bits. Este valor, 2.5 bits, por lo
tanto, es lo que llamamos la capacidad del canal del oyente Para juicios absolutos de
tono. Así que ahora tenemos el número de 2.5 bits. Qué significa eso? En primer lugar,
tenga en cuenta que 2,5 bits corresponde a unos seis Alternativas igualmente probables.
El resultado significa que no podemos elegir más de seis lanzamientos diferentes que el
El oyente nunca confundirá. O, dicho de forma ligeramente diferente, no importa
cuántos tonos alternativos solicitemos. Para juzgar, lo mejor que podemos esperar es
asignarlos a unas seis clases diferentes sin error. O, nuevamente, si sabemos que hubo N
estímulos alternativos, entonces su juicio nos permite reducir bajar el estímulo
particular a uno de N / 6. La mayoría de las personas se sorprenden de que el número
sea tan pequeño como seis. Por supuesto, hay evidencia de que musicalmente Una
persona sofisticada con un tono absoluto puede identificar con precisión cualquiera de
50 o 60 tonos diferentes. Afortunadamente, no tengo tiempo para discutir estas notables
excepciones. Yo digo que es afortunado porque lo hago No sé cómo explicar su
rendimiento superior. Así que me atendré al hecho más pedestre que la mayoría
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (3 de 17) [10/10/2001
10:23:08 AM]
Página 4

de nosotros podemos identificar uno de cada cinco o seis lanzamientos antes de que
empecemos a confundirnos. Es interesante considerar que los psicólogos han estado
utilizando escalas de calificación de siete puntos durante mucho tiempo, sobre la base
intuitiva de que tratar de clasificar en categorías más finas realmente no agrega mucho a
la utilidad de las calificaciones Los resultados de Pollack indican que, al menos para los
tonos, esta intuición es bastante sólida. A continuación puedes preguntar cuán
reproducible es este resultado. ¿Depende del espaciado de los tonos o de la ¿Varias
condiciones de juicio? Pollack varió estas condiciones de varias maneras. El rango de
Las frecuencias se pueden cambiar por un factor de aproximadamente 20 sin cambiar la
cantidad de información Transmutado más de un pequeño porcentaje. Diferentes
agrupamientos de los tonos disminuyeron la transmisión, Pero la pérdida fue pequeña.
Por ejemplo, si puede discriminar cinco tonos agudos en una serie y cinco tonos de tono
bajo en otra serie, es razonable esperar que pueda combinar los diez en un solo Series y
aun así las separamos todas sin error. Cuando lo intentas, sin embargo, no funciona. El
canal La capacidad de lanzamiento parece ser de aproximadamente seis y eso es lo
mejor que puedes hacer. Mientras estamos en tonos, veamos a continuación el trabajo
de Garner (7) sobre la sonoridad. Los datos de Garner para sonoridad son resumido en
Fig. 2. Garner se tomó algunas molestias para obtener el mejor espaciado posible de sus
tonos sobre el Rango de intensidad de 15 a 110 db. Usó 4, 5, 6, 7, 10 y 20 intensidades
de estímulo diferentes. Los resultados que se muestra en la Fig. 2 toma en cuenta las
diferencias entre los sujetos y la influencia secuencial de la Inmediatamente anterior al
juicio. De nuevo nos encontramos con que parece haber un límite. La capacidad del
canal para Los juicios absolutos de sonoridad son 2,3 bits, o aproximadamente cinco
alternativas perfectamente discriminables. Dado que estos dos estudios se realizaron en
diferentes laboratorios con técnicas y métodos ligeramente diferentes de análisis, no
estamos en una buena posición para discutir si cinco sonoros son significativamente
diferentes de seis lanzamientos Probablemente la diferencia es en la dirección correcta,
y los juicios absolutos de tono son ligeramente Más precisos que los juicios absolutos
de sonoridad. El punto importante, sin embargo, es que los dos Las respuestas son del
mismo orden de magnitud. El experimento también se ha realizado para intensidades
gustativas. En la Fig. 3 se muestran los resultados obtenidos por Beebe-Center, Rogers
y O'Connell (1) para juicios absolutos de la concentración de soluciones salinas. Las
concentraciones oscilaron entre 0,3 y 34,7 g. NaCl por 100 cc. Agua del grifo en pasos
subjetivos iguales. Usaron 3, 5, 9 y 17 concentraciones diferentes. La capacidad del
canal es de 1.9 bits, que es de aproximadamente cuatro. Concentraciones distintas. Así,
las intensidades del gusto parecen un poco menos distintivas que los estímulos
auditivos, pero de nuevo El orden de magnitud no está lejos. Por otro lado, la capacidad
del canal para los juicios de posición visual parece ser significativamente mayor. Hake y
Garner (8) pidieron a los observadores que interpolaran visualmente entre dos
marcadores de escala. Sus resultados son mostrado en la figura 4 . Hicieron el
experimento de dos maneras. En una versión dejaron que el observador usara cualquier
número entre cero y 100 para describir la posición, aunque presentaron estímulos a solo
5, 10, 20, o 50 posiciones diferentes. Los resultados con esta técnica de respuesta
ilimitada son mostrados por el llenado círculos en la gráfica. En la otra versión, los
observadores fueron limitados en sus respuestas a la presentación de informes solo
Aquellos valores de estímulo que eran posibles. Es decir, en la segunda versión el
número de diferentes Las respuestas que el observador pudo hacer fueron exactamente
las mismas que la cantidad de estímulos diferentes que El experimentador podría
presentar. Los resultados con esta técnica de respuesta limitada son mostrados por el
abierto círculos en la gráfica. Las dos funciones son tan similares que parece justo
concluir que el número de Las respuestas disponibles para el observador no tienen nada
que ver con la capacidad del canal de 3.25 bits.
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (4 de 17) [10/10/2001
10:23:08 AM]
Página 5
El experimento Hake-Garner ha sido repetido por Coonan y Klemmer. Aunque aún no
han Publicaron sus resultados, me dieron permiso para decir que obtuvieron capacidades
de canal. desde 3.2 bits para exposiciones muy cortas de la posición del puntero hasta
3.9 bits para exposiciones más largas. Estos valores son ligeramente más altos que los
de Hake y Garner, por lo que debemos concluir que hay entre 10 y 15 posiciones
distintas a lo largo de un intervalo lineal. Esta es la mayor capacidad de canal que ha
sido Medido para cualquier variable unidimensional. En la actualidad, estos cuatro
experimentos sobre juicios absolutos de estímulos simples y unidimensionales son:
Todo lo que ha aparecido en las revistas psicológicas. Sin embargo, una gran cantidad
de trabajo en otros estímulos Las variables aún no han aparecido en las revistas. Por
ejemplo, Eriksen y Hake (6) han encontrado que el la capacidad del canal para juzgar el
tamaño de los cuadrados es de 2.2 bits, o aproximadamente cinco categorías, en un
amplio rango de condiciones experimentales. En un experimento separado, Eriksen (5)
encontró 2.8 bits para el tamaño, 3.1 bits para el tono, y 2,3 bits para el brillo. Geldard
ha medido la capacidad del canal para la piel colocando vibradores En la región del
pecho. Un buen observador puede identificar aproximadamente cuatro intensidades,
aproximadamente cinco duraciones y aproximadamente siete localidades. Uno de los
grupos más activos en esta área ha sido el Laboratorio de Aplicaciones Operacionales
de la Fuerza Aérea. Pollack ha tenido la amabilidad de proporcionarme los resultados de
sus mediciones para varios aspectos de pantallas visuales. Hicieron mediciones para el
área y para la curvatura, longitud y dirección de las líneas. En una serie de experimentos
utilizaron una exposición muy corta del estímulo (1/40 segundo) y luego Repetí las
mediciones con una exposición de 5 segundos. Por área obtuvieron 2.6 bits con la corta
exposición. y 2,7 bits con la larga exposición. Para la longitud de una línea obtuvieron
alrededor de 2.6 bits con el corto Exposición y alrededor de 3.0 bits con la exposición
larga. La dirección, o ángulo de inclinación, dio 2.8 bits para La exposición corta y 3.3
bits para la exposición larga. La curvatura era aparentemente más difícil de juzgar.
Cuando la longitud del arco fue constante, el resultado en la corta exposición fue de 2,2
bits, pero cuando el La longitud del acorde fue constante, el resultado fue de solo 1.6
bits. Este último valor es el más bajo que alguien tiene medido hasta la fecha. Debo
añadir, sin embargo, que estos valores pueden ser un poco demasiado bajos porque los
datos de todos los sujetos se agruparon antes de que se computara la información
transmitida. Ahora veamos donde estamos. Primero, la capacidad del canal parece ser
una noción válida para describir observadores humanos. En segundo lugar, las
capacidades del canal medidas para estas variables unidimensionales van desde 1.6 bits
para curvatura a 3.9 bits para posiciones en un intervalo. Aunque no hay duda de que la
Las diferencias entre las variables son reales y significativas, el hecho más
impresionante para mí es su considerable similitud. Si tomo las mejores estimaciones
puedo obtener las capacidades del canal para todos los estímulos. Las variables que he
mencionado, la media es de 2.6 bits y la desviación estándar es de solo 0.6 bits. En
términos de Alternativas distinguibles, esta media corresponde a aproximadamente 6.5
categorías, una desviación estándar incluye de 4 a 10 categorías, y el rango total es de 3
a 15 categorías. Teniendo en cuenta la amplia Debido a la variedad de diferentes
variables que se han estudiado, considero que este es un rango notablemente estrecho.
Parece que hay alguna limitación incorporada en nosotros, ya sea aprendiendo o
diseñando nuestros nervios Sistemas, un límite que mantiene las capacidades de nuestro
canal en este rango general. Sobre la base del presente evidencia que parece seguro
decir que poseemos una capacidad finita y bastante pequeña para hacer tales juicios
unidimensionales y que esta capacidad no varía mucho de un simple sensorial atribuir a
otro. http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (5 de 17) [10/10/2001
10:23:08 AM]
Página 6

Juicios absolutos de estímulos multidimensionales Puede que hayas notado que he


tenido cuidado de decir que este número mágico siete se aplica a Juicios
unidimensionales. La experiencia cotidiana nos enseña que podemos identificar con
precisión cualquiera de varios cientos de caras, cualquiera de varios miles de palabras,
cualquiera de varios miles de objetos, etc. La historia ciertamente no estaría completa si
nos detuviéramos en este punto. Debemos tener alguna comprensión de ¿Por qué las
variables unidimensionales que juzgamos en el laboratorio dan resultados tan fuera de
línea con lo que nosotros? Lo hacemos constantemente en nuestro comportamiento
fuera del laboratorio. Una posible explicación radica en el número de Atributos
independientemente variables de los estímulos que se juzgan. Objetos, caras, palabras y
similares. difieren entre sí de muchas maneras, mientras que los estímulos simples que
hemos considerado hasta ahora difieren el uno del otro en un solo aspecto.
Afortunadamente, hay algunos datos sobre lo que sucede cuando hacemos juicios
absolutos de estímulos que difieren entre sí de varias maneras. Veamos primero los
resultados que Klemmer y Frick (13) tienen informado para el juicio absoluto de la
posición de un punto en un cuadrado. En la Fig. 5 vemos sus resultados. Ahora la
capacidad del canal parece haber aumentado a 4,6 bits, lo que significa que las personas
pueden identificarse con precisión Cualquiera de las 24 posiciones en la plaza. La
posición de un punto en un cuadrado es claramente una proposición bidimensional.
Tanto su horizontal como su Se debe identificar la posición vertical. Por lo tanto, parece
natural comparar la capacidad de 4,6 bits para un cuadrado. con la capacidad de 3.25
bits para la posición de un punto en un intervalo. El punto en la plaza requiere dos.
Juicios del tipo de intervalo. Si tenemos una capacidad de 3.25 bits para estimar
intervalos y lo hacemos dos veces, deberíamos obtener 6,5 bits como nuestra capacidad
para ubicar puntos en un cuadrado. Añadiendo el segundo La dimensión independiente
nos da un aumento de 3.25 a 4.6, pero no llega a la adición perfecta que Daría 6,5 bits.
Otro ejemplo es proporcionado por Beebe-Center, Rogers y O'Connell. Cuando pidieron
a la gente que identificar tanto la salinidad como la dulzura de las soluciones que
contienen varias concentraciones de sal y Sucrosa, encontraron que la capacidad del
canal era de 2,3 bits. Dado que la capacidad de sal solo era de 1.9, podría esperar
aproximadamente 3.8 bits si los dos aspectos de los estímulos compuestos se juzgaran
de forma independiente. Como con ubicaciones espaciales, la segunda dimensión agrega
un poco a la capacidad pero no tanto como posiblemente podría. Un tercer ejemplo es
proporcionado por Pollack (18) , quien pidió a los oyentes que juzgaran tanto el
volumen como el Tono de tonos puros. Dado que el tono da 2.5 bits y la sonoridad da
2.3 bits, podemos esperar obtener tanto como 4.8 bits para el tono y la intensidad juntos.
Pollack obtuvo 3.1 bits, lo que de nuevo indica que el La segunda dimensión aumenta la
capacidad del canal pero no tanto como podría. Un cuarto ejemplo se puede extraer del
trabajo de Halsey y Chapanis (9) sobre confusiones entre colores. de luminancia igual.
Aunque no analizaron sus resultados en términos informativos, estiman que hay
alrededor de 11 a 15 colores identificables, o, en nuestros términos, alrededor de 3,6
bits. Dado que estos colores variaban en Tanto el tono como la saturación,
probablemente sea correcto considerar esto como un juicio bidimensional. Si nosotros
compare esto con los 3.1 bits de Eriksen para el tono (que es una comparación
cuestionable para dibujar), nuevamente tenemos algo menos que la adición perfecta
cuando se agrega una segunda dimensión. Sin embargo, aún queda un largo camino
desde estos ejemplos bidimensionales hasta los estímulos multidimensionales.
proporcionado por caras, palabras, etc. Para llenar este vacío, solo tenemos un
experimento, un estudio auditivo realizado por
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (6 de 17) [10/10/2001
10:23:08 AM]
Página 7

Pollack y Ficks (19) . Lograron obtener seis variables acústicas diferentes que podrían
cambiar: Frecuencia, intensidad, tasa de interrupción, fracción de tiempo, duración total
y ubicación espacial. Cada uno de estas seis variables podrían asumir cualquiera de los
cinco valores diferentes, por lo que en total había 5 6 , o 15,625 tonos diferentes que
pudieron presentar. Los oyentes hicieron una calificación separada para cada uno de
estos. seis dimensiones En estas condiciones, la información transmitida era de 7,2 bits,
lo que corresponde a Alrededor de 150 categorías diferentes que podrían identificarse
absolutamente sin error. Ahora estamos empezando a Subir al rango que la experiencia
ordinaria nos haría esperar. Supongamos que trazamos estos datos, por fragmentados
que sean, y adivinamos cómo funciona el canal. La capacidad cambia con la
dimensionalidad de los estímulos. El resultado se da en la Fig. 6 . En un momento de
considerable atrevimiento, dibujé la línea de puntos para indicar aproximadamente la
tendencia de que los datos parecían estar tomando. Claramente, la adición de atributos
independientemente variables al estímulo aumenta la capacidad del canal, pero a un
ritmo decreciente. Es interesante observar que la capacidad del canal aumenta incluso
cuando el Varias variables no son independientes. Eriksen (5) informa que, cuando el
tamaño, el brillo y el tono varían. juntas en perfecta correlación, la información
transmitida es de 4.1 bits en comparación con un promedio de aproximadamente 2,7 bits
cuando estos atributos se varían de uno en uno. Al confundir tres atributos, Eriksen
aumentó la dimensionalidad de la entrada sin aumentar la cantidad de información de
entrada; el resultado fue un aumento en la capacidad del canal de aproximadamente la
cantidad que la función de puntos en La figura 6 nos llevaría esperar. El punto parece
ser que, a medida que agregamos más variables a la pantalla, aumentamos la capacidad
total, pero Disminuye la precisión para cualquier variable en particular. En otras
palabras, podemos hacer relativamente crudo Juicios de varias cosas a la vez. Podríamos
argumentar que en el curso de la evolución esos organismos fueron los más exitosos que
fueron Responden a la gama más amplia de energías de estímulo en su entorno. Para
sobrevivir en un mundo en constante fluctuación, era mejor tener un poco de
información sobre muchas cosas que tener una Mucha información sobre un pequeño
segmento del entorno. Si era necesario un compromiso, el que nosotros Lo que parece
haber hecho es claramente lo más adaptable. Los resultados de Pollack y Ficks son muy
sugestivos de un argumento que sostiene que los lingüistas y los fonetistas He estado
haciendo durante algún tiempo (11) . Según el análisis lingüístico de los sonidos
humanos. discurso, hay alrededor de ocho o diez dimensiones, los lingüistas las llaman
características distintivas, que distinguir un fonema de otro Estas características
distintivas son generalmente binarias, o en la mayoría de los casos ternarios, en
naturaleza. Por ejemplo, se hace una distinción binaria entre vocales y consonantes, una
decisión binaria es entre las consonantes orales y nasales, se toma una decisión ternaria
entre el frente, la parte media y la espalda. fonemas, etc. Este enfoque nos da una
imagen bastante diferente de la percepción del habla de lo que podríamos de lo
contrario, obtenga de nuestros estudios el espectro del habla y la capacidad del oído
para discriminar Diferencias entre los tonos puros. Personalmente estoy muy interesado
en este nuevo enfoque (15) , y lamento Que no hay tiempo para discutirlo aquí.
Probablemente fue con esta teoría lingüística en mente que Pollack y Ficks realizaron
una prueba en un conjunto de estímulos tonales que variaban en ocho dimensiones, pero
solo requerían una decisión binaria en cada dimensión. Con estos tonos midieron la
información transmitida a 6,9 bits, o alrededor de 120 tipos reconocibles de sonidos. Es
una pregunta intrigante, aún no explorada, si uno puede seguir agregando dimensiones.
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (7 de 17) [10/10/2001
10:23:08 AM]
Página 8
indefinidamente de esta manera. En el habla humana, hay claramente un límite para la
cantidad de dimensiones que usamos. En este caso, sin embargo, no se sabe si el límite
se impone por la naturaleza de la maquinaria perceptiva que Debe reconocer los sonidos
o por la naturaleza de la maquinaria del habla que debe producirlos. Alguien Habrá que
hacer el experimento para averiguarlo. Hay un límite, sin embargo, en unos ocho o
nueve distintivos características en todos los idiomas que se han estudiado, por lo que
cuando hablamos debemos recurrir a otro truco Para aumentar nuestra capacidad de
canal. El lenguaje usa secuencias de fonemas, así que hacemos varias Juicios sucesivos
cuando escuchamos palabras y oraciones. Es decir, utilizamos ambos simultáneos. y las
discriminaciones sucesivas para ampliar los límites más bien rígidos impuestos por la
inexactitud de nuestra Juicios absolutos de magnitudes simples. Estos juicios
multidimensionales recuerdan fuertemente el experimento de abstracción de Külpe (14)
. Como recordará, Külpe demostró que los observadores informan con mayor precisión
sobre un atributo para el cual están configurados que en los atributos para los que no
están configurados. Por ejemplo, Chapman (4) utilizó tres diferentes atributos y
comparó los resultados obtenidos cuando los observadores fueron instruidos antes del
taquistoscopio presentación con los resultados obtenidos cuando no se les dijo hasta
después de la presentación cuál de ellos Los tres atributos debían ser reportados.
Cuando la instrucción fue dada por adelantado, los juicios fueron más preciso. Cuando
la instrucción se dio después, los sujetos probablemente tenían que juzgar a los tres
atributos para informar sobre cualquiera de ellos y la precisión fue
correspondientemente menor. Esto es en acuerdo completo con los resultados que
acabamos de considerar, donde la precisión del juicio en cada uno atributo disminuyó a
medida que se añadieron más dimensiones. El punto es probablemente obvio, pero lo
haré de cualquier manera, que los experimentos de abstracción no demostraron que las
personas pueden juzgar solo un atributo en un momento. Simplemente mostraron lo que
parece bastante razonable, que las personas son menos precisas si deben juzgar más de
un atributo a la vez. . . . El lapso de la memoria inmediata Permítanme resumir la
situación de esta manera. Existe un límite claro y definido para la precisión con la que
Podemos identificar absolutamente la magnitud de una variable de estímulo
unidimensional. Te propondría llamar esto limita el lapso del juicio absoluto, y sostengo
que para juicios unidimensionales este lapso es Normalmente en algún lugar del barrio
de las siete. No estamos completamente a merced de esta limitada Sin embargo, debido
a que contamos con una variedad de técnicas para solucionarlo y aumentar la precisión
de nuestros juicios. Los tres más importantes de estos dispositivos son ( a ) hacer más
relativos que juicios absolutos; o, si eso no es posible, ( b ) aumentar el número de
dimensiones a lo largo de las cuales el los estímulos pueden diferir; o ( c ) organizar la
tarea de tal manera que hagamos una secuencia de varios absolutos juicios en una fila.
El estudio de juicios relativos es uno de los temas más antiguos en psicología
experimental, y no lo haré. pausa para revisarlo ahora. El segundo dispositivo,
aumentando la dimensionalidad, lo acabamos de considerar. Eso Parece que al agregar
más dimensiones y requerir crudo, binario, sí, no hay juicios sobre cada atributo.
podemos extender el lapso del juicio absoluto de siete a al menos 150. A juzgar por lo
que hacemos todos los días comportamiento, el límite es probablemente en los miles, si
de hecho hay un límite. En mi opinión, no podemos seguir. Dimensiones compuestas
indefinidamente. Sospecho que también hay un lapso de dimensionalidad perceptiva y
que este lapso está en algún lugar en el vecindario de diez, pero debo agregar de
inmediato que no hay ningún objetivo Pruebas para apoyar esta sospecha. Esta es una
pregunta que lamentablemente necesita una exploración experimental.
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (8 de 17) [10/10/2001
10:23:08 AM]
Página 9

En cuanto al tercer dispositivo, el uso de juicios sucesivos, tengo un poco que decir
porque este dispositivo Introduce la memoria como la sirvienta de la discriminación. Y,
dado que los procesos mnemónicos son al menos como Por complejos que sean los
procesos perceptivos, podemos anticipar que sus interacciones no serán fácilmente
desenredado Supongamos que comenzamos simplemente extendiendo ligeramente el
procedimiento experimental que hemos estado usando. Hasta este punto, hemos
presentado un solo estímulo y le hemos pedido al observador que lo nombre de
inmediato. después de eso. Podemos extender este procedimiento requiriendo que el
observador retenga su respuesta hasta que tengamos Le dio varios estímulos en
sucesión. Al final de la secuencia de estímulos, hace su respuesta. Todavía tenemos el
mismo tipo de situación de entrada-salida que se requiere para la medición de
información transmitida. Pero ahora hemos pasado de un experimento de juicio absoluto
a lo que es. Tradicionalmente se llama un experimento en la memoria inmediata. Antes
de ver cualquier información sobre este tema, creo que debo advertirle para ayudarlo a
evitar algunos. Asociaciones obvias que pueden ser confusas. Todo el mundo sabe que
hay un lapso finito de memoria y que para una gran cantidad de diferentes tipos de
materiales de prueba, este intervalo es de aproximadamente siete elementos de longitud.
yo Acabo de mostrarle que existe un período de juicio absoluto que puede distinguir
aproximadamente siete categorías. y que hay un lapso de atención que abarcará
alrededor de seis objetos de un vistazo. Qué es más ¿Es natural pensar que estos tres
tramos son aspectos diferentes de un solo proceso subyacente? Y ese es un error
fundamental, como tendré que demostrar algunos dolores. Este error es uno de los
Persecuciones maliciosas a las que me ha sometido el mágico número siete. Mi error fue
algo como esto. Hemos visto que la característica invariante en el lapso de absoluta
juicio es la cantidad de información que el observador puede transmitir. Hay una
operativa real. similitud entre el experimento de juicio absoluto y el experimento de
memoria inmediata. Si la memoria inmediata es como un juicio absoluto, entonces debe
seguir que la característica invariable en el lapso de la memoria inmediata es también la
cantidad de información que un observador puede retener. Si la cantidad de La
información en el lapso de la memoria inmediata es una constante, entonces el lapso
debe ser corto cuando el los elementos individuales contienen mucha información y el
intervalo debe ser largo cuando los elementos contienen poca información. Por ejemplo,
los dígitos decimales valen 3.3 bits cada uno. Podemos recordar unos siete de ellos, Para
un total de 23 bits de información. Las palabras en inglés aisladas valen
aproximadamente 10 bits cada una. Si el total La cantidad de información es
permanecer constante en 23 bits, entonces deberíamos poder recordar solo dos o Tres
palabras elegidas al azar. De esta manera, generé una teoría sobre cómo el lapso de
tiempo inmediato la memoria debe variar en función de la cantidad de información por
elemento en los materiales de prueba. Las mediciones de la duración de la memoria en
la literatura son sugerentes en esta pregunta, pero no son definitivas. Y así fue necesario
hacer el experimento para ver. Hayes (10) lo probó con cinco tipos diferentes
demateriales de prueba: dígitos binarios, dígitos decimales, letras del alfabeto, letras
más dígitos decimales, y con 1.000 palabras monosilábicas. Las listas se leyeron en voz
alta a la velocidad de un elemento por segundo y los sujetos Tuvieron todo el tiempo
que necesitaron para dar sus respuestas. Un procedimiento descrito por Woodworth (20)
fueSe utiliza para puntuar las respuestas. Los resultados son mostrados por los círculos
llenos en Fig. 7 . Aquí la línea de puntos indica lo que debehan sido si la cantidad de
información en el lapso fuera constante. Las curvas sólidas representan los datos. Hayes
repitió el experimento utilizando vocabularios de prueba de diferentes tamaños, pero
todos contenían solo inglés monosílabos (círculos abiertos en Fig. 7 ). Este material de
prueba más homogéneo no cambió la imagen.significativamente. Con los elementos
binarios, el intervalo es de aproximadamente nueve y, aunque se reduce a
aproximadamente cinco con http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html
(9 de 17) [10/10/2001 10:23:08 AM]
Página 10

Las palabras monosilábicas en inglés, la diferencia es mucho menor que la hipótesis de


información constante. exigir. No hay nada malo con el experimento de Hayes, porque
Pollack (16) lo repitió mucho más elaboradamenteY obtuvo esencialmente el mismo
resultado. Pollack se tomó la molestia de medir la cantidad de información transmitida y
no se basó en el procedimiento tradicional para calificar las respuestas. Sus resultados se
trazan en Fig. 8 .Aquí está claro que la cantidad de información transmitida no es una
constante, sino que aumenta casi linealmente a medida que aumenta la cantidad de
información por elemento en la entrada. Y así, el resultado es perfectamente claro. A
pesar de la coincidencia que aparece el número siete mágico. en ambos lugares, el
alcance del juicio absoluto y el alcance de la memoria inmediata son tipos muy
diferentes de las limitaciones que se imponen a nuestra capacidad de procesar
información. El juicio absoluto está limitado por la cantidad de información. La
memoria inmediata está limitada por el número de elementos. Para capturar esto
distinción en términos un tanto pintorescos, me he acostumbrado a distinguir entre bits
deInformación y trozos de información. Entonces puedo decir que el número de bits de
información es constante.para el juicio absoluto y el número de fragmentos de
información es constante para la memoria inmediata. los El intervalo de memoria
inmediata parece ser casi independiente del número de bits por fragmento, al menos
sobre El rango que se ha examinado hasta la fecha. El contraste de los términos bit y
chunk también sirve para resaltar el hecho de que no somos muy definidos.sobre lo que
constituye un trozo de información. Por ejemplo, el lapso de memoria de cinco palabras
que Hayes obtenido cuando cada palabra se dibujó al azar de un conjunto de 1000
monosílabos ingleses podría ser igual de apropiadamente se han llamado memoria de 15
fonemas, ya que cada palabra tenía aproximadamente tres fonemas en el mismo.
Intuitivamente, está claro que los sujetos recordaban cinco palabras, no 15 fonemas,
pero La distinción lógica no es inmediatamente aparente. Estamos tratando aquí con un
proceso de organización o agrupando la entrada en unidades o trozos familiares, y una
gran cantidad de aprendizaje ha entrado en la formación de estas unidades familiares.
Recodificación Por lo tanto, para hablar con mayor precisión, debemos reconocer la
importancia de agrupar u organizar La secuencia de entrada en unidades o trozos. Dado
que el espacio de memoria es un número fijo de fragmentos, podemos aumente el
número de bits de información que contiene simplemente mediante la creación de
fragmentos cada vez más grandes, Cada trozo contiene más información que antes. Un
hombre que recién comienza a aprender el código radiotelegráfico escucha cada dit y
dah como un fragmento separado. Pronto eles capaz de organizar estos sonidos en letras
y luego puede tratar las letras como trozos. Entonces el las letras se organizan como
palabras, que son aún partes más grandes, y él comienza a escuchar frases completas. yo
no significa que cada paso sea un proceso discreto, o que las mesetas deben aparecer en
su curva de aprendizaje, porque seguramente los niveles de organización se logran a
diferentes ritmos y se superponen entre sí durante el aprendizaje proceso. Simplemente
señalo el hecho obvio de que los dits y dahs se organizan aprendiendo patrones y que a
medida que estos trozos más grandes emergen la cantidad de mensaje que el operador
puede recordar aumenta correspondientemente. En los términos que propongo usar, el
operador aprende a aumentar los bits por pedazo. En la jerga de la teoría de la
comunicación, este proceso se llamaría recodificación. La entrada se da en unCódigo
que contiene muchos trozos con pocos bits por trozo. El operador recodifica la entrada
en otro. http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (10 de 17)
[10/10/2001 10:23:08 AM]
Página 11

Código que contiene menos fragmentos con más bits por fragmento. Hay muchas
maneras de hacer esta recodificación, pero Probablemente, lo más simple es agrupar los
eventos de entrada, aplicar un nuevo nombre al grupo y luego recordar el Nuevo
nombre en lugar de los eventos de entrada originales. Ya que estoy convencido de que
este proceso es muy general e importante para la psicología, quiero decirles que Usted
sobre un experimento de demostración que debería hacer perfectamente explícito de lo
que estoy hablando. Esta El experimento fue conducido por Sidney Smith y fue
informado por él antes de la psicología oriental. Asociación en 1954. Comience con el
hecho observado de que las personas pueden repetir ocho dígitos decimales, pero solo
nueve dígitos binarios. Dado que existe una gran discrepancia en la cantidad de
información que se recuerda en estos dos casos, sospechamos que una vez que se podría
utilizar un procedimiento de recodificación para aumentar el alcance de la memoria
inmediata para dígitos binarios. En la Tabla 1 se ilustra un método para agrupar y
renombrar. A lo largo de la parte superior hay una secuencia de 18 binarios.dígitos,
mucho más de lo que cualquier tema pudo recordar después de una sola presentación.
En la siguiente línea estos mismos Los dígitos binarios se agrupan por pares. Se pueden
producir cuatro pares posibles: 00 se renombra como 0, 01 se renombra como 1, 10 es
renombrado a 2, y 11 se renombra a 3. Es decir, recodificamos de una aritmética de base
dos a una base cuatro aritmética. En la secuencia recodificada ahora hay solo nueve
dígitos para recordar, y esto está casi dentro de El lapso de la memoria inmediata. En la
siguiente línea, la misma secuencia de dígitos binarios se reagrupa en trozos de tres.
Hay ocho secuencias posibles de tres, por lo que le damos a cada secuencia un nuevo
nombre entre 0 y 7. Ahora hemos recodificado de una secuencia de 18 dígitos binarios
en una secuencia de 6 octales dígitos, y esto está bien dentro del lapso de la memoria
inmediata. En las dos últimas líneas los dígitos binarios son Se agrupan por cuatro y por
cinco y reciben nombres de dígitos decimales de 0 a 15 y de 0 a 31. Es razonablemente
obvio que este tipo de recodificación aumenta los bits por trozo y empaqueta el binario
secuencia en una forma que puede ser retenida dentro del lapso de la memoria
inmediata. Así Smith se reunió 20 Sujetos y midieron sus tramos para dígitos binarios y
octales. Los tramos fueron 9 para binarios y 7 para octales Luego le dio cada esquema
de recodificación a cinco de los sujetos. Estudiaron la recodificación hasta que Dijeron
que lo entendieron, durante unos 5 o 10 minutos. Luego probó su span para dígitos
binarios otra vez mientras intentaron usar los esquemas de recodificación que habían
estudiado. Los esquemas de recodificación aumentaron su rango para dígitos binarios en
todos los casos. Pero el aumento no fue tan grande como esperábamos en base a su
intervalo para dígitos octales. Dado que la discrepancia aumentó a medida que el la tasa
de recodificación aumentó, razonamos que en los pocos minutos que los sujetos habían
pasado aprendiendo la recodificación Los esquemas no habían sido suficientes. Al
parecer, la traducción de un código a otro debe ser casi Automático o el sujeto perderá
parte del siguiente grupo mientras intenta recordar la traducción de el ultimo grupo
Dado que las relaciones 4: 1 y 5: 1 requieren un estudio considerable, Smith decidió
imitar a Ebbinghaus y hacer las experimento sobre sí mismo. Con paciencia germánica
se perforó en cada recodificación sucesivamente, y obtenido los resultados mostrados en
Fig. 9 . Aquí los datos siguen bastante bien con los resultados que obtendríaspredecir
sobre la base de su lapso para dígitos octales. Podía recordar 12 dígitos octales. Con la
recodificación 2: 1, Estos 12 trozos valían 24 dígitos binarios. Con la recodificación 3: 1
valían 36 dígitos binarios. Con las recodificaciones 4: 1 y 5: 1, valían aproximadamente
40 dígitos binarios. Es un poco dramático ver a una persona obtener 40 dígitos binarios
seguidos y luego repetirlos sin error. Sin embargo, si piensa en esto simplemente como
un truco mnemotécnico para ampliar el espacio de memoria, pierda el punto más
importante que está implícito en casi todos estos dispositivos mnemónicos. El caso es
que recodificación es un arma extremadamente poderosa para aumentar la cantidad de
información que podemos tratar
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (11 de 17) [10/10/2001
10:23:08 AM]
Pagina 12

con. De una forma u otra usamos la recodificación constantemente en nuestro


comportamiento diario. En mi opinión, el tipo de recodificación más habitual que
hacemos todo el tiempo es traducirlo en una forma verbal. código. Cuando hay una
historia o un argumento o una idea que queremos recordar, generalmente intentamos
reformularlo "en nuestras propias palabras". Cuando somos testigos de algún evento que
queremos recordar, hacemos un verbal Descripción del evento y luego recordar nuestra
verbalización. Al recordar lo recreamos por secundaria. Elaboración de los detalles que
parecen consistentes con la recodificación verbal particular que hemos realizado. El
conocido experimento de Carmichael, Hogan y Walter (3) sobre la influencia que tienen
los nombres enEl recuerdo de figuras visuales es una demostración del proceso. La
inexactitud del testimonio de testigos presenciales es bien conocida en psicología legal,
pero las distorsiones de los testimonios no son aleatorios; se derivan naturalmente de la
recodificación particular que el testigo utilizó, y La grabación particular que utilizó
depende de toda su historia de vida. Nuestro lenguaje es tremendamente útil. para
reenvasar material en algunos trozos ricos en información. Sospecho que las imágenes
son una forma de recodificación, también, pero las imágenes parecen mucho más
difíciles de obtener operativamente y de estudiar experimentalmente que las Más tipos
simbólicos de recodificación. Parece probable que incluso la memorización pueda ser
estudiada en estos términos. El proceso de memorización puede sea simplemente la
formación de trozos, o grupos de elementos que van juntos, hasta que haya pocos trozos
suficientes para que podamos recordar todos los artículos. El trabajo por Bousfield y
Cohen (2) sobre la aparición de agrupamientoEn el recuerdo de palabras es
especialmente interesante a este respecto. Resumen He llegado al final de los datos que
quería presentar, por lo que me gustaría ahora hacer algunos resumiendo comentarios.
Primero, la duración del juicio absoluto y la extensión de la memoria inmediata
imponen severas limitaciones a la Cantidad de información que podemos recibir,
procesar y recordar. Organizando el estímulo. ingresamos simultáneamente en varias
dimensiones y sucesivamente en una secuencia de fragmentos, conseguimos romper (o
al menos estirar) este cuello de botella informativo. Segundo, el proceso de
recodificación es muy importante en psicología humana y merece mucho más. Atención
explícita de la que ha recibido. En particular, el tipo de recodificación lingüística que la
gente hace parece Para mí ser el elemento vital de los procesos de pensamiento. Los
procedimientos de recodificación son una preocupación constante para clínicos,
psicólogos sociales, lingüistas y antropólogos y, sin embargo, probablemente porque la
recodificación es menos accesible a la manipulación experimental que las sílabas sin
sentido o laberintos T, el experimental tradicional El psicólogo ha contribuido poco o
nada a su análisis. Sin embargo, las técnicas experimentales pueden ser utilizados, se
pueden especificar métodos de recodificación, se pueden encontrar indicadores de
comportamiento. Y anticipo eso Encontraremos un conjunto muy ordenado de
relaciones que describen lo que ahora parece ser un desierto inexplorado de diferencias
individuales. En tercer lugar, los conceptos y medidas proporcionados por la teoría de la
información proporcionan una forma cuantitativa de Llegando a algunas de estas
preguntas. La teoría nos proporciona un criterio para calibrar nuestro estímulo.
Materiales y para medir el rendimiento de nuestros sujetos. En el interés de la
comunicación tengo suprimió los detalles técnicos de la medición de la información y
ha tratado de expresar las ideas en más términos familiares Espero que esta paráfrasis no
te lleve a pensar que no son útiles para la investigación. Los conceptos informativos ya
han demostrado ser valiosos en el estudio de la discriminación y del lenguaje; ellos
http://spider.apa.org/ftdocs/rev/1994/april/rev1012343.html (12 de 17) [10/10/2001
10:23:09 AM]
Página 13
Prometemos mucho en el estudio del aprendizaje y la memoria; e incluso se ha
propuesto que puedan ser Útil en el estudio de la formación de conceptos. Muchas
preguntas que parecían infructuosas veinte o treinta años. Hace tiempo que ahora puede
valer otra mirada. De hecho, siento que mi historia aquí debe detenerse justo cuando
comienza a llegar muy interesante. Y finalmente, ¿qué pasa con el mágico número
siete? ¿Qué pasa con las siete maravillas del mundo, el Los siete mares, los siete
pecados mortales, las siete hijas de Atlas en las Pléyades, las siete edades del hombre,
las Los siete niveles del infierno, los siete colores primarios, las siete notas de la escala
musical y los siete días de ¿la semana? ¿Qué pasa con la escala de calificación de siete
puntos, las siete categorías para el juicio absoluto, las siete ¿Objetos en el lapso de
atención, y los siete dígitos en el lapso de la memoria inmediata? Por el presente yo
Proponemos retener el juicio. Tal vez hay algo profundo y profundo detrás de todos
estos sietes, Algo que nos pide que lo descubramos. Pero sospecho que es sólo un
pernicioso, pitagórico coincidencia

También podría gustarte