Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Designing Probabilistic Category Learning Experiments - En.es
Designing Probabilistic Category Learning Experiments - En.es
com
Palabras clave: Aprendizaje de categorías; Retroalimentación más representativa de los entornos naturales de aprendizaje (Little y Lewandowsky, 2009; Meeter, et al.,
probabilística; Categorización perceptual; Diseños experimentales 2008; Lagnado, Newell, Kahan y Shanks, 2006 ). DF asume un maestro perfecto, y las condiciones
naturales probablemente sean más como PF, donde la señal de enseñanza puede ser inconsistente (por
Introducción ejemplo, un maestro impreciso). En segundo lugar, al menos algunos hallazgos empíricos en el
aprendizaje de categorías pueden estar condicionados al DF. Por ejemplo, las correlaciones entre
En el trabajo actual, presentamos un método para desarrollar experimentos de
características durante mucho tiempo se han considerado una parte importante de las
aprendizaje de categorías con retroalimentación probabilística, lo que permite a un
representaciones conceptuales (Hoffman y Rehder, 2010; Ell, Smith, Peralta y Hélie, 2017). En general,
investigador estipular de manera flexible las fortalezas de asociación de categoría a
se acepta que los sujetos en los experimentos de aprendizaje de categorías tienden a no aprender las
característica y, al mismo tiempo, controlar fácilmente la asociación de categoría a
correlaciones entre características. Para que se aprendan las correlaciones entre características, se
ejemplo completo (es decir, combinación de características). En el experimento
deben utilizar tareas de inferencia (Chin-Parker y Ross, 2002; Yamauchi, Love y Markman, 2002). Sin
reportado, usamos nuestro método para capacitar a los sujetos y mostrar que los
embargo, cuando se ha utilizado PF con procedimientos de clasificación, se ha encontrado evidencia de
participantes aprenden según lo predicho, lo que sugiere que el método puede usarse
que los sujetos aprenden correlaciones entre características (Little & Lewandowsky, 2009). En
en casi cualquier tarea de aprendizaje de categorías con retroalimentación
consecuencia, es posible que los fenómenos de categorización que se descubren mediante el uso de DF
probabilística.
no se generalicen en condiciones de FP. Dadas estas preocupaciones, el PF debería usarse de manera
En el aprendizaje de categorías, un procedimiento común es crear
más amplia. Se ha encontrado evidencia de que los sujetos aprenden correlaciones entre características
estímulos combinando características con valores binarios. En general,
(Little & Lewandowsky, 2009). En consecuencia, es posible que los fenómenos de categorización que se
connorte características, es posible crear 2norte estímulos que abarcan
descubren mediante el uso de DF no se generalicen en condiciones de FP. Dadas estas preocupaciones,
todas las combinaciones posibles de características (ver Ashby & Valentin,
el PF debería usarse de manera más amplia. Se ha encontrado evidencia de que los sujetos aprenden
2018). Cada estímulo o ejemplar es, por tanto, una combinación particular
correlaciones entre características (Little & Lewandowsky, 2009). En consecuencia, es posible que los
de características en uno de sus dos posibles estados (Posner y Keele,
fenómenos de categorización que se descubren mediante el uso de DF no se generalicen en
1968; Reed, 1972). En los experimentos de aprendizaje por categorías, los
condiciones de FP. Dadas estas preocupaciones, el PF debería usarse de manera más amplia.
participantes suelen ser entrenados con todos los estímulos posibles
(pero a veces solo con un subconjunto; Medin y Schaffer, 1978). Pueden
aprender que ciertas combinaciones son miembros de
161
Sospechamos que la relativa falta de investigación en el Método
aprendizaje de categorías que utiliza FP se debe a las dificultades
que los investigadores pueden experimentar si intentan diseñar Participantes
experimentos de FP. Al observar los experimentos de Little y
Treinta y seis estudiantes de pregrado (27 mujeres) de 18 a 37 años
Lewandowsky (2009), es evidente que tomaron su condición de
(media = 20,11, Dakota del Sur = 3.21), consentimiento informado
DF y la convirtieron en una condición de FP simplemente
firmado para participar en el experimento para obtener crédito del
cambiando las probabilidades de cada ejemplo o combinación
curso. Los participantes fueron asignados al azar a una de las tres
de características. En contraste con el uso de probabilidades 1 y
condiciones experimentales (AB, BC y CA, doce participantes en cada
0, en sus condiciones de FP una combinación de características
condición). El experimento duró aproximadamente 30 minutos.
perteneciente a la categoría A con p (A) = .75, pertenecía a la
categoría B con p (B) = .25. El principal problema con los
Diseño
procedimientos de Little y Lewandowsky es que permiten poca
Establecimos un experimento de diseño mixto de 3 (condición: AB,
flexibilidad al diseñar experimentos. Básicamente, las
BC y CA) x 3 (coeficiente de característica: A, B y C), siendo el último
probabilidades se asignan a combinaciones de características
un factor intra-sujetos. losDistorsión probabilística de prototipos La
completas y las probabilidades de características individuales
tarea (PPD) es una mezcla de tareas clásicas de distorsión de
solo se derivan. Para el control experimental,
prototipos (Posner y Keele, 1968; Casale y Ashby, 2008) con
retroalimentación probabilística. Como se discutió en la sección
Un procedimiento que podría utilizarse para dar FP
introductoria, existen algunos procedimientos de clasificación
es la tarea de predicción meteorológica (WP;
probabilística (por ejemplo, Knowlton, Mangels y Squire 1996; Gluck,
Knowlton, Squire y Gluck, 1994; Gluck, Shohamy y
Shohamy y Myers, 2002; Little y Lewandowsky, 2009; Kruschke y
Myers, 2002). En la tarea WP, a los sujetos se les
Johansen, 1999), pero son difíciles para implementar de manera
presentan combinaciones de naipes similares a las de
flexible. Hasta donde sabemos, no existe un procedimiento actual
la Prueba de clasificación de cartas de Wisconsin
que permita combinar de manera flexible las probabilidades de
(Monchi, Petrides, Petre, Worsley y Dagher, 2001), y
características (es decir, p (categoría | característica)) con la
tienen que aprender a usarlas para predecir el clima
probabilidad de combinación de características general (es decir, p
( es decir, lluvia o sol). Durante el entrenamiento, los
(combinación de categoría | característica)).
sujetos se presentan con combinaciones de tarjetas
El PPD asume un procedimiento prototipo “AB”, aunque también son
(es decir, 1, 2, 3 o 4 tarjetas). De manera problemática,
posibles otros procedimientos como “A-no A” o Inferencia. Como
para calcular la probabilidad del resultado (es decir,
cualquier otra tarea de prototipo de distorsión, se crean dos categorías
lluvia) dada cada carta individual, se debe elegir un
prototípicas: A y B. Como quedará claro a continuación, nuestros
conjunto muy específico de combinaciones de cartas y
estímulos están compuestos por tres características que tienen valores
de probabilidades de resultado. Como en los
binarios (1 o -1). El prototipo de categoría A se define mediante la
procedimientos de Little y Lewandowsky, aquí también
combinación "111" y el prototipo de categoría B se define mediante la
hay poca flexibilidad para que los investigadores
combinación de características "-1-1-1". Usando la codificación de efectos
seleccionen diferentes probabilidades de señales.
(ver Tabla 1), combinamos todos los estados de características posibles
para obtener un total de 8 ejemplos (23 = 8).
162
categoría A en el 90% de los ensayos y de categoría B en el 10%
= 1⁄ 1+ − ( 0 + 1 1 + 2 2 + 3 3)
(1) restante de los ensayos. Esto significa que incluso si los sujetos han
aprendieron que el ejemplar E1 es probablemente un miembro de la
categoría A, continuarán recibiendo retroalimentación correctiva en el
dónde, C es un parámetro de sensibilidad, B0 es la constante de la ecuación y B1,
10% de los ensayos en los que el ejemplar E1 tiene que ser clasificado.
B2, y B3 son pesos de características. Creamos tres condiciones diferentes (AB,
Además, este procedimiento permite que cada característica individual se
BC y CA) que ponderaron de manera diferencial las características en cada
experimente en asociación con cada categoría como se especifica en la
combinación de características específicas. Por ejemplo, en la condición AB,
Tabla 2 y los diagnósticos de característica correspondientes. Para
característica A (F1) es la característica más diagnóstica (peso = 2,5), mientras
configurar cualquier experimento similar, todo lo que el investigador debe
que la característica B (F2) contribuye menos a la probabilidad de clasificación
hacer es especificar los pesos de las características.
(peso = 1), y finalmente presenta C (F3) no tiene ningún diagnóstico (peso = 0).
Debido a la naturaleza probabilística de la tarea, el desempeño
Esta misma lógica se aplica a las otras dos condiciones (BC y CA). Las
perfecto es imposible. El rendimiento óptimo está cerca del 77%. Esto
ponderaciones de características para cada condición se muestran en la Tabla 2.
significa que el rendimiento de clasificación óptimo sería posible si
Al usar la ecuación. (1) y las ponderaciones de características especificadas por
los sujetos solo usaran la característica ponderada igual a 2.5 e
el experimentador, las probabilidades para cada ejemplo (es decir, combinación
ignoraran por completo las otras dos. Como quedará claro en lo que
de características) se pueden calcular fácilmente (ver Tabla 3).
sigue, nuestros métodos de análisis de datos nos permitieron probar
si los sujetos de nuestro experimento recurrieron a dicha regla o
aprendieron los pesos de características especificados en su lugar.
163
Como con cualquier tarea de prototipo de distorsión, el PPD involucra factor de medida, reveló un efecto principal de bloqueo
dos fases: Entrenamiento y Transferencia (Fig. 1C). Durante el (F(2,66) = 9,55, SRAe = .05, pag<.001, 2 pag = .22, potencia = .98), y un
entrenamiento, las personas tuvieron que clasificar si el ejemplar interacción no significativa entre bloqueo y condición (pag> .05). Estos
presentado pertenecía a una de las dos categorías posibles: Familia Z (Fig. resultados sugieren que hubo un efecto de aprendizaje a través de
1A) y Familia M (Fig. 1B). Las personas tenían que presionar la letra Z del bloques en todas las condiciones. Las comparaciones de contraste
teclado si creían que el ejemplar pertenecía a la Familia Z o presionar la revelaron una diferencia significativa entre el bloque 1 y el bloque
letra M si creían que pertenecía a la Familia M. Durante la capacitación, se 2 (F(1,33) = 9,99, SRAe = .12, pag= .003, 2 pag = .23, potencia = .87) y
proporcionaba retroalimentación prueba por prueba. Para respuestas una diferencia no significativa entre el bloque 2 y el bloque 3 (
correctas, una palabra verde "correcta" apareció en la pantalla durante pag> .05). Esto sugiere que en las tres condiciones el aprendizaje
1500 ms. Para las respuestas incorrectas, se presentó una palabra roja ocurrió principalmente del bloque 1 al 2, y no parece que se
"incorrecta". Los sujetos tenían solo 30 segundos para presionar un produjeran más cambios en el aprendizaje del bloque 2 al 3 (ver
botón, de lo contrario, aparecía un mensaje "demasiado lento" en la Fig. 2).
pantalla. La fase de entrenamiento estuvo compuesta por 3 bloques con Además, comparamos nuestras predicciones de clasificación dadas por
80 ensayos cada uno, para un total de 240 ensayos. Una vez que los la ecuación. (1) con precisión de entrenamiento. Hicimos un promedio de
sujetos completaron el entrenamiento, fueron trasladados a la fase de precisión en el bloque 3 para cada ejemplar en cada condición. Como
transferencia. En la transferencia, los sujetos tenían que calificar los ocho revela el análisis anterior, la mayoría de los sujetos habían aprendido el
posibles ejemplos utilizando una escala de similitud. La escala varió de 1 criterio de clasificación por bloque 3. Como queríamos comparar dos
(más similar a la familia Z) a 8 (más similar a la familia M), sin un punto trayectorias lineales (la predicha y la observada), estimamos directamente
medio. Cada ejemplar se calificó solo una vez. Sin embargo, también son laR2 entre las respuestas observadas y pronosticadas (basadas en la
posibles otros procedimientos como la generalización y las calificaciones probabilidad promedio observada frente a la pronosticada para cada
de pertenencia a categorías como medio para determinar qué es lo que ejemplo). Como muestra la figura 3, existe una clara tendencia a que los
los sujetos aprendieron durante el entrenamiento. sujetos en todas las condiciones aprendan la probabilidad de clasificación
ejemplar. En general, los accesorios son bastante buenos (para la
Resultados condición ABR2= .90, para la condición BC R2= .97, y para la condición CA R
2= .89). Sospechamos que un mayor número de bloques de entrenamiento
de .58 (SD = .06), .63 en la condición BC (SD = .08) y .62 en la condición CA (SD =
como lo ilustra nuestro experimento, los sujetos pueden aprender a
repetido
Figura 2. Probabilidad de clasificación de la categoría A (Familia Z) dada cada combinación ejemplar específica a través de bloques, mostrando
que para cada condición (AB, BC y CA) los sujetos aprendieron aproximadamente la p (A) de los ejemplares individuales. Cerrador
Mire a E8 muestra que este ejemplar está claramente clasificado en la categoría B (1 - p (A)).
164
Figura 3. Probabilidad de clasificación en la categoría A para una combinación de características dada en cada condición (AB, BC y CA).
La línea punteada muestra las probabilidades predichas calculadas por la ecuación. (1) y en la Tabla 3. La línea continua muestra el tema promedio
datos en el bloque 3.
165
evidencia de aprendizaje no sólo el patrón correcto de medias, sino
también el patrón correcto de diferencias estadísticas implícitas en el
diseño. Es importante destacar que el método PPD se puede utilizar para
variar paramétricamente diferentes aspectos de la tarea, de modo que se
puedan explorar muchos temas interesantes. Algunos de ellos se ofrecen
aquí. Esperamos que la tarea permita a los investigadores estimar cuánta
aleatoriedad hará inaprendible una tarea de clasificación y cuánto
determinismo lleva a los sujetos a desarrollar reglas de categorización
explícitas. Además, la tarea debería permitir a los investigadores obtener
evidencia convergente con una configuración experimental diferente, de
que la FP promueve el aprendizaje de la estructura interna de una
categoría, aunque los sujetos aprenden la categoría por clasificación en
contraste con aprenderla haciendo inferencias. Es más, nuestro diseño
experimental podría aplicarse a tareas con características no binarias. Al
discretizar características continuas ennorte niveles (donde norte > 2), es
trivial aplicar los mismos procedimientos aquí descritos, siendo la única
limitación el aumento del número total de ejemplares necesarios durante
Figura 4. Ponderaciones de los coeficientes de regresión obtenidos el entrenamiento para cubrir todas las combinaciones posibles.
mediante el método de regresión múltiple individualizado en
transferir datos a través de condiciones experimentales. En resumen, la tarea de PPD podría permitir a los investigadores
diseñar de manera flexible experimentos de clasificación de FP más allá
de las alternativas existentes relativamente fijas, como la tarea de WP.
Discusión Creemos que esto es una contribución al modelado matemático en la
166
aprender y generalizar representaciones dentro de la Monchi, O., Petrides, M., Petre, V., Worsley, K. y Dagher,
categoría.Atención, percepción y psicofísica, 79(6), A. (2001). Clasificación de tarjetas de Wisconsin revisada: Distintos
1777-1794. https://doi.org/10.3758/s13414-017-1345-2 circuitos neuronales que participan en diferentes etapas de la tarea
Gluck, MA y Bower, GH (1988). De Acondicionamiento a identificados por imágenes de resonancia magnética funcional
Categoría de aprendizaje: un modelo de red adaptable. Revista relacionadas con eventos.Revista de neurociencia, 21(19), 7733–7741.
de psicología experimental: general, 117 (3), 227–247.https:// https://doi.org/10.1523/jneurosci.21-19-07733.2001Nosofsky, RM,
doi.org/https://doi.org/10.1037/0096- 3445.117.3.227 Palmeri, TJ y McKinley, SC (1994).
Modelo de regla más excepción de aprendizaje de
Gluck, MA, Shohamy, D. y Myers, C. (2002). Como hacer clasificación. Psychological Review, 101 (1), 53–79.
¿Las personas resuelven la tarea de “predicción del tiempo” ?: https://doi.org/10.1037/0033-295x.101.1.53
Variabilidad individual en estrategias para el aprendizaje de Peirce, JW, Gray, JR, Simpson, S., MacAskill, MR,
categorías probabilísticas.Aprendizaje y Memoria,9(6), 408–418. Höchenberger, R., Sogo, H., Kastman, E., Lindeløv, J. (2019). PsychoPy2:
https://doi.org/10.1101/lm.45202 experimentos de comportamiento simplificados.Métodos de
Hoffman, AB y Rehder, B. (2010). Los costos de investigación del comportamiento. 10.3758 / s13428-018-01193- y
Clasificación supervisada: el efecto de la tarea de aprendizaje
en la flexibilidad conceptual.Diario de Experimental Posner, MI y Keele, SW (1968). Sobre el Génesis de
Psicología: General,139(2), 319-340. Ideas abstractas. Revista de psicología experimental, 77,
https://doi.org/10.1037/a0019042 353–363. https://doi.org/10.1037/h0025953
Knowlton, BJ, Mangels, JA y Squire, LR (1996). A Puebla, G. y Chaigneau, SE (2014). Inferencia y
sistema de aprendizaje de hábitos neoestriatales en coherencia en la categorización de artefactos basada en la causalidad.
humanos. Ciencias,273(5280), 1399–1402. Cognición, 130(1), 50–65.
https://doi.org/10.1126/science.273.5280.1399 https://doi.org/10.1016/j.cognition.2013.10.001
Knowlton, BJ, Squire, LR y Gluck, MA (1994). Reed, SK (1972). Reconocimiento y categorización de patrones.
Aprendizaje de clasificación probabilística en amnesia. Aprendiendo Psicología cognitiva,3(3), 382–407.
memoria, 1(2), 106-120. https://doi.org/10.1016/0010-0285(72)90014-XRehder, B.
https://doi.org/10.1101/lm.1.2.106 (2003). Categorización como razonamiento causal.
Kruschke, JK y Johansen, MK (1999). Un modelo de Ciencia cognitiva,27(5), 709–748.
Aprendizaje probabilístico de categorías. Journal of https://doi.org/10.1016/S0364-0213(03)00068-5Rehder, B.,
Experimental Psychology: Learning Memory and Cognition, 25 Colner, RM y Hoffman, AB (2009). Característica
(5), 1083-1119. https://doi.org/10.1037/0278-7393.25.5.1083 aprendizaje por inferencia y seguimiento ocular. Revista de memoria y
Lagnado, DA, Newell, BR, Kahan, S. y Shanks, DR lenguaje, 60(3), 393–419.
(2006). Perspicacia y estrategia en el aprendizaje de múltiples https://doi.org/10.1016/j.jml.2008.12.001
claves. Revista de psicología experimental: General, 135 (2), Rehder, B. y Hastie, R. (2001). Conocimiento causal y
162-183.https://doi.org/10.1037/0096-3445.135.2.162Little, DR categorías: Los efectos de las creencias causales sobre la
y Lewandowsky, S. (2009). Mejor aprendizaje categorización, la inducción y la similitud. Diario de Experimental
Con más error: la retroalimentación probabilística Psicología: General, 130(3), 323–360.
aumenta la sensibilidad a las señales correlacionadas https://doi.org/10.1037/0096-3445.130.3.323
en la categorización. Journal of Experimental Yamauchi, T., Love, BC y Markman, AB (2002).
Psychology: Learning Memory and Cognition, 35 (4), Aprendizaje de categorías separables no linealmente por
1041–1061.https://doi.org/10.1037/a0015902 inferencia y clasificación. Journal of Experimental
Luce, RD (1963). Detección y reconocimiento. En RD Luce, Psychology: Learning Memory and Cognition, 28(3), 585–
RR Bush y E. Galanter (Eds.), Manual de psicología 593.https://doi.org/10.1037/0278-7393.28.3.585
matemática (págs. 103-189). Nueva York: Wiley
167