Está en la página 1de 8

USANDO LA TECNOLOGÍA DE EQUIVALENCIA DE ESTIMULOS PARA

ENSEÑAR ESTADÍSTICA INFERENCIAL EN CONDICIONES DE AULA.

Lecciones computarizadas que emplean la tecnología de equivalencia de estímulo,


utilizada anteriormente bajo condiciones de laboratorio para enseñar conceptos de
estadística inferencial a estudiantes universitarios, fueron empleados en condiciones de
aula por primera vez. Los estudiantes mostraron las mismas ganancias en lo
directamente enseñado y el aprendizaje emergente, así como en estudios de
laboratorio. Un breve examen de papel y lápiz, adecuado para uso en el aula, capturo
los efectos demostrados previamente a través de pruebas de laboratorio. Los
resultados apoyan la extensión de las lecciones a entornos más naturalistas.

Palabras clave: estudiantes universitarios, discriminación condicional,


estadística inferencial, coincidencia con muestra, equivalencia de
estímulo

En tres estudios recientes, dirigidos a la enseñanza de estadística


inferencial a estudiantes de psicología. Los estudiantes dominaron algunas
habilidades fundamentales (discriminaciones condicionales) que fueron
directamente enseñadas, consistentes con la generatividad que es inherente
a la equivalencia de estímulo, entre otras habilidades. En otras palabras, los
estudiantes seguramente aprendieron más de lo que se les enseñó. Este
resultado se produjo en condiciones de laboratorio en que los estudiantes
podrían trabajar sin la distracción de los demás en las proximidades y el
aprendizaje podría evaluarse a través de baterías de prueba detalladas y
que consumen mucho tiempo que son incompatibles con rutinas en el aula.
Es importante señalar que no todas las intervenciones que trabajan
bajo condiciones controladas funcionar bien en el campo. El presente
estudio, por lo tanto, fue diseñado como un primer paso hacia evaluar
nuestras lecciones de estadística en condiciones de aula abordando dos
objetivos: (a) para determinar si una configuración de grupo afectaba
adversamente los resultados de aprendizaje afectados mediante el uso de
nuestras lecciones usando nuestras lecciones simultáneamente con un
grupo de estudiantes aproximadamente igual en tamaño a la lista de clase
de estadística en nuestra universidad; y (b) para determinar si las ganancias
de aprendizaje eran las mismas como las vistos en el laboratorio, en los
procedimientos de igualación a la muestra, en un examen de opción múltiple
y papel y lápiz como los empleados comúnmente en clases de la universidad.

MÉTODO
Los participantes fueron 27 estudiantes de pregrado (18 mujeres y 9
hombres) con medios (y desviaciones estándar) de 19,4 años (1,2) para la
edad, 3,0 (0,6) para el promedio de calificaciones, y 23.5 (3.7) para SAT
(puntaje del examen de ingreso a la universidad). Todos puntuaron debajo
del 75% de respuestas correctas en una prueba preliminar de papel y lápiz y
obtuvieron una bonificación en clase por participar. Cuatro participantes se
auto identificaron como minorías raciales (dos afroamericanos, un latino, y
un asiático). Los estudiantes trabajaron simultáneamente, en una habitación
que contenía 30 estaciones de trabajo con computadora, en lecciones
computarizadas idénticas a los de nuestros estudios anteriores más una
lección breve de repaso (Lección 4, ver a continuación). Toda la
investigación (incluidas las tareas administrativas como instrucciones y
consentimiento informado, fases de capacitación y evaluaciones) en una
sesión que requirió 2 horas.

Nota. Todos los estímulos (basados en Huck, 2000) se muestran textualmente,


excepto los estímulos D, que se han parafraseado para facilidad de exposición. Los
estímulos D que los estudiantes vieron describían una hipótesis científica y un
resultado de investigación direccional. Hubo tres versiones de los estímulos D (que
representan las predicciones de aumento, disminución y cambio de la variable
dependiente) en cada clase. Los estudiantes no fueron expuestos a esta notación.
Ver Fienup y Critchfield (2010) para más detalles.

Critchfield, 2010), usó procedimientos de igualación a la muestra


para enseñar relaciones condicionales que contribuían a la formación de
clases de equivalencia que involucran los estímulos que se muestran en la
Tabla 1. La Figura 1 resume las relaciones que involucran estos estímulos
que se enseñaron (flechas negras) o posteriormente se esperaba que
emergiera (flechas grises). En cada prueba, los estudiantes vieron estímulos
(una muestra, dos comparaciones) en la pantalla de la computadora t
seleccionaron las respuestas señalando y haciendo clic con el mouse.
Cada lección contenía uno o más unidades de aprendizaje en las
que los estudiantes practicaron un tipo de relación enseñada directamente
con retroalimentación sobre cada prueba hasta hacer 12 respuestas
correctas consecutivas. Dominar una lección de las unidades de aprendizaje
llevaba a verificación de habilidades computarizada (el modo de evaluación
en nuestros estudios de laboratorio) que consistía en relaciones (Entrenadas
y emergentes para las Lecciones 1 y 2, entrenadas solo para las Lecciones 3
y 4) que se pensaba que la lección estableciera. No hubo retroalimentación.
Puntuando en o por encima del 89% el estudiante avanzaba a la siguiente
tarea programada.Un bajo puntaje requería que el estudiante repitiera la
lección de unidades de aprendizaje y una verificación de habilidades.
La Lección 1 (tres unidades) enseñó conceptos relacionados con la
significación estadística. En nuestra notación (Tabla 1), enseñando
relaciones A-B y C-A se esperaba que promoviera B-A emergente, A-C, B-C,
y relaciones C-B. La lección 1 también incluía una unidad preliminar (que no
se muestra en Tabla 1 o Figura 1) en la que los estudiantes unieron
expresiones de desigualdad (p. ej., p <.05) para valores numéricos
específicos (por ejemplo, .001). Lección 2 (6 unidades) enseñaba conceptos
relacionados con decisiones de hipótesis. En nuestra notación, enseñando
D-E y D-F Se esperaba que las relaciones promovieran relaciones
emergentes de E-D, F-D, E-F y F-E.
La Lección 3 (12 unidades) enseñó a los estudiantes a seleccionar
decisiones de hipótesis (estímulos E y F) cuando se muestran
combinaciones de hipótesis y resultados (Estímulo D) más información
estadística (A estímulos). La figura 1 muestra que para relaciones no
inversas, la decisión de la hipótesis correcta fue idéntica a lo que los
estudiantes habían aprendido en conjunción con estímulos D solo en la
Lección 2. Para las relaciones inversas, la información estadística exigía una
decisión diferente de la que fue enseñada en la Lección 2. Esto, porque la
clase de estímulos 1 E y F (Tabla 1) se asociaron con diferentes D muestras
en función de la presencia de información estadística (estímulo A), la lección
3 estableció el control contextual (Bush, Sidman, & de Rose, 1989) sobre
membresía de clase de equivalencia.
La verificación de habilidades de la lección 3 incluía solamente las
relaciones (D+A)-E y (D+A)- F directamente enseñadas; sin embargo,
porque los estímulos A formaban parte de una clase de equivalencia
(Lección 1), sin una formación adicional, los alumnos deberían haber podido
utilizar estímulos de la Lección 1 distintos de A para guiar las decisiones de
hipótesis (para fundamento, ver Gatch & Osborne, 1989), produciendo
relaciones contextuales emergentes [(D + B) RE, (D + B) RF, (D + C) RE, y
(D + C) RF] que se sondearon en una prueba de papel y lápiz (ver a
continuación).
Figura 1. Resumen de las relaciones que se enseñaron (flechas negras) y que
se espera que emerjan (flechas grises). Las lecciones se indican con
números blancos en círculos negros. Ver el texto para la definición de
relaciones inversas y sin reversión. Los estímulos se muestran textualmente,
excepto los estímulos D, que se han parafraseado para facilitar la exposición.
Los estímulos D que los estudiantes vieron describían una hipótesis científica
y un resultado de investigación direccional. Hubo tres versiones de los
estímulos D (representa las predicciones de aumento, disminución y cambio
de la variable dependiente) en cada clase. Ver Fienup y Critchfield (2010)
para más detalles.
(Una unidad) revisó las relaciones de la Lección 1 en las que los estímulos
muéstrales fueron combinaciones D + A de la Lección 3 y los estímulos de
comparación fueron los estímulos B de la Lección 1. Antes y después de las
lecciones, los estudiantes completaron una prueba de papel y lápiz
(disponible del primer autor) que contenía 40 preguntas de opciones
múltiples, muchos de los cuales se basaron en preguntas que se habían
utilizado en exámenes anteriores en un curso de métodos de investigación.
Cada elemento incluía dos posibles respuestas, una que representa cada
una de las dos clases de estímulos que las lecciones fueron diseñadas para
crear, más una tercera opción que indica, '' No hay suficiente información
para decidir ''.
Figura 2. Arriba a la izquierda: porcentaje promedio de respuestas correctas en
la prueba preliminar de papel y lápiz (barras blancas) y la prueba final (barras
grises) para 27 estudiantes. Las barras de rango muestran +- 1 desviación
estándar. Arriba a la derecha: relación entre las puntuaciones de preprueba y
posprueba para estudiantes individuales. Los casos sobre la diagonal
representan mejoras desde la prueba previa hasta la prueba final. Abajo:
número promedio de estudiantes que respondieron correctamente las
preguntas de prueba y posprueba para los diferentes tipos de relaciones
emergentes y directamente enseñadas.
Las preguntas evaluaban (a) relaciones que fueron explícitamente
enseñadas durante las Lecciones 1 y 2 (15 artículos); (b) las relaciones que
se espera que emerjan, no enseñadas, basadas en las Lecciones 1 y 2
(nueve ítems); (c) relaciones contextuales no invertidas e invertidas que se
enseñaron explícitamente durante la Lección 3 (cuatro elementos cada una);
y (d) relaciones contextuales no invertidas e invertidas que se esperaba que
emergieran, sin enseñanza, basados en la capacitación de la Lección 3
(cuatro ítems cada uno). Para ser claros, las relaciones que la capacitación
podría haber establecido eran demasiado numerosas para evaluarlas
exhaustivamente en este formato de prueba; la evaluación de papel y el lápiz
simplemente se tomó como muestra de entre las muchas docenas de
relaciones que Fienup y Critchfield (2010) describieron y probaron en detalle.

RESULTADOS Y DISCUCIÓN
La Figura 2 (panel superior izquierdo, barra blanca) muestra que las
puntuaciones en la prueba preliminar con lápiz y papel tendieron a ser bajas
(rango, 33% a 73% correcto). El panel inferior (barras blancas) muestra que
los puntajes tendieron a ser bajos para cada uno de los varios grupos de
elementos que representaban los diversos énfasis temáticos de las lecciones.
Los resultados del entrenamiento posterior pueden ser descritos en dos
niveles de análisis. Primero, el entrenamiento se desarrolló rápidamente y
con pocos errores, de modo que los estudiantes lograron el dominio (12
respuestas correctas consecutivas) en menos de 20 intentos en 527 de 594
intentos iniciales en unidades de aprendizaje (27 estudiantes X 22 unidades
de aprendizaje). En segundo lugar, el dominio de la capacitación por lo
general se confirmó mediante verificaciones computarizadas de las
habilidades. En 94 de 108 controles de habilidades totales (27 estudiantes x
cuatro lecciones), los estudiantes lograron maestría (>89% de corrección) en
el primer intento. Debido a que 8 de las 14 fallas de primer intento ocurrieron
durante la Lección 1, estas pueden representar en parte el proceso de
adaptación de los estudiantes a un entorno de aprendizaje desconocido.
No observamos ninguna relación entre el puntaje pre-test y falla de
verificación de habilidades, pero los estudiantes que fracasaron en el intento
inicial de control de habilidades también tendieron a requerir más pruebas
para cumplir el criterio de dominio en las lecciones de unidades de
aprendizaje, en comparación con los estudiantes que pasaron el primer
intento. Esto fue cierto (a) durante la Lección 1 para la unidad preliminar
sobre desigualdades y para la primera unidad en la que se enseñaron
discriminaciones condicionales, y (b) durante la Lección 3 para varias
unidades que implican relaciones inversas, particularmente la primera en la
que las relaciones inversas fueron introducidas. Estos resultados sugieren
diferencias individuales en las que se puede anticipar la necesidad de
corrección en función del rendimiento del alumno durante el entrenamiento,
proporcionando así objetivos para los esfuerzos futuros para mejorar la
instrucción.
Aunque a veces se produjeron fallas en la verificación de
habilidades, la corrección posterior al error siempre produjo dominio de la
habilidad. Los estudiantes realizaron casi sin error en su intento final de
verificación de habilidades para la Lección 1 (M = 98% correcto, rango, 92%
a 100%), Lección 2 (M = 99%, rango, 93% a 100%), Lección 3 (M = 99%,
rango, 92% a 100%), y Lección 4 (M = 99%, rango, 92% a 100%). Por lo
tanto, los estudiantes finalmente aprendieron todo lo que se enseñó
directamente, y en los casos de las verificaciones de habilidades de la
Lección 1 y 2, también demostraron de manera confiable las habilidades
esperadas no enseñadas.
La Figura 2 (panel superior izquierdo, barra gris) muestra que los
estudiantes también tendieron a puntuar bien en la prueba posterior de papel
y lápiz (rango, 78% a 100% correcto). El panel superior derecho muestra que,
aunque hubo una correlación significativa entre las puntuaciones preprueba
y posprueba (r =.70, p, .0001), todos los estudiantes mejoraron en
comparación con el examen previo. Debido a que en la prueba posterior
cada estudiante obtuvo una puntuación más alta que la mejor puntación del
pretest, la diferencia entre la prueba previa y la prueba posterior fue
estadísticamente significativa, la prueba t para las puntuaciones
emparejadas, t (26) 5 23.92, p, .0001. Si se considera una escala de
calificación académica estándar como marco de referencia, 20 de 27
estudiantes lograron un puntaje en el post test equivalente a una A (90%
correcto), seis obtuvieron puntajes equivalentes a una B (80% correcto, con
cuatro puntajes de 85%), y el estudiante restante obtuvo una puntuación
equivalente a una C alta (78%). En general, las lecciones tuvieron éxito en el
desarrollo de habilidades de inferencia estadística, tal como se midió en las
pruebas de papel y lápiz.
La Figura 2 (abajo) indica que a nivel grupal agregado, las
ganancias post-test ocurrieron para todos los tipos de relaciones, aunque la
prueba de papel y lápiz incluyó muy pocos elementos para medir estos
efectos para estudiantes individuales. La precisión post-test fue similar para
las relaciones de las lecciones 1 y 2 que se enseñaron directamente contra
las que surgieron sin instrucción directa. La Lección 3 enseñó exitosamente
la toma de decisiones contextualmente controladas de hipótesis en que los
estudiantes generalmente respondían con precisión a preguntas sobre
relaciones no reversas (como se esperaba conforme lo enseñado en la
lección 2) y relaciones inversas (en las cuales se considera conjuntamente la
información estadística de la lección 1 y lección 2 hipótesis más resultados
la cual requirió decisiones de hipótesis diferentes a las basadas únicamente
en la información de la Lección 2). Las barras de la derecha muestran
resultados similares para las relaciones contextuales que se esperaba que
emergieran sin ser enseñadas en base al entrenamiento de la Lección 3. Es
decir, cuando la información estadística (estímulo A) que la Lección 3
empleó fue reemplazada por otros estímulos de la Lección 1, los estudiantes
generalmente respondían con precisión a las preguntas sobre las relaciones
inversas y no reversas.
Los resultados presentes replican ampliamente nuestros hallazgos
de laboratorio previos y refuerzan las expectativas de que las lecciones de
estadística se pueden emplear productivamente con los estudiantes en un
curso académico. Las porciones de capacitación de las lecciones (menos las
actividades administrativas y evaluaciones), que les tomó a los estudiantes
una media de 15 minutos (rango, 9 a 38) para completar, fácilmente podrían
caber en un período de instrucción de 50 minutos. Las evaluaciones
probablemente tendrían que tener lugar en otros días, lo que podría dificultar
el aprendizaje de dos maneras. En primer lugar, la evaluación diferida
introduce un riesgo de olvido (aunque algunos estudios de equivalencia de
estímulos sugieren que tanto las relaciones directamente enseñadas como
las emergentes son bastante resistentes al olvido, por ejemplo, Fienup y
Dixon, 2006; Rehfeldt y Root, 2004). Segundo, las pruebas en el mismo
formato utilizado en la capacitación pueden ayudar a promover relaciones
emergentes (Sidman, 1992); por lo tanto, dejar las comprobaciones de
habilidades de la Lección 1 y 2 para ahorrar tiempo de clase potencialmente
podría afectar los resultados del aprendizaje. Las aplicaciones en el aula
tendrán que enfrentar estos problemas.
Otro punto fundamental es que los participantes actuales
probablemente difirieron en aspectos importantes de los estudiantes que
están inscritos en un curso académico. Por citar solo un ejemplo, se puede
esperar que las contingencias de calificación de los cursos mejoren la
motivación del estudiante, aunque a veces hemos visto a los estudiantes
trabajar enérgicamente como voluntarios de investigación para obtener
créditos de bonificación incluso descuidando evaluaciones de cursos que
podrían hacer innecesario el crédito de bonificación. Solo los estudios de
campo pueden mostrar si tales factores afectarán sistemáticamente los
resultados del aprendizaje.

Con miras a las extensiones al aula, admitimos que los diseños


experimentales antes-después como el presente proporcionan solo
demostraciones débiles de aprendizaje estudiantil. De lo que los diseños de
antes-después carecen es de documentación clara, que los estudiantes
progresan solo con instrucción se pueden proporcionar a través de
evaluaciones de línea base repetida (para un ejemplo que involucra
instrucción basada en equivalencia, ver Fienup, Covey, & Critchfield, 2010) o
diseños de comparación grupal que involucran un grupo sin tratamiento,
como es común en los ensayos controlados aleatorios. Para que quede claro,
sin embargo, los controles sin tratamiento solo verifican que una intervención
funciona mejor que no hacer nada. Un objetivo a largo plazo de cualquier
investigación aplicada es determinar si una intervención funciona mejor que
los medios alternativos para cambiar el comportamiento (por ejemplo, Drake,
Latimer, Leff, McHugo y Burns, 2004). Los estudios futuros sobre la
instrucción basada en la equivalencia deben abordar no solo el contexto de
la aplicación sino también la eficacia relativa de la instrucción.

También podría gustarte