Teoría de la Generalizabilidad (TG): método para medir confiabilidad de pruebas

Teoría de la
Generalizabilidad (TG)
Teoría de la Generalizabilidad
(TG)
Permite medir la confiabilidad de una prueba por medio de la

cuantificación de la importancia de cada una de sus fuentes de
variabilidad.
Se redefine el error, como condición o faceta de medición,

utilizando el coeficiente de generalizabilidad como medida para
estimar la confiabilidad.
La teoría G es, así, una Para Shavelson y Webb (1991) Así, un solo puntaje obtenido
extensión de la teoría clásica de y Brennan (2001), en la teoría en una ocasión en particular,
los tests. En la teoría G se G la confiabilidad es medida en en una prueba con un(a)
aplican las técnicas de análisis relación con las diferencias que solo(a) observador(a) no es
de varianza para cuantificar la existen entre las personas, las totalmente fidedigno; es decir,
importancia de cada fuente de ocasiones en que se realice la es improbable emparejar el
variabilidad, además de las prueba, los(las) puntaje promedio de esa
diferencias individuales entre observadores(as) o persona en diversas ocasiones
los(as) examinados(as). calificadores(as) que de medición, con diferentes
intervienen, los ítems que se formas de la prueba, y con
utilicen y otras condiciones diferentes administradores(as).
presentes en el estudio. Usualmente, el puntaje de una
persona sería diferente en
ocasiones diferentes, en otras
formas de la prueba o con
observadores(as) diferentes.
Estas son algunas de las
fuentes más serias de
inconsistencias en los puntajes
de los tests.
Para Shavelson y Webb (1991), Un propósito de la teoría G es
así como para Brennan (2001), evaluar las fuentes de mayor
lo relevante en la teoría G es variabilidad, para que aquellos
que las múltiples fuentes de componentes de variabilidad no
variabilidad pueden estimarse deseados puedan reducirse
separadamente en un solo cuando se recolecten datos en
análisis, si se diseña el futuro. Por ejemplo, si en una
apropiadamente el estudio de prueba de ciencias no se desea
confiabilidad. Este modelo que el conocimiento
permite tomar en cuenta las extracurricular de los
múltiples fuentes de estudiantes sobre hámsters
variabilidad, lo cual ayuda al influya en la calificación de la
(la) investigador(a) a prueba, los ítems que la
determinar cuántas ocasiones, componen no deberían contener
formas de la prueba y enunciados que refieran a ese
observadores(as) son tema específico, puesto que si
necesarios para obtener existieran tales reactivos,
puntajes de alta precisión. algunos(as) examinados(as)
Como resultado de los análisis tendrían probablemente
con la teoría G, se puede ventajas sobre otros(as), si
calcular un indicador sumario poseen hámsters como
que es análogo al coeficiente de mascotas o han tenido
confiabilidad (alfa de Cronbach) experiencias previas con ellos.
de la teoría clásica de los tests;
éste es llamado “coeficiente de
generalizabilidad”.

La teoría G expresa la magnitud de variabilidad en términos de componentes de varianza. En el diseño de una faceta,

según lo se que describe en la Tabla 1, los componentes de varianza son
En el caso de los estudios de medición que se realizan en psicología y educación, se requiere

usualmente más de una faceta, debido a su complejidad en términos de fuentes de variación.
Para un diseño de dos facetas, por ejemplo, el universo de observaciones podría estar definido por ítems y
observadores(as), representando cada uno una faceta; es decir, el universo de puntajes sería definido por todos
los posibles reactivos, con todos(as) los(as) posibles observadores(as). Otra ilustración de un diseño de dos
facetas sería uno en donde las fuentes de variabilidad, además de las personas, sean los(as) observadores(as),
y/o calificadores(as) y las ocasiones (o momentos) de medición, como podría ser el caso de una evaluación
médica en la cual cada paciente es valorado por dos profesionales en dos momentos diferentes del día,
Este diseño de dos facetas presenta específicamente las siguientes
obteniéndose cuatro mediciones en total para cada paciente. Un diseño de este tipo se ilustra en la Tabla 2.
fuentes de variabilidad:
Efectos principales
Personas (p): Varianza del puntaje-universo (objeto de medida).
Calificadores (c): Efecto constante en todas las personas, debido a la rigurosidad o
laxitud en los puntajes otorgados por los calificadores(as).
Ocasiones (o): Efecto constante en todas las personas, debido a sus inconsistencias
de comportamiento de una ocasión a otra.
Interacciones
p x c: Inconsistencias en la evaluación de los calificadores(as) u observadores(as)
debidas al comportamiento particular de las personas.
p x o: Inconsistencias de una ocasión a otra en el comportamiento particular de las
personas.
o x c: Efecto constante para todas las personas debido a diferencias en la rigurosidad
de los calificadores(as) de una ocasión a otra.
p x c x o, e: Residuo. Consiste en todas las combinaciones únicas de p, c y o; facetas
no medidas que afectan toda la medición; y/o eventos aleatorios.
La teoría G utiliza el ANOVA para distinguir las fuentes de variación entre una y
otra observación. En las aplicaciones tradicionales se usa el ANOVA para identificar
fuentes de variación en una variable de respuesta o dependiente, según los efectos de
ciertas variables independientes, sus combinaciones (interacciones), y el error. En el
caso de la teoría G, el ANOVA se emplea para conocer el efecto de cada faceta o
fuente de variabilidad sobre las observaciones (efectos principales) y el efecto de
cada combinación de estas facetas (interacciones). El ANOVA logra esta partición
trabajando con componentes de varianza. En consecuencia, en investigaciones
sustantivas, la varianza total se divide en las fuentes independientes de variabilidad,
debida a cada variable independiente, sus interacciones y el residuo.
Interpretación de resultados en un estudio de generalizabilidad
Para llevar a cabo el análisis con esta teoría, debe considerarse el tipo de decisión que se requiere tomar con base en los puntajes observados, debido a que afecta directamente la interpretación
de los resultados. Se debe distinguir entre decisiones basadas en interpretaciones referentes a normas y decisiones basadas en interpretaciones referentes a criterios.
En el primer caso se habla de interpretaciones relativas, donde el resultado se expresa de acuerdo con la posición relativa que ocupa el desempeño de una persona particular, comparado con los
otros(as) examinados(as). Por ejemplo, en un examen de Español de sexto grado, el desempeño de un(a) estudiante particular se puede describir como igual o mayor al del 80% de los(as)
estudiantes que realizaron la prueba.
En el segundo caso se dice que se trata de interpretaciones absolutas, las cuales son utilizadas para describir lo que una persona puede o no hacer, sin tomar como referencia el desempeño de
otros(as). Por ejemplo, describir tareas de aprendizaje específicas de un(a) estudiante con respecto a un desempeño óptimo o aceptable (memorizar el alfabeto, deletrear correctamente el 70%
de las palabras de una lista, etc.).
A partir de estas dos interpretaciones se derivan dos tipos de pruebas o tests, que según Linn y Gronlund (2000) son los siguientes:
Como se afirmó
anteriormente, el(a)
Test referido a criterios:
Test referido a normas: investigador(a) o
es un test diseñado para
es un test diseñado para tomador(a) de decisiones
suministrar una medida
suministrar una medida desea generalizar el
del desempeño que es
del desempeño que es puntaje observado de una
interpretada en términos
interpretada en términos muestra de medidas
del grado de dominio de
de la posición relativa de hacia el universo de
la persona sobre un
la persona en un grupo puntajes. La inexactitud
conjunto claro y
conocido. de la generalización es
delimitado de tareas.
llamada error de
medición.
Zúñiga-Brenes, María Elena, & Montero-Rojas, Eiliana. (2007). Teoría G: un futuro
paradigma para el análisis de pruebas psicométricas. Actualidades en
psicología, 21(108), 117-144. Recuperado em 20 de abril de 2021, de
http://pepsic.bvsalud.org/scielo.php?script=sci_arttext&pid=S0258-
64442007000100006&lng=pt&tlng=es.

Teoría de la Generalizabilidad (TG): método para medir confiabilidad de pruebas

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoría de la Generalizabilidad (TG): método para medir confiabilidad de pruebas

Cargado por

Copyright:

Formatos disponibles

Teoría de la

Permite medir la confiabilidad de una prueba por medio de la

Se redefine el error, como condición o faceta de medición,

En el caso de los estudios de medición que se realizan en psicología y educación, se requiere

También podría gustarte