Está en la página 1de 10

GRUPO 3: MAPA CONCEPTUAL CAPÍTULO 4

Joyce Chamorro, Candy Llumitasig, Kevin Oña, Jean Pardo, Carolina Tipán

Carrera de Psicología, Universidad Politécnica Salesiana

Semestre IV, Grupo III: Instrumentos de Evaluación

Dra. Lia Fernanda Peñaherrera Aguirre

4 de mayo del 2023


Los instrumentos de
medición psicológica
necesitan demostrar su
utilidad y validez
En psicología, la científica El objetivo de la psicometría
psicometría es la que es proporcionar modelos para
garantiza que los transformar los hechos en
instrumentos de medición datos con la finalidad de
elaborados cuenten con asignarles valores numéricos
las garantías científicas a los sujetos, sobre la base
para su uso. de sus respuestas

FUNDAMENTOS PSICOMÉTRICOS
EN LA EVALUACIÓN En este capítulo

PSICOLÓGICA
La psicometría es el estudiaremos cuáles son
conjunto de métodos, los fundamentos
técnicas y teorías psicométricos que
implicados en la medición caracterizan a la
de variables psicológicas; evaluación psicológica;
La psicometria estudia
las propiedades métricas
exigibles en las
mediciones psicológicas y
establece las bases para
que éstas se realicen de
manera adecuada.
La psicometría trata de todo En 1947, Thurstone publica
aquello relacionado con la En 1931, Thurstone publica su su obra Análisis Factorial
medición psicológica; en libro “The Realibility and Múltiple, en donde
particular, y lo que la hace Valididy of Tests desarrolla esta técnica
diferente de otras disciplinas (Confiabilidad y validez de estadística que es utilizada
psicológicas, es especializa las pruebas). ampliamente en la
en las propiedades métricas construcción, análisis y
que dichas mediciones deben validación de las pruebas.
Definición poseer, independientemente
del campo de aplicación y de
y reseña los instrumentos utilizados
En 1936, se funda la Sociedad En 1950, Gulliksen publica un
histórica Psicométrica Americana, bajo la
dirección del mismo Thurstone,
libro en el que expone y
sintetiza todo lo realizado
quien crea también la revista que hasta entonces sobre la
ENTENDEMOS ASÍ POR publicará a partir de esa fecha teoría clásica de los tests:
PSICOMETRÍA ES EL CONJUNTO todo lo relacionado con la Theory of Mental Tests
DE MODELOS FORMALES QUE psicometría:
ESTABLECEN LAS BASES PARA
QUE SE LLEVE A CABO DE
MANERA ADECUADA LA
MEDICIÓN DE VARIABLES En 1946, Stevens da a conocer su En 1954, se editan las
PSICOLÓGICAS, CON EL FIN DE trabajo sobre las Escalas de primeras recomendaciones
PROPORCIONAR LOS MÉTODOS Medición (nominal, ordinal, de técnicas para el uso de las
PARA PODER TRANSFORMAR LOS
intervalo y de razón), sus pruebas: Technical
propiedades y relaciones, así Recomendations for
HECHOS EN DATOS, MEDIANTE
como sus implicaciones en el uso Psychological Tests and
LA ASIGNACIÓN DE VALORES de las distintas técnicas Diagnostic Techniques.
NUMÉRICOS estadísticas.
Reconocer que toda medida psicológica, al igual PROBLEMAS
que las medidas de las ciencias físicas, contiene No existe una sola aproximación a la medición de
un término de error un constructo que sea universalmente aceptada;
Al respecto, Martínez (1996) considera que aunque esto es, siempre existirá la posibilidad de que dos
en todas las ciencias el conocimiento de las teóricos seleccionen diferentes tipos de conducta
propiedades de los instrumentos de medida es para la definición operativa del constructo
fundamental, el psicólogo debe poner más
atención en la elaboración de sus instrumentos

La teoría de las pruebas tiene que ver con el estudio


de los problemas anteriores y con la búsqueda de
TEORÍA Las medidas psicológicas se basan en muestras limitadas
de conducta; nunca se medirá exhaustivamente la
métodos para su solución. Mientras que la
evaluación psicológica pone el acento en los
contenidos sustantivos y en la interpretación de las
CLÁSICA conducta, sino sólo una muestra representativa.
La medida obtenida siempre tiene error; una de las
principales cuestiones en psicología es estimar ese error
Falta de escalas con origen y unidades de medida bien
pruebas, la base de la teoría de las pruebas se
interesa por la adaptación de la estadística y el
diseño experimental
DE LAS definidas. No siempre una puntuación de cero significa
ausencia del atributo medio

La teoría de las puntuaciones verdaderas y el error


PRUEBAS
dentro de un marco correlacional y aplicada a las
puntuaciones de las pruebas; a este modelo se le Teoría clásica de las pruebas, esperamos que en la
conoce como Modelo Lineal Clásico de Spearman y es medición de atributos psicológicos, la puntuación
el que se usa en la actualidad en la teoría clásica de las obtenida por un sujeto en una prueba se acerque lo más
pruebas posible a su ejecución real con el mínimo posible de
X=V+e errores esto es, que el instrumento sea confiable para
En donde: X es la puntuación empírica de un sujeto medir el atributo que nos interesa
V es la puntuación verdadera
E es el término de error

FUENTES DE ERROR EN LA MEDICIÓN EN


PSICOLOGÍA
CONFIABILIDAD
confiabilidad sería la ausencia de errores de
medición ELECCIÓN DE LOS REACTIVOS APLICACIÓN DE LA PRUEBA
El autor de una prueba, una vez que elabora un Hay factores que no se pueden controlar: un
conjunto de reactivos para medir el atributo meta, espacio no muy bien iluminado, libre de ruidos y
debe decidirse por seleccionar una muestra de distractores, mesa y silla cómodas, etc.,
ellos; ¿cómo elegirlos para que realmente sea Condiciones físicas del que está tomando la
No es un asunto de todo o nada, sino
representativa, para que sea equitativa en cuanto a prueba: cansancio, falta de motivación, ansiedad,
una cuestión de grado: es un continuo los diferentes rubros que su prueba tiene? preocupación, hambre, sueño, sed y, en general, los
que abarca desde la consistencia mínima Una prueba bien diseñada y construida, debe estados emocionales; no siempre es posible
asegurar que la muestra de reactivos contenga controlar estos factores y forman parte del error
de una medición a la casi perfecta
todos los tipos de contenidos que intenta medir, y aleatorio de medida.
repetibilidad de los resultados; las de manera equitativa.
pruebas psicológicas se encuentran en
algún lugar dentro de este continuo
(Muñiz, 2003).
ERRORES ALEATORIOS O
CALIFICACIÓN
DECORACIÓN
DE LA PRUEBA
ERRORES NO SISTEMÁTICOS
Hay reactivos cuya respuesta tiene que valorar y
calificar el evaluador; por ejemplo, en las pruebas contribuyen de manera aleatoria a la puntuación de
de inteligencia, cuando existen preguntas abiertas los sujetos, a veces lo favorecen y otras lo
en psicología, es difícil utilizar este como: ¿qué harías si te encontraras una mochila perjudican, y su efecto sobre la confiabilidad sería
término en la medición de atributos tirada en el patio de tu escuela?, el evaluador tiene no significativo. Sin embargo, existen otros errores,
que decidir, de acuerdo con la respuesta dada por los sistemáticos, que son los que realmente le
psicológicos, como alternativa se el evaluado, si le otorga la calificación de 0, 1 ó 2 preocupan a los constructores de pruebas, ya que
utilizan sinónimos como estabilidad puntos. atentan de manera significativa contra la
confiabilidad del instrumento.
de la medida y consistencia interna
SIN EMBARGO, CUANDO MEDIMOS CONSTRUCTOS PSICOLÓGICOS, NO ESPERAMOS
CONFIABILIDAD UN GRADO DE ERROR TAN PEQUEÑO COMO CUANDO MEDIMOS OBJETOS FÍSICOS.

COMO
ESTABILIDAD DE
Para evitar amenazas que compiten con la
LA MEDIDA Para conseguir este tipo de confiabilidad existen
dos técnicas: obtención de la confiabilidad por los
medición de la confiabilidad, se podría disponer de
dos pruebas equivalentes o paralelas; sin embargo,
métodos test-retest y formas equivalentes de
al elaborarlas nunca tendríamos la certeza de que
prueba o pruebas paralelas.
realmente posean el mismo grado de dificultad
para medir el atributo en cuestión, además del alto
La estabilidad de la medida se refiere a costo y tiempo que implicaría elaborar dos pruebas
que al medir un atributo psicológico con psicológicas. Por ello, los constructores de pruebas
un determinado instrumento, éste será TEST - RESET le siguen dando prioridad a la técnica test-retest
confiable si al evaluar a los mismos Se aplica la prueba a una muestra y se vuelve a para obtener la confiabilidad de sus instrumentos
aplicar un tiempo después. Si la prueba careciera de medición.
sujetos con el mismo instrumento o con
totalmente de errores de medición y el paso del
uno equivalente, las medidas obtenidas tiempo no fuera un factor importante en el atributo
en la segunda aplicación son muy a medir, se esperaría que cada sujeto evaluado
similares a las obtenidas en la primera, obtuviera exactamente la misma puntuación. Si
éste fuera el caso, al graficar los datos y obtener el
coeficiente deDECORACIÓN
esto es, son estables a través del tiempo,
correlación r de Pearson
lo cual indicaría que los errores de
medición serían mínimos y, por lo tanto,
la confiabilidad sería aceptable; las
diferencias encontradas entre una
medición y otra se atribuirían a los
errores aleatorios asociados al proceso
de medición y no al instrumento
(Muñiz, 2003 )
los sujetos que poseen el atributo medido de forma:

Elevada: No poseen el atributo o poca cantidad


Los reactivos de un instrumento dado son consistentes entre sí En la forma en que evalúan el atributo psicológico propuesto

tendrán un puntaje alto en los reactivos de la misma un puntaje bajo

Esta forma de obtener la confiabilidad tiene la ventaja de: es necesario aplicar la prueba dos veces. Con una basta

Generalmente los reactivos nones- con los de la otra mitad -los reactivos pares Utilizando para tal fin la fórmula de correlación corregida Spearman-Brown si la puntuación de los reactivos de la prueba es dicotómica

Se correlacionan los reactivos de una mitad de la prueba


la fórmula Kuder-Richardson

parte del supuesto de que ambas mitades son equivalentes como si se aplicaran dos pruebas cortas equivalentes.

Confiabilidad de división por mitades


Se utiliza en pruebas que miden habilidades intelectuales. por este método recae en la supuesta equivalencia de ambas mitades de la prueba,

Es dudosa su utilización en pruebas que miden constructos del área emocional o no intelectual

se podría obtener la media de los coeficientes por mitades de todas las posibles formas de
Hay dos formas de obtener la confiabilidad Cronbach acotó que para no depender de una sola división
dividir la prueba en dos

se considera como la media de todas las correlaciones que pudieran obtenerse al dividir la prueba en todas las posibles mitades

Consistencia interna de los reactivos individuales Se mide la consistencia in-terna de los reactivos individuales por medio del coeficiente Alfa de Cronbach se incluye el reactivo 8a y en la segunda el reactivo 8b

Se otorga un punto por cada reactivo par contestado afirmativamente y por cada reactivo non
contestado negativamente.
La consistencia interna

1. ¿El lugar donde estudia es incómodo y con mucho ruido?


2. ¿Deja sus problemas personales cuando va a estudiar?
3. ¿A la hora de realizar un trabajo se da cuenta de que no ti ene todo a la mano?
4. ¿Subraya las ideas más importantes del texto?
Los reactivos son los siguientes Ejemplo 5. ¿Le da pena preguntar al profesor cuando no entiende algo en clase?
6. ¿Busca en el diccionario las palabras que no entiende cuando está leyen-do un texto?
7. ¿Se aprende de memoria lo que no entiende?
8a. ¿Acostumbra hacer resúmenes o esquemas cuando está estudiando?
8b. ¿Sus zapatos actuales son incómodos?

El sujeto contesta afirmativamente los reactivos 2, 4, 6 y 8a, y negativamente los reactivos 1, 3,


5 y 7, obtendrá la puntuación más alta; a más alta puntuación

El Alfa de Cronbach Primera versión


El número de todas las formas o combinaciones posibles de ocho elementos o reactivos
Al dividir la prueba en todas las mitades posibles en este caso los reactivos miden consistentemente el atributo medido.
tomados de cuatro en cuatro es igual a 70

A una población determinada y correlacionáramos las puntuaciones obtenidas de las 35 Y ese reactivo es inconsistente, comparado con los demás reactivos,
Si aplicáramos la segunda versión con el reactivo 8b, a una población determinada
posibles parejas de reactivos, aquella mitad donde quede ubicado el reactivo 8B Para medir el atributo de interés.

Nos proporcionaría, además de un índice de correlación el conocimiento de qué reactivo Es el que se está comportando de manera inconsistente y produce un nivel bajo de confiabilidad

En sentido psicométrico si consistentemente produce


Una prueba es confiable si consistentemente produce los reactivos que la componen son consistentes entre sí En la forma en que miden el atributo propuesto por la prueba
al ser aplicada en repetidas ocasiones

Es válido si hace aquello para lo que fue concebido La validez concierne a lo que ésta mide su eficacia y lo que podemos inferir de los puntajes obtenidos en la prueba

Ejemplo: Si cambiamos el agua a otro recipiente

Una medida puede ser confiable sin ser válida Ejemplo podemos utilizar una cinta métrica y medir en una jarra el nivel en donde se encuentra el agua Es medida confiable, pero no válida
La medida será diferente y no podremos generalizar lo medido

No podremos generalizar lo medido no es válido medir capacidad con un instrumento que mida longitud

No tendría sentido hablar de validez de un instrumento de medición no mide el atributo de manera confiable.
Necesita primero ser confiable

La confabilidad condición necesaria pero no suficente para la validez

- El grado de adecuación,
Para que una medida sea válida
- Significación
El estudio de la validez de un instrumento Se refiere básicamente a validar los datos proporcionados por éste:
- Utilidad de las inferencias específicas que pueden derivarse a partir de las puntuaciones de las
pruebas

Se valida la interpretación de los datos obtenidos por medio de un procedimiento específico, las
Lo que se valida no es el instrumento
inferencias

Un instrumento de medición Podemos deducir de la ejecución de un sujeto en una prueba

Confiabilidad como Validez


consistencia interna
Si la conducta mostrada en la situación de prueba es o no un reflejo de La conducta habitual del sujeto en situaciones naturales.

- Investigaciones empíricas - La clase de validez que se desea establecer


La validación requiere de depende de
- El tipo de datos necesarios para ello -El uso que se les dará a los datos obtenidos con la aplicación de la prueba

Al igual que la confiabilidad La validez no es una cuestión de grado

una prueba sólo es válida para La finalidad específica para la que fue construida

Ninguna prueba es válida en general


- Para todos los propósitos de evaluación
Puesto que las pruebas se emplean para diversos fines no existe un solo tipo de validez
- En el evaluador recae la responsabilidad del empleo válido de los resultados de la prueba.

- Las relaciones entre la ejecución


Todos los procedimientos para determinar
conciernen a - Otros hechos observables de manera independiente acerca de las características de la
la validez de una prueba
conducta que se estudia.

Validez de constructo
Los tipos de validez que los Standards of the American Psychological Association han
según el tipo de prueba y el uso al que esté destinada Validez de criterio
establecido
Validez de contenido

Es algo que no existe como dimensión de conducta observable


En la medida en que alguna variable es abstracta Hablamos de ella como un constructo
Un constructo se desarrolla para explicar y organizar consistencias de respuestas observadas ej. inteligen-cia o personalidad

se basa en el significado psicológico del puntaje de una prueba y en la explicación teórica de la ejecución del sujeto

La validez de constructo
Se intenta saber qué propiedades psicológicas o de otra índole pueden explicar la varianza de
esas pruebas
Cuando se indaga la validez de los constructos de las pruebas psicológicas

Se intenta saber qué propiedades psicológicas o de otra índole Explicar las diferencias individuales Observadas en las puntuaciones del instrumento Trata de validar la Prueba y teoría

1) Especificación del dominio de las conductas observables


Hay tres aspectos principales 2) Determinar hasta qué punto todas o algunas de esas conductas se correlacionan entre sí
3) Precisar si una, algunas o todas las medidas de tales conductas actúan, como si midieran el
constructo

Los puntajes mayores en esta prueba, que indicarían mayor ansiedad, se encontrarían en el caso
Se supone que una prueba determinada mide el constructo “ansiedad” sentido común sugiere de pacientes clasificados como “neuróticos ansiosos” con mayor probabilidad que en pacientes
no clasificados como tales
ejemplo

Que correlacionara por lo menos moderadamente con las calificaciones escolares, las con-
Validez de constructo Se establece que una determinada prueba mide el constructo “inteligencia” Se esperaría sideraciones acerca de la inteligencia hechas por profesores y con los niveles de realización
profesional.
La prueba suficiente de la validez de constructo Las medidas del constructo se comporten como se espera

Se utiliza la Relaciona los valores obtenidos en la prueba con medidas que


R de Pearson se supone teóricamente se correlacionan con el constructo
Se esperan ciertas relaciones con otras variables Para obtener un índice numérico de la validez de constructo

O con otra prueba que mida el mismo constructo y que ya esté validada.

El propósito de la validez de constructo Validar la teoría subyacente al sistema de evaluación y a la medida misma.

Los constructos Un instrumento de medida

Determinan qué conductas han de seleccionarse para su observación y la situación en la que Estará ligado al sistema de constructos dentro del que fue construido Nos indicará el grado en que el instrumento de evaluación es una medida adecuada del
ésta será aplicada. constructo y en qué grado alcance también las hipótesis

pueden confirmarse mediante la utilización del instrumento en cuestión.


Situaciones futuras ( validez predictiva), aptitudes para el Se utiliza para estimar a futuro una conducta llamada
aprendizaje. ( criterio ).

Medida directa e independiente de lo que la prueba predice , Una vez determinado el criterio, se elaboran reactivos que
tendrán correrlacion unas a otras.
Martínez (1996), se correlacionan los puntajes obtenidos en
una prueba. Se correlacionan los puntajes de la prueba con los puntajes de
la variable criterio.
Lo importante es la capacidad predictiva de la prueba, se
caracteriza por la predicción relacionada con un criterio Valora el grado en el que un instrumento de evaluación puede
externo. utilizarse para estimar la conducta de una persona en una
situación.
Recurrer a la comprobación del instrumento de medición ya
sea en presente o futuro y lo compara con un resultado o Diagnostica enfermedades tales como la:
medida. esquizofrenia,hipocondriasis y trastorno obsesivo-
compulsivo.

Demostrar que los reactivos de la prueba son una muestra


La validez depende primordialmente de la suficiencia con que
representativa y asegurar un muestreo cuidadoso de un
se muestra un dominio de contenido, debe ser una medida
dominio relevante.
adecuada de lo que evalúa.
Es el grado en que un conjunto de reactivos representa
Es la representatividado adecuación muestral del contenido
adecuadamente un dominio o universo de conductas.
dell instrumento de medición.
Martinez (1996) menciona que existen dos aspectos: 1) que el
Toda propiedad psicológica posee un universo teórico de
instrumento no incluya aspectos irrelevantes de la conducta
contenido que se puede afirmar u observar
de interés 2) que el instrumento contenga aspectos
importantes que definan el dominio Incluye el examén sistemático del contenido de la prueba para
conductual.. determinar una muestra representativa del dominio de
conductas.
Ejemplos de pruebas de validez de contenido son: prueba de Lo que interesa es si la respuesta a los reactivos de estímulo
percepción visoespacial de Frostig DTVP-2, Prueba de representan un conjunto de respuestas y condiciones.
ansiedad para niños CMASR-2 mide errores de tipo disléxico.

Hoste (1981), menciona que no existe un modo aceptable para


cuantificar la validez de contenido, por lo tanto, no puede ser
expresada como un coeficiente de validez.

Una prueba para aplicarla debe tener datos de confiabilidad y


validez solo de este modo se podrá obtener los resultados.

También podría gustarte