Psicometría Resumen

Resumen 1° parcial Psicometría
Psicometría: campo de psicología→ especializado en medición→ prueba de lo mental.

objeto: soluciones al problema de medición en psicología.
 Medida indirecta→ problemas de medición, mide→ no se ve directamente en sujeto.
 Variables psicológicas→ muchos cambios
 Cada test evalúa→ constructo (relacionado con concepto→ variable→ no toda variable
es constructo→ semejantes)
 V.→ susceptible de cambio→ interés del investigador.
 Constructo: concepto abstracto con caracteres→ serán observados x indicadores→
interés de evaluar. Puede→ distintas dimensiones→ explicarse cuando se toma test.
Test: “procedimiento estandarizado→ muestrear conductas de personas a partir→ serie de

indicadores→ puntuarlas→ inferir nivel verdadero en constructo o variable latente”
 Todo test→ cambiando. Sumar todo y dar resultado→ puntuación total.
 Medición→ asignar puntajes a cosas según ciertas reglas
 Evalúa no todos constructos posibles→ conjunto de ellos
 Indicador: preguntas. Características→ representan lo que se evalúa.
 Nivel verdadero: en todo constructo→ lo que quiero medir.
 Error de medición→ lo que no quiere medir (lo menor posible.)
 NO es encuesta
Características:
 Propiedades psicométricas: validez (evaluar lo que quiere) confiabilidad (medida, cuán
preciso es test, cuántos errores tiene).
 Elaborados x normas de construcción (escalamiento: proceso: asignación de normas).
 Requiere→ administración controlada (condiciones de administración y puntuación).
Condiciones de administración. No todo test→ puntuado de misma manera.
 Pretende evaluar a persona en atributo de interés (constructo).
Uso ético de test: ética y profesional

1. Evaluación, diagnostico, intervenciones profesionales :
-Psicólogos→ solo en contexto de relación profesional definida.
-Evaluaciones, recomendaciones, informes, diagnósticos→ basados en info y técnicas
suficientes para dar fundamentación de hallazgos.
2. Criterios para valoración de test:
1. ¿esta bien definido el marco y especificaciones del constructo? Debe tener
definición de constructo. Dimensiones: explicadas.
2. ¿hay instrucciones estandarizadas adecuadas a población?→ consigna y manera
de responder preguntas
3. Test con elemento de dificultad, ¿están elementos ordenados x dificultad creciente?
Test aptitudes (niveles habilidad) o actitudes (nivel percepciones)
4. ¿se especifican procedimientos en muestreo de ítems? De que manera se eligieron
ítems de versión final→ por qué se mantuvieron.
5. ¿tiene instrucciones para tratamiento de adivinación o azar? Hay ítems que
personas deben alterar forma en que responden (aquiescencia, deseabilidad social).
Hay ítems→ evalúan deseabilidad, engaño→ penalización x respuesta errónea.
6. Si incluye opción ## ¿especifica significado? ej.: 1. Nunca 2. A veces 3. Nunca.
7. ¿se analizó sesgo o validez diferencial para grupos sociodemográficos? Ej.: mujeres
responden similar a hombres en este ítem.
8. ¿hay buena recepción de sujetos? Instrumento→ diseñado para evaluar personas
que va dirigido.
9. ¿provoca recelos, suspicacias en sujetos? Ej.: personas pueden sentirse libres a
contestar o respuestas ponen en peligro su trabajo.
10. ¿hay en manual info suficiente sobre propiedades estadísticas? Valores→
confiabilidad, validez. TRI: ¿ítems están calibrados?
11. Si hay tiempo límite, ¿especificado?
12. ¿es fiable forma de corrección y puntuación? Experiencia y habilidad para usarlo.
13. ¿es clara la hoja de respuestas, que no haga tarea de más es resolución de
problemas? Se responde fácil o se requiere más conocimiento.
14. ¿especifica diferentes muestras, diseño muestral de su tipificación? ¿baremos?
¿Cómo se obtuvo muestra?
15. ¿refleja el manual la bibliografía usada del atributo del test?
Normas mínimas para uso de test
 Evitar errores al puntuar y registrar resultados
 No etiquetar personas por sus puntuaciones
 Tener seguras las plantillas y materiales
 Que todos los examinados sigan instrucciones
 Aplicar en condiciones en que haya rendimiento óptimo.
 No entrenar a personas en ítems
 Estar dispuesto a interpretar puntuaciones y aconsejar a sujetos en sesiones para eso.
 No fotocopiar material psicotécnico
 No usar hojas de respuesta caseras con menos precisión
 Hacer buena relación con sujetos
 No responder preguntas de sujetos con mas detalle que permite el test
 No asumir que norma para test vale para otro, igual con los grupos.
Confidencialidad de resultados
A menos que se informe a sujeto→ evaluación excluye explicación de resultados, hay que
asegurar explicación de ellos→ lenguaje entendible. Se toma medidas para dar explicaciones a
sujetos independientemente de quien interpretó resultados.
Consentimiento informado
 Sujetos deben poder decidir, tener info necesaria→ entenderla y ejercer libertad.
 Elementos: voluntario o consentido, declaración adecuada y competencia.
Recomendación en adaptación a otras culturas
 - diferencias culturales no relevantes. Hacer - cuantías de solapamiento de constructos.
 Asegurar→ adaptación lingüística y cultural para población dirigida
 Lenguaje en instrucciones, ítems y manual→ apropiados a población
 Técnicas de evaluación, formato ítems, reglas de test y procedimientos→ familiares.
Medición
Russell: medición de magnitudes→ método→ establece correspondencia única, reciproca entre
magnitudes y números.
Desde revolución industrial→ formas de medición de hoy.
Problema de la medición en psicología:
 ¿Por qué números?: comunicar y entender lo mismo. Posible→ mediciones de muchos
aspectos→ comunicar de forma entendible. Hoy→ no actividad que no tenga medición.
 Lenguaje universal.
 Facilitan descripción objetiva, análisis, comunicabilidad.
 Complejidad de comportamiento humano: es tan variado como personas hay, cada
persona→ valorar de distintas maneras al mismo comportamiento
 Constructos tienen referentes: relaciones lógicas entre conceptos
 Limitaciones de instrumentos usados: limitados (evalúan un constructo cada uno), si
cambia la cultura→ modificar instrumento
 Medición constructos abstractos: variables latentes, no observables, no medición directa
Campbell
 Asignación de números para representar propiedades de sistemas materiales en virtud
de leyes que las gobiernan
 La medición autentica→ se miden las variables cuantitativas con escala de razón
 Completo isomorfismo entre propiedades y matemáticas
 Concepción restrictiva, limitante.
Stevens
 “asignación de numerales a objetos, eventos x ciertas reglas”: cambió, no habla de
asignación de números.
 Asignación: correspondencia entre conjuntos
 Numerales: símbolos con significado, son adjetivos.
 Reglas: guía, método.
 Propone los niveles de medición
 Numerales: cardinales: señalan cantidad exacta, número entero, ej. Dos panes
Ordinal: orden opuesto ej.: segundo piso
Partitivo: división de la unidad: ej.: medio pollo
Múltiplo: multiplicación ej.: doble queso
Distributivo: repartición ej.: ambas manos
El hecho de que los números puedan ser asignados según ciertas reglas…
Variables y niveles o escalas de medición:
 Cualitativas y cuantitativas
 Nominal→ ordinal→ intervalo→ razón
Test psicológico como mucho debe→ nivel intervalar→ números→ relativos a preguntas.
Nominal: nombres o números para agrupar datos en grupos o categorías.
 El orden sin significado
 Operaciones: no se puede→ cálculos.
Ordinal: se puede establecer orden determinado entre categorías
 Relación de “mayor que” sin establecer la magnitud de la diferencia
 Operaciones: se pueden→ media y mediana
Intervalar: sus categorías→ ordenar en intervalos iguales
 El punto cero→ arbitrario
 Operaciones: suma y resta
Razón: posible medir la magnitud absoluta de la característica. Números absolutos.
 Cero→ ausencia de característica
 Operaciones: todas.
Stevens: es posible alcanzar distintos niveles de isomorfismo entre propiedades números y
propiedades de lo que medimos.
Problema: medimos objetos, “nunca se miden personas sino atributos o variables que poseen”.
Propuesta: solución más factible en estado actual de psicometría.
Campbell: representa estándar optimo, pero difícilmente alcanzable hoy.
Definiciones
Delimita conceptos, caracteriza lo esencial. Es determinar diferencia especifica. En ciencia:
explica contenido de un concepto.
Constitutiva: define constructo x medio de otro.
Operacional: operaciones→ determinan presencia/ausencia de fenómeno→ mediciones,
registros numéricos→ en técnicas estadísticas→ debe operacionalizar constructos.
Variable: característica observable. Operacionalizando constructos→ variables que resulten. No
constantes. Categorías: valores de V.→ al menos 2.
Definición depende de la teoría→ incluye diferenciación, dependencia (cómo es en otros
términos). Forma de medirla depende de medida que se use para representarla, quienes
responden, condiciones y contexto, análisis.
En psicología→ diferentes:
 Posiciones teóricas sobre la medición autentica : desde la profesión→ defender el
trabajo realizado, tener postura clara y fundamentarla.
 Concepciones acerca de la ciencia: no se puede medir→ no se hace ciencia. En un
momento→ dudaba que la psicología no era científica, desde la psicometría también.
 Enfoques sobre naturaleza humana: qué es hombre→ actividades y formas de medirlo.
Isomorfismo:
Propiedades, aspectos de objetos→ isomorfismo→ propiedades de números.
Medición implica equivalencia de formas, entre estructura, sistema numérico y estructura de lo
que se mide: equivalencia→ propiedad que estudio, su número. Que propiedades puedo agregar.
Es→ número tiene todas propiedades de número: en investigación y medición no todos números
tienen el mismo nivel de medición y no pueden aplicarse todas las propiedades o magnitudes.
Isomorfismo completo→ número→ todas las propiedades de este. Medición implica
isomorfismo. Si es completo o parcial se podrá medir mejor.
Reglas: para representar propiedad→ isomorfismo entre características de sistema numérico y
relaciones entre cantidades de la propiedad
Medición de variables psicológicas
Solo posible medir indirecta y aproximadamente. Deben operacionalizarse
¿Cómo son las variables en psicología?
 Conceptos→ sobrepasan observación empírica (no tienen observación concreta)
 Conceptos no observables, construcciones hipotéticas, variables latentes
constructos – indicadores:
 Usamos instrumentos→ muestran indirectamente la variable x de indicadores
 Indicadores: manifestaciones externas empíricas, observables, comportamientos
identificables del constructo→ muestra en qué manera se manifiesta el comportamiento.
Tipos de medición:
Campbell:
 Fundamental: instrumento→ misma cualidad de lo que se mide: ud básica de medida.
Medición de propiedades para las que se puede establecer una ud básica natural con
representación extensiva.
 Derivada: obtenida indirectamente, x relación entre 2 o más medidas fundamentales. Se
deriva de medidas fundamentales. Ej. IMC. Definida x enunciados teóricos→
relacionan medidas fundamentales
 Arbitraria: establece relaciones entre conceptos e indicadores→ la + frecuentemente
usada en psicología. Campbell no gustaba. Stevens→ existe medición en estos aspectos.
No es en base a enunciados teóricos→ significado en función de operaciones de la
medida. Son x elección del investigador. Para fenómenos sin teoría para medirlos→
usar arbitraria. Puede convertirse en las otras 2→ x usar indicador objetivo y x teoría
que diga unidades de medida del indicador.
Medición y evaluación:
 evaluación es disciplina de psicología→ en todos los campos de aplicación de
psicología.
 Todo proceso de evaluación→ medición. no necesariamente medición es evaluación.
Teoría de la medición: posible: números en fenómenos psicológicos
Evaluación psicológica: mide el comportamiento de un sujeto o grupo de sujetos.

 Puede→ distintos objetivos: descripción, diagnostico, selección, predicción.
“x proceso de toma de decisiones→ emplean al menos dos dispositivos para evaluación de
aspectos positivos como patológicos” deben implicar estas dos cuestiones.
“La evaluación es + que aplicación de test→ conlleva integración y valoración de información
recogida”→ se usa más de un test.
Medición→ aplicación de test con objetivo específico de test→ no siempre es evaluación.
Hay constructos unidimensionales y multidimensionales de distintos órdenes.
Medición y teoría psicológica:
Medir procesos psicológicos: objetivo→ operacionalizar teoría de funcionamiento psicológico
en un área, y responden a teoría de medición→ indica→ operaciones métricas para usa para
asignar números a procesos.
Validez teórica
Validez de construcciones hipotéticas: integra nociones psicométricas y psicológicas→ saber
qué propiedades puede explicar la variancia de la prueba→ explicar diferencias individuales en
valores de instrumento. Esto + investigación científica empírica: relacionadas. Necesario→
validar teoría de prueba→ Cronbach: tres partes: 1. Sugerir construcciones que fundamentan
eficacia de prueba 2. Deducir hipótesis a partir de teoría usada 3. Poner hipótesis a prueba.
Comprobación de hipótesis alternativa: importante para ↑ necesarias→ convergencia (métodos
del mismo concepto→ converger en constitución) y discriminación (debe distinguir
construcción hipotética de otras). Para usar test→ debe tener operación adecuada de teoría,
adaptados a cultura.
Adaptación a cultura: importante→ equivalencia en contenido→ funcional. Error: confundir
traducción con adaptación cultural.
Tener en cuenta: teoría métrica de prueba→ indica unidad de medición usada.
Punto de vista clásico de medida: medida fundamental/directa es posible cuando axiomas de
actividad pueden traducirse isomórficamente en manipulaciones de objetos.
Spearman: modelo para teoría de inteligencia general: g (produce interrelaciones entre medidas
de habilidad cognitiva) y teoría→ concepto de ud funcional.
g.: todas medidas de capacidades cognitivas tienen→ un factor común g→ cantidades
individuales de factor común, y factor especifico único a cada medida particular→ cantidades
individuales del factor medido. Requiere→ intercorrelaciones entre factores→ sean 0.
Correlaciones manifiestas entre variables→ producidas x factor común. Magnitud de
correlaciones→ x proporciones→ indican extensión en q test miden factor común.
Especificaba→ ud funcional de 3 procesos separados 1. Introspección 2. educción de relaciones
3. Educción de correlatos cuando hay idea con relación→ tiene poder→ traer a mente idea
correlativa. Los 3→ unidad de función g. calidad de resultado depende de calidad de trabajo de
ellos→ no miden confiable cualquier factor separado del conjunto
Método centroide del análisis factorial: test de hipótesis→ todas las medidas de habilidades
cognitivas miden factor g de inteligencia general. Cuantas + respuestas correctas→ + atributo
hay→ escala intervalar
Thurstone: mente carece de aptitud general→ estructura de inteligencia→ factores comunes a
conjuntos de actividades.
En el ’50→ estudia actitudes→ intervalos “iguales”→ proc. transformación de rtas de jueces en
valores intercalares. Ley de juicios comparativos: cada estímulo→ asociado a proceso modal
discriminal. Distribución normal→ escala de intervalos “iguales”→ ítems seleccionados x
técnicas para escalonarlos. Juicios en escala de 11 puntos→ sujetos seleccionan 1 continuo.
Diferencia Lickert-Thurstone: Lickert mide atributos multidimensionales, Thurstone no→
ubica a sujeto en punto del continuo psicológico.
Rotter: conductista, investiga personalidad con efectos entre disposiciones y condiciones del
contexto en conducta. habla del locus de control como característica de personalidad→ estudia
con cuestionario de ítems de afirmaciones dicotómicas. Escalas se representan x ítems escalados
según Lickert y no alternativos.
Cognitivos: estructura→ grado de diferenciación de elaboración informativa→ Witkin.
Explicación de conducta: basada es estudios correlacionales→ consistencia de 2 dimensiones.
Predicción→ se establece en sentido longitudinal y transversal
Comparación factorial: constante para todos→ diferencias de ejecución salen de x nivel de
dotación en los factores. Método de Thurstone→ establecer cuadro de fortalezas y debilidades
intelectuales de sujeto→ perfil aptitudinal. Lo pone a prueba→ PMA (varias pruebas),
desarrolla análisis factorial múltiple→ dificultad→ variancia de los factores no equivalente→
primero→ + variancia, entonces→ método de rotación. Advierte→ correlaciones eran
positivas→ hace cambios en factorialización→ correlacionar factores primarios→ encuentra
factor general “segundo orden”→ análogo a g. usa modelo aditivo probabilístico y respuesta
binaria→ ud medición dada x respuesta correcta. Enfoque cognitivo cambia perspectiva de su
estudio→ inteligencia: complejo de mecanismos de procesamiento de info.
Diferencias psicométrica-cognitiva: factorización vs. Experimentación→ diferentes teorías
psico (factores vs. Mecanismos). T. factorial: no especifica naturaleza interna de capacidades
subyacentes. Cognitiva: centrada en capacidad de mente de procesar info. Diferencias
individuales→ expresadas en cuan bien o rápido ejecuta operación mental→ modelo de
correlatos: lograr mapeo de factor verbal→ modelo teórico de procesamiento→ a prueba x
experimentos→ compara personas con diferentes capacidades verbales.
Rimoldi: evalúa procesos que hace persona para llegar a respuesta
Teorías esenciales: estipulan→ todas actividades intelectuales→ originadas en proceso
básico→ puede ser→ diferentes fuentes. Principal rasgo de teoría esencial→ idea de que algo
determina lo que se ve.
Escalamiento
Escala/cuestionario: conjunto de ítems, respuestas→ se califican, combinan→ valor escalar.
Clasificación (Torgerson): según variación de origen de valor de escala.
⋆Basadas en sujeto: valores reflejan diferencias entre examinados en términos individuales a lo
largo de la dimensión. Ej.: escalas personalidad.
⋆Basadas en estimulo: valores reflejan variación del estímulo en la dimensión.
⋆De respuesta: variación del valor→ tanto por estímulos (ítem) como sujetos.
Escalamiento incluye modelos, métodos, técnicas→ permite poner sujetos, estímulos, respuestas
o ambos en continuo físico o psicológico evaluado, unidimensional o multidimensional.
Diseño de escalas
Requiere conocer teoría de escalas y como medir variables psicológicas analizadas. La
definición de la V. depende de la extensión de la teoría, definición incluye:
⋆Diferenciaciones: cuales son variables, cuales no
⋆Dependencia: como V. es función de términos + básicos o antes definidos.
⋆Relaciones: relación entre Vs.
Forma en que se mide V depende de consideraciones→ en que medida se representa bien la V.,
quienes responden, condiciones, contexto de administración, diseño de investigación del
estudio→ análisis planeados.
Formato de la escala
Verbales estructuradas: ítems son parte estimulo (pregunta) parte respuesta (selección de
respuesta).
⋆Pregunta: oración, frase, palabras sueltas. Describir atributo de objeto o evento que lo
involucre en grados de especificidad o generalidad. Componentes simples o 2 o + componentes.
⋆Selección de respuesta: varía según dimensión de medida (de acuerdo, me gusta, importante),
formato también.
⋆Rango difiere según cantidad de puntos en la escala (3 o 5, etc.) y forma en que se estructura
valor de respuesta→ palabras (si-no), frases (de acuerdo) o +. Puede→ sin pesaje o pesada con
varios valores.
⋆Valores: pueden establecerse para cada punto de escala o algunos.
⋆Formatos de rango de respuesta: de un lado (0 a positivo) o dos (positivos y negativos)
⋆Formatos de respuestas ordenadas: menos, difieren en numero de elementos ordenados en
ítem. Usan clasificaciones x convención. Clasificación→ ordenada en oposición a usada en
formato de respuesta x valores→ cuanto + bajo número→ + alta clasificación.
⋆Regla: elegir formato + simple.
⋆Consideraciones: formatos + complejos pueden hacer + interesante el completarlo.
-respuesta x ordenamiento: preferible→ muchos puntos de escala→ en administración
completada→ puede agrupar puntos para reducirlos, o incrementar si no incluyó, y generan ´+
variabilidad de respuesta.
-mucho uso de punto central de escala→ se evita eliminándolo→ usando numero par de puntos
de escala→ asegura dimensión subyacente lineal
-clasificación x ordenamiento puede ser + sencilla que x valores pero→ formatos respuesta x
ordenamiento→ limitar análisis estadístico de datos.
-cantidad de espacio para escala→ excluir uso de algunos formatos.
Desarrollo de escala: recolectar datos x formularios preliminares y analizarlos para elegir
ítems→ formulario + final. Primordial→ método de escalamiento para seleccionar ítems.
Centradas en sujeto: diferencian a sujetos en atributos→ asigna valores escalares a sujetos.
Escalas Likert: Escala aditiva→ medición ordinal→ reacción a ítems→ propiedad estudiada→
rtas→ grado de acuerdo→ suma de rtas. Test tipo A→ sujetos situado a lo largo de V. variación
en rtas→ x diferencias individuales. Interesa coherencia en función de rtas.
Calidad del ítem→ analizada→ análisis de poder discriminativo de ítem: ítem discrimina→
diferencias en la manera de responder según cantidad del atributo que posee sujeto. No mide
habilidades. Distintas maneras de calcularlo:
 prueba t: compara grupos con diferencias extremas (+ alto y + bajo).
 Correlación biserial: trabaja con medias parciales de ambos grupos. puede ver si
discrimina y cuánto. Valor→ entre 0 y 1. Punto de corte 0,20 (mayor: discrimina.
Menor: no discrimina). Se acerca + a 1→ discrimina más.
 Test de la mediana.
Ventajas:
 Permite uso de ítems que no se relacionan manifiestamente con actitud que se estudia
 + rápida y fácil de construir
 Mismo número de ítems, + confiable.
 Cantidad de alternativas de respuesta permite info + precisa de sujeto en ítem particular.
Desventajas:
 Ordinal: no permite apreciar distancia entre pares de sujetos con respecto a la actitud
 Frecuente: dos valores iguales pueden ocultar pautas de respuestas diferentes de
individuos (pueden responder diferente y tener mismo puntaje/nivel).
 No→ garantía de unidimensionalidad→ pueden mezclarse dimensiones, no estando
seguro el investigador de cuál de ellas es.
Implementación:
 Computar valor total
 “ correlación ítem-total
 “ confiabilidad α para conjunto final.
Construcción:
1. Necesario→ construir serie de ítems relevantes a la actitud que se quiere medir
2. Ítems→ administrados a muestra que será de juez.
3. Asignar valores a ítems según dirección (+ -)
4. Asignar valores totales a sujetos x tipo de respuesta en cada ítem→ suma algebraica
5. Análisis de ítem.
6. Construir en base a ítems seleccionados en escala final.
Escalamiento tiene que ver con la asignación de valores.
1. Construcción de ítems: entre 30 y 50. Criterios:
Evitar→ apunten a pasado - Que den mucha info o parezcan - Evitar ambiguos - Evitar
irrelevantes a la actitud - Deben formularse según expresen actitud favorable o no a actitud -
Evitar ítems→ que nadie concuerda - Lenguaje simple, claro, directo - No + 20 palabras -
Frases lógicas – no “todos” “nunca” – frases simples, no compuestas – entendibles – evitar
negaciones – combinar 50% negativos y positivos.
Cada ítem: juicio→ graduación acuerdos/desacuerdos varia en cantidad de alternativas que
dependen del tipo de investigación, pregunta, variable
2. Administración a jueces
Se presenta a jueces al azar con características parecidas a muestra→ expresan opinión.
3. Asignación de valores a ítems
Clasificar ítems en + o – y ponderar alternativas de respuesta→ diferentes criterios. No usar
signos + o – en valoración a rtas → falso intervalar→ es ordinal→ rango. Ítems - → valoración
inversa. Ítems → ubicados en relación a V. para controlar efectos response-set→ controlar
pautas de rta de sujetos que responden así nomás.
4. Asignación de valores totales
A jueces. Es adición de valores ponderados para cada ítem. Negativos→ suma algebraica.
Personas con actitud positiva→ valores altos, viceversa.
5. Análisis de ítems
a. Computados valores de jueces→ ordenar→ valor + alto→ 1° lugar y así.
b. Operar con cuartiles inferiores y superiores→ grupo bajo y alto.
c. Se ponen en tabla de valores en cada ítem y valor total para cada sujeto ordenados.
d. Seleccionar ítems + discriminantes. 3 técnicas: Calculados valores promedio→ 1.
calcular poder discriminativo→ t de Student→ en tabla seleccionar los que den +
diferencias. 2. Ítem-test→ correlacionar valor de ítem con valor de test. 2. Test de la
mediana→ saber valor de mediana de cada ítem para grupos ↑ y ↓ combinados→
dicotomizados, valores en tabla 2x2 para cada ítem
6. Versión final
Ítems seleccionados→ escala final. Valores finales→ resultado de suma de cada ítem % total de
ítem. Para confiabilidad→ α de Cronbach
Diferencial sistemático de Osgood: Típicamente bipolares, fijadas en extremos con adjetivos

contrastantes y continuo de 7 puntos: de acuerdo a como persona responde → significado que le
da sujeto.
⋆busca medir significado de objeto para un individuo
⋆supone que existe un espacio semántico de dimensionalidad desconocida de naturaleza
geométrica.
⋆Espacio→ escalas semánticas. Cada escala→ adjetivos bipolares→ forma función lineal→
pasa x origen. Para definir espacio→ usar muchas escalas.
⋆Diferenciar significado de objeto→ elección entre alternativas (sujeto). Función de elección→
localizar objeto en espacio semántico. Valides de localización→ depende de número y
representatividad de escala.
⋆Diferencia semántica→ estabilización de objeto hasta punto en espacio semántico x valor de
número de alternativas semánticas dadas en forma de escala
⋆Punto en espacio que da definición operacional del significado→ 2 carac.:
⋆Dirección del origen: depende de cuál polo de escala se elige
⋆Distancia del origen: depende de cuán extrema es la posición.
⋆las dimensiones pueden ser de distintos tipos:
- La evaluación que hace se clasifica. Ejemplo: limpio-sucio, bueno-malo.
- La percepción de la persona de potencia o poder del objeto o concepto: grande-chico.
Dimensiones en espacio semántico
Muestreo→ importante. Diferencial semántico→ influido x 3 fuentes de variación ⋆individuo
⋆escalas ⋆objetos.
Osgood→ siempre mismos factores principales en análisis→ conclusión→ estructura factorial
no depende de elección de escalas.
Dimensiones:
1. evaluación de individuo de objeto: limpio-sucio
2. Percepción de individuo de potencia del objeto: fuerte-débil.
3. Percepción de actividad de objeto: activo-pasivo.
Construcción
No es prueba con valores específicos→ reúne info construida según demandas del problema de
investigación. No hay objetos o escalas estándar.
1. Selección de objeto
Concepto. Objeto→ para determinar significado de estímulo→ provoca reacción en persona x
respuesta que pone en escala. Puede→ verbal, una o + palabras, no verbal (cuadros). Elección
de objeto→ problema de muestreo. Supone: 1. Diferencias individuales 2. Un solo dignificado
3. Todos los testeados lo conocen.
2. Selección de escalas
Asegurar: ⋆evaluación ⋆potencia ⋆actividad→ para cada uno→ cierta cantidad de escalas
seleccionadas y tener t→ + representatividad y confiabilidad. Promedios→ scores.
Criterio + importante→ patrón factorial. Y relevancia de escalas al objeto.
3. Análisis de datos
Pesos a alternativas de escala→ 1, 2, 3, 4, 5, 6, 7 o al revés→ depende el polo en par de
adjetivos altos.
No es escala de actitudes corriente→ valores escalares→ para medir actitudes generales.
Valores escalares→ puede hacer escala universal para cualquier objeto, ventaja→ ⋆económica
⋆disponibilidad para medir actitudes no previstas ⋆poder comparar diferentes investigaciones.
Centradas en el estímulo: para controlar cambio de sujeto en investigación.

Thurstone: ley: cada ítem→ asociado a proceso modal discriminal sobre un continuo
psicológico: para él→ intervalar (ítems miden nivel del constructo). Divide continuo
psicológico en 11 puntos. 2 ítems por cada continuo.
Hay jerarquía: sigue siendo ordinal.
Construcción:
1. Se construye serie de ítems (alrededor de 150).
2. Solicita a jueces que ubiquen ítems en escala de 11 puntos. Tienen que ser expertos
3. Evaluados→ adjudican valores de escala. Se usa la mediana.
4. Seleccionan ítems que representen rango entero d escala, rechaza ítems ambiguos.
Para ver→ ítem funciona bien: analizar diferencia intercuartil.
5. Jueces se eligen entre personas→ conocimientos especiales sobre variable a medir.
6. Mediana→ indica valor del ítem a lo largo de la V.
7. Desviación intercuartil→ indica la calidad del ítem, cuanto menor→ mayor calidad
Hay 3 cuartiles: Q1: 25%. Q2 (o mediana): 50%. Q3: 75%. Max: 100%. Son punto de corte→
se divide muestra. Diferencia intercuartil→ Q3-Q1.
Ventajas:
 Permite→ distribución de un grupo, a lo largo de actitud a investigar.
 Supone medida más refinada que Likert.
 Escala final→ más ítems que Likert→ + confiable.
 Si es tratada como intervalar→ evalua cambios en actitud de sujetos.
Desventajas:
 Distintas respuestas obtienen el mismo puntaje.
 Elaboración→ larga y compleja.
 “escala intervalar”→ verdadera naturaleza→ nivel ordinal
 Fácil→ pone otras dimensiones diferente. Discrimina poco en extremos de distribución.
 Ítems neutrales→ sin significado a veces no se refieren a dimensión tratada.
 Distintas configuraciones de respuesta→ mismo valor final
 Jueces pueden introducir sesgos difíciles de detectar.
Métodos de escalas de respuesta:

⋆ Si pueden asignarse valores escalares tanto a estímulos como a sujetos→ desarrollar métodos
de construcción de escalas.
⋆ Analizan las respuestas tanto de sujetos como de ítem.
⋆ Cuando el test mide bien: mide bien a cada sujeto según su nivel: intervalar.
Guttman: escala unidimensional→ ítems se ordenan para que respuesta + implique respuesta
positiva a todos ítems + bajos de escala y viceversa → escalograma: ⋆ítems aparecen
ordenados x nivel adaptación de + a – ⋆sujetos ordenados x valor total de + a- → test
unidimensional→ escalonamiento correspondiente a progresión de aceptación de sujetos e ítems
Coeficiente de reproductibilidad→ 1 menos la proporción de excepciones→ 1.00: patrón de
respuestas→ reproducible. Si no es alto (- de 0.9)→ grafico muestra ítems malos→ se
eliminan→ recalcula hasta buen coeficiente. A veces→ eliminar sujetos.
Rasch: ideas de Guttman + concepción probabilística: ⋆ítem→ persona con habilidad→ +
probabilidad de resolverlo ⋆cualquier persona→ ítem fácil→ + fácil resolver.
Respuesta al ítem→ función de dos parámetros 1. Ítem 2. Persona→ estimados x datos→
consistencia datos puede evaluarse→ pobre→ supuestos no alcanzados. Aceptable→ mejorarse
Métodos de criterio externo: relación entre ítems→ determinar cuáles seleccionar, selección
criterio→ fundamental.
Selección ítem→ clave. Métodos: ⋆diferencia de grupos ⋆validez del ítem ⋆regresión múltiple.
Asume→ ya selecciono V. criterio para medición→ reflejan efecto de interés.
Diferencia de grupos: ítems seleccionados x diferencia de medias de valores obtenidos en los
ítems x dos grupos, ↑ y ↓ o grupo criterio (tienen 1 o + criterios) y referencia (población típica).
+ diferencia de medias→ + definido es ítem a seleccionar. Similar a Lickert
Validez del ítem: también similar a Lickert pero usa correlación valor ítem y valor-criterio.
Regresión múltiple: + sofisticado. ⋆regresión de criterio V. sobre ítems (se agregan a ecuación
de regresión de a uno)→ selecciona ítems de alta correlación con criterio.
Construcción de test
Elaboración de un test:
1. Definición del constructo
2. Enunciación de ítems
3. Análisis crítico de los ítems
4. Análisis formal de los ítems→ cuantitativo, aplica pruebas estadísticas, hay muestra
piloto. Se recopila datos en gente con características que tienen a quienes se dirige test.
5. Selección de los ítems→ surge la versión final del test
6. Estudio de características del test. Validez y confiabilidad en del test, no ítems.
7. Estandarización. Baremos. los puntajes que ayudan a interpretar los que se obtuvieron
en los resultados, no siempre es el objetivo de cada test.
1. Definición del constructo: buscar el rasgo y como se manifiesta, relacionar→

encuentra otras variables relacionadas. Definición delimita lo que se va a estudiar del
constructo.
Surge discusión teórica→ enfoque teórico con que se trabajará ese constructo para test,
delimita el campo. Busca modelo teórico. Análisis→ respaldar el modelo teórico.
2. Enunciación de los ítems: estrategias:
-Racional: reflejar rasgo a medir en criterio investigador. Se busca bibliografía→ algo
que refleje en tema. Cuando en los test dicen que son basados en la bibliografía
-Empírica: usar un criterio externo a los ítems→ hace ítems y los que quedan son los
que las pruebas determinan que son los mejores para el test.
-Constructo: sustantivo, estructural o externo. Unifica ↑, basado en teoría, selecciona
ciertos ítems y se hace un análisis→ saber cuales deben mantenerse.
Fuentes: la redacción de ítems debe contemplar (Matesanz):
a. Vocablos y expresiones + utilizadas x gente para referirse al constructo a medir.
b. Comportamientos procedentes de la propia experiencia
c. Cuestionarios, métodos evaluativos de constructo a operacionalizar, ya existentes
d. Bibliografía especializada en sintomatología que interesa. Leer→ saber de que
habla y llegar a tener ítems.
e. Opinión de expertos que→ manifestaciones valiosas de atributos a investigar. Es
Criterio de saturación, siempre se pueden estar agregando cosas.
Formulación:
a. Debe→ mismo formato exterior: misma manera de contestar, sino: batería de test
b. ¿modo aseverativo (afirmación) o interrogativo? base a como está estructurado test,
como se corrige.
c. ¿primera, segunda o tercera persona? Me siento trise. ¿te has sentido triste? En
tercera persona se contesta lo observado.
d. ¿hay ítems negativos?→ conocer el constructo para saber si es posible que haya
ítems negativos→ constructos que no tienen un polo negativo para hacer
enunciados
e. ¿voz activa o pasiva?
f. Sencilla, clara y de fácil comprensión de quienes responden.
g. Referidos a comportamientos, no dimensiones.
h. Adaptar lenguaje, formulación clara, frases breves, afirmativos, que tengan solo un
comportamiento
Formato de respuesta: transformación psicométrica de la atribución subjetiva de un
individuo a os indicadores numéricos objetivos.
Cantidad de opciones: dicotómico: SI-NO. Escalonado SI-A VECES-NO.
Puede influir en la confiabilidad y la validez del instrumento
Depende de aspectos psicométricos en cuanto a tecnicas, corrección, validación y edad
de sujetos. Formato puede influir en consistencia interna, grado de precisión de info
recibida y modificar estructura factorial de instrumento
Puntuaciones: depende de tiempo, si es limitado y
a. Alternativas:
-Dicotómicas: sin penalización (1 y 0), con penalización (+1, 0, -1), siempre se saca
la misma cantidad de puntos que se dan cuando acierta.
-Respuestas alternativas: sin penalización (1 y 0), con penalización (suma A –
errores/alternativas -1). Son varias→ una es correcta.
- + usado→ sin penalización.
Los test tipo Likert: se obtiene una puntuación mayor cuando la persona tiene el
trastorno (totalmente de acuerdo: 5 puntos. De acuerdo: 4 puntos. Y así). ítems
ambiguos admiten las dos maneras de contestar.
Osgood: dimensiones bipolares, adjetivos contrastantes y continuo de 7 puntos
Muestra: saber la clase de constructo, alcance que se quiere, si usa analsis factorial (n°
sujetos 3 veces superior a variables). Representatividad, diferencias de edad, sexo, etc.
3. Análisis crítico de ítems: selección previa x jueces→ eliminan ítems inadecuados.
4. Análisis formal de ítems: aplica pruebas estadísticas.
a. Dificultad del item: item se asocia con % de sujetos que aciertan→ se determina
para cada grupo de sujetos según variables.
b. Disctiminacion: como correlación de cada item con puntuacion total de test→
indica hasta que punto hay relación entre medida de un item con todo el test.
c. Distractores: cuando respuestas da varias alternativas→ conocer si la proporción de
ellas que da respuestas erróneas esta equilibrada.
5. Selección de items
6. Estudio de características del test
7. Estandarizacion.
Confiabilidad
⋆Ser confiable→ instrumento de medición siempre mide lo mismo.
⋆De un instrumento→ precisión o exactitud de la medida, si se aplicamos + veces el
instrumento a mismo sujeto u objeto→ mismos resultados.
⋆Proporción entre variancia de error y total obtenida x instrumento
⋆Vinculado con proceso de repetición o generalización de la medida (predominante de los
trabajos iniciales de Spearman, 1904).
⋆En medición de las variables psicológicas→ problema de consistencia es + complejo que
medición de variables físicas→ repeticiones del mismo test, puede variar por:
- Falta de fiabilidad o precisión del instrumento.
- Aspectos del propio sujeto: no rinde igual porque no está en condiciones óptimas.
- Otros aspectos que tienen que ver con el contexto en el que se realiza la medición.
- En últimos casos, la falta de consistencia o estabilidad es x situación del sujeto o
contexto, no se debe a la falta de fiabilidad del instrumento.
⋆Sinónimos: exactitud, precisión→ todos los ítems de instrumento son homogéneos→ siempre
mide igual manera un atributo
⋆Esto se evalúa en función de la carencia relativa de errores de medición del instrumento
Tipos de errores:
Existen errores que pueden explicarse por la teoría psicológica:
 Errores sistemáticos: hay una condición que afecta globalmente el resultado→
resultados varíen todos de la misma manera y dirección→ afecta a validez→ todos los
sujetos implicados: no mide el rendimiento→ cómo rinden los sujetos estando
afectados. Produce el mismo impacto para todos.
 Asistemáticos: ocurren x condición puntual o individual e interfieren en el resultado de
un individuo o una parte de la muestra→ afectan a la confiabilidad.
 su foco→ posibles errores cometidos en el proceso de medición

 hasta qué punto las cantidades reflejan con precisión la puntuación verdadera de la
persona→ valor teorico
 se considera que los errores de medición varían en torno a valor verdadero
 en la práctica→ casi imposible que una medida sea perfecta y siempre tiene error.
 Datos obtenidos→ grado de consistencia y replicabilidad.
 Mayor variabilidad entre medidas→ menos confiabilidad
 Puntuacion verdadera→ media de las puntuaciones por persona en las aplicaciones de
test→ distribución normal.
 Error→ suma de factores aleatorios→ influyen y afectan registro de datos→ dan
inconsistencia→ aleja puntuacion verdadera
 Varianza→ dispersión promedio de los valores
Teoría clásica de los test:
⋆Confiabilidad→ proporción de varianza de puntuaciones que se debe a la varianza verdadera, o
sea→ varianza del rasgo que se evalúa
⋆mediciones obtenidas x test psicológicos se realizan:
⋆en un momento particular del individuo…
⋆estas limitaciones implican que el resultado de la medición es solo una estimación aproximada
de la puntuación verdadera del individuo en el constructo que pretendemos evaluar
⋆implica que toda medición conlleva errores
⋆la psicometría hace uso de modelos formales que le permiten lograr esa estimación de la
puntuación verdadera del rasgo de un individuo
⋆la teoría clásica surge del modelo lineal de medición por Spearman
⋆la principal idea de ese modelo es que hay que distinguir entre valor real de lo que medimos, y
la medida falible que obtendremos en el proceso de medición
⋆generalmente los procedimientos usan formulas que producen coeficiente de confiabilidad que
oscilan entre 0 y 1.
Factores que afectan confiabilidad:
⋆contenido del test: selección de ítems, materiales, consignas, errores de muestreo pueden
afectar, si es muy extenso- + ítems del mismo tipo→ puntajes + confiables.
⋆administracion: hay que examinar a participantes en condiciones uniformes, - variabilidad→ -
correlación.
⋆calificacion: errores de corrección manual, diferentes evaluadores→ diferentes criterios.
⋆examinado: influencias azarosas de comportamiento, distracciones
Dimensiones:
a. qué grado de puntajo→ libre de errores de medición x cambios personales en
examinado. Esperable→ puntuaciones estables
b. en qué medida elección de muestra de ítems es fuente de error→ consistencia interna
c. en que grado la medición es independiente de subjetividad de evaluador→ confiabilidad
inter-observadores
Supuestos fundamentales:
1. modelo lineal: hipótesis fundamental de teoría clásica de los test→ puntuación
observada de persona en test particular es función lineal de los componentes: su puntaje
verdadero y el error de medición implícito en la prueba.
La puntuación observada de un sujeto es igual a la verdadera, y tiene puntuacion error
El error depende de diferentes factores: propios del test, de la persona y de la situación
que hacen que la puntuación empírica X, no sea exactamente su nivel de atributo V.
Error de medida→ diferencia entre la puntuación empírica y verdadera
2. El problema es que E y V son desconocidos, se puede estimar variancia de error
En cuenta→ en algunas formas→ error será el positivo. Desde el punto de vista
conceptual, la mejor estimación del puntaje V sobre el conocimiento evaluado→
promedio de las puntuaciones obtenido→ la medida de las puntuaciones empíricas
coincidirá con la puntuación verdadera
Si el error cometido al usar una forma no es sistemático.
1. Con las puntuaciones verdaderas
2. Ni con los errores en otra forma
3. Ni con las puntuaciones verdaderas en otro test
En el plano teórico→ puntuación verdadera puede entenderse como la medida de las
puntuaciones obtenidas x una persona en infinitas aplicaciones de un test
Las puntuaciones de error→ suma de factores que influyen y afectan el registro de los datos con
consistencia en el proceso y alejando la puntuación observada de la verdadera.
En la medida que controlemos las fuentes de error de una medición + se acerca la puntuación
observada a la puntuación verdadera.
Consistencia interna:
no es una propiedad inherente de una escala→ medida del patrón de respuesta del grupo.
Es la medida de correlación entre ítems de cualquier instrumento de medición tipo de escala que
se puede realizar en muestra de 100 participantes. Los valores son adecuados cuando son
iguales o mayores a 0,70 y menores o iguales a 0,90→ debe calculares siempre que se aplique el
instrumento en una población.
Distintas aproximaciones al concepto de confiabilidad
⋆Estabilidad: estabilidad temporal que da instrumento, replicabilidad→ debe obtener mismas
medidas→ mide lo mismo en momentos distintos→ mimos sujetos y objetos.
-Test-retest: mismo test→ dos veces a la misma muestra. Se correlacionan las puntuaciones
obtenidas en ambas ocasiones (r de Pearson). Limitaciones: si cambia el atributo en el sujeto. Si
se deja pasar mucho tiempo entre una aplicación y la otra puede llegar a cambiar un poco el
atributo, efecto de la memoria: si el sujeto se acuerda lo que contesto y lo vuelve a hacer.
-Formas paralelas: contrarresta efectos memoria o aprendizaje. Mismo objetivo: toma el test de
una forma y en la segunda aplicación de otra forma.
⋆Equivalencia: calcular coeficiente de fiabilidad como correlación entre formas paralelas de un
test. Estudia→ si se replican las mismas medidas al aplicar una prueba paralela con ítems
distintos, la correlación entre ambas formas→ grado de equivalencia. Debemos obtener las
mismas medidas→ intercorrelaciones de ítems entre sí y correlación de ítems con el test total.
⋆Exactitud
⋆Consistencia interna: grado en que diferentes partes de un test miden un rasgo con distinta
consistencia. En este sentido replicabilidad: medimos lo mismo con distintas partes del test.
Permite evaluar en qué medida elección de muestra de ítems que componen la prueba→ fuente
de error en la medición.
-División por la mitad: luego de aplicar el test, se dividen los ítems en dos conjuntos y se hace
una correlación entre las dos mitades. Dificultad para lograr mitades comprobables.
-Spearman-Brown: corrección de ↑ se obtiene estimador completo. Desventaja: errores
casuales→ afectan puntajes en ambas mitades de misma manera→ eleva coeficiente de
confiabilidad→ se aplica una vez.
Alpha de Cronbach: media de todas las correlaciones de partición por mitades posibles. (KR20
dicotómicos con distinta dificultad y KR21 con igual dificultad). Es medida de confiabilidad
total del instrumento en relación a consistencia interna a partir de una sola administración de la
prueba. Se correlacionan todos los ítems entre sí. Da índice + estable de confiabilidad x
correlación entre todos los ítems. Errores: ⋆casuales ⋆constantes
-Equivalencia racional: dos formas de un test→ ítem→ intercambiarse (apareadas) y
correlaciones entre ítems son idénticas (r de Pearson) (al aplicarse transversalmente)
-covarianza de ítems: única aplicación→ verifica consistencia interna de puntajes. Estima
covarianza con α de Cronbach o KR-20 (ítems dicotómicos). alfa→ media de todas las medidas
-Acuerdo inter-examinadores: administrar test→ entregar resultados a jueces que los puntúan→
se verifica grado de acuerdo de ellos luego de leer, registrar y codificar los mismos datos. No se
aplica→ test puntuados objetivamente, solo importa→ interviene el criterio del examinador en
la calificación. Coeficientes + usados→ Kappa para escalas nominales, para ordinales Tau de
Kendall o ro de Spearman
⋆La fiabilidad de las puntuaciones del test representa la proporción de la varianza de las
puntuaciones en el test que se debe
Puntuaciones individuales: puntaje verdadero→ si se eliminaran todos factores de error.
Confiabilidad y margen de error en la media:
⋆Puntuación→ teórica→ imposible conocer su valor directamente y solo podemos estimar la
ubicación del puntaje verdadero con un cierto grado de confianza
⋆Para estimar su ubicación probable→ supuesto: si sujeto hace cantidad infinita de pruebas
equivalentes→ puntuaciones en esos test tenderían a distribución normal→ puntaje verdadero→
la media
⋆Desviación estándar de esa distribución→ “error estándar de medición”, calculado x
coeficiente de confiabilidad
Utilidad de error estándar:
⋆fundamental para estimar ubicación aproximada de puntuacion verdadera e interpretar
puntuaciones individuales
⋆si sujeto saca 40 en test y EEM=4→ 68% de puntajes de ese sujeto si hiciera ese test muchas
veces→ entre 36 y 44→ probabilidad de 96% → puntaje verdadero entre 32 y 46.
⋆mayor confiabilidad→ menor error estándar de medición y + confianza en exactitud de puntaje
Confiabilidad no es característica de instrumentos:
⋆es característica de resultados obtenidos de muestra
⋆un mismo instrumento puede medir bien a una muestra y mal a otra.
+consistencia interna
Escalas→ deben mostrar altos valores de validez y confiabilidad. Si asume que condiciones de
aplicación de escala y atributo investigado cuantificado se mantienen estables en el tiempo→ no
ha cambiado. La confiabilidad→ necesaria, no suficiente para garantizar validez de instrumento.
Propiedades psicométricas calculables con una sola aplicación del instrumento en una
muestra→ consistencia interna (homogeneidad), la dimensionalidad (estructura factorial o
interna) a confiabilidad del constructo.
Consistencia interna del instrumento: grado en que ítems se correlacionan entre ellos, magnitud
en que miden el mismo constructo.
Alpha de Cronbach→ medir escala politómica- Kuder-Richardson→ dicotómicas. Ej:
dicotómicas: respuestas entre sí y no politómicas: escala Likert o más de dos opciones.
Se acepta→ consistencia interna de escala puede→ en rango entre 0 y 1. Los valores podrían
oscilar entre –1 y 1. Valores de 1 indicarían una correlación entre ítems cercanas a la
perfección; valores de 0, ninguna correlación; y coeficiente de –1, una correlación negativa
entre ítems. Posible→ ver coeficientes extrañamente negativos en consistencia interna para
escala de dos ítems.
Factores a considerar al estudiar la consistencia interna:
⋆Miden atributos o características→ no conocimiento sobre un tópico particular.
⋆Tamaño de la muestra. (10 o 20 sujetos por ítem)
⋆Grado en que los reactivos se relacionan.
⋆La magnitud en que mide el mismo constructo.
⋆A mayor número de opciones→ mayor coeficiente de confiabilidad.

Psicometría Resumen

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Psicometría Resumen

Cargado por

Copyright:

Formatos disponibles

Resumen 1° parcial Psicometría

Psicometría: campo de psicología→ especializado en medición→ prueba de lo mental.

Test: “procedimiento estandarizado→ muestrear conductas de personas a partir→ serie de

Uso ético de test: ética y profesional

Evaluación psicológica: mide el comportamiento de un sujeto o grupo de sujetos.

Diferencial sistemático de Osgood: Típicamente bipolares, fijadas en extremos con adjetivos

Centradas en el estímulo: para controlar cambio de sujeto en investigación.

Métodos de escalas de respuesta:

1. Definición del constructo: buscar el rasgo y como se manifiesta, relacionar→

 su foco→ posibles errores cometidos en el proceso de medición

También podría gustarte