Confia, Validez y Normas

CONFIABILIDAD.
VALIDEZ.
TIPOSDE NORMAS.
GRUPOS NORMATIVOS.
 “La forma en que las mediciones en individuos
obtenidas bajo distintas circunstancias llevan a resultados similares.”
(Streiner & Norman, Health Measurement Scales).
 Consistencia o precisión con la cual una escala puede discriminar un sujeto
de otro.
 Grado de consistencia con la cual un instrumento produce un resultado de
valor particular cuando el valor de la variable no cambia.
1. Confiabilidad vs. Validez.
2. Uso s Cotidianos vs. Distinción técnica.
3. Cambio real vs. Cambio Temporal.
4. Errores constantes vs errores no sistemáticos.
 La validez se relaciona con lo que mide una prueba,
específicamente si mide lo que quiere medir. Confiabilidad
solo se relaciona con la consistencia de la medición, al margen de
lo que mide exactamente.
 Una prueba puede ser confiable sin ser válida.
 No puede ser válida a menos de ser confiable.
Cotidianos.:
 Un empleado a tiempo es confiable.
 Un vendedor es confiable.
 Una maquina confiable arranca y funciona continuamente.
Técnica: (técnico y cuantitativo).

 Consistencia.
 Replicabilidad.
 Fiabilidad.
 Supuesto básico: La persona no cambia:
 Diferentes tiempos (confiabilidad test-retest).
 Diferentes observadores (confiabilidad interobservador).
 Diferentes versiones (confiabilidad en paralelo).
 Confiabilidad no es una propiedad fija del test. Es una propiedad de los
scores del test.
 Un test puede ser confiable en un grupo de sujetos y no confiable en otro.
 Depende del rango del score.
 Se relaciona con la variabilidad entre los sujetos.
 Si un grupo es muy homogéneo, entonces la estimación de la confiabilidad
puede ser muy baja.
 Si un grupo es muy heterogéneo, entonces la estimación de la
confiabilidad puede ser muy alta.
 Que tanto acuerdo hay en los scores medidos en dos ocasiones de tiempo,
asumiendo que el sujeto permanece sin cambios?
 Intervalo de tiempo Test-Retest:

 Lo suficientemente corto de modo que la persona no Cambie.
 Lo suficientemente largo de modo que la persona no recuerde sus
respuestas previas.
 Para tests cortos (< 50 ítems), generalmente de 10-14 días.
 Para tests largos, se puede acortar el intervalo de tiempo.
 ¿Dos o mas observadores que observan la misma
persona en ocasiones independientes, obtienen el
mismo resultado?.
 Medida de acuerdo entre dos o más observadores que evalúan el mismo
grupo de personas usando la misma información.
 Para escalas, grado de concordancia entre dos evaluaciones en dos
momentos diferentes en el tiempo.
 Prueba –Reprueba: Kappa o Kappa ponderada.
 Se asume dos formas distintas de la misma escala.
 Raramente usadas.
 Puede usarse como prueba.
 Para test-retest, confiabilidad interobservador
y formas paralelas, se usa el coeficiente de correlación
de Pearson para datos continuos.
 Limitado a 2 observadores u ocasiones.
 Da cuenta del error aleatorio.
 No da cuenta de sesgo (generalmente ignorado en
estudios de confiabilidad).
 Alfa de Cronbach: Reactivos de calificación continua (5 puntos, desde muy en
desacuerdo (1) y muy de acuerdo(5)).
 Fórmula 20 de Kuder-Richardson: pruebas dicotómicas.
 Mitades (split-half): Spearman –Brown.
 Correlación ítem puntuación total.
 Confiabilidad de constructo.
 El grado de una prueba mide lo que quiere medir.
 Grado con el cual el diagnóstico, la categoría, la puntuación o la medida es un reflejo del
verdadero estado, rasgo o atributo
 Grado de confianza que se tiene de que la medida realizada corresponde al fenómeno que se
quiere medir
El constructo
Esquema tradicional Esquemas mas recientes
De Contenido De contenido
Relacionado con el criterio Relación con otras variables:
Concurrente Convergente y discriminante
Predictiva Relación entre pruebas y criterios
Constructo Procesos de Respuestas
Estructura internas
consecuencias
 Refiere la correspondencia entre el contenido de una
prueba y un conjunto de conocimientos y habilidades
bien definido.
 Se emplea principalmente en las pruebas de
aprovechamiento y empleo.
 Método lógico racional.
 Compresiones simples y sencillas de lo que se quiere
medir.
 Sentido común.
 Se aproxima a una forma escrita de lo que podría
abarcarse en una entrevista.
 Primera prueba de personalidad: Eoodworth personal
Date Sheet.
Ventajas
 Sencillo
 Comprensión razonable del constructo que se medirá
 Fácil la generación de reactivos
 Buena validez aparente
Inconvenientes
 Las respuestas pueden distorsionarse por los estilos de respuestas.
 Distorsionarse por esfuerzos conscientes o inconscientes por hacer

falseamientos positivos o negativos.
 No se utiliza para los inventarios de amplio espectro.
 Por lo general se complementa con otro método.

 Expresa el vínculo entre las puntuaciones de la prueba y la
condición en algún otro criterio que refleje el constructo de
interés.
 La condición el criterio puede determinarse casi al mismo tiempo
en el que se aplica la prueba (validez concurrente) o en algún
momento ulterior (validez predictiva).
 Puede ser externo y realista, un grupo de contraste u otra
persona.
 Discriminación
 Grupo normal
 Grupo anormal o grupo de criterio
 Definición practica de cada escala
Ventajas
 Método muy fructífero.
 Concentra la atención exactamente en lo que hace una
prueba o en lo que se desea que realice.
 Motiva nuevas aplicaciones de investigación.
Inconvenientes
 Ateórica extrema limita la generación de la
interpretación de las puntuaciones.
 Sólo aplicar en grupos de criterios bien definidos.
 No existen puntos de cortes bien definidos.
 Los constructos son conceptos hipotéticos que no pueden ser
observado directamente.
 La validez de constructo nunca realmente se alcanza.
 Es un proceso continúo de experimentación y modificación que

conducen al refinamiento del instrumento que mide el constructo.
 Convergente.
 Divergente.
 Discriminante.
 Sensibilidad al cambio.
 Análisis de factores.
 Es una técnica de análisis multivariado que se usa para
la interpretación de las correlaciones entre un grupo de
variables.
 Se parte de la premisa que las correlaciones no son

explicadas por el azar sino que se debe a la existencia
de un factor común subyacente entre ellas.
 El propósito es determinar si un pequeño número de factores
subyacentes pueden explicar el patrón de las puntuaciones
obtenidas en una escala: dimensionalidad.
 Es deseable un menor número de factores que ítems.
 Cada factor debería explicar mucha más variable que un simple

ítem
 Comunalidad (varianza común).
 Unicidad (varianza única).

Prueba de esfericidad de Bartlett.
 Es necesario suponer la distribución normal de los

ítems.
 Contrata la hipótesis nula que la matriz de
correlaciones es una matriz de identidad.
 Muestra si existe correlación lineal entre las variables.
Prueba de esfericidad de Bartlett.
 Chi cuadrado (X2).
 Grados de libertad (gl).
 Valor de probabilidad (p).

Prueba de adecuación de la muestra de Kaiser-Meyer-
Olkin (KMO).
 Mide la correlación existente entre pares de ítems, una

vez se elimina la influencia que los restantes reactivos
ejercen sobre ellas
Ítem I II III
Reír 0,407 0,758 0,101
Disfrutar 0,486 0,742 -0,063
Culpa 0,299 0,218 0,637
Ansiedad -0,076 0,731 0,400
Pánico 0,412 0,397 0,630
Desesperanza 0,147 -0,013 0,731
Infelicidad 0,719 0,245 0,439
Triste 0,749 0,583 0,267
Llorar 0,790 0,374 0,357
Ideas suicidas 0,704 0,171 0,112
Valor propio 3,54 1,36 1,10
% de la varianza 35,4 13,6 11,0
KMO = 0,814; X2 = 495,1 gl = 45, p = 0,000

Criterios para retener los factores:
 Kaiser.
 Gorsuch.
 Catell.
 Varianza de al menos 5%.
 Peso del coeficiente (5,152 / n – 2) (Norman & Streiner).
 Número de ítems.
 Varianza total de los factores retenidos.
Rotación de la solución
 Se realiza para obtener una hacer la estructura más

simple e interpretable
 Hacer que cada ítem tenga coeficientes altos en un
único factor
 La interpretación es más sencilla cuando todos los
coeficientes son positiva
Rotación de la solución.
 Varimax (ortogonal): Se parte de supuesto que los

factores no están altamente correlacionados.
 Promax (oblicua): Se supone que los factores latentes

están pobremente correlacionados.
Rangos percentiles
Puntuaciones estándar
Normas de desarrollo
 Nacionales
 Internacionales
 Grupos normativos convenientes
 Nomas de usuario
 Subgrupos
 Locales
 Institucionales

Confia, Validez y Normas

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Confia, Validez y Normas

Cargado por

Copyright:

Formatos disponibles

CONFIABILIDAD.

Técnica: (técnico y cuantitativo).

 Intervalo de tiempo Test-Retest:

 Fórmula 20 de Kuder-Richardson: pruebas dicotómicas.

 Mitades (split-half): Spearman –Brown.

 Correlación ítem puntuación total.

 Distorsionarse por esfuerzos conscientes o inconscientes por hacer

 No se utiliza para los inventarios de amplio espectro.

 Por lo general se complementa con otro método.

 La validez de constructo nunca realmente se alcanza.

 Es un proceso continúo de experimentación y modificación que

 Se parte de la premisa que las correlaciones no son

 Es deseable un menor número de factores que ítems.

 Cada factor debería explicar mucha más variable que un simple

 Unicidad (varianza única).

 Es necesario suponer la distribución normal de los

 Chi cuadrado (X2).

 Grados de libertad (gl).

 Valor de probabilidad (p).

 Mide la correlación existente entre pares de ítems, una

KMO = 0,814; X2 = 495,1 gl = 45, p = 0,000

 Se realiza para obtener una hacer la estructura más

 Varimax (ortogonal): Se parte de supuesto que los

 Promax (oblicua): Se supone que los factores latentes

También podría gustarte