Manual para La Evaluación de Propiedades Psicométricas

Manual para la evaluación de
propiedades psicométricas.
Elaborado Por: Mg Juan Pablo Sánchez Escudero.
Asignatura: Psicometría.
Universidad Católica de Oriente.
Facultad de Ciencias sociales – Programa de Psicología.
Grupo de Investigación GIBPSICOS.
Contenido
INTRODUCCIÓN. ........................................................................................................................ 2
EL PROCESO DE CONSTRUCCIÓN DE CUESTIONARIOS E INVENTARIOS.................................................. 3
PRIMEROS PASOS:....................................................................................................................... 4
REDACCIÓN DE LOS ÍTEMS: ...................................................................................................... 4
SELECCIÓN DE LA MUESTRA ..................................................................................................... 5
ORGANIZACIÓN DE LA BASE DE DATOS ...................................................................................... 7
TIPS Y RECOMENDACIONES FINALES ......................................................................................... 8
ANÁLISIS DESCRIPTIVO DE LOS ÍTEMS............................................................................................. 9
ANÁLISIS MATEMÁTICO DE LA NORMALIDAD DE LOS ÍTEMS. ......................................................... 12
ANÁLISIS DE CONFIABILIDAD. ..................................................................................................... 16
ANÁLISIS DE CONSISTENCIA INTERNA EN JAMOVI Y JASP .......................................................... 18
ANÁLISIS FACTORIAL EXPLORATORIO PARA LA VALIDEZ DE ESTRUCTURA. .......................................... 22
2. EXTRACCIÓN DE LOS FACTORES:......................................................................................... 25
ANÁLISIS FACTORIAL EXPLORATORIO EN JAMOVI. .................................................................... 30
ANÁLISIS FACTORIAL CONFIRMATORIO. ....................................................................................... 36
BAREMACIÓN DE LA PRUEBA ...................................................................................................... 45
PUNTUACIONES NORMALIZADAS: ............................................................................................ 48
HERRAMIENTAS DIGITALES..................................................................................................... 51
BIBLIOGRAFÍA. ......................................................................................................................... 52
Manual para la evaluación de propiedades psicométricas.
Introducción.
La construcción de escalas en psicología se ha erigido como uno de los

pilares fundamentales de la disciplina, llegando a formar parte de las
habilidades que debe desarrollar un psicólogo como parte de su
formación básica. En este manual se presentan una serie de
procedimientos y conceptos básicos para la validación de cuestionarios
de autorreporte e inventarios desde el modelo de la teoría clásica de los
test, aún vigente como modelo estándar de medición psicológica en
algunos campos.
En cada sección encontrará ejemplos basados en

una recolección de datos del proyecto SAPA
(Revelle, Wilt & Rosenthal, 2010), por lo que su uso se
restringe al plano educativo. A modo de
complemento, se diseñó una página web con
material audiovisual adicional y archivos útiles para el
aprendizaje; las bases de datos disponibles en el sitio
han sido elaboradas por estudiantes de psicología
como parte del desarrollo del curso de psicometría, por lo que no podrán
ser parte de otros estudios de validación. Usted podrá acceder a la web
escaneando el código QR o haciendo click sobre él.
Se usarán procedimientos disponibles en los software JASP y JAMOVI,

paquetes estadísticos gratuitos y de libre distribución reconocidos como
alternativas viables y válidas al uso de paquetes convencionales de pago.
La información contenida en el manual ha sido compilada con fines

meramente académicos, por lo que se prohíbe su uso parcial o total como
parte de presentaciones, artículos o material científico sin la debida
autorización.
Finalmente, este manual hace parte de los esfuerzos del grupo de

investigación GIBPSICOS de la Universidad Católica de Oriente para
facilitar el aprendizaje y adquisición de habilidades de alta calidad en la
formación de sus estudiantes y público interesado en el área.
 Página 2 | Universidad Católica de Oriente.

Manual para la evaluación de Propiedades Psicométricas.
El proceso de construcción de cuestionarios e inventarios.
La medición psicológica afronta un reto enorme al tratar de cuantificar atributos

mentales, a los que, por definición, no se puede acceder de manera directa, sino
a través de definiciones conceptuales y operativas.
La imposibilidad de establecer una condición real de cuantificación o una unidad

de medida base obliga a optar por una medida basada en la comparación de los
sujetos, en la que se asume como cero arbitrario la media poblacional y se
compara el resultado de los sujetos respecto a esta usando algún tipo de
puntuación normalizada.
Estos procedimientos se sustentan en la ausencia de justificación de propiedades

de la escala (Martínez, 1996), según la cual, las escalas de medición psicológica
no cumplen con los requisitos propios de una escala de intervalo o razón y se
asumen como tal sólo por la conveniencia de establecer una comparación entre
los sujetos.
Como consecuencia directa de esta posición, las puntuaciones de una escala

tendrían significado en función de la posición que asignan al sujeto en el continuo
establecido por la evaluación previa de una muestra o población. Basándose en
procedimientos estadísticos, el evaluador establece un punto crítico a partir del
cual puede atribuirse una categoría cualitativa al dato obtenido por el sujeto.
Siguiendo estos planteamientos, se puede establecer una serie de pasos

indispensables para la elaboración de un instrumento para la evaluación de
atributos psicológicos desde la teoría clásica de los test.
1. Redacción de los ítems.

2. Selección de la muestra.
3. Adecuación de la base de datos.
4. Análisis descriptivo de los ítems.
5. Análisis de confiabilidad de la prueba.
6. Análisis factorial exploratorio.
7. Análisis factorial confirmatorio.
8. Baremación de la prueba.

Primeros pasos:
Antes de evaluar las propiedades psicométricas de cualquier instrumento es
indispensable hacer una revisión de los ítems que lo componen, recolectar datos
en una muestra representativa y significativa del grupo al que estará dirigida la
prueba final y construir una base de datos con la información obtenida.
Redacción de los ítems:

Los ítems son las unidades que componen una prueba psicológica, a través de los
cuales el atributo a evaluar se manifiesta; por lo tanto, es claro que la calidad de
una prueba depende, en principio, de la calidad de sus ítems.
Aunque existen diferentes procedimientos para probar la calidad de los ítems de

una prueba, todos ellos dependen en diferentes grado del proceso de redacción;
si el ítem se encuentra mal redactado puede inducir a errores en la respuesta,
sesgar las opciones del evaluado o incluso hacerlas incomprensibles. Hacer un
análisis cualitativo de la calidad de los ítems es uno de los primeros pasos en la
construcción y validación de una prueba psicológica.
Para Urbina (2004) los criterios centrales para evaluar la calidad de un ítem son:
1. Adecuación del contenido y formato del ítem a los propósitos de la prueba

y las poblaciones en las que se aplicará.
2. Claridad de expresión.
3. Correcta gramática.
4. Adherencia a reglas para la escritura de ítems que pueden evolucionar con
el tiempo.
Respecto al último criterio, Abad, Garrido Oleda y Ponsoda (2006), recomiendan

las siguientes reglas para los cuestionarios de ejecución típica:
 Utilizar tiempo presente.

 Su contenido debe relacionarse con el atributo a evaluar.
 Evitar incluir dos ítems en uno (evitar uso de “y” u “o”).
 La redacción debe poder asumirse por muchos, no por unos cuantos.
 Plantear el posicionamiento personal sobre la afirmación (especialmente en
escalas de actitudes).
 Redactar ítems de orden inverso para evitar la tendencia a la respuesta
automática.
 Evitar el uso de dobles negaciones.
 Disminuir la deseabilidad social en la medida de lo posible.
A modo de ejemplo se presentan tres ítems mal planteados y una versión

alternativa siguiendo las recomendaciones de antes. Cada ítem ha sido pensado

como parte de un cuestionario de actitudes, con una escala de respuestas tipo

Likert.
Tabla 1. Ejemplos de adecuación de redacción de ítems.
Alternativa de
Ítem mal planteado. Justificación
redacción.
En ocasiones siento
que el futuro es En ocasiones siento Se incluyen dos ítems en uno, lo
incierto, aunque que el futuro es que dificulta su comprensión y
después pienso que incierto. posterior solución.
Dios me ayudará.
Las dobles negaciones dificultan
la comprensión del ítem, además
No me gusta no ser Me gusta sentirme
es conveniente incluir ítems
útil. útil.
invertidos para evitar la
aquiescencia.
Siempre pienso bien Las palabras como “siempre” o
Suelo planificar mis
las cosas antes de “nunca” pueden generar sesgos
acciones.
actuar. en las respuestas.
La responsabilidad de la revisión de los ítems suele recaer, en primera instancia, en

quien diseña el instrumento; sin embargo, un método común que aporta
objetividad al proceso, es solicitar a jueces expertos (profesionales en el área con
experiencia en la evaluación de los componentes de la prueba) que evalúen
aspectos como el contenido, pertinencia y suficiencia de cada uno de los ítems,
para posteriormente analizar el grado de coincidencia de los juicios a través de
algún coeficiente de concordancia como el índice Kappa de Cohen o Alpha de
Krippendorff.
Selección de la muestra
Teniendo en cuenta que el objetivo final de la mayoría de las pruebas es la

ubicación del sujeto en un continuo que representa la presencia del atributo en
una población específica (estudiantes, adultos jóvenes, maestros, pacientes
psiquiátricos, etc) es indispensable contar con una adecuada representación de
estos grupos a la hora de establecer las puntuaciones medias, valores de medidas
de ubicación y dispersión.

En términos generales, una muestra debe cumplir con dos condiciones básicas, la
representatividad, es decir, que conserve las características generales de la
población de una forma similar a como se presentan naturalmente; y la
significatividad, que tenga un tamaño lo suficientemente adecuado como para
que todas esas características del atributo psicológico aparezcan.
Una forma clásica de facilitar el cumplimiento de la condición de

representatividad es la selección aleatoria de los sujetos que compondrán la
muestra. La selección al azar garantizará, en principio, la conservación del error
estándar de las variables de interés, permitiendo la construcción de intervalos de
confianza adecuados.
El investigador interesado en evaluar las propiedades psicométricas debe también

seleccionar cuidadosamente su unidad muestral para evitar generalizar los
resultados a poblaciones que no corresponden a la de su interés. Por ejemplo, si la
muestra se recolecta al azar en un instituto de educación superior del oriente
antioqueño, los resultados sólo deberían ser utilizados como parte de la evaluación
de estudiantes universitarios del oriente antioqueño, cualquier aplicación por fuera
de ese límite requeriría el análisis detallado de la conservación de las propiedades
de la población original.
Respecto a la condición de significatividad, existen diferentes modelos

matemáticos para calcular el tamaño adecuado de la muestra. La mayoría de las
formulas usadas suele requerir algún tipo de conocimiento sobre aspectos como la
varianza o las puntuaciones medias de la población, o en ausencia de ellos de
algún valor respecto a la presencia del atributo; sin embargo, cuando se
establece el tamaño de la muestra para la validación de un instrumento en
psicometría se pueden establecer algunas recomendaciones basadas en los
procedimientos de validación estadística posteriores.
Según Lloret-Segura, Ferreres y Hernández (2014), la recomendación clásica del

tamaño de la muestra sugiere mantener una proporción de diez sujetos por cada
ítem de la prueba, es decir, si el instrumento cuenta con 30 ítems, se requeriría una
muestra de mínimo 300 sujetos. A pesar de ser usado ampliamente, este criterio se
desaconseja totalmente en la actualidad, siendo reemplazado por
consideraciones respecto a la interacción del tamaño de la muestra con aspectos
como la comunalidad de los ítems, la cantidad de ítems por factor y la
homogeneidad de la muestra.
Aunque no existe una receta clara que sirva como regla para la elección del
tamaño de muestra ideal para la validación, puede establecerse que una muestra
de menos de 200 sujetos sería insuficiente para la estimación de las propiedades
psicométricas de un instrumento en psicología.

Organización de la base de datos
Antes de proceder con algún análisis es indispensable contar con una base de
datos bien organizada y estructurada. Se recomienda hacer la base de datos en
Microsoft Excel y después “migrarla” al paquete estadístico de preferencia. Si bien
JAMOVI permite la creación y edición de la base de datos directamente se
recomienda utilizar Excel para este proceso a fin de facilitar el cálculo o conversión
de datos mediante el uso de fórmulas.
Al construir la base de datos en indispensable colocar siempre el nombre de las

variables en las columnas (no debe usarse más de una fila para este proceso), esto
aplica tanto para las variables sociodemográficas como para los ítems que
componen el cuestionario. En caso de tener que cambiar el nombre de la
variable, se recomienda utilizar nombres familiares para evitar confusiones a futuro.
En las filas siguientes se deberán colocar los datos de cada sujeto, evitando
siempre ubicar los datos de más de un sujeto por fila.
En caso que la prueba tenga ítems invertidos (es decir, que se califican contrario a
los demás) es necesario reorganizarlos, de no hacerlo se afectarán negativamente
los estadísticos de confiabilidad. La nomenclatura se puede cambiar desde el
momento de la tabulación o desde los paquetes estadísticos. A continuación se
deja un ejemplo para la reorganización de las respuestas de los ítems invertidos.
Tabla 2. Ejemplo de recodificación de ítems con escala de respuesta invertida.
Escala de Completamente En De Completamente

Nominal. Neutro
respuesta en desacuerdo descuerdo acuerdo de acuerdo
original Numérica 1 2 3 4 5
Escala de Completamente De En Completamente
Nominal. Neutro
respuesta de acuerdo acuerdo descuerdo en desacuerdo
modificada Numérica 5 4 3 2 1
Con el objetivo de facilitar el proceso de recodificación se diseñó un archivo en

Excel específicamente para tal fin. En la sección de material de apoyo digital se
encuentra un enlace al archivo, así como a un video tutorial donde se indica paso
a paso el proceso.
Si la prueba se encuentra dividida por factores o solicita calcular puntuaciones

diferenciadas, es conveniente hacerlo desde la base de datos en Excel, dado que
facilita enormemente la obtención de este tipo de información a través del uso de
fórmulas.

Tips y Recomendaciones Finales
 No es conveniente usar nombres largos o complicados para las variables, se

recomienda Ítem 1, Ítem 2, etc. Si la prueba está dividida por factores es
conveniente las iniciales del nombre del factor seguido de un consecutivo.
 La tabulación de la información es uno de los procesos más delicados, los

resultados pueden alterarse gravemente en caso de ingresar información
errónea, por lo que no se recomienda tabular en estados de cansancio,
hambre o en ambientes con mucha distracción.
 Es necesario unificar el formato para las variables cualitativas, por ejemplo si

se usará o no la primera letra en mayúscula o si se omitirán tildes. Todos los
miembros encargados de tabular deberán hacerlo exactamente de la
misma manera, en caso contrario se generarán categorías innecesarias en
las variables.
 No reemplace los datos faltantes. En caso de ser necesario, evalúe con su

asesor/docente si se reemplaza el dato por la media poblacional o del
sujeto.
 A fin de mantener un máximo orden, las hojas de respuestas de los sujetos

con el mismo código o consecutivo de la base de datos, esto facilitará
encontrar un sujeto en particular en caso de requerirse una revisión adicional
de su información.
 Para el cálculo de los factores se deben considerar las recomendaciones de

los autores de la prueba, aunque, para la mayoría de los casos, una función
de sumatoria o promedio suele ser suficiente.

Análisis descriptivo de los ítems
Con el objetivo de conocer las características estadísticas de los ítems que

componen el cuestionario es indispensable realizar un análisis descriptivo de cada
uno de ellos. En este análisis se deben incluir media, moda, puntuación mínima,
puntuación máxima, varianza o desviación estándar y asimetría.
Media: Representa el promedio de la puntuación obtenida por la población. Debe

analizarse en conjunto con los demás valores de la tabla. Valores altos o bajos
(según la escala de respuesta) pueden indicar sesgos positivos o negativos.
Moda: Es una medida de tendencia central que representa el número que más se
repite en la distribución, este dato es relevante debido a que puede indicar una
posible tendencia en la respuesta de los sujetos. Su valor adquiere significado
según la población y atributo que se esté evaluando.
Puntuación máxima y mínima: Es conveniente analizar si para todos los ítems se

reporta por lo menos un caso de puntuación en los extremos de la escala, en caso
contrario podría ser indicador de problemas o limitaciones en la redacción o
comprensión de los ítems así como una inadecuada selección del rango de la
escala.
Desviación típica: Es una medida de dispersión, es un indicador formal de la

diferencia en las respuestas de los sujetos respecto a la media. Su interpretación
debe hacerse siempre en referencia a la escala de respuesta y a la situación
particular de medición.
Varianza: Aporta información sobre la dispersión de los datos. Su interpretación

debe hacerse siempre sobre la base de los requerimientos del test, la población y
el rango de la escala.
Asimetría: Es una medida del grado de sesgo de la información, es un indicador de

la normalidad de los datos. Valores de asimetría cercanos a cero indican una
distribución normal, mientras que valores por encima de 0,7 o por debajo de -0,7
suelen advertir sobre una desviación en la respuesta. Estas medidas deben
complementarse con pruebas de normalidad y un análisis gráfico de la
distribución.
Tanto JASP como JAMOVI permiten hacer un análisis descriptivo completo de los
ítems, la principal diferencia radica en el formato de los gráficos de los que
disponen, por lo que su uso dependerá del usuario.

Análisis descriptivo de los ítems en JASP.
Una vez abierta la base de datos siga estos pasos:
1. Descriptives (esquina
superior izquierda).
2. Descriptive Statistics.
3. Seleccionar los ítems

a los que se les realizará
el análisis.
4.Seleccionar las
medidas a usar.
Mean Media.
Mode Moda.
Std. Desviación
deviation estándar
Variance Varianza.
Skewness Asimetría

Análisis descriptivo de los ítems en JAMOVI.
1. Exploration (esquina
superior izquierda).
2. Descriptives.
3. Seleccionar los ítems

a los que se les realizará
el análisis y abrir la
sección “Statistics”.
4 Seleccionar las
medidas a usar.
Mean Media.
Mode Moda.
Std. Desviación
deviation estándar
Variance Varianza.
Skewness Asimetría

Análisis matemático de la normalidad de los ítems.
Algunos procedimientos multivariantes e inferenciales requieren el cumplimiento

del supuesto de normalidad. Un análisis inicial se basa en los valores de asimetría,
siempre que no sean mayores a 0.7 o menores a -0.7 se puede considerar que la
curva de distribución no tiene un sesgo considerable. Sin embargo, este criterio no
es especialmente preciso, por lo que se recomienda el uso de las pruebas
matemáticas para complementar hallazgos en cuanto a este criterio.
Las pruebas disponibles en los paquetes estadísticos recomendados son:
Prueba de Shapiro-Wilk:
Es una de las pruebas de normalidad más utilizadas. Tiene buenas propiedades de
poder estadístico y está basada en la correlación entre las puntuaciones dadas y
los puntajes normales asociados (Das & Imon, 2016). Originalmente estuvo
restringido a muestra menores a 50 sujetos aunque después se adaptó para
muestras mayores (Yap & Sim, 2011).
Matemáticamente está definido como:

2
[∑𝑛𝑖=1 𝑎𝑖 𝑌(𝑖) ]
𝑆𝑊 = 𝑛
∑𝑖=1(𝑌𝑖 − 𝑌̅)2
Tests de Mardia para la normalidad multivariante:

La evaluación de la normalidad multivariante es un requisito para la selección y
ejecución de algunos procedimientos multivariados como la extracción de
factores por el método de máxima verosimilitud.
Para la evaluación del cumplimiento de este supuesto se pueden utilizar las

pruebas propuestas por Mardia en 1970, estos contrastes se estiman a partir de las
puntuaciones de asimetría o curtosis. Los coeficientes se definen
matemáticamente de la siguiente manera:
Asimetría
𝑛 𝑛
1 3
𝐺1,𝑝 = 2 ∑ ∑[(𝑥𝑖 − 𝑥̅ )′𝑆̂ −1 (𝑥𝑗 − 𝑥̅ )]
𝑛
𝑖=1 𝑗=1

Curtosis:
𝑛
1 2
𝐺2,𝑝 = ∑[(𝑥𝑖 − 𝑥̅ )′𝑆̂ −1 (𝑥𝑗 − 𝑥̅ )]
𝑛
𝑖=1
La interpretación de esta prueba se basa en los valores de significancia de la

curtosis y la asimetría, de esta manera valores significativos (p<0.05) indicarían el
incumplimiento del supuesto.
Para el cálculo del coeficiente se recomienda el uso de librerías de R, en especial

la librería MVN que cuenta con una aplicación web que permite cargar los datos
(en formato .csv) y obtener los resultados directamente.
Prueba de normalidad en JASP y JAMOVI.
Para evaluar matemáticamente la normalidad, siga la ruta descrita, funciona

tanto en JASP como en JAMOVI:
 T-Tests.
 One Sampe T-Test.
 Seleccionar ítems a analizar y ubicarlos en la sección “Dependent Variables”
 Retire la selección de la casilla “Student´s” y seleccione la casilla “Normality”
en “Assumption Checks”.
Figura 1. Configuración de la prueba de normalidad en JAMOVI y JASP

respectivamente.

Regla de Interpretación:
Teniendo en cuenta el planteamiento de la hipótesis nula, los resultados

significativos en las pruebas indican una desviación de la normalidad. Es decir, si
p<0.05 se asume que no se cumple el criterio de normalidad. Para conocer la
dirección del sesgo es necesario recurrir a los valores de asimetría o a un análisis
del gráfico de densidad de la distribución o de su boxplot.
Ejemplo: Abra la base de datos BigFiveInventory y configure adecuadamente los

ítems. Después seleccione los ítems A1 a A5 para el análisis. Siga las instrucciones
descritas anteriormente y configure el paquete estadístico como se indica en la
Figura 1.
Según los resultados puede concluirse que todos los ítems presentan una
desviación de la normalidad, sin embargo, el grado de la violación del supuesto,
así como la dirección del sesgo, sólo pueden evaluarse a través del análisis de los
valores de asimetría o de los boxplot, en la Tabla 4 se presenta la correspondencia
de los valores de asimetría con la distribución de los ítems.
Tabla 3. Valores de la prueba de normalidad de cinco ítems.
Ítems W p
A1 0.854 < .001
A2 0.837 < .001
A3 0.855 < .001
A4 0.813 < .001
A5 0.874 < .001
Nota. Resultados estadísticamente significativos
(p<0.05) indican una desviación de la
normalidad.

Tabla 4. Correspondencia de valores de asimetría con la distribución de respuestas

del ítem.
Valor de Gráfico de cajas y

Ítem Distribución de frecuencia.
asimetría bigotes.
A1 0.826
A2 -1.126
A3 -0.99
A4 -1.03
A5 -0.85
Como puede observarse, el signo de la asimetría advierte la dirección del sesgo,

los valores negativos pueden interpretarse como evidencia de una mayor
concentración de los datos hacia los valores más altos de la escala, mientras que
valores positivos indican una mayor concentración de los datos hacia los valores
más bajos de la escala.
El grado de concentración dependerá del valor de la asimetría, por lo que

números cercanos al cero pueden tomarse como evidencia de ausencia de
sesgo, aunque siempre se deberán complementar con los resultados de las
pruebas de normalidad.

Análisis de confiabilidad.
En psicometría, la confiabilidad hace referencia al grado de precisión y

consistencia de las puntuaciones obtenidas, es la cualidad de las puntuaciones de
las pruebas que sugiere que son suficientemente consistentes y libres de error
como para ser útiles (Urbina, 2014). Vale la pena anotar que toda puntuación de
una prueba tiene un grado de error desconocido asociado, por lo que la
puntuación observada siempre puede ser expresada como:
𝑋𝑜 = 𝑋𝑡𝑟𝑢𝑒 + 𝑋𝑒𝑟𝑟𝑜𝑟
Donde:
 𝑋𝑜 es la puntuación observada.
 𝑋𝑡𝑟𝑢𝑒 es la puntuación verdadera, es decir, la puntuación promedio en una
distribución hipotética que se obtendría si el individuo presentara una infinita
cantidad de veces el ítem. Es una medida hipotética.
 𝑋𝑒𝑟𝑟𝑜𝑟 es el componente de error asociado a toda puntuación,
generalmente es desconocido.
Existen diferentes maneras de evaluar la confiabilidad de una prueba o

cuestionario, las más comunes son las medidas de consistencia interna, entre ellos
destacan tres coeficientes, el alpha de Cronbach, el estadístico Kr20 y el Omega
de McDonald.
Coeficiente de Alpha de Cronbach:
Es el coeficiente más utilizado para la evaluación de la consistencia interna de un

instrumento psicológico. Presentado por Cronbach en 1951 evalúa el grado de
correlación entre los ítems que componen una escala. Puede ser entendido como
el promedio de las correlaciones entre los ítems que hacen parte de un
instrumento (Celina y Campo, 2005; pág 5).
Considerando lo anterior, el coeficiente es útil para la evaluación de la

confiabilidad en instrumentos unidimensionales, es decir, que cuentan con un solo
factor; en caso contrario, en el que los instrumentos se compongan de varios
factores, es indispensable evaluar la consistencia de cada factor por separado.
Este coeficiente asume el cumplimiento de los principios del modelo de Tau

Equivalencia, es decir, considera que la varianza del error es la misma para cada
ítem, que las puntuaciones verdaderas de cada ítem tienen la misma media y la

misma varianza y que todos los ítems miden el mismo rasgo (factor) subyacente
(Dunn, Baguley & Brunsden, 2013); el incumplimiento de este principio puede llevar
sobreestimar o subestimar la consistencia de la prueba. Debido a las dificultades
técnicas para evaluar el cumplimiento de este supuesto (en especial los asociados
a la invarianza en el error) se recomienda acompañar el coeficiente por otros
como el Omega de McDonald, más robusto en estos casos (Dunn, Baguley &
Brunsden, 2013).
Para el cálculo del coeficiente puede hacerse uso de la siguiente fórmula como
indican González y Pazmiño (2015):
𝐾 ∑ 𝑆𝑖2
𝛼= [1 − 2 ]
𝐾−1 𝑆𝑟
Coeficiente Omega de McDonald:
Cuando los principios del modelo de Tau Equivalencia no se cumplen, este

coeficiente suele ser el preferido por los investigadores, debido a la robustez que
ha mostrado al compararlo con otros coeficientes. Incluso, cuando se conoce el
cumplimiento de los principios de Tau Equivalencia, el coeficiente Omega se
comporta tan bien como el Alpha de Cronbach. Este coeficiente además
presenta menor sensibilidad al número de ítems en la escala.
La expresión matemática de este coeficiente es la siguiente:

2
[∑𝑖𝑖=1 λ]
𝜔= 2 2
[∑𝑖𝑖=1 λ] + [∑𝑖𝑖=1 1 − λ2𝑖 ]
Donde:
 ω: es el símbolo de coeficiente omega

 ʎi , es la carga factorial estandarizada de i

Análisis de consistencia interna en JAMOVI y JASP
Tanto JASP como JAMOVI ofrecen la posibilidad de estimar la confiabilidad de la

prueba a través de los coeficientes de consistencia interna Alpha de Cronbach y
Omega de McDonald, el procedimiento es el mismo aunque la ruta difiere en sus
pasos iniciales:
Tabla 5. Pasos para la estimación de la confiabilidad
Ruta para JASP Ruta para JAMOVI

 Descriptives  Factor.
 Reliability  Reliability Analysis.
 Seleccione los ítems que estarán en el análisis de confiabilidad.

 Si existe algún ítem de escala invertida selecciónelo en la opción “Reverse-
Scaled Items”.
 Seleccione los estadísticos a usar, por defecto se recomienda usar el alpha
de Cronbach y Omega de McDonald.
 Seleccione las opciones “Cronbach´s α (if item dropped)” y “McDonald´s
ω (if item dropped)”. Para hacer un análisis de cómo cada ítem afecta el
coeficiente si es eliminado de la prueba.
Ejemplo: Seleccione los ítems A1, A2, A3, A4 y A5 de la base de datos

BigFiveInventory y realice un análisis de su consistencia interna (siga los pasos
descritos antes) con los coeficientes mencionados.

Figura 2. Análisis de consistencia interna.
Como puede observar en la Figura 2 ni el Alpha de Cronbach ni el Omega de

McDonald superan el umbral mínimo, sin embargo, la nota bajo la tabla advierte
que el ítem A1 tiene una correlación negativa con el resto, por lo que puede
tratarse de un ítem de calificación invertida. Lo anterior puede corroborarse tanto
en el valor negativo de la correlación ítem-rest como en el “mapa de calor”,
presentado en la Figura 3.
La interpretación del gráfico sigue las mismas reglas de las correlaciones, es decir,
se analiza tanto su fuerza como su dirección. Las correlaciones positivas
aparecerán en diferentes tonos de color verde y las negativas en diferentes tonos
de rojo, las correlaciones débiles aparecerán más claras, siendo prácticamente
blancas alrededor del cero.
Figura 3. Mapa de calor de los ítems
En la Figura 3 se puede apreciar el mapa de calor para los cinco primeros ítems de
la base de datos BigFiveInventory.csv que se trabajó anteriormente. Se han
señalado las correlaciones negativas entre el ítem A1 y el resto de ítems. Como
recordará este ítem es de escala invertida, por lo que es esperable que presente
una correlación negativa con otros ítems de la prueba. De no corregirse esta
condición se afectarán los coeficientes de confiabilidad, como se mostró en el
análisis inicial.

Figura 4. Mapa de calor con ítem invertido corregido.
En la Figura 4 se puede observar el cambio en la dirección de la correlación

respecto a la situación inicial del ítem. También se puede observar un ajuste de los
coeficientes de consistencia interna (α =0.704 y ω=0.724). En la Tabla 6 también se
presentan los resultados de la correlación ítem-rest y de los coeficientes “if ítem
dropped” una vez corregida la dirección del ítem A1.
Tabla 6. Análisis de consistencia interna ítem a ítem.
if item dropped
item-rest correlation Cronbach's α McDonald's ω
A1 ᵃ 0.311 0.718 0.731

A2 0.563 0.618 0.650
A3 0.589 0.601 0.626
A4 0.395 0.687 0.706
A5 0.487 0.645 0.670
ᵃ reverse scaled item
De acuerdo con los resultados, la eliminación de alguno de los ítems repercutiría

negativamente en los coeficientes de consistencia interna, a excepción del ítem
A1 que mejoraría levemente el omega de McDonald. También es necesario
considerar el valor de la correlación ítem-total, en caso de ser menor a 0.3 se
recomienda la eliminación del ítem.

En el caso particular de este análisis se recomienda conservar el ítem A1, al tener

una relación adecuada con el total de la escala y al mejorar muy poco sólo uno
de los coeficientes de consistencia interna.

Análisis Factorial Exploratorio para la validez de estructura.
La validez de estructura hace referencia a qué tan bien la prueba representa el

constructo que se está evaluando, es decir, qué tan similar es la estructura de la
prueba a la del constructo evaluado. Suponga que está utilizando un cuestionario
para evaluar los rasgos de personalidad basándose en el modelo de los cinco
grandes (agradabilidad, conciencia, neuroticismo, extraversión y apertura) la
prueba debe contener ítems que evalúe cada uno de esos componentes, si omite
alguno de ellos no se podría considerar una representación adecuada del
constructo de personalidad, por lo menos desde este modelo.
Para poder analizar qué tan adecuadamente los ítems de la prueba representan
el constructo hipotético que pretenden medir se debe identificar si esos ítems
pueden ser agrupados en “factores”, es decir, si existen grupos de correlaciones
entre ciertos ítems que los diferencien de los demás.
La técnica de análisis factorial comprende un conjunto de procedimientos

estadísticos multivariados que puede ser utilizado para indicar si los ítems de un
cuestionario pueden ser agrupados en unos pocos clústeres (factores), cada uno
reflejando diferentes constructos (Streiner, 1994).
En otras palabras, el objetivo del análisis factorial es la reducción del número de los
indicadores operativos de la prueba en un conjunto menor de variables
conceptuales (Péres y Medrano, 2010). Cada grupo de ítems se denomina factor y
refleja un concepto teórico específico.
El análisis factorial le permite entonces al investigador, aproximarse a la validez de

estructura de la prueba al conocer cuál es la estructura de relación entre los ítems
de la prueba y así argumentar respecto a su utilidad como representación de un
modelo teórico específico.
La técnica se basa, en principio, en la identificación de patrones en la matriz de

correlación entre los ítems, de esta manera, aquellos ítems que presentan una
correlación más alta entre ellos que con los demás se agruparían en un solo factor.
A modo de ejemplo, en capítulos pasados se ha analizado la relación entre los
ítems A1 a A5 de la base de datos BigFiveinventory; sin embargo, si se elabora un
“mapa de calor” (que no es otra cosa que una representación de la matriz de
correlación) agregando los ítems C1 a C5 se obtendrán los resultados presentados
en la Figura 5.

Figura 5. Correlación entre ítems correspondientes a cada factor.
Se han resaltado con azul y rojo las correlaciones correspondientes a los ítems A e
Ítems C respectivamente. Si observa con detenimiento podrá darse cuenta que
existe una correlación más fuerte entre los ítems A respecto a los ítems C, y que de
manera similar la correlación entre los Ítems C es más alta entre ellos que con los
ítems A.
Esto significa que cada conjunto de ítems es más similar entre ellos en
comparación con el otro, pudiéndose agrupar en dos factores, cada uno
reflejando un aspecto diferente del constructo general que representa la prueba.
En este caso los ítems representan las dimensiones de Agradabilidad (A1 a A5) y
Conciencia (C1 a C5) del modelo de los cinco grandes, las demás dimensiones no
se presentan para facilitar la comprensión del principio.
En la inmensa mayoría de casos, cuando se analizan las propiedades

psicométricas de un instrumento en psicología o educación, no se cuenta con
información sobre la organización de los ítems o la estructura de covariación entre
ellos a priori, por lo que resulta francamente inviable proceder de manera manual,
por lo que es obligatorio realizar un análisis factorial exploratorio sobre los ítems.
Para realizar el análisis factorial el investigador debe trabajar siempre con una base
de datos que contenga cada una de las respuestas de los sujetos a cada uno de
los ítems de la prueba.
En general el procedimiento puedo ser dividido en una serie de pasos:

1. Análisis de la adecuación muestral

Antes de proceder, es necesario evaluar si los datos se ajustan o no a los
requerimientos y principios del análisis factorial, para lo que se suelen utilizar dos
medias: el índice de Kaiser-Meyer Olkin (KMO) y la prueba de esfericidad de
Bartlett.
Índice de Kaiser-Meyer Olkin:

También conocido como medida de adecuación muestral (Zamora, Monroy y
Chávez, 2009). Es un indicador del grado de asociación de las variables (ítems)
bajo las condiciones del análisis factorial. En principio, si los ítems comparten
factores comunes, los coeficientes de correlación parcial serían bajos, mientras
que los valores de la diagonal de la matriz de correlación anti-imagen deberían ser
altos (Pérez y Medrano, 2010), por lo que valores relativamente altos (por encima
de 0.7) de este índice sugerirían la viabilidad de aplicar la técnica de análisis
factorial. Por otro lado, valores por debajo de 0.6 indicarían que no es adecuado
usar estos procedimientos.
La fórmula para calcular el índice es:
∑𝑖≠𝑗 𝑟𝑖𝑗2
𝐾𝑀𝑂 =
∑𝑖≠𝑗 𝑟𝑖𝑗2 + ∑𝑖≠𝑗 𝑟𝑖𝑗∙𝑚
2
Prueba de Esfericidad de Bartlett:

Esta prueba permite analizar si la matriz de ítems es una matriz de correlación
viable para el análisis factorial al compararla con una matriz de identidad (Pérez y
Medrano, 2010), como las presentadas en la Figura 6. La hipótesis nula afirma que
la matriz de ítems es igual a una matriz de identidad, en cuyo caso no sería viable
realizar un análisis factorial debido al bajo grado de asociación entre los elementos
de la prueba.
Figura 6. Ejemplos de matrices de identidad.
Una matriz de identidad se caracteriza por tener valores iguales a uno sobre la
diagonal y cero en el resto de elementos que la componen. Con base en el
supuesto de la hipótesis nula de la prueba, valores significativos (p<0.05) indicarían

que la matriz de ítems no es una matriz de identidad, por lo que el procedimiento

de análisis factorial sería viable.
Para el diagnóstico respecto a la adecuación de la muestra para la realización del

análisis factorial se requieren entonces valores altos (>0.7) en el índice KMO y una
puntuación significativa (p<0.05) en la prueba de esfericidad de Bartlett.
2. Extracción de los factores:
El siguiente paso en el análisis de la validez de estructura de las pruebas es la

extracción de factores, es decir, identifica cuántos factores se requieren para
resumir las relaciones entre los ítems. A la hora de seleccionar el número de
factores existen diferentes métodos, los tres más comunes son:
Análisis paralelo: Selecciona los factores comunes que tengan autovalores más
altos que los que presentarían en una situación donde los ítems no estuvieran
relacionados (Lloret-Segura, Ferreres-Traver, Hernández-Baeza, Tomás-Marco,
2014). Es uno de los métodos más recomendados en la actualidad, incluso por
encima de métodos más populares como el uso conjunto de autovalores
superiores a uno y scree plot o el criterio arbitario del investigador.
A partir de los autovalores (eigenvalues): Conocido también como método clásico

o regla de Kaiser, es la opción por defecto de muchos paquetes estadísticos
tradicionales. Consiste en elegir los factores de la prueba según superen un
autovalor igual a uno, indicando que el componente logra explicar más varianza
que una variable (ítem) por sí sola (Zamora y Esnaloa, 2015). A pesar de ser una de
las técnicas más desaconsejadas actualmente es también una de las más usadas
(Lloret-Segura, Ferreres-Traver, Hernández-Baeza, Tomás-Marco, 2014).
Esta técnica suele acompañarse del Scree-plot, un método gráfico que permite la
estimación del número de factores a partir de la interpretación del punto de
inflexión o de los factores que superen un autovalor igual a uno. En la Figura 7 se
puede observar un gráfico de sedimentación (scree plot) de la base de datos
trabajada en ejemplos anteriores (BigFiveInventory).

Figura 7. Gráfico de sedimentación.
Según la interpretación más recomendada del gráfico de sedimentación, se

sugeriría una estructura factorial de tres factores, al ser los que presentan
autovalores mayores a uno. Existe otro principio de interpretación basado en el
punto de inflexión, es decir, el punto en el que la curva cambia notablemente de
dirección; de acuerdo con esa interpretación, la estructura factorial sería de seis
factores, al ser los que quedan a la izquierda del factor 7, punto en el que la
dirección de la curva se altera notoriamente. Debido al carácter subjetivo de este
criterio no se recomienda su uso como único método para la selección del número
de factores a extraer.
Número fijo de factores: Se refiere al uso del criterio teórico del investigador para
selecciona “a priori” el número de factores a utilizar, sólo se recomienda en los
casos donde las soluciones factoriales no sean interpretables a razón del modelo
teórico subyacente. En cualquier otro caso se recomienda usar algún método
objetivo.
La selección del método más adecuado para la extracción de factores quedará a

consideración de quien analice las propiedades psicométricas de la prueba. En
cualquier caso, se desaconseja completamente utilizar el método de
componentes principales, debido a que es incompatible con los principios teóricos
del análisis factorial y de los intereses de los análisis psicométricos en psicología
(para una discusión detallada sobre el tema ver Lloret-Segura, Ferreres-Traver,
Hernández-Baeza, Tomás-Marco, 2014).

3. Rotación de los factores:
Cuando se selecciona el método más adecuado para la extracción de los

factores se procede con la rotación de los mismos. La orientación original se
remonta a 1947 con Thurstone, quien recomendó que los factores fueran rotados
en un espacio multidimensional a fin que la estructura factorial final fuese lo más
simple de interpretar (Lloret-Segura, et. al., 2014), por lo que el proceso de rotación
tiene la función exclusiva de facilitar la interpretación de la estructura factorial
final, es decir, ningún método de rotación afecta el número de factores extraídos,
pero sí la fuerza de la relación de los ítems con el factor.
La rotación consiste en modificar la posición de los ítems en un espacio creado por

los ejes de referencia formados a partir de los factores extraídos y los pesos de
correlación de cada ítem con los factores (Pérez y Medrano, 2010). La
simplificación de la solución inicial (no rotada) se logra reduciendo las
correlaciones de los ítems con diferentes factores, así como las correlaciones
negativas.
Existen dos tipos de rotaciones factoriales, las ortogonales y las oblicuas,

diferenciadas por el tipo de modificación que permiten hacer sobre la posición de
los ítems en los ejes factoriales. El uso de uno u otro tipo de rotación dependerá del
grado de relación entre los factores, se recomienda considerar como bajas
correlaciones consistentes entre los factores por debajo de 0.3 o 0.2 (Lloret-Segura,
et. al., 2014).
Rotaciones Ortogonales: Asumen que no existe una correlación entre los factores;
aunque es uno de los métodos de rotación más populares (sobre todo porque
suelen dar soluciones fácil de interpretar) no es muy congruente con la evaluación
psicológica, que asume, por definición cierto grado de intercorrelación entre
factores. Las rotaciones ortogonales más usadas son:
Varimax: Busca minimizar el número de saturaciones altas en cada factor,

optimizando la solución por columnas.
Quartimax: Minimiza el número de factores necesarios para explicar

cada variable (ítem).
Rotaciones Oblicuas: Este tipo de rotaciones asumen que existe cierto grado de
intercorrelación entre los factores, por lo que son más congruentes con la mayoría
de situaciones de evaluación psicológica, de acuerdo con Lloret-Segura y
colaboradores (2014) este tipo de rotaciones son las más recomendadas en la
actualidad, independiente del modelo teórico desde el que se parta.

Las rotaciones oblicuas más comúnmente usadas son:
Oblimin: Es la opción de rotación oblicua por defecto. Parte de un valor

Delta de base igual a cero para establecer la solución rotada.
Promax: Es más fácil de calcular que la rotación oblimin. En caso de ser

necesario, se recomienda que el valor Kappa (utilizado para su cálculo)
sea de cuatro.
Aunque se recomienda analizar la matriz de correlaciones entre factores para

seleccionar el método de rotación más adecuado, es necesario mencionar que el
investigador debe ceñirse al criterio empírico de parsimonia interpretativa, es decir,
el investigador-evaluador podrá seleccionar el método de rotación que dé como
resultado la solución factorial más sencilla e interpretable.
En cualquier caso, se recomienda siempre proceder, en un primer momento del

análisis, con algún tipo de rotación oblicua, al ser más congruentes con los
principios de las definiciones teóricas de los constructos en psicología.
Finalmente, se recomienda utilizar el modelo teórico que le dio origen a la prueba

como un marco interpretativo de parsimonia, evitando así una solución factorial
difícil de interpretar para quienes utilicen la prueba a futuro.
Selección de los ítems por factor:
Cuando se han extraído y rotado los factores se procede a la interpretación de las

cargas factoriales. Dichas cargas representan la correlación entre el ítem y el
factor (Zamora, Monroy y Chávez, 2009), por lo que cargas factoriales altas
indicarían una adecuada representación del factor.
Todos los ítems de la prueba tienen una correlación con cada uno de los factores,
por lo que es necesario interpretar adecuadamente su valor. Como criterio para la
interpretación de las cargas factoriales, suele establecerse un puntaje de 0.4,
debajo del cual se consideraría que el ítem no corresponde a un determinado
factor, sin embargo, el tamaño de la muestra puede influir en los valores de la
correlación como lo demuestran Zamora, Monroy y Chávez (2009), quienes
recomiendan además unos criterios de interpretación ajustados al tamaño de la
muestra, como se presenta en la Tabla 7.

Tabla 7. Recomendación para la interpretación de cargas factoriales según el

tamaño de la muestra y potencia estadística.
Carga Tamaño
Factorial muestral
0,3 352
0,35 250
0,4 200
0,45 150
0,5 120
0,55 100
0,6 85
0,65 70
0,7 60
0,75 50
Adaptado de Zamora, Monroy y Chávez, 2009
Además de interpretar el valor de la carga factorial, también debe considerar su

signo. Valores negativos pueden ser interpretados como una correlación negativa
del ítem respecto al factor (Furr, 2011)y suele ser común cuando se tienen ítems de
calificación invertida.
Por recomendación general, aquellos ítems que presenten cargas factoriales altas
en diferentes factores, deben ser eliminados de la prueba al aportar información
ambigua del atributo psicológico a medir. En caso que un ítem no presente cargas
factoriales adecuadas en ninguno de los factores deberá también ser eliminado
del cuestionario final.
Finalmente, Lloret-Segura et al. (2014) recomiendan que el número mínimo de

ítems con los que debe contar un factor es de tres o cuatro para una muestra de
200 sujetos, aunque, en general, entre más ítems tenga un factor mejor será su
comportamiento psicométrico.

Análisis factorial exploratorio en JAMOVI.
Análisis de adecuación muestral.

1. Abra la base de datos BigFiveInventory y configure adecuadamente todos
los ítems.
2. En el icono “Factor” seleccione la opción “Exploratory Factor Analysis”.
3. Seleccione los ítems de la prueba sobre los que se hará el análisis factorial
exploratorio.
4. En la sección de “Assumption Checks” active las opciones “Bartlett’s test of
sphericity” y “KMO measure of sampling adequacy”
En la ventana de resultados, debajo de la tabla “Factor Loadings” usted obtendrá

la siguiente salida:
Tabla 8. Resultados de la prueba de esfericidad de Bartlett.
Bartlett's Test of Sphericity

χ² df p
18146 300 < .001
Debajo de esa tabla se encuentra la tabla de adecuación muestral, para facilitar

su presentación se muestra dividida en la Tabla 9.
Tabla 9. Medidas de adecuación muestral general (Overall) y por ítem.
KMO Measure of Sampling KMO Measure of

Adequacy Sampling Adequacy
MSA MSA
Overall 0.849 E3 0.897
A1 0.754 E4 0.877
A2 0.836 E5 0.893
A3 0.870 N1 0.779
A4 0.878 N2 0.780
A5 0.904 N3 0.862
C1 0.843 N4 0.885
C2 0.796 N5 0.860
C3 0.852 O1 0.859
C4 0.827 O2 0.780
C5 0.864 O3 0.844
E1 0.838 O4 0.770
E2 0.884 O5 0.762

En el caso de la tabla del índice de adecuación KMO, JAMOVI presenta tanto el

valor del índice general de la prueba (Overall), como los valores correspondientes
a la diagonal en la matriz de correlación anti-imagen para cada ítem. En este
caso veremos cómo se corresponden con la matriz obtenida a través de otro
paquete estadístico, por motivos de espacio sólo se presentan los primeros 10 ítems
de la escala.
Tabla 10. Ejemplo de matriz Anti-imagen de los ítems.
A1 A2 A3 A4 A5 C1 C2 C3 C4 C5
A1 ,754 0,241 0,132 0,024 0,031 -0,046 -0,047 -0,036 -0,088 0,019
A2 0,241 ,836 -0,267 -0,159 -0,101 0,023 0,025 -0,117 0,016 -0,033
A3 0,132 -0,267 ,870 -0,159 -0,258 -0,004 -0,018 -0,002 -0,004 0,009
A4 0,024 -0,159 -0,159 ,878 -0,068 0,048 -0,147 0,036 0,019 0,112
Correlación A5 0,031 -0,101 -0,258 -0,068 ,904 -0,024 0,029 -0,027 -0,004 -0,019
anti-imagen C1 -0,046 0,023 -0,004 0,048 -0,024 ,843 -0,257 -0,124 0,152 0,034
C2 -0,047 0,025 -0,018 -0,147 0,029 -0,257 ,796 -0,160 0,223 0,066
C3 -0,036 -0,117 -0,002 0,036 -0,027 -0,124 -0,160 ,852 0,139 0,173
C4 -0,088 0,016 -0,004 0,019 -0,004 0,152 0,223 0,139 ,827 -0,287
C5 0,019 -0,033 0,009 0,112 -0,019 0,034 0,066 0,173 -0,287 ,864
a. Medidas de adecuación de muestreo (MSA)
Siguiendo la regla de interpretación descrita al principio, se puede concluir que es
conveniente aplicar el análisis factorial a los ítems.
¿Cómo Reportar?
Los resultados del índice de Kaiser-Meyer-Olkin (KMO=0.849) y la prueba de
esfericidad de Bartlett (X2(300)=18146;p<0.001) permiten concluir que es viable
aplicar la técnica de análisis factorial a los ítems.
Extracción y rotación de los factores:
Configure las opciones como se muestra en la Figura 8. Esto configurará el

programa para realizar las pruebas de adecuación muestral, extracción de
factores a través de análisis exploratorio a partir de análisis paralelo y una rotación
oblimin mostrando cargas factoriales superiores a 0.4.

Figura 8. Configuración para análisis factorial exploratorio.
A partir de este procedimiento se obtiene un total de seis factores. El filtro aplicado

sobre las cargas factoriales da como resultado la estructura expuesta en la Tabla
11.
Tabla 11. Tabla de cargas factoriales tras la rotación.
Factor
Uniqueness
1 2 3 4 5 6
A1 -0.563 0.666
A2 0.701 0.484
A3 0.628 0.474
A4 0.410 0.703
A5 0.460 0.517

Factor
Uniqueness
1 2 3 4 5 6
C1 0.548 0.641
C2 0.674 0.505
C3 0.562 0.683
C4 -0.675 0.409
C5 -0.553 0.568
E1 0.600 0.601
E2 0.682 0.440
E3 0.518
E4 -0.532 0.440
E5 0.599
N1 0.848 0.298
N2 0.833 0.335
N3 0.674 0.462
N4 0.430 0.433 0.494
N5 0.437 0.651
O1 0.566 0.653
O2 -0.420 0.701
O3 0.655 0.514
O4 0.754
O5 -0.491 0.639
Note. 'oblimin' rotation was used
El valor observado en cada columna es la carga factorial, es decir, la relación

existente entre el ítem y determinado factor, la última columna contiene los valores
de la “especificidad” (uniqueness) de cada ítem, es decir, la cantidad de varianza
común de la variable no asociada con el factor.
Como puede observarse, el factor seis no presenta, al parecer, ninguna carga que
supere el umbral de 0.4 establecido en la configuración del análisis, esta situación
indica la presencia de covariación entre diferentes ítems de los factores, pero no lo
suficientemente alta como para generar una situación de ambigüedad. En un
análisis detallado de la matriz de correlación se encontró que al eliminar el ítem A1
el factor desaparece, por lo que es necesario retirarlo de la estructura factorial
final para facilitar la interpretación de los hallazgos.

También se observa que los ítems E3, E5 y O4 no presentan cargas factoriales altas
en ninguno de los factores, siendo necesaria su eliminación. El ítem N4 también se
elimina al considerarse ambiguo, debido a la carga que presenta en dos factores
diferentes.
Tabla 12. Resumen de la varianza explicada por factor.
Summary
Factor SS Loadings % of Variance Cumulative %
1 2.501 10.00 10.0

2 2.114 8.46 18.5
3 2.178 8.71 27.2
4 1.961 7.84 35.0
5 1.737 6.95 42.0
6 0.761 3.04 45.0
La tabla de resumen (“Summary”) se encuentra información sobre la cantidad de

varianza explicada por factor, así como la varianza total explicada por la prueba.
Como puede observarse, la estructura factorial obtenida explica un 45%
(Cumulative %) de la varianza. Para el caso de las ciencias sociales, se suele fijar un
mínimo de varianza explicada en 60% (Hair, Anderson, Tatham & Black, 2004 citado
en Frías-Navarro y Pascual, 2012).
Estructura Factorial Final.
Tras el primer análisis, se deben retirar los ítems A1, E3, E5, O4 y N4 obteniendo una
estructura factorial con adecuados índices de adecuación muestral (KMO=0.809;
X2(190)=13897; p<0.001) y con la estructura que se presenta en la Tabla 13.
Tabla 13. Estructura y cargas factoriales finales.
Factor
Uniqueness
1 2 3 4 5
A2 0.589 0.615
A3 0.711 0.451
A4 0.458 0.697
A5 0.582 0.513
C1 0.536 0.663
C2 0.650 0.546
C3 0.569 0.674
C4 -0.671 0.490
C5 -0.568 0.575
E1 0.603 0.621

Factor
Uniqueness
1 2 3 4 5
E2 0.768 0.366
E4 -0.561 0.456
N1 0.836 0.311
N2 0.815 0.341
N3 0.681 0.497
N5 0.462 0.677
O1 -0.484 0.725
O2 0.496 0.703
O3 -0.614 0.538
O5 0.550 0.694
Tabla 14. Resumen del modelo factorial final.
Factor SS Loadings % of Variance Cumulative %

1 2.20 11.02 11.0
2 1.94 9.71 20.7
3 1.81 9.05 29.8
4 1.58 7.89 37.7
5 1.31 6.56 44.2
Tabla 15. Matriz de correlación final entre factores.
1 2 3 4 5
1 — -0.246 -0.104 0.301 0.116
2 — 0.293 -0.248 -0.292
3 — -0.543 -0.170
4 — 0.284
5 —
Como puede observarse, la estructura cuenta con cinco factores con al menos
tres ítems en cada uno. Este modelo explica un total de 44.2% de la varianza. La
matriz de correlaciones presentada en la Tabla 14 indica unos niveles bajos de
asociación entre la mayoría de los factores, justificando la posible utilización de
rotaciones ortogonales, sin embargo, apelando al principio de parsimonia descrito
con anterioridad y las recomendaciones de Lloret-Segura et. al. (2014) se mantiene
la decisión de la rotación oblicua.
Finalmente, para comprobar el ajuste de este modelo a la matriz de datos

recolectadas es necesario proceder con un análisis factorial confirmatorio. De lo
contrario la estructura tendrá meramente un carácter descriptivo.

Análisis factorial confirmatorio.
El análisis factorial confirmatorio (AFC) es un procedimiento multivariado de validez

psicométrica, es particularmente útil para estimar el grado de ajuste de una
estructura factorial específica a una muestra de datos.
Suele recomendarse para “comprobar” una teoría a partir de la interpretación de

una serie de índices de ajuste y medidas incrementales; en el caso de las pruebas
psicométricas, suele ser el último paso para la validación de una estructura
factorial estimada a partir de los procedimientos de análisis factorial exploratorio.
Es necesario aclarar que existe una diferencia entre comprobar el ajuste del
modelo y estimar una relación causal entre las variables, por lo que técnicamente,
los resultados del análisis factorial confirmatorio no pueden tomarse como
evidencia de explicación.
El AFC se clasifica entre los modelos de ecuaciones estructurales, específicamente

en el modelo de medida. En términos generales, permite estimar la relación (en
términos de coeficientes de regresión) entre cada uno de los ítems y una variable
latente (factor), la covariación entre factores, estimar el error asociado a cada
una de las medidas y analizar el ajuste de la estructura a los datos.
e1 Ítem 1
e2 Ítem 2
Factor 1
e3 Ítem 3
e4 Ítem 4
e5 Ítem 5
Factor 2
e6 Ítem 6
e7 Ítem 7
Figura 9. Modelo de medida de dos factores.
En la Figura 9 se puede observar un modelo de medida para análisis factorial

confirmatorio, las flechas con una sola punta indican la asociación entre los ítems y
los factores y entre los errores y cada uno de los ítems que componen la prueba.
Las flechas con dos puntas indican la covariación (correlación) entre los factores,
esto es el grado de asociación entre los factores que componen la escala. Los
rectángulos se utilizan para representar las variables observadas, mientras que los
óvalos se usan para las variables latentes.

La elaboración de un AFC puede dividirse en cinco pasos generales.
Especificación del modelo:
En esta etapa se establece formalmente el modelo basándose en criterios teóricos.

La claridad del modelo parte del conocimiento que tiene el investigador sobre la
teoría subyacente. En el caso de usar un modelo de medida para AFC el modelo
se establece, generalmente, a partir de los resultados del AFE.
Identificación del modelo.
Una vez se ha establecido un modelo teóricamente justificable es necesario saber

si se encuentra sobre-identificado o no, esto es saber si los parámetros pueden ser
estimados matemáticamente. Una forma relativamente simple de saber si el
cálculo del modelo es viable o no, es a través de la estimación de los grados de
libertad.
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑙𝑎𝑡𝑒𝑛𝑡𝑒𝑠 (𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑙𝑎𝑡𝑒𝑛𝑡𝑒𝑠 + 1)

𝐺𝑙 =
2
Si el resultado es igual o mayor a cero se puede concluir que el análisis es viable,

en caso contrario se trataría de un modelo infra estimado, es decir un modelo en
el que se intentan estimar más parámetros de los que permitiría la información
disponible.
Estimación de parámetros:
Una vez se ha determinado que el modelo es viable teórica y matemáticamente,

se procede a realizar la estimación de los parámetros. Aunque existen diferentes
métodos descritos en la bibliografía (ver Lara, 2014), el método de máxima
verosimilitud es el más popular y utilizado, siendo lo suficientemente robusto ante la
violación del supuesto de normalidad multivariante, por lo que se toma como
método por defecto en la mayoría de los análisis.
Diagnóstico de la bondad de ajuste.
La estimación del grado de ajuste de la estructura factorial se hace a partir de la

interpretación de los índices de ajuste y las medidas incrementales. En la Tabla 16
se presenta un resumen de las medidas de ajuste comúnmente reportadas así
como de los valores críticos para su interpretación.
Vale la pena anotar que algunas de estas medidas son particularmente sensibles
al tamaño de la muestra. Tal es el caso del Chi Cuadrado cuyos valores tienden a
ser significativos si la muestra es mayor a 200, tendiendo a rechazar modelos bien

ajustados. En dichos casos se recomienda hacer un análisis completo de las demás

medidas de ajuste e índices incrementales.
Tabla 16. Índices de adecuación muestral y medidas incrementales comunes para

el Análisis Factorial Confirmatorio.
Medida de bondad
Denominación. Descripción. Interpretación.
de ajuste.
Medida de ajuste
general del modelo a
Valores significativos
los datos. Contrasta si
indican que el
la diferencia entre la
Chi Cuadrado X2 modelo no se ajusta
matriz reproducida y la
adecuadamente a
correspondiente a los
los datos.
datos es significativa o
no.
Razón Chi
cuadrado sobre los X2/gl Valores menores a 3
grados de libertad
Medidas
Denominación. Descripción. Interpretación.
Incrementales.
Evalúa la disminución
Índice de ajuste del X2 del modelo
NFI Mayor o igual a 0.90
Normalizado NFI respecto al modelo
nulo.
Analiza los cambios en
Índice de Tucker-
NNFI - TLI el X2 si se agregan Mayor o igual a 0.90
Lewis
elementos al modelo
Idealmente se
Matemáticamente se esperan valores
Aproximación a la
define como el error menores a 0.05,
raíz del residuo
RMSA de aproximación aunque algunos
cuadrático
medio por el grado de autores usan como
promedio
libertad. criterio valores
menores a 0.08.
Es una medida
Raíz del residuo estandarizada del
cuadrático RMSA, presenta la
SRMR p<0,05
promedio ventaja de ser
normalizado SRMR insensible a la medida
del instrumento.
Nota: Descripción y reglas de interpretación obtenidas y adaptadas de Ruiz, Pardo
y San Martín (2010), Lara (2014).

Re-especificación del modelo.
A partir de la lectura de los estadísticos y medidas de bondad de ajuste se puede

tratar de “mejorar” el modelo, para esto es esencial hacer una lectura de los
índices de modificación que aportan información sobre los cambios que sufriría el
modelo en caso de retirar o agregar alguno de los senderos en el modelo.
En cualquier caso, el investigador tendrá siempre la responsabilidad de justificar

teóricamente los cambios realizados al modelo, no se recomienda proceder
guiado exclusivamente por la optimización de resultados estadísticos dado que las
matemáticas son ciegas a los modelos teóricos que le dieron origen a la prueba.
Análisis factorial confirmatorio con JAMOVI.
Para este ejercicio se pondrá a prueba la estructura factorial identificada en el

capítulo anterior.
Para la especificación de la estructura a probar se deben “agregar” los ítems a

cada uno de los factores identificados previamente, se recomienda asignarles los
nombres correspondientes al modelo teórico, en este caso el modelo de los cinco
grandes rasgos de personalidad.
Configure la ventana de JAMOVI de acuerdo con la Figura 10. Recuerde crear un

factor para cada conjunto de variables siguiendo los resultados del AFE del
capítulo anterior.
Figura 10. Configuración básica para el análisis factorial confirmatorio.

Tras el análisis se obtendrán las siguientes tablas.
Tabla 17. Cargas factoriales.
Factor Indicator Estimate SE Z p

Agradabilidad A2 0.719 0.0230 31.2 < .001
A3 0.948 0.0248 38.2 < .001
A4 0.726 0.0299 24.3 < .001
A5 0.871 0.0243 35.9 < .001
Conciencia C1 0.665 0.0261 25.5 < .001
C2 0.779 0.0274 28.4 < .001
C3 0.692 0.0265 26.1 < .001
C4 -0.934 0.0276 -33.8 < .001
C5 -0.993 0.0335 -29.7 < .001
Apertura O1 0.626 0.0253 24.7 < .001
O2 -0.653 0.0373 -17.5 < .001
O3 0.848 0.0298 28.5 < .001
O5 -0.624 0.0311 -20.0 < .001
Extraversion E1 0.941 0.0329 28.6 < .001
E2 1.144 0.0323 35.4 < .001
E4 -1.090 0.0292 -37.3 < .001
Neuroticismo N1 1.331 0.0274 48.6 < .001
N2 1.271 0.0267 47.7 < .001
N3 1.057 0.0291 36.4 < .001
Tabla 18. Covarianzas entre factores.
Estimate SE Z p
Agradabilidad Agradabilidad 1.000
Conciencia 0.350 0.0235 14.87 < .001
Apertura 0.315 0.0260 12.11 < .001
Extraversión -0.653 0.0190 -34.34 < .001
Neuroticismo -0.205 0.0232 -8.84 < .001
Conciencia Conciencia 1.000
Apertura 0.323 0.0260 12.41 < .001
Extraversión -0.282 0.0245 -11.49 < .001
Neuroticismo -0.250 0.0234 -10.69 < .001
Apertura Apertura 1.000
Extraversión -0.324 0.0266 -12.20 < .001
Neuroticismo -0.133 0.0255 -5.21 < .001
Extraversión Extraversión 1.000
Neuroticismo 0.220 0.0232 9.46 < .001
Neuroticismo Neuroticismo 1.000

Tabla 19. Chi cuadrado del modelo.
χ² df p
1953 142 < .001
Tabla 20. Medidas incrementales para el modelo.
RMSEA 90% CI
CFI TLI RMSEA
Lower Upper
0.868 0.841 0.0675 0.0649 0.0702
Tabla 21. Índices de modificación
Agradabilidad Conciencia Extraversión Neuroticismo Apertura
A2 0.5448 17.16762 11.632 0.0205

A3 13.8586 20.59765 27.798 0.0145
A4 41.0987 0.61329 5.449 19.0354
A5 1.2149 80.79862 48.007 8.7403
C1 3.1870 0.70099 21.711 30.9094
C2 0.0552 14.84934 90.200 5.3780
C3 0.7804 8.48773 13.166 22.9560
C4 6.4297 0.00132 34.037 0.3518
C5 14.7680 47.88381 95.047 4.9369
E1 35.7908 42.0033 49.418 5.8686
E2 32.4990 17.7580 37.085 17.1261
E4 123.1413 0.9747 0.209 35.1234
N1 0.0796 0.2723 2.38495 2.4341
N2 0.2026 4.8647 0.23358 2.8246
N3 1.0541 5.4335 2.27162 0.0197
O1 4.7362 0.6076 2.09168 1.213
O2 70.6327 8.9256 52.11970 31.090
O3 60.5636 7.6185 77.81842 13.833
O5 28.7860 0.0124 48.38534 2.252

Respecto al ajuste del modelo, los valores presentados en la Tabla 19, así como el
cálculo del valor del X2/gl, indican que el modelo presenta un desajuste respecto a
la matriz de datos, es decir, el modelo no representa adecuadamente los datos,
esto puede deberse al tamaño de la muestra o al incumplimiento de la
normalidad multivariante, por lo que es necesario evaluar también las medidas
incrementales.
Los valores de la Tabla 20 permiten concluir que el modelo se encuentra cerca a

los valores mínimos de interpretación favorable, siendo necesaria una revisión
detallada de los datos en la fase de re-especificación del modelo para lograr un
mejor ajuste.
En casos como el presentado es conveniente hacer una revisión de los índices de

modificación, que contienen información sobre los cambios en el estadístico X2.
Como regla de interpretación general se puede establecer que los mayores
valores representan cambios considerables en el modelo, en este caso al excluir el
ítem del análisis.
En la Tabla 21 se han resaltado los índices de modificación más altos, ítems que, al
ser eliminados de la estructura pueden generar un cambio notorio en el modelo.
Se ha decidido mantener el Ítem 4 dado que, aunque su ausencia modificaría el
modelo, reducir la cantidad de ítems en el factor entorpecería el análisis de
confiabilidad. A continuación se presentan los resultados del modelo final, una vez
se han retirado dichos elementos.
Tabla 22. Bondad de ajuste del modelo re-especificado.
χ² dfa p
720 80 < .001
a. df = Grados de libertad.
Tabla 23. Medidas incrementales del modelo re-especificado.
RMSEA 90% CI
CFI TLI RMSEA
Lower Upper
0.933 0.912 0.0534 0.0499 0.0571

e1 N1
e2 N2 Neuroticismo
e3 N3
.221
e4 E1
e5 E2
Extraversión -.091
e6 E4
-.374 -.067
e7 O1
e8 O3 Apertura -.170 -.148
e9 O5
.351 -.577
e10 C1
e11 C2 Conciencia .330
e12 C3
.330
e13 A2
.953*** Agradabilidad
e14 A3
e15 A4
Figura 11. Modelo confirmatorio basado en la base de datos BigFiveInventory.
Finalmente, tras conocer la estructura factorial y lograr unos índices de ajuste

adecuados y teóricamente coherentes, se debe analizar la confiabilidad de cada
uno de los nuevos factores. En la Tabla XX se presenta el Alpha de Cronbach y
Omega de McDonald total de la escala y para cada uno de los factores, como
evidencia de su consistencia interna.
Tabla XX. Consistencia interna de la escala total y por factor.

ω de
α de Cronbach
McDonald
Agradabilidad 0.651 0.669
Extraversión 0.723 0.727
Neuroticismo 0.819 0.826
Apertura 0.574 0.592
Conciencia 0.632 0.637
Escala Total 0.703 0.711

El total de la escala logra superar el umbral mínimo de interpretación para ambos

coeficientes, sin embargo, las escalas de Agradabilidad, Apertura y Conciencia no
lo hacen. Esto revela la importancia de analizar cada una de los factores que
componen una prueba de manera individual.
En casos como este se puede proceder mediante la estrategia de competencia

de modelos, que consiste en proponer varias soluciones factoriales y compararlas
mediante el Índice de Información de Akaike (AIC), aquella que presente los
valores más bajos en este índice representaría el mejor ajuste de los datos.

Baremación de la prueba
En las primeras páginas de este manual se describió el problema de la ausencia de
significación de las puntuaciones de las escalas e instrumentos psicológicos y se
estableció como una de las posibles soluciones la comparación de los sujetos o su
ubicación en una escala estandarizada, es decir, una escala en la que los
numerales indicaran la posición relativa del sujeto respecto a los demás, en otras
palabras, una escala de intervalo real.
La propiedad de intervalo se adquiere al establecer un estándar para todas las

unidades de la escala, hasta este punto, las escalas se comportan máximo en un
nivel ordinal, por lo que no pueden utilizarse para la comparación de la posición
de los sujetos respecto a otros.
Este proceso se conoce como baremación, y consiste en establecer un estándar

entre las unidades que conforman la escala, generalmente a través del cálculo de
diferentes medidas de posición y unidades estandarizadas.
Una de las medidas de posición más utilizadas son los percentiles y derivados. Los
centiles son valores que dividen la muestra en partes iguales, cada una
representando un porcentaje específico de la distribución, el proceso es similar .
Existen diferentes tipos de puntuaciones centiles:
Percentiles: Son 99 valores que dividen la distribución en partes iguales.
Deciles: Son nueve valores que dividen la distribución en 10 partes iguales. Cada
una representando el 10% de la distribución.
Quintiles: Son cuatro valores que dividen la población en cinco partes iguales,
cada una de ellas representando el 20% de la distribución.
Cuartiles: Son tres valores que dividen la población en cuatro partes iguales, cada
una representando el 25%. Son las medidas más utilizadas para la baremación de
pruebas, dada su fácil adaptación a la mayoría de rangos de medidas en
psicología.
El uso de una u otra medida quedará a juicio del investigador y de su marco

teórico; para algunas pruebas será más útil una interpretación basada en cuatro
grupos, mientras que para otra se requerirá mayor grado de distinción entre los
sujetos, por lo que podrían requerirse cinco o hasta diez grupos.
Algunas escalas, en especial las que se interesan por algún tipo de factor clínico,
presentan una combinación de percentiles y cuartiles, logrando mayor
discriminación hacia los extremos de la escala.

El cálculo de los percentiles es un proceso relativamente sencillo, en la Tabla XX se

presentan las fórmulas para cada una de las medidas.
Tabla XX. Fórmulas para el cálculo de las medidas de posición.
Medida Fórmula
Percentil
Decil
Quintil
Cuartil
Cálculo de percentiles y derivados con JAMOVI o JASP.
Tanto Jasp como Jamovi permiten la identificación de los centiles de una manera
rápida y confiable. En este ejemplo se calcularán los cuartiles y deciles para la
escala de Neuroticismo, identificada en capítulos anteriores.
La ruta para el cálculo es:
Jamovi:
 Exploration.
 Descriptives.
 Statistics.
 Activar la opción de “Quartiles”.
 Activar la opción de “Cut points for” y reemplazar el valor por 10.
JASP:
 Descriptives.
 Descriptive Statistics.
 Statistics.
 Activar la opción de “Quartiles”.
 Activar la opción de “Cut points for” y reemplazar el valor por 10.
Ejemplo:
En las Figuras XX y XX se pueden observar las configuraciones básicas del análisis

tanto en JASP como en JAMOVI. En el campo de resultados se encuentra la tabla
con los valores de los deciles (10th Percentile, 20th Percentile, 30th Percentile, 40th
Percentile, 50th Percentile, 60th Percentile, 70th Percentile, 80 Percentile, 90
Percentile) y cuartiles (25th Percentile, 50th Percentile, 75th Percentile).

También puede apreciarse que la diferencia entre las puntuaciones de Deciles es

mínima, indicando la inadecuación de utilizar rangos más pequeños.
Los datos corresponden a la sumatoria de los ítems que componen la escala de

Neuroticismo. En el material digital encontrará un enlace a un videotutorial en el
que se explica el cálculo de variables computadas en Jamovi y el cálculo de los
percentiles.
Figura XX. Cuartiles y Deciles para la puntuación de Neuroticismo en Jamovi.

Figura XX. Cálculo de Cuartiles y Deciles en JASP.
Puntuaciones normalizadas:
Otra forma de comparar sujetos es indicar su posición respecto a la media, usando

la desviación estándar como unidad básica de la escala. A continuación se
describen las puntuaciones normalizadas más comúnmente reportadas por las
pruebas psicológicas:
Puntuación Z: las puntuaciones Z representan las desviaciones típicas, pueden ser

entendidas como unidades estándar de variación dado que cada unidad de Z
representa una desviación típica. Esto quiere decir que un sujeto que obtenga una
puntuación Z de 2.5 se encuentra dos desviaciones y media por encima de la
media poblacional.
Considerando que los sujetos también se pueden encontrar por debajo de la

media poblacional, las puntuaciones Z pueden adquirir valores negativos. Para
evitar esto se pueden utilizar puntuaciones típicas derivadas, las más comunes son
las puntuaciones T, D y Estaninos.
Las puntuaciones T se calculan a partir de la puntuación Z, asumiendo una media

igual a 50 y una desviación típica de10, por lo que un sujeto que tenga una

puntuación T de 63 se encontrará a 1.3 desviaciones típicas de la medias, o lo que

es igual tendrá una puntuación Z de 1.3.
El cálculo de la puntuación T se realiza mediante la siguiente fórmula:
𝑇𝑖 = 50 + (10)𝑍𝑖
De manera similar a la puntuación T, las puntuaciones D también se calculan a
partir de la puntuación Z y sumen una media de 50, pero una desviación típica de
20, por lo que si un sujeto tiene una puntuación D igual a 98 se encontrará a 2.8
desviaciones típicas por encima de la media.
𝐷𝑖 = 50 + (20)𝑍𝑖
Los estaninos por su parte representan una escala con una puntuación media de 5
y una desviación de 2.
𝐸𝑛𝑖 = 5 + (2)𝑍𝑛𝑖
Ejemplo: A continuación se presenta la transformación de la puntuación del sujeto
50 a cada una de las puntuaciones estandarizadas descritas anteriormente. El
cálculo para cada una se realizó a través del archivo de Excel “Calculadora de
Puntuaciones estandarizadas” cuyo enlace de descarga encontrará en la sección
de herramientas digitales.
Para el cálculo de las puntuaciones se requiere de la media y desviación típica de

cada uno de los factores.
Media Puntaje Puntuación Estandarizada

Factor Estanino
(Desv. Típica) del sujeto Z T D
Agradabilidad 23.08 (4.54) 30 1.52 65.24 80.48 51.16
Sujeto
Conciencia 21.16 (4.81) 25 0.80 57.98 65.97 47.32
50
Extraversión 20.59 (5.33) 30 1.77 67.65 85.31 46.18
Neuroticismo 19.03 (5.99) 24 0.83 58.3 66.59 43.06
Apertura 18.03 (2.83) 18 -0.01 49.89 49.79 41.06
Como puede observar, la puntuación varía dependiendo de cuál sea la unidad

estandarizada que se utilice. Sin embargo, la posición del sujeto será siempre la
misma respecto a la media, siendo la única variación la denominación que
recibirá. En la Figura XX se presenta la posición del sujeto (línea roja) respecto a la
media (línea gris) en cada uno de los factores.

Figura 12. Posición del Sujeto 50 respecto a la media.
En la página web que acompaña este manual encontrará un archivo que le

permitirá realizar los cálculos de las puntuaciones estandarizadas a partir de la
puntuación del sujeto, la media poblacional y la desviación estándar.

Herramientas digitales.
A continuación encontrará una serie de enlaces a video tutoriales y archivos útiles

para la comprensión de los conceptos expuestos en el manual y el desarrollo de
habilidades de análisis de datos en psicometría.
Descripción Código QR Escanéelo con su celular.

Archivo de Excel diseñado para la
recodificación de la respuesta con un
rango de uno a siete de hasta 5000
sujetos. En el enlace encontrará
también un video-tutorial sobre su uso.
Tutorial de Youtube en el que

aprenderá a utilizar las fórmulas de
sumatoria y promedio en menos de
quince minutos.
Enlace a un aplicativo Web para el

análisis de la normalidad multivariante.

Bibliografía.
Abad, F., Garrido, J., Olea, J., & Ponsoda, V. (2006). Introducción a la psicometría:
teoría clásica de los test y teoría de la respuesta al ítem. Madrid: Universidad
Autónoma de Madrid, 61-118.
Arias, R. M. (1996). Psicometría: Teoría de los tests psicológicos y educativos. Síntesis.
Das, K. R., & Imon, A. H. M. R. (2016). A brief review of tests for normality. American
Journal of Theoretical and Applied Statistics, 5(1), 5-12.
Esnaola, J., & Zamora, R. (2015). Análisis factorial y análisis de componentes

principales. Santiago de Chile: Universidad de Chile.
Gónzalez.N.; Abad, J. y Lèvy, J.P. (2006) “ Normalidad y otros supuestos en análisis

de covarianzas” en Lévy. J. (Ed.): “ Modelización conestructuras de covarianzas”
Netbiblo. La Coruña (31-57)
González Alonso, J., & Pazmiño Santacruz, M. (2015). Cálculo e interpretación del
Alfa de Cronbach para el caso de validación de la consistencia interna de un
cuestionario, con dos posibles escalas tipo Likert. Revista Publicando, 2(1), 62-67.
Lloret-Segura, S., Ferreres-Traver, A., Hernández-Baeza, A., & Tomás-Marco, I. (2014).

El análisis factorial exploratorio de los ítems: una guía práctica, revisada y
actualizada. Anales de psicología, 30(3), 1151-1169.
Oviedo, H. C., y Arias, A. C. (2005). Aproximación al uso del coeficiente alfa de

Cronbach. Revista colombiana de psiquiatría, 34(4), 572-580.
Pérez, E. R., & Medrano, L. (2010). Análisis factorial exploratorio: bases conceptuales
y metodológicas. Revista Argentina de Ciencias del Comportamiento, 2(1).
Urbina, S. (2014). Essentials of psychological testing. John Wiley & Sons.
Ventura-León, J. L., & Caycho-Rodríguez, T. (2017). El coeficiente Omega: un

método alternativo para la estimación de la confiabilidad. Revista
Latinoamericana de Ciencias Sociales, Niñez y Juventud, 15(1), 625-627.
Yap, B. W., & Sim, C. H. (2011). Comparisons of various types of normality

tests. Journal of Statistical Computation and Simulation, 81(12), 2141-2155.
Zamora, S., Monroy, L. y Chávez, C. (2009). Análisis factorial: una técnica para
evaluar la dimensionalidad de las pruebas. Cuaderno técnico 6. México: Centro
Nacional de Evaluación para la Educación Superior, A.C.

Manual para La Evaluación de Propiedades Psicométricas

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual para La Evaluación de Propiedades Psicométricas

Cargado por

Copyright:

Formatos disponibles

Manual para la evaluación de

La construcción de escalas en psicología se ha erigido como uno de los

En cada sección encontrará ejemplos basados en

Se usarán procedimientos disponibles en los software JASP y JAMOVI,

La información contenida en el manual ha sido compilada con fines

Finalmente, este manual hace parte de los esfuerzos del grupo de

 Página 2 | Universidad Católica de Oriente.

El proceso de construcción de cuestionarios e inventarios.

La medición psicológica afronta un reto enorme al tratar de cuantificar atributos

La imposibilidad de establecer una condición real de cuantificación o una unidad

Estos procedimientos se sustentan en la ausencia de justificación de propiedades

Como consecuencia directa de esta posición, las puntuaciones de una escala

Siguiendo estos planteamientos, se puede establecer una serie de pasos

1. Redacción de los ítems.

 Página 3 | Universidad Católica de Oriente.

Redacción de los ítems:

Aunque existen diferentes procedimientos para probar la calidad de los ítems de

1. Adecuación del contenido y formato del ítem a los propósitos de la prueba

Respecto al último criterio, Abad, Garrido Oleda y Ponsoda (2006), recomiendan

 Utilizar tiempo presente.

A modo de ejemplo se presentan tres ítems mal planteados y una versión

 Página 4 | Universidad Católica de Oriente.

como parte de un cuestionario de actitudes, con una escala de respuestas tipo

Tabla 1. Ejemplos de adecuación de redacción de ítems.

La responsabilidad de la revisión de los ítems suele recaer, en primera instancia, en

Teniendo en cuenta que el objetivo final de la mayoría de las pruebas es la

 Página 5 | Universidad Católica de Oriente.

Una forma clásica de facilitar el cumplimiento de la condición de

El investigador interesado en evaluar las propiedades psicométricas debe también

Respecto a la condición de significatividad, existen diferentes modelos

Según Lloret-Segura, Ferreres y Hernández (2014), la recomendación clásica del

 Página 6 | Universidad Católica de Oriente.

Organización de la base de datos

Al construir la base de datos en indispensable colocar siempre el nombre de las

Tabla 2. Ejemplo de recodificación de ítems con escala de respuesta invertida.

Escala de Completamente En De Completamente

Con el objetivo de facilitar el proceso de recodificación se diseñó un archivo en

Si la prueba se encuentra dividida por factores o solicita calcular puntuaciones

 Página 7 | Universidad Católica de Oriente.

Tips y Recomendaciones Finales

 No es conveniente usar nombres largos o complicados para las variables, se

 La tabulación de la información es uno de los procesos más delicados, los

 Es necesario unificar el formato para las variables cualitativas, por ejemplo si

 No reemplace los datos faltantes. En caso de ser necesario, evalúe con su

 A fin de mantener un máximo orden, las hojas de respuestas de los sujetos

 Para el cálculo de los factores se deben considerar las recomendaciones de

 Página 8 | Universidad Católica de Oriente.

Análisis descriptivo de los ítems

Con el objetivo de conocer las características estadísticas de los ítems que

Media: Representa el promedio de la puntuación obtenida por la población. Debe

Puntuación máxima y mínima: Es conveniente analizar si para todos los ítems se

Desviación típica: Es una medida de dispersión, es un indicador formal de la

Varianza: Aporta información sobre la dispersión de los datos. Su interpretación

Asimetría: Es una medida del grado de sesgo de la información, es un indicador de

 Página 9 | Universidad Católica de Oriente.

Análisis descriptivo de los ítems en JASP.

Una vez abierta la base de datos siga estos pasos:

3. Seleccionar los ítems

 Página 10 | Universidad Católica de Oriente.

Análisis descriptivo de los ítems en JAMOVI.

3. Seleccionar los ítems

 Página 11 | Universidad Católica de Oriente.