Está en la página 1de 25

Traducido del inglés al español - www.onlinedoctranslator.

com

Métodos y medidas de comunicación.

ISSN: 1931-2458 (Impreso) 1931-2466 (En línea) Página de inicio de la revista:https://www.tandfonline.com/loi/hcms20

Utilice Omega en lugar del Alfa de Cronbach para


estimar la confiabilidad. Pero…

Andrew F. Hayes y Jacob J. Coutts

Para citar este artículo:Andrew F. Hayes y Jacob J. Coutts (2020): Utilice Omega en lugar del Alfa de
Cronbach para estimar la confiabilidad. Pero…, Métodos y Medidas de Comunicación, DOI:
10.1080/19312458.2020.1718629

Para vincular a este artículo:https://doi.org/10.1080/19312458.2020.1718629

Publicado en línea: 11 de febrero de 2020.

Envíe su artículo a esta revista.

Vistas del artículo: 25

Ver artículos relacionados

Ver datos de Crossmark

Los términos y condiciones completos de acceso y uso se pueden encontrar en


https://www.tandfonline.com/action/journalInformation?journalCode=hcms20
MÉTODOS Y MEDIDAS DE COMUNICACIÓN
https://doi.org/10.1080/19312458.2020.1718629

Utilice Omega en lugar del Alfa de Cronbach para estimar la


confiabilidad. Pero…
Andrés F. Hayesay Jacob J. Couttsb
Departamento de Psicología y Facultad de Comunicación, Universidad Estatal de Ohio, Columbus, Ohio, EE.UU.;
a

b Departamento de Psicología, Universidad Estatal de Ohio, Columbus, Ohio, EE.UU.

ABSTRACTO
El alfa de Cronbach (α) es una medida de confiabilidad ampliamente utilizada para cuantificar
la cantidad de error de medición aleatorio que existe en una puntuación suma o promedio
generado por una escala de medición de múltiples ítems. Sin embargo, los metodólogos han
advertido que α no es una medida óptima de confiabilidad en relación con su forma más
general, la omega de McDonald (ω). Entre otras razones, el hecho de que el cálculo de ω no
esté disponible como opción en muchos programas estadísticos populares y requiera cargas
de elementos de un análisis factorial confirmatorio (AFC) probablemente haya dificultado una
adopción más generalizada. Después de un poco de discusión sobre α versus ω, ilustramos el
cálculo de ω usando dos programas de modelado de ecuaciones estructurales (Mplus y AMOS)
y el paquete MBESS para R. Luego describimos una macro para SPSS y SAS (OMEGA) que
calcula ω de dos maneras sin depender de la estimación de cargas o varianzas de error
usando CFA. Mostramos que produce estimaciones de ω que son casi idénticas a cuando se
utilizan estimaciones basadas en CFA de cargas de artículos y varianzas de error. También
analizamos el uso de la macro OMEGA para ciertas formas de análisis de ítems y construcción
de formularios breves basados en la eliminación de ítems de una escala más larga.

Los estudiosos de la comunicación, y de hecho los investigadores de todos los campos que estudian el comportamiento
humano, han ideado una serie de enfoques inteligentes para medir variables que están en el dominio del tema de
investigación del campo. De los muchos enfoques de medición que se utilizan en la investigación empírica de las ciencias del
comportamiento, el más omnipresente es, con diferencia, la escala de medición de elementos múltiples (MIMS). AMIMS
consta de un conjunto dek artículos oindicadoresde algunos inobservablesconstruirde interés (p. ej., timidez; competencia
comunicativa, estrés traumático), cuyas respuestas se agregan numéricamente de alguna manera (generalmente sumando
o promediando) para generar una puntuación o medición única de ese constructo para cada unidad que se mide. Estas
“respuestas” suelen ser exactamente eso: las respuestas que una persona da a un conjunto de preguntas o afirmaciones,
siendo común el formato de respuesta tipo Likert. Pero no tienen por qué ser respuestas de la persona que se está
midiendo. Las respuestas podrían ser proporcionadas por un compañero o un padre de la persona. O cuando la unidad de
medida no es una persona, las “respuestas” podrían provenir de archivos existentes de datos sobre los indicadores, como en
Vandello y Cohen (1999) medida de individualismo y colectivismo a nivel estatal, o de juicios de expertos, como en varios
índices de valores democráticos o libertad de prensa a nivel nacional (Becker, Vlad y Nusser,2007)

Muchas revistas empíricas publican investigaciones sobre el desarrollo de MIMS. Algunos ejemplos recientes en
la investigación de la comunicación incluyen una medida de confianza en los medios de comunicación (Prochazka &
Schweiger,2019) y una medida de valores garantizados (DeAndrea & Carpenter,2018). Y existen libros completos
(por ejemplo, Robinson, Shaver y Wrightsman,1991,1999; Rubin, Palmgreen y Sypher,1994) que están llenos de
varios MIMS y la investigación que se ha realizado sobre ellos (a diferencia decona ellos). Cuando se desarrolla y
luego se publica un MIMS, el objetivo de la publicación es transmitir al mundo científico

CONTACTOAndrew F. hayes.338@osu.edu Departamento de Psicología, Universidad Estatal de Ohio, 1835 Neil Avenue,
Hayes Colón OH 43210
© 2020 Taylor & Francis Grupo, LLC
2 AF HAYES Y JJ COUTTS

comunidad que el MIMS existe y que produce datos que tienen propiedades psicométricas satisfactorias, como alta
confiabilidad y validez. Cuando un MIMS se construye ad hoc para un estudio particular, una práctica
extremadamente común, el artículo de investigación que describe el estudio debe incluir alguna discusión sobre la
confiabilidad y validez de los datos que genera.
Esfiabilidady cómo lo cuantifican comúnmente los desarrolladores y usuarios de MIMS, ese es el tema de este
documento. Una propiedad de los datos generados por el instrumento cuando se aplica a una población específica
más que una propiedad de la escala en sí (Raykov,2007; Streiner,2003), la confiabilidad cuantifica la cantidad de
error de medición aleatorio o “ruido” que existe en un conjunto de mediciones. Se puede decir que los datos son
altamente confiables si existe una alta correspondencia entre las puntuaciones observadas de los encuestados (las
puntuaciones generadas por el MIMS) y su nivel o cantidad real del atributo que se está midiendo. Cuanto mayor
sea la confiabilidad, más podemos confiar en que las diferencias entre las personas en las puntuaciones que genera
el MIMS son un reflejo preciso de las diferencias individuales reales en lo que mide el MIMS. Si un instrumento
genera datos con baja confiabilidad, las puntuaciones observadas contienen muchos errores de medición
aleatorios. Las consecuencias de una baja fiabilidad pueden ser negativas y graves, como, por un lado, una
reducción del poder para detectar efectos reales (un falso negativo) o, por otro lado, un aumento en la probabilidad
de afirmar que los efectos observados en un estudio son reales cuando no lo son (un falso positivo). Pero, lo que es
más importante, la alta confiabilidad no dice casi nada sobre lo que es un MIMS.de hechomedir – su validez de
constructo – es decir, si está midiendo lo que usted dice que está midiendo o si lo está usando para medir. No
discutimos la validez en este artículo, con la excepción de una breve mención al final.

En este artículo, nos oponemos a la práctica común de confiar en una medida popular de
confiabilidad informada por los usuarios de un MIMS: el alfa de Cronbach (α). Después de discutir qué
es α y qué no es, defendemos, como lo han hecho muchos metodólogos antes que nosotros, un
cambio hacia el uso de omega de McDonald's. (ω)como una alternativa relacionada pero mejor.
Reconociendo que cambiar la práctica estadística de un campo es casi imposible sin ofrecer alguna
orientación sobre el cálculo, luego ofrecemos un tutorial sobre el cálculo de ω utilizando análisis
factorial confirmatorio en Mplus y AMOS, así como en R. Reconociendo también que los investigadores
pueden resistirse al cambio. Cuando los nuevos requisitos computacionales añaden nuevas cargas a
sus vidas de investigación, como tener que aprender un nuevo software, introducimos un enfoque
para el cálculo de omega integrado en una herramienta computacional fácil de usar (la macro OMEGA)
disponible para el populares programas SPSS y SAS, cuyo uso no requiere conocimientos de
programación ni análisis factorial confirmatorio. También analizamos una característica de la macro
OMEGA útil para el análisis de ítems y el acortamiento de escala.

Alfa de Cronbach versus Omega de McDonald's

La teoría clásica de las pruebas es la base de muchas medidas de confiabilidad que han sido propuestas a lo largo de
décadas y utilizadas por los científicos del comportamiento. Aplicada a un MIMS, la teoría clásica de las pruebas postula que
la respuesta que ofrece una persona al ítemien un MIMS,Xi, en un conjunto dekLos elementos que miden un constructo son
una función de la “puntuación verdadera” del encuestado.ty un error aleatorio en la medición,

Xi¼ µiþ λitþmii (1)


donde µies una constante, λies el artículoi'scarga factorialymiies un error en la estimación de esa respuesta al
ítemi.Este modelo se representa gráficamente enFigura 1(sin las constantes), que es un modelo factorial
unidimensional de variable latentetusandokindicadores deT (es decir, elXielementos). Aunque no es un
requisito de todas las matemáticas siguientes, suponemos que cada una de las kLos ítems se miden en una
escala de respuesta común, que suele ser el caso cuando un investigador utiliza un MIMS para medir un
constructo específico.
Porquetrara vez se puede conocer (es más latente que observada directamente) la suma de las respuestas de
una persona a lakelementos
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 3

Figura 1.Un modelo factorial unidimensional de variable latente.tconkindicadores observados (Xi).

Xk
oh¼ Xi (2)
i¼1

Se utiliza frecuentemente como proxy paraT.1Pero porque cadaXicontiene algún error aleatorio en la medición (de la
Ecuación 1), también lo haceo.La confiabilidad se define como la proporción de la varianza (V)en las puntuaciones
observadasohatribuible a la variación real enT: V(T)/V(O).Queremos que esta proporción sea alta, lo que significa
que la mayor parte de la variación enohes atribuible a la variación real en el constructo que se está midiendo (T).2

Bajo el supuesto de quemiino está correlacionado contpara todoskelementos,miino está correlacionado con el error en
la estimación del artículoj,para todosi≠j,y todas las cargas factoriales son iguales a un valor común λ, la confiabilidad deohse
puede estimar con bastante precisión utilizando α de Cronbach (Cronbach,1951), definido como

PAG !
k
k i¼1VdXiÞ
α¼ 1- (3)
k -1 VdohÞ

dóndeV (Xi) es la varianza de las respuestas al ítemiyV(O)es la varianza de la suma observada.


El α de Cronbach estima la correlación al cuadrado entretyOh,cual es la proporción depag
thffieffiffi
varianza en las puntuaciones observadas atribuible a la variación real en la dimensión medida. Así, α
estima la correlación entreohyT.Tiene varias otras interpretaciones útiles (ver McNeish,
4 AF HAYES Y JJ COUTTS

2018). Como Nunnally (1978) afirmó en su famoso libro de psicometría, el α de Cronbach “está tan cargado de significado
que debería aplicarse de forma rutinaria a todas las pruebas nuevas”. (pág. 214).3
Los científicos del comportamiento parecen haber tomado en serio el consejo de Nunnally. Cronbach 1951
PsicometrikaEl artículo ha sido citado más que algunas de las investigaciones más influyentes en las ciencias (Dunn
et al.,2014; Sijtsma,2009), y el α de Cronbach es la medida dominante de confiabilidad reportada en estudios que se
basan en un MIMS. Por ejemplo, Flake, Pek y Hehman (2017) encontró que cuando se utilizaba un MIMS en artículos
publicados en elRevista de Personalidad y Psicología Socialen 2014, el α de Cronbach fue la medida reportada casi
las tres cuartas partes del tiempo. Y en un análisis de contenido más extenso de revistas de psicología, McNeish (
2018) encontraron que el α de Cronbach se utilizó en más del 90% de los artículos en los que sería relevante
informar una medida de confiabilidad de un MIMS.
Los estudiosos de la comunicación dependen tanto del α de Cronbach como los investigadores de otros campos.
Examinamos los volúmenes de 2017 y 2018 deMonografías de Comunicación, Investigación en Comunicación,
Investigación en Comunicación Humana, Revista de Comunicación,yRevista de comunicación mediada por
computadoray encontró 187 artículos que se basaban en al menos un MIMS en el estudio o colección de estudios
informados. De estos, la mayoría (173, 93%) informó α de Cronbach. La gran mayoría de los artículos restantes no
informaron ninguna información sobre confiabilidad. En otras palabras, cuando se informó la confiabilidad de los
datos generados por un MIMS, generalmente la medida reportada fue el α de Cronbach.
Aunque se utiliza ampliamente, el α de Cronbach también se malinterpreta. cortina (1993) y Schmitt (1996)
abordaron varios de estos malentendidos hace décadas, pero persisten (para discusiones más recientes, ver
Sijtsma, 2009; Streiner,2003). Quizás la más generalizada es la creencia de que un valor alto de α justifica la suma de
las puntuaciones de los ítems como medida del constructo, basándose en que un α alto implica unidimensionalidad
del conjunto de ítems. Pero el significado del α de Cronbach como estimación de confiabilidadasume
unidimensionalidad (Graham,2006). Un α alto no es evidencia de unidimensionalidad. Alfa puede ser alto incluso si
un conjunto de ítems mide más de un constructo. Por lo tanto, α no debe informarse como una medida de
confiabilidad de un conjunto de puntuaciones observadas sin haber establecido primero que los ítems miden un
solo constructo.
A veces, el α de Cronbach también se malinterpreta como una medida de la consistencia interna o de la
homogeneidad interna de las respuestas a los ítems. Es decir, se interpreta que un α más alto refleja correlaciones
más fuertes entre las respuestas de los ítems. Si bien es cierto que, en igualdad de condiciones, αes mayor cuanto
mayor es la correlación promedio entre las respuestas a los ítems, ese promedio puede consistir en correlaciones
que varían dramáticamente en tamaño y podría incluir correlaciones que son cero o cercanas a cero. Además, α está
influenciada por el número de elementos. Manteniendo constante la correlación promedio entre ítems, α aumenta a
medida que el número de ítemskaumenta. Si el número de ítems es suficientemente grande, α podría ser grande
aunque la intercorrelación entre los ítems sea generalmente bastante pequeña. Por lo tanto, α no es directamente
una medida de consistencia interna u homogeneidad de las respuestas a los ítems, aunque a menudo se describe y
enseña como una medida de confiabilidad de “consistencia interna”.
Independientemente de la interpretación adecuada, un observador casual de la literatura o un recién llegado a
las ciencias del comportamiento podría fácilmente llegar a la conclusión de que el α de Cronbach es la única medida
de confiabilidad disponible para los datos generados por un MIMS o que debe ser la mejor medida. Tampoco es así.
Aunque existen muchas alternativas que son sensibles a diferentes formas de conceptualizar la confiabilidad, se
atribuye a McDonald un serio competidor de α (1999) y por eso a veces se le llama omega de McDonald (ω). Al igual
que α, se puede calcular a partir de una única administración de un conjunto de ítems como

PAG
ð λiÞ2
ω¼ PAG PAG (4)
ð λiÞ2þ VdmiiÞ

dóndeV(e)i) es la varianza de los errores en la estimación del ítemide la Ecuación (1) (ver tambiénFigura 1) y la
suma es sobre todoyo =1 akelementos. Bajo el supuesto de errores no correlacionados en todo elkelementos
(es decir, unidimensionalidad), la ecuación (4) es equivalente a
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 5

PAG
d λÞi 2
ω¼ (5)
VdohÞ

(McDonald,1999, pag. 89). McDonald (1999, págs. 91–92) también analiza que, según los supuestos
enumerados anteriormente, α de Cronbach (Ecuación 3) es un caso especial de las Ecuaciones (4) y (5) con
todaskcargas λifijado a un valor común λ. Esta suposición de cargas factoriales iguales (junto con algunas
otras condiciones), a menudo desconocida o ignorada por los usuarios del α de Cronbach, se denomina
tauequivalencia esencial,aunque existen formas alternativas de expresar este supuesto sin depender de las
cargas factoriales. Entonces ω es un estimador de confiabilidad más general que α porque no asume
equivalencia tau esencial pero se reduce a α bajo el supuesto de equivalencia tau esencial.
Cuando elkLos elementos se miden en la misma escala (la situación típica para la mayoría de MIMS utilizados por
los investigadores), la equivalencia tau esencial significa que una diferencia dada en la variable latentetCorresponde
a la misma diferencia en respuesta a todos los ítems. Alternativamente, significa que cada ítem mide una variable
latente.tcon el mismo grado de precisión. Por ejemplo, considere los ítems “Me resulta difícil estar rodeado de
gente” y “Me considero introvertido” como indicadores de una variable latente que podríamos llamar “timidez”. La
equivalencia tau esencial se cumpliría para estos dos ítems si dos personas que difieren en un grado determinado
en timidez difieren entre sí en la misma cantidad en su respuesta a los dos ítems. O si la varianza en las respuestas a
los dos ítems fuera la misma, la equivalencia tau esencial significa que las correlaciones entrety las respuestas a los
dos ítems son las mismas. Esta parece una suposición sólida incluso para una escala de dos ítems como ésta. Pero la
equivalencia tau esencial se aplica a todos los pares de ítems de la escala, no solo a un solo par.

Como otros han dicho, la equivalencia tau esencial parece probablemente la excepción más que la norma para la
mayoría de las escalas, y las investigaciones han demostrado que cuando se viola la equivalencia tau esencial (es
decir, un conjunto de ítems o una escala escongenérico), αestima la confiabilidad con menor precisión que ω (Green
& Yang,2009; Raykov,1998; Trizano Hermosilla y Alvarado,2016). Por esta y otras razones, existe un fuerte
sentimiento entre al menos algunos psicometristas y otros que se ganan la vida estudiando la medición de que α no
es la mejor medida de confiabilidad o incluso una que debería preferirse, como claramente lo ha sido a lo largo de
los años. Aunque hay desacuerdos sobre qué debería reemplazarlo, McDonald's ωo medidas estrechamente
relacionadas que no asumen una equivalencia tau esencial han surgido como alternativas recomendadas (Dunn,
Baguley y Brunsden,2014; graham,2006; Verde y Yang,2009; Mc Neish,2018; Raykov,1998). Esta es también la
posición que adoptamos. Para facilitar la adopción de esta recomendación, dedicamos gran parte del resto de este
artículo a ilustrar el cálculo de ω en cinco programas de análisis de datos con los que los investigadores
probablemente estarán familiarizados hasta cierto punto.

Cálculo de Omega utilizando software estadístico


El α de Cronbach puede ser la medida dominante de confiabilidad utilizada por la ciencia del comportamiento en parte porque su cálculo requiere solo varianzas de puntaje total y de ítem, lo

que facilita su enseñanza en métodos de investigación y clases de estadística e ilustra con cálculos manuales simples. Para facilitar aún más su adopción generalizada en la era de las

computadoras, se implementó hace mucho tiempo en programas populares de análisis de datos como SPSS y SAS que históricamente han dominado y aún dominan las computadoras de

escritorio de los científicos del comportamiento. Sin embargo, con distintos grados de facilidad, ω se puede calcular con la ayuda de un software estadístico que puede realizar análisis factorial

confirmatorio. En esta sección mostramos cómo calcular ω primero usando dos programas de modelado de ecuaciones estructurales (SEM) (Mplus y AMOS) y luego usando R. Sin embargo,

Muchas personas que no están familiarizadas o cómodas con el uso de estos programas encontrarán frustrante su uso, por lo que un tutorial de este tipo puede tener poco impacto en la

práctica para muchos. Para facilitar la transición a ω, luego presentamos una herramienta computacional para SPSS (también está disponible una versión similar para SAS) que calcula ω sin el

uso de análisis factorial confirmatorio y que requiere solo una sola línea de sintaxis o un menú desplegable. cuadro de diálogo que se puede instalar en el sistema SPSS. Creemos que esto

eliminará la última excusa que queda (aunque más adelante introduciremos lo que potencialmente podría ser una nueva) para confiar en α en lugar de ω como medida de confiabilidad. Luego

presentamos una herramienta computacional para SPSS (también hay disponible una versión similar para SAS) que calcula ω sin el uso de análisis factorial confirmatorio y que requiere solo una

sola línea de sintaxis o un cuadro de diálogo desplegable que se puede instalar en el Sistema SPSS. Creemos que esto eliminará la última excusa que queda (aunque más adelante

introduciremos lo que potencialmente podría ser una nueva) para confiar en α en lugar de ω como medida de confiabilidad. Luego presentamos una herramienta computacional para SPSS

(también hay disponible una versión similar para SAS) que calcula ω sin el uso de análisis factorial confirmatorio y que requiere solo una sola línea de sintaxis o un cuadro de diálogo desplegable

que se puede instalar en el Sistema SPSS. Creemos que esto eliminará la última excusa que queda (aunque más adelante introduciremos lo que potencialmente podría ser una nueva) para

confiar en α en lugar de ω como medida de confiabilidad.


6 AF HAYES Y JJ COUTTS

Nuestro ejemplo se basa en datos recopilados de 211 estudiantes universitarios que completaron la
escala de Blirtatiousness de ocho ítems, un MIMS diseñado para medir "con qué rapidez, frecuencia y
efusividad las personas responden a sus parejas" (Swann & Rentfrow,2001, pag. 1160). El texto del artículo se
puede encontrar entabla 1. Las respuestas se ofrecieron seleccionando una casilla en una escala de
respuesta tipo Likert de 5 puntos, anclada con los términos “muy en desacuerdo”, “en desacuerdo”, “ni de
acuerdo ni en desacuerdo”, “de acuerdo” y “muy de acuerdo”, con una puntuación de 1. al 5,
respectivamente. Los ítems 2, 3, 5 y 7 tienen clave inversa y, por lo tanto, se calificaron al revés restando la
respuesta de 6 antes del análisis, lo que resultó en respuestas más altas a los ítems (y la suma de respuestas)
que reflejan una mayor cobardía. Los datos se guardan en variables denominadas blirt1, blirt2r, blirt3r,
blirt4, blirt5r, blirt6, blirt7r y blirt8. El archivo de datos (con puntuación inversa ya implementada para las
variables que terminan con “r” en el nombre) se puede descargar desdewww.afhayes.comy está disponible
como un archivo de datos SPSS (blirt8.sav), así como un archivo de texto delimitado por comas (blirt8.csv) sin
encabezados de nombres de variables. Las variables en el archivo csv están en el mismo orden que los
nombres de variables enumerados anteriormente.

Modelado de ecuaciones estructurales: Mplus y AMOS

El cálculo de ω tal como lo hemos discutido hasta ahora requiere cargas factoriales y varianzas de
error [λiyVdmiiÞen la Ecuación (4)] cuando el modelo diagramado enFigura 1se estima utilizando CFA.
El CFA generalmente se realiza en software SEM independiente (como Mplus, AMOS, LISREL, EQS), o en
paquetes estadísticos más generales que tienen rutinas SEM integradas (como PROC CALIS en SAS, el
comando SEM en STATA o el paquete lavaan en R). Verde y Yang (2009), Yang y Verde (2010)) discuten
los enfoques SEM para la estimación de la confiabilidad (ver también Graham,2006; Raykov,1997b) y
favorecen SEM porque ofrece al analista una flexibilidad considerable en cómo se especifica el modelo
de medición. Aquí ilustramos el cálculo de ω utilizando la estimación de máxima verosimilitud de
cargas factoriales y varianzas de error en Mplus y AMOS. Otros programas generarían resultados
similares, con cualquier discrepancia resultante de variaciones menores en las rutinas de estimación
por defecto, los criterios de convergencia, la especificación del modelo, etc.

Tabla 1.Cargas factoriales del análisis factorial de máxima verosimilitud confirmatorio (CFA) y exploratorio (EFA) y el algoritmo
Hancock-An (HA), discrepancias de las cargas CFA y estimaciones de Omega de 217 participantes que completaron la escala de
franqueza.
Cargas (λ)
CFA EFA-ML JA
Si tengo algo que decir no dudo en decirlo (BLIRT1) 0,662 0.663 0,654
A menudo me lleva un tiempo descubrir cómo expresarme (BLIRT2R) 0.640 0,642 0,677
Si no estoy de acuerdo con alguien, tiendo a esperar hasta más tarde para decir algo. (BLIRT3R) 0.574 0.576 0.583
Siempre digo lo que tengo en mente (BLIRT4) 0.709 0.711 0.711
A veces simplemente no sé qué decirle a la gente (BLIRT5R) Nunca 0.548 0.549 0.549
tengo problemas para decir lo que pienso (BLIRT6) 0,641 0,643 0,636
Cuando hay emociones involucradas, me resulta difícil argumentar mi opinión (BLIRT7R). Digo lo 0.376 0.376 0.380
que pienso tan pronto como un pensamiento entra en mi cabeza. (BLIRT8) 0,397 0,398 0.344
Discrepancia de las cargas de CFA
Inclinación – 0.001 0.002
RMSE – 0.002 0.023
Fiabilidad omega
más 0,785 – –
Amós 0,785 – –
MBESS en R 0,785 – –
macro omega – 0,785 0,779
Prueba de igualdad de cargas de CFA (equivalencia tau esencial): χ2(7) = 22,382,pag = .002
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 7

más
Mplus es un programa de análisis de datos versátil capaz de realizar análisis factoriales confirmatorios, problemas SEM más
amplios y casi cualquier otra cosa que pueda parametrizarse en forma de un conjunto de ecuaciones o modelos. El
programa Mplus en el cuadro siguiente lee el archivo de datos delimitados por comas y especifica qué variables de los datos
(o construidas en el programa) se utilizan en el modelo (en DATOS y VARIABLE), especifica las ecuaciones que definen el
modelo (en MODELO ), y calcula nuevas estadísticas que se expresan en forma de funciones de estadísticas estimadas por
las ecuaciones del modelo (en RESTRICCIÓN DEL MODELO). En este código, le hemos dicho a Mplus que estime libremente
todas las cargas factoriales (con la estrella después de blirt1; de lo contrario, de forma predeterminada, fijará la carga para
el primer indicador después de “by” en 1). Para identificar el modelo, Fijamos la varianza de la variable BLIRT latente en 1
(con el código "blirt@1"). Las etiquetas entre paréntesis que siguen a cada indicador nos permiten hacer referencia a las
estimaciones de los parámetros (las cargas y las varianzas de error) en la sección RESTRICCIÓN DEL MODELO, donde se
calcula ω.

DATOS:
el archivo es c:\omega\blirt8.csv;
VARIABLE:
LOS NOMBRES son blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8; LAS VARIABLES
UTILIZABLES son blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8;

MODELO:
blirt por blirt1* (b1)
blirt2r (b2)
blirt3r (b3)
blirt4 (b4)
blirt5r (b5)
blirt6 (b6)
blirt7r (b7)
blirt8 (b8);
blirt1 (e1); blirt2r (e2); blirt3r (e3);blirt4 (e4);blirt5r (e5); blirt6 (e6); blirt7r (e7); blirt8
(e8);
blirt@1;
RESTRICCIÓN DEL MODELO:
nuevo sumload2 sumevar omega;
sumacarga2=(b1+b2+b3+b4+b5+b6+b7+b8)**2;
sumevar=e1+e2+e3+e4+e5+e6+e7+e8;
omega=suma2/(suma2+sumevar);

Un extracto del resultado generado por este código se puede encontrar enFigura 2. Las cargas factoriales se
encuentran en la parte superior, bajo "BLIRT BY", y las variaciones de error se encuentran en la parte inferior, bajo
el título "Variaciones residuales". Aplicando la ecuación (4),
-X 2
λi ¼ ð0:662þ0:640þ0:574þ0:709þ0:548þ0:641þ0:376þ0:397Þ2¼20:675
X
VdmiiÞ ¼0:581þ0:660þ0:541þ0:494þ0:841þ0:547þ1:156þ0:843¼5:663

y entonces

PAG
d λÞ i 2 20:675
ω¼PAG 2 PAG ¼ ¼0:785
ð λ iÞ þ Vdmi Þ
i 20:675þ5:663

Sin embargo, estos cálculos manuales no son necesarios, ya que el código bajo el encabezado
RESTRICCIÓN DEL MODELO construye el numerador y el denominador de la ecuación (4) y genera ω
en la salida, como se puede ver hacia la parte inferior deFigura 2. Mplus también genera
8 AF HAYES Y JJ COUTTS

dos colas
Estimar SE Est./SE Valor p

BLIRT POR
BLIR1 0,662 0.068 9.687 0.000
BLIRT2R 0.640 0,071 8.957 0.000
BLIRT3R 0.574 0.064 8.941 0.000
BLIR4 0.709 0.066 10.688 0.000
BLIRT5R 0.548 0,077 7.140 0.000
BLIRT6 0,641 0.066 9.679 0.000
BLIRT7R 0.376 0,085 4.434 0.000
BLIRT8 0,397 0,074 5.379 0.000

Intercepciones
BLIR1 3.365 0,069 48.432 0.000
BLIRT2R 3.379 0,071 47.462 0.000
BLIRT3R 3.156 0.064 49.119 0.000
BLIR4 3.133 0,069 45.581 0.000
BLIRT5R 2.976 0,074 40.463 0.000
BLIRT6 3.237 0.067 48.037 0.000
BLIRT7R 3.379 0,078 43.101 0.000
BLIRT8 2.664 0,069 38.679 0.000

Variaciones
BLIRT 1.000 0.000 999.000 999.000

Variaciones residuales
BLIR1 0.581 0,069 8.441 0.000
BLIRT2R 0.660 0,076 8.677 0.000
BLIRT3R 0.541 0.062 8.774 0.000
BLIR4 0,494 0.064 7.760 0.000
BLIRT5R 0.841 0.090 9.322 0.000
BLIRT6 0.547 0.065 8.443 0.000
BLIRT7R 1.156 0.116 9.974 0.000
BLIRT8 0.843 0.086 9.787 0.000

Parámetros nuevos/adicionales
SUMLOAD2 20.680 2.569 8.051 0.000
SUMEVAR 5.662 0.214 26.449 0.000
OMEGA 0,785 0.022 35.185 0.000

ω
Figura 2.Extracto del resultado de Mplus de un análisis factorial confirmatorio de la escala de travesura.

un error estándar para ω, que puede usarse para construir un intervalo de confianza de la forma habitual.
Alternativamente, se puede construir un intervalo de confianza de arranque arrancando la distribución de ω
(ver Padilla y Divers,2013,; Raykov,1998, para una discusión sobre la inferencia bootstrap para la
confiabilidad). En Mplus, esto se logra agregando
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 9

ANÁLISIS:
arranque=10000;
PRODUCCIÓN:

cinterval (arranque)

al código anterior. Cuando lo hicimos, el intervalo de confianza del 95% generado fue (0,737, 0,824).
Mplus también se puede utilizar para realizar una prueba de equivalencia tau esencial reestimando el modelo
pero fijando las cargas factoriales para que sean iguales. Para este ejemplo, esto se logra agregando la línea

b1=b2;b1=b3;b1=b4;b1=b5;b1=b6;b1=b7;b1=b8;

bajo el comando MODEL CONSTRAINT en el código anterior. Esto le dice a Mplus que estime el modelo bajo la
restricción de que la carga factorial para los elementos 2 a 8 debe limitarse a ser la misma que la carga factorial
para el elemento 1 (lo que equivale a decir que los 8 están fijados para que tengan el mismo valor). Una prueba de
razón de verosimilitud de la diferencia en el ajuste de este modelo en comparación con el modelo sin esta
restricción sirve como prueba de la razonabilidad de la restricción de igualdad impuesta a las cargas factoriales.
Esta prueba de razón de verosimilitud reveló que el modelo que restringe que las cargas sean iguales se ajusta a los
datos significativamente peor en comparación con cuando se permitió que las cargas factoriales difieran, χ2(7) =
22,382,pag <.01, comprobando que ω es una medida de confiabilidad más apropiada que el α de Cronbach.

Amós
Al igual que Mplus, AMOS es un sistema de modelado de ecuaciones estructurales que puede estimar, entre otras cosas,
modelos de análisis factorial confirmatorios. Aunque se puede programar de manera muy similar a Mplus escribiendo el
código correspondiente al modelo (usando su lenguaje AMOS Basic), ha disfrutado de un amplio uso en parte debido a su
interfaz gráfica de usuario amigable que permite al usuario evitar la escritura de código dibujando el modelo en la pantalla
de la computadora.
El archivo de gráficos AMOS que configura un modelo CFA de factor único para la escala de
Blirtaciousness y genera una estimación de ω se puede encontrar enfigura 3, junto con las cargas factoriales
y las varianzas de error. En el lado izquierdo del modelo, con la variable BLIRT latente enviando efectos a los
ocho ítems, se encuentra un modelo CFA tradicional de factor único. Hemos fijado la varianza de la variable
latente en uno, permitiendo la estimación libre de todas las cargas factoriales. Observe que las cargas y las
varianzas de error son idénticas a las generadas por Mplus y, por lo tanto, producirán la misma estimación
de ω si los cálculos se realizan a mano.
Pero al igual que con Mplus, el cálculo manual de ω no es necesario. La sección del modelo a la derecha
del diagrama envía efectos ponderados por unidad hacia la variable "SUM", con una varianza de error
establecida en 0. Esto representa la suma de los ocho elementos como una variable latente. En la matriz de
covarianza implícita hacia la parte inferior defigura 3, solicitado en el resultado al seleccionar “Estimaciones
estandarizadas” y “Todos los momentos implícitos” en la opción Propiedades de análisis, es la correlación
entre la variable BLIRT latente y la SUMA latente de los ocho ítems (Graham, 2006). Esta correlación es la raíz
cuadrada de ω, por lo que elevar al cuadrado esta correlación produce ω, como se indica enfigura 3: ω¼
0:8862¼0:785:

El paquete MBESS en R
R es un lenguaje de programación y estadística de código abierto disponible gratuitamente que está
ganando popularidad en todas las ciencias. Una de sus principales desventajas es que a muchos les resulta
difícil aprender y, sin práctica y atención, lo aprendido se olvida fácilmente. Pero hay algunos paquetes
disponibles para R que calculan varias medidas de confiabilidad, como α y ω de Cronbach. McNeish (2018)
proporciona una discusión de algunos de estos paquetes e ilustra el cálculo de ω usando cada uno de ellos.
Usamos el paquete MBESS (Kelley,2007) en nuestra ilustración aquí.
10 AF HAYES Y JJ COUTTS

Figura 3.Extracto de entrada y salida de AMOS de un análisis factorial confirmatorio de la escala de cobardía. La correlación implícita (generada al elegir las
opciones "Estimaciones estandarizadas" y "todos los momentos implícitos" en Propiedades de análisis) entre la variable latente (BLIRT) y la suma "latente" de
los ocho elementos (SUM) es la raíz cuadrada de ω. Cuadre esta correlación para generar ω: 0,8862= 0,785.

La función ci.reliability en MBESS estima las cargas factoriales utilizando el paquete lavaan y luego utiliza
estas cargas en el cálculo de ω. Después de instalar el paquete MBESS, se aplicó el siguiente código R a los
datos de contenido, almacenados en un archivo delimitado por comas:

requerir (MBESS)
dat<-read.table(“c:\\omega\\blirt8.csv”, sep=”,”,header=FALSE)
ci.reliability(dat,type=“omega”)

La salida resultante es ω,
$est
[1] 0,7850364

lo cual concuerda con la estimación generada por Mplus y AMOS. La función ci.reliability en MBESS también
se puede utilizar para construir un intervalo de confianza para ω utilizando el error estándar estimado o los
enfoques bootstrap. Véase Dunn et al. (2014) o McNeish (2018) para un tutorial.
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 11

SPSS y SAS
SPSS y SAS son paquetes de análisis de datos populares que se utilizan ampliamente en la comunicación, las ciencias del
comportamiento en general, la investigación empresarial y de marketing y otras comunidades de investigación. Pero
tampoco existe un procedimiento que calcule ω, y esto puede haber dificultado la adopción de ω más ampliamente. Las
únicas opciones de confiabilidad que conocemos disponibles en SPSS y SAS incluyen el α de Cronbach, varios enfoques de
división por mitades, así como algunos otros (por ejemplo, los coeficientes lambda de Guttman; Guttman,1945) poco
conocido por la mayoría de los investigadores.
Aquí, presentamos una herramienta computacional (una macro) que acerca ω a los usuarios de SPSS y SAS y al mismo
tiempo facilita su cálculo en relación con los enfoques SEM al reducir el trabajo a escribir y ejecutar una sola línea de código.
La macro OMEGA está disponible gratuitamente como un archivo de sintaxis SPSS que define la macro y se puede descargar
desdewww.afhayes.com. Para los usuarios de SPSS que prefieren trabajar con la interfaz gráfica de usuario, también hemos
creado un archivo de diálogo personalizado que se puede instalar en el sistema de menús de SPSS, lo que permite al usuario
configurar el análisis mediante una interfaz familiar de apuntar y hacer clic. También está disponible un programa SAS que
define la macro para SAS con las mismas características que describimos aquí y una estructura de sintaxis similar. Nos
centramos en la versión de SPSS a continuación. Consulte la documentación para obtener detalles adicionales y la sintaxis
de la versión SAS.
Los cálculos de ejemplo de ω que se acaban de presentar en AMOS, Mplus y R se basan en el cálculo iterativo de
cargas factoriales y varianzas de error utilizando CFA y estimación de máxima verosimilitud. SPSS no tiene
procedimientos integrados para el análisis factorial confirmatorio. Sin embargo, hemos encontrado que la rutina
FACTOR, típicamente utilizada para el análisis factorial exploratorio (AFE), cuando se utiliza el método de extracción
de máxima verosimilitud genera cargas factoriales que se corresponden estrechamente con lo que genera una
rutina CFA de un solo factor (justificamos esta afirmación a continuación) cuando se aplica un solo factor. -Se solicita
solución factorial. Una alternativa para el cálculo de ω integrada en la macro OMEGA se basa en el enfoque
aproximado de forma cerrada descrito en Hancock y An (en prensa). Este enfoque de forma cerrada también facilita
la producción de resultados útiles para algunas formas de análisis de ítems y la producción de formas breves de
escalas más largas. A continuación describimos el uso de cada una de estas opciones integradas en la macro
OMEGA y luego, en la siguiente sección, analizamos su uso para el análisis de ítems y el acortamiento de escala.

Uso de cargas factoriales EFA


Después de activar la macro OMEGA ejecutando el archivo de sintaxis de definición de macro, el siguiente
comando de SPSS ejecuta el cálculo de ω utilizando cargas generadas por su rutina de análisis factorial:

elementos omega = blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8.

Cuando se ejecuta esta línea de código, se realiza un análisis factorial de máxima verosimilitud de la matriz de correlación4
Se inicia uno de los ocho ítems de cobardía, lo que obliga a una solución de un solo factor. En la sintaxis normal de
SPSS, este comando OMEGA realiza el equivalente del siguiente comando FACTOR integrado en SPSS

variables factoriales = blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8
/extracción=ml/factores de criterios(1).

La macro OMEGA generará la salida de este comando automáticamente en la ventana de salida.5Una vez que
se realiza el análisis factorial, la macro extrae las cargas factoriales del resultado, las multiplica por las
desviaciones estándar de los ítems para colocarlas en la escala de respuesta original de los ítems (las cargas
estandarizadas también están disponibles como una opción de salida) y los introduce en una rutina
computacional que genera una estimación de ω usando la Ecuación (4).
El resultado resultante se puede encontrar enFigura 4, panel A. La estimación de ω es 0.785, la misma que se
genera usando cargas de un CFA realizado usando AMOS, Mplus y el paquete MBESS para R. Y como puede verse,
OMEGAmacro también genera las cargas factoriales así como las cargas factoriales. variaciones de error
12 AF HAYES Y JJ COUTTS

a
Esta estimación de omega se basa en las cargas factoriales de un análisis factorial forzado de máxima
verosimilitud de un solo factor utilizando el procedimiento FACTOR integrado de SPSS.

Fiabilidad:
Omega
. 785

Medias de artículos, desviaciones estándar y cargas estimadas:


Significar Cargando ErrorVar
Dakota del Sur

blirt1 3.365 1.012 . 663 . 583


blirt2r 3.379 1.037 . 642 . 663
blirt3r 3.156 . 936 . 576 . 544
blirt4 3.133 1.001 . 711 . 496
blirt5r 2.976 1.071 . 549 . 845
blirt6 3.237 . 981 . 643 . 549
blirt7r 3.379 1.142 . 376 1.161
blirt8 2.664 1.003 . 398 . 847

b
Esta estimación de omega se basa en la solución aproximada y de forma cerrada para el cálculo de cargas
descrita en Hancock, GR y An, J. (2020). Una alternativa de forma cerrada para estimar la confiabilidad omega
bajo unidimensionalidad. Medición: investigaciones y perspectivas interdisciplinarias.

Fiabilidad:
Omega BotaSE BotaLL95 BotaUL95
. 779 . 025 . 721 . 819

Medias de artículos, desviaciones estándar y cargas estimadas:


Significar Cargando
Dakota del Sur

blirt1 3.365 1.012 . 654


blirt2r 3.379 1.037 . 677
blirt3r 3.156 . 936 . 583
blirt4 3.133 1.001 . 711
blirt5r 2.976 1.071 . 549
blirt6 3.237 . 981 . 636
blirt7r 3.379 1.142 . 380
blirt8 2.664 1.003 . 344

Figura 4.Salida de la macro OMEGA para SPSS utilizando análisis factorial de máxima verosimilitud (panel A) o el algoritmo HA (panel B) para
estimar las cargas de factorización.

(definido como la varianza del artículo multiplicada por la cantidad 1 menos la carga factorial estandarizada al
cuadrado para el artículo). Estas cargas se pueden encontrar entabla 1para facilitar una comparación lado a lado
con las cargas generadas por AMOS y Mplus. Las cargas son casi idénticas.
tabla 1También muestra dos medidas objetivas de correspondencia entre las cargas derivadas de CFA y
EFA. El “sesgo” es la discrepancia media entre elk =8 cargas macro OMEGA (λidALEÞ) y las cargas generadas a
través de un CFA de un solo factor en Mplus o AMOS (λidCFAÞ), definido como

1X k
Inclinación¼ ½λidALEÞ-λidCFAÞ- (6)
k i¼1

Un valor de cero significa que las cargas de AFA son, en promedio en todos los ítems, las mismas que las cargas de
AFC. La segunda medida de discrepancia es "RMSE", la raíz del error cuadrático medio,
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 13

tu1X k
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffif

2
RMSE¼t ½λidALEÞ-λidCFAÞ- (7)
k i¼1

que es similar a una desviación estándar y captura aproximadamente la diferencia promedio entre las cargas
de CFA y EFA, independientemente del signo de la diferencia. RMSE solo puede ser positivo, y un valor más
cercano a cero representa una mayor similitud entre los pares de cargas. Independientemente de qué
medida se considere, los pequeños valores de discrepancia observados entabla 1reflejan poca diferencia
entre estos dos conjuntos de cargas, Bias = 0,001 y RMSE = 0,002. Las cargas de EFA son aproximaciones
cercanas a las cargas de CFA.
Esta similitud en las cargas y la estimación de ω entre los enfoques EFA y CFA no son específicas de este conjunto
de ejemplo de participantes que responden a esta escala. Hemos probado la macro OMEGA en conjuntos de datos
que teníamos disponibles que incluían las respuestas de los participantes a 17 escalas diferentes, incluidas las
subescalas de aproximación y evitación de la Escala de Argumentación (Infante & Rancer,mil novecientos ochenta y
dos), Miedo al aislamiento social (Hayes, Matthes y Eveland,2013), Voluntad de autocensura (Hayes, Glynn y
Shanahan,2005), Autoestima (Rosenberg,1965), timidez (mejilla y autobús,1981), los 5 grandes factores de
personalidad (John y Srivastava,1999), las subescalas de conformidad y conversación de la Family Communication
Patterns Scale (Ritchie & Fitzpatrick,1990), Miedo a la evaluación negativa (Leary, 1983), la autoconciencia pública
(PSC) y la subescala de ansiedad social de la PSC (Fenigstein, Scheier y Buss,1975). Como es práctica habitual, todas
ellas se administraron utilizando un formato de respuesta Likert con opciones de respuesta ordinales de 5 puntos
(p. ej., totalmente en desacuerdo o totalmente de acuerdo) y utilizando muestras de varios tamaños que van desde
86 hasta más de 2000. Para todas estas escalas y conjuntos de datos,Tabla 2contiene la estimación de ω de la macro
OMEGA utilizando las cargas de EFA, el código Mplus descrito anteriormente y el paquete MBESS para R, y las dos
medidas de discrepancia entre las cargas de EFA y CFA (Ecuaciones 6 y 7). También proporcionado enTabla 2es una
prueba de razón de verosimilitud de igualdad de las cargas factoriales utilizando AFC. Como puede verse, las
diferencias entre ω y las cargas usando CFA versus EFA son consistentes y generalmente insignificantes. Parece
haber poca diferencia si ω se calcula exactamente usando una rutina CFA como en Mplus, AMOS o el paquete
MBESS para R, o usando OMEGAmacro que se basa en la rutina de análisis factorial exploratorio de SPSS. Observe
también que para cada escala que examinamos, se violó el supuesto esencial de equivalencia tau.

Aproximación de cargas en forma cerrada de Hancock y An


La macro OMEGA puede estimar ω utilizando un enfoque alternativo de forma cerrada (es decir, no
iterativo). Es un método de forma cerrada porque genera cargas que se pueden calcular sin depender
de cálculos iterativos como en EFA y CFA. Este enfoque es descrito por Hancock y An (en prensa), al
que aquí nos referimos como método "HA", e implica estimar la carga del artículo ide sumas de
covarianzas y productos de covarianzas de conjuntos de tres elementosyo, j,yq.La estimación del
artículo.i'La carga s se calcula como
SFFIP
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffifi

"j <qdCOVyoCOVcoeficiente intelectualÞ

λidJAÞ¼ PAG (8)


"j <qdCOVjqÞ

(Ecuación 8 en Hancock & An,en prensa) dóndeCOVes una covarianza entre las respuestas a los dos ítems
subíndices y "j <qdenota “para todas las combinaciones de elementosjyqcuandojes menos queq."No es necesario
ningún análisis factorial. Todo lo que se necesita para calcular ω son las covarianzas de las respuestas a lakpartidas
y la varianza de la suma de laskelementos (la macro OMEGA usa la Ecuación 5 para el cálculo de ω cuando se solicita
la opción HA), todos calculados fácilmente utilizando los datos disponibles. Hancock y An (en prensa) compararon el
rendimiento del algoritmo HA en la estimación de ω en comparación con CFA en una simulación extensiva de Monte
Carlo, variando el tamaño de la muestra, el número de elementos y los tamaños y distribución de las cargas.
Descubrieron que HA era un serio competidor de la estimación CFA, excepto cuando las cargas eran pequeñas y/o la
escala consistía en un número muy pequeño de ítems.
14
AF HAYES Y JJ COUTTS

Tabla 2.Nombres y características de las escalas, estimaciones de confiabilidad (α de Cronbach y ω de McDonald) y discrepancias de las cargas de CFA.

EFA-ML JA
CFA
Nombre de la escala Elementos norte ω ω CFA λ Sesgo de discrepancia/RMSE ω CFA λ Sesgo de discrepancia/RMSE Prueba de equivalencia Tau α de Cronbach

Argumentatividad – Enfoque 10 86 . 837 . 837 0,003/0,003 . 829 0,002/0,024 χ2(9) = 38,768,pag <.001 . 828
Argumentatividad – Evitación Los 10 87 . 839 . 839 0,004/0,004 . 834 0,006/0,049 χ2(9) = 41,310,pag <.001 . 831
cinco grandes – Apertura 10 322 . 780 . 780 0,001/0,001 . 777 0,002/0,026 χ2(9) = 25,969,pag = .002 . 780
Los cinco grandes: la escrupulosidad Los 9 322 . 763 . 763 0,000/0,002 . 764 0,004/0,032 χ2(8) = 22.070,pag = .005 . 766
cinco grandes: la extraversión 8 325 . 874 . 874 0,001/0,001 . 870 − 0,002/0,012 χ2(7) = 86,650,pag <.001 . 867
Los 5 grandes: Amabilidad 9 322 . 787 . 787 0,001/0,001 . 784 0,002/0,024 χ2(8) = 29,486,pag <.001 . 787
Los 5 grandes: 8 325 . 803 . 803 0,001/0,001 . 799 0,001/0,018 χ2(7) = 27,643,pag <.001 . 800
Neuroticismo Descaro 8 211 . 785 . 785 0,001/0,002 . 779 − 0,002/0,023 χ2(7) = 22,276,pag = .002 . 780
Patrón de comunicación familiar – Conversación 15 329 . 914 . 914 0,001/0,001 . 913 0,001/0,010 χ2(14) = 63,472,pag <.001 . 913
Patrón de comunicación familiar – Conformidad 11 329 . 830 . 830 0,001/0,001 . 823 − 0,003/0,018 χ2(10) = 89,804,pag <.001 . 824
Miedo a la evaluación negativa 11 240 . 902 . 902 0,001/0,001 . 902 0,008/0,044 χ2(10) = 52,804,pag <.001 . 903
Miedo al aislamiento social 5 233 . 864 . 864 0,002/0,002 . 864 0,002/0,009 χ2(4) = 16,125,pag = .003 . 862
Conciencia pública de uno mismo 7 415 . 826 . 826 0,001/0,001 . 823 − 0,001/0,012 χ2(6) = 44,528,pag <.001 . 823
Ansiedad social 6 236 . 810 . 810 0,001/0,001 . 807 − 0,001/0,018 χ2(5) = 39,607,pag <.001 . 800
Autoestima 10 234 . 906 . 906 0,001/0,001 . 904 0,001/0,007 χ2(9) = 80,755,pag <.001 . 902
Timidez 13 1611 . 897 . 897 0,000/0,001 . 897 0,001/0,010 χ2(12) = 460,393,pag <.001 . 895
Voluntad de autocensurarse 8 2470 . 811 . 811 0,000/0,000 . 810 − 0,001/0,004 χ2(7) = 112,242,pag <.001 . 809
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 15

Una ventaja del enfoque HA en relación con EFA y CFA es que es rápido. Además, es bastante fácil
programar una rutina que aplique este algoritmo repetidamente a diferentes subconjuntos de ítems sin
requerir trabajo adicional por parte del usuario, facilitando la generación de estadísticas de análisis de ítems
que discutiremos más adelante, así como la construcción de un bootstrap de confianza. intervalo para ω.
Una desventaja es que las cargas resultantes a veces producen estimaciones de ω mayores que 1 y, a veces,
no se puede construir una carga en absoluto, como cuando el operando en el denominador de la Ecuación 8
es negativo. Cuando ocurre cualquiera de estas situaciones, la macro OMEGA devuelve −999 para ω o una
carga y la salida correspondiente no debe interpretarse.
El algoritmo HA se activa con el uso delja = 1argumento en el comando OMEGA, como se muestra a continuación. En
este ejemplo, también solicitamos un intervalo de confianza de arranque del 95% para ω (generado usando el método
percentil y 10,000 muestras de arranque) sumandoarranque = 10000al comando, como se muestra a continuación:

elementos omega=blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8/ha=1


/arranque=10000.

El resultado resultante se puede encontrar enFigura 4, panel B. Utilizando esta aproximación de las cargas, ω = 0,779
(intervalo de confianza de arranque del 95% de 0,722 a 0,818, con una estimación de arranque del error estándar de 0,025),
que está cerca del 0,785 producido por los enfoques CFA y EFA. La macro también muestra las medias y desviaciones
estándar de los elementos y las cargas factoriales estimadas. Para facilitar la comparación de las cargas relativas a las
generadas con un CFA, las cargas se encuentran entabla 1para el ejemplo de la escala de travesura, junto con las medidas
de discrepancia correspondientes en comparación con las cargas de CFA. Observe que las cargas son similares, aunque no
tan cercanas como cuando se usa EFA.
Al igual que hicimos con el enfoque EFA implementado en la macro, aplicamos el algoritmo HA a los datos
recopilados utilizando las 17 escalas descritas anteriormente.Tabla 2contiene ω estimado con esta
aproximación para cada una de las escalas. Son similares a ω calculados de otras formas. Además, como
puede verse, las discrepancias entre las cargas generadas usando este enfoque y las cargas CFA son
bastante pequeñas (usando las Ecuaciones 6 y 7, sustituyendo λidJAÞpara λidALEÞ), pero claramente mucho
mayor que cuando se utiliza la rutina EFA basada en ML de SPSS.

Análisis de elementos y construcción de formularios breves utilizando OMEGA y el algoritmo HA

El algoritmo HA programado en la macro OMEGA facilita la realización de algunas formas de análisis de elementos que se
centran en cómo uno o más elementos contribuyen a la estimación de la confiabilidad. En esta sección, analizamos las
limitaciones del popular enfoque de dejar uno afuera para el análisis de ítems y ofrecemos un enfoque implementado en la
macro OMEGA que se basa en la construcción de todas las posibles “escalas de subconjuntos” que pueden construirse a
partir de un conjunto dekelementos. Mostramos cómo se puede utilizar este enfoque de subconjuntos para seleccionar
elementos para eliminar de una escala que no contribuyen positivamente a su confiabilidad o para ayudar en la
construcción de formas breves de escalas de medición existentes.

Análisis de artículos

Al construir o evaluar un MIMS, es común realizar un análisis de ítems, examinando cómo cada ítem
de la escala contribuye a las cualidades psicométricas de los datos resultantes. El análisis factorial
exploratorio o confirmatorio se utiliza con frecuencia para evaluar la dimensionalidad de un conjunto
de ítems, qué ítems miden qué factores si el conjunto de ítems es multidimensional y para examinar
qué ítems no se cargan en algún factor. Una vez que se acepta como unidimensional un conjunto de
ítems (ya sea el conjunto completo que se está considerando o un subconjunto de los ítems que se
cargan en un factor común), el investigador podría calcular cuánto aumenta o disminuye una
estimación de confiabilidad cuando se elimina un ítem de la escala como un enfoque adicional para
eliminar ítems que no contribuyen o tal vez incluso perjudican la confiabilidad.
dieciséis AF HAYES Y JJ COUTTS

out” (LOO) de α de Cronbach al mostrar, para cada ítem, qué sucede con la confiabilidad estimada del conjunto
cuando se excluye el ítem. Los desarrolladores de escala que utilizan este procedimiento normalmente lo hacen de
forma iterativa, la primera vez que utilizan todoskítems de una escala o subescala, la segunda vez descartando el
ítem que reduce más la confiabilidad, y así sucesivamente, eliminando un ítem de la escala en cada iteración hasta
que la confiabilidad de la escala ya no se pueda mejorar descartando ítems.
Sin embargo, el enfoque LOO para el análisis de ítems es problemático. El cambio en una medida de
confiabilidad cuando se elimina un ítem depende de la presencia de otros ítems en la escala, algunos de los cuales
pueden ser dignos de exclusión. La confiabilidad de un conjunto de elementos en la iteración.tdependerá de cuál de
loskLos elementos fueron descartados en la iteración.t –1. Considere el elemento 1 de un conjunto de cinco
elementos. Utilizando el enfoque LOO, se estima la confiabilidad para la escala con los cinco ítems, así como para
una escala de cuatro ítems que excluye el ítem 1. Supongamos que la confiabilidad es mayor cuando el ítem 1 se
elimina primero, lo que sugiere que su presencia perjudica la confiabilidad, por lo que el analista decide descartar el
ítem 1. Sin embargo, supongamos que el ítem 2 también es un ítem problemático, y cuando se elimina primero en
lugar del ítem 1, uno podría encontrar en la siguiente iteración que descartar el ítem 1 de la escala ahora de 4 ítems
en realidad puedeherirconfiabilidad, lo que sugiere que el ítem 1 debería conservarse en lugar de descartarse.

De manera más general, para cualquier artículoi,un enfoque LOO iterativo implementado descartando un elemento que
reduce la confiabilidad al incluirlo en el conjunto generará la confiabilidad de, como máximo,k –1 balanza que contiene el
artículoi.Como se analiza más adelante, esto suele ser sólo una pequeña fracción de las escalas posibles que uno podría
crear a partir del conjunto dekartículos que incluyen artículoiy eso podría ser útil para evaluar el valor de ese artículo en la
escala de medición. Es probable que el resultado sea alguna duda sobre si los elementos eliminados o retenidos han
producido la mejor escala (según un estándar de confiabilidad) que uno podría generar a partir de estos.kartículos (cf.,
Morris,1978b).
La macro OMEGA implementa este enfoque LOO para el análisis de ítems (usando ω o α de Cronbach
como índice de confiabilidad) agregandobaño =1al comando en la página 23 (consulte el resultado
resultante en la parte superior deFigura 5). Pero tiene una característica adicional que ayuda a superar esta
deficiencia del enfoque LOO. Si un elemento reduce la confiabilidad de los datos generados por un conjunto
dekítems, entonces se esperaría que cualquier escala construida a partir de algún subconjunto de loskLos
ítems que lo incluyan generarían datos menos confiables en promedio que una escala que lo excluya. Por
ejemplo, supongamos que uno está dispuesto a tener tan solo dos ítems en la versión final de la escala. Conk
artículos, hay 2k– k –1 escalas posibles con al menos dos ítems (incluida la escala con todos kelementos). De
estos, 2(k –1)– 1 contiene artículoiy 2(k –1)–kno. Artículoisería un fuerte candidato para la exclusión de la escala
si, en promedio, la confiabilidad es no trivialmente menor en el conjunto de escalas que incluyen el ítemique
en el conjunto que excluye ese elemento.
ElsubconjuntosLa opción en la macro OMEGA estima la ganancia promedio en confiabilidad cuando un
ítem se incluye en la escala calculando la confiabilidad paratodas las escalas posiblesdel conjunto dekítems
que se pueden construir con y sin cada ítem y calcular la diferencia en la confiabilidad promedio entre los
dos conjuntos. El resultado es una evaluación más completa de la contribución que ese rubro iinfluye en la
confiabilidad de un conjunto de elementos y, por lo tanto, en una decisión más informada sobre si el
elemento debe conservarse o excluirse del conjunto.
Esta opción está disponible en la macro OMEGA cuando se utiliza el algoritmo HA para estimar ω y las
cargas factoriales.6Recuerde que el algoritmo HA se basa en las covarianzas de conjuntos de tres elementos
para estimar ω. Entonces la macro OMEGA generará los 2k- 0,5(k2+k+2) posibles escalas con al menos tres
ítems al calcular la ganancia promedio en confiabilidad atribuible al ítemi,2(k –1)–kde los cuales contienen el
artículoiy 2(k –1)- 0,5(k2 –k+2) que no lo hacen.
Volviendo a la escala de la cobardía,Figura 5contiene la salida que resulta al usar la opción de
subconjuntos, solicitada agregandosubconjuntos=1al comando OMEGA, como en

elementos omega=blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8/ha=1


/loo=1/boot=10000/subsets=1.
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 17

Fiabilidad:
Omega BotaSE BotaLL95 BotaUL95
. 779 . 024 . 722 . 818

Medias de los ítems, desviaciones estándar, cargas estimadas y confiabilidad si se elimina el ítem:
Significar Cargando
Dakota del Sur Omega
blirt1 3.365 1.011 . 654 . 742
blirt2r 3.379 . 973 . 677 . 741
blirt3r 3.156 . 971 . 583 . 745
blirt4 3.133 1.029 . 711 . 733
blirt5r 2.976 1.104 . 549 . 764
blirt6 3.237 1.001 . 636 . 741
blirt7r 3.379 1.051 . 380 . 787
blirt8 2.664 . 903 . 344 . 781

Fiabilidad y correlaciones entre subescala y escala completa (r) para todas las posibles
subescalas con 3 o más ítems (1=ítem incluido, 0=no incluido):

blirt1 blirt2r blirt3r blirt4 blirt5r blirt6 blirt7r blirt8 Omega r


1 . 000 . 000 . 000 1.000 1.000 . 000 . 000 1.000 . 931 . 859
2 . 000 1.000 . 000 . 000 1.000 . 000 . 000 1.000 . 827 . 852
3 1.000 1.000 1.000 1.000 1.000 1.000 . 000 . 000 . 792 . 962
4 1.000 1.000 1.000 1.000 1.000 1.000 . 000 1.000 . 787 . 977
5 1.000 1.000 1.000 1.000 .000 1.000 . 000. 000 . 782 . 945
6 1.000 1.000 1.000 1.000 .000 1.000 . 000 1.000 . 782 . 952
7 1.000 1.000 1.000 1.000 1.000 1.000 1.000 . 000 . 781 . 983
8 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 . 779 1.000
9 1.000 1.000 1.000 1.000 .000 1.000 1.000 1.000 . 764. 983
10 1.000. 000 1.000 1.000 . 000 1.000 . 000. 000 . 761 . 908
11 1.000 . 000 1.000 1.000 1.000 1.000 . 000 . 000 . 761 . 941
12 . 000 1.000 1.000 1.000 1.000 1.000 . 000 . 000 . 761 . 940
13 1.000 1.000 1.000 1.000 .000 1.000 1.000 . 000 . 760 . 971
14 1.000. 000 1.000 1.000 . 000 1.000 . 000 1.000 . 759 . 914
15 . 000 .000 .000 .000 1.000 1.000 . 000 1.000 . 759 . 858
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
28 1.000 1.000 . 000 1.000 1.000 1.000 1.000 . 000 . 744 . 972
29 1.000 1.000 1.000 1.000 . 000. 000. 000 . 000 . 742 . 923
30 1.000 .000 1.000 1.000 1.000 1.000 1.000 . 000 . 742 . 967
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
216 1.000 . 000 . 000 . 000 1.000 . 000 1.000 . 000 . 471 . 854
217 1.000 . 000 . 000 . 000 1.000 . 000 1.000 1.000 . 437 . 910
218 . 000 . 000 1.000 . 000 . 000 . 000 1.000 1.000 . 408 . 823
219 . 000 . 000. 000 . 000 1.000 . 000 1.000 1.000 . 349 . 821

Fiabilidad media de todas las escalas de subconjuntos posibles con y sin ítem:
Sin Con Ganar
blirt1 . 637 . 682 . 045
blirt2r . 635 . 683 . 048
blirt3r . 643 . 677 . 034
blirt4 . 624 . 692 . 067
blirt5r . 651 . 669 . 018
blirt6 . 637 . 681 . 045
blirt7r . 692 . 636 - . 057
blirt8 . 669 . 655 - . 014

Figura 5.Salida macro OMEGA cuando se utiliza ellavaboysubconjuntosopciones.

Esta sección de resultados en la parte inferior deFigura 5Contiene una pequeña tabla con ocho filas, una
para cada uno de los ítems de la escala de cobardía. En las columnas están la media ω generada a partir de
las 120 escalas posibles con al menos tres de los ocho ítems de cobardía pero que excluyen el ítem de esa fila
(“Sin”), la media ω de los 99 subconjuntos con al menos tres ítems que incluyen ese artículo ("Con”), y la
ganancia promedio en confiabilidad cuando se incluye el ítem (“Ganancia”). Cuando la ganancia es positiva,
incluir el ítem mejora la confiabilidad en promedio, y cuando es negativa, el ítem reduce la confiabilidad en
promedio.
18 AF HAYES Y JJ COUTTS

Observe que el procedimiento de subconjuntos identifica los elementos 7 y 8 como elementos potencialmente
problemáticos, ya que el enfoque LOO (hacia la parte superior de la salida, generado con elbaño =1opción en el
código) lo hace. Sin embargo, el enfoque LOO sugiere sólo una pequeña reducción en la confiabilidad cuando se
incluye el ítem 7 (0,779 para la versión completa de ocho ítems) en comparación con la escala de siete ítems que lo
excluye (0,787). Pero al considerar todas las escalas posibles con tres o más ítems, la inclusión del ítem 7 reduce la
confiabilidad en mucho más: 0,057 en promedio. Del mismo modo, el enfoque LOO sugiere sólo una pequeña
reducción en la confiabilidad de 0,002 atribuible a la inclusión del ítem 8. La reducción real en la confiabilidad
atribuible al ítem 8 al considerar todas las escalas posibles del conjunto es mucho mayor, 0,014.
Es tentador concluir que si los ítems 7 y 8 se excluyeran de la escala de descaro, la estimación de
confiabilidad resultante sería 0,057 + 0,014 = 0,071 mayor. No es verdad. En la siguiente sección, veremos
otra característica de la opción de subconjuntos que muestra que cuando se excluyen los ítems 7 y 8
mientras se retienen los otros 6, la confiabilidad aumenta solo 0,013, de 0,779 a 0,792. También veremos que
una versión de cuatro ítems de la escala de franqueza podría justificarse, al menos mediante un estándar de
confiabilidad, construido descartando los ítems 5, 6, 7 y 8, aunque los ítems 5 y 6 parecen aumentar en lugar
de disminuir. fiabilidad.

Construcción de formulario breve

Muchas escalas de medición utilizadas por los científicos del comportamiento contienen cierta redundancia, a menudo
incluso sustancial, en el contenido de los ítems. Una gran cantidad de elementos pueden resultar útiles para lograr la validez
del contenido, pero un exceso de elementos puede tener un precio. Las encuestas más largas pueden resultar más costosas
de administrar. Y existe la posibilidad de que los encuestados tengan más probabilidades de fatigarse, desinteresarse en
responder de manera reflexiva o sincera, o interrumpir la entrevista o dejar de responder todas las preguntas, lo que
resultará en datos faltantes o respuestas propensas a errores.
Teniendo en cuenta estas consideraciones, existen muchas escalas breves o “formas breves” que están diseñadas, en
parte, para reducir la fatiga de los encuestados y reducir los costos de recopilación de datos en relación con cuando se
utiliza la escala completa (por ejemplo, Cacioppo, Petty y Kao,1984; Leary,1983; Stephenson, Hoyle, Palmgreen y Slater,2003;
Zhu y Yzer,2019). ElsubconjuntosLa opción en la macro OMEGA puede ayudar en el desarrollo de dichas formas breves o,
como cuando se realiza un análisis de ítems, de otro modo seleccionar de un conjunto de ítems aquellos que añaden
redundancia sin mejorar y tal vez incluso dañar las cualidades psicométricas del instrumento. Lo hace ayudando a identificar
un subconjunto demetroelementos del conjunto original dekque produzca datos que sean suficientemente confiables y que
genere puntajes de escala que estén altamente correlacionados con las mediciones obtenidas si todoskSe administraron los
artículos. Si existe una versión más corta de la escala, y normalmente existen varias, entonces lak – metroLos ítems
restantes de la escala completa probablemente añaden poco a las cualidades psicométricas de la escala y pueden
abandonarse en aras de la eficiencia de la medición. ¿Por qué gastar el esfuerzo y el costo de administrar unak-escala de
ítems cuando un conjunto más pequeño demetro¿De esos ítems será suficiente desde un punto de vista psicométrico?

Más formalmente, definarkcomo confiabilidad usando el completok-medida del artículo,rmetrocomo la confiabilidad utilizando un
subconjunto específico demetrodelkelementos,metro <k,yrmín.como la confiabilidad mínima de unmetro-versión del ítem de la escala
completa que el analista o la comunidad de investigación considerarán aceptable. Además, definirCmetro
como la correlación entre las puntuaciones del totalk-escala de ítems y unametro-versión del artículo, yCmín.como la
correlación mínima deseada entre las puntuaciones de unmetro-versión del ítem de la escala y puntuaciones de la escala
completa. La salida de la opción de subconjuntos contiene todos los posiblesmetro-escalas de ítems que pueden construirse
a partir dekelementos,metro =2 (para α) o 3 (para ω) ak,así comormetroyCmetropara cada una de estas escalas. Usando esta
sección del resultado, escanea estas posibles subescalas con el objetivo de encontrar unametro-versión del ítem de la escala
con

rmetro rmín.

Cmetro Cmín.
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 19

pero sin sacrificar la validez aparente o de contenido. Tu eliges los valores dermín.yCmín.que sean
aceptables dado el propósito de la investigación y los usos del MIMS. La mayoría no querría usarrmín.
menos de 0,7 (más alto sería mejor, como 0,90 o más para medidas utilizadas para tomar decisiones importantes
sobre las personas; Nunnally & Bernstein,1994, pag. 265; ver Lance, Butts y Michels,2006, para una discusión sobre
las creencias sobre los límites convencionales para una confiabilidad “aceptable”). Y recomendamosCmín.de al menos
0,90, dado que el objetivo es producir una escala concisa que sea funcionalmente equivalente a una versión más
larga que incluya todoskelementos.
Para cualquier valor demetro,Pueden existir varias formas breves de buenos candidatos, y puede haber varios buenos
candidatos con diferentes valores demetro.De entre estas opciones, es mejor optar por la forma breve conrmetrono mucho
más pequeño querky preferiblemente más alto si es posible, así comoCmetrocercano a 1. Una escala de este tipo generaría
datos tan confiables como la escala completa, si no más, y al mismo tiempo generaría puntuaciones que son
funcionalmente equivalentes a las generadas cuando se utiliza el conjunto completo de escalas.kelementos.
Figura 5contiene un extracto del resultado generado al usar la opción de subconjuntos y aplicado a los datos de
la escala de cobardía. Cada subconjunto ocupa una fila en esta tabla y se indica, en las columnas, con un 0 o 1 que
indica si (1) o no (0) el elemento que etiqueta la columna está incluido en el subconjunto. Las dos últimas columnas
contienen la confiabilidad estimada (ω) de la suma generada con los ítems incluidos (rmetro), así como la correlación
entre las puntuaciones generadas con la escala de subconjunto que contiene solo esos ítems y las puntuaciones
generadas utilizando todoskelementos (Cmetro).
De forma predeterminada, las filas se ordenan por valor decreciente dermetro.7La escala con todosk =8 elementos de
cobardía está en la octava fila, lo que significa que existen siete conjuntos con menos de ocho elementos conrmetro>rk. La fila
superior es unametro =Versión de 3 elementos que contiene solo los elementos 4, 5 y 8, conrmetro=0,931. Las puntuaciones
de franqueza generadas al sumar estos tres elementos se correlacionanCmetro=0,853 con las puntuaciones generadas al
sumar los 8 ítems. Observe que la fila 3 de la tabla corresponde a lametro =Versión de 6 ítems que excluye los ítems 7 y 8,
dos ítems que, en promedio, tienen menor confiabilidad cuando se incluyen, como se reveló en la discusión anterior sobre el
resultado de la opción de subconjuntos. La confiabilidad de las puntuaciones generadas con estos 6 ítems es rmetro=0,792,
más alto que cuando se utilizan todos los ítems, mientras que se generan puntuaciones correlacionadas casi perfectamente
(Cmetro=0,962) con puntuaciones generadas utilizando los ocho ítems. Otro candidato interesante para una forma breve de la
escala de descaro se encuentra en la fila 29. Estemetro =La versión de 4 ítems contiene los ítems 1, 2, 3 y 4, con una
confiabilidad ligeramente menor que cuando se usan los 8 ítems (rmetro=0,742) pero genera puntuaciones altamente
correlacionadas con el conjunto completo de 8 ítems (Cmetro=0,923).

Algunas precauciones y advertencias sobre la opción de subconjuntos

La opción de subconjuntos en la macro OMEGA permite un examen de la confiabilidad estimada con ω (o α de


Cronbach) para todas las escalas posibles que se pueden construir a partir de un conjunto de ítems. En nuestro
ejemplo, utilizando la escala de franqueza de ocho ítems, sólo se pueden construir un par de cientos de escalas. Sin
embargo, a medida que aumenta el número de ítems, el número de escalas posibles aumenta drásticamente. Para
un conjunto de 10 ítems, existen 968 escalas posibles con al menos tres ítems. Con 15 ítems, la cifra aumenta a
32.647, y con 20, hay más de un millón de posibles escalas de este tipo. La macro OMEGA intenta generarlos todos.
Esto puede requerir tiempo y memoria computacional para almacenar los resultados, tal vez más de lo que tiene
disponible en su computadora o (en casos extremos) de toda su vida. Sin embargo, limitando nuestra preocupación
al respecto, Es nuestro escepticismo que cualquier escala de medición con más de 12 ítems sea verdaderamente
unidimensional. La unidimensionalidad es una suposición de la significancia de una medida de confiabilidad o una
puntuación compuesta construida como la suma o media de un conjunto de ítems, por lo que no podemos
recomendar el uso de la macro OMEGA con más de 12 a 15 ítems a menos que el usuario tiene confianza en que se
cumple el supuesto de unidimensionalidad de ω o α.
En segundo lugar, el uso de la opción de subconjuntos como la hemos descrito es minería de datos. Es de naturaleza exploratoria.
Cuando un MIMS se construye examinando ítems potenciales para una escala que tiene y no funciona bien psicométricamente y
eligiendo la mejor escala basándose en un subconjunto de ítems con la mayor confiabilidad, es probable que se produzca algún
sobreajuste, al igual que cuando se utilizan procedimientos de selección por pasos en el análisis de regresión. elegir un conjunto de
predictores para incluir en un modelo (ver Kopalle & Lehman,1997; su discusión ocurre
20 AF HAYES Y JJ COUTTS

en el contexto de α de Cronbach pero debería aplicarse también a ω. Véase también Raykov,2007). Existe una gran posibilidad de que
los datos generados por el mejor formulario breve elegido mediante este procedimiento exploratorio no sean tan confiables cuando
se apliquen a datos que no se utilizaron para tomar la decisión. Esta preocupación se generaliza al uso de la correlación entre las
puntuaciones del subconjunto y de la escala completa como criterio para la elección. Recomendamos encarecidamente la validación
cruzada y la replicación antes de aceptar que el conjunto de ítems elegido funciona según lo previsto en datos que no se utilizaron
para desarrollar la escala en primer lugar.
En tercer lugar, y de manera relacionada, aunque la opción de subconjuntos en la macro OMEGA puede ayudar a
reducir el número de ítems en un instrumento de medición que se está desarrollando o que ya existe, es importante
recordar que una buena medición es mucho más que establecer una alta confiabilidad (ver en escamas y frito, 2019;
frito y en escamas,2018). No podemos simplemente modificar, queramos o no, instrumentos que pueden estar
basados en décadas de investigación y asumir que una forma breve también es una medida válida del mismo
constructo. Una versión abreviada de un instrumento de medición establecido existente debería pasar por un
riguroso proceso de validación tal como lo hizo (con suerte) el original. Como mínimo, un investigador que utilice un
formulario breve desarrollado con la ayuda de la macro OMEGA debería intentar argumentar empíricamente que el
instrumento de medición utilizado está produciendo una medición de alta calidad del constructo previsto. De hecho,
el peligro de centrarse demasiado en la confiabilidad cuantificada con α o ω al construir una forma breve de un
MIMS existente es una reducción en la validez de contenido que puede resultar del aumento de la homogeneidad
del contenido de los ítems, reduciendo así el alcance de lo que es la escala. realmente midiendo.metro-Lo ideal es
que las formas breves de los ítems incluyan una consideración tanto de la validez del contenido como de la
evidencia estadística relevante.

¿A partir de excusas o haciendo algo de la nada?


En este artículo, hemos adoptado la posición de que los estudiosos de la comunicación y aquellos de las ciencias del
comportamiento que utilizan un MIMS en su investigación deberían pasar del α de Cronbach como su medida
favorita de confiabilidad a su medida principal, el ω de McDonald. El α de Cronbach es un caso especial de ωeso
requiere un supuesto restrictivo que es poco probable que se cumpla en muchas situaciones de medición. Para
facilitar la adopción de esta recomendación, hemos ilustrado métodos de cálculo de ω, desde enfoques SEM más
complicados hasta una implementación fácil de usar en SPSS y SAS.
Ciertamente podemos entender la renuencia de algunos investigadores a adoptar una medida alternativa de
confiabilidad que sea menos familiar, que no se discuta ampliamente en las aulas o en los libros de métodos de
investigación, y que parezca más difícil de calcular. Sin embargo, con su implementación en software de código
abierto como R y la macro OMEGA para SPSS y SAS presentada aquí, cualquiera puede calcular ω sin tener que
hacer CFA o incluso saber qué es CFA. Por lo tanto, aferrarse a α porque es más fácil de calcular es una posición
insostenible.
Sin embargo, cualquiera que adopte esta recomendación eventualmente descubrirá algo sobre lo que deberíamos ser
honestos y abiertos. Si bien la literatura metodológica ha demostrado que ω es claramente una medida de confiabilidad
superior y preferida en relación con α, en nuestra experiencia, las dos medidas generalmente producen estimaciones
similares de confiabilidad cuando se aplican a datos reales. En nuestro análisis de ejemplo utilizando los datos generados
por la escala de cobardía, ω calculado con mayor precisión utilizando cargas CFA es 0,785. Pero α es sólo un poco más
pequeño, 0,780. La similitud en las estimaciones no es específica de este conjunto de datos o escala. La última columna en
Tabla 2proporciona α de Cronbach para las 17 escalas y conjuntos de datos que utilizamos para examinar la similitud en los
resultados producidos por diferentes enfoques para calcular ω. Observe que siempre hay poca diferencia entre α y ω,
aunque en todos los casos encontramos que se viola el supuesto esencial de equivalencia tau que hace α. Entonces, ¿por
qué abandonar α si tiende a ser similar a ω?
En nuestra opinión, utilizar estos resultados para defender el status quo es una excusa, no una defensa. En primer lugar,
aunque las prácticas de recopilación y análisis de datos, así como las escalas de medición que utilizamos aquí, son similares
a las utilizadas comúnmente por los científicos del comportamiento, no podemos decir que nunca la discrepancia entre α y
ω será mayor en cualquier conjunto de datos que uno pueda construir. utilizando cualquier escala de medición que exista o
que algún día se invente. Las investigaciones han demostrado que la diferencia entre α y ω puede no ser trivial en algunas
circunstancias (ver McNeish,2018, para una revisión)
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 21

En segundo lugar, las escalas que utilizamos aquí ya han pasado por un proceso de refinamiento y evaluación.
Los ítems deficientes, presumiblemente con cargas factoriales bajas en relación con otros, habían sido eliminados
de las escalas antes de su finalización, validación y publicación. Siempre que el número de ítems no sea demasiado
pequeño, la investigación (así como el sentido común y la intuición) sugiere que α tenderá a desviarse menos de
medidas alternativas de confiabilidad como ω cuando las cargas son uniformemente mayores y, por lo tanto, la
escala tiene más probabilidades de variar. estar más cerca del equivalente esencialmente tau (Raykov,1997a; Raykov
y Marcoulides,2019; Yang y verde,2011). Pero cuando se desarrollan nuevas medidas o cuando las medidas se
construyen ad hoc para su uso en un estudio específico, es más probable que se utilicen ítems con cargas más
pequeñas o que tal vez una investigación más extensa excluiría de la escala, lo que aumenta la probabilidad de que
α y ω diverjan. .
En tercer lugar, aviso enTabla 2que α tiende a ser menor que ω (cuando se estima con AFC o el enfoque de
análisis factorial exploratorio implementado en nuestra macro), consistente con la sabiduría convencional de que α
representa un límite inferior de confiabilidad. En otras palabras, algunos podrían argumentar que α es una
estimación conservadora, por lo que si se considera que α es aceptablemente alto, eso sugiere que la confiabilidad
real estimada con mayor precisión es aún mayor. Si bien es cierto que αtiende asubestimar la confiabilidad cuando
se viola el supuesto esencial de equivalencia tau, la investigación muestra que en algunas circunstancias, como
cuando los errores de medición aleatorios están correlacionados entre elementos, α puede sobrestimar la
confiabilidad (ver McNeish,2018; Raykov,1997a,2001). Así que simplemente no es cierto que α sea necesariamente
un subestimador conservador de la confiabilidad.
Finalmente, muchos de los supuestos incorporados a los métodos estadísticos que utilizan los científicos sociales existen
porque simplificar los supuestos facilitó los cálculos en los días anteriores a que las computadoras dominaran los
laboratorios de investigación y las oficinas de los científicos. Dado que nunca se puede demostrar que las suposiciones sean
ciertas, utilizar un método que hace una suposición (como la equivalencia tau esencial) no tiene sentido cuando existe un
método que es al menos tan bueno pero que no requiere esa suposición. La solidez ante las violaciones de supuestos es una
buena propiedad de un método estadístico en un mundo sin alternativas mejores que sean igualmente fáciles de
implementar. Pero con respecto a la estimación de la confiabilidad, este es un mundo en el que no habitamos.

Concluimos con dos últimos puntos. Primero, aunque ω es preferible a α, ninguna de las dos es necesariamente
la mejor medida de confiabilidad que existe. Ambos son falibles y pueden producir estimaciones deficientes en una
variedad de situaciones que usted pueda enfrentar, como cuando las respuestas a muchos de los ítems están
sesgadas. Para una discusión de algunas alternativas, ver McNeish (2018), Raykov y Marcoulides (2019), Sijtsma
(2009), y Trizano-Hermosilla y Alvarado (2016). En segundo lugar, debatir demasiado vigorosamente los méritos de
diferentes medidas de confiabilidad es quizás similar a trabajar sobre la elección entre encimeras de granito y
mármol en la renovación de la cocina cuando la casa está en llamas. Los científicos del comportamiento, incluidos
los estudiosos de la comunicación, dedican mucho menos tiempo del que deberían a desarrollar buenos
instrumentos de medición y a justificar que los instrumentos que están utilizando son de hecho buenos. En las
ciencias del comportamiento abundan las prácticas de medición cuestionables, como la construcción de
instrumentos ad hoc sin validación, la eliminación o modificación de ítems de escalas validadas y el cambio del
número o anclaje de las opciones de respuesta de aquellas utilizadas cuando se desarrolló originalmente la escala
(Flake & Fried,2019; frito y en escamas,2018). Esto ciertamente contribuye a una literatura confusa y llena de
inconsistencias en los hallazgos, falsos negativos y positivos y otros fenómenos producidos por los grados de
libertad de los investigadores al analizar los datos. Una alta confiabilidad no es suficiente. De hecho, es sólo
marginalmente relevante si el instrumento que se utiliza realmente mide lo que el usuario pretende medir.

Ya es hora de hacer el cambio a ω. Puede que no sea el mejor de todos los reemplazos posibles, pero es
bastante fácil de calcular, se puede calcular de varias maneras, está (ahora) disponible en algunos paquetes
estadísticos populares y sus propiedades y rendimiento han llevado a muchos antes que nosotros a recomendar su
utilizar en lugar de α. Pero al hacer la transición, no olvidemos que una buena medición requiere mucho más que
establecer una confiabilidad aceptable.
22 AF HAYES Y JJ COUTTS

Notas
1.Cuando la respuesta escala para elklos indicadores son iguales, la media aritmética de loskLos indicadores también se
utilizan con frecuencia como proxy deT.El uso del promedio no cambia el argumento que presentamos aquí ni la
estimación de confiabilidad resultante, pero cambiará un poco las matemáticas que describimos.
2.Como Raykov y Marcoulides (2019) señalan que esta definición es problemática como definición general de confiabilidad. Es
posible que los datos sean altamente confiables en circunstancias en las que no hay variación enT,sin embargo, la
confiabilidad sería 0 (o indefinida, dependiendo de la varianza en O) según esta definición. Sostienen que esta definición de
confiabilidad debería estar condicionada aV(T) >0.
3.McDonald (1999) se refiere a la Ecuación 3 comoGuttman-Cronbach α.Aunque Cronbach popularizó la Ecuación 3, Guttman (
1945) inventó esta medida de confiabilidad antes de que se publicara el influyente artículo de Cronbach.
4.El método de extracción ML no permite el análisis factorial de una matriz de covarianza.
5.Se debe examinar el resultado de la rutina factorial generada por la macro omega para asegurarse de que el
análisis factorial convergiera y generara una solución. El resto de la salida no debe interpretarse si el
comando factor genera un error.
6.La opción de subconjuntos también está disponible en la macro OMEGA cuando se utiliza α de Cronbach como medida de confiabilidad.
Tenga en cuenta que no somos los primeros en sugerir maximizar la confiabilidad mediante la eliminación selectiva de elementos o en
proporcionar software que implemente un enfoque de todos los subconjuntos. Ver Morris (1978a,1978b) y Serlin y Kaiser (1976) para
algunos tratamientos anteriores de este tema que se centran en maximizar el α de Cronbach.
7.ElclasificarLa opción se puede utilizar para cambiar la clasificación de las filas de esta tabla por confiabilidad (el valor predeterminado, ordenar = 0) a ordenar porrmetro(

ordenar = 1) o el número de elementosmetro (ordenar = 2). Esta tabla también se puede guardar como un archivo de datos con el uso delahorraropción. Consulte la

documentación para obtener más detalles.

Declaración de divulgación

Los autores no informaron ningún posible conflicto de intereses.

Referencias

Becker, LB, Vlad, T. y Nusser, N. (2007). Una evaluación de los indicadores de libertad de prensa.El internacional
Gaceta de Comunicación, 69,5–28. doi:10.1177/1748048507072774
Cacioppo, JT, Petty, RE y Kao, CF (1984). La evaluación eficiente de la necesidad de cognición.Diario de personalidad
Evaluación, 48,306–307. doi:10.1207/s15327752jpa4803_13
Cheek, JM y Buss, AH (1981). Timidez y sociabilidad.Revista de Personalidad y Psicología Social, 41,330–339.
doi:10.1037/0022-3514.41.2.330
Cortina, JM (1993). ¿Qué es el coeficiente alfa? Un examen de teoría y aplicaciones.Revista de Aplicada
Psicología, 78,98–104. doi:10.1037/0021-9010.78.1.98
Cronbach, LJ (1951). Coeficiente alfa y la estructura interna de pruebas.Psicometrika, 16 años,297–334. doi:10.1007/
BF02310555
DeAndrea, DC y Carpenter, C. (2018). Medir el constructo de valor garantizado y probar la teoría de garantía.
Investigación en comunicación, 45 años,1193-1215. doi:10.1177/0093650216644022
Dunn, TJ, Baguley, T. y Brunsden, V. (2014). De alfa a omega: una solución práctica al omnipresente problema de
estimación de consistencia interna.Revista Británica de Psicología, 105,399–412. doi:10.1111/bjop.12046
Fenigstein, A., Scheier, MF y Buss, AH (1975). Autoconciencia pública y privada: valoración y teoría.
Revista de Consultoría y Psicología Clínica, 43,522-527. doi:10.1037/h0076760
Flake, JK y Fried, EI (2019, 17 de enero). Medición de medidas: prácticas de medición cuestionables y
cómo evitarlos. doi:10.31234/osf.io/hs7wm
Flake, JK, Pek, J. y Hehman, E. (2017). Validación de constructo en la investigación social y de personalidad: práctica actual y
recomendaciones.Psicología Social y Ciencias de la Personalidad, 8,370–378. doi:10.1177/1948550617693063 Frito, EI y
copos, JK (2018). La medición importa.Observador de APS, 31 (3). Obtenido dehttps://www.psycholo
gicalscience.org/observer/measurement-matters
Graham, JM (2006). Estimaciones congenéricas y (esencialmente) equivalentes a tau de la confiabilidad de la puntuación: qué son y cómo
para usarlos.Medición Educativa y Psicológica, 66,930–944. doi:10.1177/0013164406288165 Green, SB y Yang, Y. (
2009). Comentario sobre el coeficiente alfa: una advertencia.Psicometrika, 74 años,121–135.
doi:10.1007/s11336-008-9098-4
Guttman, L. (1945). Una base para analizar la confiabilidad test-retest.Psicometrika, 10,255–282. doi:10.1007/BF02288892 Hancock, GR
y An, J. (en prensa). Una alternativa de forma cerrada para estimar la confiabilidad omega bajo unidimensionalidad.
Medición: investigaciones y perspectivas interdisciplinarias.
MÉTODOS Y MEDIDAS DE COMUNICACIÓN 23

Hayes, AF, Glynn, CJ y Shanahan, J. (2005). Voluntad de autocensura: un constructo y una herramienta de medición para
investigación de opinión pública.Revista Internacional de Investigación de Opinión Pública, 17,298–323. doi:10.1093/ijpor/
edh073 Hayes, AF, Matthes, J. y Eveland, WP (2013). Estimular el órgano cuasi estadístico: el miedo al aislamiento social
motiva la búsqueda del conocimiento del clima de opinión.Investigación en comunicación, 40,439–462. doi:10.1177/
0093650211428608
Infante, DA y Rancer, AS (mil novecientos ochenta y dos). Una conceptualización y medida de la argumentatividad.Diario de personalidad
Evaluación, 46,72–80. doi:10.1207/s15327752jpa4601_13
John, OP y Srivastava, S. (1999). La taxonomía de los cinco grandes rasgos: historia, medición y perspectivas teóricas. En
LA Pervin y OP John (Eds.),Manual de personalidad: teoría e investigación (págs. 102-138). Nueva York, Nueva York: Guilford Press.

Kelley, K. (2007). Métodos para las ciencias sociales, educativas y del comportamiento: un paquete R.Investigación del comportamiento
Métodos, 39,979–984. doi:10.3758/BF03192993
Kopalle, PK y Lehman, DR (1997). ¿Inflación alfa?: El impacto de eliminar los ítems de la escala en el alfa de Cronbach.
Comportamiento organizacional y procesos de decisión humana, 70,189–197. doi:10.1006/obhd.1997.2702
Lance, CE, Butts, MM y Michels, LC (2006). Las fuentes de cuatro criterios de corte comúnmente informados: ¿Qué
realmente dicen?Métodos de investigación organizacional, 9,202–220. doi:10.1177/1094428105284919
Leary, señor (1983). Una versión breve de la escala de evaluación del miedo a la negativa.Boletín de Personalidad y Psicología Social,
9,371-375. doi:10.1177/0146167283093007
McDonald, RP (1999).Teoría de las pruebas: un tratamiento unificado.Mahwah, Nueva Jersey: Lawrence Erlbaum.
McNeish, D. (2018). Gracias coeficiente alfa, continuaremos desde aquí.Métodos psicológicos, 23,412–433. doi:10.1037/
met0000144
Morris, JD (1978a). Una comparación de tres algoritmos para el análisis de ítems para maximizar el coeficiente alfa.Educativo
y Medición Psicológica, 38,801–804. doi:10.1177/001316447803800321
Morris, JD (1978b). Maximizar la confiabilidad del coeficiente alfa manteniendo la validez.Métodos de investigación del comportamiento
e Instrumentación, 19,733–734. doi:10.3758/BF03205385 Nunally, JC (1978).
Teoría psicométrica.Nueva York, Nueva York: McGraw-Hill.
Nunnally, JC y Bernstein, IH (1994).Teoría psicométrica (3ª edición).Nueva York, Nueva York: McGraw-Hill. Padilla, MA y Divers, J. (2013).
Estimación del intervalo Bootstrap de la confiabilidad mediante el coeficiente omega.Revista de Modernidad
Métodos estadísticos aplicados, 12,78–89. doi:10.22237/jmasm/1367381520
Prochazka, F. y Schweiger, W. (2019). ¿Cómo medir la confianza generalizada en los medios de comunicación? Una adaptación y prueba de
escamas.Métodos y medidas de comunicación, 13,26–42. doi:10.1080/19312458.2018.1506021
Raykov, T. (1997a). Fiabilidad de la escala, coeficiente alfa de Cronbach y violaciones de la equivalencia tau esencial con valores fijos
componentes congenéricos.Investigación conductual multivariada, 32,329–353. doi:10.1207/s15327906mbr3204_2 Raykov, T. (
1997b). Estimación de la confiabilidad compuesta para medidas congenéricas.Medición Psicológica Aplicada,
21,173–184. doi:10.1177/01466216970212006
Raykov, T. (1998). Un método para obtener errores estándar e intervalos de confianza de confiabilidad compuesta para
elementos congenéricos.Medición Psicológica Aplicada, 22,369–374. doi:10.1177/014662169802200406 Raykov, T. (2001).
Sesgo del coeficiente α para medidas congenéricas fijas con errores correlacionados.Psicología Aplicada
Medida, 25,69–76. doi:10.1177/01466216010251005
Raykov, T. (2007). Confiabilidad si se elimina, no 'alfa si se elimina': Evaluación de la confiabilidad de la escala después del componente
supresión.Revista Británica de Psicología Matemática y Estadística, 60,201–216. doi:10.1348/000711006X115954
Raykov, T. y Marcoulides, GA (2019). Gracias coeficiente alfa, ¡todavía te necesitamos!Educativo y Psicológico
Medición, 79,200–210. doi:10.1177/0013164417725127
Ritchie, LD y Fitzpatrick, MA (1990). Patrones de comunicación familiar: medición de las percepciones intrapersonales de
Relaciones interpersonales.Investigación en Comunicación, 17,523–544. doi:10.1177/009365090017004007 Robinson, JP,
Shaver, PR y Wrightsman, LS (1991).Medidas de personalidad y actitudes psicológicas sociales.
San Diego, CA: Prensa académica.
Robinson, JP, Shaver, PR y Wrightsman, LS (1999).Medidas de actitudes políticas.San Diego, CA: Académico
Prensa.
Rosenberg, M. (1965).La sociedad y la autoimagen adolescente.Princeton, Nueva Jersey: Princeton University Press.
Rubin, RB, Palmgreen, P. y Sypher, HE (1994).Medidas de investigación en comunicación: un libro de consulta.Nueva York, NY:
La prensa de Guilford.
Schmitt, N. (1996). Usos y abusos del coeficiente alfa.Evaluación Psicológica, 8,350–353. doi:10.1037/1040-
3590.8.4.350
Serlin, RC y Kaiser, HF (1976). Un programa informático para la selección de ítems basado en maximizar la consistencia interna.
Medición Educativa y Psicológica, 36,757–759. doi:10.1177/001316447603600328
Sijtsma, K. (2009). Sobre el uso, el mal uso y la muy limitada utilidad del alfa de Cronbach.Psicometrika, 74 años,
107–112. doi:10.1007/S11336-008-9101-0
Stephenson, MT, Hoyle, RH, Palmgreen, P. y Slater, MD (2003). Medidas breves de búsqueda de sensaciones para
selección y encuestas a gran escala.Dependencia de drogas y alcohol, 72 años,279–286. doi:10.1016/j.drugalcdep.2003.08.003
24 AF HAYES Y JJ COUTTS

Streiner, DL (2003). Empezando por el principio: una introducción al coeficiente alfa y la consistencia interna.Diario
de Evaluación de la Personalidad, 80,99-103. doi:10.1207/S15327752JPA8001_18
Swann, WB y Rentfrow, PJ (2001). Descaro: consecuencias cognitivas, conductuales y fisiológicas de una rápida
respondiendo.Revista de Personalidad y Psicología Social, 81,1160-1175. doi:10.1037/0022-3514.81.6.1160 Trizano-Hermosilla, I., y
Alvarado, JM (2016). Las mejores alternativas a la confiabilidad alfa de Cronbach en condiciones realistas.
ciones: Medidas congenéricas y asimétricas.Fronteras en Psicología, 7,Artículo 769. doi:10.3389/
fpsyg.2016.00769
Vandello, JA y Cohen, D. (1999). Patrones de individualismo y colectivismo en los Estados Unidos.Diario de
Personalidad y Psicología Social, 77,279–292. doi:10.1037/0022-3514.77.2.279
Yang, Y. y Green, SB (2010). Una nota sobre las estimaciones de confiabilidad del modelado de ecuaciones estructurales.Ecuación estructural
Modelado, 17 años,66–81. doi:10.1080/10705510903438963
Yang, Y. y Green, SB (2011). Coeficiente alfa: ¿un coeficiente de fiabilidad para el siglo XXI?Diario de
Evaluación Psicoeducativa, 29,377–392. doi:10.1177/0734282911406668
Zhu, X. e Yzer, M. (2019). Prueba de una escala breve de inducción de autoafirmación para su uso en comunicación sanitaria
investigación y práctica.Métodos y medidas de comunicación, 13,178–197. doi:10.1080/19312458.2019.1572084

También podría gustarte