Está en la página 1de 12

Machine Translated by Google

El Liderazgo Trimestral 32 (2021) 101375

Listas de contenidos disponibles en ScienceDirect

El Liderazgo Trimestral
página de inicio de la revista: www.elsevier.com/locate/leaqua

Artículo de longitud completa

En busca de la causalidad en la investigación sobre formación de líderes: una


revisión y recomendaciones pragmáticas
Robin Martina , ÿ, David J. Hughes a b a
, Olga Epitropaki , geoff thomas
a
Universidad de Manchester, Reino Unido
b
Universidad de Durham, Reino Unido

información del artículo resumen


Historial del artículo: Aunque la investigación muestra una asociación confiable entre la capacitación en liderazgo y los resultados organizacionales positivos, una variedad de
Recibido el 29 de noviembre de 2018 problemas de diseño de la investigación significan que no sabemos en qué medida la primera causa la segunda.
Recibido en forma revisada el 10 de diciembre de 2019
En consecuencia, el documento tiene dos objetivos principales. Primero, describir las condiciones necesarias para determinar la causalidad en la
Aceptado el 11 de diciembre de 2019
investigación sobre capacitación en liderazgo y la capacidad de los diferentes diseños de investigación para lograrlo. Se describen seis cuestiones
Disponible en línea el 7 de enero de 2020
importantes, pero a menudo ignoradas, asociadas con la determinación de la causalidad (condiciones de control, representación de la muestra,
aleatorización de las condiciones, independencia de las condiciones, diseño temporal y participación del autor).
En segundo lugar, revisar hasta qué punto la literatura sobre capacitación en liderazgo es capaz de demostrar causalidad. La revisión muestra que la
mayoría de los estudios no cumplen muchos de los criterios, ni siquiera los más básicos, necesarios para establecer la causalidad. Finalmente, brindamos
pautas para diseñar investigaciones futuras para mejorar la identificación causal y es capaz de generar recomendaciones significativas de teoría y política.

© 2019 Elsevier Inc. Todos los derechos reservados.

"Los hombres superficiales creen en la suerte. Los hombres fuertes creen en la causa considerablemente en la medida en que son capaces de evidenciar efectos causales
y efecto" específicos (Podsakoff & Podsakoff, 2019).

(Ralph Waldo Emerson) Si bien la discusión de la causalidad es común a todas las áreas de investigación, el
contexto de capacitación en liderazgo presenta cuestiones específicas que requieren una
cuidadosa consideración. Sin duda, el 'estándar de oro' para determinar la causalidad es el
Introducción diseño experimental clásico (es decir, los participantes se asignan aleatoriamente a las
condiciones de tratamiento y control; Lonati, Quiroga, Zehnder y Antonakis, 2018). Dado un
Las iniciativas de capacitación en liderazgo son muy populares debido a la creencia de tamaño de muestra adecuado y siempre que la aleatorización se implemente correctamente
que la capacitación en liderazgo puede generar (o, más precisamente, causar) cambios (es decir, la asignación aleatoria de líderes para capacitación y control), los estudios
positivos en el comportamiento de los gerentes y, en última instancia, en su eficacia. experimentales generan dos (o más) condiciones que son probabilísticamente similares, lo
Dada la popularidad de la capacitación en liderazgo, es imperativo evaluar si, cuándo y que significa que las posibles variables de confusión se distribuyen uniformemente y, por lo
cómo dicha capacitación provoca cambios en los resultados para avanzar en la teoría e tanto, no pueden explicar para las diferencias en los resultados entre las condiciones. Por
desgracia, fuera de los entornos de laboratorio (p. ej., estudios de campo y cuasi
informar la política de capacitación en las organizaciones.
Como resultado, la investigación que examina la capacitación y el desarrollo del liderazgo experimentales), los investigadores rara vez tienen la oportunidad de asignar aleatoriamente
es común (Day, 2001; Day & Dragoni, 2015; Day, Fleenor, Atwater, Sturm & McKee, 2014; gerentes extraídos de muestras aleatorias o de controlar otras características ambientales
Feldman & Lankau, 2005; Riggio, 2008) y muchos estudios informan asociaciones positivas porque las organizaciones son sistemas sociales complejos con muchos procesos que
entre la capacitación en liderazgo y una variedad de resultados relacionados con el trabajo ocurren simultáneamente (Shaver, 2019).
(Aguinis y Kraiger, 2009; Avolio, Reichard, Hannah, Walumbwa y Chan, 2009; Lacerenza,
Reyes, Marlow, Joseph y Salas, 2017). Además, cuando son efectivas, las intervenciones Los gerentes se involucran en muchas actividades además de la capacitación en liderazgo
de desarrollo de liderazgo pueden generar un considerable retorno de la inversión (Avolio, y los resultados de interés (p. ej., satisfacción laboral y desempeño) tienen múltiples
Avey y Quisenberry, 2010). Sin embargo, debido a una variedad de limitaciones en el determinantes. Por lo tanto, es difícil aislar factores causales específicos e identificar la
diseño del estudio, los estudios de capacitación en liderazgo varían proporción de variación en los resultados que se debe o es causada específicamente por
la capacitación en liderazgo.

ÿ Autor para correspondencia en: Alliance Manchester Business School, Universidad de Manchester, Booth Street West, Manchester M15 6PB, Reino Unido.
Dirección de correo electrónico: robin.martin@manchester.ac.uk (R. Martín).

https://doi.org/10.1016/j.leaqua.2019.101375 1048-9843/© 2019


Elsevier Inc. Todos los derechos reservados.
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

En este punto, debemos reconocer que realizar estudios de capacitación en liderazgo en Weber y Kelloway, 1996; Rigio, 2008). Esta distinción tiene muchas implicaciones para el
un contexto aplicado es muy difícil debido a la dependencia de una organización cliente. Por contenido del proceso de capacitación y desarrollo y los resultados relacionados. En este
lo tanto, reconocemos que los investigadores de capacitación en liderazgo deben equilibrar la artículo, nos enfocamos en estudios que evalúan la capacitación en liderazgo, es decir, cuando
necesidad de un diseño de investigación riguroso con las restricciones contextuales, sobre las una organización expone deliberadamente a los gerentes a actividades de capacitación en
cuales generalmente tienen poco o ningún control. Por lo tanto, exigir que todos los estudios liderazgo con la expectativa de que esto debería mejorar la capacidad de liderazgo y, en
de capacitación en liderazgo alcancen los más altos estándares de diseño experimental consecuencia, tener un impacto en los resultados relevantes relacionados con el trabajo.
probablemente resulte contraproducente. De hecho, creemos que toda investigación bien
diseñada que tenga en cuenta la capacidad del diseño para determinar la causalidad y modere La capacitación en liderazgo varía considerablemente en términos del modo de entrega
las conclusiones en consecuencia, puede hacer contribuciones significativas al 'cuerpo (p. ej., aula, entrenamiento), proceso (p. ej., retroalimentación de múltiples fuentes, reflexión,
acumulativo de investigación' (Shaver, 2019). Sin embargo, como argumentó Stouffer (1950) juego de roles) y actividades (p. ej., tutoría, entrenamiento, asignaciones de trabajo, ver Día,
“… es esencial que siempre tengamos en cuenta el modelo de un experimento controlado, 2001, para una revisión). La combinación de una o más actividades de capacitación en
incluso si en la práctica tengamos que desviarnos de un modelo ideal” (p. 356). liderazgo puede formar una 'intervención' en el sentido de un estudio de investigación. Más
precisamente, definimos la capacitación en liderazgo como "... aquellos estudios en los que el
investigador manipuló abiertamente el liderazgo como una variable independiente a través de
Las revisiones anteriores tienden a centrarse principalmente en los resultados de la la capacitación, la asignación, el escenario u otros medios" (Avolio et al., 2009, p. 764). En
formación o en los modelos teóricos de liderazgo que subyacen al contenido de la formación. términos de diseño de investigación, la capacitación en liderazgo es la variable independiente
Por lo general, cuando se informan los hallazgos, las revisiones anteriores han tendido a y los resultados de la capacitación son la variable dependiente. Se puede obtener una variedad
agregar resultados de estudios con diseños de investigación variados (p. ej., Avolio et al., de diferentes tipos de resultados (p. ej., de líderes, seguidores, recursos humanos, clientes,
2009; Lacerenza et al., 2017) o a hacer distinciones generales entre diseños experimentales y etc.) ya sea antes (prueba previa) y/o después (prueba posterior) de la capacitación.
cuasiexperimentales (p. ej., Podsakoff & Podsakoff, 2019). Sin embargo, si se da el caso de
que los estudios de capacitación en liderazgo varían en términos de su capacidad para Varias revisiones metaanalíticas muestran una relación moderada entre la capacitación
establecer la causalidad, entonces dichos análisis agregados pueden ser problemáticos y en liderazgo y una variedad de resultados laborales importantes (Avolio et al., 2009; Burke &
producir estimaciones mal especificadas que no pueden identificar qué aspectos de la Day, 1986; Collins & Holton, 2004; Lacerenza et al., 2017; Powell & Yalcin, 2010; Russon y
capacitación tienen los efectos causales. Por el contrario, este artículo se centra, por primera Reinelt, 2004; Taylor, Russ-Eft y Taylor, 2009). Sin embargo, existe una variación considerable
vez, en el diseño de investigación fundamental y las características metodológicas necesarias en los hallazgos, como lo señalaron Collins y Holton (2004) “… la efectividad de los programas
para establecer los efectos causales de la formación en liderazgo. No importa el diseño del de desarrollo de liderazgo gerencial varió ampliamente; algunos programas fueron
contenido de la capacitación en liderazgo, si uno no puede establecer que la capacitación tremendamente efectivos y otros fracasaron miserablemente” (p. 232). Además, debido a sus
provocó cambios en los resultados, entonces el valor de los resultados disminuye diferentes preguntas de investigación, estos metanálisis emplean diferentes criterios de
considerablemente. Por lo tanto, establecer condiciones para determinar la causalidad está en inclusión y, por lo tanto, varían considerablemente en cuanto a la literatura que cubren.
el corazón de la literatura sobre desarrollo de liderazgo, porque, como dice Aristóteles, “no
conocemos una verdad sin conocer su causa”. En otras palabras, ¿cómo podemos estar
seguros de que un programa de capacitación en liderazgo generó resultados laborales También tienden a adoptar una conceptualización amplia del desarrollo del liderazgo, incluidos
positivos (o negativos) si no podemos evaluar los estudios (e informar los futuros) en términos los estudios que cubren las habilidades gerenciales generales (como la resolución de
de su capacidad para proporcionar evidencia causal? problemas, el diseño del trabajo, Collins y Holton, 2004) que pueden no estar relacionadas
con el liderazgo. El metaanálisis más reciente de Lacerenza et al. (2017) examinó 335 estudios
independientes, tres veces más que el siguiente metanálisis más alto. En general, la relación
Esta revisión hace tres contribuciones importantes a la literatura sobre capacitación en entre la capacitación en liderazgo y los resultados de los empleados fue alta en los cuatro
liderazgo. Primero, ampliamos la literatura discutiendo seis condiciones críticas necesarias criterios de Kirkpatrick (1959) para evaluar la capacitación (es decir, reacciones, aprendizaje,
para establecer efectos causales y evaluar hasta qué punto los diseños de investigación de transferencia y resultados; ÿ general = 0,76) y esto llevó a los autores a concluir que “ … el
capacitación en liderazgo comúnmente aplicados satisfacen estos criterios. En segundo lugar, entrenamiento de liderazgo es sustancialmente más efectivo de lo que se pensaba” (p. 1686).
por primera vez, guiados por estos criterios, realizamos una revisión del estado de la ciencia
de la literatura sobre capacitación en liderazgo y encontramos que la mayoría de los estudios
no cumplen con los estándares necesarios para establecer la causalidad. Con base en estos En resumen, existe considerable evidencia de investigación que sugiere que la capacitación
hallazgos, identificamos una serie de preocupaciones sobre el rigor metodológico de la en liderazgo puede conducir a resultados laborales positivos y esto ha sido ampliamente
literatura que han sido pasadas por alto en revisiones anteriores. Finalmente, con base en lo aceptado en la literatura (p. ej., Aguinis & Kraiger, 2009; Avolio et al., 2009; Collins & Holton,
anterior, brindamos las recomendaciones más completas hasta la fecha para guiar futuras 2004; Lacerenza et al., 2017).
investigaciones sobre capacitación en liderazgo en términos de establecer la causalidad. Sin embargo, argumentamos que en ausencia de un examen riguroso de los diseños de
investigación empleados en esta investigación y su capacidad para establecer inferencias
causales, esta conclusión puede ser prematura. A continuación, describimos cuestiones
relacionadas con la demostración de causalidad en la investigación sobre formación de líderes
Eficacia de las intervenciones de capacitación en liderazgo y la capacidad de varios diseños de investigación para abordar estas cuestiones.

La capacitación en liderazgo es un tipo de intervención, bajo el paraguas general de


actividades e intervenciones de desarrollo de liderazgo, diseñada para mejorar la capacidad Determinación de la causalidad en los estudios de formación de líderes
de liderazgo tanto individual como colectiva “…para participar de manera efectiva en roles y
procesos de liderazgo” (Day, 2001, p. 582). Day y Dragoni (2015) distinguieron entre “… El problema de la endogeneidad
desarrollo de líderes como la expansión de la capacidad de los individuos para ser efectivos
en roles y procesos de liderazgo” y “… desarrollo de liderazgo como el crecimiento de la La endogeneidad es una etiqueta econométrica técnica que se refiere a un conjunto de
capacidad de un colectivo para producir dirección, alineación y compromiso”. (Day & Dragoni, especificaciones erróneas del modelo bien conocidas, pero subestimadas y rara vez abordadas,
2015, p. 134). El desarrollo de líderes se centra en conceptos a nivel individual, como la que pueden sesgar las estimaciones de los parámetros (Antonakis, Bendahan, Jacquart y
autoconciencia, la autoeficacia y las KSA, mientras que el desarrollo de liderazgo adopta un Lalive, 2010; Hughes, Lee, Tian, Newman y Legood, 2018). Los sesgos de endogeneidad se
enfoque más integrado que se centra en la interacción dinámica entre líderes y seguidores, las dividen en tres amplias categorías.
relaciones diádicas y las construcciones conductuales de liderazgo, como el liderazgo Primero, los modelos a menudo omiten variables que brindan una explicación alternativa o
transformacional (p. , barling, adicional para la relación de interés. En segundo lugar, los modelos a menudo no tienen en
cuenta la simultaneidad, es decir, cuando la variable dependiente y una o más de las variables
explicativas se determinan conjuntamente. En

2
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

En tales casos, los resultados del análisis de regresión podrían confundir estas relaciones Primero, x debe preceder a y temporalmente (es decir, la capacitación en liderazgo debe
porque la dirección de la causalidad muy probablemente corre en ambas direcciones (p. ej., X ocurrir antes de las medidas posteriores a la prueba). Es probable que esta sea la más fácil de
ÿ Y ÿ X). En tercer lugar, las estimaciones pueden estar sesgadas debido a errores de medición, las tres condiciones. Por definición, las medidas posteriores a la prueba se obtienen después
como escalas que evalúan solo una parte de un constructo (Hughes, 2018) o sesgos de de que se ha producido la capacitación en liderazgo. Sin embargo, el período de tiempo
métodos comunes (Podsakoff y Podsakoff, 2019). necesario entre la capacitación en liderazgo y la medición posterior a la prueba es un tema
mucho más difícil de determinar. Es necesario considerar cuestiones relacionadas con la
En términos técnicos, la endogeneidad se refiere a una instancia en la que una medida de transferencia de capacitación (es decir, el proceso mediante el cual se manifiesta el nuevo
una variable predictora (en nuestro caso, capacitación en liderazgo) se correlaciona con el conocimiento en los resultados, Gilpin-Jackson & Bushe, 2007) y las suposiciones de diseño
término de error de la variable de resultado (ver Antonakis et al., 2010) o como Hughes et al. temporal (es decir, los períodos de tiempo entre la capacitación en liderazgo y las mediciones
(2018, p. 558) describen “… un predictor endógeno está relacionado con la variable de de resultados, Fischer , Dietz y Antonakis, 2017). Los períodos de tiempo elegidos deben
resultado medida de dos o más maneras, generalmente de la manera teorizada (p. ej., como reflejar el contenido teórico de la capacitación y corresponder al tiempo esperado para que (a)
una causa significativa), pero también de alguna manera no anticipada ( ej., sesgo de método la capacitación se manifieste en los cambios previstos en los comportamientos de los líderes,
común, efectos recíprocos, relación con una causa común)”. En la investigación sobre (b) los comportamientos de los líderes tengan un impacto confiable sobre comportamientos de
capacitación en liderazgo, las 'formas imprevistas' en las que el predictor podría explicar el los miembros del equipo y, (c) cambios en los comportamientos de los miembros del equipo
resultado son muchas (p. ej., confusión debido a la no aleatorización). para afectar los resultados relacionados con el trabajo (como el desempeño). Estas decisiones
deben basarse en el contenido teórico de la capacitación y los mecanismos por los cuales el
contenido de la capacitación afectará los resultados. Si se establecen períodos de tiempo
Los sesgos de endogeneidad pueden ser muy problemáticos para estimar la eficacia del inapropiados para la medición en relación con el entrenamiento, entonces pueden surgir
entrenamiento, porque es difícil establecer el grado en que la estimación representa la relación conclusiones inapropiadas (Gilpin-Jackson & Bushe, 2007).
teorizada (es decir, el efecto causal del entrenamiento) o la relación no anticipada (es decir, los
sesgos de endogeneidad).
Afortunadamente, existen varios métodos que se pueden utilizar para reducir o eliminar los En segundo lugar, x debe estar correlacionado de forma fiable con y (es decir, la formación
sesgos de endogeneidad, como el uso de variables instrumentales. en liderazgo predice de forma fiable las medidas posteriores a la prueba). El examen de las
Debido a que estos métodos se han tratado extensamente en otros lugares, no los repetiremos implicaciones estadísticas de la determinación de la causalidad está más allá de los objetivos
aquí. En cambio, remitimos a los lectores a Antonakis, Bendahan, Jacquart y Lalive (2014) de este artículo (para revisiones, véase Gangl, 2010; Heckman, 2005; Morgan & Winship,
para una introducción a estos métodos, a Antonakis et al. (2010) para una revisión más técnica, 2015). Sin embargo, vale la pena señalar un problema principal. Al probar la relación entre la
y a An, Meier, Ladenburg y Westergård-Nielsen (2019) para una aplicación con capacitación capacitación en liderazgo y los resultados, los investigadores generalmente usan técnicas
en liderazgo. estadísticas que examinan las asociaciones (p. ej., correlación, regresión, puntajes de
propensión). Sin embargo, existe una clara diferencia teórica y estadística entre asociación y
A pesar de las preocupaciones prominentes y legítimas con respecto a la endogeneidad, causalidad (Pearl, 2009).
algunos, sin embargo, piensan que los sesgos de endogeneidad nunca pueden eliminarse por
completo y, por lo tanto, debemos aprender a 'vivir con ellos'. Por ejemplo, Van Lent (2007) Las asociaciones muestran que dos factores comparten una distribución conjunta de las
argumenta que debido a que es probable que la teoría nunca sea lo suficientemente completa variables observadas. La asociación se basa en un juicio de probabilidad estadística (si obtiene
para producir modelos completamente especificados y las buenas medidas son raras, es poco A, tiende a obtener B o, en este caso, la capacitación en liderazgo se asocia con resultados
lo que se puede hacer para mitigar la endogeneidad. En cambio, Van Lent argumenta que los positivos). La asociación se basa en la distribución de datos y conduce a inferencias de
investigadores deben utilizar el mejor diseño posible, incluso si es imperfecto (p. ej., omitiendo probabilidad. La causalidad debe ir más allá y no solo determinar la probabilidad en una
un predictor conocido debido a limitaciones de tiempo). Al hacerlo, los investigadores deben situación estática sino también comprender el efecto del cambio como causa de eventos futuros.
defender explícitamente su elección de errores de especificación, discutir los resultados en
consecuencia y considerar cómo podrían haber cambiado los resultados si el investigador La asociación y la causalidad no son buenos 'compañeros de cama' como dice Pearl (2009)
hubiera elegido un modelo con diferentes errores de especificación (p. ej., incluir predictores allí "... no hay nada en una función de distribución que nos diga cómo diferiría esa distribución
adicionales pero usar medidas más cortas). si las condiciones externas cambiaran, digamos de una configuración observacional a
experimental, porque la las leyes de la teoría de la probabilidad no dictan cómo debe cambiar
Nuestra vista está en algún punto intermedio. La endogeneidad es una preocupación seria una propiedad de una distribución cuando se modifica otra propiedad” (p. 99).
y se deben hacer todos los esfuerzos para reducir la especificación errónea causada por
sesgos de endogeneidad. Siempre que sea apropiado, se deben usar diseños experimentales Con base en estos argumentos, muchos estudiosos señalan que no se puede lograr una
aleatorios. Sin embargo, muchas oportunidades para estudiar la capacitación en liderazgo en prueba adecuada de la causalidad mediante el cálculo de probabilidades, sino que se necesitan
el campo no permitirán el uso de experimentos aleatorios porque dichos diseños plantean nuevos enfoques matemáticos. Uno de estos enfoques podría ser el uso de estadísticas
dificultades, como el reclutamiento de participantes, la aleatorización adecuada y preocupaciones bayesianas (Kruschke, 2013). Las estadísticas bayesianas se alejan de la estimación del
éticas que pueden ser difíciles, a veces imposibles, de superar. tamaño de un efecto (a veces denominada "interpretación frecuentista") para probar la
existencia de un efecto.
Cuando el compromiso en el diseño del estudio es inevitable, no creemos que los investigadores Uno de los muchos problemas con la estimación de los efectos es que existe la suposición a
deban abandonar de inmediato las pruebas empíricas, porque incluso si la endogeneidad está priori de que, de hecho, hay un efecto que estimar y que esto puede representarse en una
presente, los estudios pueden servir como exploraciones útiles que pueden informar distribución probabilística. La prueba de un efecto debería ser la condición previa antes de
investigaciones futuras. estimar los parámetros (Jeffreys, 1961). Las estadísticas bayesianas proporcionan una forma
matemática de combinar creencias y evidencias anteriores para producir creencias posteriores.
Las condiciones mínimas necesarias para inferir causalidad en la investigación sobre formación
de líderes La prueba de hipótesis bayesiana se lleva a cabo comparando la adecuación predictiva de dos
modelos estadísticos que compiten entre sí, a saber, las distribuciones anterior (distribución de
A continuación, nos basamos en la gran cantidad de literatura sobre inferencia causal (p. probabilidad esperada en base a creencias o teorías previas) y posterior (distribución de
ej., Antonakis et al., 2010, 2014; Morgan & Winship, 2015) para describir brevemente las tres probabilidad que representa creencias actualizadas sobre el parámetro posterior a la
condiciones principales necesarias para inferir cierto grado de causalidad en relación con la recopilación de datos) (para el beneficios de las estadísticas bayesianas, véase Wagenmakers
investigación sobre capacitación en liderazgo. En otras palabras, estas son las condiciones et al., 2018, Wagenmakers et al., 2018).
mínimas necesarias para inferir que es la capacitación en liderazgo la que conduce o provoca
cambios en los resultados (ver Antonakis et al., 2010 para una discusión de estos en relación Tercero, la relación entre x e y no debe explicarse por otras causas (es decir, las medidas
con la investigación sobre liderazgo). posteriores a la prueba se deben a la capacitación en liderazgo y no a otros factores). Este es
el paso más difícil de determinar. A

3
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

Para responder a esto, sería útil refrescarnos en el significado de la causalidad. Heckman diseños, y grupos independientes con diseños de medidas repetidas.
(2005, p. 1) lo describe muy bien como "Manteniendo todos los factores excepto uno en Hay muchos más diseños de investigación que podríamos considerar (como diseños de
un nivel constante, el cambio en el resultado asociado con la manipulación del factor discontinuidad de regresión, Shadish & Cook, 2009; y alternativas a los estudios de
variado se denomina efecto causal del factor manipulado". La única forma de mantener control aleatorio, West, 2009), pero nos enfocamos en estos ocho porque han sido los
constante todo lo demás excepto la variable manipulada es tener una condición idéntica empleados con mayor frecuencia en liderazgo. investigación formativa. A los efectos de
que no contenga la variable manipulada. Esto se conoce como la condición de control/ la nomenclatura, representamos estos diseños utilizando los siguientes símbolos:
contrafactual y en el entrenamiento de liderazgo estaría representado por una condición
de no entrenamiento.
• 'O' se refiere a los resultados que se espera que se vean afectados por la capacitación
Un marco matemático formal para comprender las inferencias causales es el modelo y pueden obtenerse antes (pre-test) y/o después (post-test) del entrenamiento. Las
causal de Rubin (RCM, Imbens & Rubin, 2017; Rubin, 1974, 1975). En esencia, medidas de resultados se pueden obtener a través de varios métodos (p. ej., datos de
argumentan, “no hay causalidad sin manipulación” (Rubin, 1975, p. 238) de la variable encuestas, observaciones, puntajes de desempeño) y fuentes (p. ej., líderes, miembros
independiente (es decir, obtener resultados para condiciones con y sin entrenamiento). del equipo, clientes).
• 'X' se refiere al entrenamiento de liderazgo que se predice que afectará a O. •
Al hacer esto, se pueden abordar dos preguntas causales críticas (a) si aquellos que 'C' se refiere a la condición contrafáctica o de control, en la que los participantes no
recibieron el tratamiento, de hecho, no lo recibieron, ¿qué se observaría en y? y, (b) si reciben entrenamiento (control clásico) o reciben entrenamiento sin liderazgo (control
aquellos que no han recibido el tratamiento, de hecho, lo reciben, ¿qué se observaría en activo).
y?. La segunda parte del RCM especifica que estas preguntas casuales solo pueden • '–' se utiliza para representar el paso del tiempo, que puede variar entre y dentro de las
responderse cuando se logra la equivalencia condicional. Es decir, cuando la asignación condiciones.
a las condiciones es aleatoria, se puede suponer que todas las posibles variables de
confusión se distribuyen por igual entre las condiciones (es decir, entrenamiento y
La Tabla 2 proporciona un análisis resumido de la capacidad de cada uno de los
control) y no pueden explicar las diferencias en los resultados. Si se logra la equivalencia
ocho diseños comúnmente empleados para estimar y controlar las amenazas a la
condicional, se sigue lógicamente que los resultados posteriores a la prueba (es decir,
validez del estudio descritas en la Tabla 1 (los símbolos indican lo siguiente: menos es
y) en la condición de control reflejarían lo que los individuos en la condición de
una debilidad, más está controlado, pregunta márquelo podría ser una preocupación y
entrenamiento habrían logrado si no hubieran sido capacitados (a) y los resultados
en blanco no es relevante). A continuación, describimos cada diseño con más detalle en
posteriores a la prueba en la condición de control. la condición de entrenamiento
orden ascendente, comenzando con los diseños más débiles.
reflejaría lo que aquellos en la condición de control habrían archivado si hubieran sido
entrenados (b).

Diseño de solo intervención


Evaluación de diseños de investigación de capacitación en liderazgo Estos diseños se caracterizan por examinar a los participantes que solo reciben
capacitación en liderazgo y no incluyen una condición de control (es decir, aquellos que
En esta sección, examinamos qué tan robustos son los diseños de estudio no reciben capacitación). Se pueden identificar tres diseños en esta categoría. El
empleados con más frecuencia en la investigación de capacitación de liderazgo frente a primero, un diseño de estudio de caso de una sola vez, es el más básico y solo incluye
una serie de sesgos de endogeneidad y especificaciones erróneas del modelo que la evaluación de los resultados una vez después de la capacitación en liderazgo (X – O;
pueden sesgar las estimaciones de los parámetros y hacer que los estudios no sean p. ej., Gilpin-Jackson & Bushe, 2007). Los estudios de caso de una sola oportunidad
informativos. En términos de estas amenazas a la validez del estudio, nos basamos en están más abiertos a las amenazas de validez porque la falta de puntajes previos al
el análisis clásico de Campbell y Stanley (1963). Para obtener una breve descripción de entrenamiento hace que el diseño sea muy vulnerable a la historia (p. ej., los resultados
cómo cada una de las amenazas se relaciona con la capacitación en liderazgo, consulte pueden haber aumentado con el tiempo independientemente del entrenamiento), la
la Tabla 1 (consulte también Martin et al., 2018; Podsakoff & Podsakoff, 2019). No maduración (p. las competencias de los miembros mejoran con el tiempo a medida que
describimos estas amenazas con más detalle, pero consideramos qué tan robusto es aumenta la experiencia), la selección (p. ej., se eligen 'mejores' gerentes para recibir la
cada diseño de investigación para ellas. capacitación) y la mortalidad (p. ej., peores líderes o miembros del equipo que dejan la
Examinamos ocho diseños de investigación específicos de tres categorías amplias, empresa durante el período de estudio). Por lo tanto, los diseños de estudio de caso de
a saber, diseños de solo intervención, grupos independientes una sola oportunidad producen resultados muy débiles.

Tabla 1
Amenazas internas a la validez en la investigación del desarrollo del liderazgo (adaptado de Martin, Epitropaki y O'Broin, 2018).

amenazas internas

Amenaza Descripción Ejemplo de aplicación a la formación de líderes

Historia Los eventos, distintos de las condiciones experimentales, Los cambios en el entorno, además de la capacitación, afectan los cambios entre la prueba previa y la posterior
influyen en los resultados. (como cambios en el producto, los procesos, las condiciones del mercado y las condiciones de trabajo).
Maduración Durante el estudio, los cambios que no se deben a los tratamientos Mejoras en el desarrollo dentro de los líderes y/o miembros del equipo a lo largo del tiempo que son independientes de
dentro de los participantes afectan los resultados. la capacitación.
Pruebas La exposición a una prueba previa o una evaluación intermedia Las medidas previas a la prueba (p. ej., las habilidades relacionales del líder) resaltan los factores que los seguidores
influye en el desempeño en una prueba posterior. no habían considerado hasta ahora, lo que los hace más sensibles a estos factores en la prueba posterior (p. ej., si el
gerente muestra mejores habilidades relacionales).
Instrumentación Los instrumentos de prueba no son consistentes; o el pre-test y el post- Se emplean diferentes tipos de medidas, técnicas de medición u orden de evaluación antes y después de la prueba
test no son equivalentes. para capturar constructos similares.
Regresión estadística Los puntajes de los participantes son inicialmente altos o bajos y retroceden Si los líderes inicialmente tienen puntajes muy altos en las capacidades de liderazgo en la capacitación, luego hacia la media
durante la nueva prueba. estos puntajes no pueden mejorar y pueden disminuir dando estimaciones falsas de cambio.
Selección Existen diferencias sistemáticas en los participantes Si la asignación de líderes entre las condiciones de entrenamiento y no entrenamiento no es aleatoria,
entonces las características entre los grupos de tratamiento. las diferencias preexistentes entre las condiciones podrían explicar la diferencia en los resultados posteriores a la prueba.
Mortalidad La deserción de los participantes durante el estudio puede sesgar los resultados. Algunos líderes (por ejemplo, los de bajo desempeño) dejan la organización durante el período de evaluación
experimental tal que las poblaciones de muestra difieren entre condiciones y a lo largo del tiempo.
Selección-maduración La selección de grupos de comparación y la maduración interactúan Los miembros del equipo en una condición de líder sin entrenamiento maduran (es decir, cambian naturalmente
Interacción de manera que algunos grupos cambian de manera diferente a otros. con el tiempo) a un ritmo diferente que aquellos en la condición de líder en entrenamiento.

4
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

Tabla 2
La capacidad de los diferentes diseños de investigación para hacer frente a las amenazas a la validez interna.

Diseño de la investigación Diseño Historial Maduración Prueba Instrumentación Regresión Selección Mortalidad Selección x Maduración
Solo intervención
Un trago X-O -- - -

Medidas repetidas O-X-O -- -- ? + + -


Series de tiempo O – O – X – O – O- + + + ? + + +
Grupos Independientes
Asignación aleatoria/emparejada X-O ++ ++ + + + +
(Experimentos de laboratorio/campo) C-O
Asignación no aleatoria X-O +? ++ + - - -

(Cuasi-experimentos) C-O

Grupos independientes con medidas repetidas


Asignación aleatoria/emparejada O-X-O ++ ++ + + + +
(Experimentos de laboratorio/campo) O-C-O
Asignación no aleatoria O-X-O ++ ++ + - + -

(Cuasi-experimentos) O-C-O
Diseño de Salomón O-X-O ++ ++ + + + +
O-C-O
X-O
C-O

evidencia de que los cambios en los resultados fueron causados por el entrenamiento y independiente de la formación de líderes. Múltiples períodos de medición
por lo tanto, no debe usarse para informar recomendaciones de políticas. antes y después del entrenamiento, combinado con los cambios de resultados previstos
Un desarrollo del estudio de caso único sería incluir medidas previas a la prueba; esto se después de la capacitación, podría mitigar, pero no eliminar por completo, esta
conoce como diseño de medidas repetidas (O – X – inquietud.

O; por ejemplo , Arthur & Hardy, 2014; Biggs, Brough y Barbour, 2014). Repetido
los diseños de medidas pueden hacer frente a algunas de las amenazas en el caso de una sola vez Diseños de grupos independientes
diseño del estudio, como los efectos de la mortalidad (por ejemplo, gerentes que dejan el La discusión anterior sobre el establecimiento de la causalidad muestra la necesidad de
organización o cambiar de trabajo y, por lo tanto, salir del estudio). Mortalidad diseños de investigación para incluir una condición de control para establecer qué
efectos se pueden estimar examinando las puntuaciones previas a la prueba para aquellos que sucedería si los participantes no hubieran recibido la capacitación en liderazgo.
permanecen frente a los que dejan la empresa durante o después de la formación. Varios diseños de investigación hacen esto al tener al menos dos condiciones:
Si no hay diferencias, se podría suponer que la mortalidad no es un entrenamiento de liderazgo y entrenamiento de no liderazgo (control). Discutimos
tema. Además, la prueba previa permite calcular las puntuaciones de ganancia (es decir, la prueba posterior). la naturaleza de la condición de control en una sección posterior. para cosechar
menos pre-test) que pueden cuantificar el impacto de la intervención. los beneficios de los diseños de grupos independientes, los participantes deben ser
Sin embargo, aunque los diseños de medidas repetidas abordan algunas amenazas, asignado a las dos condiciones de forma aleatoria o emparejada
introducen otros, como las pruebas, que es un problema particular en (es decir, no aleatorio pero intenta hacer que los grupos sean equivalentes en términos de
entrenamiento de liderazgo porque la prueba previa podría alertar involuntariamente variables de confusión potencialmente clave). Si la asignación es aleatoria,
participantes a aspectos del comportamiento del líder, que no habían entonces el diseño de investigación a menudo se denomina experimento de laboratorio
previamente considerado, y esto afecta sus puntajes posteriores a la prueba posterior (si los investigadores también tienen control total sobre los participantes)
(independiente de la formación). ambiente) o como un experimento de campo o estudio de control aleatorio (si
El diseño de medidas repetidas normalmente tiene un conjunto de pruebas previas y no hay control sobre el ambiente, como es típico en organizaciones
medidas posteriores a la prueba. Sin embargo, es posible tener múltiples pruebas previas estudios).
y evaluaciones posteriores a la prueba de los resultados y esto se conoce como El diseño de grupos independientes más básico evalúa los resultados únicamente
diseño de series de tiempo (O – O – X – O – O; por ejemplo, DeRue, Nahrgang, durante el post-test (X – O, C – O). Cuando los participantes son aleatorios
Hollenbeck y Workman, 2012). Como se discutió anteriormente, elegir el tiempo asignado (p. ej., Moses & Richie, 1976), entonces el independiente básico
períodos entre evaluaciones que están diseñados de manera óptima para capturar El diseño de los grupos es muy poderoso y puede atenuar las ocho amenazas principales.
los efectos objetivo es crucial, y es probable que los resultados sean a la validez (ver Tabla 1). Sin embargo, cuando la asignación de participantes no es aleatoria (p.
influido a diferentes ritmos (ver discusión anterior sobre el establecimiento de la ej., Ladegard & Gjerde, 2014), el diseño es susceptible a una
primeros criterios de causalidad). número de amenazas, tales como selección, mortalidad y selección por
Hay muchas variantes de diseños de series de tiempo (en términos de interacción de maduración. Una desventaja de la independiente básica
frecuencia de las medidas previas y posteriores a la prueba), pero el objetivo es mostrar El diseño de grupos, independientemente del procedimiento de asignación de participantes, es
que los resultados cambian directamente como resultado de la capacitación de una manera que la falta de evaluaciones de resultados previas a la prueba impide el cálculo
que es diferente a otros períodos de tiempo. El patrón 'ideal' sería de la naturaleza o magnitud absoluta de los cambios debidos al entrenamiento.
mostrar (a) un nivel consistente en los resultados en todos los períodos de tiempo previos a la prueba, Por ejemplo, es posible que ambos grupos empeoren sus resultados
(b) una mejora (esto podría ser un aumento o disminución dependiendo post-entrenamiento pero que la reducción es menor en la condición de entrenamiento.
sobre el resultado) inmediatamente después o poco después del entrenamiento, que La inclusión de medidas previas a la prueba permite abordar este problema.
(c) se mantiene constante o aumenta/disminuye según lo previsto más adelante y determinar la magnitud absoluta del cambio, lo cual es importante
períodos de tiempo posteriores a la prueba. Aunque este es el patrón ideal, es raro en a la hora de calcular el retorno de la inversión de la formación.
práctica. Sin embargo, muchos otros patrones también pueden indicar beneficios
de formación de líderes. Por ejemplo, los resultados podrían estar mejorando en Grupos independientes con diseños de medidas repetidas
períodos previos a la prueba, pero muestran mayores aumentos después del entrenamiento de liderazgo Cuando los grupos independientes también tienen evaluaciones previas a la prueba,
que se mantiene en los períodos posteriores a la prueba. se conocen como grupos independientes con diseños de medidas repetidas
En general, los diseños de series de tiempo pueden hacer frente a muchas amenazas a la validez (O-X-O, O-C-O). Cuando los participantes son asignados aleatoriamente
excepto en relación con la historia. Podría ser que los cambios en los resultados reflejen (p. ej., Cherniss, Grimm y Liautaud, 2010; Yeow y Martin, 2013), el
algunos cambios subyacentes en la organización o contexto que es grupos independientes con diseño de medidas repetidas está bien situado para

5
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

Estimar y atenuar las ocho amenazas a la validez interna y, por lo tanto, a menudo se efectos (Cooper & Richardson, 1986; Eden, 1992). Además, una intervención de
considera que es el mejor diseño para examinar la capacitación en liderazgo. capacitación en liderazgo tiene dos componentes potencialmente activos que pueden
Hay una ventaja adicional del uso de medidas previas a la prueba sobre diseños anteriores. afectar los resultados: el contenido de la capacitación (el foco de la investigación) y el
La equivalencia de condiciones que se supone en el diseño de grupos independientes, proceso de capacitación. El contenido de la capacitación se refiere al conocimiento y las
cuando hay aleatorización de condiciones y un tamaño de muestra suficiente, puede habilidades que se desarrollan dentro del líder a través de las actividades de desarrollo. El
probarse y confirmarse si las puntuaciones previas a la prueba son similares en todas las proceso de formación se refiere a todo lo que implica la intervención además del contenido
condiciones. (p. ej., selección a un curso, interacción con otros compañeros, interacción con los
Sin embargo, quedan dos preocupaciones notables en función de la ejecución de los formadores, el lugar físico, descanso del lugar de trabajo). Los participantes en la condición
grupos independientes con diseño de medidas repetidas. de no entrenamiento no reciben ni el contenido del entrenamiento ni el proceso de
Primero, la asignación no aleatoria de participantes (p. ej., Elo, Ervasti, Kuosma y Mattila- entrenamiento y, por lo tanto, es imposible identificar qué causa el cambio en las
Holappa, 2014) hace que estos diseños sean vulnerables a algunas de las amenazas a la evaluaciones de resultados posteriores a la prueba. Por lo tanto, los investigadores
validez (p. ej., selección y selección por interacción de maduración), especialmente si los idealmente deberían comparar el entrenamiento de liderazgo con una condición de
participantes en la capacitación y las condiciones de control no son equivalentes en entrenamiento que no sea de liderazgo (o una condición alternativa de entrenamiento de
términos de importantes variables de confusión (p. ej., antigüedad, desempeño). Las liderazgo) que significaría que la condición de control se equipara en términos de efectos
técnicas de emparejamiento, como el análisis de puntaje de propensión, donde se pueden de placebo, expectativa y proceso de entrenamiento (p. ej., Chambless & Hollon, 1998 ).
identificar participantes equivalentes en cada condición según criterios clave, pueden Por lo tanto, recomendamos el uso de diseños experimentales aleatorios que incluyan una
restablecer la equivalencia condicional. En segundo lugar, los efectos de la prueba pueden condición de control de entrenamiento sin liderazgo (o liderazgo alternativo) (p. ej., Boies,
ocurrir cuando las medidas previas a la prueba evaluadas para aquellos en la condición de Fiset y Gill, 2015).
entrenamiento difieren de las de la condición de control. En tales casos, la prueba previa
podría alertar de manera diferencial a los encuestados sobre las variables causales clave La naturaleza de la condición de control también podría influir en la motivación de los
que distorsionan las puntuaciones posteriores a la prueba. La recomendación simple aquí participantes para completar las evaluaciones previas y posteriores a la prueba. Para los
es garantizar evaluaciones idénticas previas y posteriores a la prueba para los grupos de gerentes y los miembros de su equipo, en la condición de capacitación en liderazgo,
entrenamiento y control. proporcionar datos de resultados parecería una parte natural del proceso de desarrollo. De
El último diseño, el Diseño de Cuatro Grupos de Solomon (Solomon, 1949), amplía el hecho, dichos datos podrían usarse en la capacitación para informar a los participantes
diseño de grupos independientes con medidas repetidas al incluir dos condiciones sobre sus comportamientos de liderazgo (p. ej., retroalimentación de 360 grados). La
adicionales (entrenamiento + post-test y control + post-test; O – X – O, O – C – O, – X – O, motivación para participar en la recopilación de datos probablemente se reduciría para
– C – O) (p. ej., Birkenbach, Kamfer y Ter Morshuizen, 1985; Holdnak, Clemons y Bushardt, aquellos en la condición de control, porque la utilidad de la recopilación de datos no estaría
1990). Al igual que con el diseño anterior, es importante que los líderes se asignen clara, lo que aumentaría el riesgo de tasas de respuesta más bajas o datos incompletos.
aleatoriamente a cada una de las cuatro condiciones y que los períodos de medición Para superar este problema, se podría capacitar a todos los gerentes con un desfase
coincidan. Al igual que los grupos independientes con diseño de medidas repetidas, el temporal, lo que significa que la condición de control consiste en gerentes que no han sido
diseño de Solomon puede hacer frente a todas las amenazas a la validez interna. Sin capacitados pero saben que lo serán en el futuro (es decir, un control de "lista de espera",
embargo, el diseño de Solomon tiene una ventaja adicional en el sentido de que puede por ejemplo , Cuello y Manz, 1996). Los participantes en una condición de control de la
lidiar con una amenaza a la validez externa (es decir, la generalización de los hallazgos), lista de espera probablemente tendrían una motivación similar a los de la condición de
a saber, la interacción de prueba por condición. La interacción prueba por condición ocurre capacitación en liderazgo para participar en la recopilación de datos.
cuando las medidas previas a la prueba afectan la sensibilidad al contexto de liderazgo
que afecta las medidas posteriores a la prueba (pruebas) y esto ocurre tanto en el grupo
de entrenamiento como en el de no entrenamiento (condiciones), aunque en un grado Representación de muestra
diferente. Si esto ocurre, los resultados de un grupo previamente evaluado no serían
representativos de un grupo no previamente evaluado del que se extrajeron los La representación de la muestra (es decir, la muestra es representativa de la población
participantes, lo que dificulta la generalización de los resultados (lo cual es importante de la que se extrae) es una preocupación importante, pero relativamente ignorada. Un
desde una perspectiva práctica). Si las diferencias en los resultados posteriores a la prueba problema pragmático en la obtención de la representación de la muestra es que el
entre el entrenamiento de liderazgo y las condiciones de control son equivalentes, investigador generalmente tiene poco o ningún control con respecto a quién es seleccionado
independientemente de completar la prueba previa, entonces se puede concluir que el para la capacitación. Para las organizaciones, los costos de capacitación son considerables
efecto es robusto al sesgo de prueba por condición. (tanto financieros como de tiempo), lo que puede afectar el proceso de selección.
A veces, se seleccionan gerentes que están disponibles, cuya ausencia es menos
disruptiva para el desempeño o que se consideran 'talentos emergentes'. Tales estrategias
Aunque el diseño de los cuatro grupos de Solomon es el diseño de investigación más de selección aumentan la probabilidad de diferencias de grupo que pueden actuar como
sólido para examinar la capacitación en liderazgo, muy pocos estudios lo han empleado variables de confusión (el sesgo de selección). Esto afecta tanto la prueba de hipótesis (p.
(Birkenbach et al., 1985). ej., al conducir a la restricción del rango) como hace que los resultados del estudio no sean
generalizables a una población más amplia (es decir, otros gerentes de la organización).
Enfoque conceptual de la revisión Colectivamente, los efectos de los sesgos de selección pueden producir resultados
engañosos y recomendaciones de políticas inapropiadas. Para evitar sesgos de selección,
Esta sección se basa en la sección anterior sobre las condiciones necesarias para los estudios deben incluir a todos los gerentes relevantes (p. ej., gerentes dentro de un
establecer la causalidad e identifica seis consideraciones críticas en el entrenamiento de grado o puesto determinado), usar una muestra representativa o extraer una muestra
liderazgo que usamos para evaluar la literatura. A continuación, describimos cada una de aleatoria de gerentes relevantes. Si la aleatorización se realiza correctamente, con un
las seis consideraciones críticas. tamaño de muestra suficiente, es probable que las posibles variables de confusión se
distribuyan aleatoriamente entre la población y las muestras del estudio, lo que significa
condición de control que los resultados pueden generalizarse a la población.

Las condiciones de control son necesarias para establecer una identificación casual Las afirmaciones de representatividad de la muestra dependen de si los seleccionados
(Rubin, 1975). Lo más común es que los participantes en la condición de control no reciban realmente realizan la capacitación. Si la participación es voluntaria, puede haber muchos
capacitación. Las condiciones de control sin entrenamiento proporcionan una comparación factores contextuales (p. ej., demandas laborales, cobertura gerencial por ausencia,
injusta porque la condición de entrenamiento puede exhibir efectos significativos debido al enfermedad, preferencia personal) que podrían afectar la asistencia a la capacitación.
placebo, la expectativa (es decir, los participantes afectan inconscientemente el resultado Todos estos factores podrían dar lugar a muestras sesgadas y poco representativas. Los
esperado) o Pygmalion (es decir, los procedimientos de entrenamiento aumentan la documentos tienden a ser vagos cuando informan sobre la representatividad de la muestra
autoeficacia y, por lo tanto, los resultados, independientemente). de la formación) y, en particular, sobre las razones por las que no se capacita.

6
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

asistencia. Una forma potencial de evitar esto es hacer que la asistencia a la capacitación los medidores de capacitación a menudo obtienen poco después de completar la
sea involuntaria. La cuestión de la voluntariedad de la formación se exploró en el estudio capacitación, tal vez debido a la presión de los financiadores para mostrar efectos
de Lacerenza et al. (2017) metanálisis de las evaluaciones de entrenamiento de Kirkpatrick positivos tan pronto como sea práctico. Otro factor que podría fomentar esta situación es
(1959) . Encontraron efectos mixtos. Mientras que la participación voluntaria tuvo un la preocupación de los investigadores por recopilar datos antes de cambios en el contexto
efecto mayor que la capacitación involuntaria sobre la 'transferencia' (es decir, el uso de organizacional (como nuevas prácticas laborales, cambios en la gestión) que podrían
las destrezas y habilidades capacitadas en el lugar de trabajo), tuvo un efecto negativo interferir con los beneficios potenciales de la capacitación o inhibir la recopilación de
para los 'resultados' (es decir, la mejora de los objetivos de desempeño de la organización), datos en el futuro.
y ningún efecto sobre ' aprendizaje' (es decir, cambios en el conocimiento y las habilidades). Las decisiones relacionadas con el momento de las mediciones podrían guiarse por
Aunque el 'jurado está fuera' sobre el impacto de la capacitación voluntaria en los la distinción de Day y Sin (2011) de la visibilidad del proceso de desarrollo del liderazgo
resultados de la capacitación, es un factor no investigado que podría sesgar gravemente en los niveles superficial, meso y básico.
a la población de capacitación. Se podría argumentar que la aleatorización de condiciones La capacitación en liderazgo que tiene como objetivo influir en los comportamientos en
debería negar tal problema, pero no es así. Los problemas de voluntariedad afectan a la estos diferentes niveles necesitará evaluaciones en diferentes períodos de tiempo para
condición formativa pero no a la no formativa y podrían conducir a la no equivalencia capturar cambios en los resultados del trabajo. En el nivel superficial (visible), la
condicional. intervención podría enfocarse en comportamientos de líderes específicos que se adapten
fácilmente, lo que significa que las evaluaciones posteriores a la capacitación podrían
Aleatorización de condiciones realizarse relativamente poco tiempo después de la finalización (como la capacitación de
líderes carismáticos, p. ej., Antonakis, Fenley y Liechti, 2011). , capacitación en liderazgo
Los diseños de investigación más robustos emplean la asignación aleatoria de líderes transformacional, por ejemplo, Barling et al., 1996; capacitación LMX, por ejemplo, Graen,
en condiciones de entrenamiento y control porque la aleatorización aumenta en gran Novak y Sommerkamp, 1982). En el nivel meso (menos visible), el cambio pronosticado
medida la probabilidad de que los líderes en cada condición sean equivalentes o, al podría centrarse en los procesos de identidad y autorregulación y, por lo tanto, se necesita
menos, que no haya diferencias sistemáticas de líderes que puedan explicar las diferencias más tiempo para que la capacitación impacte en los resultados, lo que significa que la
en los resultados. La aleatorización es efectiva cuando se obtienen tamaños de muestra evaluación posterior a la capacitación debe realizarse algún tiempo después (p. ej.,
suficientemente grandes. Desafortunadamente, la idoneidad de los tamaños de muestra evaluación del líder). identidad, Miscenko, Guenter, & Day, 2017). Finalmente, en el nivel
tiende a asumirse en lugar de examinarse explícitamente, a pesar de la disponibilidad de básico (invisible), los cambios pronosticados podrían apuntar a una remodelación
métodos para calcular los tamaños de muestra apropiados (p. ej., Rutterford, Copas y importante del concepto de sí mismo y/o del repertorio de comportamiento del líder, los
Eldridge, 2015). cuales requieren un tiempo considerable para volverse detectables, lo que significa que
El problema de lograr la aleatorización no es exclusivo de las intervenciones de la evaluación posterior a la capacitación debe realizarse mucho después. la formación (p.
capacitación en liderazgo, con el acuerdo general de que es difícil asignar aleatoriamente ej., procesos de desarrollo de adultos, Day & Sin, 2011). Los estudios que utilizan un
a los participantes en el campo, lo que significa que "... los requisitos metodológicos de diseño de series de tiempo (múltiples períodos de tiempo de medición) deben cronometrar
los experimentos tradicionales no encajan con las realidades de la vida en las las evaluaciones de acuerdo con el nivel de desarrollo del liderazgo.
organizaciones" (Lawler III, 1977, pág. 577). Como alternativa a la aleatorización, los Consideraciones similares se aplican a las medidas previas a la prueba, que deben
procedimientos de emparejamiento basados en criterios que están vinculados al éxito del evaluarse en el momento adecuado. Por ejemplo, si el desempeño laboral es un resultado,
entrenamiento pueden, en situaciones específicas, crear una equivalencia condicional el tiempo de la prueba previa (y posterior) debe reflejar la unidad de desempeño relativa
(Stuart, 2010). al ciclo de desempeño para ese trabajo. Por lo tanto, un vendedor con un objetivo de
ventas mensual podría tener medidas mucho más cercanas a la capacitación en
Independencia de condición comparación con un gerente de marketing cuyos proyectos pueden tardar varios meses
en completarse.
Incluso si se produce la aleatorización de condiciones, pueden surgir una serie de
problemas adicionales. Uno de esos problemas se refiere a la independencia de los Participación del autor
gerentes y miembros del equipo entre las condiciones y el potencial de los efectos de
arrastre (en algunas áreas de investigación esto se denomina 'interferencia'). Si los Quién es responsable del diseño y la entrega de la capacitación es un tema importante
gerentes en las condiciones de capacitación y control pertenecen al mismo sitio porque puede afectar la capacitación en liderazgo (ver Lacerenza et al., 2017). La
organizacional, es probable que los gerentes capacitados (y los miembros de su equipo) capacitación se puede realizar internamente (por lo general, a través de especialistas en
interactúen con los gerentes de control (y los miembros de su equipo) y, por lo tanto, recursos humanos) o a través de agencias de capacitación externas, pero la pregunta
puedan afectarlos. Para evitar la contaminación entre condiciones, los investigadores clave se relaciona con la participación del equipo de investigación y la relación que tienen
pueden seleccionar administradores para cada condición de diferentes sitios regionales con la organización cliente. Si el equipo de investigación diseña y/o imparte la capacitación,
(p. ej., Paul, Robertson y Herzberg, 1969), pero esto puede aumentar la probabilidad de es probable que tenga un interés personal en el resultado, porque una capacitación
sesgos de selección regional. Seleccionar gerentes de diferentes sitios de esta manera exitosa puede generar muchos beneficios (p. ej., pago, publicaciones, repetición de
proporciona independencia entre condiciones (es decir, los líderes/seguidores de una negocios, estima). Como consecuencia, la participación de los investigadores en el diseño
condición no interactúan con los de otra condición) pero no dentro de la condición de y la impartición de la formación representa un posible conflicto de intereses (Chivers,
independencia (es decir, los líderes/seguidores dentro de una condición no interactúan 2019) que puede considerarse una característica de la demanda (es decir, un factor,
con otros de otra condición). la misma condición). Dado que la mayoría de los distinto del diseño de la investigación, que podría afectar involuntariamente los resultados;
entrenamientos implican que los participantes se entrenen juntos en grupos, sería difícil Orne , 1962). Por ejemplo, sin darse cuenta, el equipo de investigación puede impartir la
garantizar la independencia tanto dentro como entre las condiciones. capacitación de liderazgo con más entusiasmo, en comparación con aquellos que no
están involucrados en el diseño de la capacitación, lo que mejora los resultados a través
Debido a esto, nos enfocamos en la independencia entre condiciones, lo que garantiza de procesos distintos al contenido de la capacitación. El deseo de brindar apoyo al
que no haya contaminación cruzada o interferencia entre las condiciones de entrenamiento programa de capacitación también puede manifestarse en prácticas de investigación
y las que no lo están. cuestionables en procesos como la recopilación de datos, el análisis, la presentación de
informes sobre los resultados y la extracción de conclusiones (John, Loewenstein y
diseño temporal Prelec, 2012). Por ejemplo, los investigadores pueden escribir artículos con una 'historia'
narrativa centrada en resultados seleccionados que 'funcionan', tal vez omitiendo, por
El momento de las medidas previas y posteriores a la prueba es fundamental para completo, los resultados que no 'funcionan'. Del mismo modo, los investigadores pueden
capturar los cambios en los resultados relacionados con la capacitación en liderazgo. agregar o eliminar covariables, incluir o excluir valores atípicos, etc., según cómo den
Para ello, los investigadores deben comprender el proceso de transferencia de formación forma a la historia. Todas estas decisiones, a menudo tomadas sin malas intenciones,
(Grossman & Salas, 2011). Russon y Reinelt (2004) notan una falta de consideración por sirven para distorsionar el registro de la investigación y producir una imagen engañosa y
el momento de la medición de resultados, con post engañosa.

7
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

literatura potencialmente dañina. Por lo tanto, si los investigadores están involucrados en cualquier Resultados y discusión

aspecto de la intervención de capacitación y/o se benefician de ella, esto debe declararse explícitamente
como un posible conflicto de intereses y reconocerse como una amenaza potencial para la validez de La Tabla 3 contiene un resumen de las codificaciones en relación con los seis núcleos
los hallazgos. problemas identificados anteriormente.

Revisión de la literatura sobre capacitación en liderazgo Condición de control La

mayoría de los estudios emplearon una condición de control sin entrenamiento (n = 54, 87 %), lo
En esta sección, proporcionamos una revisión de la literatura sobre capacitación en liderazgo en
que significa que no pudieron dividir los efectos del contenido y el proceso del entrenamiento. Para ello,
términos de las seis consideraciones críticas para el diseño de la investigación identificadas en la
se requiere una condición de control de formación de no liderazgo (o liderazgo alternativo) en la que los
sección anterior.
líderes estén expuestos al proceso de formación. Seis estudios utilizaron una condición de control de
entrenamiento sin liderazgo (p. ej., Smith, Montello y White, 1992). Finalmente, ocho estudios (13%)
Método: selección de artículos y criterios de codificación
utilizaron una condición de control de lista de espera, en la que los participantes sabían que recibirían
capacitación en liderazgo en el futuro (p. ej., Neck & Manz, 1996). Las condiciones de lista de espera
Nuestra muestra se extrae de los estudios publicados analizados por Lacerenza et al. (2017) en el
ocurren con mayor frecuencia cuando los gerentes reciben capacitación en lotes (o cohortes) debido a
metaanálisis más reciente sobre formación en liderazgo. Laceranza et al. (2017) codificaron el diseño
limitaciones de recursos. Las condiciones de la lista de espera son útiles porque controlan los posibles
de investigación del estudio primario en tres categorías: medidas repetidas de un solo grupo (208
efectos de las variaciones en la motivación de los participantes para participar en la recopilación de
estudios, es decir, resultados previos y posteriores a la prueba para el entrenamiento de liderazgo, sin datos.
condición de control), grupos independientes (62 estudios, es decir, intervención y condición de control
con resultados posteriores a la prueba) y grupos independientes con medidas repetidas (58 estudios,
es decir, condiciones de intervención y control con resultados previos y posteriores a la prueba). Aunque
los intervalos de confianza muy amplios que rodean la estimación puntual (es decir, la mejor estimación)
Representación de la muestra
de la eficacia del entrenamiento en estos diseños de estudio se superpusieron, hubo una diferencia
En más del 70 % de los estudios (n = 44) no fue posible determinar si la muestra del estudio era
notable en las estimaciones puntuales. Específicamente, el efecto promedio (d de Cohen corregida por
representativa de la población de la que se extrajo porque se presentó poca o ninguna información
la falta de confiabilidad del criterio) para grupos independientes fue ÿ = 0,78, para medidas repetidas de
sobre la selección de la muestra. En los estudios en los que se pudo establecer la representación de la
un solo grupo fue ÿ = 0,76 y para grupos independientes con medidas repetidas fue ÿ = 0,48. Por lo
muestra (n = 18, 29 %), esto se logró utilizando toda la población de gerentes (p. ej., Birkenbach et al.,
tanto, a medida que aumentó el rigor del diseño del estudio, disminuyó el efecto promedio.
1985) o extrayendo una muestra aleatoria de ella (p. ej., Tharenou & Lyndon , 1990). Sin embargo, en
los estudios que utilizaron una muestra aleatoria de la población, los criterios para determinar la
aleatorización no fueron claros (p. ej., el porcentaje de selección).

Dado que estamos específicamente interesados en diseños de investigación que emplean una
condición de control porque las condiciones de control son necesarias para determinar la identificación
causal (Rubin, 1974), nos enfocamos en dos conjuntos de artículos publicados: grupos independientes Aleatorización de condiciones

(n = 30) y grupos independientes con medidas repetidas. (n = 32). Laceranza et al. (2017) el metanálisis Cinco estudios utilizaron un procedimiento de pareamiento (es decir, asignaron a los participantes
utilizó un conjunto estricto de criterios de inclusión para satisfacer sus necesidades metaanalíticas, lo a condiciones según criterios preexistentes para determinar grupos equitativos). Sin embargo, en cuatro
que significa que se excluyeron algunos estudios en la literatura (consulte el artículo de Lacerenza et de estos estudios, el procedimiento de emparejamiento se basó en factores que no parecían estar
al., 2017 y la información complementaria para los criterios de selección y los estudios ). incluido). Sin relacionados con la transferencia de capacitación, como datos biográficos (p. ej., Carron, 1964) o
embargo, dado que existe una gran superposición en las muestras entre Lacerenza et al. (2017) y lugares de trabajo similares (p. ej., Moffie, Calhoon y O'Brien , 1964). El estudio de McGehee y Gardner
Avolio et al. (2009) , se puede suponer que el primero es una representación justa de la literatura (1955) utilizó un procedimiento de emparejamiento en el que los participantes se asignaron a las
existente. condiciones en función de sus puntajes previos a la prueba y factores demográficos. Suponiendo que
las medidas previas a la prueba aprovechen los factores que podrían estar relacionados con el éxito del
entrenamiento, entonces esta se consideraría una buena técnica. Sin embargo, debido a que solo hubo
Codificamos cada documento para reflejar los seis problemas centrales descritos anteriormente un estudio que hizo esto, combinamos los estudios emparejados con aquellos que no informaron el uso
relacionados con la causalidad: de la asignación al azar.

1. Condición de control (sin capacitación, lista de espera, capacitación sin liderazgo).


En general, veintiocho estudios asignaron al azar a los líderes y treinta y cuatro no lo hicieron. La
2. La representación de la muestra ocurre cuando todos los líderes o una muestra aleatoria de líderes
aleatorización de condiciones es el aspecto más importante para determinar la causalidad en la
se extrae de la población disponible (sí, no).
investigación porque los miembros del grupo no deben variar sistemáticamente en ninguna variable
3. Condicione la aleatorización entre los grupos de entrenamiento y control (sí, emparejado, no).
potencialmente confusora. Por lo tanto, sorprende que menos del 50% de los estudios emplearan
También registramos el tamaño de la muestra de los líderes en cada condición y también si hubo
asignación aleatoria. En total, veinticinco estudios emplearon medidas previas a la prueba que
diferencias confiables entre las condiciones en los puntajes de la prueba previa para los líderes o
permitieron estimar la magnitud de las diferencias previas a la prueba entre las condiciones. Cuando no
sus seguidores (sí, no).
hubo aleatorización de condiciones, diez estudios encontraron diferencias antes de la prueba y ocho
(44%) no. Sin embargo, cuando hubo aleatorización de condiciones, solo un estudio encontró diferencias
4. Condicione la independencia entre las condiciones de entrenamiento y control en que los líderes y
antes de la prueba y seis (86%) no. Esto muestra la importancia de utilizar la aleatorización de
los miembros de su equipo puedan interactuar con aquellos en la condición de control (sí, no).
condiciones para establecer los criterios cruciales de grupos equivalentes.

5. Diseño temporal en términos de una clara justificación del tiempo de las medidas previas y posteriores
a la prueba para capturar la transferencia de capacitación (sí, no). Registramos los períodos de
Para ser eficaz, la aleatorización necesita muestras lo suficientemente grandes como para poder
tiempo entre la prueba previa, la capacitación en liderazgo y la prueba posterior (en semanas).
suponer que los factores de confusión potenciales se distribuyen uniformemente entre las condiciones
También codificamos si las medidas previas y posteriores a la prueba se tomaron al mismo tiempo
(Rutterford et al., 2015). En general, el número de líderes en condiciones de entrenamiento (M = 41,44)
en el calendario (sí, no).
tendió a ser ligeramente mayor que en condiciones de control (M = 35,90). Sin embargo, hubo una
6. Participación del autor en el desarrollo de contenido o en la impartición de capacitación (sí, no).
amplia variación entre los estudios y es útil señalar (a) más estudios tenían una mayor cantidad de
líderes en la condición de entrenamiento que en la de control (n = 28, 45 %) que viceversa (n = 14, 23
Si no era posible emitir un juicio, o la información no estaba disponible, esto se registraba como %) y (b) algunos estudios habían
"sin codificación".

8
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

Tabla 3
Resumen de codificaciones para estudios de formación de líderes.

Aleatorización Independencia diseño tiempo similar Diferencias

Representación de muestra de condiciones de condición temporal medición previas a la prueba Participación del autor

Sí 18 28 10 1 dieciséis 11 34
No 44 34 44 61 26 14 15
no codificado 0 0 8 0 20 7 13

N = 62, excepto diferencias pretest que fue de 32.

número muy bajo de participantes con el 20% de los estudios (n = 12) con 10 o menos Contenido de entrenamiento

participantes en una afección.


Aunque el contenido de la capacitación en liderazgo no fue un enfoque explícito de
Independencia de condición nuestra revisión, notamos que la mayoría de los artículos no incluían detalles suficientes para
En más del 70% de los estudios no se logró la independencia de las condiciones entre evaluar en qué consistía la capacitación en liderazgo. Por lo tanto, la mayoría de los estudios
las condiciones de entrenamiento y control (n = 44, 71%). no se pudieron replicar con precisión. Además, el contenido de la capacitación varió tanto
Este es un problema porque no se puede descartar la contaminación cruzada entre los que sería difícil encontrar dos estudios que fueran equivalentes en términos de contenido de
líderes (y los miembros de su equipo) en condiciones de entrenamiento y control, lo que liderazgo. Por ejemplo, los estudios que tenían como objetivo mejorar el liderazgo
puede representar una seria amenaza para la validez del estudio. transformacional de los líderes (p. ej., Barling et al., 1996; Bellé, 2013; Dvir, Eden, Avolio y
En los casos en que se logró la independencia de la condición, a menudo se debió a que los Shamir, 2002; Parry y Sinha, 2005) variaron en extensión (p. ej., la mitad un día, 3 días, 3
líderes en diferentes condiciones se ubicaron en sitios físicamente separados (p. ej., Porras meses), formato de impartición (p. ej., talleres, sesiones individuales), actividades de
et al., 1982). Si bien esto podría controlar la contaminación cruzada, introduce otras posibles desarrollo (p. ej., juego de roles, coaching, charlas) e inclusión de contenido teórico adicional
variables de confusión, como el sesgo de selección y las diferencias de sitio. (p. ej., establecimiento de metas, teoría de la motivación ). Sin réplicas claras de los efectos
y la equivalencia entre los programas de capacitación, es difícil decir qué está impulsando
cualquier efecto causal. Este problema se agrava en revisiones y metanálisis que agrupan
Diseño temporal estudios que pretenden desarrollar los mismos conceptos de liderazgo y, como resultado,
Hubo una variación considerable en los períodos de tiempo entre la prueba previa y la identifican potencialmente erróneamente los verdaderos mecanismos causales.
posterior en relación con la capacitación en liderazgo. La situación se complica más porque
la duración del entrenamiento variaba en el tiempo de un día a varios meses. Sin embargo,
el tiempo medio (en semanas) desde el pre-test hasta el entrenamiento fue de 3,72 (n = 29) Otro problema es que, en la mayoría de los estudios, el contenido de la capacitación en
y entre el entrenamiento y el post-test fue de 24,46 (n = 46; la diferencia entre el entrenamiento liderazgo no se basó en la teoría del liderazgo, sino que se centró en una gama limitada de
y el post-test entre los estudios con y sin una prueba previa fue similar: 26.13 vs. comportamientos específicos del trabajo. En estos casos, es difícil determinar si la formación
estuvo dirigida al líder o al desarrollo del liderazgo (Day & Dragoni, 2015). Para empeorar las
22.91). También es evidente que, para los estudios que pudieron codificarse, en la mayoría cosas, muchos estudios que afirman involucrar la capacitación en liderazgo parecían tener
de los casos, las medidas previas y posteriores a la prueba no se recopilaron en los mismos poco que ver con los procesos de liderazgo y, en cambio, se enfocaban en las habilidades
puntos del calendario (n = 26, 62%). En cuanto a los estudios que justificaron los períodos gerenciales generales (ver Collins & Holton, 2004). En general, debe haber una comprensión
de tiempo previos y posteriores a la prueba en términos de transferencia de criterios de mucho más clara en estos estudios de lo que hay en la capacitación (contenido y proceso) y
entrenamiento, fue muy claro: solo un estudio lo hizo (Steensma & Groeneveld, 2010). cómo se relaciona con la teoría (ver Avolio et al., 2009).
Debido a que la gran mayoría de los artículos no brindan justificación (p. ej., necesidades
teóricas del cliente/investigador, disponibilidad de los participantes) para los períodos de
tiempo entre la capacitación en liderazgo y la recopilación de datos de resultados, no está
Tendencias de tiempo
claro cómo se determinaron y si se diseñaron de manera óptima para capturar los cambios
en el
El número de estudios por década (desde 1950 hasta 2014) ha sido similar (promedio
resultados.
8,9/década, rango 3 a 14). Es agradable notar que la mayoría de los artículos se publicaron
en la década más reciente (n = 14, 2010-2014) que, en el momento de redactar este
Participación del autor
documento, aún no se había completado.
En solo alrededor de una cuarta parte de los estudios, estaba claro que los autores no
Sin embargo, una característica preocupante fue una clara tendencia a la baja en relación
participaban en el diseño o la entrega de la capacitación (n = 15, 24%). Más de la mitad de
con la aleatorización de condiciones. La aleatorización de condiciones se logró en el 55 %
los estudios informaron que los autores estaban involucrados en algún aspecto del diseño o
de los estudios anteriores (décadas de 1950 a 1980; n = 16 de 29) y solo en el 36 % de los
la entrega de la capacitación (n = 34, 55%). La posibilidad de que las características de la
realizados más tarde (décadas de 1990 a 2014; n = 12 de 33). La caída en el número de
demanda afecten los resultados de estos estudios, debido a conflictos de intereses, podría
estudios que informan la aleatorización condicional es más notable en la década actual (que
aumentar. Sin embargo, en una nota positiva, cuando los autores participaron en el estudio,
no está completa), durante la cual, solo 3 (21%) de 14 estudios utilizaron la aleatorización
los procedimientos de aleatorización de condiciones fueron más probables (ns = 24 frente a
condicional. Deberíamos agregar una nota de preocupación porque muchos estudios
10) que cuando no participaron en el estudio (ns = 1 frente a 14). Uno podría sospechar que
recientes no describen el procedimiento de asignación de condiciones (dejando al lector
cuando las organizaciones diseñan iniciativas de capacitación en liderazgo, no consideran
asumir que no se logró la aleatorización) y no discuten esto como una amenaza potencial en
cuestiones relacionadas con la causalidad y, por lo tanto, la aleatorización de condiciones
el artículo. Esto, creemos, es preocupante y es algo que instamos a los futuros investigadores
podría implementarse con el asesoramiento de un equipo de investigación.
a atender.

Observaciones adicionales, resumen y recomendaciones


Establecimiento de la causalidad en la investigación sobre formación de líderes
En la sección final, consideramos algunas observaciones adicionales de nuestra revisión
(en relación con el contenido de la capacitación y las tendencias temporales), resumimos Nuestra revisión muestra que los diseños de investigación difieren en su capacidad para
algunas de las cuestiones que hemos considerado en relación con el establecimiento de lidiar con los sesgos de endogeneidad y las especificaciones erróneas del modelo que
causalidad en la literatura sobre capacitación en liderazgo y hacemos recomendaciones para pueden sesgar las estimaciones de los parámetros y producir resultados inexactos. En
guiar futuras investigaciones en la zona. general, los estudios de control asignados al azar cumplen muchos de los criterios para determinar

9
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

causalidad. El diseño de Solomon es quizás el más poderoso aunque el menos empleado. y sirven para aumentar la característica de la demanda potencial, necesita un examen más
Esto se debe a que implica cuatro condiciones, lo que significa que requiere mucha mano de detenido (Chivers, 2019).
obra y muchos participantes. Sin embargo, dado el poder de este diseño, recomendamos su
uso cuando sea posible. Recomendaciones
Los diseños de investigación, por sí mismos, no curan todos los posibles problemas de
confusión. Los problemas relacionados con la endogeneidad, por ejemplo, pueden reducirse Reiteramos nuestra opinión de que los estudios aplicados que examinan la capacitación
pero no necesariamente eliminarse mediante las características del diseño de la investigación. en liderazgo son difíciles de realizar y existe una tensión entre lo que los investigadores
Al diseñar estudios, los investigadores deben explorar el potencial de sesgo de endogeneidad desean hacer y lo que pueden hacer. Sin embargo, esperamos que estas pautas sirvan para
en su estudio y cómo podría influir en los resultados (consulte An et al., 2019). Si los sesgos estimular una mayor consideración, informar opciones sobre problemas de diseño de
de endogeneidad son lo suficientemente grandes, esto hace que el estudio no sea informativo investigación y alentar un mejor informe de información relevante para ayudar a una
y sea potencialmente dañino (es decir, al sacar conclusiones erróneas e incorrectas) y es evaluación justa. Estas recomendaciones se centran en estudios de campo y estudios de
mejor abandonar los intentos de cuantificar estadísticamente los efectos del entrenamiento. campo cuasi-experimentales, pero también son relevantes para experimentos de laboratorio
Aunque es posible que los investigadores no puedan abordar todos los sesgos en todos los (consulte Lonati et al., 2018, para obtener orientación sobre cuestiones experimentales).
estudios, deben reconocerse explícitamente al hacer cualquier afirmación de efectos causales. Agrupamos estas recomendaciones en torno a las seis condiciones cruciales para establecer
la causalidad empleadas en la revisión de la literatura.
Nuestro análisis identificó una serie de problemas importantes pero subestimados que
pueden socavar las afirmaciones de causalidad en la investigación sobre capacitación en condición de control
liderazgo: condición de control, aleatorización de la muestra, aleatorización de la condición,
• El uso de condiciones de control es fundamental. Los estudios deberían emplearlos. • No
independencia de la condición, diseño temporal y participación del autor. Nuestra revisión
son muy importantes las condiciones de control de la capacitación, pero es necesario
destacó que la literatura sobre capacitación en liderazgo es vulnerable a todos estos factores
comprender los efectos tanto del contenido de la capacitación como del proceso de capacitación.
y, en algunos casos, a un nivel muy alto. Si bien no pudimos encontrar ejemplos de buenas
sobre los resultados.
prácticas en los seis factores, observamos buenas prácticas en cada uno de ellos. Por
• Siempre que sea posible, se deben emplear condiciones de control activo, como contenido
ejemplo, algunos estudios emplearon condiciones de control sin liderazgo y sin entrenamiento
de liderazgo alternativo (es decir, más de una intervención que cubra diferentes aspectos
(p. ej., Fitzgerald & Schutte, 2010); logró la representación de la muestra (p. ej., Ivancevich,
del contenido de liderazgo, por ejemplo, Dipietro, 2006), contenido de no liderazgo (es
1982); aleatorización de la condición de empleado (p. ej., Dipietro, 2006); usaron diseños en
decir, capacitación en áreas que no se espera que afectan los procesos de liderazgo, por
los que la contaminación cruzada entre condiciones no era posible o era muy improbable (p.
ejemplo, Fitzgerald & Schutte, 2010), o condiciones de lista de espera (es decir, los
ej., Porras et al., 1982); donde el diseño temporal estaba justificado (p. ej., Steensma y
participantes deben recibir una intervención en el futuro, por ejemplo, Neck & Manz, 1996) .
Groeneveld, 2010) y donde los autores no participaron en la impartición de la capacitación
Cada una de estas condiciones puede abordar los efectos del contenido y el proceso de
(p. ej., Bozer, Sarros y Santora, 2013).
capacitación y las diferentes amenazas a la validez que ayudan a establecer la identificación
causal. • Probar todas las posibles amenazas a la validez/sesgos inherentes a la
investigación
A pesar de algunas buenas prácticas, la prevalencia general de diseños de estudio
diseño antes de probar las hipótesis del estudio.
subóptimos que se interpretan como pruebas claras de causalidad es alta. Por ejemplo, en
más del 70 % de los estudios no estaba claro si la muestra era representativa de la población
de la que se extrajo, lo que generó problemas en la generalización de los hallazgos. Dada la Representación de muestra

función crucial de la aleatorización de condiciones, es sorprendente que menos de la mitad


• La representación de la muestra es importante para lograr estimaciones de estudio
de los estudios lo logren. Más del 50 % de los estudios no tenían procedimientos aleatorios,
imparciales y para garantizar la generalización a la población. • Los estudios deben
lo que hacía que los resultados posteriores a la prueba fueran vulnerables a una amplia gama
informar cómo se seleccionan los participantes para el estudio y reconocer cualquier posible
de sesgos (como la selección, la historia), especialmente cuando no tenían una prueba
sesgo de selección. • Cuando el tamaño de la población es grande, la selección aleatoria
previa. En ausencia de aleatorización de condiciones, pocos estudios utilizaron técnicas de
de participantes debe
emparejamiento (ver Stuart, 2010, o técnicas como el análisis de puntaje de propensión) para ser seguido.
establecer mayores niveles de equivalencia de condiciones (para un buen ejemplo, ver Neck
• La representación de la muestra es importante para generalizar los hallazgos e informar las
& Manz, 1996). La importancia de la aleatorización de las condiciones quedó demostrada por
decisiones de política.
el hecho de que, cuando ocurrió, era menos probable, como se esperaba, que hubiera
diferencias en las puntuaciones previas a la prueba (lo que demuestra que se había logrado
Aleatorización de condiciones
la equivalencia de las condiciones). La independencia de las condiciones también es
necesaria para descartar los efectos de contaminación cruzada (p. ej., los gerentes en • La aleatorización de condiciones es crucial para establecer condiciones
condiciones de capacitación y sin capacitación se mezclan y se influyen mutuamente). Sin equivalencia.
embargo, no se pudo establecer la independencia de la condición en el 70% de los estudios. • Los procedimientos de aleatorización requieren tamaños de muestra suficientes para asumir
Fue aún más sorprendente que solo un estudio considerara explícitamente el diseño temporal. la igualdad de posibles factores de confusión entre las condiciones. Existen mecanismos
Se deben considerar los problemas de transferencia de capacitación (Gilpin-Jackson & Bushe, para determinar los tamaños de muestra apropiados para diseños de investigación
2007) y los supuestos de diseño temporal (Fischer et al., 2017), guiados por el contenido específicos. • Los procedimientos de emparejamiento pueden crear una equivalencia
teórico de la capacitación, para sacar conclusiones apropiadas (Gilpin-Jackson & Bushe , condicional. Los criterios de coincidencia deben reflejar los factores identificados teóricamente
2007). En pocas palabras, muchos estudios podrían estar tratando de capturar cambios en que probablemente tengan un impacto en la transferencia de la formación. Se deben
los resultados antes de que puedan manifestarse dentro de la población objetivo. Dada la realizar pruebas adecuadas para garantizar la igualdad en la prueba previa.
naturaleza dinámica de los fenómenos de liderazgo, es necesario reconocer las cuestiones
relacionadas con la naturaleza y la dirección del cambio esperado (p. ej., cambio discontinuo, • Si la aleatorización no es posible, entonces las diferencias previas a la prueba entre las
unidireccional o no lineal) (McClean, Barnes, Courtright y Johnson, 2019). . Finalmente, en condiciones deben examinarse en factores que teóricamente afectarían el proceso de
más de la mitad de los estudios, los autores desempeñaron un papel en el diseño o la entrega liderazgo y los resultados posteriores a la prueba. El análisis de puntaje de propensión
del entrenamiento y esto fue más notable cuando hubo aleatorización de condiciones. puede ser útil en este contexto.
Sospechamos que podría deberse a la participación activa del equipo de investigación en el
proceso de formación de líderes. Participación del autor, que puede conducir a un conflicto
Independencia de condición
de intereses
• Siempre que sea posible, no debe existir la posibilidad de efectos de contaminación
cruzada (es decir, los líderes y los miembros del equipo interactúan con aquellos en otras
condiciones).

10
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

• Si la independencia de la condición no es posible, debe reconocerse y considerarse Referencias


una posible variable de confusión. • Se debe evaluar la cantidad de independencia
Aguinis, H. y Kraiger, K. (2009). Beneficios de la formación y el desarrollo para las personas y los equipos, las
de la condición (por ejemplo, más probable para algunos gerentes que para otros) e
organizaciones y la sociedad. Revisión anual de psicología, 60, 451–474.
incorporarse a los procedimientos de prueba del modelo. An, SH, Meier, KJ, Ladenburg, J. y Westergård-Nielsen, N. (2019). Liderazgo y satisfacción laboral: abordar la
endogeneidad con datos de panel de un experimento de campo. Review of Public Personnel Administration,
1–24.
Antonakis, J., Bendahan, S., Jacquart, P. y Lalive, R. (2010). Sobre hacer afirmaciones causales: una revisión
y recomendaciones. The Leadership Quarterly, 21, 1082–1120.
diseño temporal
Antonakis, J., Bendahan, S., Jacquart, P. y Lalive, R. (2014). Causalidad y endogeneidad: Problemas y
soluciones. En DV Day (Ed.), El manual de liderazgo y organizaciones de Oxford (págs. 93–117). Nueva
• Describir la transferencia del proceso de capacitación, es decir, el proceso de cómo York: Oxford University Press.
Antonakis, J., Fenley, M. y Liechti, S. (2011). ¿Se puede enseñar el carisma? Ensayos de dos intervenciones.
y cuándo se espera que el contenido de la capacitación conduzca a una mejora en el
Academia de aprendizaje y educación gerencial, 10, 374–396.
resultados.
Arthur, AC y Hardy, L. (2014). Liderazgo transformacional: un estudio cuasi-experimental . Revista de desarrollo
• Evaluar los conceptos adecuados para captar la transferencia del proceso de de liderazgo y organización, 35, 38–53.

formación (tanto mediadores como resultados). • Con base en el proceso de Avolio, BJ, Avey, JB y Quisenberry, D. (2010). Estimación del retorno de la inversión en desarrollo de liderazgo .
El Liderazgo Trimestral, 21, 633–644.
transferencia del entrenamiento, determinar los períodos de tiempo más apropiados
Avolio, BJ, Reichard, RJ, Hannah, ST, Walumbwa, FO y Chan, A. (2009). Una revisión metaanalítica de la
para las medidas previas y posteriores a la prueba. • Diseñe diferentes períodos de investigación del impacto del liderazgo: estudios experimentales y cuasi experimentales. El Liderazgo
tiempo de medición para capturar de manera óptima diferentes tipos de resultados. Trimestral, 20, 764–784.
Barling, J., Weber, T. y Kelloway, EK (1996). Efectos de la capacitación en liderazgo transformacional sobre
los resultados actitudinales y financieros: un experimento de campo. Revista de Psicología Aplicada, 81,
827–832.
Bellé, N. (2013). Liderar para marcar la diferencia: un experimento de campo sobre los efectos en el desempeño
Participación del autor del liderazgo transformacional, el impacto social percibido y la motivación del servicio público. Revista de
investigación y teoría de la administración pública, 24, 109–136.
Biggs, A., Brough, P. y Barbour, J. (2014). Relaciones de apoyo individual y organizacional con compromiso:
• Reconocer el papel del equipo de investigación en la capacitación de líderes (p. ej.,
examen de varios tipos de causalidad en un estudio de tres olas. Trabajo y estrés, 28, 236–254.
diseño y ejecución de la capacitación). Si los autores están involucrados en algún
aspecto y/o se benefician de la intervención formativa, esto debe indicarse Birkenbach, XC, Kamfer, L. y Ter Morshuizen, JD (1985). El desarrollo y la evaluación de un programa de
formación de modelos de comportamiento para supervisores. Revista de psicología de Sudáfrica , 15, 11–
explícitamente como un posible conflicto de interés.
19.
• Describa la relación entre el equipo de investigación y la organización cliente y Boies, K., Fiset, J. y Gill, H. (2015). La comunicación y la confianza son clave: desbloquear la relación entre el
reconozca cualquier posible conflicto de interés. • Si el equipo de investigación está liderazgo y el rendimiento y la creatividad del equipo. The Leadership Quarterly, 26, 1080–1094.
involucrado en la capacitación de liderazgo, debe asegurarse de que los datos de los
Bozer, G., Sarros, JC y Santora, JC (2013). El papel de las características del coachee en el coaching ejecutivo
resultados sean recopilados y analizados por personas independientes (es decir,
para una sostenibilidad efectiva. Revista de desarrollo de gestión, 32, 277–294.
aquellas que no tienen un conflicto de intereses).
Burke, MJ y Day, RR (1986). Un estudio acumulativo de la eficacia de la gestión
capacitación. Revista de Psicología Aplicada, 71, 232.
Campbell, DT y Stanley, JC (1963). Diseños experimentales y cuasi-experimentales para
investigar. Manual de investigación sobre la enseñanza (págs. 171–246).
Posdata final
Carrón, TJ (1964). Formación en relaciones humanas y cambio de actitud: un análisis vectorial.
Psicología del personal, 17, 403–422.
Las recomendaciones anteriores pueden llevar al lector a concluir que creemos Chambless, DL y Hollon, SD (1998). Definición de terapias apoyadas empíricamente. Diario
de Consultoría y Psicología Clínica, 66, 7–18.
que existe un estudio de capacitación en liderazgo 'ideal' que aborda todas nuestras
Cherniss, C., Grimm, LG y Liautaud, JP (2010). Capacitación diseñada por procesos: un nuevo enfoque para
recomendaciones. Si lo hay, no hemos podido encontrar uno y, dada la complejidad y ayudar a los líderes a desarrollar competencia emocional y social. Revista de desarrollo de gestión, 29,
el "desorden" de los escenarios del "mundo real", no somos optimistas de que alguna 413–431.
Chivers, T. (2019). ¿Tiene la psicología un problema de conflicto de intereses? Naturaleza, 571
vez se lleve a cabo. Sin embargo, estamos de acuerdo con Shaver (2019) en que la
(7763), 20.
naturaleza de los estudios de liderazgo y los datos que producen significan que solo
Collins, DB y Holton, EF (2004). La efectividad de los programas de desarrollo de liderazgo gerencial : un
podemos construir una comprensión profunda a través de una acumulación de metanálisis de estudios de 1982 a 2001. Human Resource Development Quarterly, 15, 217–248.
evidencia generada a través de estudios con varias fortalezas y debilidades. Por lo
Cooper, WH y Richardson, AJ (1986). Comparaciones injustas. Revista de Psicología Aplicada, 71, 179–184.
tanto, todos los estudios tienen el potencial de contribuir a la literatura,
independientemente de su capacidad para demostrar causalidad, pero de formas Día, D. y Dragoni, L. (2015). Desarrollo de liderazgo: Revisión orientada a resultados basada en tiempo y
diferentes y proporcionadas. De hecho, combinar estudios a través de diferentes niveles de análisis. Revisión anual de psicología organizacional y comportamiento organizacional, 2, 133–
156.
diseños de investigación y/o ignorar los tipos de problemas señalados anteriormente,
Day, D. y Sin, HP (2011). Pruebas longitudinales de un modelo integrador de desarrollo de líderes: trazar y
como es típico de las revisiones metaanalíticas, no brinda una estimación real de la comprender las trayectorias de desarrollo. El Liderazgo Trimestral, 22, 545–560.
efectividad de la capacitación en liderazgo. Poder evaluar la solidez de los estudios
frente a los efectos de la endogeneidad y la capacidad de determinar la causalidad Día, DV (2001). Desarrollo de liderazgo: una revisión en contexto. El Liderazgo Trimestral,
11, 581–613.
debería permitir a los revisores ponderar con precisión su contribución. Podríamos
Day, DV, Fleenor, JW, Atwater, LE, Sturm, RE y McKee, RA (2014). Avances en el desarrollo de líderes y
argumentar que un tamaño del efecto grande en un estudio mal diseñado (lo que liderazgo: una revisión de 25 años de investigación y teoría.
podría explicarse por muchos factores de confusión) es menos significativo, teórica y The Leadership Quarterly, 25, 63–82.
DeRue, DS, Nahrgang, JD, Hollenbeck, JR y Workman, K. (2012). Un estudio cuasi experimental de revisiones
prácticamente, que un tamaño del efecto más pequeño en un estudio bien diseñado.
posteriores al evento y desarrollo de liderazgo. Revista de Psicología Aplicada, 97, 997–1015.
Sería útil si los metaanálisis futuros pudieran centrarse en las fortalezas del diseño de
investigación de cada estudio como moderadores del impacto entre la capacitación en Dipietro, RB (2006). Retorno de la inversión en capacitación gerencial: ¿El método
¿asunto? Revista de investigación comercial de servicios de alimentos, 7, 79–96.
liderazgo y los resultados.
Dvir, T., Eden, D., Avolio, BJ y Shamir, B. (2002). Impacto del liderazgo transformacional en el desarrollo y
Por supuesto, deseamos que este documento estimule estudios de capacitación en
desempeño de los seguidores: un experimento de campo. Diario de la Academia de Administración, 45,
liderazgo mejor diseñados que sean más capaces de determinar la causalidad, pero 735–744.
esperamos que también estimule una mejor comprensión de la investigación sobre Edén, D. (1992). Liderazgo y expectativas: efectos Pigmalión y otras profecías autocumplidas en las
organizaciones. El Liderazgo Trimestral, 3, 271–305.
capacitación en liderazgo y una mayor apreciación de las diferentes contribuciones
Elo, AL, Ervasti, J., Kuosma, E. y Mattila-Holappa, P. (2014). Efecto de una intervención de
que cada diseño de estudio puede brindar. Dado el potencial de la capacitación en liderazgo en el bienestar de los subordinados. Revista de desarrollo de gestión, 33, 182–
liderazgo para mejorar significativamente una amplia gama de resultados relacionados 195.
Feldman, DC y Lankau, MJ (2005). Coaching ejecutivo: una revisión y una agenda para el futuro
con el trabajo (como el bienestar psicológico y el desempeño), o para desperdiciar una
investigar. Revista de Gestión, 31, 829–848.
gran cantidad de tiempo y dinero, es un esfuerzo importante para los académicos Fischer, T., Dietz, J. y Antonakis, J. (2017). Modelos de procesos de liderazgo: una revisión y
examinar la utilidad de formación de líderes. síntesis. Diario de Gestión, 43, 1726-1753.

11
Machine Translated by Google

R. Martin, DJ Hughes, O. Epitropaki et al. El Liderazgo Trimestral 32 (2021) 101375

Fitzgerald, S. y Schutte, NS (2010). Aumentar el liderazgo transformacional a través de la mejora de la autoeficacia. Cuello, CP y Manz, CC (1996). Autoliderazgo de pensamiento: el impacto del entrenamiento de estrategias mentales
Revista de desarrollo de gestión, 29, 495–505. en la cognición, el comportamiento y el afecto de los empleados. Revista de Comportamiento Organizacional,
Gangl, M. (2010). Inferencia causal en la investigación sociológica. Revista Anual de Sociología, 36, 17, 445–467.
21–47. Orne, MT (1962). Sobre la psicología social del experimento psicológico: Con particular referencia a las características
Gilpin-Jackson, Y. y Bushe, GR (2007). Transferencia de capacitación para el desarrollo del liderazgo: un estudio de de la demanda y sus implicaciones. Psicólogo estadounidense , 17, 776–783.
caso de los determinantes posteriores a la capacitación. Revista de desarrollo de gestión, 26, 980–1004.
Parry, KW y Sinha, PN (2005). Investigar la capacidad de capacitación del liderazgo organizacional transformacional.
Graen, G., Novak, MA y Sommerkamp, P. (1982). Los efectos del intercambio líder-miembro y el diseño del trabajo Desarrollo Internacional de Recursos Humanos, 8, 165–183.
en la productividad y la satisfacción: prueba de un modelo de apego dual. Comportamiento organizacional y Paul, WJ, Robertson, KB y Herzberg, F. (1969). El enriquecimiento del trabajo vale la pena. harvard
desempeño humano, 30, 109–131. Revisión comercial, 47, 61–78.
Grossman, R. y Salas, E. (2011). La transferencia de la formación: Lo que realmente importa. Perla, J. (2009). Inferencia causal en estadística: una visión general. Encuestas estadísticas, 3, 96–146.
Revista Internacional de Capacitación y Desarrollo, 15, 103–120. Podsakoff, PM y Podsakoff, NP (2019). Diseños experimentales en investigación de gestión y liderazgo: fortalezas,
Heckman, JJ (2005). El modelo científico de la causalidad. Metodología sociológica, 35, 1–97. limitaciones y recomendaciones para mejorar la publicabilidad. El Liderazgo Trimestral, 30, 11–33.
Holdnak, BJ, Clemons, TC y Bushardt, SC (1990). Evaluación del entrenamiento organizacional por el diseño del
Grupo de los Cuatro de Salomón: Un estudio de campo en el entrenamiento de la autoestima. Revista de Porras, JJ, Hargis, K., Patterson, KJ, Maxfield, DG, Roberts, N. y Bies, RJ (1982).
Psicología Gerencial, 5, 25–31. Desarrollo organizacional basado en modelos: una evaluación longitudinal. El Diario de Ciencias Aplicadas del
Hughes, DJ (2018). Validez psicométrica: Establecer la precisión y adecuación de las medidas psicométricas. En P. Comportamiento, 18, 433–446.
Irwing, T. Booth y DJ Hughes (Eds.), El manual Wiley de pruebas psicométricas: una referencia multidisciplinaria Powell, SK y Yalcin, S. (2010). Efectividad de la capacitación gerencial: un metanálisis
sobre el desarrollo de encuestas, escalas y pruebas (págs. 751–779). Chichester, Reino Unido: Wiley. 1952-2002. Revisión de personal, 39, 227–241.
Riggio, RE (2008). Desarrollo de liderazgo: El estado actual y las expectativas futuras.
Hughes, DJ, Lee, A., Tian, AW, Newman, A. y Legood, A. (2018). Liderazgo, creatividad e innovación: una revisión
Revista de psicología de consultoría: práctica e investigación, 60, 383–392.
crítica y recomendaciones prácticas. El Liderazgo Trimestral, 29, 549–569.
Rubín, DB (1974). Estimación de los efectos causales de los tratamientos en estudios aleatorizados y no aleatorizados.
Revista de Psicología Educativa, 66, 688–701.
Imbens, GW y Rubin, DB (2017). Modelo causal de Rubin. El nuevo diccionario palgrave de
Rubín, DB (1975). Inferencia bayesiana de causalidad: la importancia de la aleatorización.
economía (págs. 1-10).
Las actas de la sección de estadísticas sociales de la Asociación Estadounidense de Estadística.
Ivancevich, JM (1982). Las reacciones de los subordinados a las entrevistas de evaluación del desempeño: una
vol. 233. (págs. 239). Alexandria, VA: Asociación Estadounidense de Estadística.
prueba de técnicas de retroalimentación y establecimiento de objetivos. Revista de Psicología Aplicada, 67,
Russon, C. y Reinelt, C. (2004). Los resultados de una exploración de evaluación de 55 programas de desarrollo de
581–587.
liderazgo. Diario de Liderazgo y Estudios Organizacionales, 10, 104–107.
Jeffreys, H. (1961). Teoría de la probabilidad (3ª ed.). Oxford: Prensa de la Universidad de Oxford.
Rutterford, C., Copas, A. y Eldridge, S. (2015). Métodos para la determinación del tamaño de la muestra en ensayos
John, LK, Loewenstein, G. y Prelec, D. (2012). Medir la prevalencia de prácticas de investigación cuestionables con
aleatorios por conglomerados. Revista Internacional de Epidemiología, 44, 1051–1067.
incentivos para decir la verdad. Ciencia Psicológica, 23, 524–532.
Shadish, WR y Cook, TD (2009). El renacimiento de la experimentación de campo en la evaluación de intervenciones.
Kirkpatrick, DL (1959). Enseñanza para la evaluación de programas de formación. Revista de la Sociedad
Revisión anual de psicología, 60, 607–629.
Estadounidense de Directores de Capacitación, 13, 3–9.
Máquina de afeitar, JM (2019). Identificación causal a través de un cuerpo acumulativo de investigación en el
Kruschke, JK (2013). La estimación bayesiana reemplaza la prueba t. Revista de Psicología Experimental: General,
estudio de la estrategia y las organizaciones. Revista de Gestión.
142, 573–603.
Smith, RM, Montello, PA y White, PE (1992). Investigación de la formación en gestión interpersonal para
Lacerenza, CN, Reyes, DL, Marlow, SL, Joseph, DL, & Salas, E. (2017). Diseño, entrega e implantación de
administradores educativos. Revista de Investigación Educativa, 85, 242–245.
capacitación en liderazgo : un metanálisis. Revista de Psicología Aplicada, 102, 1686–1718.

Salomón, RL (1949). Una extensión del diseño del grupo de control. Boletín Psicológico, 46,
Ladegard, G. y Gjerde, S. (2014). Coaching de liderazgo, eficacia del rol del líder y confianza en los subordinados.
137–150.
Un estudio de métodos mixtos que evalúa el coaching de liderazgo como una herramienta de desarrollo de
Steensma, H. y Groeneveld, K. (2010). Evaluación de un entrenamiento utilizando el “modelo de cuatro niveles”.
liderazgo. El Liderazgo Trimestral, 25, 631–646.
Revista de aprendizaje en el lugar de trabajo, 22, 319–331.
Lawler, EE, III (1977). Experimentos adaptativos: un enfoque para la investigación del comportamiento organizacional .
Stouffer, SA (1950). Algunas observaciones sobre el diseño del estudio. revista americana de sociología,
Revisión de la Academia de Gestión, 2, 576–585.
55, 355–361.
Lonati, S., Quiroga, BF, Zehnder, C. y Antonakis, J. (2018). Sobre hacer experimentos relevantes y rigurosos:
Revisión y recomendaciones. Revista de Gestión de Operaciones, 64, 19–40. Estuardo, EA (2010). Métodos de emparejamiento para la inferencia causal: una revisión y una mirada hacia el futuro.
Ciencia estadística, 25, 1–21.

Martin, R., Epitropaki, O. y O'Broin, L. (2018). Cuestiones metodológicas en la investigación sobre formación de Taylor, PJ, Russ-Eft, DF y Taylor, H. (2009). Transferencia de la formación directiva desde perspectivas alternativas.

líderes: En busca de la causalidad. Desafíos metodológicos y avances en la cognición gerencial y organizacional Revista de Psicología Aplicada, 94, 104–121.

(págs. 73–94). Emerald Publishing Limited. Tharenou, P. y Lyndon, JT (1990). El efecto de un programa de desarrollo de supervisores en el estilo de liderazgo.
McClean, ST, Barnes, CM, Courtright, SH y Johnson, RE (2019). Puesta a cero del reloj sobre los comportamientos Revista de Negocios y Psicología, 4, 365–373.
dinámicos de los líderes: una integración conceptual y una agenda para futuras investigaciones. Academia de Van Lent, L. (2007). Endogeneidad en la investigación en contabilidad de gestión: un comentario. The European
Anales de Gestión, 13, 479–508. Accounting Review, 16, 197–205.
McGehee, W. y Gardner, JE (1955). Formación de supervisores y cambio de actitud. Psicología del personal , 8, 449– Wagenmakers, EJ, Love, J., Marsman, M., Jamil, T., Ly, A., Verhagen, J., ... Morey, RD
460. (2018). Inferencia bayesiana para la psicología. Parte II: Ejemplos de aplicaciones con JASP.
Miscenko, D., Guenter, H. y Day, DV (2017). ¿Soy un líder? Examinar el desarrollo de la identidad del líder a lo largo Psychonomic Bulletin & Review, 25, 58–76.
del tiempo. El Liderazgo Trimestral, 28, 605–620. Wagenmakers, EJ, Marsman, M., Jamil, T., Ly, A., Verhagen, J., Love, J., ... Morey, RD
Moffie, DJ, Calhoon, R. y O'Brien, JK (1964). Evaluación de un desarrollo gerencial (2018). Inferencia bayesiana para la psicología. Parte I: Ventajas teóricas y ramificaciones prácticas.
programa. Psicología del personal, 17, 431–440. Psychonomic Bulletin & Review, 25, 35–57.
Morgan, SL y Winship, C. (2015). Contrafactuales e inferencia causal (2ª ed.). Nueva York: Cambridge Oeste, SG (2009). Alternativas a los experimentos aleatorios. Direcciones actuales en ciencia psicológica,
University Press. 18, 299–304.
Moses, JL y Ritchie, R. J (1976). Capacitación en relaciones de supervisión: una evaluación de Yeow, J. y Martín, R. (2013). El papel de la autorregulación en el desarrollo de líderes: un experimento de
comportamiento de un programa de modelado de comportamiento. Psicología del personal, 29, 337–343. campo longitudinal. El Liderazgo Trimestral, 24, 625–637.

12

También podría gustarte