Está en la página 1de 197

PARTE I

¿QUÉ ES EL DISEÑO DE INVESTIGACIÓN?

EL CONTEXTO DEL DISEÑO

Antes de examinar los tipos de diseños de investigación, es importante tener claro el papel y el propósito del diseño de investigación. Necesitamos entender qué es el diseño de
investigación y qué no es. Necesitamos saber dónde encaja el diseño en todo el proceso de investigación, desde formular una pregunta hasta finalmente analizar y reportar
datos. Este es el propósito de este capítulo.

Descripción y explicación

Los investigadores sociales formulan dos tipos fundamentales de preguntas de investigación:

1 ¿Qué está pasando (investigación descriptiva)?

2 ¿Por qué está pasando (investigación explicativa)?

Investigación descriptiva
Aunque algunas personas descartan la investigación descriptiva como 'mera descripción', una buena descripción es fundamental para la empresa de investigación y ha
contribuido enormemente a nuestro conocimiento de la forma y naturaleza de nuestra sociedad. La investigación descriptiva abarca gran parte de la investigación patrocinada
por el gobierno, incluida la censo de población, la recopilación de una amplia gama de indicadores sociales e información económica, como patrones de gasto de los hogares,
estudios de uso del tiempo, estadísticas de empleo y delincuencia y similares.

Las descripciones pueden ser concretas o abstractas. Una descripción relativamente concreta podría describir la mezcla étnica de una comunidad, el perfil de edad cambiante
de una población o la mezcla de género de un lugar de trabajo. Alternativamente
2
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 3
INVESTIGACIÓN?

Históricamente, las descripciones precisas del nivel de desempleo o


la descripción podría hacer preguntas más abstractas como "¿Está aumentando o pobreza han jugado un papel clave en las reformas de la política social
disminuyendo el nivel de desigualdad social?", "¿Qué tan secular es la sociedad?" o ¿ (Marsh, 1982). Al demostrar la existencia de problemas sociales, una
Cuánta pobreza hay en esta comunidad?' descripción competente puede desafiar las suposiciones aceptadas sobre
cómo son las cosas y puede provocar la acción.
Una buena descripción provoca las preguntas del 'por qué' de la investigación
explicativa. Si detectamos una mayor polarización social en los últimos 20 años (es
decir, los ricos son cada vez más ricos y los pobres cada vez más pobres) nos vemos
obligados a preguntar '¿Por qué sucede esto?' Pero antes de preguntar '¿por qué?'
debemos estar seguros del hecho y las dimensiones del fenómeno de la creciente
polarización. Está muy bien desarrollar teorías elaboradas sobre por qué la sociedad
podría estar más polarizada ahora que en el pasado reciente, pero si la premisa
básica es incorrecta (la sociedad no se está polarizando más), entonces los intentos
de explicar un fenómeno inexistente son inútiles. tonto.

Por supuesto, la descripción puede degenerar en una recopilación de hechos sin


sentido o en lo que CWMills (1959) llamó "empirismo abstracto". Hay muchos
ejemplos de encuestas no enfocadas y estudios de casos que brindan información
trivial y no provocan ninguna pregunta de "por qué" ni brindan ninguna base para la
generalización. Sin embargo, esta es una función de las descripciones
intrascendentes más que una acusación de la investigación descriptiva en sí misma.

investigación explicativa
La investigación explicativa se centra en las preguntas por qué. Por ejemplo, una cosa
es describir la tasa de criminalidad en un país, examinar las tendencias a lo largo del
tiempo o comparar las tasas en diferentes países. Es muy diferente desarrollar
explicaciones sobre por qué la tasa de criminalidad es tan alta, por qué algunos tipos
de delincuencia están aumentando o por qué la tasa es más alta en algunos países
que en otros.
Figura 1.1 Tres tipos de relaciones causales
La forma en que los investigadores desarrollan diseños de investigación se ve
afectada fundamentalmente por si la pregunta de investigación es descriptiva o opciones ocupacionales, que están vinculadas a oportunidades de promoción, que a su
explicativa. Afecta la información que se recopila. Por ejemplo, si queremos explicar vez afectan el nivel de ingresos (Gráfico 1.1b). O podríamos postular un modelo más
por qué es más probable que algunas personas sean detenidas y condenadas por complejo que involucre varias cadenas causales interrelacionadas (Figura 1.1c).
delitos, debemos tener corazonadas sobre por qué es así. Es posible que tengamos
muchas corazonadas posiblemente incompatibles y necesitaremos recopilar PREDICCIÓN, CORRELACIÓN Y CAUSALIDAD
información que nos permita ver qué corazonadas funcionan mejor empíricamente.
La gente a menudo confunde la correlación con la causalidad. El simple hecho de que
Responder a las preguntas del 'por qué' implica desarrollar explicaciones causales. un evento siga a otro, o que dos factores covaríen, no significa que uno sea la causa del
Las explicaciones causales argumentan que el fenómeno Y (por ejemplo, el nivel de otro. El vínculo entre dos eventos puede ser coincidente más que causal.
ingresos) se ve afectado por el factor X (por ejemplo, el género). Algunas Existe una correlación entre el número de camiones de bomberos en un incendio y la
explicaciones causales serán simples mientras que otras serán más complejas. Por cantidad de daños causados por el fuego (cuantos más camiones de bomberos, más
ejemplo, podríamos argumentar que existe un efecto directo del género en los daños). ¿Es por lo tanto razonable concluir que el número de camiones de bomberos
ingresos (es decir, una simple discriminación de género) (Figura 1.1a). Podríamos causa la cantidad de daños? Claramente, tanto el número de camiones de bomberos
argumentar a favor de una cadena causal, como que el género afecta la elección del como la cantidad de daños se deben a un tercer factor, como la gravedad del incendio.
campo de capacitación, lo que a su vez afecta
De manera similar, a medida que la tasa de divorcios cambió durante el siglo XX, la
tasa de delincuencia aumentó unos años más tarde. Pero esto no significa que el
divorcio provoque delitos. secularización, mayor individualismo o pobreza.

4
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 5
INVESTIGACIÓN?

tiene por qué ser porque las escuelas privadas producen un mejor rendimiento. Puede
Los estudiantes de las escuelas privadas de pago suelen tener un mejor desempeño en su ser que asistir a una escuela privada y un mejor desempeño en el último año sean el
último año de escolaridad que los de las escuelas financiadas por el gobierno. Pero esto no resultado de alguna otra causa (ver discusión más adelante).
Confundir la causalidad con la correlación también confunde la predicción con la causalidad y
la predicción con la explicación. Cuando dos eventos o características están correlacionados ,
podemos predecir uno a partir del otro. Conocer el tipo de escuela a la que asistimos mejora Dicho así, la noción de causalidad determinista en las ciencias sociales suena
nuestra capacidad para predecir el rendimiento académico. que el tipo de escuela afecta el extraña. Es difícil concebir una característica o evento que invariablemente resulte en
rendimiento académico. Predecir el rendimiento sobre la base del tipo de escuela no nos dice un resultado dado incluso si se especifica un conjunto de condiciones bastante estricto.
por qué a los estudiantes de escuelas privadas les va mejor. Una buena predicción no depende La complejidad del comportamiento social humano y los componentes subjetivos,
de relaciones causales. La capacidad de predecir con precisión tampoco demuestra nada significativos y voluntaristas del comportamiento humano significan que nunca será
acerca de la causalidad. posible llegar a enunciados causales del tipo 'Si X, y A y B, entonces siempre seguirá
Y'.
Reconocer que la causalidad es más que la correlación resalta un problema. Si bien
podemos observar la correlación, no podemos observar la causa. Tenemos que inferir la causa. La mayor parte del pensamiento causal en las ciencias sociales es probabilístico más
Sin embargo, estas inferencias son 'necesariamente falibles... [ellos] solo están indirectamente que determinista (Suppes, 1970). Es decir, trabajamos en el nivel en que un factor dado
vinculados a los observables' (Cook y Campbell, 1979: 10). Debido a que nuestras inferencias aumenta (o disminuye) la probabilidad de un resultado particular, por ejemplo: ser mujer
son falibles, debemos minimizar las posibilidades de decir incorrectamente que una relación es aumenta la probabilidad de trabajo a tiempo parcial; la raza afecta la probabilidad de
causal cuando en realidad no lo es. Uno de los propósitos fundamentales del diseño de tener un trabajo de alto estatus.
investigación en la investigación explicativa es evitar inferencias inválidas.
Podemos mejorar las explicaciones probabilísticas especificando condiciones bajo
CONCEPTOS DETERMINISTAS Y PROBABILÍSTICOS DE CAUSALIDAD las cuales X es menos probable y más probable que afecte a Y. Pero nunca lograremos
explicaciones completas o deterministas. Las personas construyen su mundo social y
Hay dos formas de pensar acerca de las causas: determinista y probabilísticamente. El fumador
hay aspectos creativos en la acción humana, pero esta libertad y agencia siempre
que niega que el tabaco provoque cáncer porque fuma mucho pero no ha contraído cáncer
estarán restringidas por las estructuras dentro de las cuales viven las personas. Debido
ilustra la causalidad determinista. La causalidad probabilística es ilustrada por las autoridades
a que el comportamiento no está simplemente determinado, no podemos lograr
sanitarias que señalan las mayores posibilidades de cáncer entre los fumadores.
explicaciones deterministas. Sin embargo, debido a que el comportamiento está
La causalidad determinista es donde se dice que la variable X causa Y si, y solo si, X produce restringido, podemos lograr explicaciones probabilísticas. Podemos decir que un factor
invariablemente Y. Es decir, cuando X está presente, Y ocurrirá 'necesaria, inevitable e dado aumentará la probabilidad de un resultado dado, pero nunca habrá certeza sobre
infaliblemente' (Cook y Campbell, 1979: 14). Este enfoque busca establecer leyes causales los resultados.
tales como: siempre que el agua se calienta a 100 ℃ siempre hierve.
A pesar de la naturaleza probabilística de las declaraciones causales en las ciencias
En realidad, las leyes nunca son tan simples. Siempre especificarán las condiciones sociales, gran parte del discurso popular, ideológico y político las traduce en
particulares bajo las cuales opera esa ley. De hecho, gran parte de la investigación científica declaraciones deterministas. Los hallazgos sobre los efectos causales de la clase, el
implica especificar las condiciones bajo las cuales operan las leyes particulares. Por lo tanto, género o la etnicidad, por ejemplo, a menudo se interpretan como si estos factores
podríamos decir que al nivel del mar, calentar agua pura a 100 ℃ siempre hará que el agua produjeran resultados particulares de manera invariable y completa. roles en las
hierva. familias, valores y formas de relacionarse con otras personas.

Alternativamente, la ley podría establecerse en la forma de 'en igualdad de condiciones',


entonces X siempre producirá Y. Una versión determinista de la relación entre la raza y el nivel Prueba de teoría y construcción de teoría.
de ingresos diría que en igualdad de condiciones (edad, educación, personalidad, experiencia)
etc.), entonces una persona blanca [siempre] ganará un ingreso más alto que una persona Los intentos de responder a las preguntas de "por qué" en las ciencias
negra. Es decir, la raza (X) causa el nivel de ingresos (Y). sociales son teorías. Estas teorías varían en su complejidad (cuántas
variables y vínculos), abstracción y alcance. Para comprender el papel de la
teoría en la investigación empírica, es útil distinguir entre dos estilos
diferentes de investigación: la comprobación de teorías y la construcción de
teorías (Figura 1.2).
Construcción de teoría

La construcción de teorías es un proceso en el que la investigación comienza


con observaciones y utiliza el razonamiento inductivo para derivar una teoría
a partir de estas observaciones.
6 ¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?
EL CONTEXTO DEL DISEÑO

Enfoque de construcción de teoría


¿Padres divorciados?

Empírico
comienzo
nivel Sí
No

aquí

Conceptual-abstracto Razonamiento (b)


Bajo (a)
inductivo
nivel conflicto de los padres
(C) (d)
Alto
Figura 1.3 La relación entre el divorcio y el conflicto parental
Enfoque de prueba de teoría

Inicio conceptual-abstracto En contraste, un enfoque de prueba de teoría comienza con una teoría y usa la teoría
para guiar qué observaciones hacer: se mueve de lo general a lo particular. Las
nivel aquí Razonamiento deductivo observaciones deben proporcionar una prueba del valor de la teoría. Usar el
Empírico razonamiento deductivo para derivar un conjunto de proposiciones de la teoría hace
esto. Necesitamos desarrollar estas proposiciones para que
nivel

Figura 1.2 Enfoques de investigación para la construcción de teorías y la prueba de teorías

Estas teorías intentan dar sentido a las observaciones. Debido a que la teoría se produce
después de que se realizan las observaciones, a menudo se la denomina teoría post factum
(Merton, 1968) o teorización ex post facto.

Esta forma de construcción de teoría implica preguntarse si la observación es un caso


particular de un factor más general, o cómo encaja la observación en un patrón o una historia.
Por ejemplo, Durkheim observó que la tasa de suicidios era mayor entre los protestantes que
entre los católicos. Pero, ¿es la afiliación religiosa un caso particular de algo más general? ¿De
qué fenómeno más general podría ser un indicador? ¿Hay otras observaciones que arrojen luz
sobre esto? También observó que los hombres eran más suicidas que las mujeres, los
habitantes urbanos más que los habitantes rurales y los socialmente móviles más que los
socialmente estables. Argumentó que el factor común detrás de todas estas observaciones era
que aquellos grupos que eran más suicidas también estaban socialmente peor. integrado y
experimentó una mayor ambigüedad sobre cómo comportarse y qué está bien y qué está mal.
Teorizó que una de las explicaciones del comportamiento suicida era una sensación de
ausencia de normas, una desconexión de los individuos de su mundo social. Por supuesto,
puede haber otras formas de explicar estas observaciones, pero al menos la explicación de
Durkheim fue consistente con los hechos.

Prueba de teoría
Proposición 2: los niños en las situaciones (c) y (d) deberían estar
igualmente mal Es decir, los niños en familias de parejas conflictivas estarán
si la teoría es cierta, entonces ciertas cosas deberían seguir en el mundo real. Luego tan mal como los niños en familias post-divorcio donde los padres mantienen
evaluamos si estas predicciones son correctas. Si son correctos, se apoya la teoría. un alto conflicto.
Si no se sostienen, entonces la teoría debe ser rechazada o modificada.
Proposición 3: a los niños en la situación (c) les irá peor que a los de
Por ejemplo, podemos desear probar la teoría de que no es el divorcio en sí mismo la situación (a) Es decir, a los que tienen padres casados en alto
lo que afecta el bienestar de los niños, sino el nivel de conflicto entre los padres. Para conflicto les irá peor que a los que tienen padres casados que no
probar esta idea, podemos hacer predicciones sobre el bienestar de los niños en están en conflicto.
diferentes condiciones familiares. Para la teoría simple de que es el conflicto de los
padres y no el divorcio lo que afecta el bienestar del niño, existen cuatro Proposición 4: a los niños en la situación (d) les irá peor que a los que están
en la situación (b) Es decir, a los que tienen padres divorciados en alto
"condiciones" básicas (ver Figura 1.3). Para cada "condición", la teoría haría
conflicto les irá peor que a los que tienen padres divorciados que no están en
diferentes predicciones sobre el nivel de bienestar de los niños que podemos
conflicto.
examinar.
Proposición 5: a los niños en la situación (b) les irá mejor que a los de la
Si la teoría de que se trata de un conflicto de los padres en lugar de un divorcio de situación (c) Es decir, a los niños de padres divorciados que no están en
los padres es correcta, se deben apoyar las siguientes proposiciones: conflicto les irá mejor que a los de padres casados que están en conflicto.

Proposición 6: a los niños en la situación (a) les irá mejor que a los que están en la
Proposición 1: los niños en las situaciones (a) y (b) estarían igualmente bien Es decir, situación (d) Es decir, a los niños con padres casados que no están en conflicto les irá
donde el conflicto entre padres es bajo, los niños con padres divorciados estarán tan mejor que a los niños con padres divorciados que están en conflicto.
bien como aquellos cuyos padres están casados.
8
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 9
INVESTIGACIÓN?

nada sobre el impacto del divorcio. Sin embargo, tomado como un paquete, el
conjunto de proposiciones proporciona una prueba más fuerte de la teoría
que cualquier proposición individual.

Aunque la comprobación de teorías y la construcción de teorías a menudo se


presentan como modos alternativos de investigación, deberían ser parte de un proceso
en curso (Figura 1.4). Por lo general, la construcción de teorías producirá un relato o
explicación plausible de un conjunto de observaciones. Sin embargo, tales
explicaciones con frecuencia son solo una de varias explicaciones posibles que se
ajustan a los datos. Si bien son plausibles, no son necesariamente convincentes.
Requieren pruebas sistemáticas donde se recopilan datos para evaluar
específicamente qué tan bien se mantiene la explicación cuando se somete a una
variedad de pruebas cruciales.

¿Qué es el diseño de investigación?

¿Cómo se utilizará el término "diseño de investigación" en este libro? Una


analogía podría ayudar. Al construir un edificio, no tiene sentido pedir
construcción de la teoría
materiales o establecer fechas críticas para completar las etapas del proyecto
Figura 1.4 La lógica del proceso de investigación
hasta que sepamos qué tipo de edificio se está construyendo. La primera
decisión es si necesitamos un edificio de oficinas de gran altura, una fábrica
Ninguna proposición única proporcionaría una prueba convincente de la teoría de maquinaria, una escuela, una casa residencial o un bloque de
original. De hecho, tomada en su propia proposición 3, por ejemplo, no revelaría
apartamentos. Hasta que no se haga esto, no podemos esbozar un plan, obtener
permisos, elaborar un cronograma de trabajo o pedir materiales.
De manera similar, la investigación social necesita un diseño o una estructura antes
de que pueda comenzar la recopilación o el análisis de datos. Un diseño de
investigación no es solo un plan de trabajo. Un plan de trabajo detalla lo que se debe
hacer para completar el proyecto, pero el plan de trabajo fluirá de la diseño de la
investigación. La función de un diseño de investigación es asegurar que la evidencia
obtenida nos permita responder la pregunta inicial de la manera más inequívoca
posible. Obtener evidencia relevante implica especificar el tipo de evidencia necesaria
para responder la pregunta de investigación, para probar una teoría, para evaluar un
programa o para describir con precisión algún fenómeno. teoría), ¿ qué tipo de
evidencia se necesita para responder la pregunta (o probar la teoría) de manera
convincente?

El diseño de la investigación 'trata con un problema lógico y no con un


problema logístico' (Yin, 1989:29). Antes de que un constructor o arquitecto
pueda desarrollar un plan de trabajo u ordenar materiales, primero debe
establecer el tipo de edificio requerido, sus usos y las necesidades de los
ocupantes. El plan de trabajo fluye de esto. de la recopilación de datos (por
ejemplo, cuestionario, observación, análisis de documentos), el diseño de las
preguntas son subsidiarios del asunto de '¿Qué evidencia necesito recopilar?'

Con demasiada frecuencia, los investigadores diseñan cuestionarios o


comienzan a entrevistar demasiado pronto, antes de pensar qué información
necesitan para responder a sus preguntas de investigación. Si no se presta
atención a estos aspectos del diseño de la investigación desde el principio,
las conclusiones extraídas normalmente serán débiles y poco convincentes y
no responderán a las preguntas. pregunta de investigación.

Diseño versus método

El diseño de la investigación es diferente del método mediante el cual se


recopilan los datos. Muchos textos sobre métodos de investigación
confunden los diseños de investigación con los métodos. No hay nada
intrínseco en ningún diseño de investigación que requiera un método
particular de recopilación de datos. Aunque las encuestas transversales con
frecuencia se equiparan con cuestionarios y los estudios de casos a menudo
se equiparan con la observación participante (por ejemplo, la Sociedad de la
esquina de la calle de Whyte, 1943), los datos para cualquier El diseño se
puede recopilar con cualquier método de recopilación de datos (Figura 1.5).
La forma en que se recopilan los datos es irrelevante para la lógica del diseño.

No distinguir entre diseño y método conduce a una mala evaluación de los


diseños. Equiparar diseños transversales con cuestionarios o estudios de
casos con observación participante significa que los diseños a menudo se
evalúan en función de las fortalezas y debilidades del método en lugar de su
capacidad. sacar conclusiones relativamente inequívocas o seleccionar entre
hipótesis plausibles rivales.

10
¿QUÉ ES EL
DISEÑO DE EL CONTEXTO DEL DISEÑO 11
INVESTIGAC
IÓN?

Es un error equiparar un diseño de investigación particular con métodos


cuantitativos o cualitativos. Yin (1993), una autoridad respetada en el diseño
de estudios de casos, ha subrayado la irrelevancia de la distinción
cuantitativo/cualitativo para los estudios de casos. Señala que:

Figura 1.5 Relación entre el diseño de la investigación y métodos particulares de recopilación


de datos

INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA

De manera similar, los diseños a menudo se equiparan con métodos de


investigación cualitativos y cuantitativos. Las encuestas y los experimentos sociales
se consideran con frecuencia como ejemplos principales de investigación
cuantitativa y se evalúan frente a las fortalezas y debilidades de los métodos y
análisis estadísticos y cuantitativos de la investigación. Los estudios de casos, por
otro lado, a menudo se ven como ejemplos principales de investigación cualitativa,
que adopta un enfoque interpretativo de los datos, estudia 'cosas' dentro de su
contexto y considera los significados subjetivos que las personas aportan a su
situación.
Adoptar un enfoque escéptico a las explicaciones.
La necesidad de un diseño de investigación surge de un enfoque escéptico de la
un punto de confusión... ha sido la desafortunada vinculación entre el método de estudio de
investigación y de la opinión de que el conocimiento científico siempre debe ser
caso y ciertos tipos de recopilación de datos, por ejemplo, aquellos que se enfocan en métodos
provisional. El propósito del diseño de investigación es reducir la ambigüedad de gran
cualitativos, etnografía u observación participante. Las personas han pensado que el método
parte de la evidencia de la investigación.
de estudio de caso les obligaba a adoptar estos métodos de recopilación de datos... Por el
contrario, el método no implica ninguna forma particular de recopilación de datos, que puede Siempre podemos encontrar alguna evidencia consistente con casi cualquier teoría.
ser cualitativa o cuantitativa. (1993:32) Sin embargo, debemos ser escépticos de la evidencia, y en lugar de buscar evidencia
que sea consistente con nuestra teoría, debemos buscar evidencia que proporcione
De manera similar, Marsh (1982) argumenta que las encuestas cuantitativas pueden brindar una prueba convincente de la teoría.
información y explicaciones que son 'adecuadas al nivel del significado'. Si bien reconoce que
la investigación de encuestas no siempre ha sido buena para aprovechar la dimensión Hay dos estrategias relacionadas para hacer esto: eliminar explicaciones
subjetiva del comportamiento, argumenta que: rivales de la evidencia y buscar deliberadamente evidencia que pueda refutar
Dar sentido a la acción social... es... difícil y las encuestas tradicionalmente no han sido muy
la teoría.
buenas en eso. Los primeros investigadores de encuestas iniciaron una tradición... de traer el
HIPÓTESIS RIVALES PLAUSIBLES
significado desde afuera, ya sea haciendo uso de las existencias de explicaciones plausibles
del investigador... o extrayéndolo de entrevistas en profundidad subsidiarias, salpicando Una estrategia fundamental de la investigación social consiste en evaluar
citas... liberalmente sobre la materia prima. correlaciones derivadas de la encuesta. La "hipótesis rivales plausibles". Necesitamos examinar y evaluar formas
investigación de la encuesta se volvió mucho más emocionante... cuando comenzó a incluir alternativas de explicar un fenómeno particular. Esto se aplica
dimensiones significativas en el diseño del estudio. proporcionar información sobre los independientemente de si los datos son cuantitativos o cualitativos;
valores centrales de su vida en torno a los cuales podemos suponer que está orientando su independientemente del diseño particular de la investigación (experimental,
vida. [Esto] implica recopilar una imagen suficientemente completa del contexto en el que se transversal, longitudinal o de casos).
encuentra un actor para que un equipo de personas externas pueda leer las dimensiones
significativas .(1982:123-4)
12
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 13
INVESTIGACIÓN?

Relación causal Academic


achievement

Explicación alternativa: selectividad en la capacidad inicial del niño


Figura 1.6 Explicaciones causales y no causales de la relación entre el tipo de escuela
y el rendimiento académico

estudio); e independientemente del método de recopilación de datos (observación del


yo, cuestionario). Nuestra mentalidad necesita anticipar formas alternativas de
interpretar los hallazgos y considerar cualquier interpretación de estos hallazgos como
Explicación alternativa:recursos familiares provisional, sujeta a más pruebas.

La idea de evaluar hipótesis rivales plausibles se puede ilustrar utilizando el ejemplo


de la correlación entre el tipo de escuela a la que asiste y el rendimiento académico.
Muchos padres aceptan la proposición causal de que la asistencia a escuelas privadas
de pago mejora el rendimiento académico de un niño (Figura 1.6). Las propias escuelas
promover la misma noción anunciando de manera destacada sus índices de
aprobación y comparándolos con los de otras escuelas o con los promedios
nacionales. Por implicación, proponen una conexión causal: 'Envíe a su hijo a nuestra
Explicación alternativa:valores educativos escuela y aprobará (o obtendrá calificaciones para ingresar a instituciones prestigiosas,
cursos). Los datos que proporcionan son consistentes con su propuesta de que estas escuelas
producen mejores resultados.
Pero estos datos no son convincentes. Hay al menos otras tres formas de explicar
esta correlación sin aceptar el vínculo causal entre el tipo de escuela y el rendimiento
(Figura 1.6). Está la explicación de la selectividad: los estudiantes más capaces
pueden ser enviados a escuelas que pagan tasas. colegios privados en primer lugar.
Está la explicación de los recursos familiares: los padres que pueden permitirse el lujo
de enviar a sus hijos a escuelas privadas de pago también pueden permitirse otra
ayuda (por ejemplo, libros, tutoría privada, espacio de estudio tranquilo,
computadoras). Es esta ayuda más que el tipo de escuela la que produce el mejor
desempeño de los estudiantes de escuelas privadas. Finalmente, está la explicación de
los valores familiares: los padres que más valoran la educación están preparados para
enviar a sus hijos a escuelas privadas pagas y es este énfasis familiar en la educación,
no las escuelas mismas, lo que produce el mejor rendimiento académico. Todas estas
explicaciones son igualmente consistentes con la observación de que a los estudiantes
de escuelas privadas les va mejor que a los estudiantes de escuelas públicas. Sin
recopilar más evidencia, no podemos elegir entre estas explicaciones y, por lo tanto,
debemos mantener la mente abierta sobre cuál tiene más sentido empírico.

También podría haber explicaciones metodológicas para el hallazgo de que los


estudiantes de escuelas privadas se desempeñan mejor académicamente. Estos
problemas metodológicos podrían socavar cualquier argumento de que existe una
conexión causal. ¿Los resultados se deben a formas cuestionables de medir los
logros? ¿De qué rango y número de escuelas se obtuvieron los datos? ¿En cuántos
casos se basan las conclusiones? ¿Podría el patrón ser simplemente una función del
azar? Todas estas son posibles explicaciones alternativas para el hallazgo de que los
estudiantes de escuelas privadas se desempeñan mejor.

Un buen diseño de investigación anticipará explicaciones contrapuestas antes de


recopilar datos, de modo que se obtenga información relevante para evaluar los
méritos relativos de estas explicaciones contradictorias. En este ejemplo de las
escuelas y el rendimiento académico, pensar de antemano en hipótesis alternativas
plausibles nos llevaría a conocer los recursos económicos de los padres, los recursos
de estudio disponibles en el hogar, las actitudes de los padres y el niño sobre la
educación y las habilidades académicas del niño antes. entrando a la escuela.

La falacia de afirmar el consecuente Aunque la evidencia puede ser


consistente con una proposición inicial, podría ser igualmente consistente
con un rango de proposiciones alternativas. Con demasiada frecuencia, las
personas ni siquiera piensan en las hipótesis alternativas y simplemente
concluyen que, dado que la evidencia es consistente con su teoría, entonces
la teoría es verdadera. Esta forma de razonamiento comete la falacia lógica
de afirmar el consecuente. Esta forma de razonamiento tiene la siguiente
estructura lógica:

Si A es verdadero, entonces B debe seguir.

Observamos B.

Por lo tanto A es verdadero.


14
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 15
INVESTIGACIÓN?

Si aplicamos esta lógica al tipo de escuela y la proposición de logro, la estructura lógica nada cambiará la mente del verdadero creyente. La teoría del intercambio
del argumento del tipo de escuela y el logro se vuelve más clara. (Homans, 1961; Blau, 1964) es en gran medida infalsable. Asume que
Proposición inicial: siempre maximizamos nuestras ganancias y evitamos costos. Pero
podemos ver casi cualquier cosa como una ganancia. Los grandes
·Las escuelas privadas producen mejores estudiantes que las escuelas públicas. sacrificios para cuidar a un pariente discapacitado pueden interpretarse
como una ganancia (satisfacción de ayudar) en lugar de una pérdida
La prueba: (ingresos, tiempo para uno mismo, etc.). Necesitamos enmarcar nuestras
proposiciones y definir nuestros términos de tal manera que puedan ser
Si A, entonces B Si las escuelas privadas producen mejores estudiantes (A), entonces refutados.
sus estudiantes deberían obtener mejores calificaciones finales que los de las escuelas
financiadas por el gobierno (B).
EL CARÁCTER PROVISIONAL DEL APOYO A LAS TEORÍAS
B es cierto Los estudiantes de escuelas privadas obtienen mejores notas finales que
los estudiantes de escuelas públicas (observe B). Incluso cuando la teoría se corrobora y ha sobrevivido a los intentos de
refutarla, la teoría sigue siendo provisional:
Por lo tanto, A es verdadera. Por lo tanto, las escuelas privadas producen mejores
estudiantes (A es verdadera).
El falsacionismo enfatiza la ambigüedad de la confirmación... la corroboración brinda
Pero como ya he argumentado, el mejor desempeño de los estudiantes de escuelas solo el consuelo de que la teoría ha sido probada y sobrevivió a la prueba, que incluso
después de las corroboraciones más impresionantes de las predicciones, solo ha
privadas también podría reflejar el efecto de otros factores. El problema aquí es que
alcanzado el estatus de 'todavía no refutada'. Esto... .está lejos del estado de "ser
cualquier número de explicaciones puede ser correcta y la evidencia no ayuda a verdadero". (Cook y Campbell, 1979: 20)
descartar muchas de ellas. Para el científico social este nivel de indeterminación es
bastante insatisfactorio. En efecto, sólo estamos en condiciones de decir:
Siempre puede haber una explicación no pensada. No podemos anticipar o
Si A [o C, o D, o E, o F, o...] entonces B. evaluar todas las explicaciones posibles. Cuantas más explicaciones
alternativas se hayan eliminado y cuanto más hayamos intentado refutar
Observamos B.
nuestra teoría, más confianza tendremos en ella, pero debemos evitar
Por lo tanto, A [o C, o D, o E, o F, o...] es verdadera. pensar que está demostrada.

Aunque la explicación (A) todavía está en proceso porque es consistente con las Sin embargo, podemos refutar una teoría. La lógica de esto es:
observaciones, no podemos decir que sea la explicación más plausible. Necesitamos
probar nuestra proposición más a fondo evaluando el valor de las proposiciones Si la teoría A es verdadera, entonces B debería seguir.
alternativas.
B no sigue.
FALSIFICACIÓN: EN BUSCA DE PRUEBAS PARA DESAPROBAR LA TEORÍA
Por lo tanto A no es verdadero.
Además de evaluar y eliminar explicaciones alternativas, debemos evaluar
rigurosamente nuestras propias teorías. En lugar de preguntar ' ¿ Qué evidencia
constituiría un apoyo para la teoría?', pregúntese '¿Qué evidencia me convencería de que Siempre que B sea una prueba válida de A, la ausencia de B debería hacernos
la teoría es incorrecta?' No es difícil encontrar evidencia consistente con una teoría. Es rechazar o revisar la teoría. En realidad, no rechazaríamos una teoría
mucho más difícil que una teoría sobreviva a la prueba de las personas que intentan simplemente porque un solo hecho u observación no encaja. Antes de
refutarla. rechazar una teoría plausible, requeriríamos múltiples refutaciones utilizando
diferentes medidas, diferentes muestras y diferentes métodos de recopilación
Desafortunadamente, algunas teorías son sistemas cerrados en los que cualquier evidencia y análisis de datos.
puede interpretarse como apoyo a la teoría. Se dice que tales teorías no son falsables. Muchas
religiones o sistemas de creencias se convierten en sistemas cerrados en los que la teoría puede En resumen, debemos adoptar un enfoque escéptico a las explicaciones.
acomodar toda la evidencia y Deberíamos anticiparnos a las interpretaciones rivales y recopilar datos para
permitir la selección de las explicaciones más débiles y la identificación de qué
teorías alternativas tienen más sentido empírico. También debemos preguntarnos qué perspectiva más exigente.
datos desafiarían la explicación y recopilar datos para evaluar la teoría desde esta
dieciséis
¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?

Resumen
Este capítulo ha esbozado el propósito del diseño de investigación tanto en la
investigación descriptiva como en la explicativa. En la investigación explicativa, el 2
propósito es desarrollar y evaluar teorías causales. Se discutió la naturaleza
probabilística de la causalidad en las ciencias sociales, en oposición a la causalidad
determinista. HERRAMIENTAS PARA EL DISEÑO DE
El diseño de la investigación no está relacionado con ningún método particular de INVESTIGACIÓN
recopilación de datos ni con ningún tipo particular de datos. Cualquier diseño de investigación
puede, en principio, usar cualquier tipo de método de recolección de datos y puede usar datos
cuantitativos o cualitativos. El diseño de investigación se refiere a la estructura de una
investigación: es un asunto lógico más que logístico.

Se ha argumentado que el papel central del diseño de la investigación es


Para lograr un diseño de investigación razonable, debemos atender una serie
minimizar la posibilidad de extraer inferencias causales incorrectas de los datos. El
de cuestiones antes de llegar al diseño final. La primera sección de este
diseño es una tarea lógica que se lleva a cabo para garantizar que la evidencia
capítulo describe estos pasos preliminares que preceden al diseño. Luego
recopilada nos permita responder preguntas o probar teorías de la manera más
amplía la idea de hipótesis rivales alternativas que se presentó en el Capítulo
inequívoca posible. Al diseñar una investigación, es esencial que identifiquemos el
1. La segunda sección presenta una serie de conceptos que son
tipo de evidencia requerida para responder la pregunta de investigación de manera
fundamentales para diseñar una buena investigación: validez interna, validez
convincente. Esto significa que no debemos simplemente recolectar evidencia que
externa y error de medición.
sea consistente con una teoría o explicación en particular. La investigación debe
estructurarse de tal manera que la evidencia también se relacione con
explicaciones rivales alternativas y nos permita identificar cuál de las explicaciones Antes del diseño
en competencia es más convincente empíricamente. También significa que no
debemos simplemente buscar evidencia que respalde nuestra teoría favorita: De la misma manera que un arquitecto necesita saber el propósito del edificio
también debemos buscar evidencia que tenga el potencial de refutar nuestras antes de diseñarlo (¿es un edificio de oficinas, una fábrica o una casa?), los
explicaciones preferidas. investigadores sociales deben tener clara su pregunta de investigación antes
de desarrollar un diseño de investigación.
Enfocar y clarificar la pregunta de investigación.

La primera pregunta que hay que hacer es: '¿Qué pregunta estoy tratando de
responder?' Especificar una pregunta es más que identificar un tema. No es
suficiente decir que estoy interesado en obtener algunas respuestas sobre la
ruptura familiar. ¿Qué responde a qué preguntas? ¿Quieres saber el alcance
de la ruptura familiar? ¿Quién es más vulnerable a la ruptura familiar? ¿
Cambiando las tasas de descomposición? ¿Durante qué período? ¿Dónde?
¿O realmente estás mirando las causas de la avería? ¿Los efectos de la
ruptura familiar? ¿Todos los efectos o solo algunos en particular?
ENFOQUE DE PREGUNTAS DE INVESTIGACIÓN DESCRIPTIVA

Para reducir el enfoque de la investigación descriptiva, necesitamos


especificar el alcance de lo que se va a describir. Las siguientes pautas,
utilizando la ruptura familiar como ejemplo, ayudan a reducir un tema de
investigación descriptivo a una pregunta investigable.
1 ¿Cuál es el alcance de los conceptos básicos? ¿Qué debe incluirse en el concepto de desintegración familiar? ¿Queremos decir divorcio? Qué pasa
18
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO DE 19
INVESTIGACIÓN? INVESTIGACIÓN

Pensar más allá de los individuos como unidades de análisis amplía el


¿ separación? ¿ Nos referimos únicamente a la ruptura de las relaciones rango de preguntas de investigación que hacemos y amplía el rango y las
maritales? ¿Nos referimos a la ruptura total o simplemente a malas relaciones? fuentes de datos disponibles. Por ejemplo, si los años fueran la unidad de
¿Qué pasa con las relaciones entre padres e hijos o entre hijos? Hasta que análisis, obtendríamos estadísticas de las agencias de recopilación
especifiquemos lo que queremos decir con nuestros conceptos centrales, será nacionales relevantes con respecto al divorcio para cada año. También
imposible comenzar la descripción. recopilaríamos

2 ¿Cuál es el marco de tiempo para la descripción? ¿Nuestro interés en el cambio se


produce a lo largo del tiempo o simplemente se derrumba en los niveles
contemporáneos de la familia ? Si se trata de cambio, ¿durante qué período?

3 ¿Cuál es la ubicación geográfica para la descripción? ¿El interés por la ruptura


familiar está en una comunidad en particular, en diferentes regiones o en toda la
nación? ¿Es comparativo, analizando el desglose en diferentes tipos de países (p.
ej., países altamente industrializados versus países que se industrializan
rápidamente versus países empobrecidos)?

4 ¿Cuán general debe ser la descripción? ¿Quiere poder describir patrones para
subgrupos específicos (por ejemplo, entre los que se casaron en la adolescencia,
entre los que tienen relaciones de hecho, segundos matrimonios, etc.)?

5 ¿Qué aspecto del tema te interesa? ¿Está el interés en tasas de desglose? ¿La
experiencia? ¿Leyes? ¿Actitudes y creencias?

6 ¿Qué tan abstracto es su interés? ¿Está su interés en la ruptura familiar o en la


ruptura familiar como reflejo de algo más abstracto (por ejemplo, fragmentación
social, conflicto social, individualismo, el papel del estado en la vida privada de los
ciudadanos)?

7 ¿Cuál es la unidad de análisis? La unidad de análisis es la 'cosa' sobre la que


recopilamos información y de la que sacamos conclusiones. A menudo se trata de
una persona (p. ej., una persona divorciada), pero pueden ser 'cosas' como
organizaciones (tribunales de divorcio), una familia en su conjunto, eventos (p. ej.,
divorcios), períodos (divorcios en diferentes años), lugares (comunidades , países).

Las preguntas que podamos responder dependerán de la unidad de análisis.


Podríamos comparar individuos divorciados con individuos no divorciados (el
individuo como unidad de análisis). Podríamos estudiar una serie de divorcios y
examinar cuál fue el proceso de divorciarse (evento como unidad de análisis).
Podríamos usar el año como unidad de análisis y realizar un seguimiento de los
cambios en las tasas de divorcio desde 1945. Utilizando países, podríamos
examinar las diferentes tasas de divorcio en diferentes tipos de países con miras
a comparar los patrones en diferentes tipos de países. Alternativamente, las
familias podrían sean las unidades de análisis y es posible que deseemos
observar las características de las familias que se divorcian (por ejemplo,
tamaño, ingreso familiar, tipo de familia, naturaleza de las relaciones en la
familia) en comparación con las de las familias que no se divorcian.
representan en los diagramas causales con el símbolo Z, como se ilustra en
la figura 2.1.
otra información sobre cada año (por ejemplo, nivel de empleo, tasa de inflación,
cambios en las leyes) que era relevante para las hipótesis. Variables extrañas Dos variables se pueden correlacionar sin estar
causalmente relacionadas. La correlación puede deberse a que los dos
PREGUNTAS DE INVESTIGACIÓN EXPLICATIVAS DE ENFOQUE factores son los resultados de una tercera variable (consulte el Capítulo 1).
Esta tercera variable se denomina variable extraña y también se simboliza
Al formular preguntas explicativas, necesitamos especificar más nuestro enfoque. La
como Z en los diagramas causales, y la forma de esta relación se ilustra en
investigación explicativa explora las causas y/o consecuencias de un fenómeno, por
la figura 2.2.
lo que la pregunta de investigación debe ser clara sobre el estilo de investigación
explicativa e identificar qué causas o consecuencias investigará.
Búsqueda de causas o efectos Este es el tipo de investigación explicativa
Antes de esbozar algunos tipos diferentes de investigación explicativa, es útil menos centrado. Implica identificar el fenómeno central (por ejemplo,
introducir algunos términos. cambios en la tasa de divorcio desde la Segunda Guerra Mundial) y luego
buscar las causas o consecuencias de esto. La búsqueda de las causas
Variable dependiente Esta es la variable que se trata como el efecto en el modelo implicaría identificar los posibles factores causales (p. ej., cambios de
causal: depende de la influencia de algún otro factor. La variable dependiente valores, declive de la religión, cambios en la composición de la población,
también se denomina variable de resultado y en los diagramas causales se cambios económicos, reformas legales, cambios en el apoyo social para
designa convencionalmente como la variable Y . familias monoparentales). Luego, diseñaríamos una investigación para
evaluar cuál de estas causas ayuda a explicar los cambios en las tasas de
Variable independiente Esta es la variable que es la supuesta causa. También se divorcio. Esta forma de pregunta de investigación se ilustra en la Figura 2.3.
le llama variable predictora, variable experimental o variable explicativa y se
designa en los diagramas causales como la variable X (como en educación (X) → Alternativamente, podríamos centrarnos en las consecuencias más que
nivel de ingresos (Y) ). en las causas de los cambios en la tasa de divorcio (Figura 2.4).

Variables intervinientes Estas variables se encuentran entre la variable


independiente y la variable dependiente en una cadena causal. Son los medios por
los cuales la causa X produce el efecto Y. Las variables intervinientes se
20
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO 21
INVESTIGACIÓN? DE INVESTIGACIÓN
Figura 2.4 Búsqueda de efectos

Exploración de una proposición causal simple Una pregunta de investigación más


enfocada especificará una proposición causal particular para evaluar (Figura 2.5).
Figura 2.5 Una proposición causal específica
Podría proponer un impacto de un factor particular o examinar una consecuencia
específica. Por ejemplo, podríamos proponer que los cambios en el gobierno Los
beneficios para padres solos han llevado a un aumento en las tasas de divorcio
desde la Segunda Guerra Mundial.
Modelos causales más complejos Tales proposiciones son simplistas en el sentido
de que no explican los mecanismos por los cuales los dos factores pueden estar
relacionados. Podríamos desarrollar modelos más complejos que detallen algunos
de los mecanismos en la cadena causal. Este modelo más completo se convierte en
el foco de la investigación y proporciona el marco dentro del cual se enmarcará el
diseño de la investigación (Figura 2.6).

Al aclarar una pregunta de investigación, es útil dibujar diagramas como los de las
Figuras 2.1 a 2.5. También es útil hacer cuatro preguntas clave:
1 ¿Qué estoy tratando de explicar (es decir, cuál es la variable dependiente)?

2 ¿Cuáles son las posibles causas (cuáles son las variables independientes)?

3 ¿Qué causas exploraré?

Figura 2.6 Un modelo causal más complejo para el aumento de divorcios

4 ¿ Qué posibles mecanismos conectan las supuestas causas con los


supuestos efectos (cuáles son las variables que intervienen)?

Otra forma de enmarcar las preguntas de investigación es formular diferentes


formas de comprender un fenómeno y luego comparar cuál de estos enfoques
en competencia se ajusta mejor a los hechos. Por ejemplo, podríamos
comparar tres formas diferentes de entender los cambios en las tasas de
divorcio: un enfoque económico, un enfoque de valores sociales y un enfoque
legislativo. El enfoque económico podría argumentar que los cambios en las
tasas de divorcio se derivan de factores económicos como el nivel de riqueza,
el acceso de las mujeres al trabajo y los niveles de asistencia social para los
padres solos. La explicación de los valores sociales podría tratar de explicar el
aumento de la tasa de divorcio en términos de niveles crecientes de
individualismo y una mayor aceptación social del divorcio. Ä El enfoque
legislativo podría centrarse en el impacto de los cambios legislativos, como el
divorcio sin culpa o las nuevas normas relativas a la división de bienes.

22
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO 23
INVESTIGACIÓN? DE INVESTIGACIÓN
EXPLICACIONES IDIOGRAFICAS Y NOMOTETICAS

Los ejemplos anteriores se enfocan en causas y consecuencias particulares e atributos de la pareja: su personalidad, sus valores y creencias y sus
intentan brindar solo una explicación parcial de los cambios en las tasas de divorcio. habilidades interpersonales. Podría centrarse en los factores económicos e
Estas explicaciones se denominan explicaciones nomotéticas: explicaciones interpretar la felicidad marital en términos de costos y beneficios para cada
parciales de una clase de casos en lugar de una explicación "completa" de un caso socio. Alternativamente, la explicación podría adoptar una perspectiva de ciclo
particular. Implican un examen de relativamente pocos factores causales y un mayor de vida que interprete las diferencias en la felicidad conyugal según el lugar en
número de casos. Por el contrario, las explicaciones idiográficas se centran en casos el que se encuentre la pareja en el ciclo de vida (por ejemplo, recién casados,
particulares y desarrollan una explicación lo más completa posible de cada caso. antes de tener hijos, niños pequeños, hijos adolescentes, nido vacío, vida
Implican examinar tantos factores como sea posible que contribuyen al caso, posterior). Un enfoque feminista podría tratar de explicar la felicidad marital en
incluidos factores únicos. términos de roles de género, división del trabajo y poder dentro de la relación.
Un demógrafo podría centrarse en las cohortes de nacimiento (por ejemplo,
Una explicación nomotética del divorcio podría centrarse en la importancia de un solo factor matrimonios de depresión, matrimonios de posguerra, matrimonios de los
contribuyente, como la transmisión intergeneracional del divorcio. ¿Es más probable que las años 90, etc.). Otros investigadores podrían tratar de explicar la felicidad
parejas se divorcien si uno de sus padres se ha divorciado? El estudio podría involucrar la marital en términos estructurales, como el nivel de desventaja social de la
comparación de personas que se habían divorciado con aquellas que no lo habían hecho para pareja. Los teóricos de las redes sociales podrían concentrarse en la medida
ver si los divorciados tenían más probabilidades de tener antecedentes familiares de divorcio.
en que una pareja está integrada en la familia y la comunidad más amplias y
Por el contrario, un enfoque idiográfico podría enfocarse en una pareja divorciada en particular
y construir una explicación completa de por qué esta pareja se divorció. La explicación
puede recibir apoyo de estas redes.
consideraría la historia familiar de la pareja y la examinaría junto con muchos otros factores
Esta lista no es exhaustiva. El punto es que diferentes enfoques (p. ej.,
contribuyentes. La explicación idiográfica nos proporcionaría con una buena comprensión del
caso, mientras que la explicación nomotética proporcionaría una comprensión de la influencia
psicológico, curso de vida, intercambio, estructural, feminista) tendrán un
de un factor. 'ángulo' particular que nos alerta sobre diferentes formas de ver un tema.
Cuando piense en un problema, hágase preguntas como "¿Cómo explicaría
Identificar hipótesis rivales plausibles esto una feminista?", "¿Cómo explicaría esto una psicóloga freudiana?", "¿
Cómo explicaría esto un teórico del intercambio?", "¿Qué podría explicar un
En el Capítulo 1 subrayé la importancia de identificar formas rivales plausibles de
conflicto?". dice el teórico?
explicar el fenómeno que se estudia. Obviamente tiene sentido anticipar estas
alternativas antes de realizar la investigación. Pero, ¿cómo identificamos estas Otros investigadores La investigación previa sobre el tema puede ser una rica
explicaciones alternativas? Hay dos tipos principales de hipótesis rivales y éstas fuente de explicaciones contrapuestas. Lea la literatura en revistas y busque
sugieren formas de anticipar explicaciones alternativas. bases de datos electrónicas. Los artículos de revisión y los resúmenes
RIVALES TEÓRICOS Y SUSTANTIVOS introductorios pueden ser extremadamente útiles.
No existe una forma mágica de producir un conjunto de explicaciones sustantivas o Los profesionales, los informantes clave, los encargados de formular políticas,
teóricas alternativas. Al final, el investigador debe formularlas. Cuanto más los defensores Los "internos" con conocimientos prácticos de un campo
familiarizado esté el investigador con el tema sustantivo particular y con los modelos pueden ser invaluables. En un estudio sobre el divorcio, los consejeros
y teorías de las ciencias sociales, es más probable que anticipe diferentes formas de matrimoniales, las parejas casadas, las personas divorciadas y los grupos de
interpretar un conjunto dado de resultados. A continuación se proporcionan fuentes defensa pueden brindar información valiosa. La literatura, como las novelas y
de explicaciones alternativas. las obras de teatro, también puede proporcionar ideas agudas que pueden
probarse sistemáticamente (p. ej., la novela de Tolstoi Ana Karenina ofrece
La literatura teórica Los enfoques amplios en una disciplina pueden presentar
una forma de interpretar la infelicidad conyugal).
diferentes formas de ver cualquier pregunta. Supongamos, por ejemplo, que
quisiéramos entender por qué algunas personas parecen tener matrimonios más Experiencia propia, corazonadas e intuiciones No ignore su propia
felices que otras. Una explicación podría concentrarse en lo personal experiencia, sus propias intuiciones y corazonadas. Al final, todas las
explicaciones comienzan con corazonadas que surgen de individuos que
tienen ideas y observan cosas a su alrededor. Use estas ideas, experiencias y
observaciones y probarlos sistemáticamente.

No existe una forma correcta de desarrollar ideas. No se limite a la


investigación formal en ciencias sociales oa la investigación sobre el tema
muy específico en el que está trabajando. Utilice diversas fuentes de ideas.
Lluvia de ideas con un grupo y
24
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO 25
INVESTIGACIÓN? DE INVESTIGACIÓN

matrimonial, bienestar e hijos. Esto implica definir estos conceptos, lo que a


debatir el tema. Piense lateralmente: si su tema es la ruptura del matrimonio, mire su vez requiere desarrollar una definición nominal y una definición operativa
más allá de la literatura sobre el matrimonio y el divorcio. de cada concepto.

Los conceptos, por su naturaleza, no son directamente observables. No podemos


RIVALES TÉCNICOS/METODOLÓGICOS
ver la clase social, la felicidad conyugal, la inteligencia, etc. Para usar conceptos en la
Si es probable que los hallazgos se deban a una medición deficiente (ver a investigación, necesitamos traducir los conceptos en algo observable, algo que
continuación), entonces cualquier interpretación teórica de estos resultados no podamos medir. Esto implica definir y clarificar conceptos abstractos y desarrollar
indicadores de los mismos. Este proceso de aclarar conceptos abstractos y traducirlos
será convincente. A lo largo de este libro identificaré muchos factores técnicos y
en medidas específicas y observables se denomina operacionalización e implica
metodológicos que pueden socavar las conclusiones que extraigamos de nuestra descender por la escalera de la abstracción.
investigación. Un buen diseño de investigación minimizará la amenaza de estas
fuentes.

No entraré en este punto en detalle en estas cuestiones metodológicas. Sin


embargo, será útil resaltar los tipos de rivales metodológicos que se examinarán.
Estos se describen en Goldenberg (1992).

1 Demanda características de la situación.

2 Características personales transitorias, como el estado de ánimo, la capacidad


de atención, la salud, etc. del encuestado.

3 Factores situacionales como el anonimato, las personas presentes cuando se


recolectaron los datos, el sexo, la edad y la clase del investigador y del
encuestado.

Muestreo de ítems ¿Están bien medidos los conceptos?

5 Naturaleza de la muestra ¿Podemos generalizar a partir de la muestra?

6 Falta de claridad del instrumento ¿ Son las preguntas claras y sin


ambigüedades?

7 Formato de la recopilación de datos ¿Son los resultados un artefacto del método


de recopilación de datos? ¿Se encontrarían patrones diferentes si se utilizara un
método diferente (observación del yo en lugar de cuestionario)?

8 Variación en la administración del instrumento en estudios de seguimiento del


cambio a lo largo del tiempo.

9 Errores de procesamiento/análisis.

Operacionalización
La mayor parte de la investigación en ciencias sociales implica hacer
observaciones que presumimos son conceptos básicos. Si estuviéramos
realizando un estudio sobre el efecto de la ruptura matrimonial en el bienestar de
los niños, primero tendríamos que averiguar qué se entiende por ruptura
En segundo lugar, decidir sobre una definición. De su lista, seleccione una
ACLARAR CONCEPTOS
definición o cree una definición mejor a partir de los elementos comunes de
varias definiciones. Explique y justifique su enfoque.
Antes de desarrollar indicadores de conceptos, primero debemos aclarar los
Tercero, delinear las dimensiones del concepto. Muchos conceptos tienen una serie
conceptos. Esto implica desarrollar definiciones tanto nominales como operativas
de dimensiones y es útil explicarlas en detalle, ya que pueden ayudar a refinar aún más
del concepto. su definición. Esto se puede ilustrar utilizando el concepto de bienestar del niño.
Definiciones nominales Los conceptos no tienen un significado fijo o correcto. La Podemos pensar en una serie de dimensiones del bienestar: emocional, psicológico,
físico, educativo, financiero, social, ambiental, legal, etc. Si estamos argumentando que
ruptura del matrimonio podría definirse en términos de la ley (por ejemplo, si se ha la ruptura del matrimonio afecta el bienestar de un niño, ¿de qué tipo de bienestar
otorgado el decreto nisi), la calidad de la relación o arreglos prácticos (viviendo estamos hablando? ? ¿Todos estos? ¿Solo uno o dos? Habiendo delineado varias
separados). Del mismo modo, necesitamos definir a los niños. ¿Se define a un dimensiones, deberá decidir cuáles son de interés en el presente estudio. Puede
niño por una relación de sangre, una relación legal (incluye adoptado), una relación examinar todos los aspectos o limitarse a uno o dos.
social (padres de hecho), edad cronológica, nivel de dependencia o algún otro
Un concepto puede tener subdimensiones. Supongamos que nos
criterio? Al decidir sobre el tipo de definición, proporcionamos una definición
enfocamos en el bienestar social. Este concepto amplio podría incorporar
nominal: especifica el significado del concepto pero sigue siendo abstracto.
subdimensiones como el nivel de seguridad en el vecindario, la naturaleza de
Diferentes definiciones producen diferentes hallazgos. En consecuencia, la definición de las relaciones del niño y sus experiencias de discriminación social. La
conceptos es una etapa crucial de la investigación. Debe hacerse deliberadamente y sub-mención de 'relaciones con otros' podría dividirse aún más en relaciones
justificarse sistemática y cuidadosamente. Hay tres pasos para desarrollar y reducir una con personas particulares como madre, padre, compañeros, hermanos y
definición nominal.
abuelos. Habiéndonos decidido por las relaciones particulares con las que
Primero, obtenga un rango de definiciones. Busque artículos de revisión, vamos a tratar, necesitaríamos identificar qué aspectos de las relaciones
diccionarios de disciplinas (por ejemplo, diccionario de sociología), enciclopedias medir y decidir cómo medirlos (ver más abajo). En la Figura 2.7 las relaciones
(por ejemplo, enciclopedia de ciencias sociales) y artículos de revistas. Busque se miden según el nivel de
definiciones explícitas e implícitas.
26
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO DE 27
INVESTIGACIÓN? INVESTIGACIÓN
contacto, conflicto, cercanía, ayuda y tipo de actividades compartidas. Estas
medidas o indicadores luego proporcionarían el núcleo alrededor del cual
enmarcar preguntas específicas o enfocar un estudio observacional.

En este ejemplo, me he centrado en una dimensión en cada nivel, pero


podría haber sido exhaustivo y haber desarrollado medidas para cada
dimensión y subdimensión concebible. La decisión de adoptar un enfoque
enfocado o exhaustivo dependerá de lo que le interese. La ventaja de
adoptar un enfoque sistemático como se describe en la Figura 2.7 es que
ayuda a enfocar y refinar la pregunta de investigación y lo obliga a tomar
decisiones. Decisiones deliberadas sobre cómo medir un concepto.

Definiciones operativas Habiendo definido los conceptos, desarrollará una


definición operativa: las observaciones para medir el concepto. ¿ Qué
indicadores de ruptura matrimonial usará? Podríamos definir operativamente
la ruptura del matrimonio según la calidad de la relación. Usando esta
definición podríamos medir el desglose según el nivel de conflicto, tipo de
comunicación, signos de falta de afecto y nivel de cooperación o falta de
cooperación.

La eficacia con la que dichos indicadores aprovechen el concepto definido


tendrá una influencia crítica en el valor de las conclusiones extraídas del
estudio. Si los indicadores apuntan a algo diferente de lo que afirmamos que
Figur hacen, nuestras conclusiones pueden cuestionarse fácilmente. Por ejemplo,
a 2.7 si nuestras medidas de ruptura matrimonial simplemente tocan las
Dim
ensi diferencias de clase social en el estilo marital en lugar de la ruptura, entonces
ona nuestras conclusiones sobre la ruptura matrimonial serán sospechosas.
mien
to Una vez que se ha desarrollado la definición operativa del concepto, llegamos a la
del
conc
etapa final de operacionalización. Esto implica la forma precisa en que se medirán los
epto indicadores. Esto podría implicar el desarrollo de preguntas para un cuestionario o la
de identificación de qué y cómo se realizarán las observaciones. La articulación de la
bien mecánica de estas estrategias está más allá del alcance de este libro.
estar
infan
til

Conceptos para el diseño de la investigación

Dos conceptos, validez interna y externa, son fundamentales para desarrollar


diseños de investigación. Idealmente, los diseños de investigación deberían
ser válidos tanto interna como externamente.

Validez interna

Necesitamos estar seguros de que el diseño de investigación puede sustentar


las conclusiones causales que reclamamos para él. La capacidad de un
diseño de investigación para hacer esto refleja su validez interna.
28 ¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?
HERRAMI
ENTAS 29
PARA EL
DISEÑO
DE
INVESTIG
ACIÓN

buena validez interna, pero su valor es limitado si los hallazgos solo se


Imagine un proyecto de investigación que compare el ajuste emocional de niños de familias aplican a las personas en esa investigación en particular. La pregunta crítica
divorciadas y familias intactas. Encuentra que los niños de familias divorciadas están menos es si es probable que los resultados se apliquen más ampliamente. La
adaptados que los niños de familias intactas. ¿Podemos concluir que el divorcio causó un
amenaza más común para
desajuste emocional? No sobre la base de estos resultados. El diseño no nos permite
eliminar explicaciones alternativas. La peor adaptación de los niños con padres divorciados
podría deberse a las diferencias de adaptación anteriores al divorcio de los padres.

Un estudio de investigación diferente puede abordar este problema mediante el


seguimiento de los niños antes del divorcio de los padres y durante algunos años
después. Puede encontrar que estos niños muestran una disminución significativa
en el ajuste emocional después del divorcio de sus padres. ¿Muestra el diseño de
la investigación que el divorcio está produciendo esta disminución en el ajuste? No.
La disminución de la adaptación puede reflejar simplemente una disminución
general de la adaptación emocional a medida que los niños crecen. La misma
disminución puede ser evidente entre los niños de familias intactas.

Otro estudio podría tratar de superar este problema rastreando los cambios en la
adaptación de los niños antes y después del divorcio de sus padres y también los cambios
entre los niños de familias intactas. Si los niños de familias intactas muestran menos deterioro
en el ajuste que los niños de familias divorciadas, esto seguramente debe demostrar el efecto
del divorcio. No. Tendríamos que estar seguros de que los dos grupos de niños eran
comparables en otros aspectos relevantes (por ejemplo, la edad). Las diferentes tasas de
cambio en el ajuste podrían deberse a que las personas de familias que se divorcian eran
más jóvenes en promedio. Tal vez los niños más pequeños muestren mayores cambios en la
adaptación durante un período determinado que los niños mayores. Puede que sean las
diferencias de edad, en lugar de tener padres divorciados, lo que explica los cambios de
adaptación de los dos grupos de niños.

La validez interna es la medida en que la estructura de un diseño de


investigación nos permite sacar conclusiones inequívocas de nuestros resultados.
La forma en que se organiza el estudio (p. ej., hacer un seguimiento de los cambios
a lo largo del tiempo, hacer comparaciones entre grupos comparables) puede
eliminar explicaciones alternativas para nuestros hallazgos. Cuanto más la
estructura de un estudio elimine estas interpretaciones alternativas, más fuerte
será la validez interna del estudio. Una tarea central del diseño de la investigación
es estructurar el estudio de modo que se minimicen las ambigüedades de los
ejemplos anteriores. Es imposible eliminar todas las ambigüedades en la
investigación social, pero ciertamente podemos reducirlas.

Validez externa

La validez externa se refiere a la medida en que los resultados de un estudio se


pueden generalizar más allá del estudio particular. Un estudio puede tener una
nuestra capacidad para generalizar más ampliamente a partir de un estudio de
investigación es el uso de muestras no representativas. Esta y otras amenazas a la
validez externa se analizarán con más detalle en los capítulos 5, 8, 11 y 14.

Error de medición
Otra amenaza para las conclusiones que se pueden extraer de cualquier estudio es
el error de medición. Esto ocurre cuando usamos indicadores defectuosos para
aprovechar los conceptos (consulte el Capítulo 1).

TIPOS DE ERROR DE MEDIDA


Los indicadores deben cumplir dos criterios fundamentales. Deben ser válidos y
fiables. Un indicador válido en este contexto significa que el indicador mide el
concepto que decimos que mide. Por ejemplo, una prueba de coeficiente
intelectual se utiliza para medir la inteligencia. Si realmente mide la inteligencia, la
prueba sería válida. Si la prueba de coeficiente intelectual midiera algo más, como
el nivel educativo o los antecedentes culturales, entonces sería una medida de
inteligencia inválida.

Confiabilidad significa que el indicador arroja constantemente la misma medida.


Por ejemplo, si las personas obtienen consistentemente la misma puntuación de CI
en pruebas de CI repetidas, entonces la prueba sería confiable. Si sus resultados
fluctúan enormemente dependiendo de cuándo toman la prueba, entonces no sería
confiable.

Validez La discusión anterior sobre la validez interna se relacionó con la validez del
diseño de investigación. Abordó la pregunta: ¿el diseño de la investigación está
entregando las conclusiones que afirmamos que entrega? Además, necesitamos
examinar la validez de las medidas utilizadas en cualquier pieza de investigación.

La validez de una medida depende tanto del uso que se le dé como de la muestra para la
que se utilice. Por ejemplo, la validez de usar la frecuencia de las discusiones entre los socios
para medir la felicidad conyugal gira en torno a lo que entendemos por felicidad conyugal. La
vigencia de esta medida puede variar para diferentes grupos culturales y para un mismo
grupo cultural en diferentes períodos históricos. Las medidas del ajuste emocional de los
niños variarán según su edad y su grupo cultural.

Hay tres formas básicas de evaluar la validez. La validez de criterio se adapta mejor a
situaciones en las que existen medidas bien establecidas de un concepto que necesitan
adaptarse, acortarse o actualizarse. Implica comparar la forma en que las personas califican
la nueva medida con la forma en que califican las medidas bien establecidas del concepto. Si
las calificaciones de la nueva medida coinciden con las de una medida establecida, podemos
estar seguros de su validez.

La validez de criterio tiene dos limitaciones. Primero, requiere que el punto de


referencia establecido sea válido. Si el punto de referencia no es válido, entonces
tiene poco valor para evaluar la nueva medida. En segundo lugar, no existen
medidas establecidas para muchos conceptos de las ciencias sociales.
A veces se pueden utilizar grupos de criterios para evaluar la validez de los criterios.
ser inútil.vruc
En lugar de comparar una medida con una medida de referencia existente, se puede
probar la nueva medida. Por ejemplo, se podría probar una nueva medida de felicidad ¿cambiar o simplemente medir 'ruido'?
marital en parejas que buscan asesoramiento marital. Esperaríamos que este grupo
de parejas normalmente obtuviera puntuaciones bajas en una medida válida de la La falta de confiabilidad puede provenir de muchas fuentes. La redacción deficiente
de la pregunta puede hacer que un encuestado entienda la pregunta de manera
felicidad marital. Si estas parejas realmente obtienen puntajes altos en la medida de la
diferente en diferentes ocasiones. Diferentes entrevistadores pueden obtener
felicidad conyugal, probablemente querríamos preguntarnos si la medida realmente diferentes respuestas de una persona: la coincidencia de edad, género, clase y etnia
estaba aprovechando la felicidad conyugal. de un entrevistador y entrevistado puede influir respuestas Hacer preguntas sobre las
personas que no tienen opinión, tienen información insuficiente o requieren una
La validez de contenido evalúa qué tan bien las medidas aprovechan los diferentes respuesta demasiado precisa puede conducir a datos poco confiables. Las respuestas
aspectos del concepto tal como lo hemos definido. Una prueba de habilidades a algunas preguntas pueden verse afectadas por el estado de ánimo y por el contexto
aritméticas que solo evaluara las habilidades de resta claramente no sería una medida particular en el que se formulan.
válida de las habilidades aritméticas. De manera similar, una medida de la felicidad
Las medidas deben ser válidas y fiables. Aunque estos dos conceptos están
conyugal que solo preguntara sobre la frecuencia de las discusiones entre los relacionados, no son lo mismo. Una medida puede ser confiable sin ser válida. Es decir,
cónyuges probablemente carecería de validez de contenido a menos que hubiéramos una medida puede ser incorrecta constantemente. Por ejemplo, las personas
definido la felicidad conyugal simplemente como la ausencia de discusiones. Las subestiman constantemente su nivel de consumo de alcohol en las encuestas de
medidas de felicidad conyugal también podrían incluir la naturaleza de las cuestionarios. Las medidas de consumo de alcohol son confiables pero no nos
informan con precisión sobre el verdadero nivel de alcohol consumido.
discusiones, las actividades de ocio compartidas por la pareja, la comunicación, los
métodos para resolver conflictos, la calidad de la relación sexual, etc. Las medidas nunca serán perfectamente fiables y perfectamente válidas. Estos no
son conceptos de todo o nada y el objetivo es maximizar la fiabilidad y la validez. Si
Dado el desacuerdo sobre el 'contenido' de muchos conceptos de las ciencias sociales, estos aspectos de la medición son débiles, los resultados del estudio que los utiliza
puede ser difícil desarrollar medidas que tengan validez acordada. Incluso si podemos podrían atribuirse plausiblemente a una medición deficiente en lugar de decirnos algo
ponernos de acuerdo sobre el concepto y medirlo usando toda una batería de preguntas, sobre la realidad social.
entonces nos enfrentamos al problema de la importancia relativa de los diversos componentes
de la medida. Por ejemplo, ¿deberían ser tan importantes las medidas de la frecuencia de las FORMAS DE ERROR DE MEDIDA
discusiones como la naturaleza de las discusiones, el método de resolución de conflictos, el
estilo de comunicación o las afirmaciones sobre el nivel de satisfacción marital subjetiva? El error puede tomar diferentes formas y las consecuencias del error
La validez de construcción se basa en ver qué tan bien los resultados que variarán dependiendo de su forma. Estas formas de error son
obtenemos al usar la medida se ajustan a las expectativas teóricas. Para validar una aleatorias, constantes y correlacionadas.
medida de felicidad marital, podemos anticipar, sobre la base de la teoría, que la El error aleatorio es aquel que no tiene una forma sistemática. Significa que en
felicidad variará de manera predecible según la etapa de la vida. ciclo. Si los algunos casos la medición de una variable puede ser demasiado baja, mientras que en
resultados de un estudio brindan confirmación, esto podría reflejar la validez de otros es demasiado alta. La medición del peso de una persona puede mostrar un error
nuestra medida de felicidad marital. Sin embargo, este enfoque para evaluar la validez aleatorio. A veces, las personas subestiman su peso mientras que otras pueden
sobreestimarlo, pero si estos errores son aleatorios, habrá el mismo número de
se basa en la corrección de nuestras expectativas. Si nuestra teoría no se respalda,
sobrestimaciones y subestimaciones y el tamaño de las sobrestimaciones será el
esto podría deberse a una de dos razones: la medida de la felicidad conyugal podría mismo en promedio que el de las subestimaciones. Cuando el promedio (media) se
ser incorrecta o la teoría con la que se compara la medida puede ser incorrecta. calcula para todo el grupo, será exacto porque las sobreestimaciones y las
subestimaciones se anulan entre sí. Además, estos cálculos erróneos no están
No existe una forma ideal de evaluar la validez. Si una medida pasa las tres correlacionados con ninguna otra característica (por ejemplo, sexo, edad) sino que son
pruebas, es más probable que sea válida, pero no podemos estar seguros. En última realmente aleatorios. Debido a que el error aleatorio no distorsiona las medias y no está
instancia, tendremos que argumentar a favor de la validez de nuestras medidas. correlacionado con otros factores, es menos grave que otras formas de error.

Confiabilidad Una medida confiable es aquella que da la misma 'lectura' cuando se El error constante ocurre cuando hay el mismo error en todos los casos. Por
usa en repetidas ocasiones. Por ejemplo, suponiendo que no hubo un cambio real, ejemplo, si todos reportaron su peso por debajo de 5 kilogramos, tendríamos un error
constante. Tal error no está correlacionado con otras características. Aunque el error
una medida confiable de la felicidad marital debería arrojar la misma d en diferentes
puramente constante será raro, habrá
ocasiones. Un termómetro que mide

10s o el próximo sería


32
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO DE 33
INVESTIGACIÓN? INVESTIGACIÓN

permitan elegir entre estas alternativas. Se proporcionaron pautas para


variables para las que normalmente habrá un componente de error constante (ego ayudar a identificar estas explicaciones alternativas.
exageraciones sobre la frecuencia de las relaciones sexuales y subestimaciones
sobre la cantidad de alcohol consumido). Debido a que dicho error es constante, no
se cancela sino que tiene un efecto en las estimaciones de la muestra. Por lo tanto,
el peso promedio de la muestra sería una subestimación en la medida del error
constante.

El error correlacionado ocurre cuando la cantidad y la dirección del error varían


sistemáticamente de acuerdo con otras características de los encuestados. Por
ejemplo, si las mujeres tienden a sobreestimar su peso mientras que los hombres lo
subestiman, entonces este error estaría correlacionado con el género. Si el formato
o el lenguaje en un cuestionario es difícil, entonces los errores al responder las
preguntas bien pueden estar correlacionados con la educación. entender la
pregunta que difiere.

Un objetivo crucial del diseño y la administración de instrumentos de encuesta es la


minimización de las diversas formas de error de medición. Lograr esto implica prestar
cuidadosa atención a la redacción de las preguntas, la calidad del indicador, la capacitación
del entrevistador y del observador, y las formas de identificar las respuestas de deseabilidad
social y otras formas de tergiversación deliberada por parte de los encuestados. En muchos
casos, es difícil identificar hasta qué punto ocurren realmente tales errores. Sin embargo, esto
no reduce la necesidad de hacer todo lo posible para minimizar su probabilidad y contar con
comprobaciones integradas para identificar algunas fuentes de error. Dichos controles
incluyen la búsqueda de inconsistencias en las respuestas, el uso de preguntas múltiples en
lugar de preguntas únicas para aprovechar los conceptos, la identificación de conjuntos de
respuestas de deseabilidad social, la realización de controles entre entrevistadores y la
supervisión cuidadosa del trabajo de campo.

Resumen

Este capítulo ha enfatizado la importancia de aclarar las preguntas y conceptos de


investigación antes de desarrollar un diseño de investigación. La falta de claridad
con respecto a la pregunta de investigación y los conceptos centrales de la
investigación comprometerán severamente cualquier diseño de investigación. Se
proporcionaron pautas para ayudar a enfocar las preguntas de investigación tanto
descriptivas como explicativas y para aclarar los conceptos que emplean.

Tampoco es prudente desarrollar un diseño de investigación a menos que se


hayan identificado formas alternativas de comprender el tema central de la
pregunta de investigación. Dado que uno de los propósitos del diseño de
investigación es ayudar a identificar cuál de una variedad de explicaciones
alternativas funciona mejor, es deseable que estas explicaciones alternativas se
identifiquen antes de desarrollar el diseño de investigación. Luego, el diseño se
puede estructurar de tal manera que se recopilen datos relevantes que nos
error de medición. Los capítulos posteriores evaluarán los diversos diseños
utilizando estos conceptos.
Finalmente, se discutieron tres conceptos centrales que están en el corazón de
un buen diseño. Estos fueron los conceptos de validez interna, validez externa y
LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA INVESTIGACIÓN

Si dos factores están causalmente relacionados, al menos deben estar


correlacionados: deben covariar. Si X causa Y, entonces las personas que
difieren entre sí en X deberían tender a diferir entre sí en Y. Por ejemplo, si
3 discutiéramos que trabajar en el sector privado en lugar del sector público
hace que las personas estén más orientadas al logro en el trabajo, lo
haríamos, en el mismo
LA CAUSALIDAD Y LA LÓGICA DE
DISEÑO DE LA INVESTIGACIÓN

Establecer relaciones causales está en el centro del diseño de la investigación


explicativa. Sin embargo, no es sencillo establecer que un evento causa otro
(Blalock, 1964; Hage y Meeker, 1988). La razón principal por la que es difícil
establecer relaciones causales es porque no podemos observar un fenómeno que
produzca cambios en otro. Aunque un evento siempre pueda seguir a otro, no
sabemos si esto se debe a que un evento causa al otro. Por lo tanto, las relaciones
causales deben inferirse en lugar de observarse. El propósito del diseño de
investigación en la investigación explicativa es mejorar la calidad de nuestra
inferencias causales.

Inferir relaciones causales

Criterios para inferir la causa

En el capítulo 1 distinguí entre conceptos probabilísticos y deterministas de


causalidad. Los enfoques probabilísticos de la causalidad son aquellos que
argumentan que un factor dado aumenta (o disminuye) la probabilidad de un
resultado particular. Por ejemplo, podemos argumentar que existe una relación
causal entre el género y el trabajo a tiempo parcial, que el género afecta la
probabilidad de trabajar a tiempo parcial. tiempo.

Para inferir que existe una relación causal probabilística entre dos variables, se
deben cumplir dos criterios básicos. Primero, debe haber covariación de las
variables causales y de resultado (por ejemplo, entre el género y ser un trabajador
a tiempo completo o parcial); y segundo , la afirmación de que una variable afecta
a la otra debe tener sentido.
CO-VARIACIÓN
orientación laboral podría deberse completamente a una tercera variable, como la
edad (Figura 3.1). Las personas más jóvenes podrían tener más probabilidades que las
personas mayores de trabajar en el sector privado y las personas más jóvenes también
podrían tener una mayor orientación al logro que las personas mayores. Estos dos
patrones harán que la orientación al logro y al sector estén correlacionados (más
jóvenes en el sector privado, por lo que el sector privado se asocia con la orientación al
logro). Sin embargo, el vínculo entre el sector y la orientación al logro es más una
coincidencia que una causal.

DEBE TENER SENTIDO

Cualquier afirmación de que la covariación refleja una relación causal debe


Figura 3.1 Una relación espuria ser plausible. Debe tener sentido en tres niveles.

Orden temporal Si dos variables están correlacionadas la causa debe


al menos, la necesidad de demostrar que los trabajadores del sector privado
preceder al efecto. El razonamiento causal no tiene tiempo para afirmar que
tenían una mayor orientación al logro que los trabajadores del sector público. Si
un evento futuro puede tener un efecto presente (explicación teleológica).
dos factores no covariaran, es decir, los trabajadores del sector público y privado
Nuestra proposición causal debe ser tal que la variable causal ocurra antes
tuvieran niveles idénticos de rendimiento laboral, sería difícil argumentar que están
que el supuesto efecto. El intervalo de tiempo entre la causa y el efecto
causalmente relacionados.1
puede ser de minutos o de años (por ejemplo, el efecto de la educación sobre
Sin embargo, aunque la covariación es una condición previa, no es suficiente para los ingresos puede tardar muchos años en manifestarse).
nosotros afirmar que las variables están causalmente relacionadas. Las correlaciones
también pueden reflejar relaciones no causales. Cuando dos variables o eventos están
Aunque dos variables pueden estar causalmente relacionadas, a veces
correlacionados pero no causalmente relacionados, la relación entre las dos variables se puede ser difícil determinar qué variable viene primero y, por lo tanto,
dice que es espuria (ver Capítulo 1). Por ejemplo, la correlación entre el sector de empleo y la
36
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 37
INVESTIGACIÓN? INVESTIGACIÓN

al estrategias como el pago de bonificaciones por desempeño, el desarrollo


establecer qué variable es la causa y cuál el efecto. Por ejemplo, ¿el sector de de una cultura de mayores expectativas, la provisión de mejores recursos y la
trabajo afecta la orientación al logro o es al revés? Incluso cuando afirmamos que creación de menor seguridad laboral. Cuando está respaldado por este tipo
una variable viene primero, la relación causal puede ser bidireccional. Es decir, el de razonamiento, cualquier correlación entre el sector de empleo y la
sector de empleo puede afectar la orientación al logro, lo que a su vez influye en orientación al logro puede interpretarse plausiblemente en términos
las decisiones futuras sobre el sector de empleo en el que uno trabaja. Las causales.
relaciones causales pueden ser recíprocas (bidireccionales) en lugar de
unidireccionales. Tipos de patrones causales

La variable dependiente debe poder cambiarse Si decimos que una correlación entre dos RELACIONES CAUSALES DIRECTAS E INDIRECTAS
variables se debe a que una está causando la otra, debemos asegurarnos de que la variable Las relaciones causales pueden ser directas o indirectas. Una relación
dependiente (el efecto) pueda cambiarse. Si no puede cambiarse, entonces existe una directa es aquella en la que afirmamos que la causa afecta el resultado
relación causal. cuenta de la relación no tiene sentido. Por ejemplo, cualquier relación causal directamente y no a través de otras variables. Una relación causal indirecta
entre el sexo y los ingresos solo podría ser en la dirección de que el sexo afecte los ingresos. es aquella en la que la causa tiene su efecto al operar a través de su
La proposición opuesta (ingresos→sexo) no tiene sentido.
influencia sobre otra variable que, a su vez, produce el efecto. La variable a
Plausibilidad teórica La afirmación causal debe tener sentido. Deberíamos poder través de la cual se relacionan las dos variables se denomina variable
contar una historia de cómo X afecta a Y si deseamos inferir una relación causal interviniente: se presenta en el tiempo y en una secuencia causal entre la
entre X e Y. Incluso si no podemos demostrar empíricamente cómo X afecta a Y, causa inicial y el efecto. Por ejemplo, podríamos argumentar que la forma en
debemos proporcionar una explicación plausible de la conexión (plausible en que el sector privado produce un mayor logro La orientación hacia el trabajo
términos de otra investigación, teoría actual, etc.). Por ejemplo, para apoyar la es hacer que los empleados teman por sus trabajos (la variable interviniente)
afirmación de que el sector del empleo afecta la orientación al logro, podríamos (Figura 3.2).
argumentar que el sector privado fomenta el desarrollo de una orientación al logro
Las relaciones causales indirectas pueden ser simples (como en la Figura 3.2) o
consistir en una cadena causal extendida o varias rutas causales diferentes
(Figura 3.3).

Figura 3.2 Una relación causal indirecta

a)Cadena causal larga

b)Múltiples caminos indirectos

Figura 3.3 Relaciones causales indirectas más complejas

TIPOS DE RELACIONES EN UN MODELO DE TRES VARIABLES

Cualquier relación entre dos variables constará de dos componentes: un


componente causal y un componente no causal (espurio). El componente
causal puede consistir en un componente directo, un componente indirecto o
ambos.

Se sigue entonces que cualquier relación entre dos variables puede


interpretarse como:

una relación causal directa

una relación causal indirecta

una relación espuria

cualquier combinación de estos.

La figura 3.4 ilustra las posibilidades en las que tenemos tres variables que, a efectos
del ejemplo, llamaré X, Y y Z. La relación entre X e Y podría ser cualquiera de las
siguientes:
(a) La causal directa Y sigue a X en el tiempo, Y es capaz de cambiar, y es
plausible que X pueda producir cambios en Y. A falta de encontrar cualquier
otra variable que sea responsable de esta relación, podemos continuar
argumentando que la correlación observada es directa y causal (Figura
3.4a).

(b) La causal indirecta Y sigue a X en el tiempo, Y es capaz de cambiar, y es


plausible que X pueda producir cambios en Y. Sin embargo, en este caso
estamos explicando el mecanismo por el cual X afecta a Y. Podemos
pensar de Z como un mecanismo único o un montón de variables
intervinientes (Figura 3.4b).

(c) Los espurios X e Y no están causalmente relacionados entre sí. Aunque


Y podría seguir a X en el tiempo y ser capaz de cambiarse, tanto X como Y
son efectos conjuntos de alguna tercera variable Z. X e Y covarían
puramente porque Z tiene un efecto simultáneo tanto en X como en Y
(figura 3.4c).

(d) Directo e indirecto El efecto de X puede ser en parte a través de su


efecto sobre una variable intermedia y en parte directo (Figura 3.4d).

(e) Causal directa e indirecta y espuria La relación entre X e Y podría


constar de tres componentes: una parte causal directa (X→Y), una parte
causal indirecta (X→Z→Y) y una parte espuria (XZ→Y ) (Figura 3.4e).

(f) Relación causal directa combinada con un componente espurio (Figura


3.4f).

(g) Relación causal indirecta combinada con un componente espurio


(Figura 3.4g).

Este conjunto de posibilidades resulta de situaciones en las que solo


tenemos tres variables. Cuantas más variables tengamos en cuenta, más
complejos se vuelven los asuntos.
Cuando recopilamos y analizamos datos, puede ser útil dibujar diagramas para
explicar las formas en que proponemos que las variables estén interrelacionadas.
Necesitamos especificar:

1 si se presume que las relaciones son causales o espurias

2 si se espera que las relaciones causales sean directas o indirectas

3 los mecanismos (variables intervinientes) subyacentes a cualquier


relación causal indirecta.
Resolver estos asuntos nos permite articular nuestra pregunta de investigación y la
línea de explicación más plausible.

Proporcionar un marco de referencia


La lógica de hacer comparaciones es fundamental para probar modelos causales.
En consecuencia, un elemento central en el diseño de un modelo explicativo.
40
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 41
INVESTIGACIÓN? INVESTIGACIÓN

Proposición El divorcio conduce a problemas emocionales en los


Proposición El divorcio conduce a problemas emocionales en los
niños pequeños. [divorcio→problemas emocionales de los niños]
niños pequeños. Proposición reformulada Los niños cuyos padres se
Observación Encontramos que muchos niños con padres divorciados han divorciado tienen más probabilidades de mostrar problemas
tienen problemas emocionales. emocionales que los niños cuyos padres no se han divorciado. [estado
civil de los padres→nivel de problemas emocionales]
Proposición Las escuelas privadas producen un alto rendimiento académico
entre sus estudiantes. [escuelas privadas→alto rendimiento] Observación Hay Proposición Las escuelas privadas producen un alto rendimiento académico
muchos casos de estudiantes de escuelas privadas que obtienen un alto entre sus estudiantes. Propuesta reformulada Las escuelas privadas tendrán
rendimiento. niveles más altos de rendimiento académico entre sus estudiantes que las
escuelas públicas. [tipo de escuela→nivel de rendimiento académico]

Proposición El desempleo juvenil es responsable del suicidio juvenil.


Proposición El desempleo juvenil es responsable del suicidio juvenil.
[desempleo→alta tasa de suicidio] Observación El 50% de los jóvenes que se Propuesta reformulada Los jóvenes desempleados tienen más probabilidades de
suicidarse que los jóvenes empleados. [situación laboral→tasa de suicidio]
suicidan están desempleados.

Figura 3.5 Proposiciones y observaciones sin marco de referencia comparativo


Figura 3.6 Uso de proposiciones con un marco de referencia comparativo explícito

El estudio de investigación proporciona un marco comparativo de referencia.


Se recordará que cuando decimos que dos variables están relacionadas
Diferentes diseños de investigación realizan la tarea de proporcionar significa que la variación o diferencia en una variable está ligada a las
comparaciones de diferentes maneras. diferencias en la otra variable. En este caso tenemos dos variables: (1) estado
civil de los padres (casados versus divorciados) y (2) ajuste emocional del niño
Comparando grupos (bajo versus alto). Si nuestro diseño de investigación incluyera solo a padres
divorciados, no podríamos decir nada sobre el impacto del divorcio en los
Al hacer comparaciones proporcionamos un marco de referencia dentro del cual niños. Incluso si el 100 por ciento de los niños de padres divorciados tuvieran
tratar de dar sentido a hallazgos particulares. La importancia de esto se puede ver un bajo nivel de ajuste emocional, no podríamos sacar conclusiones sobre el
en las ilustraciones de la figura 3.5. En estos ejemplos, la observación en cada impacto del divorcio de los padres en el ajuste emocional de los niños.
caso difícilmente proporciona un apoyo convincente a la proposición. Una de las Tendríamos que comparar el ajuste de los hijos de padres divorciados con el
razones de esto es que no existe un marco de referencia dentro del cual dar ajuste de los hijos de familias intactas. La diferencia en los niveles de ajuste en
sentido a las observaciones. No hay grupos con los que comparar y contrastar las los dos grupos proporcionará una fuerte evidencia sobre el supuesto efecto del
observaciones. Es solo haciendo comparaciones que nuestras observaciones divorcio en el ajuste emocional de los niños.
adquieren mucho significado y somos capaces de eliminar explicaciones
Las proposiciones en la Figura 3.5 solo mencionan un grupo en particular
alternativas.
(hijos de padres divorciados, estudiantes de escuelas privadas, jóvenes
La proposición de que el divorcio conduce a problemas emocionales en los niños suicidas). Puede ser útil reafirmar las proposiciones para resaltar las
pequeños nos animaría a esperar encontrar problemas emocionales entre los niños cuyos comparaciones implícitas. La figura 3.6 reafirma estas proposiciones usando
padres están divorciados. Pero encontrar tal evidencia no nos llevará muy lejos. Para comparaciones explícitas.
avanzar más en el camino de la explicación debemos hacer comparaciones. ¿ Los
problemas emocionales son mayores, iguales o menores que los de los niños de familias GRUPOS DE COMPARACIÓN MÚLTIPLE
intactas? ¿Las observaciones entre los hijos de padres divorciados reflejan simplemente lo
Las variables independientes anteriores (estado civil de los padres, tipo de
que encontraríamos entre cualquier grupo de niños?
escuela, situación laboral de los jóvenes) se han tratado como variables de
dos categorías (dicotomías). Sin embargo, no estamos restringidos a comparaciones de
42
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 43
INVESTIGACIÓN? INVESTIGACIÓN

MÚLTIPLES PRUEBAS PREVIAS Y POSTERIORES

solo dos grupos. Los grupos de comparación múltiples son posibles y surgirán de al
En el ejemplo anterior, la medición del ajuste emocional al comienzo del
menos dos circunstancias.
estudio a menudo se denomina 'pre-test' y la
Variables independientes con más de dos categorías Cuando las variables
independientes tienen más de dos categorías, podemos comparar más grupos y
proporcionar pruebas de teorías más sólidas y sutiles. Por ejemplo, al examinar el
efecto del divorcio en los hijos, podríamos simplemente clasificar los matrimonios
en divorciados o intactos, o podríamos clasificarlos como solteros (nunca casados),
intactos, separados, viudos, divorciados (reunidos) y divorciados (no vueltos a unir).
Si tomáramos el último enfoque podríamos hacer múltiples comparaciones. Al
hacerlo, podemos obtener una imagen más clara de lo que está sucediendo. Si
encontramos que son los hijos de padres divorciados que se han vuelto a unir los
que tienen más problemas, logramos una comprensión más enfocada del impacto
del estado civil de los padres en los niños. Hemos aprendido que no es el divorcio
per se sino los arreglos que siguen. divorcio que son críticos. Si simplemente
hubiésemos comparado matrimonios divorciados e intactos, nunca habríamos
identificado esto.

Efectos combinados de distintas variables independientes Es posible que sólo


cuando las personas tienen una determinada combinación de características se
produzca un efecto. Por ejemplo, pueden ser los efectos conjuntos del género y la
edad en lugar de cada uno por separado lo que está relacionado con el suicidio.
Podemos plantear la hipótesis de que cuando una persona es a la vez hombre y
joven, la probabilidad de suicidio es máxima. Si, para el propósito de este ejemplo,
pensamos en la edad como una variable dicotómica (15-35 = joven; 35+ = viejo),
entonces podemos pensar en términos de cuatro grupos basados en la
combinación de estas dos variables independientes. Estos se ilustran en la Figura
3.7.

Comparando puntos de tiempo

Un hallazgo de que los niños de familias divorciadas están menos ajustados


emocionalmente que los de familias intactas supone que el divorcio es responsable
de esta diferencia. El problema con una simple comparación entre grupos
(divorciados e intactos) es que no nos dice si el divorcio realmente ha producido
algún cambio en el ajuste emocional de los niños. Cualquier conclusión sería
mucho más convincente si pudiéramos rastrear el ajuste emocional de los niños.
tanto antes como después del divorcio para ver si hubo algún cambio en el ajuste
emocional de los niños después del divorcio.

Al rastrear a los niños a lo largo del tiempo, pudimos ver si hubo un cambio en el
ajuste emocional de los niños y evaluar si esto era atribuible al divorcio de sus
padres.
Podemos recopilar datos sobre más de dos puntos de tiempo en lugar de estar
Masculino Femenino restringidos a recopilaciones de datos simples de "antes" y "después". WNe podría tener
mediciones repetidas durante un período prolongado para rastrear 'altibajos' y para
rastrear tendencias antes y después de cualquier evento crítico. Múltiples 'pruebas
Joven Grupo 1: Grupo 2: previas' y múltiples pruebas posteriores pueden ayudar a distinguir entre tendencias a
corto y largo plazo. . También ayudan a identificar el efecto de la 'intervención' o variable
independiente. Por ejemplo, una simple medida de ajuste emocional antes y después
machos hembras del divorcio podría mostrar un declive en el ajuste. Pero, ¿qué pasaría si existiera una
jóvenes jóvenes
fuerte evidencia de que el declive comenzó mucho antes del divorcio? Solo múltiples
medidas antes del divorcio mostrarían que ya había comenzado una tendencia. De
manera similar, una simple prueba posterior podría mostrar que el ajuste es menor
Antiguo Grupo 3: Grupo 4: después del divorcio, pero varias pruebas posteriores podrían mostrar un ajuste
deficiente inmediatamente después del divorcio, pero una mejora constante con el
tiempo (consulte el Capítulo 6).
machos viejos hembras
Hacer comparaciones significativas
viejas
Idealmente, los grupos que estamos comparando deberían ser iguales en
todos los aspectos relevantes, excepto en lo que respecta a la variable
Figura 3.7 Grupos de comparación múltiple creados al combinar dos variables independientes independiente. Por ejemplo, si queremos probar la idea de que las escuelas
no gubernamentales producen estudiantes que obtienen mejores resultados
la nueva medición al final se llama 'post-test'. Entre el pre-test y el post-test ocurren ciertos académicos que las escuelas públicas, tendríamos que estar seguros de que
eventos críticos - en este caso el divorcio de los padres (o no-divorcio según sea el caso). ambos tipos de escuelas tenían estudiantes comparables. Necesitaríamos
Estos eventos sirven como variables independientes en el estudio, es decir, la supuesta esto para estar seguros de que la única diferencia relevante entre los dos
variable causal detrás del cambio observado. En algunos diseños, estos eventos intermedios grupos de estudiantes está en el tipo de escuela a la que asisten. Si los
se denominan intervención o tratamiento (consulte el Capítulo 4).
estudiantes difirieran en aspectos adicionales, ¿cómo podríamos
44
¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?

reduciremos el riesgo de confundir relaciones espurias con relaciones causales,


¿Sabe cuál de las diferencias fue responsable de las diferencias en el rendimiento es decir, más eliminaremos las explicaciones plausibles alternativas.
académico? Existen cuatro estrategias principales para maximizar la comparabilidad de los
Las comparaciones de niños de familias divorciadas y enteras se complican por el grupos.
hecho de que típicamente los niños de padres divorciados son mayores que los niños
de familias enteras. Cualquier diferencia entre el nivel de ajuste emocional de los dos PAREO
grupos de niños podría deberse a diferencias de edad más que al estado civil de sus Al reclutar los grupos, podemos emparejarlos deliberadamente en características
padres. relevantes. Por lo tanto, al comparar estudiantes que asisten a escuelas públicas
por un lado y escuelas privadas pagas por el otro lado, debemos asegurarnos de
El mismo problema puede surgir cuando se observa el mismo grupo o categoría de que los dos grupos de estudiantes sean similares en términos de inteligencia,
personas a lo largo del tiempo. Idealmente, con las comparaciones a lo largo del aspiraciones ,recursos de los padres,educación en valores, historia
tiempo, las únicas diferencias entre la prueba previa y la prueba posterior deben ser el familiar,género y edad. Al comparar lo similar deberíamos poder aislar el efecto del
evento que estamos proponiendo como la causa de cualquier cambio. Sin embargo, tipo de escuela en el rendimiento académico.
pueden ocurrir muchos eventos que pueden explicar el cambio y estos pueden
confundir nuestras comparaciones y nuestra atribución de lo que está detrás del El problema de comparar elementos similares es establecer la identidad de
cambio en la variable de resultado (consulte el Capítulo 4 para una discusión más todas las variables en las que necesitamos hacer coincidir los grupos. Podemos
detallada). hacer coincidir las características que sabemos que podrían contaminar nuestros
resultados, pero puede haber otros factores en los que no hemos pensado. .
Dado que las comparaciones son fundamentales para un buen diseño de
investigación, debemos asegurarnos de que sean significativas. Cuanto más Emparejamiento ex post facto Idealmente, los grupos deberían emparejarse al
podamos eliminar las diferencias involuntarias y desconocidas entre los grupos, más comienzo del estudio antes de los eventos críticos (por ejemplo, el divorcio, asistir
a la escuela). grupos de un grupo completo de participantes del estudio después de
que se hayan recopilado todos los datos. Por ejemplo, podríamos tener una gran
cantidad de estudiantes del gobierno y escuelas privadas de pago. De este grupo edad. Entonces podríamos comparar estos grupos y ver si había diferencias en su
podríamos extraer un grupo de estudiantes de escuelas gubernamentales y un grupo nivel de logro académico.
de estudiantes de escuelas privadas que pagan cuotas que son comparables en
términos de inteligencia, aspiraciones, recursos de los padres, - lm hont la importancia Hay muchos problemas con este enfoque. El más obvio es que debemos tener
de la educación, historia familiar, género y la información relevante con la cual emparejar. Dado que esto siempre será
limitado, es probable que los grupos permanezcan sin emparejar en factores
importantes pero desconocidos. Otro problema es que muchos casos de ambos
grupos simplemente no tendrán partidos del otro grupo y tendrán que ser
descartados. Si emparejamos en más de una pequeña cantidad de factores, a
menudo terminaremos con solo una pequeña cantidad de personas en el estudio,
ya que la cantidad de casos de ambos grupos que coinciden puede ser bastante
pequeña.2

ALEATORIZACIÓN
Una forma más simple y efectiva de hacer que los grupos sean comparables es
asignar aleatoriamente a las personas a diferentes grupos al comienzo de un
estudio. Al asignar individuos aleatoriamente a cada grupo, cualquier diferencia
entre los grupos debe ser aleatoria en lugar de sistemática. Siempre que los
grupos sean lo suficientemente grandes, la asignación aleatoria debería producir
automáticamente grupos con perfiles comparables en factores conocidos y
desconocidos. Desde una perspectiva estadística, la asignación aleatoria de
personas a grupos hará que los grupos sean idénticos para todos los intentos y
propósitos y proporciona lo que Davis llama el seguro de espuriosidad para todos
los propósitos de la aleatorización' (1985: 35). Controlamos por un número infinito
de hipótesis rivales plausibles sin especificar cuáles son (Campbell, 1989).

Este es el enfoque adoptado en los ensayos de fármacos. Los individuos se


asignan aleatoriamente a uno de varios grupos y luego a cada grupo se le
administra un fármaco diferente. Dado que los grupos deben tener perfiles
prácticamente idénticos para empezar, cualquier diferencia en los resultados entre
los grupos debe deberse a los diferentes tratamientos administrados a cada uno.
Sin embargo, este enfoque a menudo no es aplicable en la investigación social
porque las consideraciones prácticas y éticas nos impiden asignar personas a
grupos y luego hacer algo a un grupo para ver qué efecto tiene (ver Capítulo 5).
Ventajas y desventajas de este enfoque para la investigación social se analizan en
los capítulos 4 y 5.

DISEÑOS DE BLOQUES A JUEGO

Si bien la aleatorización minimiza las posibilidades de diferencias iniciales entre


los grupos, todavía existe la posibilidad de que haya diferencias entre los grupos,
especialmente en grupos más pequeños. Cuando queremos estar seguros de que
los grupos son comparables en una característica particular, podemos dar un paso
adicional. para garantizar que los grupos sean comparables al menos en variables
específicas. Esto se logra con lo que se llama el diseño de bloques aleatorios, una
combinación de aleatorización y emparejamiento.

Supongamos que quisiéramos evaluar el efecto sobre el rendimiento académico


de tres métodos de impartición de cursos universitarios: (1) impartición presencial
46
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 47
INVESTIGACIÓN? INVESTIGACIÓN
de conferencias y tutoriales, (2) correspondencia usando materiales escritos y (3)
electrónicamente usando Internet y correo electrónico. Además, supongamos que Intervenciones y variables independientes
pudiéramos asignar individuos a uno de estos tres modos. La asignación aleatoria A lo largo de este capítulo he utilizado los términos 'intervención', 'tratamiento',
sería la forma obvia. Pero supongamos que queremos estar absolutamente 'variable independiente' y 'grupos' más o menos indistintamente. Los diseños
seguros de que los estudiantes en cada uno de los tres modos tienen una de investigación varían en términos del tipo de variable independiente
capacidad académica comparable. empleada y del número de variables independientes integradas en el estudio.
Para conseguirlo haríamos lo siguiente:
TIPOS DE VARIABLES INDEPENDIENTES
1 Obtener una medida de capacidad académica en la prueba previa. Cuando se piensa en términos causales (X → Y) X es la variable
2 Clasifique a todos los estudiantes de mayor a menor habilidad. independiente. Cuando llevamos a cabo la investigación y hacemos el
análisis, comparamos los resultados (Y) para diferentes grupos. Los grupos se
3 Selecciona a los tres alumnos con mayor capacidad (porque tenemos tres modos definen según a qué categoría de la variable independiente pertenecen. En
de aprendizaje). Este grupo de tres alumnos es el bloque 1. algunos estudios, el investigador que introduce una intervención activa define
la variable independiente (por ejemplo, asigna a diferentes personas a uno de
4 Asigne aleatoriamente a cada uno de los tres estudiantes a un grupo (uno los tres modos de impartición del curso: presencial, por correspondencia o
para cara a cara, uno para correspondencia escrita y otro para aprendizaje electrónico). En otras situaciones, la variable independiente se define por una
electrónico). 'intervención' que ocurre naturalmente (por ejemplo, una persona se jubila o
permanece empleada). En otras situaciones, la variable independiente está
5 Seleccione los siguientes tres estudiantes más capaces (bloque 2) y repita la
determinada por los atributos relativamente fijos de los participantes (por
asignación aleatoria a los grupos.
ejemplo, sexo, educación, raza, etc.) más que por intervenciones de cualquier
6 Repita esto hasta que todos los estudiantes hayan sido asignados a uno de los tipo.
tres grupos.
NÚMERO DE INTERVENCIONES
CONTROLES ESTADÍSTICOS
Los diseños de investigación también pueden diferir en términos de la
Una forma alternativa de hacer que los grupos sean comparables es hacerlo en la cantidad de intervenciones que se realizan. Cuando la variable independiente
etapa de análisis de datos después de que se hayan recopilado los datos. Implica involucra una intervención activa o pasiva, podemos examinar el efecto de
un análisis multivariante que, en un aspecto, empareja grupos en variables intervenciones únicas versus repetidas. Podemos ver si una sola intervención
específicas (ver el Capítulo 12 para una discusión de la lógica de algunas de estas tiene un impacto diferente. que el impacto acumulativo de intervenciones
técnicas). repetidas. Por ejemplo, podríamos estar evaluando el impacto de los maestros
que dan a los estudiantes comentarios negativos sobre su trabajo. La crítica
Aunque los procedimientos del análisis multivariante pueden ser muy complejos, la lógica
esencial es simple. Supongamos que queremos comparar el ajuste emocional de los niños de
inicial del trabajo puede impulsar el esfuerzo y el desempeño de un
familias divorciadas e intactas, pero creemos que cualquier comparación se confundiría por el estudiante, pero la retroalimentación negativa repetida puede disminuir el
hecho de que, en promedio, los niños cuyos padres se divorcian son mayores que los de desempeño a medida que el estudiante pierde confianza. Un diseño de
familias intactas. Cualquier desajuste mayor entre los niños cuyos padres se han divorciado intervención múltiple ayuda a refinar nuestra comprensión de la forma en que
podría darse por ser mayores, ya que los niños mayores presentan mayor desajuste. las intervenciones afectan a los participantes y nos permite descartar formas
alternativas de interpretando resultados.
El análisis multivariado elimina cualquier efecto que pueda deberse a la edad comparando
iguales con iguales seleccionando, digamos, niños en edad preescolar y comparando a los de
familias divorciadas y sin daños para ver si, a pesar de la similitud de edad, los niños muestran
diferentes niveles de ajuste. Las mismas comparaciones podrían repetirse entre, digamos, Dimensiones de un diseño de investigación.
niños de 5 a 8 años, de 9 a 12 años, de 13 a 15 años, etc.

Las deficiencias obvias de este enfoque son similares a las del emparejamiento. Podemos La discusión anterior ha identificado seis elementos centrales de un diseño de
eliminar la influencia de las variables en las que hemos pensado y sobre las que tenemos investigación. La mezcla particular de los elementos en cualquier estudio
datos, pero no podemos eliminar los efectos de las variables desconocidas o de las que no producirá diferentes diseños.
tenemos datos. Dado que nunca podemos saber qué factores hemos pasado por alto, siempre
hay el peligro de que factores en los que no hemos pensado puedan estar contribuyendo a las Estos seis elementos principales en la producción de un diseño de
diferencias grupales. investigación son:

48 ¿QUÉ ES EL DISEÑO DE INVESTIGACIÓN?


LA
CAUSALID 49
AD Y LA
LÓGICA
DEL
DISEÑO
DE LA
INVESTIGA
CIÓN

Diseño experimental
1 El número de grupos en el diseño Los diseños variarán desde aquellos sin
La versión clásica del diseño experimental tiene los siguientes elementos:
comparaciones (por ejemplo, diseño de caso único de estudio de caso) hasta
aquellos con muchos grupos de comparación diferentes. 1 Una medida previa a la intervención (pre-test) sobre la variable de resultado.
2 El número de fases de medición de 'pre-test' Los diseños varían desde aquellos sin 2 Dos grupos: un grupo que está expuesto a la intervención (el grupo
'pre-test' (por ejemplo, diseños transversales y algunos diseños experimentales)
experimental) y un grupo que no está expuesto a la intervención (el grupo de
hasta aquellos con una serie de 'pre-tests' que establecen tendencias preexistentes
control).
antes de un evento.

3 El número de fases de medición 'post-test' Todos los diseños requieren al menos un


'post-test': la medición de una variable de resultado. En algunos diseños (por ejemplo,
transversales) habrá una 'prueba posterior', mientras que otros diseños pueden tener
muchas pruebas posteriores para ayudar a distinguir entre los resultados a corto y
largo plazo.

4 El método de asignación de casos a grupos En los diseños de grupos múltiples, los


grupos pueden ser comparables asignando personas a diferentes grupos mediante
asignación aleatoria, emparejamiento 'pre-test', emparejamiento post hoc o
emparejamiento de bloques o mediante el uso de controles estadísticos en la fase de
análisis.

5 La naturaleza de la intervención Los estudios que se basan en la variación existente


(diseños transversales y aquellos con variables independientes 'fijas') no tienen
intervenciones. Otros diseños se basan en intervenciones entre una prueba previa y
una prueba posterior. Estas 'intervenciones' pueden ser activas o naturales.3

6 El número deintervenciones Los diseños con una intervención pueden tener una
sola intervención o múltiples intervenciones. Se pueden usar múltiples intervenciones
para identificar el efecto de los 'tratamientos' acumulativos.

Una gama de diseños de investigación.


La combinación de las posibilidades creadas por estos seis elementos de un diseño
de investigación produce un gran número de diseños posibles. Spector (1981)
proporciona una útil discusión resumida de muchos de estos diseños. Para imponer
cierto orden en esta gama de posibilidades, es útil pensar en términos de cuatro
amplios tipos de diseño. Para cada tipo de diseño, las decisiones tomadas por el
investigador producirán variaciones dentro del tipo. Estos cuatro tipos proporcionan
la estructura para el resto del libro. Los cuatro tipos generales de diseño son
experimental, longitudinal, transversal y estudio de caso. Examinaré cada uno de
estos a su vez.
Este diseño se ilustra en la Figura 3.8.
Método de Prueba previa Intervención Post-prueba
El análisis de cualquier efecto de la intervención se centra en los cambios
asignación a (X) en el grupo experimental antes y después de la intervención y una
comparación con la tasa de cambio en el grupo de control. Si el cambio es
grupos
mayor en el grupo experimental que en el grupo de control, el investigador lo
atribuirá al impacto de la variable independiente (el tratamiento).
Aleatorio medir en 'Tratamiento' medir en
variable de variable de diseño longitudinal
(experimental resultado resultado
La forma básica de este diseño implica:
grupo) (Y) (Y)
1 Un grupo.

Aleatorio medir en Sin tratamiento' medir en 2 Una medición previa a la "intervención" en la variable de resultado.
variable de variable de 3 Una 'intervención' donde todos reciben el 'tratamiento'.
(grupo de resultado resultado
4 Una medición posterior a la "intervención" en la variable de resultado.
control) (Y) (Y)
En efecto, este diseño es similar al diseño experimental, excepto que no hay
Figura 3.8 Diseño experimental clásico un grupo de control y, por lo general, solo un grupo "experimental". El diseño
se ilustra en la Figura 3.9.

3 Asignación aleatoria a los grupos antes del pretest. El análisis en este diseño compara las medidas previas a la intervención
con las medidas posteriores a la intervención. El cambio en estos puntajes
4 Una intervención (prueba/tratamiento). puede reflejar la influencia de X en Y. Sin embargo, la ausencia de un control
aleatorio
5 Una medida posterior a la intervención (post-test) en la variable de resultado.

50
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 51
INVESTIGACIÓN? INVESTIGACIÓN

Método de Prueba previa Intervención Post-prueba 1 En lugar de intervenciones, el diseño transversal se basa en las variaciones
existentes en la(s) variable(s) independiente(s) en la muestra.
asignación a (X)
2 Está presente al menos una variable independiente con al menos dos
grupos
categorías.

Aleatorio medir en Tratamiento' medir en 3 Los datos se recopilan en un momento dado.


variable de variable de
resultado 4 No hay asignación aleatoria a 'grupos'.
(un grupo) resultado

(Y) (Y) Este diseño refleja la fase posterior a la intervención del diseño experimental
clásico, pero sin que se realice ninguna asignación aleatoria a "grupos". la
variable de resultado está vinculada con las diferencias de grupo. Es decir, ¿
Figura 3.9 Diseño longitudinal simple
en qué medida difieren los de las diferentes categorías de la variable
independiente en relación con la variable de resultado? Las relaciones
grupo dificulta saber si la intervención o algún otro factor produce algún cambio. causales se establecen mediante la utilización de controles estadísticos en
lugar de la asignación aleatoria de personas a grupos.
Diseño transversal
Este diseño se ilustra en la Figura 3.10. En este caso, la 'intervención'
Los elementos básicos del diseño transversal son los siguientes: simplemente está en una categoría diferente de la variable independiente.
Estudios de caso
Los diseños de estudios de caso se basan menos en la comparación de casos que Método de Prueba previa Intervención Post-prueba
en el análisis exhaustivo de casos individuales y luego en la comparación de casos. asignación a (X)
Una característica distintiva de los estudios de casos es que se recopila
grupos
información contextual sobre un caso para que tengamos un contexto dentro del
cual comprender los procesos causales.
No aleatorio Ninguna 'Tratamiento' medir en

variable de
resultado

(Y)

No aleatorio Ninguna Sin tratamiento' medir en

variable de
resultado

(Y)

Figura 3.10 Diseño de sección transversal simple

Los diseños de estudios de caso pueden consistir en un solo estudio de caso (p. ej.,
un estudio comunitario, un estudio de una organización) o una serie de estudios de
caso en los que quizás cada caso pruebe una teoría desde un ángulo diferente. Es útil
pensar en un estudio de caso de manera similar a un experimento. No rechazamos ni
aceptamos finalmente una teoría sobre la base de un solo experimento; tratamos de
replicar un experimento y llevarlo a cabo bajo una variedad de condiciones. De manera
similar, un proyecto de estudio de caso que implica un solo estudio de caso es análogo
a un solo experimento. Si se encuentran resultados similares en estudios de casos
repetidos, o se encuentran diferencias predecibles en los resultados para casos
particulares en el estudio, entonces desarrollamos una mayor confianza en los
hallazgos de los casos de la misma manera que ganamos confianza en los resultados
experimentales que se encuentran en experimentos repetidos.

Resumen
Este capítulo ha examinado formas de estructurar diseños de investigación para
ayudar a extraer inferencias causales convincentes de la investigación. Dado que las
causas no pueden observarse, deben inferirse de las observaciones. Sin embargo, es
fácil hacer inferencias incorrectas. El capítulo ha considerado formas de estructurar la
investigación para mejorar la calidad de estas inferencias. Se esbozó una variedad de
formas de interpretar las correlaciones entre variables y se proporcionaron los criterios
necesarios para inferir que una correlación refleja una conexión causal.

El capítulo enfatizó la importancia de hacer comparaciones significativas entre


grupos como un elemento central para sacar inferencias causales.

52
¿QUÉ ES EL DISEÑO DE INVESTIGACIÓN?

Una de las tareas del diseño de la investigación es estructurar la investigación de


modo que se puedan realizar comparaciones significativas de los resultados entre
los grupos.
PARTE II
Finalmente, el capítulo describió seis elementos centrales de los diseños de
investigación: número de grupos, número de pruebas previas, número de pruebas
posteriores, naturaleza de la asignación a los grupos, tipo de intervenciones y DISEÑOS EXPERIMENTALES
número de intervenciones. Los diseños de investigación varían en la forma en que
se tratan estos elementos. Luego se describieron brevemente cuatro tipos
principales de diseño de investigación: experimental, longitudinal, transversal y de
estudio de caso. Estas amplias categorías de diseño proporcionan el marco para el 4
resto de este libro.

TIPOS DE DISEÑO EXPERIMENTAL


notas
1 Puede haber excepciones a esto donde una variable supresora puede estar operando
para enmascarar una relación causal. Ver Rosenberg (1968: Capítulo 4).

2 Veremos más adelante que este problema de pérdida de casos puede superarse con
ciertas formas de análisis multivariante. Este capítulo se basa en los elementos del diseño de investigación descritos
en el Capítulo 3 para presentar una variedad de tipos de diseños
3 Una intervención que ocurre naturalmente es un evento que tiene lugar entre la prueba experimentales. Describe los diferentes entornos en los que se pueden
previa y la posterior sin que el investigador inicie ninguna intervención. Un ejemplo podría ser
realizar experimentos y describe variaciones de diseños experimentales
un estudio de familias a lo largo del tiempo en el que algunas familias experimentan el
divorcio de los padres. El divorcio es la 'intervención natural'.
tanto simples como más complejas. Este capítulo no busca evaluar diseños
experimentales: esa es la tarea del Capítulo 5. La discusión también
proporciona un marco útil dentro del cual comprender algunas de las
fortalezas y debilidades de los diseños de investigación discutidos más
adelante en este libro.

El diseño experimental clásico


El diseño experimental clásico se enfoca en dos variables: la variable
independiente (la causa/intervención) y la variable dependiente (resultado).
El propósito del diseño es eliminar la influencia de otras variables para que el
efecto de la intervención pueda ser evaluado. claramente visto. Dado que el
diseño experimental clásico se describió en el capítulo anterior, no hay
necesidad de repetirlo aquí. Sin embargo, un ejemplo ayudará a aclarar sus
elementos.

Supongamos que quisiéramos probar la proposición de la figura 4.1, es decir, cuanto


más difícil sea unirse a un grupo, más deseable parecerá el grupo.' Para probar esta
proposición es necesario desarrollar medidas de deseabilidad de membresía y definir
qué se entiende por 'dificultades para unirse'. La expresión podría referirse a cosas
tales como membresía restringida, largos períodos de espera, tarifas altas, duras
iniciación, compromisos de tiempo alto. Para el propósito de este ejercicio usaremos
'severidad de

54
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 55
Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2)

asignación a (X)
Prueba previa Post-prueba
grupos

Aleatorio E1 'Severo E2 Intercambio=E2-E


Figura 4.1 Proposición causal simple

asignación Promedio previo a iniciación' Promedio


la prueba posterior a la
iniciación en el grupo como indicador de la dificultad de unirse. El diseño
experimental clásico para tal investigación implica los siguientes pasos: (experimental prueba
puntuación de
1 Asignación aleatoria de personas a dos grupos: un grupo experimental y un grupo grupo) deseabilidad puntuación de
de control. deseabilidad

2 Obtención de medidas de deseabilidad percibida de pertenencia al grupo.


Aleatorio C1 sin C2 Cambio=C2-C1
iniciación
3 Someter al grupo experimental a severos requisitos de iniciación y al grupo de
Promedio previo a Promedio
control a ningún requisito de iniciación. asignación
la prueba posterior a la
4 Obtener medidas de deseabilidad de la pertenencia al grupo de ambos grupos (grupo de prueba
después de que se haya completado el inicio del grupo experimental. puntuación de
control) deseabilidad puntuación de
5 Cálculo del cambio en la deseabilidad de membresía para el grupo experimental deseabilidad
antes y después del inicio y del grupo de control en T1 y T2.

6 Comparar el nivel de cambio en el grupo experimental con el del grupo de control. Figura 4.2 Estructura del diseño experimental clásico

Si los cambios en la conveniencia percibida de la membresía son diferentes entre los Tiempo 1 (T1) Intervención Tiempo 2 (T2)
dos grupos (más de lo que se debe al azar), esto debería deberse a que un grupo
experimentó una iniciación severa. Esto se representa en la figura 4.2. Aquí, el (X)
Prueba previa Post-prueba
símbolo T1 representa el momento 1 o la prueba previa. E1 representa el grupo
experimental en el momento 1 y C1 representa el grupo de control en el momento 1. Experimental E1 'Severo E2 Intercambio=75-50
La cantidad de cambio en el grupo experimental es simbolizado como Ecambio y es
la diferencia entre la puntuación de deseabilidad del grupo en T2 en comparación con grupo Puntuación media = iniciación'
50 núcleo = =25
T1. El cambio comparable para el grupo de control puede simbolizarse como
Ccambio: el efecto de la intervención es la diferencia entre la cantidad de cambio en 75
mineral=50
el grupo experimental antes y después la intervención (Ecambio) y la cantidad de
cambio en el grupo de control (Ccambio) entre T1 y T2 (es decir, Ecambio-Ccambio).
Si es mayor que cero, probablemente concluiríamos que la iniciación tuvo un impacto Grupo de C1 sin C2 Cambio=60-50

en la deseabilidad. control iniciación


Puntuación media = núcleo = =10
Si la medida de deseabilidad se midió cuantitativamente en una escala de, 50
60
digamos, 0-100 con una puntuación alta que indica alta conveniencia, podríamos
cuantificar el efecto de la intervención (gravedad de inicio). Esto se ilustra con datos
hipotéticos en la Figura 4.3. Usando estas cifras podemos ver que: Figura 4.3 Diseño experimental clásico: efecto de la dificultad de unirse a un grupo
según la conveniencia percibida de pertenecer al grupo

1 Ambos grupos tenían el mismo nivel de deseabilidad antes del inicio


(resultado de la asignación aleatoria).
2 La puntuación de deseabilidad del grupo experimental aumenta (en 25 puntos). 4 Por lo tanto, algún cambio en el grupo experimental no se debe a la
iniciación (vale 10 puntos ya que este nivel se da sin iniciación).
3 La puntuación de deseabilidad del grupo de control también aumenta (en 10
puntos).
56
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 57

después de mostrar la película, a ambos grupos se les preguntaría


5 El cambio en el grupo experimental es mayor que en el grupo control (en 15 nuevamente sobre sus puntos de vista con respecto a las sanciones por
puntos). conducir bajo los efectos del alcohol. Si las opiniones del grupo experimental
cambiaron más que las opiniones del grupo de control, sería razonable
6 Por lo tanto, la severidad de la iniciación conduce en promedio a un aumento de suponer que ver la película provocó el cambio. El entorno de laboratorio
15 puntos en la percepción de conveniencia de pertenecer al grupo. permitió al investigador controlar todo, por lo que la única diferencia entre los
La lógica de este diseño experimental se basa en dos condiciones: grupos fue la exposición o falta de exposición a la película.

1 Los grupos son los mismos en todos los aspectos relevantes antes de cualquier
intervención (T1).

2 Los grupos experimentan las mismas condiciones entre T1 y T2 excepto por la


intervención/tratamiento específico.

Si alguna de estas condiciones no se cumple, existen hipótesis alternativas


plausibles que podrían explicar los diferentes cambios entre los grupos
experimental y de control. Los diferentes niveles de cambio podrían deberse a las
diferencias iniciales entre los dos grupos más que a la gravedad de la iniciación. Si
los dos grupos difieren en otras experiencias entre T1 y T2 (p. ej., mezclarse con
diferentes personas en el grupo), estas diferencias, más que la gravedad de la
iniciación, podrían explicar las diferentes tasas de cambio en los dos grupos.
Contextos experimentales

Los diseños experimentales se pueden implementar de tres maneras diferentes:


en un laboratorio, en el campo y utilizando sucesos naturales.
EXPERIMENTOS DE LABORATORIO

El experimento de laboratorio está diseñado para garantizar que los grupos


experimentales y de control estén expuestos exactamente al mismo entorno
excepto por la intervención experimental. Esto se logra estandarizando y
controlando el entorno y todos los eventos entre T1 y T2. Máximo control sobre el
El ambiente está diseñado para asegurar que la única razón factible para las
diferencias de grupo en T2 sea el trato diferencial.

Un ejemplo de un experimento de laboratorio es un estudio diseñado para


probar el efecto de imágenes extremadamente gráficas de accidentes de tráfico
causados por el alcohol en las opiniones sobre la conducción bajo los efectos del
alcohol. Los participantes podrían ser asignados aleatoriamente a grupos
experimentales y de control y se les preguntaría sobre sus opiniones con respecto
a las sanciones apropiadas por beber. -Conducción. Al grupo experimental se le
podría mostrar una película gráfica de accidentes provocados por el alcohol. A los
miembros del otro grupo no se les mostraría la película. En un momento específico
esfuerzo laboral y la estabilidad marital. Se midieron al comienzo del esquema y luego
en varios puntos a lo largo del experimento. Mientras participaban en el experimento,
Los experimentos de laboratorio se han utilizado con gran éxito en las ciencias físicas y estas familias continuaron con sus vidas normales y estuvieron sujetas a todas las
biológicas. Sin embargo, por diversas razones metodológicas, prácticas y éticas, su uso en la diversas experiencias y cambios adicionales (por ejemplo, cambios políticos y sociales)
investigación social ha sido limitado (véase el Capítulo 5). que tuvieron lugar durante el período del estudio.

EXPERIMENTOS DE CAMPO Participé en un experimento de campo realizado por el Departamento de


Seguridad Social de Australia (DSS). Fue diseñado para ver si la
Debido a la artificialidad y la impracticabilidad de los experimentos de laboratorio,
participación de los beneficiarios de asistencia social (clientes de DSS) en
los científicos sociales han establecido diseños experimentales en entornos del
grupos de autoayuda mejoraba su nivel de vida. Se establecieron varios
mundo real. En un experimento de campo, el investigador crea grupos
grupos de autoayuda en 80 lugares. Los clientes del DSS que vivían en esos
experimentales y de control mediante la asignación aleatoria de participantes. El
lugares podían elegir si participar o no en los grupos. Se obtuvieron medidas
experimento también implica una intervención. La intervención se implementa en
extensivas de los niveles de vida antes de la participación y 12 meses
el 'campo' donde un entorno de la vida real se trata como un laboratorio. Este
después. En cada uno de los 80 lugares, una muestra aleatoria de clientes de
enfoque se ha vuelto especialmente popular entre aquellos que evalúan iniciativas
DSS que no participaron en los grupos de autoayuda también fueron
políticas y programas piloto.2
interrogados acerca de sus niveles de vida. Estas personas actuaron como
Para ilustrar la naturaleza de los experimentos de campo, relataré las principales un grupo de control o comparación.
características de un estudio estadounidense sobre el mantenimiento del ingreso entre
familias de nivel socioeconómico bajo. El estudio se conoce como el Experimento de Claramente, este fue un intento de implementar la lógica del diseño
Mantenimiento de Ingresos de Seattle/Denver (Hakim, 1986). Casi 5000 familias de bajos experimental en una situación de campo. Sin embargo, el diseño tenía una
ingresos participaron en el experimento en la década de 1970. El propósito del estudio fue falla grave. Los participantes no se asignaron aleatoriamente a los grupos,
establecer el efecto de la introducción de un ingreso mínimo garantizado en el esfuerzo
laboral y la estabilidad marital de los participantes. Las familias se asignaron aleatoriamente
por lo que no sabemos si los que participaron en los grupos de autoayuda
a diferentes versiones del esquema (sin apoyo a los ingresos, apoyo a corto plazo, hasta fueron inicialmente similares a los que no participaron. Además no sabemos
ingresos garantizados a largo plazo). Entre las muchas variables medidas estaban el si
58
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 59

cambio total entre los dos grupos. En el ejemplo anterior (gravedad de la iniciación), el
los participantes y los no participantes estuvieron expuestos a influencias cambio total en el grupo experimental fue de 25 puntos en comparación con 10 puntos
en el grupo de control. La diferencia en el cambio total entre los dos grupos fue de 15
comparables durante el período de 12 meses. Observamos que a los
puntos: el efecto experimental.
participantes del grupo de autoayuda les fue mejor durante los 12 meses en
comparación con los miembros del grupo de control. Sin embargo, no pudimos Sin embargo, nos encontramos con problemas cuando cualquiera de estos
estar seguros de si esto se debió a la participación en los grupos de autoayuda o si factores externos influye más en un grupo que en el otro. Esto puede ocurrir
el tipo de personas que se ofrecieron como voluntarios para participar estaban al menos de dos maneras:
más orientados a la autoayuda antes del comienzo del experimento. Estas
diferencias iniciales podrían haber explicado su mayor mejora en los niveles de
1 Un grupo puede estar expuesto selectivamente a factores adicionales más
vida.
que el otro grupo.
Mientras que los experimentos de laboratorio tienen problemas de artificialidad,
2 Los factores externos pueden interactuar con la intervención. Es decir,
los experimentos de campo encuentran problemas por el control inadecuado de
cuando una persona está expuesta tanto a la intervención experimental
los eventos entre T1 y T2. Siempre existe el peligro de que los eventos no
como al factor externo, esta combinación tiene un efecto único que ni el
controlados, en lugar de la intervención experimental, produzcan los cambios
factor experimental ni el externo tienen por sí solos. Un ejemplo de un efecto
observados.
de interacción es evidente en el tratamiento de la depresión. El tratamiento
Sin embargo, otros factores (es decir, eventos no controlados) no deberían ser un farmacológico por sí solo puede tener algún efecto limitado sobre la
problema importante si tanto el grupo experimental como el de control están igualmente depresión, y la psicoterapia por sí sola puede tener algún efecto. Pero
expuestos a estas otras influencias. El cambio total en el grupo experimental entre T1 y T2 cuando los dos enfoques se usan juntos, pueden tener un impacto dramático
consta de dos elementos: el producido por la intervención y el el producido por otros eventos en la depresión. El impacto combinado es mucho mayor que el simple
intermedios.3 En el grupo de control, el cambio total se deberá enteramente a los otros impacto acumulativo de cada enfoque: es la combinación la que tiene el
eventos intermedios. Si los mismos eventos intermedios se aplican por igual a ambos mayor efecto.
grupos, aún podemos identificar el cambio experimental observando la diferencia en el
EXPERIMENTOS NATURALES
El experimento natural se basa en eventos que ocurren naturalmente como
intervenciones en lugar de intervenciones controladas inducidas por el Si podemos anticipar que ocurrirá un evento, podemos recopilar información
experimentador. antes y después para monitorear su impacto. Para ayudar a interpretar los
resultados, podríamos intentar identificar un grupo de comparación que no
estará expuesto al evento.

Un experimento natural es muy adecuado para estudiar el impacto de la


legalización de las máquinas de póquer en el bienestar familiar. Para tal
experimento obtendríamos medidas de bienestar familiar antes y después de
la legalización de las máquinas de póquer. Obtendríamos un grupo de
comparación midiendo el bienestar familiar en una región, estado o país
comparable en el que las máquinas de póquer seguían siendo ilegales. De
manera similar, un experimento natural es muy adecuado para examinar el
impacto de la introducción del divorcio sin culpa en las tasas de divorcio.
Examinaríamos las tasas de divorcio en un país antes y después de la
introducción del divorcio sin culpa y compararíamos la tasa de cambio con un
país comparable sin divorcio sin culpa.

Se puede lograr otra forma de experimento natural mediante la


construcción de grupos experimentales y de control después de que haya
ocurrido la 'intervención'. Supongamos, por ejemplo, que queremos
establecer cómo el regreso de las mujeres a la fuerza laboral impacta en la
división del trabajo doméstico y el cuidado de los niños. entre los cónyuges.
Recopilaríamos información de referencia sobre la división doméstica del
trabajo de parejas en las que la esposa no forma parte de la fuerza laboral
remunerada. Podríamos volver a la misma muestra varios años después,
anticipando que algunas esposas habrán regresado a la fuerza laboral. Estas
podrían tratarse como las grupo experimental, mientras que aquellas parejas
en las que la esposa permaneció fuera de la fuerza laboral constituirían el
grupo de control. Los cambios en quién hacía qué en el hogar se
compararían en los dos grupos para evaluar el impacto del regreso a la
fuerza laboral.

La dificultad aquí es que los grupos se forman a sí mismos en lugar de ser


creados por asignación aleatoria. Es posible que podamos unir regiones,
países o familias hasta cierto punto, pero la coincidencia tiene sus límites
obvios (consulte el Capítulo 3). Estos límites significan que los grupos que
estamos comparando pueden ser diferentes en aspectos importantes. Esto
necesariamente compromete nuestra capacidad de decir exactamente qué
está produciendo algún cambio o alguna diferencia entre los grupos. En el
ejemplo de los juegos de azar, el problema será encontrar una región
verdaderamente comparable en la que los juegos de azar sigan siendo
ilegales; con el divorcio, el problema será encontrar países verdaderamente
comparables. El ejemplo del trabajo doméstico encontraría el problema de
que las mujeres que regresan al trabajo pueden ser diferentes de las que se
quedan en casa.

Diseños experimentales más simples


En muchas circunstancias no podemos obtener todas las medidas requeridas por para el experimental). En algunas circunstancias, se pueden extraer
el diseño experimental clásico (pretest y postest tanto para el grupo control como inferencias válidas sin todos estos puntos de medición.
60
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 61

Este diseño implica la construcción de grupos experimentales y de control después de


Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2) una 'intervención' (ver discusión anterior sobre experimentos naturales).
asignación a (X)
Prueba previa Post-prueba
grupos

Aleatorio Ninguna 'Tratamiento' medir en

asignación variable de
resultado
(experimental
(Y)
grupo)

Aleatorio Ninguna Sin tratamiento' medir en

variable de
asignación resultado

(Y)
(grupo de
control)

Figura 4.4 Diseño experimental solo post-test con grupo control

Post-test solo con grupo control


Este diseño se ilustra en la Figura 4.4. Siempre que los grupos sean lo suficientemente
grandes, la asignación aleatoria a los grupos experimental y de control significa que cualquier
diferencia entre los grupos experimental y de control es aleatoria y no tendrá en cuenta las
diferencias en los resultados de los grupos. Por lo tanto, cuando formamos grupos utilizando
la asignación aleatoria, se puede omitir la fase de medición previa a la prueba.

Campbell y Stanley argumentan que:

Si bien la prueba previa es un concepto profundamente arraigado en el pensamiento de los


investigadores... en realidad no es esencial para los verdaderos diseños experimentales. Por
razones psicológicas, es difícil dejar de "saber con seguridad" que los... grupos fueron 'igual'
antes del tratamiento experimental diferencial. No obstante, la garantía general más
adecuada de ausencia de sesgos iniciales entre los grupos es la aleatorización (1963: 25).

Cuando se utiliza este diseño, no se puede emprender el análisis examinando diferentes


cantidades de cambio entre los grupos. Más bien, el análisis se enfoca en las diferencias
posteriores a la prueba entre los grupos. Debido a que los participantes han sido asignados
aleatoriamente a sus grupos, las diferencias posteriores a la prueba en la medida de
resultado deben ser las mismas que las diferencias en las puntuaciones de cambio de los
grupos experimental y de control en el grupo experimental clásico.

Diseño experimental retrospectivo


Los dos grupos podrían emparejarse para que sean comparables en al menos
Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2) algunas formas relevantes. Parte de la información para el cotejo se relacionaría con
eventos pasados. Esta información tendría que recopilarse preguntando sobre estos
asignación a (X) eventos pasados. El diseño también se puede mejorar refinando la medición del
Prueba previa Post-prueba cambio en la variable de resultado. Si simplemente tenemos medidas 'después' no
grupos podemos ver si, después de la 'intervención', un grupo ha cambiado más que el otro.
Para medir el cambio podríamos obtener medidas anteriores retrospectivamente y
Retrospectivo medir en 'Tratamiento' medir en luego evaluar la cantidad de cambio. Entonces, incluso si los dos grupos fueran
diferentes al principio, podemos ver si la cantidad de cambio en un grupo es mayor que
pareo variable de variable de en el otro.
resultado resultado
(experimental (Y) Por ejemplo, podríamos querer ver si tener hijos anima a las personas a
(Y)
ser políticamente más conservadoras.4 Para lograr este fin, podríamos
grupo)
comparar el nivel de conservadurismo político de un grupo de familias con
hijos y un grupo sin hijos. Dado que cualquier diferencia entre los grupos
Retrospectivo medir en Sin tratamiento' medir en
podría deberse a factores distintos de la paternidad, recopilaríamos otra
variable de variable de información sobre las familias y emparejaríamos los dos grupos para
pareo resultado resultado compararlos. Sin embargo, todavía no podemos estar seguros de que tener
(grupo de (Y) (Y) hijos haya producido cambios en las opiniones políticas. Para probar esta
control) proposición, podríamos pedir a los participantes que describieran sus puntos
de vista políticos en algún momento anterior a que tuvieran hijos. Esta
Figura 4.5 Diseño experimental retrospectivo
estrategia nos proporciona una medida pseudo 'antes'. Podríamos usar esta
medida para evaluar si los padres habían cambiado de manera diferente a
los que no eran padres.
los grupos no se forman a través de la asignación aleatoria, cualquier diferencia
entre los grupos podría reflejar simplemente diferencias "previas a la intervención".
Este diseño se puede mejorar de dos maneras usando datos retrospectivos
(Figura 4.5).
62
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 63

Método de Tiempo 1 Intervención Tiempo 2 Tiempo 3 Tiempo 4 Aleatorio Medida Sin Medida Medida Medida

asignación a (T1) (X) (T2) asignación sobre el 'tratamiento' en el sobre el sobre el


(T3) (T4)
resultado resultado resultado resultado
grupos
Prueba Post-prueba (control variable variable variable
Post-prueba Post-prueba variable
previa 1 grupo) (Y)
3 (Y) (Y) (Y)
2

Aleatorio Medida Tratamiento'Medida Medida Medida Figura 4.6 Diseño experimental con múltiples pruebas posteriores

asignación sobre el resultado sobre el sobre el


sobre el resultado resultado resultado
Diseños experimentales más complejos
(experimental variables
variable variable
variables Podemos agregar al diseño experimental clásico introduciendo más de dos
grupo) (Y) (Y)
(Y) (Y) grupos, agregando medidas adicionales previas y posteriores a la prueba e
incluyendo más de una variable independiente.

Múltiples pruebas posteriores


Dado que es posible que los efectos de una intervención no se manifiesten de
inmediato o solo duren poco tiempo, las pruebas posteriores múltiples pueden
ayudar a identificar los resultados a corto y largo plazo. Por ejemplo, la reforma de la Múltiples variaciones. Puede haber varias intervenciones alternativas para evaluar.
ley de divorcio diseñada para simplificar el divorcio puede producir inicialmente un Por ejemplo, podemos estar interesados en el efecto del voto obligatorio en la
fuerte aumento de los divorcios (demanda reprimida, formalización de la ruptura participación electoral. Podríamos considerar cinco condiciones: (1) voto
familiar), pero a largo plazo la tasa de divorcio puede disminuir y estabilizarse en los completamente voluntario, (2) compulsión sin sanciones por incumplimiento, (3)
niveles anteriores a la reforma. compulsión con una advertencia solo por la primera infracción, (4) compulsión con una
multa de $ 50 por incumplimiento , (5) coacción con multa de $250 por incumplimiento.
En la Figura 4.6 se representa un diseño experimental de post-prueba múltiple. El Después de asignar aleatoriamente a los individuos a uno de cinco grupos, podríamos
mismo diseño podría modificarse para proporcionar múltiples pruebas previas para preguntarles sobre su intención de votar en las próximas elecciones. Suponiendo que
estimar en qué medida se estaba produciendo el cambio antes de la intervención el voto voluntario sea el statu quo, a cuatro de los cinco grupos se les dirá que el voto
para ver en qué medida la intervención acelera o desacelera la tasa de cambio. será obligatorio en las próximas elecciones. A cada grupo se le dirá algo diferente
sobre las sanciones que se impondrán por no votar. . El grupo de control creerá que el
Múltiples grupos voto seguirá siendo voluntario. Después de recibir esta información, se preguntará a las
personas de cada grupo sobre su intención de voto. Las diferencias en las intenciones
Hasta ahora solo he descrito diseños donde la variable independiente o la de voto T2 de los cinco grupos deben reflejar el efecto de la compulsión en la intención
intervención tiene dos categorías. Sin embargo, las intervenciones con frecuencia de voto declarada. . Este diseño está diagramado en la Figura 4.7.
tienen

Diseño de cuatro grupos de Salomón

Un problema al diseñar experimentos que tienen fases de medición antes y después es


que hacer mediciones puede producir cambios por sí mismo, independientemente de
cualquier intervención. Este es el problema de la reactividad del instrumento. En la
medida en que el cambio pueda atribuirse al efecto de la medición en lugar del
"tratamiento" experimental, los resultados seguirán siendo ambiguos.

El diseño de cuatro grupos de Solomon ayuda a evaluar si el cambio en la variable


de resultado se debe a la reactividad del instrumento (Figura 4.8). En este ejemplo,
describo este diseño para una variable independiente con solo dos categorías, pero la
lógica del diseño podría extenderse fácilmente a variables independientes con más de
dos categorías o condiciones.

Usando este diseño, el grupo experimental se divide en dos subgrupos, al igual que
el grupo de control. Un grupo experimental implica una prueba previa mientras que el
otro no. Las mismas condiciones se aplican al grupo de control. Si no hay reactividad
del instrumento, los dos grupos experimentales deberían puntuar de forma idéntica en
las medidas de resultado en T2, al igual que los dos grupos de control. Cualquier
diferencia entre las puntuaciones T2 de los dos grupos experimentales o de los dos
grupos de control debe atribuirse a la reactividad del instrumento.

El ejemplo de la Figura 4.9 ilustra este diseño con figuras. Por el bien del
ejemplo, la variable de resultado se mide en una escala de 0 a 100. En los
grupos experimentales, el grupo de prueba previa obtuvo una puntuación de
80 en comparación con una puntuación de 70. para el grupo experimental sin
el pretest. Si podemos suponer que no hubo otras diferencias entre los
64
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL sese
nta y
cinco
Podría preguntarse, ¿por qué molestarse en usar un diseño tan complicado
Método de asignación Tiempo 1 (T1) Intervención Tiempo 2 (T2)
para eliminar el efecto de la prueba previa? ¿No podríamos haber logrado el
a grupos (X) mismo resultado simplemente eliminando la prueba previa por completo y
Prueba previa Post-prueba
comparando las puntuaciones T2 de un solo grupo experimental y un solo
control? ¿grupo? Habríamos llegado exactamente a la misma respuesta. Sin
Asignación aleatoria % con intención Compulsión %con la intención
embargo, cuando tenemos grupos pequeños, la aleatorización puede ser
votar sin que votar insuficiente para eliminar las diferencias iniciales.
(grupo experimental sanciones
1)

Asignación aleatoria %con la intención Compulsión con %con la intención


votar advertencia votar
(grupo experimental inicial

2)

Asignación %con la intención Compulsión con %con la intención

aleatoria votar multa modesta como votar


sanción
(grupo experimental 3)

Asignación %con la intención Compulsión con %con la intención

votar fuerte multa como votar


aleatoria
sanción
(grupo experimental

4)

Asignación aleatoria %con la intención Sin compulsión %con la intención


votar votar
(grupo de control)

Figura 4.7 Diseño experimental con múltiples grupos y una prueba previa y una prueba
posterior

dos grupos, entonces la discrepancia de 10 puntos entre los dos grupos es


atribuible al efecto de la única otra diferencia entre los dos grupos: estar expuesto
a una prueba previa. La misma lógica se puede aplicar a los dos grupos de control.

El efecto real de la intervención sería la diferencia entre el grupo experimental y el grupo


de control sin el efecto de la reactividad del instrumento. Esto nos daría una puntuación de
70 para el grupo experimental y una puntuación de 50 para el grupo de control. concluyen
que la intervención tuvo un efecto de 20 puntos.
Figura 4.8 Diseño de cuatro grupos de Solomon

Método de asignación Tiempo 1 (T1) Intervención Tiempo 2 (T2)


a grupos (X)
entre los dos grupos y es posible que deseemos realizar pruebas previas para
Prueba previa Post-prueba medir el cambio. En tales casos, es posible que necesitemos este diseño más
complejo.
Asignación aleatoria medir en 'Tratamiento medir en
diseños factoriales
variable de variable de
(grupo experimental) resultado resultado Todos los diseños experimentales hasta ahora se han ocupado de una sola
(Y) variable independiente. Sin embargo, a menudo desearemos evaluar los
(Y)
efectos de varias variables independientes. Podríamos, si tuviéramos el
tiempo y los recursos, realizar un experimento separado para cada variable
Asignación aleatoria Ninguna Tratamiento' medir en
independiente y, con suerte, averiguar qué variable independiente tuvo el
variable de mayor efecto.
(grupo experimental) resultado
Pero los experimentos separados serían tanto ineficientes como poco prácticos.
(Y)
Más importante aún, los experimentos separados no nos permitirían ver cómo las
diversas variables independientes trabajan juntas en combinaciones particulares
Asignación aleatoria medir en Sin tratamiento medir en
para producir efectos únicos. Una variable independiente puede tener un efecto por
variable de variable de sí sola (llamados efectos principales o efectos directos) o en combinación con otras
(grupo de control) resultado resultado variables (efectos de interacción). Un efecto principal es cuando,
independientemente de cualquier otra cosa, la variable afecta el resultado. Un efecto
(Y) (Y)
de interacción ocurre cuando el efecto de una variable independiente depende, al
menos en parte, de la presencia de otros factores.
Asignación Ninguna Sin tratamiento' medir en

aleatoria variable de
resultado

(grupo de control) (Y)

66
DISEÑOS TIPOS DE DISEÑO EXPERIMENTAL 67
EXPERIMENTALES
reactividad del
Asignación Ninguna Tratamiento Media=70 instrumento
Método de Tiempo 1 Intervención Tiempo 2
aleatoria
asignación (T1) (X) (T2)
(experimental
a grupos
Prueba Post-prueba
(dno.6
previa

Asignación Media=50 Sin Media=60 Diferencia entre


Asignación Media=50 'Tratamiento' Media=80 Diferencia entre tratamiento'
grupos de control es
aleatoria grupos aleatoria 10
experimentales
(60 menos 50). Esto
(experimental es 10(80 menos 70). (grupo de control)

grupo) Esto es atribuible a


Ninguna es atribuible a
Asignación Sin Media=50
tratamiento'
reactividad del
aleatoria instrumento Mando(X1)

Alto(a) Bajo(b)
(grupo de control)
Grupo 1 Grupo 2

Figura 4.9 Ejemplo hipotético del diseño de cuatro grupos de Solomon Male(a) machos machos

Por ejemplo, el alcohol, por sí solo, afecta el estado de ánimo. Las anfetaminas, por Gender con altura con bajo
sí solas, también afectan el estado de ánimo. Los efectos son efectos principales:
control control
cada uno tiene un efecto por sí solo. y más allá del alcohol o las anfetaminas de forma
independiente. Esto será más que un simple efecto aditivo: será un efecto único que
solo se produce al mezclar las dos drogas. De manera similar, dar a los trabajadores Grupo 3 Grupo 4
más control sobre su trabajo podría mejorar la satisfacción laboral de todos (efecto
principal), pero podría tienen más efecto en determinados tipos de personas, como (X2) Hembras Hembras
profesionales o personas mayores (efecto de interacción).
con altura con bajo
Female (b)
El propósito de los diseños experimentales factoriales es examinar
simultáneamente los efectos directos (efectos principales) de una serie de variables control control
independientes y ver cómo varias combinaciones de características trabajan juntas
para producir un efecto. La versión más simple de este diseño se llama diseño Figura 4.10 Definición de grupos en un diseño factorial 2x2
factorial 2x2. , que es uno basado en dos variables independientes, cada una con solo
dos categorías. Este diseño simple de 2 x 2 se puede extender fácilmente a más de
dos variables, cada una de las cuales puede tener dos o más categorías o (Figura 4.10). La variable dependiente (Y) es la satisfacción laboral medida en
condiciones. una escala de 0 a 100, donde 100 indica una satisfacción muy alta. Una variable
independiente es el grado de control sobre la propia situación laboral (X1)
El diseño simple 2x2 se puede ilustrar mejor con un ejemplo en el que tenemos dos clasificada simplemente como control bajo y alto. La otra variable independiente
variables independientes y una variable dependiente la variable es género (X2).

Un diseño factorial implica formar grupos experimentales para cada


combinación posible de las dos variables independientes. En este caso los
cuatro grupos son los definidos en la Figura 4.10. Simbólicamente, las dos
variables independientes se pueden representar como X1 (control) y X2
(género). Las categorías de cada uno se pueden representar como 'a' y 'b'. Por
lo tanto, los machos con alto control se pueden simbolizar como X1aX2a,
mientras que las hembras con bajo control se simbolizarían como X1bX2b.

En este caso particular, dado que el género es una variable independiente


pero no es una 'intervención', comenzaríamos con un grupo de hombres y un
grupo de mujeres seleccionados al azar (Figura 4.11). A cada uno de estos
grupos le introduciríamos el ' tratamiento' de alto y bajo control laboral. La mitad
de los hombres serían asignados aleatoriamente a un ambiente de trabajo de
bajo control y la otra mitad a un ambiente de trabajo de alto control. Lo mismo se
aplicaría a las mujeres. Así tendríamos cuatro grupos para los cuales luego
obtendríamos medidas de antes y después.

El número de grupos crece si cualquiera de las variables tiene más de dos categorías.
Quizás sea más difícil visualizar lo que sucedería con tres o más variables. Podemos
hacer esto simbólicamente cuando tenemos tres variables independientes con un número
variable de categorías: X1 ( dos categorías llamadas a y b), X2 (dos categorías llamadas a
y b) y X3 (dos categorías llamadas a y b). La primera categoría de la primera variable se
puede simbolizar como X1a y la segunda categoría como X1b; la primera categoría de la
segunda variable independiente se representa como X2a; y así. La tabla 4.1 ilustra el número de variables independientes.
grupos que podrían producirse por cada una de las posibles combinaciones de estas tres
68
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 69

X1b X2b EX 7
Método de asignación Tiempo 1 (T1) 'Intervenciones' Tiempo 2 (T2)
X1b X2b X3b 8
a grupos (X1 y X2)
Prueba previa Post-prueba

Asignación aleatoria medir en X1aX2a medir en Rápidamente se hace evidente que la cantidad de grupos requeridos
Satisfacción machos con Satisfacción puede explotar con la adición de cada variable adicional y ya que cada una
laboral laboral de esas variables tiene categorías adicionales. Por supuesto, no
alto control necesitamos diseñar la investigación con todas las combinaciones posibles
(Y) (Y)
incluidas. Por razones teóricas y prácticas, podríamos simplemente
seleccionar conjuntos particulares de combinaciones y examinar el efecto
Asignación aleatoria medir en X1aX1b medir en de estas combinaciones seleccionadas.
Satisfacción machos con Satisfacción
laboral laboral
control bajo
(Y) (Y)

Asignación aleatoria medir en X1bX2a medir en

Satisfacción Hembras con Satisfacción


laboral laboral
alto control
(Y) (Y)

Asignación aleatoria medir en X1bX2b medir en

Satisfacción Hembras con Satisfacción


laboral laboral
control bajo
(Y) (Y)

Figura 4.11 Elementos de un diseño factorial 2 x2

Tabla 4.1 Definición de grupos en un 3x2

diseño factorial

X1 X2 X3 Grupo

X1a zx X3m 1

X1a X2 X3b 2

X1a X2b X3 3

X1a X2b X3b 4

X1b X2a X30 5

X1b X2a X3 6
notas
1 Esta es una modificación de un argumento probado en un experimento por
Resumen
Aronson y Mills (1959) y discutido en Kerlinger (1979:91).
Este capítulo ha esbozado una variedad de diseños experimentales de diversa
2 Lamentablemente, estos objetivos no siempre se especifican al comienzo de la
complejidad. Se esbozó la lógica de extraer inferencias causales a partir de datos implementación de los programas piloto y, con demasiada frecuencia, se encargan
obtenidos con diseños experimentales. Los diversos diseños experimentales estudios de evaluación después de que se ha desarrollado e implementado el
varían en términos del uso de pruebas previas, la cantidad de puntos de medición programa piloto.
de pruebas previas y posteriores y la cantidad de grupos comparados dentro del
diseño. Todos los diseños experimentales tendrán grupos de comparación y todos 3 También hay cambios medidos que se deben a varios tipos de errores (consulte el
intentarán hacer las grupos lo más similares posible excepto en relación con la Capítulo 2).
intervención experimental. Aunque la asignación aleatoria a grupos es el método 4 El argumento es que a medida que las personas tienen hijos, su preocupación por
preferido, los medios por los cuales los grupos serán comparables variarán según el bienestar de su familia hace que se preocupen más por la estabilidad social y
las circunstancias de la investigación (ver el Capítulo 3). El rigor de los diseños política.
experimentales variará según los contextos en los que se lleve a cabo el
experimento. realizado. Los entornos de laboratorio brindan el máximo control de
las influencias externas de confusión, mientras que los experimentos naturales
brindan el mínimo control.
PROBLEMAS EN EL DISEÑO EXPERIMENTAL

que los grupos sean comparables en todos los aspectos, excepto con
respecto a la variable experimental. Hakim argumenta que:
Los experimentos son apropiados cuando existe algún argumento sobre la existencia
5 misma de una relación causal entre X e Y (neto de otros factores contextuales o
relacionados), o cuando se necesita la medida precisa del tamaño y la dirección del
efecto. (1986: 105)
PROBLEMAS EN EL DISEÑO EXPERIMENTAL
Sin embargo, la fuerza de los experimentos obtenidos a través de la
aleatorización tiene un costo considerable. La investigación experimental no
es adecuada para proporcionar una explicación de los resultados, para
identificar los mecanismos por los cuales una variable afecta a otra. Tampoco
nos permite construir una imagen del conjunto complejo de factores que
Los diseños experimentales se han utilizado ampliamente en las ciencias naturales producen un resultado dado. Los experimentos se centran en el impacto de
y en la investigación psicológica y educativa y han proporcionado una gran cantidad solo uno o dos factores.
de datos de investigación valiosos. Sin embargo, los diseños experimentales se han
utilizado menos en las ciencias sociales. Esta falta de uso en las ciencias sociales se
debe a desde consideraciones metodológicas, prácticas y éticas. Esto no quiere
decir, sin embargo, que los diseños experimentales no puedan usarse de una forma
u otra en la investigación de las ciencias sociales o que la lógica del diseño
experimental no pueda ser invaluable en el desarrollo de otros diseños de
investigación que sean aplicables en las ciencias sociales. Este capítulo explora
algunas de las fortalezas y debilidades de los diseños experimentales y los
problemas que deben abordarse al desarrollar cualquier investigación que utilice
este diseño.

Problemas metodológicos
El problema de la estrechez explicativa

La fuerza de la investigación experimental es la capacidad que nos brinda para decir


cuánto impacto causal directo tiene una variable. Los experimentos nos permiten
aislar el impacto de la variable experimental. Esto se logra mediante la asignación
aleatoria de personas a grupos experimentales y de control, un proceso que hace
Si bien demostramos que, a pesar de comenzar igual, los estudiantes de
escuelas privadas se desempeñan mejor que los estudiantes de escuelas
LA ALEATORIZACIÓN DIFICULTA ESTABLECER EL PAPEL DE OTROS FACTORES públicas, no sabemos por qué los primeros se desempeñan mejor. ¿Qué
La fuerza de la aleatorización es también su debilidad: al eliminar el efecto de tienen las escuelas privadas que produce un mejor desempeño? ¿ Son
numerosas variables, también elimina demasiada información. Si bien el control que mejores maestros, recursos superiores, un ambiente que enfatiza el
brinda la aleatorización ayuda a aislar el impacto de la variable experimental, nos desempeño académico o qué? Todo lo que sabemos es que los estudiantes
impide probar modelos causales más complejos o averiguar por qué una de escuelas privadas se desempeñan mejor académicamente.
intervención tiene un impacto.
En resumen, el diseño experimental puede ser efectivo para identificar qué
Este inconveniente se puede ilustrar con el ejemplo anterior del impacto del tipo intervenciones serán efectivas, pero no nos ayuda a comprender por qué una
de escuela en el rendimiento académico de los estudiantes. Imagine un experimento intervención es efectiva.
en el que pudiéramos asignar aleatoriamente a los estudiantes a escuelas LA ALEATORIZACIÓN PUEDE SUBESTIMAR EL EFECTO CAUSAL TOTAL
financiadas por el gobierno y otros a escuelas privadas de pago. Tal asignación
aleatoria debería eliminar cualquier diferencia entre los dos conjuntos de La aleatorización puede resultar en la subestimación de la relación causal
estudiantes en variables clave como la capacidad inicial del estudiante y los total entre la variable experimental y la variable de resultado. En el mundo
antecedentes familiares. Al final del período de estudio, pudimos comparar el real, el efecto causal total entre dos variables consta de dos componentes:
rendimiento académico de los estudiantes en las escuelas financiadas por el
gobierno con el de los estudiantes en las escuelas privadas. Cualquier diferencia ·efecto causal directo
debe ser atribuible a la escuela.
·efecto causal indirecto.
Sin embargo, lo que aprendemos sobre situaciones de la vida real al invocar este La aleatorización asegura que los grupos que comparamos sean similares en
procedimiento es limitado. En el mundo real, muchos otros factores, además del tipo todos los aspectos relevantes. Solo podemos mirar el efecto directo de la
de escuela en sí, pueden contribuir a las diferencias reales que vemos. Sin variable experimental. No podemos mirar los efectos del mundo real de una
embargo, hemos eliminado tales influencias relevantes, por ejemplo, los variable en
antecedentes del hogar, mediante la aleatorización y, en consecuencia, no podemos
identificar su impacto.
72
DISEÑOS PROBLEMAS EN EL DISEÑO 73
EXPERIMENTALES EXPERIMENTAL

relevantes excepto en su género. Es el efecto que el género tiene en sí mismo,


no por la forma en que el género podría vincularse. con otros factores como el
tipo de trabajo, el nivel de participación laboral o el nivel educativo. Los diseños
experimentales son buenos para identificar el alcance de un efecto directo.

El problema, sin embargo, es que el género también puede tener un efecto


indirecto, a través de otras variables. Por ejemplo, el género afecta el tipo de
ocupaciones que las personas eligen o a las que se les permite ingresar. El tipo
de ocupación, a su vez, afecta su nivel de ingresos. Entonces, además de que
los hombres ganan más por el mero hecho de su género (simple
discriminación), también ganan más por factores como el tipo de trabajo que
tienen, la mayor probabilidad de trabajar a tiempo completo y una mayor
oportunidad de aceptar horas extras (Gráfico 5.1).
Figura 5.1 Efectos directos e indirectos del género en el ingreso
Si calculáramos el impacto del género en los ingresos observando
únicamente su efecto directo, subestimaríamos seriamente la influencia
aquellas circunstancias en las que una variable de intervención o experimental
general del género en los ingresos. Ignorar los efectos indirectos tiene
actúa indirectamente.
implicaciones prácticas. Las diferencias de género en los ingresos no se
Esta deficiencia puede ilustrarse considerando la relación entre género e superarán simplemente pagando a hombres y mujeres el mismo dinero por el
ingresos. El efecto directo del género en el ingreso consiste en la diferencia de mismo trabajo. Debido a que el género está relacionado indirectamente con los
ingresos entre hombres y mujeres que son similares en todos los aspectos ingresos, cualquier política diseñada para aumentar la equidad de género
también debería abordar los mecanismos que vinculan el género con los ingresos (
ej., el vínculo entre género y elección ocupacional y entre género y horas de
trabajo). queremos estar seguros de que se debe a lo que pensamos que es y no a otra
cosa. Cuando la lógica y la estructura de un diseño son defectuosas y no
Problemas con la validez interna eliminan las explicaciones de los resultados que compiten entre sí, entonces el
diseño carece de validez interna.
El propósito del diseño es estructurar la recopilación y el análisis de datos para
llegar a conclusiones inequívocas. Si observamos un cambio en un resultado Todos los diseños enfrentan amenazas a la validez interna. Campbell y
Stanley (1963) identificaron las amenazas que se analizan a continuación.

HISTORIA
Si, además de la intervención experimental, ocurren eventos entre el pre-test y
el post-test, entonces estos eventos pueden amenazar la validez interna de la
investigación. Estos eventos, más que la intervención experimental, podrían
producir cualquier cambio que observemos. El problema de los eventos
extraños es mayor en los experimentos de campo y naturales de una manera
desconocida. En tales experimentos tenemos menos control sobre lo que le
sucede a la gente. Esta falta de control es un gran peligro para la investigación
ya que aumenta el tiempo entre el pre-test y el post-test.

Los diseños experimentales se ocupan de tales problemas mediante el uso


de grupos de control. Mientras el grupo de control y el grupo experimental estén
igualmente expuestos a estos eventos externos no controlados, la intervención
experimental seguirá siendo la única diferencia entre los grupos. Aunque la
ocurrencia de tales eventos externos significa que no podemos atribuir todo el
cambio que observamos a la intervención, todavía podemos atribuir diferencias
en la cantidad de cambio en los grupos experimental y de control a la
intervención. Por ejemplo, podríamos observar 50 unidades de cambio en el
grupo experimental y 30 unidades de cambio en el grupo de control. Si los
eventos externos están operando y producen las 30 unidades de cambio tanto
en el grupo experimental como en el de control, la cantidad restante de cambio
en el grupo experimental (20 unidades) es atribuible a la intervención
experimental.

Incluso cuando se utilizan grupos de control, estas influencias externas no


controladas pueden causar problemas en los experimentos. No podemos estar
seguros de que tanto el grupo experimental como el de control estén
igualmente expuestos a las influencias externas desconocidas e incontroladas.
Si, por alguna razón, el grupo experimental estuvo más expuesto esto podría
explicar cualquier diferencia posterior a la prueba entre los grupos de control y
experimental. Además, también puede haber un efecto de interacción que se
confunda con un simple efecto directo de la intervención. Es decir, la
intervención podría tener su efecto solo porque también tuvo lugar otro evento
desconocido o no intencionado.

MADURACIÓN
En un estudio de cambio, parte del cambio podría deberse al paso del tiempo
más que a la intervención experimental. Por ejemplo, si deseamos probar el
impacto de un método de enseñanza en el rendimiento matemático de

74 PRO
DISEÑOS EXPERIMENTALES BLE
MAS EN
EL 75
DISEÑO
EXPERIM
ENTAL

actitud), la secuencia de la pregunta o el El modo de recopilación de datos


niños, tendríamos que estar seguros de que cualquier mejora en el rendimiento se (por ejemplo, entrevista cara a cara en T1 y entrevista telefónica en T2)
deba a la intervención (método de enseñanza) y no a que los niños estén podría explicar el cambio medido. Otra persona que recopila la información
creciendo. Necesitamos asegurarnos de no confundir el impacto de una también puede
intervención con los cambios de desarrollo o maduración que tienen lugar en el
curso de un experimento. Los efectos de maduración pueden ocurrir en un estudio
de cambio organizacional. En tales estudios necesitamos distinguir entre el
impacto de la introducción de nuevas formas de hacer las cosas de los cambios
que se acumulan simplemente porque, con el tiempo, las personas permanecen
más tiempo en la organización y adquieren más experiencia. En un experimento de
laboratorio, hambre, cansancio y aburrimiento proporcionar más ejemplos de
efectos de maduración.

Dado que tanto el grupo experimental como el de control deberían ser


igualmente vulnerables a la maduración, estos efectos pueden eliminarse en gran
medida mediante el uso de grupos de control aleatorios. La lógica para esto es la
misma que se esbozó en la discusión sobre la influencia de la historia. El uso de
múltiples pruebas previas y posteriores también puede ayudar a detectar la
maduración, ya que nos permiten ver si el cambio en el período experimental es
simplemente parte de una tendencia continua que comenzó antes de la
intervención.

PRUEBAS
Examinar a los participantes varias veces puede contaminar los resultados. Una
persona puede recordar respuestas anteriores y posteriormente responder
preguntas de tal manera que parezca coherente. Completar las preguntas puede
sensibilizar a las personas sobre cuestiones sobre las que antes habían pensado
poco y esto, en lugar de cualquier intervención experimental, puede producir
cambios. De manera similar, la familiaridad con una prueba (por ejemplo, una
prueba de coeficiente intelectual) puede conducir a un mejor desempeño.

Suponiendo que la prueba tendrá los mismos efectos tanto para el grupo
experimental como para el de control, el efecto de la prueba se puede eliminar
utilizando un grupo de control, de la misma manera que se describe anteriormente.
El peligro de los efectos de interacción (las pruebas y la intervención combinadas
tienen un efecto único) es un peligro que el diseño de cuatro grupos de Solomon
(Capítulo 4) puede identificar y permitirnos eliminar estadísticamente. Los efectos
de prueba en un experimento aleatorio también se pueden eliminar eliminando por
completo la fase previa a la prueba. Este enfoque es evidente en el diseño
aleatorio posterior a la prueba (Capítulo 4).

DETERIORO DEL INSTRUMENTO

El cambio medido podría deberse a cambios en la forma en que se realizan las


medidas previas y posteriores a la prueba. Cambiar la redacción de la pregunta, las
alternativas de respuesta (p. ej., agregar una opción 'no sé' a las preguntas de
La regresión estadística también puede deberse al hecho de que el error de medición
solo puede cambiar las puntuaciones extremas en una dirección. En una escala del 1 al
contaminar el procedimiento, ya que la misma persona se vuelve más 10, una puntuación de 10 solo puede bajar debido a un error de medición. Una
experimentada y familiarizada con la recopilación de datos. puntuación de 1 solo puede aumentar. El sesgo, por lo tanto, del cambio basado en el
error de medición será hacia una puntuación más moderada.
Brindar una capacitación cuidadosa e instrucciones sistemáticas para quienes
recolectan datos puede reducir este problema. La introducción de grupos de Mediante la utilización de grupos de control, el investigador puede abordar este
problema. Siempre que las personas con puntajes extremos se asignen aleatoriamente
control y el uso de los mismos instrumentos tanto para los grupos experimentales
a los grupos de control y experimental, el nivel de regresión estadística debe ser el
como para los de control puede reducir sustancialmente el problema del deterioro mismo para ambos grupos.
del instrumento. Incluso si hay deterioro del instrumento, su El efecto puede
eliminarse comparando las diferencias entre los grupos experimental y de control SELECCIÓN
en la cantidad de cambio en la variable de resultado.
Si dos grupos son inicialmente diferentes, las diferencias posteriores a la
REGRESIÓN ESTADÍSTICA
prueba entre los grupos podrían deberse a esta diferencia inicial más que a la
intervención del investigador. Los grupos de control aleatorizados de tamaño
Es probable que los grupos o personas que registran puntajes extremos en una razonable deben eliminar los efectos de la selección. Cuando la
medida de resultado en T1 (p. ej., CI alto o bajo) cambien a un puntaje más aleatorización no es factible, el pareamiento puede eliminar los efectos de
moderado en T2. Esta tendencia estadística, más que una intervención selección específicos, pero permanece la posibilidad de que las diferencias
experimental, puede explicar algún cambio. no pareadas influyan en los resultados (consulte el Capítulo 3).
La regresión estadística ocurre porque todos los puntajes se deben en parte a variaciones
MORTALIDAD/DESERCIÓN
aleatorias. Es más probable que una puntuación de CI extremadamente alta o baja contenga
un elemento de error aleatorio que una puntuación moderada. Las probabilidades están en
Si un experimento se lleva a cabo a lo largo del tiempo, la pérdida de ciertos
contra de que una persona logre un puntaje extremo en dos ocasiones debido a un error
aleatorio. Por lo tanto, las probabilidades son que una buena proporción de aquellas
tipos de participantes, en lugar de una intervención experimental, puede ser
personas que inicialmente lograron un puntaje alto debido a algún error aleatorio no estarán responsable de
sujetas al mismo error aleatorio. por segunda vez. En consecuencia, en una segunda prueba
es probable que su puntuación sea menos extrema de lo que era inicialmente.
76
DISEÑOS EXPERIMENTALES PROBLEMAS EN EAEN

La noción de validez externa se refiere a la medida en que podemos generalizar


cualquier cambio medido. Por ejemplo, podríamos medir las calificaciones académicas los resultados de la muestra experimental a la población que pretende representar.
de un grupo de estudiantes en T1 y calcular el promedio del grupo. Luego ¿Funcionaría la intervención experimental en una situación del mundo real o su
implementamos una intervención experimental durante un período de un año y luego efecto solo ocurrirá en una situación experimental? ambiente con un conjunto
volvemos a medir el desempeño. Podríamos observar un aumento en las calificaciones particular de participantes? Campbell y Stanley (1963: 5-6) identifican una serie de
promedio. ¿Será por la intervención? Posiblemente. Pero también podría deberse a factores que pueden socavar nuestra capacidad para generalizar los hallazgos
que las personas menos capaces abandonan el programa. Si los menos capacitados experimentales más allá del experimento específico.
abandonaron, entonces el aumento en las calificaciones promedio podría deberse
simplemente a que los menos capacitados no se incluyeron en los cálculos en T2. EFECTO REACTIVO DE LA PRUEBA PREVIA
Si la prueba previa cambia el comportamiento o las actitudes o sensibiliza a las
La mejor manera de lidiar con el impacto de la pérdida de participantes es minimizar
personas para que sean más vulnerables a los efectos de la intervención, entonces
la deserción selectiva. Lo siguiente mejor es eliminar su efecto en la etapa de análisis.
cualquier hallazgo experimental puede ser un artefacto de la situación
En el ejemplo anterior, podríamos recalcular los promedios T1 solo para los estudiantes
experimental y no aplicar a las personas que no participan en el experimento. Si la
que permanecieron durante todo el proceso. el estudio. Alternativamente, cuando haya
prueba previa en lugar de la intervención produce el efecto, entonces el efecto no
evidencia de deserción selectiva, podríamos ponderar las muestras para ajustar la
ocurrirá en la implementación de una intervención en el mundo real, ya que el
deserción selectiva (Capítulo 9), introducir controles estadísticos (Capítulo 12) o
contexto del mundo real no incluirá pruebas previas experimentales.
realizar análisis por separado para varios subgrupos.
En situaciones donde existe la posibilidad de efectos previos a la prueba, es
Problemas con la validez externa mejor adoptar un diseño sin la fase previa a la prueba, o usar el diseño de cuatro
grupos de Solomon para que el impacto de este tipo de interacción se pueda estimar y
tomar. en cuenta.
mundo. Si los participantes experimentales son diferentes en aspectos importantes
FALTA DE REPRESENTATIVIDAD de las personas del "mundo real" a quienes se dirige la intervención, no podemos
chadv tiene una fuerte validez interna no significa que un estar seguros de cuál será el resultado. Por ejemplo, podríamos usar estudiantes
universitarios de primer año para probar el efecto de ver una película que retrata
accidentes de tráfico gráficos en el comportamiento al volante. ¿Podemos estar
seguros de que cualquier efecto en este grupo joven y predominantemente de
clase media se aplicará a otros tipos de personas?

Existen dos enfoques para abordar este problema. Uno es realizar experimentos
con muestras representativas grandes y analizar los resultados para ver si son
válidos para todos los tipos de personas. En ausencia de muestras representativas
seleccionadas al azar, la mejor estrategia es repetir el proceso. experimentar
muchas veces con diferentes muestras y en diferentes contextos. Esto se llama
replicación. Si seguimos obteniendo los mismos resultados con diferentes tipos de
muestras, podemos estar más seguros de que los resultados se aplican más
ampliamente. Sin embargo, si no podemos replicar los resultados con tipos
particulares de personas o bajo condiciones particulares, no significa que el
procedimiento es fundamentalmente defectuoso. Más bien, nos permite
especificar los límites de nuestra generalización y los tipos de personas a quienes
se aplican y no se aplican los resultados.

LO ARTIFICIAL
Al esforzarnos por lograr la validez interna y atender asuntos éticos y prácticos,
podemos terminar con un experimento que es elegante y ético pero es tan artificial
que no aprendemos nada útil sobre personas reales en contextos sociales reales.
Tajfel (1984) nos recuerda que el experimento típico de la psicología social se basa
en

una colección temporal de extraños adolescentes tardíos a los que se les da un


rompecabezas para resolver en condiciones extrañas en un tiempo limitado
durante su primer encuentro mientras son observados desde detrás de un espejo
(en Hakim, 1986: 111)

El simple hecho de ser seleccionado para un estudio puede hacer que las
personas se sientan especiales y producir resultados artificiales. Un famoso
estudio de Western Electric Hawthorne Works en Chicago a principios de la
década de 1930 descubrió por primera vez la importancia de lo que se conoce
como el efecto Hawthorne (Roethlisberger y Dickson, 1939). Los investigadores
seleccionaron un grupo de trabajadores y cambiaron su entorno de trabajo en un
esfuerzo por mejorar la productividad. Descubrieron que independientemente de
las intervenciones que hicieran, el grupo se volvió más productivo. Llegaron a la
conclusión de que no fueron las intervenciones las que fueron efectivas, sino que
fueron seleccionadas especialmente las que produjeron el efecto. Si se hubieran
hecho los mismos cambios sin dar a las personas la sensación de que eran
especiales, no podemos estar seguros de que la satisfacción y
78
DISEÑOS EXPERIMENTALES PROBLEMAS EN EL DISEÑO 79
EXPERIMENTAL

Cuestiones prácticas
cuenta la forma en que analizaremos los datos: diferentes métodos requieren
Hay pocas respuestas simples a las muchas preguntas prácticas que surgen al diferentes tamaños de muestra.
diseñar experimentos sociales. En la mayoría de los casos, la respuesta a la
pregunta es: "Depende". ¿Cómo deben ser reclutados los participantes?
La validez externa se logra mejor eligiendo una muestra que sea
¿Cuánto les dices a los participantes?
representativa de la población más amplia a la que deseamos extrapolar.
¿Deberíamos decirles a los participantes que están en el grupo de control? ¿Cuánto Una muestra representativa se obtiene mejor utilizando técnicas de
debemos decirles sobre el tratamiento experimental? ¿Deberían saber cuál es la muestreo aleatorio. Esto requiere que seleccionemos a los participantes de
hipótesis de investigación? Si bien el principio ético del consentimiento informado tal manera que cada persona en la población más amplia tenga una
(ver más adelante en este capítulo) sugiere que debemos contarles todo a los probabilidad igual o conocida de ser seleccionada. se seleccionó la muestra.
participantes, hacerlo podría hacer que el estudio no tenga valor. Si los participantes Desafortunadamente, incluso si usamos un muestreo aleatorio, no necesariamente
saben lo que estamos buscando, podrían comportarse de tal manera que confirmen terminaremos con una muestra representativa. Puede estar sesgado porque
o sabotear nuestras expectativas. Decirles a las personas que están en un grupo de realizamos nuestra investigación de manera ética. No es ético presionar a los sujetos
control o explicarles la gama de intervenciones experimentales (por ejemplo, la potenciales para que participen o tratar de evitar que se retiren del estudio en cualquier
gama de niveles de apoyo a los ingresos en el proyecto de ingresos garantizados) etapa de la investigación. El alcance del sesgo resultante dependerá de cuántos
puede hacerles sentir que se están perdiendo las intervenciones deseables y crear participantes potenciales se nieguen a participar o se retiren posteriormente.
resentimientos y falta de cooperación.
Brechas entre pruebas e intervenciones
No existen reglas estrictas sobre cuánta información proporcionar a los ¿Cuánto debe transcurrir entre la introducción de una intervención y la
participantes, pero dentro de los requisitos del consentimiento informado, lo más prueba posterior? La duración de la brecha debe depender de lo que
seguro es minimizar la cantidad de información detallada proporcionada antes de nuestras teorías e investigaciones previas nos lleven a esperar sobre el
que se complete el experimento. Esto minimiza las posibilidades de contaminar el tiempo que tardaría en detectarse un efecto. La duración de la brecha entre
experimento. A veces, un experimento implica un engaño explícito para evitar el la intervención y la prueba posterior también dependerá de si estamos
sabotaje. En tales casos, se deben seguir escrupulosamente las pautas éticas y un buscando para efectos a corto o largo plazo.
informe cuidadoso.
La brecha entre una prueba previa y una intervención debe ser lo más
¿Cuántos participantes? corta posible. Una brecha corta es deseable porque minimiza la posibilidad
de que ocurran eventos antes de la intervención que podrían hacer que los
La importancia que le demos a la validez externa y el enfoque que le demos a la
grupos experimental y de control sean diferentes de alguna manera antes de
validez externa tendrán una gran influencia en el tamaño de la muestra que
la intervención. intervención. Sin embargo, a veces es posible que debamos
elijamos. Si queremos generalizar estadísticamente a una población más amplia,
dejar un espacio si sospechamos que la prueba previa podría interactuar con
necesitamos usar una muestra que se seleccione aleatoriamente y que sea lo
la intervención (por ejemplo, la prueba previa ha sensibilizado a los
suficientemente grande para generalizar con confianza. Muchos libros proporcionan
participantes sobre los problemas).
fórmulas para calcular el tamaño de muestra necesario para la generalización
estadística (Moser y Kalton, 1971; Kalton, 1983b). Sin embargo, si usamos una Al establecer el tamaño de la brecha temporal entre la prueba previa y la prueba
replicación (ver arriba) para lograr la generalización, el factor crítico es si hemos posterior, debemos tener en cuenta el impacto de la pérdida de participantes y su
replicado el experimento un número suficiente de veces y bajo un rango suficiente amenaza para la validez tanto interna como externa. Dado que los abandonos
de condiciones. Consideraciones teóricas y sentido común en cuanto al rango de aumentan cuanto más dura un estudio, debemos establecer la brecha con el fin de
condiciones bajo las cuales intentamos replicaciones debe guiarnos. minimizar su ocurrencia.

Si nuestra principal preocupación es la validez interna, podemos trabajar con muestras Sin embargo, un intervalo de tiempo demasiado corto puede producir otros
mucho más pequeñas que las que se requieren para la generalización estadística, pero deben problemas metodológicos. Cuando el intervalo entre la prueba previa y la
ser lo suficientemente grandes para detectar un efecto. Los procedimientos para calcular el posterior es breve, es probable que los participantes recuerden sus
tamaño de muestra requerido para detectar efectos se pueden encontrar en otro lugar (Cohen, respuestas previas a la prueba. Su memoria puede influir en la forma en que
1987). El tamaño de la muestra también debe tener en cuenta responden en la prueba posterior. -fase de prueba del experimento.
80 DISEÑOS EXPERIMENTALES
PROBLE
MAS EN 81
EL
DISEÑO
EXPERI
MENTAL

La práctica de asignar participantes aleatoriamente es una de las


Tales efectos de la memoria se pueden tratar de varias maneras. Las pruebas características distintivas del diseño experimental. Sin embargo, por varias
piloto pueden establecer la cantidad de tiempo que ha transcurrido antes de que razones, la asignación aleatoria no necesariamente logra su objetivo de
los participantes olviden sus respuestas previas a la prueba. Alternativamente, si garantizar que los grupos experimental y de control sean inicialmente
hemos asignado a los participantes al azar y tenemos una muestra de tamaño comparables.
suficiente, la prueba previa puede eliminarse por completo (Capítulo 4). Una
tercera alternativa es usar el diseño de cuatro grupos de Solomon. Este diseño
supera el problema ya que nos permite evaluar y eliminar estadísticamente los
efectos de la prueba previa.

Los asuntos prácticos también determinarán los intervalos de tiempo entre las
etapas del estudio. La cantidad de tiempo disponible para completar el estudio y la
disponibilidad de fondos a nuestra disposición para realizar un seguimiento de las
personas influirán en la forma en que finalmente diseñemos el experimento.

¿Qué método de recopilación de datos?


El diseño de investigación particular que adoptamos no dicta un método particular
de recopilación de datos (por ejemplo, observación, entrevista o cuestionario). El
método de recolección de datos que adoptemos dependerá de la naturaleza de las
observaciones que necesitemos hacer (Capítulo 1). Lo que es crítico es que el
método de recolección de datos produzca datos confiables, válidos y significativos.

Dado que el diseño experimental se basa en la detección de diferencias a lo


largo del tiempo y diferencias entre grupos, es fundamental que tengamos
medidas que reflejen el cambio de manera precisa y confiable. Debemos estar
seguros de que el cambio medido es real y no solo un artefacto de métodos de
recopilación de información deficientes. .

La necesidad de lograr una alta confiabilidad no nos lleva a un único método de


recopilación de datos. La confiabilidad de un método dependerá de qué datos se recopilan y
de la habilidad de la persona que los recopila. En algunos casos obtendremos mucha mejor
información observando a las personas que haciéndoles preguntas muy estructuradas. A
veces, un cuestionario menos estructurado que permita al entrevistador sondear y dar
seguimiento a las respuestas puede ser más efectivo que uno altamente estructurado.

Además de generar datos confiables, nuestro método de recopilación de datos


debe producir información válida: debemos medir lo que creemos que somos. De
poco sirve recopilar datos fiables que son erróneos. No tiene mucho mérito
recopilar datos usando instrumentos muy confiables sobre, digamos, el nivel de
prejuicio racial si el método de recopilación de datos está haciendo que las
personas expresen puntos de vista socialmente deseables en lugar de sus puntos
de vista reales.

Problemas con la asignación aleatoria


merecedores' a los grupos de tratamiento deseables. Idealmente, el
investigador debería asignar a las personas a los grupos pero, cuando esto
LÍMITES DE ASIGNACIÓN ALEATORIA no sea posible, se requiere un escrutinio minucioso de quienes realizan la
La elección de una muestra pequeña puede impedir lograr la comparabilidad de asignación.
los grupos experimentales y de control. Por ejemplo, la asignación aleatoria de una
muestra de 10 personas en dos grupos de cinco personas cada uno puede resultar RESENTIMIENTO DEL GRUPO DE CONTROL
fácilmente en grupos diferentes. A medida que aumenta el tamaño de la muestra Si las personas creen que están en un grupo de control, pueden sentirse mal.
total, las características promedio de los grupos experimental y de control deben El resentimiento resultante puede llevar a un alto abandono y producir un
converger. Cuando no se puede aumentar el tamaño de la muestra, se puede usar grupo de control que difiere en aspectos importantes del grupo experimental
el diseño de bloques aleatorios para garantizar la equivalencia en las (por ejemplo, más negativo). Estas percepciones, más bien que el efecto de
características específicas. Sin embargo, con grupos grandes, todavía puede cualquier intervención, podría ser responsable de cualquier diferencia de
haber diferencias importantes entre los grupos en variables con poca variabilidad a resultado final entre los grupos.
pesar de la asignación aleatoria (Cook y Campbell, 1979). :342).
Una solución es disfrazar el hecho de estar en el grupo de control utilizando un
GUARDIANES Y AMENAZAS A LA ASIGNACIÓN ALEATORIA 'placebo', es decir, un tratamiento irrelevante. En la investigación de fármacos, el
placebo podría ser una pastilla de azúcar. En la investigación social, podría ser un
La asignación aleatoria puede ser difícil de lograr en entornos de campo donde las tratamiento que se sabe que no afecta las variables de resultado y, por lo tanto, es
realidades prácticas pueden requerir negociaciones con las autoridades y otros seguro de usar. Alternativamente, podemos asegurar a los participantes del grupo de
'guardianes' que controlan el acceso a los participantes potenciales. Entre los control que pueden recibir los tratamientos deseables, si así lo desean, al finalizar el
guardianes con los que es probable que se encuentre el investigador se experimento.
encuentran directores de escuela, gerentes de organizaciones y trabajadores
sociales profesionales. Los guardianes pueden causar problemas al insistir en NEGATIVAS A PARTICIPAR EN LA INTERVENCIÓN
asignar a las personas a los grupos ellos mismos o al socavar la investigación por Puede surgir un problema comparable cuando las personas asignadas a un
una implementación deficiente. Podrían, por ejemplo, asignar a los 'más tratamiento dado se niegan a participar porque se considera que el tratamiento es
82
DISEÑOS EXPERIMENTALES PROBLEMAS EN EL DISEÑO 83
EXPERIMENTAL

Una cosa clave a verificar es si los abandonos son distintivos en relación con sus
indeseable. El abandono en este punto significaría que, a pesar de la asignación puntajes iniciales en la variable de resultado. Por ejemplo, ¿aquellos con puntajes
iniciales bajos en la variable de resultado son más propensos que otros a abandonar
aleatoria inicial, los grupos podrían ser diferentes antes de la intervención.
antes, durante o después de la intervención experimental? Si es más probable que se
Este problema se puede evitar posponiendo la asignación aleatoria a los grupos retiren, entonces la tasa de abandono diferencial entre los grupos podría ser
responsable de las diferencias posteriores a la prueba. Si los participantes con
(Cook y Campbell, 1979: 358). Habiendo reclutado a los participantes, podemos
puntajes bajos abandonan, automáticamente aumentará el puntaje promedio del
determinar su disposición a participar en el control o en cualquiera de varios grupo, incluso si la intervención en sí misma no produjo el aumento en los puntajes.
tratamientos experimentales diferentes. Luego, podríamos eliminar del estudio a los
participantes que no estaban dispuestos a participar en ningún grupo en particular. Además de minimizar la deserción, lo siguiente mejor es identificar las
Luego, podríamos asignar aleatoriamente a los participantes restantes dispuestos a características de quienes abandonan y luego ajustar estas características en la etapa
participar en los diversos grupos. de análisis de datos. Podemos utilizar la información recopilada en la etapa previa a la
prueba para ayudar a identificar estas características de deserción y luego incluir estas
ABANDONOS variables en un análisis multivariado para ver si habrían surgido diferencias de grupo si
Dado que los diseños experimentales examinan el cambio a lo largo del tiempo, no hubiera una deserción diferencial.
enfrentan el peligro de un abandono diferencial de los diferentes grupos (por Desigualdad de las intervenciones
ejemplo, las intervenciones menos deseables). Esta deserción diferencial podría ser
responsable de cualquier diferencia de grupo posterior a la prueba (ver En la investigación social experimental basada en el campo, las
anteriormente en este capítulo). Esto puede ser un problema serio en la consideraciones políticas y prácticas reducen nuestro grado de control sobre
investigación social de campo a largo plazo. Además, incluso cuando la tasa de la intervención. Cuando confiamos en una variedad de personas para
abandono es muy similar en todos los grupos, los abandonos pueden diferir implementar una intervención (por ejemplo, diferentes personas pueden ser
significativamente de los que permanecen en el experimento, amenazando así la responsables de llevar a cabo una intervención en diferentes organizaciones)
validez externa. de El estudio. podemos no ser capaz de garantizar que la intervención se implemente de
manera consistente o adecuada. Cuando la intervención se lleva a cabo de
manera desigual, no necesariamente tenemos una buena prueba del impacto de la
intervención prevista.
confiamos en qué intervención ha tenido lugar realmente y, por lo tanto,
En la medida de lo posible, el investigador debe mantener el control de la forma en podemos tener dificultades para dar sentido a los datos.
que se implementan las intervenciones. Sin esto no podemos ser
La profecía autocumplida8
En cualquier investigación siempre existe el peligro de que las expectativas y
los valores del investigador distorsionen inadvertidamente la forma en que
recopila e interpreta la información. Por ejemplo, si esperamos que un
método de enseñanza en particular pueda mejorar el nivel de cooperación de
los niños en el aula, podríamos 'ver' más cooperación que si no tuviéramos
esta creencia. Las expectativas de un investigador pueden afectar lo que ve,
cómo lo interpreta y cuánto busca evidencia contraria a sus expectativas.

En los experimentos con drogas, este problema se minimiza mediante el


uso de un enfoque "doble ciego". Ni el participante ni el investigador saben
qué fármaco o placebo se administra a qué participantes. Pero esta solución
rara vez está disponible en la investigación social. Debido a la operación del
principio ético del consentimiento informado (ver más adelante en este
capítulo), puede ser difícil usar tratamientos con placebo. Del mismo modo,
en muchos experimentos sociales es muy difícil ocultar qué grupos están
sujetos a qué intervención.

Lo más cerca que podemos estar del enfoque 'doble ciego' en la


investigación social es asegurarnos de que la persona que recopila los datos
desconozca las hipótesis de la investigación. Pero incluso si se logra esta
condición, los valores y creencias del investigador pueden distorsionar lo que
ve y cómo informa lo que ve.

Podemos tomar dos enfoques que pueden reducir el peligro de ver solo lo que
queremos ver. Una es desarrollar definiciones operativas claras y protocolos de
investigación que reduzcan la distorsión de las observaciones e interpretaciones. La
segunda es usar múltiples 'jueces' y observadores para que los diferentes
observadores puedan actuar como un control entre sí. Mediante el uso de múltiples
observadores, podemos identificar hasta qué punto los patrones dependen del
observador.

Cuestiones éticas

Independientemente del diseño de la investigación, la investigación social


debe ajustarse a cuatro principios éticos amplios (Kimmel, 1988; Homan,
1991).

Participacion voluntaria
Un principio bien establecido de la investigación social es que a las personas
no se les debe exigir o hacer creer que están obligadas a participar en un
estudio. Además, los participantes deben saber que pueden retirarse del
estudio en cualquier momento. Debemos evitar que la gente tenga la
impresión
84
DISEÑOS EXPERIMENTALES
PROBLE
MAS EN 85
EL
DISEÑO
EXPERIM
ENTAL

Consentimiento informado
del contexto en el que se hace la solicitud de que se requiere la participación. En
El consentimiento informado es un primo cercano de la participación
situaciones donde hay una 'audiencia cautiva' y donde hay una diferencia de poder
voluntaria. Por lo general, los participantes deben ser informados sobre:
entre el investigador y los posibles participantes experimentales (por ejemplo,
clase de psicología de primer año, beneficiarios de asistencia social en una
agencia de asistencia social), el investigador debe tener especial cuidado en
enfatizar que la participación es verdaderamente voluntaria.

La manera más segura de asegurar que la gente entienda que la participación


es voluntaria es decírselo explícitamente. Por ejemplo, al comienzo de un estudio
se les puede decir a los participantes

'Aunque su participación en este estudio será muy valorada, no está obligado a participar.
Puede detenerse en cualquier punto o elegir no responder a ninguna pregunta en particular.
Hágaselo saber al entrevistador.

La participación voluntaria puede producir una serie de problemas. Puede


amenazar la validez externa del experimento. Dado que ciertos tipos de personas
(por ejemplo, aquellos con niveles educativos más bajos, aquellos que no hablan
inglés, personas mayores) tienen más probabilidades que otros de negarse a
participar en estudios, la participación voluntaria puede producir muestras
sesgadas. También puede amenazar la validez interna si obtenemos una
deserción diferencial en los grupos experimental y de control (ver la sección
anterior sobre problemas con la aleatorización). Además, si la participación
voluntaria conduce a altas tasas de deserción, puede generar muy pocos casos
para un análisis significativo.

Sin embargo, la compulsión no es la respuesta. Aunque la compulsión podría reducir el


sesgo de la muestra, los participantes no dispuestos pueden socavar la calidad de los datos
de un estudio. Dado que podemos ajustar estadísticamente los sesgos conocidos de la
muestra, es mejor maximizar la calidad de las respuestas y fomentar la participación
voluntaria.

Es mejor animar que exigir a las personas que participen en los estudios. Hay
dos formas principales de hacerlo. Una es apelar al altruismo de las personas
señalando los posibles beneficios del estudio. Las personas son notablemente
generosas y están dispuestas a participar en estudios en los que creen que
servirán de algo. Sin embargo, en nuestro entusiasmo por reclutar participantes,
debemos evitar la "publicidad engañosa" que exagera los beneficios. En segundo
lugar, podemos apelar al interés propio de las personas: cómo la participación
puede beneficiarlas. Podríamos ofrecer recompensas por participar o al menos
compensar por su tiempo y cualquier costo en el que puedan incurrir al participar.
Algunos estudios brindan obsequios simbólicos y se ofrecen a proporcionar a los
participantes un resumen de los principales hallazgos.
Además, proporcionar detalles sobre el estudio, especialmente información
detallada sobre el diseño del estudio, sobre las hipótesis y teorías que
1 el propósito del estudio y sus procedimientos básicos estamos probando, puede distorsionar la forma en que las personas
responden las preguntas y socavar la validez de los hallazgos.
2 la identidad del investigador y del patrocinador
Una solución es proporcionar información básica y ofrecer responder
3 el uso que se podría dar a los datos. preguntas adicionales. Si esta información pudiera distorsionar la forma en
También deben estar provistos de lo siguiente: que las personas se comportan, podemos explicar con tacto que esto es una
preocupación y ofrecernos para tratar las preguntas después de que termine
4 un resumen de riesgos razonablemente previsibles, vergüenza o incomodidad el experimento. En algunas investigaciones psicológicas, los participantes
son engañados deliberadamente, ya que un conocimiento preciso invalidaría
5 una descripción de los posibles beneficios del estudio el estudio (Homan, 1991: 96ff). Cuando esto esté justificado, es fundamental
6 una descripción de cómo fueron seleccionados que los participantes sean informados por completo después del estudio.

7 una oferta para responder a cualquier pregunta Esto plantea la cuestión de cuándo se debe obtener el consentimiento. La
mayoría de los comités de ética2 exigen que se obtenga el consentimiento
8 una declaración de que la participación es voluntaria, que cada participante es antes de participar. Sin embargo, se puede argumentar que los participantes
libre de retirarse en cualquier momento o de negarse a responder cualquier no saben realmente lo que están aceptando hasta que han participado, y que
pregunta en particular. solo pueden dar su consentimiento informado después de haber participado.

Si bien el tema del consentimiento informado parece completamente razonable y - ¿ Quién debe dar el consentimiento? ¿ Quién debe dar permiso en la
deseable, no siempre es sencillo. ¿Cuánta información debemos proporcionar investigación de niños pequeños, personas con discapacidad intelectual y
antes de que un participante pueda considerarse informado? ¿ Cuán otras personas que pueden no estar en condiciones de comprender
completamente informados deben estar los participantes? ¿Qué significa estar completamente las implicaciones de participar en una encuesta? La
informado? Proporcionar más información no significa necesariamente que las participación aún debe ser voluntaria, pero es posible que se deba obtener el
personas estarán mejor informadas. El simple hecho de proporcionar consentimiento de otras personas, como los padres y tutores, así como del
descripciones detalladas del estudio no significa que los encuestados estarán más participante. En las organizaciones jerárquicas, los guardianes pueden
informados como resultado. De hecho, la información técnica detallada puede otorgar
confundir, distraer y abrumar en lugar de informar.
permiso para que los jóvenes participen y, por lo tanto, en cierto sentido, obligar a los A diferencia de otros diseños, muchos diseños experimentales involucran al
jóvenes a participar. En tales situaciones, debemos asegurarnos de obtener el investigador activamente haciendo algo potencialmente dañino para los
consentimiento tanto de los guardianes como de los participantes reales. participantes. Si bien debería ser obvio que no debemos someter a las personas a
intervenciones potencialmente dañinas, parece razonable establecer
experimentos en los que las intervenciones beneficien a los participantes. Por
Ningún daño a los participantes ejemplo, los experimentos de ingresos garantizados descritos en el Capítulo 4
podrían justificarse porque la intervención de proporcionar un ingreso garantizado
solo beneficiaría a los participantes (Hakim, 1986: 102).
En algunos estudios experimentales, los participantes están potencialmente expuestos
a daños. Por ejemplo, en los experimentos médicos en los que se prueba un nuevo Sin embargo, el argumento de que una intervención será beneficiosa presupone
fármaco, los participantes corren un peligro potencial. En los experimentos psicológicos, que conocemos los resultados de la intervención. Podemos creer que el
los participantes pueden recibir estímulos o ser inducidos a comportarse de manera que mantenimiento de los ingresos será, en el peor de los casos, inofensivo, pero no lo
luego se arrepientan y encuentren angustiosos.3 sabemos de antemano. Incluso con las mejores intenciones, puede haber efectos
nocivos no deseados. También está el tema de '¿beneficio para quién?'. Hakim
Cuando exista algún peligro de daño para los participantes, el principio del (1986) señala que los experimentos de mantenimiento de ingresos condujeron a
consentimiento informado requiere que se informe a los participantes de los peligros un aumento de los divorcios, ya que algunas mujeres adquirieron mayor seguridad
antes de participar en el experimento. Cuando existe la posibilidad de daño y la persona financiera. ) pueden haber tenido puntos de vista muy diferentes.
todavía está de acuerdo en participar, existe la necesidad de un informe cuidadoso
después del experimento. Según el tipo de daño potencial, puede ser necesario un Cuando se perciben beneficios por participar en un experimento (por ejemplo,
seguimiento a largo plazo para garantizar que se eliminen los efectos secundarios un experimento de mantenimiento de ingresos, pruebas médicas) podemos
potencialmente dañinos. son monitoreados. enfrentar el problema opuesto: negar un tratamiento beneficioso al grupo de
control. ¿Es justo negar a algunas personas el beneficio potencial del tratamiento?
La asignación aleatoria puede reducir algunos de los problemas éticos a este respecto.
También podemos comprometernos a facilitar el acceso al tratamiento al grupo de Anonimato y confidencialidad
control una vez que sepamos que ha tenido éxito (o una modificación del tratamiento en Una forma obvia en la que los participantes pueden verse perjudicados es el
base a lo aprendido del experimento). incumplimiento de las promesas de confidencialidad. Las personas que participan
en experimentos tienen derecho a esperar que no puedan ser identificadas como
la fuente de ninguna información en particular. Con frecuencia, los experimentos
de ciencias sociales implican la recopilación de información personal que, si se
hace pública, podría ser vergonzoso o humillante o causar daño a los participantes
de una forma u otra.

Por lo tanto, es esencial que la información se recopile de tal manera que se


pueda garantizar la confidencialidad. También es fundamental que las personas
involucradas en la recolección, análisis y reporte de los hallazgos respeten
escrupulosamente los requisitos de confidencialidad.

Para proteger a los participantes, los datos deben almacenarse de tal manera
que impidan cualquier acceso no autorizado. Esto puede significar almacenar
datos en gabinetes cerrados y eliminar toda la información de identificación. Si los
datos se almacenan electrónicamente, las contraseñas y el cifrado pueden ayudar
a garantizar la privacidad. Es muy deseable que los detalles de identificación
personal y las respuestas relacionadas con los participantes se mantengan por
separado. La información sobre el nombre y la dirección de una persona debe
almacenarse en un archivo y todas sus respuestas a las preguntas deben
almacenarse en un archivo diferente. Los números de identificación para las
referencias cruzadas deben almacenarse de tal manera que solo las personas
autorizadas puedan hacer la comparación.

Proporcionar garantías de confidencialidad es importante por razones tanto


metodológicas como éticas. Si los participantes están seguros de que sus
respuestas son verdaderamente confidenciales (o incluso mejor si son anónimas),
podemos esperar que las personas estén más dispuestas a participar en el
estudio, especialmente si se trata de asuntos privados. También podemos esperar
que si una persona siente que sus respuestas son realmente confidenciales, será
más probable que proporcione respuestas francas y honestas.

Uno no debe hacer promesas de confidencialidad a menos que pueda


cumplirlas. En un estudio de niños en edad escolar, puede conocer la identidad de
un traficante de drogas o un maestro que abusa sexualmente de los estudiantes.
En un estudio de presos, puede conocer planes de fuga o la identidad de una
persona que asesinó a un preso. En tales casos, se enfrenta al problema de
sopesar su promesa de confidencialidad frente al daño causado a otros al respetar
esa promesa. Asegúrese de no hacer promesas poco realistas de
confidencialidad.

Al prometer confidencialidad, tenga en cuenta las ramificaciones legales de su


promesa. Según el contexto en el que se recopilan los datos, pueden estar sujetos
a la legislación sobre libertad de información. En muchos países, los datos de
investigación recopilados con la garantía de confidencialidad no gozan de
privilegio legal y pueden ser citados por los tribunales. Dada tal situación, es
importante aclarar sus derechos para mantener la confidencialidad de los datos
cuando trabaje en agencias gubernamentales o bajo un contrato. Los contratos
frecuentemente hacen declaraciones explícitas sobre la propiedad de
88
DISEÑOS
EXPERIMENTALES

datos y es importante asegurarse de que estas disposiciones no comprometan sus


compromisos con respecto a la confidencialidad.
6
Resumen
Los diseños experimentales son valiosos para aislar el impacto causal de variables
específicas. Este es especialmente el caso cuando se llevan a cabo en entornos
ANÁLISIS DE DATOS EXPERIMENTALES
altamente controlados. La estructura del diseño, especialmente el uso de buenos
grupos de control, ayuda a maximizar la validez interna de la investigación
experimental. Sin embargo, la artificialidad de dicha investigación y la estrechez de
los diseños a menudo significan que, para la investigación en ciencias sociales, los
diseños experimentales producen solo resultados limitados. información que
Hay un gran número de técnicas estadísticas que se pueden utilizar para
frecuentemente tiene poca validez externa. Este capítulo ha discutido algunas de las
analizar datos experimentales. El propósito de este capítulo es proporcionar
amenazas a la validez interna y externa de la investigación y ha esbozado las formas
alguna guía para seleccionar entre estas muchas formas diferentes de analizar
en que los diseños experimentales superan estas amenazas. En la investigación de
datos experimentales.
las ciencias sociales, las cuestiones prácticas y éticas también significan que a
menudo no se pueden utilizar diseños experimentales. Este capítulo ha esbozado El núcleo del análisis experimental es la comparación de grupos. ¿Los
estas cuestiones prácticas y éticas. grupos que difieren en términos de la variable independiente también difieren
en la variable dependiente? ¿Los grupos que tienen diferentes 'tratamientos' se
desempeñan de manera diferente en la variable de resultado? En un
notas
experimento bien diseñado, la única diferencia entre los grupos deberían ser los
1 Estas debilidades de la aleatorización son más evidentes con diseños experimentales diferentes 'tratamientos' a los que están expuestos. Cuanto más estemos
simples en los que solo hay una variable independiente. Pueden reducirse un poco en diseños seguros de que nuestros grupos son similares, excepto en términos de la
experimentales más complejos que incluyen varias variables independientes (consulte la variable independiente (intervención), más podemos estar seguros de que las
discusión sobre diseños factoriales en el Capítulo 4). diferencias de grupo en la variable de resultado se deben a la intervención.
2 La mayoría de las instituciones (por ejemplo, hospitales, universidades, organizaciones de Al hacer comparaciones, se deben enfatizar tres cosas.
investigación, departamentos gubernamentales) tienen comités de ética institucionales que
deben aprobar los proyectos desde una perspectiva ética antes de que se liberen los fondos para 1 La comparación se centra en grupos, no en individuos.
el estudio.
2 Necesitamos formas de calcular cuánta diferencia debe haber entre los
3 Los experimentos de Milgram sobre la obediencia son ejemplos clásicos de esto. Ver grupos experimentales y de control antes de atribuirles alguna importancia a las
Baumrind (1964) y Milgram (1964).
diferencias. Por ejemplo, podemos observar diferencias pequeñas pero
importantes o podemos observar diferencias sustanciales que pueden deberse
simplemente a errores de muestreo y medición.

3 Comparamos grupos en términos de la variable de resultado.

Selección del método de análisis


Hay tantas técnicas para analizar datos experimentales. La variedad de
técnicas se debe a la variedad de tipos de variables y las diversas formas de los
datos que se recopilan. Para analizar datos experimentales, necesitamos hacer
coincidir el método de análisis con las características del datos.
¿Qué tipo de análisis se requiere: descripción o inferencia?
El análisis estadístico tiene dos propósitos principales: descripción e inferencia. Las inferenciales
estadísticas descriptivas resumen patrones en una muestra mientras que las
90
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 91

las estadísticas establecen si los resultados de una muestra se pueden extrapolar


a la población más amplia de la que se extrae la muestra. Por ejemplo, podríamos ordinales y nominales (también llamados categóricos o cualitativos). Estos se
encontrar entre los miembros de la muestra que las personas que están pueden explicar mejor con tres ejemplos.
desempleadas tienen peor salud que las personas con empleo. ¿Qué probabilidad
VARIABLES DE INTERVALO/RELACIÓN
hay de que se encuentre el mismo vínculo entre el desempleo y la salud en la
población más amplia que la muestra pretende representar? Las estadísticas Una variable de intervalo/razón es aquella en la que las categorías se pueden clasificar
inferenciales proporcionan una forma de estimar si los patrones de muestra se de menor a mayor de alguna manera significativa. Además de ordenar las categorías de
menor a mayor, es posible especificar la cantidad de diferencia entre las categorías. La
mantendrán en la población más amplia.
edad, cuando se mide en años, es un ejemplo de una variable de intervalo. Podemos
Idealmente, el análisis debe involucrar tanto el análisis descriptivo como el clasificar las categorías de edad (años) desde la más joven (la más baja) hasta la más
vieja (la más alta). Además, podemos especificar la cantidad de diferencia entre las
inferencial. Deberíamos describir cuidadosamente el alcance de las diferencias
categorías. La diferencia entre la categoría '20 años' y la categoría '25 años' es de 5
entre los grupos y luego determinar si es probable que se encuentren diferencias años. Variables como el número de horas semanales de trabajo remunerado,
en la población en general. coeficiente intelectual, altura, peso, ingresos (en dólares) son todas variables donde las
categorías son numéricas y donde los intervalos entre las categorías se pueden
¿Qué tipo de muestra tenemos? especificar con precisión.
Las estadísticas inferenciales solo se pueden usar para generalizar hallazgos si se usa una
muestra probabilística. Una muestra probabilística es uno de dos amplios tipos de muestras. VARIABLES ORDINALES
La otra es una muestra no probabilística. Una muestra probabilística es aquella en la que Una variable ordinal es aquella en la que podemos ordenar las categorías de
cada persona tiene una posibilidad (probabilidad) igual o al menos conocida de ser menor a mayor. Sin embargo, no podemos especificar en términos numéricos
seleccionada. La forma más segura de obtener dicha muestra es seleccionar al azar
cuánta diferencia hay entre las categorías. Por ejemplo, cuando la variable
miembros de la muestra de una población conocida y definida.
edad tiene categorías como 'niño', 'adolescente', 'adulto joven', 'mediana edad'
Cuando tenemos una muestra probabilística, solo podemos generalizar y 'anciano' la variable se mide en el nivel ordinal. Las categorías se pueden
legítimamente a la población específica de la que se extrae la muestra. Una ordenar de menor a mayor, pero no podemos especificar con precisión la
muestra probabilística de un país que excluyó sistemáticamente a las personas diferencia de edad entre las personas en diferentes categorías. Si midiéramos
menores de 18 años, las que no tienen teléfono o las que viven en instituciones el nivel de participación laboral como tiempo completo, tiempo parcial y fuera
arrojaría hallazgos que sólo podría generalizarse a la población de adultos no de la fuerza laboral, esta variable sería una variable ordinal. Si preguntáramos
institucionalizados con teléfono. Si un experimento se basa en una muestra el número exacto de horas trabajadas cada semana la variable (horas de
probabilística de estudiantes en una clase de psicología de primer año en una trabajo) estaría medida a nivel de intervalo.
universidad en particular, entonces solo podemos generalizar con confianza a esta
población (a menos que podamos demostrar que estos estudiantes de psicología VARIABLES NOMINALES

de primer año en la universidad en particular son representativos de una población Una variable nominal es aquella en la que las diferentes categorías no tienen
más amplia). un orden de rango establecido. Con una variable nominal no tiene sentido
decir que las categorías se pueden ordenar de menor a mayor en algún
Si no tenemos una muestra de probabilidad, no tiene mucho sentido usar sentido. La afiliación religiosa es una variable nominal en la que podemos
estadísticas inferenciales para generalizar a una población más amplia. distinguir entre categorías de afiliación (p. ej., judía, católica romana,
Deberíamos limitarnos a estadísticas descriptivas que resuman patrones en esa ortodoxa, protestante, islámica, sin religión). Estas categorías no tienen un
muestra. Muchos investigadores no pueden reclutar muestras aleatorias. orden de clasificación natural.
continúan usando estadísticas inferenciales de manera inapropiada en su análisis.
Cuando las muestras de probabilidad no son factibles, la forma más adecuada de Al seleccionar un método de análisis de datos, primero debemos identificar el nivel de
probar la generalización es repetir el experimento en diferentes contextos y con medición de cada una de las variables en nuestro análisis. Para calcular el nivel de
diferentes muestras. medición de cualquier variable, haga las preguntas de la Tabla 6.1.

Al seleccionar los métodos apropiados de análisis, el nivel de medición


¿Qué nivel de datos tenemos?
tanto de la variable de agrupación (independiente o de intervención) como del
En el análisis estadístico, el nivel de medición de las variables es fundamental para
seleccionar un análisis estadístico particular. Hay tres niveles principales en los
que se miden las variables: intervalo/razón (también llamado continuo),
92
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 93

Desafortunadamente, los promedios pueden ocultar información


Cuadro 6.1 Determinación del nivel de medición de las variables importante. Por ejemplo, podemos obtener promedios idénticos entre dos
grupos, pero los dos grupos pueden diferir considerablemente. El ejemplo de
Nivel de medida
la figura 6.1 ilustra este punto. En este ejemplo, los grupos experimental y de
control son idénticos en el momento 1. Cada persona de ambos grupos logró
Nominal Ordinal Intervalo/proporción
una puntuación idéntica en la variable de resultado (5) y el promedio de cada
grupo fue 5. En el momento 2 el grupo de control permanece sin cambios y
¿Hay diferentes categorías? Sí Sí Sí
mantuvo una puntuación promedio de 5. Cómo-
¿Puedo clasificar las
categorías?

de menor a mayor? No Sí Sí

¿Puedo especificar la
cantidad?

de diferencia entre

las categorias? No No Sí

variable de resultado son relevantes. La selección de métodos particulares


dependerá (en parte) de la combinación de niveles de medición entre las dos
variables y de qué variable (dependiente o independiente) se encuentra en qué
nivel de medición. Las figuras 6.5 a 6.8 demuestran cómo esto afecta la elección de
métodos estadísticos.

¿Tipo de comparaciones requeridas?


Los grupos se comparan en términos de la variable de resultado. Estas
comparaciones pueden examinar la cantidad de cambios antes y después de la
prueba en los grupos experimental y de control o las diferencias absolutas entre los
grupos en la etapa posterior a la prueba. Hay diferentes aspectos de la variable de
resultado que pueden formar el foco de las comparaciones.

DIFERENCIAS DE TENDENCIA CENTRAL

Los grupos se pueden comparar en términos de sus promedios en la variable de


resultado. Se pueden utilizar diferentes tipos de promedios (media, mediana o
moda) según el nivel de medición de la variable de resultado.

La técnica de comparación más utilizada es comparar las medias de los grupos, pero esto
requiere que la variable de resultado se mida a nivel de intervalo (ver más abajo). A nivel
descriptivo, esto simplemente requiere comparar las medias. Sin embargo, estas diferencias
en la muestra pueden no mantenerse en la población: pueden ser simplemente el resultado de
un error de muestreo. Podríamos utilizar una técnica de estadística inferencial para averiguar
si la diferencia entre las medias probablemente refleje una diferencia real en la población o
simplemente se deba al azar (error de muestreo). Para hacer esto, podríamos usar una
técnica como una prueba t, una prueba F o análisis de varianza.
en 5. Los promedios de los dos grupos en el tiempo 2 permanecen iguales.
Promedio En consecuencia, una simple comparación de los dos promedios sin observar
A B C D mi F GRAMO H 1 j otros elementos de las distribuciones llevaría a una conclusión falsa de que la
Caso
(significar) intervención no tuvo efecto, ya que los promedios no reflejaron cambios ni
Hora 1 diferencias entre los grupos experimental y de control.
Puntuación en la variable de resultado
DIFERENCIAS EN LA VARIABILIDAD
Grupo de control 5 5 5 5 5 5 5 5 5 5 5
Una forma alternativa de comparar grupos es medir el grado de diversidad
dentro de cada uno de los grupos. ¿Algunos grupos son más uniformes que
Grupo experimental 5 5 5 5 5 5 5 5 5 5 5 otros? ¿Algunos grupos cambian para volverse más uniformes o menos
uniformes que otros? El impacto de una intervención puede no ser aumentar
tiempo 2 Puntuación en la variable de resultado los puntajes generales sino hacer que un grupo sea más uniforme o más
diverso (como en la Figura 6.1). Hay medidas estadísticas como el rango, la
varianza y la desviación estándar que brindan resúmenes del grado de
Grupo de control 5 5 5 5 5 5 5 5 5 5 5
uniformidad (homogeneidad) en los grupos y hay pruebas que miden si los
niveles de homogeneidad en los grupos difieren. Técnicas gráficas como
Grupo experimental 0 0 0 0 0 10 10 10 10 10 5 histogramas y diagramas de caja y bigotes también se puede utilizar para
examinar si los grupos son igualmente diversos. Las pruebas de variación
que se utilicen dependen en parte del nivel de medición de las variables en
Figura 6.1 Problemas con la comparación de promedios
cuestión.

nunca, el grupo experimental ha cambiado mucho. Todos los individuos han


cambiado: la mitad tiene puntajes mucho más bajos y la mitad tiene puntajes más
altos. Sin embargo, el puntaje promedio para este grupo experimental permanece
94
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 95

Las distribuciones de modalidad pueden ser unimodales, bimodales o


multimodales (Figura 6.2a). Una intervención experimental podría
cambiar una distribución unimodal a una distribución multimodal.

Simetría Las distribuciones de variables ordinales o de intervalo pueden


ser simétricas o sesgadas (Figura 6.2b). Las distribuciones asimétricas
pueden ser positivas (casos que se agrupan en el extremo inferior de la
variable de resultado) o negativos (casos que se agrupan en el extremo
superior de la variable de resultado). Una intervención podría cambiar la
simetría de la distribución.

Las distribuciones de curtosis pueden variar en términos de cuán


(a) Modalidad agrupadas están alrededor del centro de la distribución. Esto se llama
(b) Simetría curtosis (Figura 6.2c). La distribución puede ser muy agrupada o
puntiaguda (leptocúrtica), en forma de campana (mesokúrtica) o bastante
plana (platycúrtica).
Todas estas diferentes formas de pensar acerca de las distribuciones
proporcionan diferentes formas de examinar el impacto de una intervención
en una variable de resultado. En lugar de centrarnos estrictamente en el
impacto sobre la puntuación media de un grupo, podemos observar otras
dimensiones de la variable de resultado para detectar un efecto.

DIMENSIONES

Otro enfoque para comparar grupos, que se utiliza mejor para variables de
resultado categóricas (nominales) o variables con pocas categorías, es
comparar la proporción o el porcentaje de cada grupo que da una respuesta
particular.
(c)Kurtosis (d)Spread
Por ejemplo, imagine que quisiéramos examinar el efecto sobre las tasas
de finalización de cursos universitarios de diferentes métodos de impartición
Figura 6.2 Formas de distribuciones
de un curso. Examinamos las tasas de finalización de aquellos a quienes se
les enseña en situaciones cara a cara con aquellos que toman su curso a
través de Internet. Podríamos encontrar que en el grupo cara a cara, el 75 por
ciento completó con éxito en comparación con el 60 por ciento de los
miembros del grupo de Internet. Estos porcentajes brindan una descripción
FORMA de los diferentes resultados en los dos grupos (estadísticas descriptivas).
Entonces podríamos emprender un análisis que nos diría si estas diferencias
El impacto de una intervención puede verse en su efecto sobre la forma de las puntuaciones entre los grupos (75 por ciento y 60 por ciento) probablemente se deban al
en la variable de resultado. Las comparaciones de homogeneidad de grupo son una forma azar o no. si es probable que reflejen diferencias reales en la población de la
de comparar formas de distribuciones. Otros aspectos de la forma de una distribución que se extrajo la muestra (estadística inferencial). En el ejemplo recién
también pueden formar la base de comparaciones de grupos y revelar el impacto de una proporcionado, la prueba de diferencia entre proporciones para dos muestras
intervención. cumpliría esta función (Loether y McTavish, 1974a: 189ff).
Además de comparar el grado de similitud o diferencia dentro de un grupo, también
podemos comparar las distribuciones utilizando otras dimensiones de la forma de una ASOCIACIÓN ENTRE VARIABLES
distribución. Estas diferentes dimensiones se ilustran en la Figura 6.2.
Los grupos también se pueden comparar de manera útil al examinar la
asociación o correlación entre variables. Las medidas estadísticas de
asociación ponen a prueba la
96
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 97

Además de describir hasta qué punto existe una asociación entre la


medida en que dos variables covarían. Cuando decimos que el género y los intervención experimental y el resultado, debemos usar una estadística
ingresos están asociados queremos decir que conocer el género de una persona inferencial para determinar si es probable que la asociación se mantenga en
ayuda a predecir mejor sus ingresos que si no supiéramos su género. la población más amplia. Se han desarrollado diferentes pruebas
inferenciales para diferentes coeficientes de correlación.
Un diseño experimental simple tiene dos variables: la variable de intervención (variable
independiente) y la variable de resultado. Si la intervención tiene un efecto sobre la variable de
¿Qué tipo de pantalla se requiere?
resultado, entonces las dos variables, la intervención y el resultado, se asociarán
estadísticamente. Es decir, si las personas del grupo que recibió la intervención (grupo Dado que el propósito del análisis en los experimentos es comparar grupos,
experimental) obtuvieron puntajes diferentes en la variable de resultado que los que no debemos decidir cómo mostrar las diferencias entre los grupos. Nuestra
recibieron la intervención, las dos variables, intervención y resultado, estarían asociadas elección es entre usar tablas, gráficos o estadísticas de resumen. Cuál(es)
estadísticamente. Dicha asociación se puede mostrar mediante tabulaciones cruzadas, elijamos dependerá en parte de la audiencia y la complejidad de los datos.
gráficos o resúmenes estadísticos, como el coeficiente de correlación.
Las tres formas de mostrar los resultados se pueden ilustrar con un ejemplo.
Suponga que tenemos un experimento que examina el impacto de diferentes formas
Cuadro 6.2 Cambio de productividad según esquema de incentivos
de recompensas en la productividad del lugar de trabajo. Las tres condiciones
experimentales serían: (1) tasas de pago estándar fijas independientemente de la Tipo de interés
% cambiar en bono de grupo bono individual
fijo
productividad , (2) un bono de productividad para todo el grupo al final del año
dependiendo de la producción del grupo, (3) bonos de productividad individuales productividad (ou)dnou8 grupo (nº) (ou)dnou8
dependiendo de la productividad del individuo. La variable de resultado sería el
100 o más - 2 7
cambio porcentual en la productividad de cada individuo.
75 a 100 - 5 1
A continuación se ilustran ejemplos de métodos tabulares, gráficos y estadísticos
para mostrar los resultados. 50 a 74 - 6 2

25 a 49 2 10 1
TABULAR
1 a 24 5 6 14
La tabla 6.2 proporciona un ejemplo de cómo los resultados de un estudio pueden
Ningún cambio 19 3 1
presentarse en forma tabular. En este ejemplo, se reporta el grado de cambio de
productividad para cada uno de los tres esquemas de bonificación. Las celdas de la -1 a-24 5 1 2
tabla indican el número de personas de cada esquema de bonificación que 2
-25 a-50 - 5
muestran varios niveles de cambio en la productividad. Para buscar diferencias en
el efecto de los tres esquemas de bonificación, debemos observar el patrón y la -50 o menos - -

distribución de números para cada uno de los tres esquemas.


norte 33 33 33

GRÁFICO/TABLA
Al decidir mostrar datos con un gráfico, también debemos decidir qué tipo de gráfico
usar. En la Figura 6.3 se proporcionan solo tres de las muchas presentaciones gráficas
posibles: histogramas, diagramas de tallo y hojas y diagramas de caja y bigotes. Los
tres gráficos se basan en los mismos datos y proporcionan diferentes formas de pensar
y visualizar las distribuciones.

RESUMEN ESTADÍSTICO

Alternativamente, podríamos evitar el uso de tablas y gráficos por completo y


simplemente demostrar las diferencias de grupo mediante el uso de promedios,
porcentajes o alguna otra forma de resumen estadístico. La figura 6.4 proporciona un
conjunto de estadísticas resumidas en relación con el cambio de productividad en los
tres grupos. Esta es una descripción estadística completa de los cambios en los tres
grupos. Sin embargo, gran parte de la misma imagen se puede deducir de los gráficos
y la tabla.

¿Cuántos grupos se van a comparar?

Otro determinante de la forma en que analizamos nuestros datos es la cantidad de


grupos que comparamos. Algunas técnicas estadísticas se limitan a comparaciones de
dos grupos (prueba de egt), mientras que otras son apropiadas para múltiples grupos
(por ejemplo, razones F y análisis de varianza). Algunos coeficientes de correlación
están diseñados para un pequeño número de grupos (tau de Kendall, eta) mientras que
otros son apropiados para variables independientes con un gran número de
categorías. De manera similar, la idoneidad de las técnicas de visualización tabular y gráfica La forma más simple de comparación es cuando tenemos un solo grupo y deseamos
dependerá del número de grupos. en el análisis. comparar los resultados en este grupo con un valor conocido. Estos métodos de
análisis se conocen como diseños de una muestra.
COMPARACIONES DE UN GRUPO CON UN VALOR CONOCIDO

98
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 99

(a) Histogramas

Fr

Figura 6.3 Representaciones gráficas de los cambios de productividad por sistema de


(b) Diagramas de tallo y hoja
bonificación

(c) Diagramas de caja y bigotes


curtosis 31.1515 9.0712

Prima individual Media 14.0000 .409


descriptivos
Mediana 2715.445 .798
Sistema de bonificación Estadística Error
estándar Diferencia 52.1099

% de cambio en la productividad Pago a tasa fija -.5455 2.3769


Desviación -45.00
Media estándar
.0000 .409 125.00
Mínimo
Mediana
186.443 .798 170.00
Máximo
Diferencia
13,6544 79.5000
Rango
Desviación estándar
-30.00 .679
Rango intercuartil
Mínimo
30.00 -.822
Máximo
Oblicuidad

Rango
60.00 curtosis
7.5000
Rango intercuartil
Figura 6.4 Estadísticas resumidas: cambio de productividad por esquema de
-.161
Oblicuidad bonificación
1.078
curtosis
Digamos, por ejemplo, que queríamos establecer qué conexión había, si la
Prima de grupo Media 45,4848 5.9012
hubiera, entre tener un hijo con una discapacidad y la probabilidad de que los padres
Mediana 39.0000 .409 del niño se divorciaran. Supongamos que sabemos que la tasa nacional de divorcio
en cualquier año para parejas con un hijo en el hogar es de 12 por 1000 parejas
Diferencia 1149.195 .798
casadas. Luego, a partir de nuestra investigación, descubrimos que en una muestra
Desviación 33.8998 de familias en las que había un niño con una discapacidad grave, la tasa de divorcio
estándar era de 14 por 1000. La tasa de 14 para la muestra de discapacidad es ciertamente
-5.00
Mínimo más alta que la cifra general nacional, pero es la diferencia probable que refleje una
130.00 diferencia real o simplemente se deba a un error de muestreo? Una estadística
Máximo
inferencial puede responder a esta pregunta. La misma lógica de comparar un solo
135.00
Rango grupo de muestra con una figura de comparación conocida se puede aplicar al
53.0000 análisis en el que nos enfocamos en la media, la proporción o la varianza de un solo
Rango intercuartil
grupo (ver Loether y McTavish, 1974a: Capítulo 7).
.567
Oblicuidad
-.261

100
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 101

No hay nada en la lógica del diseño experimental que nos restrinja a las
Dos grupos variables de resultado a nivel de intervalo. Cuando solo hay dos grupos y la
El diseño experimental clásico comprende dos grupos: el grupo experimental y el grupo de variable de resultado es nominal u ordinal, podemos usar una medida de
control. En diseños experimentales con una variable de resultado a nivel de intervalo, la prueba asociación como estadística de resumen para describir el vínculo entre
t se utiliza para establecer la significación estadística de las diferencias entre grupos. Indica si pertenencia al grupo y resultado.
es probable que la diferencia entre las medias de los dos grupos se deba al azar o si refleja
verdaderas diferencias en la población. El uso de esta prueba depende en cierta medida de la Alternativamente, podríamos usar tabulaciones cruzadas o gráficos para mostrar
distribución de la variable (ver más abajo). Se pueden usar otras pruebas, como la razón crítica, las diferencias entre dos grupos. Si necesitáramos generalizar acerca de si alguna de
para establecer la importancia de las diferencias de grupo para muestras grandes donde no se las relaciones mostradas en tablas o gráficos probablemente se mantendría en la
cumple el supuesto de normalidad (Mueller et al., 1977: 422). población más amplia, podríamos usar una estadística inferencial apropiada. Chi
cuadrado es una estadística ampliamente utilizada que es especialmente útil cuando
las variables de resultado se miden en el nivel nominal. Esto nos dice si las dos variables son
independientes entre sí, es decir, si la pertenencia al grupo hace alguna diferencia en la variable
de resultado. Cuadro 6.3 Cambio porcentual medio en la productividad por
esquema de bonificación
TRES O MÁS GRUPOS grupo de
Cambio% medio
bonificación
Algunos diseños experimentales requieren tres o más grupos de comparación. Por ejemplo,
podemos querer comparar una variedad de intervenciones además de tener un grupo de
control. en productividad

Cuando la variable de resultado es nominal u ordinal, estaremos restringidos en gran medida Tasa fija de pago -0.55
a tablas, gráficos, medidas de asociación y otras formas de comparar distribuciones. Estos
métodos son satisfactorios siempre que haya un número suficiente de personas en cada grupo bono de grupo 45.48
y no haya demasiados grupos para comparar. Cuando hay más de seis o siete grupos para
bono individual 31.15
comparar, las comparaciones pueden volverse muy difíciles.

Si la variable de resultado es una variable de nivel de intervalo, el análisis se realiza de


manera más eficaz comparando las medias de los diferentes grupos. Con frecuencia se utiliza
un análisis de varianza unidireccional para este propósito.
Un análisis de varianza puede mostrar que, en general, el cambio de
productividad varía según la pertenencia al grupo. Sin embargo, el problema
Un análisis de varianza unidireccional nos dirá si hay diferencias dentro de un conjunto de con este análisis es que no sabemos qué diferencias de grupo son
medias. Por ejemplo, en la ilustración anterior del impacto de los esquemas de bonificación en importantes. Está bastante claro que tanto los grupos de bonificación grupal
la productividad había tres grupos: tarifa fija de pago, bonificación grupal y bonificación
individual. Supongamos que los resultados descritos en la Tabla 6.3 se obtuvieron en este como los de bonificación individual funcionan mejor que el grupo de pago
estudio. fijo, pero ¿es estadísticamente significativa la diferencia entre los sistemas
de bonificación grupal e individual? ¿Podría la diferencia entre la mejora del
45,48 por ciento y la mejora del 31,15 por ciento deberse simplemente al
azar?

Para averiguar qué grupos tienen medias que son estadísticamente diferentes
entre sí, necesitamos un procedimiento de comparación múltiple. En tal
procedimiento se comparan todos los posibles pares de grupos y se puede establecer
qué pares de grupos, si los hay, tienen medias que son significativamente diferentes
entre sí. Una técnica de comparación múltiple ampliamente utilizada es la prueba de
Scheffé.

La prueba de Scheffé nos da una estimación. Lo hace observando las


diferencias de medias entre los siguientes pares de grupos:

1 pago fijo versus bono de grupo

2 sueldo fijo versus bono individual

3 Bono de grupo versus bono individual.

Puede demostrarse que las diferencias en los dos primeros pares (pago fijo
versus bono grupal y pago fijo versus bono individual) probablemente no se
debieron al azar. Sin embargo, la diferencia entre los aumentos de
productividad en los esquemas de bonos grupales e individuales
probablemente se debió al azar. Esto significa que si las diferencias
observadas en la mejora de la productividad de aquellos con bonos
individuales y aquellos con bonos grupales se deben al azar, entonces
esencialmente los dos esquemas son igualmente efectivos. No importa qué esquema DISEÑOS DE MUESTRAS INDEPENDIENTES

de bonificación se utilice. La manera más simple y efectiva de hacer que los grupos sean inicialmente
comparables es asignar aleatoriamente individuos a grupos experimentales y de
¿Los grupos de comparación son muestras independientes? control. Esto se denomina diseño de muestras independientes. Asignación aleatoria a

102
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 103

¿Cómo podemos saber si la variable de resultado se distribuye normalmente


los grupos experimentales y de control deben garantizar la independencia entre los en la población? Dada una muestra de tamaño suficiente, un gráfico lineal o
grupos. También debe haber independencia entre los casos dentro de los grupos. un
Dado que la selección de un elemento de la muestra debe ser independiente de la
selección de cualquier otro elemento, un grupo compuesto por, digamos, parejas de
marido y mujer no produce un diseño de muestras independientes.

DISEÑOS DE MUESTRAS APARADAS


En un diseño de muestras pareadas, los grupos se hacen comparables emparejando los
elementos de la muestra en lugar de una simple asignación aleatoria. Aquí, la selección de
personas en un grupo no es independiente de la selección de personas para otros grupos. Por
ejemplo, podríamos tener un grupo de gemelos idénticos y asignar un gemelo al grupo
experimental y el otro al grupo de control. Alternativamente, podríamos simplemente administrar
diferentes tratamientos experimentales al mismo grupo en diferentes momentos. Al usar el
mismo grupo teóricamente eliminamos cualquier otra diferencia entre los grupos (excepto, por
supuesto, que los tratamientos posteriores pueden estar contaminados por tratamientos
anteriores del mismo grupo). En efecto, las personas en un grupo experimental se emparejan
consigo mismas para el siguiente tratamiento.

Algunas estadísticas inferenciales deben tener en cuenta la forma en que las personas fueron
asignadas a las diferentes condiciones experimentales. ¿ Estaban emparejadas de alguna
manera o fueron seleccionadas al azar (independientemente)?

¿La variable dependiente se distribuye normalmente?


Algunas estadísticas inferenciales, llamadas estadísticas paramétricas, requieren
variables de resultado a nivel de intervalo que se distribuyen normalmente en la
población. Desafortunadamente, a menudo las variables de resultado no se
distribuyen normalmente en la población (en el sentido estadístico) o se desconoce su
distribución poblacional.

Cuando la variable de resultado no tiene una distribución normal o no podemos


suponer razonablemente una distribución normal de la población, tenemos tres
opciones principales (Loether y McTavish, 1974a: 268ff).

1 Podemos 'normalizar' la distribución transformándola (Marsh, 1988: Capítulo 11).

2 Podemos violar el supuesto de normalidad y usar la estadística paramétrica de


todos modos. Se argumenta que algunas de estas estadísticas son sólidas y arrojan
resultados muy similares independientemente de que se cumplan sus supuestos.

3 Podemos usar una estadística no paramétrica que no asuma una distribución


normal.
¿Cuántas variables independientes?

El histograma puede dar una idea visual de si la distribución es una distribución Los diseños experimentales más simples tienen una sola variable
unimodal en forma de campana. Una curva normal también tendrá una asimetría de 0 independiente. Sin embargo, muchos diseños incluyen varias variables
(es decir, simétrica) y una curtosis de 3 (es decir, mesokúrtica) (Loether y McTavish, independientes. Los diseños factoriales y de cuatro grupos de Solomon
1974b: 162). Cuando la muestra es pequeña (por ejemplo, menos de 50) y no se examinan el impacto de cada una de las variables experimentales en la
extrae al azar de la población y se desconoce su distribución poblacional, la estrategia variable de resultado. También identifican el impacto de las interacciones
más segura es utilizar estadísticas no paramétricas o estadísticas paramétricas entre estas variables independientes en la variable de resultado. En los
robustas. experimentos de campo donde la asignación aleatoria no es posible,
necesitamos estimar y eliminar estadísticamente el efecto de las diferencias
¿La varianza de la variable dependiente es similar entre cada grupo de comparación? de grupo conocidas para que podamos examinar el efecto 'puro' de la
variable experimental.
Las comparaciones de grupos pueden ejecutarse de manera útil comparando la
respuesta típica de cada grupo. Sin embargo, las comparaciones de lo que es típico Cuando se utilizan múltiples variables independientes, la estrategia de
pueden invalidarse si los grupos tienen varianzas muy diferentes. La comparación de análisis dependerá de:
las medias de grupos con varianzas muy diferentes dificulta establecer si hay
diferencias en las medias se deben a diferencias en la tendencia central o no (Loether el nivel de medición de todas las variables (tanto independientes como
y McTavish, 1974a: 176). dependientes)

Algunas técnicas estadísticas requieren que establezcamos que la varianza en los (dos) si queremos examinar el impacto relativo de cada variable independiente
grupos es similar. Esto es particularmente importante para las pruebas t de diferencias entre las (incluidos los efectos de interacción) o
medias. En el caso de las pruebas t existen diferentes formas de la prueba dependiendo de si
hay igualdad de varianzas entre los grupos. La mayoría de los paquetes estadísticos incluyen si queremos ver el efecto de una sola variable independiente con el efecto de otras
técnicas estadísticas para probar esta condición. variables controladas.

104
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 105

IMPACTO INDEPENDIENTE DE MÚLTIPLES VARIABLES INDEPENDIENTES

Cuando un diseño utiliza múltiples variables independientes y una variable de una forma modificada de análisis de regresión denominada variables ficticias (ver de co
resultado a nivel de intervalo, el análisis de varianza de dos vías o factorial es un Vaus, 1996). nfu
método de análisis común. Este método permite al investigador observar el impacto Si la variable dependiente es de carácter nominal u ordinal, no se puede sió
de cada variable independiente con los efectos de las otras variables independientes. utilizar el análisis de varianza o el análisis de regresión estándar. Sin n
variables pendientes eliminadas. Es decir, el análisis puede aislar el efecto 'puro' de embargo, existen otras formas de análisis de regresión, como la regresión de
cada variable independiente y cada posible efecto de interacción. logística, que se pueden utilizar para estas situaciones. otr
as
Este enfoque se puede ilustrar mediante el empleo de una analogía química en la que hay tres
productos químicos A, B y C. La pregunta es: '¿Cuál es el efecto corrosivo de estos tres ELIMINAR LOS EFECTOS DE OTRAS VARIABLES var
productos químicos en el acero?' Podríamos ver el efecto del químico A solo, el químico B solo y Si estamos interesados en el efecto de una sola variable independiente, es iab
el químico C solo. También podríamos querer saber qué sucede cuando combinamos los tres posible que debamos eliminar estadísticamente los efectos de otras les
químicos de diferentes maneras: A con B, A con C, B con C, y A, B y C combinados. El análisis es
diferencias de grupo en la variable de resultado. El análisis de varianza y la
factorial de la varianza nos permite responder a este tipo de preguntas. us
regresión logran esto. Sin embargo, con variables de resultado nominales y
La regresión múltiple es otro enfoque empleado para el análisis que involucra una variable de ordinales también podemos usar tabulaciones cruzadas para eliminar el ar
resultado a nivel de intervalo y múltiples variables independientes. La regresión múltiple efecto de las variables 'contaminantes'. Para ello utilizaríamos el análisis de un
proporciona una forma de examinar el efecto de cada variable independiente menos el efecto de a
elaboración (ver pp.203-210). No hay espacio suficiente para describir este
cualquier otra variable independiente y de las interacciones entre las variables independientes. tab
Cuando las variables independientes no se miden a nivel de intervalo (el análisis de regresión enfoque aquí, pero hay explicaciones claras fácilmente disponibles
múltiple normal supone que todas las variables se miden a nivel de intervalo), podemos utilizar (Rosenberg, 1968; Johnson, 1977). Otra forma de eliminar los efectos de la
pa
rcial promedio (Loether y McTavish, 1974b: 290).

Figu
ra
6.5
Sele
cció
n de
mét
odo
s
esta
dísti
cos
de
análi
sis,
part
e1

Proceso resumido para seleccionar la medida adecuada


Las figuras 6.5 a 6.8 están diseñadas para ayudarlo a seleccionar una forma apropiada de análisis estadístico dados diferentes tipos de situaciones experimentales.
DIS
EÑO
S
EXP
ERI
MEN
TAL
ES

106
Figura 6.6 Selección de métodos estadísticos de análisis, parte 2

ANÁL
ISIS
DE
DATO
S
EXPE
RIME
NTAL
ES

Figura 6.7 Selección de métodos estadísticos de análisis, parte 3


106

108
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 109

y diferentes tipos de datos. Estas cifras no pueden cubrir todas las


posibilidades, pero brindan orientación para una amplia gama de situaciones
típicas. La mayoría de estas estadísticas se calculan fácilmente utilizando
paquetes como SPSS o SAS.
DIEZ PREGUNTAS

Seleccionar el método de análisis apropiado implica esencialmente hacer


una serie de preguntas:

1 ¿Qué tipo de muestra tiene?

Probabilidad.

Probablemente no.

2 ¿Cuál es el nivel de medición de la variable de resultado?

·Nominal.

·Ordinal.

·Intervalo.

3 ¿Cuántos grupos estás comparando?

·Uno (contra un estándar conocido).

·Dos.

·Tres o más.

4 ¿Cómo se asignaron las personas a cada grupo?

·¿Las muestras(grupos) son independientes?

· ¿Las muestras (grupos) están emparejadas o emparejadas de alguna


manera?

5 ¿Cómo se distribuye la variable de resultado en la población?

·Normal.

·No es normal o no puede asumir la normalidad.

6 ¿Los grupos tienen una varianza similar en la variable de resultado?

·Igualdad de varianza.

· Varianza desigual.

7 ¿Qué comparaciones de grupos son necesarias?


·Tendencia central. 9 ¿Cuántas variables independientes tienes?

· Variabilidad/forma. ·Una.

·Dimensiones. ·Dos o más.

·Asociación. 10 ¿Le preocupa principalmente la descripción o la inferencia?

8 ¿De qué forma desea mostrar sus comparaciones entre grupos? ·Describe patrones en la muestra?

· Tabular. ·¿Generalizar a partir de la muestra?

·Gráfico. ·Ambas cosas.

·Uso de estadísticas resumidas.

·Mezcla.
No todas estas preguntas son apropiadas en todas las circunstancias. Algunas son Por ejemplo, podemos usar una escala de 0 a 10 para medir la felicidad
apropiadas dependiendo de cómo se respondan las preguntas anteriores (por ejemplo , donde una puntuación de 0 indica infelicidad. Supongamos que tuviéramos
si no tiene una muestra de probabilidad, entonces no puede usar la inferencia personas en nuestros grupos que obtuvieron una puntuación de 0, es decir,
estadística y, por lo tanto, estará restringido a la descripción). estábamos en el extremo de la infelicidad según lo medido por nuestra escala.
Sin embargo, si estos la gente se volvió aún más infeliz con el tiempo, no hay
forma de detectar esto con nuestra medida. Esas personas serían identificadas
Otros asuntos como personas que no cambian. Solo podríamos identificar a las personas que
se volvieron más felices. Lo mismo se aplicaría a quienes obtuvieron una
Cambiar puntuaciones puntuación de 10. Solo pudimos detectar a aquellos que se volvieron menos
felices.
La lógica del diseño experimental clásico nos llevaría a usar puntajes de cambio.
Cuando tenemos una prueba previa, podemos examinar cuánto cambia cada grupo en Incluso aquellos que no están en el extremo de una escala pero están cerca del final
la medida de resultado antes y después de la intervención. Dado que reconocemos que presentan un problema. Por ejemplo, aunque la persona que obtiene una puntuación de 1
el grupo de control también puede exhibir cambio debido a factores como la maduración, en la prueba previa puede ir más abajo (puede obtener un 0), no puede cambiar en la
simplemente hipotetizaríamos que el cambio será mayor en el grupo experimental que misma medida que alguien que obtuvo una puntuación inicial de, por ejemplo.
en el grupo de control. Por ejemplo:
Grupo experimental: puntuación de cambio=20 Grupo de control: puntuación de cambio=5

Luego podemos realizar un análisis de varianza para ver si este grado de diferencia en
las puntuaciones de cambio (20 en comparación con 5) podría haber ocurrido debido al
azar (error de muestreo). Si la diferencia pudiera deberse a un error de muestreo,
supondríamos que habría no habrá diferencia en la población de la que se extrajo la
muestra.

Hay varios problemas con el uso de puntajes de cambio simples para detectar
cambios y estos se discutirán en el Capítulo 9.

Efectos de truncamiento (efectos de suelo y techo)

En los diseños en los que las puntuaciones de un grupo se agrupan alrededor del
extremo superior o inferior de una escala (es decir, la medida de la variable de
resultado), debemos recordar que el cambio solo se puede detectar en una dirección.
Este hecho puede introducir un sesgo en la naturaleza de la variable. cambio observado.
Sin embargo, un enfoque inicial útil para analizar este tipo de datos es dibujar
3 o 4. Si el análisis mide el grado de cambio en lugar de simplemente cambiar per se, el gráficos de líneas simples. Estos pueden o no revelar un efecto claro a largo o
'piso' de la escala puede llevarnos a subestimar el grado de cambio. corto plazo o indicar que la intervención no tiene un efecto distintivo (Figura
6.9). El patrón en el grupo o grupos experimentales se puede comparar con el
Este es un problema con muchas medidas que tienen límites superior e inferior.
de un grupo de control.
Introduce un sesgo en términos del tipo de cambio que podemos medir a nivel individual
(ver Capítulo 9) y por lo tanto puede subestimar el alcance del cambio y Sin embargo, la dificultad es que, con múltiples observaciones, los patrones
equivocadamente estimar la dirección del cambio en general. con frecuencia no son tan claros como los de la figura 6.9. Podemos observar
diferencias en diferentes puntos de tiempo simplemente debido al azar y al
Es difícil lidiar con este problema de datos extraídos de escalas con límites estrictos
error de medición. El problema entonces se convierte en lo que constituye una
superior e inferior en la etapa de análisis. El problema de los efectos de truncamiento se
diferencia real entre diferentes líneas de series de tiempo. Este problema es
maneja mejor en la etapa de diseño, donde debemos asegurarnos de que nuestras
demasiado grande para ser tratado definitivamente aquí. Si planea realizar este
medidas estén diseñadas de tal manera que las personas no se agrupen en un extremo
tipo de análisis, asegúrese de obtener un buen asesoramiento estadístico antes
de la escala. Deberíamos emplear medidas que tengan techos altos y pisos bajos y
de realizar el análisis.
donde las personas no se amontonen hacia ninguno de los extremos.

Análisis de tendencia
Resumen
Para identificar los efectos a corto y largo plazo (consulte el Capítulo 4), algunos diseños
experimentales requieren múltiples medidas de antes y después. Estos diseños pueden Este capítulo ha examinado la lógica del análisis de datos experimentales. En
presentar problemas de análisis particulares y pueden involucrar análisis bastante su mayor parte, la lógica básica es la de comparar grupos en relación con el
complejos si estamos tratando de comparar dos tendencias (a diferencia de decir dos desempeño de cada grupo en la variable de resultado. La base de la
medios). Existe una gama de lo que se denominan métodos de análisis de series de comparación pueden ser promedios, distribuciones completas, varianza o
tiempo que están más allá del alcance de este libro. muchas otras características de las distribuciones. Existe una asombrosa
variedad de estadísticas disponibles para el análisis de datos experimentales.
Para ayudar
112
DISEÑOS EXPERIMENTALES
PARTE III

DISEÑOS LONGITUDINALES

TIPOS DE DISEÑO LONGITUDINAL

Encontrará una amplia variedad de diseños longitudinales en la literatura.


Sin embargo, todos comparten los objetivos comunes de medir el cambio a
lo largo del tiempo y de hacerlo mediante la recopilación de datos sobre al
menos dos puntos temporales. En ambos aspectos, son similares al diseño
experimental clásico que tiene una prueba previa y una prueba posterior.
Sin embargo, los diseños longitudinales no suelen tener un grupo de control
aleatorio.1

Figura 6.9 Algunos resultados de una variable experimental en una serie de tiempo El desarrollo de diseños longitudinales implica una serie de decisiones
críticas. Las decisiones que se tomen determinarán exactamente qué tipo
de diseño longitudinal evoluciona.
con la selección de las estadísticas apropiadas, este capítulo ha esbozado las
principales consideraciones que deben tenerse en cuenta al seleccionar el método 1 ¿Se seguirán los mismos casos a lo largo del tiempo? Aquí la elección es
particular de comparación. Finalmente, dado que los diseños experimentales entre estudios de tendencias y estudios de panel. Los estudios de
normalmente involucran el análisis del cambio, el capítulo discutió una serie de tendencias (o estudios transversales repetidos) implican recopilar
cuestiones sobre la medición del cambio: el uso de puntajes de cambio, efectos de información de muestras comparables a lo largo del tiempo, pero no de las
truncamiento y análisis de tendencias. En el Capítulo 9 se considerarán otros mismas personas. Encuestas anuales como la Encuesta Social General en
problemas relacionados con la medición del cambio. los EE. UU., la Encuesta Británica de Actitudes Sociales, las encuestas del
Eurobarómetro y las Encuestas del Programa Internacional de Ciencias
Sociales son ejemplos de estudios de tendencias en los que se hacen
Nota preguntas similares a una muestra nueva cada año. Este diseño permite la
el seguimiento de los cambios en las actitudes y el comportamiento a lo
1 Esto es cierto si los individuos son las unidades de análisis en el experimento. Si la pareja largo del tiempo. Un diseño de panel involucra encuestas repetidas de las
fuera la unidad de análisis, tener la pareja no violaría los requisitos de independencia. mismas personas. Este diseño permite el seguimiento del cambio tanto a
nivel agregado como individual (consulte el Capítulo 9).

2 ¿Se recopilarán datos en un momento determinado? Aunque los diseños


de panel implican la recopilación de datos sobre al menos dos puntos de
tiempo, no necesariamente requieren que estos datos se recopilen en dos
ocasiones diferentes. El diseño longitudinal prospectivo implica la
recopilación de datos en varias ocasiones diferentes. En tal diseño, un grupo de personas
114
DISEÑOS LONGITUDINALES

El propósito de los diseños longitudinales puede variar de lo descriptivo a lo


ser entrevistado, rastreado y vuelto a entrevistar al menos una vez en el futuro. El explicativo. Como herramienta descriptiva el valor del diseño longitudinal
diseño del panel retrospectivo puede implicar la recopilación de datos en una sola
ocasión. Las dimensiones de tiempo y cambio del estudio se obtienen pidiendo a las
personas que recuerden cómo eran las cosas en algún momento anterior y también
en el presente. De esta forma podemos obtener alguna indicación de hasta qué punto
ha cambiado la persona a lo largo del tiempo.

Los diseños longitudinales también pueden variar en muchas otras dimensiones. Estos
incluyen los siguientes:

Entorno La lógica del diseño longitudinal se puede aplicar en entornos que van desde
una situación de laboratorio altamente controlada, grupos de menor escala (por ejemplo,
clases escolares, partes de una organización) hasta encuestas nacionales a gran
escala.

Escala de tiempo La brecha sobre la cual se puede medir el cambio puede variar desde
un período muy corto (por ejemplo, una medida de actitudes antes y después de ver una
película) hasta muchos años. El Estudio Nacional de Desarrollo Infantil es un ejemplo de
una encuesta de panel a largo plazo. El estudio comenzó en 1958 e incluyó a todos los
niños nacidos en Gran Bretaña entre el 3 y el 9 de marzo. Estos niños han sido
rastreados e involucrados en posteriores recopilaciones de datos de seguimiento en
1965, 1969, 1974, 1981, 1991 y 2000.

Número de puntos de tiempo Los estudios longitudinales variarán en términos de


cuántas veces se recopila información del mismo grupo de personas en un estudio de
panel o grupos de personas diferentes como en un estudio de tendencias. El famoso
programa de televisión '7-up', que tiene siguió a un grupo de niños durante un largo
período para ver qué cambios han tenido lugar en sus vidas, es un excelente ejemplo
de un diseño de panel. Comenzó con niños que tenían siete años y ha vuelto a visitar
a los niños cada siete años desde entonces. Estos niños ahora tienen 40 años. La
Encuesta de Panel de Hogares Británicos proporciona un ejemplo de un estudio de
panel con recopilaciones de datos más frecuentes. Cada año vuelve a visitar su
muestra nacional.

Intervenciones planificadas Las encuestas longitudinales también variarán en


términos de si involucran 'intervenciones' planificadas o si se basan en la observación
de los resultados de eventos que ocurren naturalmente. Donde hay intervenciones
planificadas, el diseño longitudinal es similar al diseño experimental clásico excepto
que habrá ningún grupo de control aleatorizado.

Propósitos del diseño longitudinal


Describir patrones de cambio y estabilidad.
político es más pronunciado entre las personas mayores que entre las
personas más jóvenes. Sin embargo, esta correlación en sí misma no explica el
reside en el hecho de que nos permite examinar el cambio o la estabilidad. Usado de esta vínculo. ¿ Se debe, por ejemplo, a que las personas se vuelven más
manera, un estudio longitudinal puede revelar mucho sobre la dirección del cambio a nivel conservadoras a medida que envejecen, o la correlación refleja algo sobre la
social, organizacional o individual. era en la que las personas mayores crecieron y formaron sus puntos de vista
políticos? Por ejemplo, la inseguridad económica experimentada por la
Estableciendo orden temporal generación crecer durante la Gran Depresión de la década de 1930 puede ser
El análisis causal implica establecer el orden temporal de los eventos. Esto es necesario responsable del conservadurismo político de la generación anterior.
porque un principio básico del razonamiento causal es que una causa debe preceder a su
Por otra parte, el conservadurismo de las personas mayores puede deberse
efecto en el tiempo. En la investigación transversal donde todos los datos se recopilan en
a un efecto de desarrollo: las personas pueden volverse más conservadoras a
un momento dado, puede ser difícil establecer el orden en que ocurren los eventos
medida que envejecen. Pueden volverse menos aventureros, necesitar mayor
(consulte el Capítulo 10). Sin embargo, los diseños longitudinales, en particular los
certeza o volverse más escépticos de aquellos que prometen que el cambio
diseños prospectivos, permiten rastrear el orden en que ocurren los eventos. lugar. Por
traerá un mundo mejor. La única forma confiable de establecer si el
ejemplo, un estudio transversal podría establecer una correlación entre el desempleo y la
conservadurismo político es el resultado de un efecto de desarrollo es rastrear
salud mental, pero tendría dificultades para establecer si el desempleo afecta la salud
a los mismos individuos a lo largo del tiempo y ver si cambian a medida que
mental o viceversa. Sin embargo, un diseño longitudinal podría medir la salud mental de
envejecen.
una muestra de personas empleadas y luego ver qué cambios en la salud mental, si los
hay, ocurren entre aquellos que luego quedan desempleados. Alternativamente, Establecimiento de efectos históricos (períodos)
podríamos estudiar a las personas desempleadas y observar los cambios en la salud
mental. entre los que consiguen un trabajo. Hay un problema con la adopción de una estrategia de seguimiento. Si
hacemos un seguimiento de un grupo de jóvenes a lo largo del tiempo y
Establecimiento de los efectos del desarrollo (edad) observamos que se vuelven más conservadores, no podemos estar seguros de
que el cambio de actitudes sea el resultado de
En ciertos estudios de cambio puede ser difícil establecer qué tipo de cambio ocurre. Por
ejemplo, la edad y el conservadurismo político están correlacionados: el conservadurismo
116
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 117

de ad (aquellos nacidos má la tabla 7.2 muestra


Cuadro 7.1 Cohortes de edad a lo largo del tiempo ed en un período s que cada cohorte se
ad específico) pol vuelve más
Grupo Edad en 19 80 Edad en 1990 Edad en 2000 a podríamos observar ític conservadora en 10
lo cualquier cambio en am puntos cada década.
Nacido 1920-9 51-60 61-70 71-80
lar el conservadurismo ent Además,
Nacido 1930-9 41-50 51-60 61-70 go político durante el e independientemente
del período de 20 años co de la década, las
Nacido 1940-9 31-40 41-50 51-60
tie (1980-1980). 2000). ns personas de 51 a 60
Nacido 1950-9 21-30 31-40 41-50 mp Si cada cohorte se erv años tienen una
o. volviera más ad puntuación de
Nacido 1960-9 11-20 21-30 31-40 Pa conservadora durante or. conservadurismo de
ra el período de 20 años 50. En otras palabras,
ca y si lo hicieran al E independientemente
da mismo ritmo, n del período o tiempo
Haciendose mayor. Todos en la sociedad, independientemente de su edad,
co podríamos concluir est en la historia , las
podrían volverse más conservadores. e
hor que el cambio a una personas de una
te posición más eje determinada edad
Lo que es necesario hacer para responder a nuestra pregunta es rastrear diferentes grupos de
de conservadora es un mp obtienen un
edad a lo largo del tiempo. Hacer esto nos permitiría observar los efectos del envejecimiento o
ed efecto de desarrollo. lo, determinado nivel de
del desarrollo. La tabla 7.1 representa la forma en que podríamos rastrear un rango de cohortes
conservadurismo. Además, todas las cohortes muestran un nivel de cambio similar que es a mi a mi

metr
independiente del período histórico particular. Sencillamente, el tiempo, no el período histórico, o
produce el cambio. vr vr
0 0 0 8 合 명 20
0 2 0
s r o ro
Si solo se hubiera rastreado una cohorte (por ejemplo, los nacidos en la década de 1950),
habríamos observado que a medida que envejecían se volvían más conservadores . más i mi C mi C

conservador debido a algún efecto peculiar de haber crecido en los años 60 y 70. Para distinguir t

entre efectos de desarrollo (envejecimiento) y efectos históricos (cohorte/período), necesitamos


s s ss
examinar múltiples cohortes a lo largo del tiempo. De alguna manera, tener múltiples cohortes es a mi

comparable a usar un diseño experimental donde el grupo de control proporciona un punto de n n


v r o o
comparación para ayudar a interpretar cambios en el grupo experimental. r r
t t
Efe r o 2 0 명 8 0 e e
Si las cohortes no se volvieron más conservadoras a medida que envejecían, esto indicaría la cto mi C
ausencia de un efecto de desarrollo. Sin embargo, en la Tabla 7.3, los puntajes de s o o
conservadurismo dependen de cuándo nacieron las personas. Los nacidos en 1920-9 obtuvieron de s s
un puntaje de conservadurismo de 50 en 1980 y permaneció así de conservador durante 1990 y des C C

2000. Los nacidos en la década de 1960 obtuvieron una puntuación de conservadurismo de 10 arr no
ollo rt
en 1980 y permanecieron en ese nivel. e
p p
: a a
g g
ca o s s
mbi
t 0 t0
os u u
0 0 0 0 0 0 00 0 0
en C
o 9
o8
el
con r
r9
7 6
6
5
5
4 3
4 3
pa
ser gs

vad g gra 1
tu 0 r mo
- - - - -

uris 0 0 0 0 0 a 1 - -
-
- -

o0 m 1 1 1 1 1
mo o
m nor
polí r 8 7 6 5 4 i te
tico 1

g 5 4 3 2 1
de gr r
am 2 ai 1 1
198 o
-
-
-
-
-

m m
1 1

i o
0 a norte 6 5 4 3

200 A 2
1 g
0 r
a i

por m
no o
mi rt
gru e
3 9 9 9 9 9
po 7 6 5 4
A
gr
de am i
o - - - - -
eda m
e
d t
A r
Cu o 0 0 0 0 0

adr
me
o tr s
o 2 3 4 5 6
7.2

s i

9 9 9 9 9

t 1

t r 1 1 1 1
a mi C

metr vr
o
o
n ro p 0 성 0 20 0
o no no no no a
s
r rt rt rt rt g
t e e e e mi C
s
e i

ss t
h r r r r r t u 0
mi 0 0 0 0 0
no
o o o o o o a rt
o
e
8
vr r
6 5 4 3 2

0 合 0 20 0 9

ro o gr
- - - - -

am 1
o 1 1 1 1 1

mi C C
4 2 1

norte

mi
Efe
cto s s 5 3
pa g
s gs r
a i

de no m
rt t o
per e u0
0 0 0 0 0
A
íod o 9

o: o
r 9 7 6 5 4 3
ca
mbi C gra 1
mo - - - - -

9 9 9 9 9

os 1 1 1 1 1

en - -
mi
nor 6 5
-

4 3 2
- -

el pa te
gs
con
gr
ser tu 0 am i 0 0 0 0 0
0 o
0
vad
5

uris 0 0 0
3 6
o0 A 2 4 5

mo
4
polí
m
tico r0 8 7 6 e 9 9 9 9 9
t t
de r
gra 2
mo
- - - - -
o
198 1 1 1 1

0 a r
1 1 1 1 s
200
0 no n
por mi rt 7 6 5 4 3 i o no no no no
e o r rt rt rt rt
coh t e e e e
e
gr
ort am i
t

mi
e o a
h r
de r r r r
A vr
eda 0 우
o 0 o 20 00
o o
ro o o
d
Cu me mi C
tr
adr o
ss
o
n
7.3 s o
r
t
e
i

t
118
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 119

hasta 1990 y 2000. Las diferencias en el conservadurismo de los grupos de edad en,
Hora 1 Intervención tiempo 2
digamos, 2000 se deben a los efectos del período y no a que algunas personas sean
mayores. El grupo de mayor edad en 2000 ha sido 'siempre' más conservador.
Medir variables ? Medir variables

Análisis de la 'carrera' del curso de vida adopción de este enfoque puede producir grupos de comparación que proporcionan
una forma útil, pero limitada, de examinar el efecto de "intervenciones" específicas.
Los estudios longitudinales pueden ayudar a los investigadores a estudiar 'carreras' Por ejemplo, nos puede interesar establecer si tener hijos conduce o no a un
(Menard, 1991: 15). A un nivel puramente descriptivo, con frecuencia no sabemos aumento en la división sexual del trabajo en el hogar. Comenzaríamos con una
cómo se desarrollan las diversas "carreras". Obtener una secuencia precisa de la muestra
forma en que se desarrollan las 'carreras' puede ser crucial para desarrollar
explicaciones sensatas de estas carreras. Por ejemplo, en la 'carrera' de un usuario de
drogas, ¿cuál es la secuencia de eventos? ¿Las personas comienzan a consumir
drogas blandas y luego pasan a las drogas duras, o no hay progresión? ¿ Las
personas se mezclan con los consumidores de drogas y luego comienzan a
consumirlas, o el consumo de drogas conduce a la participación en una subcultura de
drogas? Comprender el orden de los eventos es fundamental para comprender las
vías hacia el consumo de drogas y desarrollar estrategias de intervención.

Las historias de trabajo se pueden rastrear con estudios longitudinales. Podríamos


ver la edad a la que las personas entran y salen de la fuerza laboral, y los tipos de
cambios de trabajo que hacen, y trazar esta historia en otros eventos, como los
eventos de la etapa de la vida, incluido el matrimonio, tener hijos, el divorcio.

Tipos de diseño longitudinal.


Posibles diseños de paneles
DISEÑO DE PANEL PROSPECTIVO SENCILLO

Este diseño simple (Figura 7.1) requiere la recopilación de datos en dos momentos de
la misma muestra. Podemos hacer una intervención activa o simplemente observar el
efecto de los eventos que ocurren naturalmente entre el tiempo 1 y el tiempo 2.

El diseño de panel prospectivo simple es muy parecido a la fila superior del diseño
experimental clásico (Figura 4.2). Es decir, el diseño tiene un 'grupo experimental' en
el que se puede medir el cambio. Sin embargo, el diseño carece de un grupo de
control aleatorio, lo que genera el problema de no saber si algún cambio se debe a
alguna 'intervención' del investigador, al paso del tiempo oa alguna otra influencia.

El problema de no tener un grupo de control se puede aliviar un poco cuando se usa una
muestra suficientemente grande y diversa en el estudio. Tal muestra nos permite determinar si,
con el tiempo, algunas personas experimentan 'intervenciones' mientras que otras no. La
Este diseño es similar al diseño simple de dos puntos pero simplemente
involucra más puntos de recolección de datos (Figura 7.2).
Figura 7.1 Diseño de panel prospectivo simple
Podríamos tener intervenciones específicas entre cualquier conjunto de puntos de
de parejas sin hijos y observar hasta qué punto los hombres y las mujeres comparten recolección de datos o simplemente recopilar información sobre eventos intermedios
el trabajo doméstico. Podríamos rastrear los cambios durante un período de tiempo relevantes entre cada punto de medición. Las consideraciones teóricas y la
investigación previa afectarían lo que se consideran eventos intermedios
durante el cual algunas parejas tendrían hijos mientras que otras no. Entonces 'relevantes'.
podríamos agrupar la muestra en aquellos que se convirtieron en padres y aquellos
que no tuvieron hijos y ver si aquellos que se convirtieron en padres mostraron un Al igual que el diseño de panel simple, este diseño de múltiples puntos
mayor movimiento hacia una división del trabajo por género. Podemos encontrar que requiere suficiente variación en el grupo inicial y suficiente diversidad en las
los padres adoptaron una división del trabajo más genérica. experiencias intermedias para permitirnos construir grupos de comparación
en la etapa de análisis.
Sin embargo, el problema con este enfoque es que no tiene en cuenta el hecho de que los dos
grupos pueden ser diferentes en muchos aspectos, no solo en la paternidad (por ejemplo, edad, El propósito de múltiples puntos de recolección de datos es:
etnia, nivel de participación en la fuerza laboral). Como no hemos controlado estas posibles
diferencias, no podemos estar seguros de cuál es la causa de las diferencias finales en la división
del trabajo. Sin embargo, si nuestra muestra es lo suficientemente grande y diversa y examinar los efectos a corto y largo plazo
recolectamos la información relevante, podemos eliminar estadísticamente el impacto de las
diferencias conocidas entre los grupos y al menos eliminar algunas de las explicaciones realizar un seguimiento de cuándo se producen los cambios (por ejemplo,
alternativas para las diferencias grupales. en el análisis de 'carrera')

DISEÑO DE PANELES PROSPECTIVOS MÚLTIPLES PUNTOS trazar la 'forma' de cualquier cambio

identificar los factores que preceden a cualquier cambio (o no cambio).


120
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 121

T1 ! T2 个 T3 ! T4 ! ts 个 T6 distinguir entre los efectos a corto, mediano y largo plazo. Podríamos ver los
altibajos que un diseño de dos puntos simplemente no permitiría.
? ? ? ? ?
DISEÑO DE PANEL ÚNICO SIN REEMPLAZO
Figura 7.2 Diseño de panel prospectivo de múltiples puntos
Ya sea que se use o no un diseño simple de dos puntos (prueba previa,
prueba posterior) o de puntos múltiples, se deberá tomar una decisión sobre
Por ejemplo, es posible que deseemos rastrear la forma en que los matrimonios qué hacer con respecto a los abandonos. Cuantos más puntos se recopilen
cambian con el tiempo. Podríamos observar estos cambios a lo largo de cualquier los datos y más tiempo la duración de un estudio, más abandonos se
número de dimensiones tales como los niveles de intimidad, quién ejerce el poder, la convierten en un problema.
forma en que se comparte el trabajo doméstico, la felicidad, los niveles de conflicto,
etc. Podríamos rastrear los cambios en estos aspectos de la relación desde cuando La Figura 7.3 ilustra un diseño de panel sin reemplazo. Hay dos problemas clave
con este diseño. Una es que en un estudio multipunto la deserción acumulativa de los
una pareja empieza a vivir junta ya intervalos regulares a partir de entonces, digamos encuestados puede resultar en una muestra final inaceptablemente pequeña. La otra
cada dos años. También averiguaríamos sobre otros cambios que ocurren entre es que la muestra final puede volverse no representativa y, por lo tanto, amenazar la
nuestras visitas de seguimiento (por ejemplo, nivel de participación en la fuerza validez externa. La falta de representatividad proviene de dos fuentes: primero, las
laboral, nacimiento de niños, nuevas personas, como un padre o un suegro que se une personas que abandonan normalmente son diferentes en formas particulares de las
al hogar, o cambios en las circunstancias económicas). que permanecen en el estudio; en segundo lugar, en muchas poblaciones se
incorporan nuevos miembros y los miembros antiguos se van. Incluso si el panel
Si quisiéramos explorar el efecto de tener un hijo sobre la felicidad marital, original sigue siendo representativo de la población como lo era cuando se reclutó por
primera vez, a medida que la población cambia, puede volverse no representativo.
podríamos, mediante el seguimiento regular de las parejas durante un largo período,
DISEÑO DE PANEL ÚNICO CON REEMPLAZO

Una forma de abordar estos problemas es emplear alguna forma de reemplazo para
T1 T2 T3 T4 T6
los abandonos de la muestra e incluir nuevos tipos de miembros de la población. De
esta forma se mantienen el tamaño de la muestra y, con suerte, la representatividad.
Este tipo de diseño se ilustra en la Figura 7.4.

Figura 7.3 Diseño de panel único sin reemplazo

Figura 7.4 Diseño de panel único con reemplazo

Con el tiempo, y dependiendo del nivel de abandono, el panel se irá


componiendo cada vez más de personas diferentes a las que fueron
seleccionadas inicialmente. Que el panel mantenga la representatividad
inicial depende del método de reemplazo. Dado que las personas no se
retiran al azar, los reclutas deben coincidir, cuando sea posible, con los abandonos. la misma edad, sexo, raza y clase. Sin embargo, tal coincidencia siempre
Esto se puede hacer a un nivel amplio asegurándose de que los reemplazos sean de será menos que perfecta y conducirá a una pérdida de
122
DISEÑOS TIPOS DE DISEÑO LONGITUDINAL 123

LONGITUDINALES

mantener el estudio durante un período muy largo, aunque con diferentes


aleatoriedad, lo que dificulta la extrapolación con confianza de la muestra. casos, se puede estudiar el cambio agregado a lo largo del tiempo.

El reemplazo también presenta algunas dificultades con el análisis. Dado que, en la figura 7.4, La ventaja de tener paneles superpuestos es que, en cualquier momento, la
muchos de los casos en To son casos diferentes de los de la muestra en T1, no tenemos medidas información de todos los paneles se puede agrupar para obtener información
a lo largo del tiempo para muchos individuos. Esta ausencia de datos a lo largo del tiempo para los transversal.
individuos dificulta el análisis del cambio a nivel individual. Es posible que estemos restringidos a
observar el cambio a nivel agregado en lugar de a nivel individual (consulte el Capítulo 9). Esto se
puede superar en parte mediante la recopilación de información retrospectiva para algunas
variables (consulte a continuación). lo que es probable que hayamos sido en etapas anteriores.
Para lograr este fin utilizaríamos la información que tenemos sobre casos similares que han
estado presentes en la muestra desde el inicio.

DISEÑO DE PANEL GIRATORIO

Este es un diseño adicional que proporciona una forma más sistemática y aleatoria de tratar la
deserción de la muestra y, al hacerlo, maximiza la validez externa del diseño. Se llama un diseño
de panel giratorio.

Este diseño es muy utilizado en estudios que requieren medidas frecuentes. Las encuestas de
población activa proporcionan un ejemplo de este tipo. Los datos de panel de este tipo permiten al
investigador ver lo que sucede con los patrones de empleo de un individuo (por ejemplo, cuánto
tiempo lleva encontrar trabajo, los esfuerzos para encontrar trabajo, los movimientos dentro y
fuera del trabajo, etc.) a intervalos frecuentes (por ejemplo, mensualmente). El diseño del panel
giratorio también minimiza el problema de la deserción (y los consiguientes problemas de
representatividad) y el agotamiento (exigir demasiado a las mismas personas).

Con un diseño de panel giratorio se establece una serie de paneles. Cada panel comienza en
un momento diferente pero se superpone temporalmente con al menos algunos de los otros
paneles. Esencialmente, se crea un conjunto de paneles que tienen tiempos de inicio y finalización
escalonados. Pero se recopila la misma información de cada panel. La lógica de este diseño se
ilustra en la Figura 7.5.

En este ejemplo, el primer panel (fila 1) se vuelve a probar cada mes durante seis meses.
Después de que este panel ha comenzado, otro panel comienza un mes después y se continúa
durante seis meses. La prueba del segundo panel se completará un mes después del primero.
panel. Se pueden ejecutar varios paneles escalonados simultáneamente.

Cada panel tiene una vida limitada, por lo que es de esperar que los participantes no
sean personas agotadas. Sin embargo, el estudio puede extenderse indefinidamente.
Al rastrear un panel en particular, se puede estudiar el cambio individual durante ese
período. En consecuencia, obtenemos una serie de estudios de panel a corto plazo. Al
madres solas). En las encuestas de población activa, la precisión de las estimaciones
de la muestra puede ser particularmente importante. Por lo tanto, las ventajas de
T1 T2 T3 T4 Ts T6 T7 TB TgT1o T1t T12 T13 T14 T1s T16 T17 agrupar los paneles para el análisis transversal no pueden exagerarse.

Panel 1 Al emplear una serie de paneles superpuestos, el investigador puede suavizar el


impacto de factores como la deserción y el condicionamiento del panel (consulte el
2
Capítulo 8). Aunque el panel 1 sufrirá alguna deserción y condicionamiento después
3 de la primera recopilación de datos, el impacto de estos los factores pueden evaluarse
comparando las estimaciones del segundo panel que no estarán sujetas a los efectos
4 de la deserción o el condicionamiento. La misma lógica se aplica en T3 y en todas
partes. Dado que continuamente se obtienen muestras nuevas, se pueden ajustar los
5
efectos del agotamiento y la deserción en los paneles más antiguos. Además, en
6 cualquier análisis transversal de las muestras agrupadas, la inclusión de paneles más
nuevos puede moderar los efectos de sesgo de la deserción.
7
8
DISEÑO DE COHORTE ÚNICA
9
En todos los diseños de panel discutidos hasta ahora, se podría usar una
11 sola cohorte. El uso de una sola cohorte implica seleccionar un grupo de
personas de edad similar en un momento dado y seguirlo durante un período
prolongado. Pueden consistir en personas nacidas en un año en particular, la
clase de 2000 o aquellas que tuvieron su primer hijo en 2001.
Figura 7.5 Diseño de panel giratorio

(ver Parte IV). La ventaja particular de este enfoque es que le permite al investigador aumentar el
tamaño de la muestra y así minimizar el error de la muestra. Al proporcionar una gran muestra
agrupada, el diseño también proporciona más casos de grupos difíciles de encontrar (por ejemplo,
TIPOS DE DISEÑO LONGITUDINAL

numerosas campañas mediáticas destinadas a cambiar las prácticas sexuales.


El problema de usar una sola cohorte, como se identificó anteriormente, es que es Es imposible decir cuánto se debe el cambio a los efectos del envejecimiento y
imposible saber si este cambio en el grupo se debe a que el grupo está envejeciendo o cuánto se debe a los efectos del período, a menos que se examinen
porque todos están cambiando. Supongamos que en 1980 se inició un estudio sobre el simultáneamente los cambios entre un rango de grupos de edad. Los diseños de
comportamiento y el conocimiento sexual de un grupo de jóvenes de 20 años. El estudio cohortes múltiples superan este problema.
recopiló información sobre aspectos como el nivel de actividad sexual, el número de
parejas y el conocimiento y la práctica del sexo seguro. Si estos jóvenes de 20 años DISEÑO DE COHORTES MÚLTIPLES
hubieran sido seguidos durante los siguientes 15 años, el estudio probablemente habría La característica principal del diseño de cohortes múltiples es la dispersión de las
encontrado que estos jóvenes se volvieron más moderados y 'conservadores' cohortes. Esta dispersión permite las comparaciones entre cohortes y, por lo
sexualmente con el paso del tiempo. Por ejemplo, el estudio probablemente encontraría tanto, ayuda a distinguir entre los efectos del envejecimiento y del período.
que con el tiempo estos jóvenes tuvieron menos sexo con menos personas y adoptaron
prácticas sexuales más seguras. No es necesario establecer cohortes separadas al comienzo de un estudio.
Siempre que la muestra tenga una diversidad suficiente de grupos de edad, las
¿A qué se debe este cambio? ¿Es simplemente una cuestión de hacerse mayor? En cohortes se pueden establecer posteriormente en la etapa de análisis de datos.
parte podría ser eso: a medida que las personas envejecen, se establecen con una sola
pareja. Pero también puede deberse a efectos históricos. Durante el período histórico en DISEÑO SECUENCIAL DE COHORTES
el que están envejeciendo, se descubre el SIDA. Este descubrimiento da lugar a
Un diseño menos común pero potencialmente poderoso es el que usa múltiples cohortes
y tiene una forma de renovación del panel con el tiempo (Figura 7.6). Una de las
deficiencias del diseño del panel es que si el panel dura un período prolongado, todo el Años de encuestas
panel envejece el panel no incluirá a personas más jóvenes. En consecuencia, a medida
Edad en 2000 2005 2010 2015 2020 2025
que el panel envejece, no se aprende nada sobre los jóvenes contemporáneos. Por
ejemplo, podríamos realizar un estudio longitudinal del envejecimiento. Queremos saber 2000
cómo es envejecer. ¿Qué piensan las personas mayores sobre el envejecimiento y la
mortalidad? ¿Cambian los puntos de vista, las experiencias, las percepciones y los 25
- - - -
temores de las personas a medida que envejecen? Tenemos mucho tiempo para realizar
un seguimiento de los cambios y decidimos incluir cohortes que, en el año 2000, tenían 30
- 50- -
50, 55, 60, 65, 70 y 75 años. Podemos darnos el lujo de realizar un seguimiento de las
personas hasta el año 2025. Dado que tenemos diferentes cohortes podemos comparar 35
- - 50 55-
las actitudes cambiantes entre las cohortes. El problema es que al
40
- - 50

45
55 60- - 50

50
55 60 65-

55
50 55 60 65

60
7050 55 60 65

sesenta y
70 7555 60 65
cinco
70 75 -60 65
70

70 75 - -65

70 75 - -

75 -70 75 - -

- -75 -

- - -

Figura 7.6 Diseño de panel secuencial de cohorte

el año 2005 los que tenían 50 años en el 2000 ahora tienen 55 años. La
muestra no nos puede decir nada sobre los nuevos 50 años: los que cumplen
50 en 2005.

El aspecto distintivo del diseño secuencial de cohortes es que, con el tiempo,


las cohortes abandonan el estudio. Esto es similar en formas a los paneles en el
diseño de panel giratorio, excepto que son cohortes las que se reemplazan en
lugar de paneles completos. En el ejemplo de la Figura 7.6, eliminamos una
cohorte después de que alcanzan la edad de 75 años.
A medida que la cohorte de mayor edad abandona el estudio, es reemplazada por una 1 Nos permite, en cada encuesta de cinco años, tener una nueva muestra
nueva cohorte joven (50 años). Esta nueva cohorte en efecto sustituye a lo que en la transversal de personas de 50, 55, 60, 65, 70 y 75 años. Cada columna de la
primera etapa era la cohorte más joven. Figura 7.6 representa una muestra transversal separada. Podríamos analizar
Este diseño nos permite hacer tres cosas:
126
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 127

primer hijo sobre su nivel actual de felicidad marital y les pediría que recordaran qué
esto de la misma manera que analizaríamos cualquier encuesta transversal (ver estaban de antemano. Este diseño se representa esquemáticamente en la Figura 7.7.
Capítulo 12).
El mismo enfoque podría aplicarse al estudio de la experiencia de
2 Con el tiempo construiríamos paneles para cada cohorte. Podríamos rastrear a envejecer descrito anteriormente. Podríamos tomar un grupo de personas
aquellos que tenían 50 años en el año 2000. Para el año 2025 habremos rastreado esta de 75 años y pedirles que recuerden qué tan optimistas se sentían sobre el
cohorte hasta el final. Podemos hacer lo mismo para aquellos que eran mayores, futuro cuando tenían 50, 55, 60, 65, 70 años y cómo se sienten actualmente.
excepto que el panel para esa cohorte se ejecutaría por menos tiempo. Estos paneles Este diseño se representa en forma de diagrama en la figura 7.8.
están representados por cada fila en la Figura 7.6. Estos paneles permiten el análisis
estándar del cambio individual. Los paneles múltiples también brindan múltiples
cohortes para explorar el efecto del envejecimiento a diferencia de los cambios sociales
más amplios (consulte la discusión anterior sobre las ventajas de los estudios de
múltiples cohortes).

3 Nos permite trazar la experiencia cambiante de un grupo de edad a lo largo del


tiempo. Debido a que tenemos cohortes continuas (es decir, tenemos información sobre
personas de 50 años en el año 2000, 2005, 2010, 2015, 2020 y 2025) podemos rastrear
cómo la La experiencia de tener 50 años cambia con el tiempo. Del mismo modo,
podemos rastrear cómo es tener 75 años a lo largo del tiempo. ¿Cambia la experiencia
de este grupo de edad a lo largo del tiempo histórico?

Diseños retrospectivos

DISEÑO DE PANELES RETROSPECTIVOS


Hasta ahora, todos los diseños han implicado el seguimiento de una muestra durante un período
de tiempo. Este enfoque tiene muchas ventajas, como se mostrará en el Capítulo 8. Pero también
tiene desventajas relacionadas con cuestiones como el costo, el desgaste de la muestra y el
retraso en la obtención de datos útiles sobre los cambios en la muestra. La principal ventaja de los
diseños longitudinales es que nos permite establecer la secuencia de eventos que, a su vez, nos
permite hacer afirmaciones más sólidas sobre el orden causal y la causalidad.

En algunos estudios es posible reconstruir los datos a lo largo del tiempo recopilando toda la
información en un momento dado. Es posible reconstruir el grado de cambio y la secuencia de
eventos pidiendo a las personas que recuerden lo que sucedió y cuándo sucedió.

Podríamos, por ejemplo, preguntar a las personas sobre su situación o actitudes actuales y
luego pedirles que proporcionen material similar sobre un punto anterior de sus vidas. Podríamos,
por el bien del argumento, querer saber cómo el nacimiento de un primer hijo afecta la felicidad
marital. Un diseño retrospectivo le preguntaría a una muestra de personas que han tenido su
pasadas se interpretan a la luz de los eventos y experiencias posteriores. Todo lo que
este tipo de diseños nos dirían es cómo las personas construyen su pasado.
T1 'Intervención/evento' T2
Pero este problema no es motivo para condenar todos los estudios retrospectivos.
Recuerdo del matrimonio Nacimiento del primer hijo Nivel de felicidad marital Cuando se trata de ciertos eventos, se puede obtener información bastante buena y
confiable sobre la secuencia de eventos pasados, especialmente si son eventos
ahora
significativos en la vida de la persona. A partir de estos relatos de la secuencia de
felicidad entonces eventos pasados podemos reconstruir "carreras" y, al hacerlo, resolver algunos de los
problemas de orden temporal tan necesarios para desarrollar explicaciones causales.

Figura 7.7 Diseño de panel retrospectivo simple Por ejemplo, podríamos querer examinar la influencia de la etapa de la vida familiar
en la participación laboral de las mujeres. Podemos preguntar a las mujeres
Años retrospectivamente sobre el momento de eventos particulares. Preguntaríamos sobre
50 55 60 65 70 75 el momento de su matrimonio, el nacimiento del primer hijo, el nacimiento de los hijos
posteriores, el divorcio, etc. También podríamos preguntar sobre cualquier cambio en
Recuerdo Recuerdo Recuerdo Recuerdo Recuerdo Optimismo los niveles de participación laboral, como cuándo ingresaron a la fuerza laboral, si
abandonaron la fuerza laboral y cuándo. , cualquier cambio en el estado de la fuerza
de optimismo de optimismo de optimismo de optimismo de optimismo ahora en
laboral (tiempo parcial/tiempo completo/ocasional) o el horario de trabajo (fin de
a los 50 años a los 55 años a los 60 años a los 65 años a los 70 años 75 años semana, noche, etc.). Luego podríamos trazar los cambios en la etapa de la vida
familiar y los cambios en la participación laboral para ayudar a identificar la secuencia
de eventos. Dado que tales eventos son eventos significativos para la mayoría de las
Figura 7.8 Diseño de panel retrospectivo de múltiples puntos personas, podemos reconstruir el orden temporal razonablemente bien y construir una
imagen de las carreras laborales y familiares. para mujeres. El estudio también podría
Los problemas con este tipo de diseño para este tipo de asuntos son obvios. Habrá una gran pedirles a estas mujeres que
cantidad de distorsión (deliberada o no) en esos recuerdos. Las personas no solo no podrán
recordar con precisión cómo se sintieron, sino que sabemos que los recuerdos de experiencias
128
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 129

de diseño, necesitaríamos tener identificadores personales. en los registros para que


recordar por qué su participación en la fuerza laboral cambió en puntos determinados. Esto podamos asegurarnos de vincular los registros de la misma persona a lo largo del
proporcionaría una mayor comprensión de los vínculos causales entre la etapa de la vida y la tiempo. Ejemplos de dichos registros pueden ser declaraciones de impuestos sobre
participación laboral entre las mujeres. la renta, registros de seguridad social, registros médicos y registros policiales. Al
vincular estos registros, podemos construir una historia de vida o 'carrera' para esa
Este enfoque retrospectivo es más confiable cuando se trata de eventos memorables. Se persona.
pueden usar varios recursos para ayudar a las personas a reconstruir el orden en que
sucedieron las cosas. Podemos retroceder desde el presente hasta el pasado o centrarnos en La principal deficiencia de un diseño de vinculación de registros es la dificultad de
'eventos ancla' y luego preguntar sobre estos. Por ejemplo, podemos hacer las preguntas: '¿ obtener dichos datos. En muchos países, las disposiciones de confidencialidad
Cuándo nació su primer hijo?', '¿Estaba trabajando en ese momento?' , '¿Cuánto tiempo antes impiden el acceso a dichos datos. La otra dificultad principal es que dichos registros
de tener el bebé dejó de trabajar?', '¿Volvió a trabajar después del bebé?', '¿Cuánto tiempo generalmente solo recopilan información limitada y pueden no contener información
después fue?' clave necesaria para desarrollar una explicación de la secuencia de eventos. Sin
embargo, la vinculación de registros puede ayudarnos a trazar con precisión una
DISEÑOS DE ENLACE DE REGISTRO secuencia temporal de ciertos eventos y la naturaleza y extensión. de cambios a lo
largo del tiempo. En este sentido, estos registros pueden ayudar a probar si la
Aunque un diseño de vinculación de registros no es necesariamente un diseño retrospectivo,
secuencia es al menos consistente con nuestra teoría.
por lo general lo es. Es un diseño en el que los datos se recopilan a partir de registros oficiales.
Cuando estos registros se han recopilado a lo largo del tiempo (generalmente con fines Diseños cuasi-longitudinales
oficiales), podemos construir una secuencia temporal de eventos. Para implementar este tipo
intervención. Al comparar los dos grupos después de la "intervención", se estima el
impacto de la intervención. .
¿Intervención T1? T2
Por ejemplo, podemos estar interesados en el impacto sobre las creencias
(Tres años de Mediciones del grupo B religiosas de asistir a la universidad. Podríamos establecer el impacto midiendo las
creencias religiosas de una muestra de estudiantes de primer y último año en un
curso universitario)
momento determinado (es decir, un estudio transversal). Pero no sabríamos si alguna
Figura 7.9 Diseño antes-después simulado diferencia entre los estudiantes de primer y último año se debió a diferencias iniciales
(es decir, los estudiantes de último año pueden haber sido diferentes incluso cuando
nivel agregado. Sin embargo, dado que los datos se recopilan de diferentes individuos, este eran estudiantes de primer año).
tipo de diseño no se puede usar para rastrear el cambio a nivel individual.
El diseño simulado de antes y después implicaría medir las creencias religiosas de
DISEÑO SIMULADO ANTES Y DESPUÉS una muestra de estudiantes de primer año cuando comenzaron la universidad.
Luego, digamos tres o cuatro años después, se medirían las creencias religiosas de
El diseño de panel prospectivo simple descrito anteriormente implicaba medir un grupo antes una muestra de estudiantes de último año. dos muestras incluirían diferentes
de una intervención y nuevamente después. Este diseño es similar al diseño experimental personas. El patrón de creencias de los estudiantes de primer año podría compararse
clásico pero sin grupo de control. con los patrones de creencias de la muestra de estudiantes de último año tomada
cuatro años después.
En el diseño simulado de antes y después, las medidas se obtienen de un grupo en T1 y
luego de un grupo comparable en T2 después de que haya tenido lugar algún evento o El diseño antes-después simulado se representa en la figura 7.9.
Todos los diseños longitudinales descritos anteriormente son diseños de panel e implican el
seguimiento de las mismas personas a lo largo del tiempo. Al hacerlo, los cambios tanto a nivel DISEÑO TRANSVERSAL REPETIDO
agregado como individual pueden trazarse para resolver problemas sobre la secuencia de
Otra forma de obtener datos a lo largo del tiempo que nos permite rastrear el
eventos.
cambio a nivel agregado es el diseño transversal repetido. Esto se discute
Sin embargo, los diseños longitudinales basados en paneles no son la única forma de completamente en el Capítulo 10.
obtener datos a lo largo del tiempo, al menos a nivel agregado. Estos tipos alternativos de
diseños longitudinales implican la recopilación de datos en diferentes momentos para que los
Resumen
cambios se se recolectan de diferentes individuos en cada punto de tiempo. Cuando, en cada
punto de tiempo, las muestras son representativas de la población, el enfoque de usar Los diseños longitudinales proporcionan un medio para rastrear el cambio a
diferentes muestras en cada punto de tiempo puede rastrear efectivamente los cambios en el lo largo del tiempo y establecer la secuencia en la que tienen lugar los
eventos, un importante
130
DISEÑOS
LONGITUDINALES

resuelven estos diversos asuntos en cualquier estudio particular da como


importante para cualquier análisis causal. Este capítulo ha esbozado una variedad de resultado una variedad de formas diferentes de diseño longitudinal. Se
formas diferentes de construir un estudio longitudinal como un medio de seguimiento describieron los principales tipos de diseños longitudinales. El Capítulo 8
del cambio. Estos incluyen diseños prospectivos y retrospectivos, diseños que siguen considera algunas de las fortalezas y debilidades de estos diseños y los
a las mismas personas a lo largo del tiempo (estudios de panel) y aquellos que problemas que deben tenerse en cuenta al implementar diseños
observan a diferentes personas al mismo tiempo. diferentes puntos de tiempo longitudinales.
(estudios de tendencias). Dentro de cada tipo de estudio hay una serie de decisiones
que deben tomarse sobre la estructura del estudio. Estos incluyen cuestiones como el
Nota
entorno, la cantidad de veces que se realiza el seguimiento de un grupo, la duración
general del estudio, la brecha entre las oleadas, el uso de intervenciones activas, la 1 Sin embargo, el análisis de datos longitudinales normalmente creará
forma en que se trata la deserción y el uso de múltiples paneles La forma en que se grupos de control estadístico. Consulte el Capítulo 9.
En el capítulo anterior indiqué que los diseños de paneles se ven empañados
por no incluir grupos de control aleatorios. Sin embargo, esta deficiencia se
maneja utilizando la variación dentro del panel para construir grupos, en la
etapa de análisis, con fines de comparación. Por ejemplo, el propósito del
8 estudio longitudinal podría ser examinar el impacto del desempleo en la salud
mental de los jóvenes ( Graetz, 1993). La ola inicial del estudio podría incluir
tanto a jóvenes empleados como desempleados. Para cuando ocurran las
PROBLEMAS EN EL DISEÑO LONGIDUTINAL oleadas subsiguientes, se habrán producido una serie de acontecimientos:
algunos de los que estaban empleados en la primera oleada se habrán
quedado sin empleo; algunos desempleados seguirán estando
desempleados; algunos empleados seguirán empleados; y algunos de los
desempleados se habrán empleado. Estas cuatro posibilidades se ilustran en
la Tabla 8.1. Cuantas más ondas tengamos, más variada será la gama de
Varias de las cuestiones metodológicas, prácticas y éticas que se aplican a los diseños posibilidades.
experimentales también pueden aplicarse a los diseños longitudinales. Este capítulo
se centra en los asuntos que surgen de forma más aguda en los diseños Siempre que las medidas de salud mental estén disponibles para ambas oleadas,
podemos tener una idea del impacto del empleo/desempleo y sus cambios en la salud
longitudinales, aunque muchos de estos asuntos no son exclusivos de este diseño.
mental. El problema obvio es que debido a que los grupos no están formados por
asignación aleatoria, pueden ser diferentes en formas críticas además de su situación
laboral. Estas otras diferencias pueden ser responsables de cualquier diferencia en los
Problemas metodológicos resultados de salud mental. Este problema se puede reducir un poco con el análisis
multivariante porque permite al investigador controlar las diferencias conocidas entre los
Cuestiones de validez interna grupos.
AUSENCIA DE GRUPOS DE CONTROL ALEATORIZADOS

132
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 133
LONGIDUTINAL

En cualquier estudio que se extienda en el tiempo, pueden ocurrir muchos


Tabla 8.1 Creación de grupos desde el panel eventos en el mundo en el que vive la gente, y en los estudios de panel
puede ser difícil aislar qué eventos están teniendo un impacto.
variación
Por ejemplo, podríamos querer examinar el impacto de la introducción de un
'Grupos' Ola 1 Ola 2
esquema en el que los beneficios de desempleo solo estén disponibles para las
1 empleado empleado personas desempleadas que participan en proyectos comunitarios no remunerados
durante dos días a la semana. Podríamos medir el comportamiento de búsqueda de
2 Desempleados Desempleados trabajo antes de la introducción del esquema y nuevamente, digamos, 12 meses
3 Desempleados
después. El problema con este diseño es que cualquier cambio en el comportamiento
empleado
de búsqueda de trabajo podría deberse a otros eventos que ocurren en el período de
4 Desempleados empleado 12 meses. Por ejemplo, la economía podría mejorar y las mayores perspectivas de
empleo podrían aumentar el comportamiento de búsqueda de empleo. El clima podría
ser mejor. A menos que se pueda aislar el impacto de todos estos tipos de factores, es
difícil decir cuánto cambio en el comportamiento de búsqueda de trabajo se debe a la
introducción de requisitos de trabajo comunitario.
HISTORIA

MADURACIÓN
Los cambios también pueden deberse a que las personas simplemente envejecen
(efectos de desarrollo). Por ejemplo, un estudio del efecto del desempleo en la salud
PRUEBAS O ACONDICIONAMIENTO DE PANELES
mental de los jóvenes encontrará el problema de que la adolescencia tardía es un
período en el que los problemas de salud mental como la depresión y esquizofrenia El condicionamiento del panel ocurre cuando los participantes del panel responden a
tienen más probabilidades de desarrollarse de todos modos. Si simplemente las preguntas de maneras que están influenciadas por su exposición previa a las
hacemos un seguimiento de la incidencia de los problemas de salud mental entre un mismas preguntas. Cuando las personas recuerdan cómo respondieron previamente
grupo de jóvenes que quedan desempleados, corremos el riesgo de sobrestimar el a las preguntas, puede influir en la forma en que responden en ocasiones posteriores.
efecto del desempleo en la salud mental. Es probable que parte de la incidencia en Los participantes pueden responder de modo que parezcan coherentes a lo largo del
problemas de salud mental se deba a un aumento común de problemas en este tiempo. Alternativamente, pueden responder de una manera particular porque han
grupo de edad, independientemente de la situación laboral. aprendido a evitar una serie extensa de preguntas de seguimiento. El
condicionamiento del panel puede contaminar las respuestas de los participantes del
Para identificar cualquier contribución distintiva que el hecho de estar panel y subestimar o sobrestimar el grado de cambio real a lo largo del tiempo.
desempleado haya hecho a la salud mental, necesitaríamos rastrear varios grupos
Los estudios experimentales pueden minimizar los problemas de prueba al evitar
de jóvenes: los que permanecieron empleados, los que consiguieron empleo y los por completo la etapa previa a la prueba o al usar diseños como el diseño de cuatro
que permanecieron desempleados. grupos de Solomon (Capítulo 4). Desafortunadamente, es difícil eliminar este
problema cuando se utiliza un diseño de panel prospectivo ya que, por definición, se
requieren al menos dos pruebas. Sin embargo, existen algunas formas de estimar el
efecto de las pruebas.

Una forma es emplear el diseño de panel giratorio o el diseño secuencial de


cohortes u otros diseños que tengan estrategias de reemplazo. Estos diseños
alternativos proporcionan un medio para estimar los efectos de las pruebas. Usando
estos enfoques alternativos, podemos comparar las respuestas de los nuevos
participantes o paneles con las respuestas de los miembros del panel que son
similares en todos los demás aspectos relevantes. Con estas comparaciones
podemos evaluar si los miembros 'experimentados' están respondiendo preguntas de
manera distintiva.

En algunos estudios que tienen muchas ondas, también podemos experimentar


para estimar el efecto de las pruebas. Por ejemplo, podemos variar la frecuencia con
la que se hacen determinadas preguntas. Por ejemplo, podríamos hacer un conjunto
particular de preguntas a algunas personas en cada ola, pero hacer las mismas
preguntas con menos frecuencia a otras personas. Al comparar las respuestas de las
personas que respondieron las preguntas en cada ola con las de aquellos a quienes
se les hicieron las preguntas. irregularmente podemos estimar el alcance de los
efectos de prueba.

INSTRUMENTACIÓN

En una encuesta de panel, los cambios a lo largo del tiempo también pueden deberse
a cambios en la forma en que se recopilan los datos en cada ronda (Capítulo 5).
Variación en la redacción de las preguntas, el orden, la duración de la entrevista, el
entrevistador, los métodos de recopilación de datos (por ejemplo, cara a cara en onda
1 y teléfono en la onda 2) pueden producir cambios aparentes pero no reales en las
actitudes.
Cuanto más abierto esté el método de recopilación de datos a las interpretaciones subjetivas cuando participa el mismo observador, esa persona está sujeta a cambios y puede
de las personas que recopilan los datos, mayor será el peligro de que los cambios aparentes verse afectada por factores históricos y de maduración. Con el tiempo, los
puedan reflejar diferencias del observador en lugar de cambios en lo que se observa. Incluso observadores pueden ver el
134
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 135
LONGIDUTINAL

El concepto de regresión estadística de puntajes extremos a puntajes menos


mismas cosas de manera diferente porque ellos, como observadores, han cambiado de alguna extremos sobre varias ondas de medición se discutió en el Capítulo 5. La regresión no
manera. Hay ejemplos famosos en antropología donde diferentes antropólogos han 'visto' la es un problema menor con los diseños longitudinales que con los diseños
misma comunidad de maneras muy diferentes. Redfield (1930) y Lewis (1951) realizaron longitudinales.
estudios etnográficos de un pueblo mexicano con 20 años de diferencia y "vieron" a la
comunidad de manera totalmente diferente. De manera similar, Mead (1943) y Freeman (1984)
estudiaron a los samoanos con algunos años de diferencia pero la cultura de manera totalmente
diferente. Dada la naturaleza no estructurada de los métodos del antropólogo en estos casos, es
difícil estar seguro de hasta qué punto las diferentes observaciones reflejan cambios en las
comunidades o simplemente reflejan las diferentes formas en que los observadores
interpretaron sus observaciones.

ERROR DE MEDICIÓN

Dado que una razón clave para realizar estudios longitudinales es medir el cambio, es crucial
que observemos el cambio real en lugar de un simple error de medición. El uso de instrumentos
de medición poco confiables hará que detectemos un "cambio" donde realmente no hay cambio.
Por ejemplo, podríamos medir el nivel de prejuicio de una persona en T1 y nuevamente en T2.
Sin embargo, si la medida del prejuicio es inestable, ¿cómo podemos saber si algún cambio se
debe a un instrumento poco confiable o a un cambio real? Del mismo modo, si la medida del
prejuicio es insensible, es posible que no detecte el cambio aunque haya habido un cambio.

El error de medición puede conducir a sobreestimaciones graves de la cantidad de cambio a


nivel individual (es decir, identificar a los individuos que cambian). El uso de instrumentos poco
confiables hace que muchas personas parezcan cambiar al menos marginalmente. En el
análisis descriptivo, el problema no será tan pronunciado a nivel agregado. Si observamos las
puntuaciones medias de un panel o de los subgrupos del panel, el efecto del error de medición
aleatorio será silenciado. Aquellos que parecen cambiar en una dirección cancelarán el error
causado por las personas que parecen cambiar en la misma dirección. otra dirección. Por
ejemplo, en un panel de 1000 personas, el puntaje promedio en una medida de prejuicio que va
de 0 a 10 podría ser 5. Si, debido a un error de medición, 200 personas muestran menos
prejuicios y 200 muestran más prejuicios ( y el grado de cambio en una dirección es el mismo
que en la otra), entonces el puntaje promedio de prejuicio no se verá afectado.

Al graficar las puntuaciones de cambio, se puede ver si el cambio observado se debe a un


error de medición aleatorio. Si el cambio observado se debe a un error de medición aleatorio, las
puntuaciones de cambio deben formar una distribución normal en cada lado sin cambios.

REGRESIÓN
El mismo problema surge en los estudios de panel, ya que la deserción no será
uniforme para todas las categorías de personas. La importancia del problema
diseños experimentales. En otras palabras, los individuos con puntajes extremos en depende del análisis particular (comparaciones) realizado. Identificar los sesgos
el ciclo 1 tenderán, en el ciclo 2, a 'retroceder' a la media. Los puntajes altos tenderán introducidos por la deserción y luego eliminar estadísticamente el efecto de dichos
a bajar y los puntajes bajos tenderán a subir. Cuando el análisis del cambio se realiza sesgos puede minimizar el impacto de la deserción diferencial.
a nivel individual nivel en lugar de a nivel agregado, atribuiremos erróneamente
algunos cambios individuales a una intervención o algún otro factor cuando es Cuestiones de validez externa
simplemente un artefacto de regresión estadística. A nivel agregado, no debemos
cometer este error, ya que el movimiento de puntajes bajos a moderados equilibrará DESGASTE DEL PANEL
el movimiento de puntajes altos a moderados (consulte la discusión sobre los efectos
Una importante amenaza potencial para la validez externa en los estudios de
de truncamiento en el Capítulo 6).
panel es la pérdida de casos con el tiempo (desgaste). Cuanto más tiempo
En los diseños experimentales es relativamente fácil distinguir el cambio debido a la regresión exista un estudio de panel y más ondas tenga, mayor será el peligro de
estadística del cambio debido a otros factores. Dado que tanto el grupo experimental como el de desgaste. El desgaste es una amenaza para la validez externa porque no es
control estarán igualmente sujetos a la regresión estadística, será la diferencia en el nivel de aleatorio. Algunos tipos de personas tienen más probabilidades de
cambio (en lugar de la cantidad absoluta) que reflejará la influencia de otros factores. En los abandonar los estudios que otros. A medida que la deserción se agrava a lo
estudios de panel, la ausencia de grupos de control estrictamente comparables hace que sea largo de las oleadas, la muestra se vuelve cada vez menos representativa.
más difícil medir el alcance de la regresión.
Hay varias formas de responder al desgaste y su amenaza a la validez
MORTALIDAD/DESERCIÓN externa. Una forma es reemplazar los abandonos con personas con
características similares para corregir los sesgos conocidos. Esto es más
El concepto de mortalidad, la deserción diferencial en los grupos experimental y de
fácil decirlo que hacerlo. Es posible que no sepamos qué sesgos introduce la
control, se discutió en el Capítulo 5. Los diferentes resultados para los dos grupos
deserción. Además, puede que no sea posible contratar a los
pueden deberse a la deserción diferencial en alguna etapa entre la prueba previa y la
posterior, en lugar de la intervención.

136
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 137
LONGIDUTINAL

este sesgo de edad solo importa si la edad está vinculada a las variables que
nuevos miembros de la muestra. Si usamos reemplazos, los datos para estos nuevos se están analizando. examinado. Si X afecta a Y, independientemente de la
reclutas estarán incompletos, lo que limitará el análisis al análisis de nivel agregado edad, entonces el sesgo de edad debido a la deserción no importa. Podemos
(consulte el Capítulo 9). esperar con confianza que la relación entre X e Y existirá en la población más
amplia, a pesar de las diferencias en los perfiles de edad de la muestra y la
Este problema se puede abordar ponderando la muestra para tener en cuenta el población.
desgaste. La ponderación implica aumentar estadísticamente la proporción de grupos
subrepresentados en la muestra para que su proporción refleje su proporción en la En aquellas circunstancias en las que un sesgo de muestra producido por la
población (Capítulo 9). Si la muestra se pondera con precisión, aún puede deserción puede afectar los patrones que estamos examinando, necesitamos
proporcionar una base útil para la generalización. eliminar estadísticamente el efecto de este sesgo y ver si la relación entre X e
Y permanece (véanse los Capítulos 9 y 12). la relación entre X e Y permanece
Los problemas causados por el desgaste de la muestra también se pueden abordar después de eliminar el efecto de cualquier variable en la que haya sesgo de
reconociendo que existen sesgos y aceptando que afectarán significativamente muestra, podemos generalizar con seguridad a una población más amplia a
nuestra capacidad para generalizar a nivel descriptivo. Sin embargo, a nivel pesar del sesgo de muestra.
explicativo, el sesgo podría no importar. Si, por ejemplo, un estudio de panel está
sesgado debido a la desproporcionada deserción de las personas más jóvenes (se ACONDICIONAMIENTO DE PANELES
mueven más y, por lo tanto, es más difícil hacer un seguimiento a lo largo del tiempo),
La discusión anterior sobre los efectos de las pruebas y sus implicaciones para la
validez interna (atribuir el cambio a una intervención u otro factor cuando en realidad se
debe simplemente al estudio) también tiene implicaciones para la validez externa. Si la el estudio podría no ser comparable a aquellos entre los niños de la ruptura del
participación en un estudio longitudinal produce un cambio (porque alerta a los matrimonio en general.
participantes sobre asuntos en los que de otro modo no pensarían), es difícil decir que
los cambios observados en el estudio tendrán lugar en la población más amplia. Sin embargo, no hay razón por la cual el condicionamiento deba afectar la
relación entre las variables. Podríamos querer ver si los divorcios de alto
Sin embargo, esto es más un problema a nivel descriptivo que explicativo. Si conflicto producen una peor adaptación entre los niños que los divorcios de
participar en un estudio de panel afecta el comportamiento y las actitudes de los bajo conflicto. Si bien la participación en el estudio puede moderar el nivel de
participantes, será difícil generalizar del panel a la población. Sin embargo, el conflicto entre padres divorciados y puede afectar la adaptación de los niños,
condicionamiento no debe afectar la forma en que los factores se vinculan entre sí. Por no hay razón por la cual la participación altere el vínculo entre conflicto y
ejemplo, para explorar el impacto de la ruptura del matrimonio en el bienestar de los adaptación. Aunque los niveles absolutos de conflicto y adaptación pueden no
niños, podríamos hacer un seguimiento de las familias que están experimentando la reflejar los niveles en la población más amplia de divorciados, la relación entre
ruptura del matrimonio. Si formar parte del estudio hace que los padres y los niños conflicto y ajuste no debería verse afectada. En consecuencia, esta relación
estén más atentos a las cuestiones de adaptación y bienestar, entonces los niveles de puede generalizarse a una población más amplia.
adaptación que observamos en
En aquellas circunstancias en las que es probable que el
acondicionamiento del panel se convierta en un problema serio para la validez
externa de un estudio, puede ser apropiado utilizar un diseño diferente. Un
diseño transversal repetido puede ofrecer una alternativa adecuada. Un
diseño de panel giratorio también proporciona una forma de estimar la medida
en que el acondicionamiento podría estar afectando los resultados. Lo hace
comparando los resultados de los paneles nuevos con los de los paneles
'experimentados'.

INMIGRACIÓN Y SALIDA

Los paneles pueden dejar de ser representativos si cambia la población de la


que se extrae el panel. Ciertos tipos de personas pueden abandonar el área
donde se realiza el estudio. Como resultado, el panel puede representar en
exceso a estos egresados (emigrantes). De manera similar, nuevos tipos de
personas pueden mudarse al área y, en consecuencia, el panel
subrepresentará a estos inmigrantes.

Cuando los cambios de población están creando un problema sustancial para el


proyecto, la solución es usar muestras dinámicas. Las muestras dinámicas se pueden
lograr de varias maneras. Son: diseños de panel rotatorio, diseños que permiten el
reemplazo o la complementación de muestras, y encuestas transversales repetidas.

Si usamos paneles dinámicos, debemos tener claro el origen de cualquier


cambio en nuestras variables dependientes. Los cambios en el nivel agregado
en un panel dinámico pueden reflejar una de dos cosas: cambios en los
individuos o cambios en la composición del panel. Por ejemplo, podríamos
estar rastreando los niveles de satisfacción con la vida en una región local en
particular y observar que, con el tiempo, el nivel promedio de satisfacción con
la vida disminuye. satisfacción dejando el área (y por lo tanto el panel). Al
mismo tiempo, las personas con bajos niveles de satisfacción pueden
mudarse al área (y por lo tanto ser reclutadas en nuestro panel dinámico). La
disminución de los niveles agregados de satisfacción con la vida podría
deberse enteramente a cambios en la composición del panel y no a cambios en el niveles de satisfacción con la vida experimentados por los individuos.
138
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 139
LONGIDUTINAL

Cuestiones prácticas
niños o el lugar de trabajo para que, si el encuestado se muda, podamos
Tanto en la etapa de diseño como en la de ejecución de un estudio longitudinal hay muchas comunicarnos con estos otros contactos de respaldo para encontrar al
cuestiones prácticas que resolver. Algunos de estos tienen que ver con maximizar la validez encuestado. También se pueden usar los registros públicos. Los directorios
interna y externa. Otros tienen más que ver con el costo de implementar diferentes diseños y los
telefónicos, las listas electorales y los registros disponibles públicamente de
aspectos prácticos de completar el estudio.
los consejos locales pueden ayudar a localizar a los encuestados que se han
Estandarización de instrumentos mudado. Por supuesto ,es más fácil si los participantes del panel nos dicen
Dado que el cambio es el enfoque central de los estudios longitudinales, debemos asegurarnos que se han mudado. En cada entrevista y cualquier otro contacto, es útil
de que el cambio observado refleje el cambio real en lugar de cambios en la forma en que se proporcionar tarjetas de notificación de cambio de dirección a los
recopilan los datos. Por lo tanto, es esencial estandarizar la forma en que se recopilan los datos participantes para que las envíen por correo a los administradores del
para las distintas oleadas del estudio. Es necesario estandarizar el método por el cual se estudio si se mudan. Mantener el contacto entre las oleadas de encuestas
recopilan los datos, la forma en que se hacen las preguntas, el orden en que se hacen, etc.
es otra estrategia útil. tarjeta a los participantes. Si esta tarjeta se 'devuelve
Necesitamos desarrollar reglas claras y consistentes sobre qué hacer en situaciones particulares
y seguirlas religiosamente. a ellos. Es posible que la época del año en la que se recopilan los al remitente', se nos alerta sobre la necesidad de comenzar a rastrearlos de
datos deba ser coherente para cada ciclo. Las épocas ocupadas, las épocas sombrías del año, inmediato. La tarjeta también brinda la oportunidad de enviar una tarjeta de
las épocas de estrés (por ejemplo, Navidad, el final del año fiscal), las vacaciones pueden afectar cambio de dirección y actúa como un reconocimiento de agradecimiento por
el tipo de respuestas que recibimos. participar en el estudio.
No siempre es posible lograr la estandarización. Cuanto menos estructurado sea el método de
Para reducir la deserción, es esencial mantener la motivación de los
recopilación de datos, más difícil será estandarizar los procedimientos. Cuando se requieran
técnicas más cualitativas y subjetivas, como la observación y las entrevistas no estructuradas, encuestados para continuar participando a fin de reducir la deserción.
mayor será la posibilidad de que se produzcan cambios. deberse a las personas que recopilan Proporcionar incentivos como dinero por el tiempo que las personas dedican
los datos y los métodos mismos. al estudio, pequeñas muestras de agradecimiento o resúmenes de los
resultados clave de la encuesta puede ayudar. lograr este objetivo. Si bien
La estandarización completa no siempre es deseable. Por ejemplo, puede interferir con
nuestros objetivos de investigación en estudios de curso de vida en los que se realiza un los incentivos materiales pueden ayudar a mantener la participación,
seguimiento de las personas a medida que envejecen. En los estudios longitudinales, las probablemente el incentivo más efectivo es que las personas sientan que su
circunstancias de las personas cambian, por lo que es posible que necesitemos adaptar nuestros participación es importante y constructiva. Cuantas más personas sientan
indicadores para reflejar dichos cambios. De la misma manera que los indicadores de que son participantes y socios en la investigación en lugar de 'sujetos',
inteligencia son específicos de la edad, nuestros indicadores de cambio también pueden
mejor. El objetivo primordial debe ser hacer de la participación en el estudio
necesitar ser específicos de la etapa de la vida. Es posible que sea necesario adaptar las
medidas de bienestar y cohesión familiar según la etapa del ciclo de vida familiar. una experiencia positiva en lugar de una carga y una intrusión no deseadas
(Dillman, 1978).
En los estudios de panel en curso, a menudo hay un núcleo de medidas estándar recopiladas
en cada ola del estudio. Además, también se incluyen con frecuencia módulos que cambian de La deserción es un problema mayor en algunos tipos de estudios que en otros. Los
vez en cuando. estudios de personas que son muy móviles, marginales o miembros de grupos
"extremos" pueden experimentar altas tasas de deserción. Por ejemplo, los estudios
desgaste del panel de padres después del divorcio invariablemente crean el problema de mantener el
contacto con los padres no residentes, especialmente los padres no residentes. Los
El desgaste de la muestra produce problemas tanto con el tamaño de la muestra como con la estudios longitudinales de grupos tales como delincuentes, usuarios de drogas y
representatividad y, por lo tanto, debe minimizarse. algunos tipos de personas desempleadas tienen tasas de deserción muy altas
inducidas por altos niveles de movilidad, enfermedad y muerte. Los estudios de panel
Para minimizar la deserción, debemos realizar un seguimiento de los miembros del panel. El
de personas que experimentan transiciones en la vida también pueden tener tasas de
seguimiento exige recursos considerables. Se utiliza una variedad de técnicas para ayudar a
deserción más altas que el promedio. es muy probable que las transiciones cambien
rastrear a las personas. Se recopila información adicional sobre los padres,
de dirección. Como resultado, pueden perderse en el estudio de panel.
Carga del encuestado entrevistas/cuestionarios son largos o intrusivos. calidad a medida que
Las encuestas de panel pueden imponer una carga considerable a los participantes. aumenta la carga.
Esto es especialmente así si cada ola del estudio está muy cerca una de la otra o si las
140
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 141
LONGIDUTINAL

Existe alguna evidencia (Buck et al., 1995) de que el costo de mantenimiento del
Hay varias formas de reducir la carga del encuestado. Algunas preguntas no panel puede ser no más que el costo de reclutar nuevas muestras. Además, el costo
necesitan hacerse en cada oleada: cada segunda o tercera oleada puede ser de recolectar los mismos datos de antecedentes en cada encuesta transversal
suficiente para algunas preguntas. Alternativamente, se puede hacer un conjunto de limitará la cantidad de otra información que se puede recolectar. En un diseño de
panel más fondo
preguntas solo a la mitad del panel y un conjunto diferente de preguntas a la otra
mitad. Aunque tenemos menos personas respondiendo las preguntas, es posible que
todavía tengamos suficientes números para un análisis significativo.

Recuerdo del encuestado


Los diseños de paneles retrospectivos se basan en el recuerdo del encuestado. Esto tiene dos
problemas. El primero es que la gente reconstruirá eventos pasados a la luz de eventos
posteriores. Esto puede resultar en distorsión y reinterpretación por la cual los eventos
recordados tienen poca semejanza con los eventos reales. Por ejemplo, un estudio que pide a
las personas que se han divorciado que describan aspectos de su matrimonio que se verán
afectados por el divorcio, por la naturaleza del divorcio, quién lo inició, etc.

El segundo problema con los estudios que requieren el recuerdo del encuestado es el
telescoping y el telescoping inverso (Menard, 1991). Las personas pueden recordar mal y pensar
que los eventos sucedieron más recientemente de lo que realmente sucedieron (telescópico) o
hace más tiempo de lo que realmente sucedieron (telescópico inverso). Se pueden usar varias
técnicas para reducir este problema. eventos y la construcción de un calendario de estos
eventos clave puede proporcionar puntos de anclaje para ayudar a recordar la secuencia de
eventos con mayor precisión. Por ejemplo, podríamos estar interesados en el vínculo entre la
etapa de la vida familiar y los patrones de trabajo de las madres. Para proporcionar puntos de
anclaje, primero podríamos pedir a las madres que proporcionen fechas clave como el año de su
primer trabajo, la fecha de nacimiento de cada hijo y así sucesivamente. Dado que es probable
que estas sean fechas que se pueden recordar con precisión, podemos entonces, pieza por
pieza, reconstruir cuánto tiempo después de estos eventos memorables ocurrieron otros
eventos, quizás menos memorables.

Costo

Los estudios de panel suelen ser mucho más costosos que un solo estudio transversal. El costo
de las encuestas de panel se deriva del uso de múltiples recopilaciones de datos y el costo de
seguimiento y mantenimiento del panel.

Sin embargo, si la elección es entre, digamos, un estudio de panel de cinco ondas y cinco
encuestas transversales repetidas, la desventaja del costo del diseño del panel es menos obvia.
entrevistas cara a cara a entrevistas telefónicas puede presentar problemas de
instrumentación como se discutió anteriormente.
la información solo debe recopilarse una vez (en la primera ola), lo que nos permite recopilar
información adicional en oleadas posteriores o reducir la duración (y el costo) de las Método de recopilación de datos
recopilaciones de datos posteriores.
No hay nada intrínseco en cualquier diseño de investigación que dicte que el
En última instancia, la rentabilidad del diseño del panel dependerá de la dificultad de mantener investigador utilice un método particular de recopilación de datos. En principio, los
el panel: cuánto tiempo se necesita para el seguimiento y el esfuerzo requerido para las datos pueden recopilarse mediante cuestionarios estructurados, observación,
'conversiones de llamadas' (convencer a los miembros del panel que inicialmente se niegan a entrevistas estructuradas o no estructuradas o cualquier otro método.
continuar).
Sin embargo, cuando se propone utilizar un diseño de panel, existen ventajas
El costo también dependerá del método de recopilación de datos. De los tres métodos reales en el uso de técnicas de entrevista asistidas por computadora. Aquí hay dos
principales de recopilación de datos en estudios de panel -entrevistas cara a cara, entrevistas alternativas disponibles: entrevista telefónica asistida por computadora (CATI) y
telefónicas y cuestionarios postales autoadministrados- las entrevistas cara a cara son los más entrevista personal asistida por computadora (CAPI).
caros. Sin embargo, tienden a producir las mejores tasas de respuesta. Las encuestas
Hay dos ventajas en el uso de métodos asistidos por computadora en los diseños
nacionales de panel generalmente se basan en alguna forma de muestreo por conglomerados
de paneles. Primero, estos diseños pueden involucrar conjuntos de preguntas
(Moser y Kalton, 1971; de Vaus, 1996) donde los conjuntos de entrevistas se concentran en
extremadamente complejos, con muchas preguntas que son relevantes solo para
varias áreas geográficas. entrevistas cara a cara en un área al mismo tiempo que se maximizan
pequeños subconjuntos de encuestados (dependiendo de sus características o los
las tasas de respuesta y se minimiza la deserción.
patrones de cambio que hemos observado). . Por ejemplo, es posible que
En el transcurso de un estudio de panel, las entrevistas cara a cara pueden volverse menos necesitemos un módulo especial de preguntas para las familias que se han divorciado
factibles desde el punto de vista financiero. A pesar de las entrevistas agrupadas inicialmente, en entre oleadas y requieran diferentes preguntas para los padres residentes y no
áreas particulares, las altas tasas de movilidad geográfica pueden conducir a la 'desagrupación' residentes. Con los métodos de entrevista asistidos por computadora, todas las
o dispersión de la muestra, lo que aumenta los costos de las entrevistas. considerablemente. preguntas posibles se programan en el paquete de entrevistas. Sobre la base de las
Afortunadamente, los avances en las entrevistas telefónicas (ver la siguiente sección) pueden respuestas a las preguntas anteriores, la computadora selecciona qué preguntas
aliviar los problemas de desagrupamiento (Buck et al., 1995). Sin embargo, cambiar de
142
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 143
LONGIDUTINAL

cambio, es posible que se necesiten varias oleadas. Por ejemplo, si


el entrevistador debe preguntar. Esto simplifica la tarea de administrar cuestionarios simplemente quisiéramos saber qué tan bien se han adaptado las personas
complejos y reduce los errores de registro y entrevista. Otra ventaja de las entrevistas a la jubilación, digamos dos años después de la jubilación, dos oleadas
asistidas por computadora es que en el pueden ser todo lo que se requiere. Si quisiéramos rastrear las etapas de
En la segunda ronda y en las subsiguientes, las respuestas de las rondas anteriores adaptación a la jubilación, podríamos necesitar múltiples oleadas para
para ese encuestado se pueden incluir en la entrevista. Estos pueden servir como detectar el altibajos del proceso (ver Capítulo 7).
indicaciones excelentes que brindan a los encuestados recordatorios sobre cómo han El número de oleadas también dependerá de la financiación, ya que cada oleada
respondido anteriormente. Por ejemplo, el entrevistador de CATI o CAPI puede decir: aumenta considerablemente el costo del estudio. La carga del encuestado también
'La última vez que dijo...' o 'La última vez que indicó que planeaba jubilarse'. ¿Ya te debe tenerse en cuenta al planificar el número de oleadas.
has jubilado? Esto no solo brinda a los encuestados un recordatorio de cómo se
sintieron la última vez, sino que también personaliza la entrevista y hace que el Muchas encuestas prospectivas de panel a gran escala adoptan un enfoque
abierto. El financiamiento está disponible para un conjunto inicial de oleadas y las
encuestado sienta que sus respuestas anteriores se han tomado en serio.
decisiones sobre cuánto tiempo continuar con el panel dependerán de la capacidad
Número de olas para asegurar más financiamiento para las oleadas posteriores.

El número de ondas utilizadas dependerá en parte del propósito del estudio. Si Brecha entre olas
estamos interesados simplemente en 'antes' y 'después' de un evento en particular,
dos ondas deberían ser suficientes. Si estamos tratando de rastrear un proceso de
Establecer la brecha entre olas se verá afectado por consideraciones 'políticas' como
la presión para obtener algunos resultados. La naturaleza y el contenido del estudio
también serán cruciales para establecer la brecha entre las olas. Los estudios de Al establecer la brecha entre olas, se debe considerar la carga del encuestado y el
condicionamiento del panel. Las brechas cortas pueden exacerbar estos problemas.
eventos de alta frecuencia o procesos de cambios relativamente rápidos pueden
Por otro lado, las brechas largas pueden crear problemas de seguimiento y aumentar
requerir solo pequeños intervalos entre ondas. El modelo teórico que se prueba
el desgaste.
también determinará los intervalos. Por ejemplo, en un estudio de adaptación a la
jubilación que anticipó diferentes fases en la transición de la jubilación (p. ej., luna de Error de muestra
miel en los primeros 3 meses; angustia a los 6 meses; reconstrucción de una nueva
El error de muestra es, en parte, una función del tamaño de la muestra. Cuanto más
identidad a los 12 meses; estabilización a los 18 meses), el modelo dictaría el espacios pequeña sea la muestra, mayor será la posibilidad de error de muestra. En las
entre olas. encuestas prospectivas de panel (sin reemplazo), se producirá un error de muestra
cuando se seleccione la muestra inicial. El desgaste posterior puede producir sesgo y
Cuando se espera que los cambios sean graduales, no tiene sentido volver a visitarlos con
aumentará el error de muestra como resultado de la reducción del tamaño de la
frecuencia. La famosa serie '7-UP', que siguió a un grupo de personas cada siete años a partir de
muestra. Si la muestra se repone, se controlará el error de muestra debido al tamaño
los siete años, es un ejemplo de un estudio a largo plazo con grandes lagunas. entre olas.
total de la muestra. Sin embargo, el reemplazo se basará en nuevas mini muestras y
estas mini muestras de reemplazo estarán sujetas a errores de muestreo y, por lo
tanto, pueden afectar la precisión con la que podemos generalizar con confianza
nuestro resultado más allá del panel.

Tamaño de la muestra
El tamaño de la muestra crea un problema con cualquier tipo de diseño. Las muestras
pequeñas encuentran problemas con el error de muestreo y con casos insuficientes
en subgrupos especiales para permitir un análisis significativo.

En los estudios de cambio y transiciones, para los cuales los estudios


longitudinales son especialmente útiles, el número real de personas en un panel que
experimenta un cambio o transición en particular puede ser bastante pequeño. Por
ejemplo, podríamos querer usar un diseño de panel para examinar el efecto del
divorcio en los niños. Si utilizamos un panel de hogares de la población general, el
número de hogares que realmente se divorcian en un período determinado será
bastante pequeño. Por ejemplo, sobre la base de la tasa de divorcio anual de
Australia de 12 por cada 1000 parejas (es decir, en un año dado, 12 de cada 1000
parejas casadas se divorciarán), necesitaríamos un panel muy grande para tener
suficientes parejas divorciándose en un año para permitir un análisis significativo.
Incluso si tuviéramos un panel de 5000 parejas, solo 60 parejas se divorciarían en un
año. Si seguimos el panel durante un período de cinco años, esto aumentaría a algo
cercano a las 300 parejas. Pero incluso este número puede constituir una muestra
demasiado pequeña si quisiéramos observar a las parejas que se divorcian y tienen
hijos pequeños. Los números serían aún más pequeños si quisiéramos mirar a los
padres de esos niños que tenían la responsabilidad principal de cuidar a los niños.

-Cuando nuestro interés está en los grupos pequeños, es posible que debamos
refinar más el panel inicial (por ejemplo, solo parejas con niños pequeños en lugar de
una muestra aleatoria de hogares). Alternativamente, puede ser posible
sobremuestrear ciertos tipos de personas (por ejemplo, parejas con niños pequeños)
para maximizar nuestras posibilidades de obtener un número suficiente de personas
que posteriormente experimenten los cambios en los que estamos interesados.
144
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 145
LONGIDUTINAL

Los diseños longitudinales enfrentan los mismos problemas éticos que


El tamaño de la muestra inicial también deberá tener en cuenta la posible deserción. cualquier otro diseño. Es decir, los asuntos de participación voluntaria,
Dado que la deserción dependerá en parte de la duración del estudio y del número y la consentimiento informado, no dañar a los participantes y
frecuencia de las ondas, el tamaño inicial del panel deberá tener en cuenta las tasas confidencialidad/anonimato deben ser considerados.
de deserción estimadas.

Diseño de instrumentos

En la primera ola de una encuesta prospectiva de panel, generalmente dedicamos


bastante tiempo a obtener información sociodemográfica, familiar e histórica. olas
necesitaremos verificar si algunas cosas han cambiado (por ejemplo, estado civil,
cualquier cambio en la composición del hogar, cambios en el trabajo, etc.).

El diseño de los instrumentos variará según el método de recopilación de datos. Los


métodos computarizados permiten estructuras de cuestionarios complejas con
módulos de subgrupos (consulte la discusión de CATI y CAPI más arriba), mientras
que los cuestionarios autoadministrados deben ser simples. El diseño del instrumento
también se verá afectado por las decisiones sobre el uso de preguntas centrales,
módulos rotativos y conjuntos de preguntas dados solo a la mitad de la muestra
(consulte la discusión anterior)

dotación de personal

Un estudio longitudinal se beneficiará enormemente del empleo de personal bien


capacitado que tenga una participación continua en el estudio. Si una persona es
entrevistada por el mismo entrevistador a lo largo del tiempo, hay más posibilidades de
que el encuestado continúe en el estudio debido a un sentimiento de compromiso
tanto con la persona como con el estudio (Rose et al., 1991).

Un estudio de panel bien realizado requerirá personas que sean particularmente


hábiles para convencer a los miembros del panel que pueden estar inclinados a
abandonar el estudio para que continúen. Persuadir a los miembros del panel que
inicialmente se niegan a continuar en el estudio se denomina negativas de
"conversión". Se necesitan habilidades particulares para llevar a cabo esta tarea con
éxito sin contravenir los principios éticos del consentimiento voluntario e informado.

La gestión de datos también es fundamental para el éxito de un estudio de panel a


gran escala. Los administradores de datos capacitados que almacenan datos,
combinan adecuadamente los datos de olas sucesivas y desarrollan protocolos de
gestión de datos transparentes son esenciales. Finalmente, el análisis de datos
longitudinales puede volverse muy complejo y los miembros del proyecto que pueden
manejar adecuadamente el análisis serán importantes.

Cuestiones éticas
Surge una pregunta interesante en los diseños que involucran vinculación
de registros. Aunque las leyes de privacidad de muchos países impiden dicha
implementado. Dado que estos principios se discutieron en el Capítulo 5, esta sección vinculación, estos diseños también contravienen potencialmente el principio
simplemente destaca los asuntos que surgen particularmente con los diseños del consentimiento informado. Aunque una persona puede haber dado su
longitudinales. consentimiento informado cuando proporcionó cada conjunto de información
por separado, esto no es lo mismo que aceptar que los datos se vinculen, ya
Participacion voluntaria que este es un uso muy diferente de los datos y es poco probable que sea
para lo que la persona dio su consentimiento. .
Dada la necesidad de minimizar el desgaste del panel, existe el peligro de que se
empleen presiones indebidas o medios poco éticos para convencer a las personas de Daño a los participantes
que continúen participando en cada ola. A medida que crece la 'inversión' en cada
persona a medida que participa en más oleadas, aumenta el 'costo' de la deserción de En los diseños experimentales en los que hay una intervención activa, existe
las personas. Sin embargo, la participación voluntaria debe seguir siendo la base un requisito ético de que esta intervención no exponga a los participantes a
sobre la cual las personas continúan participando. daños. La misma preocupación puede surgir en los diseños de panel que
involucran una intervención activa. Sin embargo, los estudios de panel
También surge la pregunta de qué hacer con las personas que se niegan a generalmente se basan en el efecto de eventos 'naturales' y por lo tanto no
participar en una ola. ¿Debería eso impedir tratar de reclutarlos nuevamente en una enfrentan el problema de las intervenciones dañinas de la misma manera que
ola posterior? ¿En qué momento volver a los que antes se negaron se convierte en lo hace el experimentador.
acoso?
Sin embargo, el investigador bien puede enfrentarse a situaciones en las
Consentimiento informado que se entera de personas que están expuestas a daños. Por ejemplo, el
estudio puede identificar a una persona con depresión suicida o puede
¿En qué momento se debe pedir a los participantes su consentimiento? En un estudio encontrarse con casos de abuso infantil. El investigador debe decidir qué
que puede extenderse por muchos años, ¿el consentimiento al principio dura el resto hacer. en tales casos. Puede existir la tentación de no hacer nada, ya que
del estudio, independientemente de cuántas oleadas tenga finalmente? ¿ O se cualquier referencia posterior para obtener otra ayuda puede poner en peligro
requiere consentimiento informado en cada ciclo? la participación continua de la persona en el panel. Además, dicha
intervención puede 'contaminar'
146
DISEÑOS LONGITUDINALES

Resumen
la investigación cambiando el comportamiento. Mi propia opinión es que el bienestar
de los participantes debe tener prioridad y que, al invitar a las personas a participar en Si bien los diseños experimentales con frecuencia no son factibles en la
un estudio, el investigador asume cierta responsabilidad por la seguridad y el investigación de las ciencias sociales, los diseños longitudinales brindan una
bienestar de los participantes, incluso cuando se trata de otras personas. que el forma importante de rastrear y comprender el cambio a nivel individual y
investigador que causa el daño. social. Mientras que los diseños longitudinales pueden encontrar algunos
problemas con la validez interna debido a la ausencia de grupos de control
Confidencialidad y anonimato aleatorios. , hay maneras de minimizar estos efectos. Estos se han discutido
brevemente y se desarrollarán con más detalle en el Capítulo 9. Se han
Dado que necesitamos poder emparejar casos entre oleadas y rastrear casos, es imposible
discutido otros problemas potenciales con validez interna y se han esbozado
garantizar el anonimato de los participantes. Sin embargo, es necesario garantizar la
confidencialidad. Aparte de las garantías normales de no divulgar información que pueda
formas de estructurar diseños longitudinales para superar estos problemas en
comprometer la privacidad de cualquier persona, existe la necesidad de garantizar que los datos este capítulo. Como regla general, los diseños longitudinales tienden a tener
se almacenen de forma segura. Dado que necesitamos poder hacer coincidir las respuestas con una mejor validez externa que los diseños experimentales, pero las amenazas
información que pueda identificar a los encuestados, es importante que los datos se almacenen a la validez externa permanecen y deben eliminarse. El capítulo describió
de tal manera que ninguna persona no autorizada pueda hacer coincidir esta información de estas amenazas e indicó estrategias para minimizarlas.
identificación con otras respuestas. Esto se puede lograr almacenando la información en
archivos separados con solo un número muy limitado de personas que tienen la información Los diseños longitudinales pueden ser bastante complejos de implementar
necesaria para hacer coincidir los dos archivos. e involucran una amplia variedad de decisiones prácticas. Se describieron los
problemas prácticos y éticos que son particularmente pertinentes para los
diseños de paneles.
Fuentes de datos faltantes

ÍTEM NO RESPUESTA
9
La falta de respuesta del ítem ocurre cuando los individuos no responden a
una pregunta en particular. En algunos casos, esto se debe a que no están
obligados a responder al ítem (p. ej., preguntas sobre un cónyuge para
ANÁLISIS DE DATOS EN LONGITUDINAL personas que no están casadas), mientras que en otros casos algunas
personas pueden negarse a responder a una pregunta (p. ej., ingresos).
DISEÑO
FALTA DE RESPUESTA DE LA UNIDAD

Este es un problema que es propio de los estudios de panel.1 Dado que los
diseños de panel involucran la recopilación de datos de los mismos individuos
en varias ocasiones y la medición del cambio durante ese tiempo, nos
Muchos de los temas discutidos en el Capítulo 6 en relación con el análisis de datos encontramos con dificultades si no logramos recopilar datos del caso en el
experimentales también se aplican al análisis longitudinal. En lugar de repetir esa segundo caso o en cualquier otro subsiguiente. ocasión.
discusión, este capítulo se enfoca en una serie de cuestiones de análisis que son
Hay dos formas de falta de respuesta de la unidad. Una es donde las personas
particularmente pertinentes para el análisis longitudinal. abandonan el estudio por completo. El otro ocurre en estudios de panel de ondas
múltiples donde algunas personas pierden algunas ondas pero no se pierden
permanentemente en el panel. Esto se denomina falta de respuesta de onda (Rose et
Datos perdidos al., 1991).

Los datos faltantes son un problema para cualquier tipo de análisis, pero son
particularmente problemáticos en el análisis de panel. Hay dos tipos de datos
faltantes: falta de respuesta del ítem y falta de respuesta de la unidad.

148
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 149

El problema de la falta de respuesta del ítem puede agravarse con las oleadas. Esto
¿Por qué un problema? se puede ilustrar con un ejemplo extremo. Imagine un estudio de panel de cinco
oleadas en el que un individuo participó en cada oleada. Es posible que tengamos un
Los datos faltantes representan un problema por dos razones principales. conjunto de 10 preguntas que forman una escala de prejuicio administrada en cada ola.
Si una persona no pudo responder solo un elemento en una ola, es posible que no
TAMAÑO DE LA MUESTRA podamos construir una puntuación de escala para esa persona en esa ola. Tendríamos
La falta de respuesta a los ítems puede conducir a una pérdida sustancial del tamaño por tanto datos incompletos de esa persona lo que podría obligarnos a eliminar ese
caso del análisis. Debido a que falta un dato, sería necesario descartar una gran
de muestra disponible para el análisis de datos. Esto es especialmente un problema cantidad de datos sobre una persona en particular. El desgaste de esta extensión
cuando se construyen escalas o se realizan análisis multivariados en los que la falta puede conducir a una pérdida severa de casos y datos. A medida que un panel
de datos en cualquiera de un conjunto de variables conduce a la pérdida de ese caso madura, el problema creado por la falta de datos puede empeorar, ya que la posibilidad
para el análisis. Este problema puede agravarse rápidamente para producir una de que a un individuo le falten datos sobre una variable relevante en algún momento
pérdida inaceptable de casos. Por ejemplo, suponga que estamos realizando un aumenta a medida que aumenta el número de ondas.
análisis usando solo tres variables y que para cada una de las tres variables el 10 por
ciento de las personas no ha respondido la pregunta. Supongamos que para cada PARCIALIDAD
variable no hubiera respondido un 10 por ciento diferente de personas. Entonces Los datos faltantes también pueden introducir sesgos en la muestra. Cuando la falta de
tendríamos una pérdida del 30 por ciento de los casos. respuesta a los ítems es sistemática en lugar de aleatoria (es decir, ciertos tipos de
personas son más propensas que otras a negarse a responder preguntas), el resultado
pueden ser muestras no representativas. Por ejemplo, si las personas con mayores ingresos
son más propensas que las personas con ingresos más bajos a negarse a revelar sus ingresos,
nos quedamos con estimaciones de ingresos inexactas. En consecuencia, cualquier análisis en Identificar el sesgo de datos faltantes
el que el ingreso sea una variable se verá afectado por la pérdida de casos debido a elementos
no -respuesta. Al tratar el problema de la falta de respuesta a los ítems, podemos verificar si
La falta de respuesta de la unidad introducirá otros sesgos en la muestra. Es poco probable los que no responden son diferentes de los que responden simplemente
que las personas que abandonan un panel sean las mismas que permanecen. La pérdida de comparándolos en otras variables. Por ejemplo, podríamos verificar si los
miembros del panel puede deberse a muerte, movilidad geográfica, cambio de estado familiar o que no respondieron a una pregunta en particular eran diferentes de los que
algún otro tipo de cambio en las circunstancias de una persona. respondieron en términos de edad, ingresos, educación, sexo, etnia o sus
actitudes sobre temas particulares. También podemos verificar el sesgo
debido a la falta de respuesta de la unidad. Una de las ventajas de los
estudios de panel es que cuando una persona no responde en una ola en
particular o la abandona por completo, todavía sabemos mucho sobre esa
persona de oleadas anteriores. Podemos usar esta información para ver si
los que abandonan son diferentes de los que continúan. Si lo son, podemos
emplear varias estrategias durante el análisis de datos para hacer ajustes.

Incluso si identificamos sesgo, no es necesariamente un problema. El sesgo es un


problema si deseamos hacer generalizaciones y llegar a estimaciones de población
para las variables en las que hay sesgo. Sin embargo, en la investigación explicativa, el
sesgo no siempre importará. Si la característica sobre la que existe un sesgo de la
muestra no está relacionada con las variables que componen el modelo explicativo,
entonces el sesgo no afectará los patrones del modelo explicativo (Capítulo 8).

Tratar con datos faltantes


Los datos faltantes crean un problema debido a su efecto en el tamaño de la muestra y
en el sesgo de la muestra. Las estrategias para tratar con los datos faltantes
dependerán en parte del problema que estemos tratando de minimizar.

Por supuesto, debemos tratar de minimizar el problema en la etapa de


recopilación de datos, pero hay tres formas de abordar el problema durante el
análisis de datos: imputación, ponderación y controles estadísticos (Rose et
al., 1991: 19).

IMPUTACIÓN

Esencialmente, la imputación implica construir respuestas para las preguntas


que la gente no responde. Hay varias formas de imputación, algunas de las
cuales son discutidas por Hertel (1976) y por Kalton (1983a; 1986). Estas
incluyen las siguientes.

Enfoque de la media de la muestra Si no conocemos el valor de una persona en una


variable dada, una suposición razonable para esa persona es la respuesta promedio
de otros miembros de la muestra para esa variable. Con variables de nivel de intervalo,
podríamos reemplazar los valores faltantes con la media de la variable. Podríamos
usar la mediana para variables ordinales y la moda para variables nominales. Aunque
cometeremos errores en nuestras conjeturas, este método produce menos errores que
conjeturar cualquier otro valor. Cuando la muestra es relativamente homogénea, este enfoque puede dar lugar a pocas "conjeturas" incorrectas.
150
DISEÑOS ANÁLISIS DE DATOS EN DISEÑO LONGIIUDINAL ICI

LONGITUDINALES

Sin embargo, el problema de adoptar este enfoque es que reduce la variabilidad de la


muestra en la variable para la que se estiman los datos faltantes. Esto, a su vez, reduce (y correlaciones) que es un problema del enfoque simple de sustitución de
la correlación entre esta variable y otras variables. medios.

Enfoque de medias grupales Una forma de superar este problema es usar medias Análisis de regresión Este es un método de imputación más complejo que
grupales en lugar de la media muestral general. Para hacer esto, dividiríamos la muestra involucra el uso de la regresión para predecir el valor de la persona en la
en grupos sobre la base de una variable de antecedentes (por ejemplo, sexo, edad y variable de valores perdidos. Sobre la base de todo un conjunto de
etnia) que se correlacione bien con la variable de valor faltante. Entonces obtendríamos características podemos estimar cómo, en promedio, una persona con esas
la media de la variable de datos faltantes para cada uno de estos subgrupos. Por características respondería a la pregunta sobre la que faltan datos. En este
ejemplo, si quisiéramos estimar los ingresos de las personas que se negaron a sentido, es comparable al enfoque de medias grupales. El problema con el
responder la pregunta de ingresos, podríamos dividir la muestra en grupos según su método es que, dado que la regresión se basa en una matriz de correlación en
nivel educativo y luego, dentro de cada nivel educativo, dividir la muestra en hombres y la que se usa el método de manejo de datos faltantes por pares (ver más abajo),
mujeres. Para cada el nivel de educación y el subgrupo de género, podríamos obtener el normalmente habrá alguna pérdida de casos.
nivel de ingresos medio para aquellos que respondieron la pregunta de ingresos. Imputación de oleadas anteriores Para algunas características estables,
Podríamos encontrar que el nivel de ingresos para las mujeres con educación terciaria podemos "acarrear" valores de una oleada anterior (Rose et al., 1991) o
es de $ 30,000 al año, mientras que los hombres con educación terciaria ganan, en verificar de oleadas posteriores. Sin embargo, para las variables que
promedio, $ 35,000 y así sucesivamente. Usando En el enfoque de los medios grupales, probablemente estén sujetas a cambios y para las variables numéricas en
simplemente sustituiríamos estos valores medios por los valores faltantes para las particular, puede ser incorrecto "transferir" las respuestas de una ola anterior.
personas de acuerdo con el grupo al que pertenecen. Con el tiempo, puede ser posible llenar algunos vacíos causados por la falta de
respuesta de la ola. observando la onda anterior y la onda subsiguiente e
La desventaja de este enfoque es que exagera el grado de homogeneidad dentro de
imputando un valor de punto medio para la onda faltante.
los grupos y, por lo tanto, puede sobrestimar la varianza entre grupos y para la muestra
en general. estimado. Ignorar los datos que faltan Este no es un enfoque de imputación, pero
proporciona una forma de gestionar los datos que faltan al construir escalas.
Asignación aleatoria dentro de grupos Este enfoque es similar al enfoque de medias de
Implica calcular puntuaciones de escala calculando la puntuación media de una
grupo en que se basa en dividir la muestra en grupos sobre la base de otras
persona para las variables para las que ha proporcionado respuestas.
características que probablemente se correlacionen con la variable de datos faltantes.
Supongamos que estamos construyendo una escala a partir de 10 preguntas,
Pero difiere en que no implica sustituir la media del grupo por ningún dato faltante. En
cada una con puntajes posibles que van de 0 a 4. Una persona que obtuvo un
cambio, cuando localizamos un caso con datos faltantes en una variable en particular,
puntaje de 2 en los 10 elementos lograría un puntaje total de 20 en los 10
buscaríamos el valor en la misma variable del caso anterior más cercano en ese grupo y
elementos y un puntaje promedio de 2. .Una persona que obtuvo una
le daríamos ese mismo valor al caso con el valor faltante. Esto significa que el valor
puntuación de 2 en cada uno de los ocho ítems pero no respondió los dos ítems
faltante los valores se reemplazan con una variedad de valores diferentes elegidos
restantes obtendría una puntuación total de 16 pero una media de 2. Calcular
aleatoriamente dentro de ese subgrupo de casos. Este enfoque no afecta la variabilidad
una puntuación de escala de esta manera evita el problema de falta de datos al
de la muestra o del grupo: no tiene efecto sobre la fuerza de las correlaciones y evita la
construir escamas.
pérdida de casos. A pesar de ser un poco más complejo de ejecutar, este es un método
muy deseable para manejar los datos faltantes. PONDERACIÓN

Promedio del lapso Un enfoque relacionado requiere que calculemos la media o la La ponderación es una forma de ajustar una muestra para permitir un posible
mediana (según corresponda) de los casos dentro de un lapso dado del caso con datos sesgo debido a la falta de respuesta de la unidad. La ponderación de una
faltantes y sustituyamos este valor por el valor de los datos faltantes. Este enfoque es muestra debe hacerla más representativa de la población para la que está
relativamente simple y evita deflactar la varianza. diseñada, de modo que se puedan hacer estimaciones confiables desde la
muestra hasta el final. población. Por ejemplo, imagine una situación en la que
el 50 por ciento de la población son hombres y el 50 por ciento son mujeres. Sin mujeres y 40 por ciento hombres. Dado que el género estará relacionado con
embargo, cuando se extrae una muestra de esta población se encuentra que, ya sea por muchas otras variables, este sesgo afectará las estimaciones de otras variables
falta de respuesta o por abandono,60 por ciento de los miembros de la muestra son de la muestra a la población.
152
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 153

Para hacer esto, controlamos estadísticamente las variables en las que sabemos o
Para ajustar el sesgo, necesitaríamos ponderar cada una de las mujeres para que cuenten creemos que puede haber un sesgo. Mediante el uso de controles estadísticos
por menos de una persona, mientras que cada hombre se ponderaría para que cuenten por (Capítulo 12) podemos observar las relaciones con el efecto de otras variables
más de una persona. De esta forma, sus proporciones en la muestra se ajustan para igualar eliminadas. Al eliminar los efectos de otras variables, podemos eliminar el efecto de
sus proporciones en la población. una variable donde el sesgo de la muestra es evidente.

Para lograr este fin ponderamos cada caso con un peso específico. La ponderación se
obtiene dividiendo el porcentaje de la población de una categoría por el porcentaje de la
muestra. En este caso, la relación de fórmula para hombres sería 50/40, lo que da un peso de
1,25. Para las mujeres la relación sería 50/60 lo que da un peso de 0,83 (de Vaus, 2001).

En el ciclo 1 de un estudio de panel, necesitaríamos ponderar la muestra sobre la base de lo


que sabemos sobre las características de la población y las características de quienes
responden en la primera fase (p. ej., sexo, región, etnicidad). Esto requiere que tengamos un
conocimiento confiable de las características de la población.

En oleadas posteriores, tendremos que hacer más ajustes de ponderación para tener en
cuenta los sesgos que pueden surgir debido a la deserción. Dada la cantidad de información
disponible desde la primera ola, tendremos una gran cantidad de información que se puede
utilizar para calcular los pesos. En estos casos, el peso se lograría dividiendo el porcentaje de
la onda 1 por el porcentaje de la onda 2 (o 3,4). Esto permitirá que las ondas posteriores a la
onda 1 sigan siendo representativas de la onda 1. Siempre que la onda 1 sea representativa
de la onda población, estas ponderaciones pueden ayudar a que cada oleada siga siendo
representativa de la población.

El análisis puede volverse bastante complejo cuando se analizan varias oleadas a la vez, ya
que es posible que cada oleada deba ponderarse de manera diferente. Estas estrategias de
ponderación dentro de las encuestas de panel se analizan en detalle en Kalton (1983a; 1986),
Lepkowski (1989), Lynn et al. (1994) y Buck et al. (1995).

INTRODUCCIÓN DE CONTROLES ESTADÍSTICOS PARA VARIABLES DE SESGO

El sesgo no solo afecta nuestra capacidad para hacer estimaciones confiables de una muestra
a la población, sino que también puede distorsionar los patrones de relaciones que
encontramos entre las variables dentro de una muestra. No siempre es posible volver a pesar
las muestras de forma fiable. Sin embargo, podemos asegurar que el patrón de relaciones que
encontramos entre las variables no se debe al efecto de la variable para la que tenemos
información sesgada.
Distinguir entre cambio agregado e individual es importante tanto a nivel teórico
como a nivel de diseño de investigación. Es fácil malinterpretar los bajos niveles de
Cambio de medición cambio agregado. Si interpretamos el bajo cambio agregado como la ausencia de
cambio individual, llegaremos a diferentes conclusiones sobre el fenómeno. Por
Cambio de nivel agregado versus cambio de nivel individual ejemplo, el porcentaje de personas que reciben asistencia social y las características
de dichas personas son bastante estables en el tiempo. Esto ha llevado a algunas
En estudios que se extienden en el tiempo podemos pensar en el cambio en dos niveles:
personas a creer que los beneficiarios de asistencia social son un grupo estable e
agregado e individual.
inmutable. En realidad, hay una gran rotación de quienes reciben asistencia social y
El cambio a nivel agregado también se conoce como cambio neto o cambio macro, mientras relativamente pocos dependen continuamente de la asistencia social a lo largo del
que el cambio a nivel individual también se conoce como cambio bruto o cambio micro. El tiempo (Hakim, 1986). La estabilidad a nivel agregado indicará algo sobre la
significado de las dos formas de pensar sobre el cambio se puede describir más fácilmente con naturaleza del macrosistema (es decir, hay algo sobre la estructura del sistema social
un ejemplo. En el ciclo 1 de un estudio sobre personas en la fuerza laboral remunerada, y económico que produce un nivel dado de personas en bienestar). Sin embargo, no
podríamos identificar el porcentaje de personas que trabajan a tiempo completo y el porcentaje nos dice sobre los individuos y la naturaleza de los cambios que experimentan.
que trabaja a tiempo parcial. En el ciclo 2 recopilamos la misma información y encontramos que
El tipo de diseño de investigación que adoptemos dependerá de si nuestro enfoque
exactamente los mismos porcentajes de personas trabajan a tiempo completo. tiempo y tiempo
está en el nivel de cambio agregado o individual. Una serie de encuestas
parcial como en la primera ola.
transversales repetidas es bastante apropiada para rastrear el cambio agregado. a
Si bien sería correcto concluir que a nivel agregado no ha habido cambios entre la ola 1 y la nivel de grupo necesitamos grupos comparables a lo largo del tiempo. Sin embargo, si
ola 2, no se sigue que ningún individuo haya cambiado su nivel de participación en la fuerza estamos interesados en el cambio a nivel individual, tenemos que usar un diseño de
laboral. Si el 20 por ciento de los trabajadores a tiempo completo hubiera cambiado a tiempo panel porque los mismos individuos están involucrados en cada ola.
parcial y el 20 por ciento de los trabajadores a tiempo parcial se han convertido en trabajadores
Los datos se analizarán de manera diferente dependiendo de si estamos
a tiempo completo, tendríamos un gran número de personas que, en efecto, habrían cambiado
examinando un cambio de nivel agregado o individual. Cuando se trata de un cambio
su nivel de participación en la fuerza laboral, pero a nivel agregado parecería que no hubo
de nivel agregado
cambio. los cambios en el nivel agregado de los individuos en una dirección pueden ser
anulados por cambios en la dirección opuesta.
154
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 155

Cambio cualitativo versus cuantitativo


cambio de nivel, estamos restringidos a medidas agregadas. Por ejemplo, cuando examinamos el El tipo de análisis realizado dependerá del tipo de cambio que se esté considerando.
cambio agregado, compararemos las medias del grupo a lo largo del tiempo, los cambios en la Esto se relaciona con el nivel de medición de la variable dependiente.
varianza del grupo, los porcentajes generales en categorías particulares en diferentes momentos
(por ejemplo, porcentaje de desempleados, porcentaje de asistencia social, etc.) .Al adoptar una Si la variable dependiente es nominal (categórica, cualitativa), entonces el cambio
estrategia de cambio agregado, podemos comparar subgrupos para ver si el alcance y la consistirá simplemente en si las personas han cambiado de un estado a otro estado (por
dirección del cambio agregado difieren entre los subgrupos. Por ejemplo, podemos hacer un ejemplo, casadas o divorciadas, empleadas o desempleadas). Con las variables
seguimiento de los cambios, a nivel agregado, en el nivel de optimismo de los dueños de negocios dependientes cualitativas utilizaremos métodos de análisis que puedan hacer frente a
y empleados. antes y después de la elección de un gobierno de orientación laboral. Al comparar este tipo de variables dependientes. La forma particular de análisis también dependerá
las diferencias en el cambio agregado de los diferentes grupos, podemos comenzar a identificar del nivel de medición de las variables independientes. Menard (1991) ha resumido las
algunos de los factores que afectan el optimismo a nivel agregado. principales formas de análisis adecuadas a diferentes circunstancias y se proporcionan
en la Tabla 9.1. Una descripción de cada una de estas formas de análisis está más allá
Sin embargo, ninguna de estas estrategias nos permite identificar el alcance y la naturaleza del alcance de este libro.
multidireccional del cambio a nivel individual. No podemos identificar el grado en que cambian los
individuos, el número que cambia en una dirección u otra, o la naturaleza multidireccional del Cuando las variables dependientes se miden a nivel de intervalo, podemos medir la
cambio (entradas y salidas). Cuando podemos identificar a los individuos que cambian, entonces cantidad o la cantidad de cambio en lugar de simplemente si han cambiado o no.
nuestro análisis puede enfocarse en identificar las características de los cambiadores: aquellos Podemos hacer esto tanto a nivel agregado (grupo) como individual. Por ejemplo,
que cambian en pequeña y gran medida, y aquellos que cambian en direcciones opuestas. Para podríamos medir el grado en que el bienestar económico cambia con el tiempo.
realizar un análisis a este nivel, necesitamos datos de panel para individuos. Suponiendo que podemos medir con precisión el bienestar económico (por ejemplo, el
nivel de ingresos, el valor neto de los activos en dólares), podemos cuantificar cuánto
mejor (o peor) está la gente a lo largo del tiempo. Los métodos apropiados para analizar el cambio
cuando la variable de cambio es cuantitativa se describen en la Tabla 9.1.
Cuadro 9.1 Métodos de análisis para datos de panel

Variable dependiente Variable independiente Método de análisis

Intervalo (continuo) Intervalo (continuo) Ecuaciones diferenciales;

regresión;ARIMA multivariado

análisis de series de tiempo;


latente

modelos estructurales variables

Mezcla de nominal y ANOVA con ANCOVA;

intervalo (continuo y regresión con dummy

categórico) Variables

nominal (categórico) ANOVA; no paramétrico

ANOVA;variable ficticia

regresión

nominal (categórico) Intervalo (continuo) Análisis discriminante; logit o

análisis probit;logística

regresión; peligro/supervivencia/

análisis del historial de eventos

Mezcla de nominal y Análisis log-lineal;logística

intervalo (continuo y regresión; peligro/supervivencia/

categórico) análisis del historial de eventos

nominal (categórico) Análisis log-lineal;multiestado

modelos de tablas de vida;


peligro/ compararíamos medias, varianzas o proporciones en cada ciclo y veríamos
análisis de
cuánto difieren entre ciclos ( Tabla 9.2).
supervivencia/historial de
eventos Sin embargo, si esta es la única forma en que se analizaron los datos de
panel, no tendría mucho sentido usar un diseño de panel. Un diseño
Fuente: adaptado de Menard (1991) transversal repetido funcionaría igual de bien.

Cuando los datos de panel están disponibles, normalmente se analizarán para


Medición del cambio en los diseños de los paneles identificar el cambio a nivel individual así como a nivel agregado. La pregunta entonces
es cómo se medirá el cambio a nivel individual.
En este capítulo se tratará únicamente la medición del cambio en los diseños de
paneles. El Capítulo 12 considerará las formas en que se analiza el cambio en CAMBIO DE MEDIDA
diseños transversales repetidos.
Puntuaciones de cambio sin procesar Una forma sencilla de medir el cambio
En los diseños de paneles tenemos que averiguar cómo se medirá el cambio. Esto cuando la variable dependiente es cuantitativa es calcular las puntuaciones
podría limitarse a examinar el cambio agregado, en cuyo caso las medidas agregadas de cambio para cada persona. Esto se hace restando las puntuaciones de la
de la variable dependiente se compararían en cada ciclo. Por ejemplo, onda 1 de las puntuaciones de la onda 2 (o
156
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 157

Puntajes de cambio residuales Un problema con los puntajes de cambio sin


Cuadro 9.2 Formas de examinar el cambio agregado en dos ondas procesar es que la cantidad de cambio puede no ser independiente de los
puntajes iniciales. Por ejemplo, podríamos esperar más cambios entre
Ola 1 Ola 2 Cambio
aquellos que inicialmente tenían puntajes extremos o, por alguna otra razón,
Significar 25 35 +10
cambio entre las personas que puntúan en el medio de alguna escala.
Ciertamente, es probable que la dirección del cambio sea diferente
Diferencia 62 50 -12 dependiendo de dónde se encuentre una persona en alguna escala. Los que
45% 49% +4%
se encuentran en los extremos de una escala solo pueden cambiar en una
Porcentaje en la categoría X
dirección.

Una forma de eliminar el efecto del puntaje inicial es usar puntajes de cambio
residualizados o retrocedidos (Kerlinger, 1973: 337; Menard, 1991: 45). Estos
independientemente de las ondas que se comparen) y tratar la diferencia como un identifican casos en los que una persona ha cambiado más de lo esperado en base a su
reflejo del cambio. Sin embargo, existen varios problemas con este enfoque. puntaje inicial. Con este procedimiento, utilizamos el análisis de regresión para predecir
las puntuaciones de la onda 2 a partir de las puntuaciones de la onda 1 sobre la base de
La primera es que cualquier medida tendrá un grado de error. Al usar una medida la correlación entre las puntuaciones de la onda 1 y la onda 2. Luego restamos estos
dos veces (onda 1 y onda 2) y calcular un puntaje de cambio, la falta de confiabilidad puntajes predichos de la onda 2 de los puntajes reales de la onda 2. Lo que queda es el
de cada prueba se verá agravada en el puntaje de cambio. Se debe tener mucho puntaje de ganancia residual: la cantidad de ganancia que no se debe a la influencia de
cuidado al usar puntajes de cambio a menos que se sepa que la medida de la la puntuación inicial de la onda 1.
variable de resultado ser altamente confiable.
Cambio porcentual Otra forma de medir el cambio a nivel individual es calcular
Otro problema relacionado es que es más probable que las puntuaciones extremas cambien
el cambio porcentual en la puntuación inicial. Este enfoque solo es apropiado
debido a los fenómenos de regresión a la media y efectos de truncamiento (capítulos 5 y 6). Por
lo tanto, puede ser difícil saber hasta qué punto la puntuación de cambio refleja el cambio real y
para variables de escala de razón donde hay un cero no arbitrario (esto
cuánto refleja el error de medición. incluye la mayoría de las variables continuas en la investigación en ciencias
sociales). Aquí restamos el puntaje de la ola 1 de la ola 2
medición. El logro de patrones consistentes cuando se emplean diferentes medidas
sugiere que el patrón no depende de las medidas particulares y no es simplemente un
puntuación y divide la respuesta por la puntuación de la onda 1. Para convertirlo en artefacto de medidas poco fiables.
un cambio porcentual, multiplicaríamos la respuesta por 100.
¿Cuánto es el cambio? Dado que siempre habrá algún grado de error de medición, ¿
Por ejemplo, la puntuación del ciclo 1 de una persona podría ser 30 y la cómo se define el cambio? El problema de especificar cuánto cambio medido tiene que
puntuación del ciclo 2 40. Entonces: ocurrir antes de que estemos preparados para tratarlo como un cambio real es una
dificultad independientemente de si se utilizan puntajes de cambio brutos, puntajes de

ola 2 cambio residualizados o cambio porcentual. Si, por ejemplo, en una escala de 0 -20 una
persona cambia en 0,5 puntos, o si una persona cambia en un 1 por ciento, ¿tratamos
esto como un cambio, o es probable que este grado de cambio se deba a un error de
medición? ¿Deberíamos emplear un punto de corte mínimo y solo definir el cambio de
La puntuación de la fase 2 representa un aumento del 33 % con respecto a la puntuación de la más de un cierto nivel predefinido como constituyente del cambio?
fase 1.
No hay una respuesta simple o clara a estas preguntas. La regla básica debería ser
Distinguir entre cambio real y falta de confiabilidad Todas estas formas de medir el cambio que cuanto más fiables sean las medidas, más podremos tratar los pequeños cambios
tienen un problema común: todas se basan en poseer medidas confiables de las variables como cambios reales. Dado que muchas variables en las ciencias sociales son
dependientes. Cumplir con esta condición puede ser especialmente problemático cuando se propensas a errores de medición, debemos ser cautelosos en lo que definimos como
usan variables dependientes numéricas. cambio.

Un enfoque que se puede usar para ayudar a distinguir entre el cambio real y el 'cambio' ESTANDARIZACIÓN Y ESCALADO
producido por instrumentos poco confiables es replicar el análisis usando diferentes medidas.
Ajuste por 'inflación' Algunas medidas (por ejemplo, el ingreso) deben ajustarse con el
Si persisten los mismos patrones cuando se utilizan varias medidas diferentes del concepto
tiempo antes de que podamos medir el cambio. En algunos casos el real
subyacente, es menos probable que el cambio medido se deba principalmente a un error de
158
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 159

1998 1000 3 609 $628x0.97


Cuadro 9.3 Ajuste por inflación 1999 1000 2 590 $609x0.97

Expresado en dólares de 1990 2000 1000 2 579 $590x0.98

Año ps Tasa de %) 1990$


inflación (
Expresado en 2000 dólares

1990 1000 8 1000


Año S Tasa de inflación (%) 2000$

$ 1000x0.92 (es decir,


1991 1000 8 920 1990 1000 8 1673 $1549x1.08
100-8%)
1991 1000 8 1549 $1434x1.06
1992 1000 6 846 $920x0.92(es decir, 100-8%)
1992 1000 6 1434 $1353x1.06
1993 1000 8 796 $846x0.94(es decir, 100-6%)
1993 1000 8 1353 $1253x1.08
1994 1000 5 732 $796x0.92
1994 1000 5 1253 $1193x1.05
1995 1000 4 695 $732x0.95
1995 1000 4 1193 $1147x1.04
1996 1000 6 668 $695x0.96
1996 1000 6 1147 $1082x1.06
1997 1000 3 628 $668x0.94
1997 1000 3 1082 $1051x1.03

1998 1000 3 1051 $1020x1.03


expresado en dólares del año 2000. Por lo tanto, $ 1000 dólares del año 2000
1999 1000 2 1020 $ 1000x1.02 (es decir, 100 + 2%) comprarían $ 1673 en bienes si esos $ 1000 se gastaran en 1990.

2000 1000 2 1000 Estandarización: puntajes z y rango percentil Otra forma de ajustar los puntajes es
expresar todos los puntajes en términos de dónde se encuentran en una distribución.
Es decir, podemos estandarizar puntajes y, en lugar de observar cambios en valores
absolutos, observamos cambios en el puntaje de una persona en relación con otras
personas (ver Marsh, 1988 para una discusión accesible de una variedad de métodos
el instrumento puede cambiar (por ejemplo, es posible que sea necesario cambiar las preguntas de estandarización). en los cambios en el lugar donde se encuentra una persona en
para que coincidan con la edad o la etapa de vida de los encuestados). Para otras variables, una distribución. Al observar el cambio, en términos relativos en lugar de absolutos,
como el ingreso, donde el significado de las categorías cambia (por ejemplo, el ingreso debe solo consideraríamos que una persona cambió si cambió su posición en relación con
ajustarse por inflación), la variable en sí debe reescalarse para que las medidas sean los demás, es decir, se movió más (o menos) que otras personas. Para expresar el
comparables a lo largo del tiempo. cambio en una variable dependiente de nivel de intervalo en términos relativos,
podemos expresar la puntuación de cada persona en la onda 1 y la onda 2 como una
Por ejemplo, podemos estar observando los cambios en los ingresos entre hombres y
puntuación z. Con una variable dependiente ordinal, podemos usar el rango percentil
mujeres entre 1990 y 2000. Antes de que podamos hacer comparaciones significativas entre los
de una persona. Luego mediríamos el cambio observando los cambios en las
niveles de ingresos en 1990 y 2000, necesitamos saber cuánto vale la misma cantidad de
puntuaciones z o el rango percentil.
dólares a lo largo del tiempo, después de ajustar por inflación. Debido a la inflación $1000 en
1990 no es el equivalente de $1000 en el año 2000. En la Tabla 9.3 el ingreso se ha ajustado Por ejemplo, si estuviéramos observando los cambios en los ingresos a lo largo del
por la tasa de inflación. El ingreso en cada año se ha expresado en dólares de 1990. Así, tiempo, podríamos convertir los ingresos de cada persona en un puntaje z que nos
después de los ajustes por inflación, $1000 en 2000 es el equivalente de sólo $579 en dólares informaría sobre los ingresos de esa persona en relación con los ingresos de otras
de 1990 después de la inflación. En el segundo ejemplo, se han hecho los cálculos opuestos personas. Si tuviéramos estos puntajes z para las mismas personas durante dos
con el valor de $1000 en cada año siendo ondas pudimos identificar aquellos cuyo puntaje z aumentó y aquellos para quienes
disminuyó. También pudimos cuantificar cuánto cambió la posición relativa de
ingresos de la persona (Tabla 9.4). Alternativamente, podríamos calcular su rango
percentil en las apuestas de ingresos y ver cómo cambiaron con el tiempo en el rango.
Este método de medir el cambio en términos relativos es valioso cuando necesitamos
ajustar los cambios en la forma en que se mide la variable dependiente a lo largo del
tiempo. Sin embargo, es un método que se puede usar incluso cuando no
necesitamos ajustar el forma en que se mide la variable.

Dado que el puntaje z indica el número de desviaciones estándar que una persona
se encuentra por encima o por debajo de la media de la muestra, podemos comparar
de manera útil los cambios en su posición a lo largo del tiempo. En la tabla 9.4, el caso
1 permanece por debajo de la media de la muestra en el ciclo 2, pero se ha acercado.
El caso 2 se ha deteriorado en relación con los demás en 0,4 de desviación estándar.
El caso 7 ha mejorado considerablemente su posición relativa. Mediante el uso de
puntajes z, ajustamos automáticamente las diferencias en el ingreso real debido a la
inflación y el aumento general en el ingreso medio. Este enfoque nos permite
centrarnos en los cambios en el desempeño de las personas en relación con los
demás.

Alternativamente, podríamos examinar el cambio relativo de los individuos


examinando el cambio de rango (Tabla 9.5). Esto es comparable a observar los
cambios en las puntuaciones z, pero no cuantifica la cantidad de diferencia entre los
individuos. Por lo tanto, es útil con variables dependientes de nivel ordinal. En la tabla
9.5, la posición relativa del caso 1 ha mejorado, la del caso 7 se ha deteriorado drásticamente mientras que la del caso 9 ha mejorado notablemente.
160
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 161

6 $28,000 2 $33,000 2

Cuadro 9.4 Cambios en las puntuaciones z de las personas 7 $45,000 8 $39,000 3

Puntuación puntuación Puntuación puntuación 8 $42,000 7 $69,000 10


Caso z z Cambiar en
bruta bruta
9 $33,000 3 $49,000 7

1990 (ingresos) 1990 2000 (ingresos) 2000 puntuación z


10 $55,000 9 $60,000 8

1 (mujer) $35,000 -0.38 $45,000 -0.18 0.20

2 (masculino) $40,000 0.04 $41,000 -0.48 -0.52 También podemos usar puntajes z (o rango percentil) para ver si algunos grupos
3 (femenino) $20,000 -1.64 $32,000 -1.16 0.48 cambian más que otros. Por ejemplo, si examináramos si la brecha de ingresos entre
hombres y mujeres se había reducido entre 1990 y 2000, podríamos obtener las
4 (masculino) $60,000 1.72 $65,000 1.35 -0.37 puntuaciones z de todos los hombres y todas las mujeres en el ciclo 1 (de una
5 (femenino) $37,000 -0.21 $40,000 -0.56 -0.35
muestra conjunta de hombres y mujeres) y hacer mismo en el relevamiento 2. Al usar
el análisis de nivel agregado, podríamos ver si el puntaje z promedio de los hombres
6 (femenino) $28,000 -0.96 $33,000 -1.09 -0.13 en el relevamiento 2 ha cambiado más que el puntaje z promedio de las mujeres en el
relevamiento 2. En la Tabla 9.6, las mujeres, en promedio, han un ingreso de 0,75
7 (masculino) $45,000 0.46 $39,000 -0.63 -1.09
(1990) y 0,57 (2000) desviaciones estándar por debajo de la media, mientras que los
8 (masculino) $42,000 0.21 $69,000 1,65 1.44 hombres, en promedio, tienen un ingreso de 0,75 (1990) y 0,57 (2000) desviaciones
estándar por encima de la media. se ha reducido ligeramente entre 1990 y 2000.
9 (femenino) $33,000 -0.55 $49,000 0.13 0,68

10 (masculino) $55,000 1.30 $60,000 0.97 -0.33 Otro enfoque para ajustar por 'inflación' u otro cambio en el tiempo es cambiar los
valores en proporciones (Cuadro 9.7). Las cifras absolutas podrían indicar una
Significar $39,500 $47,300 ampliación de la brecha de ingresos entre hombres y mujeres.

Desviación Estándar $11,918 $13,140

Cuadro 9.5 Cambios medidos por cambios de rango


Caso Puntuación bruta Rango Puntuación bruta Rango

1990 (ingresos) 2000 (ingresos)

1 $35,000 4 $45,000 6

2 $40,000 6 $41,000 5

3 $20,000 1 $32,000 1

4 $60,000 10 $65,000 9

5 $37,000 5 $40,000 4
perceptores de ingresos del 25 por ciento superior ganaban 7,7 veces más que el
perceptor medio de ingresos del 25 por ciento inferior.
Tabla 9.6 Puntuación z media para hombres y mujeres,
EXPLICACIÓN DEL CAMBIO
1990-2000
Suponiendo que se hayan abordado los problemas de cómo medir el cambio y que
1990 2000 Cambio estemos razonablemente seguros de que se está midiendo el cambio real,
probablemente también querremos explicar el cambio.
machos 0.75 0.57 -0.18
Las teorías y proposiciones en torno a las cuales se diseña la investigación
Hembras -0.75 -0.57 +0.18
proporcionarán orientación sobre cómo probar las explicaciones.

Cuadro 9.7 Ingresos femeninos como proporción de los ingresos masculinos

Año columna 1 columna 2 columna 3 columna 4

FT promedio FT promedio Mujer como proporción de Absoluto

hombre$ pa hembra $ pa hombre (columna 2/columna 1) $brecha

1970 $5,000 $3,400 0,68 -$1,600

1980 $15,000 $10,500 0.70 -$4,500

1990 $25,000 $18,000 0.72 -$7,000

2000 $35,000 $26,950 0.77 -$8,005

Por ejemplo, la brecha de ingreso promedio en el ingreso semanal entre hombres y mujeres
podría haber sido de $25 en 1970. En 2000, esto podría haber aumentado a $150 por
semana. Sin embargo, los dólares de 1970 no son comparables con los de 2000. Podríamos
usar cualquiera de los enfoques anteriores para hacer los ajustes necesarios para facilitar la
comparación. Alternativamente, podríamos expresar los ingresos de las mujeres como una
proporción de los ingresos de los hombres en cada año. De esta forma eliminamos
automáticamente el efecto de la inflación. Así, aunque la brecha en dólares entre los ingresos
promedio de hombres y mujeres está aumentando en la Tabla 9.7, la posición relativa de las
mujeres está mejorando.

También podemos abordar el problema de la estandarización adoptando alguna otra base.


Por ejemplo, podríamos querer ver si la brecha de ingresos se está ampliando entre las
personas con ingresos más bajos y más altos. Podríamos tomar el 25 por ciento inferior de
los perceptores de ingresos y expresar su ingreso promedio como una proporción del ingreso
promedio del 25 por ciento superior. En este ejemplo, vemos en la Tabla 9.8 que en 1970 el
25 por ciento superior de los perceptores de ingresos, en promedio, ganaba cinco veces más
que el promedio del 25 por ciento inferior de los perceptores de ingresos. En este ejemplo
hipotético, la disparidad aumenta a lo largo de los años, de modo que para el año 2000 los
wum cuartil de ingresos como utilizando una forma u otra de análisis multivariante. Esta estrategia nos permite
eliminar los efectos de las diferencias conocidas entre los grupos. Una vez que se
proporción del cuartil superior de ingresos establece que los grupos son similares en los aspectos especificados, entonces es
proporción del cuartil superior de ingresos posible establecer cuánto difieren los grupos con respecto a los cambios de
autoestima. La lógica y las técnicas de este enfoque se discutirán con más detalle en
Año columna 1 columna 2 el Capítulo 12.

Promedio Promedio 25% inferior como

proporción del 25%


ingreso de ingresos de
superior

25% inferior 25% superior (columna 2/columna 1)

1970 $2,000 $10,000 5.0

1980 $5,000 $30,000 6.0

1990 $8,000 $60,000 7.5

2000 $11,000 $85,000 7.7

Sin embargo, el problema de cualquier explicación es que no podemos estar seguros de qué
factores han producido el cambio. Debido a que carecemos del nivel de control de un diseño
experimental, cualquier cambio podría deberse a factores desconocidos que ocurrieron entre
las olas.

Al explicar el cambio, el análisis se basará en la comparación de diferentes grupos de


personas. Veremos si el alcance y la naturaleza del cambio en un grupo son diferentes de
otros grupos. Cualquier diferencia en los patrones de cambio de los grupos se atribuye a
otras diferencias que puedan existir entre los grupos. Tomemos, por ejemplo, un estudio que
examina el impacto del empleo remunerado en la autoestima de los jóvenes. Utilizando un
diseño de panel, podríamos medir la autoestima en dos o más oleadas. Para probar el efecto
del empleo en la autoestima, identificaríamos a los jóvenes que obtuvieron empleo entre
oleadas, los que quedaron desempleados, los que permanecieron empleados y los quienes
han permanecido desempleados. Podríamos encontrar que aquellos que obtuvieron empleo
mostraron una mejora real en la autoestima, y aquellos que perdieron su trabajo mostraron
una pérdida en la autoestima, mientras que los empleados estables y los desempleados no
mostraron autoestima. cambios en la autoestima. Sería tentador concluir que son las
diferencias en el empleo las que explican los diferentes cambios en la autoestima de los
grupos.

El problema, sin embargo, es que no sabemos que los cambios en la situación laboral son
los únicos cambios que están experimentando estas personas. Tampoco sabemos que los
cuatro grupos sean comparables en otros aspectos (p. ej., género, edad y educación). En los
diseños experimentales, este problema se maneja mediante la asignación aleatoria a grupos.
Por lo general, en los diseños de paneles esto no es posible.

La principal forma de responder al problema de la comparabilidad es utilizar controles


estadísticos para establecer la comparabilidad entre los grupos. Este objetivo se puede lograr
habitantes de 15 años o más. Sin embargo, el eje Y podría haber indicado el
Describiendo el cambio número de divorcios o alguna otra forma de indicar la prevalencia del
Una vez que se ha conceptualizado y medido el cambio, se deben tomar decisiones divorcio.
sobre cómo representar este cambio. Hay varias formas matemáticas y estadísticas La figura 9.1 proporciona datos de tendencia para h-
de hacer esto (Menard, 1991: 49ff), pero aquí solo mencionaré brevemente algunas
formas de mostrar el cambio en forma tabular y gráfica. granhe~-

Mesas
El cambio a lo largo del tiempo se puede presentar de manera efectiva en forma
tabular. La forma particular dependerá de la cantidad de puntos de tiempo en los
que se realiza un seguimiento del cambio y si el cambio se considera a nivel
agregado o individual.

Las tablas anteriores proporcionan ilustraciones de algunas de las formas en que


las tablas pueden mostrar el cambio. Estas tablas suelen tener años en un eje, ya
sea en la parte superior (p. ej., tablas sobre análisis de cohortes en el Capítulo 12) o
al costado (p. ej., tablas 9.3, 9.7). y 9.8). La forma en que se indica el cambio variará
dependiendo de si se está considerando un cambio agregado o individual. Algunas
de las formas posibles de informar el cambio se proporcionan en la Tabla 9.9.

Cuando se trata de cambios a nivel individual, se aplican enfoques similares. Los


períodos durante los cuales se realiza un seguimiento del cambio individual (por
ejemplo, año) se indicarán en la parte superior de la tabla o en el lateral. El otro eje
representará la forma particular en que el individuo el cambio está siendo
conceptualizado. Una vez más, es posible una amplia gama de formas posibles de
representar el cambio individual. Algunos enfoques comunes se ilustran en la Tabla
9.10.

gráficos

Los gráficos son una buena manera de representar el cambio. El tipo de gráfico más
común para mostrar el cambio es el gráfico de tendencia. Esta sección
proporcionará una breve introducción a los gráficos de tendencia. En Henry (1995)
se puede encontrar una discusión más completa de estos gráficos y otras formas de
mostrar el cambio gráficamente.

El gráfico de tendencia simple tendrá dos ejes: el eje X en la parte inferior y el eje
Y en el costado. El eje X representará el tiempo, mientras que el eje Y reflejará una
cantidad en la variable que se está examinando para ver si cambia. . La figura 9.1
ilustra un gráfico de tendencia simple.

El eje Y se puede medir utilizando una amplia gama de unidades de medida. En


la Figura 9.1 se mide como una tasa: el número de divorcios por cada 1000
164
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 165

Año
Cuadro 9.9 Ejemplos de formas tabulares de presentar datos sobre cambios
agregados 1998-9 2000-1 2002-3

Año
% mejorado (de

1998-9 2000-1 2002-3


periodo anterior) 5% 15% 2%

Significar 5 10 15
%estable 85% 80% 78%
Diferencia 80 80 80 10% 5%
%rechazado 20%

% de cambio (en % cambio 15% 20% 22%


100% 50%
promedio)
% cambiando por X cantidad 10% 5% 7,5%

Mejora media

de mejoradores 25 puntos 35 puntos 40 puntos

Disminución media de los


10 puntos 10 puntos 10 puntos
declinantes

La figura 9.2 muestra las diferentes tendencias en los niveles de empleo para
del periodo anterior
hombres y mujeres de 55 a 59 años durante los años 1975 a 2010 y las compara con
Velocidad 12 por 1000 12,8 por 1000 13,6 por 1000 las tendencias generales para el grupo de edad. Al informar las tendencias por
separado para los diferentes subgrupos (hombres y mujeres), podemos obtener una
Brechas (por ejemplo, imagen más detallada que la que proporciona la línea de tendencia para el grupo de
$10,000 $7,500 $5,000
entre
edad en su conjunto.

hombre y mujer La forma en que se escalan el eje X y el eje Y puede distorsionar la tendencia de
los datos. Cada gráfico de la Figura 9.3 tiene la misma información que la Figura 9.2,
ingreso promedio) pero estirar o contraer las escalas proporciona una impresión muy diferente de la
tendencia en los niveles de empleo de hombres y mujeres mayores. En la Figura
Proporción (por ejemplo, 9.3a, los cambios en los niveles de empleo parecen modestos porque la X -el eje se
0.80 0.82 0.84
mujer ha estirado y el eje Y se ha contraído. Esto tiene el efecto de aplanar la línea de
tendencia. En la Figura 9.3b el X-
ingreso promedio como

proporción de hombres

promedio)

Tabla 9.10 Ejemplos de formas tabulares de presentar datos sobre cambios


individuales (niveles de vida)
Figura 9.1 Tasa bruta de divorcios, Australia, 1970-1995 (de Vaus y Wolcott, 1997)

Figura 9.2 Tasa de empleo de personas de 55 a 59 años por género, Australia,


1975-2010 (real y prevista) (de Vaus y Wolcott, 1997)
166
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 167
Figura 9.4 Muertes por suicidio masculino y tasas de desempleo, 20-24 años,
Australia, 1966-90 (DHSH, 1995)

El eje se ha contraído y el eje Y se ha estirado, lo que tiene el efecto de exagerar la


tasa de cambio de la tendencia.

Figura 9.3 Tasa de empleo de personas de 55 a 59 años por sexo, Australia, 1975-2010 Las tendencias de múltiples variables se pueden trazar en el mismo gráfico, como
(real y prevista): (a) escala plana, (b) escala ampliada (de Vaus y Wolcott, 1997) se ilustra en la Figura 9.4. La figura grafica dos variables: tasa de suicidio y tasa de
desempleo de los jóvenes. En esta figura, la línea de tendencia para el suicidio de
personas de 20 a 24 años se ha trazado junto con las tasas de desempleo para los
mismos grupos de edad. Trazar líneas de tendencia de diferentes variables en el
mismo gráfico puede resaltar la forma en que las tendencias en diferentes variables co
-variar. Sin embargo, se debe tener cuidado de no asumir que esta covariación de
tendencias demuestra una relación causal.

En la figura 9.4, cada una de las variables se mide en la misma escala, por lo que
cada variable se puede trazar en el mismo eje Y. A veces es posible que deseemos
comparar tendencias en dos variables diferentes, cada una de las cuales se mide en
diferentes unidades de medida. En tal caso, podemos usar dos ejes Y, cada uno con
una escala de medición diferente. En la Figura 9.5, el eje Y de la izquierda (eje Y
primario) es la tasa de delitos graves por cada 500 000 habitantes, mientras que el eje Y (nacimientos de madres solteras). ). Otra vez,
de la derecha (eje Y secundario) representa el porcentaje de nacimientos exnupciales
168
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 169

surgen con la medición del cambio. Un problema importante es el problema


de la información faltante que es causado por la recopilación incompleta de
datos en algún punto de las múltiples oleadas de recopilación de datos de los
estudios longitudinales. Se describieron los diferentes tipos de datos
faltantes y se evaluaron las estrategias para tratar con los datos faltantes
durante el análisis de datos.

Figura 9.5 Nacimientos exnupciales y tasa de delitos graves, Australia, 1903-1993 (Sullivan et
al., 1997)

se debe tener mucho cuidado de no confundir tendencias similares con conexiones


causales.

Cuando un estudio longitudinal proporciona datos para solo dos puntos de tiempo
en lugar de datos de tendencias a largo plazo, normalmente será más apropiado
usar gráficos de barras para representar los dos puntos de tiempo (Figura 9.6). Para
tener simplemente dos puntos de tiempo y unirlos con un línea para formar un
gráfico de tendencia podría ser muy engañoso ya que esto podría ocultar las
variaciones en los años intermedios (ver Figura 9.1 para estas variaciones).

Resumen

Dado que un aspecto básico de los diseños longitudinales es describir y explicar el


cambio, el enfoque de este capítulo se ha centrado en los problemas de análisis que
del tiempo para que se pueda identificar un cambio real. Se describieron diferentes
estrategias de estandarización.

Nota
1 También puede ocurrir en diseños experimentales, pero se puede evitar
adoptando un diseño aleatorio sin una medida previa a la prueba.

Figura 9.6 Tasa bruta de divorcios, Australia, 1970 y 1995 (de Vaus y Wolcott, 1997)

Cuando se mide el cambio, es importante distinguir entre el cambio a nivel agregado y el


cambio a nivel individual. Se ha discutido esta distinción y se han considerado sus
implicaciones para las estrategias de análisis. Se han identificado problemas para detectar
cambios de manera confiable y algunas formas de reducirlos. se han esbozado los problemas.
Finalmente, el capítulo ha discutido la necesidad de estandarizar algunas medidas a lo largo
DISEÑO TRANSVERSAL

Los diseños transversales tienen tres características distintivas: no tienen


dimensión temporal; se basan en las diferencias existentes en lugar de
cambiar después de la intervención; y grupos basados en las diferencias
PARTE IV existentes en lugar de una asignación aleatoria.

DISEÑOS TRANSVERSALES Sin dimensión temporal

En el diseño transversal estándar, los datos se recopilan en un momento dado. En


este sentido, este diseño difiere de los diseños de panel estándar y de los diseños
10 experimentales previos y posteriores a la prueba en los que los datos se recopilan en
varios momentos diferentes. Como tal, el diseño transversal solo puede medir las
diferencias entre los grupos en lugar del cambio.
DISEÑO TRANSVERSAL La distinción entre medir la diferencia y medir el cambio es importante y se puede
aclarar con un ejemplo (Figura 10.1). Supongamos que queremos aprender sobre el
impacto de los niños en la felicidad marital. Un diseño de panel rastrearía a las
personas a lo largo del tiempo. Comenzaría con un grupo de parejas casadas sin hijos
y mediría su felicidad marital. Cinco años después de la ola inicial del estudio, podríamos volver a
visitar la muestra y volver a medir su nivel de felicidad conyugal. Para entonces, algunas parejas Grupos Tiempo 1 (T1) 'Intervención' Tiempo 2 (T2)
habrán tenido hijos y otras no. Algunas parejas habrán tenido su primer hijo recientemente
(digamos en el último año) mientras que otras habrán tenido su primer hijo antes (entre 1 y 5 años (X)
Prueba inicial Cinco años
atrás). Entonces podríamos pensar en términos de tres grupos: los sin hijos, los nuevos padres
(primer hijo dentro del último año) y los padres establecidos (primer hijo entre uno y cinco años de después
edad). El análisis podría consistir en observar el grado de cambio en la felicidad marital de los tres
grupos 1 Nivel de Sin hijos Nivel de
matrimonio matrimonio

felicidad felicidad

(Y)

2 Nivel de tener primer hijo Nivel de


matrimonio matrimonio
en los últimos 12
felicidad felicidad
meses
(Y)

3 Nivel de tener primer hijo Nivel de


matrimonio matrimonio
entre 12 y 60
felicidad felicidad
meses antes
(Y)

Figura 10.1 Diseño transversal: felicidad marital por estado de paternidad

entre la onda 1 y la onda 2. Las diferentes cantidades de cambio en la felicidad marital


de los tres grupos podrían reflejar el efecto de la paternidad.

Un diseño transversal para la misma pregunta de investigación implicaría un estudio


único en el que midiéramos los niveles de felicidad conyugal de las parejas, si tenían
hijos y, de ser así, la edad de su hijo mayor.Uso de esta información podríamos crear
tres grupos: aquellos sin hijos, aquellos cuyo hijo mayor tenía menos de 12 meses y
aquellos cuyo hijo mayor tenía entre uno y cinco años. Luego podríamos comparar el
nivel de felicidad conyugal de los tres grupos para ver si hay alguna diferencia Si
hubiera alguna diferencia, podríamos sentirnos tentados a atribuirla al efecto sobre la
felicidad marital de tener hijos.

Esencialmente, la diferencia entre los dos diseños es que el diseño de panel nos
permite comparar grupos en términos de diferentes cantidades de cambio en la
variable dependiente, mientras que el diseño transversal implica comparar los grupos
simplemente en términos de diferencia en la variable dependiente.

Confianza en las diferencias existentes


Debido a que el diseño transversal implica la recopilación de datos en un punto del tiempo y con diferencia del diseño del panel, el diseño transversal
respecto a él, todo análisis se basa en las diferencias en la muestra en ese punto del tiempo. A
172
DISEÑOS TRANSVERSALES DISEÑO TRANSVERSAL 173

la variable independiente. La información sobre esto y la medida de


no permite que surjan diferencias con el tiempo. A diferencia del diseño resultado se recopila en el mismo momento.
experimental, donde hay una intervención activa del investigador para producir
Los diseños transversales no se limitan a comparaciones entre solo dos o
cambios o crear diferencias, el diseño transversal se basa en las diferencias
tres grupos. El número de categorías de los independientes.
existentes en lugar de examinar el impacto de las intervenciones experimentales. .

Los diseños transversales emplean un enfoque relativamente pasivo para hacer


inferencias causales (Marsh, 1982:6) y pueden distinguirse de los experimentos en
este sentido. Al igual que los diseños transversales, los experimentos explican la
variación en la variable dependiente al ver si esta variación está sistemáticamente
vinculado a la variación en la variable independiente. ¿La variación en la felicidad
marital se corresponde con las variaciones en el estado de paternidad? Sin
embargo, los experimentos crean activamente una variación en la variable
independiente, mientras que los diseños transversales se basan en las diferencias
existentes.

La naturaleza de los 'grupos' en el diseño transversal


El diseño experimental se basa en la comparación de grupos. Los individuos se
asignan aleatoriamente a los grupos para que antes de cualquier intervención
experimental los dos grupos sean idénticos. El investigador produce activamente
diferencias entre los grupos mediante una intervención deliberada y controlada.
Esta intervención es la variable independiente en el diseño experimental.
Idealmente, este tratamiento diferencial es la única diferencia entre los grupos y,
por lo tanto, cualquier diferencia de grupo con respecto a la variable de resultado
debe atribuirse a esta intervención diferencial.

En el diseño transversal, los 'grupos' se construyen a partir de las diferencias


existentes en la muestra. La muestra se divide en grupos según la categoría de la
variable independiente a la que pertenecen. En el ejemplo anterior, los grupos de
comparación serían aquellos sin hijos, aquellos cuyo hijo mayor tenía menos de 12
meses y aquellos cuyo hijo mayor tenía entre uno y cinco años. El punto crítico, sin
embargo, es que debido a que debemos confiar sobre las diferencias existentes no
puede haber una asignación aleatoria a los grupos. Los grupos pueden muy bien
ser diferentes en otros aspectos además de la categoría de la variable
independiente a la que pertenecen. Esto, a su vez, puede dificultar determinar si las
diferencias de grupo en la variable de resultado se deben a la variable
independiente oa otras diferencias relacionadas entre los grupos.

Usando el marco del diseño experimental clásico como marco de referencia, el


diseño transversal puede representarse en forma de diagrama como en la Figura
10.2. En este caso, la 'intervención' simplemente está en una categoría diferente de
todos los niveles (o grupos) de edad y vemos si el ingreso varía sistemáticamente
entre los niveles de edad.
Método de asignación 'Pre-prueba' 'Intervención' 'Post-prueba'

a 'grupos' En resumen, los diseños transversales difieren de los diseños experimentales y de


(X)
panel en que no tienen una dimensión temporal. En consecuencia, enfrentan
dificultades para identificar sin ambigüedades la secuencia temporal de los eventos.
Debido a esto, enfrentan el problema de identificar la dirección causal. Además,
No aleatorio Ninguna Existente medir en
debido a que los diseños transversales se basan en las diferencias existentes en lugar
característica variable de de la asignación aleatoria, cualquier efecto aparente de la variable independiente
resultado puede deberse de hecho a otras diferencias no controladas entre los grupos. Los
(Xa) problemas creados por esto se discutirán con más detalle en la sección de problemas
(Y) metodológicos del Capítulo 11.

No aleatorio Ninguna Diferentes medir en


existentes Obtención de una dimensión temporal: estudios transversales repetidos
variable de
característica resultado Los diseños transversales son frecuentemente criticados por carecer de una
dimensión temporal. Debido a esta deficiencia, no pueden establecer sin
(X) (Y) ambigüedades la secuencia temporal en la que ocurren los eventos. Esto es
particularmente un problema con los estudios transversales únicos. Sin embargo, el
diseño transversal repetido aborda este problema hasta cierto punto.
Figura 10.2 Grupos en diseños transversales
Este diseño implica recopilar información en varios puntos de tiempo diferentes
pero de una muestra diferente en cada punto de tiempo. En lugar de seguir a un grupo
variable determina el número de 'grupos'. A menudo, observamos la correlación entre de individuos a lo largo del tiempo y ver cómo cambian esos individuos, el diseño
variables continuas como, por ejemplo, la edad y el nivel de ingresos. Al observar tal transversal repetido obtiene muestras comparables en cada momento. Mientras se
correlación, nos preguntamos si los ingresos varían según la edad. Es decir, comparamos hagan las mismas preguntas en
174
DISEÑOS TRANSVERSALES DISEÑO TRANSVERSAL 175

T1 T2 T3 T4 ts T6 El censo nacional de cada país es un claro ejemplo de este tipo de 'diseño'. En la


medida en que se hagan las mismas preguntas en cada censo, los cambios se
pueden rastrear durante largos períodos. Muchos países tienen encuestas sociales
Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 nacionales regulares que rastrean una gama mucho más amplia de asuntos que
cualquier censo nacional. En los Estados Unidos, la Encuesta Social General se lleva
a cabo anualmente desde 1972 y proporciona una excelente manera de observar los
Cuestiona pregunta un pregunta un pregunta un pregunta un pregunta un cambios en el comportamiento, las creencias, los valores y las actitudes durante el
último cuarto de siglo. En Gran Bretaña, la Encuesta británica de actitudes sociales se
utiliza para lograr un fin similar. La Encuesta general de hogares proporciona datos de
pregunta b pregunta b pregunta b pregunta b pregunta b pregunta b dos décadas y la Encuesta de gastos familiares proporciona datos de series
temporales de más de 30 años. La Encuesta internacional de ciencias sociales
pregunta c implica formular un núcleo similar de preguntas. cada año a nuevas muestras en cada
pregunta c pregunta c pregunta c pregunta c pregunta c uno de los países miembros del Programa Internacional de Ciencias Sociales (35
países en 2000). Las encuestas transversales repetidas brindan una excelente
pregunta d instantánea de los valores en diferentes puntos en un período de cambio rápido.
pregunta d pregunta d pregunta d pregunta d pregunta d
Esquemáticamente, el diseño transversal repetido se puede representar como una
serie de muestras independientes (Figura 10.3). Cada punto de tiempo se basa en
Figura 10.3 Diseño transversal repetido
una nueva muestra. Por lo general, cada muestra proporcionará una amplia sección
transversal de casos para que se pueda realizar un análisis transversal útil dentro de
cada una de estas muestras transversales independientes podemos construir una imagen a lo
largo del tiempo de cualquier variable que tengamos.
cada muestra. un grupo de edad incluyen una amplia gama de edades para que en cualquier
momento dado se puedan examinar las diferencias de edad).
Se utilizan para el análisis de cohortes. Permiten al investigador realizar un
Si bien este diseño no permite el seguimiento de los cambios individuales a lo largo del seguimiento del cambio y obtener una cierta comprensión de la naturaleza del
tiempo, permite el análisis longitudinal a nivel agregado (consulte el Capítulo 9). Además, estos cambio. El análisis de cohortes se analizará en el Capítulo 12.
estudios transversales repetidos pueden ser
Los diseños de medidas repetidas pueden adoptar dos formas: prospectivo y
retrospectivo. Un diseño prospectivo es aquel en el que comenzamos ahora y
repetimos el estudio en varios puntos en el futuro. El diseño retrospectivo de medidas
repetidas se basa en conjuntos de datos existentes para examinar los patrones de
cambio hasta el momento actual. En este momento podríamos usar las Encuestas
Sociales Generales de los últimos 25 años para examinar los patrones de cambio. Los
datos del censo recopilados en los últimos años pueden analizarse de manera similar
a muchos otros conjuntos de datos que se recopilan de manera rutinaria (estadísticas
de divorcios anuales, datos de matrimonios, etc.). , estadísticas de fecundidad).

PROBLEMAS EN EL DISEÑO TRANSVERSAL

Como se argumentará más adelante, el análisis adecuado que usa controles


estadísticos permite que los datos transversales proporcionen información valiosa
sobre procesos causales y para probar modelos causales.
11 Sin embargo, hay una serie de problemas metodológicos y prácticos que debemos
tener en cuenta al usar diseños transversales. El conocimiento de estos problemas
debería ayudar a minimizar las deficiencias de este diseño.
CUESTIONES EN SECCIÓN TRANSVERSAL
Problemas metodológicos
DISEÑO
Validez interna

Encontramos problemas con la validez interna cuando la lógica y la


estructura del diseño no nos permiten elegir sin ambigüedad una explicación
de nuestros resultados sobre otra explicación. Campbell y Stanley (1963)
Los diseños transversales son probablemente los diseños más utilizados en la han identificado una serie de factores que amenazan la validez interna y
investigación social. Una de las razones de esta popularidad es que permiten al estos se han discutido en detalle en los Capítulos 5 y 8 en relación con los
investigador obtener resultados con relativa rapidez. Dado que los datos se diseños longitudinales y experimentales.
recopilan en un momento dado, no es necesario esperar varias etapas de
seguimiento o intervenciones antes de analizar los datos. También es cierto que, en
igualdad de condiciones (por ejemplo, tamaño de la muestra, población, tipo de
muestra), los diseños transversales son más rentables que los diseños
experimentales y longitudinales comparables. Esto se debe a que los diseños
transversales no implican el costo de los datos repetidos. colecciones, seguimiento
de encuestados o de intervenciones experimentales.

Los diseños transversales pueden ser ideales para el análisis descriptivo. Si simplemente
queremos describir las características de una población, sus actitudes, su intención de voto o
sus patrones de compra, la encuesta transversal es la forma más satisfactoria de obtener esta
información descriptiva. Pero los diseños transversales no se limitan a análisis descriptivo.
el (Blalock, 1964). En el Capítulo 10 introduje un ejemplo del efecto del
estado de paternidad (no tener hijos; el hijo mayor menor de un año y el hijo
Sin embargo, la mayoría de estas amenazas (historia, maduración, deterioro del mayor entre 1 y 5 años) y la felicidad conyugal. Incluso si los tres grupos
instrumento, regresión estadística, mortalidad y efectos de las pruebas) surgen debido al diferían en términos de felicidad conyugal, tendríamos dificultades para
elemento de tiempo extra de estos diseños. No son problemas con los diseños transversales. determinar si esta diferencia se debió a su diferente estado de paternidad.
Las principales amenazas a la validez interna de los diseños transversales provienen de dos
Es probable que los tres grupos difieran en otras formas además de su
fuentes: problemas para establecer la causa sin una dimensión temporal; y problemas en el
nivel de significado (Marsh, 1982). Los problemas en el nivel de causa son, por supuesto, un
estado de paternidad: cuánto tiempo han estado juntos, su perfil de edad,
problema con cualquier diseño, pero los diseños transversales son particularmente propensos nivel de participación de la fuerza laboral, etc. Estas diferencias, más que el
a problemas en este nivel. Los problemas en el nivel de significado son también comunes a estado de paternidad, podrían explicar las diferencias en la felicidad marital.
todos los diseños y surgen con igual fuerza para diseños experimentales, longitudinales y
CONTROLES ESTADÍSTICOS
transversales.

Marsh (1982) ha escrito con claridad y contundencia sobre estos dos problemas. Este problema de las variables de confusión se aborda en los diseños
Ella está en desacuerdo con aquellos que descartan los diseños de encuestas transversales en la etapa de análisis de datos en lugar de en la etapa de
transversales debido a sus supuestos problemas de causalidad y significado. Ella recopilación de datos como ocurre en los diseños experimentales. La
argumenta que este diseño no es tan defectuoso como se presenta con frecuencia. solución se logra haciendo que los grupos sean lo más similares posible
La siguiente discusión se basa en el argumento de Marsh. mediante la eliminación estadística de las diferencias entre los grupos
después de que se hayan recopilado los datos. equal necesitamos eliminar
ESTABLECIMIENTO DE CAUSALIDAD Y CONTROL DE CONFUSIÓN tantas diferencias como sea posible y comparar iguales con iguales.
VARIABLES En el Capítulo 12 se discutirá un esquema de cómo se hace esto. Sin
embargo, la lógica básica puede introducirse ahora. Para el ejemplo de los
No se puede negar que los estudios transversales enfrentan problemas para
niños y la felicidad marital, compararíamos la felicidad marital de
identificar variables causales. Aunque dos variables ordenadas en el tiempo pueden
estar correlacionadas o los grupos pueden diferir en una variable de resultado, no
podemos estar seguros de que estas diferencias se deban a un vínculo causal entre
DISEÑOS TRANSVERSALES
PROBLEMAS EN EL DISEÑO 179
TRANSVERSAL

diferentes perfiles de edad de los tres grupos. La lógica de esto es similar a la


tres grupos: los que no tienen hijos, los que tienen el hijo mayor menor de un año y los lógica de emparejamiento de grupos que a veces se usa en diseños
que tienen entre 1 y 5 años el hijo mayor. Alguien podría decir que las diferencias en la experimentales.
felicidad conyugal no se deben a los hijos sino a las diferentes perfiles de edad de los
Cuantas más variables se controlen estadísticamente, más podemos estar
tres grupos de padres. Argumentan que los que tienen más tiempo de padres son, en
seguros de que la relación final que encontramos entre X e Y refleja una relación
promedio, mayores que los que no tienen hijos. Argumentan que es la edad de las
causal entre X e Y.
parejas, no la presencia de los hijos, lo que influye en la felicidad conyugal.
El problema con esto, sin embargo, es que solo podemos controlar las
Podemos probar esta posibilidad eliminando las diferencias de edad de nuestras
variables en las que hemos pensado y sobre las que tenemos información. La
comparaciones. Podemos hacer una serie de comparaciones restringidas. En primer
asignación aleatoria en un diseño experimental controla efectivamente todas las
lugar, podríamos observar a personas de entre 20 y 24 años y ver si dentro de este grupo
variables, conocidas y desconocidas. Cuando controlamos las variables
de edad en particular, la felicidad conyugal de los tres grupos difería. Es decir,
estadísticamente en la etapa de análisis de datos, nunca podemos estar seguros
restringimos nuestra comparación entre los tres grupos a aquellos que tienen la misma
de haber controlado todas las variables relevantes. Siempre existe la posibilidad
edad. Podríamos repetir esta comparación por separado dentro de cada grupo de edad
de que alguna La relación que hemos encontrado entre X e Y podría deberse a
(por ejemplo, 25-29, 30-34, 35-39). Supongamos que encontramos que, dentro de En
alguna variable no controlada.
cada grupo de edad, todavía hay diferencias en la felicidad marital entre los grupos (es
decir, entre los que no tienen hijos, los nuevos padres y los que tienen un hijo de 1 a 5 Pero esto no es para condenar los diseños transversales como inútiles para
años) a pesar de sus perfiles de edad comparables. Entonces, al menos podemos decir explorar las relaciones causales. De hecho, dado que en la investigación de las
que esta relación entre la felicidad conyugal y el estado de paternidad no se debe a los ciencias sociales nuestra capacidad para intervenir de manera práctica o ética y
para manipular situaciones según lo requieran los diseños experimentales es limitada, a
menudo hay pocas alternativas, si es que hay alguna, a los diseños transversales.

En lugar de rechazar los diseños transversales por ser inútiles para el análisis causal, modelo 1
debemos proceder sistemática y cuidadosamente con el análisis y controlar
estadísticamente los factores que podrían explicar plausiblemente las correlaciones que
observamos. Además, debemos recordarnos constantemente la naturaleza tentativa de
cualquier conclusión que extraigamos en cualquier esfuerzo científico.
modelo 2
Aunque encontrar que dos variables están correlacionadas no establece la causa, sí
significa que es posible una explicación causal. como pantano

modelo 3

Figura 11.1 Tres modelos causales del rendimiento académico del niño

argumenta, 'encontrar una correlación entre fumar y el cáncer de pulmón de


ninguna manera prueba que fumar cause cáncer de pulmón, pero sí significa
que la hipótesis no se puede descartar'. (1982: 73).
ELIMINAR LAS VARIABLES COMO CAUSAS

Los datos transversales pueden ayudar a establecer que no existen relaciones


causales. Si bien es cierto que una correlación entre dos variables no establece
causalidad, es un requisito previo para establecer una relación causal. Si no hay
correlación podemos estar seguros de que no hay una relación causal.' La
eliminación de las variables como causas puede tener tanta importancia
científica como la localización de las causas. Ciertamente, los fabricantes de
tabaco considerarían un hallazgo de no correlación entre el tabaquismo y el
cáncer de pulmón como un hallazgo importante.
MODELOS: RAZONAMIENTO A PRIORI Y RAZONAMIENTO AD HOC

La forma más útil de realizar el análisis causal de los datos transversales es


dibujar modelos o diagramas de flujo o diagramas de ruta del tipo ilustrado en la
figura 11.1 y en otras partes de este libro. La tarea del analista de datos es
entonces evaluar qué tan bien estos modelos se ajustan a los datos.

El uso de teorías y modelos como guía para el análisis es una herramienta


importante para la persona que analiza datos transversales. 'Es el modelo que
se interpone entre el investigador y el empirismo desenfrenado en el intento de
sacar inferencias causales' (Marsh 1982: 72). Es importante desarrollar el
modelo antes de usar datos transversales para sacar conclusiones causales.
Hay una diferencia entre el razonamiento a priori y el razonamiento ad hoc. El razonamiento a priori consiste en proponer, sobre la base de teorías
180
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 181

consideraciones e investigaciones previas, que X causará Y y por lo tanto estará


correlacionado. Este razonamiento es independiente de los datos que podamos Incluso en aquellas circunstancias en las que no podemos desarrollar un
tener. El razonamiento ad hoc, por otro lado, es el proceso mediante el cual, sobre la nuevo estudio para establecer la dirección causal, podemos arrojar algo de
base de una correlación observada en nuestros datos, inventamos una historia causal luz sobre la dirección recopilando información retrospectiva y preguntando
de por qué existe la correlación. directamente a las personas sobre cualquier efecto que los niños puedan
haber tenido en su felicidad marital. datos inequívocos pero, poco a poco,
El problema con el razonamiento ad hoc es que siempre podemos inventar una historia construye una imagen con respecto a qué dirección causal es más probable.
independientemente de la correlación que encontremos. No es difícil pensar en una historia que
sea consistente con una correlación; es un asunto bastante diferente anticipar, sobre la base del Sin embargo, establecer la dirección causal no siempre es problemático.
razonamiento y la teoría, que debería existir una correlación y luego descubrir que existe. Algunas variables independientes son fijas (p. ej., género, raza), otras no
están fácilmente sujetas a nuestra manipulación (p. ej., edad, denominación
En resumen, los datos transversales pueden ser bastante efectivos para demostrar dónde
probablemente no existe una relación causal. Además, puede ayudar a evaluar cuál, de varios
religiosa) y para otras, los ordenamientos temporales son sencillos (p. ej., la
modelos a priori derivados teóricamente en competencia, se ajusta mejor a los datos. educación de los padres precede a educación del encuestado, el nivel de
Finalmente, podemos usar datos transversales para evaluar y modificar un modelo dado a priori. educación suele preceder al tipo de trabajo que obtenemos).
ADECUACIÓN A NIVEL DE SIGNIFICADO
Con un diseño adecuado, anticipándose a las explicaciones causales rivales en la medida de
lo posible y creando formas de probarlas, las encuestas [transversales] pueden proporcionar Al establecer explicaciones causales sobre la base de correlaciones, los
evidencia a favor y en contra de diferentes modelos causales. Sin embargo, la evidencia no es diseños transversales a menudo son acusados de tratar la acción humana
una prueba; es tan buena como el modelo. (Marsh, 1982: 97) como determinada por fuerzas externas y de descuidar el papel de la
ESTABLECIMIENTO DE LA DIRECCIÓN CAUSAL agencia humana. Marsh expresa este punto de vista de la manera más
Otro problema con los datos transversales es que incluso si establecemos que dos variables
clara:
están correlacionadas, esto no establece su dirección causal. Para ilustrar este punto, usemos El objetivo de la explicación no es solo mostrar altas correlaciones entre variables; las
nuevamente el ejemplo del estado parental y la felicidad marital. El estudio mostró que las explicaciones sociológicas casi siempre resultarían un fracaso de todos modos por
parejas sin hijos son menos felices que las que tienen bebés y que las parejas con hijos mayores estos motivos. También debe mostrar cómo las acciones de las personas
son las más felices. El problema es que incluso si asumimos que esto refleja una relación causal involucradas fueron las acciones de seres humanos conscientes, reaccionando a un
entre las dos variables, no sabemos nada sobre la dirección de la relación. relación. ¿Qué viene entorno, tratando de encontrarle sentido y persiguiendo varios objetivos y acciones
de los primeros hijos o la felicidad conyugal? ¿Los hijos aumentan la felicidad conyugal o las con más o menos éxito. Solo explicaciones que toman conocimiento de lo significativo
personas felizmente casadas tienen más probabilidades de tener hijos que las infelizmente aspecto de la acción social nos satisfará como observadores humanos. (1982: 98)
casadas?
Herbert Blumer (1956) acuñó el término 'análisis de variables' para describir
Una encuesta de panel podría resolver esta pregunta. Sabríamos el nivel de felicidad el tipo de análisis y comprensión proporcionados por los diseños de
conyugal antes de tener hijos y nuevamente después y veríamos si hubo algún cambio. También encuestas transversales (también lo aplicaría a diseños longitudinales y
podríamos verificar si el nivel inicial de felicidad estaba relacionado con la probabilidad de tener experimentales del tipo ya considerado). Argumenta que el análisis que usa
hijos posteriormente. . Sin embargo, no existe una forma sencilla de hacer esto cuando todos los
variables discretas y cuantificables es inadecuado por al menos tres
datos se recopilan en un momento determinado.
razones. Primero,
Una forma de abordar este dilema es desarrollar modelos a priori para probar. Si bien el apoyo
Omite las complejidades reales de la actividad y los procesos reales de interacción en
a un modelo a priori no prueba la dirección causal, al menos proporciona una base teórica para
los que la vida humana tiene su ser. (1956: 101)
argumentar un caso y proporciona datos empíricos que al menos son consistentes con esto.
Habiendo encontrado datos consistentes con la tesis de una dirección causal particular, el En segundo lugar, ignora la interpretación del actor de la situación y el
siguiente paso sería adoptar un diseño que pueda establecer una dirección causal. comportamiento y la forma en que estas interpretaciones impactan en sus
acciones:
La variable independiente se pone al principio del proceso de interpretación y la variable Al ignorar el proceso que interviene, uno no puede entender por qué las
dependiente en la parte terminal del proceso. El proceso intermedio es ignorado... como algo variables independientes y dependientes están o no relacionadas.
que no necesita ser considerado. (1956:97)
182
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 183

puede preguntarles por qué actuaron como lo hicieron. Este enfoque es


el comportamiento humano es intencional y se basa en la comprensión de una criticado por quienes argumentan que a menudo la gente no sabe por qué
situación, entonces estas intenciones y entendimientos deberían ser parte de la actuó como lo hizo. La respuesta a esta objeción es que si la gente no sabe
explicación del comportamiento. Blumer argumenta que el análisis de variables por qué actuó como lo hizo, entonces no hay problema, ya que no podemos
generalmente falla en hacer esto. decir que ese comportamiento es en cualquier sentido significativo. Una
segunda objeción a pedir a las personas que den sus propias explicaciones
En tercer lugar, Blumer argumenta que el análisis de variables saca a las personas es que malinterpretan
y su comportamiento de sus contextos. Al tratar de trabajar con variables discretas y
cuantificables, se pierde el contacto con el 'todo'. Al tratar solo con fragmentos de
comportamiento aislados artificialmente, se perderá el significado completo del
comportamiento. Al observar aspectos particulares de las creencias y acciones de las
personas sin mirar el contexto en el que tienen lugar, es probable que
malinterpretemos el significado del comportamiento.

Al final, la pregunta no debe ser si la dimensión significativa e intencional del comportamiento


debe constituir parte de las explicaciones sociales, sino si este aspecto del comportamiento
puede capturarse utilizando los métodos de recopilación de datos generalmente asociados con
los diseños transversales.

Ha habido una variedad de formas en que aquellos que utilizan encuestas


transversales han proporcionado explicaciones 'significativas'. Como observa Marsh,
estos

Los enfoques difieren en cuanto a quién creen que debe proporcionar el significado y cuánta y
qué tipo de evidencia se requiere antes de que uno pueda atribuir válidamente significado a la
acción. (1982: 101)

Ella identifica una serie de enfoques. La primera, y menos satisfactoria, es la que ella
llama 'sociología facesheet'. Consiste en correlacionar un conjunto de características
sociodemográficas (por ejemplo, sexo, clase, edad, religión y etnia) con el fenómeno
que se quiere explicar. uno puede detectar correlaciones cuanto más hayamos
'explicado' la varianza en ese fenómeno. Sin embargo, este enfoque no proporciona
explicaciones sociológicamente significativas. Encontrar que el género está
correlacionado con la religiosidad no es entender por qué el género está relacionado
con la religiosidad. Necesitamos entender qué tiene el género y la religión que explica
por qué las mujeres son más religiosas que los hombres. Por lo general, como señala
Marsh, este enfoque para proporcionar significado proviene de fuera de los datos
donde, de manera ad hoc, el investigador proporciona la explicación a partir de su
reserva de ideas sociológicas plausibles. Si bien estas explicaciones pueden ser
consistentes con los datos, rara vez son convincentes ya que se pueden desarrollar
muchas 'explicaciones' que son igualmente consistentes con los datos. Un segundo
enfoque consiste en pedir a las personas que proporcionen el significado.
Un enfoque final para incluir una dimensión significativa en las explicaciones es que
el investigador suministre los significados (1982: 111). Habrá muchas situaciones en
su comportamiento. La evidencia experimental muestra que en ciertas situaciones las que simplemente no podamos preguntar de manera confiable a las personas por
experimentales podemos demostrar empíricamente qué factor causal condujo a un sus razones. A menudo, solo podemos identificar las razones observando a varias
comportamiento dado, pero los individuos mismos desconocen cuál es este factor. personas en situaciones similares y leyendo los puntos en común entre los casos. El
Esta objeción tiene algún mérito para algunos comportamientos en algunas actor individual normalmente no tendrá acceso a los conocimientos adicionales
situaciones, pero no significa que los individuos, en muchas situaciones, no puedan disponibles para el investigador que puede observar a partir de una variedad de
casos.
proporcionar al menos algunas razones por las que se han comportado como lo
hicieron. Decir que no tienen acceso a la gama completa de factores que afectaron El estudio de Durkheim (1970) sobre el suicidio proporciona un ejemplo. Al estudiar
sus acciones no significa que no comprendan su comportamiento. Si le las regularidades estadísticas, identificó los grupos sociales que eran más
preguntáramos a una madre con niños pequeños por qué quería trabajar a tiempo "suigénicos", los grupos con las tasas de suicidio más altas. Al preguntar qué tenían
parcial, sin duda podría identificar algunas de las razones detrás de su decisión. Que en común estos grupos suigénicos, trató de proporcionar las razones del suicidio. Lo
ella no sea consciente o no sea capaz de articular todas las influencias no invalida la hizo al proponer que en estos grupos las personas tenían más probabilidades de
importancia de aquellas que ha identificado. Una tercera objeción es que los experimentar anomia, el sentimiento de ausencia de normas y una sensación de no
individuos pueden ser conscientes de las razones de sus acciones pero, debido a que pertenecer. Hle argumenta que este sentimiento subjetivo es angustiante en la
medida en que las personas se suicidan. Durkheim proporciona este significado en
las razones pueden no ser tan nobles, los factores de deseabilidad social les
lugar de provenir de los datos. Es Durkheim quien argumenta, en lugar de demostrar
impedirán informar sobre estas razones. empíricamente, que los grupos suigénicos sufren más anomia. Sin embargo, intenta
dar sentido a las correlaciones empíricas proporcionando una explicación
Si bien estas objeciones tienen algún mérito, aún puede ser útil preguntar a las personas las
subjetivamente significativa de los vínculos entre la pertenencia a ciertas categorías
razones de su comportamiento. Marsh argumenta que "los actores... tienen un acceso
sociales y el suicidio.
privilegiado a su propia experiencia, pero no a todos los determinantes de su propio
comportamiento" (1982: 107). Sin embargo, dice Marsh, no debemos exagerar lo que
Marsh (1982) analiza extensamente un estudio de la base social de la
descubriremos y debemos tratar la explicaciones proporcionadas por las propias personas con
circunspección.
depresión realizado por Brown y Harris (1978) donde se creía que aquellos

184
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 185

Tiene sentido emplear una variedad de estrategias, ya que ningún enfoque está
que sufren de depresión no serán plenamente conscientes de todos los factores que exento de deficiencias.
contribuyen a su depresión. Brown y Harris adoptan un enfoque no muy diferente al Validez externa
utilizado por Durkheim en su estudio del suicidio, pero con una diferencia.
Recolectaron información sobre lo que pensaban que serían los factores REPRESENTATIVA
precipitantes sociales detrás de la depresión (acontecimientos de la vida que Las muestras representativas son necesarias si vamos a generalizar a partir de los
actuaron como agentes provocadores, como la familia). vivienda deficiente, factores resultados obtenidos en una muestra a la población más amplia que la muestra
pretende representar. La forma más segura de lograr muestras representativas es
estresantes laborales, gravedad de los factores estresantes, acceso a redes de emplear métodos de muestreo probabilístico. Estos son métodos en los que cada
apoyo). Recopilaron información sobre estos factores porque pensaron que ayudaría persona de la población a la que queremos generalizar tiene una probabilidad igual o
a dar sentido, a nivel subjetivo, a por qué algunas personas estaban deprimidas y por conocida de ser seleccionada en la muestra.
qué otras no. planeando con anticipación y anticipando las posibles razones que
Los diseños transversales pueden tener más éxito que otros diseños para lograr la
podrían estar detrás de la depresión, pudieron desarrollar un relato de la depresión representatividad.
que trató de incorporar las experiencias de los actores. No es una forma infalible de
aprovechar el aspecto subjetivamente significativo del comportamiento, pero Los experimentos encuentran problemas con la representatividad por dos razones
demuestra un intento en un diseño de encuesta transversal para incluir esta forma de principales. A menudo piden más a las personas que los estudios transversales
únicos. También implican intervenciones activas y, por lo tanto, tienen que depender
explicación.
de voluntarios y muestras disponibles. En consecuencia, carecen de
representatividad. Incluso cuando se obtienen inicialmente muestras representativas,
En resumen, no hay nada inherente en los diseños transversales que impida intentar acceder
a las dimensiones significativas del comportamiento humano y convertirlas en explicaciones. esto se puede perder a medida que las personas abandonan el experimento.
Un problema similar de deserción puede comprometer los estudios de panel. Cuantas más
ondas tenga un estudio de panel, mayor será la deserción acumulada. En la medida en que
esta deserción introduzca sesgos importantes en la muestra, la representatividad puede verse datos que reflejan la población que fueron diseñados para representar. Por esta
socavada progresivamente. razón, las encuestas transversales se han convertido en el diseño de elección para
los estudios donde se requiere una descripción precisa (por ejemplo, encuestas
Dado que los diseños transversales no tienen una dimensión temporal, evitan el problema del políticas, encuestas de gastos de los hogares). son fuertes en la descripción.
sesgo introducido por el desgaste de la muestra. Siempre que la muestra inicial esté bien
seleccionada, la encuesta transversal debería producir

Cuestiones prácticas

Muchos de los temas prácticos discutidos en esta sección no son exclusivos de los
diseños transversales, pero son temas importantes para todas las investigaciones,
independientemente del diseño.

Método de recopilación de datos


No hay nada en la lógica de los diseños transversales que requiera un método
particular de recopilación de datos. Lo esencial en los diseños transversales es
obtener un conjunto estructurado de datos que permita comparaciones sistemáticas
entre casos o grupos de casos. .

El análisis de datos transversales requiere datos de múltiples casos usando las


mismas variables. El análisis se basa en comparar casos y dar cuenta de la variación
entre casos en una variable en términos de variación en otra variable. Por ejemplo,
observaremos que hay variación en cuanto a los ingresos: algunas personas ganan
más que otras. Luego veremos si estas variaciones se corresponden con variaciones
en algo más: por ejemplo, ¿las personas con mayores ingresos también tienden a
tener una educación más alta que aquellas con bajos ingresos? ¿Tienden a ser
hombres los que ganan altos ingresos mientras que los que ganan bajos tienden a ser
mujeres?

Este tipo de análisis correlacional requiere lo que a veces se denomina matriz de


variable por caso, una cuadrícula en la que tenemos la misma información para cada
caso. En el ejemplo de la figura 11.2, el caso 1 es un hombre de clase media de 44
años con una ingreso de $45,000. Vota conservador y está de acuerdo con la actitud
A pero no tiene opinión sobre la actitud B.

Los datos en una matriz variable por caso se pueden recolectar utilizando cualquier
método: cuestionarios, entrevistas cara a cara, observaciones, registros de archivo,
entrevistas telefónicas, etc. No hay ninguna razón por la que no se pueda utilizar una
combinación de métodos para completar la matriz. Sin embargo, es importante que se
utilice la misma combinación de métodos para cada caso. Por ejemplo, debemos
evitar recopilar información sobre los ingresos de algunas personas utilizando un
cuestionario anónimo de autocompletado mientras confiamos en una entrevista cara
a cara para otras personas y confiando en registros personales para otros, o
declaraciones de impuestos para un conjunto adicional. de la gente. Dado que el
método por el cual se recopilan los datos puede influir en la forma en que las personas
responden las preguntas, al menos debemos garantizar la coherencia.
186
DISEÑOS TRANSVERSALES
Variables
La elección de cualquier método de recopilación de datos en particular
dependerá de muchos factores. Estos incluyen el tamaño de la muestra, el grado
Sexo Clase Ingreso Años Actitud Actitud Votar en que están agrupados en un solo lugar o muy dispersos, el tiempo y los
a A
recursos disponibles, el grado de sensibilidad del material siendo col-lected, y la
a B
complejidad del material.
Case
1 Masculino Medio $ 45K 44 Aceptar No Conservador Si bien se puede usar una variedad de métodos para recopilar información
para formar un conjunto de datos estructurados, los cuestionarios estructurados
opinión siguen siendo el método más utilizado. Los cuestionarios estructurados se
pueden administrar de varias maneras diferentes, la más común de las cuales
2 Femenino Laboral $ 25K 56 Discrepar Discrepar No- son: (1) cara a cara por entrevistadores capacitados, (2) por teléfono con
entrevistadores capacitados, (3) autoadministrado por el encuestado donde
Conservador
normalmente se recibe el cuestionario y se devuelve por correo.

3 Femenino Superior $ 70K 34 Fuertemente Fuertemente Conservador Cada método de administración de cuestionarios tiene sus defensores y
detractores y los métodos tienen sus puntos fuertes y débiles (Dillman, 1978;
medio aceptar aceptar Rogers, 1976; Groves, 1979; Groves y Kahn, 1979). estas fortalezas y
debilidades relativas y cómo podrían aplicarse a la encuesta particular en la que
4 Masculino Laboral $ 34K 45 No No No- está involucrado. Estas fortalezas y debilidades se pueden agrupar en cinco
categorías amplias. La Tabla 11.1 proporciona una evaluación resumida de
opinión opinión Conservador cómo cada uno de los tres métodos de administración califica en cada uno de los
criterios. Una discusión más completa está disponible en Dillman (1978) y de
5 Masculino Medio $ 52K 33 Fuertemente Discrepar Conservador Vaus (1996).
discrepar
Tamaños de muestra
El tamaño de la muestra depende de los fondos, el tiempo, el acceso a los
6 Femenino Más bajo $ 40K 60 Aceptar Fuertemente -UON
participantes potenciales, los métodos de análisis planificados y el grado de
medio aceptar Conservador precisión y exactitud requerido. beneficios más marginales.

ANÁLISIS DE SUBGRUPOS
7 Femenino Medio $ 55K 41 Aceptar Aceptar No-
Cuanto mayor sea el tamaño de la muestra, más se puede subdividir para que se
Conservador puedan hacer comparaciones de subgrupos significativas. Si, en una encuesta
general de hogares, quisiéramos comparar el bienestar de los niños en hogares
8 Masculino Superior $ 250K 32 Discrepar Fuertemente Conservador de pareja con el de los niños en hogares monoparentales , tendríamos que
asegurarnos de que la muestra sea lo suficientemente grande como para
aceptar producir un número suficiente de hogares monoparentales. Si quisiéramos
comparar los hogares monoparentales encabezados por el padre y los
9 Masculino Laboral $ 25K 64 Fuertemente Aceptar No- encabezados por la madre, necesitaríamos reclutar una muestra inicial muy
grande simplemente para encontrar suficientes hogares monoparentales
aceptar Conservador encabezados por el padre.

Adoptar la estrategia de aumentar el tamaño total de la muestra para obtener


norte Femenino Medio $ 43K 43 Fuertemente Discrepar Conservador
suficientes grupos difíciles de encontrar puede ser ineficiente: podemos terminar
aceptar con más encuestados "típicos" de los que realmente necesitamos. Un enfoque
alternativo es sobremuestrear los grupos difíciles de encontrar para asegurar
suficiente
Figura 11.2 Una variable por matriz de casos

Cuadro 11.1 Ventajas y desventajas de los tres métodos de administración del cuestionario Tasas de respuesta

Cara a cara Teléfono Correo Muestras generales Bueno Bueno Bueno


muestras especializadas Bueno Bueno Bueno Implementando la encuesta

Muestras representativas Facilidad para encontrar personal


Pobre Bueno Bueno
adecuado
Evitar el sesgo de rechazo Bueno Bueno Pobre
Velocidad Pobre Bueno Satisfactorio
Control sobre quién completa el Bueno Bueno Satisfactorio
Costo Pobre Satisfactorio Bueno
cuestionario
Fuente:adaptado de Dillman,1978

Obtener acceso a la persona


Satisfactorio Bueno Bueno
seleccionada
números. Esto puede afectar la representatividad de la muestra, pero esto
Localización de la persona
Satisfactorio Bueno Bueno se puede ajustar volviendo a ponderar la muestra para tener en cuenta el
seleccionada
submuestreo y el sobremuestreo (Capítulo 9).
Efectos sobre el diseño del
cuestionario PRECISIÓN Y EXACTITUD DE LAS ESTIMACIONES

Cuando se utilizan muestras, siempre existe la posibilidad de un error de


Habilidad para manejar:
muestreo: la muestra no refleja con precisión la población de la que se
Cuestionarios largos Bueno Satisfactorio Satisfactorio extrae. Cuando usamos muestras aleatorias, podemos estimar, dentro de
un nivel específico de probabilidad, qué tan cerca pueden estar las cifras
Preguntas complejas Bueno Pobre Satisfactorio
(reales pero desconocidas) de la población de las cifras que obtenemos de
preguntas aburridas Bueno Satisfactorio Pobre la muestra. Por lo tanto, podemos encontrar que el 60 por ciento de una
muestra dice que apoya la compra de capital.
Falta de respuesta del artículo Bueno Bueno Satisfactorio

Filtrar preguntas Bueno Bueno Satisfactorio

Control de secuencia de preguntas Bueno Bueno Pobre

Preguntas de final abierto Bueno Bueno Pobre

Calidad de las respuestas

Minimizar las respuestas socialmente


Pobre Satisfactorio Bueno
deseables

Capacidad para evitar la distorsión


debido a:

Características del entrevistador Pobre Satisfactorio Bueno

Opiniones del entrevistador Satisfactorio Satisfactorio Bueno

Influencia de otras personas Satisfactorio Bueno Pobre

Permite oportunidades para consultar Satisfactorio Pobre Bueno

Evita la subversión Pobre Satisfactorio Bueno


que tenemos una muestra, querremos saber qué tan cerca es probable que esté la
Cuadro 11.2 Tamaños de muestra necesarios para varios errores de muestreo con
cifra de la población real de esta estimación de la muestra. Usando la teoría de la
un nivel de confianza del 95 % (muestreo aleatorio simple)
probabilidad, podemos estimar con un alto nivel de confianza que la cifra de la
Muestreo Muestra Muestreo Muestra población real estará dentro, digamos ± 2,0 por ciento de la estimación de la
muestra (es decir, en este ejemplo, en algún lugar dentro del rango de 58 por ciento
error Talla error Talla
a 62 por ciento).
(%) (%)
Uno de los factores clave que afecta la precisión con la que podemos especificar
1.0 9,200 5.5 330 las cifras de población es el tamaño de la muestra. Cuanto más grande sea la
muestra, más estrecha será la banda (llamada intervalo de confianza) dentro de la
1.5 4500 6.0 277
cual podemos estimar que se encontrará la cifra de población. En el ejemplo
2.0 2,400 6.5 237 anterior podríamos haber tenido una muestra de unas 2400 personas. Con una
muestra de este tamaño, podemos decir que la población se ubicará dentro de una
2.5 1,600 7.0 204
banda relativamente estrecha de ±2,0 por ciento alrededor de la estimación de la
3.0 1,100 7.5 178 muestra. Si quisiéramos estrechar la banda tendríamos que aumentar el tamaño de
la muestra. La regla general es que para reducir a la mitad el intervalo de confianza
3.5 816 8.0 156
necesitamos cuadruplicar el tamaño de la muestra. Por lo tanto, para reducir el error
4.0 625 8.5 138 de la muestra de ±2,0 por ciento a ±1,0 por ciento, necesitaríamos aumentar el
4.5 494 06 123 tamaño de la muestra a 9200 casos. Obviamente, hay un punto en el que el nivel
adicional de precisión no vale la pena el costo adicional. Dónde esté ese punto
5.0 400 9.5 110
dependerá de los fondos disponibles y del grado de precisión requerido.
10.0 100 La tabla 11.2 proporciona estimaciones de los tamaños de muestra que
necesitaría según la cantidad de error de muestreo que estaría dispuesto a tolerar.
Esto es de hecho dos errores estándar.
La tabla indica cuál sería el intervalo de confianza en lo que se conoce como el nivel
Esto es de hecho dos errores estándar. de confianza del 95 por ciento. Por lo tanto, podemos estar seguros en un 95 por
ciento de que si tuviéramos una muestra aleatoria de 100 casos, la población
Esto supone una división 50/50 en la variable. Estos tamaños de muestra serían más pequeños
para muestras más homogéneas.
estimada estaría dentro de

190
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO 191
TRANSVERSAL

variación para 'explicar'. Al incluir a la mayoría de las personas dentro de


encontrar en la muestra. Si el 50 por ciento de la muestra apoyara a un político en una categoría (menos de $100,000) las estaríamos tratando como si fueran
particular, podríamos estar casi seguros de que el nivel real de apoyo en la población iguales. En consecuencia, no podríamos explicar la variación dentro de esta
estaría entre el 40 y el 60 por ciento. Si la muestra se aumentara a 400, entonces la categoría. De manera similar, si quisiéramos medir la satisfacción conyugal
banda de certeza razonable sería 45-55 por ciento (50 ± 5 por ciento).2 y esto se hiciera de tal manera que todos parecieran muy satisfechos,
seríamos incapaces de "explicar" las variaciones en la satisfacción
Suficiente variación en la muestra en variables clave
conyugal. Si nuestro instrumento es demasiado tosco para detectar
Dado que el análisis de datos transversales requiere que analicemos la variación de variaciones, entonces no podemos explicar la variación ya que no la hemos
una variable en términos de variación de otra variable, nuestras mediciones deben ser medido en primer lugar.
lo suficientemente sensibles para aprovechar la variación que existe. Por ejemplo, si
intentáramos explicar las variaciones en el ingreso y la simplemente recolectando datos Lo mismo ocurre con las variables explicativas clave: debemos asegurar
de ingresos usando solo dos categorías amplias, $0 a $100,000 y $100,000+, la variación. Por ejemplo, si pensáramos que las variaciones en los ingresos
enmascararíamos la mayor parte de la variación que existe y tendríamos poca podrían deberse al género, es muy poco probable que, en una muestra
compuesta principalmente por hombres, gran parte de la variación en los ingresos se
deba a diferencias de género. Si pensáramos que las diferencias de ingresos se deben
formularios que incluyen inconvenientes, invasión de la privacidad y tiempo.
en parte a las diferencias de edad pero luego comprobáramos esto usando una
¿ Cuánto tiempo deben durar las entrevistas y cuánto puede durar un
muestra que era bastante homogénea en edad, encontraríamos que la edad no era
cuestionario?
muy importante para explicar las variaciones de ingresos en esta muestra.
Información para controles estadísticos Es imposible ser definitivo. La duración óptima de una entrevista o
cuestionario variará ampliamente entre diferentes tipos de personas.
Debido a la naturaleza de los diseños transversales, debemos poder introducir Algunas personas estarán más ocupadas y no podrán dedicar tiempo. Otros
controles estadísticos en nuestro análisis (Capítulo 12). Esto es esencial si queremos encontrarán dificultades con el idioma y encontrarán la
obtener alguna claridad con respecto a los procesos causales utilizando datos entrevista/cuestionario más exigente. Dependerá de qué tan fácil sea seguir
transversales. Si vamos a introducir controles estadísticos en la etapa de análisis, estos el cuestionario y qué tan hábil sea el entrevistador. Aún más importante es
deben anticiparse antes de recopilar datos, ya que solo podemos controlar los factores cómo la gente encuentra el tema interesante. Indudablemente, la extensión
sobre los que tenemos información. Esto solo se puede lograr leyendo primero la de un cuestionario de investigación de mercado sobre algo de poco interés
literatura relevante y pensando en los modelos teóricos que planeamos evaluar y para las personas deberá ser más corta que uno que trata sobre asuntos de
anticipando qué variables requerirán un control estadístico. interés directo y sobre los cuales tienen experiencia de primera mano.
Longitud
tipos de datos
Cuando los datos se recopilan directamente de los encuestados, debemos ser No hay nada en la lógica de los diseños transversales que requiera el uso de datos
conscientes de la carga que recae sobre los encuestados. Esta carga puede tomar cuantitativos o cualitativos. La clave es que los datos sean sistemáticos, que
muchos tengamos información sobre los mismos asuntos para cada caso. Si estos datos
tienen forma de datos cuantitativos, numéricos o codificados, o si son citas de
entrevistas, extractos de diarios u observaciones, no es importante para la lógica del
diseño.

El análisis es más simple (pero no necesariamente mejor) si los datos se recopilan


utilizando variables y categorías predefinidas. Esta es la razón por la que los
cuestionarios se utilizan tanto en los diseños transversales. Pero incluso en los
cuestionarios estructurados debemos elegir entre preguntas abiertas y preguntas de
elección forzada (ver Foddy, 1993: 126-52 para una discusión completa de las
supuestas ventajas y desventajas de las preguntas abiertas y cerradas).

Los cuestionarios estructurados son una de las formas más sencillas de obtener un
conjunto de datos estructurados. Sin embargo, podríamos usar técnicas de
recopilación de datos menos estructurados y, a partir de esto, construir un conjunto de
datos estructurados. Usando entrevistas en profundidad, por ejemplo, podríamos
identificar a partir de las entrevistas un conjunto de variables de interés para nosotros.
Para cada una de estas variables construiríamos un conjunto de categorías y luego
clasificaríamos cada caso. Por ejemplo, realicé una serie de entrevistas en
profundidad con adultos que examinaron la naturaleza de las relaciones con su familia
más amplia. Como parte de la entrevista hablamos sobre las relaciones con los
padres. Después de completar las entrevistas, construí un conjunto de variables,
algunas de las cuales se referían a las relaciones entre adultos y padres. A partir de
mis entrevistas, identifiqué lo que pensé que eran varios tipos diferentes de
relaciones. Usé una variedad de piezas de información para identificar el tipo de
relación que pensé que se aplicaba en un caso particular. Luego clasifiqué cada caso
sobre la base de un conjunto completo de pistas dispersas a lo largo de la entrevista.
Repetí el mismo proceso para muchos otros aspectos de la entrevista (p. ej., relación
con los hermanos, naturaleza del matrimonio, grado de participación en la comunidad
local, centralidad del trabajo en la vida). En otras palabras, pude usar una variedad de información cualitativa para producir variables y clasificar
192
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 193

manera, es posible evitar la identificación de individuos particulares a partir de un


casos. Entonces pude analizar sistemáticamente patrones en los datos (de Vaus, 1994). conjunto de datos anónimos.

Cuestiones éticas

Al igual que con cualquier diseño de investigación, el investigador que utilice un diseño
transversal deberá prestar atención a cuestiones de confidencialidad, privacidad, prevención
de daños a los participantes y consentimiento informado.

En algunos aspectos, los diseños transversales pueden minimizar algunos de los problemas
éticos que pueden surgir con los diseños experimentales y longitudinales. Dado que no se
requiere un seguimiento de los participantes, es mucho más fácil garantizar el anonimato. No
es necesario mantener listas de nombres o hacer coincidir los nombres con las respuestas.
Además, dado que la recopilación de datos es 'única', los estudios transversales pueden ser
menos intrusivos y, en este sentido, pueden ser menos una imposición para la privacidad de
una persona.

En algunas encuestas pueden surgir problemas de confidencialidad incluso cuando la


información se proporciona de forma anónima. En una encuesta de una organización o una
región específica o en un censo nacional, es concebible que los individuos puedan identificarse
mediante el examen de un conjunto de características. Para individuos con características
relativamente inusuales, puede ser posible identificar personas individuales. Por ejemplo, en
un censo nacional se recolectarán datos para cada persona que indique su ubicación
geográfica (hasta áreas geográficas relativamente pequeñas llamadas distritos de
recolección), su edad, sexo, ocupación, ingresos, educación, características del hogar, estado
civil y así sucesivamente. Con información detallada de este tipo, sería posible que alguien con
acceso a los datos identificara a algunas personas, como el médico de un pueblo pequeño en
particular, el maestro de escuela, el clérigo, etc. Dado que algunos datos de encuestas y
censos se ponen a disposición del público Para los investigadores, para un análisis más
detallado, es importante que ningún individuo sea identificable mediante la clasificación
cruzada de información detallada en casos individuales.

Para protegerse contra este problema, los datos de las encuestas y las recopilaciones del
censo se 'anonimizarán' antes de que se entreguen a otras personas para su posterior análisis.
Esto se logra de varias maneras. Una forma es omitir cierta información clave, como cualquier
identificador geográfico, de cualquier divulgación pública de los datos. Otra forma es reducir la
precisión de los datos colapsando categorías. Por ejemplo, en lugar de proporcionar datos con
edades o fechas de nacimiento específicas, solo se publicarán grupos de edad (por ejemplo,
grupos de edad de cinco años). Otra estrategia es omitir cualquier información de enlace entre
casos. Por ejemplo, cuando se recopila información de cada miembro de un hogar, los datos
publicados pueden hacer imposible identificar qué casos individuales pertenecen al mismo
hogar. Al controlar el detalle y la cantidad de información publicada públicamente de esta
La ausencia de grupos de control aleatorios significa que el análisis de datos de
diseños transversales se basa en una variación considerable de la muestra y en la
Debido a que los diseños transversales se basan en variaciones existentes en lugar de creación de grupos de comparación post hoc. Esto tiene implicaciones para el tamaño
introducir intervenciones, evitan muchas de las preocupaciones éticas potenciales sobre el de la muestra, el tipo de muestra y las estrategias prácticas de implementación de
daño a los participantes que se produce como resultado de la intervención. También es una estudios transversales. El capítulo ha esbozado estas consideraciones prácticas y
ventaja que evitan la asignación aleatoria a grupos experimentales y de control. La asignación éticas.
aleatoria puede dar lugar a serios problemas éticos (ver Capítulo 6).

notas
Resumen
1 Esto debe matizarse en la medida en que las variables supresoras pueden
Dado que los diseños transversales carecen de una dimensión temporal y de grupos de control enmascarar una relación causal. Estrictamente hablando, necesitaríamos poder
aleatorios, se encuentran con posibles deficiencias para el análisis causal. Estas deficiencias eliminar la influencia de todas las variables supresoras antes de que pudiéramos estar
representan amenazas a la validez interna de los estudios transversales. Este capítulo ha seguros de que la ausencia de una correlación entre dos variables realmente refleja la
esbozado estas deficiencias e identificado algunas formas de minimizar su impacto. Si bien los ausencia de una relación causal. Para una discusión más completa de las variables
diseños transversales presentan algunas debilidades peculiares en relación con la validez supresoras, ver Rosenberg (1968). : Capítulo 4).
interna, se ha señalado que también tienen algunas fortalezas particulares. Debido a que no
tienen una dimensión temporal, no sufren muchas de las otras amenazas a la validez interna 2 Estas estimaciones asumen que estamos tratando con variables donde hay una
que hemos encontrado con los diseños experimentales y longitudinales. Los diseños división 50/50. Los tamaños de muestra estimados serán diferentes en poblaciones
transversales son un diseño simple y rentable y, en consecuencia, a menudo pueden emplear más homogéneas.
muestras excelentes y evitar los problemas causados por el desgaste de la muestra. Como
tales, los diseños transversales pueden tener una fuerte validez externa.
ANÁLISIS TRANSVERSAL

porque llaman la atención sobre las debilidades inherentes del diseño


transversal que deben abordarse.

12 Análisis descriptivo

Los diseños transversales son ideales para el análisis descriptivo y se


ANÁLISIS TRANSVERSAL
utilizan ampliamente para estos fines. Su uso generalizado en la
investigación de mercado y las encuestas políticas lo confirman. Estos son
contextos en los que los investigadores simplemente quieren describir
cosas tales como: quién usa o le gustan determinados productos; aspectos
del comportamiento del consumidor; intención de voto; nivel de interés en la
Los diseños transversales se adaptan bien al análisis descriptivo, al menos para las política; sentimientos hacia políticos particulares; y actitudes hacia una
descripciones de las cosas tal como son en un momento dado. Sin embargo, los variedad de temas. Por lo general, este tipo de investigación se enfoca en
diseños transversales han sido criticados por su debilidad en el nivel del análisis preguntas sobre 'cuántas' y 'qué tipos' de personas piensan o piensan de
causal explicativo. Algunos investigadores argumentan que, por varias razones, los una manera particular.
diseños transversales no tienen valor en la etapa explicativa de un estudio. Para
respaldar su juicio, citan las dificultades que presentan los datos transversales para El censo es otro ejemplo de diseño transversal descriptivo. Su función
establecer el orden causal de los eventos, para controlar todas las variables que principal es proporcionar una descripción precisa de la población de un país:
podrían estar influyendo en las correlaciones y para establecer, sin ambigüedades, el cuántas personas hay en la población y cuántas personas poseen
orden causal. Aunque el juicio basado en las críticas es demasiado duro, son valiosas características particulares (por ejemplo, sexo, edad, educación, vivir en
lugares particulares, etc.). Encuestas de gastos domésticos proporcionar un
ejemplo adicional de datos transversales que se utilizan con fines descriptivos. En
estas encuestas, los gobiernos buscan mapear los patrones de gasto de individuos y
niveles en lugares particulares y en una etapa particular del ciclo de vida familiar.
hogares. Tales encuestas permiten descripciones detalladas de los patrones de
gasto de diferentes tipos de familias y hogares y para personas con diferentes Dado que estas encuestas no están diseñadas principalmente para desarrollar
ingresos. explicaciones del comportamiento, los problemas de causalidad, de orden causal o la
influencia de variables no controladas no importan. La clave es asegurarse de que las
muestras sean lo suficientemente grandes para que podamos obtener números
suficientes en los diversos subgrupos para proporcionar descripciones confiables. La
otra clave es obtener muestras de tal manera que podamos generalizar más allá de la
muestra a la población de la que se extrajo la muestra.

El problema del análisis se convierte entonces en una cuestión de las formas


apropiadas de describir los datos. Está más allá del alcance de este libro analizar
todas las formas en que se pueden describir los datos.

¿Cuanto?
Contar es un aspecto básico del análisis descriptivo. El objetivo es establecer cuántas
personas tienen características particulares, tienen una opinión particular, se
comportan de una manera determinada, etc. Las encuestas de mercado descubrirán
a cuántas personas les gusta un producto en particular, una encuesta política contará
cuántas personas tienen la intención de votar por un partido o candidato específico,
un censo contará el número de personas en la población, mientras que una encuesta
de gastos domésticos describirá cuántas personas tienen patrones particulares de
gasto.

Como resultado, contamos cuántas personas dan respuestas particulares porque


nos interesa la distribución de casos. ¿Cuál es la respuesta típica a la pregunta? ¿
Qué tan típica es la respuesta típica? ¿Están las personas repartidas en un gran
número de categorías? ¿Están agrupados en unas pocas categorías? ¿Qué tan
similares o diferentes son las personas en la muestra? ¿Están agrupados hacia un
extremo de una distribución (por ejemplo, el extremo de bajos ingresos)?

En otras palabras, además del simple conteo, veremos la forma de cualquier


distribución e intentaremos resumir de manera significativa cómo se ve la distribución.
Estos objetivos se pueden lograr con varias estadísticas de resumen. Para resumir lo
que es típico en una distribución usaríamos una medida apropiada de tendencia
central (media, mediana o moda). Para resumir la dispersión y la variabilidad en una
distribución, usaríamos una medida apropiada de dispersión (egrango, rango
intercuartílico, varianza y desviación estándar). Otros aspectos de la forma de una
distribución se pueden resumir con estadísticas como la asimetría y la curtosis.

Las representaciones gráficas de distribuciones a menudo pueden transmitir más y


ser más intuitivamente comprensibles que las medidas estadísticas resumidas.
Gráficos circulares, gráficos de barras, gráficos de líneas, histogramas, diagramas de
caja y bigotes, diagramas de tallo y hoja son solo algunos de los medios gráficos para
representar distribuciones. La mayoría de los paquetes estadísticos y hojas de cálculo
basados en computadora producen una variedad de tales gráficos. Alternativamente,
podemos optar por presentar los datos en forma tabular. Las distribuciones de
frecuencia son la forma normal de hacer esto.

196 DISEÑOS TRANSVERSALES


ANÁLISIS
TRANSVERS 197
AL

000-29 999, $30 000-39 999, $40 000-49 999, $50 000
Nivel de detalle -59,999,$60,000-69,999,$70,000-79,999,$80,000-89,999,$90,000-99,999,$1
00,000 y más.
Cuando describimos las distribuciones, debemos decidir cuánto detalle
proporcionar. Las variables continuas, como la edad (en años), los ingresos (en
dólares) y las horas trabajadas cada semana, pueden analizarse como variables
continuas o colapsarse en grupos. Alternativamente, la edad podría colapsarse en
categorías como menos de 20, 20-29, 30-39, 40-49, 50-59, 60-69, 70-79 y 80+; los
ingresos pueden colapsarse en grupos de ingresos (menos de $5000,
$5000-10,000, $10,001-15,000, $15,001-20,000) y analizarse en estos grupos.
Muchas variables ordinales pueden colapsarse en menos categorías. Por ejemplo,
los encuestados en una encuesta son se les preguntó qué tan de acuerdo o en
desacuerdo estaban con una declaración de actitud en particular (muy de acuerdo,
de acuerdo, no puedo decidir, en desacuerdo o muy en desacuerdo). Tendríamos
que tomar decisiones sobre si colapsar en las categorías 'de acuerdo', 'no puedo
decidir' y 'en desacuerdo' o, alternativamente, si solo estamos interesados en estar
de acuerdo, podríamos simplemente usar las categorías de 'de acuerdo' y 'otro'. Las
variables nominales, como el país de nacimiento, pueden tener una gran cantidad de
categorías, muchas de las cuales pueden combinarse con el propósito de una
presentación simple y clara. Podríamos agrupar países en regiones (por ejemplo,
Europa Occidental, Europa Central y Oriental, América del Norte ,Otra América,Asia
del Sur,Sudeste de Asia,Oceanía) o según niveles de desarrollo,o sean o no de
habla inglesa (Capítulo 6).

El grado de detalle que conservemos dependerá de factores como el tamaño de la muestra,


el número de personas en categorías particulares y la forma en que se analizarán y
presentarán los datos, y de los puntos principales que deben destacarse.

La forma en que se colapsan las variables puede tener implicaciones importantes


para los patrones de resultados y se debe tener cuidado de no recodificar
simplemente para crear o enmascarar un patrón. Por ejemplo, la tabla 12.1 ilustra la
forma en que la codificación puede enmascarar una relación.

Hay dos formas generales en las que se colapsarán las categorías de una
variable.

SUSTANTIVAMENTE

Usando este enfoque, las categorías se combinan debido a la similitud de las


categorías. Por lo tanto, se combinarían las categorías 'de acuerdo' y 'totalmente de
acuerdo' porque ambas reflejan un acuerdo. De manera alternativa, dependiendo del
propósito del análisis, podríamos combinar 'totalmente de acuerdo' y 'totalmente en
desacuerdo', ya que ambos indican personas que están muy de acuerdo con el
tema. Con una variable como el ingreso, la recodificación sustantiva combinaría
categorías sobre la base de los valores reales del ingreso. Por lo tanto, podríamos
colapsar el ingreso en categorías como por debajo de $10 000, $10 000-19 999, $20
perceptores de ingresos, el segundo 10 por ciento inferior de los perceptores
de ingresos, hasta el 10 por ciento superior de los perceptores de ingresos.
Tabla 12.1 Una ilustración de la recodificación que enmascara una relación
Las líneas divisorias específicas se determinarían observando la distribución
Descodificado versión d Recodificado versión
real. Utilizando este enfoque, el investigador no impone arbitrariamente las
definiciones de ingresos bajos y altos, sino que se definen relativamente
sobre la base de la distribución.
Masculino Femenino Masculino Femenino
La tabla 12.2 ilustra cómo la misma variable puede colapsarse de manera
Totalmente de acuerdo 50% 15% 60% diferente dependiendo de si se usaron métodos sustantivos o distributivos
Aceptar 60% de registro.
Aceptar 10 45

Discrepar 30 5 40 formulario de datos


→En desacuerdo 40
Muy en desacuerdo 10 35 Además de decidir cómo presentar y resumir las distribuciones y cómo
agrupar los valores, puede ser necesario prestar atención a la forma en que
norte 500 500 500 500 se analizan los datos. A veces es deseable cambiar la forma en que se
expresan nuestras medidas.

Es posible que necesitemos convertir variables para que todas se midan sobre una
DISTRIBUCIONAL
base uniforme. Esto puede ser necesario cuando se analizan datos en encuestas
transversales repetidas donde el valor de, digamos, el ingreso debe ajustarse por
Con este enfoque, nos enfocamos en la distribución de una variable como base inflación. En estudios transnacionales, algunas variables, como el ingreso, pueden
para la recodificación y dejamos que la distribución, en lugar del significado necesitar convertirse a una moneda común (por ejemplo, dólares estadounidenses).
sustantivo de las categorías, determine cómo combinamos las categorías. Por Esto se discutió en el Capítulo 9.
ejemplo, en lugar de colapsar los ingresos de la manera descrita anteriormente,
Los datos también se pueden representar expresando puntajes individuales, no en
simplemente dos categorías: personas por debajo del ingreso medio y personas
términos de las unidades de la variable original (por ejemplo, años para la edad o
por encima del ingreso medio. Si el ingreso medio fuera de $35 000, entonces las dólares para el ingreso), sino en términos de cómo se compara el puntaje de un
dos categorías de ingresos estarían por debajo de $35 000 y por encima de $35 individuo (o grupo) con el valor típico de esa variable Esto podría hacerse por
000. O podríamos dividir la muestra en deciles: el 10 por ciento inferior de los
198
DISEÑOS TRANSVERSALES ANALI0 TRANSVERSAL

2 3 11
Cuadro 12.2 Ilustración de la división de una variable en tres grupos usando métodos de
recodificación sustantivos y distributivos
3 4 15

10 es excelente? Medio 1/3 de 4 7 22

Sustantivo Puntaje % Acumulativo Distribucional


codigos 5 10 32
recodificación % recodificación

6 9 41 Relativamente 'en el medio'


Terrible Fondo 1/3 de 0 3 3 1/3 inferior de los casos:

1/3 de los casos


codigos relativamente más infeliz

1/3 superior de 7 10 51
1 5 8
codigos 8 15 66

dólares, marcos alemanes, yenes y francos. En cambio, estaríamos tratando


9 15 81 1/3 superior de los casos:
con la 'moneda' común de las desviaciones de la media.
Excelente 10 19 100 relativamente más feliz Una variable se estandariza simplemente restando el valor típico (media o
mediana) del puntaje real de cada persona en esa variable. El valor resultante
para cada persona luego se divide por una medida de variación (desviación
reexpresando el ingreso de cada persona (por ejemplo) en términos de cuánto más
estándar si se usó la media y el rango intercuartílico o lo que sea, si se usó la
bajo o más alto es que el valor promedio. Una forma de hacerlo es expresando la
mediana).
puntuación individual de una persona en términos del número de desviaciones
estándar por encima o por debajo de la media.
¿Quién?
Podemos ir un paso más allá y estandarizar las variables. La estandarización tiene el efecto de
expresar el puntaje de cada persona en relación con el de los demás en la distribución. Tiene el La descripción de las distribuciones en todo un estudio suele ser solo la primera
efecto de eliminar las diferencias en las unidades de medida entre países, a través del tiempo y parte de un análisis descriptivo. La mayoría de las veces queremos ver cómo
entre diferentes variables. Nos permite comparar manzanas con naranjas. Al estandarizar los difieren las distribuciones entre los diferentes subconjuntos de las personas
ingresos, por ejemplo, podríamos examinar los cambios en la posición de ingresos de hombres y que componen el estudio. Por ejemplo, ¿los patrones de ingresos de hombres
mujeres a lo largo del tiempo en diferentes países. Si pudiéramos expresar las calificaciones de y mujeres difieren? ¿Por cuanto? ¿En qué dirección? ¿Hay diferencias entre
cada hombre y cada mujer en forma estandarizada, entonces para cualquier año o país los jóvenes, los de mediana edad y los ancianos? ¿Difieren según la región?
podríamos calcular el puntaje estándar promedio de hombres y mujeres. Podríamos hacer esto
durante una gran cantidad de años y no preocuparnos por el efecto general de inflación. La comparación de subgrupos sobre una variable dada (ingresos,
conservadurismo, religiosidad, felicidad) es esencialmente un ejercicio
Veríamos que, en promedio, las mujeres estarían recibiendo ingresos por debajo del descriptivo que implica establecer qué tipos de personas tienen características,
promedio y los hombres por encima del promedio. Al estandarizar las variables, actitudes o comportamientos particulares. No llega a intentar explicar por qué
podemos ver fácilmente si la brecha entre hombres y mujeres se está reduciendo o algunos grupos son diferentes de otros (aunque ese sería el próximo paso
ampliando con el tiempo. En la forma no estandarizada, sería más difícil establecer obvio). Simplemente estamos describiendo patrones, que a su vez pueden
cualquier aumento o disminución debido a que cambia el 'valor' de los ingresos. La conducir a explicaciones de por qué los grupos difieren. El ejercicio de describir
brecha promedio en dólares entre los ingresos de hombres y mujeres puede haber es ,sin embargo, el primer paso indispensable antes de desarrollar
aumentado en términos absolutos en dólares, pero en términos relativos, la brecha explicaciones. Por ejemplo, antes de tratar de explicar las diferencias de
puede haber aumentado. estrechado género en los ingresos, primero debemos establecer el alcance y la naturaleza
de las diferencias.
Estandarizar los ingresos también nos permite comparar las diferencias entre
países. Al estandarizar, podríamos comparar la posición relativa de hombres y mujeres Las descripciones de los subgrupos se pueden examinar utilizando una
en Gran Bretaña, Estados Unidos, Alemania, Japón y Francia sin preocuparnos por las amplia variedad de técnicas de análisis de datos, pero el investigador siempre
diferencias entre libras, empleará métodos bivariados o multivariados de un tipo u otro. Las técnicas
variarán desde simples tabulaciones cruzadas y comparación de medias hasta
técnicas multivariadas más complejas como regresión múltiple y análisis
discriminante. El análisis puede basarse en estadísticas de resumen (p. ej.,
comparación de medias, coeficientes de correlación, análisis de varianza),
utilizar representaciones gráficas (p. ej., diagramas de dispersión, gráficos de
líneas complejas, gráficos de barras agrupadas) o basarse en presentaciones
tabulares (comparación de medias, coeficientes de correlación, análisis de
varianza). -tabulaciones a tabulaciones cruzadas de varias vías).

La elección entre estos diversos enfoques dependerá de las características


de los datos (por ejemplo, el nivel de medición) y el tipo de público al que se
dirige el análisis. El Capítulo 6 proporciona un resumen de una variedad de
técnicas de análisis y las consideraciones de datos que afectarán la elección
entre las alternativas.
Estructuras de factores y estructuras de escala

Otra forma de análisis descriptivo delinea qué conjuntos de variables 'van juntos'. El
análisis factorial se utiliza a menudo para buscar patrones en la forma
200
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 201

Al buscar un patrón en la forma en que las personas responden a


la gente responde a un conjunto de preguntas. Es un enfoque de análisis que se conjuntos de preguntas, podemos desarrollar una comprensión más
utiliza con frecuencia en estudios de actitudes y valores y características de sofisticada de la estructura de las actitudes y el comportamiento.
personalidad. Básicamente, implica buscar patrones en conjuntos de actitudes que
tienen las personas. Busca descubrir si existe una estructura subyacente al patrón de ¿Qué tan generales? ¿Qué cerca?
respuestas a las preguntas. Por ejemplo, podemos pedir a las personas que nos
digan cuáles consideran que son los atributos más importantes que deben poseer los Además de describir patrones en una muestra, con frecuencia querremos
niños (por ejemplo, buenos modales, obediencia, pulcritud, imaginación, generalizar a la población más amplia de la que se extrae la muestra.
independencia y autocontrol). Al observar el patrón de respuestas, podemos Querremos saber si es probable que los patrones que hemos descrito en la
encontrar que algunas personas enfatizan los buenos modales, la obediencia y el muestra se mantengan en la población más amplia y, de ser así, qué tan
autocontrol y ponen poco énfasis en la imaginación y la independencia o viceversa. cerca es probable que las cifras de la población estén de las que hemos
En otras palabras, ciertas variables se agrupan. Algunas personas seleccionarán encontrado en la muestra.
características que reflejen el factor subyacente de conformidad, mientras que otras Cuando usamos una muestra probabilística (capítulo 6), usamos técnicas de
seleccionarán características que reflejen una dimensión de autonomía. estadística inferencial para responder a este tipo de preguntas. Dos tipos principales

De manera similar, podríamos estar interesados en los tipos de cosas que la gente
busca en un trabajo. Podríamos preguntarnos sobre la importancia de las siguientes
cosas en un trabajo:

1 buena paga

2 oportunidades para usar la iniciativa

3 teniendo responsabilidad

4 la sensación de lograr algo

5 ausencia de demasiada presión

6 vacaciones generosas

7 buenas horas.

Podríamos analizar las respuestas para ver si existe una estructura o un patrón en la forma en
que las personas responden a cada una de estas características laborales. Podríamos
encontrar que hay una estructura: algunas personas tienden a enumerar las características
intrínsecas del trabajo (oportunidades para usar la iniciativa, responsabilidad y sentimientos de
lograr algo) mientras que otras enumeran las características extrínsecas (pago, vacaciones,
horas y sin presión).
Análisis explicativo

de la estadística inferencial se utilizan comúnmente en el análisis descriptivo: estimaciones de Al tratar de hacer afirmaciones sobre relaciones causales, los diseños transversales
intervalos y pruebas de significación. deben basarse en comparaciones estáticas entre grupos o en correlaciones entre
variables donde las mediciones se realizan en el mismo momento. Los problemas con
Las estimaciones de intervalo nos permiten estimar dentro de qué rango de las cifras de la esto ya se han discutido extensamente (Capítulos 3 y 11). La estrategia básica
muestra es probable que se encuentren las cifras de la población. Por ejemplo, en una muestra mediante la cual se manejan estos problemas es introduciendo controles estadísticos
podemos encontrar que el 60 por ciento dice que tiene la intención de votar por un partido en el análisis.
político en particular. Podemos usar estimaciones de intervalo para estimar dentro de qué rango
del 60 por ciento es probable que se encuentre la cifra de población. Usando una estadística La lógica de los controles estadísticos
llamada error estándar, podríamos decir, por ejemplo, que podemos tener un 95 por ciento de
confianza en que la cifra de la población real estará dentro de un cierto rango de la estimación La lógica de los controles estadísticos se comprende mejor dentro del
de la muestra del 60 por ciento (por ejemplo, ±2 por ciento). o dentro del rango de 58 por ciento contexto de la lógica de los diseños experimentales. El diseño experimental
a 62 por ciento). se basa en comparar el cambio a lo largo del tiempo en dos o más grupos,
que inicialmente eran idénticos en todos los aspectos relevantes. Diferentes
Otra forma de usar la estadística inferencial es usar pruebas de significancia. Estos se
utilizan con frecuencia junto con los coeficientes de correlación. Proporcionan una estimación grupos están expuestos a tratamientos experimentales y un grupo de control
de la probabilidad de que también se encuentre en la población una correlación al menos tan no está expuesto a ningún tratamiento. Después del tratamiento, cualquier
fuerte como la observada en la muestra. Por ejemplo, una correlación en una muestra podría diferencia entre los grupos en la variable de resultado se considera que se
reflejar una correlación real en la población o podría ser simplemente el resultado de un error de debe al efecto del tratamiento. Sin embargo, si los grupos fueran diferentes
muestreo. Las pruebas de significación proporcionan una estimación de la probabilidad de que
al principio, no sabríamos si hubo diferencias entre los grupos después del
la correlación de la muestra se deba simplemente a un error de muestreo. Si hubiera una
posibilidad razonable de que se deba a un error de muestreo, no nos sentiríamos seguros al tratamiento debido al tratamiento oa las diferencias iniciales.
predecir que la correlación de la muestra se encontraría en la población más amplia.

ANÁLISIS TRANSVERSAL

que debemos anticipar las variables relevantes en las que se deben emparejar
En los diseños transversales la lógica es comparar grupos que se forman a partir de las los grupos. Nuestra anticipación siempre será menos que perfecta.
diferencias existentes (la variable independiente). Luego comparamos los resultados (la
variable dependiente) en estos grupos. Cualquier diferencia puede interpretarse como Si estuviéramos examinando el impacto del género en los ingresos,
debida a la influencia de la pertenencia a diferentes grupos. Por lo tanto, las diferencias tendríamos que comparar a hombres y mujeres que trabajaron un número
en los ingresos (variable dependiente) de hombres y mujeres (variable independiente) similar de horas por semana. Sería inapropiado comparar un grupo de mujeres
pueden deberse al efecto del género en los ingresos. las diferencias pueden deberse no donde muchas trabajaban a tiempo parcial con un grupo de hombres que eran
al género per se, sino a otras diferencias entre los grupos. El grupo de hombres puede principalmente trabajadores a tiempo completo. Tiene más sentido comparar
ser mayor, estar mejor educado, incluir más trabajadores a tiempo completo, tener hombres que trabajaron a tiempo completo con mujeres que trabajaron a
ocupaciones diferentes a las del grupo de mujeres. Para determinar si las diferencias de tiempo completo y observar las diferencias de ingresos entre estos dos grupos.
ingresos entre hombres y mujeres se deben al género, necesitamos comparar hombres y Entonces podríamos comparar hombres y mujeres que trabajaron, digamos,
mujeres comparables. 25-35 horas a la semana, y luego aquellos que trabajan 15- 24 horas, y así
sucesivamente. Los analistas sensatos buscarán comparar cosas similares.
El diseño experimental normalmente logra la comparabilidad entre grupos mediante la
asignación aleatoria a los grupos. Los diseños transversales buscan lograr la Si las diferencias de ingresos persisten entre hombres y mujeres cuando
comparabilidad mediante el cotejo (Capítulo 3) pero, dado que se basan en las comparamos (controlamos) las horas de trabajo, entonces sabemos que las
diferencias existentes y todos los datos se recopilan en un solo momento, el cotejo se diferencias iniciales de ingresos no se deben a las diferentes horas de trabajo
realiza en la etapa de análisis de datos, después de que se recopilan los datos y no de hombres y mujeres.
antes. .
Aunque puede haber otros factores que puedan afectar las diferencias de
Este emparejamiento siempre será un medio limitado y menos adecuado que la ingresos entre hombres y mujeres, nuestro análisis al menos eliminará las horas
asignación aleatoria para lograr la comparabilidad del grupo. Solo podemos emparejar de trabajo como explicación de las diferencias de ingresos. Podríamos querer
en relación con las variables sobre las que se ha recopilado información. Esto significa comparar las diferencias de ingresos entre hombres y mujeres de ocupaciones
similares. Podríamos controlar por ocupación (emparejar) y comparar hombres
profesionales con mujeres profesionales, hombres oficinistas con mujeres oficinistas, y
así sucesivamente. Si hombres y mujeres en el mismo tipo de trabajo tienen ingresos Múltiples controles estadísticos
diferentes, entonces tendríamos que decir que las diferencias de ingresos entre hombres
y mujeres no se deben a los diferentes tipos de trabajos que tienen hombres y mujeres. El análisis más fuerte ocurre cuando es factible emparejar un conjunto completo
de variables simultáneamente. Cuantas más variables controlemos a la vez,
más similares serán los grupos que comparemos. Por ejemplo, podríamos
pensar que las diferencias de ingresos entre hombres y mujeres se deben a los
efectos acumulativos de las diferencias de género en las horas de trabajo, los
tipos de trabajos, la cantidad de experiencia laboral y los antecedentes
educativos. Trataríamos de eliminar todos estos factores de nuestras
comparaciones. de hombres y mujeres. Podríamos dividir nuestra muestra en
muchos grupos, de modo que un grupo podría ser de mujeres que trabajan a
tiempo completo en trabajos profesionales que tienen calificaciones terciarias y
tienen al menos 14 años de experiencia laboral. Estos podrían compararse con
un grupo comparable de hombres. Otro par de grupos podría ser similar al
anterior en todos los aspectos, excepto que los hombres y las mujeres tienen
trabajos comerciales. Se podrían comparar muchos otros pares de grupos. Al
controlar o eliminar las diferencias entre hombres y mujeres, podemos
responder la pregunta: '¿Cuándo Si todo lo demás es igual, ¿el género hace
alguna diferencia en los ingresos? Si, cuando todo lo demás es igual, los
hombres y las mujeres aún tienen ingresos diferentes, entonces tenemos
evidencia de discriminación de género. Esto significa que el género mismo es
responsable de las diferencias de ingresos. .Si cuando controlamos por un
conjunto de variables, las diferencias de ingresos por género desaparecen,
diríamos que las diferencias iniciales de ingresos se deben a las variables que
hemos controlado. Dicho de otra manera, diríamos que las variables
controladas explican las diferencias iniciales.

Por supuesto, no es posible controlar todas las variables posibles, por lo que
siempre existe la posibilidad de que cualquier diferencia de ingresos
relacionada con el género se deba a estas variables no controladas.

Hay una variedad de formas en que se realizan los controles estadísticos y


hay una variedad de formas de interpretar los diversos patrones de resultados
que se pueden obtener. Un método común para controlar las variables es la
técnica de elaboración.

La técnica de elaboración
No hay espacio suficiente aquí para explorar todos los detalles de esta técnica.
Un excelente libro que describe completamente el método es el de Rosenberg,
The Logic of Survey Analysis (1968).
Enfoque básico

Sin embargo, se puede describir la estrategia básica y la lógica del análisis de


elaboración. ¿Hay cinco pasos básicos?
1 Llevar a cabo el análisis bivariado Examinará la relación entre la variable independiente correlaciones, tablas o
y la dependiente (p. ej., género e ingresos). Este análisis puede ser en forma de
204
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 205

comparación de medias (Capítulo 6). La relación entre estas dos variables se llama Tabla 12.3 Tablas condicionales y de orden cero que indican la especificación
relación de orden cero.

2 Identifique una variable de control relevante (la tercera variable) Esta es la variable (a) Tabla de orden cero: relación de orden cero de género e ingreso
en la que está tratando de emparejar los grupos (según lo definido por las categorías
Todo género
de la variable independiente). A menudo se la denomina variable de prueba o variable
Z. Su selección de la tercera variable se basará en modelos teóricos y lo que espera Macho femenino
podría ser responsable de las relaciones de orden cero. Esto dependerá de si está
Low 40% 70%
proponiendo que la relación de orden cero es falsa (ver más abajo) o si está Income
proponiendo una relación causal indirecta (ver más abajo). 60% 30%
High
3 Dibuje un modelo de la relación que está proponiendo entre las tres variables
(vea la discusión a continuación). (b) Tablas condicionales: relación de género e ingresos controlando por ocupación

Cuello azul Género

4 Llevar a cabo el análisis Esto puede ser en forma de tablas, y/o correlaciones, o
Macho femenino
comparación de medias. Esencialmente, el análisis implica observar la relación entre
las dos variables iniciales (X e Y) por separado para cada categoría de la variable de 50% 70%
Bajo
control (Z). Estas relaciones se denominan relaciones condicionales. 50% 30%
Ingreso
5 Interpretar los resultados A continuación se analizan formas de interpretar los
diferentes resultados. Alto
Género
De cuello blanco

Interpretación
Masculi Femenin
no o

Hay cuatro formas principales de pensar e interpretar los resultados del análisis de
Bajo 20% 20%
elaboración, como sigue.
Ingreso 80% 80%
ESPECIFICACIÓN
Alto

En este enfoque comenzamos con una relación de orden cero y luego especificamos azul y condición de cuello blanco). La relación de orden cero parece ser
los subgrupos particulares a los que se aplica y no se aplica. Por ejemplo, existe una específica de grupos ocupacionales particulares más que general para todos
relación general entre el género y los ingresos, como se ilustra en la tabulación los grupos.
cruzada de orden cero en la Tabla 12.3: hay un mayor porcentaje de hombres que de
mujeres que tienen altos ingresos. Sin embargo, cuando controlamos por ocupación Cuando la relación inicial se cumple para algunas categorías de la variable de
control (ocupación en este caso) pero no para otras, se dice que la variable
(cuello azul y cuello blanco) y observamos ambos grupos ocupacionales por
independiente y la variable de control interactúan: es decir, la combinación de las dos
separado, encontramos que la relación de orden cero no se mantiene variables puede crear un efecto particular. (es decir, ser mujer y azul
consistentemente dentro de cada grupo ocupacional. Las tablas separadas para
cuello azul y cuello blanco collar se denominan tablas condicionales: muestran la
relación entre el género y los ingresos en diferentes condiciones (condición de cuello
ubicación (rural y urbana). Cuando se comparan hombres y mujeres en
general (la tabla de orden cero), hay una brecha del 30 por ciento entre
collar) que ninguno crea por sí solo. El concepto de interacción se ha discutido anteriormente en hombres y mujeres (el 60 por ciento de los hombres frente al 30 por ciento de
este libro (Capítulo 4). las mujeres tienen ingresos altos). El mismo patrón persiste entre los
hombres y mujeres rurales y también entre los hombres y mujeres urbanos.
REPLICACIÓN
En otras palabras, la relación de orden cero se replica dentro de cada
categoría de la variable de control.
La replicación ocurre cuando la relación de orden cero persiste en cada categoría de
la variable de control. Cuando esto ocurre, la variable de control no es responsable de Cuando ocurre este patrón, se dice que la relación de orden cero no se
la relación inicial de orden cero. En el ejemplo de la Tabla 12.4 se ha controlado la debe a la variable de control.
206
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 207

Tabla 12.4 Tablas condicionales y de orden cero que ilustran la replicación


Controlando por horas
relación de orden cero

Figura 12.1 Modelo causal de relación causal indirecta entre género e ingreso
(a) Tabla de orden cero: relación de orden cero de género e ingreso
relación inicial se debió a la variable horas de trabajo como se representa en la figura.
Todo género
Esto también se ilustra en las tabulaciones cruzadas de la Tabla 12.5. En este caso,
Macho
femenino la relación de orden cero muestra que un mayor porcentaje de hombres que de
40% 70% mujeres tienen altos ingresos (55 por ciento versus 40 por ciento). timers muestra que
Low
Income High 60% 30%
prácticamente el mismo porcentaje de hombres que de mujeres tienen altos ingresos
(31 por ciento frente a 33 por ciento). Del mismo modo, entre los trabajadores a tiempo
completo, el mismo porcentaje de hombres y mujeres son personas con altos ingresos
(b)Conditional tables: relationship of gender and income controlling forlocation (65 por ciento frente a 65 por ciento). En otras palabras, en este ejemplo hipotético,
cuando hombres y mujeres tienen horas de trabajo comparables, las diferencias de
ingresos entre hombres y mujeres desaparecen. La relación de orden cero se debe a la
Rural Gender relación entre género y horas de trabajo y la relación entre horas de trabajo e ingresos.
El hecho de que hubiera muchas más mujeres a tiempo parcial que hombres a tiempo
Male Female
parcial en la muestra generó la correlación entre género e ingresos. Si la muestra
50% 80% hubiera tenido el mismo número de hombres y mujeres a tiempo parcial, no habría
Low
Income 50% 20%
aparecido la relación inicial entre género e ingresos.
High

género urbano

Masculino
Femenino

30% 70%

70% 30%
Income
High
RELACIONES CAUSALES INDIRECTAS
FALSO
El análisis de elaboración también se puede utilizar para aclarar la naturaleza de la Una relación espuria es aquella en la que la correlación entre dos variables no
relación de orden cero. En este caso podríamos estar afirmando que el género afecta se debe a ninguna relación causal entre ellas, sino a que ambas variables
casualmente los ingresos. Pero podríamos querer saber por qué mecanismos tiene este están relacionadas o son resultados de alguna tercera variable (Capítulo 3).
efecto. ¿El género afecta los ingresos porque el género afecta las horas de trabajo, lo Por ejemplo, supongamos que las personas que asisten a escuelas religiosas
que, a su vez, afecta los ingresos (Figura 12.1)? Aquí estamos controlando por horas de son más religiosos que los que asisten a escuelas seculares. ¿Si esta relación
trabajo para ver si la relación entre horas de trabajo y género se debe a la relación entre se debe a que las escuelas religiosas hacen a las personas más religiosas o
género y horas de trabajo y la relación entre horas de trabajo e ingresos. Si la relación es porque ambos factores son producidos por algún tercer factor?
entre género e ingresos desaparece entre aquellos con horas de trabajo comparables,
entonces diríamos que el En este ejemplo, el modelo propone que la razón de la relación entre el tipo de
escuela y la religiosidad no es que una sea la causa de la otra, sino que es más
probable que los padres religiosos envíen a sus hijos a escuelas religiosas que los
padres no religiosos (Figura 12.2). ). Los padres religiosos también tienen más
probabilidades de criar hijos religiosos. Por lo tanto, la razón por la cual los jóvenes en
las escuelas religiosas son más religiosos que los de las escuelas seculares es porque
los padres religiosos envían a sus hijos a esas escuelas y crían niños religiosos.

Resultados como los de la Tabla 12.6 serían consistentes con esta


interpretación. La relación inicial desaparece cuando se controla por
208
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 209

Tabla 12.5 Tablas condicionales y de orden cero que ilustran una relación causal indirecta
Cuadro 12.6 Cuadros condicionales y de orden cero que ilustran una relación espuria
relación
(a) Tabla de orden cero: relación de orden cero de género e ingreso (a) Tabla de orden cero: relación de orden cero del tipo de escuela y la religiosidad

Todos
Género Todos Tipo de escuela

Macho femenino Religioso Secular

Bajo 45% 60% 48% 71%

55% 40% infantil


Ingreso 52% 29%

1000 1000 religiosidad


Alto 800 800

norte Bajo

Alto

norte

(b)Tablas condicionales: relación de género e ingresos controlando por horas de trabajo (a)Tablas condicionales: relación de tipo de escuela y religiosidad controlando la religiosidad de los
padres

Tiempo parcial
Género padres religiosos Tipo de escuela

Masculino Femenino
Religioso Secular
Bajo
69% 67%
Bajo 35% 37%
Ingreso infantil
31% 33% sesenta y
Alto religiosidad Alto cinco%
63%

300 800
norte nort 600 200
e

Tiempo completo
Género Padres no religiosos Tipo de escuela

Masculino
Femenino Religioso
Secular

Bajo
35% 35% Bajo 85% 82%
Ingreso infantil
sesenta y sesenta y Alto 15% 18%
Alto cinco% cinco% religiosidad
nort 200 600
norte 700 200 e

Control de la religiosidad de los padres


religiosidad de los padres. Entre aquellos con padres religiosos vemos el
mismo nivel de religiosidad entre los niños, independientemente del tipo de
escuela a la que asistieron: el 65 por ciento de los niños en escuelas
religiosas eran muy religiosos en comparación con el 63 por ciento de los de
escuelas seculares. El patrón se repite entre aquellos con padres no
religiosos: el 15 por ciento de los niños que asistían a escuelas religiosas
eran religiosos en comparación con el 18 por ciento de los que asistían a
escuelas seculares.

RESUMEN DE INTERPRETACIÓN DE DISTINTOS PATRONES

Figura 12.2 Modelo que indica una relación indirecta entre el tipo de escuela y la La estrategia en el análisis de elaboración es comparar el patrón en la
religiosidad de los estudiantes relación de orden cero con el de las relaciones condicionales. los
017
1 Igual que orden cero Replicación Relación de orden cero Z1X→Y

no se debe a la variable de
Tabla 12.7 Interpretación de las relaciones condicionales en comparación con las relaciones de Z2 X→Y
prueba
orden cero
2 partidos Especificación Interacción entre Z1 X→Y
relación condicional Interpretación Ilustración
variable independiente y Z2 XY
en comparación con el orden
cero
variable de prueba; X solo
afecta

Y bajo condiciones
específicas Análisis multivariable

3 Orden inferior a cero espuria La relación de orden cero es X El análisis de elaboración es una forma simple de análisis multivariante.
Por lo general, se enfoca en el papel de una tercera variable en la
y variable de prueba no causal Z comprensión de una relación bivariada inicial. Otras formas de análisis
multivariante, como la correlación parcial, la regresión múltiple, el análisis
precede tanto a X como a Y discriminante, el análisis de ruta y el análisis logarítmico lineal, nos
permiten controlar varias otras variables simultáneamente. Varias formas
Y en el tiempo de análisis multivariante pueden permitir un análisis explicativo poderoso
e informativo de datos transversales.
4 Orden inferior a cero interviniendo La relación de orden cero es XZ→Y
1 Podemos eliminar los efectos de confusión de un conjunto de variables
y viene la variable de a la vez y concentrarnos en el efecto 'puro' de una variable independiente.
causal causal pero mediada por
prueba Cuantas más variables podamos controlar a la vez, más válida se vuelve
relación la variable interviniente nuestra comparación de grupos, y más seguros podemos estar de que
entre X e Y
cualquier efecto observado de una variable independiente se debe a esa
en el tiempo (variable de prueba) variable y no a los efectos de confusión de otras variables.
2 Estas técnicas de análisis multivariante pueden informarnos sobre el
efecto conjunto de un conjunto de variables independientes.
3 Al controlar un conjunto de variables simultáneamente, estas
La comparación proporciona la clave para interpretar la forma en que la variable de técnicas multivariantes nos permiten examinar el efecto discreto de cada
control afecta la relación original. La tabla 12.7 proporciona un resumen simple de las variable dentro de un conjunto de variables independientes . Si bien el
formas de interpretar la comparación entre las relaciones de orden cero y las relaciones género, la educación y las horas de trabajo pueden tener algún efecto
condicionales. sobre los ingresos, el análisis multivariado nos permite explorar cuánto
tiene cada uno independientemente de los demás. Esta estrategia nos
Problemas con el modelo de elaboración permite identificar la importancia relativa de cada una de un conjunto de
El modelo de elaboración tiene una serie de problemas que pueden limitar su utilidad
variables independientes.
como forma de controlar las variables en el análisis transversal. 4 Las técnicas multivariadas permiten la prueba de modelos causales, así
Un problema importante es que este tipo de emparejamiento requiere muestras muy
como el impacto de variables individuales. Al probar modelos, estas
grandes. Debido a que implica subdividir la muestra en grupos separados para cada
técnicas pueden ser efectivas para ayudar a identificar procesos causales
categoría de la variable de prueba, podemos terminar rápidamente con grupos bastante
o al menos para evaluar qué tan bien se ajusta un modelo a un conjunto
pequeños para el análisis. Si la variable de prueba tiene, digamos, cinco categorías,
de datos transversales.
cada subgrupo puede ser pequeño. Si queremos emparejar dos variables a la vez, este
Aquí no hay espacio suficiente para describir las diversas técnicas
problema se complica. Las dificultades creadas por quedarse sin casos son tan graves
que esta forma de análisis se limita con frecuencia a emparejar una sola variable a la
multivariantes. Hay disponibles muchas introducciones simples pero
vez. sofisticadas (Kerlinger y Pedhazur, 1973; Tabachnick y Fidell, 1983;
Grimm y Yarnold, 1995).
Además de quedarse sin casos, los resultados obtenidos de los análisis de
elaboración pueden volverse muy complejos y difíciles de interpretar. Cuando tenemos
muchas tablas condicionales diferentes, la lógica involucrada en la interpretación de los Análisis de cohortes
patrones variables puede volverse muy compleja. Puede volverse extremadamente
difícil explicar y presentar los resultados de cualquier cosa que no sean los análisis de Los diseños transversales están limitados en la medida en que pueden
elaboración bastante simples. proporcionar información sobre el cambio a lo largo del tiempo. Sin embargo, los
estudios transversales repetidos pueden proporcionar información valiosa sobre el cambio es atribuible a los efectos de período, envejecimiento y efectos de cohorte
cambio. El análisis de cohortes puede usar una serie de estudios transversales repetidos (Capítulo 7).
para describir el cambio agregado. a lo largo del tiempo e identificar en qué medida este
212
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 213

La conclusión que uno sacaría es que a medida que las personas


Por ejemplo, podríamos querer estudiar los cambios en la asistencia a la iglesia. Esto se envejecen aumentan su asistencia a la iglesia. Esto es consistente
puede lograr mediante la construcción de lo que Glenn (1977) llama una tabla de cohortes independientemente de los años que se examinen o del grupo de edad
estándar. examinado.

Construcción y lectura de tablas de cohortes

Cuando se ha realizado una serie de encuestas igualmente espaciadas (por ejemplo, un censo
de población cada 10 años), se puede construir una tabla de cohortes estándar. Para construir la
tabla estableceríamos un lapso de cohorte de edad que es igual al intervalo entre cada encuesta.
Por lo tanto, si los datos se recopilaran cada 10 años, podríamos establecer cohortes de edad de
20-29, 30-39, 40-49, etc.

La tabla constaría de cohortes de edad en el lateral y años de recopilación de datos en la parte


superior. En cada celda de la tabla, insertaríamos la información relevante que se aplica a la
cohorte de edad en particular en el año en particular. Si la variable dependiente fuera la
asistencia a la iglesia, cada celda contendría alguna medida de la asistencia a la iglesia (por
ejemplo, el porcentaje de asistencia a la iglesia al menos una vez al mes, el número promedio de
veces que las personas de ese grupo de edad asisten a la iglesia cada año, una medida de
variación con respecto a la asistencia a la iglesia o alguna otra manera de resumir la asistencia a
la iglesia) para la cohorte de edad relevante para el año de estudio en particular (ver Tablas 12.8
a 12.10).

Luego podemos leer la tabla de cohortes estándar de tres maneras diferentes para detectar
diferentes patrones de cambio.

EFECTOS DE ENVEJECIMIENTO

Los efectos del envejecimiento o los efectos del desarrollo son aquellos en los que el cambio es
atribuible al envejecimiento de las personas. Estos pueden detectarse leyendo la tabla de
cohortes estándar en diagonal desde la parte superior izquierda a la inferior derecha para
identificar las tendencias dentro de la cohorte. Leer las diagonales de la tabla nos permite ver
cómo una cohorte de edad en particular cambia a medida que envejece (Tabla 2.8). ¿Cómo han
cambiado como grupo de edad las personas que tenían 20 años en 1970 a medida que pasaron
a los 30 en 1980, a los 40 en 1990 y a los 50 en 1970? ¿construcción principios de siglo?

La tabla 12.8 muestra los efectos de envejecimiento perfecto. El diez por ciento de la cohorte
de jóvenes de 20 años en 1970 asistía a la iglesia al menos una vez al mes. Diez años más tarde,
cuando esta cohorte tendría unos 30 años de edad, la asistencia a la iglesia de esta cohorte
aumentó al 15 por ciento. Otros 10 años más tarde (1990) esta cohorte, ahora en sus 40 años,
muestra un mayor aumento en la asistencia a la iglesia. El mismo patrón de envejecimiento se
puede ver en cualquier diagonal descendente de izquierda a derecha.
EFECTOS DEL PERÍODO

Tabla 12.8 Tabla de cohorte del porcentaje de asistencia a la iglesia por lo menos mensualmente Los efectos claros del período son evidentes si, dentro de un año en
por cohorte de edad y año, 1970-2000: efectos de la edad en 8 particular, no hay diferencias entre los grupos de edad (es decir, dentro de
una columna), pero hay diferencias entre cada columna. En la tabla 12.9
vemos que en 1970 todos los grupos de edad tenían la misma proporción de
Año de recopilación de datos
asistentes regulares a la iglesia. Los grupos de edad eran indistinguibles.
Esta irrelevancia de la edad persiste en cada década. Los efectos del período
1990
son evidentes al observar la tendencia en las columnas. En cada década
Grupo de edad 1970 1980 2000
cambia la proporción de asistentes regulares, y cambia de forma idéntica
para cada grupo de edad.
20-29 10 10 10
10 Un examen de estos efectos de período nos permite ver cómo las personas dentro
del mismo grupo de edad difieren en diferentes períodos. Así, en la tabla 12.9 podemos
15 15 ver que las personas de 20 años en 1970 son bastante diferentes de las que tenían 20
30-39 15
15 años a principios de siglo. El grupo de edad es constante: el período en el que vive este
grupo de edad es diferente.
40-49 20 20 20 20
EFECTOS DE COHORTE
50-59 25 25 25 25
Los efectos de cohorte son evidentes en la Tabla 12.10. Es decir, dentro de un año
dado, los grupos de edad tienen diferentes proporciones de asistentes regulares: el
69-09 30 30 30
grupo de edad hace una diferencia en el nivel de asistentes frecuentes.

70-79 35 35 35 35

214
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 215

50-59 25 20 15 10
Tabla 12.9 Tabla de cohorte del porcentaje de asistencia a la iglesia por lo menos mensualmente
por cohorte de edad y año, 1970-2000: efectos del período 25 20 15 10
60-69

70-79 25 20 15 10
Año de recopilación de datos

Grupo de edad 1970 1980 1990 2000

20-29 25 20 15 10 Tabla 12.10 Tabla de cohortes del porcentaje de asistencia a la iglesia por lo menos
mensualmente por cohorte de edad y año, 1970-2000: efectos de cohorte
30-39 25 20 15 10

40-49 25 20 15 10 Año de recopilación de datos


Grupo de edad 1970 1980 1990 2000

Los efectos de cohorte son evidentes cuando hay un cambio dentro de una
20-29 25 20 15 10
columna y dentro de las filas, y la dirección del cambio en una columna (por ejemplo,
30-39
de un porcentaje bajo a uno alto) es opuesta a la dirección del cambio dentro de las
25 20 15
30 filas (por ejemplo, de un porcentaje alto a uno bajo). centavo).

40-49
35 30 25 20 Si bien una tabla de cohortes puede ser muy útil para identificar los efectos del
envejecimiento, el período y la cohorte, existe una dificultad importante con este
50-59
35 30 25 enfoque. Es imposible aislar completamente un efecto 'puro' de envejecimiento,
40
período o cohorte (Glenn, 1977: 130). Cualquier tabla que demuestre un tipo de efecto
40
invariablemente muestra otro tipo de efecto. Por ejemplo, la tabla 12.8, que fue
60-69 45 35 30
diseñada para ilustrar los efectos del envejecimiento (cambio en la diagonal), también
70-79 muestra los efectos de cohorte (cambio en la columna). La tabla 12.9, diseñada para
50
45 40 35
mostrar los efectos del período (cambio entre columnas), también muestra los efectos
del envejecimiento. La tabla 12.10 se diseñó para mostrar los efectos de cohorte, pero
también muestra los efectos de período. Si bien no es posible desagregar estos
efectos, podemos, sin embargo, ver la ausencia de efectos particulares y la
posibilidad de otros efectos.

ENCUESTAS ESPACIADAS DESIGUALMENTE

Desafortunadamente, no siempre podemos darnos el lujo de realizar


estudios a intervalos de tiempo convenientes o espaciados uniformemente.
Cuando estas condiciones no prevalecen, debemos modificar la forma en
que se construyen la tabla de cohortes y las cohortes de edad. Esto se
ilustra en la Tabla 12.11.

Para construir esta tabla, primero establecemos nuestros anchos de cohorte para
el primer año, 1979 (en este caso, franjas de edad de 10 años). Para el año de la
próxima recopilación de datos (1984), construiremos cohortes de edad del mismo
espacio de edad (es decir, 10 años), pero los límites inferior y superior de la cohorte
se ajustarán al intervalo entre las recopilaciones de datos. Se utilizaría el mismo
procedimiento para ajustar las cohortes entre cada fase de recopilación de datos.

Por ejemplo, la cohorte 1 en 1979 comprendía el grupo de edad de 20 a 29 años


(lapso de 10 años). La siguiente recopilación de datos fue en 1985 (cinco años
después). Para rastrear la cohorte inicial de 20 a 29 años cinco años después,
identificamos el grupo de edad de 25 a 34 años en 1984. La cohorte comparable dos
años después en 1986 será 27-36. Tres años después, en 1989, la cohorte
comparable será 30-39 años. La estrategia básica implica establecer un lapso de
edad fijo para la cohorte y luego ajustar las edades inferior y superior para la cohorte
equivalente a la brecha entre las recopilaciones de datos.

Esta tabla de cohortes debe leerse de forma un poco diferente a la tabla de


cohortes estándar:

1 Para identificar los efectos del envejecimiento, leemos a lo largo de las filas en lugar
de a lo largo de una diagonal de cohorte. En este caso, podemos ver un efecto de
envejecimiento a medida que aumenta el porcentaje de asistentes regulares a medida
que rastreamos la cohorte de edad en encuestas sucesivas.
216
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 217

compararíamos en cada fila. Las columnas serían las mismas que en la


Tabla 12.11 Tabla de cohortes para encuestas espaciadas irregularmente: envejecimiento y primera tabla y también podrían usarse para detectar los efectos del nivel de
efectos de cohorte para el porcentaje de asistencia regular a la iglesia (al menos mensual) edad. En esta tabla, debido a que los intervalos de edad no son los mismos
que los intervalos entre los años de recolección de datos, no podemos usar
la diagonal para rastrear los efectos del envejecimiento.
Año

1979 1984 1986 1989 1996 2000

Cohorte 1 Edad 20-29 25-34 27-36 30-39 37-46 40-49

15% 17% 18% 20% 23% 24%

Cohorte 2 Edad 30-39 35-44 37-46 40-49 47-56 50-59

17% 19% 20% 22% 25% 26%

Cohorte3 Edad 40-49 45-54 47-56 50-59 57-66 60-69

21% 23% 24% 26% 29% 30%

Cohorte 4 Edad 50-59 55-64 57-66 60-69 67-76 70-79

25% 27% 28% 30% 33% 34%

Cohorte 5 Edad 69-09 65-74 67-76 70-79 77-86 80-89

26% 28% 29% 31% 34% 35%

Fuente:adaptado de Glenn,1977:47

2 Para identificar los efectos de cohorte (nivel de edad), continuaríamos mirando


hacia abajo en una columna dentro de un año determinado. En este caso, podemos
ver un efecto de cohorte ya que el porcentaje de asistentes regulares dentro de
cualquier encuesta aumenta cuanto mayor es la cohorte de edad.

3 Para identificar cualquier efecto de período (cambios dentro de un nivel de edad a


lo largo del tiempo), necesitamos construir una segunda tabla en la que se
proporcionen los datos del nivel de edad de cada recopilación de datos (Tabla
12.12). En esta tabla, para identificar los efectos del período, simplemente
Problemas con el análisis de cohortes
Tabla 12.12 Tabla de cohortes para encuestas espaciadas irregularmente: efectos del período para el Si bien el análisis de cohortes puede ser una forma excelente de identificar
porcentaje de asistencia regular a la iglesia (al menos mensual) algunos de los patrones de cambio a nivel agregado a lo largo del tiempo sin
el gasto y las dificultades de recopilar datos de panel, enfrenta problemas
Año
importantes.

Grupo de Un problema es el poder explicativo limitado del análisis de cohortes. Se limita a


1979 1984 1986 1989 1996 2000
edad probar tres explicaciones diferentes del cambio: que cualquier cambio se debe a que
las personas envejecen, al período en el que se criaron o a los efectos de cohortes
15% 12% 10% 9% (diferencias entre grupos de edad). en un momento específico). Si bien el análisis de
20-29 14% 14% cohortes puede ser un medio eficaz para identificar el tipo y la dirección del cambio
(envejecimiento, período o cohorte), no nos ayuda a identificar por qué se produce ese
17% 14% 12% 11% tipo de cambio.
30-39 dieciséis% dieciséis%
En segundo lugar, existen problemas de comparabilidad: determinar si el
cambio medido refleja un cambio real o cambios en la metodología. en los
40-49 21% 20% 20% 18% dieciséis% 15%
análisis de cohortes son recopilaciones independientes, puede haber
cambios en la redacción de las preguntas, la codificación, el muestreo, los
50-59 25% 24% 24% 22% 20% 19%
métodos de recopilación de datos y similares entre los estudios que
dificultan la comparación de los patrones de respuesta a lo largo del tiempo.
60-69 25% 25% 23% 20%
26% 21% Las recopilaciones del censo, que pueden proporcionar un excelente
análisis de datos de cohortes, a menudo son culpables de cambiar las
preguntas, las definiciones y las categorías de codificación a lo largo del
tiempo. Esto puede crear dificultades para el análisis de cohortes.
218
DISEÑOS TRANSVERSALES

Resumen

Este capítulo ha proporcionado pautas para el análisis descriptivo y explicativo de los


datos generados por diseños transversales. No ha considerado las técnicas PARTE V
específicas, pero muchas de las pautas estadísticas provistas en el Capítulo 6 se
aplican al análisis transversal.

El capítulo consideró los problemas particulares del uso de datos transversales para el
DISEÑOS DE ESTUDIOS DE
análisis causal, problemas creados por la ausencia de una dimensión temporal en el diseño y la
falta de grupos de control aleatorios. La forma general de abordar estos problemas es en la
CASO
etapa de análisis más que en la etapa de diseño de la investigación. El capítulo describió la
lógica del uso de controles estadísticos y análisis multivariado para que los datos transversales
puedan ser útiles para el análisis causal. Luego describió una forma particular de análisis
multivariante, el análisis de elaboración, para proporcionar una comprensión de las formas en 13
que se pueden abordar los problemas del análisis causal. Finalmente, el capítulo discutió un
método para analizar datos de estudios transversales repetidos. En particular, se centró en el
análisis de cohortes: cómo construir e interpretar tablas de cohortes y ser consciente de los DISEÑO DE ESTUDIO DE CASO
límites de este tipo de análisis.
Durante muchos años, el estudio de caso ha sido el patito feo del diseño de investigación. La 1955). La investigación educativa, la investigación de evaluación y la investigación
mayoría de los textos sobre métodos de investigación ignoran los estudios de caso o los organizacional han hecho un amplio uso de los estudios de caso para fomentar su
confunden con otros tipos de investigación social. de vista - como opciones 'suaves'. Algunos desarrollo.
comentaristas creen que los estudios de casos deben usarse solo para investigación
exploratoria: para generar hipótesis para futuras pruebas con diseños de investigación más La falta de una discusión sistemática de los diseños de estudios de casos ha
rigurosos. comenzado a abordarse en los últimos tiempos. Yin (1989; 1993) ha brindado un
tratamiento particularmente útil de los diseños de estudios de casos y una poderosa
La metodología del diseño de estudios de casos no se ha descuidado porque los estudios de defensa de su valor.
casos no hayan tenido importancia en las ciencias sociales. De hecho, han sido fundamentales
para el desarrollo sustantivo y metodológico de las ciencias sociales. En la antropología social, Este capítulo examina una variedad de formas de desarrollar diseños de estudios
los estudios de las tribus han sido estudios de caso por excelencia. Los estudios comunitarios de casos. Esta es una tarea diferente a la emprendida para los diseños
como Middletown de Lynds (1929) y los estudios de grupos pequeños como Street Corner experimentales, longitudinales y transversales porque, como señala Yin, "a diferencia
Society de Whyte (1943) han hecho importantes contribuciones al desarrollo de la sociología de otras estrategias de investigación, el "catálogo" potencial de diseños de
como disciplina. El psicoanálisis ha prosperado con un enfoque de estudio de caso (Freud, investigación aún no se ha desarrollado" (1989: 27).

220
DISEÑOS DE ESTUDIOS DISEÑO DE ESTUDIO DE 221
DE CASO CASO

Algunos casos constan de múltiples niveles o componentes. Por ejemplo, una


¿Qué es un caso? escuela como caso incluye personal docente, personal administrativo, personal en
diferentes niveles de antigüedad y experiencia, estudiantes, estudiantes en diferentes
Unidades de análisis niveles de año, padres, miembros del gobierno y de la comunidad, etc. Una escuela
puede concebirse de en el nivel 'holístico' donde nos enfocamos en las características
Un caso es el 'objeto' de estudio. Es la unidad de análisis (ver Capítulo 2) sobre la
de la escuela que se aplican a ese nivel. La escuela existe como una entidad y tiene
cual recopilamos información. En los diseños de estudio de caso es la unidad que características de nivel escolar (por ejemplo, tamaño, tipo de escuela, ubicación,
buscamos comprender como un todo. La unidad de análisis puede ser una cultura de la escuela, un conjunto de reglas, una estructura, un sistema de gestión,
persona sobre la que tratamos de construir una comprensión que esté informada una filosofía de la escuela, fortalezas y debilidades). Pero también hay muchos
por el contexto en el que se desarrolla todo el caso. subniveles de elementos a la escuela. Solo se obtendría una imagen completa de la
escuela en toda su complejidad si recopilamos información de una amplia gama de
Pero los estudios de casos no se limitan a los individuos. Podemos seleccionar muchos elementos constitutivos (unidades integradas) de la unidad más grande.
otros tipos de casos - unidades de análisis. Un matrimonio, una familia o un hogar pueden
servir como caso. Lugares tales como un bloque de casas, una comunidad residencial, una Un matrimonio proporciona otro ejemplo. En el nivel holístico, trataríamos el
región o un país, todos pueden servir como casos; al igual que organizaciones como una matrimonio como un todo en términos de duración, etapa, tipo, nivel de conflicto e
empresa, una escuela, un departamento gubernamental o un sindicato. Un caso puede ser intimidad, igualdad, modos de interacción, etc. También podríamos tratar al esposo y
un evento como un divorcio en lugar de la persona que se divorcia. Alternativamente, una la esposa como unidades incrustadas. y construir una imagen mucho más completa y
decisión (por ejemplo, decisiones sobre la reducción de una organización) podría ser el diferente del matrimonio al incorporar las experiencias y perspectivas del esposo y la
unidad de análisis para el estudio de caso. El estudio de caso podría involucrar la esposa (subunidades).
comprensión de la decisión como un todo, examinando el proceso mediante el cual se
tomó, los participantes, las consecuencias, etc. Los períodos de tiempo podrían ser la
unidad de análisis. Podríamos estudiar las décadas de 1960 o 1990: cada una de ellas
puede ser la 'cosa' sobre la que recopilamos información.

Unidades de análisis holísticas e integradas

Es útil distinguir entre casos como un todo y casos que constan de varios niveles o
componentes. Yin (1989) utiliza los términos diseños "holísticos" e "incrustados" para
referirse a esta distinción.
interesante, la tarea del investigador de estudios de casos es fundamentalmente
teórica. La recopilación y el análisis de información de los estudios de casos deben
Un estudio de caso bien diseñado evitará examinar solo algunos de los elementos guiarse por la teoría.
constitutivos. Construirá una imagen del caso teniendo en cuenta la información obtenida
de muchos niveles. El caso de estudio final nos dirá más y cualitativamente diferente de lo Casos de estudio explicativos
que cualquier elemento constitutivo del caso podría decirnos. En el caso de una escuela,
Los diseños de estudios de casos difieren de los diseños discutidos anteriormente en
las percepciones obtenidas de los estudiantes, maestros, padres, administradores y
este libro en que buscan lograr explicaciones más complejas y más completas de los
miembros de la comunidad probablemente difieran y, cuando se toman en conjunto,
fenómenos. Buscan lograr explicaciones tanto ideográficas como nomotéticas (véase
proporcionen una comprensión mucho más completa y compleja del todo que la
el capítulo 14). También difieren en la forma en que tratan de lograr explicaciones
perspectiva proporcionada por cualquier elemento en particular. del caso El todo es mayor
causales (véanse los capítulos 14 y 15).
que la suma de sus partes.
La investigación de estudios de casos en ciencias sociales debe tener una
Dado que muchos casos consistirán en diferentes elementos, es posible que se
dimensión teórica. Sin una dimensión teórica, un estudio de casos será de poco valor
requieran diferentes métodos de recopilación de datos para los diferentes elementos. Una
para una generalización más amplia, uno de los objetivos de la investigación en
encuesta de estudiantes podría ser apropiada; También puede valer la pena observar las
ciencias sociales. Esta sección considera tres formas en las que se usa la teoría en
aulas y las reuniones del personal, mientras que las entrevistas pueden ser una buena
diseñar estudios de casos.
manera de obtener información de los maestros. Un análisis de los registros y archivos
escolares podría proporcionar información útil sobre el contexto histórico en el que opera la PRUEBAS DE TEORÍA
escuela.
Este enfoque, que Yin (1989) considera que está en el centro de los estudios de
casos, comienza con una teoría, o un conjunto de teorías rivales, con respecto a un
Casos prácticos y teoría fenómeno particular. Sobre la base de una teoría, predecimos que un caso con un
conjunto particular de características tendrá un resultado particular. La teoría puede
Aunque algunos investigadores de estudios de casos llevan a cabo estudios de casos como
ser simple o compleja.
si sólo tuvieran que recopilar los hechos sobre el caso y escribir sobre ellos de una manera
222
DISEÑOS DE ESTUDIOS DISEÑO DE ESTUDIO DE 223
DE CASO CASO

escuela (incluidos los 'elementos integrados', como maestros, administración,


Por ejemplo, el estudio de caso podría comenzar con la siguiente pregunta: '¿Cuál es el padres, estudiantes anteriores y actuales), construiríamos una imagen de la calidad
efecto del control delegado del personal basado en la escuela sobre la calidad de la educación de la educación en la escuela (como sea que se defina) y trazaríamos cualquier
en una escuela?' personal, así como la fijación de los niveles salariales y las condiciones de vínculo. que existen entre la calidad educativa y el sistema de dotación de personal.
enseñanza. Los sistemas de dotación de personal delegado pueden contrastarse con los Si es posible, recopilaríamos datos históricos relacionados con el tiempo anterior a la
sistemas centralizados en los que los burócratas del servicio público gestionan estos asuntos introducción del sistema delegado para ver si hubo evidencia de mejora después de
de dotación de personal a nivel de la oficina central. Podríamos comenzar con la proposición de su introducción. También buscaríamos identificar qué más estaba sucediendo en la
que el control delegado producirá resultados educativos mucho mejores que el control escuela que podría haber llevado a mejoras en la calidad de la educación o factores
centralizado. El razonamiento sería que el control local hace que las personas sean mucho más que podrían haber impedido mejoras a pesar de la introducción del sistema
responsables, permite que una escuela construya un perfil de personal adecuado a sus descentralizado.
necesidades y hace que sea mucho más fácil recompensar al personal que logra los resultados
deseados por la escuela. La teoría implícita aquí es que la calidad educativa es El objetivo del estudio de caso sería ver si la teoría realmente funcionó en una
fundamentalmente el resultado de la calidad del maestro (en contraposición a la naturaleza de situación de la vida real. Si funcionó, entonces la teoría está respaldada (no probada).
Si no funcionara, buscaríamos comprender, a partir de un análisis cuidadoso del
los estudiantes, los recursos escolares, la estructura organizativa, la participación de los
padres) y que la calidad del maestro es una función de la responsabilidad del maestro y del caso, por qué no se produjo el resultado previsto (mejor educación). ¿Es porque la
'ajuste' del maestro con el escuela. teoría está completamente equivocada? ¿La teoría requiere algún refinamiento? ¿La
teoría es aplicable sólo bajo circunstancias específicas?
La selección de un caso para probar esta teoría nos llevaría a encontrar una escuela que
haya introducido un sistema de dotación de personal descentralizado. Al investigar a fondo la En lugar de esta simple proposición, podríamos desarrollar un modelo más
complejo que especificara lo que sucedería con la introducción de un sistema de
dotación de personal delegado. El modelo podría anticipar efectos positivos en aspectos
particulares de los resultados educativos y efectos negativos en otros. Puede especificar
efectos positivos solo después de un período de tiempo determinado, y solo cuando el sistema Independientemente de la complejidad de la teoría, este enfoque de los estudios
delegado se implementa de una manera particular (por ejemplo, con una consulta completa a de casos comienza con un conjunto de expectativas derivadas de investigaciones y/o
los maestros y la comunidad, con controles y equilibrios apropiados). En otras palabras, la teorías previas. Abordamos el estudio de casos con el propósito de probar nuestra
teoría que especificamos podría anticipar que cuando se cumplen las condiciones A+B+C+D, el teoría en una situación de la vida real. Claramente, la selección de la situación de la
sistema descentralizado logrará mejoras en los aspectos X e Y después de un período de N vida real (el caso) necesitaría coincidir con las condiciones bajo las cuales la teoría
años. propone resultados particulares (Capítulo 14).
ESTUDIOS DE CASOS DE CONSTRUCCIÓN DE TEORÍA
Usando un enfoque de construcción de teoría para estudios de casos, seleccionamos
casos para ayudar a desarrollar y refinar las proposiciones y desarrollar una teoría
que se ajuste a los casos que estudiamos. Por ejemplo, podríamos comenzar con la
proposición simple de que la introducción de sistemas delegados mejorará los
resultados educativos. Podríamos seleccionar una escuela en la que se haya
introducido dicho sistema y encontrar que los resultados educativos, de hecho,
mejoraron. Entonces podríamos encontrar una escuela en la que la introducción del
sistema de delegación de personal no produjo mejores resultados educativos. ¿Por
qué produjo buenos resultados en algunos casos y no en otros?

Nuestro análisis de cada caso apuntaría a resaltar las diferencias entre los casos
en los que funcionó y no funcionó. Nuestro análisis también identificaría los puntos en
común entre los casos en los que la delegación de personal tuvo éxito y los puntos en
común entre los casos en los que no tuvo éxito (por ejemplo, la forma en que se
implementó el sistema). Estos estudios de caso podrían usarse para desarrollar un
conjunto de proposiciones sobre las condiciones y el contexto. bajo el cual los
sistemas de dotación de personal delegados conducen a mejoras (Capítulo 15).

La diferencia entre los enfoques de prueba de teoría y construcción de


teoría es que en el primero comenzamos con un conjunto de proposiciones
bastante específicas y luego vemos si funcionan en situaciones del mundo
real. En el modelo de construcción de teoría, comenzamos con solo una
pregunta y tal vez una proposición básica, observamos casos reales y
terminamos con una teoría más específica o un conjunto de proposiciones
como resultado del examen de casos reales.
ESTUDIOS DE CASOS CLÍNICOS

Mientras que los dos enfoques de estudio de caso anteriores se centran en la teoría
en el sentido de que el objetivo es utilizar el caso para probar, refinar y desarrollar
generalizaciones teóricas, el estudio de caso clínico utiliza teorías de manera muy
diferente. Los estudios de caso clínico se centran en casos. entender un caso.

La forma en que un médico trata a un cliente ilustra este estilo de estudio de caso.
Un niño puede visitar a un psicólogo porque se está desempeñando mal en la escuela
y se ha vuelto disruptivo. La tarea del psicólogo clínico es averiguar qué está pasando
en este caso y por qué está pasando. Un buen clínico comenzará con los síntomas: ¿
qué está pasando en la escuela? ¿ En qué áreas de la escuela se está
desempeñando mal el niño? Sin duda, el médico tendrá una variedad de posibles explicaciones para el bajo rendimiento escolar y el comportamiento disruptivo en la escuela.
224
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 225
CASO CASO

El problema en cualquier descripción es dónde empezar y dónde terminar. Esto es


información para construir una imagen de lo que está pasando. Ella desarrollará corazonadas especialmente así en los estudios de casos. Un estudio de caso trata con el caso
y recopilará más información para probar estas corazonadas. El psicólogo puede hacerle al completo
niño varias pruebas para establecer su cociente de inteligencia y cualquier discapacidad de
aprendizaje específica. El psicólogo hace esto para ver si encaja una explicación cognitiva de
las dificultades de aprendizaje. Los problemas de la vista o auditivos están contribuyendo a
sus problemas de aprendizaje. El psicólogo puede evaluar las habilidades de relación del niño
para establecer si los problemas en este ámbito contribuyen a las dificultades de aprendizaje.
Alternativamente, podría indagar en las relaciones familiares del niño para ver si algo que está
pasando en casa está creando problemas en la escuela. Quizás el niño y el maestro no se
lleven bien y los problemas surjan de sus dificultades de relación. También es posible que el
niño padezca ansiedad, depresión o algún otro síndrome clínico.

El punto es que el clínico tendrá una batería de posibles explicaciones para los problemas
del niño. Su tarea es construir una imagen completa del caso para poder evaluar qué
explicación se ajusta mejor a los hechos del caso. Habiendo diagnosticado correctamente la
naturaleza o la causa de los problemas del niño, el médico puede comenzar el tratamiento.

En este ejemplo, el objetivo es comprender el caso y resolver un problema para este caso.
El propósito no es probar o desarrollar teorías, sino usar las teorías existentes. El clínico
trabaja con hipótesis rivales plausibles y recopila información progresivamente para ayudar a
determinar cuál se ajusta mejor.

La misma lógica se puede aplicar en los estudios de casos de consultoría. Una


organización podría estar sufriendo una gran cantidad de conflictos y baja moral. Un consultor
puede tener una variedad de posibles explicaciones para esto y debe emprender la tarea de
recopilar información sobre la organización que pueda ayudar a establecer cuál de las
explicaciones se ajusta a esta organización en particular. El objetivo no es desarrollar una
teoría del conflicto organizacional y la pérdida de moral. sino identificar cuál de varias teorías
alternativas tiene más sentido en este caso particular.

Estudios de casos descriptivos


Aunque este capítulo y los dos capítulos siguientes se centran en estudios de casos
explicativos, es importante analizar los diseños de estudios de casos descriptivos. Es
importante considerar los estudios de casos descriptivos por dos razones. La primera es que,
a menos que podamos hacer buenas descripciones de casos, no estaremos en posición de
lograr buenas explicaciones usando esos casos. La segunda razón es que una discusión de
estudios de casos descriptivos destaca aún más la importancia de la teoría en la investigación
de estudios de casos.

DESCRIPCIÓN Y TEORÍA
atributos físicos, genéticos. Cada una de las descripciones refleja un enfoque
diferente de interés y una evaluación diferente de lo que es relevante para describir a
Aceptación de objetivos culturales. una persona.

Acepta Rechaza
TIPOLOGÍAS Y TIPOS IDEALES
conformistas Ritualistas LosAccepts
estudiosmeans of descriptivos
de casos Accepts pueden consistir en casos únicos o múltiples. Una
achieving
forma the goals
de reportar múltiples estudios de casos es usar tipologías y tipos ideales.
innovadores Retiradores Rejects teóricamente o empíricamente. Una tipología
Las tipologías pueden derivarse
derivada teóricamente es aquella que es lógica o teóricamente posible. Por ejemplo,
Merton (1968) desarrolló una tipología de tipos de desviados basada en las nociones
Figura 13.1 Tipología de desviaciones derivada teóricamente de metas culturales y medios institucionalizados para lograr esas metas (Figura 13.1).
Así, el conformista es una construcción teórica definida como alguien que acepta los
pero esto no puede significar que el estudio de caso consiste en todo sobre el caso. objetivos de la cultura y los medios por los cuales la cultura prescribe el logro de estos
Describirlo todo es imposible: debe haber un foco. objetivos. El innovador acepta los objetivos pero no los medios prescritos para
alcanzarlos. El ritualista rechaza los objetivos culturales pero, sin embargo, sigue el
La descripción no debe, de hecho no puede, ser ateórica. Siempre seleccionamos y comportamiento cultural prescrito. El retraído rechaza tanto las metas como los
organizamos lo que describimos. Las descripciones resaltarán aspectos del caso. Será más medios para lograr esas metas.
como una pintura de un paisaje que como una fotografía; será una interpretación más que una
imagen especular. Podríamos hacer esto usando teorías explícitas o categorías conceptuales Las tipologías construidas de esta forma deductiva representan un conjunto de
preexistentes, o usando teorías implícitas de qué es relevante y qué categorías son tipos ideales (Coser, 1977:223-4). Los tipos ideales son una descripción teórica de
importantes. Por ejemplo, cuando describo a una persona, como sociólogo, podría resaltar su conjuntos
personalidad, etnia, edad, género y similares porque los veo como los elementos críticos que
constituyen a una persona social. Otra persona, un biólogo, podría enfocarse mucho más en
226
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 227
CASO CASO

grupos de características. Sobre la base de estos elementos comunes,


de características que esperamos vayan juntas en un caso. Representan un tipo puro o caractericé los casos particulares como pertenecientes a un tipo particular.
teórico que no necesariamente se encuentra en esa forma pura en la realidad empírica. relaciones que denominé centradas en los padres, centradas en el niño,
Por ejemplo, aunque Weber identificó las características de una forma "pura" de remotas, interdependientes (de Vaus, 1994).
burocracia (Gerth y Mills, 1946: 196-204), es posible que no encontremos ejemplos de
burocracias reales que funcionen exactamente como postula Weber. Las características particulares de cada tipo no nos interesan aquí. El punto
es que las tipologías se pueden desarrollar de diferentes maneras, ya sea de
Las tipologías deductivas y los tipos ideales pueden proporcionar una forma útil de forma deductiva o inductiva. Independientemente de la forma en que se
analizar estudios de casos. El tipo ideal puede servir como criterio para comparar casos desarrollen, pueden proporcionar una plantilla útil para realizar, analizar e
reales (capítulo 15). La plantilla proporcionada por el tipo ideal puede guiar la forma en informar (Capítulos 14 y 15) estudios de casos descriptivos.
que investigamos el caso; puede guiar lo que buscamos.
TIPOLOGÍAS INDUCTIVAS
Otros elementos de los diseños de estudio de caso
Una tipología derivada inductivamente es aquella en la que comenzamos con una Al diseñar estudios de casos, hay una serie de elementos, además de los
pregunta y luego examinamos los casos a la luz de la pregunta. Una comparación de discutidos anteriormente, que se pueden incorporar al diseño.
casos puede entonces resaltar grupos de casos similares. Por ejemplo, comencé una
serie de estudios de casos con la pregunta: '¿Cómo se llevan los adultos con sus padres ¿Casos únicos o múltiples?
ancianos?' Estudié una variedad de casos y encontré que diferían en una variedad de
dimensiones (por ejemplo, nivel de conflicto, tensión, dependencia, equilibrio, disfrute, Un diseño de estudio de caso puede basarse en casos únicos o múltiples. El
intimidad e intrusión). Luego me di cuenta de que los casos tendían a exhibir distintos diseño de un solo caso normalmente será menos convincente que los diseños
de varios casos. Usando la lógica de la replicación (Capítulo 14), un solo caso
representa solo una replicación y no proporciona necesariamente una prueba dura de
una teoría. Sin embargo, es posible que tengamos pocas opciones. El acceso limitado a ejemplo. En otras situaciones podemos basarnos en un solo caso crítico. Esto
los casos o la naturaleza extrema del caso puede significar que solo podemos estudiar puede ser apropiado cuando tenemos una teoría clara con proposiciones bien
un único formuladas y tenemos un solo caso que cumple con todos los requisitos de la
teoría. Tal caso puede proporcionar una explicación moderadamente
convincente. prueba de una teoría compleja (Yin, 1989).

Casos múltiples, estratégicamente seleccionados, pueden proporcionar una prueba


mucho más dura de una teoría y pueden ayudar a especificar las diferentes condiciones
bajo las cuales una teoría puede o no ser válida. Además, los casos múltiples son
esenciales si los estudios de casos se utilizan con fines inductivos (ver Capítulo 15 sobre
inducción analítica). Con suficientes recursos y acceso a los casos, los diseños de casos
múltiples normalmente serán más poderosos y convincentes y proporcionarán más
información que los diseños de casos únicos.

Sin embargo, cuando se utiliza un diseño de casos múltiples, debemos


esforzarnos por tratar cada caso como un caso único para que podamos
establecer una descripción completa de ese caso antes de realizar
comparaciones entre casos. Se debe respetar la unidad del caso único ( Stake,
1994; Yin, 1989: 56-7).
¿Paralelo o secuencial?

Un diseño paralelo es aquel en el que todos los estudios de casos se realizan a


la vez (p. ej., diferentes investigadores, cada uno de los cuales realiza un
caso). Solo al finalizar la investigación de cada estudio de caso se realizan
comparaciones entre los casos. Esta estrategia puede ser apropiada cuando el
proyecto adopta un enfoque de prueba de teoría simple.

Un diseño secuencial es aquel en el que los estudios de casos se suceden


unos a otros. Utilizando este enfoque, un investigador podría, en principio,
realizar cada estudio de caso. Una ventaja del enfoque secuencial es que la
selección de cada caso y algunos de los temas examinados pueden basarse
en acertijos identificados en casos anteriores. Un caso puede arrojar ideas que
pueden influir en la selección de casos posteriores y que se pueden seguir
estos últimos casos (capítulos 14 y 15). Cuando se adopta un enfoque de
construcción de teoría más inductivo, un diseño secuencial es más apropiado
que un enfoque paralelo.
¿Retrospectivo o prospectivo?

La mayoría de los estudios de casos, y todos los estudios de casos


explicativos, incorporarán una dimensión temporal. Sin esta dimensión, no es
posible ninguna explicación causal adecuada. Los estudios de casos pueden
proporcionar una buena manera de mapear cuidadosamente la secuencia de
eventos, que es la base de las explicaciones causales. Hay que decidir si esta
dimensión temporal se obtiene de forma retrospectiva o prospectiva.

Un diseño retrospectivo consiste en recopilar, en una sola ocasión,


información relativa a un período prolongado. Esto requiere la reconstrucción
de la historia del caso. Esto podría hacerse mediante el uso de registros y documentos
de archivo, o entrevistas con personas que participaron u observaron eventos pasados.
228
DISEÑOS DE ESTUDIOS DE
CASO

Una clasificación cruzada de estos elementos da como resultado la posibilidad


Este diseño tiene los problemas obvios asociados con la pérdida de evidencia, la lógica de 64 variaciones diferentes de diseños de estudios de casos (Figura
reconstrucción del pasado a la luz del presente y el error en la secuencia en la que 13.2). Esta figura no se presenta para abrumar con la gama de posibilidades, ni
ocurrieron los eventos. Sin embargo, en muchas situaciones no hay más remedio para desarrollar 64 nombres diferentes para diferentes diseños de estudio de
que aprovechar la capacidad de las personas para recordar el pasado. Con los caso, sino para proporcionar una forma de pensar sobre diferentes alternativas
estudios de caso, el uso de múltiples fuentes de evidencia puede reducir los para dar forma a un diseño de estudio de caso. Las decisiones que se tomen en
problemas que acompañan a este enfoque. relación con estos seis elementos darán como resultado diferentes formas de
realizar el estudio de caso y de analizar los datos recopilados en el estudio.
Un diseño prospectivo implica el seguimiento de los cambios a lo largo del tiempo.
Tiene la ventaja obvia de permitir que el investigador observe los eventos a medida
que ocurren en lugar de depender de relatos parciales y reconstruidos. Según los
temas que se estén considerando y los tipos de casos, los estudios de casos
prospectivos pueden durar años. La desventaja obvia puede ser el tiempo y los
recursos requeridos. Estas restricciones pueden limitar severamente el número y el
rango de casos que se pueden estudiar. Esto, a su vez, puede resultar en pruebas
muy limitadas de una teoría.

Independientemente de si se adopta un enfoque retrospectivo o prospectivo, el


objetivo es construir una imagen clara y razonablemente detallada de la secuencia
en la que ocurrieron los eventos y del contexto en el que ocurrieron. Para construir
explicaciones causales significativas debemos obtener la secuencia y el contexto
correcto. Una explicación causal convincente podrá rastrear la 'historia' mediante la
cual uno (o un conjunto de) eventos terminaron produciendo un resultado particular.

Tipos de diseños de estudio de caso

A diferencia de otros tipos de diseño de investigación, todavía no existe un inventario


de los tipos de diseño de estudio de caso (Yin, 1989). Sin embargo, la discusión de
los elementos de los diseños de estudio de caso discutidos en este capítulo
proporciona una forma de pensar formas en que se pueden estructurar los estudios
de casos. Estos elementos son:

descriptivo o explicativo

prueba de teoría o construcción de teoría

caso único o caso múltiple

unidades de análisis integradas o holísticas

estudios de casos paralelos o secuenciales

retrospectivo o prospectivo.
d
¿Explicativo? Descriptivo Explicativo
r
Tiempo Retrospectivo Futuro Retrospectivo Futuro
norte

Orden de casos
gramo

C tu T
T
a norte
h mi
mi
mi metro
s i
s
o b
mi t

r mi
s s METRO i

y Paralela Secuencial Paralela Secuencial Paralela Secuencial Paralela Secuencial d


tu norte

d
yo gramo
T
mi
mi metro
mi
d B
metro i

s tu
pags
b
t tu i

mi yo

i norte
S
yo

mi
d
i norte i d

d
norte gramo C t
i

mi
gramo
a s norte

d B
yo
s gramo

mi tu
mi H T
tu
i
s o mi
C norte
yo

i
yo s
a
d

i
t
s
t

s s
i
mi norte
t
norte
gramo
i

gramo
C
T
B
mi
tu
H
s
i
o
t
yo

yo
i
d
i

norte
i
s

gramo norte
t

gramo
B
i

C
o

norte Figura 13.2 Variaciones de diseños de estudios de caso

230
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 231
CASO CASO
Lo que no es un estudio de caso Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2)

Antes de terminar este capítulo vale la pena decir lo que no son los diseños de estudio asignación a (X)
Prueba previa Post-prueba
de caso. grupos

No es el caso de estudio de una sola vez 'Experimental' Ninguna el grupo es medir en


La taxonomía de los diseños de investigación esbozada por Campbell y Stanley uniforme
grupo variable de
(1963) y por Cook y Campbell (1979) ha llevado a malentendidos sobre lo que puede
en términos de resultado
ser un diseño de estudio de caso. Usando la plantilla del diseño experimental clásico,
identifican un diseño al que se refieren. como el estudio de caso único. Esto se causal propuesta (Y)
representa esquemáticamente en la Figura 13.3.
variable
Como ejemplo sencillo de este tipo de diseño podríamos considerar un grupo de
niños cuyos padres se divorciaron en el último año y para los que obtuvimos una 'Grupo de control Ninguna Sin tratamiento Ninguna
medida de ajuste emocional. En efecto, este diseño consta únicamente de miembros
de un grupo "experimental" y se basa únicamente en la información "posterior a la
intervención".

Las discusiones anteriores sobre la lógica de los diseños experimentales,


longitudinales y transversales indican cómo este diseño no nos dice nada de valor Figura 13.3 Diseño de estudio de caso de una sola vez (un grupo, solo diseño posterior
sobre el impacto del divorcio de los padres en el ajuste emocional de los niños. No a la prueba)
podemos decir a partir de este diseño si los niños con padres divorciados están en de
alguna manera distintiva de otros niños, y si hay algún cambio en el ajuste emocional la lógica mediante la cual las hipótesis iniciales o las preguntas de investigación pueden
después del divorcio. someterse a pruebas empíricas. Decidir entre estudios de casos únicos o múltiples se
indica más adelante], seleccionar casos específicos para estudiar, desarrollar un
Representar este tipo de diseño como un ejemplo de diseño de estudio de caso es protocolo de estudio de casos y definir estrategias de recopilación de datos relevantes
desafortunado y proporciona una imagen engañosa del potencial de un diseño de estudio de [por ejemplo, el período que se cubrirá -retrospectivo, prospectivo son todos parte del
caso bien concebido. De hecho, Cook y Campbell (1979) han reconocido esto y han renombrado diseño de estudio de caso. (1993: 33)
el diseño como uno solo diseño de prueba posterior grupal, y ahora recalque que no debe
confundirse con el verdadero diseño de estudio de caso. Se puede utilizar cualquier método de recopilación de datos dentro de un
diseño de estudio de caso siempre que sea práctico y ético. De hecho, una de
No es un método de recopilación de datos.
las características distintivas del método de estudio de caso es que a menudo
Los estudios de casos se han equiparado frecuentemente con métodos cualitativos, se emplearán múltiples métodos de recopilación de datos (ver Capítulo 14).
especialmente la observación participante y las entrevistas en profundidad no Los estudios de casos buscan construir una imagen completa de un caso, sus
estructuradas. Sin duda, esta identificación se debe en parte a que algunos de los subunidades (consulte la discusión anterior sobre unidades de análisis y
primeros e influyentes estudios de caso utilizaron métodos de observación diseños integrados en este capítulo) y su contexto.
participante (por ejemplo, Street Corner Society y Middletown). se ha tomado como la
misma cosa. En otros contextos, los estudios de casos se equiparan con entrevistas
en profundidad no estructuradas que permiten al investigador construir una imagen
mucho más completa de un caso de lo que es posible con métodos de recopilación de
Resumen
datos más cuantitativos. En general, existe una tendencia a equiparar la "descripción Los diseños de estudios de caso constituyen un diseño importante para la
densa" (Geertz, 1973) con estudios de casos. investigación social. Ofrecen un enfoque flexible, que puede resultar en una
amplia variedad de diseños particulares. Hacen uso de una amplia variedad
Si equiparamos los estudios de casos con un método particular de recopilación de
de métodos de recopilación de datos y son especialmente adecuados para
datos, malinterpretamos el diseño de los estudios de casos. Yin argumenta que el
utilizar una amplia gama de unidades de análisis. Los estudios de casos en la
diseño del estudio de caso es
investigación de las ciencias sociales deben ser fundamentalmente teóricos.

Los diseños de estudios de casos son particularmente adecuados para


situaciones que involucran un pequeño número de casos con una gran
cantidad de variables. El enfoque es apropiado para la investigación de casos
cuando es necesario comprender partes de un caso dentro del contexto del
todo. Los estudios de casos están diseñados para estudiar totalidades en lugar de partes. También son particularmente
232
DISEÑOS DE ESTUDIOS
DE CASO

apropiados cuando necesitamos investigar fenómenos en los que no es posible


introducir intervenciones. Mientras que los diseños basados en experimentos nos
permiten excluir la influencia de muchas variables, los diseños de estudios de casos
son particularmente útiles cuando no deseamos o no podemos descartar la influencia 14
de ' variables externas, sino cuando deseamos examinar su efecto sobre el fenómeno
que estamos investigando.
PROBLEMAS EN EL DISEÑO DE
Nota
ESTUDIOS DE CASO
1 Yin (1993:60ff) distingue cuidadosamente las etnografías de los estudios de casos. Una de
las razones por las que Yin establece esta distinción es que las etnografías no son adecuadas
para probar teorías, mientras que los estudios de casos sí lo son. Otra base para la distinción es
que las etnografías no asumen una sola realidad objetiva que pueda investigarse siguiendo las
reglas tradicionales de la investigación científica. Todos los diseños de investigación deben ser válidos interna y externamente,
deben producir resultados confiables y deben ser susceptibles de replicación.
A menudo se considera que los diseños de los estudios de casos son
deficientes en todas estas áreas. Sin embargo, la atención cuidadosa a estos
asuntos en la etapa de diseño puede solucionar muchas de estas críticas.

Problemas metodológicos

Validez interna

La validez interna de muchos de los diseños de investigación examinados en


las Partes II a IV de este libro depende de tener grupos que sean
comparables excepto en relación con variables clave específicas. variables
causales clave. Implican centrarse en un pequeño número de variables y
eliminar la influencia de otras variables mediante controles de un tipo u otro.
Las amenazas a la validez interna surgen del peligro de que factores distintos
a nuestra variable clave produzcan cualquier cambio que observemos.

EXPLICACIONES IDIOGRAFICAS Y NOMOTETICAS

Al centrarse en un rango muy restringido de variables, los diseños anteriores


logran una explicación estrecha o nomotética. Es decir, logran explicaciones
parciales de una clase de casos en lugar de una explicación "completa" de un
caso particular. Implican un examen de menos factores causales y un mayor
número de casos. Por ejemplo, una explicación nomotética podría examinar
los divorcios como una clase de casos e identificar los factores clave que
contribuyen al divorcio en general (por ejemplo, la edad del matrimonio,
factores estresantes familiares externos, etc.). El enfoque nomotético
contrasta con la explicación idiográfica. La explicación idiográfica se enfoca en caso. Por ejemplo, una explicación ideográfica de un divorcio examinaría un
eventos particulares o casos, y busca desarrollar una explicación completa de cada divorcio en particular y desarrollaría una imagen completa de por qué ocurrió
ese divorcio.
234
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 235
DE CASO ESTUDIOS DE CASO

Los estudios de casos, por otro lado, enfatizan la comprensión del caso completo y
Los estudios de casos se pueden utilizar para ambos tipos de explicación. Un la visualización del caso dentro de su contexto más amplio. Goode y Hatt (1952)
estudio de caso adopta un enfoque idiográfico cuando se logra una comprensión describen los estudios de casos como
completa y contextualizada de un caso. Pero los diseños de estudios de casos
pueden adoptar un enfoque nomotético. Esto ocurre cuando se utilizan casos una forma de organizar los datos sociales... para preservar el carácter unitario del
particulares para lograr una comprensión más generalizada de proposiciones objeto social que se estudia... es un enfoque que considera cualquier unidad social
teóricas más amplias (ver discusión de estudios de casos y teoría en el Capítulo 13). como un todo. (1952: 331, sus cursivas)

Al desarrollar una explicación causal completa y bien redondeada, los estudios de casos
pueden lograr una alta validez interna. Al ver factores causales particulares en combinación
con otros factores causales, podemos evaluar tanto la importancia relativa de causas
particulares como la forma en que se interrelacionan varias causas. Como tales, los estudios de
casos pueden lograr una explicación sofisticada y equilibrada de los procesos causales y, al
hacerlo, evitar confundir causa con correlación.

TODOS, NO SOLO PARTES

Los diseños discutidos en partes anteriores de este libro se enfocan en las variables más que
en los casos. Examinan cómo los diferentes rasgos de los casos se asocian entre sí (Mitchell,
1983: 192). Por lo general, sin embargo, estos rasgos no se consideran dentro del contexto de
caso del que forman parte. Al arrancar los rasgos del contexto en el que ocurren, los
despojamos de gran parte de su significado y, en consecuencia, corremos el riesgo de leer mal
su significado y significado y, por lo tanto, malinterpretar sus causas.

Blumer (1956) utiliza el término "análisis de variables" para describir el análisis que se centra
en las variables en lugar de en los casos. Argumenta que, aunque dicho análisis puede
establecer relaciones estadísticas entre las variables, no proporciona mucha información sobre
los procesos causales. Argumenta que:

La variable independiente se coloca en la parte inicial del proceso de interpretación y la variable


dependiente se coloca en la parte terminal del proceso. El proceso intermedio se ignora... como
algo que no necesita ser considerado. (1956: 97)

Aunque esta es una versión algo simplista del análisis estadístico de las relaciones entre
variables, contiene algo de verdad. Si bien muchos de los diseños tratados anteriormente en
este libro pueden aislar variables que producen resultados particulares, no son tan buenos para
decirnos por qué producen estos resultados.
interpretar su significado de manera diferente.Dentro de una familia en particular
puede haber mucha ayuda intergeneracional: los adultos de la familia están atentos a
Destacan la importancia de mirar las partes dentro del contexto del todo.' El caso también debe los padres ancianos, los visitan con frecuencia y ayudan en lo que pueden. Pero, ¿es
verse dentro del contexto en el que existe. Al examinar este contexto en su totalidad, el esto un signo de solidaridad familiar, cercanía y cuidado, o es un signo de control,
investigador puede obtener una imagen más completa y redondeada de los procesos causales dependencia, manipulación y chantaje (los adultos ayudan por culpa, preocupación
que rodean un fenómeno particular. Yin argumenta que por la herencia, preocupación de que los hermanos se verán favorecidos a menos que
ayuden)? ¿ La ayuda es recíproca? ¿ Cuáles eran los patrones de ayuda en el
una razón importante para usar [estudios de casos] es cuando su investigación debe cubrir
pasado? ¿Cuál es la historia de las relaciones entre padres e hijos en esta familia? ¿
tanto un fenómeno particular como el contexto dentro del cual ocurre el fenómeno porque (a) se
Qué formas particulares de ayuda se dan? ¿Qué tipo de ayuda se retiene? ¿Por qué
supone que el contexto contiene información explicativa importante sobre el fenómeno o (b ) los
la gente da la ayuda? ¿Cuán felizmente es aceptado? ¿Qué pasa si no se ofrece
límites entre fenómeno y contexto no son claramente evidentes. (1993:31)
ayuda? ¿ Cuáles son las normas sobre lealtad familiar y ayuda dentro de la
El estudio del contexto es importante porque el comportamiento tiene lugar dentro de un comunidad, clase y grupo étnico en el que se sitúa esta familia? ¿Cuáles son las
contexto y su significado se deriva en gran medida de ese contexto. Un mismo comportamiento reglas de herencia en esta sociedad? ¿Cuáles son las obligaciones legales, si las
puede significar cosas muy diferentes dependiendo de su contexto. Además, las acciones hay, de los niños de cuidar a sus padres ancianos? Tendríamos que abordar estas y
tienen significados para las personas que las realizan y esto debe formar parte de nuestra otras preguntas antes de poder construir una imagen del significado de la ayuda
comprensión de las causas y el significado de cualquier comportamiento. Mirar simplemente el intergeneracional y las posibles causas de la ayuda en un caso particular. Aislar el
comportamiento y darle un significado en lugar de tomar el significado de los actores es perder comportamiento de este contexto más amplio y despojarlo del significado que le dan
una importante fuente de comprensión del comportamiento humano. los actores es invitar a malentendidos y, por lo tanto, amenazar la validez interna del
estudio.
Un ejemplo puede ilustrar este punto. La literatura de investigación sobre familias extendidas
asume que el intercambio de ayuda y cuidado entre las generaciones (por ejemplo, adultos y Para tomar otro ejemplo: nuestro objetivo de investigación puede ser obtener una
padres mayores) refleja la calidad y la fuerza de los lazos intergeneracionales. Sin embargo, si comprensión de la adicción a las drogas. Para dar sentido a la adicción en un
examinamos el significado de la ayuda intergeneracional dentro de su contexto, podemos particular

236
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 237
DE CASO ESTUDIOS DE CASO

HISTORIA Y MADURACIÓN
caso, necesitaríamos entender su contexto social e institucional. ¿Fue la adicción el La forma en que la 'historia' y la maduración pueden amenazar la validez de
resultado del tratamiento médico para controlar el dolor (adicción del tratamiento)? ¿ las explicaciones causales se ha discutido en capítulos anteriores. Los
Se originó con angustia emocional después de la ruptura de una relación (adicción diseños experimentales buscan lidiar con los problemas de la historia y la
como escape)? ¿Se daba por sentado que el consumo de drogas formaba parte del maduración mediante el uso de grupos de control aleatorios y centrándose
contexto social inmediato en el que vivía la persona (la adicción como conformidad)? en las diferencias de cambio entre estos grupos en lugar del cambio
¿La persona procedía de un entorno muy antidrogas (adicción como rebeldía)? El absoluto (Capítulos 4 y 5).
contexto es de suma importancia para comprender el fenómeno (adicción) y
presumiblemente es crucial para dar forma a formas apropiadas de manejar o tratar Los diseños de estudios de caso intentan abordar el "problema de la
la adicción. historia" y la maduración al observar de cerca el contexto más amplio y
explorar la medida en que este tipo de eventos concurrentes contribuyen a
En resumen, las explicaciones basadas en estudios de casos implican mucho más que los resultados observados. Es decir, en lugar de eliminar del análisis los
explicar la variación de una variable en términos de la variación de otra variable. Los diseños de factores históricos/contextuales y de maduración (controlándolos), los
estudios de casos se diseñan para producir un relato sensato y plausible de los eventos y de
diseños de los estudios de caso los incluyen para mejorar nuestra
esta manera lograr la validez interna. Logran explicaciones al construir una imagen completa
de la secuencia de eventos, el contexto en el que ocurren y el significado de las acciones y
comprensión. al mismo tiempo, evitando las amenazas que la historia y la
eventos según lo interpretan los participantes y su significado dado por un contexto. Al final, maduración presentan a la validez interna de las conclusiones de nuestro
una explicación causal adecuada es aquella que tiene sentido. Se trata de contar una historia estudio de caso. La calidad del estudio de caso dependerá en gran medida
plausible, convincente y lógicamente aceptable de cómo se desarrollan los acontecimientos y de qué tan bien identifique estos factores históricos/contextuales y de
cómo se relacionan entre sí. maduración y los incluya en cualquier explicación.
EFECTOS REACTIVOS

Simplemente hacer un estudio de caso puede producir cambios en el caso y


dependen, en parte, del tipo de caso, los métodos de recopilación de datos y
podemos confundir los efectos de hacer el estudio con los efectos de otras variables.
la naturaleza de las variables de resultado.
Si esto será o no un problema en un estudio de caso particular
Es poco probable que la historia de vida de una persona muerta, que se
basa en pruebas documentales, sufra efectos reactivos. Los diseños
retrospectivos serán menos propensos a efectos reactivos que los estudios
prospectivos. Pero un estudio de un grupo muy unido en el que el
investigador utiliza la observación participante y las entrevistas afectará
inevitablemente la forma en que opera el grupo.

Podemos tratar de reducir las amenazas de reactividad usando métodos


discretos de recopilación de datos (Kellehear, 1993). Para algunos tipos de
casos, esto puede funcionar bien. En otros, puede que no sea posible
utilizar métodos discretos por razones prácticas o éticas. Si los datos sólo
pueden obtenerse mediante entrevistas u observación, es muy difícil evitar
la reactividad de ser un 'objeto extraño' (Denzin, 1978: 200).

Validez externa

Si bien los estudios de casos pueden lograr una excelente validez interna al
proporcionar una comprensión profunda de un caso, han sido ampliamente
criticados por carecer de validez externa. Se argumenta que una
comprensión profunda de un caso no proporciona una base para generalizar
a una población más amplia más allá de ese caso. Un caso es sólo eso, un
caso, y no puede ser representativo de un universo más amplio de casos.

GENERALIZACIÓN TEÓRICA Y ESTADÍSTICA


Es correcto decir que los diseños de estudios de caso no pueden proporcionar una
base para hacer generalizaciones estadísticamente válidas más allá de ese caso
particular (ver Capítulo 15 sobre análisis estadístico). Un estudio de caso puede
consistir en un solo caso (una comunidad, una organización, una persona) y no
podemos estar seguros, en ningún sentido estadístico, de que el caso represente una
clase más amplia de casos. Incluso si llevamos a cabo múltiples estudios de casos,
digamos 10 , nuestro n sigue siendo demasiado pequeño para una generalización
estadística creíble.

Sin embargo, los estudios de casos no buscan este tipo de validez externa. Hay
dos tipos de generalización: estadística y teórica. La generalización estadística se
logra mediante el uso de muestras aleatorias representativas. Sobre la base de la
probabilidad estadística, generalizamos nuestros hallazgos a una población más
amplia que nuestra muestra está diseñada para representar.

La generalización teórica implica generalizar de un estudio a una teoría. En lugar


de preguntar qué nos dice un estudio sobre la población más amplia (generalización
estadística), preguntamos: "¿Qué nos dice este caso sobre una teoría (o proposición
teórica) específica?" teóricos. Están diseñados para ayudar a desarrollar, refinar y
probar teorías. Lo hacen utilizando la lógica de la replicación.
238
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 239
DE CASO ESTUDIOS DE CASO

REPLICACIÓN
la selección de casos contribuye a la replicación literal y teórica (Yin, 1989).
Para comprender el concepto de generalización teórica es necesario comprender la lógica de la
replicación en el diseño de la investigación (Yin, 1989). Esta es la lógica que se encuentra en el Los diseños de estudios de casos implican la selección de casos con fines teóricos
corazón de la generalización a partir de experimentos. Dado que los experimentos normalmente no y específicos. Seleccionamos un caso porque prueba si una teoría funciona en
utilizan muestras probabilísticas representativas, no proporcionan una base para la generalización situaciones particulares del mundo real. Alternativamente, seleccionamos un caso
estadística a una población más amplia. Un experimento puede emplear un diseño excelente que porque pensamos que podría refutar una proposición, o porque queremos ver si la
asegure un alto grado de validez interna, pero a menos que esté basado en una muestra proposición teórica funciona bajo condiciones particulares (como repetir un
probabilística, no sabemos si esos hallazgos ocurrirán en la población más amplia. Puede haber algo experimento bajo diferentes condiciones).
en la muestra en particular que signifique que la los resultados se aplicarán solo a las personas que
La selección estratégica de casos significa que sabemos algo de las características
participaron en el experimento.
de un caso antes de que comience el estudio de caso propiamente dicho. Dado que
Los experimentos que utilizan muestras no probabilísticas abogan por la validez externa sobre la los casos se seleccionan porque cumplen requisitos particulares (en lugar de ser
base de la lógica de replicación. Es decir, si el experimento se puede repetir una y otra vez en las seleccionados al azar), primero debemos saber algo sobre cada caso. Esto puede
mismas condiciones y producir los mismos resultados, podemos estar seguros de que los resultados requerir una evaluación exhaustiva de los casos antes de que finalmente se
experimentales se mantendrán de manera más general. Si los resultados experimentales se seleccionen los casos reales (ver más adelante en este capítulo).
mantienen bajo diferentes condiciones y con diferentes tipos de participantes experimentales, nuestra
La forma en que los casos se seleccionan estratégicamente se puede ilustrar
confianza en la generalización de los resultados crece. Si los resultados experimentales no se
utilizando el ejemplo anterior de los sistemas de dotación de personal delegado. Si
pueden replicar en condiciones particulares, entonces necesitaremos especificar condiciones a las
comenzamos con la proposición de que "la introducción de sistemas de dotación de
que no se pueda generalizar el experimento. Ganamos confianza en el valor y la solidez de los
personal descentralizado en las escuelas mejora la calidad de la educación", nuestro
hallazgos experimentales al repetir el experimento. Cuando el experimento se repite con diferentes
primer estudio de caso se centrará en una escuela en la que se haya introducido dicho
muestras y en diferentes condiciones, obtenemos una mayor idea de los límites de la generalización.
sistema. Predecimos que en esta escuela habrá ser evidencia de mejora educativa.
Los experimentos repetidos dan una idea del rango de generalización. Si un experimento solo
Además, pronosticamos que un estudio intensivo de la escuela mostraría lo siguiente:
funciona una vez con un grupo particular de personas y los resultados no se pueden reproducir,
tendríamos poca confianza en sus hallazgos o en su aplicabilidad en general. 1 La mejora en la educación se remonta al nuevo sistema.

La ciencia experimental se basa en la lógica de la replicación. No se acepta ningún hallazgo sobre 2 Las razones por las que el nuevo sistema fue efectivo fueron las que se anticiparon
la base de un solo experimento. La misma lógica se aplica a los estudios de casos. De hecho, un solo en la teoría (mejor ajuste de los maestros a la escuela, mayor sentimiento de
estudio de caso puede pensarse de la misma manera que un solo experimento. En el Capítulo 13 responsabilidad y mayor creencia de que el esfuerzo es recompensado).
argumenté que los hallazgos de un estudio de caso se prueban repitiendo estudios de caso (más de
Si encontráramos que el caso coincidía con lo que predijo la teoría, se habría logrado
esto más adelante). Podemos examinar diferentes tipos de casos bajo diferentes condiciones y tal
una réplica literal de la teoría (Yin, 1989: 54). Dado que este resultado puede deberse
vez incluso usando diferentes métodos. Cuanto más se comporten los casos de una manera que sea
al azar, podríamos buscar otras escuelas en las que el sistema delegado fue
consistente con la forma en que esperaríamos sobre la base de nuestra teoría, más confianza
presentado y examinar su impacto en la calidad de la educación en esas escuelas. Si
tendremos en nuestra teoría. Si encontramos que algunos casos no se comportan de la manera que
ocurren los mismos patrones, tenemos más réplicas literales.
hubiéramos predicho, necesitamos modificar nuestra teoría para acomodar ese caso de la misma
manera que las teorías se modificarán para dar cuenta del experimento que no da los resultados Entonces podríamos intentar probar la teoría de una manera diferente. Ya que
esperados. habíamos concluido que la mejora en la educación se debió a la introducción del
SELECCIÓN ESTRATÉGICA DE CASOS sistema descentralizado, esperaríamos, sobre la base de nuestra teoría, que donde
un sistema centralizado era retenido, no habría mejora en la educación. Buscaríamos
La validez externa de los estudios de casos se ve reforzada por la selección estratégica de casos más deliberadamente instancias de 'escuelas que todavía funcionan con un sistema
que por la selección estadística de casos. el estratégico centralizado para ver si nuestras predicciones teóricas fueron apoyadas.
Como prueba más dura, podríamos buscar casos que vayan en contra de la proposición básica: es centralizados que, durante el mismo período, también generaron mejoras en la
decir, casos de un sistema delegado fallido. Alternativamente, podríamos buscar casos de sistemas calidad educativa. Sin embargo, nuestro
PROBLEMAS EN EL DISEÑO DE ESTUDIOS DE CASO

probarán las proposiciones. Usando la lógica de la replicación, una sola replicación


la teoría puede ser tal que pueda explicar estos casos 'desviados'. Podría especificar nos dice algo, pero las replicaciones repetidas nos dan más confianza en los
hallazgos. Si buscamos réplicas teóricas, necesitaremos realizar estudios de casos
que la relación básica solo funcionará bajo condiciones particulares. Si encontramos
adicionales. Cuando encontremos casos que no se ajustan a nuestras expectativas,
que las proposiciones básicas no se sostienen y esto es predecible sobre la base de
esto puede generar la necesidad de realizar estudios de casos adicionales que nos
la teoría hemos añadido más apoyo a nuestra teoría. Esto se llama replicación
permitan
teórica (Yin 1989:54).

Cuestiones prácticas

Muestreo

MÉTODO DE SELECCIÓN DE CASOS


Dado que los casos se utilizan para generalizaciones teóricas más que estadísticas, no tiene
mucho sentido seleccionar casos porque, en cierto sentido, son representativos de una
población más amplia.

Tampoco necesitamos buscar casos 'típicos'.2 No tenemos forma segura de saber si un


caso es verdaderamente típico ni forma de estimar su tipicidad. El deseo de algunas personas
de encontrar casos típicos refleja confusión sobre lo que Mitchell (1983) llama modos de
inducción enumerativos y analíticos o lo que Yin (1989) llama generalización estadística y
generalización teórica. muestra de casos (inducción enumerativa o generalización
estadística), no tiene mucho sentido tratar de encontrar un caso típico para un estudio de
caso. La necesidad es encontrar casos que proporcionen pruebas válidas y desafiantes de
una teoría.

Glaser y Strauss (1967) han utilizado el término muestreo teórico para describir el método
normal de selección de casos en diseños de estudios de casos. Hakim (1986) usa el término
muestreo enfocado para describir el mismo proceso. Estos términos se refieren a la estrategia
de seleccionar casos que proporcionarán ejemplos esclarecedores de un tipo de caso (como
en los diseños de estudio de casos descriptivos) o que proporcionarán pruebas adecuadas de
una teoría.

NUMERO DE CASOS

No hay un número correcto de casos para incluir en un diseño de estudio de caso. Los
diseños de estudios de casos pueden consistir en un solo caso o en múltiples casos (Capítulo
13). Con estudios de casos múltiples, el número de casos es una cuestión de juicio (Yin, 1989:
57). Un factor importante para determinar el número de casos será el rigor con el que se
suburbana, rural y remota). O bien, Nuevamente, es posible que no sepamos si el
impacto positivo se mantendrá en diferentes niveles (primario, secundario o
los casos diseñados para refutar nuestras proposiciones también aumentarán el número de terciario) o en los diferentes tipos de sistemas escolares (privados, religiosos o
estudios de casos que podemos realizar. estatales). estudios que acomoden algunas de estas diferencias para ver si las
predicciones se pueden replicar en estas diferentes condiciones.
La complejidad de nuestras predicciones puede influir en la confianza que tengamos en
nuestras replicaciones. Cuanto más complejas sean nuestras predicciones, más seguros Otro factor que puede afectar el número de casos es el marco conceptual con el
podremos estar en el caso único en que nuestras predicciones se repliquen. Cuando nuestras que estamos trabajando. Por ejemplo, si la clase social fuera un concepto
predicciones sean simples (por ejemplo, cuando exista A, ocurrirá Z) un solo estudio de caso importante en el estudio, sería necesario incluir casos de cada una de las diferentes
puede no representar una prueba difícil y es posible que deseemos múltiples repeticiones clases sociales. El número de casos dependería de cómo se conceptualizara la
antes de sentirnos seguros de los resultados. Cuando nuestras predicciones son más clase social y de cuántas categorías de clase incluyera esta conceptualización (p.
complejas y exigentes (por ejemplo, cuando existe A+B+C+D, entonces W+X+Y+Z ocurrirá) ej., solo clase media y clase trabajadora, o una clasificación de clases más refinada
es relativamente improbable que este patrón complejo ocurra debido al azar. En que incluya la clase alta y varias clasificaciones dentro de las clases media y
consecuencia, podemos sentirnos bastante confiados en la dureza de la prueba que trabajadora) .
proporciona el estudio de caso único.
Podríamos seguir para siempre y verificar las cosas bajo cualquier cantidad de
La cantidad de estudios de casos que realicemos también dependerá de nuestro condiciones diferentes. Al final, debemos emitir juicios sobre las posibles
conocimiento de los factores externos que podrían afectar los resultados. Es decir, si variaciones y tener buenas razones para esperar que estas diferentes condiciones
esperamos que nuestros resultados se mantengan bajo una amplia gama de condiciones puedan afectar los patrones. También debemos guiarnos por lo que es práctico
externas, es posible que necesitemos menos estudios de casos. Cuando no estamos seguros dentro de las limitaciones de tiempo, dinero y acceso a casos relevantes. Lo
de las condiciones externas bajo las cuales se mantendrán nuestras predicciones, es posible fundamental es seleccionar los casos más estratégicos para probar nuestras
que necesitemos más estudios de casos bajo estas diferentes condiciones. para ver qué tan propuestas en lugar de apuntar a una gran cantidad de casos.
consistentes son nuestros hallazgos (Yin, 1989: 58). Por ejemplo, es posible que no estemos
seguros de si el vínculo entre los sistemas de dotación de personal delegado y el desempeño DETECCIÓN DE CASOS
educativo se mantendrá independientemente de la región (por ejemplo, ciudad de origen,
La selección estratégica de-
242
DISEÑOS DE ESTUDIOS DE PROBLEMAS EN EL DISEÑO DE 243
CASO ESTUDIOS DE CASO

Alternativamente, podemos decidir descontinuar ese estudio de caso en


las escuelas rectoras tienen mejores resultados educativos, necesitamos saber qué particular ya que no ayuda a responder las preguntas de investigación
escuelas tienen qué sistema. También es posible que necesitemos saber, con fines de originales.
selección, durante cuánto tiempo una escuela ha tenido un sistema en particular.
Podríamos querer seleccionar escuelas que tuvieron buenos y malos resultados COSTO Y ACCESO
educativos. Para hacer esto, necesitaríamos tener esta información antes de la
selección del caso. tuvo lugar el proceso. El número de casos seleccionados, y los casos particulares seleccionados, se
verán afectados por la cantidad de tiempo y dinero disponible. Los estudios de
La selección estratégica de casos puede requerir un trabajo preliminar considerable casos bien ejecutados pueden consumir mucho tiempo. En consecuencia, solo
para identificar las características de un gran número de casos a fin de ver cuáles se puede realizar un número limitado. más la importancia de la selección
satisfacen los criterios de selección. Este proceso puede llevar mucho tiempo, pero es estratégica de casos: dado que solo se pueden completar unos pocos estudios
fundamental y debe incorporarse en plazos y presupuestos. La evaluación de casos se de casos, cada uno tiene que 'ganarse el sustento'.
puede realizar de varias maneras, según el tipo de caso. Un cuestionario de encuesta,
los informes anuales de una organización, los registros de archivo, las bases de datos El acceso a los casos es el otro factor crítico que afecta tanto el número de
o una amplia gama de otras fuentes pueden proporcionar la información de detección casos estudiados como los casos particulares seleccionados. Ciertos casos
pertinente. pueden identificarse como estratégicamente ideales para el diseño, pero
cuestiones prácticas pueden significar que dichos casos no están disponibles
Incluso cuando se introduce la detección, es posible que terminemos seleccionando para fines de investigación. Obtener acceso a los casos que se han
casos inapropiados. Sin embargo, estos casos pueden ser útiles para otros fines.
identificado como estratégicamente apropiados debe abordarse con mucho cuidado y
esfuerzo.
información. Obtener información confiable es un requisito previo para una
Número de investigadores: obteniendo consistencia buena investigación. Esto significa que la información no debe ser
simplemente un artefacto de las circunstancias particulares de su recopilación.
Los estudios de casos pueden involucrar a varios investigadores diferentes. En los Necesitamos estar seguros de que la misma información surgiría si se buscara
diseños 'paralelos' es casi inevitable que participen varios investigadores, tal vez con nuevamente en circunstancias comparables. Ciertamente, no queremos que
un investigador diferente que realice cada estudio. En los diseños de casos múltiples, las comparaciones entre casos sean invalidadas por una recopilación
cada estudio de caso debe realizarse de manera consistente, ya que la inconsistencia descuidada o por la aplicación de diferentes enfoques en cada estudio de caso
entre los casos puede invalidar las comparaciones de casos. Yin (1989) recomienda el porque eso hace que los casos sean incomparables. .Por ejemplo, sería
uso de protocolos de estudio de casos para ayudar a lograr esta consistencia. completamente inapropiado comparar matrimonios donde en un caso la
satisfacción conyugal se determinó mediante el uso de una batería
La planificación para garantizar la consistencia entre los estudios de casos y entre estructurada de ítems del cuestionario mientras que en otro la satisfacción se
los investigadores es importante por dos razones. En primer lugar, mejora la midió mediante la observación del investigador, o en un tercer caso la
confiabilidad de nuestro satisfacción se determinó sobre la base de informes. de otras personas (por
ejemplo, amigos, hijos, padres). Aunque cada estudio de caso proporcionaría
información sobre la 'satisfacción marital', la forma en que se mide este
concepto utilizando las diferentes técnicas significa que, en efecto, se está
conceptualizando de manera muy diferente en cada caso.

En segundo lugar, es imperativo que cualquier estudio sea capaz de


replicarse. Cumplir esta condición requiere que si otros investigadores
realizaron un estudio similar, encontrarían los mismos patrones. La replicación
exitosa es una protección contra el fraude. También permite que otros vean si
el patrón solo ocurre cuando una persona en particular realiza las
observaciones o entrevistas. Si los hallazgos solo pueden ser encontrados por
una persona, proporcionan poca base para generalizar a las proposiciones
teóricas.

Cuándo ir al campo

La tentación es 'ensuciarse las manos' desde el principio: salir y aprender de


los casos con plena confianza de que la verdad del caso surgirá de alguna
manera. Con demasiada frecuencia, las personas comienzan estudios de
casos sin saber cuál es su pregunta de investigación o qué proposiciones que
están evaluando.

Esta es una receta para el desastre. Es esencial que tengamos una pregunta de
investigación clara antes de comenzar un estudio de caso.3 De hecho, ni siquiera
podemos comenzar a seleccionar casos hasta que tengamos una declaración clara de la
pregunta de investigación. Necesitamos ir más allá de tener una pregunta. Deberíamos
poder formular algunas proposiciones iniciales, algunas respuestas iniciales a la
pregunta que los estudios de caso nos ayudarán a probar.

Habrá quienes exhorten a que el trabajo de campo esté libre de teorías ya


que éstas imponen nuestras ideas preconcebidas y categorías preexistentes
sobre los datos. Algunos insistirán en que deberíamos ir al campo libres de
obstáculos teóricos, ya que estos simplemente nos ciegan a lo que de otro
modo podríamos ver y nos hacen sordos a lo que la gente está tratando de decirnos. nosotros impongamos una interpretación teórica sobre su historia, o usemos
Nuestro trabajo, dirán, es permitir que otros nos cuenten su historia en lugar de que su historia con propósitos teóricos.
244
DISEÑOS DE ESTUDIOS DE PROBLEMAS EN EL DISEÑO DE 245
CASO ESTUDIOS DE CASO

estudio de caso único de un pequeño pueblo rural. Las preguntas orientadoras en el


En mi opinión, esta no es la tarea del científico social. Puede ser el papel de un biógrafo, un estudio de caso fueron preguntas como: "¿Cuán desiguales son las personas en esta
novelista o un activista. El papel de un científico social es desarrollar y evaluar comunidad?", "¿Cuáles son las bases clave de la diferenciación social?" ?', 'Cómo en
generalizaciones teóricas que nos permitan comprender clases completas de casos, no, en
última instancia, casos individuales.

No tenemos que tener una teoría bien formulada para probar. Nuestras preguntas pueden
ser tales que no haya teorías obvias para probar. Pero esto no nos libera de la necesidad de
estar bien informados y bien preparados teóricamente antes de entrar en el campo. Pasteur
observó que, 'En lo que respecta a la observación, el azar solo favorece a la mente preparada'
(citado en Mitchell, 1983: 204). Si no somos conscientes de las teorías, conceptos, debates y
similares relevantes, probablemente perderemos la importancia de mucho de lo que podamos
encontrar. Sin tener alguna idea de lo que estamos buscando, no sabremos lo que hemos
encontrado.

Presentación de casos de estudio

Los estudios de casos pueden implicar la recopilación de una gran cantidad de información.
Esta información debe procesarse y destilarse cuidadosamente antes de que pueda
presentarse. No podemos simplemente describir el caso y dejar que los hechos hablen por sí
mismos. Cualquier intento de presentar todos los hechos resultará en un lío indigesto que es
ilegible y no leído.

Los hechos no hablan por sí mismos y no debemos pretender lo contrario. La descripción


de un caso siempre implica selección y ordenación y, al menos, la construcción implícita de
secuencias e interpretaciones causales.

Hay muchas formas diferentes de presentar los estudios de casos. Podríamos describir
cada caso como un todo para que el lector se forme una imagen clara del caso.
Alternativamente, podríamos describir buenos ejemplos de tipos particulares de casos y luego
comparar estos diferentes tipos de casos y sacar conclusiones generales con respecto a
nuestras teorías. The Second Shift (1989) de Hochschild proporciona un buen ejemplo de
este tipo de información. Describe una serie de matrimonios y de cada uno de sus casos
extrae lecciones sobre la división doméstica del trabajo y los procesos por los cuales se
mantiene la desigualdad marital en este ámbito.

Alternativamente, podríamos informar los resultados de una serie de estudios de casos


extrayendo temas de los estudios de casos e informando los hallazgos de los estudios de
casos temáticamente. Por ejemplo, Vaughn (1986) realizó estudios de casos retrospectivos
de parejas cuyas relaciones íntimas habían terminado. . A partir de estos estudios de casos,
identificó un conjunto de patrones y etapas subyacentes debajo de cada relación en
desintegración. Otro enfoque es centrarse en una serie de preguntas y reportar los casos en
términos de cómo arrojan luz sobre estas preguntas. Por ejemplo, Dempsey (1990) realizó un
Por ejemplo, las cuestiones éticas serán diferentes si el estudio de caso involucra
una intervención activa o una intervención pasiva, o requiere que obtengamos un
frente a la considerable desigualdad social, ¿mantiene la comunidad un fuerte sentido de relato retrospectivo de un evento, intervención o cambio. Las cuestiones éticas
cohesión?' Estas preguntas guiaron el estudio y proporcionaron el marco en torno al cual se también diferirán en función de si los datos se recopilan entrevistando a individuos,
informó el estudio. usando informantes, analizando registros oficiales, observando pasivamente,
realizando una encuesta de elementos del caso o utilizando la observación
Independientemente del enfoque que se adopte, es muy deseable que la lógica del diseño
participante. Dado que los estudios de casos emplean con frecuencia una gama de
de la investigación permanezca clara. El lector debe tener claro la(s) proposición(es) y por qué
diferentes técnicas de recopilación de datos para un estudio es probable que surja una
se seleccionó un caso particular para probar la proposición. El lector debería poder ver que
mayor variedad de cuestiones éticas al usar un diseño de estudio de caso que con
hay una estructura y una lógica en la selección de casos, que han sido seleccionados con un
otros diseños
propósito y no simplemente porque están disponibles.
No tiene sentido repetir los asuntos éticos identificados anteriormente en este libro.
Cualquier informe que simplemente proporcione una serie de historias está incompleto. Al
Debe leer atentamente estas secciones anteriores y ver cómo se aplican a los detalles
informar sobre estudios de casos, es fundamental que relacionemos los casos con
específicos del diseño de estudio de caso particular que adopte. Sin embargo, dado
proposiciones y que busquemos hacer comparaciones entre casos y llegar a generalizaciones
que los diseños de estudio de caso implican con frecuencia la obtención de
o proposiciones más refinadas como resultado de los estudios de casos. Necesitamos contar
información más detallada y frecuentemente emplean técnicas de observación
la historia del conjunto de casos. -las generalizaciones, las proposiciones y las preguntas que
participante, surgen algunos problemas éticos que son menos problemáticos con otros
responden y las proposiciones que terminamos apoyando.
diseños.

Cuestiones éticas Anteriormente argumenté que la reactividad puede ser una amenaza importante
para la validez interna de los diseños de estudios de casos: la presencia de un
Se aplican los mismos principios éticos a los diseños de estudios de casos que a los diseños investigador puede alterar la dinámica de los casos que se observan. Esto puede ser
discutidos en capítulos anteriores. Los problemas éticos particulares que se enfrenten particularmente cierto cuando se utilizan técnicas de observación participante. Una
variarán, según el tipo de diseño de estudio de casos adoptado y la forma particular de forma en que algunos
recopilación de datos utilizada para ese diseño.

246
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 247
DE CASO ESTUDIOS DE CASO

cualquier daño potencial, tiene mucho sentido obtener asesoramiento o incluso hacer
los investigadores pueden tratar de reducir los efectos de la reactividad es disfrazar su que las decisiones sean tomadas por terceros, como los comités de ética
identidad como investigadores para evitar que su identidad de investigador se inmiscuya. Por institucionales.
ejemplo, un investigador puede querer examinar el acoso sexual en el lugar de trabajo. Es
probable que las personas de la organización se comporten de manera diferente mientras el Los investigadores deberán resolver las consideraciones éticas contrapuestas. ¿
investigador esté presente y, por lo tanto, socaven el estudio. Como alternativa, el investigador Hasta qué punto la ética del consentimiento informado y la participación voluntaria
deben tener prioridad sobre el valor de la investigación que expone un
podría emprender la investigación obteniendo un trabajo en la empresa y observando de forma
encubierta lo que sucede. comportamiento altamente poco ético?

Los problemas éticos del engaño y la imposibilidad de obtener el consentimiento informado Incluso si un investigador revelara su identidad y obtuviera permiso para realizar el
surgen obviamente en esta situación. El dilema que destaca es el compromiso que se produce estudio, surge la pregunta de cómo obtener el consentimiento informado y de quién
obtener ese consentimiento. Si estuviéramos realizando un estudio de acoso sexual
entre la ética y la validez interna: seguir las pautas éticas puede amenazar la validez interna del
estudio. en un lugar de trabajo, ¿obtendríamos permiso de los guardianes de la organización o
de todas las personas que podríamos observar en el curso del estudio?
No cabe duda de que revelar la propia identidad y obtener el consentimiento informado
puede socavar gran parte de lo que Punch (1994) llama etnografía de "estilo callejero". En ¿ Es necesario informar a las personas de que se está observando su
comportamiento público con fines de investigación? Claramente, en muchos casos
algunos casos, revelar la identidad de uno puede acabar con el proyecto de investigación. En
estas situaciones, se debe dar una cuidadosa consideración a los méritos de alguna forma de esto es simplemente poco práctico (observar el comportamiento de la gente en una
engaño a la luz de los posibles beneficios de la investigación y el potencial de daño a los fiesta, en una manifestación, comprando en rebajas). En mi opinión, observar el
comportamiento público plantea pocos problemas éticos. Mientras los individuos no
participantes. Si bien es fácil para un investigador racionalizar que los beneficios superarán
sean identificables, no debería haber peligro de daño para los participantes. Después
de todo, si el comportamiento es público, apenas hay invasión de la privacidad.
Otro problema ético que es más probable que surja cuando se usa la observación en un
estudio de caso es el problema de qué hacer cuando observamos un comportamiento ilegal o
dañino. ¿Deberían tener prioridad las cuestiones éticas del consentimiento informado y la escuela y te enteras de la identidad de una persona que vende drogas peligrosas a los
participación voluntaria sobre la exposición de conductas altamente poco éticas? Por ejemplo, estudiantes? ¿Qué haces si descubres, durante tu investigación, que un participante
¿cuál sería su responsabilidad ética si sus estudios de casos de familias revelaran casos de del grupo está a punto de cometer un delito? ¿Es la traición de la confianza de los que
violencia doméstica o abuso infantil? ¿Qué debe hacer al realizar un estudio de caso de un te rodean menos ético que la responsabilidad de uno a los que están en peligro?

¿Cuál es la responsabilidad del investigador hacia otros investigadores? Si un


investigador traiciona la confianza de una comunidad, aunque sea por razones éticas,
¿esto socava la capacidad de otros investigadores para estudiar en esa comunidad?
Una vez que un grupo ha aprendido a desconfiar de los investigadores sociales,
puede ser muy difícil realizar más investigaciones con ese grupo, y esto puede tener
más consecuencias éticas. El comportamiento de algunos investigadores con grupos
indígenas ha generado una profunda desconfianza en algunas comunidades
indígenas de fuera. investigadores

¿ Cómo resuelve el objetivo de la investigación feminista de promover la


identificación, la confianza, la empatía y las relaciones no explotadoras entre la
investigadora y quienes participan en la investigación, por un lado, y exponer
comportamientos no éticos y dañinos, por el otro?

Carecemos de respuestas claras a estos dilemas. Destacan el hecho de que los


principios éticos a menudo pueden entrar en conflicto entre sí, y que las cuestiones
éticas ciertamente pueden competir con los principios metodológicos y prácticos.

Resumen
Este capítulo ha hecho hincapié en que la validez interna de los estudios de
casos se basa en una lógica que distingue a este diseño de los demás
diseños discutidos en este libro. Los estudios de casos se centran en un
gran número de variables y en la forma en que se interrelacionan. Por el
contrario, los otros diseños se basan en controlar la influencia de otras
variables y centrarse en la influencia de un número muy limitado de
variables. Una de las fortalezas de los estudios de casos es que intentan
comprender la importancia de factores particulares dentro del contexto del
caso completo en lugar de descartar este contexto. Como tales, los estudios
de casos tienen el potencial de una buena validez interna basada en una
comprensión más completa del significado de comportamientos y eventos
particulares que la que brindan los otros diseños.

La validez externa de los estudios de casos se basa en la lógica de la replicación


más que en la lógica del muestreo. Los estudios de casos se utilizan para generalizar
a una teoría más que a una población. Los casos en los diseños de estudios de casos
se seleccionan estratégicamente en lugar de estadísticamente y se seleccionan como
pruebas críticas de proposiciones teóricas. Se discutieron cuestiones relacionadas
con la selección de casos, la selección de métodos de investigación para recopilar
información sobre el caso y la realización de estudios de casos. Finalmente, se
plantearon cuestiones éticas particulares que pueden surgir en los estudios de casos,
en particular aquellos que emplean la observación participante y métodos etnográficos.

notas
1 El concepto de un todo es, como señalan Goode y Hatt (1952), una construcción en sí misma.
Somos nosotros quienes definimos qué es el 'todo'. La delimitación entre el caso (el todo) y su
15
contexto es de hecho arbitraria.

2 Los casos "típicos" no deben confundirse con la selección de casos "típicos ideales", casos que ANÁLISIS DEL ESTUDIO DE CASO
pueden representar un tipo ideal (Capítulo 13).

3 Puede ser apropiado realizar estudios de casos sin preguntas de investigación o proposiciones
claras cuando estamos haciendo estudios de casos exploratorios. finalizado. Pero este tipo de estudio
de caso, diseñado para ayudar a producir una pregunta de investigación, es muy diferente de un
diseño de estudio de caso. Un diseño de estudio de caso es la estructura de un estudio que nos
permitirá responder preguntas de investigación. Se refiere a la lógica y estructura del estudio. Los métodos para analizar estudios de casos están menos sistemáticamente
desarrollados que las técnicas para analizar datos recopilados con otros tipos de
diseños de investigación. El análisis con estos otros diseños generalmente usa
técnicas estadísticas que se basan en tener muchos casos y giran en torno a la
comparación de grupos de casos. Además, los intentos de generalizar a partir de
estos diseños se basan en la teoría de la probabilidad que, a su vez, se basa en
tener suficientes casos de los cuales generalizar con un determinado nivel de
precisión y certeza.

Todos los diseños de investigación tratados anteriormente se basan en


comparaciones entre grupos utilizando un número limitado de variables. Sin
embargo, los estudios de casos logran explicaciones mediante el análisis
intensivo de muchas variables dentro de un caso. Se utilizan múltiples casos para
replicar los resultados, no como un medio para localizar explicaciones causales.
Además, los estudios de casos múltiples son útiles para hacer comparaciones
entre casos y, por lo tanto, extrapolar a teorías más amplias.

análisis estadístico

Aunque la lógica de los diseños anteriores no requiere un análisis estadístico,


dicho análisis se usa ampliamente. Los métodos como las correlaciones, las
tabulaciones cruzadas, la regresión y la comparación de medias se basan en
conjuntos de casos y en la construcción de una imagen típica o la descripción de
tendencias en múltiples casos en lugar de reflejar las características de un caso
particular.

Debido a que los diseños de estudios de caso se enfocan en casos


individuales, emplean diferentes métodos de análisis. Se han desarrollado o
están en proceso de desarrollarse varios métodos de este tipo. El análisis del
estudio de caso gira en torno a la evaluación del "ajuste" entre un caso individual
y la teoría o teorías que se están probando. El objetivo del análisis del estudio de
caso es la generalización teórica más que la generalización estadística (Capítulo
14). Este objetivo afecta la forma en que realizamos nuestro análisis.
Debido a que el enfoque está en casos individuales, cuando se analizan datos de casos, comportaban de una manera particular. El pequeño número de casos
es inapropiado contar el número de casos que tenían características particulares o se
250
DISEÑOS DE ESTUDIOS DE ANÁLISIS DEL ESTUDIO DE 251
CASO CASO

Las descripciones de casos deben estructurarse en torno a ideas teóricas.


y la naturaleza atípica de los casos seleccionados hace que no tenga sentido analizar Sin embargo, hay académicos que argumentan que las descripciones de
los estudios de caso contando. casos deben simplemente describir el caso y no tratar de interpretarlo. Este
punto de vista argumenta que debemos dejar que los 'hechos' hablen por sí
Esto no quiere decir que el análisis del estudio de caso no pueda tener un elemento
cuantitativo o estadístico. Un caso se puede describir estadísticamente. Una región en particular
mismos y evitar imponer nuestra propia interpretación sobre 'los hechos'. Tal
podría ser un caso en un proyecto de investigación. Se puede describir en términos de su enfoque es a la vez indeseable y
tamaño, riqueza, edad promedio, tasa de desempleo, tasa de criminalidad y similares. Sin
embargo, el enfoque del análisis es describir la región, construir una imagen de ese caso.

Además, cuando los casos incluyen unidades de análisis integradas (véase el Capítulo 13), el
análisis de algunos niveles bien puede incluir el tipo de análisis típicamente asociado con otros
diseños. Por ejemplo, un estudio de caso de una región podría incluir una encuesta de
residentes en la región (siendo los residentes una unidad integrada dentro del caso). La
encuesta de los residentes incluiría el tipo de análisis que normalmente se usa en un diseño
transversal. Sin embargo, el enfoque del análisis general estaría en el caso como un todo: la
región. Los resultados de la encuesta serían simplemente una pieza en el rompecabezas para
construir una imagen de todo el caso.

En el capítulo 13 hice hincapié en que los estudios de casos son fundamentalmente


teóricos. Su análisis también es fundamentalmente teórico. El análisis debe
construirse en torno a las proposiciones teóricas que se prueban o desarrollan.

Significado y contexto

En el capítulo 14 subrayé que los estudios de casos son particularmente adecuados


para los problemas de investigación cuando el fenómeno en el que estamos
interesados no puede distinguirse de su contexto o debe verse dentro de su contexto.
Muchos científicos sociales creen que las explicaciones causales adecuadas deben
tener en cuenta el significado que los participantes en una situación social atribuyen a
su comportamiento. Argumentan que el significado del comportamiento nos ayuda a
'dar sentido' a por qué un evento produce resultados particulares. Por lo tanto, al
realizar estudios de casos, es muy útil recopilar información sobre el significado
subjetivo del comportamiento para los participantes e incorporar estos datos
subjetivos en nuestro análisis del caso.

Análisis en estudios de casos descriptivos


Dimensión teórica del análisis descriptivo
La estrategia analítica es utilizar este tipo ideal como plantilla para guiar el análisis
de un caso real. Podemos usar la plantilla para ver qué tan cerca se ajusta nuestro
imposible. Cualquier descripción de cualquier caso implica siempre una selección de caso real a la plantilla. Podríamos tener buenas razones para esperar que los casos
hechos. Esta selección se basará en lo que consideramos relevante e importante. El particulares representen las características de un tipo particular. Por ejemplo,
acto mismo de seleccionar significa que estamos tomando decisiones sobre lo que es podríamos esperar, por varias razones, que un departamento gubernamental en una
relevante. Este proceso de selección estará fuertemente influenciado por nuestras forma de gobierno de Westminster podría estar cerca de un tipo ideal de burocracia
teorías implícitas. Además, cualquier reporte de un caso implicará ordenar los hechos según lo definido por Weber (Gerth y Mills, 1946). Usando nuestra plantilla de una
burocracia de tipo ideal, podemos examinar un departamento (caso) seleccionado
seleccionados. La selectividad y el orden inevitables significarán que todas las
para ver qué tan cerca se aproxima al tipo ideal. Además de identificar dónde el caso
descripciones son nuestras descripciones, en lugar de la descripción del caso.
se ajusta al ideal, también usaríamos la plantilla para ayudar a resaltar dónde diverge
El inevitable elemento subjetivo del análisis del estudio de caso no significa que dicho análisis el caso. del ideal. Los estudios de casos repetidos (p. ej., una variedad de
no valga la pena. Lo que sí significa es que debemos ser explícitos sobre la base sobre la cual departamentos gubernamentales) pueden mostrarnos que los ejemplos empíricos
estamos construyendo la descripción. divergen constantemente del ideal en la medida en que las intervenciones
ministeriales pueden anular el ideal de la toma de decisiones gobernada por reglas,
que es una característica del tipo ideal de burocracia. hay que recordar, sin embargo,
ANÁLISIS DEL TIPO IDEAL que el tipo ideal sigue siendo un tipo ideal independientemente de los hallazgos
empíricos de un conjunto de casos. El tipo ideal sigue siendo una abstracción
Una forma de construir una descripción es usar tipos ideales (ver Capítulo 13). Esto implica idealizada "pura".
construir descripciones teóricamente derivadas de tipos de casos. Sobre la base de
El uso del tipo ideal proporciona una forma de ver y organizar el análisis para las
consideraciones teóricas y nuestro conocimiento de la literatura de investigación existente,
descripciones de casos reales. Al usar este enfoque, evitamos la descripción que
podemos enumerar los elementos de un tipo. por ejemplo, una persona autoritaria, una
simplemente describe lo que sea que descubrimos sobre el caso o simplemente
organización perfectamente burocrática, un sistema electoral democrático, un matrimonio
informa las características que llaman nuestra atención. En cambio, la descripción
igualitario).
está estructurada, planificada y tiene un propósito.

252
DISEÑOS DE ESTUDIOS DE ANÁLISIS DEL ESTUDIO DE 253
CASO CASO

Enfoques analíticos de conglomerados Estos enfoques implican identificar un


TIPOLOGÍAS conjunto de variables que queremos usar como base para nuestra tipología.
Por ejemplo, en un estudio de una organización podríamos haber recopilado
Una tipología consiste en un conjunto de tipos. Así, podríamos desarrollar tipologías de
de nuestros estudios de caso información sobre la forma en que se toman las
diferentes tipos de personalidad, formas de gobierno, tipos de estructuras
decisiones, la forma en que se utilizan las normas y reglamentos, el grado de
organizativas o tipos de matrimonio. Este conjunto de tipos puede basarse en un
jerarquía, el grado de racionalidad, etc. En un conjunto de casos estudios
conjunto de tipos ideales o derivarse empíricamente (véase el Capítulo 13). Las
podríamos entonces agrupar casos que tenían constelaciones similares de
tipologías y los tipos ideales proporcionan excelentes métodos de análisis en los que
características.
se conserva la "totalidad" de un caso. En lugar de concentrarse únicamente en los
rasgos, una tipología intenta construir una imagen general de un caso teniendo en Si tenemos un pequeño número de casos que conocemos bien podemos
cuenta una amplia gama de características. hacerlo manualmente. Si tenemos un mayor número de casos podemos
utilizar una técnica estadística denominada análisis de conglomerados para
Cuando empleamos una tipología derivada teóricamente, la tarea del análisis es
conseguir el mismo fin. Esencialmente, esta técnica consiste en identificar las
simplemente una extensión del análisis del tipo ideal descrito anteriormente.
características en las que queremos que se base la tipología, codificando
Cuando usamos nuestros estudios de casos para derivar tipologías empíricamente cada caso en función de cada una de ellas. características, y luego introducir
fundamentadas (es decir, aquellas basadas en nuestros casos reales), necesitamos esa información en un programa informático de análisis de conglomerados. El
adoptar un enfoque de análisis diferente. Estos enfoques solo son posibles si tenemos programa identificará entonces qué casos son más similares entre sí.
múltiples casos.
Agrupará los casos en grupos que tengan conjuntos de características relativamente
similares. explicación particular. Alternativamente, puede estar diseñado simplemente
DESCRIPCIONES ORDENADAS POR TIEMPO para proporcionar un registro de eventos sin un intento explícito de explicar o
En lugar de presentar los casos en términos de tipos, podemos representar un caso como una interpretar esos eventos.
historia de algún tipo u otro. Si tratamos con individuos, la descripción del caso podría presentarse
como una biografía, el relato de una vida. La biografía será necesariamente selectiva y
representará a la persona bajo una luz particular. Es probable que la biografía vaya más allá de Casos de estudio explicativos
una simple descripción e incluya teorías implícitas o explícitas de por qué la vida de la persona
tomó direcciones particulares. Al igual que en el análisis descriptivo, en el análisis explicativo la teoría juega
Historias de eventos, organizaciones, políticas, o cualquiera que sea la unidad de análisis, un papel clave. Las proposiciones teóricas dirigirán el análisis o serán el
representan una forma de describir un caso donde el énfasis está en la secuencia de eventos. El objetivo del análisis.
relato secuencial puede tratar de explicar el curso de los acontecimientos y puede estar diseñado
para respaldar una Cuando se realizan estudios de casos múltiples, el objetivo del primer paso en el
análisis es comprender cada caso como un todo. Solo después de que se haya
construido una imagen de cada caso, es apropiado comparar los casos (Yin, 1989;
Stake, 1994). El análisis de cada caso debe organizarse en torno a preguntas y
conceptos teóricos. Cada caso debe usarse para probar o construir proposiciones
teóricas. Cuando cada caso se analiza en torno a un marco común, entonces es
posible comparar los casos para llegar a generalizaciones de mayor nivel o para
proporcionar pruebas de teorías más estrictas. Si cada caso se examina de manera
idiosincrásica, será muy difícil comparar los casos de manera significativa.

La forma en que abordamos el análisis de los estudios de casos


explicativos variará un poco dependiendo de si los usamos para probar
teorías o construir teorías.

Análisis de prueba de teoría

Hay varias formas de utilizar los estudios de casos cuando se prueban


proposiciones teóricas. Yin (1989) describe dos enfoques: coincidencia de
patrones y análisis de series de tiempo. Desde mi punto de vista, el análisis
de series de tiempo es simplemente un tipo de coincidencia de patrones, pero
en la discusión a continuación los trataré por separado.
LA COINCIDENCIA DE PATRONES

La coincidencia de patrones es una forma de análisis de prueba de teoría que


establece un conjunto detallado de predicciones antes de que se lleve a cabo
el estudio de caso. Estas predicciones se derivan de un modelo teórico y, por
lo tanto, representan un enfoque claro de prueba de teoría. El análisis podría
continuar estableciendo un conjunto de patrones alternativos que
predeciríamos sobre la base de teorías en competencia.

La forma y la complejidad de la coincidencia de patrones pueden variar


considerablemente. El principio básico es que cuanto más elaborado sea el patrón
predicho (siempre y cuando se siga lógicamente de la teoría), más difícil será la prueba
de una teoría. Habiendo predicho un patrón particular, entonces realizaríamos el
estudio de caso para ver si el caso lo hace, de hecho, coincide con el patrón predicho.
Si el caso coincide con el patrón predicho, entonces el caso respalda la teoría.
254
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 255
DE CASO CASO

Variable independiente
Variable independiente

Xa
X Xa
Ya Patrón 1 Patrón 2
Dependent variable ya Patrón 1 Patrón 2 Patrón 3
Y6 Patrón 3 Patrón 4
Variable dependiente Patrón 4 Patrón 5 Patrón 6

Y6
Figura 15.1 Coincidencia de patrones para dos variables, cada una con dos Patrón 7 Patrón 8 Patrón 9
categorías
Yc
También esperaríamos que cuando exista Xb (sistema centralizado), le siga
de la misma manera que un experimento exitoso apoya una teoría. Sin embargo, si el Ya (bajos niveles de compromiso de los docentes).
caso no coincide con el patrón predicho, la teoría requiere modificación.
Nuestra prueba, incluso en este ejemplo muy simple de coincidencia de
Yin (1989) describe la coincidencia de patrones que varía en complejidad según el patrones, sería más interesante y más poderosa si estuviéramos probando
número de variables independientes y dependientes incluidas en los patrones teorías alternativas que predijeran diferentes patrones. Una teoría podría
predichos. predecir

Patrones simples En su nivel más simple, la coincidencia de patrones implica una


variable independiente con dos valores (por ejemplo, masculino y femenino) y una
variable dependiente con dos valores posibles (se comporta de una de dos maneras
en una situación particular). En este caso, hay cuatro posibles patrones diferentes
(Figura 15.1). Para un caso dado con una característica dada, podríamos predecir
uno de dos patrones. El patrón que predijimos dependería de consideraciones
teóricas.

El patrón que podríamos predecir para un caso particular que sabemos que tiene un valor Xa
en la variable independiente es que el caso tendrá un valor Yb en la variable dependiente
(resultado). La predicción toma la forma: si Xa entonces Yb.

Por ejemplo, nuestra teoría del desempeño laboral en las escuelas podría llevarnos
a esperar que cuando los nombramientos, despidos y ascensos del personal se
gestionan a nivel de la escuela local en lugar de un sistema altamente burocrático,
centralizado y remoto (variable X), el personal docente el compromiso (Y) será alto. Si
los sistemas de dotación de personal delegado se simbolizan como Xa y el alto nivel
de compromiso de los docentes se simboliza como Yb, nuestra predicción es:
Cuando existe Xa (sistema de dotación de personal local), entonces seguirá Yb (altos niveles de
compromiso de los docentes).
desempeño y un híbrido de modelos de dotación de personal centralizados
Figura 15.2 Patrones para dos variables cada una con tres categorías
y locales). posibles patrones que podríamos predecir. Por ejemplo, si
ambas variables tuvieran tres valores posibles, hay nueve patrones
patrón 1, mientras que una teoría competidora podría predecir el patrón 3. El estudio posibles que podríamos encontrar en cualquier caso particular (Figura
de caso nos permitiría ver qué patrón surgió y, por lo tanto, cuál de las teorías rivales 15.2). En esta situación, todavía predeciríamos un patrón particular para un
se apoyó en este caso. caso dado: si fueran Xa, podríamos predecir Ye

Por ejemplo, podríamos proponer las siguientes dos teorías rivales: Por ejemplo, podríamos tener una teoría sobre el impacto de los estilos de crianza
en el comportamiento infantil. Cada uno de estos dos factores podría tener tres
Teoría A El control local conducirá a un mayor compromiso con el trabajo porque el categorías, como se ilustra en la Figura 15.3. Usando este ejemplo, podríamos
esfuerzo y la 'adecuación' se ven y se recompensan (y se castiga la falta de esfuerzo predecir que las familias autoritarias producirán niños que son rebeldes (patrón 1) Un
y la falta de adaptación a las necesidades escolares). estudio de caso de una familia autoritaria ayudará a determinar si esta propuesta
recibe apoyo. Los estudios de casos repetidos de familias autoritarias proporcionarán
Teoría B El control local hace que las personas se sientan más desmoralizadas y una prueba más firme. Otra proposición puede ser que las familias permisivas
vulnerables a la política y los prejuicios locales, y no reconoce un desarrollo produzcan niños que se involucren constantemente en un comportamiento de prueba
profesional más amplio, etc. fomentando el rendimiento. límite (patrón 9).

Una versión un poco más compleja de esencialmente la misma situación surgiría si


cualquiera de las variables tuviera más categorías (por ejemplo, niveles medios de
256
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 257
DE CASO CASO

patrón de resultado diferente de crianza permisiva dependiendo de si estamos viendo


una familia donde el niño está ansioso o seguro/confiado. Podríamos predecir que el
Estilo de autoridad de los padres
niño ansioso con padres permisivos exhibirá la respuesta 'prueba los límites de los
Autoritario Autoritario Permisivo padres' 24), mientras que el niño confiado/seguro con padres permisivos puede
establecer sus propios límites (patrón 17).
Rebellious Patrón 1 Patrón 2 Patrón 3
Podríamos extender este ejemplo para incluir más variables independientes y así
Patrón 4 Patrón 5 Patrón 6 anticipar aún más patrones posibles.
Child behaviour Compliant
La figura 15.4 ilustra las posibilidades lógicas: los diferentes patrones que uno
Limit testing Patrón 7 Patrón 8 Patrón 9 posiblemente podría encontrar. Por supuesto, nuestro razonamiento teórico nos llevará
a predecir patrones particulares en circunstancias particulares, es decir, para tipos
Figura 15.3 Combinación de patrones para el estilo de los padres y el comportamiento del niño particulares de casos, como se ilustra en las celdas sombreadas de la figura 15.4.

Habiendo establecido los patrones posibles y los patrones predichos, entonces


La mejor prueba de la teoría sería una serie de estudios de casos que predijeran tipos buscaríamos casos que nos permitan probar las proposiciones. Por ejemplo,
particulares de comportamiento infantil para cada estilo de crianza y para cada una de las llevaríamos a cabo un estudio de caso sobre una familia en la que ocurren padres
proposiciones mutuamente excluyentes que se confirmarían mediante los estudios de casos autoritarios y ansiedad infantil. Nuestra predicción sería que el niño sería muy
relevantes. obediente. Si esto fuera cierto, habríamos logrado una réplica literal. Entonces
podríamos buscar un caso de paternidad autoritaria con un niño que no está ansioso.
Patrones más complejos: múltiples variables independientes Se puede predecir un conjunto de Nuestra predicción aquí podría ser que el niño no cumplirá Esto sería una réplica
patrones más complejo si se utilizan dos variables independientes: se predice un resultado teórica. Es decir, donde la combinación particular de factores
diferente para cada combinación de variables independientes (Figura 15.4).

Aquí podríamos hacer diferentes predicciones, dependiendo de la combinación del estilo de


autoridad de los padres combinado con el nivel de ansiedad del niño. Podríamos predecir un
a

v
Variables dependientes
i

tu

Independiente

vanables
De los padres Autoritario Autoritario Permisivo
Figura 15.4 Patrones lógicos con dos variables independientes y una variable
estilo de
autoridad dependiente

Ansiedad Bajo Alto Bajo Alto Bajo Alto


infantil no está presente, no obtendremos un resultado específico (ver más adelante para una
nivel
discusión más completa).

Otro enfoque para recopilar y analizar datos de estudios de casos es buscar casos
Obediente Patrón 1 Patrón 2 Patrón 3 Patrón 4 Patrón 5 Patrón 6
con resultados particulares (por ejemplo, niños muy obedientes) y predecir que estos
niños estarán ansiosos y tendrán padres autoritarios. En términos de las predicciones
Rebelde Patrón 7 Patrón 8 Patrón 9 Patrón patrón patrón de la Figura 15.4, hemos predicho esto, pero si encontramos casos de niños muy
obedientes que no están ansiosos ni tienen padres autoritarios, entonces nuestra teoría
10 11 12 necesita refinarse.
C

h Una forma de probar una proposición teórica es demostrar, a través de estudios de


Conjuntos Patrón Patrón Patrón patrón patrón patrón
i
infantiles casos, que cuando se dan ciertas condiciones (por ejemplo, paternidad autoritaria y
límites 15 17 18 ansiedad infantil) también habrá un resultado específico (niño altamente obediente). El
yo
13 14 dieciséis
propios problema con este tipo de emparejamiento es que solo especifica condiciones
d
suficientes para un resultado. No nos dice si estas son las únicas condiciones bajo las
Pruebas Patrón Patrón Patrón patrón patrón patrón
cuales ocurre el resultado. Como tal, no representa una prueba exigente de una
b
de los padres proposición. Una prueba más exigente implicaría buscar casos en los que el resultado
mi 19 20 21 22 23 24
limites
particular esté presente y luego preguntar si este resultado solo ocurre bajo las
h condiciones predichas teóricamente.

258
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 259
DE CASO CASO

Bajo Medio Bajo Medio Alto


Variables independientes

Condición 1 Condición 2 A 1 2 3 1 2 3

Valores de las variables Valores de las variables B 1 2 3 1 2 3


dependientes dependientes s
mi
C 1 2 3 1 2 3
yo

Variables independientes
b
D 1 2 3 1 2 3
a
alto nivel de trabajador Alto grado de control directo
i

autonomía sobre trabajador


r

a Valores de DV Bajo Medio Bajo Medio Alto

Moral 1 2 3 1 2 3
t

norte
Trabajar 1 2 3 1 2 3
mi 1 2 3 1 2 3
mi
calidad
d s

norte mi
Personal 1 2 3 1 2 3
mi yo

sintonía 2 3
pags
b

mi
a

Eficiencia 1 1 2 3
D
i

Figura 15.5 Patrones lógicos con una variable independiente y cinco variables dependientes r

a
Otra prueba de una proposición es si encontramos casos en los que se cumplen todas las v
condiciones pero el resultado no se produce. Por ejemplo, ¿encontramos casos de crianza autoritaria
y niños ansiosos en los que los niños no cumplen? Si lo hacemos, entonces nuestra proposición no t

está respaldada y nuestra teoría necesitará ser revisada para acomodar este tipo de caso.
norte
Patrones más complejos: variables dependientes múltiples La sección anterior se centró en mi
situaciones en las que predecimos una única variable de resultado bajo un conjunto particular de Innovación 1 2 3 1 2 3
condiciones (variables independientes múltiples). variable independiente) y predecir que esta d

condición producirá un conjunto particular de resultados. Es decir, pronosticaremos un patrón de


norte
resultados bajo una condición dada (Figura 15.5). Luego uniremos ese patrón pronosticado con los
casos que cumplan la condición. mi

pags
Aquí predecimos un patrón de resultados en los casos que cumplen la condición 1 y un patrón
diferente para los casos que cumplen la condición 2. El patrón es una combinación particular de mi
resultados. En este caso, predecimos que para los casos que cumplen la condición 1 (en la variable
independiente) encontraremos el D

Figura 15.6 Patrones previstos de resultados en cinco variables dependientes por nivel
de autonomía del trabajador
siguientes características en las cinco variables de resultado (A, B, C, D, E): A3, B3, C1, D2, E3. Para En otras palabras, predecimos que las organizaciones (casos) que permiten altos
los casos que cumplen la condición 2, predecimos un patrón diferente de resultados: A1, B1, C3, D2 niveles de autonomía entre los miembros de su fuerza laboral mostrarán un patrón
y E1. particular de resultados: alta moral + alta calidad del trabajo + baja rotación de personal
+ niveles moderados de eficiencia + altos niveles de innovación .
Esto se puede ilustrar con un ejemplo (Figura 15.6). La teoría que se utiliza aquí predice que la
autonomía conduce a mejores resultados que los altos niveles de supervisión. términos de moral, Se predice que las organizaciones con altos grados de supervisión y dirección se
compromiso con el trabajo, iniciativa y mejora de la calidad del trabajo. comportarán de manera diferente. Se prevé que tengan un conjunto diferente de
características de resultados: baja moral + baja calidad del trabajo + alta rotación de
personal + niveles moderados de eficiencia + bajos niveles de innovación.
260
DISEÑOS DE ESTUDIOS DE ANÁLISIS DEL ESTUDIO 261
CASO DE CASO

Análisis de tendencias El análisis de tendencias es un examen de la dirección


Coincidencia de patrones altamente compleja La versión más compleja de la del cambio en una variable o conjunto de variables en particular. Abordamos
coincidencia de patrones ocurrirá cuando tengamos un conjunto de variables la cuestión de si la tendencia es al alza (empinada o gradual), si no muestra
independientes y un conjunto de variables dependientes. En esta situación, podemos cambios, variable (hacia arriba y hacia abajo) o hacia abajo (empinada o
predecir que cuando un caso tiene un conjunto particular de atributos causales, se gradual).
compararán con un conjunto particular de resultados.
Las tendencias pronosticadas pueden variar desde simples hasta
Por ejemplo, podemos predecir que cuando una organización es bastante pequeña altamente complejas. Las formas más simples predicen una tendencia en una
y posee una estructura organizativa 'plana', mecanismos consultivos respetados y variable dependiente. Entonces podríamos predecir un patrón diferente de
planes de recompensa para los trabajadores, habrá un conjunto valioso de cambio en esta variable en diferentes contextos. Por ejemplo, podemos
resultados. Estos pueden ser un alto compromiso de los trabajadores, resultados de anticipar que las inscripciones en un tipo particular de curso universitario (el
excelente calidad, fuertes lazos entre los trabajadores fuera del lugar de trabajo, fácil caso) aumentarán en el corto plazo pero disminuirán en el largo plazo. Se
aceptación de la innovación, bajos niveles de ausentismo y ausencia de disputas puede predecir que otro curso mantendrá niveles estables de inscripción
laborales. mientras que otro tipo de curso se prevé que experimentar fuertes aumentos
en los niveles de matriculación.
Refinar teorías Estrictamente hablando, la prueba de teoría implica especificar una
proposición teórica, probarla y aceptarla o rechazarla. En realidad, sin embargo, si
una proposición no está respaldada por un estudio de caso, el siguiente paso es
refinar la teoría para que pueda tener en cuenta la excepción prevista por el caso. De
esta manera, la proposición cubre un conjunto de casos cada vez más amplio y se
vuelve más poderosa. Este proceso se llama inducción analítica y se describirá con
más detalle más adelante en la sección que trata sobre la construcción de teorías.

ANÁLISIS DE SERIES TEMPORALES

Aunque Yin (1989) trata este método de análisis como separado de la coincidencia
de patrones descrita anteriormente, la lógica es idéntica y, por lo tanto, debe tratarse
simplemente como una forma de coincidencia de patrones. En lugar de predecir un
patrón particular para un conjunto de variables, predice una tendencia particular o
secuencia de eventos. La estrategia analítica implica predecir un patrón particular de
cambio a lo largo del tiempo. Este tipo de análisis de patrones puede tomar una de
dos formas: análisis de tendencias y análisis cronológico (secuencia de eventos).
seguido de una estabilidad a más largo plazo) y hacer coincidir este patrón
previsto con el de los casos reales.
El análisis de tendencias podría ser mucho más complejo. En lugar de
simplemente predecir una tendencia diferente en la misma variable para diferentes No todos los estudios de tendencias tendrán una interrupción. Algunos
casos, una versión compleja del análisis de tendencias predeciría tendencias para un simplemente predecirán una tendencia que se anticipará en un contexto
conjunto de variables en cualquier caso dado. Por ejemplo, podríamos predecir que particular. Por ejemplo, podemos anticipar, a partir de lo que sabemos sobre
en un curso dado aumentarán las inscripciones, la proporción de mujeres a hombres el perfil demográfico y económico de una región (el caso), que es probable
mejorará con el aumento de los niveles de inscripción, habrá un aumento en los que experimente una disminución de la población a largo plazo. Se podría
estudiantes de edad madura y no habrá reducción en la calidad de la enseñanza. pronosticar que otra región con una combinación diferente de características
estudiantes. En otro curso, podríamos predecir una combinación diferente de demográficas y económicas experimentaría un crecimiento, mientras que se
tendencias: una matrícula constante, una disminución de los estándares, una podría pronosticar que otra región con un perfil diferente se estancaría.
disminución de estudiantes de edad madura y menos estudiantes mujeres. Análisis cronológico El análisis cronológico implica predecir una secuencia de
Los análisis de tendencias pueden ser interrumpidos o ininterrumpidos. El análisis de series eventos (o incluso una secuencia de tendencias) que involucra una cantidad
de tiempo interrumpido se refiere a una situación en la que un evento específico tiene lugar en de eventos o variables diferentes. Es decir, predeciríamos qué cambiaría o
algún lugar dentro de la secuencia de eventos. Esto nos permite examinar el patrón de eventos qué eventos ocurrirían y en qué orden. La secuencia de eventos podría ser
antes y después de la interrupción (o intervención). En este sentido, un análisis de series de una secuencia de causa y efecto o podría ser una secuencia descriptiva que
tiempo interrumpido es similar a un diseño de antes y después. Aunque no involucra un grupo de propone etapas particulares en un proceso.
control, realizaríamos estudios de casos en los que la interrupción ocurrió y no ocurrió. Si bien
no podemos controlar otras diferencias entre casos, podemos recopilar información detallada Ejemplos de una versión escalonada del análisis cronológico podrían ser
sobre todos los casos para permitirnos considerar si estos otros las diferencias (en lugar de la modelos que propongan etapas predecibles para convertirse en un
interrupción) podrían ser responsables del efecto aparente de la interrupción. consumidor de marihuana (Becker, 1966), etapas en la desintegración de las
relaciones íntimas (Vaughn, 1986), etapas en el proceso de ajuste a la
El análisis de tendencias interrumpidas implicaría predecir un patrón previo y
jubilación (Atchley, 1976), o cambios en las relaciones entre los adultos y sus
posterior a la interrupción (por ejemplo, disminución previa y aumento posterior,
padres a medida que los padres envejecen (Marsden y Abrams, 1987).
262
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 263
DE CASO CASO

En el capítulo 13 argumenté que la generalización a partir de estudios de


Independientemente de si el análisis involucra una secuencia de eventos de causa y efecto, casos se basa en la lógica de replicación de los experimentos más que en la
o un conjunto de etapas predichas, la pregunta analítica es si el patrón de cambio predicho lógica estadística de las encuestas. Ganamos confianza en los resultados
ocurre en los casos en que la teoría esperaría que ocurriera. predeciría que no debería ocurrir?
experimentales no solo por la elegancia del experimento, sino también por
Las formas de los patrones previstos pueden variar. Yin (1989) indica cuatro tipos de formas nuestra capacidad para replicar los resultados de manera predecible y
en las que se puede predecir que los eventos cambiarán entre sí. Podemos predecir previsiblemente fallar en replicar los resultados (es decir, anticipamos que la
cronologías en las que: intervención tendrá su efecto bajo condiciones específicas pero no bajo otras
algunos eventos siempre deben ocurrir antes que otros eventos, siendo imposible la condiciones).
secuencia inversa;
De manera similar, ganamos confianza en los hallazgos del estudio de
·algunos eventos siempre deben ser seguidos por otros eventos, de forma contingente; casos cuando podemos predecir con precisión qué tipos de casos mostrarán
patrones particulares y qué casos no mostrarán patrones específicos.
algunos eventos solo pueden seguir a otros eventos después de un transcurso de tiempo
específico; o ciertos períodos de tiempo en un estudio de caso pueden estar marcados por Cuando tenemos un conjunto predicho de resultados y un solo factor causal, se
clases de eventos que difieren sustancialmente de los de otros períodos de tiempo [etapas]. mantiene una lógica similar. Nos haríamos el siguiente tipo de preguntas:
(1989: 119)
1 ¿Ocurre el conjunto completo de características de resultado cuando está
Réplica literal y teórica
presente el supuesto factor causal? Si es así tenemos la confirmación de
nuestra teoría.
2 Entonces encontraríamos otro caso donde el supuesto factor causal está presente
y veríamos si el conjunto completo de resultados también está presente en ese caso.
Si es así, tenemos una réplica literal del caso anterior y una mayor confirmación de No encontraremos casos en los que tengamos los efectos sin nuestra
nuestra teoría. presunta causa. Si no logramos encontrar ninguno de estos casos,
habremos logrado una mayor replicación teórica.
3 ¿Tenemos casos en los que el supuesto factor causal está presente pero solo
algunas de las características del resultado previsto están presentes? Si
Análisis para la construcción de teorías: inducción analítica
encontramos tales casos, entonces no hemos podido replicar la teoría y
rechazaríamos o modificaríamos la teoría. Si no pudiéramos encontrar casos en los En esencia, la inducción analítica es "una estrategia de análisis que dirige al
que la causa estuviera presente y el conjunto completo de resultados no estuviera investigador a formular generalizaciones que se aplican a todas las instancias
presente, entonces tendríamos una réplica teórica. del problema" (Denzin, 1978: 191). Es un método que se puede utilizar para
lograr generalizaciones descriptivas o para llegar a explicaciones causales. Es
4 Entonces buscaríamos encontrar un caso en el que el presunto factor causal no
una estrategia que parte de casos individuales y busca identificar qué tienen
esté presente. Esperaríamos que el conjunto completo de resultados no ocurriera
en común los casos. El elemento común proporciona la base de la
cuando la causa no estuviera presente. Es decir, deberíamos
generalización teórica (ver Figura 1.2).

La inducción analítica es una estrategia que busca llegar a generalizaciones


aplicables a todos los casos. En este aspecto difiere de las estrategias de análisis
discutidas en secciones previas de este libro. En el capítulo 3 distinguí entre nociones
deterministas y probabilísticas de causalidad. Los modos de análisis discutidos en las
secciones anteriores se basan en la causalidad probabilística: estimamos si un grupo
tiene más probabilidades que otros grupos de comportarse de una manera particular. La
inducción analítica, sin embargo, busca lograr generalizaciones universales.

Denzin (1978: 192) resume seis pasos clave en el proceso de inducción


analítica:

1 Especifique qué es lo que busca explicar (la variable dependiente).

2 Formula una posible explicación inicial y provisional del fenómeno que


buscas explicar (tu teoría).

3 Realice un estudio de un caso seleccionado para probar su teoría.

4 Revise (y modifique si es necesario) su teoría provisional a la luz del caso o


excluya el caso como inapropiado.

5 Llevar a cabo más estudios de caso para probar la propuesta (revisada) y


reformular la propuesta según sea necesario.

6 Continúe con los estudios de casos (incluida la búsqueda de casos que


puedan refutar la proposición) y revise la proposición hasta que logre una
proposición causal que explique todos los casos.

El proceso podría ilustrarse utilizando el ejemplo hipotético del Capítulo 13


sobre el impacto en la calidad de la educación de los sistemas de dotación de
personal escolar descentralizados frente a los centralizados.
En este ejemplo la calidad de la educación es el fenómeno que buscamos explicar (paso 1). centralizados (paso 2). Por lo tanto, anticipamos que los casos (escuelas) con sistemas
Nuestra explicación provisional (parcial) es que los sistemas descentralizados de personal descentralizados tendrán una educación de mejor calidad que aquellos con sistemas
producirán mayores mejoras en la calidad de la educación en una escuela que los sistemas centralizados
264
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 265
DE CASO CASO

Luego revisamos nuestros casos anteriores para ver si esto explica los diferentes
(siendo el resto de las cosas iguales). Alternativamente, podríamos anticipar que resultados. ¿Se destacan los casos exitosos por tener procesos de implementación
las escuelas que introdujeron un sistema de dotación de personal descentralizado diferentes al caso desastroso? Supongamos que los casos exitosos implementaron el
exhibirían una mejora en la calidad de la educación y que esta mejora sería mayor esquema solo después de una gran cantidad de consultas y hubo un amplio consenso
que en las escuelas que no introdujeron dicho sistema. sobre la conveniencia

Luego, seleccionaríamos un caso para probar nuestra propuesta (paso 3). Podríamos
encontrar una escuela que haya introducido recientemente un sistema de personal local.
Habiendo desarrollado una definición de lo que constituye la calidad educativa y resuelto
cómo medirla, podríamos realizar un estudio de caso para ver si la introducción del nuevo
sistema de dotación de personal había conducido a las mejoras previstas. Supongamos que
las mejoras previstas de hecho había tenido lugar. Esto respalda nuestra propuesta, pero el
apoyo no es abrumador y probablemente no convencería a un escéptico (paso 4). El
escéptico podría decir que un caso difícilmente prueba el punto, que puede haber habido una
mejora general en la calidad educativa en todas las escuelas durante el mismo período, y
que las escuelas que mantuvieron el antiguo sistema también podrían haber exhibido una
mejora en la calidad educativa. Como mínimo, podrían decir que podrían encontrar una
escuela con un sistema central que había mejorado su calidad de educación durante el
mismo período. También podrían argumentar que podrían encontrar ejemplos de escuelas
donde se introdujo el sistema local con consecuencias desastrosas para la calidad educativa.

Tendríamos que trabajar más: más estudios de casos (paso 5). Inicialmente, podríamos
buscar más casos de sistemas locales de dotación de personal recientemente introducidos
para verificar que el estudio de caso inicial no fue solo buena suerte.

Imaginemos que luego nos encontramos con una escuela a la que aluden nuestros
críticos, una en la que la introducción del nuevo sistema había sido un desastre. Había
conducido a la insatisfacción de maestros, estudiantes y padres, pérdida de moral y una clara
disminución en muchos aspectos de la calidad educativa. ¿Cómo podemos entender este
caso? ¿Qué tiene de diferente este caso que debería hacer que se comporte de manera
diferente a la que predijimos provisionalmente, y tan diferente de los otros casos que ya
hemos estudiado?

Dado que nuestro estudio debe producir una imagen completa de cada caso y su contexto
social y cultural, probablemente recogeremos algunas pistas iniciales. ¿En qué se diferencia
la escuela 'desviada' de las demás? Podríamos notar algunas características sobre el
proceso por el cual se introdujo el esquema descentralizado en la escuela en la que resultó
un fracaso. Por ejemplo, los docentes informan que se les impuso. No fueron consultados y
no existen procesos de apelación contra el decisiones del rector. Entonces, nuestra
corazonada es que el éxito de este tipo de esquema depende de la forma en que se
implemente.
Podríamos continuar con estudios de casos adicionales para comprobar qué tan
bien se sostiene esta propuesta. Además de analizar los casos en los que se introdujo
del esquema y el proceso por el cual iba a operar. Entonces estaríamos en una posición un sistema de dotación de personal local, debemos analizar algunos casos en los que
(paso 6) para modificar nuestra proposición provisional inicial para que diga algo como: se mantuvo el sistema centralizado. Esperaríamos no ver el mismo nivel de mejora en
'Cuando se implementa en un clima de consulta y consenso, los sistemas de personal la educación en estas escuelas. Si esto fuera así, fortalecería nuestra confianza en
descentralizados producirá mejoras en la calidad educativa. nuestra teoría inicial sobre el impacto de los sistemas locales de dotación de personal.

Sin embargo, nuestro próximo caso causa problemas. Hemos localizado otro caso donde Podríamos buscar casos que pudieran refutar nuestra teoría. Por ejemplo, si
el sistema de dotación de personal local también ha sido un desastre. En este caso, sin pudiéramos encontrar una escuela que hubiera mantenido el sistema centralizado y
embargo, el sistema se implementó sólo después de una cuidadosa consulta y con el pleno hubiera mostrado una mejora en la calidad educativa, podríamos mejorar aún más
acuerdo del personal y otros. Esto no es lo que esperábamos. ¿Por qué no encaja este nuestra teoría. Podríamos estudiar una escuela en la que hayamos identificado que
caso? Un examen más detallado del caso revela que la escuela ha tenido un nuevo director ha habido una mejora en la educación, pero se ha mantenido el sistema de dotación
designado desde que se introdujo el sistema. No se confía en este director y se cree que de personal centralizado. Esto iría en contra de nuestra propuesta revisada. En su
tiene favoritos. También se cree que victimiza al personal popular en particular. Tal vez estas contexto más amplio, existe una relación hostil entre la escuela y la comunidad local.
son las razones por las que el sistema no funcionó. Revisando casos anteriores, todas las Nos enteramos de que hubo un intento previo por parte del consejo escolar (en el que
historias de éxito tenían directores que gozaban del aprecio y confianza de muchos. había muchos representantes de la comunidad local) de introducir un esquema de
dotación de personal local. Los maestros se habían resistido con éxito. esto y sintieron
¿Tienen algo en común los dos fracasos? Aunque los casos son diferentes en ciertos que el sistema centralizado de dotación de personal los estaba protegiendo.
aspectos, lo que tienen en común es que los docentes no tienen ninguna confianza en el
sistema. En un caso se les impuso sin consultar. En el otro, el director ha socavado su Cuando aprendemos estas cosas sobre lo que a primera vista parece un 'caso
confianza en la imparcialidad del sistema. Entonces podríamos modificar nuestra propuesta desviado' que refuta nuestra proposición, de hecho confirma aún más
revisada a algo como: 'Cuando los docentes tengan confianza en la imparcialidad de un
sistema de dotación de personal delegado, esto conducirá a mejoras en la calidad de la
educación.'
266
DISEÑOS DE ESTUDIOS
DE CASO

Nota
nuestra proposición que enfatiza la noción de que los maestros deben tener confianza 1 Por supuesto, esta lógica asume que nuestra variable causal es el único factor que
en el sistema. Quizás este caso nos haría ampliar aún más nuestra propuesta para puede producir un resultado dado. Si encontramos casos en los que ocurren los efectos
enfatizar la importancia de que los docentes tengan confianza en el sistema e identificar pero nuestra causa favorita está ausente, entonces tenemos explicaciones alternativas
los factores que producen esa confianza en lugar de enfatizar la importancia de un del fenómeno. Nuestro diseño de investigación debe diseñarse para eliminar tales
sistema local o centralizado en sí mismo. explicaciones alternativas.

Resumen
Este capítulo ha enfatizado el punto de que el análisis de estudio de caso debe ser
fundamentalmente una empresa teóricamente informada. Esto se aplica igualmente a
los estudios de casos descriptivos y explicativos. Se discutió el uso de tipos ideales
como método para analizar estudios de casos descriptivos. Se describieron dos
métodos amplios para analizar los estudios de casos con fines explicativos. Cuando los
estudios de casos se utilizan para probar una teoría, la coincidencia de patrones
proporciona una forma adecuada de analizar y comparar casos. múltiples variables
independientes y dependientes. Cuando se utilizan estudios de casos para construir una
teoría, la inducción analítica proporciona una forma útil de analizar y utilizar cada estudio
de caso.
and Methods.Beverly Hills and London:Sage.

Campbell, DT y Stanley, JC (1963) Diseños experimentales y cuasiexperimentales para


la investigación. Boston: Houghton Mifflin.

Cohen, J. (1987) Análisis de poder estadístico para las ciencias del comportamiento.
Nueva York: Academic Press.

REFERENCIAS Cook, TD y Campbell, DT (1979) Cuasi-experimentación: problemas de diseño y análisis


para entornos de campo. Boston: Houghton Mifflin.

Coser, LA (1977) Maestría en Pensamiento Sociológico: Ideas en el Contexto Histórico y


Social. Nueva York: Harcourt, Brace, Jovanovich.

Davis,JA(1985)La lógica del orden causal.Beverly Hills,CA:Sage.


Aronson, E. y Mills, J. (1959) 'El efecto de la severidad de la iniciación en el gusto por un grupo',
Journal of Abnormal and Social Psychology, 59: 177-81. Dempsey, K. (1990) Smalltown: un estudio de desigualdad social, cohesión y
pertenencia. Melbourne: Oxford University Press.
Atchley,RC(1976) La sociología de la jubilación.Cambridge,MA:Schenkman. Baumrind, D. (1964)
'Algunos pensamientos sobre la ética de la investigación: después de leer Denzin, N. (1978) La Ley de Investigación: una Introducción Teórica a los Métodos de
Investigación. Nueva York: McGraw-Hill.
“ Estudio conductual de la obediencia ” de Milgram, American Psychologist, 19:421-3.
Becker,HS(1966) Outsiders:Studies in the Sociology of Deviance.Nueva York:Free Press. Departamento de Servicios Humanos y Salud (1995) Suicidio juvenil en Australia: una
monografía de antecedentes. Canberra: Servicio de publicaciones del gobierno
Blalock, H. (1964) Inferencias causales en la investigación no experimental. Chapel Hill, NC: australiano.
University of North Carolina Press.
de Vaus, DA (1994) Dejar ir: Relaciones entre adultos y sus padres. Melbourne: Oxford
Blau, P. (1964) Intercambio y poder en la vida social. Nueva York: Wiley. University Press.

Blumer, H. (1956) 'Análisis sociológico y la "variable"', American Sociological Review, 21:683-90. de Vaus,DA(2001) Surveys in Social Research.Londres:Routledge.

Brown, GW y Harris, T. (1978) Los orígenes sociales de la depresión: un estudio de los trastornos de Vaus, DA y Wolcott, I. (eds)(1997) Australian Family Profiles: Social and Demographic
psiquiátricos en mujeres. Londres: Tavistock. Patterns. Melbourne: Instituto Australiano de Estudios Familiares.

Buck, N., Ermisch, J. y Jenkins, S. (1995) Elegir un diseño de encuesta longitudinal: los problemas,
Centro de investigación ESRC sobre cambio microsocial, Universidad de Essex. Campbell, DT
(1989) 'Prólogo', en RKY en (ed.), Investigación de estudio de caso: Diseño

268
REFERENCIAS REFERENCIAS 269

Freud, S. (1955) Two Case Histories (Little Hans and Rat Man). Londres: Hogarth Press
Dillman, D. (1978) Encuestas por correo y teléfono: el método de diseño total. Nueva York: y el Instituto de Psicoanálisis.
Wiley.
Geertz, C. (1973) 'Descripción densa: hacia una teoría interpretativa de la cultura', en
Durkheim,E.(1970) Suicide.Londres:Routledge and Kegan Paul. C.Geertz (ed.), La interpretación de las culturas: Ensayos seleccionados. Nueva York:
Basic. págs. 3-32.
Foddy, W. (1993) Construcción de preguntas para entrevistas y cuestionarios: teoría y práctica
en investigación social. Cambridge: Cambridge University Press. Freeman, D. (1984) Margaret Gerth, HH y Wright Mills, C. (1946) De Max Weber: Ensayos de sociología. Oxford:
Mead y Samoa: el hacer y deshacer de un Oxford University Press.

Mito antropológico.Harmondsworth: Penguin. Glaser, BG y Strauss, AL (1967) El descubrimiento de la teoría fundamentada:


estrategias para la investigación cualitativa. Chicago: Aldine.

Glenn,NV(1977) Análisis de cohortes.Beverly Hills,CA:Sage.


Goldenberg, S. (1992) Thinking Methodologically. Nueva York: HarperCollins.

Goode, WJ y Hatt, PK (1952) Métodos en investigación social. Londres: McGraw-Hill. Kerlinger, FN (1973) Fundamentos de la Investigación del Comportamiento. Nueva
York: Holt, Rinehart and Winston.
Graetz, B. (1993) Consecuencias para la salud del empleo y el desempleo: evidencia
longitudinal para hombres y mujeres jóvenes', Social Science and Medicine, 36:715-24. Kerlinger, FN (1979) Behavioral Research: a Conceptual Approach. Nueva York: Holt,
Rinehart and Winston.
Grimm, LG y Yarnold, RR (1995) Lectura y comprensión de estadísticas multivariadas.
Washington: Asociación Americana de Psicología. Kerlinger, FN y Pedhazur, EJ (1973) Regresión múltiple en la investigación del
comportamiento. Nueva York: Holt, Rinehart y Winston.
Groves, RM (1979) 'Actores y preguntas en encuestas telefónicas y entrevistas personales',
Public Opinion Quarterly, 43:190-205. Kimmel, AJ (1988) Ética y valores en la investigación social aplicada. Beverly Hills y
Londres: Sage.
Groves, RM y Kahn, RL (1979) Encuestas por teléfono: una comparación nacional con
entrevistas personales. Nueva York: Prensa Académica. Lepkowski,JM(1989) Tratamiento de la falta de respuesta de onda en encuestas de
panel', en D. Kasprzyk,G.Duncan,G.Kalton y MP Singh (eds), Panel Surveys.Nueva
Hage, J. y Meeker, BF (1988) Causalidad social. Londres: George Allen y Unwin. York:Wiley.

Hakim,C.(1986) Diseño de Investigación: Estrategias y Opciones en el Diseño de Investigación Lewis, O. (1951) La vida en un pueblo mexicano: Tepoztlán reestudiado. Urbana, IL:
Social. Londres: Allen and Unwin. Prensa de la Universidad de Illinois.

Henry,GT(1995) Gráficos de datos: técnicas de visualización y análisis. Thousand Oaks, CA: Loether, HJ y McTavish, DG (1974a) Estadística inferencial para sociólogos: una
Sage. introducción. Boston: Allyn and Bacon.

Hertel, B. (1976) 'Minimización de la varianza del error introducida por el análisis de datos Loether, HJ y McTavish, DG (1974b) Estadísticas descriptivas para sociólogos: una
faltantes en el análisis de encuestas', Sociological Methods and Research, 4:459-74. introducción. Boston: Allyn and Bacon.

Hochschild, A. (1989) The Second Shift. Nueva York: Avon. Lynd, RS y Merrell-Lynd, H. (1929) Middletown: un estudio sobre la cultura americana
moderna. Nueva York: Harcourt, Brace and World.
Homan,R.(1991) La ética de la investigación social. Londres: Longman.
Lynn,P.,Purdon,S.,Hedges,B.and Mcaleese,I.(1994) 'Una evaluación de las estrategias
Homans, G. (1961) Comportamiento social: sus formas elementales. Nueva York: Harcourt, de ponderación alternativas', Informe de encuesta de cohorte juvenil, Departamento de
Educación, Sheffield.
Brace, Jovanovich.
Marsden, D. y Abrams, S. (1987) Libertadores, compañeros, intrusos y cucos en el
Johnson, A. (1977) Estadísticas sociales sin lágrimas. Nueva York: McGraw-Hill. nido: una sociología de las relaciones de cuidado durante el ciclo de vida', en P. Allatt,
T. Keil, A. Bryman y B. Bytheway (eds), Women and the Life Cycle: Transitions and
Kalton,G.(1983a) 'Compensación de datos de encuestas faltantes', Serie de informes de
Turning-Points. Londres: Macmillan.
investigación, Instituto de Investigación Social, Universidad de Michigan.
Marsh,C.(1982) El método de la encuesta: la contribución de las encuestas a la
Kalton, G. (1983b) Introducción al muestreo de encuestas.Beverly Hills, CA: Sage. Kalton, G.
explicación sociológica. Londres: George Allen y Unwin.
(1986) 'Manejo de la falta de respuesta de onda en encuestas de panel', Journal of Official
Statistics, 2: 303-14. Marsh,C.(1988) Exploración de datos: una introducción al análisis de datos para
científicos sociales. Cambridge: Polity.
Kellehear, A. (1993) El investigador discreto: una guía de métodos. St Leonards: Allen and
Unwin. Mead,M.(1943) La mayoría de edad en Samoa: un estudio de la adolescencia y el sexo
en las sociedades primitivas.Harmondsworth:Penguin.

Menard,S.(1991) Investigación longitudinal. Newbury Park, CA: Sage.

Merton, RK (1968) Teoría social y estructura social. Nueva York: Prensa libre. Milgram,
S. (1964) Problemas en el estudio de la obediencia: una respuesta a Baumrind',
American Psychologist, 19: 848-52.

Mills, CW (1959) La imaginación sociológica. Nueva York: Oxford University Press.


Mitchell, JC (1983) 'Análisis de casos y situaciones', Sociological Review, 31: 187-211. Moser, Redfield, R. (1930) Tepoztlan, a Mexican Village: a Study of Folk Life. Chicago:
CA y Kalton, G. (1971) Métodos de encuesta en investigación social. Londres: Heinemann. University of Chicago Press.

Mueller,JH,Schuessler KFand Costner,HL(1977) Razonamiento estadístico en Roethlisberger FJand Dickson, WJ (1939) Gestión y el trabajador. Cambridge, MA:
sociología.Boston:Houghton Mifflin. Prensa de la Universidad de Harvard.

Punch,M.(1994) 'Política y ética en la investigación cuantitativa', en N. Denzin y Y.Lincoln (eds),


Handbook of Qualitative Research. Thousand Oaks, CA:Sage. págs. 83-97.

270
REFERENCIAS

Rogers, TF (1976) 'Entrevistas por teléfono y en persona: calidad de las respuestas y


desempeño en el campo', Public Opinion Quarterly, 40:51-65.

Rose,D.,Buck,NAand Corti,L.(1991)'Design issues in the British Home Panel


Study',Documentos de trabajo del ESRC Research Center on Micro-Social Change,Paper
2,University of Essex,Colchester.

Rosenberg, M. (1968) La lógica del análisis de encuestas. Nueva York: Básico. ÍNDICE
Spector,PE(1981) Diseños de investigación.Beverly Hills, CA:Sage.

Stake, RE(1994)'Estudios de casos', en NKDenzin and Y.Lincoln (eds),Handbook of


Qualitative Research. Thousand Oaks, CA:Sage.pp.236-47.
Razonamiento a priori Sesgo, 79
Sullivan, L., Maley, B. y Warby,M.(1997) Estado de la Nación: Indicadores Estadísticos del
Bienestar de Australia. Melbourne: Centro de Estudios Independientes. Suppes, P. (1970) diseños de secciones transversales, 178-9 desgaste, 75-6
Una teoría probabilística de la causalidad. Ámsterdam: Holanda Septentrional.
Empirismo abstracto,2 efecto sobre la descripción, 136
Tabachnick, BG y Fidell, LS (1983) Uso de estadísticas multivariadas. Nueva York: Harper
and Row. Razonamiento ad hoc efecto sobre la explicación, 136

Tajfel, H. (1984) La Dimensión Social: Desarrollos Europeos en Psicología Social. identificar el sesgo de datos
diseños transversales,179-80,182
faltantes,149
Cambridge: Prensa de la Universidad de Cambridge.
eliminando
Vaughn, D. (1986) Desacoplamiento: puntos de inflexión en las relaciones íntimas. Nueva Rango de cohorte de edad, 212,
estadísticamente,135,136,152
York: Oxford University Press.
Efectos del
Whyte, WF (1943) Street Corner Society: la estructura social de un barrio marginal italiano. pruebas de efectos,77
envejecimiento,115,124,211,212-13,
Chicago: Prensa de la Universidad de Chicago.
215 ponderación,151-2
Yin,RK(1989) Investigación de estudio de caso: diseño y métodos. Beverly Hills y Londres:
Sage. diseños longitudinales, 132

Yin, RK (1993) Aplicaciones de la investigación de estudios de casos. Beverly Hills y Londres: Diseño del grupo Solomon 4, 133 CAPÍ, 141-2
Sage.
Cambio agregado Estudios de caso

Cambio agregado,122,128-9,134,135,137, clínico, 223-4

153-54,211 análisis descriptivo, 250-3

gráficos, 163 análisis explicativo, 253-66


métodos de análisis, 153-4 presentando, 244-5 ver correlación, covariación diferentes tipos,37-9

diseños de sección transversal repetidos, Desgaste efectos directos,2-4,36-9


informes, 244-5
153
evaluación de efectos,123 indirecta,36-9
mesas,163,164 construcción de la teoría, 263-6
sesgo,75-6 inferir la causa,4,34-6
Asignación a grupos,44-6,48 prueba de teoría, 253-63
tamaño de la muestra inicial, 144
Inducción analítica, 263-6 Diseño de estudio de caso,50-1,219-66

seis pasos, 263 tipos, 228-9 minimizar los efectos, 135-6 Relaciones causales

Anonimato CATI,141-2 minimizando, 138-9 criterios para la inferencia,34-6

experimentos, 87-8 dirección causal no aleatorio, 135 directos e indirectos,36-9

diseños de secciones transversales, tablero,138-9 Causalidad,4-5,34-51


diseños de secciones transversales, 192
180-1
reemplazos, 136 razonamiento a priori,178-9
ver también confidencialidad efecto causal
carga del encuestado,139-40 razonamiento ad hoc,179-80,182
Anonimización de datos directa,65,71
miembros del panel de seguimiento, 138-9 correlación y causa, 178
diseños de secciones transversales, 192 indirecta,71
falta de respuesta de la unidad, 147 determinista, 4-5
Artificialidad, 77, totales, 71
Cuadro medio parcial,104 causa fundamentante,34-47,178-81
Asociación,medidas de Explicación causal, 2-4

ÍNDICE yo ÍNDICE
272
273

Causalidad (continuación) estudios de casos múltiples, 226 Definiciones replicación, 205-6

diseños de secciones transversales,


significa, 199 nominal, 24-7 especificación, 204-5
177-81

a juego, 178 diseños de estudio de caso de una sola toma, 230 operativo, 24, 27 relación espuria,204,207

ajuste del modelo, 179-80 puntos de tiempo, 42-3 Características de la demanda,24 pasos, 203-4

probabilístico, 4-5 Recolección de datos asistida por computadora, variable dependiente,19,36 tipos de patrones causales,36-9

recíproco, 36 141-2 Descripción,1-2,114-5 relaciones de orden cero, 204-10

véase también relación directa, efecto


controles estadísticos,177-9 Conceptos transversal,194-200
causal,

tipos de patrones causales,36-9 aclarando, 24-7 tipologías deductivas,225-6 causalidad

ver también dirección causal dimensiones,25,26 preguntas de investigación descriptivas, 17-19 Unidades de análisis integradas, 220-1

Tendencia central,medidas de,92-3 naturaleza de, 24 tipologías empíricas,225 Igualdad de varianza, 103,

Cambiar gráficos CATI,141-2 tipos ideales, 225-6 Error

ver gráficos CAPÍ, 141-2 tipologías inductivas,226 ver error de medición; muestreo
272

Cambiar medida,153-63 ventajas en estudios longitudinales estadísticas, 89-90 error

cálculo de puntajes de cambio sin


Tablas condicionales, 204-5 tipologías teóricas,225 Ética
procesar, 155-6

transversal,171-2,173-5 Intervalo de confianza, ver muestreo teoría, 224-5 experimentos, 83-8

experimentos,53-6 Nivel de confianza, ver muestreo tipologías,225-6 anonimato, 192

error de medición, 156 Confidencialidad con estudios de casos, 224-5 anonimizar datos, 192

multidireccional,154 almacenamiento de datos, 87 Análisis descriptivo confidencialidad y anonimato,146,

cambio porcentual, 156-7 experimentos, 87-8 datos transversales, 194-218 192

problemas de puntajes de cambio sin


procesar, 156 diseños de secciones transversales, 192 Distribuciones, 195 observación encubierta, 246

cambio cualitativo,154 diseños longitudinales, 146 tendencia central, 195 seguridad de datos, 146

cambio cuantitativo, 154 contexto legal,87 distribuciones de frecuencia, 195 engaño, 246

puntajes de cambio sin procesar, 155-6 límites, 87 gráficos, 195 disfrazando la identidad,246

confiabilidad y cambio bruto, 156 ver también anonimato análisis de tipo ideal, 251 daño a los participantes,145,193

puntajes de cambio residualizados, 156 Contexto teorías implícitas, 251 comportamiento ilegal/dañino,246

véase también cambio agregado,individual análisis de estudio de caso, 234-6,250 curtosis, 195 estudios de casos, 246-7

cambio Grupos de control forma de distribuciones, 195 diseños de secciones transversales, 192-3

Cambiar puntajes, 110 fortalecimiento de la validez interna,73-5 sesgo, 195 consentimiento informado,145,246,85-6

Cambio, describiendo, 163-8 Correlación, 95, propagación, 195 diseños longitudinales, 144-6

gráficos, 163 Costo subjetividad,250-1 observación participante,246

mesas, 163 estudios de casos, 242 tipologías,252 responsabilidad hacia otros investigadores,247

Análisis cronológico,261-2 desagrupamiento, 141 Efectos de desarrollo participación voluntaria,79,145

Análisis de cohortes, 115-18, 211-17 diseños longitudinales, 140-1 ver efectos de envejecimiento ver consentimiento informado, voluntario

rango de cohorte de edad, 212 Covariación, 34-5 Relaciones directas,36-9,65,71 participación, anonimato, daño a

efectos del envejecimiento,115,211 Observación encubierta, 246 ver también efecto causal Participantes

cambio agregado, 211 estudios de casos, 246 Distribuciones, describiendo Experimentos, 53-112

efectos de cohorte,211,213-15,216-17 Casos críticos,227 tendencia central,92-3 análisis,89-111

construyendo mesas, 212 Diseños de secciones transversales,50,170-218 proporciones, 95 y explicación,70

efectos de periodo,115-16,211 ef longitudinal,170-1 forma, 94-5 artificialidad, 77

problemas, 217 diferencias de grupo, 170-1 variabilidad,93-4 diseño clásico,48-9,53-9

tablas de cohortes de lectura, 212-17 intervenciones,172 doble ciego,83 ética,83-8


272

diseño transversal repetido, 211 naturaleza de los 'grupos',172-3 Abandonar campo,57-8

tabla de cohorte estándar, 212 estudios repetidos,173-5 ver desgaste laboratorio,56-9

encuestas espaciadas irregularmente,


dimensión temporal, 173 Muestras dinámicas, 137, natural,58-9
215-17

Diseño secuencial de cohortes,124-6,133 cambio agregado, 137 Mantenimiento de ingresos de Seattle/Denver

envejecimiento del panel, 124-5 Seguridad de datos Experimento, 57

Tablas de cohortes diseños longitudinales, 146 Efectos tipos de diseño,53-69

ver análisis de cohortes ver confidencialidad corto y largo plazo,79 Explicación,1,2-5

Colapsar variables Engaño, 246 Análisis de elaboración,104,203-10 cf predicción, 3-4

ver grabación estudios de casos, 246 tablas condicionales, 204-5 estrechez explicativa de los experimentos,

comparaciones disfrazando la identidad,246 variables de control, 204 70-2

diferentes métodos, 40-7 Véase también consentimiento informado relaciones causales indirectas,204, explicación idiográfica,221,233-4

grupos,39-47 Desagrupamiento, 141 206-7 explicación nomotética,221,233-4

significativo, 43-6 Razonamiento deductivo,6-8,253-62 efectos de interacción, 204-5 papel de los experimentos,70

272 tipologías,226 problemas,210 con casos de estudio,221-4,253-63

274 4 ÍNDICE

validez externa,28-9 efecto Hawthorne,77

experimentos cf de corte transversal,


Historia, 132
184

estudios transversales de panel cf,184 experimentos, 73

diseño de estudio de caso, 237-40 estudios de casos, 236

diseños de secciones transversales,


diseños de secciones transversales, 177
184-5

experimentos, 76-8 diseños longitudinales, 132

diseños longitudinales, 135-8 Unidades holísticas de análisis, 220-1

inmigración y emigración,137

desgaste del panel, 135-6 Tipos ideales, 225-6

reactividad,76 análisis, 251

representatividad,184-5 Explicación idiográfica,22,221,233-4

imputación
generalización
estadística,237,240,249 análisis descriptivo, 195 engaño,78

prueba de efectos de sesgo,77 ver datos faltantes distorsiones, 164-7 cuanta información, 85

generalización teórica, 237, 240, Muestras independientes, 101-2 diferencias de grupo, 97-8 experimentos, 84-6

249 Variable independiente,19,47 cambio individual, 163 diseños longitudinales, 145

amenazas a,76-7 tipos de, 47 ejes primario y secundario,168-9 sincronización, 85

muestras no representativas,76-7 Indicadores,25,26,27,29-30 líneas de tendencia, 163-8 quien de,85-6

variables traneas,19-20,37-9 véase también operacionalización dos variables en un gráfico, 167-8 Inmigración,120,137

cambio de ross Deterioro del instrumento


Relaciones causales indirectas,36-9,71

ver cambio individual experimental, 74-5


análisis ctor,199 análisis de elaboración,204,206-7

Cambio de nivel diseños de secciones transversales, 177


análisis de varianza ctorial
individual,122,129-9,134,135,
brazo a los participantes diseños longitudinales,134,133-4
ver análisis de varianza de dos
153-54
factores diseños de secciones transversales,
Diseño de instrumentos
193
diseños artísticos,65-8,103 gráficos, 163
experimentos, 86 diseños longitudinales, 144
llacy de afirmar el consecuente, métodos de análisis, 153-4
diseños longitudinales, 145-6 Reactividad del instrumento,63,74
13-14 cambio multidireccional,154
comportamiento bravo, 246 pruebas previas, 74
lsificación, 14-15,263,265 diseños de paneles, 153
gráficos
teorías cerradas,14-15 mesas,163,164
estudios de casos, 246 Diseño de 4 grupos de Solomon, 63-5
ministerio de ética de la
investigación,247 Inducción

efectos de suelo y techo analítico, 240, 263-6

ver efectos de truncamiento enumerativo, 240

muestreo discutido, 240 tipologías inductivas,225-6

nombre de referencia,39-47 Razonamiento inductivo,5-6

ver también comparaciones véase también inducción analítica,inducción

distribuciones de equidad, 195 Inferencia,

ver relaciones causales, teoría

mineralización, 28 edificio

Rafas Estadística inferencial,89-90,99

cambio agregado, 163 Consentimiento informado,78,83,246

escalas de eje, 164-7 estudios de casos, 246


regresión estadística,75,134,177 error constante, 31
ÍNDICE 275
prueba/acondicionamiento del
ÍNDICE error correlacionado, 32
panel,74,133,177
275
unidad de casos, 234-5 formas de,31-2
Efectos de
interacción,42,58,65-6,73,74,103, Relaciones de enmascaramiento, 196-7 Estimaciones de intervalo, 201 diseños longitudinales, 134

Intervalos error aleatorio, 31


104 Grupos emparejados,44-5,75

análisis de elaboración,204-5 ex post facto,44-5 desgaste, 79 Cambio de medición

diseños de secciones transversales, entre etapas experimentales,79 ver cambio de medida


Validez interna,27-8
178
efectos de memoria, 80 microcambio
explicaciones ad hoc,182 análisis de elaboración,203-10
Variable interviniente,19,36 ver cambio individual
causa y correlación, 234 diseños de bloques emparejados, 45-6
Intervenciones, 47,172 Datos faltantes, 147-53
análisis de variables, 234-6 prueba posterior, 44,48,61
activo,natural,47 promedio de la imputación de tramo, 150
contexto en estudios de caso,234-6 prueba previa, 44
tipos de, 48 sesgo, 148
diseño de sección transversal, 177 aleatorización, 45
desigual, 82-3 tratar con, 149
efecto de ningún grupo de control
controles estadísticos,202-3 Ítem no respuesta,147 grupo significa imputación,150
aleatorizado, 131

establecer causa, 177-81 Maduración ignorando los datos faltantes, 151

establecimiento de significado, 181-4 estudios de casos, 236 Escalera de abstracción, 24 imputación de oleadas anteriores,151

diseños de secciones transversales, Nivel de medida,90-2 falta de respuesta del artículo, 147
historia,73-4,132,177,236
177
intervalo, 91 por parejas, 151
explicaciones ideográficas, 233-4 experimentos, 73-4
asignación aleatoria dentro de los
estudios de casos, 233-7 diseños longitudinales,132,133 nominal,91-2
grupos
experimentos, 72-6 Significado,5,11 ordinales, 91 imputación,150

diseños longitudinales, 131-5 establecimiento de significado, 181-4 Análisis del curso de vida, 118 imputación basada en regresión,151

deterioro del Réplica literal, 262-3 muestra significa imputación,149


sociología de la hoja frontal, 182
instrumento,74-5,133-4,177
Diseños longitudinales,49-50,113-69 tamaño de la muestra, 148
maduración,73-4,132 análisis de estudio de caso, 234-6, 250
cf diseño experimental, 113 construcción a escala, 148
diseños de secciones transversales,
error de medición, 134
181-4 dimensiones de,113-4 fuentes, 147

mortalidad,75-6,134-5,177 proporcionando significado, 182 panel cf tendencia, 113 falta de respuesta de la unidad, 147

explicaciones nomotéticas, 233-4 análisis de variables, 181 prospectivo cf retrospectivo, 113-14 ola sin respuesta, 147

selección,75 Error de medición, 29-32,89,134,156,157 propósito de,115-18 ver también falta de respuesta
Mortalidad,134-5 ver cambio agregado 177

experimentos, 75-6
Cambio de macros
diseños de secciones transversales,
Efectos principales, 65
276 DEX EN DEX
EN 277

Múltiples grupos tipos sustanciales y teóricos,22-4 Reactividad grupos difíciles de encontrar, 123

diseño de estudio de casos múltiples, 226 técnico y metodológico,24 estudios de casos, 236 paneles de agrupación, 123

diseño de cohortes múltiples, 124 Post test solo con grupo control Recuerdo propósito, 122

pruebas de comparación múltiple, 101 experimentos, 60 eventos de anclaje, 128

diseño experimental de grupos múltiples, Predicción, 3-4 eventos memorables, 128 Tamaño de la muestra

62-3 Privacidad problemas con, 140 desgaste, 144

Múltiples puntos de tiempo ver confidencialidad recordar problemas, 127 diseños de secciones transversales, 187-90

diseño de panel de múltiples puntos, 119-20 Muestreo probabilístico,79,90 diseños retrospectivos, 140 determinantes de,187-188

diseño experimental de múltiples pruebas


Prueba, 15 telescópico inverso, 140 análisis de elaboración, 210
previas,

62 Carácter provisional del apoyo,15 telescópico, 140 experimentos, 78-9

Análisis multivariado,211 proporciones, 95 Recodificación, 196 datos faltantes, 148

regresión múltiple, 104 Proposiciones, 6-8 enfoque distributivo, 197-8 sobremuestreo,143,187-8

Diseño prospectivo relaciones de enmascaramiento, 196-7 al azar, 79

Cambio neto diseños de estudios de casos, 227-8 enfoques sustantivos,196-7,198 diseños de estudio de caso único y múltiple,

ver cambio agregado desventajas, 127 Grabar diseños de enlaces, 128 226-7

Definición nominal, 24-7 panel multipunto,119-20 confidencialidad,128 poder estadístico,78

Explicación nomotética,22,221,233-4 panel sencillo,118-19 Fiabilidad,29,30-1,80 subgrupos, 187-8

Estadísticas no paramétricas,102 puntajes de cambio, 156.157 Muestreo, 24

Muestreo no probabilístico,90 Cualitativo, Diseño transversal repetido, 129,137, acceso a casos,242

Distribución normal, 102-3 cf cuantitativo, 10 211 detección de casos, 241

suposición de, 102 cambio, 154 Reemplazo por desgaste, 137 diseños de estudios de caso, 240

relación crítica, 100 datos, 191 implicaciones del análisis, 122 intervalo de confianza, 189

pruebas t, 100 estudios de casos, 230-1 estrategias, 121 nivel de confianza, 189

Distribuciones normalizadas, 102 experimentos, 83 Replicación,77,78,226 validez externa,29


276

Cuantitativo estudios de casos,226,237-8 enfocado, 241

Comparaciones de un grupo con valor conocido, cf cualitativo,10 análisis de elaboración,205-6 número de casos, 240-1

97,99 cambio, 154 experimentos, 90 sobremuestreo,143,187-8

Diseño de estudio de caso de una sola


datos, 191 literal,239,262-3 precisión de las estimaciones,188
oportunidad, 230-1

Definición operativa, 24,27 estudios de casos, 249-50 teórico,239,262-3 error de muestreo, 188

Operacionalización,24-27 métodos, 10 Informes de estudios de casos, 244-5 selección en estudios de casos,238-40

Emigración,120,137 Diseños cuasi longitudinales, 128-9 Diseño de la investigación teórico, 240

Sobremuestreo,143,187-8 cambio agregado, 128-9 método cf, 9-10 casos típicos, 240

cambio individual, 128-9 cf plan de trabajo,9 no representativo, 29

Diseño de muestra pareada, 102 Longitud del cuestionario, 190-1 definición,8-9 varianza, 190

Envejecimiento de paneles, 124-5 dimensiones de,47-8 ponderación, 188

Acondicionamiento de paneles, 143 Error aleatorio, 31 Pregunta de investigación, Error de muestreo, 89, 92, 99, 188,

evaluación de efectos,123 Muestreo aleatorio descriptivo, 17-19 diseños longitudinales, 143

Panel de datos, análisis, 155 ver muestreo probabilístico explicativo, 19-21 Construcción a escala,148,151

Diseños de estudios de casos


Asignación aleatoria, 45 enfocando, clarificando, 17-21 Escepticismo, 11-15
paralelos,227,242-3

investigadores, 242 desgaste,81,82 Puntuaciones de cambio residualizadas,156 Prueba de Scheffe, 101

protocolos de investigación,242 resentimiento del grupo de control,81 Carga del demandado,139-40,143,190-1 Selección de casos,238-41

Estadísticas paramétricas, 102 porteros,81 Diseños retrospectivos acceso a casos,242

Observación participante,246 tamaño del grupo, 81 eventos de anclaje, 128 detección de casos,239,241-2

estudios de casos, 246 límites de asignación aleatoria,81 estudios de casos, 227-8 estudios de casos, 238-40

Coincidencia de patrones, 253-60 problemas,71-2,80-2 experimentos, 60-1 número de casos, 240-1

Cambio porcentual, 156-7 rechazos, 81-2 eventos memorables, 128 muestreo, 240

calcular, 156-7 subestimar el efecto causal, paneles,126-8 Selección,75

error de medición, 157 71-2 recordar problemas, 127 Profecía autocumplida,83

problemas, 157 Puntuaciones de cambio sin procesar, 155-6 telescópico inverso, 140 Diseños de estudios de casos secuenciales,227

confiabilidad, 157 calcular, 155-6 telescópico, 140 Forma de las distribuciones, 94-5

Efectos de periodo,124,115-6,211,213-14,216, puntajes extremos, 156 Diseño de panel giratorio,122-3,133 Diseño de paneles sencillos

Placebo,81,83, error de medición, 156 desgaste,122,123 desgaste,120,121


276

Hipótesis rivales plausibles,9,11-14, problemas, 156 evitar el agotamiento, 122 sesgo, 120

estudios de casos, 224 regresión a la media, 156 efectos condicionantes, 123 inmigración y emigración,120

fuente de,21,22-4
276 confiabilidad,156 validez externa,137 tamaño de la muestra,120

278 ÍNDICE puntuaciones z, 159-61 desagrupamiento, 141

278 ÍNDICE Controles estadísticos,162,190 Distribuciones transformadas, 102

ajuste por sesgo de datos faltantes, 152 distribuciones normalizadas, 102


Diseño de panel simple (continuación) teoría,5
cf controles experimentales, 201-2 Variables transformadas, 197-8
con reemplazo,120-2 ex post facto,6
análisis de elaboración,203-10 Tratos
sin reemplazo, 120 post factum,6
diseños de secciones transversales,
Diseño simulado de antes y después,129 análisis de estudio de caso, 250-2, 253-60 ver intervenciones
177-9

Diseño de estudio de caso único,226 diseño de estudio de caso, 221-6 lógica de, 201 Análisis de tendencias,111,260

ver también construcción de teoría, a juego, 202 Efectos de truncamiento, 110-1


Diseño de cohorte única, 123-4
prueba de teoría
múltiple, 203 Análisis de varianza de dos vías, 104,
efectos del envejecimiento, 124 Construcción de teoría, 5-6
Generalización estadística, 237, 240, 110
efectos de período, 124 inducción analítica,260,263-6
249 Tipologías,225-6,252
problemas, 124 estudios de casos,223,227,263-3
Inferencia estadística, 200-1, análisis de conglomerados, 252
Diseño de 4 grupos de Salomón, 63-5,80, Pruebas teóricas,6-8,11,253
estimaciones de intervalo, 201 deductivo, 225-6
103 diseños de estudios de casos, 221-3, 227,
pruebas de significación, 201 empírica,225,252
efectos de prueba,74,76 253-60

Especificación, 204-5, Poder estadístico,78 inductivo, 226


Descripción gruesa, 230
Regresión estadística,75,134, teórico, 225
Relaciones espurias,35,37-9,44 Análisis ordenado por tiempo,35,115
diseños de secciones transversales,
análisis de elaboración,204,207 biografía, 252 177

dotación de personal estudios de casos, 252-3 diseños longitudinales, 134 Falta de respuesta de la unidad, 147

diseños longitudinales, 144 análisis cronológico, 261-2 Resúmenes estadísticos,97,99 Unidades de análisis,18

Normalización,157-61 cronologías, 252


Análisis de subgrupos, 187-8 unidades integradas, 220-1

ajuste por inflación,157-9 historias, 252


unidades holísticas, 220-1
instrumentos, 138 serie temporal interrumpida,261
Pantalla tabular, 96-7 estudios de casos, 220
rango percentil, 159-61 análisis de series de tiempo, 260-2
Explicación teleológica,35 Métodos discretos,237
proporciones,160-1 análisis de tendencias, 260
Pruebas/acondicionamiento de
descamación, 157-61 Seguimiento de los miembros del panel,138-9,146 falta de fiabilidad
paneles,74,133

variable,197-9 costo, 140 diseños longitudinales, 133-4 cambio agregado, 134


diseños de secciones transversales,
cambio individual,,134 INDEX
177 279

Pruebas de significación, 201, cambio de medición, 134


Validez(cont.) validez externa,84
Generalización teórica, 237, 240,
grupos de criterios,30 validez interna,84
249 Validez,29-30,31,80
validez de criterio,29 diseños longitudinales,145
Réplica teórica,262-3 validez de constructo,30
externo,28-9 problemas de,84
validez de contenido,30
interna,27-8

naturaleza de,29 Ola sin respuesta,147

amenazas,24 Olas

véase también validez interna,intervalos de validez externa entre,142-3

Variabilidad, medidas de, 93-4 número en estudios longitudinales, 142

Análisis de variables,181,234-6 acondicionamiento de panel,143

Variable por matriz de casos,185-6 carga del encuestado,143

Varianza,muestra,190 Pesos,76,136,188

Sesgo de datos faltantes de participación voluntaria, 151-2

sesgo, 84

experimentos, 83-4 Relaciones de orden cero, 204-10

También podría gustarte