Documentos de Académico
Documentos de Profesional
Documentos de Cultura
De Vaus Research-Design-In-Social-Research Traducido
De Vaus Research-Design-In-Social-Research Traducido
Antes de examinar los tipos de diseños de investigación, es importante tener claro el papel y el propósito del diseño de investigación. Necesitamos entender qué es el diseño de
investigación y qué no es. Necesitamos saber dónde encaja el diseño en todo el proceso de investigación, desde formular una pregunta hasta finalmente analizar y reportar
datos. Este es el propósito de este capítulo.
Descripción y explicación
Investigación descriptiva
Aunque algunas personas descartan la investigación descriptiva como 'mera descripción', una buena descripción es fundamental para la empresa de investigación y ha
contribuido enormemente a nuestro conocimiento de la forma y naturaleza de nuestra sociedad. La investigación descriptiva abarca gran parte de la investigación patrocinada
por el gobierno, incluida la censo de población, la recopilación de una amplia gama de indicadores sociales e información económica, como patrones de gasto de los hogares,
estudios de uso del tiempo, estadísticas de empleo y delincuencia y similares.
Las descripciones pueden ser concretas o abstractas. Una descripción relativamente concreta podría describir la mezcla étnica de una comunidad, el perfil de edad cambiante
de una población o la mezcla de género de un lugar de trabajo. Alternativamente
2
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 3
INVESTIGACIÓN?
investigación explicativa
La investigación explicativa se centra en las preguntas por qué. Por ejemplo, una cosa
es describir la tasa de criminalidad en un país, examinar las tendencias a lo largo del
tiempo o comparar las tasas en diferentes países. Es muy diferente desarrollar
explicaciones sobre por qué la tasa de criminalidad es tan alta, por qué algunos tipos
de delincuencia están aumentando o por qué la tasa es más alta en algunos países
que en otros.
Figura 1.1 Tres tipos de relaciones causales
La forma en que los investigadores desarrollan diseños de investigación se ve
afectada fundamentalmente por si la pregunta de investigación es descriptiva o opciones ocupacionales, que están vinculadas a oportunidades de promoción, que a su
explicativa. Afecta la información que se recopila. Por ejemplo, si queremos explicar vez afectan el nivel de ingresos (Gráfico 1.1b). O podríamos postular un modelo más
por qué es más probable que algunas personas sean detenidas y condenadas por complejo que involucre varias cadenas causales interrelacionadas (Figura 1.1c).
delitos, debemos tener corazonadas sobre por qué es así. Es posible que tengamos
muchas corazonadas posiblemente incompatibles y necesitaremos recopilar PREDICCIÓN, CORRELACIÓN Y CAUSALIDAD
información que nos permita ver qué corazonadas funcionan mejor empíricamente.
La gente a menudo confunde la correlación con la causalidad. El simple hecho de que
Responder a las preguntas del 'por qué' implica desarrollar explicaciones causales. un evento siga a otro, o que dos factores covaríen, no significa que uno sea la causa del
Las explicaciones causales argumentan que el fenómeno Y (por ejemplo, el nivel de otro. El vínculo entre dos eventos puede ser coincidente más que causal.
ingresos) se ve afectado por el factor X (por ejemplo, el género). Algunas Existe una correlación entre el número de camiones de bomberos en un incendio y la
explicaciones causales serán simples mientras que otras serán más complejas. Por cantidad de daños causados por el fuego (cuantos más camiones de bomberos, más
ejemplo, podríamos argumentar que existe un efecto directo del género en los daños). ¿Es por lo tanto razonable concluir que el número de camiones de bomberos
ingresos (es decir, una simple discriminación de género) (Figura 1.1a). Podríamos causa la cantidad de daños? Claramente, tanto el número de camiones de bomberos
argumentar a favor de una cadena causal, como que el género afecta la elección del como la cantidad de daños se deben a un tercer factor, como la gravedad del incendio.
campo de capacitación, lo que a su vez afecta
De manera similar, a medida que la tasa de divorcios cambió durante el siglo XX, la
tasa de delincuencia aumentó unos años más tarde. Pero esto no significa que el
divorcio provoque delitos. secularización, mayor individualismo o pobreza.
4
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 5
INVESTIGACIÓN?
tiene por qué ser porque las escuelas privadas producen un mejor rendimiento. Puede
Los estudiantes de las escuelas privadas de pago suelen tener un mejor desempeño en su ser que asistir a una escuela privada y un mejor desempeño en el último año sean el
último año de escolaridad que los de las escuelas financiadas por el gobierno. Pero esto no resultado de alguna otra causa (ver discusión más adelante).
Confundir la causalidad con la correlación también confunde la predicción con la causalidad y
la predicción con la explicación. Cuando dos eventos o características están correlacionados ,
podemos predecir uno a partir del otro. Conocer el tipo de escuela a la que asistimos mejora Dicho así, la noción de causalidad determinista en las ciencias sociales suena
nuestra capacidad para predecir el rendimiento académico. que el tipo de escuela afecta el extraña. Es difícil concebir una característica o evento que invariablemente resulte en
rendimiento académico. Predecir el rendimiento sobre la base del tipo de escuela no nos dice un resultado dado incluso si se especifica un conjunto de condiciones bastante estricto.
por qué a los estudiantes de escuelas privadas les va mejor. Una buena predicción no depende La complejidad del comportamiento social humano y los componentes subjetivos,
de relaciones causales. La capacidad de predecir con precisión tampoco demuestra nada significativos y voluntaristas del comportamiento humano significan que nunca será
acerca de la causalidad. posible llegar a enunciados causales del tipo 'Si X, y A y B, entonces siempre seguirá
Y'.
Reconocer que la causalidad es más que la correlación resalta un problema. Si bien
podemos observar la correlación, no podemos observar la causa. Tenemos que inferir la causa. La mayor parte del pensamiento causal en las ciencias sociales es probabilístico más
Sin embargo, estas inferencias son 'necesariamente falibles... [ellos] solo están indirectamente que determinista (Suppes, 1970). Es decir, trabajamos en el nivel en que un factor dado
vinculados a los observables' (Cook y Campbell, 1979: 10). Debido a que nuestras inferencias aumenta (o disminuye) la probabilidad de un resultado particular, por ejemplo: ser mujer
son falibles, debemos minimizar las posibilidades de decir incorrectamente que una relación es aumenta la probabilidad de trabajo a tiempo parcial; la raza afecta la probabilidad de
causal cuando en realidad no lo es. Uno de los propósitos fundamentales del diseño de tener un trabajo de alto estatus.
investigación en la investigación explicativa es evitar inferencias inválidas.
Podemos mejorar las explicaciones probabilísticas especificando condiciones bajo
CONCEPTOS DETERMINISTAS Y PROBABILÍSTICOS DE CAUSALIDAD las cuales X es menos probable y más probable que afecte a Y. Pero nunca lograremos
explicaciones completas o deterministas. Las personas construyen su mundo social y
Hay dos formas de pensar acerca de las causas: determinista y probabilísticamente. El fumador
hay aspectos creativos en la acción humana, pero esta libertad y agencia siempre
que niega que el tabaco provoque cáncer porque fuma mucho pero no ha contraído cáncer
estarán restringidas por las estructuras dentro de las cuales viven las personas. Debido
ilustra la causalidad determinista. La causalidad probabilística es ilustrada por las autoridades
a que el comportamiento no está simplemente determinado, no podemos lograr
sanitarias que señalan las mayores posibilidades de cáncer entre los fumadores.
explicaciones deterministas. Sin embargo, debido a que el comportamiento está
La causalidad determinista es donde se dice que la variable X causa Y si, y solo si, X produce restringido, podemos lograr explicaciones probabilísticas. Podemos decir que un factor
invariablemente Y. Es decir, cuando X está presente, Y ocurrirá 'necesaria, inevitable e dado aumentará la probabilidad de un resultado dado, pero nunca habrá certeza sobre
infaliblemente' (Cook y Campbell, 1979: 14). Este enfoque busca establecer leyes causales los resultados.
tales como: siempre que el agua se calienta a 100 ℃ siempre hierve.
A pesar de la naturaleza probabilística de las declaraciones causales en las ciencias
En realidad, las leyes nunca son tan simples. Siempre especificarán las condiciones sociales, gran parte del discurso popular, ideológico y político las traduce en
particulares bajo las cuales opera esa ley. De hecho, gran parte de la investigación científica declaraciones deterministas. Los hallazgos sobre los efectos causales de la clase, el
implica especificar las condiciones bajo las cuales operan las leyes particulares. Por lo tanto, género o la etnicidad, por ejemplo, a menudo se interpretan como si estos factores
podríamos decir que al nivel del mar, calentar agua pura a 100 ℃ siempre hará que el agua produjeran resultados particulares de manera invariable y completa. roles en las
hierva. familias, valores y formas de relacionarse con otras personas.
Empírico
comienzo
nivel Sí
No
aquí
Inicio conceptual-abstracto En contraste, un enfoque de prueba de teoría comienza con una teoría y usa la teoría
para guiar qué observaciones hacer: se mueve de lo general a lo particular. Las
nivel aquí Razonamiento deductivo observaciones deben proporcionar una prueba del valor de la teoría. Usar el
Empírico razonamiento deductivo para derivar un conjunto de proposiciones de la teoría hace
esto. Necesitamos desarrollar estas proposiciones para que
nivel
Estas teorías intentan dar sentido a las observaciones. Debido a que la teoría se produce
después de que se realizan las observaciones, a menudo se la denomina teoría post factum
(Merton, 1968) o teorización ex post facto.
Prueba de teoría
Proposición 2: los niños en las situaciones (c) y (d) deberían estar
igualmente mal Es decir, los niños en familias de parejas conflictivas estarán
si la teoría es cierta, entonces ciertas cosas deberían seguir en el mundo real. Luego tan mal como los niños en familias post-divorcio donde los padres mantienen
evaluamos si estas predicciones son correctas. Si son correctos, se apoya la teoría. un alto conflicto.
Si no se sostienen, entonces la teoría debe ser rechazada o modificada.
Proposición 3: a los niños en la situación (c) les irá peor que a los de
Por ejemplo, podemos desear probar la teoría de que no es el divorcio en sí mismo la situación (a) Es decir, a los que tienen padres casados en alto
lo que afecta el bienestar de los niños, sino el nivel de conflicto entre los padres. Para conflicto les irá peor que a los que tienen padres casados que no
probar esta idea, podemos hacer predicciones sobre el bienestar de los niños en están en conflicto.
diferentes condiciones familiares. Para la teoría simple de que es el conflicto de los
padres y no el divorcio lo que afecta el bienestar del niño, existen cuatro Proposición 4: a los niños en la situación (d) les irá peor que a los que están
en la situación (b) Es decir, a los que tienen padres divorciados en alto
"condiciones" básicas (ver Figura 1.3). Para cada "condición", la teoría haría
conflicto les irá peor que a los que tienen padres divorciados que no están en
diferentes predicciones sobre el nivel de bienestar de los niños que podemos
conflicto.
examinar.
Proposición 5: a los niños en la situación (b) les irá mejor que a los de la
Si la teoría de que se trata de un conflicto de los padres en lugar de un divorcio de situación (c) Es decir, a los niños de padres divorciados que no están en
los padres es correcta, se deben apoyar las siguientes proposiciones: conflicto les irá mejor que a los de padres casados que están en conflicto.
Proposición 6: a los niños en la situación (a) les irá mejor que a los que están en la
Proposición 1: los niños en las situaciones (a) y (b) estarían igualmente bien Es decir, situación (d) Es decir, a los niños con padres casados que no están en conflicto les irá
donde el conflicto entre padres es bajo, los niños con padres divorciados estarán tan mejor que a los niños con padres divorciados que están en conflicto.
bien como aquellos cuyos padres están casados.
8
¿QUÉ ES EL DISEÑO DE EL CONTEXTO DEL DISEÑO 9
INVESTIGACIÓN?
nada sobre el impacto del divorcio. Sin embargo, tomado como un paquete, el
conjunto de proposiciones proporciona una prueba más fuerte de la teoría
que cualquier proposición individual.
10
¿QUÉ ES EL
DISEÑO DE EL CONTEXTO DEL DISEÑO 11
INVESTIGAC
IÓN?
Observamos B.
Si aplicamos esta lógica al tipo de escuela y la proposición de logro, la estructura lógica nada cambiará la mente del verdadero creyente. La teoría del intercambio
del argumento del tipo de escuela y el logro se vuelve más clara. (Homans, 1961; Blau, 1964) es en gran medida infalsable. Asume que
Proposición inicial: siempre maximizamos nuestras ganancias y evitamos costos. Pero
podemos ver casi cualquier cosa como una ganancia. Los grandes
·Las escuelas privadas producen mejores estudiantes que las escuelas públicas. sacrificios para cuidar a un pariente discapacitado pueden interpretarse
como una ganancia (satisfacción de ayudar) en lugar de una pérdida
La prueba: (ingresos, tiempo para uno mismo, etc.). Necesitamos enmarcar nuestras
proposiciones y definir nuestros términos de tal manera que puedan ser
Si A, entonces B Si las escuelas privadas producen mejores estudiantes (A), entonces refutados.
sus estudiantes deberían obtener mejores calificaciones finales que los de las escuelas
financiadas por el gobierno (B).
EL CARÁCTER PROVISIONAL DEL APOYO A LAS TEORÍAS
B es cierto Los estudiantes de escuelas privadas obtienen mejores notas finales que
los estudiantes de escuelas públicas (observe B). Incluso cuando la teoría se corrobora y ha sobrevivido a los intentos de
refutarla, la teoría sigue siendo provisional:
Por lo tanto, A es verdadera. Por lo tanto, las escuelas privadas producen mejores
estudiantes (A es verdadera).
El falsacionismo enfatiza la ambigüedad de la confirmación... la corroboración brinda
Pero como ya he argumentado, el mejor desempeño de los estudiantes de escuelas solo el consuelo de que la teoría ha sido probada y sobrevivió a la prueba, que incluso
después de las corroboraciones más impresionantes de las predicciones, solo ha
privadas también podría reflejar el efecto de otros factores. El problema aquí es que
alcanzado el estatus de 'todavía no refutada'. Esto... .está lejos del estado de "ser
cualquier número de explicaciones puede ser correcta y la evidencia no ayuda a verdadero". (Cook y Campbell, 1979: 20)
descartar muchas de ellas. Para el científico social este nivel de indeterminación es
bastante insatisfactorio. En efecto, sólo estamos en condiciones de decir:
Siempre puede haber una explicación no pensada. No podemos anticipar o
Si A [o C, o D, o E, o F, o...] entonces B. evaluar todas las explicaciones posibles. Cuantas más explicaciones
alternativas se hayan eliminado y cuanto más hayamos intentado refutar
Observamos B.
nuestra teoría, más confianza tendremos en ella, pero debemos evitar
Por lo tanto, A [o C, o D, o E, o F, o...] es verdadera. pensar que está demostrada.
Aunque la explicación (A) todavía está en proceso porque es consistente con las Sin embargo, podemos refutar una teoría. La lógica de esto es:
observaciones, no podemos decir que sea la explicación más plausible. Necesitamos
probar nuestra proposición más a fondo evaluando el valor de las proposiciones Si la teoría A es verdadera, entonces B debería seguir.
alternativas.
B no sigue.
FALSIFICACIÓN: EN BUSCA DE PRUEBAS PARA DESAPROBAR LA TEORÍA
Por lo tanto A no es verdadero.
Además de evaluar y eliminar explicaciones alternativas, debemos evaluar
rigurosamente nuestras propias teorías. En lugar de preguntar ' ¿ Qué evidencia
constituiría un apoyo para la teoría?', pregúntese '¿Qué evidencia me convencería de que Siempre que B sea una prueba válida de A, la ausencia de B debería hacernos
la teoría es incorrecta?' No es difícil encontrar evidencia consistente con una teoría. Es rechazar o revisar la teoría. En realidad, no rechazaríamos una teoría
mucho más difícil que una teoría sobreviva a la prueba de las personas que intentan simplemente porque un solo hecho u observación no encaja. Antes de
refutarla. rechazar una teoría plausible, requeriríamos múltiples refutaciones utilizando
diferentes medidas, diferentes muestras y diferentes métodos de recopilación
Desafortunadamente, algunas teorías son sistemas cerrados en los que cualquier evidencia y análisis de datos.
puede interpretarse como apoyo a la teoría. Se dice que tales teorías no son falsables. Muchas
religiones o sistemas de creencias se convierten en sistemas cerrados en los que la teoría puede En resumen, debemos adoptar un enfoque escéptico a las explicaciones.
acomodar toda la evidencia y Deberíamos anticiparnos a las interpretaciones rivales y recopilar datos para
permitir la selección de las explicaciones más débiles y la identificación de qué
teorías alternativas tienen más sentido empírico. También debemos preguntarnos qué perspectiva más exigente.
datos desafiarían la explicación y recopilar datos para evaluar la teoría desde esta
dieciséis
¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?
Resumen
Este capítulo ha esbozado el propósito del diseño de investigación tanto en la
investigación descriptiva como en la explicativa. En la investigación explicativa, el 2
propósito es desarrollar y evaluar teorías causales. Se discutió la naturaleza
probabilística de la causalidad en las ciencias sociales, en oposición a la causalidad
determinista. HERRAMIENTAS PARA EL DISEÑO DE
El diseño de la investigación no está relacionado con ningún método particular de INVESTIGACIÓN
recopilación de datos ni con ningún tipo particular de datos. Cualquier diseño de investigación
puede, en principio, usar cualquier tipo de método de recolección de datos y puede usar datos
cuantitativos o cualitativos. El diseño de investigación se refiere a la estructura de una
investigación: es un asunto lógico más que logístico.
La primera pregunta que hay que hacer es: '¿Qué pregunta estoy tratando de
responder?' Especificar una pregunta es más que identificar un tema. No es
suficiente decir que estoy interesado en obtener algunas respuestas sobre la
ruptura familiar. ¿Qué responde a qué preguntas? ¿Quieres saber el alcance
de la ruptura familiar? ¿Quién es más vulnerable a la ruptura familiar? ¿
Cambiando las tasas de descomposición? ¿Durante qué período? ¿Dónde?
¿O realmente estás mirando las causas de la avería? ¿Los efectos de la
ruptura familiar? ¿Todos los efectos o solo algunos en particular?
ENFOQUE DE PREGUNTAS DE INVESTIGACIÓN DESCRIPTIVA
4 ¿Cuán general debe ser la descripción? ¿Quiere poder describir patrones para
subgrupos específicos (por ejemplo, entre los que se casaron en la adolescencia,
entre los que tienen relaciones de hecho, segundos matrimonios, etc.)?
5 ¿Qué aspecto del tema te interesa? ¿Está el interés en tasas de desglose? ¿La
experiencia? ¿Leyes? ¿Actitudes y creencias?
Al aclarar una pregunta de investigación, es útil dibujar diagramas como los de las
Figuras 2.1 a 2.5. También es útil hacer cuatro preguntas clave:
1 ¿Qué estoy tratando de explicar (es decir, cuál es la variable dependiente)?
2 ¿Cuáles son las posibles causas (cuáles son las variables independientes)?
22
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO 23
INVESTIGACIÓN? DE INVESTIGACIÓN
EXPLICACIONES IDIOGRAFICAS Y NOMOTETICAS
Los ejemplos anteriores se enfocan en causas y consecuencias particulares e atributos de la pareja: su personalidad, sus valores y creencias y sus
intentan brindar solo una explicación parcial de los cambios en las tasas de divorcio. habilidades interpersonales. Podría centrarse en los factores económicos e
Estas explicaciones se denominan explicaciones nomotéticas: explicaciones interpretar la felicidad marital en términos de costos y beneficios para cada
parciales de una clase de casos en lugar de una explicación "completa" de un caso socio. Alternativamente, la explicación podría adoptar una perspectiva de ciclo
particular. Implican un examen de relativamente pocos factores causales y un mayor de vida que interprete las diferencias en la felicidad conyugal según el lugar en
número de casos. Por el contrario, las explicaciones idiográficas se centran en casos el que se encuentre la pareja en el ciclo de vida (por ejemplo, recién casados,
particulares y desarrollan una explicación lo más completa posible de cada caso. antes de tener hijos, niños pequeños, hijos adolescentes, nido vacío, vida
Implican examinar tantos factores como sea posible que contribuyen al caso, posterior). Un enfoque feminista podría tratar de explicar la felicidad marital en
incluidos factores únicos. términos de roles de género, división del trabajo y poder dentro de la relación.
Un demógrafo podría centrarse en las cohortes de nacimiento (por ejemplo,
Una explicación nomotética del divorcio podría centrarse en la importancia de un solo factor matrimonios de depresión, matrimonios de posguerra, matrimonios de los
contribuyente, como la transmisión intergeneracional del divorcio. ¿Es más probable que las años 90, etc.). Otros investigadores podrían tratar de explicar la felicidad
parejas se divorcien si uno de sus padres se ha divorciado? El estudio podría involucrar la marital en términos estructurales, como el nivel de desventaja social de la
comparación de personas que se habían divorciado con aquellas que no lo habían hecho para pareja. Los teóricos de las redes sociales podrían concentrarse en la medida
ver si los divorciados tenían más probabilidades de tener antecedentes familiares de divorcio.
en que una pareja está integrada en la familia y la comunidad más amplias y
Por el contrario, un enfoque idiográfico podría enfocarse en una pareja divorciada en particular
y construir una explicación completa de por qué esta pareja se divorció. La explicación
puede recibir apoyo de estas redes.
consideraría la historia familiar de la pareja y la examinaría junto con muchos otros factores
Esta lista no es exhaustiva. El punto es que diferentes enfoques (p. ej.,
contribuyentes. La explicación idiográfica nos proporcionaría con una buena comprensión del
caso, mientras que la explicación nomotética proporcionaría una comprensión de la influencia
psicológico, curso de vida, intercambio, estructural, feminista) tendrán un
de un factor. 'ángulo' particular que nos alerta sobre diferentes formas de ver un tema.
Cuando piense en un problema, hágase preguntas como "¿Cómo explicaría
Identificar hipótesis rivales plausibles esto una feminista?", "¿Cómo explicaría esto una psicóloga freudiana?", "¿
Cómo explicaría esto un teórico del intercambio?", "¿Qué podría explicar un
En el Capítulo 1 subrayé la importancia de identificar formas rivales plausibles de
conflicto?". dice el teórico?
explicar el fenómeno que se estudia. Obviamente tiene sentido anticipar estas
alternativas antes de realizar la investigación. Pero, ¿cómo identificamos estas Otros investigadores La investigación previa sobre el tema puede ser una rica
explicaciones alternativas? Hay dos tipos principales de hipótesis rivales y éstas fuente de explicaciones contrapuestas. Lea la literatura en revistas y busque
sugieren formas de anticipar explicaciones alternativas. bases de datos electrónicas. Los artículos de revisión y los resúmenes
RIVALES TEÓRICOS Y SUSTANTIVOS introductorios pueden ser extremadamente útiles.
No existe una forma mágica de producir un conjunto de explicaciones sustantivas o Los profesionales, los informantes clave, los encargados de formular políticas,
teóricas alternativas. Al final, el investigador debe formularlas. Cuanto más los defensores Los "internos" con conocimientos prácticos de un campo
familiarizado esté el investigador con el tema sustantivo particular y con los modelos pueden ser invaluables. En un estudio sobre el divorcio, los consejeros
y teorías de las ciencias sociales, es más probable que anticipe diferentes formas de matrimoniales, las parejas casadas, las personas divorciadas y los grupos de
interpretar un conjunto dado de resultados. A continuación se proporcionan fuentes defensa pueden brindar información valiosa. La literatura, como las novelas y
de explicaciones alternativas. las obras de teatro, también puede proporcionar ideas agudas que pueden
probarse sistemáticamente (p. ej., la novela de Tolstoi Ana Karenina ofrece
La literatura teórica Los enfoques amplios en una disciplina pueden presentar
una forma de interpretar la infelicidad conyugal).
diferentes formas de ver cualquier pregunta. Supongamos, por ejemplo, que
quisiéramos entender por qué algunas personas parecen tener matrimonios más Experiencia propia, corazonadas e intuiciones No ignore su propia
felices que otras. Una explicación podría concentrarse en lo personal experiencia, sus propias intuiciones y corazonadas. Al final, todas las
explicaciones comienzan con corazonadas que surgen de individuos que
tienen ideas y observan cosas a su alrededor. Use estas ideas, experiencias y
observaciones y probarlos sistemáticamente.
9 Errores de procesamiento/análisis.
Operacionalización
La mayor parte de la investigación en ciencias sociales implica hacer
observaciones que presumimos son conceptos básicos. Si estuviéramos
realizando un estudio sobre el efecto de la ruptura matrimonial en el bienestar de
los niños, primero tendríamos que averiguar qué se entiende por ruptura
En segundo lugar, decidir sobre una definición. De su lista, seleccione una
ACLARAR CONCEPTOS
definición o cree una definición mejor a partir de los elementos comunes de
varias definiciones. Explique y justifique su enfoque.
Antes de desarrollar indicadores de conceptos, primero debemos aclarar los
Tercero, delinear las dimensiones del concepto. Muchos conceptos tienen una serie
conceptos. Esto implica desarrollar definiciones tanto nominales como operativas
de dimensiones y es útil explicarlas en detalle, ya que pueden ayudar a refinar aún más
del concepto. su definición. Esto se puede ilustrar utilizando el concepto de bienestar del niño.
Definiciones nominales Los conceptos no tienen un significado fijo o correcto. La Podemos pensar en una serie de dimensiones del bienestar: emocional, psicológico,
físico, educativo, financiero, social, ambiental, legal, etc. Si estamos argumentando que
ruptura del matrimonio podría definirse en términos de la ley (por ejemplo, si se ha la ruptura del matrimonio afecta el bienestar de un niño, ¿de qué tipo de bienestar
otorgado el decreto nisi), la calidad de la relación o arreglos prácticos (viviendo estamos hablando? ? ¿Todos estos? ¿Solo uno o dos? Habiendo delineado varias
separados). Del mismo modo, necesitamos definir a los niños. ¿Se define a un dimensiones, deberá decidir cuáles son de interés en el presente estudio. Puede
niño por una relación de sangre, una relación legal (incluye adoptado), una relación examinar todos los aspectos o limitarse a uno o dos.
social (padres de hecho), edad cronológica, nivel de dependencia o algún otro
Un concepto puede tener subdimensiones. Supongamos que nos
criterio? Al decidir sobre el tipo de definición, proporcionamos una definición
enfocamos en el bienestar social. Este concepto amplio podría incorporar
nominal: especifica el significado del concepto pero sigue siendo abstracto.
subdimensiones como el nivel de seguridad en el vecindario, la naturaleza de
Diferentes definiciones producen diferentes hallazgos. En consecuencia, la definición de las relaciones del niño y sus experiencias de discriminación social. La
conceptos es una etapa crucial de la investigación. Debe hacerse deliberadamente y sub-mención de 'relaciones con otros' podría dividirse aún más en relaciones
justificarse sistemática y cuidadosamente. Hay tres pasos para desarrollar y reducir una con personas particulares como madre, padre, compañeros, hermanos y
definición nominal.
abuelos. Habiéndonos decidido por las relaciones particulares con las que
Primero, obtenga un rango de definiciones. Busque artículos de revisión, vamos a tratar, necesitaríamos identificar qué aspectos de las relaciones
diccionarios de disciplinas (por ejemplo, diccionario de sociología), enciclopedias medir y decidir cómo medirlos (ver más abajo). En la Figura 2.7 las relaciones
(por ejemplo, enciclopedia de ciencias sociales) y artículos de revistas. Busque se miden según el nivel de
definiciones explícitas e implícitas.
26
¿QUÉ ES EL DISEÑO DE HERRAMIENTAS PARA EL DISEÑO DE 27
INVESTIGACIÓN? INVESTIGACIÓN
contacto, conflicto, cercanía, ayuda y tipo de actividades compartidas. Estas
medidas o indicadores luego proporcionarían el núcleo alrededor del cual
enmarcar preguntas específicas o enfocar un estudio observacional.
Validez interna
Otro estudio podría tratar de superar este problema rastreando los cambios en la
adaptación de los niños antes y después del divorcio de sus padres y también los cambios
entre los niños de familias intactas. Si los niños de familias intactas muestran menos deterioro
en el ajuste que los niños de familias divorciadas, esto seguramente debe demostrar el efecto
del divorcio. No. Tendríamos que estar seguros de que los dos grupos de niños eran
comparables en otros aspectos relevantes (por ejemplo, la edad). Las diferentes tasas de
cambio en el ajuste podrían deberse a que las personas de familias que se divorcian eran
más jóvenes en promedio. Tal vez los niños más pequeños muestren mayores cambios en la
adaptación durante un período determinado que los niños mayores. Puede que sean las
diferencias de edad, en lugar de tener padres divorciados, lo que explica los cambios de
adaptación de los dos grupos de niños.
Validez externa
Error de medición
Otra amenaza para las conclusiones que se pueden extraer de cualquier estudio es
el error de medición. Esto ocurre cuando usamos indicadores defectuosos para
aprovechar los conceptos (consulte el Capítulo 1).
Validez La discusión anterior sobre la validez interna se relacionó con la validez del
diseño de investigación. Abordó la pregunta: ¿el diseño de la investigación está
entregando las conclusiones que afirmamos que entrega? Además, necesitamos
examinar la validez de las medidas utilizadas en cualquier pieza de investigación.
La validez de una medida depende tanto del uso que se le dé como de la muestra para la
que se utilice. Por ejemplo, la validez de usar la frecuencia de las discusiones entre los socios
para medir la felicidad conyugal gira en torno a lo que entendemos por felicidad conyugal. La
vigencia de esta medida puede variar para diferentes grupos culturales y para un mismo
grupo cultural en diferentes períodos históricos. Las medidas del ajuste emocional de los
niños variarán según su edad y su grupo cultural.
Hay tres formas básicas de evaluar la validez. La validez de criterio se adapta mejor a
situaciones en las que existen medidas bien establecidas de un concepto que necesitan
adaptarse, acortarse o actualizarse. Implica comparar la forma en que las personas califican
la nueva medida con la forma en que califican las medidas bien establecidas del concepto. Si
las calificaciones de la nueva medida coinciden con las de una medida establecida, podemos
estar seguros de su validez.
Confiabilidad Una medida confiable es aquella que da la misma 'lectura' cuando se El error constante ocurre cuando hay el mismo error en todos los casos. Por
usa en repetidas ocasiones. Por ejemplo, suponiendo que no hubo un cambio real, ejemplo, si todos reportaron su peso por debajo de 5 kilogramos, tendríamos un error
constante. Tal error no está correlacionado con otras características. Aunque el error
una medida confiable de la felicidad marital debería arrojar la misma d en diferentes
puramente constante será raro, habrá
ocasiones. Un termómetro que mide
Resumen
Para inferir que existe una relación causal probabilística entre dos variables, se
deben cumplir dos criterios básicos. Primero, debe haber covariación de las
variables causales y de resultado (por ejemplo, entre el género y ser un trabajador
a tiempo completo o parcial); y segundo , la afirmación de que una variable afecta
a la otra debe tener sentido.
CO-VARIACIÓN
orientación laboral podría deberse completamente a una tercera variable, como la
edad (Figura 3.1). Las personas más jóvenes podrían tener más probabilidades que las
personas mayores de trabajar en el sector privado y las personas más jóvenes también
podrían tener una mayor orientación al logro que las personas mayores. Estos dos
patrones harán que la orientación al logro y al sector estén correlacionados (más
jóvenes en el sector privado, por lo que el sector privado se asocia con la orientación al
logro). Sin embargo, el vínculo entre el sector y la orientación al logro es más una
coincidencia que una causal.
La variable dependiente debe poder cambiarse Si decimos que una correlación entre dos RELACIONES CAUSALES DIRECTAS E INDIRECTAS
variables se debe a que una está causando la otra, debemos asegurarnos de que la variable Las relaciones causales pueden ser directas o indirectas. Una relación
dependiente (el efecto) pueda cambiarse. Si no puede cambiarse, entonces existe una directa es aquella en la que afirmamos que la causa afecta el resultado
relación causal. cuenta de la relación no tiene sentido. Por ejemplo, cualquier relación causal directamente y no a través de otras variables. Una relación causal indirecta
entre el sexo y los ingresos solo podría ser en la dirección de que el sexo afecte los ingresos. es aquella en la que la causa tiene su efecto al operar a través de su
La proposición opuesta (ingresos→sexo) no tiene sentido.
influencia sobre otra variable que, a su vez, produce el efecto. La variable a
Plausibilidad teórica La afirmación causal debe tener sentido. Deberíamos poder través de la cual se relacionan las dos variables se denomina variable
contar una historia de cómo X afecta a Y si deseamos inferir una relación causal interviniente: se presenta en el tiempo y en una secuencia causal entre la
entre X e Y. Incluso si no podemos demostrar empíricamente cómo X afecta a Y, causa inicial y el efecto. Por ejemplo, podríamos argumentar que la forma en
debemos proporcionar una explicación plausible de la conexión (plausible en que el sector privado produce un mayor logro La orientación hacia el trabajo
términos de otra investigación, teoría actual, etc.). Por ejemplo, para apoyar la es hacer que los empleados teman por sus trabajos (la variable interviniente)
afirmación de que el sector del empleo afecta la orientación al logro, podríamos (Figura 3.2).
argumentar que el sector privado fomenta el desarrollo de una orientación al logro
Las relaciones causales indirectas pueden ser simples (como en la Figura 3.2) o
consistir en una cadena causal extendida o varias rutas causales diferentes
(Figura 3.3).
La figura 3.4 ilustra las posibilidades en las que tenemos tres variables que, a efectos
del ejemplo, llamaré X, Y y Z. La relación entre X e Y podría ser cualquiera de las
siguientes:
(a) La causal directa Y sigue a X en el tiempo, Y es capaz de cambiar, y es
plausible que X pueda producir cambios en Y. A falta de encontrar cualquier
otra variable que sea responsable de esta relación, podemos continuar
argumentando que la correlación observada es directa y causal (Figura
3.4a).
solo dos grupos. Los grupos de comparación múltiples son posibles y surgirán de al
En el ejemplo anterior, la medición del ajuste emocional al comienzo del
menos dos circunstancias.
estudio a menudo se denomina 'pre-test' y la
Variables independientes con más de dos categorías Cuando las variables
independientes tienen más de dos categorías, podemos comparar más grupos y
proporcionar pruebas de teorías más sólidas y sutiles. Por ejemplo, al examinar el
efecto del divorcio en los hijos, podríamos simplemente clasificar los matrimonios
en divorciados o intactos, o podríamos clasificarlos como solteros (nunca casados),
intactos, separados, viudos, divorciados (reunidos) y divorciados (no vueltos a unir).
Si tomáramos el último enfoque podríamos hacer múltiples comparaciones. Al
hacerlo, podemos obtener una imagen más clara de lo que está sucediendo. Si
encontramos que son los hijos de padres divorciados que se han vuelto a unir los
que tienen más problemas, logramos una comprensión más enfocada del impacto
del estado civil de los padres en los niños. Hemos aprendido que no es el divorcio
per se sino los arreglos que siguen. divorcio que son críticos. Si simplemente
hubiésemos comparado matrimonios divorciados e intactos, nunca habríamos
identificado esto.
Al rastrear a los niños a lo largo del tiempo, pudimos ver si hubo un cambio en el
ajuste emocional de los niños y evaluar si esto era atribuible al divorcio de sus
padres.
Podemos recopilar datos sobre más de dos puntos de tiempo en lugar de estar
Masculino Femenino restringidos a recopilaciones de datos simples de "antes" y "después". WNe podría tener
mediciones repetidas durante un período prolongado para rastrear 'altibajos' y para
rastrear tendencias antes y después de cualquier evento crítico. Múltiples 'pruebas
Joven Grupo 1: Grupo 2: previas' y múltiples pruebas posteriores pueden ayudar a distinguir entre tendencias a
corto y largo plazo. . También ayudan a identificar el efecto de la 'intervención' o variable
independiente. Por ejemplo, una simple medida de ajuste emocional antes y después
machos hembras del divorcio podría mostrar un declive en el ajuste. Pero, ¿qué pasaría si existiera una
jóvenes jóvenes
fuerte evidencia de que el declive comenzó mucho antes del divorcio? Solo múltiples
medidas antes del divorcio mostrarían que ya había comenzado una tendencia. De
manera similar, una simple prueba posterior podría mostrar que el ajuste es menor
Antiguo Grupo 3: Grupo 4: después del divorcio, pero varias pruebas posteriores podrían mostrar un ajuste
deficiente inmediatamente después del divorcio, pero una mejora constante con el
tiempo (consulte el Capítulo 6).
machos viejos hembras
Hacer comparaciones significativas
viejas
Idealmente, los grupos que estamos comparando deberían ser iguales en
todos los aspectos relevantes, excepto en lo que respecta a la variable
Figura 3.7 Grupos de comparación múltiple creados al combinar dos variables independientes independiente. Por ejemplo, si queremos probar la idea de que las escuelas
no gubernamentales producen estudiantes que obtienen mejores resultados
la nueva medición al final se llama 'post-test'. Entre el pre-test y el post-test ocurren ciertos académicos que las escuelas públicas, tendríamos que estar seguros de que
eventos críticos - en este caso el divorcio de los padres (o no-divorcio según sea el caso). ambos tipos de escuelas tenían estudiantes comparables. Necesitaríamos
Estos eventos sirven como variables independientes en el estudio, es decir, la supuesta esto para estar seguros de que la única diferencia relevante entre los dos
variable causal detrás del cambio observado. En algunos diseños, estos eventos intermedios grupos de estudiantes está en el tipo de escuela a la que asisten. Si los
se denominan intervención o tratamiento (consulte el Capítulo 4).
estudiantes difirieran en aspectos adicionales, ¿cómo podríamos
44
¿QUÉ ES EL DISEÑO DE
INVESTIGACIÓN?
ALEATORIZACIÓN
Una forma más simple y efectiva de hacer que los grupos sean comparables es
asignar aleatoriamente a las personas a diferentes grupos al comienzo de un
estudio. Al asignar individuos aleatoriamente a cada grupo, cualquier diferencia
entre los grupos debe ser aleatoria en lugar de sistemática. Siempre que los
grupos sean lo suficientemente grandes, la asignación aleatoria debería producir
automáticamente grupos con perfiles comparables en factores conocidos y
desconocidos. Desde una perspectiva estadística, la asignación aleatoria de
personas a grupos hará que los grupos sean idénticos para todos los intentos y
propósitos y proporciona lo que Davis llama el seguro de espuriosidad para todos
los propósitos de la aleatorización' (1985: 35). Controlamos por un número infinito
de hipótesis rivales plausibles sin especificar cuáles son (Campbell, 1989).
Las deficiencias obvias de este enfoque son similares a las del emparejamiento. Podemos La discusión anterior ha identificado seis elementos centrales de un diseño de
eliminar la influencia de las variables en las que hemos pensado y sobre las que tenemos investigación. La mezcla particular de los elementos en cualquier estudio
datos, pero no podemos eliminar los efectos de las variables desconocidas o de las que no producirá diferentes diseños.
tenemos datos. Dado que nunca podemos saber qué factores hemos pasado por alto, siempre
hay el peligro de que factores en los que no hemos pensado puedan estar contribuyendo a las Estos seis elementos principales en la producción de un diseño de
diferencias grupales. investigación son:
Diseño experimental
1 El número de grupos en el diseño Los diseños variarán desde aquellos sin
La versión clásica del diseño experimental tiene los siguientes elementos:
comparaciones (por ejemplo, diseño de caso único de estudio de caso) hasta
aquellos con muchos grupos de comparación diferentes. 1 Una medida previa a la intervención (pre-test) sobre la variable de resultado.
2 El número de fases de medición de 'pre-test' Los diseños varían desde aquellos sin 2 Dos grupos: un grupo que está expuesto a la intervención (el grupo
'pre-test' (por ejemplo, diseños transversales y algunos diseños experimentales)
experimental) y un grupo que no está expuesto a la intervención (el grupo de
hasta aquellos con una serie de 'pre-tests' que establecen tendencias preexistentes
control).
antes de un evento.
6 El número deintervenciones Los diseños con una intervención pueden tener una
sola intervención o múltiples intervenciones. Se pueden usar múltiples intervenciones
para identificar el efecto de los 'tratamientos' acumulativos.
Aleatorio medir en Sin tratamiento' medir en 2 Una medición previa a la "intervención" en la variable de resultado.
variable de variable de 3 Una 'intervención' donde todos reciben el 'tratamiento'.
(grupo de resultado resultado
4 Una medición posterior a la "intervención" en la variable de resultado.
control) (Y) (Y)
En efecto, este diseño es similar al diseño experimental, excepto que no hay
Figura 3.8 Diseño experimental clásico un grupo de control y, por lo general, solo un grupo "experimental". El diseño
se ilustra en la Figura 3.9.
3 Asignación aleatoria a los grupos antes del pretest. El análisis en este diseño compara las medidas previas a la intervención
con las medidas posteriores a la intervención. El cambio en estos puntajes
4 Una intervención (prueba/tratamiento). puede reflejar la influencia de X en Y. Sin embargo, la ausencia de un control
aleatorio
5 Una medida posterior a la intervención (post-test) en la variable de resultado.
50
¿QUÉ ES EL DISEÑO DE LA CAUSALIDAD Y LA LÓGICA DEL DISEÑO DE LA 51
INVESTIGACIÓN? INVESTIGACIÓN
Método de Prueba previa Intervención Post-prueba 1 En lugar de intervenciones, el diseño transversal se basa en las variaciones
existentes en la(s) variable(s) independiente(s) en la muestra.
asignación a (X)
2 Está presente al menos una variable independiente con al menos dos
grupos
categorías.
(Y) (Y) Este diseño refleja la fase posterior a la intervención del diseño experimental
clásico, pero sin que se realice ninguna asignación aleatoria a "grupos". la
variable de resultado está vinculada con las diferencias de grupo. Es decir, ¿
Figura 3.9 Diseño longitudinal simple
en qué medida difieren los de las diferentes categorías de la variable
independiente en relación con la variable de resultado? Las relaciones
grupo dificulta saber si la intervención o algún otro factor produce algún cambio. causales se establecen mediante la utilización de controles estadísticos en
lugar de la asignación aleatoria de personas a grupos.
Diseño transversal
Este diseño se ilustra en la Figura 3.10. En este caso, la 'intervención'
Los elementos básicos del diseño transversal son los siguientes: simplemente está en una categoría diferente de la variable independiente.
Estudios de caso
Los diseños de estudios de caso se basan menos en la comparación de casos que Método de Prueba previa Intervención Post-prueba
en el análisis exhaustivo de casos individuales y luego en la comparación de casos. asignación a (X)
Una característica distintiva de los estudios de casos es que se recopila
grupos
información contextual sobre un caso para que tengamos un contexto dentro del
cual comprender los procesos causales.
No aleatorio Ninguna 'Tratamiento' medir en
variable de
resultado
(Y)
variable de
resultado
(Y)
Los diseños de estudios de caso pueden consistir en un solo estudio de caso (p. ej.,
un estudio comunitario, un estudio de una organización) o una serie de estudios de
caso en los que quizás cada caso pruebe una teoría desde un ángulo diferente. Es útil
pensar en un estudio de caso de manera similar a un experimento. No rechazamos ni
aceptamos finalmente una teoría sobre la base de un solo experimento; tratamos de
replicar un experimento y llevarlo a cabo bajo una variedad de condiciones. De manera
similar, un proyecto de estudio de caso que implica un solo estudio de caso es análogo
a un solo experimento. Si se encuentran resultados similares en estudios de casos
repetidos, o se encuentran diferencias predecibles en los resultados para casos
particulares en el estudio, entonces desarrollamos una mayor confianza en los
hallazgos de los casos de la misma manera que ganamos confianza en los resultados
experimentales que se encuentran en experimentos repetidos.
Resumen
Este capítulo ha examinado formas de estructurar diseños de investigación para
ayudar a extraer inferencias causales convincentes de la investigación. Dado que las
causas no pueden observarse, deben inferirse de las observaciones. Sin embargo, es
fácil hacer inferencias incorrectas. El capítulo ha considerado formas de estructurar la
investigación para mejorar la calidad de estas inferencias. Se esbozó una variedad de
formas de interpretar las correlaciones entre variables y se proporcionaron los criterios
necesarios para inferir que una correlación refleja una conexión causal.
52
¿QUÉ ES EL DISEÑO DE INVESTIGACIÓN?
2 Veremos más adelante que este problema de pérdida de casos puede superarse con
ciertas formas de análisis multivariante. Este capítulo se basa en los elementos del diseño de investigación descritos
en el Capítulo 3 para presentar una variedad de tipos de diseños
3 Una intervención que ocurre naturalmente es un evento que tiene lugar entre la prueba experimentales. Describe los diferentes entornos en los que se pueden
previa y la posterior sin que el investigador inicie ninguna intervención. Un ejemplo podría ser
realizar experimentos y describe variaciones de diseños experimentales
un estudio de familias a lo largo del tiempo en el que algunas familias experimentan el
divorcio de los padres. El divorcio es la 'intervención natural'.
tanto simples como más complejas. Este capítulo no busca evaluar diseños
experimentales: esa es la tarea del Capítulo 5. La discusión también
proporciona un marco útil dentro del cual comprender algunas de las
fortalezas y debilidades de los diseños de investigación discutidos más
adelante en este libro.
54
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 55
Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2)
asignación a (X)
Prueba previa Post-prueba
grupos
6 Comparar el nivel de cambio en el grupo experimental con el del grupo de control. Figura 4.2 Estructura del diseño experimental clásico
Si los cambios en la conveniencia percibida de la membresía son diferentes entre los Tiempo 1 (T1) Intervención Tiempo 2 (T2)
dos grupos (más de lo que se debe al azar), esto debería deberse a que un grupo
experimentó una iniciación severa. Esto se representa en la figura 4.2. Aquí, el (X)
Prueba previa Post-prueba
símbolo T1 representa el momento 1 o la prueba previa. E1 representa el grupo
experimental en el momento 1 y C1 representa el grupo de control en el momento 1. Experimental E1 'Severo E2 Intercambio=75-50
La cantidad de cambio en el grupo experimental es simbolizado como Ecambio y es
la diferencia entre la puntuación de deseabilidad del grupo en T2 en comparación con grupo Puntuación media = iniciación'
50 núcleo = =25
T1. El cambio comparable para el grupo de control puede simbolizarse como
Ccambio: el efecto de la intervención es la diferencia entre la cantidad de cambio en 75
mineral=50
el grupo experimental antes y después la intervención (Ecambio) y la cantidad de
cambio en el grupo de control (Ccambio) entre T1 y T2 (es decir, Ecambio-Ccambio).
Si es mayor que cero, probablemente concluiríamos que la iniciación tuvo un impacto Grupo de C1 sin C2 Cambio=60-50
1 Los grupos son los mismos en todos los aspectos relevantes antes de cualquier
intervención (T1).
cambio total entre los dos grupos. En el ejemplo anterior (gravedad de la iniciación), el
los participantes y los no participantes estuvieron expuestos a influencias cambio total en el grupo experimental fue de 25 puntos en comparación con 10 puntos
en el grupo de control. La diferencia en el cambio total entre los dos grupos fue de 15
comparables durante el período de 12 meses. Observamos que a los
puntos: el efecto experimental.
participantes del grupo de autoayuda les fue mejor durante los 12 meses en
comparación con los miembros del grupo de control. Sin embargo, no pudimos Sin embargo, nos encontramos con problemas cuando cualquiera de estos
estar seguros de si esto se debió a la participación en los grupos de autoayuda o si factores externos influye más en un grupo que en el otro. Esto puede ocurrir
el tipo de personas que se ofrecieron como voluntarios para participar estaban al menos de dos maneras:
más orientados a la autoayuda antes del comienzo del experimento. Estas
diferencias iniciales podrían haber explicado su mayor mejora en los niveles de
1 Un grupo puede estar expuesto selectivamente a factores adicionales más
vida.
que el otro grupo.
Mientras que los experimentos de laboratorio tienen problemas de artificialidad,
2 Los factores externos pueden interactuar con la intervención. Es decir,
los experimentos de campo encuentran problemas por el control inadecuado de
cuando una persona está expuesta tanto a la intervención experimental
los eventos entre T1 y T2. Siempre existe el peligro de que los eventos no
como al factor externo, esta combinación tiene un efecto único que ni el
controlados, en lugar de la intervención experimental, produzcan los cambios
factor experimental ni el externo tienen por sí solos. Un ejemplo de un efecto
observados.
de interacción es evidente en el tratamiento de la depresión. El tratamiento
Sin embargo, otros factores (es decir, eventos no controlados) no deberían ser un farmacológico por sí solo puede tener algún efecto limitado sobre la
problema importante si tanto el grupo experimental como el de control están igualmente depresión, y la psicoterapia por sí sola puede tener algún efecto. Pero
expuestos a estas otras influencias. El cambio total en el grupo experimental entre T1 y T2 cuando los dos enfoques se usan juntos, pueden tener un impacto dramático
consta de dos elementos: el producido por la intervención y el el producido por otros eventos en la depresión. El impacto combinado es mucho mayor que el simple
intermedios.3 En el grupo de control, el cambio total se deberá enteramente a los otros impacto acumulativo de cada enfoque: es la combinación la que tiene el
eventos intermedios. Si los mismos eventos intermedios se aplican por igual a ambos mayor efecto.
grupos, aún podemos identificar el cambio experimental observando la diferencia en el
EXPERIMENTOS NATURALES
El experimento natural se basa en eventos que ocurren naturalmente como
intervenciones en lugar de intervenciones controladas inducidas por el Si podemos anticipar que ocurrirá un evento, podemos recopilar información
experimentador. antes y después para monitorear su impacto. Para ayudar a interpretar los
resultados, podríamos intentar identificar un grupo de comparación que no
estará expuesto al evento.
asignación variable de
resultado
(experimental
(Y)
grupo)
variable de
asignación resultado
(Y)
(grupo de
control)
Método de Tiempo 1 Intervención Tiempo 2 Tiempo 3 Tiempo 4 Aleatorio Medida Sin Medida Medida Medida
Aleatorio Medida Tratamiento'Medida Medida Medida Figura 4.6 Diseño experimental con múltiples pruebas posteriores
Usando este diseño, el grupo experimental se divide en dos subgrupos, al igual que
el grupo de control. Un grupo experimental implica una prueba previa mientras que el
otro no. Las mismas condiciones se aplican al grupo de control. Si no hay reactividad
del instrumento, los dos grupos experimentales deberían puntuar de forma idéntica en
las medidas de resultado en T2, al igual que los dos grupos de control. Cualquier
diferencia entre las puntuaciones T2 de los dos grupos experimentales o de los dos
grupos de control debe atribuirse a la reactividad del instrumento.
El ejemplo de la Figura 4.9 ilustra este diseño con figuras. Por el bien del
ejemplo, la variable de resultado se mide en una escala de 0 a 100. En los
grupos experimentales, el grupo de prueba previa obtuvo una puntuación de
80 en comparación con una puntuación de 70. para el grupo experimental sin
el pretest. Si podemos suponer que no hubo otras diferencias entre los
64
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL sese
nta y
cinco
Podría preguntarse, ¿por qué molestarse en usar un diseño tan complicado
Método de asignación Tiempo 1 (T1) Intervención Tiempo 2 (T2)
para eliminar el efecto de la prueba previa? ¿No podríamos haber logrado el
a grupos (X) mismo resultado simplemente eliminando la prueba previa por completo y
Prueba previa Post-prueba
comparando las puntuaciones T2 de un solo grupo experimental y un solo
control? ¿grupo? Habríamos llegado exactamente a la misma respuesta. Sin
Asignación aleatoria % con intención Compulsión %con la intención
embargo, cuando tenemos grupos pequeños, la aleatorización puede ser
votar sin que votar insuficiente para eliminar las diferencias iniciales.
(grupo experimental sanciones
1)
2)
4)
Figura 4.7 Diseño experimental con múltiples grupos y una prueba previa y una prueba
posterior
aleatoria variable de
resultado
66
DISEÑOS TIPOS DE DISEÑO EXPERIMENTAL 67
EXPERIMENTALES
reactividad del
Asignación Ninguna Tratamiento Media=70 instrumento
Método de Tiempo 1 Intervención Tiempo 2
aleatoria
asignación (T1) (X) (T2)
(experimental
a grupos
Prueba Post-prueba
(dno.6
previa
Alto(a) Bajo(b)
(grupo de control)
Grupo 1 Grupo 2
Figura 4.9 Ejemplo hipotético del diseño de cuatro grupos de Solomon Male(a) machos machos
Por ejemplo, el alcohol, por sí solo, afecta el estado de ánimo. Las anfetaminas, por Gender con altura con bajo
sí solas, también afectan el estado de ánimo. Los efectos son efectos principales:
control control
cada uno tiene un efecto por sí solo. y más allá del alcohol o las anfetaminas de forma
independiente. Esto será más que un simple efecto aditivo: será un efecto único que
solo se produce al mezclar las dos drogas. De manera similar, dar a los trabajadores Grupo 3 Grupo 4
más control sobre su trabajo podría mejorar la satisfacción laboral de todos (efecto
principal), pero podría tienen más efecto en determinados tipos de personas, como (X2) Hembras Hembras
profesionales o personas mayores (efecto de interacción).
con altura con bajo
Female (b)
El propósito de los diseños experimentales factoriales es examinar
simultáneamente los efectos directos (efectos principales) de una serie de variables control control
independientes y ver cómo varias combinaciones de características trabajan juntas
para producir un efecto. La versión más simple de este diseño se llama diseño Figura 4.10 Definición de grupos en un diseño factorial 2x2
factorial 2x2. , que es uno basado en dos variables independientes, cada una con solo
dos categorías. Este diseño simple de 2 x 2 se puede extender fácilmente a más de
dos variables, cada una de las cuales puede tener dos o más categorías o (Figura 4.10). La variable dependiente (Y) es la satisfacción laboral medida en
condiciones. una escala de 0 a 100, donde 100 indica una satisfacción muy alta. Una variable
independiente es el grado de control sobre la propia situación laboral (X1)
El diseño simple 2x2 se puede ilustrar mejor con un ejemplo en el que tenemos dos clasificada simplemente como control bajo y alto. La otra variable independiente
variables independientes y una variable dependiente la variable es género (X2).
El número de grupos crece si cualquiera de las variables tiene más de dos categorías.
Quizás sea más difícil visualizar lo que sucedería con tres o más variables. Podemos
hacer esto simbólicamente cuando tenemos tres variables independientes con un número
variable de categorías: X1 ( dos categorías llamadas a y b), X2 (dos categorías llamadas a
y b) y X3 (dos categorías llamadas a y b). La primera categoría de la primera variable se
puede simbolizar como X1a y la segunda categoría como X1b; la primera categoría de la
segunda variable independiente se representa como X2a; y así. La tabla 4.1 ilustra el número de variables independientes.
grupos que podrían producirse por cada una de las posibles combinaciones de estas tres
68
DISEÑOS EXPERIMENTALES TIPOS DE DISEÑO EXPERIMENTAL 69
X1b X2b EX 7
Método de asignación Tiempo 1 (T1) 'Intervenciones' Tiempo 2 (T2)
X1b X2b X3b 8
a grupos (X1 y X2)
Prueba previa Post-prueba
Asignación aleatoria medir en X1aX2a medir en Rápidamente se hace evidente que la cantidad de grupos requeridos
Satisfacción machos con Satisfacción puede explotar con la adición de cada variable adicional y ya que cada una
laboral laboral de esas variables tiene categorías adicionales. Por supuesto, no
alto control necesitamos diseñar la investigación con todas las combinaciones posibles
(Y) (Y)
incluidas. Por razones teóricas y prácticas, podríamos simplemente
seleccionar conjuntos particulares de combinaciones y examinar el efecto
Asignación aleatoria medir en X1aX1b medir en de estas combinaciones seleccionadas.
Satisfacción machos con Satisfacción
laboral laboral
control bajo
(Y) (Y)
diseño factorial
X1 X2 X3 Grupo
X1a zx X3m 1
X1a X2 X3b 2
X1a X2b X3 3
X1b X2a X3 6
notas
1 Esta es una modificación de un argumento probado en un experimento por
Resumen
Aronson y Mills (1959) y discutido en Kerlinger (1979:91).
Este capítulo ha esbozado una variedad de diseños experimentales de diversa
2 Lamentablemente, estos objetivos no siempre se especifican al comienzo de la
complejidad. Se esbozó la lógica de extraer inferencias causales a partir de datos implementación de los programas piloto y, con demasiada frecuencia, se encargan
obtenidos con diseños experimentales. Los diversos diseños experimentales estudios de evaluación después de que se ha desarrollado e implementado el
varían en términos del uso de pruebas previas, la cantidad de puntos de medición programa piloto.
de pruebas previas y posteriores y la cantidad de grupos comparados dentro del
diseño. Todos los diseños experimentales tendrán grupos de comparación y todos 3 También hay cambios medidos que se deben a varios tipos de errores (consulte el
intentarán hacer las grupos lo más similares posible excepto en relación con la Capítulo 2).
intervención experimental. Aunque la asignación aleatoria a grupos es el método 4 El argumento es que a medida que las personas tienen hijos, su preocupación por
preferido, los medios por los cuales los grupos serán comparables variarán según el bienestar de su familia hace que se preocupen más por la estabilidad social y
las circunstancias de la investigación (ver el Capítulo 3). El rigor de los diseños política.
experimentales variará según los contextos en los que se lleve a cabo el
experimento. realizado. Los entornos de laboratorio brindan el máximo control de
las influencias externas de confusión, mientras que los experimentos naturales
brindan el mínimo control.
PROBLEMAS EN EL DISEÑO EXPERIMENTAL
que los grupos sean comparables en todos los aspectos, excepto con
respecto a la variable experimental. Hakim argumenta que:
Los experimentos son apropiados cuando existe algún argumento sobre la existencia
5 misma de una relación causal entre X e Y (neto de otros factores contextuales o
relacionados), o cuando se necesita la medida precisa del tamaño y la dirección del
efecto. (1986: 105)
PROBLEMAS EN EL DISEÑO EXPERIMENTAL
Sin embargo, la fuerza de los experimentos obtenidos a través de la
aleatorización tiene un costo considerable. La investigación experimental no
es adecuada para proporcionar una explicación de los resultados, para
identificar los mecanismos por los cuales una variable afecta a otra. Tampoco
nos permite construir una imagen del conjunto complejo de factores que
Los diseños experimentales se han utilizado ampliamente en las ciencias naturales producen un resultado dado. Los experimentos se centran en el impacto de
y en la investigación psicológica y educativa y han proporcionado una gran cantidad solo uno o dos factores.
de datos de investigación valiosos. Sin embargo, los diseños experimentales se han
utilizado menos en las ciencias sociales. Esta falta de uso en las ciencias sociales se
debe a desde consideraciones metodológicas, prácticas y éticas. Esto no quiere
decir, sin embargo, que los diseños experimentales no puedan usarse de una forma
u otra en la investigación de las ciencias sociales o que la lógica del diseño
experimental no pueda ser invaluable en el desarrollo de otros diseños de
investigación que sean aplicables en las ciencias sociales. Este capítulo explora
algunas de las fortalezas y debilidades de los diseños experimentales y los
problemas que deben abordarse al desarrollar cualquier investigación que utilice
este diseño.
Problemas metodológicos
El problema de la estrechez explicativa
HISTORIA
Si, además de la intervención experimental, ocurren eventos entre el pre-test y
el post-test, entonces estos eventos pueden amenazar la validez interna de la
investigación. Estos eventos, más que la intervención experimental, podrían
producir cualquier cambio que observemos. El problema de los eventos
extraños es mayor en los experimentos de campo y naturales de una manera
desconocida. En tales experimentos tenemos menos control sobre lo que le
sucede a la gente. Esta falta de control es un gran peligro para la investigación
ya que aumenta el tiempo entre el pre-test y el post-test.
MADURACIÓN
En un estudio de cambio, parte del cambio podría deberse al paso del tiempo
más que a la intervención experimental. Por ejemplo, si deseamos probar el
impacto de un método de enseñanza en el rendimiento matemático de
74 PRO
DISEÑOS EXPERIMENTALES BLE
MAS EN
EL 75
DISEÑO
EXPERIM
ENTAL
PRUEBAS
Examinar a los participantes varias veces puede contaminar los resultados. Una
persona puede recordar respuestas anteriores y posteriormente responder
preguntas de tal manera que parezca coherente. Completar las preguntas puede
sensibilizar a las personas sobre cuestiones sobre las que antes habían pensado
poco y esto, en lugar de cualquier intervención experimental, puede producir
cambios. De manera similar, la familiaridad con una prueba (por ejemplo, una
prueba de coeficiente intelectual) puede conducir a un mejor desempeño.
Suponiendo que la prueba tendrá los mismos efectos tanto para el grupo
experimental como para el de control, el efecto de la prueba se puede eliminar
utilizando un grupo de control, de la misma manera que se describe anteriormente.
El peligro de los efectos de interacción (las pruebas y la intervención combinadas
tienen un efecto único) es un peligro que el diseño de cuatro grupos de Solomon
(Capítulo 4) puede identificar y permitirnos eliminar estadísticamente. Los efectos
de prueba en un experimento aleatorio también se pueden eliminar eliminando por
completo la fase previa a la prueba. Este enfoque es evidente en el diseño
aleatorio posterior a la prueba (Capítulo 4).
Existen dos enfoques para abordar este problema. Uno es realizar experimentos
con muestras representativas grandes y analizar los resultados para ver si son
válidos para todos los tipos de personas. En ausencia de muestras representativas
seleccionadas al azar, la mejor estrategia es repetir el proceso. experimentar
muchas veces con diferentes muestras y en diferentes contextos. Esto se llama
replicación. Si seguimos obteniendo los mismos resultados con diferentes tipos de
muestras, podemos estar más seguros de que los resultados se aplican más
ampliamente. Sin embargo, si no podemos replicar los resultados con tipos
particulares de personas o bajo condiciones particulares, no significa que el
procedimiento es fundamentalmente defectuoso. Más bien, nos permite
especificar los límites de nuestra generalización y los tipos de personas a quienes
se aplican y no se aplican los resultados.
LO ARTIFICIAL
Al esforzarnos por lograr la validez interna y atender asuntos éticos y prácticos,
podemos terminar con un experimento que es elegante y ético pero es tan artificial
que no aprendemos nada útil sobre personas reales en contextos sociales reales.
Tajfel (1984) nos recuerda que el experimento típico de la psicología social se basa
en
El simple hecho de ser seleccionado para un estudio puede hacer que las
personas se sientan especiales y producir resultados artificiales. Un famoso
estudio de Western Electric Hawthorne Works en Chicago a principios de la
década de 1930 descubrió por primera vez la importancia de lo que se conoce
como el efecto Hawthorne (Roethlisberger y Dickson, 1939). Los investigadores
seleccionaron un grupo de trabajadores y cambiaron su entorno de trabajo en un
esfuerzo por mejorar la productividad. Descubrieron que independientemente de
las intervenciones que hicieran, el grupo se volvió más productivo. Llegaron a la
conclusión de que no fueron las intervenciones las que fueron efectivas, sino que
fueron seleccionadas especialmente las que produjeron el efecto. Si se hubieran
hecho los mismos cambios sin dar a las personas la sensación de que eran
especiales, no podemos estar seguros de que la satisfacción y
78
DISEÑOS EXPERIMENTALES PROBLEMAS EN EL DISEÑO 79
EXPERIMENTAL
Cuestiones prácticas
cuenta la forma en que analizaremos los datos: diferentes métodos requieren
Hay pocas respuestas simples a las muchas preguntas prácticas que surgen al diferentes tamaños de muestra.
diseñar experimentos sociales. En la mayoría de los casos, la respuesta a la
pregunta es: "Depende". ¿Cómo deben ser reclutados los participantes?
La validez externa se logra mejor eligiendo una muestra que sea
¿Cuánto les dices a los participantes?
representativa de la población más amplia a la que deseamos extrapolar.
¿Deberíamos decirles a los participantes que están en el grupo de control? ¿Cuánto Una muestra representativa se obtiene mejor utilizando técnicas de
debemos decirles sobre el tratamiento experimental? ¿Deberían saber cuál es la muestreo aleatorio. Esto requiere que seleccionemos a los participantes de
hipótesis de investigación? Si bien el principio ético del consentimiento informado tal manera que cada persona en la población más amplia tenga una
(ver más adelante en este capítulo) sugiere que debemos contarles todo a los probabilidad igual o conocida de ser seleccionada. se seleccionó la muestra.
participantes, hacerlo podría hacer que el estudio no tenga valor. Si los participantes Desafortunadamente, incluso si usamos un muestreo aleatorio, no necesariamente
saben lo que estamos buscando, podrían comportarse de tal manera que confirmen terminaremos con una muestra representativa. Puede estar sesgado porque
o sabotear nuestras expectativas. Decirles a las personas que están en un grupo de realizamos nuestra investigación de manera ética. No es ético presionar a los sujetos
control o explicarles la gama de intervenciones experimentales (por ejemplo, la potenciales para que participen o tratar de evitar que se retiren del estudio en cualquier
gama de niveles de apoyo a los ingresos en el proyecto de ingresos garantizados) etapa de la investigación. El alcance del sesgo resultante dependerá de cuántos
puede hacerles sentir que se están perdiendo las intervenciones deseables y crear participantes potenciales se nieguen a participar o se retiren posteriormente.
resentimientos y falta de cooperación.
Brechas entre pruebas e intervenciones
No existen reglas estrictas sobre cuánta información proporcionar a los ¿Cuánto debe transcurrir entre la introducción de una intervención y la
participantes, pero dentro de los requisitos del consentimiento informado, lo más prueba posterior? La duración de la brecha debe depender de lo que
seguro es minimizar la cantidad de información detallada proporcionada antes de nuestras teorías e investigaciones previas nos lleven a esperar sobre el
que se complete el experimento. Esto minimiza las posibilidades de contaminar el tiempo que tardaría en detectarse un efecto. La duración de la brecha entre
experimento. A veces, un experimento implica un engaño explícito para evitar el la intervención y la prueba posterior también dependerá de si estamos
sabotaje. En tales casos, se deben seguir escrupulosamente las pautas éticas y un buscando para efectos a corto o largo plazo.
informe cuidadoso.
La brecha entre una prueba previa y una intervención debe ser lo más
¿Cuántos participantes? corta posible. Una brecha corta es deseable porque minimiza la posibilidad
de que ocurran eventos antes de la intervención que podrían hacer que los
La importancia que le demos a la validez externa y el enfoque que le demos a la
grupos experimental y de control sean diferentes de alguna manera antes de
validez externa tendrán una gran influencia en el tamaño de la muestra que
la intervención. intervención. Sin embargo, a veces es posible que debamos
elijamos. Si queremos generalizar estadísticamente a una población más amplia,
dejar un espacio si sospechamos que la prueba previa podría interactuar con
necesitamos usar una muestra que se seleccione aleatoriamente y que sea lo
la intervención (por ejemplo, la prueba previa ha sensibilizado a los
suficientemente grande para generalizar con confianza. Muchos libros proporcionan
participantes sobre los problemas).
fórmulas para calcular el tamaño de muestra necesario para la generalización
estadística (Moser y Kalton, 1971; Kalton, 1983b). Sin embargo, si usamos una Al establecer el tamaño de la brecha temporal entre la prueba previa y la prueba
replicación (ver arriba) para lograr la generalización, el factor crítico es si hemos posterior, debemos tener en cuenta el impacto de la pérdida de participantes y su
replicado el experimento un número suficiente de veces y bajo un rango suficiente amenaza para la validez tanto interna como externa. Dado que los abandonos
de condiciones. Consideraciones teóricas y sentido común en cuanto al rango de aumentan cuanto más dura un estudio, debemos establecer la brecha con el fin de
condiciones bajo las cuales intentamos replicaciones debe guiarnos. minimizar su ocurrencia.
Si nuestra principal preocupación es la validez interna, podemos trabajar con muestras Sin embargo, un intervalo de tiempo demasiado corto puede producir otros
mucho más pequeñas que las que se requieren para la generalización estadística, pero deben problemas metodológicos. Cuando el intervalo entre la prueba previa y la
ser lo suficientemente grandes para detectar un efecto. Los procedimientos para calcular el posterior es breve, es probable que los participantes recuerden sus
tamaño de muestra requerido para detectar efectos se pueden encontrar en otro lugar (Cohen, respuestas previas a la prueba. Su memoria puede influir en la forma en que
1987). El tamaño de la muestra también debe tener en cuenta responden en la prueba posterior. -fase de prueba del experimento.
80 DISEÑOS EXPERIMENTALES
PROBLE
MAS EN 81
EL
DISEÑO
EXPERI
MENTAL
Los asuntos prácticos también determinarán los intervalos de tiempo entre las
etapas del estudio. La cantidad de tiempo disponible para completar el estudio y la
disponibilidad de fondos a nuestra disposición para realizar un seguimiento de las
personas influirán en la forma en que finalmente diseñemos el experimento.
Una cosa clave a verificar es si los abandonos son distintivos en relación con sus
indeseable. El abandono en este punto significaría que, a pesar de la asignación puntajes iniciales en la variable de resultado. Por ejemplo, ¿aquellos con puntajes
iniciales bajos en la variable de resultado son más propensos que otros a abandonar
aleatoria inicial, los grupos podrían ser diferentes antes de la intervención.
antes, durante o después de la intervención experimental? Si es más probable que se
Este problema se puede evitar posponiendo la asignación aleatoria a los grupos retiren, entonces la tasa de abandono diferencial entre los grupos podría ser
responsable de las diferencias posteriores a la prueba. Si los participantes con
(Cook y Campbell, 1979: 358). Habiendo reclutado a los participantes, podemos
puntajes bajos abandonan, automáticamente aumentará el puntaje promedio del
determinar su disposición a participar en el control o en cualquiera de varios grupo, incluso si la intervención en sí misma no produjo el aumento en los puntajes.
tratamientos experimentales diferentes. Luego, podríamos eliminar del estudio a los
participantes que no estaban dispuestos a participar en ningún grupo en particular. Además de minimizar la deserción, lo siguiente mejor es identificar las
Luego, podríamos asignar aleatoriamente a los participantes restantes dispuestos a características de quienes abandonan y luego ajustar estas características en la etapa
participar en los diversos grupos. de análisis de datos. Podemos utilizar la información recopilada en la etapa previa a la
prueba para ayudar a identificar estas características de deserción y luego incluir estas
ABANDONOS variables en un análisis multivariado para ver si habrían surgido diferencias de grupo si
Dado que los diseños experimentales examinan el cambio a lo largo del tiempo, no hubiera una deserción diferencial.
enfrentan el peligro de un abandono diferencial de los diferentes grupos (por Desigualdad de las intervenciones
ejemplo, las intervenciones menos deseables). Esta deserción diferencial podría ser
responsable de cualquier diferencia de grupo posterior a la prueba (ver En la investigación social experimental basada en el campo, las
anteriormente en este capítulo). Esto puede ser un problema serio en la consideraciones políticas y prácticas reducen nuestro grado de control sobre
investigación social de campo a largo plazo. Además, incluso cuando la tasa de la intervención. Cuando confiamos en una variedad de personas para
abandono es muy similar en todos los grupos, los abandonos pueden diferir implementar una intervención (por ejemplo, diferentes personas pueden ser
significativamente de los que permanecen en el experimento, amenazando así la responsables de llevar a cabo una intervención en diferentes organizaciones)
validez externa. de El estudio. podemos no ser capaz de garantizar que la intervención se implemente de
manera consistente o adecuada. Cuando la intervención se lleva a cabo de
manera desigual, no necesariamente tenemos una buena prueba del impacto de la
intervención prevista.
confiamos en qué intervención ha tenido lugar realmente y, por lo tanto,
En la medida de lo posible, el investigador debe mantener el control de la forma en podemos tener dificultades para dar sentido a los datos.
que se implementan las intervenciones. Sin esto no podemos ser
La profecía autocumplida8
En cualquier investigación siempre existe el peligro de que las expectativas y
los valores del investigador distorsionen inadvertidamente la forma en que
recopila e interpreta la información. Por ejemplo, si esperamos que un
método de enseñanza en particular pueda mejorar el nivel de cooperación de
los niños en el aula, podríamos 'ver' más cooperación que si no tuviéramos
esta creencia. Las expectativas de un investigador pueden afectar lo que ve,
cómo lo interpreta y cuánto busca evidencia contraria a sus expectativas.
Podemos tomar dos enfoques que pueden reducir el peligro de ver solo lo que
queremos ver. Una es desarrollar definiciones operativas claras y protocolos de
investigación que reduzcan la distorsión de las observaciones e interpretaciones. La
segunda es usar múltiples 'jueces' y observadores para que los diferentes
observadores puedan actuar como un control entre sí. Mediante el uso de múltiples
observadores, podemos identificar hasta qué punto los patrones dependen del
observador.
Cuestiones éticas
Participacion voluntaria
Un principio bien establecido de la investigación social es que a las personas
no se les debe exigir o hacer creer que están obligadas a participar en un
estudio. Además, los participantes deben saber que pueden retirarse del
estudio en cualquier momento. Debemos evitar que la gente tenga la
impresión
84
DISEÑOS EXPERIMENTALES
PROBLE
MAS EN 85
EL
DISEÑO
EXPERIM
ENTAL
Consentimiento informado
del contexto en el que se hace la solicitud de que se requiere la participación. En
El consentimiento informado es un primo cercano de la participación
situaciones donde hay una 'audiencia cautiva' y donde hay una diferencia de poder
voluntaria. Por lo general, los participantes deben ser informados sobre:
entre el investigador y los posibles participantes experimentales (por ejemplo,
clase de psicología de primer año, beneficiarios de asistencia social en una
agencia de asistencia social), el investigador debe tener especial cuidado en
enfatizar que la participación es verdaderamente voluntaria.
'Aunque su participación en este estudio será muy valorada, no está obligado a participar.
Puede detenerse en cualquier punto o elegir no responder a ninguna pregunta en particular.
Hágaselo saber al entrevistador.
Es mejor animar que exigir a las personas que participen en los estudios. Hay
dos formas principales de hacerlo. Una es apelar al altruismo de las personas
señalando los posibles beneficios del estudio. Las personas son notablemente
generosas y están dispuestas a participar en estudios en los que creen que
servirán de algo. Sin embargo, en nuestro entusiasmo por reclutar participantes,
debemos evitar la "publicidad engañosa" que exagera los beneficios. En segundo
lugar, podemos apelar al interés propio de las personas: cómo la participación
puede beneficiarlas. Podríamos ofrecer recompensas por participar o al menos
compensar por su tiempo y cualquier costo en el que puedan incurrir al participar.
Algunos estudios brindan obsequios simbólicos y se ofrecen a proporcionar a los
participantes un resumen de los principales hallazgos.
Además, proporcionar detalles sobre el estudio, especialmente información
detallada sobre el diseño del estudio, sobre las hipótesis y teorías que
1 el propósito del estudio y sus procedimientos básicos estamos probando, puede distorsionar la forma en que las personas
responden las preguntas y socavar la validez de los hallazgos.
2 la identidad del investigador y del patrocinador
Una solución es proporcionar información básica y ofrecer responder
3 el uso que se podría dar a los datos. preguntas adicionales. Si esta información pudiera distorsionar la forma en
También deben estar provistos de lo siguiente: que las personas se comportan, podemos explicar con tacto que esto es una
preocupación y ofrecernos para tratar las preguntas después de que termine
4 un resumen de riesgos razonablemente previsibles, vergüenza o incomodidad el experimento. En algunas investigaciones psicológicas, los participantes
son engañados deliberadamente, ya que un conocimiento preciso invalidaría
5 una descripción de los posibles beneficios del estudio el estudio (Homan, 1991: 96ff). Cuando esto esté justificado, es fundamental
6 una descripción de cómo fueron seleccionados que los participantes sean informados por completo después del estudio.
7 una oferta para responder a cualquier pregunta Esto plantea la cuestión de cuándo se debe obtener el consentimiento. La
mayoría de los comités de ética2 exigen que se obtenga el consentimiento
8 una declaración de que la participación es voluntaria, que cada participante es antes de participar. Sin embargo, se puede argumentar que los participantes
libre de retirarse en cualquier momento o de negarse a responder cualquier no saben realmente lo que están aceptando hasta que han participado, y que
pregunta en particular. solo pueden dar su consentimiento informado después de haber participado.
Si bien el tema del consentimiento informado parece completamente razonable y - ¿ Quién debe dar el consentimiento? ¿ Quién debe dar permiso en la
deseable, no siempre es sencillo. ¿Cuánta información debemos proporcionar investigación de niños pequeños, personas con discapacidad intelectual y
antes de que un participante pueda considerarse informado? ¿ Cuán otras personas que pueden no estar en condiciones de comprender
completamente informados deben estar los participantes? ¿Qué significa estar completamente las implicaciones de participar en una encuesta? La
informado? Proporcionar más información no significa necesariamente que las participación aún debe ser voluntaria, pero es posible que se deba obtener el
personas estarán mejor informadas. El simple hecho de proporcionar consentimiento de otras personas, como los padres y tutores, así como del
descripciones detalladas del estudio no significa que los encuestados estarán más participante. En las organizaciones jerárquicas, los guardianes pueden
informados como resultado. De hecho, la información técnica detallada puede otorgar
confundir, distraer y abrumar en lugar de informar.
permiso para que los jóvenes participen y, por lo tanto, en cierto sentido, obligar a los A diferencia de otros diseños, muchos diseños experimentales involucran al
jóvenes a participar. En tales situaciones, debemos asegurarnos de obtener el investigador activamente haciendo algo potencialmente dañino para los
consentimiento tanto de los guardianes como de los participantes reales. participantes. Si bien debería ser obvio que no debemos someter a las personas a
intervenciones potencialmente dañinas, parece razonable establecer
experimentos en los que las intervenciones beneficien a los participantes. Por
Ningún daño a los participantes ejemplo, los experimentos de ingresos garantizados descritos en el Capítulo 4
podrían justificarse porque la intervención de proporcionar un ingreso garantizado
solo beneficiaría a los participantes (Hakim, 1986: 102).
En algunos estudios experimentales, los participantes están potencialmente expuestos
a daños. Por ejemplo, en los experimentos médicos en los que se prueba un nuevo Sin embargo, el argumento de que una intervención será beneficiosa presupone
fármaco, los participantes corren un peligro potencial. En los experimentos psicológicos, que conocemos los resultados de la intervención. Podemos creer que el
los participantes pueden recibir estímulos o ser inducidos a comportarse de manera que mantenimiento de los ingresos será, en el peor de los casos, inofensivo, pero no lo
luego se arrepientan y encuentren angustiosos.3 sabemos de antemano. Incluso con las mejores intenciones, puede haber efectos
nocivos no deseados. También está el tema de '¿beneficio para quién?'. Hakim
Cuando exista algún peligro de daño para los participantes, el principio del (1986) señala que los experimentos de mantenimiento de ingresos condujeron a
consentimiento informado requiere que se informe a los participantes de los peligros un aumento de los divorcios, ya que algunas mujeres adquirieron mayor seguridad
antes de participar en el experimento. Cuando existe la posibilidad de daño y la persona financiera. ) pueden haber tenido puntos de vista muy diferentes.
todavía está de acuerdo en participar, existe la necesidad de un informe cuidadoso
después del experimento. Según el tipo de daño potencial, puede ser necesario un Cuando se perciben beneficios por participar en un experimento (por ejemplo,
seguimiento a largo plazo para garantizar que se eliminen los efectos secundarios un experimento de mantenimiento de ingresos, pruebas médicas) podemos
potencialmente dañinos. son monitoreados. enfrentar el problema opuesto: negar un tratamiento beneficioso al grupo de
control. ¿Es justo negar a algunas personas el beneficio potencial del tratamiento?
La asignación aleatoria puede reducir algunos de los problemas éticos a este respecto.
También podemos comprometernos a facilitar el acceso al tratamiento al grupo de Anonimato y confidencialidad
control una vez que sepamos que ha tenido éxito (o una modificación del tratamiento en Una forma obvia en la que los participantes pueden verse perjudicados es el
base a lo aprendido del experimento). incumplimiento de las promesas de confidencialidad. Las personas que participan
en experimentos tienen derecho a esperar que no puedan ser identificadas como
la fuente de ninguna información en particular. Con frecuencia, los experimentos
de ciencias sociales implican la recopilación de información personal que, si se
hace pública, podría ser vergonzoso o humillante o causar daño a los participantes
de una forma u otra.
Para proteger a los participantes, los datos deben almacenarse de tal manera
que impidan cualquier acceso no autorizado. Esto puede significar almacenar
datos en gabinetes cerrados y eliminar toda la información de identificación. Si los
datos se almacenan electrónicamente, las contraseñas y el cifrado pueden ayudar
a garantizar la privacidad. Es muy deseable que los detalles de identificación
personal y las respuestas relacionadas con los participantes se mantengan por
separado. La información sobre el nombre y la dirección de una persona debe
almacenarse en un archivo y todas sus respuestas a las preguntas deben
almacenarse en un archivo diferente. Los números de identificación para las
referencias cruzadas deben almacenarse de tal manera que solo las personas
autorizadas puedan hacer la comparación.
de primer año en la universidad en particular son representativos de una población Una variable nominal es aquella en la que las diferentes categorías no tienen
más amplia). un orden de rango establecido. Con una variable nominal no tiene sentido
decir que las categorías se pueden ordenar de menor a mayor en algún
Si no tenemos una muestra de probabilidad, no tiene mucho sentido usar sentido. La afiliación religiosa es una variable nominal en la que podemos
estadísticas inferenciales para generalizar a una población más amplia. distinguir entre categorías de afiliación (p. ej., judía, católica romana,
Deberíamos limitarnos a estadísticas descriptivas que resuman patrones en esa ortodoxa, protestante, islámica, sin religión). Estas categorías no tienen un
muestra. Muchos investigadores no pueden reclutar muestras aleatorias. orden de clasificación natural.
continúan usando estadísticas inferenciales de manera inapropiada en su análisis.
Cuando las muestras de probabilidad no son factibles, la forma más adecuada de Al seleccionar un método de análisis de datos, primero debemos identificar el nivel de
probar la generalización es repetir el experimento en diferentes contextos y con medición de cada una de las variables en nuestro análisis. Para calcular el nivel de
diferentes muestras. medición de cualquier variable, haga las preguntas de la Tabla 6.1.
de menor a mayor? No Sí Sí
¿Puedo especificar la
cantidad?
de diferencia entre
las categorias? No No Sí
La técnica de comparación más utilizada es comparar las medias de los grupos, pero esto
requiere que la variable de resultado se mida a nivel de intervalo (ver más abajo). A nivel
descriptivo, esto simplemente requiere comparar las medias. Sin embargo, estas diferencias
en la muestra pueden no mantenerse en la población: pueden ser simplemente el resultado de
un error de muestreo. Podríamos utilizar una técnica de estadística inferencial para averiguar
si la diferencia entre las medias probablemente refleje una diferencia real en la población o
simplemente se deba al azar (error de muestreo). Para hacer esto, podríamos usar una
técnica como una prueba t, una prueba F o análisis de varianza.
en 5. Los promedios de los dos grupos en el tiempo 2 permanecen iguales.
Promedio En consecuencia, una simple comparación de los dos promedios sin observar
A B C D mi F GRAMO H 1 j otros elementos de las distribuciones llevaría a una conclusión falsa de que la
Caso
(significar) intervención no tuvo efecto, ya que los promedios no reflejaron cambios ni
Hora 1 diferencias entre los grupos experimental y de control.
Puntuación en la variable de resultado
DIFERENCIAS EN LA VARIABILIDAD
Grupo de control 5 5 5 5 5 5 5 5 5 5 5
Una forma alternativa de comparar grupos es medir el grado de diversidad
dentro de cada uno de los grupos. ¿Algunos grupos son más uniformes que
Grupo experimental 5 5 5 5 5 5 5 5 5 5 5 otros? ¿Algunos grupos cambian para volverse más uniformes o menos
uniformes que otros? El impacto de una intervención puede no ser aumentar
tiempo 2 Puntuación en la variable de resultado los puntajes generales sino hacer que un grupo sea más uniforme o más
diverso (como en la Figura 6.1). Hay medidas estadísticas como el rango, la
varianza y la desviación estándar que brindan resúmenes del grado de
Grupo de control 5 5 5 5 5 5 5 5 5 5 5
uniformidad (homogeneidad) en los grupos y hay pruebas que miden si los
niveles de homogeneidad en los grupos difieren. Técnicas gráficas como
Grupo experimental 0 0 0 0 0 10 10 10 10 10 5 histogramas y diagramas de caja y bigotes también se puede utilizar para
examinar si los grupos son igualmente diversos. Las pruebas de variación
que se utilicen dependen en parte del nivel de medición de las variables en
Figura 6.1 Problemas con la comparación de promedios
cuestión.
DIMENSIONES
Otro enfoque para comparar grupos, que se utiliza mejor para variables de
resultado categóricas (nominales) o variables con pocas categorías, es
comparar la proporción o el porcentaje de cada grupo que da una respuesta
particular.
(c)Kurtosis (d)Spread
Por ejemplo, imagine que quisiéramos examinar el efecto sobre las tasas
de finalización de cursos universitarios de diferentes métodos de impartición
Figura 6.2 Formas de distribuciones
de un curso. Examinamos las tasas de finalización de aquellos a quienes se
les enseña en situaciones cara a cara con aquellos que toman su curso a
través de Internet. Podríamos encontrar que en el grupo cara a cara, el 75 por
ciento completó con éxito en comparación con el 60 por ciento de los
miembros del grupo de Internet. Estos porcentajes brindan una descripción
FORMA de los diferentes resultados en los dos grupos (estadísticas descriptivas).
Entonces podríamos emprender un análisis que nos diría si estas diferencias
El impacto de una intervención puede verse en su efecto sobre la forma de las puntuaciones entre los grupos (75 por ciento y 60 por ciento) probablemente se deban al
en la variable de resultado. Las comparaciones de homogeneidad de grupo son una forma azar o no. si es probable que reflejen diferencias reales en la población de la
de comparar formas de distribuciones. Otros aspectos de la forma de una distribución que se extrajo la muestra (estadística inferencial). En el ejemplo recién
también pueden formar la base de comparaciones de grupos y revelar el impacto de una proporcionado, la prueba de diferencia entre proporciones para dos muestras
intervención. cumpliría esta función (Loether y McTavish, 1974a: 189ff).
Además de comparar el grado de similitud o diferencia dentro de un grupo, también
podemos comparar las distribuciones utilizando otras dimensiones de la forma de una ASOCIACIÓN ENTRE VARIABLES
distribución. Estas diferentes dimensiones se ilustran en la Figura 6.2.
Los grupos también se pueden comparar de manera útil al examinar la
asociación o correlación entre variables. Las medidas estadísticas de
asociación ponen a prueba la
96
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 97
25 a 49 2 10 1
TABULAR
1 a 24 5 6 14
La tabla 6.2 proporciona un ejemplo de cómo los resultados de un estudio pueden
Ningún cambio 19 3 1
presentarse en forma tabular. En este ejemplo, se reporta el grado de cambio de
productividad para cada uno de los tres esquemas de bonificación. Las celdas de la -1 a-24 5 1 2
tabla indican el número de personas de cada esquema de bonificación que 2
-25 a-50 - 5
muestran varios niveles de cambio en la productividad. Para buscar diferencias en
el efecto de los tres esquemas de bonificación, debemos observar el patrón y la -50 o menos - -
GRÁFICO/TABLA
Al decidir mostrar datos con un gráfico, también debemos decidir qué tipo de gráfico
usar. En la Figura 6.3 se proporcionan solo tres de las muchas presentaciones gráficas
posibles: histogramas, diagramas de tallo y hojas y diagramas de caja y bigotes. Los
tres gráficos se basan en los mismos datos y proporcionan diferentes formas de pensar
y visualizar las distribuciones.
RESUMEN ESTADÍSTICO
98
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 99
(a) Histogramas
Fr
Rango
60.00 curtosis
7.5000
Rango intercuartil
Figura 6.4 Estadísticas resumidas: cambio de productividad por esquema de
-.161
Oblicuidad bonificación
1.078
curtosis
Digamos, por ejemplo, que queríamos establecer qué conexión había, si la
Prima de grupo Media 45,4848 5.9012
hubiera, entre tener un hijo con una discapacidad y la probabilidad de que los padres
Mediana 39.0000 .409 del niño se divorciaran. Supongamos que sabemos que la tasa nacional de divorcio
en cualquier año para parejas con un hijo en el hogar es de 12 por 1000 parejas
Diferencia 1149.195 .798
casadas. Luego, a partir de nuestra investigación, descubrimos que en una muestra
Desviación 33.8998 de familias en las que había un niño con una discapacidad grave, la tasa de divorcio
estándar era de 14 por 1000. La tasa de 14 para la muestra de discapacidad es ciertamente
-5.00
Mínimo más alta que la cifra general nacional, pero es la diferencia probable que refleje una
130.00 diferencia real o simplemente se deba a un error de muestreo? Una estadística
Máximo
inferencial puede responder a esta pregunta. La misma lógica de comparar un solo
135.00
Rango grupo de muestra con una figura de comparación conocida se puede aplicar al
53.0000 análisis en el que nos enfocamos en la media, la proporción o la varianza de un solo
Rango intercuartil
grupo (ver Loether y McTavish, 1974a: Capítulo 7).
.567
Oblicuidad
-.261
100
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 101
No hay nada en la lógica del diseño experimental que nos restrinja a las
Dos grupos variables de resultado a nivel de intervalo. Cuando solo hay dos grupos y la
El diseño experimental clásico comprende dos grupos: el grupo experimental y el grupo de variable de resultado es nominal u ordinal, podemos usar una medida de
control. En diseños experimentales con una variable de resultado a nivel de intervalo, la prueba asociación como estadística de resumen para describir el vínculo entre
t se utiliza para establecer la significación estadística de las diferencias entre grupos. Indica si pertenencia al grupo y resultado.
es probable que la diferencia entre las medias de los dos grupos se deba al azar o si refleja
verdaderas diferencias en la población. El uso de esta prueba depende en cierta medida de la Alternativamente, podríamos usar tabulaciones cruzadas o gráficos para mostrar
distribución de la variable (ver más abajo). Se pueden usar otras pruebas, como la razón crítica, las diferencias entre dos grupos. Si necesitáramos generalizar acerca de si alguna de
para establecer la importancia de las diferencias de grupo para muestras grandes donde no se las relaciones mostradas en tablas o gráficos probablemente se mantendría en la
cumple el supuesto de normalidad (Mueller et al., 1977: 422). población más amplia, podríamos usar una estadística inferencial apropiada. Chi
cuadrado es una estadística ampliamente utilizada que es especialmente útil cuando
las variables de resultado se miden en el nivel nominal. Esto nos dice si las dos variables son
independientes entre sí, es decir, si la pertenencia al grupo hace alguna diferencia en la variable
de resultado. Cuadro 6.3 Cambio porcentual medio en la productividad por
esquema de bonificación
TRES O MÁS GRUPOS grupo de
Cambio% medio
bonificación
Algunos diseños experimentales requieren tres o más grupos de comparación. Por ejemplo,
podemos querer comparar una variedad de intervenciones además de tener un grupo de
control. en productividad
Cuando la variable de resultado es nominal u ordinal, estaremos restringidos en gran medida Tasa fija de pago -0.55
a tablas, gráficos, medidas de asociación y otras formas de comparar distribuciones. Estos
métodos son satisfactorios siempre que haya un número suficiente de personas en cada grupo bono de grupo 45.48
y no haya demasiados grupos para comparar. Cuando hay más de seis o siete grupos para
bono individual 31.15
comparar, las comparaciones pueden volverse muy difíciles.
Para averiguar qué grupos tienen medias que son estadísticamente diferentes
entre sí, necesitamos un procedimiento de comparación múltiple. En tal
procedimiento se comparan todos los posibles pares de grupos y se puede establecer
qué pares de grupos, si los hay, tienen medias que son significativamente diferentes
entre sí. Una técnica de comparación múltiple ampliamente utilizada es la prueba de
Scheffé.
Puede demostrarse que las diferencias en los dos primeros pares (pago fijo
versus bono grupal y pago fijo versus bono individual) probablemente no se
debieron al azar. Sin embargo, la diferencia entre los aumentos de
productividad en los esquemas de bonos grupales e individuales
probablemente se debió al azar. Esto significa que si las diferencias
observadas en la mejora de la productividad de aquellos con bonos
individuales y aquellos con bonos grupales se deben al azar, entonces
esencialmente los dos esquemas son igualmente efectivos. No importa qué esquema DISEÑOS DE MUESTRAS INDEPENDIENTES
de bonificación se utilice. La manera más simple y efectiva de hacer que los grupos sean inicialmente
comparables es asignar aleatoriamente individuos a grupos experimentales y de
¿Los grupos de comparación son muestras independientes? control. Esto se denomina diseño de muestras independientes. Asignación aleatoria a
102
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 103
Algunas estadísticas inferenciales deben tener en cuenta la forma en que las personas fueron
asignadas a las diferentes condiciones experimentales. ¿ Estaban emparejadas de alguna
manera o fueron seleccionadas al azar (independientemente)?
El histograma puede dar una idea visual de si la distribución es una distribución Los diseños experimentales más simples tienen una sola variable
unimodal en forma de campana. Una curva normal también tendrá una asimetría de 0 independiente. Sin embargo, muchos diseños incluyen varias variables
(es decir, simétrica) y una curtosis de 3 (es decir, mesokúrtica) (Loether y McTavish, independientes. Los diseños factoriales y de cuatro grupos de Solomon
1974b: 162). Cuando la muestra es pequeña (por ejemplo, menos de 50) y no se examinan el impacto de cada una de las variables experimentales en la
extrae al azar de la población y se desconoce su distribución poblacional, la estrategia variable de resultado. También identifican el impacto de las interacciones
más segura es utilizar estadísticas no paramétricas o estadísticas paramétricas entre estas variables independientes en la variable de resultado. En los
robustas. experimentos de campo donde la asignación aleatoria no es posible,
necesitamos estimar y eliminar estadísticamente el efecto de las diferencias
¿La varianza de la variable dependiente es similar entre cada grupo de comparación? de grupo conocidas para que podamos examinar el efecto 'puro' de la
variable experimental.
Las comparaciones de grupos pueden ejecutarse de manera útil comparando la
respuesta típica de cada grupo. Sin embargo, las comparaciones de lo que es típico Cuando se utilizan múltiples variables independientes, la estrategia de
pueden invalidarse si los grupos tienen varianzas muy diferentes. La comparación de análisis dependerá de:
las medias de grupos con varianzas muy diferentes dificulta establecer si hay
diferencias en las medias se deben a diferencias en la tendencia central o no (Loether el nivel de medición de todas las variables (tanto independientes como
y McTavish, 1974a: 176). dependientes)
Algunas técnicas estadísticas requieren que establezcamos que la varianza en los (dos) si queremos examinar el impacto relativo de cada variable independiente
grupos es similar. Esto es particularmente importante para las pruebas t de diferencias entre las (incluidos los efectos de interacción) o
medias. En el caso de las pruebas t existen diferentes formas de la prueba dependiendo de si
hay igualdad de varianzas entre los grupos. La mayoría de los paquetes estadísticos incluyen si queremos ver el efecto de una sola variable independiente con el efecto de otras
técnicas estadísticas para probar esta condición. variables controladas.
104
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 105
Cuando un diseño utiliza múltiples variables independientes y una variable de una forma modificada de análisis de regresión denominada variables ficticias (ver de co
resultado a nivel de intervalo, el análisis de varianza de dos vías o factorial es un Vaus, 1996). nfu
método de análisis común. Este método permite al investigador observar el impacto Si la variable dependiente es de carácter nominal u ordinal, no se puede sió
de cada variable independiente con los efectos de las otras variables independientes. utilizar el análisis de varianza o el análisis de regresión estándar. Sin n
variables pendientes eliminadas. Es decir, el análisis puede aislar el efecto 'puro' de embargo, existen otras formas de análisis de regresión, como la regresión de
cada variable independiente y cada posible efecto de interacción. logística, que se pueden utilizar para estas situaciones. otr
as
Este enfoque se puede ilustrar mediante el empleo de una analogía química en la que hay tres
productos químicos A, B y C. La pregunta es: '¿Cuál es el efecto corrosivo de estos tres ELIMINAR LOS EFECTOS DE OTRAS VARIABLES var
productos químicos en el acero?' Podríamos ver el efecto del químico A solo, el químico B solo y Si estamos interesados en el efecto de una sola variable independiente, es iab
el químico C solo. También podríamos querer saber qué sucede cuando combinamos los tres posible que debamos eliminar estadísticamente los efectos de otras les
químicos de diferentes maneras: A con B, A con C, B con C, y A, B y C combinados. El análisis es
diferencias de grupo en la variable de resultado. El análisis de varianza y la
factorial de la varianza nos permite responder a este tipo de preguntas. us
regresión logran esto. Sin embargo, con variables de resultado nominales y
La regresión múltiple es otro enfoque empleado para el análisis que involucra una variable de ordinales también podemos usar tabulaciones cruzadas para eliminar el ar
resultado a nivel de intervalo y múltiples variables independientes. La regresión múltiple efecto de las variables 'contaminantes'. Para ello utilizaríamos el análisis de un
proporciona una forma de examinar el efecto de cada variable independiente menos el efecto de a
elaboración (ver pp.203-210). No hay espacio suficiente para describir este
cualquier otra variable independiente y de las interacciones entre las variables independientes. tab
Cuando las variables independientes no se miden a nivel de intervalo (el análisis de regresión enfoque aquí, pero hay explicaciones claras fácilmente disponibles
múltiple normal supone que todas las variables se miden a nivel de intervalo), podemos utilizar (Rosenberg, 1968; Johnson, 1977). Otra forma de eliminar los efectos de la
pa
rcial promedio (Loether y McTavish, 1974b: 290).
Figu
ra
6.5
Sele
cció
n de
mét
odo
s
esta
dísti
cos
de
análi
sis,
part
e1
106
Figura 6.6 Selección de métodos estadísticos de análisis, parte 2
ANÁL
ISIS
DE
DATO
S
EXPE
RIME
NTAL
ES
108
DISEÑOS EXPERIMENTALES ANÁLISIS DE DATOS EXPERIMENTALES 109
Probabilidad.
Probablemente no.
·Nominal.
·Ordinal.
·Intervalo.
·Dos.
·Tres o más.
·Normal.
·Igualdad de varianza.
· Varianza desigual.
· Variabilidad/forma. ·Una.
8 ¿De qué forma desea mostrar sus comparaciones entre grupos? ·Describe patrones en la muestra?
·Mezcla.
No todas estas preguntas son apropiadas en todas las circunstancias. Algunas son Por ejemplo, podemos usar una escala de 0 a 10 para medir la felicidad
apropiadas dependiendo de cómo se respondan las preguntas anteriores (por ejemplo , donde una puntuación de 0 indica infelicidad. Supongamos que tuviéramos
si no tiene una muestra de probabilidad, entonces no puede usar la inferencia personas en nuestros grupos que obtuvieron una puntuación de 0, es decir,
estadística y, por lo tanto, estará restringido a la descripción). estábamos en el extremo de la infelicidad según lo medido por nuestra escala.
Sin embargo, si estos la gente se volvió aún más infeliz con el tiempo, no hay
forma de detectar esto con nuestra medida. Esas personas serían identificadas
Otros asuntos como personas que no cambian. Solo podríamos identificar a las personas que
se volvieron más felices. Lo mismo se aplicaría a quienes obtuvieron una
Cambiar puntuaciones puntuación de 10. Solo pudimos detectar a aquellos que se volvieron menos
felices.
La lógica del diseño experimental clásico nos llevaría a usar puntajes de cambio.
Cuando tenemos una prueba previa, podemos examinar cuánto cambia cada grupo en Incluso aquellos que no están en el extremo de una escala pero están cerca del final
la medida de resultado antes y después de la intervención. Dado que reconocemos que presentan un problema. Por ejemplo, aunque la persona que obtiene una puntuación de 1
el grupo de control también puede exhibir cambio debido a factores como la maduración, en la prueba previa puede ir más abajo (puede obtener un 0), no puede cambiar en la
simplemente hipotetizaríamos que el cambio será mayor en el grupo experimental que misma medida que alguien que obtuvo una puntuación inicial de, por ejemplo.
en el grupo de control. Por ejemplo:
Grupo experimental: puntuación de cambio=20 Grupo de control: puntuación de cambio=5
Luego podemos realizar un análisis de varianza para ver si este grado de diferencia en
las puntuaciones de cambio (20 en comparación con 5) podría haber ocurrido debido al
azar (error de muestreo). Si la diferencia pudiera deberse a un error de muestreo,
supondríamos que habría no habrá diferencia en la población de la que se extrajo la
muestra.
Hay varios problemas con el uso de puntajes de cambio simples para detectar
cambios y estos se discutirán en el Capítulo 9.
En los diseños en los que las puntuaciones de un grupo se agrupan alrededor del
extremo superior o inferior de una escala (es decir, la medida de la variable de
resultado), debemos recordar que el cambio solo se puede detectar en una dirección.
Este hecho puede introducir un sesgo en la naturaleza de la variable. cambio observado.
Sin embargo, un enfoque inicial útil para analizar este tipo de datos es dibujar
3 o 4. Si el análisis mide el grado de cambio en lugar de simplemente cambiar per se, el gráficos de líneas simples. Estos pueden o no revelar un efecto claro a largo o
'piso' de la escala puede llevarnos a subestimar el grado de cambio. corto plazo o indicar que la intervención no tiene un efecto distintivo (Figura
6.9). El patrón en el grupo o grupos experimentales se puede comparar con el
Este es un problema con muchas medidas que tienen límites superior e inferior.
de un grupo de control.
Introduce un sesgo en términos del tipo de cambio que podemos medir a nivel individual
(ver Capítulo 9) y por lo tanto puede subestimar el alcance del cambio y Sin embargo, la dificultad es que, con múltiples observaciones, los patrones
equivocadamente estimar la dirección del cambio en general. con frecuencia no son tan claros como los de la figura 6.9. Podemos observar
diferencias en diferentes puntos de tiempo simplemente debido al azar y al
Es difícil lidiar con este problema de datos extraídos de escalas con límites estrictos
error de medición. El problema entonces se convierte en lo que constituye una
superior e inferior en la etapa de análisis. El problema de los efectos de truncamiento se
diferencia real entre diferentes líneas de series de tiempo. Este problema es
maneja mejor en la etapa de diseño, donde debemos asegurarnos de que nuestras
demasiado grande para ser tratado definitivamente aquí. Si planea realizar este
medidas estén diseñadas de tal manera que las personas no se agrupen en un extremo
tipo de análisis, asegúrese de obtener un buen asesoramiento estadístico antes
de la escala. Deberíamos emplear medidas que tengan techos altos y pisos bajos y
de realizar el análisis.
donde las personas no se amontonen hacia ninguno de los extremos.
Análisis de tendencia
Resumen
Para identificar los efectos a corto y largo plazo (consulte el Capítulo 4), algunos diseños
experimentales requieren múltiples medidas de antes y después. Estos diseños pueden Este capítulo ha examinado la lógica del análisis de datos experimentales. En
presentar problemas de análisis particulares y pueden involucrar análisis bastante su mayor parte, la lógica básica es la de comparar grupos en relación con el
complejos si estamos tratando de comparar dos tendencias (a diferencia de decir dos desempeño de cada grupo en la variable de resultado. La base de la
medios). Existe una gama de lo que se denominan métodos de análisis de series de comparación pueden ser promedios, distribuciones completas, varianza o
tiempo que están más allá del alcance de este libro. muchas otras características de las distribuciones. Existe una asombrosa
variedad de estadísticas disponibles para el análisis de datos experimentales.
Para ayudar
112
DISEÑOS EXPERIMENTALES
PARTE III
DISEÑOS LONGITUDINALES
Figura 6.9 Algunos resultados de una variable experimental en una serie de tiempo El desarrollo de diseños longitudinales implica una serie de decisiones
críticas. Las decisiones que se tomen determinarán exactamente qué tipo
de diseño longitudinal evoluciona.
con la selección de las estadísticas apropiadas, este capítulo ha esbozado las
principales consideraciones que deben tenerse en cuenta al seleccionar el método 1 ¿Se seguirán los mismos casos a lo largo del tiempo? Aquí la elección es
particular de comparación. Finalmente, dado que los diseños experimentales entre estudios de tendencias y estudios de panel. Los estudios de
normalmente involucran el análisis del cambio, el capítulo discutió una serie de tendencias (o estudios transversales repetidos) implican recopilar
cuestiones sobre la medición del cambio: el uso de puntajes de cambio, efectos de información de muestras comparables a lo largo del tiempo, pero no de las
truncamiento y análisis de tendencias. En el Capítulo 9 se considerarán otros mismas personas. Encuestas anuales como la Encuesta Social General en
problemas relacionados con la medición del cambio. los EE. UU., la Encuesta Británica de Actitudes Sociales, las encuestas del
Eurobarómetro y las Encuestas del Programa Internacional de Ciencias
Sociales son ejemplos de estudios de tendencias en los que se hacen
Nota preguntas similares a una muestra nueva cada año. Este diseño permite la
el seguimiento de los cambios en las actitudes y el comportamiento a lo
1 Esto es cierto si los individuos son las unidades de análisis en el experimento. Si la pareja largo del tiempo. Un diseño de panel involucra encuestas repetidas de las
fuera la unidad de análisis, tener la pareja no violaría los requisitos de independencia. mismas personas. Este diseño permite el seguimiento del cambio tanto a
nivel agregado como individual (consulte el Capítulo 9).
Los diseños longitudinales también pueden variar en muchas otras dimensiones. Estos
incluyen los siguientes:
Entorno La lógica del diseño longitudinal se puede aplicar en entornos que van desde
una situación de laboratorio altamente controlada, grupos de menor escala (por ejemplo,
clases escolares, partes de una organización) hasta encuestas nacionales a gran
escala.
Escala de tiempo La brecha sobre la cual se puede medir el cambio puede variar desde
un período muy corto (por ejemplo, una medida de actitudes antes y después de ver una
película) hasta muchos años. El Estudio Nacional de Desarrollo Infantil es un ejemplo de
una encuesta de panel a largo plazo. El estudio comenzó en 1958 e incluyó a todos los
niños nacidos en Gran Bretaña entre el 3 y el 9 de marzo. Estos niños han sido
rastreados e involucrados en posteriores recopilaciones de datos de seguimiento en
1965, 1969, 1974, 1981, 1991 y 2000.
metr
independiente del período histórico particular. Sencillamente, el tiempo, no el período histórico, o
produce el cambio. vr vr
0 0 0 8 合 명 20
0 2 0
s r o ro
Si solo se hubiera rastreado una cohorte (por ejemplo, los nacidos en la década de 1950),
habríamos observado que a medida que envejecían se volvían más conservadores . más i mi C mi C
conservador debido a algún efecto peculiar de haber crecido en los años 60 y 70. Para distinguir t
2000. Los nacidos en la década de 1960 obtuvieron una puntuación de conservadurismo de 10 arr no
ollo rt
en 1980 y permanecieron en ese nivel. e
p p
: a a
g g
ca o s s
mbi
t 0 t0
os u u
0 0 0 0 0 0 00 0 0
en C
o 9
o8
el
con r
r9
7 6
6
5
5
4 3
4 3
pa
ser gs
vad g gra 1
tu 0 r mo
- - - - -
uris 0 0 0 0 0 a 1 - -
-
- -
o0 m 1 1 1 1 1
mo o
m nor
polí r 8 7 6 5 4 i te
tico 1
g 5 4 3 2 1
de gr r
am 2 ai 1 1
198 o
-
-
-
-
-
m m
1 1
i o
0 a norte 6 5 4 3
200 A 2
1 g
0 r
a i
por m
no o
mi rt
gru e
3 9 9 9 9 9
po 7 6 5 4
A
gr
de am i
o - - - - -
eda m
e
d t
A r
Cu o 0 0 0 0 0
adr
me
o tr s
o 2 3 4 5 6
7.2
s i
9 9 9 9 9
t 1
t r 1 1 1 1
a mi C
metr vr
o
o
n ro p 0 성 0 20 0
o no no no no a
s
r rt rt rt rt g
t e e e e mi C
s
e i
ss t
h r r r r r t u 0
mi 0 0 0 0 0
no
o o o o o o a rt
o
e
8
vr r
6 5 4 3 2
0 合 0 20 0 9
ro o gr
- - - - -
am 1
o 1 1 1 1 1
mi C C
4 2 1
norte
mi
Efe
cto s s 5 3
pa g
s gs r
a i
de no m
rt t o
per e u0
0 0 0 0 0
A
íod o 9
o: o
r 9 7 6 5 4 3
ca
mbi C gra 1
mo - - - - -
9 9 9 9 9
os 1 1 1 1 1
en - -
mi
nor 6 5
-
4 3 2
- -
el pa te
gs
con
gr
ser tu 0 am i 0 0 0 0 0
0 o
0
vad
5
uris 0 0 0
3 6
o0 A 2 4 5
mo
4
polí
m
tico r0 8 7 6 e 9 9 9 9 9
t t
de r
gra 2
mo
- - - - -
o
198 1 1 1 1
0 a r
1 1 1 1 s
200
0 no n
por mi rt 7 6 5 4 3 i o no no no no
e o r rt rt rt rt
coh t e e e e
e
gr
ort am i
t
mi
e o a
h r
de r r r r
A vr
eda 0 우
o 0 o 20 00
o o
ro o o
d
Cu me mi C
tr
adr o
ss
o
n
7.3 s o
r
t
e
i
t
118
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 119
hasta 1990 y 2000. Las diferencias en el conservadurismo de los grupos de edad en,
Hora 1 Intervención tiempo 2
digamos, 2000 se deben a los efectos del período y no a que algunas personas sean
mayores. El grupo de mayor edad en 2000 ha sido 'siempre' más conservador.
Medir variables ? Medir variables
Análisis de la 'carrera' del curso de vida adopción de este enfoque puede producir grupos de comparación que proporcionan
una forma útil, pero limitada, de examinar el efecto de "intervenciones" específicas.
Los estudios longitudinales pueden ayudar a los investigadores a estudiar 'carreras' Por ejemplo, nos puede interesar establecer si tener hijos conduce o no a un
(Menard, 1991: 15). A un nivel puramente descriptivo, con frecuencia no sabemos aumento en la división sexual del trabajo en el hogar. Comenzaríamos con una
cómo se desarrollan las diversas "carreras". Obtener una secuencia precisa de la muestra
forma en que se desarrollan las 'carreras' puede ser crucial para desarrollar
explicaciones sensatas de estas carreras. Por ejemplo, en la 'carrera' de un usuario de
drogas, ¿cuál es la secuencia de eventos? ¿Las personas comienzan a consumir
drogas blandas y luego pasan a las drogas duras, o no hay progresión? ¿ Las
personas se mezclan con los consumidores de drogas y luego comienzan a
consumirlas, o el consumo de drogas conduce a la participación en una subcultura de
drogas? Comprender el orden de los eventos es fundamental para comprender las
vías hacia el consumo de drogas y desarrollar estrategias de intervención.
Este diseño simple (Figura 7.1) requiere la recopilación de datos en dos momentos de
la misma muestra. Podemos hacer una intervención activa o simplemente observar el
efecto de los eventos que ocurren naturalmente entre el tiempo 1 y el tiempo 2.
El diseño de panel prospectivo simple es muy parecido a la fila superior del diseño
experimental clásico (Figura 4.2). Es decir, el diseño tiene un 'grupo experimental' en
el que se puede medir el cambio. Sin embargo, el diseño carece de un grupo de
control aleatorio, lo que genera el problema de no saber si algún cambio se debe a
alguna 'intervención' del investigador, al paso del tiempo oa alguna otra influencia.
El problema de no tener un grupo de control se puede aliviar un poco cuando se usa una
muestra suficientemente grande y diversa en el estudio. Tal muestra nos permite determinar si,
con el tiempo, algunas personas experimentan 'intervenciones' mientras que otras no. La
Este diseño es similar al diseño simple de dos puntos pero simplemente
involucra más puntos de recolección de datos (Figura 7.2).
Figura 7.1 Diseño de panel prospectivo simple
Podríamos tener intervenciones específicas entre cualquier conjunto de puntos de
de parejas sin hijos y observar hasta qué punto los hombres y las mujeres comparten recolección de datos o simplemente recopilar información sobre eventos intermedios
el trabajo doméstico. Podríamos rastrear los cambios durante un período de tiempo relevantes entre cada punto de medición. Las consideraciones teóricas y la
investigación previa afectarían lo que se consideran eventos intermedios
durante el cual algunas parejas tendrían hijos mientras que otras no. Entonces 'relevantes'.
podríamos agrupar la muestra en aquellos que se convirtieron en padres y aquellos
que no tuvieron hijos y ver si aquellos que se convirtieron en padres mostraron un Al igual que el diseño de panel simple, este diseño de múltiples puntos
mayor movimiento hacia una división del trabajo por género. Podemos encontrar que requiere suficiente variación en el grupo inicial y suficiente diversidad en las
los padres adoptaron una división del trabajo más genérica. experiencias intermedias para permitirnos construir grupos de comparación
en la etapa de análisis.
Sin embargo, el problema con este enfoque es que no tiene en cuenta el hecho de que los dos
grupos pueden ser diferentes en muchos aspectos, no solo en la paternidad (por ejemplo, edad, El propósito de múltiples puntos de recolección de datos es:
etnia, nivel de participación en la fuerza laboral). Como no hemos controlado estas posibles
diferencias, no podemos estar seguros de cuál es la causa de las diferencias finales en la división
del trabajo. Sin embargo, si nuestra muestra es lo suficientemente grande y diversa y examinar los efectos a corto y largo plazo
recolectamos la información relevante, podemos eliminar estadísticamente el impacto de las
diferencias conocidas entre los grupos y al menos eliminar algunas de las explicaciones realizar un seguimiento de cuándo se producen los cambios (por ejemplo,
alternativas para las diferencias grupales. en el análisis de 'carrera')
T1 ! T2 个 T3 ! T4 ! ts 个 T6 distinguir entre los efectos a corto, mediano y largo plazo. Podríamos ver los
altibajos que un diseño de dos puntos simplemente no permitiría.
? ? ? ? ?
DISEÑO DE PANEL ÚNICO SIN REEMPLAZO
Figura 7.2 Diseño de panel prospectivo de múltiples puntos
Ya sea que se use o no un diseño simple de dos puntos (prueba previa,
prueba posterior) o de puntos múltiples, se deberá tomar una decisión sobre
Por ejemplo, es posible que deseemos rastrear la forma en que los matrimonios qué hacer con respecto a los abandonos. Cuantos más puntos se recopilen
cambian con el tiempo. Podríamos observar estos cambios a lo largo de cualquier los datos y más tiempo la duración de un estudio, más abandonos se
número de dimensiones tales como los niveles de intimidad, quién ejerce el poder, la convierten en un problema.
forma en que se comparte el trabajo doméstico, la felicidad, los niveles de conflicto,
etc. Podríamos rastrear los cambios en estos aspectos de la relación desde cuando La Figura 7.3 ilustra un diseño de panel sin reemplazo. Hay dos problemas clave
con este diseño. Una es que en un estudio multipunto la deserción acumulativa de los
una pareja empieza a vivir junta ya intervalos regulares a partir de entonces, digamos encuestados puede resultar en una muestra final inaceptablemente pequeña. La otra
cada dos años. También averiguaríamos sobre otros cambios que ocurren entre es que la muestra final puede volverse no representativa y, por lo tanto, amenazar la
nuestras visitas de seguimiento (por ejemplo, nivel de participación en la fuerza validez externa. La falta de representatividad proviene de dos fuentes: primero, las
laboral, nacimiento de niños, nuevas personas, como un padre o un suegro que se une personas que abandonan normalmente son diferentes en formas particulares de las
al hogar, o cambios en las circunstancias económicas). que permanecen en el estudio; en segundo lugar, en muchas poblaciones se
incorporan nuevos miembros y los miembros antiguos se van. Incluso si el panel
Si quisiéramos explorar el efecto de tener un hijo sobre la felicidad marital, original sigue siendo representativo de la población como lo era cuando se reclutó por
primera vez, a medida que la población cambia, puede volverse no representativo.
podríamos, mediante el seguimiento regular de las parejas durante un largo período,
DISEÑO DE PANEL ÚNICO CON REEMPLAZO
Una forma de abordar estos problemas es emplear alguna forma de reemplazo para
T1 T2 T3 T4 T6
los abandonos de la muestra e incluir nuevos tipos de miembros de la población. De
esta forma se mantienen el tamaño de la muestra y, con suerte, la representatividad.
Este tipo de diseño se ilustra en la Figura 7.4.
LONGITUDINALES
El reemplazo también presenta algunas dificultades con el análisis. Dado que, en la figura 7.4, La ventaja de tener paneles superpuestos es que, en cualquier momento, la
muchos de los casos en To son casos diferentes de los de la muestra en T1, no tenemos medidas información de todos los paneles se puede agrupar para obtener información
a lo largo del tiempo para muchos individuos. Esta ausencia de datos a lo largo del tiempo para los transversal.
individuos dificulta el análisis del cambio a nivel individual. Es posible que estemos restringidos a
observar el cambio a nivel agregado en lugar de a nivel individual (consulte el Capítulo 9). Esto se
puede superar en parte mediante la recopilación de información retrospectiva para algunas
variables (consulte a continuación). lo que es probable que hayamos sido en etapas anteriores.
Para lograr este fin utilizaríamos la información que tenemos sobre casos similares que han
estado presentes en la muestra desde el inicio.
Este es un diseño adicional que proporciona una forma más sistemática y aleatoria de tratar la
deserción de la muestra y, al hacerlo, maximiza la validez externa del diseño. Se llama un diseño
de panel giratorio.
Este diseño es muy utilizado en estudios que requieren medidas frecuentes. Las encuestas de
población activa proporcionan un ejemplo de este tipo. Los datos de panel de este tipo permiten al
investigador ver lo que sucede con los patrones de empleo de un individuo (por ejemplo, cuánto
tiempo lleva encontrar trabajo, los esfuerzos para encontrar trabajo, los movimientos dentro y
fuera del trabajo, etc.) a intervalos frecuentes (por ejemplo, mensualmente). El diseño del panel
giratorio también minimiza el problema de la deserción (y los consiguientes problemas de
representatividad) y el agotamiento (exigir demasiado a las mismas personas).
Con un diseño de panel giratorio se establece una serie de paneles. Cada panel comienza en
un momento diferente pero se superpone temporalmente con al menos algunos de los otros
paneles. Esencialmente, se crea un conjunto de paneles que tienen tiempos de inicio y finalización
escalonados. Pero se recopila la misma información de cada panel. La lógica de este diseño se
ilustra en la Figura 7.5.
En este ejemplo, el primer panel (fila 1) se vuelve a probar cada mes durante seis meses.
Después de que este panel ha comenzado, otro panel comienza un mes después y se continúa
durante seis meses. La prueba del segundo panel se completará un mes después del primero.
panel. Se pueden ejecutar varios paneles escalonados simultáneamente.
Cada panel tiene una vida limitada, por lo que es de esperar que los participantes no
sean personas agotadas. Sin embargo, el estudio puede extenderse indefinidamente.
Al rastrear un panel en particular, se puede estudiar el cambio individual durante ese
período. En consecuencia, obtenemos una serie de estudios de panel a corto plazo. Al
madres solas). En las encuestas de población activa, la precisión de las estimaciones
de la muestra puede ser particularmente importante. Por lo tanto, las ventajas de
T1 T2 T3 T4 Ts T6 T7 TB TgT1o T1t T12 T13 T14 T1s T16 T17 agrupar los paneles para el análisis transversal no pueden exagerarse.
(ver Parte IV). La ventaja particular de este enfoque es que le permite al investigador aumentar el
tamaño de la muestra y así minimizar el error de la muestra. Al proporcionar una gran muestra
agrupada, el diseño también proporciona más casos de grupos difíciles de encontrar (por ejemplo,
TIPOS DE DISEÑO LONGITUDINAL
45
55 60- - 50
50
55 60 65-
55
50 55 60 65
60
7050 55 60 65
sesenta y
70 7555 60 65
cinco
70 75 -60 65
70
70 75 - -65
70 75 - -
75 -70 75 - -
- -75 -
- - -
el año 2005 los que tenían 50 años en el 2000 ahora tienen 55 años. La
muestra no nos puede decir nada sobre los nuevos 50 años: los que cumplen
50 en 2005.
primer hijo sobre su nivel actual de felicidad marital y les pediría que recordaran qué
esto de la misma manera que analizaríamos cualquier encuesta transversal (ver estaban de antemano. Este diseño se representa esquemáticamente en la Figura 7.7.
Capítulo 12).
El mismo enfoque podría aplicarse al estudio de la experiencia de
2 Con el tiempo construiríamos paneles para cada cohorte. Podríamos rastrear a envejecer descrito anteriormente. Podríamos tomar un grupo de personas
aquellos que tenían 50 años en el año 2000. Para el año 2025 habremos rastreado esta de 75 años y pedirles que recuerden qué tan optimistas se sentían sobre el
cohorte hasta el final. Podemos hacer lo mismo para aquellos que eran mayores, futuro cuando tenían 50, 55, 60, 65, 70 años y cómo se sienten actualmente.
excepto que el panel para esa cohorte se ejecutaría por menos tiempo. Estos paneles Este diseño se representa en forma de diagrama en la figura 7.8.
están representados por cada fila en la Figura 7.6. Estos paneles permiten el análisis
estándar del cambio individual. Los paneles múltiples también brindan múltiples
cohortes para explorar el efecto del envejecimiento a diferencia de los cambios sociales
más amplios (consulte la discusión anterior sobre las ventajas de los estudios de
múltiples cohortes).
Diseños retrospectivos
En algunos estudios es posible reconstruir los datos a lo largo del tiempo recopilando toda la
información en un momento dado. Es posible reconstruir el grado de cambio y la secuencia de
eventos pidiendo a las personas que recuerden lo que sucedió y cuándo sucedió.
Podríamos, por ejemplo, preguntar a las personas sobre su situación o actitudes actuales y
luego pedirles que proporcionen material similar sobre un punto anterior de sus vidas. Podríamos,
por el bien del argumento, querer saber cómo el nacimiento de un primer hijo afecta la felicidad
marital. Un diseño retrospectivo le preguntaría a una muestra de personas que han tenido su
pasadas se interpretan a la luz de los eventos y experiencias posteriores. Todo lo que
este tipo de diseños nos dirían es cómo las personas construyen su pasado.
T1 'Intervención/evento' T2
Pero este problema no es motivo para condenar todos los estudios retrospectivos.
Recuerdo del matrimonio Nacimiento del primer hijo Nivel de felicidad marital Cuando se trata de ciertos eventos, se puede obtener información bastante buena y
confiable sobre la secuencia de eventos pasados, especialmente si son eventos
ahora
significativos en la vida de la persona. A partir de estos relatos de la secuencia de
felicidad entonces eventos pasados podemos reconstruir "carreras" y, al hacerlo, resolver algunos de los
problemas de orden temporal tan necesarios para desarrollar explicaciones causales.
Figura 7.7 Diseño de panel retrospectivo simple Por ejemplo, podríamos querer examinar la influencia de la etapa de la vida familiar
en la participación laboral de las mujeres. Podemos preguntar a las mujeres
Años retrospectivamente sobre el momento de eventos particulares. Preguntaríamos sobre
50 55 60 65 70 75 el momento de su matrimonio, el nacimiento del primer hijo, el nacimiento de los hijos
posteriores, el divorcio, etc. También podríamos preguntar sobre cualquier cambio en
Recuerdo Recuerdo Recuerdo Recuerdo Recuerdo Optimismo los niveles de participación laboral, como cuándo ingresaron a la fuerza laboral, si
abandonaron la fuerza laboral y cuándo. , cualquier cambio en el estado de la fuerza
de optimismo de optimismo de optimismo de optimismo de optimismo ahora en
laboral (tiempo parcial/tiempo completo/ocasional) o el horario de trabajo (fin de
a los 50 años a los 55 años a los 60 años a los 65 años a los 70 años 75 años semana, noche, etc.). Luego podríamos trazar los cambios en la etapa de la vida
familiar y los cambios en la participación laboral para ayudar a identificar la secuencia
de eventos. Dado que tales eventos son eventos significativos para la mayoría de las
Figura 7.8 Diseño de panel retrospectivo de múltiples puntos personas, podemos reconstruir el orden temporal razonablemente bien y construir una
imagen de las carreras laborales y familiares. para mujeres. El estudio también podría
Los problemas con este tipo de diseño para este tipo de asuntos son obvios. Habrá una gran pedirles a estas mujeres que
cantidad de distorsión (deliberada o no) en esos recuerdos. Las personas no solo no podrán
recordar con precisión cómo se sintieron, sino que sabemos que los recuerdos de experiencias
128
DISEÑOS LONGITUDINALES TIPOS DE DISEÑO LONGITUDINAL 129
132
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 133
LONGIDUTINAL
MADURACIÓN
Los cambios también pueden deberse a que las personas simplemente envejecen
(efectos de desarrollo). Por ejemplo, un estudio del efecto del desempleo en la salud
PRUEBAS O ACONDICIONAMIENTO DE PANELES
mental de los jóvenes encontrará el problema de que la adolescencia tardía es un
período en el que los problemas de salud mental como la depresión y esquizofrenia El condicionamiento del panel ocurre cuando los participantes del panel responden a
tienen más probabilidades de desarrollarse de todos modos. Si simplemente las preguntas de maneras que están influenciadas por su exposición previa a las
hacemos un seguimiento de la incidencia de los problemas de salud mental entre un mismas preguntas. Cuando las personas recuerdan cómo respondieron previamente
grupo de jóvenes que quedan desempleados, corremos el riesgo de sobrestimar el a las preguntas, puede influir en la forma en que responden en ocasiones posteriores.
efecto del desempleo en la salud mental. Es probable que parte de la incidencia en Los participantes pueden responder de modo que parezcan coherentes a lo largo del
problemas de salud mental se deba a un aumento común de problemas en este tiempo. Alternativamente, pueden responder de una manera particular porque han
grupo de edad, independientemente de la situación laboral. aprendido a evitar una serie extensa de preguntas de seguimiento. El
condicionamiento del panel puede contaminar las respuestas de los participantes del
Para identificar cualquier contribución distintiva que el hecho de estar panel y subestimar o sobrestimar el grado de cambio real a lo largo del tiempo.
desempleado haya hecho a la salud mental, necesitaríamos rastrear varios grupos
Los estudios experimentales pueden minimizar los problemas de prueba al evitar
de jóvenes: los que permanecieron empleados, los que consiguieron empleo y los por completo la etapa previa a la prueba o al usar diseños como el diseño de cuatro
que permanecieron desempleados. grupos de Solomon (Capítulo 4). Desafortunadamente, es difícil eliminar este
problema cuando se utiliza un diseño de panel prospectivo ya que, por definición, se
requieren al menos dos pruebas. Sin embargo, existen algunas formas de estimar el
efecto de las pruebas.
INSTRUMENTACIÓN
En una encuesta de panel, los cambios a lo largo del tiempo también pueden deberse
a cambios en la forma en que se recopilan los datos en cada ronda (Capítulo 5).
Variación en la redacción de las preguntas, el orden, la duración de la entrevista, el
entrevistador, los métodos de recopilación de datos (por ejemplo, cara a cara en onda
1 y teléfono en la onda 2) pueden producir cambios aparentes pero no reales en las
actitudes.
Cuanto más abierto esté el método de recopilación de datos a las interpretaciones subjetivas cuando participa el mismo observador, esa persona está sujeta a cambios y puede
de las personas que recopilan los datos, mayor será el peligro de que los cambios aparentes verse afectada por factores históricos y de maduración. Con el tiempo, los
puedan reflejar diferencias del observador en lugar de cambios en lo que se observa. Incluso observadores pueden ver el
134
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 135
LONGIDUTINAL
ERROR DE MEDICIÓN
Dado que una razón clave para realizar estudios longitudinales es medir el cambio, es crucial
que observemos el cambio real en lugar de un simple error de medición. El uso de instrumentos
de medición poco confiables hará que detectemos un "cambio" donde realmente no hay cambio.
Por ejemplo, podríamos medir el nivel de prejuicio de una persona en T1 y nuevamente en T2.
Sin embargo, si la medida del prejuicio es inestable, ¿cómo podemos saber si algún cambio se
debe a un instrumento poco confiable o a un cambio real? Del mismo modo, si la medida del
prejuicio es insensible, es posible que no detecte el cambio aunque haya habido un cambio.
REGRESIÓN
El mismo problema surge en los estudios de panel, ya que la deserción no será
uniforme para todas las categorías de personas. La importancia del problema
diseños experimentales. En otras palabras, los individuos con puntajes extremos en depende del análisis particular (comparaciones) realizado. Identificar los sesgos
el ciclo 1 tenderán, en el ciclo 2, a 'retroceder' a la media. Los puntajes altos tenderán introducidos por la deserción y luego eliminar estadísticamente el efecto de dichos
a bajar y los puntajes bajos tenderán a subir. Cuando el análisis del cambio se realiza sesgos puede minimizar el impacto de la deserción diferencial.
a nivel individual nivel en lugar de a nivel agregado, atribuiremos erróneamente
algunos cambios individuales a una intervención o algún otro factor cuando es Cuestiones de validez externa
simplemente un artefacto de regresión estadística. A nivel agregado, no debemos
cometer este error, ya que el movimiento de puntajes bajos a moderados equilibrará DESGASTE DEL PANEL
el movimiento de puntajes altos a moderados (consulte la discusión sobre los efectos
Una importante amenaza potencial para la validez externa en los estudios de
de truncamiento en el Capítulo 6).
panel es la pérdida de casos con el tiempo (desgaste). Cuanto más tiempo
En los diseños experimentales es relativamente fácil distinguir el cambio debido a la regresión exista un estudio de panel y más ondas tenga, mayor será el peligro de
estadística del cambio debido a otros factores. Dado que tanto el grupo experimental como el de desgaste. El desgaste es una amenaza para la validez externa porque no es
control estarán igualmente sujetos a la regresión estadística, será la diferencia en el nivel de aleatorio. Algunos tipos de personas tienen más probabilidades de
cambio (en lugar de la cantidad absoluta) que reflejará la influencia de otros factores. En los abandonar los estudios que otros. A medida que la deserción se agrava a lo
estudios de panel, la ausencia de grupos de control estrictamente comparables hace que sea largo de las oleadas, la muestra se vuelve cada vez menos representativa.
más difícil medir el alcance de la regresión.
Hay varias formas de responder al desgaste y su amenaza a la validez
MORTALIDAD/DESERCIÓN externa. Una forma es reemplazar los abandonos con personas con
características similares para corregir los sesgos conocidos. Esto es más
El concepto de mortalidad, la deserción diferencial en los grupos experimental y de
fácil decirlo que hacerlo. Es posible que no sepamos qué sesgos introduce la
control, se discutió en el Capítulo 5. Los diferentes resultados para los dos grupos
deserción. Además, puede que no sea posible contratar a los
pueden deberse a la deserción diferencial en alguna etapa entre la prueba previa y la
posterior, en lugar de la intervención.
136
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 137
LONGIDUTINAL
este sesgo de edad solo importa si la edad está vinculada a las variables que
nuevos miembros de la muestra. Si usamos reemplazos, los datos para estos nuevos se están analizando. examinado. Si X afecta a Y, independientemente de la
reclutas estarán incompletos, lo que limitará el análisis al análisis de nivel agregado edad, entonces el sesgo de edad debido a la deserción no importa. Podemos
(consulte el Capítulo 9). esperar con confianza que la relación entre X e Y existirá en la población más
amplia, a pesar de las diferencias en los perfiles de edad de la muestra y la
Este problema se puede abordar ponderando la muestra para tener en cuenta el población.
desgaste. La ponderación implica aumentar estadísticamente la proporción de grupos
subrepresentados en la muestra para que su proporción refleje su proporción en la En aquellas circunstancias en las que un sesgo de muestra producido por la
población (Capítulo 9). Si la muestra se pondera con precisión, aún puede deserción puede afectar los patrones que estamos examinando, necesitamos
proporcionar una base útil para la generalización. eliminar estadísticamente el efecto de este sesgo y ver si la relación entre X e
Y permanece (véanse los Capítulos 9 y 12). la relación entre X e Y permanece
Los problemas causados por el desgaste de la muestra también se pueden abordar después de eliminar el efecto de cualquier variable en la que haya sesgo de
reconociendo que existen sesgos y aceptando que afectarán significativamente muestra, podemos generalizar con seguridad a una población más amplia a
nuestra capacidad para generalizar a nivel descriptivo. Sin embargo, a nivel pesar del sesgo de muestra.
explicativo, el sesgo podría no importar. Si, por ejemplo, un estudio de panel está
sesgado debido a la desproporcionada deserción de las personas más jóvenes (se ACONDICIONAMIENTO DE PANELES
mueven más y, por lo tanto, es más difícil hacer un seguimiento a lo largo del tiempo),
La discusión anterior sobre los efectos de las pruebas y sus implicaciones para la
validez interna (atribuir el cambio a una intervención u otro factor cuando en realidad se
debe simplemente al estudio) también tiene implicaciones para la validez externa. Si la el estudio podría no ser comparable a aquellos entre los niños de la ruptura del
participación en un estudio longitudinal produce un cambio (porque alerta a los matrimonio en general.
participantes sobre asuntos en los que de otro modo no pensarían), es difícil decir que
los cambios observados en el estudio tendrán lugar en la población más amplia. Sin embargo, no hay razón por la cual el condicionamiento deba afectar la
relación entre las variables. Podríamos querer ver si los divorcios de alto
Sin embargo, esto es más un problema a nivel descriptivo que explicativo. Si conflicto producen una peor adaptación entre los niños que los divorcios de
participar en un estudio de panel afecta el comportamiento y las actitudes de los bajo conflicto. Si bien la participación en el estudio puede moderar el nivel de
participantes, será difícil generalizar del panel a la población. Sin embargo, el conflicto entre padres divorciados y puede afectar la adaptación de los niños,
condicionamiento no debe afectar la forma en que los factores se vinculan entre sí. Por no hay razón por la cual la participación altere el vínculo entre conflicto y
ejemplo, para explorar el impacto de la ruptura del matrimonio en el bienestar de los adaptación. Aunque los niveles absolutos de conflicto y adaptación pueden no
niños, podríamos hacer un seguimiento de las familias que están experimentando la reflejar los niveles en la población más amplia de divorciados, la relación entre
ruptura del matrimonio. Si formar parte del estudio hace que los padres y los niños conflicto y ajuste no debería verse afectada. En consecuencia, esta relación
estén más atentos a las cuestiones de adaptación y bienestar, entonces los niveles de puede generalizarse a una población más amplia.
adaptación que observamos en
En aquellas circunstancias en las que es probable que el
acondicionamiento del panel se convierta en un problema serio para la validez
externa de un estudio, puede ser apropiado utilizar un diseño diferente. Un
diseño transversal repetido puede ofrecer una alternativa adecuada. Un
diseño de panel giratorio también proporciona una forma de estimar la medida
en que el acondicionamiento podría estar afectando los resultados. Lo hace
comparando los resultados de los paneles nuevos con los de los paneles
'experimentados'.
INMIGRACIÓN Y SALIDA
Cuestiones prácticas
niños o el lugar de trabajo para que, si el encuestado se muda, podamos
Tanto en la etapa de diseño como en la de ejecución de un estudio longitudinal hay muchas comunicarnos con estos otros contactos de respaldo para encontrar al
cuestiones prácticas que resolver. Algunos de estos tienen que ver con maximizar la validez encuestado. También se pueden usar los registros públicos. Los directorios
interna y externa. Otros tienen más que ver con el costo de implementar diferentes diseños y los
telefónicos, las listas electorales y los registros disponibles públicamente de
aspectos prácticos de completar el estudio.
los consejos locales pueden ayudar a localizar a los encuestados que se han
Estandarización de instrumentos mudado. Por supuesto ,es más fácil si los participantes del panel nos dicen
Dado que el cambio es el enfoque central de los estudios longitudinales, debemos asegurarnos que se han mudado. En cada entrevista y cualquier otro contacto, es útil
de que el cambio observado refleje el cambio real en lugar de cambios en la forma en que se proporcionar tarjetas de notificación de cambio de dirección a los
recopilan los datos. Por lo tanto, es esencial estandarizar la forma en que se recopilan los datos participantes para que las envíen por correo a los administradores del
para las distintas oleadas del estudio. Es necesario estandarizar el método por el cual se estudio si se mudan. Mantener el contacto entre las oleadas de encuestas
recopilan los datos, la forma en que se hacen las preguntas, el orden en que se hacen, etc.
es otra estrategia útil. tarjeta a los participantes. Si esta tarjeta se 'devuelve
Necesitamos desarrollar reglas claras y consistentes sobre qué hacer en situaciones particulares
y seguirlas religiosamente. a ellos. Es posible que la época del año en la que se recopilan los al remitente', se nos alerta sobre la necesidad de comenzar a rastrearlos de
datos deba ser coherente para cada ciclo. Las épocas ocupadas, las épocas sombrías del año, inmediato. La tarjeta también brinda la oportunidad de enviar una tarjeta de
las épocas de estrés (por ejemplo, Navidad, el final del año fiscal), las vacaciones pueden afectar cambio de dirección y actúa como un reconocimiento de agradecimiento por
el tipo de respuestas que recibimos. participar en el estudio.
No siempre es posible lograr la estandarización. Cuanto menos estructurado sea el método de
Para reducir la deserción, es esencial mantener la motivación de los
recopilación de datos, más difícil será estandarizar los procedimientos. Cuando se requieran
técnicas más cualitativas y subjetivas, como la observación y las entrevistas no estructuradas, encuestados para continuar participando a fin de reducir la deserción.
mayor será la posibilidad de que se produzcan cambios. deberse a las personas que recopilan Proporcionar incentivos como dinero por el tiempo que las personas dedican
los datos y los métodos mismos. al estudio, pequeñas muestras de agradecimiento o resúmenes de los
resultados clave de la encuesta puede ayudar. lograr este objetivo. Si bien
La estandarización completa no siempre es deseable. Por ejemplo, puede interferir con
nuestros objetivos de investigación en estudios de curso de vida en los que se realiza un los incentivos materiales pueden ayudar a mantener la participación,
seguimiento de las personas a medida que envejecen. En los estudios longitudinales, las probablemente el incentivo más efectivo es que las personas sientan que su
circunstancias de las personas cambian, por lo que es posible que necesitemos adaptar nuestros participación es importante y constructiva. Cuantas más personas sientan
indicadores para reflejar dichos cambios. De la misma manera que los indicadores de que son participantes y socios en la investigación en lugar de 'sujetos',
inteligencia son específicos de la edad, nuestros indicadores de cambio también pueden
mejor. El objetivo primordial debe ser hacer de la participación en el estudio
necesitar ser específicos de la etapa de la vida. Es posible que sea necesario adaptar las
medidas de bienestar y cohesión familiar según la etapa del ciclo de vida familiar. una experiencia positiva en lugar de una carga y una intrusión no deseadas
(Dillman, 1978).
En los estudios de panel en curso, a menudo hay un núcleo de medidas estándar recopiladas
en cada ola del estudio. Además, también se incluyen con frecuencia módulos que cambian de La deserción es un problema mayor en algunos tipos de estudios que en otros. Los
vez en cuando. estudios de personas que son muy móviles, marginales o miembros de grupos
"extremos" pueden experimentar altas tasas de deserción. Por ejemplo, los estudios
desgaste del panel de padres después del divorcio invariablemente crean el problema de mantener el
contacto con los padres no residentes, especialmente los padres no residentes. Los
El desgaste de la muestra produce problemas tanto con el tamaño de la muestra como con la estudios longitudinales de grupos tales como delincuentes, usuarios de drogas y
representatividad y, por lo tanto, debe minimizarse. algunos tipos de personas desempleadas tienen tasas de deserción muy altas
inducidas por altos niveles de movilidad, enfermedad y muerte. Los estudios de panel
Para minimizar la deserción, debemos realizar un seguimiento de los miembros del panel. El
de personas que experimentan transiciones en la vida también pueden tener tasas de
seguimiento exige recursos considerables. Se utiliza una variedad de técnicas para ayudar a
deserción más altas que el promedio. es muy probable que las transiciones cambien
rastrear a las personas. Se recopila información adicional sobre los padres,
de dirección. Como resultado, pueden perderse en el estudio de panel.
Carga del encuestado entrevistas/cuestionarios son largos o intrusivos. calidad a medida que
Las encuestas de panel pueden imponer una carga considerable a los participantes. aumenta la carga.
Esto es especialmente así si cada ola del estudio está muy cerca una de la otra o si las
140
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 141
LONGIDUTINAL
Existe alguna evidencia (Buck et al., 1995) de que el costo de mantenimiento del
Hay varias formas de reducir la carga del encuestado. Algunas preguntas no panel puede ser no más que el costo de reclutar nuevas muestras. Además, el costo
necesitan hacerse en cada oleada: cada segunda o tercera oleada puede ser de recolectar los mismos datos de antecedentes en cada encuesta transversal
suficiente para algunas preguntas. Alternativamente, se puede hacer un conjunto de limitará la cantidad de otra información que se puede recolectar. En un diseño de
panel más fondo
preguntas solo a la mitad del panel y un conjunto diferente de preguntas a la otra
mitad. Aunque tenemos menos personas respondiendo las preguntas, es posible que
todavía tengamos suficientes números para un análisis significativo.
El segundo problema con los estudios que requieren el recuerdo del encuestado es el
telescoping y el telescoping inverso (Menard, 1991). Las personas pueden recordar mal y pensar
que los eventos sucedieron más recientemente de lo que realmente sucedieron (telescópico) o
hace más tiempo de lo que realmente sucedieron (telescópico inverso). Se pueden usar varias
técnicas para reducir este problema. eventos y la construcción de un calendario de estos
eventos clave puede proporcionar puntos de anclaje para ayudar a recordar la secuencia de
eventos con mayor precisión. Por ejemplo, podríamos estar interesados en el vínculo entre la
etapa de la vida familiar y los patrones de trabajo de las madres. Para proporcionar puntos de
anclaje, primero podríamos pedir a las madres que proporcionen fechas clave como el año de su
primer trabajo, la fecha de nacimiento de cada hijo y así sucesivamente. Dado que es probable
que estas sean fechas que se pueden recordar con precisión, podemos entonces, pieza por
pieza, reconstruir cuánto tiempo después de estos eventos memorables ocurrieron otros
eventos, quizás menos memorables.
Costo
Los estudios de panel suelen ser mucho más costosos que un solo estudio transversal. El costo
de las encuestas de panel se deriva del uso de múltiples recopilaciones de datos y el costo de
seguimiento y mantenimiento del panel.
Sin embargo, si la elección es entre, digamos, un estudio de panel de cinco ondas y cinco
encuestas transversales repetidas, la desventaja del costo del diseño del panel es menos obvia.
entrevistas cara a cara a entrevistas telefónicas puede presentar problemas de
instrumentación como se discutió anteriormente.
la información solo debe recopilarse una vez (en la primera ola), lo que nos permite recopilar
información adicional en oleadas posteriores o reducir la duración (y el costo) de las Método de recopilación de datos
recopilaciones de datos posteriores.
No hay nada intrínseco en cualquier diseño de investigación que dicte que el
En última instancia, la rentabilidad del diseño del panel dependerá de la dificultad de mantener investigador utilice un método particular de recopilación de datos. En principio, los
el panel: cuánto tiempo se necesita para el seguimiento y el esfuerzo requerido para las datos pueden recopilarse mediante cuestionarios estructurados, observación,
'conversiones de llamadas' (convencer a los miembros del panel que inicialmente se niegan a entrevistas estructuradas o no estructuradas o cualquier otro método.
continuar).
Sin embargo, cuando se propone utilizar un diseño de panel, existen ventajas
El costo también dependerá del método de recopilación de datos. De los tres métodos reales en el uso de técnicas de entrevista asistidas por computadora. Aquí hay dos
principales de recopilación de datos en estudios de panel -entrevistas cara a cara, entrevistas alternativas disponibles: entrevista telefónica asistida por computadora (CATI) y
telefónicas y cuestionarios postales autoadministrados- las entrevistas cara a cara son los más entrevista personal asistida por computadora (CAPI).
caros. Sin embargo, tienden a producir las mejores tasas de respuesta. Las encuestas
Hay dos ventajas en el uso de métodos asistidos por computadora en los diseños
nacionales de panel generalmente se basan en alguna forma de muestreo por conglomerados
de paneles. Primero, estos diseños pueden involucrar conjuntos de preguntas
(Moser y Kalton, 1971; de Vaus, 1996) donde los conjuntos de entrevistas se concentran en
extremadamente complejos, con muchas preguntas que son relevantes solo para
varias áreas geográficas. entrevistas cara a cara en un área al mismo tiempo que se maximizan
pequeños subconjuntos de encuestados (dependiendo de sus características o los
las tasas de respuesta y se minimiza la deserción.
patrones de cambio que hemos observado). . Por ejemplo, es posible que
En el transcurso de un estudio de panel, las entrevistas cara a cara pueden volverse menos necesitemos un módulo especial de preguntas para las familias que se han divorciado
factibles desde el punto de vista financiero. A pesar de las entrevistas agrupadas inicialmente, en entre oleadas y requieran diferentes preguntas para los padres residentes y no
áreas particulares, las altas tasas de movilidad geográfica pueden conducir a la 'desagrupación' residentes. Con los métodos de entrevista asistidos por computadora, todas las
o dispersión de la muestra, lo que aumenta los costos de las entrevistas. considerablemente. preguntas posibles se programan en el paquete de entrevistas. Sobre la base de las
Afortunadamente, los avances en las entrevistas telefónicas (ver la siguiente sección) pueden respuestas a las preguntas anteriores, la computadora selecciona qué preguntas
aliviar los problemas de desagrupamiento (Buck et al., 1995). Sin embargo, cambiar de
142
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 143
LONGIDUTINAL
El número de ondas utilizadas dependerá en parte del propósito del estudio. Si Brecha entre olas
estamos interesados simplemente en 'antes' y 'después' de un evento en particular,
dos ondas deberían ser suficientes. Si estamos tratando de rastrear un proceso de
Establecer la brecha entre olas se verá afectado por consideraciones 'políticas' como
la presión para obtener algunos resultados. La naturaleza y el contenido del estudio
también serán cruciales para establecer la brecha entre las olas. Los estudios de Al establecer la brecha entre olas, se debe considerar la carga del encuestado y el
condicionamiento del panel. Las brechas cortas pueden exacerbar estos problemas.
eventos de alta frecuencia o procesos de cambios relativamente rápidos pueden
Por otro lado, las brechas largas pueden crear problemas de seguimiento y aumentar
requerir solo pequeños intervalos entre ondas. El modelo teórico que se prueba
el desgaste.
también determinará los intervalos. Por ejemplo, en un estudio de adaptación a la
jubilación que anticipó diferentes fases en la transición de la jubilación (p. ej., luna de Error de muestra
miel en los primeros 3 meses; angustia a los 6 meses; reconstrucción de una nueva
El error de muestra es, en parte, una función del tamaño de la muestra. Cuanto más
identidad a los 12 meses; estabilización a los 18 meses), el modelo dictaría el espacios pequeña sea la muestra, mayor será la posibilidad de error de muestra. En las
entre olas. encuestas prospectivas de panel (sin reemplazo), se producirá un error de muestra
cuando se seleccione la muestra inicial. El desgaste posterior puede producir sesgo y
Cuando se espera que los cambios sean graduales, no tiene sentido volver a visitarlos con
aumentará el error de muestra como resultado de la reducción del tamaño de la
frecuencia. La famosa serie '7-UP', que siguió a un grupo de personas cada siete años a partir de
muestra. Si la muestra se repone, se controlará el error de muestra debido al tamaño
los siete años, es un ejemplo de un estudio a largo plazo con grandes lagunas. entre olas.
total de la muestra. Sin embargo, el reemplazo se basará en nuevas mini muestras y
estas mini muestras de reemplazo estarán sujetas a errores de muestreo y, por lo
tanto, pueden afectar la precisión con la que podemos generalizar con confianza
nuestro resultado más allá del panel.
Tamaño de la muestra
El tamaño de la muestra crea un problema con cualquier tipo de diseño. Las muestras
pequeñas encuentran problemas con el error de muestreo y con casos insuficientes
en subgrupos especiales para permitir un análisis significativo.
-Cuando nuestro interés está en los grupos pequeños, es posible que debamos
refinar más el panel inicial (por ejemplo, solo parejas con niños pequeños en lugar de
una muestra aleatoria de hogares). Alternativamente, puede ser posible
sobremuestrear ciertos tipos de personas (por ejemplo, parejas con niños pequeños)
para maximizar nuestras posibilidades de obtener un número suficiente de personas
que posteriormente experimenten los cambios en los que estamos interesados.
144
DISEÑOS LONGITUDINALES PROBLEMAS EN EL DISEÑO 145
LONGIDUTINAL
Diseño de instrumentos
dotación de personal
Cuestiones éticas
Surge una pregunta interesante en los diseños que involucran vinculación
de registros. Aunque las leyes de privacidad de muchos países impiden dicha
implementado. Dado que estos principios se discutieron en el Capítulo 5, esta sección vinculación, estos diseños también contravienen potencialmente el principio
simplemente destaca los asuntos que surgen particularmente con los diseños del consentimiento informado. Aunque una persona puede haber dado su
longitudinales. consentimiento informado cuando proporcionó cada conjunto de información
por separado, esto no es lo mismo que aceptar que los datos se vinculen, ya
Participacion voluntaria que este es un uso muy diferente de los datos y es poco probable que sea
para lo que la persona dio su consentimiento. .
Dada la necesidad de minimizar el desgaste del panel, existe el peligro de que se
empleen presiones indebidas o medios poco éticos para convencer a las personas de Daño a los participantes
que continúen participando en cada ola. A medida que crece la 'inversión' en cada
persona a medida que participa en más oleadas, aumenta el 'costo' de la deserción de En los diseños experimentales en los que hay una intervención activa, existe
las personas. Sin embargo, la participación voluntaria debe seguir siendo la base un requisito ético de que esta intervención no exponga a los participantes a
sobre la cual las personas continúan participando. daños. La misma preocupación puede surgir en los diseños de panel que
involucran una intervención activa. Sin embargo, los estudios de panel
También surge la pregunta de qué hacer con las personas que se niegan a generalmente se basan en el efecto de eventos 'naturales' y por lo tanto no
participar en una ola. ¿Debería eso impedir tratar de reclutarlos nuevamente en una enfrentan el problema de las intervenciones dañinas de la misma manera que
ola posterior? ¿En qué momento volver a los que antes se negaron se convierte en lo hace el experimentador.
acoso?
Sin embargo, el investigador bien puede enfrentarse a situaciones en las
Consentimiento informado que se entera de personas que están expuestas a daños. Por ejemplo, el
estudio puede identificar a una persona con depresión suicida o puede
¿En qué momento se debe pedir a los participantes su consentimiento? En un estudio encontrarse con casos de abuso infantil. El investigador debe decidir qué
que puede extenderse por muchos años, ¿el consentimiento al principio dura el resto hacer. en tales casos. Puede existir la tentación de no hacer nada, ya que
del estudio, independientemente de cuántas oleadas tenga finalmente? ¿ O se cualquier referencia posterior para obtener otra ayuda puede poner en peligro
requiere consentimiento informado en cada ciclo? la participación continua de la persona en el panel. Además, dicha
intervención puede 'contaminar'
146
DISEÑOS LONGITUDINALES
Resumen
la investigación cambiando el comportamiento. Mi propia opinión es que el bienestar
de los participantes debe tener prioridad y que, al invitar a las personas a participar en Si bien los diseños experimentales con frecuencia no son factibles en la
un estudio, el investigador asume cierta responsabilidad por la seguridad y el investigación de las ciencias sociales, los diseños longitudinales brindan una
bienestar de los participantes, incluso cuando se trata de otras personas. que el forma importante de rastrear y comprender el cambio a nivel individual y
investigador que causa el daño. social. Mientras que los diseños longitudinales pueden encontrar algunos
problemas con la validez interna debido a la ausencia de grupos de control
Confidencialidad y anonimato aleatorios. , hay maneras de minimizar estos efectos. Estos se han discutido
brevemente y se desarrollarán con más detalle en el Capítulo 9. Se han
Dado que necesitamos poder emparejar casos entre oleadas y rastrear casos, es imposible
discutido otros problemas potenciales con validez interna y se han esbozado
garantizar el anonimato de los participantes. Sin embargo, es necesario garantizar la
confidencialidad. Aparte de las garantías normales de no divulgar información que pueda
formas de estructurar diseños longitudinales para superar estos problemas en
comprometer la privacidad de cualquier persona, existe la necesidad de garantizar que los datos este capítulo. Como regla general, los diseños longitudinales tienden a tener
se almacenen de forma segura. Dado que necesitamos poder hacer coincidir las respuestas con una mejor validez externa que los diseños experimentales, pero las amenazas
información que pueda identificar a los encuestados, es importante que los datos se almacenen a la validez externa permanecen y deben eliminarse. El capítulo describió
de tal manera que ninguna persona no autorizada pueda hacer coincidir esta información de estas amenazas e indicó estrategias para minimizarlas.
identificación con otras respuestas. Esto se puede lograr almacenando la información en
archivos separados con solo un número muy limitado de personas que tienen la información Los diseños longitudinales pueden ser bastante complejos de implementar
necesaria para hacer coincidir los dos archivos. e involucran una amplia variedad de decisiones prácticas. Se describieron los
problemas prácticos y éticos que son particularmente pertinentes para los
diseños de paneles.
Fuentes de datos faltantes
ÍTEM NO RESPUESTA
9
La falta de respuesta del ítem ocurre cuando los individuos no responden a
una pregunta en particular. En algunos casos, esto se debe a que no están
obligados a responder al ítem (p. ej., preguntas sobre un cónyuge para
ANÁLISIS DE DATOS EN LONGITUDINAL personas que no están casadas), mientras que en otros casos algunas
personas pueden negarse a responder a una pregunta (p. ej., ingresos).
DISEÑO
FALTA DE RESPUESTA DE LA UNIDAD
Este es un problema que es propio de los estudios de panel.1 Dado que los
diseños de panel involucran la recopilación de datos de los mismos individuos
en varias ocasiones y la medición del cambio durante ese tiempo, nos
Muchos de los temas discutidos en el Capítulo 6 en relación con el análisis de datos encontramos con dificultades si no logramos recopilar datos del caso en el
experimentales también se aplican al análisis longitudinal. En lugar de repetir esa segundo caso o en cualquier otro subsiguiente. ocasión.
discusión, este capítulo se enfoca en una serie de cuestiones de análisis que son
Hay dos formas de falta de respuesta de la unidad. Una es donde las personas
particularmente pertinentes para el análisis longitudinal. abandonan el estudio por completo. El otro ocurre en estudios de panel de ondas
múltiples donde algunas personas pierden algunas ondas pero no se pierden
permanentemente en el panel. Esto se denomina falta de respuesta de onda (Rose et
Datos perdidos al., 1991).
Los datos faltantes son un problema para cualquier tipo de análisis, pero son
particularmente problemáticos en el análisis de panel. Hay dos tipos de datos
faltantes: falta de respuesta del ítem y falta de respuesta de la unidad.
148
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 149
El problema de la falta de respuesta del ítem puede agravarse con las oleadas. Esto
¿Por qué un problema? se puede ilustrar con un ejemplo extremo. Imagine un estudio de panel de cinco
oleadas en el que un individuo participó en cada oleada. Es posible que tengamos un
Los datos faltantes representan un problema por dos razones principales. conjunto de 10 preguntas que forman una escala de prejuicio administrada en cada ola.
Si una persona no pudo responder solo un elemento en una ola, es posible que no
TAMAÑO DE LA MUESTRA podamos construir una puntuación de escala para esa persona en esa ola. Tendríamos
La falta de respuesta a los ítems puede conducir a una pérdida sustancial del tamaño por tanto datos incompletos de esa persona lo que podría obligarnos a eliminar ese
caso del análisis. Debido a que falta un dato, sería necesario descartar una gran
de muestra disponible para el análisis de datos. Esto es especialmente un problema cantidad de datos sobre una persona en particular. El desgaste de esta extensión
cuando se construyen escalas o se realizan análisis multivariados en los que la falta puede conducir a una pérdida severa de casos y datos. A medida que un panel
de datos en cualquiera de un conjunto de variables conduce a la pérdida de ese caso madura, el problema creado por la falta de datos puede empeorar, ya que la posibilidad
para el análisis. Este problema puede agravarse rápidamente para producir una de que a un individuo le falten datos sobre una variable relevante en algún momento
pérdida inaceptable de casos. Por ejemplo, suponga que estamos realizando un aumenta a medida que aumenta el número de ondas.
análisis usando solo tres variables y que para cada una de las tres variables el 10 por
ciento de las personas no ha respondido la pregunta. Supongamos que para cada PARCIALIDAD
variable no hubiera respondido un 10 por ciento diferente de personas. Entonces Los datos faltantes también pueden introducir sesgos en la muestra. Cuando la falta de
tendríamos una pérdida del 30 por ciento de los casos. respuesta a los ítems es sistemática en lugar de aleatoria (es decir, ciertos tipos de
personas son más propensas que otras a negarse a responder preguntas), el resultado
pueden ser muestras no representativas. Por ejemplo, si las personas con mayores ingresos
son más propensas que las personas con ingresos más bajos a negarse a revelar sus ingresos,
nos quedamos con estimaciones de ingresos inexactas. En consecuencia, cualquier análisis en Identificar el sesgo de datos faltantes
el que el ingreso sea una variable se verá afectado por la pérdida de casos debido a elementos
no -respuesta. Al tratar el problema de la falta de respuesta a los ítems, podemos verificar si
La falta de respuesta de la unidad introducirá otros sesgos en la muestra. Es poco probable los que no responden son diferentes de los que responden simplemente
que las personas que abandonan un panel sean las mismas que permanecen. La pérdida de comparándolos en otras variables. Por ejemplo, podríamos verificar si los
miembros del panel puede deberse a muerte, movilidad geográfica, cambio de estado familiar o que no respondieron a una pregunta en particular eran diferentes de los que
algún otro tipo de cambio en las circunstancias de una persona. respondieron en términos de edad, ingresos, educación, sexo, etnia o sus
actitudes sobre temas particulares. También podemos verificar el sesgo
debido a la falta de respuesta de la unidad. Una de las ventajas de los
estudios de panel es que cuando una persona no responde en una ola en
particular o la abandona por completo, todavía sabemos mucho sobre esa
persona de oleadas anteriores. Podemos usar esta información para ver si
los que abandonan son diferentes de los que continúan. Si lo son, podemos
emplear varias estrategias durante el análisis de datos para hacer ajustes.
IMPUTACIÓN
LONGITUDINALES
Enfoque de medias grupales Una forma de superar este problema es usar medias Análisis de regresión Este es un método de imputación más complejo que
grupales en lugar de la media muestral general. Para hacer esto, dividiríamos la muestra involucra el uso de la regresión para predecir el valor de la persona en la
en grupos sobre la base de una variable de antecedentes (por ejemplo, sexo, edad y variable de valores perdidos. Sobre la base de todo un conjunto de
etnia) que se correlacione bien con la variable de valor faltante. Entonces obtendríamos características podemos estimar cómo, en promedio, una persona con esas
la media de la variable de datos faltantes para cada uno de estos subgrupos. Por características respondería a la pregunta sobre la que faltan datos. En este
ejemplo, si quisiéramos estimar los ingresos de las personas que se negaron a sentido, es comparable al enfoque de medias grupales. El problema con el
responder la pregunta de ingresos, podríamos dividir la muestra en grupos según su método es que, dado que la regresión se basa en una matriz de correlación en
nivel educativo y luego, dentro de cada nivel educativo, dividir la muestra en hombres y la que se usa el método de manejo de datos faltantes por pares (ver más abajo),
mujeres. Para cada el nivel de educación y el subgrupo de género, podríamos obtener el normalmente habrá alguna pérdida de casos.
nivel de ingresos medio para aquellos que respondieron la pregunta de ingresos. Imputación de oleadas anteriores Para algunas características estables,
Podríamos encontrar que el nivel de ingresos para las mujeres con educación terciaria podemos "acarrear" valores de una oleada anterior (Rose et al., 1991) o
es de $ 30,000 al año, mientras que los hombres con educación terciaria ganan, en verificar de oleadas posteriores. Sin embargo, para las variables que
promedio, $ 35,000 y así sucesivamente. Usando En el enfoque de los medios grupales, probablemente estén sujetas a cambios y para las variables numéricas en
simplemente sustituiríamos estos valores medios por los valores faltantes para las particular, puede ser incorrecto "transferir" las respuestas de una ola anterior.
personas de acuerdo con el grupo al que pertenecen. Con el tiempo, puede ser posible llenar algunos vacíos causados por la falta de
respuesta de la ola. observando la onda anterior y la onda subsiguiente e
La desventaja de este enfoque es que exagera el grado de homogeneidad dentro de
imputando un valor de punto medio para la onda faltante.
los grupos y, por lo tanto, puede sobrestimar la varianza entre grupos y para la muestra
en general. estimado. Ignorar los datos que faltan Este no es un enfoque de imputación, pero
proporciona una forma de gestionar los datos que faltan al construir escalas.
Asignación aleatoria dentro de grupos Este enfoque es similar al enfoque de medias de
Implica calcular puntuaciones de escala calculando la puntuación media de una
grupo en que se basa en dividir la muestra en grupos sobre la base de otras
persona para las variables para las que ha proporcionado respuestas.
características que probablemente se correlacionen con la variable de datos faltantes.
Supongamos que estamos construyendo una escala a partir de 10 preguntas,
Pero difiere en que no implica sustituir la media del grupo por ningún dato faltante. En
cada una con puntajes posibles que van de 0 a 4. Una persona que obtuvo un
cambio, cuando localizamos un caso con datos faltantes en una variable en particular,
puntaje de 2 en los 10 elementos lograría un puntaje total de 20 en los 10
buscaríamos el valor en la misma variable del caso anterior más cercano en ese grupo y
elementos y un puntaje promedio de 2. .Una persona que obtuvo una
le daríamos ese mismo valor al caso con el valor faltante. Esto significa que el valor
puntuación de 2 en cada uno de los ocho ítems pero no respondió los dos ítems
faltante los valores se reemplazan con una variedad de valores diferentes elegidos
restantes obtendría una puntuación total de 16 pero una media de 2. Calcular
aleatoriamente dentro de ese subgrupo de casos. Este enfoque no afecta la variabilidad
una puntuación de escala de esta manera evita el problema de falta de datos al
de la muestra o del grupo: no tiene efecto sobre la fuerza de las correlaciones y evita la
construir escamas.
pérdida de casos. A pesar de ser un poco más complejo de ejecutar, este es un método
muy deseable para manejar los datos faltantes. PONDERACIÓN
Promedio del lapso Un enfoque relacionado requiere que calculemos la media o la La ponderación es una forma de ajustar una muestra para permitir un posible
mediana (según corresponda) de los casos dentro de un lapso dado del caso con datos sesgo debido a la falta de respuesta de la unidad. La ponderación de una
faltantes y sustituyamos este valor por el valor de los datos faltantes. Este enfoque es muestra debe hacerla más representativa de la población para la que está
relativamente simple y evita deflactar la varianza. diseñada, de modo que se puedan hacer estimaciones confiables desde la
muestra hasta el final. población. Por ejemplo, imagine una situación en la que
el 50 por ciento de la población son hombres y el 50 por ciento son mujeres. Sin mujeres y 40 por ciento hombres. Dado que el género estará relacionado con
embargo, cuando se extrae una muestra de esta población se encuentra que, ya sea por muchas otras variables, este sesgo afectará las estimaciones de otras variables
falta de respuesta o por abandono,60 por ciento de los miembros de la muestra son de la muestra a la población.
152
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 153
Para hacer esto, controlamos estadísticamente las variables en las que sabemos o
Para ajustar el sesgo, necesitaríamos ponderar cada una de las mujeres para que cuenten creemos que puede haber un sesgo. Mediante el uso de controles estadísticos
por menos de una persona, mientras que cada hombre se ponderaría para que cuenten por (Capítulo 12) podemos observar las relaciones con el efecto de otras variables
más de una persona. De esta forma, sus proporciones en la muestra se ajustan para igualar eliminadas. Al eliminar los efectos de otras variables, podemos eliminar el efecto de
sus proporciones en la población. una variable donde el sesgo de la muestra es evidente.
Para lograr este fin ponderamos cada caso con un peso específico. La ponderación se
obtiene dividiendo el porcentaje de la población de una categoría por el porcentaje de la
muestra. En este caso, la relación de fórmula para hombres sería 50/40, lo que da un peso de
1,25. Para las mujeres la relación sería 50/60 lo que da un peso de 0,83 (de Vaus, 2001).
En oleadas posteriores, tendremos que hacer más ajustes de ponderación para tener en
cuenta los sesgos que pueden surgir debido a la deserción. Dada la cantidad de información
disponible desde la primera ola, tendremos una gran cantidad de información que se puede
utilizar para calcular los pesos. En estos casos, el peso se lograría dividiendo el porcentaje de
la onda 1 por el porcentaje de la onda 2 (o 3,4). Esto permitirá que las ondas posteriores a la
onda 1 sigan siendo representativas de la onda 1. Siempre que la onda 1 sea representativa
de la onda población, estas ponderaciones pueden ayudar a que cada oleada siga siendo
representativa de la población.
El análisis puede volverse bastante complejo cuando se analizan varias oleadas a la vez, ya
que es posible que cada oleada deba ponderarse de manera diferente. Estas estrategias de
ponderación dentro de las encuestas de panel se analizan en detalle en Kalton (1983a; 1986),
Lepkowski (1989), Lynn et al. (1994) y Buck et al. (1995).
El sesgo no solo afecta nuestra capacidad para hacer estimaciones confiables de una muestra
a la población, sino que también puede distorsionar los patrones de relaciones que
encontramos entre las variables dentro de una muestra. No siempre es posible volver a pesar
las muestras de forma fiable. Sin embargo, podemos asegurar que el patrón de relaciones que
encontramos entre las variables no se debe al efecto de la variable para la que tenemos
información sesgada.
Distinguir entre cambio agregado e individual es importante tanto a nivel teórico
como a nivel de diseño de investigación. Es fácil malinterpretar los bajos niveles de
Cambio de medición cambio agregado. Si interpretamos el bajo cambio agregado como la ausencia de
cambio individual, llegaremos a diferentes conclusiones sobre el fenómeno. Por
Cambio de nivel agregado versus cambio de nivel individual ejemplo, el porcentaje de personas que reciben asistencia social y las características
de dichas personas son bastante estables en el tiempo. Esto ha llevado a algunas
En estudios que se extienden en el tiempo podemos pensar en el cambio en dos niveles:
personas a creer que los beneficiarios de asistencia social son un grupo estable e
agregado e individual.
inmutable. En realidad, hay una gran rotación de quienes reciben asistencia social y
El cambio a nivel agregado también se conoce como cambio neto o cambio macro, mientras relativamente pocos dependen continuamente de la asistencia social a lo largo del
que el cambio a nivel individual también se conoce como cambio bruto o cambio micro. El tiempo (Hakim, 1986). La estabilidad a nivel agregado indicará algo sobre la
significado de las dos formas de pensar sobre el cambio se puede describir más fácilmente con naturaleza del macrosistema (es decir, hay algo sobre la estructura del sistema social
un ejemplo. En el ciclo 1 de un estudio sobre personas en la fuerza laboral remunerada, y económico que produce un nivel dado de personas en bienestar). Sin embargo, no
podríamos identificar el porcentaje de personas que trabajan a tiempo completo y el porcentaje nos dice sobre los individuos y la naturaleza de los cambios que experimentan.
que trabaja a tiempo parcial. En el ciclo 2 recopilamos la misma información y encontramos que
El tipo de diseño de investigación que adoptemos dependerá de si nuestro enfoque
exactamente los mismos porcentajes de personas trabajan a tiempo completo. tiempo y tiempo
está en el nivel de cambio agregado o individual. Una serie de encuestas
parcial como en la primera ola.
transversales repetidas es bastante apropiada para rastrear el cambio agregado. a
Si bien sería correcto concluir que a nivel agregado no ha habido cambios entre la ola 1 y la nivel de grupo necesitamos grupos comparables a lo largo del tiempo. Sin embargo, si
ola 2, no se sigue que ningún individuo haya cambiado su nivel de participación en la fuerza estamos interesados en el cambio a nivel individual, tenemos que usar un diseño de
laboral. Si el 20 por ciento de los trabajadores a tiempo completo hubiera cambiado a tiempo panel porque los mismos individuos están involucrados en cada ola.
parcial y el 20 por ciento de los trabajadores a tiempo parcial se han convertido en trabajadores
Los datos se analizarán de manera diferente dependiendo de si estamos
a tiempo completo, tendríamos un gran número de personas que, en efecto, habrían cambiado
examinando un cambio de nivel agregado o individual. Cuando se trata de un cambio
su nivel de participación en la fuerza laboral, pero a nivel agregado parecería que no hubo
de nivel agregado
cambio. los cambios en el nivel agregado de los individuos en una dirección pueden ser
anulados por cambios en la dirección opuesta.
154
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 155
regresión;ARIMA multivariado
categórico) Variables
ANOVA;variable ficticia
regresión
análisis probit;logística
regresión; peligro/supervivencia/
Una forma de eliminar el efecto del puntaje inicial es usar puntajes de cambio
residualizados o retrocedidos (Kerlinger, 1973: 337; Menard, 1991: 45). Estos
independientemente de las ondas que se comparen) y tratar la diferencia como un identifican casos en los que una persona ha cambiado más de lo esperado en base a su
reflejo del cambio. Sin embargo, existen varios problemas con este enfoque. puntaje inicial. Con este procedimiento, utilizamos el análisis de regresión para predecir
las puntuaciones de la onda 2 a partir de las puntuaciones de la onda 1 sobre la base de
La primera es que cualquier medida tendrá un grado de error. Al usar una medida la correlación entre las puntuaciones de la onda 1 y la onda 2. Luego restamos estos
dos veces (onda 1 y onda 2) y calcular un puntaje de cambio, la falta de confiabilidad puntajes predichos de la onda 2 de los puntajes reales de la onda 2. Lo que queda es el
de cada prueba se verá agravada en el puntaje de cambio. Se debe tener mucho puntaje de ganancia residual: la cantidad de ganancia que no se debe a la influencia de
cuidado al usar puntajes de cambio a menos que se sepa que la medida de la la puntuación inicial de la onda 1.
variable de resultado ser altamente confiable.
Cambio porcentual Otra forma de medir el cambio a nivel individual es calcular
Otro problema relacionado es que es más probable que las puntuaciones extremas cambien
el cambio porcentual en la puntuación inicial. Este enfoque solo es apropiado
debido a los fenómenos de regresión a la media y efectos de truncamiento (capítulos 5 y 6). Por
lo tanto, puede ser difícil saber hasta qué punto la puntuación de cambio refleja el cambio real y
para variables de escala de razón donde hay un cero no arbitrario (esto
cuánto refleja el error de medición. incluye la mayoría de las variables continuas en la investigación en ciencias
sociales). Aquí restamos el puntaje de la ola 1 de la ola 2
medición. El logro de patrones consistentes cuando se emplean diferentes medidas
sugiere que el patrón no depende de las medidas particulares y no es simplemente un
puntuación y divide la respuesta por la puntuación de la onda 1. Para convertirlo en artefacto de medidas poco fiables.
un cambio porcentual, multiplicaríamos la respuesta por 100.
¿Cuánto es el cambio? Dado que siempre habrá algún grado de error de medición, ¿
Por ejemplo, la puntuación del ciclo 1 de una persona podría ser 30 y la cómo se define el cambio? El problema de especificar cuánto cambio medido tiene que
puntuación del ciclo 2 40. Entonces: ocurrir antes de que estemos preparados para tratarlo como un cambio real es una
dificultad independientemente de si se utilizan puntajes de cambio brutos, puntajes de
ola 2 cambio residualizados o cambio porcentual. Si, por ejemplo, en una escala de 0 -20 una
persona cambia en 0,5 puntos, o si una persona cambia en un 1 por ciento, ¿tratamos
esto como un cambio, o es probable que este grado de cambio se deba a un error de
medición? ¿Deberíamos emplear un punto de corte mínimo y solo definir el cambio de
La puntuación de la fase 2 representa un aumento del 33 % con respecto a la puntuación de la más de un cierto nivel predefinido como constituyente del cambio?
fase 1.
No hay una respuesta simple o clara a estas preguntas. La regla básica debería ser
Distinguir entre cambio real y falta de confiabilidad Todas estas formas de medir el cambio que cuanto más fiables sean las medidas, más podremos tratar los pequeños cambios
tienen un problema común: todas se basan en poseer medidas confiables de las variables como cambios reales. Dado que muchas variables en las ciencias sociales son
dependientes. Cumplir con esta condición puede ser especialmente problemático cuando se propensas a errores de medición, debemos ser cautelosos en lo que definimos como
usan variables dependientes numéricas. cambio.
Un enfoque que se puede usar para ayudar a distinguir entre el cambio real y el 'cambio' ESTANDARIZACIÓN Y ESCALADO
producido por instrumentos poco confiables es replicar el análisis usando diferentes medidas.
Ajuste por 'inflación' Algunas medidas (por ejemplo, el ingreso) deben ajustarse con el
Si persisten los mismos patrones cuando se utilizan varias medidas diferentes del concepto
tiempo antes de que podamos medir el cambio. En algunos casos el real
subyacente, es menos probable que el cambio medido se deba principalmente a un error de
158
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 159
2000 1000 2 1000 Estandarización: puntajes z y rango percentil Otra forma de ajustar los puntajes es
expresar todos los puntajes en términos de dónde se encuentran en una distribución.
Es decir, podemos estandarizar puntajes y, en lugar de observar cambios en valores
absolutos, observamos cambios en el puntaje de una persona en relación con otras
personas (ver Marsh, 1988 para una discusión accesible de una variedad de métodos
el instrumento puede cambiar (por ejemplo, es posible que sea necesario cambiar las preguntas de estandarización). en los cambios en el lugar donde se encuentra una persona en
para que coincidan con la edad o la etapa de vida de los encuestados). Para otras variables, una distribución. Al observar el cambio, en términos relativos en lugar de absolutos,
como el ingreso, donde el significado de las categorías cambia (por ejemplo, el ingreso debe solo consideraríamos que una persona cambió si cambió su posición en relación con
ajustarse por inflación), la variable en sí debe reescalarse para que las medidas sean los demás, es decir, se movió más (o menos) que otras personas. Para expresar el
comparables a lo largo del tiempo. cambio en una variable dependiente de nivel de intervalo en términos relativos,
podemos expresar la puntuación de cada persona en la onda 1 y la onda 2 como una
Por ejemplo, podemos estar observando los cambios en los ingresos entre hombres y
puntuación z. Con una variable dependiente ordinal, podemos usar el rango percentil
mujeres entre 1990 y 2000. Antes de que podamos hacer comparaciones significativas entre los
de una persona. Luego mediríamos el cambio observando los cambios en las
niveles de ingresos en 1990 y 2000, necesitamos saber cuánto vale la misma cantidad de
puntuaciones z o el rango percentil.
dólares a lo largo del tiempo, después de ajustar por inflación. Debido a la inflación $1000 en
1990 no es el equivalente de $1000 en el año 2000. En la Tabla 9.3 el ingreso se ha ajustado Por ejemplo, si estuviéramos observando los cambios en los ingresos a lo largo del
por la tasa de inflación. El ingreso en cada año se ha expresado en dólares de 1990. Así, tiempo, podríamos convertir los ingresos de cada persona en un puntaje z que nos
después de los ajustes por inflación, $1000 en 2000 es el equivalente de sólo $579 en dólares informaría sobre los ingresos de esa persona en relación con los ingresos de otras
de 1990 después de la inflación. En el segundo ejemplo, se han hecho los cálculos opuestos personas. Si tuviéramos estos puntajes z para las mismas personas durante dos
con el valor de $1000 en cada año siendo ondas pudimos identificar aquellos cuyo puntaje z aumentó y aquellos para quienes
disminuyó. También pudimos cuantificar cuánto cambió la posición relativa de
ingresos de la persona (Tabla 9.4). Alternativamente, podríamos calcular su rango
percentil en las apuestas de ingresos y ver cómo cambiaron con el tiempo en el rango.
Este método de medir el cambio en términos relativos es valioso cuando necesitamos
ajustar los cambios en la forma en que se mide la variable dependiente a lo largo del
tiempo. Sin embargo, es un método que se puede usar incluso cuando no
necesitamos ajustar el forma en que se mide la variable.
Dado que el puntaje z indica el número de desviaciones estándar que una persona
se encuentra por encima o por debajo de la media de la muestra, podemos comparar
de manera útil los cambios en su posición a lo largo del tiempo. En la tabla 9.4, el caso
1 permanece por debajo de la media de la muestra en el ciclo 2, pero se ha acercado.
El caso 2 se ha deteriorado en relación con los demás en 0,4 de desviación estándar.
El caso 7 ha mejorado considerablemente su posición relativa. Mediante el uso de
puntajes z, ajustamos automáticamente las diferencias en el ingreso real debido a la
inflación y el aumento general en el ingreso medio. Este enfoque nos permite
centrarnos en los cambios en el desempeño de las personas en relación con los
demás.
6 $28,000 2 $33,000 2
2 (masculino) $40,000 0.04 $41,000 -0.48 -0.52 También podemos usar puntajes z (o rango percentil) para ver si algunos grupos
3 (femenino) $20,000 -1.64 $32,000 -1.16 0.48 cambian más que otros. Por ejemplo, si examináramos si la brecha de ingresos entre
hombres y mujeres se había reducido entre 1990 y 2000, podríamos obtener las
4 (masculino) $60,000 1.72 $65,000 1.35 -0.37 puntuaciones z de todos los hombres y todas las mujeres en el ciclo 1 (de una
5 (femenino) $37,000 -0.21 $40,000 -0.56 -0.35
muestra conjunta de hombres y mujeres) y hacer mismo en el relevamiento 2. Al usar
el análisis de nivel agregado, podríamos ver si el puntaje z promedio de los hombres
6 (femenino) $28,000 -0.96 $33,000 -1.09 -0.13 en el relevamiento 2 ha cambiado más que el puntaje z promedio de las mujeres en el
relevamiento 2. En la Tabla 9.6, las mujeres, en promedio, han un ingreso de 0,75
7 (masculino) $45,000 0.46 $39,000 -0.63 -1.09
(1990) y 0,57 (2000) desviaciones estándar por debajo de la media, mientras que los
8 (masculino) $42,000 0.21 $69,000 1,65 1.44 hombres, en promedio, tienen un ingreso de 0,75 (1990) y 0,57 (2000) desviaciones
estándar por encima de la media. se ha reducido ligeramente entre 1990 y 2000.
9 (femenino) $33,000 -0.55 $49,000 0.13 0,68
10 (masculino) $55,000 1.30 $60,000 0.97 -0.33 Otro enfoque para ajustar por 'inflación' u otro cambio en el tiempo es cambiar los
valores en proporciones (Cuadro 9.7). Las cifras absolutas podrían indicar una
Significar $39,500 $47,300 ampliación de la brecha de ingresos entre hombres y mujeres.
1 $35,000 4 $45,000 6
2 $40,000 6 $41,000 5
3 $20,000 1 $32,000 1
4 $60,000 10 $65,000 9
5 $37,000 5 $40,000 4
perceptores de ingresos del 25 por ciento superior ganaban 7,7 veces más que el
perceptor medio de ingresos del 25 por ciento inferior.
Tabla 9.6 Puntuación z media para hombres y mujeres,
EXPLICACIÓN DEL CAMBIO
1990-2000
Suponiendo que se hayan abordado los problemas de cómo medir el cambio y que
1990 2000 Cambio estemos razonablemente seguros de que se está midiendo el cambio real,
probablemente también querremos explicar el cambio.
machos 0.75 0.57 -0.18
Las teorías y proposiciones en torno a las cuales se diseña la investigación
Hembras -0.75 -0.57 +0.18
proporcionarán orientación sobre cómo probar las explicaciones.
Por ejemplo, la brecha de ingreso promedio en el ingreso semanal entre hombres y mujeres
podría haber sido de $25 en 1970. En 2000, esto podría haber aumentado a $150 por
semana. Sin embargo, los dólares de 1970 no son comparables con los de 2000. Podríamos
usar cualquiera de los enfoques anteriores para hacer los ajustes necesarios para facilitar la
comparación. Alternativamente, podríamos expresar los ingresos de las mujeres como una
proporción de los ingresos de los hombres en cada año. De esta forma eliminamos
automáticamente el efecto de la inflación. Así, aunque la brecha en dólares entre los ingresos
promedio de hombres y mujeres está aumentando en la Tabla 9.7, la posición relativa de las
mujeres está mejorando.
Sin embargo, el problema de cualquier explicación es que no podemos estar seguros de qué
factores han producido el cambio. Debido a que carecemos del nivel de control de un diseño
experimental, cualquier cambio podría deberse a factores desconocidos que ocurrieron entre
las olas.
El problema, sin embargo, es que no sabemos que los cambios en la situación laboral son
los únicos cambios que están experimentando estas personas. Tampoco sabemos que los
cuatro grupos sean comparables en otros aspectos (p. ej., género, edad y educación). En los
diseños experimentales, este problema se maneja mediante la asignación aleatoria a grupos.
Por lo general, en los diseños de paneles esto no es posible.
Mesas
El cambio a lo largo del tiempo se puede presentar de manera efectiva en forma
tabular. La forma particular dependerá de la cantidad de puntos de tiempo en los
que se realiza un seguimiento del cambio y si el cambio se considera a nivel
agregado o individual.
gráficos
Los gráficos son una buena manera de representar el cambio. El tipo de gráfico más
común para mostrar el cambio es el gráfico de tendencia. Esta sección
proporcionará una breve introducción a los gráficos de tendencia. En Henry (1995)
se puede encontrar una discusión más completa de estos gráficos y otras formas de
mostrar el cambio gráficamente.
El gráfico de tendencia simple tendrá dos ejes: el eje X en la parte inferior y el eje
Y en el costado. El eje X representará el tiempo, mientras que el eje Y reflejará una
cantidad en la variable que se está examinando para ver si cambia. . La figura 9.1
ilustra un gráfico de tendencia simple.
Año
Cuadro 9.9 Ejemplos de formas tabulares de presentar datos sobre cambios
agregados 1998-9 2000-1 2002-3
Año
% mejorado (de
Significar 5 10 15
%estable 85% 80% 78%
Diferencia 80 80 80 10% 5%
%rechazado 20%
Mejora media
La figura 9.2 muestra las diferentes tendencias en los niveles de empleo para
del periodo anterior
hombres y mujeres de 55 a 59 años durante los años 1975 a 2010 y las compara con
Velocidad 12 por 1000 12,8 por 1000 13,6 por 1000 las tendencias generales para el grupo de edad. Al informar las tendencias por
separado para los diferentes subgrupos (hombres y mujeres), podemos obtener una
Brechas (por ejemplo, imagen más detallada que la que proporciona la línea de tendencia para el grupo de
$10,000 $7,500 $5,000
entre
edad en su conjunto.
hombre y mujer La forma en que se escalan el eje X y el eje Y puede distorsionar la tendencia de
los datos. Cada gráfico de la Figura 9.3 tiene la misma información que la Figura 9.2,
ingreso promedio) pero estirar o contraer las escalas proporciona una impresión muy diferente de la
tendencia en los niveles de empleo de hombres y mujeres mayores. En la Figura
Proporción (por ejemplo, 9.3a, los cambios en los niveles de empleo parecen modestos porque la X -el eje se
0.80 0.82 0.84
mujer ha estirado y el eje Y se ha contraído. Esto tiene el efecto de aplanar la línea de
tendencia. En la Figura 9.3b el X-
ingreso promedio como
proporción de hombres
promedio)
Figura 9.3 Tasa de empleo de personas de 55 a 59 años por sexo, Australia, 1975-2010 Las tendencias de múltiples variables se pueden trazar en el mismo gráfico, como
(real y prevista): (a) escala plana, (b) escala ampliada (de Vaus y Wolcott, 1997) se ilustra en la Figura 9.4. La figura grafica dos variables: tasa de suicidio y tasa de
desempleo de los jóvenes. En esta figura, la línea de tendencia para el suicidio de
personas de 20 a 24 años se ha trazado junto con las tasas de desempleo para los
mismos grupos de edad. Trazar líneas de tendencia de diferentes variables en el
mismo gráfico puede resaltar la forma en que las tendencias en diferentes variables co
-variar. Sin embargo, se debe tener cuidado de no asumir que esta covariación de
tendencias demuestra una relación causal.
En la figura 9.4, cada una de las variables se mide en la misma escala, por lo que
cada variable se puede trazar en el mismo eje Y. A veces es posible que deseemos
comparar tendencias en dos variables diferentes, cada una de las cuales se mide en
diferentes unidades de medida. En tal caso, podemos usar dos ejes Y, cada uno con
una escala de medición diferente. En la Figura 9.5, el eje Y de la izquierda (eje Y
primario) es la tasa de delitos graves por cada 500 000 habitantes, mientras que el eje Y (nacimientos de madres solteras). ). Otra vez,
de la derecha (eje Y secundario) representa el porcentaje de nacimientos exnupciales
168
DISEÑOS LONGITUDINALES ANÁLISIS DE DATOS EN DISEÑO LONGITUDINAL 169
Figura 9.5 Nacimientos exnupciales y tasa de delitos graves, Australia, 1903-1993 (Sullivan et
al., 1997)
Cuando un estudio longitudinal proporciona datos para solo dos puntos de tiempo
en lugar de datos de tendencias a largo plazo, normalmente será más apropiado
usar gráficos de barras para representar los dos puntos de tiempo (Figura 9.6). Para
tener simplemente dos puntos de tiempo y unirlos con un línea para formar un
gráfico de tendencia podría ser muy engañoso ya que esto podría ocultar las
variaciones en los años intermedios (ver Figura 9.1 para estas variaciones).
Resumen
Nota
1 También puede ocurrir en diseños experimentales, pero se puede evitar
adoptando un diseño aleatorio sin una medida previa a la prueba.
Figura 9.6 Tasa bruta de divorcios, Australia, 1970 y 1995 (de Vaus y Wolcott, 1997)
felicidad felicidad
(Y)
Esencialmente, la diferencia entre los dos diseños es que el diseño de panel nos
permite comparar grupos en términos de diferentes cantidades de cambio en la
variable dependiente, mientras que el diseño transversal implica comparar los grupos
simplemente en términos de diferencia en la variable dependiente.
Los diseños transversales pueden ser ideales para el análisis descriptivo. Si simplemente
queremos describir las características de una población, sus actitudes, su intención de voto o
sus patrones de compra, la encuesta transversal es la forma más satisfactoria de obtener esta
información descriptiva. Pero los diseños transversales no se limitan a análisis descriptivo.
el (Blalock, 1964). En el Capítulo 10 introduje un ejemplo del efecto del
estado de paternidad (no tener hijos; el hijo mayor menor de un año y el hijo
Sin embargo, la mayoría de estas amenazas (historia, maduración, deterioro del mayor entre 1 y 5 años) y la felicidad conyugal. Incluso si los tres grupos
instrumento, regresión estadística, mortalidad y efectos de las pruebas) surgen debido al diferían en términos de felicidad conyugal, tendríamos dificultades para
elemento de tiempo extra de estos diseños. No son problemas con los diseños transversales. determinar si esta diferencia se debió a su diferente estado de paternidad.
Las principales amenazas a la validez interna de los diseños transversales provienen de dos
Es probable que los tres grupos difieran en otras formas además de su
fuentes: problemas para establecer la causa sin una dimensión temporal; y problemas en el
nivel de significado (Marsh, 1982). Los problemas en el nivel de causa son, por supuesto, un
estado de paternidad: cuánto tiempo han estado juntos, su perfil de edad,
problema con cualquier diseño, pero los diseños transversales son particularmente propensos nivel de participación de la fuerza laboral, etc. Estas diferencias, más que el
a problemas en este nivel. Los problemas en el nivel de significado son también comunes a estado de paternidad, podrían explicar las diferencias en la felicidad marital.
todos los diseños y surgen con igual fuerza para diseños experimentales, longitudinales y
CONTROLES ESTADÍSTICOS
transversales.
Marsh (1982) ha escrito con claridad y contundencia sobre estos dos problemas. Este problema de las variables de confusión se aborda en los diseños
Ella está en desacuerdo con aquellos que descartan los diseños de encuestas transversales en la etapa de análisis de datos en lugar de en la etapa de
transversales debido a sus supuestos problemas de causalidad y significado. Ella recopilación de datos como ocurre en los diseños experimentales. La
argumenta que este diseño no es tan defectuoso como se presenta con frecuencia. solución se logra haciendo que los grupos sean lo más similares posible
La siguiente discusión se basa en el argumento de Marsh. mediante la eliminación estadística de las diferencias entre los grupos
después de que se hayan recopilado los datos. equal necesitamos eliminar
ESTABLECIMIENTO DE CAUSALIDAD Y CONTROL DE CONFUSIÓN tantas diferencias como sea posible y comparar iguales con iguales.
VARIABLES En el Capítulo 12 se discutirá un esquema de cómo se hace esto. Sin
embargo, la lógica básica puede introducirse ahora. Para el ejemplo de los
No se puede negar que los estudios transversales enfrentan problemas para
niños y la felicidad marital, compararíamos la felicidad marital de
identificar variables causales. Aunque dos variables ordenadas en el tiempo pueden
estar correlacionadas o los grupos pueden diferir en una variable de resultado, no
podemos estar seguros de que estas diferencias se deban a un vínculo causal entre
DISEÑOS TRANSVERSALES
PROBLEMAS EN EL DISEÑO 179
TRANSVERSAL
En lugar de rechazar los diseños transversales por ser inútiles para el análisis causal, modelo 1
debemos proceder sistemática y cuidadosamente con el análisis y controlar
estadísticamente los factores que podrían explicar plausiblemente las correlaciones que
observamos. Además, debemos recordarnos constantemente la naturaleza tentativa de
cualquier conclusión que extraigamos en cualquier esfuerzo científico.
modelo 2
Aunque encontrar que dos variables están correlacionadas no establece la causa, sí
significa que es posible una explicación causal. como pantano
modelo 3
Figura 11.1 Tres modelos causales del rendimiento académico del niño
Los enfoques difieren en cuanto a quién creen que debe proporcionar el significado y cuánta y
qué tipo de evidencia se requiere antes de que uno pueda atribuir válidamente significado a la
acción. (1982: 101)
Ella identifica una serie de enfoques. La primera, y menos satisfactoria, es la que ella
llama 'sociología facesheet'. Consiste en correlacionar un conjunto de características
sociodemográficas (por ejemplo, sexo, clase, edad, religión y etnia) con el fenómeno
que se quiere explicar. uno puede detectar correlaciones cuanto más hayamos
'explicado' la varianza en ese fenómeno. Sin embargo, este enfoque no proporciona
explicaciones sociológicamente significativas. Encontrar que el género está
correlacionado con la religiosidad no es entender por qué el género está relacionado
con la religiosidad. Necesitamos entender qué tiene el género y la religión que explica
por qué las mujeres son más religiosas que los hombres. Por lo general, como señala
Marsh, este enfoque para proporcionar significado proviene de fuera de los datos
donde, de manera ad hoc, el investigador proporciona la explicación a partir de su
reserva de ideas sociológicas plausibles. Si bien estas explicaciones pueden ser
consistentes con los datos, rara vez son convincentes ya que se pueden desarrollar
muchas 'explicaciones' que son igualmente consistentes con los datos. Un segundo
enfoque consiste en pedir a las personas que proporcionen el significado.
Un enfoque final para incluir una dimensión significativa en las explicaciones es que
el investigador suministre los significados (1982: 111). Habrá muchas situaciones en
su comportamiento. La evidencia experimental muestra que en ciertas situaciones las que simplemente no podamos preguntar de manera confiable a las personas por
experimentales podemos demostrar empíricamente qué factor causal condujo a un sus razones. A menudo, solo podemos identificar las razones observando a varias
comportamiento dado, pero los individuos mismos desconocen cuál es este factor. personas en situaciones similares y leyendo los puntos en común entre los casos. El
Esta objeción tiene algún mérito para algunos comportamientos en algunas actor individual normalmente no tendrá acceso a los conocimientos adicionales
situaciones, pero no significa que los individuos, en muchas situaciones, no puedan disponibles para el investigador que puede observar a partir de una variedad de
casos.
proporcionar al menos algunas razones por las que se han comportado como lo
hicieron. Decir que no tienen acceso a la gama completa de factores que afectaron El estudio de Durkheim (1970) sobre el suicidio proporciona un ejemplo. Al estudiar
sus acciones no significa que no comprendan su comportamiento. Si le las regularidades estadísticas, identificó los grupos sociales que eran más
preguntáramos a una madre con niños pequeños por qué quería trabajar a tiempo "suigénicos", los grupos con las tasas de suicidio más altas. Al preguntar qué tenían
parcial, sin duda podría identificar algunas de las razones detrás de su decisión. Que en común estos grupos suigénicos, trató de proporcionar las razones del suicidio. Lo
ella no sea consciente o no sea capaz de articular todas las influencias no invalida la hizo al proponer que en estos grupos las personas tenían más probabilidades de
importancia de aquellas que ha identificado. Una tercera objeción es que los experimentar anomia, el sentimiento de ausencia de normas y una sensación de no
individuos pueden ser conscientes de las razones de sus acciones pero, debido a que pertenecer. Hle argumenta que este sentimiento subjetivo es angustiante en la
medida en que las personas se suicidan. Durkheim proporciona este significado en
las razones pueden no ser tan nobles, los factores de deseabilidad social les
lugar de provenir de los datos. Es Durkheim quien argumenta, en lugar de demostrar
impedirán informar sobre estas razones. empíricamente, que los grupos suigénicos sufren más anomia. Sin embargo, intenta
dar sentido a las correlaciones empíricas proporcionando una explicación
Si bien estas objeciones tienen algún mérito, aún puede ser útil preguntar a las personas las
subjetivamente significativa de los vínculos entre la pertenencia a ciertas categorías
razones de su comportamiento. Marsh argumenta que "los actores... tienen un acceso
sociales y el suicidio.
privilegiado a su propia experiencia, pero no a todos los determinantes de su propio
comportamiento" (1982: 107). Sin embargo, dice Marsh, no debemos exagerar lo que
Marsh (1982) analiza extensamente un estudio de la base social de la
descubriremos y debemos tratar la explicaciones proporcionadas por las propias personas con
circunspección.
depresión realizado por Brown y Harris (1978) donde se creía que aquellos
184
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 185
Tiene sentido emplear una variedad de estrategias, ya que ningún enfoque está
que sufren de depresión no serán plenamente conscientes de todos los factores que exento de deficiencias.
contribuyen a su depresión. Brown y Harris adoptan un enfoque no muy diferente al Validez externa
utilizado por Durkheim en su estudio del suicidio, pero con una diferencia.
Recolectaron información sobre lo que pensaban que serían los factores REPRESENTATIVA
precipitantes sociales detrás de la depresión (acontecimientos de la vida que Las muestras representativas son necesarias si vamos a generalizar a partir de los
actuaron como agentes provocadores, como la familia). vivienda deficiente, factores resultados obtenidos en una muestra a la población más amplia que la muestra
pretende representar. La forma más segura de lograr muestras representativas es
estresantes laborales, gravedad de los factores estresantes, acceso a redes de emplear métodos de muestreo probabilístico. Estos son métodos en los que cada
apoyo). Recopilaron información sobre estos factores porque pensaron que ayudaría persona de la población a la que queremos generalizar tiene una probabilidad igual o
a dar sentido, a nivel subjetivo, a por qué algunas personas estaban deprimidas y por conocida de ser seleccionada en la muestra.
qué otras no. planeando con anticipación y anticipando las posibles razones que
Los diseños transversales pueden tener más éxito que otros diseños para lograr la
podrían estar detrás de la depresión, pudieron desarrollar un relato de la depresión representatividad.
que trató de incorporar las experiencias de los actores. No es una forma infalible de
aprovechar el aspecto subjetivamente significativo del comportamiento, pero Los experimentos encuentran problemas con la representatividad por dos razones
demuestra un intento en un diseño de encuesta transversal para incluir esta forma de principales. A menudo piden más a las personas que los estudios transversales
únicos. También implican intervenciones activas y, por lo tanto, tienen que depender
explicación.
de voluntarios y muestras disponibles. En consecuencia, carecen de
representatividad. Incluso cuando se obtienen inicialmente muestras representativas,
En resumen, no hay nada inherente en los diseños transversales que impida intentar acceder
a las dimensiones significativas del comportamiento humano y convertirlas en explicaciones. esto se puede perder a medida que las personas abandonan el experimento.
Un problema similar de deserción puede comprometer los estudios de panel. Cuantas más
ondas tenga un estudio de panel, mayor será la deserción acumulada. En la medida en que
esta deserción introduzca sesgos importantes en la muestra, la representatividad puede verse datos que reflejan la población que fueron diseñados para representar. Por esta
socavada progresivamente. razón, las encuestas transversales se han convertido en el diseño de elección para
los estudios donde se requiere una descripción precisa (por ejemplo, encuestas
Dado que los diseños transversales no tienen una dimensión temporal, evitan el problema del políticas, encuestas de gastos de los hogares). son fuertes en la descripción.
sesgo introducido por el desgaste de la muestra. Siempre que la muestra inicial esté bien
seleccionada, la encuesta transversal debería producir
Cuestiones prácticas
Muchos de los temas prácticos discutidos en esta sección no son exclusivos de los
diseños transversales, pero son temas importantes para todas las investigaciones,
independientemente del diseño.
Los datos en una matriz variable por caso se pueden recolectar utilizando cualquier
método: cuestionarios, entrevistas cara a cara, observaciones, registros de archivo,
entrevistas telefónicas, etc. No hay ninguna razón por la que no se pueda utilizar una
combinación de métodos para completar la matriz. Sin embargo, es importante que se
utilice la misma combinación de métodos para cada caso. Por ejemplo, debemos
evitar recopilar información sobre los ingresos de algunas personas utilizando un
cuestionario anónimo de autocompletado mientras confiamos en una entrevista cara
a cara para otras personas y confiando en registros personales para otros, o
declaraciones de impuestos para un conjunto adicional. de la gente. Dado que el
método por el cual se recopilan los datos puede influir en la forma en que las personas
responden las preguntas, al menos debemos garantizar la coherencia.
186
DISEÑOS TRANSVERSALES
Variables
La elección de cualquier método de recopilación de datos en particular
dependerá de muchos factores. Estos incluyen el tamaño de la muestra, el grado
Sexo Clase Ingreso Años Actitud Actitud Votar en que están agrupados en un solo lugar o muy dispersos, el tiempo y los
a A
recursos disponibles, el grado de sensibilidad del material siendo col-lected, y la
a B
complejidad del material.
Case
1 Masculino Medio $ 45K 44 Aceptar No Conservador Si bien se puede usar una variedad de métodos para recopilar información
para formar un conjunto de datos estructurados, los cuestionarios estructurados
opinión siguen siendo el método más utilizado. Los cuestionarios estructurados se
pueden administrar de varias maneras diferentes, la más común de las cuales
2 Femenino Laboral $ 25K 56 Discrepar Discrepar No- son: (1) cara a cara por entrevistadores capacitados, (2) por teléfono con
entrevistadores capacitados, (3) autoadministrado por el encuestado donde
Conservador
normalmente se recibe el cuestionario y se devuelve por correo.
3 Femenino Superior $ 70K 34 Fuertemente Fuertemente Conservador Cada método de administración de cuestionarios tiene sus defensores y
detractores y los métodos tienen sus puntos fuertes y débiles (Dillman, 1978;
medio aceptar aceptar Rogers, 1976; Groves, 1979; Groves y Kahn, 1979). estas fortalezas y
debilidades relativas y cómo podrían aplicarse a la encuesta particular en la que
4 Masculino Laboral $ 34K 45 No No No- está involucrado. Estas fortalezas y debilidades se pueden agrupar en cinco
categorías amplias. La Tabla 11.1 proporciona una evaluación resumida de
opinión opinión Conservador cómo cada uno de los tres métodos de administración califica en cada uno de los
criterios. Una discusión más completa está disponible en Dillman (1978) y de
5 Masculino Medio $ 52K 33 Fuertemente Discrepar Conservador Vaus (1996).
discrepar
Tamaños de muestra
El tamaño de la muestra depende de los fondos, el tiempo, el acceso a los
6 Femenino Más bajo $ 40K 60 Aceptar Fuertemente -UON
participantes potenciales, los métodos de análisis planificados y el grado de
medio aceptar Conservador precisión y exactitud requerido. beneficios más marginales.
ANÁLISIS DE SUBGRUPOS
7 Femenino Medio $ 55K 41 Aceptar Aceptar No-
Cuanto mayor sea el tamaño de la muestra, más se puede subdividir para que se
Conservador puedan hacer comparaciones de subgrupos significativas. Si, en una encuesta
general de hogares, quisiéramos comparar el bienestar de los niños en hogares
8 Masculino Superior $ 250K 32 Discrepar Fuertemente Conservador de pareja con el de los niños en hogares monoparentales , tendríamos que
asegurarnos de que la muestra sea lo suficientemente grande como para
aceptar producir un número suficiente de hogares monoparentales. Si quisiéramos
comparar los hogares monoparentales encabezados por el padre y los
9 Masculino Laboral $ 25K 64 Fuertemente Aceptar No- encabezados por la madre, necesitaríamos reclutar una muestra inicial muy
grande simplemente para encontrar suficientes hogares monoparentales
aceptar Conservador encabezados por el padre.
Cuadro 11.1 Ventajas y desventajas de los tres métodos de administración del cuestionario Tasas de respuesta
190
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO 191
TRANSVERSAL
Los cuestionarios estructurados son una de las formas más sencillas de obtener un
conjunto de datos estructurados. Sin embargo, podríamos usar técnicas de
recopilación de datos menos estructurados y, a partir de esto, construir un conjunto de
datos estructurados. Usando entrevistas en profundidad, por ejemplo, podríamos
identificar a partir de las entrevistas un conjunto de variables de interés para nosotros.
Para cada una de estas variables construiríamos un conjunto de categorías y luego
clasificaríamos cada caso. Por ejemplo, realicé una serie de entrevistas en
profundidad con adultos que examinaron la naturaleza de las relaciones con su familia
más amplia. Como parte de la entrevista hablamos sobre las relaciones con los
padres. Después de completar las entrevistas, construí un conjunto de variables,
algunas de las cuales se referían a las relaciones entre adultos y padres. A partir de
mis entrevistas, identifiqué lo que pensé que eran varios tipos diferentes de
relaciones. Usé una variedad de piezas de información para identificar el tipo de
relación que pensé que se aplicaba en un caso particular. Luego clasifiqué cada caso
sobre la base de un conjunto completo de pistas dispersas a lo largo de la entrevista.
Repetí el mismo proceso para muchos otros aspectos de la entrevista (p. ej., relación
con los hermanos, naturaleza del matrimonio, grado de participación en la comunidad
local, centralidad del trabajo en la vida). En otras palabras, pude usar una variedad de información cualitativa para producir variables y clasificar
192
DISEÑOS TRANSVERSALES PROBLEMAS EN EL DISEÑO TRANSVERSAL 193
Cuestiones éticas
Al igual que con cualquier diseño de investigación, el investigador que utilice un diseño
transversal deberá prestar atención a cuestiones de confidencialidad, privacidad, prevención
de daños a los participantes y consentimiento informado.
En algunos aspectos, los diseños transversales pueden minimizar algunos de los problemas
éticos que pueden surgir con los diseños experimentales y longitudinales. Dado que no se
requiere un seguimiento de los participantes, es mucho más fácil garantizar el anonimato. No
es necesario mantener listas de nombres o hacer coincidir los nombres con las respuestas.
Además, dado que la recopilación de datos es 'única', los estudios transversales pueden ser
menos intrusivos y, en este sentido, pueden ser menos una imposición para la privacidad de
una persona.
Para protegerse contra este problema, los datos de las encuestas y las recopilaciones del
censo se 'anonimizarán' antes de que se entreguen a otras personas para su posterior análisis.
Esto se logra de varias maneras. Una forma es omitir cierta información clave, como cualquier
identificador geográfico, de cualquier divulgación pública de los datos. Otra forma es reducir la
precisión de los datos colapsando categorías. Por ejemplo, en lugar de proporcionar datos con
edades o fechas de nacimiento específicas, solo se publicarán grupos de edad (por ejemplo,
grupos de edad de cinco años). Otra estrategia es omitir cualquier información de enlace entre
casos. Por ejemplo, cuando se recopila información de cada miembro de un hogar, los datos
publicados pueden hacer imposible identificar qué casos individuales pertenecen al mismo
hogar. Al controlar el detalle y la cantidad de información publicada públicamente de esta
La ausencia de grupos de control aleatorios significa que el análisis de datos de
diseños transversales se basa en una variación considerable de la muestra y en la
Debido a que los diseños transversales se basan en variaciones existentes en lugar de creación de grupos de comparación post hoc. Esto tiene implicaciones para el tamaño
introducir intervenciones, evitan muchas de las preocupaciones éticas potenciales sobre el de la muestra, el tipo de muestra y las estrategias prácticas de implementación de
daño a los participantes que se produce como resultado de la intervención. También es una estudios transversales. El capítulo ha esbozado estas consideraciones prácticas y
ventaja que evitan la asignación aleatoria a grupos experimentales y de control. La asignación éticas.
aleatoria puede dar lugar a serios problemas éticos (ver Capítulo 6).
notas
Resumen
1 Esto debe matizarse en la medida en que las variables supresoras pueden
Dado que los diseños transversales carecen de una dimensión temporal y de grupos de control enmascarar una relación causal. Estrictamente hablando, necesitaríamos poder
aleatorios, se encuentran con posibles deficiencias para el análisis causal. Estas deficiencias eliminar la influencia de todas las variables supresoras antes de que pudiéramos estar
representan amenazas a la validez interna de los estudios transversales. Este capítulo ha seguros de que la ausencia de una correlación entre dos variables realmente refleja la
esbozado estas deficiencias e identificado algunas formas de minimizar su impacto. Si bien los ausencia de una relación causal. Para una discusión más completa de las variables
diseños transversales presentan algunas debilidades peculiares en relación con la validez supresoras, ver Rosenberg (1968). : Capítulo 4).
interna, se ha señalado que también tienen algunas fortalezas particulares. Debido a que no
tienen una dimensión temporal, no sufren muchas de las otras amenazas a la validez interna 2 Estas estimaciones asumen que estamos tratando con variables donde hay una
que hemos encontrado con los diseños experimentales y longitudinales. Los diseños división 50/50. Los tamaños de muestra estimados serán diferentes en poblaciones
transversales son un diseño simple y rentable y, en consecuencia, a menudo pueden emplear más homogéneas.
muestras excelentes y evitar los problemas causados por el desgaste de la muestra. Como
tales, los diseños transversales pueden tener una fuerte validez externa.
ANÁLISIS TRANSVERSAL
12 Análisis descriptivo
¿Cuanto?
Contar es un aspecto básico del análisis descriptivo. El objetivo es establecer cuántas
personas tienen características particulares, tienen una opinión particular, se
comportan de una manera determinada, etc. Las encuestas de mercado descubrirán
a cuántas personas les gusta un producto en particular, una encuesta política contará
cuántas personas tienen la intención de votar por un partido o candidato específico,
un censo contará el número de personas en la población, mientras que una encuesta
de gastos domésticos describirá cuántas personas tienen patrones particulares de
gasto.
000-29 999, $30 000-39 999, $40 000-49 999, $50 000
Nivel de detalle -59,999,$60,000-69,999,$70,000-79,999,$80,000-89,999,$90,000-99,999,$1
00,000 y más.
Cuando describimos las distribuciones, debemos decidir cuánto detalle
proporcionar. Las variables continuas, como la edad (en años), los ingresos (en
dólares) y las horas trabajadas cada semana, pueden analizarse como variables
continuas o colapsarse en grupos. Alternativamente, la edad podría colapsarse en
categorías como menos de 20, 20-29, 30-39, 40-49, 50-59, 60-69, 70-79 y 80+; los
ingresos pueden colapsarse en grupos de ingresos (menos de $5000,
$5000-10,000, $10,001-15,000, $15,001-20,000) y analizarse en estos grupos.
Muchas variables ordinales pueden colapsarse en menos categorías. Por ejemplo,
los encuestados en una encuesta son se les preguntó qué tan de acuerdo o en
desacuerdo estaban con una declaración de actitud en particular (muy de acuerdo,
de acuerdo, no puedo decidir, en desacuerdo o muy en desacuerdo). Tendríamos
que tomar decisiones sobre si colapsar en las categorías 'de acuerdo', 'no puedo
decidir' y 'en desacuerdo' o, alternativamente, si solo estamos interesados en estar
de acuerdo, podríamos simplemente usar las categorías de 'de acuerdo' y 'otro'. Las
variables nominales, como el país de nacimiento, pueden tener una gran cantidad de
categorías, muchas de las cuales pueden combinarse con el propósito de una
presentación simple y clara. Podríamos agrupar países en regiones (por ejemplo,
Europa Occidental, Europa Central y Oriental, América del Norte ,Otra América,Asia
del Sur,Sudeste de Asia,Oceanía) o según niveles de desarrollo,o sean o no de
habla inglesa (Capítulo 6).
Hay dos formas generales en las que se colapsarán las categorías de una
variable.
SUSTANTIVAMENTE
Es posible que necesitemos convertir variables para que todas se midan sobre una
DISTRIBUCIONAL
base uniforme. Esto puede ser necesario cuando se analizan datos en encuestas
transversales repetidas donde el valor de, digamos, el ingreso debe ajustarse por
Con este enfoque, nos enfocamos en la distribución de una variable como base inflación. En estudios transnacionales, algunas variables, como el ingreso, pueden
para la recodificación y dejamos que la distribución, en lugar del significado necesitar convertirse a una moneda común (por ejemplo, dólares estadounidenses).
sustantivo de las categorías, determine cómo combinamos las categorías. Por Esto se discutió en el Capítulo 9.
ejemplo, en lugar de colapsar los ingresos de la manera descrita anteriormente,
Los datos también se pueden representar expresando puntajes individuales, no en
simplemente dos categorías: personas por debajo del ingreso medio y personas
términos de las unidades de la variable original (por ejemplo, años para la edad o
por encima del ingreso medio. Si el ingreso medio fuera de $35 000, entonces las dólares para el ingreso), sino en términos de cómo se compara el puntaje de un
dos categorías de ingresos estarían por debajo de $35 000 y por encima de $35 individuo (o grupo) con el valor típico de esa variable Esto podría hacerse por
000. O podríamos dividir la muestra en deciles: el 10 por ciento inferior de los
198
DISEÑOS TRANSVERSALES ANALI0 TRANSVERSAL
2 3 11
Cuadro 12.2 Ilustración de la división de una variable en tres grupos usando métodos de
recodificación sustantivos y distributivos
3 4 15
1/3 superior de 7 10 51
1 5 8
codigos 8 15 66
Otra forma de análisis descriptivo delinea qué conjuntos de variables 'van juntos'. El
análisis factorial se utiliza a menudo para buscar patrones en la forma
200
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 201
De manera similar, podríamos estar interesados en los tipos de cosas que la gente
busca en un trabajo. Podríamos preguntarnos sobre la importancia de las siguientes
cosas en un trabajo:
1 buena paga
3 teniendo responsabilidad
6 vacaciones generosas
7 buenas horas.
Podríamos analizar las respuestas para ver si existe una estructura o un patrón en la forma en
que las personas responden a cada una de estas características laborales. Podríamos
encontrar que hay una estructura: algunas personas tienden a enumerar las características
intrínsecas del trabajo (oportunidades para usar la iniciativa, responsabilidad y sentimientos de
lograr algo) mientras que otras enumeran las características extrínsecas (pago, vacaciones,
horas y sin presión).
Análisis explicativo
de la estadística inferencial se utilizan comúnmente en el análisis descriptivo: estimaciones de Al tratar de hacer afirmaciones sobre relaciones causales, los diseños transversales
intervalos y pruebas de significación. deben basarse en comparaciones estáticas entre grupos o en correlaciones entre
variables donde las mediciones se realizan en el mismo momento. Los problemas con
Las estimaciones de intervalo nos permiten estimar dentro de qué rango de las cifras de la esto ya se han discutido extensamente (Capítulos 3 y 11). La estrategia básica
muestra es probable que se encuentren las cifras de la población. Por ejemplo, en una muestra mediante la cual se manejan estos problemas es introduciendo controles estadísticos
podemos encontrar que el 60 por ciento dice que tiene la intención de votar por un partido en el análisis.
político en particular. Podemos usar estimaciones de intervalo para estimar dentro de qué rango
del 60 por ciento es probable que se encuentre la cifra de población. Usando una estadística La lógica de los controles estadísticos
llamada error estándar, podríamos decir, por ejemplo, que podemos tener un 95 por ciento de
confianza en que la cifra de la población real estará dentro de un cierto rango de la estimación La lógica de los controles estadísticos se comprende mejor dentro del
de la muestra del 60 por ciento (por ejemplo, ±2 por ciento). o dentro del rango de 58 por ciento contexto de la lógica de los diseños experimentales. El diseño experimental
a 62 por ciento). se basa en comparar el cambio a lo largo del tiempo en dos o más grupos,
que inicialmente eran idénticos en todos los aspectos relevantes. Diferentes
Otra forma de usar la estadística inferencial es usar pruebas de significancia. Estos se
utilizan con frecuencia junto con los coeficientes de correlación. Proporcionan una estimación grupos están expuestos a tratamientos experimentales y un grupo de control
de la probabilidad de que también se encuentre en la población una correlación al menos tan no está expuesto a ningún tratamiento. Después del tratamiento, cualquier
fuerte como la observada en la muestra. Por ejemplo, una correlación en una muestra podría diferencia entre los grupos en la variable de resultado se considera que se
reflejar una correlación real en la población o podría ser simplemente el resultado de un error de debe al efecto del tratamiento. Sin embargo, si los grupos fueran diferentes
muestreo. Las pruebas de significación proporcionan una estimación de la probabilidad de que
al principio, no sabríamos si hubo diferencias entre los grupos después del
la correlación de la muestra se deba simplemente a un error de muestreo. Si hubiera una
posibilidad razonable de que se deba a un error de muestreo, no nos sentiríamos seguros al tratamiento debido al tratamiento oa las diferencias iniciales.
predecir que la correlación de la muestra se encontraría en la población más amplia.
ANÁLISIS TRANSVERSAL
que debemos anticipar las variables relevantes en las que se deben emparejar
En los diseños transversales la lógica es comparar grupos que se forman a partir de las los grupos. Nuestra anticipación siempre será menos que perfecta.
diferencias existentes (la variable independiente). Luego comparamos los resultados (la
variable dependiente) en estos grupos. Cualquier diferencia puede interpretarse como Si estuviéramos examinando el impacto del género en los ingresos,
debida a la influencia de la pertenencia a diferentes grupos. Por lo tanto, las diferencias tendríamos que comparar a hombres y mujeres que trabajaron un número
en los ingresos (variable dependiente) de hombres y mujeres (variable independiente) similar de horas por semana. Sería inapropiado comparar un grupo de mujeres
pueden deberse al efecto del género en los ingresos. las diferencias pueden deberse no donde muchas trabajaban a tiempo parcial con un grupo de hombres que eran
al género per se, sino a otras diferencias entre los grupos. El grupo de hombres puede principalmente trabajadores a tiempo completo. Tiene más sentido comparar
ser mayor, estar mejor educado, incluir más trabajadores a tiempo completo, tener hombres que trabajaron a tiempo completo con mujeres que trabajaron a
ocupaciones diferentes a las del grupo de mujeres. Para determinar si las diferencias de tiempo completo y observar las diferencias de ingresos entre estos dos grupos.
ingresos entre hombres y mujeres se deben al género, necesitamos comparar hombres y Entonces podríamos comparar hombres y mujeres que trabajaron, digamos,
mujeres comparables. 25-35 horas a la semana, y luego aquellos que trabajan 15- 24 horas, y así
sucesivamente. Los analistas sensatos buscarán comparar cosas similares.
El diseño experimental normalmente logra la comparabilidad entre grupos mediante la
asignación aleatoria a los grupos. Los diseños transversales buscan lograr la Si las diferencias de ingresos persisten entre hombres y mujeres cuando
comparabilidad mediante el cotejo (Capítulo 3) pero, dado que se basan en las comparamos (controlamos) las horas de trabajo, entonces sabemos que las
diferencias existentes y todos los datos se recopilan en un solo momento, el cotejo se diferencias iniciales de ingresos no se deben a las diferentes horas de trabajo
realiza en la etapa de análisis de datos, después de que se recopilan los datos y no de hombres y mujeres.
antes. .
Aunque puede haber otros factores que puedan afectar las diferencias de
Este emparejamiento siempre será un medio limitado y menos adecuado que la ingresos entre hombres y mujeres, nuestro análisis al menos eliminará las horas
asignación aleatoria para lograr la comparabilidad del grupo. Solo podemos emparejar de trabajo como explicación de las diferencias de ingresos. Podríamos querer
en relación con las variables sobre las que se ha recopilado información. Esto significa comparar las diferencias de ingresos entre hombres y mujeres de ocupaciones
similares. Podríamos controlar por ocupación (emparejar) y comparar hombres
profesionales con mujeres profesionales, hombres oficinistas con mujeres oficinistas, y
así sucesivamente. Si hombres y mujeres en el mismo tipo de trabajo tienen ingresos Múltiples controles estadísticos
diferentes, entonces tendríamos que decir que las diferencias de ingresos entre hombres
y mujeres no se deben a los diferentes tipos de trabajos que tienen hombres y mujeres. El análisis más fuerte ocurre cuando es factible emparejar un conjunto completo
de variables simultáneamente. Cuantas más variables controlemos a la vez,
más similares serán los grupos que comparemos. Por ejemplo, podríamos
pensar que las diferencias de ingresos entre hombres y mujeres se deben a los
efectos acumulativos de las diferencias de género en las horas de trabajo, los
tipos de trabajos, la cantidad de experiencia laboral y los antecedentes
educativos. Trataríamos de eliminar todos estos factores de nuestras
comparaciones. de hombres y mujeres. Podríamos dividir nuestra muestra en
muchos grupos, de modo que un grupo podría ser de mujeres que trabajan a
tiempo completo en trabajos profesionales que tienen calificaciones terciarias y
tienen al menos 14 años de experiencia laboral. Estos podrían compararse con
un grupo comparable de hombres. Otro par de grupos podría ser similar al
anterior en todos los aspectos, excepto que los hombres y las mujeres tienen
trabajos comerciales. Se podrían comparar muchos otros pares de grupos. Al
controlar o eliminar las diferencias entre hombres y mujeres, podemos
responder la pregunta: '¿Cuándo Si todo lo demás es igual, ¿el género hace
alguna diferencia en los ingresos? Si, cuando todo lo demás es igual, los
hombres y las mujeres aún tienen ingresos diferentes, entonces tenemos
evidencia de discriminación de género. Esto significa que el género mismo es
responsable de las diferencias de ingresos. .Si cuando controlamos por un
conjunto de variables, las diferencias de ingresos por género desaparecen,
diríamos que las diferencias iniciales de ingresos se deben a las variables que
hemos controlado. Dicho de otra manera, diríamos que las variables
controladas explican las diferencias iniciales.
Por supuesto, no es posible controlar todas las variables posibles, por lo que
siempre existe la posibilidad de que cualquier diferencia de ingresos
relacionada con el género se deba a estas variables no controladas.
La técnica de elaboración
No hay espacio suficiente aquí para explorar todos los detalles de esta técnica.
Un excelente libro que describe completamente el método es el de Rosenberg,
The Logic of Survey Analysis (1968).
Enfoque básico
comparación de medias (Capítulo 6). La relación entre estas dos variables se llama Tabla 12.3 Tablas condicionales y de orden cero que indican la especificación
relación de orden cero.
2 Identifique una variable de control relevante (la tercera variable) Esta es la variable (a) Tabla de orden cero: relación de orden cero de género e ingreso
en la que está tratando de emparejar los grupos (según lo definido por las categorías
Todo género
de la variable independiente). A menudo se la denomina variable de prueba o variable
Z. Su selección de la tercera variable se basará en modelos teóricos y lo que espera Macho femenino
podría ser responsable de las relaciones de orden cero. Esto dependerá de si está
Low 40% 70%
proponiendo que la relación de orden cero es falsa (ver más abajo) o si está Income
proponiendo una relación causal indirecta (ver más abajo). 60% 30%
High
3 Dibuje un modelo de la relación que está proponiendo entre las tres variables
(vea la discusión a continuación). (b) Tablas condicionales: relación de género e ingresos controlando por ocupación
4 Llevar a cabo el análisis Esto puede ser en forma de tablas, y/o correlaciones, o
Macho femenino
comparación de medias. Esencialmente, el análisis implica observar la relación entre
las dos variables iniciales (X e Y) por separado para cada categoría de la variable de 50% 70%
Bajo
control (Z). Estas relaciones se denominan relaciones condicionales. 50% 30%
Ingreso
5 Interpretar los resultados A continuación se analizan formas de interpretar los
diferentes resultados. Alto
Género
De cuello blanco
Interpretación
Masculi Femenin
no o
Hay cuatro formas principales de pensar e interpretar los resultados del análisis de
Bajo 20% 20%
elaboración, como sigue.
Ingreso 80% 80%
ESPECIFICACIÓN
Alto
En este enfoque comenzamos con una relación de orden cero y luego especificamos azul y condición de cuello blanco). La relación de orden cero parece ser
los subgrupos particulares a los que se aplica y no se aplica. Por ejemplo, existe una específica de grupos ocupacionales particulares más que general para todos
relación general entre el género y los ingresos, como se ilustra en la tabulación los grupos.
cruzada de orden cero en la Tabla 12.3: hay un mayor porcentaje de hombres que de
mujeres que tienen altos ingresos. Sin embargo, cuando controlamos por ocupación Cuando la relación inicial se cumple para algunas categorías de la variable de
control (ocupación en este caso) pero no para otras, se dice que la variable
(cuello azul y cuello blanco) y observamos ambos grupos ocupacionales por
independiente y la variable de control interactúan: es decir, la combinación de las dos
separado, encontramos que la relación de orden cero no se mantiene variables puede crear un efecto particular. (es decir, ser mujer y azul
consistentemente dentro de cada grupo ocupacional. Las tablas separadas para
cuello azul y cuello blanco collar se denominan tablas condicionales: muestran la
relación entre el género y los ingresos en diferentes condiciones (condición de cuello
ubicación (rural y urbana). Cuando se comparan hombres y mujeres en
general (la tabla de orden cero), hay una brecha del 30 por ciento entre
collar) que ninguno crea por sí solo. El concepto de interacción se ha discutido anteriormente en hombres y mujeres (el 60 por ciento de los hombres frente al 30 por ciento de
este libro (Capítulo 4). las mujeres tienen ingresos altos). El mismo patrón persiste entre los
hombres y mujeres rurales y también entre los hombres y mujeres urbanos.
REPLICACIÓN
En otras palabras, la relación de orden cero se replica dentro de cada
categoría de la variable de control.
La replicación ocurre cuando la relación de orden cero persiste en cada categoría de
la variable de control. Cuando esto ocurre, la variable de control no es responsable de Cuando ocurre este patrón, se dice que la relación de orden cero no se
la relación inicial de orden cero. En el ejemplo de la Tabla 12.4 se ha controlado la debe a la variable de control.
206
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 207
Figura 12.1 Modelo causal de relación causal indirecta entre género e ingreso
(a) Tabla de orden cero: relación de orden cero de género e ingreso
relación inicial se debió a la variable horas de trabajo como se representa en la figura.
Todo género
Esto también se ilustra en las tabulaciones cruzadas de la Tabla 12.5. En este caso,
Macho
femenino la relación de orden cero muestra que un mayor porcentaje de hombres que de
40% 70% mujeres tienen altos ingresos (55 por ciento versus 40 por ciento). timers muestra que
Low
Income High 60% 30%
prácticamente el mismo porcentaje de hombres que de mujeres tienen altos ingresos
(31 por ciento frente a 33 por ciento). Del mismo modo, entre los trabajadores a tiempo
completo, el mismo porcentaje de hombres y mujeres son personas con altos ingresos
(b)Conditional tables: relationship of gender and income controlling forlocation (65 por ciento frente a 65 por ciento). En otras palabras, en este ejemplo hipotético,
cuando hombres y mujeres tienen horas de trabajo comparables, las diferencias de
ingresos entre hombres y mujeres desaparecen. La relación de orden cero se debe a la
Rural Gender relación entre género y horas de trabajo y la relación entre horas de trabajo e ingresos.
El hecho de que hubiera muchas más mujeres a tiempo parcial que hombres a tiempo
Male Female
parcial en la muestra generó la correlación entre género e ingresos. Si la muestra
50% 80% hubiera tenido el mismo número de hombres y mujeres a tiempo parcial, no habría
Low
Income 50% 20%
aparecido la relación inicial entre género e ingresos.
High
género urbano
Masculino
Femenino
30% 70%
70% 30%
Income
High
RELACIONES CAUSALES INDIRECTAS
FALSO
El análisis de elaboración también se puede utilizar para aclarar la naturaleza de la Una relación espuria es aquella en la que la correlación entre dos variables no
relación de orden cero. En este caso podríamos estar afirmando que el género afecta se debe a ninguna relación causal entre ellas, sino a que ambas variables
casualmente los ingresos. Pero podríamos querer saber por qué mecanismos tiene este están relacionadas o son resultados de alguna tercera variable (Capítulo 3).
efecto. ¿El género afecta los ingresos porque el género afecta las horas de trabajo, lo Por ejemplo, supongamos que las personas que asisten a escuelas religiosas
que, a su vez, afecta los ingresos (Figura 12.1)? Aquí estamos controlando por horas de son más religiosos que los que asisten a escuelas seculares. ¿Si esta relación
trabajo para ver si la relación entre horas de trabajo y género se debe a la relación entre se debe a que las escuelas religiosas hacen a las personas más religiosas o
género y horas de trabajo y la relación entre horas de trabajo e ingresos. Si la relación es porque ambos factores son producidos por algún tercer factor?
entre género e ingresos desaparece entre aquellos con horas de trabajo comparables,
entonces diríamos que el En este ejemplo, el modelo propone que la razón de la relación entre el tipo de
escuela y la religiosidad no es que una sea la causa de la otra, sino que es más
probable que los padres religiosos envíen a sus hijos a escuelas religiosas que los
padres no religiosos (Figura 12.2). ). Los padres religiosos también tienen más
probabilidades de criar hijos religiosos. Por lo tanto, la razón por la cual los jóvenes en
las escuelas religiosas son más religiosos que los de las escuelas seculares es porque
los padres religiosos envían a sus hijos a esas escuelas y crían niños religiosos.
Tabla 12.5 Tablas condicionales y de orden cero que ilustran una relación causal indirecta
Cuadro 12.6 Cuadros condicionales y de orden cero que ilustran una relación espuria
relación
(a) Tabla de orden cero: relación de orden cero de género e ingreso (a) Tabla de orden cero: relación de orden cero del tipo de escuela y la religiosidad
Todos
Género Todos Tipo de escuela
norte Bajo
Alto
norte
(b)Tablas condicionales: relación de género e ingresos controlando por horas de trabajo (a)Tablas condicionales: relación de tipo de escuela y religiosidad controlando la religiosidad de los
padres
Tiempo parcial
Género padres religiosos Tipo de escuela
Masculino Femenino
Religioso Secular
Bajo
69% 67%
Bajo 35% 37%
Ingreso infantil
31% 33% sesenta y
Alto religiosidad Alto cinco%
63%
300 800
norte nort 600 200
e
Tiempo completo
Género Padres no religiosos Tipo de escuela
Masculino
Femenino Religioso
Secular
Bajo
35% 35% Bajo 85% 82%
Ingreso infantil
sesenta y sesenta y Alto 15% 18%
Alto cinco% cinco% religiosidad
nort 200 600
norte 700 200 e
Figura 12.2 Modelo que indica una relación indirecta entre el tipo de escuela y la La estrategia en el análisis de elaboración es comparar el patrón en la
religiosidad de los estudiantes relación de orden cero con el de las relaciones condicionales. los
017
1 Igual que orden cero Replicación Relación de orden cero Z1X→Y
no se debe a la variable de
Tabla 12.7 Interpretación de las relaciones condicionales en comparación con las relaciones de Z2 X→Y
prueba
orden cero
2 partidos Especificación Interacción entre Z1 X→Y
relación condicional Interpretación Ilustración
variable independiente y Z2 XY
en comparación con el orden
cero
variable de prueba; X solo
afecta
Y bajo condiciones
específicas Análisis multivariable
3 Orden inferior a cero espuria La relación de orden cero es X El análisis de elaboración es una forma simple de análisis multivariante.
Por lo general, se enfoca en el papel de una tercera variable en la
y variable de prueba no causal Z comprensión de una relación bivariada inicial. Otras formas de análisis
multivariante, como la correlación parcial, la regresión múltiple, el análisis
precede tanto a X como a Y discriminante, el análisis de ruta y el análisis logarítmico lineal, nos
permiten controlar varias otras variables simultáneamente. Varias formas
Y en el tiempo de análisis multivariante pueden permitir un análisis explicativo poderoso
e informativo de datos transversales.
4 Orden inferior a cero interviniendo La relación de orden cero es XZ→Y
1 Podemos eliminar los efectos de confusión de un conjunto de variables
y viene la variable de a la vez y concentrarnos en el efecto 'puro' de una variable independiente.
causal causal pero mediada por
prueba Cuantas más variables podamos controlar a la vez, más válida se vuelve
relación la variable interviniente nuestra comparación de grupos, y más seguros podemos estar de que
entre X e Y
cualquier efecto observado de una variable independiente se debe a esa
en el tiempo (variable de prueba) variable y no a los efectos de confusión de otras variables.
2 Estas técnicas de análisis multivariante pueden informarnos sobre el
efecto conjunto de un conjunto de variables independientes.
3 Al controlar un conjunto de variables simultáneamente, estas
La comparación proporciona la clave para interpretar la forma en que la variable de técnicas multivariantes nos permiten examinar el efecto discreto de cada
control afecta la relación original. La tabla 12.7 proporciona un resumen simple de las variable dentro de un conjunto de variables independientes . Si bien el
formas de interpretar la comparación entre las relaciones de orden cero y las relaciones género, la educación y las horas de trabajo pueden tener algún efecto
condicionales. sobre los ingresos, el análisis multivariado nos permite explorar cuánto
tiene cada uno independientemente de los demás. Esta estrategia nos
Problemas con el modelo de elaboración permite identificar la importancia relativa de cada una de un conjunto de
El modelo de elaboración tiene una serie de problemas que pueden limitar su utilidad
variables independientes.
como forma de controlar las variables en el análisis transversal. 4 Las técnicas multivariadas permiten la prueba de modelos causales, así
Un problema importante es que este tipo de emparejamiento requiere muestras muy
como el impacto de variables individuales. Al probar modelos, estas
grandes. Debido a que implica subdividir la muestra en grupos separados para cada
técnicas pueden ser efectivas para ayudar a identificar procesos causales
categoría de la variable de prueba, podemos terminar rápidamente con grupos bastante
o al menos para evaluar qué tan bien se ajusta un modelo a un conjunto
pequeños para el análisis. Si la variable de prueba tiene, digamos, cinco categorías,
de datos transversales.
cada subgrupo puede ser pequeño. Si queremos emparejar dos variables a la vez, este
Aquí no hay espacio suficiente para describir las diversas técnicas
problema se complica. Las dificultades creadas por quedarse sin casos son tan graves
que esta forma de análisis se limita con frecuencia a emparejar una sola variable a la
multivariantes. Hay disponibles muchas introducciones simples pero
vez. sofisticadas (Kerlinger y Pedhazur, 1973; Tabachnick y Fidell, 1983;
Grimm y Yarnold, 1995).
Además de quedarse sin casos, los resultados obtenidos de los análisis de
elaboración pueden volverse muy complejos y difíciles de interpretar. Cuando tenemos
muchas tablas condicionales diferentes, la lógica involucrada en la interpretación de los Análisis de cohortes
patrones variables puede volverse muy compleja. Puede volverse extremadamente
difícil explicar y presentar los resultados de cualquier cosa que no sean los análisis de Los diseños transversales están limitados en la medida en que pueden
elaboración bastante simples. proporcionar información sobre el cambio a lo largo del tiempo. Sin embargo, los
estudios transversales repetidos pueden proporcionar información valiosa sobre el cambio es atribuible a los efectos de período, envejecimiento y efectos de cohorte
cambio. El análisis de cohortes puede usar una serie de estudios transversales repetidos (Capítulo 7).
para describir el cambio agregado. a lo largo del tiempo e identificar en qué medida este
212
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 213
Cuando se ha realizado una serie de encuestas igualmente espaciadas (por ejemplo, un censo
de población cada 10 años), se puede construir una tabla de cohortes estándar. Para construir la
tabla estableceríamos un lapso de cohorte de edad que es igual al intervalo entre cada encuesta.
Por lo tanto, si los datos se recopilaran cada 10 años, podríamos establecer cohortes de edad de
20-29, 30-39, 40-49, etc.
Luego podemos leer la tabla de cohortes estándar de tres maneras diferentes para detectar
diferentes patrones de cambio.
EFECTOS DE ENVEJECIMIENTO
Los efectos del envejecimiento o los efectos del desarrollo son aquellos en los que el cambio es
atribuible al envejecimiento de las personas. Estos pueden detectarse leyendo la tabla de
cohortes estándar en diagonal desde la parte superior izquierda a la inferior derecha para
identificar las tendencias dentro de la cohorte. Leer las diagonales de la tabla nos permite ver
cómo una cohorte de edad en particular cambia a medida que envejece (Tabla 2.8). ¿Cómo han
cambiado como grupo de edad las personas que tenían 20 años en 1970 a medida que pasaron
a los 30 en 1980, a los 40 en 1990 y a los 50 en 1970? ¿construcción principios de siglo?
La tabla 12.8 muestra los efectos de envejecimiento perfecto. El diez por ciento de la cohorte
de jóvenes de 20 años en 1970 asistía a la iglesia al menos una vez al mes. Diez años más tarde,
cuando esta cohorte tendría unos 30 años de edad, la asistencia a la iglesia de esta cohorte
aumentó al 15 por ciento. Otros 10 años más tarde (1990) esta cohorte, ahora en sus 40 años,
muestra un mayor aumento en la asistencia a la iglesia. El mismo patrón de envejecimiento se
puede ver en cualquier diagonal descendente de izquierda a derecha.
EFECTOS DEL PERÍODO
Tabla 12.8 Tabla de cohorte del porcentaje de asistencia a la iglesia por lo menos mensualmente Los efectos claros del período son evidentes si, dentro de un año en
por cohorte de edad y año, 1970-2000: efectos de la edad en 8 particular, no hay diferencias entre los grupos de edad (es decir, dentro de
una columna), pero hay diferencias entre cada columna. En la tabla 12.9
vemos que en 1970 todos los grupos de edad tenían la misma proporción de
Año de recopilación de datos
asistentes regulares a la iglesia. Los grupos de edad eran indistinguibles.
Esta irrelevancia de la edad persiste en cada década. Los efectos del período
1990
son evidentes al observar la tendencia en las columnas. En cada década
Grupo de edad 1970 1980 2000
cambia la proporción de asistentes regulares, y cambia de forma idéntica
para cada grupo de edad.
20-29 10 10 10
10 Un examen de estos efectos de período nos permite ver cómo las personas dentro
del mismo grupo de edad difieren en diferentes períodos. Así, en la tabla 12.9 podemos
15 15 ver que las personas de 20 años en 1970 son bastante diferentes de las que tenían 20
30-39 15
15 años a principios de siglo. El grupo de edad es constante: el período en el que vive este
grupo de edad es diferente.
40-49 20 20 20 20
EFECTOS DE COHORTE
50-59 25 25 25 25
Los efectos de cohorte son evidentes en la Tabla 12.10. Es decir, dentro de un año
dado, los grupos de edad tienen diferentes proporciones de asistentes regulares: el
69-09 30 30 30
grupo de edad hace una diferencia en el nivel de asistentes frecuentes.
70-79 35 35 35 35
214
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 215
50-59 25 20 15 10
Tabla 12.9 Tabla de cohorte del porcentaje de asistencia a la iglesia por lo menos mensualmente
por cohorte de edad y año, 1970-2000: efectos del período 25 20 15 10
60-69
70-79 25 20 15 10
Año de recopilación de datos
20-29 25 20 15 10 Tabla 12.10 Tabla de cohortes del porcentaje de asistencia a la iglesia por lo menos
mensualmente por cohorte de edad y año, 1970-2000: efectos de cohorte
30-39 25 20 15 10
Los efectos de cohorte son evidentes cuando hay un cambio dentro de una
20-29 25 20 15 10
columna y dentro de las filas, y la dirección del cambio en una columna (por ejemplo,
30-39
de un porcentaje bajo a uno alto) es opuesta a la dirección del cambio dentro de las
25 20 15
30 filas (por ejemplo, de un porcentaje alto a uno bajo). centavo).
40-49
35 30 25 20 Si bien una tabla de cohortes puede ser muy útil para identificar los efectos del
envejecimiento, el período y la cohorte, existe una dificultad importante con este
50-59
35 30 25 enfoque. Es imposible aislar completamente un efecto 'puro' de envejecimiento,
40
período o cohorte (Glenn, 1977: 130). Cualquier tabla que demuestre un tipo de efecto
40
invariablemente muestra otro tipo de efecto. Por ejemplo, la tabla 12.8, que fue
60-69 45 35 30
diseñada para ilustrar los efectos del envejecimiento (cambio en la diagonal), también
70-79 muestra los efectos de cohorte (cambio en la columna). La tabla 12.9, diseñada para
50
45 40 35
mostrar los efectos del período (cambio entre columnas), también muestra los efectos
del envejecimiento. La tabla 12.10 se diseñó para mostrar los efectos de cohorte, pero
también muestra los efectos de período. Si bien no es posible desagregar estos
efectos, podemos, sin embargo, ver la ausencia de efectos particulares y la
posibilidad de otros efectos.
Para construir esta tabla, primero establecemos nuestros anchos de cohorte para
el primer año, 1979 (en este caso, franjas de edad de 10 años). Para el año de la
próxima recopilación de datos (1984), construiremos cohortes de edad del mismo
espacio de edad (es decir, 10 años), pero los límites inferior y superior de la cohorte
se ajustarán al intervalo entre las recopilaciones de datos. Se utilizaría el mismo
procedimiento para ajustar las cohortes entre cada fase de recopilación de datos.
1 Para identificar los efectos del envejecimiento, leemos a lo largo de las filas en lugar
de a lo largo de una diagonal de cohorte. En este caso, podemos ver un efecto de
envejecimiento a medida que aumenta el porcentaje de asistentes regulares a medida
que rastreamos la cohorte de edad en encuestas sucesivas.
216
DISEÑOS TRANSVERSALES ANÁLISIS TRANSVERSAL 217
Fuente:adaptado de Glenn,1977:47
Resumen
El capítulo consideró los problemas particulares del uso de datos transversales para el
DISEÑOS DE ESTUDIOS DE
análisis causal, problemas creados por la ausencia de una dimensión temporal en el diseño y la
falta de grupos de control aleatorios. La forma general de abordar estos problemas es en la
CASO
etapa de análisis más que en la etapa de diseño de la investigación. El capítulo describió la
lógica del uso de controles estadísticos y análisis multivariado para que los datos transversales
puedan ser útiles para el análisis causal. Luego describió una forma particular de análisis
multivariante, el análisis de elaboración, para proporcionar una comprensión de las formas en 13
que se pueden abordar los problemas del análisis causal. Finalmente, el capítulo discutió un
método para analizar datos de estudios transversales repetidos. En particular, se centró en el
análisis de cohortes: cómo construir e interpretar tablas de cohortes y ser consciente de los DISEÑO DE ESTUDIO DE CASO
límites de este tipo de análisis.
Durante muchos años, el estudio de caso ha sido el patito feo del diseño de investigación. La 1955). La investigación educativa, la investigación de evaluación y la investigación
mayoría de los textos sobre métodos de investigación ignoran los estudios de caso o los organizacional han hecho un amplio uso de los estudios de caso para fomentar su
confunden con otros tipos de investigación social. de vista - como opciones 'suaves'. Algunos desarrollo.
comentaristas creen que los estudios de casos deben usarse solo para investigación
exploratoria: para generar hipótesis para futuras pruebas con diseños de investigación más La falta de una discusión sistemática de los diseños de estudios de casos ha
rigurosos. comenzado a abordarse en los últimos tiempos. Yin (1989; 1993) ha brindado un
tratamiento particularmente útil de los diseños de estudios de casos y una poderosa
La metodología del diseño de estudios de casos no se ha descuidado porque los estudios de defensa de su valor.
casos no hayan tenido importancia en las ciencias sociales. De hecho, han sido fundamentales
para el desarrollo sustantivo y metodológico de las ciencias sociales. En la antropología social, Este capítulo examina una variedad de formas de desarrollar diseños de estudios
los estudios de las tribus han sido estudios de caso por excelencia. Los estudios comunitarios de casos. Esta es una tarea diferente a la emprendida para los diseños
como Middletown de Lynds (1929) y los estudios de grupos pequeños como Street Corner experimentales, longitudinales y transversales porque, como señala Yin, "a diferencia
Society de Whyte (1943) han hecho importantes contribuciones al desarrollo de la sociología de otras estrategias de investigación, el "catálogo" potencial de diseños de
como disciplina. El psicoanálisis ha prosperado con un enfoque de estudio de caso (Freud, investigación aún no se ha desarrollado" (1989: 27).
220
DISEÑOS DE ESTUDIOS DISEÑO DE ESTUDIO DE 221
DE CASO CASO
Es útil distinguir entre casos como un todo y casos que constan de varios niveles o
componentes. Yin (1989) utiliza los términos diseños "holísticos" e "incrustados" para
referirse a esta distinción.
interesante, la tarea del investigador de estudios de casos es fundamentalmente
teórica. La recopilación y el análisis de información de los estudios de casos deben
Un estudio de caso bien diseñado evitará examinar solo algunos de los elementos guiarse por la teoría.
constitutivos. Construirá una imagen del caso teniendo en cuenta la información obtenida
de muchos niveles. El caso de estudio final nos dirá más y cualitativamente diferente de lo Casos de estudio explicativos
que cualquier elemento constitutivo del caso podría decirnos. En el caso de una escuela,
Los diseños de estudios de casos difieren de los diseños discutidos anteriormente en
las percepciones obtenidas de los estudiantes, maestros, padres, administradores y
este libro en que buscan lograr explicaciones más complejas y más completas de los
miembros de la comunidad probablemente difieran y, cuando se toman en conjunto,
fenómenos. Buscan lograr explicaciones tanto ideográficas como nomotéticas (véase
proporcionen una comprensión mucho más completa y compleja del todo que la
el capítulo 14). También difieren en la forma en que tratan de lograr explicaciones
perspectiva proporcionada por cualquier elemento en particular. del caso El todo es mayor
causales (véanse los capítulos 14 y 15).
que la suma de sus partes.
La investigación de estudios de casos en ciencias sociales debe tener una
Dado que muchos casos consistirán en diferentes elementos, es posible que se
dimensión teórica. Sin una dimensión teórica, un estudio de casos será de poco valor
requieran diferentes métodos de recopilación de datos para los diferentes elementos. Una
para una generalización más amplia, uno de los objetivos de la investigación en
encuesta de estudiantes podría ser apropiada; También puede valer la pena observar las
ciencias sociales. Esta sección considera tres formas en las que se usa la teoría en
aulas y las reuniones del personal, mientras que las entrevistas pueden ser una buena
diseñar estudios de casos.
manera de obtener información de los maestros. Un análisis de los registros y archivos
escolares podría proporcionar información útil sobre el contexto histórico en el que opera la PRUEBAS DE TEORÍA
escuela.
Este enfoque, que Yin (1989) considera que está en el centro de los estudios de
casos, comienza con una teoría, o un conjunto de teorías rivales, con respecto a un
Casos prácticos y teoría fenómeno particular. Sobre la base de una teoría, predecimos que un caso con un
conjunto particular de características tendrá un resultado particular. La teoría puede
Aunque algunos investigadores de estudios de casos llevan a cabo estudios de casos como
ser simple o compleja.
si sólo tuvieran que recopilar los hechos sobre el caso y escribir sobre ellos de una manera
222
DISEÑOS DE ESTUDIOS DISEÑO DE ESTUDIO DE 223
DE CASO CASO
Nuestro análisis de cada caso apuntaría a resaltar las diferencias entre los casos
en los que funcionó y no funcionó. Nuestro análisis también identificaría los puntos en
común entre los casos en los que la delegación de personal tuvo éxito y los puntos en
común entre los casos en los que no tuvo éxito (por ejemplo, la forma en que se
implementó el sistema). Estos estudios de caso podrían usarse para desarrollar un
conjunto de proposiciones sobre las condiciones y el contexto. bajo el cual los
sistemas de dotación de personal delegados conducen a mejoras (Capítulo 15).
Mientras que los dos enfoques de estudio de caso anteriores se centran en la teoría
en el sentido de que el objetivo es utilizar el caso para probar, refinar y desarrollar
generalizaciones teóricas, el estudio de caso clínico utiliza teorías de manera muy
diferente. Los estudios de caso clínico se centran en casos. entender un caso.
La forma en que un médico trata a un cliente ilustra este estilo de estudio de caso.
Un niño puede visitar a un psicólogo porque se está desempeñando mal en la escuela
y se ha vuelto disruptivo. La tarea del psicólogo clínico es averiguar qué está pasando
en este caso y por qué está pasando. Un buen clínico comenzará con los síntomas: ¿
qué está pasando en la escuela? ¿ En qué áreas de la escuela se está
desempeñando mal el niño? Sin duda, el médico tendrá una variedad de posibles explicaciones para el bajo rendimiento escolar y el comportamiento disruptivo en la escuela.
224
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 225
CASO CASO
El punto es que el clínico tendrá una batería de posibles explicaciones para los problemas
del niño. Su tarea es construir una imagen completa del caso para poder evaluar qué
explicación se ajusta mejor a los hechos del caso. Habiendo diagnosticado correctamente la
naturaleza o la causa de los problemas del niño, el médico puede comenzar el tratamiento.
En este ejemplo, el objetivo es comprender el caso y resolver un problema para este caso.
El propósito no es probar o desarrollar teorías, sino usar las teorías existentes. El clínico
trabaja con hipótesis rivales plausibles y recopila información progresivamente para ayudar a
determinar cuál se ajusta mejor.
DESCRIPCIÓN Y TEORÍA
atributos físicos, genéticos. Cada una de las descripciones refleja un enfoque
diferente de interés y una evaluación diferente de lo que es relevante para describir a
Aceptación de objetivos culturales. una persona.
Acepta Rechaza
TIPOLOGÍAS Y TIPOS IDEALES
conformistas Ritualistas LosAccepts
estudiosmeans of descriptivos
de casos Accepts pueden consistir en casos únicos o múltiples. Una
achieving
forma the goals
de reportar múltiples estudios de casos es usar tipologías y tipos ideales.
innovadores Retiradores Rejects teóricamente o empíricamente. Una tipología
Las tipologías pueden derivarse
derivada teóricamente es aquella que es lógica o teóricamente posible. Por ejemplo,
Merton (1968) desarrolló una tipología de tipos de desviados basada en las nociones
Figura 13.1 Tipología de desviaciones derivada teóricamente de metas culturales y medios institucionalizados para lograr esas metas (Figura 13.1).
Así, el conformista es una construcción teórica definida como alguien que acepta los
pero esto no puede significar que el estudio de caso consiste en todo sobre el caso. objetivos de la cultura y los medios por los cuales la cultura prescribe el logro de estos
Describirlo todo es imposible: debe haber un foco. objetivos. El innovador acepta los objetivos pero no los medios prescritos para
alcanzarlos. El ritualista rechaza los objetivos culturales pero, sin embargo, sigue el
La descripción no debe, de hecho no puede, ser ateórica. Siempre seleccionamos y comportamiento cultural prescrito. El retraído rechaza tanto las metas como los
organizamos lo que describimos. Las descripciones resaltarán aspectos del caso. Será más medios para lograr esas metas.
como una pintura de un paisaje que como una fotografía; será una interpretación más que una
imagen especular. Podríamos hacer esto usando teorías explícitas o categorías conceptuales Las tipologías construidas de esta forma deductiva representan un conjunto de
preexistentes, o usando teorías implícitas de qué es relevante y qué categorías son tipos ideales (Coser, 1977:223-4). Los tipos ideales son una descripción teórica de
importantes. Por ejemplo, cuando describo a una persona, como sociólogo, podría resaltar su conjuntos
personalidad, etnia, edad, género y similares porque los veo como los elementos críticos que
constituyen a una persona social. Otra persona, un biólogo, podría enfocarse mucho más en
226
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 227
CASO CASO
descriptivo o explicativo
retrospectivo o prospectivo.
d
¿Explicativo? Descriptivo Explicativo
r
Tiempo Retrospectivo Futuro Retrospectivo Futuro
norte
Orden de casos
gramo
C tu T
T
a norte
h mi
mi
mi metro
s i
s
o b
mi t
r mi
s s METRO i
d
yo gramo
T
mi
mi metro
mi
d B
metro i
s tu
pags
b
t tu i
mi yo
i norte
S
yo
mi
d
i norte i d
d
norte gramo C t
i
mi
gramo
a s norte
d B
yo
s gramo
mi tu
mi H T
tu
i
s o mi
C norte
yo
i
yo s
a
d
i
t
s
t
s s
i
mi norte
t
norte
gramo
i
gramo
C
T
B
mi
tu
H
s
i
o
t
yo
yo
i
d
i
norte
i
s
gramo norte
t
gramo
B
i
C
o
230
DISEÑOS DE ESTUDIOS DE DISEÑO DE ESTUDIO DE 231
CASO CASO
Lo que no es un estudio de caso Método de Tiempo 1 (T1) Intervención Tiempo 2 (T2)
Antes de terminar este capítulo vale la pena decir lo que no son los diseños de estudio asignación a (X)
Prueba previa Post-prueba
de caso. grupos
Problemas metodológicos
Validez interna
Los estudios de casos, por otro lado, enfatizan la comprensión del caso completo y
Los estudios de casos se pueden utilizar para ambos tipos de explicación. Un la visualización del caso dentro de su contexto más amplio. Goode y Hatt (1952)
estudio de caso adopta un enfoque idiográfico cuando se logra una comprensión describen los estudios de casos como
completa y contextualizada de un caso. Pero los diseños de estudios de casos
pueden adoptar un enfoque nomotético. Esto ocurre cuando se utilizan casos una forma de organizar los datos sociales... para preservar el carácter unitario del
particulares para lograr una comprensión más generalizada de proposiciones objeto social que se estudia... es un enfoque que considera cualquier unidad social
teóricas más amplias (ver discusión de estudios de casos y teoría en el Capítulo 13). como un todo. (1952: 331, sus cursivas)
Al desarrollar una explicación causal completa y bien redondeada, los estudios de casos
pueden lograr una alta validez interna. Al ver factores causales particulares en combinación
con otros factores causales, podemos evaluar tanto la importancia relativa de causas
particulares como la forma en que se interrelacionan varias causas. Como tales, los estudios de
casos pueden lograr una explicación sofisticada y equilibrada de los procesos causales y, al
hacerlo, evitar confundir causa con correlación.
Los diseños discutidos en partes anteriores de este libro se enfocan en las variables más que
en los casos. Examinan cómo los diferentes rasgos de los casos se asocian entre sí (Mitchell,
1983: 192). Por lo general, sin embargo, estos rasgos no se consideran dentro del contexto de
caso del que forman parte. Al arrancar los rasgos del contexto en el que ocurren, los
despojamos de gran parte de su significado y, en consecuencia, corremos el riesgo de leer mal
su significado y significado y, por lo tanto, malinterpretar sus causas.
Blumer (1956) utiliza el término "análisis de variables" para describir el análisis que se centra
en las variables en lugar de en los casos. Argumenta que, aunque dicho análisis puede
establecer relaciones estadísticas entre las variables, no proporciona mucha información sobre
los procesos causales. Argumenta que:
Aunque esta es una versión algo simplista del análisis estadístico de las relaciones entre
variables, contiene algo de verdad. Si bien muchos de los diseños tratados anteriormente en
este libro pueden aislar variables que producen resultados particulares, no son tan buenos para
decirnos por qué producen estos resultados.
interpretar su significado de manera diferente.Dentro de una familia en particular
puede haber mucha ayuda intergeneracional: los adultos de la familia están atentos a
Destacan la importancia de mirar las partes dentro del contexto del todo.' El caso también debe los padres ancianos, los visitan con frecuencia y ayudan en lo que pueden. Pero, ¿es
verse dentro del contexto en el que existe. Al examinar este contexto en su totalidad, el esto un signo de solidaridad familiar, cercanía y cuidado, o es un signo de control,
investigador puede obtener una imagen más completa y redondeada de los procesos causales dependencia, manipulación y chantaje (los adultos ayudan por culpa, preocupación
que rodean un fenómeno particular. Yin argumenta que por la herencia, preocupación de que los hermanos se verán favorecidos a menos que
ayuden)? ¿ La ayuda es recíproca? ¿ Cuáles eran los patrones de ayuda en el
una razón importante para usar [estudios de casos] es cuando su investigación debe cubrir
pasado? ¿Cuál es la historia de las relaciones entre padres e hijos en esta familia? ¿
tanto un fenómeno particular como el contexto dentro del cual ocurre el fenómeno porque (a) se
Qué formas particulares de ayuda se dan? ¿Qué tipo de ayuda se retiene? ¿Por qué
supone que el contexto contiene información explicativa importante sobre el fenómeno o (b ) los
la gente da la ayuda? ¿Cuán felizmente es aceptado? ¿Qué pasa si no se ofrece
límites entre fenómeno y contexto no son claramente evidentes. (1993:31)
ayuda? ¿ Cuáles son las normas sobre lealtad familiar y ayuda dentro de la
El estudio del contexto es importante porque el comportamiento tiene lugar dentro de un comunidad, clase y grupo étnico en el que se sitúa esta familia? ¿Cuáles son las
contexto y su significado se deriva en gran medida de ese contexto. Un mismo comportamiento reglas de herencia en esta sociedad? ¿Cuáles son las obligaciones legales, si las
puede significar cosas muy diferentes dependiendo de su contexto. Además, las acciones hay, de los niños de cuidar a sus padres ancianos? Tendríamos que abordar estas y
tienen significados para las personas que las realizan y esto debe formar parte de nuestra otras preguntas antes de poder construir una imagen del significado de la ayuda
comprensión de las causas y el significado de cualquier comportamiento. Mirar simplemente el intergeneracional y las posibles causas de la ayuda en un caso particular. Aislar el
comportamiento y darle un significado en lugar de tomar el significado de los actores es perder comportamiento de este contexto más amplio y despojarlo del significado que le dan
una importante fuente de comprensión del comportamiento humano. los actores es invitar a malentendidos y, por lo tanto, amenazar la validez interna del
estudio.
Un ejemplo puede ilustrar este punto. La literatura de investigación sobre familias extendidas
asume que el intercambio de ayuda y cuidado entre las generaciones (por ejemplo, adultos y Para tomar otro ejemplo: nuestro objetivo de investigación puede ser obtener una
padres mayores) refleja la calidad y la fuerza de los lazos intergeneracionales. Sin embargo, si comprensión de la adicción a las drogas. Para dar sentido a la adicción en un
examinamos el significado de la ayuda intergeneracional dentro de su contexto, podemos particular
236
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 237
DE CASO ESTUDIOS DE CASO
HISTORIA Y MADURACIÓN
caso, necesitaríamos entender su contexto social e institucional. ¿Fue la adicción el La forma en que la 'historia' y la maduración pueden amenazar la validez de
resultado del tratamiento médico para controlar el dolor (adicción del tratamiento)? ¿ las explicaciones causales se ha discutido en capítulos anteriores. Los
Se originó con angustia emocional después de la ruptura de una relación (adicción diseños experimentales buscan lidiar con los problemas de la historia y la
como escape)? ¿Se daba por sentado que el consumo de drogas formaba parte del maduración mediante el uso de grupos de control aleatorios y centrándose
contexto social inmediato en el que vivía la persona (la adicción como conformidad)? en las diferencias de cambio entre estos grupos en lugar del cambio
¿La persona procedía de un entorno muy antidrogas (adicción como rebeldía)? El absoluto (Capítulos 4 y 5).
contexto es de suma importancia para comprender el fenómeno (adicción) y
presumiblemente es crucial para dar forma a formas apropiadas de manejar o tratar Los diseños de estudios de caso intentan abordar el "problema de la
la adicción. historia" y la maduración al observar de cerca el contexto más amplio y
explorar la medida en que este tipo de eventos concurrentes contribuyen a
En resumen, las explicaciones basadas en estudios de casos implican mucho más que los resultados observados. Es decir, en lugar de eliminar del análisis los
explicar la variación de una variable en términos de la variación de otra variable. Los diseños de factores históricos/contextuales y de maduración (controlándolos), los
estudios de casos se diseñan para producir un relato sensato y plausible de los eventos y de
diseños de los estudios de caso los incluyen para mejorar nuestra
esta manera lograr la validez interna. Logran explicaciones al construir una imagen completa
de la secuencia de eventos, el contexto en el que ocurren y el significado de las acciones y
comprensión. al mismo tiempo, evitando las amenazas que la historia y la
eventos según lo interpretan los participantes y su significado dado por un contexto. Al final, maduración presentan a la validez interna de las conclusiones de nuestro
una explicación causal adecuada es aquella que tiene sentido. Se trata de contar una historia estudio de caso. La calidad del estudio de caso dependerá en gran medida
plausible, convincente y lógicamente aceptable de cómo se desarrollan los acontecimientos y de qué tan bien identifique estos factores históricos/contextuales y de
cómo se relacionan entre sí. maduración y los incluya en cualquier explicación.
EFECTOS REACTIVOS
Validez externa
Si bien los estudios de casos pueden lograr una excelente validez interna al
proporcionar una comprensión profunda de un caso, han sido ampliamente
criticados por carecer de validez externa. Se argumenta que una
comprensión profunda de un caso no proporciona una base para generalizar
a una población más amplia más allá de ese caso. Un caso es sólo eso, un
caso, y no puede ser representativo de un universo más amplio de casos.
Sin embargo, los estudios de casos no buscan este tipo de validez externa. Hay
dos tipos de generalización: estadística y teórica. La generalización estadística se
logra mediante el uso de muestras aleatorias representativas. Sobre la base de la
probabilidad estadística, generalizamos nuestros hallazgos a una población más
amplia que nuestra muestra está diseñada para representar.
REPLICACIÓN
la selección de casos contribuye a la replicación literal y teórica (Yin, 1989).
Para comprender el concepto de generalización teórica es necesario comprender la lógica de la
replicación en el diseño de la investigación (Yin, 1989). Esta es la lógica que se encuentra en el Los diseños de estudios de casos implican la selección de casos con fines teóricos
corazón de la generalización a partir de experimentos. Dado que los experimentos normalmente no y específicos. Seleccionamos un caso porque prueba si una teoría funciona en
utilizan muestras probabilísticas representativas, no proporcionan una base para la generalización situaciones particulares del mundo real. Alternativamente, seleccionamos un caso
estadística a una población más amplia. Un experimento puede emplear un diseño excelente que porque pensamos que podría refutar una proposición, o porque queremos ver si la
asegure un alto grado de validez interna, pero a menos que esté basado en una muestra proposición teórica funciona bajo condiciones particulares (como repetir un
probabilística, no sabemos si esos hallazgos ocurrirán en la población más amplia. Puede haber algo experimento bajo diferentes condiciones).
en la muestra en particular que signifique que la los resultados se aplicarán solo a las personas que
La selección estratégica de casos significa que sabemos algo de las características
participaron en el experimento.
de un caso antes de que comience el estudio de caso propiamente dicho. Dado que
Los experimentos que utilizan muestras no probabilísticas abogan por la validez externa sobre la los casos se seleccionan porque cumplen requisitos particulares (en lugar de ser
base de la lógica de replicación. Es decir, si el experimento se puede repetir una y otra vez en las seleccionados al azar), primero debemos saber algo sobre cada caso. Esto puede
mismas condiciones y producir los mismos resultados, podemos estar seguros de que los resultados requerir una evaluación exhaustiva de los casos antes de que finalmente se
experimentales se mantendrán de manera más general. Si los resultados experimentales se seleccionen los casos reales (ver más adelante en este capítulo).
mantienen bajo diferentes condiciones y con diferentes tipos de participantes experimentales, nuestra
La forma en que los casos se seleccionan estratégicamente se puede ilustrar
confianza en la generalización de los resultados crece. Si los resultados experimentales no se
utilizando el ejemplo anterior de los sistemas de dotación de personal delegado. Si
pueden replicar en condiciones particulares, entonces necesitaremos especificar condiciones a las
comenzamos con la proposición de que "la introducción de sistemas de dotación de
que no se pueda generalizar el experimento. Ganamos confianza en el valor y la solidez de los
personal descentralizado en las escuelas mejora la calidad de la educación", nuestro
hallazgos experimentales al repetir el experimento. Cuando el experimento se repite con diferentes
primer estudio de caso se centrará en una escuela en la que se haya introducido dicho
muestras y en diferentes condiciones, obtenemos una mayor idea de los límites de la generalización.
sistema. Predecimos que en esta escuela habrá ser evidencia de mejora educativa.
Los experimentos repetidos dan una idea del rango de generalización. Si un experimento solo
Además, pronosticamos que un estudio intensivo de la escuela mostraría lo siguiente:
funciona una vez con un grupo particular de personas y los resultados no se pueden reproducir,
tendríamos poca confianza en sus hallazgos o en su aplicabilidad en general. 1 La mejora en la educación se remonta al nuevo sistema.
La ciencia experimental se basa en la lógica de la replicación. No se acepta ningún hallazgo sobre 2 Las razones por las que el nuevo sistema fue efectivo fueron las que se anticiparon
la base de un solo experimento. La misma lógica se aplica a los estudios de casos. De hecho, un solo en la teoría (mejor ajuste de los maestros a la escuela, mayor sentimiento de
estudio de caso puede pensarse de la misma manera que un solo experimento. En el Capítulo 13 responsabilidad y mayor creencia de que el esfuerzo es recompensado).
argumenté que los hallazgos de un estudio de caso se prueban repitiendo estudios de caso (más de
Si encontráramos que el caso coincidía con lo que predijo la teoría, se habría logrado
esto más adelante). Podemos examinar diferentes tipos de casos bajo diferentes condiciones y tal
una réplica literal de la teoría (Yin, 1989: 54). Dado que este resultado puede deberse
vez incluso usando diferentes métodos. Cuanto más se comporten los casos de una manera que sea
al azar, podríamos buscar otras escuelas en las que el sistema delegado fue
consistente con la forma en que esperaríamos sobre la base de nuestra teoría, más confianza
presentado y examinar su impacto en la calidad de la educación en esas escuelas. Si
tendremos en nuestra teoría. Si encontramos que algunos casos no se comportan de la manera que
ocurren los mismos patrones, tenemos más réplicas literales.
hubiéramos predicho, necesitamos modificar nuestra teoría para acomodar ese caso de la misma
manera que las teorías se modificarán para dar cuenta del experimento que no da los resultados Entonces podríamos intentar probar la teoría de una manera diferente. Ya que
esperados. habíamos concluido que la mejora en la educación se debió a la introducción del
SELECCIÓN ESTRATÉGICA DE CASOS sistema descentralizado, esperaríamos, sobre la base de nuestra teoría, que donde
un sistema centralizado era retenido, no habría mejora en la educación. Buscaríamos
La validez externa de los estudios de casos se ve reforzada por la selección estratégica de casos más deliberadamente instancias de 'escuelas que todavía funcionan con un sistema
que por la selección estadística de casos. el estratégico centralizado para ver si nuestras predicciones teóricas fueron apoyadas.
Como prueba más dura, podríamos buscar casos que vayan en contra de la proposición básica: es centralizados que, durante el mismo período, también generaron mejoras en la
decir, casos de un sistema delegado fallido. Alternativamente, podríamos buscar casos de sistemas calidad educativa. Sin embargo, nuestro
PROBLEMAS EN EL DISEÑO DE ESTUDIOS DE CASO
Cuestiones prácticas
Muestreo
Glaser y Strauss (1967) han utilizado el término muestreo teórico para describir el método
normal de selección de casos en diseños de estudios de casos. Hakim (1986) usa el término
muestreo enfocado para describir el mismo proceso. Estos términos se refieren a la estrategia
de seleccionar casos que proporcionarán ejemplos esclarecedores de un tipo de caso (como
en los diseños de estudio de casos descriptivos) o que proporcionarán pruebas adecuadas de
una teoría.
NUMERO DE CASOS
No hay un número correcto de casos para incluir en un diseño de estudio de caso. Los
diseños de estudios de casos pueden consistir en un solo caso o en múltiples casos (Capítulo
13). Con estudios de casos múltiples, el número de casos es una cuestión de juicio (Yin, 1989:
57). Un factor importante para determinar el número de casos será el rigor con el que se
suburbana, rural y remota). O bien, Nuevamente, es posible que no sepamos si el
impacto positivo se mantendrá en diferentes niveles (primario, secundario o
los casos diseñados para refutar nuestras proposiciones también aumentarán el número de terciario) o en los diferentes tipos de sistemas escolares (privados, religiosos o
estudios de casos que podemos realizar. estatales). estudios que acomoden algunas de estas diferencias para ver si las
predicciones se pueden replicar en estas diferentes condiciones.
La complejidad de nuestras predicciones puede influir en la confianza que tengamos en
nuestras replicaciones. Cuanto más complejas sean nuestras predicciones, más seguros Otro factor que puede afectar el número de casos es el marco conceptual con el
podremos estar en el caso único en que nuestras predicciones se repliquen. Cuando nuestras que estamos trabajando. Por ejemplo, si la clase social fuera un concepto
predicciones sean simples (por ejemplo, cuando exista A, ocurrirá Z) un solo estudio de caso importante en el estudio, sería necesario incluir casos de cada una de las diferentes
puede no representar una prueba difícil y es posible que deseemos múltiples repeticiones clases sociales. El número de casos dependería de cómo se conceptualizara la
antes de sentirnos seguros de los resultados. Cuando nuestras predicciones son más clase social y de cuántas categorías de clase incluyera esta conceptualización (p.
complejas y exigentes (por ejemplo, cuando existe A+B+C+D, entonces W+X+Y+Z ocurrirá) ej., solo clase media y clase trabajadora, o una clasificación de clases más refinada
es relativamente improbable que este patrón complejo ocurra debido al azar. En que incluya la clase alta y varias clasificaciones dentro de las clases media y
consecuencia, podemos sentirnos bastante confiados en la dureza de la prueba que trabajadora) .
proporciona el estudio de caso único.
Podríamos seguir para siempre y verificar las cosas bajo cualquier cantidad de
La cantidad de estudios de casos que realicemos también dependerá de nuestro condiciones diferentes. Al final, debemos emitir juicios sobre las posibles
conocimiento de los factores externos que podrían afectar los resultados. Es decir, si variaciones y tener buenas razones para esperar que estas diferentes condiciones
esperamos que nuestros resultados se mantengan bajo una amplia gama de condiciones puedan afectar los patrones. También debemos guiarnos por lo que es práctico
externas, es posible que necesitemos menos estudios de casos. Cuando no estamos seguros dentro de las limitaciones de tiempo, dinero y acceso a casos relevantes. Lo
de las condiciones externas bajo las cuales se mantendrán nuestras predicciones, es posible fundamental es seleccionar los casos más estratégicos para probar nuestras
que necesitemos más estudios de casos bajo estas diferentes condiciones. para ver qué tan propuestas en lugar de apuntar a una gran cantidad de casos.
consistentes son nuestros hallazgos (Yin, 1989: 58). Por ejemplo, es posible que no estemos
seguros de si el vínculo entre los sistemas de dotación de personal delegado y el desempeño DETECCIÓN DE CASOS
educativo se mantendrá independientemente de la región (por ejemplo, ciudad de origen,
La selección estratégica de-
242
DISEÑOS DE ESTUDIOS DE PROBLEMAS EN EL DISEÑO DE 243
CASO ESTUDIOS DE CASO
Cuándo ir al campo
Esta es una receta para el desastre. Es esencial que tengamos una pregunta de
investigación clara antes de comenzar un estudio de caso.3 De hecho, ni siquiera
podemos comenzar a seleccionar casos hasta que tengamos una declaración clara de la
pregunta de investigación. Necesitamos ir más allá de tener una pregunta. Deberíamos
poder formular algunas proposiciones iniciales, algunas respuestas iniciales a la
pregunta que los estudios de caso nos ayudarán a probar.
No tenemos que tener una teoría bien formulada para probar. Nuestras preguntas pueden
ser tales que no haya teorías obvias para probar. Pero esto no nos libera de la necesidad de
estar bien informados y bien preparados teóricamente antes de entrar en el campo. Pasteur
observó que, 'En lo que respecta a la observación, el azar solo favorece a la mente preparada'
(citado en Mitchell, 1983: 204). Si no somos conscientes de las teorías, conceptos, debates y
similares relevantes, probablemente perderemos la importancia de mucho de lo que podamos
encontrar. Sin tener alguna idea de lo que estamos buscando, no sabremos lo que hemos
encontrado.
Los estudios de casos pueden implicar la recopilación de una gran cantidad de información.
Esta información debe procesarse y destilarse cuidadosamente antes de que pueda
presentarse. No podemos simplemente describir el caso y dejar que los hechos hablen por sí
mismos. Cualquier intento de presentar todos los hechos resultará en un lío indigesto que es
ilegible y no leído.
Hay muchas formas diferentes de presentar los estudios de casos. Podríamos describir
cada caso como un todo para que el lector se forme una imagen clara del caso.
Alternativamente, podríamos describir buenos ejemplos de tipos particulares de casos y luego
comparar estos diferentes tipos de casos y sacar conclusiones generales con respecto a
nuestras teorías. The Second Shift (1989) de Hochschild proporciona un buen ejemplo de
este tipo de información. Describe una serie de matrimonios y de cada uno de sus casos
extrae lecciones sobre la división doméstica del trabajo y los procesos por los cuales se
mantiene la desigualdad marital en este ámbito.
Cuestiones éticas Anteriormente argumenté que la reactividad puede ser una amenaza importante
para la validez interna de los diseños de estudios de casos: la presencia de un
Se aplican los mismos principios éticos a los diseños de estudios de casos que a los diseños investigador puede alterar la dinámica de los casos que se observan. Esto puede ser
discutidos en capítulos anteriores. Los problemas éticos particulares que se enfrenten particularmente cierto cuando se utilizan técnicas de observación participante. Una
variarán, según el tipo de diseño de estudio de casos adoptado y la forma particular de forma en que algunos
recopilación de datos utilizada para ese diseño.
246
DISEÑOS DE ESTUDIOS PROBLEMAS EN EL DISEÑO DE 247
DE CASO ESTUDIOS DE CASO
cualquier daño potencial, tiene mucho sentido obtener asesoramiento o incluso hacer
los investigadores pueden tratar de reducir los efectos de la reactividad es disfrazar su que las decisiones sean tomadas por terceros, como los comités de ética
identidad como investigadores para evitar que su identidad de investigador se inmiscuya. Por institucionales.
ejemplo, un investigador puede querer examinar el acoso sexual en el lugar de trabajo. Es
probable que las personas de la organización se comporten de manera diferente mientras el Los investigadores deberán resolver las consideraciones éticas contrapuestas. ¿
investigador esté presente y, por lo tanto, socaven el estudio. Como alternativa, el investigador Hasta qué punto la ética del consentimiento informado y la participación voluntaria
deben tener prioridad sobre el valor de la investigación que expone un
podría emprender la investigación obteniendo un trabajo en la empresa y observando de forma
encubierta lo que sucede. comportamiento altamente poco ético?
Los problemas éticos del engaño y la imposibilidad de obtener el consentimiento informado Incluso si un investigador revelara su identidad y obtuviera permiso para realizar el
surgen obviamente en esta situación. El dilema que destaca es el compromiso que se produce estudio, surge la pregunta de cómo obtener el consentimiento informado y de quién
obtener ese consentimiento. Si estuviéramos realizando un estudio de acoso sexual
entre la ética y la validez interna: seguir las pautas éticas puede amenazar la validez interna del
estudio. en un lugar de trabajo, ¿obtendríamos permiso de los guardianes de la organización o
de todas las personas que podríamos observar en el curso del estudio?
No cabe duda de que revelar la propia identidad y obtener el consentimiento informado
puede socavar gran parte de lo que Punch (1994) llama etnografía de "estilo callejero". En ¿ Es necesario informar a las personas de que se está observando su
comportamiento público con fines de investigación? Claramente, en muchos casos
algunos casos, revelar la identidad de uno puede acabar con el proyecto de investigación. En
estas situaciones, se debe dar una cuidadosa consideración a los méritos de alguna forma de esto es simplemente poco práctico (observar el comportamiento de la gente en una
engaño a la luz de los posibles beneficios de la investigación y el potencial de daño a los fiesta, en una manifestación, comprando en rebajas). En mi opinión, observar el
comportamiento público plantea pocos problemas éticos. Mientras los individuos no
participantes. Si bien es fácil para un investigador racionalizar que los beneficios superarán
sean identificables, no debería haber peligro de daño para los participantes. Después
de todo, si el comportamiento es público, apenas hay invasión de la privacidad.
Otro problema ético que es más probable que surja cuando se usa la observación en un
estudio de caso es el problema de qué hacer cuando observamos un comportamiento ilegal o
dañino. ¿Deberían tener prioridad las cuestiones éticas del consentimiento informado y la escuela y te enteras de la identidad de una persona que vende drogas peligrosas a los
participación voluntaria sobre la exposición de conductas altamente poco éticas? Por ejemplo, estudiantes? ¿Qué haces si descubres, durante tu investigación, que un participante
¿cuál sería su responsabilidad ética si sus estudios de casos de familias revelaran casos de del grupo está a punto de cometer un delito? ¿Es la traición de la confianza de los que
violencia doméstica o abuso infantil? ¿Qué debe hacer al realizar un estudio de caso de un te rodean menos ético que la responsabilidad de uno a los que están en peligro?
Resumen
Este capítulo ha hecho hincapié en que la validez interna de los estudios de
casos se basa en una lógica que distingue a este diseño de los demás
diseños discutidos en este libro. Los estudios de casos se centran en un
gran número de variables y en la forma en que se interrelacionan. Por el
contrario, los otros diseños se basan en controlar la influencia de otras
variables y centrarse en la influencia de un número muy limitado de
variables. Una de las fortalezas de los estudios de casos es que intentan
comprender la importancia de factores particulares dentro del contexto del
caso completo en lugar de descartar este contexto. Como tales, los estudios
de casos tienen el potencial de una buena validez interna basada en una
comprensión más completa del significado de comportamientos y eventos
particulares que la que brindan los otros diseños.
notas
1 El concepto de un todo es, como señalan Goode y Hatt (1952), una construcción en sí misma.
Somos nosotros quienes definimos qué es el 'todo'. La delimitación entre el caso (el todo) y su
15
contexto es de hecho arbitraria.
2 Los casos "típicos" no deben confundirse con la selección de casos "típicos ideales", casos que ANÁLISIS DEL ESTUDIO DE CASO
pueden representar un tipo ideal (Capítulo 13).
3 Puede ser apropiado realizar estudios de casos sin preguntas de investigación o proposiciones
claras cuando estamos haciendo estudios de casos exploratorios. finalizado. Pero este tipo de estudio
de caso, diseñado para ayudar a producir una pregunta de investigación, es muy diferente de un
diseño de estudio de caso. Un diseño de estudio de caso es la estructura de un estudio que nos
permitirá responder preguntas de investigación. Se refiere a la lógica y estructura del estudio. Los métodos para analizar estudios de casos están menos sistemáticamente
desarrollados que las técnicas para analizar datos recopilados con otros tipos de
diseños de investigación. El análisis con estos otros diseños generalmente usa
técnicas estadísticas que se basan en tener muchos casos y giran en torno a la
comparación de grupos de casos. Además, los intentos de generalizar a partir de
estos diseños se basan en la teoría de la probabilidad que, a su vez, se basa en
tener suficientes casos de los cuales generalizar con un determinado nivel de
precisión y certeza.
análisis estadístico
Además, cuando los casos incluyen unidades de análisis integradas (véase el Capítulo 13), el
análisis de algunos niveles bien puede incluir el tipo de análisis típicamente asociado con otros
diseños. Por ejemplo, un estudio de caso de una región podría incluir una encuesta de
residentes en la región (siendo los residentes una unidad integrada dentro del caso). La
encuesta de los residentes incluiría el tipo de análisis que normalmente se usa en un diseño
transversal. Sin embargo, el enfoque del análisis general estaría en el caso como un todo: la
región. Los resultados de la encuesta serían simplemente una pieza en el rompecabezas para
construir una imagen de todo el caso.
Significado y contexto
252
DISEÑOS DE ESTUDIOS DE ANÁLISIS DEL ESTUDIO DE 253
CASO CASO
Variable independiente
Variable independiente
Xa
X Xa
Ya Patrón 1 Patrón 2
Dependent variable ya Patrón 1 Patrón 2 Patrón 3
Y6 Patrón 3 Patrón 4
Variable dependiente Patrón 4 Patrón 5 Patrón 6
Y6
Figura 15.1 Coincidencia de patrones para dos variables, cada una con dos Patrón 7 Patrón 8 Patrón 9
categorías
Yc
También esperaríamos que cuando exista Xb (sistema centralizado), le siga
de la misma manera que un experimento exitoso apoya una teoría. Sin embargo, si el Ya (bajos niveles de compromiso de los docentes).
caso no coincide con el patrón predicho, la teoría requiere modificación.
Nuestra prueba, incluso en este ejemplo muy simple de coincidencia de
Yin (1989) describe la coincidencia de patrones que varía en complejidad según el patrones, sería más interesante y más poderosa si estuviéramos probando
número de variables independientes y dependientes incluidas en los patrones teorías alternativas que predijeran diferentes patrones. Una teoría podría
predichos. predecir
El patrón que podríamos predecir para un caso particular que sabemos que tiene un valor Xa
en la variable independiente es que el caso tendrá un valor Yb en la variable dependiente
(resultado). La predicción toma la forma: si Xa entonces Yb.
Por ejemplo, nuestra teoría del desempeño laboral en las escuelas podría llevarnos
a esperar que cuando los nombramientos, despidos y ascensos del personal se
gestionan a nivel de la escuela local en lugar de un sistema altamente burocrático,
centralizado y remoto (variable X), el personal docente el compromiso (Y) será alto. Si
los sistemas de dotación de personal delegado se simbolizan como Xa y el alto nivel
de compromiso de los docentes se simboliza como Yb, nuestra predicción es:
Cuando existe Xa (sistema de dotación de personal local), entonces seguirá Yb (altos niveles de
compromiso de los docentes).
desempeño y un híbrido de modelos de dotación de personal centralizados
Figura 15.2 Patrones para dos variables cada una con tres categorías
y locales). posibles patrones que podríamos predecir. Por ejemplo, si
ambas variables tuvieran tres valores posibles, hay nueve patrones
patrón 1, mientras que una teoría competidora podría predecir el patrón 3. El estudio posibles que podríamos encontrar en cualquier caso particular (Figura
de caso nos permitiría ver qué patrón surgió y, por lo tanto, cuál de las teorías rivales 15.2). En esta situación, todavía predeciríamos un patrón particular para un
se apoyó en este caso. caso dado: si fueran Xa, podríamos predecir Ye
Por ejemplo, podríamos proponer las siguientes dos teorías rivales: Por ejemplo, podríamos tener una teoría sobre el impacto de los estilos de crianza
en el comportamiento infantil. Cada uno de estos dos factores podría tener tres
Teoría A El control local conducirá a un mayor compromiso con el trabajo porque el categorías, como se ilustra en la Figura 15.3. Usando este ejemplo, podríamos
esfuerzo y la 'adecuación' se ven y se recompensan (y se castiga la falta de esfuerzo predecir que las familias autoritarias producirán niños que son rebeldes (patrón 1) Un
y la falta de adaptación a las necesidades escolares). estudio de caso de una familia autoritaria ayudará a determinar si esta propuesta
recibe apoyo. Los estudios de casos repetidos de familias autoritarias proporcionarán
Teoría B El control local hace que las personas se sientan más desmoralizadas y una prueba más firme. Otra proposición puede ser que las familias permisivas
vulnerables a la política y los prejuicios locales, y no reconoce un desarrollo produzcan niños que se involucren constantemente en un comportamiento de prueba
profesional más amplio, etc. fomentando el rendimiento. límite (patrón 9).
v
Variables dependientes
i
tu
Independiente
vanables
De los padres Autoritario Autoritario Permisivo
Figura 15.4 Patrones lógicos con dos variables independientes y una variable
estilo de
autoridad dependiente
Otro enfoque para recopilar y analizar datos de estudios de casos es buscar casos
Obediente Patrón 1 Patrón 2 Patrón 3 Patrón 4 Patrón 5 Patrón 6
con resultados particulares (por ejemplo, niños muy obedientes) y predecir que estos
niños estarán ansiosos y tendrán padres autoritarios. En términos de las predicciones
Rebelde Patrón 7 Patrón 8 Patrón 9 Patrón patrón patrón de la Figura 15.4, hemos predicho esto, pero si encontramos casos de niños muy
obedientes que no están ansiosos ni tienen padres autoritarios, entonces nuestra teoría
10 11 12 necesita refinarse.
C
258
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 259
DE CASO CASO
Condición 1 Condición 2 A 1 2 3 1 2 3
Variables independientes
b
D 1 2 3 1 2 3
a
alto nivel de trabajador Alto grado de control directo
i
Moral 1 2 3 1 2 3
t
norte
Trabajar 1 2 3 1 2 3
mi 1 2 3 1 2 3
mi
calidad
d s
norte mi
Personal 1 2 3 1 2 3
mi yo
sintonía 2 3
pags
b
mi
a
Eficiencia 1 1 2 3
D
i
Figura 15.5 Patrones lógicos con una variable independiente y cinco variables dependientes r
a
Otra prueba de una proposición es si encontramos casos en los que se cumplen todas las v
condiciones pero el resultado no se produce. Por ejemplo, ¿encontramos casos de crianza autoritaria
y niños ansiosos en los que los niños no cumplen? Si lo hacemos, entonces nuestra proposición no t
está respaldada y nuestra teoría necesitará ser revisada para acomodar este tipo de caso.
norte
Patrones más complejos: variables dependientes múltiples La sección anterior se centró en mi
situaciones en las que predecimos una única variable de resultado bajo un conjunto particular de Innovación 1 2 3 1 2 3
condiciones (variables independientes múltiples). variable independiente) y predecir que esta d
pags
Aquí predecimos un patrón de resultados en los casos que cumplen la condición 1 y un patrón
diferente para los casos que cumplen la condición 2. El patrón es una combinación particular de mi
resultados. En este caso, predecimos que para los casos que cumplen la condición 1 (en la variable
independiente) encontraremos el D
Figura 15.6 Patrones previstos de resultados en cinco variables dependientes por nivel
de autonomía del trabajador
siguientes características en las cinco variables de resultado (A, B, C, D, E): A3, B3, C1, D2, E3. Para En otras palabras, predecimos que las organizaciones (casos) que permiten altos
los casos que cumplen la condición 2, predecimos un patrón diferente de resultados: A1, B1, C3, D2 niveles de autonomía entre los miembros de su fuerza laboral mostrarán un patrón
y E1. particular de resultados: alta moral + alta calidad del trabajo + baja rotación de personal
+ niveles moderados de eficiencia + altos niveles de innovación .
Esto se puede ilustrar con un ejemplo (Figura 15.6). La teoría que se utiliza aquí predice que la
autonomía conduce a mejores resultados que los altos niveles de supervisión. términos de moral, Se predice que las organizaciones con altos grados de supervisión y dirección se
compromiso con el trabajo, iniciativa y mejora de la calidad del trabajo. comportarán de manera diferente. Se prevé que tengan un conjunto diferente de
características de resultados: baja moral + baja calidad del trabajo + alta rotación de
personal + niveles moderados de eficiencia + bajos niveles de innovación.
260
DISEÑOS DE ESTUDIOS DE ANÁLISIS DEL ESTUDIO 261
CASO DE CASO
Aunque Yin (1989) trata este método de análisis como separado de la coincidencia
de patrones descrita anteriormente, la lógica es idéntica y, por lo tanto, debe tratarse
simplemente como una forma de coincidencia de patrones. En lugar de predecir un
patrón particular para un conjunto de variables, predice una tendencia particular o
secuencia de eventos. La estrategia analítica implica predecir un patrón particular de
cambio a lo largo del tiempo. Este tipo de análisis de patrones puede tomar una de
dos formas: análisis de tendencias y análisis cronológico (secuencia de eventos).
seguido de una estabilidad a más largo plazo) y hacer coincidir este patrón
previsto con el de los casos reales.
El análisis de tendencias podría ser mucho más complejo. En lugar de
simplemente predecir una tendencia diferente en la misma variable para diferentes No todos los estudios de tendencias tendrán una interrupción. Algunos
casos, una versión compleja del análisis de tendencias predeciría tendencias para un simplemente predecirán una tendencia que se anticipará en un contexto
conjunto de variables en cualquier caso dado. Por ejemplo, podríamos predecir que particular. Por ejemplo, podemos anticipar, a partir de lo que sabemos sobre
en un curso dado aumentarán las inscripciones, la proporción de mujeres a hombres el perfil demográfico y económico de una región (el caso), que es probable
mejorará con el aumento de los niveles de inscripción, habrá un aumento en los que experimente una disminución de la población a largo plazo. Se podría
estudiantes de edad madura y no habrá reducción en la calidad de la enseñanza. pronosticar que otra región con una combinación diferente de características
estudiantes. En otro curso, podríamos predecir una combinación diferente de demográficas y económicas experimentaría un crecimiento, mientras que se
tendencias: una matrícula constante, una disminución de los estándares, una podría pronosticar que otra región con un perfil diferente se estancaría.
disminución de estudiantes de edad madura y menos estudiantes mujeres. Análisis cronológico El análisis cronológico implica predecir una secuencia de
Los análisis de tendencias pueden ser interrumpidos o ininterrumpidos. El análisis de series eventos (o incluso una secuencia de tendencias) que involucra una cantidad
de tiempo interrumpido se refiere a una situación en la que un evento específico tiene lugar en de eventos o variables diferentes. Es decir, predeciríamos qué cambiaría o
algún lugar dentro de la secuencia de eventos. Esto nos permite examinar el patrón de eventos qué eventos ocurrirían y en qué orden. La secuencia de eventos podría ser
antes y después de la interrupción (o intervención). En este sentido, un análisis de series de una secuencia de causa y efecto o podría ser una secuencia descriptiva que
tiempo interrumpido es similar a un diseño de antes y después. Aunque no involucra un grupo de propone etapas particulares en un proceso.
control, realizaríamos estudios de casos en los que la interrupción ocurrió y no ocurrió. Si bien
no podemos controlar otras diferencias entre casos, podemos recopilar información detallada Ejemplos de una versión escalonada del análisis cronológico podrían ser
sobre todos los casos para permitirnos considerar si estos otros las diferencias (en lugar de la modelos que propongan etapas predecibles para convertirse en un
interrupción) podrían ser responsables del efecto aparente de la interrupción. consumidor de marihuana (Becker, 1966), etapas en la desintegración de las
relaciones íntimas (Vaughn, 1986), etapas en el proceso de ajuste a la
El análisis de tendencias interrumpidas implicaría predecir un patrón previo y
jubilación (Atchley, 1976), o cambios en las relaciones entre los adultos y sus
posterior a la interrupción (por ejemplo, disminución previa y aumento posterior,
padres a medida que los padres envejecen (Marsden y Abrams, 1987).
262
DISEÑOS DE ESTUDIOS ANÁLISIS DEL ESTUDIO DE 263
DE CASO CASO
Luego revisamos nuestros casos anteriores para ver si esto explica los diferentes
(siendo el resto de las cosas iguales). Alternativamente, podríamos anticipar que resultados. ¿Se destacan los casos exitosos por tener procesos de implementación
las escuelas que introdujeron un sistema de dotación de personal descentralizado diferentes al caso desastroso? Supongamos que los casos exitosos implementaron el
exhibirían una mejora en la calidad de la educación y que esta mejora sería mayor esquema solo después de una gran cantidad de consultas y hubo un amplio consenso
que en las escuelas que no introdujeron dicho sistema. sobre la conveniencia
Luego, seleccionaríamos un caso para probar nuestra propuesta (paso 3). Podríamos
encontrar una escuela que haya introducido recientemente un sistema de personal local.
Habiendo desarrollado una definición de lo que constituye la calidad educativa y resuelto
cómo medirla, podríamos realizar un estudio de caso para ver si la introducción del nuevo
sistema de dotación de personal había conducido a las mejoras previstas. Supongamos que
las mejoras previstas de hecho había tenido lugar. Esto respalda nuestra propuesta, pero el
apoyo no es abrumador y probablemente no convencería a un escéptico (paso 4). El
escéptico podría decir que un caso difícilmente prueba el punto, que puede haber habido una
mejora general en la calidad educativa en todas las escuelas durante el mismo período, y
que las escuelas que mantuvieron el antiguo sistema también podrían haber exhibido una
mejora en la calidad educativa. Como mínimo, podrían decir que podrían encontrar una
escuela con un sistema central que había mejorado su calidad de educación durante el
mismo período. También podrían argumentar que podrían encontrar ejemplos de escuelas
donde se introdujo el sistema local con consecuencias desastrosas para la calidad educativa.
Tendríamos que trabajar más: más estudios de casos (paso 5). Inicialmente, podríamos
buscar más casos de sistemas locales de dotación de personal recientemente introducidos
para verificar que el estudio de caso inicial no fue solo buena suerte.
Imaginemos que luego nos encontramos con una escuela a la que aluden nuestros
críticos, una en la que la introducción del nuevo sistema había sido un desastre. Había
conducido a la insatisfacción de maestros, estudiantes y padres, pérdida de moral y una clara
disminución en muchos aspectos de la calidad educativa. ¿Cómo podemos entender este
caso? ¿Qué tiene de diferente este caso que debería hacer que se comporte de manera
diferente a la que predijimos provisionalmente, y tan diferente de los otros casos que ya
hemos estudiado?
Dado que nuestro estudio debe producir una imagen completa de cada caso y su contexto
social y cultural, probablemente recogeremos algunas pistas iniciales. ¿En qué se diferencia
la escuela 'desviada' de las demás? Podríamos notar algunas características sobre el
proceso por el cual se introdujo el esquema descentralizado en la escuela en la que resultó
un fracaso. Por ejemplo, los docentes informan que se les impuso. No fueron consultados y
no existen procesos de apelación contra el decisiones del rector. Entonces, nuestra
corazonada es que el éxito de este tipo de esquema depende de la forma en que se
implemente.
Podríamos continuar con estudios de casos adicionales para comprobar qué tan
bien se sostiene esta propuesta. Además de analizar los casos en los que se introdujo
del esquema y el proceso por el cual iba a operar. Entonces estaríamos en una posición un sistema de dotación de personal local, debemos analizar algunos casos en los que
(paso 6) para modificar nuestra proposición provisional inicial para que diga algo como: se mantuvo el sistema centralizado. Esperaríamos no ver el mismo nivel de mejora en
'Cuando se implementa en un clima de consulta y consenso, los sistemas de personal la educación en estas escuelas. Si esto fuera así, fortalecería nuestra confianza en
descentralizados producirá mejoras en la calidad educativa. nuestra teoría inicial sobre el impacto de los sistemas locales de dotación de personal.
Sin embargo, nuestro próximo caso causa problemas. Hemos localizado otro caso donde Podríamos buscar casos que pudieran refutar nuestra teoría. Por ejemplo, si
el sistema de dotación de personal local también ha sido un desastre. En este caso, sin pudiéramos encontrar una escuela que hubiera mantenido el sistema centralizado y
embargo, el sistema se implementó sólo después de una cuidadosa consulta y con el pleno hubiera mostrado una mejora en la calidad educativa, podríamos mejorar aún más
acuerdo del personal y otros. Esto no es lo que esperábamos. ¿Por qué no encaja este nuestra teoría. Podríamos estudiar una escuela en la que hayamos identificado que
caso? Un examen más detallado del caso revela que la escuela ha tenido un nuevo director ha habido una mejora en la educación, pero se ha mantenido el sistema de dotación
designado desde que se introdujo el sistema. No se confía en este director y se cree que de personal centralizado. Esto iría en contra de nuestra propuesta revisada. En su
tiene favoritos. También se cree que victimiza al personal popular en particular. Tal vez estas contexto más amplio, existe una relación hostil entre la escuela y la comunidad local.
son las razones por las que el sistema no funcionó. Revisando casos anteriores, todas las Nos enteramos de que hubo un intento previo por parte del consejo escolar (en el que
historias de éxito tenían directores que gozaban del aprecio y confianza de muchos. había muchos representantes de la comunidad local) de introducir un esquema de
dotación de personal local. Los maestros se habían resistido con éxito. esto y sintieron
¿Tienen algo en común los dos fracasos? Aunque los casos son diferentes en ciertos que el sistema centralizado de dotación de personal los estaba protegiendo.
aspectos, lo que tienen en común es que los docentes no tienen ninguna confianza en el
sistema. En un caso se les impuso sin consultar. En el otro, el director ha socavado su Cuando aprendemos estas cosas sobre lo que a primera vista parece un 'caso
confianza en la imparcialidad del sistema. Entonces podríamos modificar nuestra propuesta desviado' que refuta nuestra proposición, de hecho confirma aún más
revisada a algo como: 'Cuando los docentes tengan confianza en la imparcialidad de un
sistema de dotación de personal delegado, esto conducirá a mejoras en la calidad de la
educación.'
266
DISEÑOS DE ESTUDIOS
DE CASO
Nota
nuestra proposición que enfatiza la noción de que los maestros deben tener confianza 1 Por supuesto, esta lógica asume que nuestra variable causal es el único factor que
en el sistema. Quizás este caso nos haría ampliar aún más nuestra propuesta para puede producir un resultado dado. Si encontramos casos en los que ocurren los efectos
enfatizar la importancia de que los docentes tengan confianza en el sistema e identificar pero nuestra causa favorita está ausente, entonces tenemos explicaciones alternativas
los factores que producen esa confianza en lugar de enfatizar la importancia de un del fenómeno. Nuestro diseño de investigación debe diseñarse para eliminar tales
sistema local o centralizado en sí mismo. explicaciones alternativas.
Resumen
Este capítulo ha enfatizado el punto de que el análisis de estudio de caso debe ser
fundamentalmente una empresa teóricamente informada. Esto se aplica igualmente a
los estudios de casos descriptivos y explicativos. Se discutió el uso de tipos ideales
como método para analizar estudios de casos descriptivos. Se describieron dos
métodos amplios para analizar los estudios de casos con fines explicativos. Cuando los
estudios de casos se utilizan para probar una teoría, la coincidencia de patrones
proporciona una forma adecuada de analizar y comparar casos. múltiples variables
independientes y dependientes. Cuando se utilizan estudios de casos para construir una
teoría, la inducción analítica proporciona una forma útil de analizar y utilizar cada estudio
de caso.
and Methods.Beverly Hills and London:Sage.
Cohen, J. (1987) Análisis de poder estadístico para las ciencias del comportamiento.
Nueva York: Academic Press.
Blumer, H. (1956) 'Análisis sociológico y la "variable"', American Sociological Review, 21:683-90. de Vaus,DA(2001) Surveys in Social Research.Londres:Routledge.
Brown, GW y Harris, T. (1978) Los orígenes sociales de la depresión: un estudio de los trastornos de Vaus, DA y Wolcott, I. (eds)(1997) Australian Family Profiles: Social and Demographic
psiquiátricos en mujeres. Londres: Tavistock. Patterns. Melbourne: Instituto Australiano de Estudios Familiares.
Buck, N., Ermisch, J. y Jenkins, S. (1995) Elegir un diseño de encuesta longitudinal: los problemas,
Centro de investigación ESRC sobre cambio microsocial, Universidad de Essex. Campbell, DT
(1989) 'Prólogo', en RKY en (ed.), Investigación de estudio de caso: Diseño
268
REFERENCIAS REFERENCIAS 269
Freud, S. (1955) Two Case Histories (Little Hans and Rat Man). Londres: Hogarth Press
Dillman, D. (1978) Encuestas por correo y teléfono: el método de diseño total. Nueva York: y el Instituto de Psicoanálisis.
Wiley.
Geertz, C. (1973) 'Descripción densa: hacia una teoría interpretativa de la cultura', en
Durkheim,E.(1970) Suicide.Londres:Routledge and Kegan Paul. C.Geertz (ed.), La interpretación de las culturas: Ensayos seleccionados. Nueva York:
Basic. págs. 3-32.
Foddy, W. (1993) Construcción de preguntas para entrevistas y cuestionarios: teoría y práctica
en investigación social. Cambridge: Cambridge University Press. Freeman, D. (1984) Margaret Gerth, HH y Wright Mills, C. (1946) De Max Weber: Ensayos de sociología. Oxford:
Mead y Samoa: el hacer y deshacer de un Oxford University Press.
Goode, WJ y Hatt, PK (1952) Métodos en investigación social. Londres: McGraw-Hill. Kerlinger, FN (1973) Fundamentos de la Investigación del Comportamiento. Nueva
York: Holt, Rinehart and Winston.
Graetz, B. (1993) Consecuencias para la salud del empleo y el desempleo: evidencia
longitudinal para hombres y mujeres jóvenes', Social Science and Medicine, 36:715-24. Kerlinger, FN (1979) Behavioral Research: a Conceptual Approach. Nueva York: Holt,
Rinehart and Winston.
Grimm, LG y Yarnold, RR (1995) Lectura y comprensión de estadísticas multivariadas.
Washington: Asociación Americana de Psicología. Kerlinger, FN y Pedhazur, EJ (1973) Regresión múltiple en la investigación del
comportamiento. Nueva York: Holt, Rinehart y Winston.
Groves, RM (1979) 'Actores y preguntas en encuestas telefónicas y entrevistas personales',
Public Opinion Quarterly, 43:190-205. Kimmel, AJ (1988) Ética y valores en la investigación social aplicada. Beverly Hills y
Londres: Sage.
Groves, RM y Kahn, RL (1979) Encuestas por teléfono: una comparación nacional con
entrevistas personales. Nueva York: Prensa Académica. Lepkowski,JM(1989) Tratamiento de la falta de respuesta de onda en encuestas de
panel', en D. Kasprzyk,G.Duncan,G.Kalton y MP Singh (eds), Panel Surveys.Nueva
Hage, J. y Meeker, BF (1988) Causalidad social. Londres: George Allen y Unwin. York:Wiley.
Hakim,C.(1986) Diseño de Investigación: Estrategias y Opciones en el Diseño de Investigación Lewis, O. (1951) La vida en un pueblo mexicano: Tepoztlán reestudiado. Urbana, IL:
Social. Londres: Allen and Unwin. Prensa de la Universidad de Illinois.
Henry,GT(1995) Gráficos de datos: técnicas de visualización y análisis. Thousand Oaks, CA: Loether, HJ y McTavish, DG (1974a) Estadística inferencial para sociólogos: una
Sage. introducción. Boston: Allyn and Bacon.
Hertel, B. (1976) 'Minimización de la varianza del error introducida por el análisis de datos Loether, HJ y McTavish, DG (1974b) Estadísticas descriptivas para sociólogos: una
faltantes en el análisis de encuestas', Sociological Methods and Research, 4:459-74. introducción. Boston: Allyn and Bacon.
Hochschild, A. (1989) The Second Shift. Nueva York: Avon. Lynd, RS y Merrell-Lynd, H. (1929) Middletown: un estudio sobre la cultura americana
moderna. Nueva York: Harcourt, Brace and World.
Homan,R.(1991) La ética de la investigación social. Londres: Longman.
Lynn,P.,Purdon,S.,Hedges,B.and Mcaleese,I.(1994) 'Una evaluación de las estrategias
Homans, G. (1961) Comportamiento social: sus formas elementales. Nueva York: Harcourt, de ponderación alternativas', Informe de encuesta de cohorte juvenil, Departamento de
Educación, Sheffield.
Brace, Jovanovich.
Marsden, D. y Abrams, S. (1987) Libertadores, compañeros, intrusos y cucos en el
Johnson, A. (1977) Estadísticas sociales sin lágrimas. Nueva York: McGraw-Hill. nido: una sociología de las relaciones de cuidado durante el ciclo de vida', en P. Allatt,
T. Keil, A. Bryman y B. Bytheway (eds), Women and the Life Cycle: Transitions and
Kalton,G.(1983a) 'Compensación de datos de encuestas faltantes', Serie de informes de
Turning-Points. Londres: Macmillan.
investigación, Instituto de Investigación Social, Universidad de Michigan.
Marsh,C.(1982) El método de la encuesta: la contribución de las encuestas a la
Kalton, G. (1983b) Introducción al muestreo de encuestas.Beverly Hills, CA: Sage. Kalton, G.
explicación sociológica. Londres: George Allen y Unwin.
(1986) 'Manejo de la falta de respuesta de onda en encuestas de panel', Journal of Official
Statistics, 2: 303-14. Marsh,C.(1988) Exploración de datos: una introducción al análisis de datos para
científicos sociales. Cambridge: Polity.
Kellehear, A. (1993) El investigador discreto: una guía de métodos. St Leonards: Allen and
Unwin. Mead,M.(1943) La mayoría de edad en Samoa: un estudio de la adolescencia y el sexo
en las sociedades primitivas.Harmondsworth:Penguin.
Merton, RK (1968) Teoría social y estructura social. Nueva York: Prensa libre. Milgram,
S. (1964) Problemas en el estudio de la obediencia: una respuesta a Baumrind',
American Psychologist, 19: 848-52.
Mueller,JH,Schuessler KFand Costner,HL(1977) Razonamiento estadístico en Roethlisberger FJand Dickson, WJ (1939) Gestión y el trabajador. Cambridge, MA:
sociología.Boston:Houghton Mifflin. Prensa de la Universidad de Harvard.
270
REFERENCIAS
Rosenberg, M. (1968) La lógica del análisis de encuestas. Nueva York: Básico. ÍNDICE
Spector,PE(1981) Diseños de investigación.Beverly Hills, CA:Sage.
Tajfel, H. (1984) La Dimensión Social: Desarrollos Europeos en Psicología Social. identificar el sesgo de datos
diseños transversales,179-80,182
faltantes,149
Cambridge: Prensa de la Universidad de Cambridge.
eliminando
Vaughn, D. (1986) Desacoplamiento: puntos de inflexión en las relaciones íntimas. Nueva Rango de cohorte de edad, 212,
estadísticamente,135,136,152
York: Oxford University Press.
Efectos del
Whyte, WF (1943) Street Corner Society: la estructura social de un barrio marginal italiano. pruebas de efectos,77
envejecimiento,115,124,211,212-13,
Chicago: Prensa de la Universidad de Chicago.
215 ponderación,151-2
Yin,RK(1989) Investigación de estudio de caso: diseño y métodos. Beverly Hills y Londres:
Sage. diseños longitudinales, 132
Yin, RK (1993) Aplicaciones de la investigación de estudios de casos. Beverly Hills y Londres: Diseño del grupo Solomon 4, 133 CAPÍ, 141-2
Sage.
Cambio agregado Estudios de caso
seis pasos, 263 tipos, 228-9 minimizar los efectos, 135-6 Relaciones causales
ÍNDICE yo ÍNDICE
272
273
a juego, 178 diseños de estudio de caso de una sola toma, 230 operativo, 24, 27 relación espuria,204,207
ajuste del modelo, 179-80 puntos de tiempo, 42-3 Características de la demanda,24 pasos, 203-4
probabilístico, 4-5 Recolección de datos asistida por computadora, variable dependiente,19,36 tipos de patrones causales,36-9
ver también dirección causal dimensiones,25,26 preguntas de investigación descriptivas, 17-19 Unidades de análisis integradas, 220-1
Tendencia central,medidas de,92-3 naturaleza de, 24 tipologías empíricas,225 Igualdad de varianza, 103,
ver gráficos CAPÍ, 141-2 tipologías inductivas,226 ver error de medición; muestreo
272
error de medición, 156 Confidencialidad con estudios de casos, 224-5 anonimizar datos, 192
cambio cualitativo,154 diseños longitudinales, 146 tendencia central, 195 seguridad de datos, 146
cambio cuantitativo, 154 contexto legal,87 distribuciones de frecuencia, 195 engaño, 246
puntajes de cambio sin procesar, 155-6 límites, 87 gráficos, 195 disfrazando la identidad,246
confiabilidad y cambio bruto, 156 ver también anonimato análisis de tipo ideal, 251 daño a los participantes,145,193
puntajes de cambio residualizados, 156 Contexto teorías implícitas, 251 comportamiento ilegal/dañino,246
véase también cambio agregado,individual análisis de estudio de caso, 234-6,250 curtosis, 195 estudios de casos, 246-7
cambio Grupos de control forma de distribuciones, 195 diseños de secciones transversales, 192-3
Cambiar puntajes, 110 fortalecimiento de la validez interna,73-5 sesgo, 195 consentimiento informado,145,246,85-6
Cambio, describiendo, 163-8 Correlación, 95, propagación, 195 diseños longitudinales, 144-6
mesas, 163 estudios de casos, 242 tipologías,252 responsabilidad hacia otros investigadores,247
Análisis de cohortes, 115-18, 211-17 diseños longitudinales, 140-1 ver efectos de envejecimiento ver consentimiento informado, voluntario
rango de cohorte de edad, 212 Covariación, 34-5 Relaciones directas,36-9,65,71 participación, anonimato, daño a
efectos del envejecimiento,115,211 Observación encubierta, 246 ver también efecto causal Participantes
cambio agregado, 211 estudios de casos, 246 Distribuciones, describiendo Experimentos, 53-112
ver grabación estudios de casos, 246 tablas condicionales, 204-5 estrechez explicativa de los experimentos,
diferentes métodos, 40-7 Véase también consentimiento informado relaciones causales indirectas,204, explicación idiográfica,221,233-4
significativo, 43-6 Razonamiento deductivo,6-8,253-62 efectos de interacción, 204-5 papel de los experimentos,70
274 4 ÍNDICE
inmigración y emigración,137
imputación
generalización
estadística,237,240,249 análisis descriptivo, 195 engaño,78
prueba de efectos de sesgo,77 ver datos faltantes distorsiones, 164-7 cuanta información, 85
generalización teórica, 237, 240, Muestras independientes, 101-2 diferencias de grupo, 97-8 experimentos, 84-6
variables traneas,19-20,37-9 véase también operacionalización dos variables en un gráfico, 167-8 Inmigración,120,137
mineralización, 28 edificio
establecimiento de significado, 181-4 estudios de casos, 236 Escalera de abstracción, 24 imputación de oleadas anteriores,151
diseños de secciones transversales, Nivel de medida,90-2 falta de respuesta del artículo, 147
historia,73-4,132,177,236
177
intervalo, 91 por parejas, 151
explicaciones ideográficas, 233-4 experimentos, 73-4
asignación aleatoria dentro de los
estudios de casos, 233-7 diseños longitudinales,132,133 nominal,91-2
grupos
experimentos, 72-6 Significado,5,11 ordinales, 91 imputación,150
diseños longitudinales, 131-5 establecimiento de significado, 181-4 Análisis del curso de vida, 118 imputación basada en regresión,151
mortalidad,75-6,134-5,177 proporcionando significado, 182 panel cf tendencia, 113 falta de respuesta de la unidad, 147
explicaciones nomotéticas, 233-4 análisis de variables, 181 prospectivo cf retrospectivo, 113-14 ola sin respuesta, 147
selección,75 Error de medición, 29-32,89,134,156,157 propósito de,115-18 ver también falta de respuesta
Mortalidad,134-5 ver cambio agregado 177
experimentos, 75-6
Cambio de macros
diseños de secciones transversales,
Efectos principales, 65
276 DEX EN DEX
EN 277
Múltiples grupos tipos sustanciales y teóricos,22-4 Reactividad grupos difíciles de encontrar, 123
diseño de estudio de casos múltiples, 226 técnico y metodológico,24 estudios de casos, 236 paneles de agrupación, 123
diseño de cohortes múltiples, 124 Post test solo con grupo control Recuerdo propósito, 122
diseño experimental de grupos múltiples, Predicción, 3-4 eventos memorables, 128 Tamaño de la muestra
Múltiples puntos de tiempo ver confidencialidad recordar problemas, 127 diseños de secciones transversales, 187-90
diseño de panel de múltiples puntos, 119-20 Muestreo probabilístico,79,90 diseños retrospectivos, 140 determinantes de,187-188
Cambio neto diseños de estudios de casos, 227-8 enfoques sustantivos,196-7,198 diseños de estudio de caso único y múltiple,
ver cambio agregado desventajas, 127 Grabar diseños de enlaces, 128 226-7
suposición de, 102 cambio, 154 Reemplazo por desgaste, 137 diseños de estudios de caso, 240
relación crítica, 100 datos, 191 implicaciones del análisis, 122 intervalo de confianza, 189
pruebas t, 100 estudios de casos, 230-1 estrategias, 121 nivel de confianza, 189
Comparaciones de un grupo con valor conocido, cf cualitativo,10 análisis de elaboración,205-6 número de casos, 240-1
Definición operativa, 24,27 estudios de casos, 249-50 teórico,239,262-3 error de muestreo, 188
Sobremuestreo,143,187-8 cambio agregado, 128-9 método cf, 9-10 casos típicos, 240
Diseño de muestra pareada, 102 Longitud del cuestionario, 190-1 definición,8-9 varianza, 190
Acondicionamiento de paneles, 143 Error aleatorio, 31 Pregunta de investigación, Error de muestreo, 89, 92, 99, 188,
Panel de datos, análisis, 155 ver muestreo probabilístico explicativo, 19-21 Construcción a escala,148,151
protocolos de investigación,242 resentimiento del grupo de control,81 Carga del demandado,139-40,143,190-1 Selección de casos,238-41
Observación participante,246 tamaño del grupo, 81 eventos de anclaje, 128 detección de casos,239,241-2
estudios de casos, 246 límites de asignación aleatoria,81 estudios de casos, 227-8 estudios de casos, 238-40
Cambio porcentual, 156-7 rechazos, 81-2 eventos memorables, 128 muestreo, 240
problemas, 157 Puntuaciones de cambio sin procesar, 155-6 telescópico inverso, 140 Diseños de estudios de casos secuenciales,227
confiabilidad, 157 calcular, 155-6 telescópico, 140 Forma de las distribuciones, 94-5
Efectos de periodo,124,115-6,211,213-14,216, puntajes extremos, 156 Diseño de panel giratorio,122-3,133 Diseño de paneles sencillos
Hipótesis rivales plausibles,9,11-14, problemas, 156 evitar el agotamiento, 122 sesgo, 120
estudios de casos, 224 regresión a la media, 156 efectos condicionantes, 123 inmigración y emigración,120
fuente de,21,22-4
276 confiabilidad,156 validez externa,137 tamaño de la muestra,120
Diseño de estudio de caso único,226 diseño de estudio de caso, 221-6 lógica de, 201 Análisis de tendencias,111,260
dotación de personal estudios de casos, 252-3 diseños longitudinales, 134 Falta de respuesta de la unidad, 147
diseños longitudinales, 144 análisis cronológico, 261-2 Resúmenes estadísticos,97,99 Unidades de análisis,18
amenazas,24 Olas
Varianza,muestra,190 Pesos,76,136,188
sesgo, 84