Está en la página 1de 18

MÓDULO 0614 - METODOLOGÍA II.

EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 1

INDICE

LA OBSERVACIÓN.......................................................................2
UNIDAD II. Definición y características de la metodología observacional ...2
Codificación de la conducta.......................................................3
Elección de las conductas a observar....................................4
FUNDAMENTOS TEÓRICOS Y Unidades conductuales..........................................................4
Sistemas de categorías..........................................................5
PRÁCTICOS DE LA Recogida de datos observacionales..........................................6
Medidas conductuales ...........................................................6
OBSERVACIÓN DIRECTA Muestreo observacional y sesiones de observación..............7
Reglas de muestreo intrasesional de sujetos y reglas de
registro ...................................................................................9
Obtención de medidas conductuales a partir del registro ....11
Control de la calidad de los datos............................................12
Fiabilidad..............................................................................12
Precisión ..............................................................................14
Lectura 2 Validez .................................................................................14
Quera, V. y Behar, J. (1997). La observación. En G. Sesgos del observador y de la observación ........................14
Buela y J. Sierra (dirs.). Manual de Clases de análisis de datos .....................................................16
Evaluación Psicológica. Madrid: Siglo Áreas de aplicación de la metodología observacional.............17
XXI. (Cáp. 15).

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 2

LA OBSERVACIÓN personas adiestradas en ese fin concreto, a las que no se les


suministra información acerca de las hipótesis y los objetivos
Definición y características de la metodología de la investigación, con el propósito de evitar o minimizar sus
observacional expectativas, que falsearían, los datos obtenidos.
5. Debe evitarse o reducirse el intrusismo del observador con el
En psicología existen áreas de estudio en las que el fin de que ello no provoque reactividad en el comportamiento
comportamiento de los sujetos no puede investigarse mediante de los sujetos observados, y su consecuente falta de
ninguna de las estrategias tradicionales, como las metodologías espontaneidad.
experimental y selectiva o correlacional, sino que únicamente es 6. Permite estudiar conductas que no sería ético provocar (por
accesible a través de la observación. Esto es así porque la ejemplo, el pánico).
observación sistemática es una estrategia científica que permite 7. Puesto que el interés del investigador consiste en averiguar
cuantificar la conducta espontánea de los sujetos en el momento qué covariaciones existen entre el comportamiento y las
en que se produce y en su entorno natural, sin introducir variables externas a él, o entre diferentes tipos de
elementos de distorsión (Hutt y Hutt, 1970; Sackett, Ruppenthal y comportamiento, es necesario que en los datos se refleje una
Gluck, 1978). Las características fundamentales de la amplia heterogeneidad de variables conductuales, aspecto
metodología observacional son (Wright, 1960; Weick, 1968; que sólo es posible lograr obteniendo muchos datos de cada
Anguera, 1981, 1985; McRae, 1995; Bakeman, 1997; Bakeman y sujeto, es decir, observándolo durante largo tiempo. Los
Gottman, 1997): datos obtenidos al aplicar la metodología observacional
pueden analizarse de muy diversas formas, siempre de
1. Se aplica al estudio del comportamiento espontáneo, por lo acuerdo a las hipótesis y los objetivos prefijados; sin
que no existe una manipulación de variables con el propósito embargo, debido a que estos datos tienen la forma de
de averiguar cómo afectan al comportamiento. Por el secuencias temporales, un tipo de análisis idóneo es el
contrario se registran, de un modo controlado, los valores de llamado "análisis secuencial", que permite averiguar cuál es
las variables, tanto ambientales como conductuales, y a la dinámica temporal del comportamiento.
continuación se analizan sus covariaciones. La ausencia de
manipulación garantiza que no existe distorsión en el La metodología observacional se aplica muchas veces en
comportamiento registrado. investigaciones de corte inductivo, y, por lo tanto, no basadas en
2. Se emplean observadores adiestrados que registran la teorías. Ello ha alimentado la creencia errónea de que la
conducta en el momento en que se produce, y lo hacen observación sistemática sólo debe emplearse en ausencia de
ciñéndose a unos códigos conductuales que han sido hipótesis concretas. No obstante, la metodología observacional
definidos de forma objetiva por el investigador, y siguiendo no es intrínsecamente inductiva, como tampoco la
unas reglas de registro y de muestreo determinadas. experimentación es intrínsecamente hipotético-deductiva. Sea
3. Los observadores son entrenados periódicamente y se cual sea la forma de proceder (inductiva o deductiva), el
controla la calidad de los datos que obtienen mediante investigador observacional plantea objetivos y establece
técnicas de análisis de la fiabilidad y la precisión de sus conjeturas acerca de qué espera encontrar en los datos. Si estas
registros. conjeturas se derivan de una teoría por deducción lógica,
4. El investigador o investigadores dirigen y planifican el estudio, entonces se denominan, con todo rigor, hipótesis. Si se
pero no actúan como observadores. Los observadores son establecen sin que exista una teoría previa, basándolas, por

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 3

ejemplo, en resultados de investigaciones anteriores, entonces padre está ausente que cuando está presente?». Las mismas
pueden denominarse también hipótesis, con menos rigor, o variables conductuales que en el ejemplo anterior, más una
simplemente conjeturas, lo cual no comporta que la investigación variable ambiental, "presencia del padre".
se deprecie o sea de rango menor. En cualquier caso, cada
hipótesis que se plantea en la metodología observacional Es necesario que todas las variables estén operativizadas,
relaciona, como toda hipótesis, al menos dos variables lo que implica medibles de forma totalmente objetiva. Por lo
totalmente operativizadas. En esta disciplina las variables que se tanto, es de capital importa las variables o códigos conductuales
utilizan son de tres tipos (Johnston y Pennypacker, 1980): que se emplean en la investigación estés dos de manera que los
observadores no puedan efectuar interpretaciones su o
1. Variables conductuales. Son códigos conductuales que toman idiosincrásicas de las mismas. Ello requiere una especial
dos valores, presencia y ausencia, y que el observador atención cuando son de naturaleza molar e inferencial (por
asigna a los segmentos de conducta del sujeto observado ejemplo, códigos como "agrede", etc.). Por tanto, la codificación
(Sackett y cols., 1978). Cada código es un tipo de conducta de la conducta a observar etapa no sólo necesaria sino crucial en
que el investigador ha definido de modo objetivo de acuerdo cualquier investigación observacional, Io que, junto con los
con los fines de su investigación. A lo largo de una sesión de observadores entrenados, constituye el instrumento de medí la
observación se espera que cada uno de los códigos presente metodología observacional (Bebas; 1991).
variabilidad.
2. Variables ambientales. Son propiedades susceptibles de Codificación de la conducta
evaluación del entorno natural de los sujetos observados, que
el investigador considera que pueden estar relacionadas con La metodología observacional debe enfrentarse a un
su comportamiento (por ejemplo, la presencia o la ausencia material de enorme complejidad, la conducta, que es preciso
del maestro cuando se estudia la conducta de un alumno acotar y cuantificar. Cualquier intento por alcanzar un
durante un examen). conocimiento objetivo de la conducta debe pasar, como en toda
3. Variables de sujeto. Son atributos de los sujetos observados ciencia, por obtención de unidades definibles y diferenciables. Si,
que no sufren variabilidad intrasujeto ni pueden ser alterados con objeto de obtener datos sobre la conducta, se realizan
durante la investigación (por ejemplo, la edad, las variables únicamente observaciones no estructuradas; procediendo
de personalidad o el sexo). simplemente a anotar los eventos que se suceden, y utilizando
para ello el lenguaje habitual, es muy difícil captar la estructura
Como mínimo una de las variables entre las cuales se de la conducta o establecer relación entre diversos aspectos de
establece relación en las hipótesis debe ser una variable la misma. Por esta razón es necesario, para conseguir una
conductuyal. Por ejemplo: información objetiva y cuantificada de la conducta, ajustarse a
1. «¿Lloran más los bebés de madres primíparas que los de ciertas normas y, de este modo, la elaboración de un sistema de
madre; ras?». Una variable conductual, "el bebé llora", y una categorías de conducta es una fase fundamental. En este
variable del sujeto "primiparidad". apartado se trata de cómo transformar el flujo conductual en
2. «¿Disminuye la probabilidad de que el bebé llore después de datos objetivos a partir de los cuales sea posible contrastar las
que hable?». Dos variables conductuales, «el bebé llora» y hipótesis o conjeturas.
«la madre «¿La disminución de la probabilidad de que el
bebé llore después la madre le hable es mayor cuando el

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 4

Elección de las conductas a observar observacional, pues facilitan un primer abordaje de las conductas
que serán objeto de estudio.
La cuestión ¿qué es lo que deseamos conocer, cuál es el
problema planteado? lleva a delimitar ciertos aspectos del flujo Unidades conductuales
conductual, a elegir unas partes de un todo; en definitiva, a
realizar un muestreo conductual. Una vez concretado el objetivo, El material obtenido a partir de la observación no
un primer paso aconsejable es proceder a una observación no sistemática debe ser estudiado y analizado con objeto de
sistemática de la conducta (León y Montero, 1995). En esta etapa segmentar el flujo conductual y obtener así las unidades
el observador no realiza ningún control y se limita a recoger conductuales. Esta segmentación no puede ser arbitraria y debe
aquello que considera relevante para posibilitar la diferenciación apoyarse en determinados indicios. Existen diversos indicadores
de unos eventos de otros, y estimar cuáles guardan relación con de segmentación en función de distintos criterios. Sulzer-Azarof y
las preguntas plantea-das. Sin esta precisión, y ante la duda de Reese (1982) proponen analizar las tareas y subdividirlas en
lo que es realmente importante, se recogería un número excesivo diversos componentes o segmentos. Por ejemplo, la tarea
de datos que en realidad no guardarían relación con el objeto de "conducir un automóvil" podría subdividirse en los componentes:
la investigación. Esta fase de observación preliminar, cuyos datos abrir la puerta, sentarse, cerrar la puerta, abrocharse el cinturón
no deben incluirse en el análisis final, proporciona material en de seguridad, poner la llave de contacto, etc. Rosenblum (1978)
bruto para plantearse cuestiones y formular hipótesis y asimismo sugiere tener en cuenta dos dimensiones: un cambio marcado en
facilita una aproximación a la conducta objeto de estudio que la intensidad motriz y un cambio en la orientación del sujeto
resulta imprescindible para proceder posteriormente a la durante la conducta. En el segundo criterio considera también la
codificación de la misma (Martin y Bateson, 1986). Los datos existencia de contacto con un objeto, ya sea inanimado o social.
obtenidos en esta primera fase presentan las características de El tamaño de las unidades, es decir, su molaridad o
un sistema verbal (Fassnacht, 1982), con signos propios del len- molecularidad, viene también dictado en cierta medida por el
guaje y con una relación entre los signos correspondiente a la objetivo de la investigación. Por ejemplo, si se desean estudiar
sintaxis. El uso del lenguaje cotidiano en el registro y la ausencia las pautas motrices del recién nacido se impondrán de forma
de cualquier tipo de norma o limitación en cuanto a qué registrar natural unidades moleculares que recojan con el mayor detalle
y cómo registrarlo implica: posible los diversos movimientos que los bebés sean capaces de
realizar. En cambio, en una investigación sobre habilidades
1. Subjetividad en la elección de las conductas a observar. sociales las unidades deberían reflejar conductas de mayor
2. No comparabilidad de los registros de observadores distintos, complejidad, que, al incluir diversos segmentos conductuales,
ya que pueden estar utilizando expresiones diferentes para implican mayor molaridad. Sin embargo, a pesar de esta
describir una misma realidad. determinación inicial, el investigador toma su propia decisión so-
3. Dificultad en la cuantificación. bre el tamaño de las unidades a utilizar, y, aun respetando la
orientación derivada del objetivo de la investigación, marca el
Desde una perspectiva histórica los sistemas verbales grado de molaridad o de molecularidad. De este modo, en
fueron los primeros en ser utilizados en la observación, en una sistemas de codificación empleados para captar la interacción en
época en que la metodología observacional carecía de la entidad la pa-reja es posible hallar desde sistemas como el MICS-III
actual. En la actualidad, los sistemas verbales son una forma de (Weiss,1985), con unidades de relativa molaridad, hasta otros
registro inicial y casi imprescindible en toda investigación como el DCS (Julien y cols., 1989), en el que cada unidad abarca

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 5

20 minutos. Si, por el carácter exploratorio del trabajo, los conceptuales entre ellas; asimismo, es aconsejable en ocasiones
objetivos no están claramente definidos, es preferible codificar establecer separaciones temporales disyuntivas entre las
conductas moleculares y, posteriormente y si se considera unidades. Estas relaciones entre unidades de conducta son la
oportuno, combinarlas para conseguir unidades molares. mutua exclusividad y la exhaustividad. Un conjunto cíe unidades
Por otra parte, en función de su contenido las unidades mutuamente excluyentes entre sí (tanto conceptual como
pueden clasificarse en estructurales (o morfológicas) y temporalmente) y además exhaustivas (como mínimo
funcionales. Las primeras corresponden a localizaciones conceptualmente) se denomina sistema de categorías de
concretas en el dominio espacio-temporal (Schleidt, 1982). Por conducta. Un sistema de categorías es un sistema nominal
ejemplo, "dar patadas": golpe dado con la planta del pie; (Passnacht, 1982). Un conjunto de unidades en las que no exista
"acariciar", rozar suavemente alguna parte del cuerpo del otro exclusividad mutua entre todas ellas y/o no sean
con la mano. En estas unidades se realiza una descripción por conceptualmente exhaustivas recibe a veces el nombre de
operación. Las unidades funcionales se definen por las sistema de rasgos distintivos. Mientras que un sistema de
consecuencias que producen en el entorno físico o social, es categorías es cerrado, un sistema de rasgos distintivos puede
decir, no por los movimientos que componen las acciones sino considerarse abierto o incompleto. Definir sistemas de categorías
por los productos de dichas acciones. Se trata de descripciones es de especial utilidad, pues facilita el trabajo observar y registrar
por con-secuencia; por ejemplo, "coser un vestido", "escribir un en vivo y permite llevar a cabo más cómodamente determinados
libro" o "hacer un programa de radio". Sean de uno u otro tipo, las análisis de los datos. Cuando las unidades de conducta son
unidades de conducta deben definirse de forma objetiva y categorías, registrar una de ellas hace imposible registrar otra
completa. Objetiva, utilizando en la definición características ob- simultáneamente. Asimismo, siempre existirá una categoría para
servables de la conducta y evitando en todo momento cualquier registrar los segmentos conductuales relacionados con el objetivo
tipo de interpretación; y completa, precisando los límites de la de la investigación, ya que el sistema debe ser conceptualmente
unidad, para de este modo facilitar la discriminación entre las exhaustivo. Es también posible, pero no siempre necesaria, la
diversas unidades. En la definición deben emplearse expresiones exhaustividad temporal. En cada categoría es posible diferenciar
claras y sencillas que eviten la ambigüedad. De acuerdo con su un núcleo conceptual y un nivel de plasticidad o grado de
duración, las unidades de conducta se consideran eventos apertura (Anguera, 1991). El núcleo conceptual de una categoría
cuando son segmentos de duración muy pequeña, o menor que está compuesto por los elementos comunes que existen en los
la unidad de tiempo fijada por el investigador, y se consideran diversos segmentos conductuales que son clasificados en la
estados cuando su duración es mayor que esa unidad. En misma. Este núcleo confiere significado a la categoría y la
general, son eventos todos aquellos segmentos que son identifica y diferencia respecto a otras categorías. El nivel de
transitorios (por ejemplo, "levantar las cejas", "salir de casa", plasticidad o grado de apertura de una categoría es el grado de
"sentarse"), y estados, todos aquellos segmentos que diversidad de los diferentes segmentos conductuales adscritos a
representan una permanencia (por ejemplo, "dormir", "estar ella. Si tras poner a prueba el sistema de categorías se verifica
sentado", "llorar"). que éste no cumple los requisitos de exhaustividad conceptual y
de mutua exclusividad de las categorías, es posible reelaborar el
Sistemas de categorías sistema hasta conseguirlo. De este modo, si se produce
coocurrencia entre dos categorías (ausencia de exclusividad)
Las unidades de conducta deben articularse en un cabe recurrir a dos procedimientos:
sistema o conjunto de manera que resulten claras las relaciones

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 6

1. Establecer prioridades. Si dos unidades de conducta tienden Quera, 1995a). Por lo tanto, no siempre puede considerarse
a ocurrir simultáneamente, entonces se establece cuál de indispensable imponer la restricción de mutua exclusividad tem-
ellas debe registrarse, en detrimento de la otra; ello supone poral cuando es claro que el fenómeno conductual que se
una pérdida de información. investiga puede analizarse con mayor profundidad empleando
2. Crear una nueva categoría. Se mantienen ambas categorías unidades de conducta que se solapan temporalmente.
en el sistema, y se define una nueva categoría por
agrupación de las dos, lo que implica un incremento de la Recogida de datos observacionales
información.
Medidas conductuales
Si el problema es de falta de exhaustividad, cabe recurrir
a: La finalidad de la recogida de datos en la observación
sistemática es la obtención de un registro conductual del que
1. Creación de categorías vacías, que recogerán las ocurrencias poder extraer medidas de la conducta que tengan variabilidad a
de segmentos conductuales que se consideran irrelevantes y lo largo de las sesiones de observación o dentro de una misma
que son excluyentes con el resto de las categorías. sesión de observación. Las medidas conductuales pueden
2. Creación de categorías "cajón de sastre", que incluirán dividirse en primarias y secundarias. Las medidas primarias son
segmentos heterogéneos que, aun guardando relación con el la frecuencia y la duración de las categorías (Johnston y
objetivo de la investigación, ocurren raras veces y son poco Pennypacker, 1980; Barrett, Johnston y Pennypacker, 1986). La
importantes para el objetivo de la investigación. frecuencia de una categoría a lo largo de un período de
observación es el número de segmentos conductuales a los que
Utilizar sistemas de categorías es especialmente se ha asignado dicha categoría, o, en otras palabras, es el
aconsejable cuando la observación ha de realizarse en vivo. Sin número - de veces que ha ocurrido la categoría. Se trata de una
embargo, el comportamiento no es en sí mismo mutuamente medida absoluta que se expresa en una escala de razón absoluta
excluyente en un sentido temporal. Por ejemplo, si se observa la (cero y unidad no transformables). La unidad de medida de la
interacción entre dos personas, las conductas de una y otra frecuencia es el ciclo o "número de veces", aunque, puesto que el
pueden perfectamente solaparse en el tiempo. Si la observación ciclo no es una dimensión física, se considera que la frecuencia
se efectúa con imágenes grabadas en vídeo, cabe la posibilidad, es una medida adimensional. Es posible calcular frecuencias
si así lo exigen los objetivos de la investigación, de definir tanto de categorías estado como de categorías evento. La
unidades de conducta que coocurran, pues pueden registrarse a duración de ocurrencia es el tiempo ocupado por la ocurrencia de
partir del vídeo con facilidad. La disponibilidad de sistemas de una categoría. Sumando las duraciones de todas las ocurrencias
registro observacional informatizados (por ejemplo, The Observer de una categoría a lo largo de un período de observación
de Noldus [1992] permite trabajar con unidades de conducta obtenemos su duración. Ambos tipos de duración son también
estructuradas en varios sistemas de categorías paralelos en el medidas absolutas, expresadas en una escala de razón (cero
tiempo, por ejemplo, uno de exprcsion facial, otro de conducta absoluto, pero unidad transformable). La unidad de medida más
verbal y otro de control postura( de un individuo). Asimismo, las corriente es el segundo (s). Sólo es posible obtener duraciones
técnicas de análisis de datos observacionales más actuales facili- de categorías estado, pues las ocurrencias de una categoría
tan el tratamiento de secuencias de conducta en las que existen evento tienen duración nula por definición. Otros tipos de
unidades con solapa-miento temporal (por ejemplo, Bakeman y duración son: el intervalo o lapso entre ocurrencias, o el tiempo

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 7

transcurrido desde que finaliza una ocurrencia de una categoría Muestreo observacional y sesiones de observación
hasta que se inicia la siguiente ocurrencia de la misma categoría;
y la latencia, o tiempo transcurrido desde que ocurre un cierto Para contrastar las hipótesis de una investigación, rara
evento hasta el inicio de la primera ocurrencia de una categoría. vez es posible acceder a toda la población de individuos a la que
El evento en cuestión puede ser la emisión de un estímulo, la se desean generalizar los resultados. En la observación
ocurrencia de un evento en la conducta de otro individuo, etc. La sistemática existen diversas poblaciones de interés que es
frecuencia y la duración (en cualquiera de sus formas) no son imposible estudiar en su totalidad. Las principales son la
útiles si no se proporciona información acerca del tiempo total población de sujetos y la población de tiempo. Ambas están
que ha durado el período de observación o si no se relacionan delimitadas por los objetivos de la investigación. Así, en un
una con otra. Por este motivo existen medidas relativas o estudio acerca de las interacciones entre madre y recién nacido
secundarias, directamente interpretables, que se derivan de las durante el primer mes de vida del niño, la población de sujetos
anteriores. Las más empleadas son la tasa (frecuencia dividida está compuesta por todas las parejas madre-recién nacido, y la
por el tiempo total de observación), la frecuencia relativa población temporal consta de todas las unidades de tiempo
(frecuencia dividida por la suma de las frecuencias de todas las comprendidas desde el momento del nacimiento hasta el término
categorías), la duración relativa (duración dividida por la suma de del primer mes de vida del bebé. Puesto que ni una ni otra
las duraciones de todas las categorías) y duración media población pueden estudiarse en su totalidad, es necesario
(duración dividida por frecuencia). Todas las medidas anteriores seleccionar muestras de ambas que representen adecuadamente
caracterizan las categorías de una forma estática, es decir, se las poblaciones respectivas. Las selecciones posibles son las
emplean para "re-sumir" la conducta que se produce durante un siguientes, de las cuales las tres primeras son necesarias y la
cierto período de observación. Sin embargo, para contrastar cuarta es opcional:
ciertas hipótesis es necesario caracterizar las categorías de a. Muestreo de sujetos. Consiste en seleccionar una
forma dinámica: cuantificar cómo cambia la conducta momento a muestra representativa de sujetos a partir de la población a la
momento durante el período de observación (Bakeman y que se quieren generalizar los resultados (Suen y Ary, 1989). En
Gottman, 1997). El análisis del cambio conductual momento a el ejemplo anterior se concretaría en seleccionar un grupo de
momento se llama análisis secuencial, y sus características parejas de madre y recién nacido. Este tipo de muestreo es
principales se exponen en un apartado posterior de este capítulo. común a todas las metodologías de investigación.
Las medidas dinámicas básicas son la frecuencia de b. Muestreo intrasesional de sujetos (Suen y Ary, 1989).
transición y la frecuencia relativa de transición (Castellan, 1979; Cuando se observa a más de un sujeto y se juzga imposible que
Van Hooff, 1982). La frecuencia de transición es el número de el observador pueda mantener su atención en la conducta de
veces que ocurre una transición entre un par de categorías. Para todos a la vez, debe determinarse de antemano qué sujetos del
unas categorías A y B la frecuencia de transición de A a B es el grupo serán observados durante la sesión, y/o en qué orden van
número de veces que después de A ocurre B en la secuencia de a ser observados.
datos. La frecuencia relativa de transición entre dos categorías A c. Muestreo intersesional de tiempo. Consiste en
y B es la proporción de todas las transiciones desde A que seleccionar los períodos o sesiones durante los cuales los
terminan en B, o la estimación de la probabilidad de que después sujetos van a ser observados, lo que implica seleccionar tanto la
de A ocurra B, y se calcula dividiendo la frecuencia de transición cantidad de sesiones como los momentos en que éstas se inician
entre A y B por el número total de transiciones observadas desde y terminan.
A.

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 8

d. Muestreo intrasesional de tiempo. Si se decide humanos en interacción social una duración de sesión indi-
segmentar el flujo conductual en unidades de tiempo, entonces la cativa oscila entre 30 y 60 minutos.
conducta de los sujetos será registrada de forma discontinua
durante la sesión de observación, realizándose un muestreo del La cantidad total de sesiones ha de ser suficiente para
tiempo dentro de la misma. La alternativa es observar y registrar que el volumen de datos recogidos permita poner a prueba las
de modo continuo dentro de la sesión, sin efectuar ningún tipo de hipótesis de investigación (Yarrow y Waxler, 1979). Cuantas más
muestreo temporal. categorías de conducta se hayan definido y cuanto menor tasa
La sesión de observación es el período de tiempo durante tengan, más largas habrán de ser las sesiones y/o mayor número
el cual se observa y se registra siguiendo siempre la misma regla de ellas deberá haber para que las medidas de las categorías
de muestreo intrasesional de sujetos y utilizando la misma obtenidas sean aptas para realizar los análisis estadísticos
técnica de registro. Cada sesión es una muestra del período de pertinentes. Así por ejemplo, si estamos interesados en averiguar
estudio o período de tiempo de la vida de los sujetos al cual se si la categoría "interacción verbal positiva de la madre" (A) activa
quieren generalizar los resultados de la investigación. Como secuencialmente la categoría "interacción verbal positiva del hijo"
ejemplos de períodos de estudio empleados por los (B), necesitaremos observar el número de sesiones suficiente
investigadores podemos citar: el posparto, el primer curso de para que, en la pareja o en la totalidad de la muestra, las fre-
universidad, el año posterior a la jubilación, etc. Cuando el cuencias totales de A y de B sean grandes para poder estimar
período de estudio es largo (por ejemplo, días, meses, años), es adecuadamente la probabilidad de que a A siga B y compararla
necesario extraer muestras de él porque es imposible con la probabilidad no condicionada de que ocurra B. Las
permanecer observando a los sujetos durante días enteros, técnicas estadísticas mediante las que se compararán dichas
debido tanto a la disponibilidad del observador como a la estimaciones de probabilidad exigirán que las frecuencias
disponibilidad de los sujetos. La duración de las sesiones aludidas alcancen un mínimo, que puede ser 30
dependerá de: aproximadamente. Para que la conducta registrada en una
sesión sea representativa de toda la conducta restante que
1. El tipo de conducta a observar. La duración de las sesiones ocurre fuera de la sesión y no es observada, deben programarse
tiene que ser suficientemente larga para que en ellas tenga adecuadamente los inicios y finalizaciones de las sesiones que
lugar una variabilidad aceptable en el comportamiento van a realizarse con el fin de que no dependan de las
observado, es decir, para que ocurra un número grande de preferencias del observador. Ello significa que los inicios han de
transiciones entre ocurrencias de categorías de conducta. ser seleccionados de forma que todos los puntos temporales del
Ello depende a su vez del grado de molaridad de las período de estudio tengan la misma probabilidad de ser inicios de
categorías y de sus duraciones medias. La duración total de sesiones, siempre que haya transcurrido un tiempo determinado
la sesión ha de ser mucho mayor que las duraciones medias desde el inicio de la sesión anterior. El muestreo intersesional de
de las categorías conductuales. tiempo suele adoptar una de estas formas (Altmann, 1974):
2. La fatiga del observador. La atención constante repercute en 1. Muestreo aleatorio. Si se seleccionan los inicios de sesión
un aumento de la fatiga y un descenso de la calidad de los mediante muestreo aleatorio dentro del período de estudio se
datos. Sin embargo, la utilización del vídeo en la observación da por supuesto que tanto los sujetos como el observador
sistemática permite grabar sesiones de larga duración que estarán disponibles en cualquier momento. Esta situación
después pueden ser observadas durante sesiones de trabajo puede ser realista en casos muy concretos, como por
de menor duración. En la observación en vivo de sujetos ejemplo, si el período de estudio es de un día, o si es posible

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 9

obtener una grabación audiovisual permanente de los sujetos, Reglas de muestreo intrasesional de sujetos y reglas de registro
pero en general cabe suponer que observador y observado
están disponibles únicamente en ciertos subperíodos de la Las reglas de muestreo intrasesional de sujetos
fase de estudio, es decir, a ciertas horas. En tal caso el especifican qué sujetos han de observarse y cuándo, dentro de la
muestreo intersesional ha de restringirse a dichos sesión de observación. Si el registro va a realizarse en una díada
subperíodos y, por lo tanto, puede producirse algún sesgo en o en un grupo, si ha de realizarse en vivo (porque no puede
la muestra de conducta observada. grabarse en vídeo para verlo posteriormente), y si el observador
2. Selección fija. También pueden iniciarse las sesiones siempre no puede prestar atención simultánea a la conducta de todos los
a las mismas horas del día. Ello tiene la ventaja de que es sujetos, entonces es preciso aplicar una de las reglas que se
más cómodo para el observador pero sólo permite recoger especifican a continuación (Altmann, 1974; Martin y Bateson,
datos representativos de esas horas. Por lo tanto, la muestra 1986; Qucra, 1991):
de los flujos conductuales que se obtiene puede estar
sesgada. 1. Muestreo focal. El observador únicamente mantiene su
3. Criterios comportamentales. El observador permanece atento atención centrada en el comportamiento de un individuo, sea
al comporta-miento de los sujetos sin registrarlo, hasta que un sujeto en un grupo, una díada en un grupo de díadas, o un
ocurre por primera vez una determinada categoría conductual subgrupo en un grupo formado por varios subgrupos
de interés, momento en el cual se inicia la sesión. Asimismo, similares. Si la investigación está orientada a obtener datos
la finalización de la sesión puede determinarse por la de sujetos individuales cuando se encuentran solos, el
presencia o ausencia de otra cierta categoría. La selección muestreo de sujetos siempre es focal. Se utiliza la
por criterios comportamentales posee la desventaja de que la denominación "focal" porque es más corriente observar
muestra de conducta que se obtiene únicamente es sujetos que se encuentran en grupos que sujetos solitarios e
representativa de los períodos iniciados y terminados por las interesa destacar que, ocurra lo que ocurra en el grupo, el
categorías en cuestión y, por lo tanto, puede contener un observador centra su atención exclusivamente en uno de los
sesgo importante si lo que se desea es generalizar los sujetos.
resultados al resto del período de estudio. No obstante, si el 2. Muestreo de barrido o multifocal. El observador focaliza su
período de estudio se define en función de la aparición de atención en cada uno de los individuos durante un intervalo
tales categorías, la selección por criterios comportamentales de tiempo corto y por turnos, de forma rotatoria. Durante la
dará lugar a una muestra de conducta representativa. A modo sesión, el barrido se efectúa un gran número de veces, razón
de ejemplo, si estamos interesados en investigar las por la cual el intervalo dedicado a cada individuo cuando se le
secuencias de agresión en una cierta especie animal bastará observa es muy pequeño en comparación con la duración de
con que iniciemos las sesiones en el momento en que tiene la sesión. Todos los intervalos tienen siempre la misma
lugar una cierta categoría que presumimos desencadenará la duración. El orden en que los individuos son observados es
agresión (por ejemplo, una amenaza) y las terminemos en el siempre el mismo en cada turno, y se establece de antemano.
momento en que los individuos se alejen unos de otros o
inicien otro tipo de actividad (por ejemplo, comer). Las reglas de registro especifican qué propiedades de las
categorías de conducta han de ser registradas y en qué
momentos. En cada sesión de observación se combina una regla
de registro y una regla de muestreo intrasesional de sujetos. Las

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 10

reglas de registro observacional son las siguientes (Martin y muestreo. La distancia entre puntos de muestreo (o longitud
Bateson, 1986; Quera, 1991; Bakeman y Gottman, 1997): de intervalo 7) ha de ser pequeña en comparación con la
duración de la sesión (T), por lo que la cantidad de puntos de
1. Registro activado por transiciones (RAT). El observador anota muestreo o intervalos (N) suele ser un número grande. Para
todas las ocurrencias de las categorías del individuo focal o cada una de las categorías el registro que se obtiene es una
de los individuos que son multifocalizados, en la secuencia en secuencia de unos y ceros que indican respectivamente la
que se producen; además el observador puede anotar en qué presencia y la ausencia de la categoría en los puntos de
momento termina una categoría y se inicia la siguiente. muestreo. Al utilizar el muestreo instantáneo se parte del
Decimos que el registro está activado por transiciones porque supuesto de que todas las ocurrencias de las categorías de
el observador únicamente anota en aquellos momentos en conducta poseen duración y que las transiciones entre ellas
que se produce una transición entre ocurrencias de son instantáneas. Por lo tanto, el muestreo instantáneo es
categorías, efectuando por consiguiente una segmentación totalmente inadecuado cuando las categorías son eventos.
conductual del flujo. El RAT permite obtener información b. Muestreo de intervalo parcial, de Hansen o "uno-cero ". La
completa y precisa acerca de la frecuencia, la duración y la sesión se divide también en N intervalos y el observador
secuencia u orden temporal de las categorías de conducta. registra en cada uno de ellos qué categorías han ocurrido,
2. Registro activado por unidades de tiempo (RAUT). El prescindiendo de cuántas veces han ocurrido, cuánto han
observador anota las coocurrencias de las categorías de durado sus ocurrencias, y en qué momentos han tenido lugar
conducta del individuo focal o de cada uno de los individuos dentro del intervalo. Para cada categoría es un registro "todo
multifocalizados rigiéndose por unidades de tiempo llamadas o nada" o "uno-cero"; es decir, sólo interesa tener constancia
intervalos. Mientras que en el RAT es la unidad de conducta de si la categoría se ha dado o no en el intervalo. Se trata de
la que determina la anotación, en el registro activado por un RAUT no restrictivo porque basta que una categoría
unidades de tiempo es la finalización de cada unidad de ocurra en cualquier instante de un intervalo para que sea
tiempo o intervalo, indicada por un metrónomo o reloj, lo que registrada en el mismo. El observador no ha de esperar
activa al observador para que anote. Por lo tanto, se realiza necesariamente hasta que termine el intervalo para anotar;
una segmentación temporal y no conductual del flujo. El basta que anote cada categoría cuando ocurre por primera
RAUT recibe a veces el nombre de "muestreo de tiempo" en vez dentro del intervalo. También en este caso el producto del
referencia a que, según la técnica concreta que se emplee registro es un conjunto de secuencias binarias, una por
(véanse los párrafos siguientes), el observador puede categoría. Este muestreo es utilizable tanto si las categorías
prescindir de mantener la atención sobre los sujetos mientras de conducta son eventos como si son estados.
no haya transcurrido la unidad de tiempo pertinente; se trata c. Muestreo de intervalo total. La sesión se divide en N
pues de un muestreo intrasesional del tiempo. Los tres tipos intervalos y el observador anota en cada uno de ellos cuál ha
de RAUT más comunes son (Hansen, 1966; Altmann, 1974; sido la categoría que ha ocupado la totalidad del intervalo. Se
Powell, Martindale y Kulp, 1975; Ary y Suen, 1983; Bakeman trata de un RAUT totalmente restrictivo porque no permite
y Gottman, 1987; Suen y Ary, 1989): registrar categorías que ocurran sólo en una parte del
a. Muestreo instantáneo, momentáneo o puntual. La sesión de intervalo. Si en un intervalo se produce una transición entre
observación se divide en N intervalos de duración constante categorías entonces ninguna de ellas es registrada. Sólo los
(longitud de intervalo) y el observador sólo registra cuál de las intervalos sin transiciones dan lugar a registro. Esta forma de
categorías está ocurriendo al término del intervalo o punto de registro no es adecuada cuando las categorías son eventos.

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 11

Si tiene lugar una transición durante el intervalo el observador Obtención de medidas conductuales a partir del registro
puede sustraer su atención de la conducta de los sujetos, no
registrar nada, y esperar a que se inicie el siguiente intervalo En el RAT la información acerca de la frecuencia,
para volver a observar. duración y secuencia es inmediata a partir del registro. Por
ejemplo, supongamos que se definió este sistema de categorías
En comparación con el RAT, el RAUT posee las para el intercambio verbal en una pareja: (M+, M-, Mo, H+, H-,
siguientes ventajas: Ho), donde M simboliza Mujer, H Hombre, + "intervención
positiva", - "intervención negativa" y 0 "intervención neutra". Un
1. Produce menor fatiga en el observador, lo cual repercute en RAT efectuado con este sistema podría dar como resultado estos
que tiene menos errores y los datos tienden a ser más fiables datos en los que el primer elemento de cada par simboliza una
(Sackett, 1978; Mehm y Knutson, 1987). categoría de conducta, y el segundo el tiempo en que se inició,
2. Los observadores pueden ser adiestrados más rápidamente correspondiendo el cero al comienzo de la sesión:
(Bakeman y Gottman, 1987). Es más fácil de utilizar que el
RAT porque el observador simplemente ha de anotar a M+ 0 H+ 12 Ho 15 M+ 17 Ho 24 M-31 H-35
intervalos regulares, en lugar de decidir cuándo hay o no
transiciones entre categorías. Por lo tanto, en general, utilizar La última unidad de tiempo de la sesión fue la unidad 39
un RAUT repercute en un menor coste para la investigación (en total, 40 unidades de tiempo). La secuencia de categorías es,
(Sackett, 1978; Klesges, Woolfrey y Vollmer, 1985). obviamente, M+ H+ Ho M+ 1 Ho M– H-. Las frecuencias (F) y
duraciones (D) de las categorías son:
En contrapartida, la desventaja del RAUT es que no
produce una representación fidedigna de los cambios que M+ Al— Mo H+ H— Ho
ocurren en los flujos conductuales (Altmann, 1974; Suen y Ary, F: 2 1 0 1 1 2
1989). Por lo tanto, no proporciona valores exactos de la D: 19 4 0 3 5 9
frecuencia y la duración de las conductas, ni permite obtener
información acerca de las secuencias. Sin embargo, si la longitud En el RAUT la frecuencia y la duración de las conductas
del intervalo es pequeña en comparación con las duraciones pueden estimarse mediante fórmulas a partir de las medidas
medias de las conductas, el registro obtenido se aproxima al que proporcionadas por este tipo de registro. Las medidas
proporcionaría un RAT. Además, a partir de un RAUT es posible proporcionadas por un RAUT son:
realizar estimaciones de las frecuencias y las duraciones
mediante técnicas específicas (Suen y Ary, 1986, 1989; (lucra,
1989, 1990, 1991).

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 12

1. Frecuencia modificada (0). La frecuencia modificada de una producido y con qué longitud de intervalo. La frecuencia
categoría de conducta es la cantidad de unos de su modificada no es en absoluto una estimación ni de la fre-
secuencia binaria, es decir, el número de intervalos en los cuencia ni de la duración de la conducta.
que la categoría ha sido anotada conforme a la regla de
registro (Sackett, 1978). Control de la calidad de los datos
2. Seudofrecuencia (f). La seudofrecuencia de una categoría de
conducta es el número de pares 01 de su secuencia binaria, Como en toda ciencia, en psicología y específicamente en
esto es, la cantidad de ráfagas de unos de la misma (Suen y la metodología observacional, una fase fundamental del proceso
Ary, 1989; Quera, 1991). Si en una misma sesión se de investigación es la dedicada al control de calidad de los datos.
aplicasen simultáneamente los tres tipos de RAUT con la Carece de sentido y puede dar lugar a conclusiones falsas aplicar
misma longitud de intervalo, las frecuencias modificadas sofisticadas técnicas estadísticas si no es posible disponer
obtenidas para cada conducta no coincidirían previamente de una cierta garantía de que los datos procedentes
necesariamente. Lo mismo ocurriría con las de la observación reflejan la realidad. Para realizar dicho control
seudofrecuencias. Luego, para la interpretación de ambas de calidad se dispone en metodología observacional de procedi-
medidas se necesita conocer qué tipo de RAUT las ha mientos como la evaluación de la fiabilidad, la precisión y la
validez de los datos. Además, puesto que se conocen las fuentes
de los sesgos posibles del observador y del observado, es
factible intentar evitar que éstos se produzcan. A continuación se
realiza una somera aproximación a cada uno de estos conceptos.
Para un tratamiento más detallado de la calidad de los datos
observacionales, se remite al lector a los textos de Suen (1988) y
Bakeman (1997).

Fiabilidad

Aun en el caso de que los registros observacionales se


realicen con la ayuda de vídeo v computadores portátiles, en
último término la intervención del observador es in-dispensable
para determinar si se ha producido o no una cierta categoría de
conducta, por lo que la tarea a desempeñar por el mismo es
sumamente importante. Del observador depende en gran medida
el grado de calidad de los datos. Es necesario que la observación
la realicen como mínimo dos observadores con objeto de
comparar sus registros y poseer así un control del grado de
subjetividad incorporado al registro por cada uno de ellos y
conseguir de este modo datos sin sesgo. Tal como indican Suen
y Ary (1989, p. 100), «la evidencia de fiabilidad en los datos de
observación conductual es necesaria para demostrar

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 13

públicamente que los datos reflejan la realidad». En la cuyas columnas corresponden a las categorías tal como son
metodología observacional se define la fiabilidad como el grado registra-das por el otro. En las casillas de la matriz se
de concordancia entre los datos proporcionados por dos o más incluyen segmentos temporales, de modo que cada unidad de
observadores cuando registran independientemente la misma tiempo de la sesión se asigna a una casilla de la tabla. En el
conducta en la misma ocasión (fiabilidad interobservadores); o cuadro 15.2 se muestra una hipotética matriz de confusión.
bien, como la concordancia entre dos registros de una misma
sesión obtenidos por el mismo observador en dos momentos
diferentes, gracias a la grabación en vídeo (fiabilidad
intraobservador o consistencia del observador) (House y House,
1979).
Existe una amplia gama de índices estadísticos
empleados como coeficientes de fiabilidad. La elección de
cualquiera de ellos debe venir marcada por el objetivo de la
investigación y por la escala de medida a la que pertenecen los
datos (Hartmann, 1977). Pueden distinguirse tres clases de
coeficientes de fiabilidad:
• Coeficientes globales o de sesión. Son correlaciones entre En dicha matriz, de las siete unidades de tiempo que,
medidas globales como la tasa, la duración relativa, etc., de según el observador 1, han estado ocupadas por la categoría B,
las categorías de conducta, obtenidas por dos observadores dos unidades fueron ocupadas por la categoría A según el
diferentes. Esta clase de coeficiente es el que deberá observador 2. Cuando la concordancia es perfecta, todas las
calcularse cuando las hipótesis relacionen variables casillas de la tabla que no pertenecen a su diagonal principal
expresadas en forma de medidas globales (véase el concepto contienen valores nulos. De entre los numerosos coeficientes
de macroanálisis en el apartado v). existentes para la evaluación de la fiabilidad punto por punto,
• Coeficientes secuenciales. Son correlaciones entre las resumidos por Frick y Semmel (1978) o Wallace y Elder (1980),
frecuencias de transición obtenidas por dos observadores destaca el coeficiente Kappa de Cohen (1960), que es una
diferentes. Estos coeficientes son los que han de calcularse proporción de concordancia en la que se corrige la concordancia
cuando las hipótesis aluden a la existencia de relaciones que es posible lograr por azar. Para su cálculo se utilizan la
secuenciales entre categorías (véase el concepto de proporción de concordancia total obtenida y la proporción de
microanálisis en el apartado v). concordancia aleatoria esperada. Esto lo hace preferible a los
diversos tipos de porcentajes de acuerdo ampliamente utilizados
• Coeficientes punto por punto. Son proporciones de
en metodología observacional (Hanley, 1987). El coeficiente
concordancia momento a momento entre los observadores, y
Kappa se calcula así: k = (Po - P)/(1 - Pe), donde P, es la
deben calcularse cuando las hipótesis aluden a relaciones
proporción de concordancia observada y Pe es la proporción de
temporales entre unidades de tiempo ocupadas por las
concordancia aleatoria. En el ejemplo del cuadro 15.2, P =
categorías, dentro de la sesión de observación. Estos
(10+4+4)/22 = 0,818, P = (10x13+7x4+5x5)/22' = 0,378, k =
coeficientes son más estrictos que los de las dos clases
(0,818-0,378)/(1-0,378) = 0,707. El grado eje concordancia es
anteriores. Para calcularlos es necesario construir una tablao
mayor cuanto más próximo a la unidad es el valor del coeficiente
matriz de confusión cuyas filas corresponden a las categorías
obtenido.
tal como son registradas por uno de los observadores, y

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 14

Precisión evaluar (Martin y Bateson, 1986). Por lo tanto, debe establecerse


la relación entre una variable, como la medida de una conducta, y
La precisión se define como el grado de concordancia otra variable externa, indicativa del objeto de la medida. En la
entre un observador y un criterio establecido o registro estándar metodología observacional se trata de comprobar la validez del
(Landis, 1975; Green, 1982). Fiabilidad y precisión están sistema de categorías. Pese a la importancia del concepto, la
íntimamente relacionadas sin que ninguna de ellas implique la metodología observacional no ha dedicado al mismo ni análisis
otra. En un registro puede ocurrir que la fiabilidad teóricos frecuentes, ni su comprobación regular en las
interobservadores sea alta pero la precisión baja, por haber investigaciones. Posiblemente, dado que la conducta se observa
cometido igual tipo de errores ambos observadores. Por ello se directamente, sin intermediarios (tests, cuestionarios,
aconseja frecuentemente evaluar la precisión en lugar de la autoinformes...), sin manipulación de variables independientes y
fiabilidad inter o intraobservadores (Foster y Cone, 1980; sin realizar inferencias, no se pone en cuestión la validez de los
Johnston y Pennypacker, 1980). Sin embargo, la dificultad de datos obtenidos. Cuando en las definiciones de las categorías se
disponer de registros estándar lleva a que se calcule el realizan inferencias, por la utilización de categorías molares, la
coeficiente de precisión en pocas ocasiones. Para el cálculo de la validez no es tan inmediata y se trata entonces de comprobar si
precisión pueden utilizarse las mismas técnicas que en la las categorías son buenas definiciones operacionales de los
evaluación de la fiabilidad, con la única diferencia de que en lugar elementos implicados en el problema. La vía óptima es comparar
de evaluar la concordancia entre dos observadores con igual el registro del observador con una medida independiente de la
grado de adiestramiento, se evalúa la concordancia entre un misma variable. Si este procedimiento no es viable por la
observador considerado falible y un observador estándar. dificultad de conseguir dicho criterio externo, entonces puede
Además, existen coeficientes de precisión punto por punto procederse a hallar el grado en que los registros de los
específicos para la evaluación de la precisión: observadores son los mismos que si estuvieran determinados por
una posición teórica bien formada y documentada (Anguera,
1. El coeficiente de sensibilidad, o la proporción de unidades de 1985).
tiempo en las que verdaderamente ocurre la categoría, que
son registradas correctamente por el observador falible; esta Sesgos del observador y de la observación
proporción es la estimación de la probabilidad de que el
observador falible registre la conducta cuando debe hacerlo. La existencia del error de medida es un problema común
2. El coeficiente de especificidad, o proporción de unidades de al proceso de recogida de datos en cualquier disciplina científica.
tiempo en las que verdaderamente no ocurre la categoría, Los sesgos del observador son aquellos errores de medida que
que no son registradas por el observador falible; esta se deben al observador o al instrumento de observación, registro
proporción es la estimación de la probabilidad de que el o medición, y se reflejan en los datos en forma de problemas de
observador falible no registre la conducta cuando no debe fiabilidad y/o precisión. Los sesgos de la observación son
hacerlo. aquellos errores que se deben a fallos de diseño o de
procedimiento que alteran la situación del registro y por lo tanto la
Validez conducta del sujeto observado, y que limitan la generalización de
los resultados (Behar y Riba, 1993). Son sesgos del observador:
En su acepción más común la validez se refiere a la 1. Errores mecánicos de registro, debidos a la complejidad de la
relación existente entre lo que se evalúa y lo que se desea tarea a realizar.

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 15

2. Errores de interpretación del sistema de categorías, debidos a del observador, del sistema de categorías y del manual de
la deriva del observador, consensuada o no, que consiste en instrucciones y disponer de este modo de un instrumento que
que los observadores desarrollan versiones idiosincrásicas de per-mita la objetividad en la medida. Tener en cuenta estos
las definiciones originales de las categorías de conducta requisitos y evitar o reducir los posibles errores del
(Kazdin, 1977); o debidos a la complejidad del sistema cíe observador es velar por la fiabilidad de los datos.
categorías, existiendo una relación inversa entre la
complejidad y el grado de precisión (Mash y McElwec, 1974). Por lo que se refiere a los sesgos de la observación, éstos
3. Errores perceptivos, entre ellos el efecto de halo, que pueden resumirse en la noción de reactividad o cambios que
transforma la percepción presente en función de la evaluación puede sufrir la conducta de un individuo cuando desempeña el
antecedente (Muchielli, 1974). papel de sujeto en una investigación psicológica (Behar y Riba,
4. Efectos biosociales, como la incidencia de la edad, del sexo y 1993). Se trata de una noción propia y exclusiva de las ciencias
de la etnia del observador en los datos que obtiene del comportamiento. Kazdin (1977), Kcnt y Eoster (1977) y Baum,
(Rosenthal, 1967). Forehand y Zegiob (1979) han puesto en evidencia que la
5. Efectos biográficos, psicosociales y situacionales, debidos a conducta de los sujetos observados es cualitativa y cuantitativa-
que la historia personal del observador, su situación familiar y mente distinta a la que se hubiese producido si el observador no
social, su ideología y sus rasgos psicológicos parecen influir hubiese estado presente, y el sujeto no se hubiese sentido
sobre sus registros, al percibir la realidad a través de su observado (Jacob, Tennenbaum y Krahn, 1987). Según Behar y
prisma personal. Riba (1993), la reactividad viene modificada por diversos
6. Expectancia, o tendencia del observador a obtener datos que factores: el ambiente, los sujetos y la conducta. Las
se ajustan a las expectativas iniciales fruto de una teoría configuraciones ambientales complejas, en las que el observador
implícita o explícita. desarrolla su tarea habitualmente, suscitan reactividad cuando se
produce algún tipo de cambio en sus elementos. El mismo
En la metodología observacional existe la posibilidad de observador forma parte de estas configuraciones ambientales y
controlar los sesgos del observador, siendo los procedimientos en función de sus características personales, de sus rasgos
más eficaces y relevantes: físicos —como talla, peso, edad, sexo, etnia—y psicológicos,
afecta de forma distinta al sujeto observado y da lugar a mayor o
1. La diferenciación entre investigador y observador a fin de que menor reactividad. No todos los sujetos presentan igual grado de
este último desconozca el objetivo final de la investigación y reactividad, debido a sus rasgos de personalidad y a sus
se evite así el sesgo de expectancia. experiencias previas. La reactividad comporta resistencias del
2. La definición de sistemas de categorías no excesivamente sujeto observado que lo llevan a inhibirse, sobreactuar o
molares, no ambiguas, especificadas clara y detalladamente, engañar. Asimismo, unas conductas son más sensibles que otras
para evitar la subjetividad del observador en el registro. a la reactividad. Las conductas automáticas o involuntarias, las
3. La elaboración de un manual de instrucciones, que al inducidas por mediadores hormonales, los hábitos, etc.,
suministrar pautas específicas sobre el contexto en que debe presentan una reactividad prácticamente nula. Por el contrario, la
realizarse el registro y sobre el iniclo y finalización del mismo, conducta voluntaria, especialmente la verbal, con un objetivo
proporciona rigor y homogeneidad a la observación. preciso, es más sensible a la reactividad. La reactividad puede
4. El adiestramiento y entrenamiento del observador; con la manifestarse en forma de conductas nuevas, que no formaban
finalidad de conseguir y mantener el aprendizaje, por parte parte de las variables dependientes o del sistema de categorías

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 16

previsto, o bien en la desaparición de conductas previas y correlación, el análisis de covariancia, el análisis de


esperadas en el contexto de la observación. En todo caso la agrupamiento, el análisis factorial, etc. (véase Gottman, 1978),
reactividad no afecta únicamente a las frecuencias y a las tasas técnicas también utilizadas para analizar datos obtenidos
de las conductas sino que pueden modificar su latencia y su mediante otras metodologías.
duración. Es posible minimizar el sesgo de reactividad: La hipótesis «¿los niños de 5 años invierten mayor
cantidad de tiempo en juego paralelo que los niños de 4 años?»
a. Haciendo que el observador permanezca oculto, o bien puede ponerse a prueba a través de un macroanálisis; esta
que sepa inspirar confianza al sujeto observado para que éste se hipótesis relaciona una variable de sujeto, la edad, con una
comporte de forma sincera y natural. variable conductual, el juego paralelo (Bakeman y Gottman,
b. Manteniendo al sujeto observado en la ignorancia del 1997), la cual se expresa en forma de duración, o mejor, la
objetivo real de la investigación. duración relativa o prevalencia. Para contrastar esta hipótesis
c. Consiguiendo que el observador pase a ser un compararíamos las duraciones relativas de la conducta "juego
observador olvidado, es decir, que el sujeto observado llegue a paralelo", obtenida a lo largo de unas sesiones de observación,
habituarse a su presencia. La utilización de estos procedimientos en dos grupos de niños, uno de 4 años y otro de 5. La técnica
no reactivos, especialmente el del observador oculto, está estadística concreta podría ser, por ejemplo, el cálculo de un
asociada a cuestiones éticas que pueden resumirse en el contraste t de Student entre los valores medios de las duraciones
derecho de cualquier persona a no ser objeto de una relativas de los dos grupos. Otro ejemplo de macroanálisis es el
observación, al igual que ocurre en cualquier investigación con siguiente. Supóngase que las variables de una investigación
humanos. sobre la interacción materno-filial son "primiparidad",
"prematuridad", "tasa de vocalizaciones de la madre" y "tasa de
Clases de análisis de datos lloro del bebé". Además, ambas tasas han sido obtenidas para
cada pareja madre-hijo en dos puntos temporales, al final de la
La elección de una técnica concreta de análisis de datos primera semana y al final de la cuarta semana de vida del bebé.
observacionales depende de la clase de hipótesis que se desee Por tanto, en conjunto existen variables, cuatro de ellas
verificar y de la escala de medida en la que se hayan expresado conductuales, acerca de cuyas relaciones binarias, ternarias,
las variables. Podemos distinguir dos clases de análisis de datos etc., es posible formular hipótesis. Puesto que estas variables
en este contexto (Quera, 1986, 1993), que son complementarios conductuales se evalúan en forma de tasas, se trata de un
porque hacen posible descubrir distintos tipos de relaciones o macroanálisis. Una de las hipótesis que podrían plantearse es
regularidades en los datos: «cuanto mayor es la tasa de vocalización de la madre en la
primera semana, menor es la tasa de lloro del bebé en la cuarta».
a. Macroanálisis. Las variables conductuales implicadas Otra hipótesis es «en las madres no primíparas, cuanto mayor es
en las hipótesis están expresadas en forma de frecuencias, la tasa de vocalización de la madre en la primera semana, menor
duraciones, tasas, etc., es decir, medidas "globales" y "estáticas» es la tasa de lloro del bebé en la cuarta, mientras que en las
en general. El término "global" se refiere al hecho de que dichas madres primíparas dichas variables no están relacionadas».
medidas son "resúmenes" de sesiones de observación, y para Estas hipótesis podrían ponerse a prueba calculando las
calcular sus valores no es necesario conocer la secuencia de correlaciones entre las variables conductuales a partir de los
códigos a lo largo de la misma. Como técnicas estadísticas datos de una muestra de parejas madre-hijo. En ambos casos, se
aplicables pueden citarse los contrastes de medias, la trataría de un análisis longitudinal, pues se estaría averiguando la

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 17

relación que existe entre variables evaluadas en puntos 2 x 2 x 2 = 8 casillas, con la que es posible evaluar el ajuste de
temporales diferentes. un modelo log-lineal acorde con la hipótesis, mediante un
b. Microanálisis. Las variables conductuales están contraste chi-cuadrado. El análisis secuencial es pues la técnica
evaluadas en forma de frecuencias de transición, absolutas o adecuada cuando las variables implicadas en la hipótesis son
relativas, o de frecuencias de coocurrencia, todas ellas medidas códigos conductuales registrados en secuencia. Se trata de una
"dinámicas", esto es, que expresan el cambio conductual dentro técnica que ha sido objeto de una atención especial por parte de
de la sesión de observación (Kaye, 1982). Las técnicas los investigadores durante los últimos años. El lector interesado
estadísticas aplicables en este caso se engloban bajo el epígrafe tanto en los fundamentos metodológicos y estadísticos del
de "análisis secuencial", y se basan en la aplicación de la teoría análisis secuencia) corno en el tratamiento informático de los
de los procesos estocásticos y de contrastes para tablas de datos secuenciales puede consultar los textos de Van Hooff
contingencia bi o multivariadas (estadísticos chi-cuadrado, (1982), Gottman y Roy (1990), Bakeman y Quera (1992, 1995a,
modelos log-lineales) (Gottman y Roy, 1990). He aquí un ejemplo 1995b), Quera (1993), Bakeman, Robinson y Quera (1996) y
de microanálisis. Las variables de una investigación acerca de la Bakeman y Gottman (1997).
interacción verbal en parejas son "tipo de pareja" (con dos
valores, "problemática" y "no problemática"), "intervención Áreas de aplicación de la metodología observacional
positiva del hombre", "intervención neutra del hombre",
"intervención negativa del hombre", "intervención positiva de la Las áreas de aplicación de la metodología observacional
mujer", "intervención neutra de la mujer", "intervención negativa son tantas como los ámbitos de actuación de la psicología. En
de la mujer". Una hipótesis para cuya contrastación es necesario tanto que la metodología observacional se ocupa de la conducta
el análisis secuencial es, por ejemplo, «¿las parejas espontánea tal como ésta se produce, los únicos límites vienen
problemáticas tienen más reciprocidad negativa que positiva, al marcados por el propio repertorio conductual, humano o animal y
contrario de las no problemáticas, que tienen más reciprocidad por la privacidad de determinadas conductas. Existen
positiva que negativa?». La reciprocidad negativa puede definirse investigaciones en el marco familiar, como la de Bakeman y
como la tendencia de cada miembro de la pareja a intervenir Brown (1977) que analiza la interacción madre-hijo, o la de
negativamente después de que el otro miembro haya intervenido Noack (1992) que estudia las relaciones que se establecen
negativamente, y la reciprocidad positiva, corno la tendencia a durante la primera adolescencia con los padres y con los iguales;
intervenir positivamente después de una intervención positiva. en el marco escolar, sobre el rendimiento académico (Huston-
Para contrastar dichas hipótesis deberíamos obtener las Stcin, Friedrick-Coffer y Susman, 1977), sobre el desarrollo del
frecuencias de transición entre los códigos conductuales lenguaje, la adaptación escolar en niños de preescolar (Zazzo,
definidos para el hombre y la mujer, en nuestras parejas 1978), la interacción con iguales en la adolescencia durante la
problemáticas y no problemáticas a lo largo de un conjunto de hora de recreo (Behar, 1987); en instituciones penitenciarias se
sesiones de observación. Estas frecuencias podrían disponerse ha utilizado para evaluar la evolución individual y grupal en un
en una tabla de contingencia de tres dimensiones: A ("tipo de programa para tratar conductas adictivas (Pleite e Ibern, 1991).
pare-ja") x B ("tipo de conducta antes de la transición") x C ("tipo Abikoff, Gittelman y Klein (1980) desarrollaron un sistema de
de conducta después de la transición"), donde cada una de estas codificación para la observación en el aula de la conducta de
dos últimas variables tiene dos valores, "intervención positiva (del niños hiperactivos entre 6 y 12 años. Se consideraron
hombre o de la mujer)" o "intervención negativa (del hombre o de hiperactivos aquellos niños a los que el maestro y los padres
la mujer)". Por tanto, se trataría de una tabla de contingencia con valoraban como tales y que no presentaban ningún otro

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA


MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 18

diagnóstico psiquiátrico. En total fueron observados 57 chicos y 4 receptores, reactores y reacciones. El niño era siempre el
chicas con estas características, con una media de edad de 8 objetivo de la observación. Se codificaba la actividad del niño y
años, 4 meses y una desviación tipo de 1 año y 4 meses. su interacción, y a continuación el receptor de dicha interacción,
Asimismo, se observó un número igual de niños no el sujeto que reaccionaba y el tipo de reacción. Los observadores
hiperquinéticos del mismo nivel escolar, para proceder a la fueron adiestrados en el sistema de categorías durante un
comparación con los anteriores Se utilizó un sistema de período antes de iniciar la recogida de datos, y para ser
codificación de 11 categorías conductuales y la observación se considerados fiables debían alcanzar un grado de concordancia
realizó durante situaciones estructuradas de explicación del del 90% (proporción de concordancia no corregida por el efecto
profesor y durante períodos de trabajo académico independiente del azar). Debido a la baja frecuencia de algunas de las
bajo la supervisión del profesor. El niño fue observado al menos conductas observadas en los niños se hicieron agrupaciones de
en tres sesiones de 16 minutos cada una. Los datos fueron las mismas: conductas motrices amplias, juegos típicos de niños
recogidos por cuatro observadores que desconocían el objetivo y de niñas, comunicación con los adultos y conductas agresivas.
de la investigación y las características clínicas de los sujetos Por su parte, las categorías de reacciones se agruparon en
estudiados. Para evitar la reactividad, los observadores se respuestas instructivas, respuestas positivas y respuestas
situaban siempre al final del aula, en ángulo con los sujetos a negativas. Asimismo, se realizaron agrupaciones empíricas de
observar, para disponer de una vista de perfil de los mismos, aquellas conductas que ofrecían diferencias significativas entre
pero estar fuera de su área de visión. Se obtuvo una mayor niños y niñas. De entre los resultados que se obtuvieron cabe
frecuencia en los niños hiperactivos que en el grupo control de destacar los siguientes. Los padres tenían reacciones diferentes
todas las categorías de observación consideradas, como ante niños y niñas, con reacciones más positivas ante los niños
agresión verbal a los compañeros, agresión verbal al profesor o cuando éstos desarrollaban conductas agresivas y cuan-do
permanecer fuera de la silla. jugaban con juguetes típicamente masculinos. Las madres
Para dar respuesta a la pregunta de si los padres presentaban reacciones más positivas que los padres hacia los
proporcionan diferente socialización a niños y niñas, Fagot y juguetes típicamente femeninos. Asimismo, los niños recibían
Hagan (1991) realizaron una investigación observacional. La reacciones más negativas que las niñas cuando intentaban
muestra estaba formada por 50 niños y 42 niñas de 12 meses, al comunicarse; los niños recibían reacciones más positivas al jugar
inicio de la observación, y 42 niños y 40 niñas de 18 meses, con juguetes típica-mente masculinos, y al realizar conductas
también al iniciar la observación. Diez de los niños de 12 meses y agresivas. Las más positivas por intentar comunicarse. A pesar
doce de los niños de 18 meses vivían sólo con la madre, y el de la diversidad de las aplicaciones reseñadas, se constata que
resto pertenecía a familias con padres casados o que vivían en ellas los datos se obtienen directamente de la realidad, sin
juntos, en pro-medio, desde hacía 4 años. Los datos se utilización de instrumentos intermediarios, y que se siguen las
recogieron en casa de las familias, al volver el niño de la fases propias del método científico. Al mismo tiempo, presentan
guardería, y cuando todos los miembros de la familia estaban características propias y diferenciales respecto a otras
presentes. A éstos se les pedía que no miraran la televisión, que metodologías, como la elaboración del sistema de categorías, el
atendieran al teléfono con la mayor brevedad posible, y que adiestramiento de los observadores y el control de los sesgos del
actuasen con la máxima normalidad. Para cada niño se observador y de la observación.
realizaron cuatro sesiones de observación de una hora cada una.
El sistema de categorías incluía cinco secciones diferenciadas:
categorías de contexto o de actividades, categorías interactivas,

UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA

También podría gustarte