Está en la página 1de 601

Métodos y diseños

de investigación en educación

RAMÓN PÉREZ JUSTE


ARTURO GALÁN GONZÁLEZ
JOSÉ QUINTANAL DÍAZ

UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA


M TODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Quedan rigurosamente prohibidas, sin la


autorización escrita de los titulares del
Copyright, bajo las sanciones establecidas
en las leyes, la reproducción total o
parcial de esta obra por cualquier medio
o procedimiento, comprendidos la reprografía
y el tratamiento informático, y la distribución
de ejemplares de ella mediante alquiler
o préstamos públicos.

© Universidad Nacional de Educación a Distancia


Madrid 2012

© Ramón Pérez Juste, Arturo Galán González y José Quintanal Díaz

Todas nuestras publicaciones han sido sometidas


a un sistema de evaluación antes de ser editadas.

ISBN :

: de 2012
ÍNDICE

UNIDAD DIDÁCTICA I

Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Tema 1. CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS.
INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA.
MÉTODOS CUANTITATIVOS Y CUALITATIVOS . . . . . . . . . . . . . . . . . 19
Presentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.1. La investigación como procedimiento para obtener
conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2. Conocimiento científico y no científico . . . . . . . . . . . . . . . . . . 24
2. La educación como objeto de conocimiento . . . . . . . . . . . . . . . . . . 27
2.1. El método general de la ciencia . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2. La Educación como objeto de conocimiento . . . . . . . . . . . . . . 31
3. El problema de los paradigmas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.1. Concepto de paradigma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2. Caracterización de los paradigmas . . . . . . . . . . . . . . . . . . . . . . 38
3.3. Valoración de los paradigmas . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4. Situación actual del debate . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4. Concluyendo: nuestra posición sobre el tema . . . . . . . . . . . . . . . . . 47
4.1. Naturaleza y complejidad del acto educativo . . . . . . . . . . . . . 48
4.2. Complejidad de los procesos educativos . . . . . . . . . . . . . . . . . 50
4.3. La respuesta metodológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Tema 2. LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN.


EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA . . . . 55
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.1. Características del conocimiento científico . . . . . . . . . . . . . . . 58

7
MÉTODO Y DISEÑO DE INVESTIGACIÓN EN EDUCACIÓN

1.2. El método y su importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . 60


2. La investigación científica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3. El proceso y la lógica de la investigación científica . . . . . . . . . . . . 62
3.1. El problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2. La hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3. Validación de la hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4. Interpretación, teoría y replicación . . . . . . . . . . . . . . . . . . . . . 76
4. Características del conocimiento científico-experimental . . . . . . . 83
5. Posibilidades y limitaciones de la aplicación de la metodología
científico-experimental a la educación . . . . . . . . . . . . . . . . . . . . . . . 85
5.1. Posibilidad de leyes generales en Educación . . . . . . . . . . . . . . 86
5.2. Medición y evaluación. Principales objeciones . . . . . . . . . . . . 88
5.3. Posibilidades de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4. Verificabilidad intersubjetiva . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6. Repercusiones metodológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

Tema 3. EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN . . . . . . . . . . . . 105


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
1. Valor, sentido y utilidad del informe de investigación . . . . . . . . 108
2. Elementos de contenido del informe . . . . . . . . . . . . . . . . . . . . . . 110
3. Distinta tipología de informes . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4. La difusión de una investigación . . . . . . . . . . . . . . . . . . . . . . . . 119
5. La calidad de la investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6. Criterios de calidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

UNIDAD DIDÁCTICA II

Tema 4. DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS


Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES,
CUASI-EXPERIMENTALES Y EXPERIMENTALES ............... 127
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
2. El diseño de investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
2.1. Concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

8
ÍNDICE

2.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139


2.3. Tipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
3. Criterios para seleccionar el diseño . . . . . . . . . . . . . . . . . . . . . . . . . 156
3.1. Responder a las preguntas de la investigación . . . . . . . . . . . . 156
3.2. Controlar la varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
3.3. Grado de generalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
4. Problemas educativos y diseños . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

Tema 5. EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS.


LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA . . . . . . . 165
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
2. El Experimento y sus notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
2.1. Notas o características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
2.2. Tipos y características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
2.3. Limitaciones del experimento . . . . . . . . . . . . . . . . . . . . . . . . . . 174
3. La validez de los diseños . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
3.1. Factores de invalidez interna de los diseños . . . . . . . . . . . . . . 178
3.2. Factores de invalidez externa de los diseños . . . . . . . . . . . . . . 181
4. La investigación ex-post-facto como alternativa . . . . . . . . . . . . . . . 182
4.1. Concepto y características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
4.2. Algunas modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

Tema 6. PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS.


DISEÑOS FACTORIALES Y DE CUADRADO LATINO.
DISEÑO DE COVARIANZA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
1. La naturaleza del experimento y el diseño de dos grupos . . . . . . . 200
1.1. El dominio de la realidad y la provocación del fenómeno . . . 201
1.2. El control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
2. Los principales diseños de dos grupos . . . . . . . . . . . . . . . . . . . . . . . 209
2.1. Diseños únicamente con pos-test . . . . . . . . . . . . . . . . . . . . . . . 214
2.2. Diseños con pre-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
2.3. Diseños con sujetos independientes o emparejados . . . . . . . . 217
2.4. Valoración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

9
MÉTODO Y DISEÑO DE INVESTIGACIÓN EN EDUCACIÓN

3. Valoración de los diseños de dos grupos . . . . . . . . . . . . . . . . . . . . . 220


4. El diseño factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
4.1. Naturaleza del diseño factorial . . . . . . . . . . . . . . . . . . . . . . . . . 223
4.2. Efectos a estudiar en los diseños factoriales . . . . . . . . . . . . . . 223
5. El diseño de cuadrado latino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6. El diseño de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
7. Diseños de un solo grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

Tema 7. ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS . . . . . 233


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
2. Conceptos básicos en la inferencia estadística . . . . . . . . . . . . . . . . 236
2.1. Propiedades de los estimadores . . . . . . . . . . . . . . . . . . . . . . . . 239
3. Distribución muestral, error muestral y error típico: Estimación
del parámetro media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
3.1. Estimación del parámetro proporción . . . . . . . . . . . . . . . . . . . 248
4. Estimación del parámetro correlación de Pearson. Introducción
al concepto de la significación estadística y al planteamiento
de los diseños de un solo grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5. Estimación del parámetro diferencia de medias . . . . . . . . . . . . . . . . 252
6. Estimación de parámetros y contraste de hipótesis: interpretación
intuitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257

Tema 8. ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS . . . . . . . . 259


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
2. Lógica de la prueba de significación de la hipótesis nula. . . . . . . . 262
3. Nivel de significación estadística y errores Tipo I y Tipo II . . . . . . 265
4. Los pasos del contraste de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . 267
4.1. Selección de una muestra aleatoria . . . . . . . . . . . . . . . . . . . . . 268
4.2. Formulación de las hipótesis estadísticas . . . . . . . . . . . . . . . . 268
4.3. Elección del valor de alfa o nivel de significación . . . . . . . . . . 270
4.4. Determinación de la distribución muestral y la región
de rechazo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
4.5. Utilización del valor exacto de p . . . . . . . . . . . . . . . . . . . . . . . . 272

10
ÍNDICE

5. Errores frecuentes en la utilización e interpretación de resultados


de la prueba de significación de la hipótesis nula . . . . . . . . . . . . . . 273
6. El tamaño del efecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

Tema 9. LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES


DISEÑOS:
ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER . . 281
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
1. Variedad de pruebas para los diseños de dos grupos . . . . . . . . . . . 284
1.1. Pruebas paramétricas frente a no paramétricas . . . . . . . . . . . 285
1.2. Tipos de diferencias y pruebas estadísticas . . . . . . . . . . . . . . . 287
2. Las pruebas paramétricas en los diseños de dos grupos.
Sujetos independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
2.1. Las exigencias del modelo y la prueba . . . . . . . . . . . . . . . . . . . 289
2.2. Principales pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
3. La correlación como minimización de la varianza de error . . . . . . 320
4. Correlación y grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
5. Pruebas paramétricas para muestras relacionadas . . . . . . . . . . . . . 328
5.1. Pruebas z y t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
5.2. La prueba F como alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . 337
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341

Tema 10. ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U . . . . . . 343


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
1. Diversidad de pruebas. Selección de las más utilizadas . . . . . . . . . 346
2. Escala de medida, potencia, tipo de diferencia y prueba a aplicar . . 346
2.1. χ2 y datos de carácter nominal . . . . . . . . . . . . . . . . . . . . . . . . . 347
2.2. Prueba de la mediana y medición ordinal burda . . . . . . . . . . 362
3. Pruebas no paramétricas para grupos correlacionados . . . . . . . . . 376
3.1. Medición ordinal burda y prueba de los signos . . . . . . . . . . . . 377
3.2. Medición ordinal y prueba de Wilcoxon . . . . . . . . . . . . . . . . . 385

Tema 11. LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS . . . . . . 397


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
1. Diseños de más de dos grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
1.1 Resolución de un caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
1.2 Un caso de falta de validez interna . . . . . . . . . . . . . . . . . . . . . . 402

11
MÉTODO Y DISEÑO DE INVESTIGACIÓN EN EDUCACIÓN

2. La covarianza en los diseños de grupos naturales . . . . . . . . . . . . . . 403


2.1 Estudio de un caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404
2.2 Resolución estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
2.3 Compraciones entre medias ajustadas . . . . . . . . . . . . . . . . . . . 409
3. Diseños de cuadrado latino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
3.1 Estudio de un caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411
3.2 Resolución estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
4. Diseños factoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
4.1 Estudio de un caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
4.2 Resolución estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
4.3 Contrastes a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
4.4 Manifestaciones de invalidez interna . . . . . . . . . . . . . . . . . . . . 426
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
ANEXO A LA UNIDAD DIDÁCTICA II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
1. Sentido del Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
2. El informe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
2.2. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
2.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
2.4. Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
2.5. Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
2.6. Instrumento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
2.7. Proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
2.8. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
2.9. Tratamiento estadístico e interpretación de resultados . . . . . 437
2.10. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
3. Enjuiciamiento de la investigación . . . . . . . . . . . . . . . . . . . . . . . . . . 445
3.1. Aspectos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
3.2. Validez interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
3.3. Validez externa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
3.4. El tratamiento estadístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449

UNIDAD DIDÁCTICA III

Tema 12. PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA


A LA SELECCIÓN DE INFORMANTES ...................... 453

12
ÍNDICE

Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
1. Los fundamentos de la metodología cualitativa de investigación . . 456
1.1 Su esencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
1.2. Notas que permiten conocer cómo ha sido su construcción
histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
2. La metodología cualitativa de investigación y sus características . . 460
2.1 Aportaciones y limitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
3. El proceso que sigue la investigación cualitativa . . . . . . . . . . . . . . . 469
3.1. Propuesta inicial de partida . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
3.2. Trabajo de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474
3.3. Análisis e interpretación de datos cualitativos . . . . . . . . . . . . . 478
3.4. Elaboración del informe y líneas de acción . . . . . . . . . . . . . . . 480
4. Los métodos de investigación cualitativa en la educación . . . . . . . 481
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

Tema 13. MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS . 487


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489
1. Los datos cualitativos en la investigación . . . . . . . . . . . . . . . . . . . . 491
2. La observación participante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491
3. La entrevista cualitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498
4. Técnicas narrativas para el registro y tratamiento de los datos. . . 501
4.1. Documentos personales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502
4.2. Documentos institucionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 505
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506

Tema 14. EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA . 507


Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
1. Procedimientos y técnicas a seguir en el análisis cualitativo de
los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 510
2. El procedimiento analítico de datos en la investigación cualitativa . . 511
3. De los datos a la teoría . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517
4. Aportaciones de la informática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
Software de referencia: AQUAD, NUD.IST, QSR-NVIVO, WIN MAX
pro, MAX QDA, ATLAS.TI, ETHNOGRAPH, DECISION EXPORER . 519
Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527

13
MÉTODO Y DISEÑO DE INVESTIGACIÓN EN EDUCACIÓN

GLOSARIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529

BIBLIOGRAFÍA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559

ANEXO. Tablas Estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567

14
PRESENTACIÓN

El presente volumen está pensado especialmente para el alumnado del


Grado universitario en Pedagogía de la UNED, en concreto para la pre-
paración de la asignatura del mismo nombre: Métodos y diseños de inves-
tigación en Educación. No obstante, puede resultar de interés para todos
aquellos estudiantes y profesionales de la Educación interesados tanto
por mejorar su actividad profesional mediante la investigación como en
comprender y valorar la investigación dada a conocer en libros y en revis-
tas especializadas, de cara a su posible aplicación a la práctica docente y
educativa.
En efecto, entre los objetivos perseguidos por los autores, profesores de
la citada asignatura, se encuentran los de capacitar para comprender los
informes de investigación que permitan actualizar los conocimientos a tra-
vés de los resultados de la investigación científica.
Junto a ello, y en niveles básicos, también se pretende capacitar para el
diseño, ejecución y valoración crítica de investigaciones en el ámbito pro-
fesional, para lo que conviene ser capaz de plantearse la realidad educativa
con mentalidad crítica y científica: problematizarla, cuestionarla, buscar
respuestas rigurosas y contrastarlas.
El programa se estructura en tres unidades, integradas por 13 temas. La
primera unidad se centra en temas básicos en torno a la ciencia, el método
científico, la problemática de los paradigmas y la calidad de los informes de
investigación.
La segunda, más amplia, se dedica al diseño de la investigación y a los
principales diseños, con su correspondiente solución mediante la Estadísti-
ca. Esta unidad lleva incorporado un Anexo, a modo de Informe de investi-
gación, en el que se pretende integrar teoría y práctica.
Por último, en la tercera, más breve, se someten a estudio los principa-
les aspectos relacionados con la investigación de corte cualitativo.

15
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Los temas están redactados con un enfoque destinado a la comprensión


y asimilación de los conceptos fundamentales; a tales efectos, algunos de
ellos tienen una notable extensión cuyo sentido y orientación es la de faci-
litar su dominio mediante ejemplos clarificadores.
Por otra parte, y dada la importancia que adquiere el lenguaje como ins-
trumento para facilitar la comunicación, la comprensión y la asimilación,
el texto se completa con un Glosario, destinado a facilitar la adquisición de
un vocabulario técnico que el alumno deberá ser capaz no de memorizar
sino de exponer con sus propias palabras.
Como en todo texto universitario, se incluye una amplia bibliografía. No
obstante, para facilitar la tarea del alumnado, se marcan con * los conside-
rados fundamentales y de mayor utilidad.
Los autores esperan que el texto pueda ser de utilidad tanto para la for-
mación de los estudiantes como para la mejora de su hacer profesional. En
ese sentido, agradecerán cualquier sugerencia destinada a la mejora.

Madrid, junio de 2011

16
UNIDAD DIDÁCTICA I

Tema 1. CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS.


INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA.
MÉTODOS CUANTITATIVOS Y CUALITATIVOS.

Tema 2. LA INVESTIGACIÓN CIENTÍFICA EMPÍRICA EN EDUCACIÓN.


EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA.

Tema 3. EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN.


Tema 1
Ciencia y método. Paradigmas y metodologías.
Investigación científica e investigación empírica.
Métodos cuantitativos y cualitativos

Presentación

1. Introducción
1.1. La investigación como procedimiento para obtener conocimiento
1.2. Conocimiento científico y no científico

2. La educación como objeto de conocimiento


2.1. El método general de la ciencia
2.2. La Educación como objeto de conocimiento
2.2.1. Las Ciencias humanas o sociales como ámbito u objeto del
saber.
2.2.2. La Educación como ámbito disciplinar

3. El problema de los paradigmas


3.1. Concepto de paradigma.
3.2. Caracterización de los paradigmas
3.3. Valoración de los paradigmas
3.4. Situación actual del debate

4. Concluyendo: nuestra posición sobre el tema


4.1. Naturaleza y complejidad del acto educativo
4.2. Complejidad de los procesos educativos
4.3. La respuesta metodológica

Resumen

19
PRESENTACIÓN

La investigación, tanto en el ámbito educativo como en cualquier otro,


sea social o natural, es una forma rigurosa de proceder para alcanzar cono-
cimiento relevante.
En esencia, la investigación científica no es sino la aplicación del méto-
do científico, con sus correspondientes técnicas y procedimientos, para
alcanzar un conocimiento objetivo y riguroso, dando respuesta a los
muchos interrogantes que se plantea el ser humano sobre la realidad obje-
to de preocupación, bien porque no conoce la respuesta adecuada bien por-
que desea profundizar en las respuestas disponibles, que se consideran per-
fectibles y merecedoras de profundización.
La diversidad de los ámbitos sobre los que puede investigar el ser huma-
no en su afán de conocer la realidad que le rodea ha hecho que surja una
importante cuestión: ¿cabe hablar de un método científico único, general,
o, por el contrario, es preferible hablar de varios grandes complejos meto-
dológicos, relacionados con las peculiaridades de esos campos del saber?
Todavía más: admitiendo la posibilidad de un único método general para la
creación del conocimiento científico, ¿cuál sería su naturaleza, de forma
que pudiera compatibilizarse con algunos otros métodos, también genera-
les aunque en menor grado, aplicables a los diversos grandes ámbitos sobre
los que trabaja el ser humano?
A partir de la unidad del saber, representado en su momento por la
Filosofía, se han ido desgajando las diferentes ciencias particulares, que
han ido logrando su entidad y autoafirmación a base de los conocimien-
tos relevantes a los que ha contribuido la aplicación del método científi-
co. Nos estamos refiriendo a las denominadas Ciencias de la Naturaleza,
que se han servido de tal método en el marco de una filosofía o concep-
ción positivista.

21
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La aplicación de ese planteamiento a las Ciencias Sociales, o Humanas


como otros prefieren denominarlas, ha sido objeto de críticas y polémicas al
considerarlo totalmente inadecuado, originándose así un agrio debate entre
los defensores de los métodos ligados a los denominados paradigmas, enten-
didos como unas concepciones generales sobre el mundo, el hombre y su
modo de acercarse a la realidad. Patton1, en efecto, define un paradigma como

«… una visión del mundo, una perspectiva general, un modo de desmenuzar la


complejidad del mundo real (...) los paradigmas les dicen lo que es importante,
legítimo y razonable. Los paradigmas son también normativos: señalan al profe-
sional lo que ha de hacer sin necesidad de prolongadas consideraciones existen-
ciales o epistemológicas.»

De esta forma surgen, en principio, dos grandes paradigmas, cada uno


con un origen y tradición diferentes. Como afirman Cook y Reichardt2

«El conglomerado de atributos que integran el paradigma cuantitativo proce-


de de las ciencias naturales y agronómicas, mientras que el paradigma cualitativo
tuvo su origen en los trabajos de antropología social y de sociología, sobre todo de
la Escuela de Chicago.»

En el marco específico de la Educación han surgido otras propuestas


paradigmáticas, a juicio del autor inadecuadas no en tanto que propuestas
sino en cuanto a su denominación como paradigmas, ya que no se acomo-
dan al contenido de este concepto.
Pues bien, en el presente tema se analizan estas cuestiones, y otras rela-
cionadas con ellas. Debemos destacar las relativas a la ligazón o indepen-
dencia de las metodologías para con los paradigmas. Si tal ligazón existie-
ra y fuera necesaria, la opción por el paradigma implicaría la adscripción a
una determinada metodología y, tal vez, a ciertas técnicas y procedimien-
tos. Si paradigma y metodología fueran independientes, cabría pensar en la

1
PATTON, M.Q. (1978). Utilization-Focused Evaluation. Beverly Hills: Sage, p. 203. A Patton se debe
una obra, Qualitative Evaluation Methods, publicada en 1980 en Beverly Hills por Sage, origen de
muchos trabajos sobre planteamientos metodológicos cualitativos.
2
COOK, T.D. y REICHARDT (1986). Métodos cualitativos y cuantitativos en investigación evaluativa.
Madrid: Morata, p. 39.

22
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

posibilidad de utilizar metodologías diversas, al margen del paradigma en


que el investigador milite, para afrontar los problemas a investigar. Cabe,
incluso, pensar en la posibilidad de que los propios paradigmas sean com-
patibles entre si.
Para dar respuesta a estas cuestiones se aborda de modo especial una
cuestión: la relativa a la naturaleza y características de la Educación como
objeto de conocimiento e investigación3. Ello nos permitirá saber si nos
situamos ante una ciencia, un arte, una tecnología o varias de estas cosas a
la vez. Analizaremos, también, el tipo de conocimiento que es necesario a
los educadores y, siguiendo las pautas marcadas por el profesor De Miguel,
haremos mención del valor que pueda aportar la participación de tales edu-
cadores para el éxito de la investigación.
En función de todas estas cuestiones tomaremos una posición, posición
que se ofrece a los lectores como propuesta pues en este, como en otros
muchos campos, resulta prácticamente imposible establecer certezas defi-
nitivas.
Dado todo lo hasta aquí dicho, comprenderá el lector que si siempre es
importante abordar el estudio de las diferentes unidades temáticas de forma
reflexiva y con espíritu crítico, en esta ocasión la recomendación cobra una
especial importancia. De hecho, la posición que el lector tome aquí le será de
gran valor para afrontar los temas de la asignatura; además, le dará pautas
no sólo para tomar postura sobre la calidad y el valor de las aportaciones de
la investigación siempre que se acerque a la lectura de textos e informes de
investigación, sino también para diseñar sus propias investigaciones.

1. INTRODUCCIÓN

Desde que el ser humano está sobre la Tierra ha tratado de conocer la


realidad que le rodea y ha buscado explicaciones por los medios más varia-
dos; la magia en sus inicios, la autoridad, la revelación o el denominado
sentido común a lo largo de la Historia pueden ser algunas de las manifes-
taciones más habituales.

3
Tal es la definición que, como nos recuerda T. Husén en una ponencia a la que más adelante nos
referiremos, da de Educación la International Encyclopaedia of Education: Research and Studies.

23
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

1.1. La investigación como procedimiento para obtener conocimiento

Con el paso del tiempo se abrió camino un procedimiento más riguro-


so, conocido generalmente como investigación. Hablando en términos
generales sobre la investigación, Selltiz y cols.4 afirman que

«Investigar es buscar de nuevo, echar otra mirada más cuidadosa para averi-
guar más. Echamos otra mirada porque puede haber algo erróneo en lo que ya
sabemos [...]
La actitud investigadora presupone que la primera mirada —y las posterio-
res— pueden ser propensas a error, y por ello tenemos que mirar una y otra vez,
de forma diferente y completa cada vez.»

Si nos fijamos en las palabras anteriores, tanto la actitud investigadora


como el propio acto de investigar pueden ser aplicados a muy diversas rea-
lidades humanas, a muy diferentes problemas: puede investigar un juez, un
policía, un periodista, un detective... Hasta una persona cualquiera, en el
ámbito de su domicilio, puede investigar tratado de descubrir por qué, por
ejemplo, la factura del agua es mucho más elevada de lo que razonable-
mente cabría esperar, descubriendo que hay una fuga en la tubería, que los
niños dejan los grifos sin cerrar por completo, que se deja correr el agua de
modo innecesario... o que el propio contador tiene una avería que le lleva a
medir mal el agua realmente gastada.
En todas esas manifestaciones descubrimos una actitud inquisitiva y
podemos aceptar que los «investigadores» actúan siguiendo unas pautas,
unos procedimientos propios de la investigación: definir el problema, plan-
tear tentativas de solución, ponerlas a prueba, admitir o descartar la tenta-
tiva sometida a investigación...

1.2. Conocimiento científico y no científico

Sin embargo, no creemos que nadie califique al juez, al policía, al perio-


dista o al cabeza de familia de científico, a pesar de que puedan aplicar unas

4
SELLTIZ, C. y otros (1976). Métodos de investigación en las relaciones sociales. Madrid: Rialp, p. 17.

24
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

pautas propias del hacer científico, lo que, sin duda, redundará en una
mayor eficacia de su hacer profesional. Por tanto, ni la actitud de rigor
inquisitivo ni el propio proceder indagador son la clave de la investigación
científica, aunque todas ellas sean necesarias. Lo que es preciso es que acti-
tud y proceder, o si se prefiere sólo el proceder —porque ya implica la acti-
tud— se pongan al servicio de objetivos científicos.
En el avance hacia el conocimiento científico no se da una total discon-
tinuidad con el proporcionado por el denominado sentido común. De
hecho, no cabe un conocimiento científico a partir de la nada; son la expe-
riencia propia y ajena y el sentido común los que pueden sugerir proble-
mas, procedimientos y hasta soluciones. La ciencia, después, mediante la
aplicación de un procedimiento riguroso puesto al servicio de cuestiones
destacadas y relevantes, confirmará, modificará o rechazará las intuiciones
de la experiencia y del sentido común5.
En esa línea se manifiesta Mario Bunge6, doctor en Ciencias Físico—
Matemáticas, filósofo de la Ciencia y Premio «Príncipe de Asturias» de
Humanidades, cuando afirma:

«Si la “sustancia” (objeto) no puede ser lo distintivo de toda ciencia, entonces


tienen que serlo la “forma” (el procedimiento) y el objetivo: la peculiaridad de la
ciencia tiene que consistir en el modo con que opera para alcanzar algún objetivo
determinado, o sea, en el método científico y en la finalidad para la cual se aplica
dicho método.»

y refiriéndose a esta —a la finalidad— la caracteriza como la obtención


de «conocimiento objetivo del mundo».
Para situar la presente unidad temática, nada mejor que la transcripción
de las palabras con que Bunge7, da comienzo a un tan pequeño como inte-
resante y denso texto sobre la ciencia:

5
Debemos indicar, no obstante, los riesgos del denominado sentido común. Kerlinger (en Investi-
gación del comportamiento. Técnicas y metodología, en su edición de 1981 por Iberoamericana, p. 2),
recoge la opinión de Whitehead en el sentido de que es un mal maestro, dado que «Su único criterio
para juzgar es que las nuevas ideas han de asemejarse a las antiguas».
6
BUNGE, M. (1979). La investigación científica. Barcelona: Ariel, p. 22.
7
BUNGE, M. (1981). La ciencia: su método y su filosofía. Buenos Aires: Ediciones Siglo Veinte, p. 9.

25
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

«Mientras los animales inferiores están en el mundo, el hombre trata de enten-


derlo; y sobre la base de su inteligencia imperfecta pero perfectible del mundo, el
hombre trata de enseñorearse de él para hacerlo más confortable. En este proceso,
construye un mundo artificial: ese creciente cuerpo de ideas llamado «ciencia»,
que puede caracterizarse como conocimiento racional, sistemático, exacto, verifi-
cable y, por consiguiente, falible. Por medio de la investigación científica, el hom-
bre ha alcanzado una reconstrucción conceptual del mundo que es cada vez más
amplia, profunda y exacta.

[...] La ciencia como actividad —como investigación— pertenece a la vida social;


en cuanto se aplica al mejoramiento de nuestro medio natural y artificial, a la inven-
ción y manufactura de bienes materiales y culturales, la ciencia se convierte en tecno-
logía. Sin embargo, la ciencia se nos aparece como la más deslumbrante y asombrosa
de las estrellas de la cultura cuando la consideramos como un bien en sí mismo, esto
es, como un sistema de ideas establecidas provisionalmente (conocimiento científico)
y como una actividad productora de ideas (investigación científica).»

La cita, bastante extensa, incorpora una serie de ideas de gran utilidad


para nosotros:
a) hay algo que distingue al ser humano del resto de seres vivos, inclui-
dos los animales: la posibilidad de entender el mundo para enseñore-
arse de él y hacerlo más confortable;
b) en el proceso nunca acabado de llegar a tan elevada meta, el hombre
elabora un gran cuerpo de ideas, que denominamos ciencia, y que es
caracterizado por todo un conjunto de notas: se trata de un conoci-
miento racional, sistemático, exacto, verificable y falible;
c) es la investigación científica —la ciencia como actividad— la que per-
mite esa reconstrucción conceptual progresiva del mundo;
d) hay algo así como dos grandes tipos de ciencia: aquella que es un bien
en si misma —un sistema de ideas establecidas provisionalmente— y
aquella otra que se aplica al mejoramiento de nuestro medio natural
y artificial, convirtiéndose entonces en tecnología8.

8
En una de sus más grandes obras, La investigación científica, editada en Barcelona por Ariel en 1979
(6.ª ed.) llama a las primeras ciencia pura, siendo su objetivo primordial el incremento de nuestro conoci-

26
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Pues bien, tomando estas ideas como punto de partida, nuestra refle-
xión se va a centrar en cuatro grandes aspectos: a) estudiaremos el método
científico y sus implicaciones para la investigación científica; b) trataremos
de analizar lo que representa el objeto de nuestra atención, la educación,
como campo para la ciencia y, en consecuencia, para la investigación cien-
tífica; c) plantearemos el debate sobre los paradigmas desde la perspectiva
anterior; y d) haremos una propuesta propia, a modo de conclusión, en
torno a la investigación sobre Educación.

2. LA EDUCACIÓN COMO OBJETO DE CONOCIMIENTO

Si bien cabría hablar de algo así como un método general propio de


la ciencia, no es menos cierto que tanto el objeto de conocimiento
como el tipo de enunciados 9 que proporciona, por un lado, como su
finalidad y objetivos, por otro, dan lugar a diferentes modalidades de
ciencia.
Por ello parece conveniente y adecuado abordar el análisis de la Edu-
cación como objeto de conocimiento, así como los objetivos que se pre-
tenden cubrir a través de su estudio mediante los procedimientos cien-
tíficos.

2.1. El método general de la ciencia

Probablemente, la más sencilla presentación de lo que se conoce como


método científico la realizó John Dewey10, consistente en cinco grandes
pasos, momentos o etapas:

miento (objetivo intrínseco o cognitivo) , y a las segundas ciencia aplicada, cuyo objetivo es el de aumentar
nuestro bienestar y nuestro poder (objetivos extrínsecos o utilitarios), denominando a éstas tecnologías. En
ambos textos hace mención de una distinción de otra naturaleza, la que se basa en el objeto de las discipli-
nas y tipo de enunciados, que da lugar a las ciencias formales, como la Lógica y la Matemática (estudian
ideas) y las factuales, como la Física, la Química, la Biología, la Economía, la Sociología..., que estudian
hechos.
9
Bunge señala que las ciencias formales —la Lógica y la Matemática— dan lugar a enunciados que
consisten en relaciones entre signos, mientras las factuales —caso de la Física, la Química o la Econo-
mía— producen enunciados referidos, en la mayoría de las ocasiones, a sucesos o procesos. (La cien-
cia..., p. 11).
10
DEWEY, JH. (1933). How we Thing. Heath, pp. 106-118.

27
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

«El hombre se da cuenta de que está ante una situación para la que no tiene
una respuesta satisfactoria, una solución adecuada (un problema).
Busca soluciones a tal situación o problema.
Analiza cuál de ellas es la que puede ser considerada, a priori, como la mejor,
la más adecuada, y la plantea como hipótesis.
Deduce las consecuencias que deberían darse si tal solución fuera la correcta.
Somete la hipótesis a contraste, tratando de apreciar si, en efecto, se dan tales
consecuencias esperadas.»

Si es así —si se dan tales consecuencias— da por buena, aunque provi-


sionalmente, la solución; en caso contrario, vuelve al punto c) y sigue el
proceso.
No es esta la única forma de caracterizar el método. Tal vez resulte de
utilidad en este punto una breve referencia a la conocida obra de R. Des-
cartes, El discurso del método, cuyo título completo es el de Discurso del
método para dirigir bien la razón y buscar la verdad en las ciencias. Seme-
jante título nos sitúa ante el sentido del método —una herramienta para
ayudar a la razón— y su finalidad: buscar la verdad en las ciencias. En su
segunda parte, plantea los siguientes cuatro preceptos como de necesaria
observación y aplicación:

• «Consistiría el primero en no admitir jamás como verdadera cosa alguna sin


conocer con evidencia que lo era; es decir: evitar cuidadosamente la precipita-
ción y la prevención y no comprender en mis juicios, nada más que lo que se pre-
sentase a mi espíritu tan clara y distintamente que no tuviese motivo alguno
para ponerlo en duda.
• El segundo, en dividir cada una de las dificultades que examinare en tantas par-
tes como fuere posible y en cuantas requiriese su mejor solución.
• El tercero, en conducir ordenadamente mis pensamientos, comenzando por
los objetos más simples y más fáciles de conocer, para ir ascendiendo, poco a
poco, como por grados, hasta el conocimiento de los más compuestos; y
suponiendo un orden aun entre aquellos que no se preceden naturalmente
unos a otros.
• Y el último, en hacer en todo enumeraciones tan completas y revisiones tan
generales que estuviera seguro de no omitir nada.»

28
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Por su parte, M. Bunge11, que se resiste a la elaboración de reglas que


aseguren el conocimiento científico, se muestra en radical desacuerdo con
quienes rechazan toda regla12, y se limita a proponer una serie ordenada de
operaciones que debe seguir la investigación científica:

«1. Enunciar preguntas bien formuladas y verosímilmente fecundas.


2. Arbitrar conjeturas, fundadas y contrastables con la experiencia, para contestar
a las preguntas.
3. Derivar consecuencias lógicas de las conjeturas
4. Arbitrar técnicas para someter las conjeturas a contrastación.
5. Someter a su vez a contrastación esas técnicas para comprobar su relevancia y
la fe que merecen.
6. Llevar a cabo la contrastación e interpretar sus resultados
7. Estimar la pretensión de verdad de las conjeturas y la fidelidad de las técnicas
8. Determinar los dominios en los cuales valen las conjeturas y las técnicas y for-
mular nuevos problemas originados por la investigación.»

La posición de algunos autores es la de que todo campo del saber que


pretenda ser denominado ciencia debe ser capaz de aplicar ese método
general, un método que en su formulación más exigente se denomina hipo-
tético-deductivo-experimental, en atención a sus tres grandes momentos:
plantear hipótesis, sacar consecuencias de las mismas y contrastarlas de
modo riguroso —experimento— en la realidad.
El propio Bunge afirma:

«El método científico es un rasgo característico de la ciencia, tanto de la pura


como de la aplicada: donde no hay método científico no hay ciencia. Pero no es ni
infalible ni autosuficiente. El método científico es falible: puede perfeccionarse
mediante la estimación de los resultados a los que lleva y mediante el análisis
directo. Tampoco es autosuficiente: no puede operar en un vacío de conocimien-
to, sino que requiere algún tipo de conocimiento previo que pueda luego reajus-

11
La investigación científica, pp. 25-26.
12
En La Ciencia, su método y su filosofía, rechaza la posición de Bridgman, para quien «la ciencia es
lo que hacen los científicos y hay tantos métodos científicos como ciencia»; pero también se muestra con-
trario a posiciones como las de Bacon o Descartes, que tienen una gran fe en el respeto a las reglas.

29
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

tarse y elaborarse; y tiene que complementarse mediante métodos especiales adap-


tados a las peculiaridades de cada tema.» (pp. 29 y 30).

De sus palabras parece sacarse una conclusión: el método científico es


imprescindible, es la conditio sine qua non para alcanzar conocimiento cien-
tífico; unas líneas antes de la anterior cita nos da la clave: «el método cientí-
fico y la finalidad a la cual se aplica (conocimiento objetivo del mundo) cons-
tituyen la entera diferencia que existe entre la ciencia y la no-ciencia»... Ahora
bien, a la hora de acotar, de delimitar la esencia del método, Bunge parece
huir de la excesiva formalización cuando, unas líneas más adelante, afirma:

«Frente a prescripciones metodológicas tan dogmáticas y estériles (y teorética-


mente injustificadas), lo mejor es tener presente la que acaso sea la única regla de
oro del trabajo científico: audacia en el conjeturar, rigurosa prudencia en el
someter a contrastación las conjeturas.» (p. 29).

Lo que nos conduciría a una importante conclusión: estaremos en el


marco de la ciencia siempre que la finalidad sea científica (conocimiento
objetivo del mundo) y actuemos con rigor metodológico al servicio de la
misma, esto es, sometiendo a contraste las conjeturas que nos hayamos
planteado.
Sin embargo, dejemos constancia de que estos planteamientos no son
aceptados por muchos, en particular por investigadores de las Ciencias
Sociales o Humanas, por considerar que la especificidad de los propios
saberes no permite ni formular esas conjeturas ni contrastarlas por proce-
dimientos como los indicados por M. Bunge, sino, más bien, descubrirlas,
extraerlas de la realidad por medio de metodologías no predeterminadas,
que se van construyendo sobre la marcha en un diálogo dialéctico conti-
nuado entre información e interpretación13.

13
Comprenderemos la dificultad con sólo analizar el concepto de investigación científica ofrecido
por Kerlinger en su citada obra: «La investigación científica es una investigación sistemática, controlada,
empírica y crítica, de proposiciones hipotéticas sobre supuestas relaciones que existen entre fenómenos
naturales» (p. 7). En línea con lo anterior plantea que «el objetivo fundamental de la ciencia e la teoría.
Dicho en un lenguaje menos críptico, su finalidad consiste en explicar los fenómenos naturales. Tales expli-
caciones reciben el nombre de teorías.» (p. 6).

30
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

2.2. La Educación como objeto de conocimiento

Dos son los problemas que hemos de abordar en este punto: el primero,
si la educación, como el resto de los ámbitos del saber sobre el ser humano,
debe ser estudiada del mismo modo que los saberes sobre las cosas e, inclu-
so, sobre los seres vivos no racionales; el segundo, si la educación es un
ámbito disciplinar homogéneo o, por el contrario, carece de tal carácter.

2.2.1. Las Ciencias humanas o sociales como ámbito u objeto del saber

En el desarrollo de los saberes científicos como una realidad separada


de la Filosofía, fueron las Ciencias Naturales las primeras en dar el paso, y
en hacerlo con éxito. Los avances de la ciencia en este ámbito se debieron
en gran medida a los planteamientos científicos del positivismo, término
este atribuido a Augusto Compte y a Emile Durkheim.
En forma sintética, el positivismo asume la unidad de la ciencia, la
explicación científica de carácter causal y la elaboración de leyes generales
así como la utilización de la metodología propia de las ciencias naturales,
en concreto del método hipotético-deductivo-experimental.
Dado el éxito en la obtención de conocimiento científico mediante la
aplicación de tales postulados, no debe extrañar que, en ese proceso de cre-
ación del conocimiento científico, el modelo de investigación positivista
fuera tomado como referencia e ideal: había que aplicar a las Ciencias
Sociales y Humanas en general los esquemas de procedimiento riguroso
que tan buen resultado estaban dando en otros ámbitos del saber.
Sin embargo, a mediados del siglo XX se produce una notable reac-
ción, cuyo punto de arranque tal vez se pueda localizar en los plante-
amiento de W. Dilthey, quien, a finales del XIX, ya enunciaba una
clara distinción entre el modo de conocer propio del ámbito natural
(Ciencias Naturales) y el humano (Ciencias Humanas): si las primeras
se orientaban a la explicación 14, las segundas buscaban la compren-

14
El concepto de explicación debe entenderse en el sentido de encontrar enunciados generales que
permitan dar una respuesta a un conjunto de fenómenos. Para Jaspers, la explicación tiene por objeto
establecer las causas de los fenómenos, por lo que la considera como una meta propia de las Ciencias

31
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

sión 15, conceptos ambos no siempre fáciles de diferenciar 16. La línea de


demarcación entre ambos tipos de ciencias se encontraría en un
importante hecho: mientras el investigador de las Ciencias Naturales
centra su atención en lo que ocurre «ahí fuera», una realidad objetiva,
estática, dócil al investigador, el de las Ciencias Humanas aborda
fenómenos intencionales, dinámicos, en continuo cambio, para cuyo
conocimiento debe acudir a la «experiencia interior» de sus protago-
nistas.
La reacción frente al positivismo tiene en la Escuela de Frankfut de filo-
sofía crítica otro importante hito. Esta concepción filosófica mantiene que,
frente a las Ciencias Naturales, en que se da una distancia entre el investi-
gador y el objeto de conocimiento, lo que permite el conocimiento objetivo,
en las Ciencias Sociales se produce una interacción entre la realidad estu-
diada y el propio investigador, que se acerca a ella con unas ideas y posi-
cionamientos previos, con una teoría. En estas condiciones, ni el plantea-
miento positivista ni siquiera el post-positivista, resultarían aptos para
captar el comportamiento humano; la alternativa propuesta es el interac-
cionismo simbólico17.

de la Naturaleza. Vid. FREUND, J. (1975). Las teorías de las ciencias humanas. Barcelona: Ediciones
Península, págs. 119 s. En la misma línea se manifiesta Russell Hanson en Patrones de descubrimiento.
Observación y explicación, editado en 1977 por Alianza Universidad. En su pág. 35 afirma: «Las expli-
caciones causales son importantes para nosotros. Existen, por supuesto, otros muchos modos de hacer
comprensibles los fenómenos».
15
Cuando se habla de comprensión en el contexto de las metas de la investigación debemos enten-
der «la captación de las relaciones internas y profundas a través de la penetración en su intimidad, respe-
tando la originalidad y la indivisibilidad de los fenómenos», palabras que pone Freund, en su citada obra
y lugar, en boca de Jaspers. Y añade: «en lugar de parcelar lo real, como hace la explicación, la compren-
sión respeta su totalidad vivida. Los resultados a los que llega no son, en general, directamente verificables
por la experiencia, pero se nos imponen por la evidencia».
16
Véase al respecto los planteamientos de I.C. Jarvie: «Es fácil que se produzcan problemas de
explicación y de comprensión, quizá porque las palabras usuales `explicación´ y `comprensión´ se utili-
zan casi indistintamente. Sin embargo, en filosofía de la ciencia podemos ser claros mediante la adop-
ción de una precisión deductiva de la primera. Sea la comprensión lo que sea, la explicación es el pro-
ceso que consiste en deducir un enunciado a partir de otros, de acuerdo con algunos requisitos tanto
formales como materiales». Vid. JARVIE. I.C. (1982). Comprensión y explicación en Sociología y en
Antropología social. En N. CHOMSKY y otros: La explicación en las ciencias de la conducta. Madrid:
Alianza Universidad, pp. 159-181.
17
Vid. MARTÍNEZ MIGUÉLEZ, M. (2002) La Etnometodología y el Interaccionismo Simbólico. Sus
aspectos metodológicos específicos. En Heterotopia (2), n. 21, pp. 9-21. Consultar en
http://prof.usb.ve/miguelm/laetnometodologia.html

32
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

2.2.2. La Educación como ámbito disciplinar

¿Y la Educación? ¿Qué podemos decir de ella como objeto de conoci-


miento e investigación? Dos son aquí las cuestiones fundamentales: ¿es
ciencia? Y, en caso de serlo, ¿se trata de una o de varias?18. Para abordar
esta cuestión parece conveniente una reflexión sobre la naturaleza del saber
sobre educación.
Voces hay que hablan de la Educación como un arte19 algo que proba-
blemente sea cierto, pero que, a nuestro juicio, no impediría intentar un
«acceso científico» a ese arte. El pintor es un artista y cuando elabora sus
cuadros se deja llevar en gran medida por la creatividad, por la intuición,
por la inspiración, por su especial sensibilidad..., pero, dentro de su hacer
artístico, puede recurrir al conocimiento, objetivo y objetivado, sobre la
perspectiva, las proporciones, el colorido, los contrastes, las texturas... aun-
que luego le dé su toque personal, precisamente el que le hace reconocible
como autor de todas sus obras o de las correspondientes a una determina-
da etapa de creación.
Otros autores consideran que la educación es un arte mientras la Peda-
gogía es, o desea serlo, una ciencia, la ciencia de la educación. El enfrenta-
miento directo del educador con el educando es una actividad que, por su
especificidad y, en alguna medida, irrepetibilidad, tienen mucho de intui-
ción y creatividad, pero el profesional puede beneficiarse del conocimiento
riguroso, obtenido por procedimientos adecuados, que le sirve la Pedagogía
y el resto de las Ciencias de la Educación, en particular la Psicología o la
Sociología.
Por su parte, Shulman20 o Heshusius y Smith21 consideran que la Edu-
cación sería una mezcla de ciencia y arte, de conocimiento teórico y acción
práctica, que exigiría una forma de investigación propia.

18
No olvidemos que, en educación, es frecuente utilizar la expresión «ciencias de la Educación».
19
Una voz autorizada en este aspecto es la de William James, quien, refiriéndose a la posibilidad
de obtener aplicaciones prácticas directas desde la ciencia psicológica a las aulas, lo califica de un
«enorme error» ya que «La Psicología es una ciencia y enseñar es un arte». «Una mente inventiva inter-
media ha de realizar la aplicación, utilizando su originalidad».
20
SHULMAN, L.S. (1981). Disciplines of inquiry in education: An overview. En Educational Research,
10, 6.
21
HESHUSIUS, L. y SMITH, J. (1986). Closing down the conversation: The end of the quantitative-qual-
itative debate among educational inquiries. En Educational Researcher, 15, 1.

33
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Para otros, la Educación como objeto de estudio e investigación es una


tecnología22; en general, la naturaleza de las tecnologías reside en el logro de
un conjunto de conocimientos debidamente organizados y estructurados,
obtenidos mediante el manejo de procedimientos rigurosos, aplicables a la
mejora de la realidad de que se trate.
En otro orden de cosas, entre quienes sostienen, y desean, alcanzar
conocimiento científico sobre Educación —un conocimiento que se encua-
draría en el marco de las denominadas ciencias sociales o humanas ya que
su objeto de preocupación y estudio es el ser humano en cuanto mejorable
o perfeccionable a través de una actuación sistemática— hay quienes des-
tacan un importante hecho: la Educación no es una disciplina claramente
delimitada y definida sino una realidad compleja que puede y debe ser estu-
diada desde diferentes disciplinas, entre las que podemos destacar la Psi-
cología, la Sociología, la Filosofía, la Economía o la Política, además, claro
está de la propia Pedagogía.
Estos tres importantes hechos: que la educación se considere o no cien-
cia (ciencia frente a arte), que se tome como un tipo concreto de saber (tec-
nología) y que, de ser ciencia, lo sea desde una perspectiva multidisciplinar,
han dado lugar a una reacción frente a los métodos clásicos de carácter
positivista que se ha traducido en el planteamiento de enfoques —paradig-
mas— alternativos. Al debate suscitado en este ámbito dedicaremos en pró-
ximo apartado.
Tal como hemos indicado, nuestra posición reconoce tres hechos impor-
tantes: a) el acto de educar es un arte, pero tal arte puede verse beneficiado
de la utilización de saber, de conocimiento obtenido por la vía rigurosa del
método científico, por lo que la disciplina que se sirva de tan elaborada
como potente y rigurosa herramienta es o debe aspirar a constituirse como
ciencia23; b) los conocimientos científicos se orientan directamente a la
mejora de los educandos, y a la de todos los elementos y componentes de los
procesos y contextos educativos como un medio necesario para el logro de
aquella; y c) la Educación es un ámbito del saber, tan amplio como pueda

22
COLOM, A. y cols. (1986). Tecnología y Educación. Barcelona: CEAC.
23
Para algunos, lo más difícil para que el estudio de la Educación se pueda considerar ciencia es la
posibilidad de llegar a leyes generales. Sin embargo, hay autores que ofrecen salidas a considerar. Por
ejemplo, M. Sherwood (The logic of Explanation in Psychoanalysis. Academic Press, 1969), a la que nos
referiremos más adelante.

34
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

serlo la Medicina; ni una ni otra, por poner dos ejemplos, constituyen una
disciplina unitaria, homogénea en sus planteamientos, sino que se benefician
de las aportaciones de otras disciplinas que, a tales efectos, se constituyen en
ciencias básicas de estos campos de naturaleza aplicada.
Por otra parte, nos adherimos a los planteamientos del profesor De
Miguel cuando, al caracterizar la Educación, hace referencia a la convenien-
cia de que la investigación no represente una realidad apartada de la vida dia-
ria de las instituciones educativas, lugar donde se llevan a cabo los procesos
educativos. Si unas personas investigan con toda la sofistificación propia del
método científico, pero lo hacen sobre problemas que no conectan con los
que día a día afrontan los educadores en su práctica ordinaria, los resultados
de la investigación no servirán, no serán útiles para alcanzar el elemento
nuclear de la acción educativa: el cambio perfectivo de las personas que son
los educandos. Por ello, parece aconsejable intentar la conexión entre teoría
y práctica, y una investigación en que participen los profesores puede con-
vertirse en uno de los medios más adecuados para lograrlo24.
En esa línea podemos acudir a las aportaciones de Hoyle, recogidas
por L. Stenhouse25, al distinguir entre el profesional restringido y el pro-
fesional amplio; si el primero presenta un elevado nivel de competencia
en el aula, sabe comprender y tratar al niño, se siente satisfecho en sus
relaciones con los alumnos, evalúa de acuerdo con sus percepciones y
asiste a cursillos de índole práctica, al segundo le reconocen las siguien-
tes características:

«… una capacidad para un autodesarrollo profesional autónomo mediante un sis-


temático autoanálisis, el estudio de su labor con otros profesores y la comproba-
ción de ideas mediante procedimientos de investigación en el aula.»

Como se puede apreciar, el elemento diferencial se encuentra en su


capacidad para elaborar —y no sólo para aplicar— conocimiento relevante,
siendo la investigación en el aula el procedimiento adecuado.

24
La profesora M. Bartolomé propone la «investigación colaborativa» como un medio justamente
para promover la innovación en la Universidad. Vid. BARTOLOMÉ, M. y ANGUERA, T. (1990). La investiga-
ción cooperativa: vía para la innovación en la Universidad. Barcelona: PPU
25
STENHOUSE, L. (1984). Investigación y desarrollo del currículum, Madrid: Morata, pp. 195-197.

35
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

3. EL PROBLEMA DE LOS PARADIGMAS

La manifiesta diferencia entre ciencias humanas y naturales ha condu-


cido a plantear una alternativa global a los procedimientos positivistas de
la investigación, considerándolos tan adecuados a las segundas como
inapropiados a las primeras.
Por tanto, y en el campo de la investigación sobre Educación, si la realidad
a investigar es tan especial y, desde luego, diferente de la propia de las Cien-
cias de la Naturaleza, ¿es razonable aplicarle un esquema de investigación
similar? Pero, a la vez, si la realidad a investigar es tan heterogénea, ¿cabría
pensar en aplicar ambos tipos de planteamientos: los propios de las ciencias
naturales y de las ciencias sociales? Todavía más: ¿se agotan las opciones de
estudio aplicando, simultanea o sucesivamente, ambos paradigmas? He aquí
algunas de las cuestiones que debemos abordar a continuación.

3.1. El concepto de paradigma

Gage26 define a los paradigmas como «modelos, pautas o esquemas. Los


paradigmas no son teorías; son más bien maneras de pensar o pautas para la
investigación que, cuando se aplican, pueden conducir al desarrollo de la
teoría».
A Th. Kuhn se debe una de las concepciones más conocidas del término
paradigma. Sin embargo, como señala Shulman27, cabe distinguir dos for-
mas generales de entender el término:
• el primero, debido a Kuhn, considera que una disciplina madura no
puede tener más de un paradigma dominante;
• la segunda opción viene a significar el marco de una determinada escue-
la de pensamiento «que define los objetivos, los puntos de partida, méto-
dos y concepciones interpretativas adecuados para sus investigadores».

26
GAGE, N. L. (1963). Paradigms for research on teaching. En N. L. GAGE (Edit.): Handbook of
research on teaching. Chicago: Rand McNally, p. 95.
27
SHULMAN, L. S. (1989). Paradigmas y programas de investigación en el estudio de la enseñanza:
una perspectiva contemporánea. En M.C. WITTROCK (Edit.): La investigación de la enseñanza. I: Enfo-
ques, teorías y métodos. Barcelona: Paidós, p. 13.

36
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Pues bien, a juicio de Th. Kuhn, «lo que distingue a las ciencias sociales
de las naturales es la ausencia misma de un paradigma dominante único»
(p. 14). Es más, para Kuhn las ciencias sociales son «preparadigmáticas» en
su desarrollo. Ahora bien, para Shulman este hecho no debe interpretarse
como una debilidad en el desarrollo de estas ciencias; antes al contrario, «es
mucho más posible que para las ciencias sociales y de la educación la coexis-
tencia de escuelas divergentes de pensamiento sea un estado natural y bas-
tante maduro», llegándose a apoyar en Merton28 para quien

«La crisis crónica de la sociología, con su diversidad, competencia y enfrenta-


miento de doctrinas, parece preferible a la prescripción de una única perspectiva teó-
rica (...) Ningún paradigma ha empezado siquiera a demostrar su coherencia para
la investigación de toda la gama de las cuestiones sociológicamente interesantes.»

Pues bien, para algunos, a la hora de plantearse la investigación en el


campo de las ciencias sociales o humanas se dan dos grandes opciones, deno-
minadas paradigmas: el positivista, cuantitativo, y el naturalista, interpretati-
vo o cualitativo. Pero hay quienes consideran que son tres, añadiendo a los
dos anteriores un tercero, denominado crítico. Si los dos primeros se dife-
rencian en el procedimiento, en la forma de construir el conocimiento, el
paradigma crítico lo hace en lo que se refiere a su finalidad: lo importante es
que el conocimiento haga posible la transformación de la sociedad —hacién-
dola más justa— y la emancipación y liberación del ser humano29.
Aún se plantean nuevas alternativas; algunos hacen referencia al deno-
minado paradigma del cambio, cuyo sentido estaría en la producción de
conocimiento útil para la práctica educativa, algo, por cierto, en sintonía
con la misma esencia del acto educativo. Últimamente, utilizando a nues-
tro juicio de modo inadecuado el concepto, se habla de paradigmas emer-
gentes, situando en este marco el denominado feminista.

28
MERTON, R.K. (1975). Structural analysis in sociology. En P. BLAU (Edit.): Approaches to the study
of social structure. New York: The Free Press, p. 28.
29
Como se puede apreciar, el paradigma presenta connotaciones cuasi revolucionarias; de hecho,
sus mayores defensores se dan entre los educadores que trabajan en sectores marginales y marginados
de la sociedad. Sin embargo, para muchos este paradigma mezcla la Política con la Educación: mien-
tras aquella debe orientarse a crear las condiciones de justicia social y de dignificación de las condicio-
nes de vida y cultura de la Humanidad, ésta debe centrar su actuación en el mejoramiento de la perso-
na, en su plenificación, tratando de que lleguen a convertirse en realidad todas sus potencialidades.

37
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tres son los problemas que abordaremos a continuación: a) la caracte-


rización de los paradigmas; b) su valoración como adecuados o no al estu-
dio científico de la educación; c) nuestra personal opción en torno a los
mismos: la complementariedad metodológica.

3.2. Caracterización de los paradigmas

Centrando, en principio, nuestra reflexión en los dos paradigmas general-


mente aceptados, el positivista o cuantitativo y el naturalista, interpretativo,
fenomenológico o cualitativo —que todas las denominaciones se utilizan— se
ha hecho clásico el cuadro siguiente (cuadro 1.1), debido a Cook y Reichardt30:

Cuadro 1.1. Atributos de los paradigmas cualitativo y cuantitativo

Paradigma cualitativo Paradigma cuantitativo

Aboga por el empleo de los métodos cualitativos. Aboga por el empleo de los métodos cuantitativos.
Fenomenologismo y verstehen (comprensión) «inte- Positivismo lógico: «busca los hechos o causas de
resado en comprender la conducta humana desde el los fenómenos sociales, prestando escasa atención
propio marco de referencia de quien actúa» 31 a los estados subjetivos de los individuos»
Observación naturalista y sin control. Medición penetrante y controlada.
Subjetivo Objetivo
Próximo a los datos; perspectiva «desde dentro» Al margen de los datos: perspectiva «desde fuera».
Fundamentado en la realidad, orientado a los des- No fundamentado en la realidad, orientado a la
cubrimientos, exploratorio, expansionista, des- comprobación, confirmatorio, reduccionista, infe-
criptivo e inductivo. rencial e hipotético-deductivo.
Orientado al proceso. Orientado al resultado
Válido: datos «reales», «ricos» y «profundos» Fiable: datos «sólidos» y repetibles
No generalizable: estudios de casos aislados Generalizable: estudios de casos múltiples
Holista Particularista
Asume una realidad dinámica Asume una realidad estable

30
COOK, T. D. y REICHART, CH. S. (1.986). Métodos cualitativos y cuantitativos en la investigación eva-
luativa. Madrid: Morata, p. 29.
31
Citas de BOGDAN, R. y TAYLOR, S. (1975). Introduction to Qualitative Research Methods, New York:
John Wiley

38
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Por su parte, diversos autores, entre los que deben destacar a Lincoln y
Guba32 analizan las diferencias entre los tres paradigmas, los dos anteriores
y el crítico, en torno a seis grandes cuestiones:

• Las diferencias teleológicas o relativas a la finalidad de la investiga-


ción.
• Las diferencias ontológicas, esto es, a la perspectiva desde la que se
enfoca la naturaleza de la realidad investigada.
• Las relaciones entre los sujetos y el objeto.
• El propósito de la investigación
• El tipo de conocimiento que aportan
• El papel que juegan los valores (axiología).

El profesor De Miguel33, tomando estas ideas como referencia, presenta


un interesante cuadro, que nos permite apreciar, entre otras, las siguientes
cuestiones (Cuadro 1.2):
a) Las diferencias más nítidas se dan entre los paradigmas clásicos, esto
es, entre el positivista y el naturalista.
b) El paradigma crítico únicamente presenta diferencias de relieve, en
relación con el naturalista, en lo referente a la finalidad. Por tanto,
desde el punto de vista de las metodologías asociadas, es razonable
asumir que le corresponden las propias del interpretativo o natura-
lista.

32
GUBA, E. (1983). The context of emergent paradigm research. Kansas: University Press. LINCOLN, Y.
y GUBA, E. (1985). Naturalistic inquiry. San Francisco: Jossey-Bass.
33
DE MIGUEL, M. (1988). Paradigmas de la investigación educativa española. En I. DENDALUCE
(Coord.): Aspectos metodológicos de la investigación educativa. Madrid: Narcea — II Congreso Mundial
Vasco, pp. 60-77.

39
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Cuadro 1.2. Caracterización de los paradigmas positivista, naturalista


y crítico (De Miguel, 1988)
Aspectos
Finalidad Naturaleza Relación Generalización Explicación Axiología
Comparados
de la Sujeto-objeto causal
Paradigma de
Investigación realidad
Positivista Explicar Dado, externo, Independientes Generalizacio- Causas reales, Libre de valores
Controlar singular, muestral, libre nes libres de temporalmente
Predecir tangible, de valores tiempo y precedentes o
fragmentable, contexto; leyes; simultáneas
convergente explicaciones
nomotéticas:
-deductivas
-cuantitativas
-centradas sobre
semejanzas
Interpretativo Comprender Múltiple, Interrelacionado Hipótesis de Interacción de Valores dados.
(naturalista) Interpretar holístico, Relaciones trabajo en factores Los valores
divergente, influenciadas contexto y influyen en la
construido por factores tiempo dado; selección del
subjetivos explicaciones problema, la
idiográficas, teoría y los
inductivas, métodos de
cualitativas, análisis
centradas sobre
diferencias
Critico Liberar Construido, Interrelacionado Idéntico que en Similar al Valores dados.
criticar e múltiple, Relaciones el interpretativo interpretativo Crítica de las
identificar el holístico, influenciadas por ideologías
potencial de divergente fuerte
cambio compromiso para
la liberación
humana

3.3. Valoración de los paradigmas

A partir de este punto nos situamos ante la siguiente cuestión: ¿son irre-
conciliables los paradigmas? ¿Cabe pensar en su complementariedad? Y,
para nuestros propósitos, la cuestión tal vez más importante: al margen de
la respuesta que se dé ¿cabe hablar de compatibilidad y de complementa-
riedad de metodología y métodos?

40
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

En su obra de 1987, Guba34 centra su atención en tres cuestiones nucle-


ares en lo que se refiere a la opción cuantitativo/cualitativa; se trata, en
efecto, de tres supuestos aparentemente irreconciliables (Cuadro 1.3):

Cuadro 1.3. Supuestos en torno a los paradigmas, según Guba

SUPUESTO ONTOLÓGICO:

Realismo en el opción cuantitativa; relativismo en la cualitativa.

El realismo supone aceptar que existe una realidad independiente del observador; la verdad consis-
te en la representación fiel de tal realidad.

El relativismo acepta que existen realidades diferentes socialmente construidas; la verdad es una reali-
dad construida de forma consensuada.

SUPUESTO EPISTEMOLÓGICO:

Objetivismo en la opción cuantitativa frente a subjetivismo en la cualitativa.

El objetivismo asume que se puede conocer la realidad con independencia del observador. La adecuada
realización de la observación es una garantía para alcanzar el conocimiento objetivo.

El subjetivismo plantea que el resultado de la investigación no es sino una creación debida a la relación
entre el observador y la realidad observada.

SUPUESTO METODOLÓGICO:

Intervencionismo en la opción cuantitativa frente a hermenéutica en la cualitativa.

El intervencionismo consiste en el control, la manipulación de variables y la medición, garantías para


una investigación científica.

La hermenéutica sitúa al investigador como principal instrumento en la comprensión de la realidad


estudiada.

Para muchos autores, planteamientos como los anteriores nos sitúan


ante una polaridad, en especial en el caso de lo cualitativo /naturalista fren-
te a lo cuantitativo/ positivista, que no hace sino señalar los extremos de
una realidad. Es más, si bien parecen adecuados desde una perspectiva
didáctica para expresar con claridad las diferencias, a la hora de hacer
investigación, pueden resultar desaconsejables en la medida en que pueden

34
GUBA, E. (1987). What have we learned about naturalistic evaluation? En Evaluation Practice, 8,
23-44.

41
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

sugerir no sólo su posible irreconciliabilidad sino, lo que es peor, la necesi-


dad de utilizar únicamente uno y, con él, únicamente una serie de métodos,
los asociados al paradigma, como si se diera una adscripción necesaria
entre paradigma y método.
Para Cook y Reichardt (p. 38)35:

«... la distinción más notable y fundamental entre los paradigmas correspon-


de a la dimensión de verificación frente a descubrimiento. Parece que los
métodos cuantitativos han sido desarrollados más directamente para la tarea
de verificar o de confirmar teorías y que, en gran medida, los métodos cuali-
tativos fueron deliberadamente desarrollados para la tarea de descubrir o
generar teorías.»

A nuestro juicio, lo único verdaderamente irreconciliable es la posición


de partida: si la realidad exterior puede ser conocida tal como es, en su
estricta objetividad, merced a las cualidades de rigor metodológico, o si,
por el contrario, las «cosas» no existen como tales sino como son percibi-
das por el hombre a través del filtro de sus sentidos, aspecto éste en que el
propio ser humano llega a construir la realidad en continua interacción con
otros seres humanos36.
Si el investigador se sitúa decididamente en uno de tales polos, sin
dar cabida alguna al otro, acaba de elegir un paradigma —insistimos:
cualitativo o cuantitativo— y, según algunos, de adherirse a un conjun-
to de métodos y técnicas, no tomando en consideración a las del otro
paradigma.
Sin embargo, dejando de lado esta realidad, el resto de diferencias no
implican incompatibilidad ni mucho menos adscripción necesaria a un
paradigma —con rechazo subsiguiente del otro— y, de paso, a una meto-
dología concreta. Es más, las notas o atributos para diferenciar los para-

35
Sin embargo, como tendremos ocasión de apreciar, hay autores que plantean entre las finalida-
des de los métodos cualitativos la de validar teorías. Entiéndase, por tanto, lo anterior, como uno de los
elementos importantes de diferenciación pero no como una línea dicotómica de división nítida, algo que
avalaría nuestra posición de compatibilidad.
36
Y forzoso es reconocer que esta cuestión, que representa una posición filosófica, es argumenta-
ble pero en modo alguno demostrable.

42
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

digmas no constituyen una realidad entre sí interdependiente sino, más


bien, independiente.
En consecuencia, cabe estar interesado tanto por explicar como por
comprender, y muy probablemente lo uno ayuda a lo otro; cabe, asimismo,
llegar a generalizaciones intemporales a partir de otras contextuales; cabe
plantearse estudios sobre cosas y sobre seres humanos, cabe tratar los com-
portamientos humanos como realidades objetivas ocurridas «ahí fuera» y,
a la vez, tratar de analizar las reacciones, actitudes, sentimientos, valores...
a que dan lugar tales comportamientos tanto en los actores como en las per-
sonas del contexto, implicadas o no.

3.4. La situación actual del debate

Cook y Reichardt, tras someter a análisis todos y cada uno de los atri-
butos de los paradigmas recogidos en el cuadro 1.1, concluyen:

«Según el uso actual, un paradigma consta no sólo de una concepción filo-


sófica global sino también de un nexo con un determinado tipo de método de
investigación. En este sentido, la definición de paradigma determina entonces
el método. La cuestión que aquí se plantea es la de precisar si este nexo entre
paradigma y método resulta necesario e inherente o si sencillamente procede de
la definición y de la práctica. [...] Partiendo de las observaciones anteriores, lle-
gamos a la conclusión de que los atributos de un paradigma no se hallan inhe-
rentemente ligados ni a los métodos cualitativos ni a los cuantitativos. ....Lo
principal es que los paradigmas no constituyen el determinante único de la elec-
ción de los métodos.»

señalando a continuación que la elección de método debe depender


también, al menos en parte, «de las exigencias de la situación de investiga-
ción de que se trate».
Tras una dilatada época en que el debate se planteó en términos de
enfrentamiento y de descalificación del paradigma rival, tal vez como
medio para afirmar la posición emergente frente a la dominante, en la
actualidad la posición predominante es de la compatibilidad, cooperación
y, en todo caso, de señalar que la preferencia por uno u otro paradigma no

43
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

deriva de la superioridad del elegido «en general», sino de su mayor ade-


cuación a las pretensiones —objetivos— de la investigación concreta de que
se trate.
A tales efectos, transcribimos algunas de las manifestaciones relevantes:

«Tratar como incompatibles a los tipos de métodos estimula obviamente a los


investigadores a emplear sólo uno u otro, cuando la combinación de los dos sería
más adecuada para las necesidades de la investigación. [...] En nuestra posición,
constituye un error la perspectiva paradigmática que promueve esta incompatibi-
lidad entre los tipos de métodos.» (Cook y Reichardt, p. 30)

«Yo quisiera destacar aquí que los objetivos de la investigación son los que
determinan qué métodos serán más provechosos.
La afirmación anteriormente realizada parece más que evidente: la estrategia
o el paradigma que se adopte depende en gran medida del objetivo que uno se pro-
pone en la investigación que se emprende. Si la finalidad consiste en comprobar el
nivel de competencia logrado, por ejemplo, en Matemáticas..., el método de
encuesta, cuantitativamente orientado, deberá ser evidentemente el elegido. [...]
Pero un método así no nos puede revelar cómo las sutilezas pedagógicas que cons-
tituyen la infraestructura de la instrucción originan un determinado nivel de com-
petencia.» (T. Husén) 37

Y concluye el autor afirmando que, para ello, se puede acudir a la obser-


vación y a las entrevistas a profesores, esto es a la «recogida etnográfica de
datos» (p. 93)
Por su parte, el profesor De Miguel, en su citado trabajo, tras analizar lo
que denomina «caracterización del conocimiento pedagógico», concluye
del siguiente modo:

«... todo paradigma que se utilice para la investigación de fenómenos educativos


será tanto más adecuado y eficaz en la medida en que persiga la obtención de

37
HUSÉN, T. (1988). Paradigmas de la investigación en Educación. En I. DENDALUCE (Coord.):
Aspectos metodológicos de la investigación educativa. Madrid: Narcea — II Congreso Mundial Vasco,
pp. 46-59.

44
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

conocimientos monopragmáticos —verdades útiles— y utilice procedimientos de


acercamiento a la realidad apropiados a la naturaleza dinámica de la misma y
cuente, además, con la participación de aquellos que necesariamente deben trans-
formarla.»38

En relación con el tema, el profesor García Hoz, en el marco de su últi-


ma obra39, considera reduccionista la posición de incompatibilidad «a no
ser que se refieran a la imposibilidad de estudiar un mismo fenómeno con
métodos diferentes»40. Así, tras poner un ejemplo en que se pueden estudiar
aspectos apropiados unos al enfoque cuantitativo —establecer las dimen-
siones de una casa— y adecuados otros al cualitativo —apreciación de
aspectos tales como la comodidad o su calidad estética y hasta la percep-
ción de sus habitantes— concluye:

«Nos hallamos así frente a la posibilidad de enriquecer el conocimiento de una


misma realidad, uniendo a los resultados de un método los resultados de otro.»

El mismo profesor García Hoz hace referencia a un trabajo de Firesto-


ne, en el que, tras analizar las diferencias entre ambos enfoques de investi-
gación, se decanta por su complementariedad:

«El estudio cuantitativo ofrece con más precisión la magnitud de las relacio-
nes. Es posible decir claramente que el 61 % de la varianza en el rendimiento se
puede explicar. El estudio cualitativo concluye en afirmaciones `más ambiguas´
pero con mayor atención a la influencia y al sentido de los distintos factores que
inciden en una determinada actuación pedagógica.»41

38
La presente afirmación, además de resaltar la necesidad de acudir a diversos enfoques paradig-
máticos, introduce un nuevo elemento importante: la referente a la necesidad de participación de los
profesores como un elemento para romper la tradicional división entre teoría y práctica, que, con fre-
cuencia, conduce a la falta de fertilidad de la investigación por no aplicarse a la mejora de lo que ocu-
rre en los ámbitos educativos, sea la familia, el aula o el centro educativo.
39
El Tratado de Educación Personalizada, integrado por 33 volúmenes y publicado a lo largo de más
de una década (desde mediados de los 80 hasta más allá de mediados de los 90).
40
GARCÍA HOZ, V. (1994). Problemas y métodos de investigación en Educación Personalizada. Vol. 5
del Tratado de Educación Personalizada. Madrid: Rialp, p. 27.
41
FIRESTONE, W. A. (1987). Meaning in Method: The retoric of Qualitative and Quantitative research.
En Educational Researcher, october, pp. 16-81.

45
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Pero no podemos ignorar las voces discrepantes; dejemos constancia de


ellas a través de las afirmación de Smith y Heshusius42 y de Kerlinger. Los
primeros manifiestan que

«… la reclamación de una compatibilidad y la llamada para una cooperación


entre la investigación cuantitativa y cualitativa no pueden mantenerse.»

si bien es preciso indicar que estos mismos autores reconocen que


«muchos investigadores de la educación parecen pensar que el quehacer
investigador ha alcanzado una etapa si no de síntesis si de cierta compatibili-
dad y cooperación entre los dos planteamientos».
En cuanto a Kerlinger hace saber que

«La solución de un problema de investigación es de un nivel diferente de discur-


so que la solución de un problema de acción, por lo que creer o suponer que la inves-
tigación educativa puede resolver problemas y mejorar la práctica educativa es falso.»

Entre quienes defienden la complementariedad se encuentran autores


que abogan por la utilización conjunta de ambos tipos de metodologías. Tal
vez, el caso más claro se da en el marco de la denominada investigación eva-
luativa. En tal sentido, Cook y Reichardt argumentan (pág. 43):

a) La investigación evaluativa sirve a propósitos u objetivos múltiples, lo


que a menudo exige variedad de métodos.
b) Los dos tipos de métodos, cualitativos y cuantitativos, pueden vigori-
zarse mutuamente para brindar aportaciones que ninguno de ellos
podría ofrecer por separado.
c) Dado que ningún método está libre de prejuicios y limitaciones, solo
será posible acercarse a la verdad subyacente acudiendo a múltiples
técnicas con las que el investigador efectuará las correspondientes
triangulaciones.

42
SMITH, J. K. y HESHUSIUS, L. (1986): Closing down the conversation: The end of the quantitative-
qualitative debate among educational inquiries. En Educational Researcher, 15, 1, pp. 4-12. Citado por
T. HUSÉN, obra citada, p. 52.

46
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

En esta línea se hallarían las reacciones críticas que se han dado desde
dentro de los enfoques cuantitativos, que han originado las propuestas
situadas en el contexto del post-positivismo, y que han conducido, en el
marco de la investigación evaluativa, a hablar de multiplismo frente al sim-
plismo metodológico. Los componentes fundamentales del multiplismo,
propuestos por Cook en su aportación a la obra de Shotland y Marck43 se
recogen a continuación (Cuadro 1.4):

Cuadro 1.4. Componentes fundamentales del multiplismo, según Cook

a) Conveniencia de acudir a enfoques teóricos múltiples.


b) Necesidad de plantear objetivos diferentes que hagan posible la utilización de diferentes análisis de
los resultados.
c) Acudir a modelos variados de evaluación.
d) Someter a prueba modelos causales multivariados.
e) Plantear variedad de hipótesis rivales alternativas.
f) Elaborar diversas definiciones operativas de las diversas variables de la investigación.
g) Llevar a cabo análisis de datos y contrastes de hipótesis múltiples.
h) Acudir a valoraciones diversas, recogiendo los puntos de vista de las diferentes partes implicadas
(audiencias).

No obstante lo anterior, Cook y Reichardt reconocen la existencia de


diversos tipos de obstáculos para la aplicación de estos planteamientos
metodológicos; en concreto, el uso conjunto de ambos tipos de métodos
resulta en ocasiones prohibitivo en términos de recursos y de tiempo, ade-
más de exigir una suficiente capacitación del investigador en ambas meto-
dologías, lo que puede ser sustituido por equipos con formación metodoló-
gica diferente bajo la dirección de una persona con suficiente formación en
ambos como para dar unidad a la investigación.

4. CONCLUYENDO: NUESTRA POSICIÓN SOBRE EL TEMA

La educación consiste en un proceso intencional, sistemático y perma-


nente de mejora o perfeccionamiento del ser humano, de la persona.

43
COOK, T.D. (1985). Postposivist Critical Multiplims. En L. SHOTLAND y M.M. MARCK (Edits.): Social
Science and Social Policy. Beverly Hills: Sage Pub.

47
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

4.1. Naturaleza y complejidad del acto educativo

La intencionalidad es una nota que permite distinguir el hecho educativo


de aquellas otras situaciones en que la persona, bien como fruto de las diná-
micas naturales de desarrollo bien como consecuencia de su reacción ante los
estímulos naturales y sociales, avanza en el proceso de hacerse persona.
La intencionalidad va ligada a la sistematicidad: la acción intencional de
los educadores —heteroeducación— y, en su momento, de la propia perso-
na, responde a un plan más o menos elaborado —más en el primer caso,
menos en el segundo— en el que se distingue una orientación general o
finalidad, unos objetivos de mayor o menor amplitud y concreción y un
conjunto articulado de medios y recursos a su servicio. La educación como
plan sistemático e intencional se concreta en unos resultados —la persona
más o menos educada— que son indicio del grado de eficacia de los proce-
sos educativos.
Dada la limitación —finitud— del ser humano y su radical situación de
indeterminación y desvalimiento inicial, el proceso educativo puede conti-
nuar hasta la muerte; es por ello que, aunque haya etapas especialmente
aptas para una educación desde fuera, como intervención más o menos
reglada de los educadores, siempre el ser humano está en condiciones y con
posibilidades de mejorar, de perfeccionarse, algo que, unido al avance y
cambio de las circunstancias externas, hace no sólo posible sino aconseja-
ble acudir a una educación permanente, concepto que suele aplicarse a la
educación recibida o autoimpartida por el propio educando en etapas pos-
teriores a su juventud, cuando ya ha concluido la educación reglada.
Con todo, lo que más importa aquí y ahora a nuestros propósitos es el
análisis del acto educativo, un acto radical y profundamente humano, y ello
en el doble sentido de que está restringido a los seres humanos —los ani-
males se adiestran, no se educan— y de que se encuentra inscrito en su pro-
pia naturaleza. Recordemos, en efecto, que el hombre es el ser creado que
nace en un estado de mayor inacabamiento e indefensión lo que, por una
parte, le hace inicialmente más vulnerable y necesitado de sus semejantes,
pero, por otra, le sitúa en condiciones óptimas de hacerse, y ello no de una
forma necesaria sino con opciones muy variadas, fruto de la aplicación de
su libre albedrío, lo que le permite elegir caminos, y poner o no a su servi-
cio la determinación, el esfuerzo y la voluntad precisas.

48
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Estos hechos: la indeterminación del ser humano, el libre albedrío, que le


permite optar entre alternativas, y la necesidad de cooperación —léase
esfuerzo, voluntad— para alcanzar las metas que le propone la sociedad a
través de los educadores, constituyen la esencia del acto educativo. En él, la
relación, profunda y necesitada de empatía, entre el educador y el educan-
do, tiene unas características idiosincrásicas que, muy probablemente, nos
permiten calificarla como única e irrepetible.
En estas condiciones, puede entenderse que una investigación orienta-
da a la producción y descubrimiento de leyes o enunciados generales, pre-
feriblemente de naturaleza causal, se antoja no ya difícil sino, hoy por hoy,
imposible44. Tendríamos que pensar en un estudio de casos únicos, donde
la riqueza, las matizaciones, la casuística, nos llevarían a comprender la rea-
lidad, una realidad, por cierto, a cuya comprensión más o menos completa
nos acercaríamos justamente cuando ya estuviéramos cercanos a dejarla en
manos de otro educador.
Sin embargo, y a pesar de reconocer esa especificidad e irrepetibilidad
tanto de las personas como de los actos y procesos educativos, la situación
anteriormente descrita sería la propia de uno de los extremos del continuo.
Pero hay dos observaciones a realizar:
a) los fenómenos educativos son únicos, pero ello no impide que se des-
arrollen dentro de unas pautas, con ciertas tendencias predominantes y en
el marco de una determinada variabilidad;
b) la reiteración de estudios en profundidad permite alcanzar una cier-
ta acumulación de experiencia que conduce al descubrimiento de tales pau-
tas o regularidades. Como afirmaba el psiquiatra francés Azam a finales del
siglo XIX, la ciencia del carácter «no puede proceder por generalización,
como la psicología, ni por individualidades como el arte. Ocupa un lugar
intermedio».

44
El profesor G. Vázquez Gómez, en el prólogo a la edición española del libro de D. Fox, El pro-
ceso de investigación en educación, editado en Pamplona por EUNSA en 1981, manifiesta: «Fruto de
esta perspectiva histórica, reconocemos que el método experimental constituye hoy una posibilidad lími-
te para nosotros. [...] Ahora, ya podemos reconocer con Kerlinger, no sólo que una buena parte de los
estudios más valiosos en el área pedagógica son del tipo ex-post-facto (cuasi-experimentales) sino
incluso que esta modalidad de investigación es particularmente adecuada a la naturaleza del proceso
educativo» (p. 16).

49
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Todavía más: aun reconociendo, como reconocemos, esa especial rela-


ción irrepetible, específica, diversa, entre el educador y el educando, nada
se opone a un estudio científico en la concepción tradicional positivista de
los procesos de aprendizaje, de la naturaleza y de la eficacia de la motiva-
ción, de la efectividad de los refuerzos, de las pautas de desarrollo evoluti-
vo, de los niveles de rendimiento... Conocimientos todos ellos muy necesa-
rios para que el educador los tenga en cuenta en el momento de establecer
la privilegiada relación educativa de carácter artístico.
Tal vez por ello, Allport45, un defensor de la individualidad, que es quien
recoge la afirmación de Azam, refiriéndose a la Psicología, mantiene:

«No hay razón alguna para que no aprendamos de generalizaciones sobre la natu-
raleza humana. Pero debemos tener en cuenta los conceptos y los métodos que nos capa-
citan para comprender la individualidad configurada. [...] Para el desarrollo de la cien-
cia de la psicología de la personalidad debemos utilizar todos los métodos de estudio.»

4.2. Complejidad de los procesos educativos

Pero es que la Educación en cuanto objeto de conocimiento e investiga-


ción es mucho más que esa realidad privilegiada y profunda del acto educa-
tivo, un acto en que se encuentran, al menos, dos personas en toda su com-
plejidad: sus capacidades y aptitudes, sus sentimientos y afectos, sus
actitudes, sus apreciaciones y valores... y ello no tanto desde la realidad de
las mismas sino desde la mutua percepción, siempre subjetiva. La relación
educativa, en efecto, ocurre en unos contextos determinados en simultanei-
dad con un conjunto amplio y diverso de relaciones humanas —personales,
de amistad y profesionales— que se constituyen en el componente funda-
mental de un ambiente, más o menos favorable, más o menos educativo.
La relación profesional incorpora todo un hacer reglado —más o menos
reglado— y pautado, bien sea por pautas «personales» bien por elaboracio-
nes nacidas del estudio, la experiencia, la reflexión o la investigación, ya sea
la realizada por expertos ya la llevada a cabo por el propio educador.

45
ALLPORT, G. (1975). La personalidad. Su configuración y desarrollo. Barcelona: Herder, p. 29 ss.

50
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

Y, para complicarlo más, esa relación educativa contextualizada, se des-


arrolla en el marco de contextos más amplios, generalmente adversos a los
planteamientos educativos, donde el ambiente social y cultural se convier-
te en condicionante de la acción educativa. Las relaciones de amistad, la
vida social, los medios de masas, las nuevas tecnologías... constituyen una
realidad que es el aire respirado día a día, momento a momento, por los
protagonistas de los actos educativos.

4.3. La respuesta metodológica

En estas condiciones, cualquier intento de aportar conocimiento rigu-


roso sobre los planes, proyectos, procesos y resultados educativos tiene, for-
zosamente, que estar abierto a la diversidad de métodos y procedimientos
disponibles, siempre que cumplan con la exigencia del debido rigor.
La autolimitación a ciertas metodologías, además de representar un
reduccionismo en sí mismas, cercena de hecho la posibilidad de conocer,
de comprender y de explicar una realidad tan compleja. Por ello nos mani-
festamos decididamente defensores el principio de complementariedad
metodológica, una complementariedad que puede ser en ocasiones sucesiva
—los enfoques cualitativos como sugeridores de planteamientos o teorías
que puedan ser sometidos a validación empírica con metodologías cuanti-
tativas, o viceversa— y, en otras, simultánea, como puede ser el caso de las
investigaciones evaluativas, donde la evaluación de programas puede
encontrar aportaciones riquísimas en la metodología cualitativa para la
apreciación de los procesos mientras resulta especialmente adecuada la
cuantitativa para evaluar los productos o resultados.
Una posición concordante en este sentido es la manifestada por Camp-
bell46. Recogiendo sus ideas, Cook y Reichardt, afirman:

«Campbell demuestra también la complementariedad inherente a los métodos


cualitativos y cuantitativos al describir cómo el conocimiento cuantitativo sólo
supera al cualitativo cuando se apoya en éste.» (p. 54)

46
CAMPBELL, D.T. (1986). «Grados de libertad» y el estudio de casos. En T.D. COOK y CH.S. REI-
CHARDT: Métodos cualitativos y cuantitativos en investigación evaluativa. Madrid: Morata, pp. 80-104.

51
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En general, y por encima de la compatibilidad de los métodos cuantitativos


y cualitativos, a juicio del autor no se debe renunciar a ninguna modalidad de
investigación, esto es, a procedimientos rigurosos de indagación en busca de
conocimiento sobre educación. Así, en el ámbito de lo empírico, y teniendo
como ideal —si fuera posible— acudir a diseños experimentales, la investiga-
ción descriptiva, sea con una variable o varias, la investigación de carácter ex-
post-facto y la cuasi experimental pueden hacer importantes aportaciones.
Pero a su lado, la observación, participante o no, de los hechos y proce-
sos educativos; la indagación mediante entrevistas, estructuradas o no
(entrevistas en profundidad), los estudios de casos, sean experimentales (N
= 1) o cualitativos, el registro de datos, el análisis de documentos... repre-
sentan enfoques que pueden complementar y enriquecer el conocimiento,
o bien sugerirlo, abrir nuevas vías, descubrir nuevas perspectivas...
Pero todas estas modalidades de investigación pueden ser realizadas
«desde fuera», por expertos metodólogos, preocupados sobre todo por
temas «de moda», de interés personal y de cara a su carrera profesional, por
los propios protagonistas de la acción educativa o a través de la fructífera
colaboración entre ambos tipos de profesionales. Y así, diversas modalida-
des de investigación-acción y en concreto, la investigación colaborativa, la
propia investigación evaluativa,... en la medida en que buscan o permiten
el trabajo investigador conjunto entre personas formadas en la metodología
y preocupadas del avance del saber con otras capacitadas, por formación y
experiencia, en los actos y procesos educativos, permiten evitar la pernicio-
sa dicotomía entre teoría y práctica, facilitando la integración de los resul-
tados de la investigación en la práctica diaria de aulas y centros.
¿Tendríamos que hacer alguna afirmación específica en relación con el
añadido «a distancia» a la hora de plantear la metodología de investigación
adecuada? A juicio de quien esto escribe, no.
Como en tantas ocasiones he reseñado, el único elemento diferencial,
con toda la profundidad que ello representa, se refiere a la relación media-
da y, en la mayoría de las ocasiones, diferida —al menos no simultánea
temporalmente— de los procesos de educación —formación y enseñanza-
aprendizaje— llevados a cabo por profesores y alumnos.
Tal relación se concreta en una metodología específica donde los mate-
riales de aprendizaje y, en la actualidad, las tecnologías, cobran un prota-

52
CIENCIA Y MÉTODO. PARADIGMAS Y METODOLOGÍAS. INVESTIGACIÓN CIENTÍFICA E INVESTIGACIÓN EMPÍRICA. MÉTODOS CUANTITATIVOS Y CUALITATIVOS

gonismo especial. Pero todo ello no añade un ápice a la complejidad ante-


riormente dibujada. Es más, en algunos aspectos, la reduce, dado que la
relación personal, directa y simultánea, es bastante más limitada, y la rela-
ción mediada, en especial la de carácter virtual, más fácil de ser sometida,
dada su objetividad, a análisis y estudio.

RESUMEN

La presente unidad temática ha centrado su atención en los procedi-


mientos existentes para la obtención de conocimiento relevante, en la medi-
da de lo posible científico, en el ámbito de la educación.
A tales efectos se ha reflexionado sobre el concepto de ciencia y de méto-
do científico, sobre la posibilidad de que exista o no un método científico
general que, para sus defensores, tendría en el método hipotético-deducti-
vo-experimental su más genuina manifestación, y sobre la alternativa a esta
posición, que dejaría tal método como expresión de una de las dos grandes
opciones paradigmáticas, conocida como positivista o cuantitativa, reser-
vada para las Ciencias Naturales, mientras abogaría por otra, denominada
naturalista, interpretativa, fenomenológica o cualitativa, especialmente idó-
nea para las Ciencias Sociales. Y ello sin dejar de mencionar otras pro-
puestas, como el denominado paradigma crítico, o el del cambio.
Una parte sustancial de nuestra reflexión se ha centrado en la caracteri-
zación de la Educación en cuanto objeto de conocimiento e investigación.
En este punto hemos podido comprobar cómo no existe una idea domi-
nante, yendo las alternativas desde su consideración como arte o como tec-
nología hasta entenderla como una ciencia más, al menos en proceso de
constituirse en tal. Junto a ello, y aquí parece haber más consenso, hemos
señalado que la Educación no es una disciplina unitaria sino interiormen-
te compleja y heterogénea, algo que podría explicar y justificar nuestra pos-
terior propuesta de complementariedad metodológica a la hora de empren-
der la tarea investigadora.
A continuación se ha abordado el tema de los paradigmas; una vez
caracterizados hemos analizado su raíz —diferentes concepciones en lo
ontológico, lo metodológico y, por consiguiente, en lo metodológico— y,
tras presentar las posturas más destacadas, con su correspondiente argu-

53
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

mentación, hemos dejado claro que la posición predominante es la de bus-


car la colaboración, la de «tender puentes»47 en lugar de levantar barreras,
yendo hacia una decidida complementariedad metodológica.
La unidad concluye con una reflexión del autor sobre la Educación,
tanto en lo que se refiere a la esencia del acto educativo como del contexto
—centro educativo48, familia, sociedad— en que se desarrolla. De tal refle-
xión hemos concluido con una propuesta: que impere el principio de com-
plementariedad metodológica.

Expresión utilizada por Cook y Reichardt en su obra citada, p. 27.


47

48
Recomendamos al respecto las reflexiones del autor en la Introducción (pp. 13-16) en relación
con las organizaciones educativas: PÉREZ JUSTE, R. (coord.) (2005) Calidad en educación, calidad de la
Educación. Madrid: AEC.

54
Tema 2
La investigación científico-empírica en educación.
El proceso y la lógica de la investigación científica

Presentación

1. Introducción
1.1. Características del conocimiento científico
1.2. El método y su importancia

2. La investigación científica

3. El proceso y la lógica de la investigación científica


3.1. El problema
3.2. La hipótesis
3.3. Validación de la hipótesis
3.4. Interpretación, teoría y replicación
3.4.1. Inferencias deductivas
3.4.2. Generalización
3.4.3. Inferencias inductivas

4. Características del conocimiento científico-experimental

5. Posibilidades y limitaciones de la aplicación de la metodología


científico–experimental a la educación
5.1. Posibilidad de leyes generales en Educación
5.2. Medición y evaluación. Principales objeciones
5.3. Posibilidades de control
5.4. Verificabilidad intersubjetiva

6. Repercusiones metodológicas

Resumen

55
PRESENTACIÓN

El presente tema se dedica a la presentación de los conceptos básicos


relacionados con la investigación científica, con su lógica y el proceso ade-
cuado para alcanzarla y con el análisis de las posibilidades y limitaciones
existentes para aplicar esta metodología al estudio de la Educación.
En el análisis del proceso se presta especial atención al problema, a su
definición y formulación; a las hipótesis, como un elemento de rigor que
protege contra el intento de explicar a posteriori, con afirmaciones ad hoc,
la información disponible; su validación, momento en que se concentra en
mayor medida la metodología; y en la interpretación, con la problemática
asociada.
La naturaleza de los actos y de los procesos educativos es analizada en
relación con la posibilidad de que les sea aplicable metodología tan riguro-
sa. Aspectos como las posibilidades y limitaciones de control, de medición
y de verificabilidad intersubjetiva son sometidos a análisis.

1. INTRODUCCIÓN

Entre las características que diferencian al ser humano de otros seres


animados se encuentran su curiosidad y su inteligencia. La curiosidad le ha
hecho preguntarse el por qué de las cosas y su para qué, y su inteligencia le
ha permitido tanto averiguar respuestas cuanto decidir sobre la valía de las
mismas.
Las explicaciones que ha ido encontrando como respuesta a su curiosi-
dad han sido de diferente naturaleza; en ocasiones ha acudido a la revela-
ción, en otras a las opiniones de personas prestigiosas o que desempeñan
cargos de autoridad, sin dejar de lado la aplicación del sentido común a la
resolución de situaciones que requerían una respuesta aceptable.

57
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La evolución y el avance del ser humano ha tenido en su capacidad crí-


tica uno de sus pilares más sólidos; merced a ella los humanos no aceptan
sin más cualquier explicación y, cada vez en mayor medida, solo dan por
buenas, y no siempre de modo definitivo, aquellas que, sometidas a prueba,
han salido indemnes y, por lo tanto, robustecidas.
No debe extrañar que así sea dado que entre sus intereses se encuentra,
desde luego, el saber por el saber, el disfrute del conocimiento. Sin embargo,
dada su necesidad de hallar soluciones a sus problemas, ese saber ha adqui-
rido un interés práctico por el cual desea dominar la realidad para lo que, con
frecuencia, necesitará adelantarse a los acontecimientos. Estamos haciendo
alusión s su deseo de controlar y dominar la realidad objeto de estudio de tal
manera que le permita saber por adelantado lo que puede ocurrir. Las fun-
ciones predictiva y de control1 son metas deseables que pueden ser alcanzadas
con diferentes grados de precisión, profundidad y seguridad, críticamente
comprobada en el caso del denominado conocimiento científico.

1.1. Características del conocimiento científico

Así las cosas, parece conveniente dejar constancia de las características


que definen este tipo de conocimiento, una modalidad que pretendemos
alcanzar dentro del campo de la educación con la aplicación de los conoci-
mientos obtenidos en esta materia. Para Zaragüeta2, tales características son:
• Su precisión; el conocimiento científico aspira a la exactitud de tal
manera que, al identificar las notas o características esenciales del
objeto de conocimiento, sea posible su dominio sin confusión con
objetos próximos en sus características. Esa precisión llega incluso a la
necesidad de un lenguaje adecuado, claro y determinado, como reco-
noce Nagel en La estructura de la ciencia.
• El objeto de atención científica frente al objeto de preocupaciones del
saber vulgar. Generalmente el científico se encuentra preocupado por
las causas, por el por qué de las cosas, por la explicación de los fenó-
menos, un conocimiento mucho más profundo que la mera explica-

1
SCRIVEN, M. (1974). Filosofía de la Ciencia. En Enciclopedia Internacional de las Ciencias socia-
les. Madrid: Aguilar, vol. 2 p. 321.
2
ZARAGÜETA, J. (1953). Pedagogía Fundamental. Barcelona: Labor, 2.ª ed.

58
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

ción superficial de la realidad. La búsqueda de los por qué necesita


generalmente de métodos propios a los que alude Scriven, y entre los
que resaltan los de observar, medir y experimentar.
• Su objetividad, condición imprescindible para el acuerdo entre obser-
vadores o la contrastabilidad intersubjetiva; en efecto, el conocimien-
to objetivo es imparcial, no viene afectado por las ideologías ni por los
prejuicios o sentimientos del ser humano, sino que es concorde con la
realidad que representa, por lo que hace posible el acuerdo entre per-
sonas, la comprobabilidad de las afirmaciones y la repetibilidad de los
procesos para llegar a los mismos resultados3.
• Seguridad, derivada de las notas anteriores, ya que, el conocimiento
repetidamente comprobado por todo tipo de personas, en condiciones
y circunstancias variadas —replicación—, es en sí más fiable que aquel
otro que no ha podido ser comprobado en otras ocasiones.
Sin embargo, la mayor seguridad nunca se traduce en certeza, como
muy bien aclara Russell en La perspectiva científica, o Popper, quien reco-
noce que no se puede pedir «a la ciencia ninguna certidumbre definitiva»4.
Hasta tal punto es esto importante que Kerlinger, que duda de la existencia
de un método científico, habla de un enfoque científico, enfoque que sitúa
en la autocorrección5.
En su explicación de la realidad, la ciencia persigue un conocimiento
capaz de llegar a explicarla por completo en el campo de que se trate, y no
aspectos parciales e inconexos. La realidad es coherente, se encuentra per-
fectamente integrada y relacionada, y el conocimiento de la misma debe
reflejar tal coherencia, integración y relación. Por ello la ciencia pretende
ser un sistema ordenado y coherente de relaciones que mutuamente se apo-
yan y sostienen; cuando conocimientos parciales de la realidad no encajan,
nos encontramos ante la manifestación patente de que allí hay algo que
falla. La ciencia persigue un conocimiento relacionado y sistemático, y
cualquier conocimiento parcial debe engranar perfectamente con la totali-

3
La comprobabilidad de resultados mediante la repetibilidad de los fenómenos estudiados es reco-
gida como una característica de la ciencia moderna, experimental, por todo tipo de autores; para Gar-
cía Hoz es una de las dos exigencias básicas para hacer de un conocimiento empírico un conocimiento
científico.
4
POPPER, K. R.: o. c., p. 77.
5
KERLINGER, F. N. (1973). Investigación del comportamiento. México: Interamericana, p. 6.

59
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

dad. Los fallos en este punto pueden dar lugar a revoluciones científicas
que permitan alcanzar esa coherencia cuando, como fruto de nuevas apor-
taciones, se encuentra aquello que faltaba.

1.2. El método y su importancia

La consecución de conocimientos que tiendan a tales características no


es, lógicamente, fruto del azar, sino de la acción consciente, reflexiva, orga-
nizada y disciplinada a su servicio. Esa acción no es otra cosa que el méto-
do, de cuya importancia dan fe autores como De Vries6, para quien se con-
vierte en una nota o característica esencial de la ciencia; Edington7, quien
considera que la ligazón entre ambas —ciencia y método— aumenta con-
forme aquélla se desarrolla y perfecciona; McGuigan8, que pone en este
punto, junto con el planteamiento de problemas resolubles, las notas del
conocimiento científico, o Bunge que, categóricamente, afirma9:

«La peculiaridad de la ciencia tiene que consistir en el modo como opera para
alcanzar algún objetivo determinado, o sea, en el método científico.»

Y en otro lugar añade: «Donde no hay método científico, no hay ciencia»


La concreción de este método suele tomar como referencia el paradig-
ma propuesto por John Dewey10, ya presentado, concretado en los siguien-
tes puntos:

a) Percepción de un obstáculo, problema, dificultad o asunto para el que no se dis-


pone de conocimientos suficientes que permitan la resolución.
b) Identificación y definición precisa del problema o dificultad a resolver.
c) Planteamiento de hipótesis que pudieran representar la respuesta a tales pre-
guntas o la solución a las dificultades o problemas.

6
BRUGGER, W.: «Ciencia», en Diccionario de Filosofía, Barcelona: Herder, 1969, 6.8 ed.
7
Vid, (1939) The Philosophy of Physical Science. Cambridge University Press, p. 5.
8
McGUIGAN, F. J. (1976) Psicología experimental. México: Trillas, pp. 14-15.
9
BUNGE, M.: o. c., p. 29.
10
DEWEY, J. (1910): How we Think. Boston: Heath, pp. 106-118. El lector puede encontrar referen-
cias sobre el autor en http://www.educar.org/articulos/JohnDewey.asp.

60
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

d) Fase deductiva. De ser cierta(s) la(s) hipótesis planteada(s) deberían darse


determinadas consecuencias; tales consecuencias deben ser formuladas con
precisión y, en la investigación experimental, en forma operativa.
e) Validación de la(s) hipótesis mediante la oportuna prueba o contraste.

El método que acabamos de diseñar recibe el nombre de hipotético-


deductivo-experimental, en la medida en que tales fases son las etapas o
momentos clave del mismo. La superioridad de este método radica, pues,
en ser una síntesis de observación y razonamiento, de deducción e induc-
ción, de análisis y síntesis, a lo que contribuyeron en gran medida científi-
cos de renombre universal como Newton y Galileo.
Convendría, para finalizar, precisar que sobre la base de un método
científico, de estructura válida para toda la ciencia, la solución de los pro-
blemas específicos de cada una se abordan mediante técnicas específicas
peculiares, que dependen del desarrollo propio de cada campo del saber,
aunque algunas de ellas, por su amplia aplicación, valgan para varios de
tales campos.

2. LA INVESTIGACIÓN CIENTÍFICA

Investigar es la actividad encaminada a la consecución de metas cientí-


ficas, bien sean éstas de tipo teórico, como lo es el hecho de aumentar o
mejorar nuestro conocimiento de la realidad natural, humana y trascen-
dental, sin otro interés que el propio conocimiento, o de carácter práctico,
en muchas ocasiones a partir del conocimiento teórico, tratando de mejo-
rar la posición del hombre en el mundo, elevando su calidad de vida en
todos los campos en que se desenvuelve.
La actividad a que aludimos no es otra cosa que la puesta en práctica del
método científico al que nos hemos referido, al servicio de la solución de
problemas teóricos, prácticos o, en muchas ocasiones, teórico-prácticos.
Siguiendo las características que definen el conocimiento científico, la
actividad aludida ha de ser sistemática, organizada, disciplinada y rigurosa.
Más no por eso debería entenderse que la aplicación del método debe ser
algo rígido e inflexible en sus etapas, pues ni siquiera puede afirmarse que

61
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

se haya llegado a su definición definitiva. Es más, las reglas, por sí mismas,


no son eficaces para conseguir frutos de calidad. Son la capacidad y la expe-
riencia del investigador las que, mediante la disciplina del método, logran
resolver problemas científicos.
Conviene resaltar que, aunque la disciplina en las etapas es conve-
niente y necesaria, hay un continuo ir hacia adelante y hacia atrás, espe-
cialmente en las etapas preliminares de investigación en un campo
determinado, ya que, en función de nuevas aportaciones, se pueden
redefinir problemas, reformular hipótesis y revisar planteamientos para
su solución.

3. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

A partir de las anteriores consideraciones pasamos a presentar y anali-


zar, de forma sintética y general, el proceso y la lógica de la actividad inves-
tigadora.

3.1. El problema

De todos es conocido que siendo el ser humano el que nace más desva-
lido de entre sus congéneres, llega a superarlos con creces hasta el punto de
ser el que domina el mundo. La respuesta puede hallarse en que el hombre
es el único animal capaz de problematizar la realidad, no habiéndose con-
formado en modo alguno con superar las dificultades de la Naturaleza que
limitaban su existencia, sino que pasó a hacerse preguntas que permitieran
no solo la superación en sentido estricto, sino su dominio y utilización,
poniéndola a su servicio aunque, a veces, al precio de destruirla.
Pues bien, si el hombre es el único animal problematizador, el científi-
co se caracteriza por su capacidad para problematizar, para «ver» proble-
mas donde otros no ven nada y, claro está, para intentar su resolución: la
manzana ha estado cayendo de los árboles desde que existe, pero solo New-
ton supo ver en ello un problema.
El problema es el arranque de toda investigación. Pero, ¿qué es un pro-
blema, un problema científico? En sentido amplio, un problema es cual-

62
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

quier situación para la que no se encuentra una solución satisfactoria, para


la que no disponemos de una respuesta adecuada. Sin embargo, es necesa-
rio precisar que, si bien la realidad está plagada de problemas, éstos no se
manifiestan como tales sino a quienes se encuentran «pre-ocupados» por
este tipo de cosas, esto es, ocupados antes de; así entenderemos que el pro-
blema no se revela a cualquiera sino a quien se interesa por problemas,
tiene una adecuada formación, conoce el campo de que se trate y domina
adecuadamente las técnicas apropiadas11
El nacimiento de un problema, pues, necesita de un cierto trasfondo de
conocimientos, directa o indirectamente relacionados con aquél, aunque la
ocasión de que se manifieste puede estar mediata o inmediatamente ligada
a la experiencia cotidiana, ocasional o profesional, del investigador.
Pero los problemas que interesan a la ciencia no son de cualquier clase,
sino que reúnen ciertas cualidades. En general, los expertos están de acuer-
do en reconocer que un problema científico requiere una teoría de fondo12
en que incardinarlo, ya que, en caso contrario, su posterior definición será
lo suficientemente vaga como para hacer difícil la solución del mismo; más
aún, como la ciencia actúa con pretensiones de sistematización, los proble-
mas científicos suelen integrarse en un sistema problemático o «un con-
junto parcialmente ordenado de problemas, esto es, una secuencia ramificada
de problemas dispuestos en orden de prioridad lógica»13. Asimismo se pide su
formulación correcta y precisa, de forma que se evite una acumulación de
datos que puedan manifestarse posteriormente como irrelevantes a la vez
que se aprecia la falta de otros necesarios; la formulación más precisa por
lo general se da cuando el investigador es capaz de plantear una o varias
preguntas concretas donde aparecen relacionadas las variables implicadas,
de forma que se constituyan en guía para la formulación posterior de la
hipótesis, a la vez que orienten sobre el tipo de datos a recoger y las res-
puestas que serán precisas, además del tipo de pruebas que serán conside-
radas aceptables para su resolución14.
No obstante, como reconoce Kerlinger, en determinados problemas el
investigador puede llegar a tardar años para su precisa formulación, lo que

11
Vid. BUNGE, M.: o. c., pp. 212 s.
12
Ibídem, p. 211: ARNAU. J. (1979). Psicología experimental. México: Tril1as.
13
Ibídem, p. 217
14
Vid. KERLINGER, F. N., o. c., pp. 16 s.

63
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

nunca debe ser una excusa para no hacerlo, manifestándose en la misma


línea Van Dalen cuando reconoce que el análisis de un problema, esto es, la
identificación de las variables y de las relaciones existentes entre ellas,
puede ser la etapa de mayor duración de una investigación15. La precisión
se refiere también a la delimitación del área y alcance del problema, de
forma que pueda resolverse pues, en problemas de gran generalidad, la
solución se muestra esquiva a no ser en el caso de investigadores de gran
capacidad y experiencia.
McGuigan hace de la resolubilidad una característica básica de los pro-
blemas científicos, de forma que dejarían de ser científicos, por importan-
tes y sugerentes que se presentaran, en caso de no ser resolubles; la reali-
dad es que su resolubilidad en ocasiones es cuestión de tiempo, es decir,
que problemas no resolubles hace un siglo lo son en el actual como conse-
cuencia del avance de la teoría, de la mejora de los instrumentos y del per-
feccionamiento de las técnicas estadísticas. En concreto McGuigan señala
que un problema es resoluble si:

«a) puede proponerse una hipótesis relevante como una tentativa de solución para
el mismo; y
b) es posible comprobar dicha hipótesis determinando un grado de probabilidad
para ella.»16

coincidiendo en parte con la opinión de Popper sobre la contrasta-


bilidad de los enunciados científicos y la expresada por Kerlinger al
pedir que el problema se formule en términos que admitan la prueba
empírica.
Cabría añadir que los problemas deben ser relevantes; ahora bien, esta
característica es francamente difícil de precisar. Es cierto que la investiga-
ción es una tarea dura, que requiere esfuerzo, tiempo y medios, razón por
la cual no puede, o no debe, centrarse en temas irrelevantes, faltos de utili-
dad, imprecisos e, incluso, en contra de la teoría preexistente. Pero no es
menos cierto que la decisión sobre tal relevancia es algo difícil al principio

McGUIGAN, F. J.: o. c., pp. 35-39.


16

VAN DALEN, D. B. y otros (1979). Manual de técnica de la Investigación Educacional. Buenos Aires:
15

Paidós, 4.ª ed., p. 144.

64
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

y que las grandes aportaciones y revoluciones científicas han estado en fla-


grante contradicción o, al menos, en lucha abierta, con lo establecido hasta
entonces. Probablemente lo más que se puede pedir en este campo es que
el investigador se exija a sí mismo rigor a la hora de justificar las motiva-
ciones, los antecedentes, los presupuestos, los motivos de duda en que se
base, y las derivaciones, teóricas y prácticas que se seguirían de la solución
del problema planteado.

3.2. La hipótesis

Un problema que reúne las condiciones indicadas permite poner en


marcha la investigación; de hecho la investigación ya ha empezado al pre-
cisar y delimitar el problema, al decidir sobre su resolubilidad y sobre su
valor.
A continuación el investigador debe tratar de resolverlo pero, al igual
que un problema matemático no se resuelve sin más utilizando ciegamen-
te los datos, un problema de investigación, menos obvio por lo general, no
debe intentar resolverse sin más acudiendo a los datos, entre otras cosas
porque para encontrar datos relevantes al problema primero debe decidir-
se cuáles son tales datos.
En la resolución del problema ocupa un lugar destacado la formulación
de hipótesis explicativas, esto es, aventurar conjeturas sobre la posible rela-
ción entre los elementos —variables— integrantes del problema. Una vez
formuladas encauzan la actividad necesaria para la resolución, convirtién-
dose en orientación y guía del proceso, tanto desde la perspectiva de la
selección y recogida de los datos cuanto de la prueba a que deben someter-
se y de la interpretación de los resultados17.
Por contra, proceder a investigar sin hipótesis directrices puede llevar a
la utilización inadecuada de los datos, elaborando a posteriori explicaciones
que cuadren con ellos, riesgo especialmente grave en toda investigación ex-
post-facto. Kerlinger destaca esto al afirmar que «el investigador que no
supone una relación por anticipado no da a los hechos la oportunidad de

17
Cfr. McGUIGAN, F. J.: o. c. pp. 69 s.; VAN DALEN, D. B. v otro: O. c., pp. 196198; BUNGE, M., C.c.,
pp. 308-316; KERLINGER, F. N., o. c., p. 21, entre otros.

65
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

demostrar o negar algo»18, añadiendo que si se recogen primero los datos y


luego se les busca explicación se está violando el juego científico19.
Con todo conviene que reflexionemos sobre las características que
deben tener las hipótesis para ser tales, para convertirse en guías de la acti-
vidad científica. De alguna manera, las varias características expresadas
por los diversos autores se podrían concentrar en dos grandes categorías:

• Es necesario que las hipótesis estén bien fundamentadas.


• Que sean contrastables.

Bunge afirma que «la mejor fundamentación de una hipótesis es su


inserción en una teoría, o sea, en un sistema de hipótesis que se apoyan y
controlan mutuamente»20; Van Dalen21 pide para la hipótesis verosimili-
tud, que entiende como lógicamente congruente y como no contradicto-
ria con las leyes naturales (entre otras cosas); McGuigan habla de armo-
nía con otras hipótesis del campo de investigación, aunque reconoce que
no es esencial, pues las grandes revoluciones científicas han nacido de la
falta —al menos en cierto grado y desde ciertas perspectivas— de tal cohe-
rencia; este hecho lo recoge asimismo Bunge al indicar que la convalida-
ción teorética, a la vez que protege contra ideas extravagantes, «puede
retrasar o hasta impedir cambios revolucionarios en la ciencia», razón por
la cual McGuigan pide que el científico, aunque se valga de la hipótesis
como elemento rector, esté atento a posibles hechos «irrelevantes», irre-
levantes claro está para su hipótesis, que pueden sugerirle cambios en sus
planteamientos.
Pero las hipótesis, además, han de ser contrastables por procedimientos
empíricos. Ya conocemos la postura categórica de Popper de negarse a
aceptar en la ciencia enunciados que no puedan ser sometidos a contras-
te y al pedir que tal contrastabilidad sea pública, intersubjetiva. Mario
Bunge22 se expresa en la misma línea, siendo éste uno de los tres criterios

18
El autor reconoce que los términos demostrar y negar no tienen aquí el significado usual pues
una hipótesis nunca se demuestra o niega. o. c., p. 21.
19
Vid. al respecto la posición concordante de SIDMAN, M. (1978). Tácticas de Investigación científi-
ca. Barcelona: Fontanella, pp. 16-19.20 BUNGE, M.: o. c., p. 281.
21
VAN DALEN. O. B. y otro: o. c. o. 190. ; McGUIGAN, F. N.: o. c., pp. 67 y 70-74; BUNGE, M.: o.c., p. 283
22
O.c., p. 255

66
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

que exige para que una hipótesis pueda ser considerada científica, junto
a su fundamentación y a la corrección formal, y Kerlinger es, asimismo,
definitivo:

«… si una explicación no puede ser formulada en forma de una hipótesis com-


probable, puede ser considerada entonces como una explicación metafísica y no
susceptible de investigación científica.» 23

No obstante, precisaremos, y matizaremos el recurso a la experiencia


como la base de toda contrastabilidad.
En efecto, podría parecer que la mejor manera de lograr esa contras-
tabilidad es la de formular hipótesis cuyos términos fueran en sí mismos
empíricos, para lo que podría recurrirse a proposiciones fenomenalistas;
sin embargo, nada de eso parece adecuado si aceptamos la postura de
Bunge según la cual las hipótesis científicas más importantes no cumplen
ese requisito, pues «ninguna de ellas se refiere a la experiencia, aunque pue-
dan contrastarse con la ayuda de la experiencia que afecta a ciertas distan-
tes consecuencias de dichas hipótesis»24, es decir, son indirectamente con-
trastables.
De hecho, de lo que se trata es de traducir la hipótesis a términos ope-
racionales25 que permitan decidir acerca de su contrastación; generalmen-
te lo que se hace es deducir de la hipótesis las consecuencias que deberían
seguirse de ser cierta, consecuencias formuladas en términos contrastables,
y admitir que la hipótesis ha salido indemne de tal contrastación en los
casos en que los resultados empíricos concuerdan con ellas, lo que lleva a
afirmar de tal hipótesis que ha quedado validada por la evidencia empírica,
no que ha quedado establecida o verificada porque, mientras la lógica for-
mal capacita para la refutación de hipótesis, no permite su confirmación26.
Las hipótesis que reúnen estas características son científicas, esto es,
aptas para iniciar el juego de la ciencia; pero, además, se pueden añadir
otras, como sencillez o simplicidad, generalidad y potencia deductiva.

23
O. c., p. 26.
24
O. c., 304.
25
Vid. VAN DALEN, D.B. y otro: o. c., pp. 178 s.
26
BUNGE, en o. c., p. 259; el autor lo expresa con mayor detalle y profundidad en pp. 886-896.

67
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

De entre varias hipótesis que expliquen un mismo fenómeno suele


recomendarse aquélla que acude a una estructura teórica menos com-
pleja (Van Dalen), la que no requiere fundarse a su vez en otras hipó-
tesis o suposiciones ad hoc (McGuigan); por otra parte, su alcance y
generalidad es otra característica a tener en cuenta, si bien es verdad
que, normalmente, la ciencia comienza con hipótesis restringidas que,
recogidas y analizadas con posterioridad, permiten elevarse a la máxi-
ma generalidad; por último reseñemos la conveniencia de escoger
aquellas hipótesis cuya formulación permite una mayor y mejor infor-
mación, esto es, un número superior de consecuencias, pero teniendo
en cuenta, a la vez, la importancia de las mismas; Van Dalen ilustra
este hecho diferenciando entre la mera explicación de los hechos y la
posibilidad de avanzar predicciones sobre hechos y relaciones aún no
observadas, como ocurrió con Mendeléyev27 con la tabla periódica de
los elementos.

3.3. La validación de la hipótesis

En función de su experiencia y de sus conocimientos que, normal-


mente, han debido ser completados acudiendo a la literatura científica
sobre el tema —estado de la cuestión—, y a través de un proceso nada
claro y difícilmente explicable que Reichenbach califica como contexto
del descubrimiento, el investigador formula varias conjeturas por lo
general como posibles soluciones al problema; considerando las carac-
terísticas reseñadas en el apartado anterior, selecciona entre ellas la que
considera mejor y se dispone a someterla a contrastación para ver si
puede mantenerla o si los datos no se lo permiten por salir mal parada
de la prueba.
Ahora bien, como decíamos con anterioridad, las mejores hipótesis
científicas no son directamente contrastables. Bunge expresa este hecho
con claridad meridiana por medio de las siguientes palabras28:

27
A Mendeléyev se debe la ordenación de los elementos en la conocida Tabla periódica o sistema
periódico. Atendiendo a su teoría dejó algunos huecos, manteniendo que serían ocupados por elemen-
tos desconocidos en aquel momento.
28
BUNGE, M.: o. c., pp. 878 s.

68
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

«No hay hipótesis que sea por sí misma contrastable: para que pueda some-
terse a contrastación tiene que poseer consecuencias observacionales, las cuales se
derivan con algún cuerpo de conocimiento que no se discute en la contrastación
misma... Más precisamente: para contrastar una hipótesis tenemos que hacer la
ulterior suposición de que, si la hipótesis es verdadera, serán perceptibles ciertos
hechos, los cuales se considerarán manifestaciones, objetivaciones o índices, de la
situación a que se refiere la hipótesis.»

Pues bien, esa traducción a consecuencias observables es la tarea que se


conoce como operativización. La hipótesis establece la relación existente
entre variables que a estos efectos reciben la denominación de indepen-
dientes —condiciones sometidas a variación, o bien, aquéllas a partir de las
cuales se realizan predicciones— y dependientes —variables en que se apre-
cian los efectos de la variación provocada en las independientes, o variable
que se predice—29; la tarea del investigador consistirá en operativizarlas,
entendiendo por tal la traducción a un lenguaje observable, cuantificable o
medible; más exactamente, una definición operativa de una variable es
aquélla en que el concepto en cuestión es definido por las acciones u ope-
raciones que deben llevarse a cabo para medirlo o manipularlo.
Claro está que si tales definiciones facilitan la comprobabilidad, el
acuerdo entre observadores, la objetividad y, por supuesto, la contrastabili-
dad, presentan el gran inconveniente de poder llegar a tantos resultados
diferentes como definiciones puedan elaborarse30. Por otra parte, en casi
toda la investigación experimental, una vez operativizadas las variables es
necesario traducir la hipótesis científica a formas estadísticas.
Así, en un supuesto problema sobre falta de rendimiento de los alum-
nos, un profesor puede aventurar la hipótesis de que la mejora de las téc-
nicas específicas de estudio elevará el rendimiento de los alumnos; la ope-
rativización le debería llevar a traducir los conceptos de técnicas
específicas de estudio por términos concretos para evitar el desacuerdo con

29
Vid. al respecto la obra de TRAVERS. R. M. W. (1971) Introducción a la investigación educacional,
Buenos Aires: Paidós, pp. 120-144.
30
Una posición crítica a la operacionalización puede encontrarse en Arnau, J., o. c., pp. 140-145, y
en Bunge (o. c., pp. 171-173) que culmina afirmando: «Si las significaciones de los términos científicos
se especificaran exclusivamente a base de operaciones humanas, la ciencia objetiva no existiría».

69
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

otros investigadores o, si se prefiere, para que los demás sepan qué aspec-
tos incluye en la definición y poder comprobar los resultados; pero no bas-
taría con ello porque traducidas las técnicas especificas de estudio por tér-
minos como capacidad para analizar, sintetizar, demostrar...,
probablemente no habría acuerdo en qué es y cómo se miden las capaci-
dades de análisis, síntesis, demostración, etc., por lo que habría que expre-
sarlas en forma de las actividades que deben realizar los alumnos para que
el profesor pueda proceder a su medición; algo similar habría que decir
con el rendimiento, que para unos puede ser medido con pruebas prefe-
rentemente memorísticas, para otros con pruebas que pongan de mani-
fiesto capacidades de estructurar temas en forma personal, de resolver
problemas, de definir con precisión... o tal vez, de una adecuada y ponde-
rada reunión de todos o varios de esos aspectos. Para proseguir, es conve-
niente ahora la traducción a lenguaje estadístico; así podemos presentar la
hipótesis del investigador como
H1: µA > µB
donde µA es la medida aritmética en rendimiento de un grupo con mejo-
res técnicas de estudio y µB la correspondiente a otro que ha puntuado por
debajo de esta última prueba; o bien µB representa el rendimiento medio de
un grupo antes de iniciar el proceso de mejora de sus técnicas específicas
de estudio y µA dicho valor tras el período de mejora.
Así pues, la operativización de las variables, bien entendida, facilita la
prueba de la hipótesis y permite el acuerdo entre observadores, caracterís-
tica científica. Pero veamos qué otros pasos implica la validación, que no
verificación, de la hipótesis.
En primer lugar, se puede afirmar que ninguna hipótesis es válida en
general; en el caso de nuestro profesor se podría afirmar, si los datos empí-
ricos lo permitieran, que, para su clase, su hipótesis habría quedado vali-
dada; si fuéramos más rigurosos, deberíamos, a la vez, ser más precisos:
para sus alumnos, con un profesor como él, con su sistema de enseñanza,
en su asignatura, en un colegio con el sistema de disciplina como el suyo,
con materiales y técnicas como las empleadas por él y los alumnos...; como
se ve entran muchos factores, algunos de los cuales suelen olvidarse.
Sin embargo, hay un punto que siempre se suele tomar en considera-
ción, aunque no siempre en forma correcta por problemas prácticos, sobre

70
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

todo económicos: me estoy refiriendo a la definición de la población para


la que se pretende validar la hipótesis. Tal definición debe afectar a todas
las variables que, desde la perspectiva de los objetivos de la investigación,
puedan resultar relevantes para la misma; por otra parte, y dado que por lo
general no se estudian poblaciones sino muestras, y éstas han de ser repre-
sentativas, esto es, de tamaño suficiente y extraídas por procedimientos
imparciales (aleatorios) es de gran utilidad conocer el número total de casos
y la unidad —lo que se toma como base, bien sean personas o grupos—, así
como, siempre que sea posible, el listado de sus componentes31.
La selección de la muestra requiere la toma de decisiones sobre su tama-
ño, para asegurar la suficiencia, y el sistema o procedimiento de muestreo
si se quiere facilitar, que no asegurar, la representatividad, para la que es
conveniente acudir a los muestreos de probabilidad32.
Acotado el campo de validez en cuanto a sujetos se refiere, es necesario
elegir el diseño —en el sentido restringido del término— que permita res-
ponder a las preguntas formuladas en forma tal que, gracias al control de
las variables extrañas —validez interna—, los efectos que se aprecien poste-
riormente en la variable dependiente puedan ser atribuidos a y solo a la o
las variables independientes.
Las variables definidas operativamente, y el diseño elegido, nos permi-
ten pasar a la validación de la hipótesis en sentido estricto. En algunos
casos este momento es muy simple ya que se trata de recoger los datos que
se consideran pertinentes y relevantes; en tal caso se encuentran las encues-
tas, incluso de las de carácter científico, o los estudios descriptivos, como
los correlacionales, los transversales o los longitudinales, aunque, en este
último caso, la recogida de datos pueda ser cuestión de decenios, como en
el estudio de Terman sobre superdotados o de Gesell sobre psicología evo-
lutiva. Sin embargo, contrariamente a lo que se lee en algunos lugares, este
momento de pura recogida presenta problemas y dificultades que exigen
del investigador decisiones de importancia.

31
Este planteamiento se hace muy difícil de lograr en la investigación empírica experimental o
cuasi experimental en Educación, donde lo habitual es acudir a centros educativos en los que se selec-
cionan los sujetos que intervendrán en la investigación.
32
Vid. AZORÍN POCH: (1973). Curso de muestreo y aplicaciones, Madrid, Aguilar, 1973; PULIDO SAN
ROMÁN, A. (1978). Estadística y técnicas de investigación social, Madrid, Pirámide, caps. 13 a 15.

71
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Sin embargo, en la mayoría de las ocasiones la validación de la hipóte-


sis es el momento cumbre que decide no tanto sobre la aceptación o recha-
zo de la hipótesis, pues, desde este ángulo de vista cualquier investigación
es válida aunque la hipótesis se rechace33, cuanto de su validez, es decir, de
si podemos aceptar los resultados, en la dirección que sea, o si no merecen
confianza alguna.
En efecto, este momento supone llevar a cabo el diseño, bien sea que
suponga un experimento en sus diversas modalidades, bien requiera un pro-
cedimiento ex-post-facto, bien sea acudir a formas de observación como las
apuntadas con anterioridad. La observación, en efecto, puede ser una de las
técnicas fundamentales para la recogida de datos e información en la inves-
tigación pedagógica.
La posibilidad de disponer de información en situaciones naturales, del
desarrollo de los procesos educativos y no solo de los resultados, represen-
ta aportaciones de extraordinario valor, riqueza y matices. Obviamente, no
toda observación vale para tan importantes aportaciones; probablemente,
la caracterización más completa, a la vez que sencilla, de esta técnica esen-
cial es la de Bunge34, cuando afirma que debe ser intencionada, porque debe
llevarse a cabo al servicio de un objetivo determinado, e ilustrada, pues
debe ser guiada por un cuerpo de conocimientos.
Por su parte, Selltiz35 afirma:

«La observación se convierte en técnica científica en la medida en que: 1) sirva


a un objetivo ya formulado en la investigación; 2) es planificada sistemáticamen-
te; 3) es controlada sistemáticamente y relacionada con proposiciones más gene-
rales en vez de ser presentada como una serie de curiosidades interesantes, y 4)
sujeta a comprobación y controles de validez y fiabilidad.»

Continuando con nuestro análisis sobre la validación de la hipótesis,


nos referimos al grado de control que pueda poner en práctica el investiga-

33
Para Claude Bernard (1865, Introduction a l´étude de la medicine experimentale. París: Garnier-
Flammarion) nunca hay experimentos fracasados. Kerlinger (o. c., p. 26) por su parte, afirma que «los
hallazgos negativos son a veces tan importantes como los positivos, porque reducen el universo total de
ignorancia y, en ocasiones, señalan en dirección de otras hipótesis y líneas de investigación científica.
34
O. c., p. 727.
35
O. c., p. 225.

72
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

dor que, junto al rigor del proceso utilizado, darán lugar a resultados fia-
bles o contaminados y, en consecuencia, aceptables o no como prueba para
decidir sobre la aceptación o rechazo de las hipótesis.
Ahora bien, la recogida de datos no da en sí misma ninguna respuesta a
las preguntas planteadas; los datos en sí nada prueban ni nada refutan si no
son analizados y tratados adecuadamente, si no son sometidos al adecuado
análisis.
Entre las operaciones fundamentales a seguir con los datos es preciso
señalar las de depuración, especialmente necesaria en situaciones de trata-
miento mecanizado, para eliminar protocolos en los que se den varias res-
puestas a un mismo ítem o en los que los elementos sin respuesta sean
demasiado elevados, por encima del criterio previamente fijado por el
investigador; la de organización, bien a través de una simple ordenación,
bien por medio de una adecuada categorización36 que desemboque en una
tabla de frecuencias, bien llegando a distribuciones, sistemas todos ellos
que ofrecen una visión de conjunto a la vez que permiten una simplificación
y facilitan el tratamiento posterior.
En la tarea de simplificación ayuda mucho la utilización de todo tipo de
representaciones gráficas, en función de las características mismas de los
datos y de las necesidades del investigador; en ocasiones la de transforma-
ción, de forma que sean posibles formas de análisis posteriores que, en caso
contrario, no lo serían.
Dispuestos así los datos, aunque no siempre tales operaciones son
necesarias, puede pasarse a formas conocidas de análisis, propias de
hipótesis sencillas, como son las pruebas sobre diferencias significativas
en medidas de tendencia central o variabilidad; cuando se trata de estu-
dios conjuntos de dos o más variables es necesario llegar previamente a
distribuciones conjuntas de frecuencias y diagramas de dispersión o
tablas de contingencia, para después decidir sobre la significación de las
diferencias apreciadas.
En general este tipo de análisis representa para el investigador la toma
de decisiones previas que se centran sobre todo en los siguientes puntos:

36
Una clara definición de las reglas de la categorización puede encontrarse en KERLINGER, F. N: o.
c., pp. 141-144.

73
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

a) El nivel de medición logrado.


b) El tipo de error que desea evitar en mayor grado (tipo I o tipo II) y nivel de sig-
nificación estadística, representado por α.
c) La elección de la prueba estadística.

El nivel de medición logrado, en el marco de las escalas de medida, viene


a representar uno de los puntos clave para todos aquellos autores que,
como Siegel, ven en el isomorfismo entre las operaciones que se pueden
realizar con los objetos empíricos y las que posibilitan los números que se
les atribuyen un elemento esencial; según ello el investigador deberá con-
formarse en muchos casos con medidas de posición y variabilidad menos
fuertes, como la mediana (Md) o la moda o modo (Mo) entre las primeras,
---
y como Q o DMMd entre las segundas, sin poder utilizar X , s2 y s 37.
En cuanto a los errores, propios de todo planteamiento probabilístico,
el investigador debe saber que si reduce el de tipo I —rechazar una hipóte-
sis de nulidad verdadera aceptando en su lugar su propia hipótesis siendo
falsa— aumenta el de tipo II; debe, pues, decidir en cada caso, en función
del conjunto de circunstancias que rodean su investigación y de su signifi-
cación práctica, cuál es peor en su caso; en ocasiones le interesará mos-
trarse conservador, reduciendo el de tipo I a su mínima expresión, en otras
actuará al contrario; pero puede buscar la reducción de uno y otro a un
nivel satisfactorio adecuando el tamaño de su muestra38.
Por lo que se refiere a la elección de la prueba estadística debe tener en
cuenta toda una amplia serie de puntos de vista; para quienes siguen la pos-
tura de Siegel, la primera decisión está clara:

«Los datos medidos por escalas nominales u ordinales deben analizarse por
métodos no paramétricos. Los datos medidos por escala de intervalo o de propor-

37
SIEGEL, S. (1976). Estadística no paramétrica. México: Trillas. Una posición contraria la repre-
sentan: LORD, F. N. (1953) On the statistical treatment of football numbers. En American Psychologist,
8, pp. 750 s.; GLASS, G. V. y otro (1975) Métodos estadísticos aplicados a las Ciencias Sociales. Madrid:
Prentice-Hall International. Una posición matizada es la representada por KERLINGER, en su citada obra,
pp. 451-460, o AMON, J. (1976) Estadística para psicólogos, Madrid, vol. 1, pp. 11-17
38
Vid. al respecto la interesante exposición de Fox, D. J.: (1980). El proceso de investigación en la
educación, Pamplona, EUNSA, cap. 8.

74
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

ción deben analizarse por métodos paramétricos si los supuestos del modelo esta-
dístico paramétrico son sostenibles.» (53)

Por lo que hace a los supuestos aludidos por Siegel no todos se han reve-
lado igualmente exigentes; uno de ellos, el de normalidad, parece no tener
tanta importancia, de modo que su violación no da lugar a graves altera-
ciones del modelo salvo en casos de violación muy acusada; sin embargo, el
incumplimiento del de homogeneidad de las varianzas puede tener graves
repercusiones en el nivel de significación de las pruebas paramétricas como
t y F, como se desprende de los trabajos de Scheffé y Boneau39.
Aplicados estos criterios debe elegirse la prueba más potente y más preci-
sa de entre las posibles, esto es, la que permite rechazar más fácilmente H0 y
hacerlo en forma más específica. Con todo conviene reseñar una serie de
aspectos a cuidar en la elección de la prueba y en su resolución, como son:

• El tamaño de las muestras.


• El tipo de contrastes: unilaterales o bilaterales.
• La forma de selección de los sujetos —al azar o guardando relación (gemelos,
parejas, mismos sujetos).
• El número de tratamientos y el de variables independientes y dependientes que
se integran en el diseño.

Junto a este tipo de análisis estadístico, referido a hipótesis estadísticas


sobre significación de diferencias, es preciso hablar de otros que no se cen-
tran tanto en la variable o en un combinado de ésta y de las unidades (pro-
pio de diseños factoriales y de métodos multivariables) cuanto en tales uni-
dades. En estos casos el análisis se preocupa fundamentalmente de la
elaboración de índices o de la identificación de factores40 campo este de
extraordinaria fecundidad en tareas de investigación fundamental y con
derivaciones prácticas de importancia: la validación de constructo41 y la ela-

39
Vid. SCHEFFÉ, H. (1959) The analysis of Variance. New York: Wiley. BONNEAU, C. A. (1960) The
effects of violations of assumptions underlying the-test. En Psychological Bulletin, 57, pp. 49-64.
40
Vid. YELA, M.: (1957) La técnica del análisis factorial, Biblioteca Nueva, Madrid. HARMANN, H. H.
(1967) Modern factor analysis, Chicago, University of Chicago Press, 2nd. ed ; TORRENS IBERN, J.: (1972).
Modèles et méthodes de analyse factorielle, París: Dunod.
41
Vid. ANASTASI, A.: o. c., pp. 140-144, CRONBACH. C. J.: o. c., pp. 165-168 y ADAMS, G.S. (1970). Medi-
ción y evaluación. Barcelona: Herder, pp. 170-190 .

75
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

boración de teorías en torno a la organización de los rasgos son ejemplos


relevantes.

3.4. Interpretación, teoría y replicación

Los informes de investigación suelen presentar en su parte final un


apartado dedicado a conclusiones. Recordando que la ciencia nunca llega a
resultados finales acabados, sino que se encuentra dispuesta a modificar los
enunciados hasta entonces tenidos por válidos cuando nuevos datos así lo
recomienden, con este término debemos entender el resultado a que se ha
llegado tras la prueba a que se han sometido las hipótesis de la investiga-
ción, por lo que es frecuente que, si el problema tenía varias preguntas
habiéndose elaborado una hipótesis para cada una de ellas, se presente
como mínimo una conclusión para cada una de tales preguntas.
Caben dos grandes categorías, según que la conclusión se limite a ser
una traducción de los términos estadísticos a lenguaje verbal, incluso lle-
gando a nuevas conclusiones de carácter deductivo con respecto a aquéllas,
o que se pretenda elevarse por encima de ellas, bien, sea en forma de mera
generalización de los datos a poblaciones más amplias bien a formulación
o reformulación de leyes y teorías.
La deducción de nuevas conclusiones de nivel más bajo a partir de la vali-
dación de la hipótesis no plantea problemas sobre la certeza siempre y cuando
los resultados, que se toman ahora como premisas, sean ciertos; así las cosas,
la validación de una hipótesis —no definitiva, como sabemos— permite llevar
a cabo predicciones que, de confirmarse, prestarán a aquélla nueva fuerza.
Pero los resultados obtenidos en una investigación a base del estudio
controlado de unos pocos casos nos permiten —ahora por inducción— ele-
varnos por encima de los hechos y, en función de las variables controladas,
poder formular leyes de aplicación más o menos general; conviene resaltar
que hablamos del estudio controlado de hechos y no de una mera acumu-
lación de datos, pues por ese camino podemos acumular una enorme evi-
dencia favorable desdeñando o pasando por alto la de carácter desfavora-
ble como no relevante.
Pero la generalización toma otra forma más importante para la ciencia:
la validación de una hipótesis, sobre todo cuando se actúa dentro de siste-

76
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

mas problemáticos como apuntábamos con anterioridad, permite formular


nuevas leyes que, de momento, son hipótesis de alcance más general que las
hasta entonces utilizadas. Esta es para Popper «la ruta de la ciencia», una
ruta inductiva, que él prefiere denominar casi-inductiva ya que «solo cabe
superar una teoría que esté bien corroborada por medio de otra de nivel de
universalidad más alto; esto es, por una que sea más contrastable y que, ade-
más, contenga a la teoría antigua y bien corroborada»42.

3.4.1. Inferencias deductivas

Como hemos expresado con anterioridad, planteada una hipótesis como


posible solución a un problema se deducen las consecuencias que, de ser
ciertas, deberían producirse; confirmadas tales consecuencias inducimos
que la hipótesis ha quedado validada aunque no verificada.
Ahora es posible tomar esta conclusión como una premisa, que se acep-
ta mientras no sea puesta en tela de juicio por nueva evidencia, y derivar de
ella nuevas predicciones que, a la par que permiten ensanchar la estructu-
ra y el ámbito del saber científico en torno al tema, se convierten en sí mis-
mas en prueba de nuevas contrastaciones de la hipótesis en que se funda-
mentan y de la correspondiente teoría; si, en efecto, las predicciones
resultan confirmadas, hipótesis y teoría adquieren mayor firmeza, pero en
caso contrario será preciso reformular la teoría o desecharla, proponiendo
otra en su lugar.
La ventaja de estas inferencias deductivas es el carácter de certeza que
les corresponde cuando las premisas también lo son; no obstante es nece-
sario ser cautos en este punto ya que en la denominada ciencia factual no
hay ningún supuesto absolutamente cierto. En efecto, en nuestras ciencias
no es posible llegar a la confirmación de leyes o teorías, dándoles el carác-
ter de ciertas o verdaderas, aunque sí es posible en ciertos casos afirmar
que un enunciado ha resultado ser cierto o falso tras la oportuna prueba.
Este caso lo tenemos en las hipótesis universales y en las singulares o
existenciales; en las del primer tipo, al referirse a todos los casos, la evi-

42
POPPER, K. R.: o. c., p. 257. Una excelente crítica a la postura de Popper puede encontrarse en
CHALMERS, o. c, cap. 6.

77
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

dencia recogida puede dar la razón al enunciado hipotético, en cuyo caso,


y dado que no se han estudiado sino unos cuantos de todos los posibles, el
investigador se muestra cauto y se limita a firmar la confirmación de la
hipótesis; ahora bien, si la evidencia resulta negativa tratándose de una ley
universal el investigador procede deductivamente y afirma su falsedad; ésta
es la postura sostenida, y ya aludida, por Popper43 en el sentido de que una
falsación contrastable intersubjetivamente es definitiva, y expresada con
claridad por Weyl44:

«De una vez para siempre quiero manifestar mi admiración ilimitada por el
trabajo del experimentador en su lucha por sacar hechos interpretables de una
Naturaleza huraña, que también sabe responder a nuestras teorías con un no deci-
sivo o con un sí inaudible.»

Estamos aquí ante la postura refutabilista según la cual, al no existir


otro procedimiento que el deductivo, los datos resultan inútiles si son
favorables, esto es, no dan valor de verdad alguno a la teoría, pero son
decisivos en caso contrario; de unos datos favorables lo único que se
puede afirmar es que la teoría ha salido indemne de la prueba, pero en el
futuro otros podrían contradecirla y tirarla por tierra para sustituirla por
otra mejor. Sin tomar posiciones extremadas se puede afirmar, no obs-
tante, que ésta es una postura bastante general, de la que participan
muchos autores.

«Las hipótesis más generales de hecho nunca se “confirman”; cuando por con-
veniencia utilizamos ese término queremos significar, más bien, que la hipótesis
fue expuesta a refutación y salió airosa de ella. Este punto de vista es compatible
con todas las filosofías humanas de la ciencia que proclaman la imposibilidad de
obtener pruebas concluyentes para leyes inductivas.»45

Existe otro caso, el de las hipótesis singulares, en que puede llegarse por
deducción a su establecimiento definitivo, aquí como verdaderas: ocurre
esto cuando al estudiar un determinado número de casos se encuentra uno

43
Ibídem, p. 250.
44
WEYL, (1931) Gruppentheorie und Quantenmechamich, p. 2, citado por Popper.
45
CAMPBELL, D. y otro. o. c., p. 73.

78
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

por lo menos que cumple el enunciado; por muchos que se estudien, si no


fueran todos, una evidencia enorme en contra nunca permitiría el rechazo
definitivo de tales hipótesis46.
La postura refutabilista tiene en contra la confirmacionista, según la
cual una mayoría de casos favorables deja establecida una hipótesis;
Bunge se manifiesta más cauto en un doble sentido: de una parte no con-
sidera que las contrastaciones empíricas sean las únicas posibles y, de
otra, admite fallos en la contrastación; por ello llega a una postura más
matizada, lo que él denomina el verdadero procedimiento científico según
el cual, los datos

«… si son favorables, sugieren cosas, aunque no concluyentemente; si son desfa-


vorables, tienen aún más importancia pero no por eso son concluyentes, pues la
contrastación puede ser errada.»47

3.4.2. Generalización

Un segundo aspecto, generalmente más conocido, de la interpretación


de los datos se refiere a su generalización, es decir, a la extensión de los
resultados encontrados en la investigación a casos no estudiados en ella.
No obstante es preciso aclarar que, si bien es más conocido, no siempre
es correctamente interpretado; en efecto, en la investigación realizada
sobre muestras el proceso suele entenderse como de extensión de los resul-
tados contrastados en ellas a toda la población de sujetos, previo el proce-
so de determinación de la significación estadística de los resultados. La jus-
tificación de la decisión se halla en la suficiencia y representatividad de la
muestra con respecto a la población de la que forma parte:

«Solo cuando la muestra es representativa de la población estamos capacita-


dos para generalizar de la muestra a la población.»

46
Vid. McGUIGAN, F. J.: o. c., pp. 359-372.
47
BUNGE, M.: o. c., p. 896; más ampliamente 886-896, postura coincidente con Chalmers, en su ya
citada obra ¿Qué es esa cosa llamada ciencia?, cap. 4.

79
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

afirma McGuigan48, si bien es necesario precisar que tal generalización de


los resultados estadísticos no se refiere al valor hallado, sino a un intervalo
confidencial a su alrededor, intervalo que depende de la probabilidad de
certeza elegida (nivel de confianza).
Pero, como decíamos con anterioridad, ninguna hipótesis es válida en
general sino en el marco de las condiciones integradas en la investigación,
y en ésta hay algo más que sujetos; podemos encontrar unas variables inde-
pendientes —controladas y extrañas—, definidas de una determinada
manera, un investigador más o menos participante o interviniente y unas
determinadas circunstancias espacio-temporales.
Respecto de las variables independientes es necesario precisar que en la
investigación se consideran ciertos niveles de las mismas, niveles por lo
general decididos por el experimentador en función de sus intereses perso-
nales —efectos fijos en la terminología de Glass y Stanley49— y en modo
alguno seleccionados al azar de entre una población de los infinitos niveles
posibles.
Por otra parte, cada investigación se lleva a cabo en el marco general de
la situación a que se refiere: en un colegio hay ciertos medios, cierta
«atmósfera» o estilo, hay ciertos profesores y no otros, el número de alum-
nos es el que es y no otro, la investigación se lleva a cabo en un momento
determinado, caracterizado por conflictos o preocupaciones académicas de
diversa consideración, por ambiente distendido, cordial o, al contrario,
tenso y endurecido, con un sistema de evaluación más o menos continua,
en un marco de competición o colaboración más o menos predominante...;
todos estos hechos limitan las posibilidades de generalización en el caso de
no haber sido muestreados al azar de una población; pero está el problema
del propio investigador en ciertas ocasiones en que su papel es especial-
mente activo, manteniendo relaciones directas con los sujetos: en tales
casos no se puede generalizar sin más a la población de sujetos sin hacer
referencia a las características de aquél. En realidad podría afirmarse que
son precisamente generalizaciones no justificadas a partir de todos estos, y
más, hechos y circunstancias los que explican, o pueden explicar al menos,
resultados contradictorios obtenidos en la investigación educativa.

48
McGUIGAN, F. J., o. c. p. 385.
49
GLASS, G. V. y otro, o. c., cap. 17; así mismo, McGUIGAN, F. J., o. c., pp. 320-322.

80
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

La utilización de diseños factoriales y una definición precisa de todas


las circunstancias espacio-temporales y de todo tipo en que se lleva a cabo
la investigación, permiten llegar no solo a generalizaciones más realistas
sino a leyes más matizadas en las que la interacción50 juega un papel de pri-
mera importancia.
La generalización está íntimamente ligada a la replicación, y facilitada
por ella. La réplica de experimentos o, en general, de investigaciones, viene
a ser la exigencia lógica del nivel de incertidumbre que rodea toda ciencia
que actúa inductivamente o, si se quiere, toda ciencia empírica incluso en
la postura de Popper; la exigencia de contrastación intersubjetiva a que
hemos aludido se cumple justamente en la replicación, que puede ayuda-
mos en la doble tarea de la generalización en que nos hallamos y en el grado
de confianza que concedemos a los resultados.
La replicación llevada a cabo con el mismo sujeto o grupo permite con-
ceder mayor credibilidad, mayor fortaleza y fiabilidad a los resultados al
hacer más improbable que se deban a la casualidad; por otra parte esa
mayor certeza, en modo indirecto facilita la credibilidad de la generaliza-
ción entendida como extensión a la población. Ahora bien, si una misma
investigación es repetida con nuevos sujetos, sobre todo cuando éstos han
sido seleccionados en modo imparcial, la concordancia de los resultados no
solo aumenta la fiabilidad de éstos sino que concede mayor credibilidad a
la generalización a nuevos sujetos.
Con todo es preciso hablar de una forma de replicación de experimen-
tos que Sidman denomina sistemática51, en la que las circunstancias, los
niveles de las variables independientes y cualquier otra considerada rele-
vante son variados y sometidos a contraste; la concordancia, ahora, de los
resultados, favorece generalizaciones no solo a sujetos sino a todas esas cir-
cunstancias, elevándose por encima y facilitando formulaciones de leyes de
mayor alcance.
Conviene hablar asimismo de un tipo especial de generalización consis-
tente en la interpolación y extrapolación de resultados a partir de los empí-

50
Vid. COCHRAN, V. G. y otro (1974). Diseños experimentales, México: Trillas, cap. 5; GLASS, G.V. y
otro: o. c, pp. 295-300 y 322-326; KERLINGER, F. N.: o. c., pp. 254-279; DOMENECH, J. M. (1977) Bioesta-
dística, Barcelona: Herder, pp. 461 y 483-505.
51
SIDMAN, M. (1978). Tácticas de investigación científica. Barcelona: Fontanella, pp. 113-140.

81
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

ricamente hallados que permitan formular leyes de aplicación general. En


efecto, sobre la base de un número suficiente de datos o mediciones que
permitan establecer una cierta tendencia, el investigador puede llegar a
encontrar o definir algún modelo matemático o alguna representación grá-
fica —curva empírica— que le permita anticipar o predecir lo que ocurrirá
en nuevas investigaciones con niveles intermedios o exteriores a los ya
experimentados, siempre, claro está, con unos márgenes de error propios
de toda investigación empírica.

3.4.3. Inferencias inductivas

Las inferencias inductivas, es decir, el paso de unos enunciados parti-


culares a otros universales o, al menos, más generales es, en principio, pro-
blemático. Así lo afirma Bunge52 expresándose en los siguientes términos:

«El problema de la inferencia científica no deductiva es muy serio y difícil, ya


por el mero hecho de que entre las ideas y los hechos que se supone representan
aquéllas existe un indudable hiato.»

y en la misma línea se mueve Chalmers53 entre otros muchos estudiosos del


tema.
Sin embargo, considera que estas inferencias son no solo necesarias
sino convenientes; recordemos su regla de oro del trabajo científico: «auda-
cia en el conjeturar, rigurosa prudencia en el someter a contrastación las con-
jeturas», si bien con un dominio o control para que tales saltos no lo sean
en el vacío.
En este punto se dan una serie de posturas diversas, de mayor o menor
rigor A título de ejemplo, McGuigan, hablando de estas inferencias recono-
ce que no pueden conducir a posturas ciertas, de rechazo o aceptación de
la hipótesis, como las que acabamos de ver en las de carácter universal y
existencial respectivamente, sino a, la atribución a las conclusiones de cier-
ta probabilidad de ser verdaderas.

52
O. c., p. 859.
53
O. c., caps. 1 a 3.

82
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

No obstante las polémicas sobre probabilidad o el temple de las hipóte-


sis, lo cierto es que a partir de la prueba de la que se planteó como solución
al problema, la ciencia puede avanzar en la medida en que sea factible ele-
varse por encima de los datos con nuevas hipótesis de carácter explicativo
que no se limiten a afirmar lo que los datos dicen sino que procuren expli-
carlos, dar razones del hecho contrastado, y esto solo es posible en la medi-
da en que el investigador vuelve sus ojos a la teoría buscando su apoyo.
Estas hipótesis explicativas generalmente suelen apoyarse en otras del
mismo nivel que han sido o van a ser probadas, de forma que mutuamente
se apoyan y sostienen, con lo que su probabilidad total es mayor que la de
cada una por separado.
Decíamos al principio de este apartado que las conclusiones de un tra-
bajo científico no debían entenderse como que el problema está acabado o
concluso; y si esto es verdad en el sentido de provisionalidad, revisión y
autocorrección de la ciencia, no lo es menos en el de que cualquier res-
puesta a un problema, aun las negativas —no hay experimento fracasado
veíamos decir a C. Bernard—, deja abiertas nuevas vías, plantea nuevos
problemas que antes tal vez no se atisbaban, y hasta formula ciertas obje-
ciones a campos que antes no se consideraban problemáticos, llegando en
ocasiones a hacer necesaria una revisión de la teoría. El científico, pues,
nunca agota el campo de la investigación.

4. CARACTERÍSTICAS DEL CONOCIMIENTO CIENTÍFICO-


EXPERIMENTAL

El conocimiento experimental se nos presenta como una modalidad de


conocimiento científico, concretamente aquél que se funda en la observa-
ción y experimentación científica54 sobre la base de la experiencia.
Conviene que precisemos el concepto de experiencia para no confundir los
términos, pues no toda experiencia puede considerarse de carácter científico.
J. Simon55 distingue dentro de la experiencia pedagógica el ensayo, entendi-
do como introducción de una nueva forma de hacer o de estar —la imprenta

54
GARCÍA HOZ, V. (1968). Principios de Pedagogía Sistemática. Madrid: Rialp, 4.ª ed., p. 89.
55
SIMON, J. (1972). La Pédagogie expérimentale. Tolouse: E. Privat Editeur, pp. 9 s.

83
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

en la escuela, la actitud no directiva...—, y la experiencia sistemática o experi-


mentación controlada, que es el tipo de experiencia que concierne principal-
mente a nuestra disciplina. De alguna manera, esta posición refleja la man-
tenida en el primer cuarto del pasado siglo por el Dr. Th. Simon56 al distinguir
entre la Pedagogía experimental, caracterizada por el «esfuerzo de medir los
hechos pedagógicos, estudiar las condiciones, determinar las leyes», y el movi-
miento innovador a base de la realización de ensayos frente a las corrientes
clásicas. Buyse, en la misma línea, denominará a esta última corriente la de
la Pedagogía experimentada frente a la auténtica Pedagogía experimental.
Dentro de la línea primera —pedagogía experimentada—, Dottrens y
Mialaret sitúan todo el movimiento innovador, representado, a partir del
s. XVIII por figuras como Comenio, J. B. de La Salle, Pestalozzi o Rousseau
y, por supuesto, todo el movimiento de la «escuela nueva» con Reddie, Des-
molins, Claparéde y Ferriere, las aportaciones de Kerchensteiner y el movi-
miento individualizador americano con Parkhurst y Washburne entre otros.
Por el contrario, la Pedagogía experimental, de carácter científico, procede

«… por vía de experimentación cuidadosamente estudiada y de encuestas objeti-


vamente planteadas que afectan a los problemas de la pedagogía y de la enseñan-
za susceptibles de medirse exactamente y controlarse mediante métodos de la cien-
cia y en particular de la estadística.»57

Parece, pues, que encontramos unos criterios para reconocer qué expe-
riencia se considera incluida en la Pedagogía experimental o, si se prefiere,
cuándo la experiencia, lo empírico, es científico: debe haber posibilidad de
medición y control.
Parecida posición mantiene García Hoz58 quien, tras reconocer que no
suele haber problema para diferenciar lo que es especulativo de lo que es
experimental dentro de la ciencia, la distinción no es tan clara entre lo cien-
tífico y no científico dentro de lo empírico, y propone, apoyándose en
Decroly y Buyse, dos criterios:

56
SIMON, TH. (1924). Pédagogie expérimentale, París, Colin, p. 1.
57
DOTTRENS, R. y otro (1971). El desarrollo de las ciencias pedagógicas. En Introducción a la Peda-
gogía, Tomo I del Tratado de las Ciencias Pedagógicas, Barcelona: Oikos-Tau, pp. 46-55.
58
O. c., p. 90.

84
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

«… la aplicación de la medida o la evaluación objetiva a los fenómenos estudia-


dos», y
«… la posibilidad de comprobar la investigación por parte de personas ajenas a
ellas.»

Recurriendo a una cita de Binet y Henry; es más, según Meumann59 se


puede considerar como pedagogía experimental cualquier estudio de carác-
ter pedagógico-empírico que pueda ser considerado investigación exacta,
esto es, «determinable numéricamente y capaz de ser comprobado en sus
resultados.»
Así pues, nuestra disciplina se caracteriza por procurar un conocimien-
to científico de carácter experimental, esto es, basado en la observación60 y
experimentación científicas, cuyas notas son la medición, el control y la veri-
ficabilidad intersubjetiva61, notas a las que más adelante nos volveremos a
referir.
A estas notas es preciso añadir la necesidad de que, como en cualquier
ciencia, sea posible el logro de leyes generales —scientia non est individuo-
rum, decían los escolásticos—, característica recogida por Palacios62.

5. POSIBILIDADES Y LIMITACIONES DE LA APLICACIÓN DE LA


METODOLOGÍA CIENTÍFICO–EXPERIMENTAL A LA
EDUCACIÓN

Analicemos estos puntos como un medio adecuado para decidir sobre la


posibilidad y limitaciones de una metodología experimental en nuestro
campo del saber.

59
MEUMANN, E. (1924). Compendio de Pedagogía Experimental. Barcelona: Tipografía La Educación,
citado por V. García Hoz, en o. c., p. 90.
60
Es interesante señalar que en apoyo de la observación como procedimiento experimental, tan
denigrado por algunos, se encuentran figuras a las que tanto deben las ciencias experimentales huma-
nas como Claude Bemard en su Introduction a l´étude de la médecine expérimentale, publicada en París,
en 1865.
61
Refiriéndose a esta última, Seiffert (1977) señala que tal verificabilidad ni debe serlo por cual-
quiera ni puede ser algo subjetivo; los criterios «Dependen siempre del método de la ciencia competen-
te en cada caso». Introducción a la teoría de la Ciencia, Barcelona: Herder, p. 169.
62
PALACIOS, L. E. (1972). Filosofía del saber. Madrid: Gredos, 2.ª ed., pp. 57 s.

85
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

5.1. Posibilidad de leyes generales en Educación

Tal vez sea ésta una de las características de la ciencia que más se dis-
cutan al saber científico pedagógico. Fiel reflejo de ello son las polémicas
aparecidas hace años en la Harvard Educational Review y en los escritos de
Dilthey y Royce entre otros63.
En efecto, las mismas investigaciones sobre diferencias humanas, hoy
en día aceptadas, asumidas y valoradas en el ámbito pedagógico, parecen
constituir un serio obstáculo. Sin embargo tal objeción entendemos que
puede ser superada en la medida en que precisemos el significado del tér-
mino general o universal, y en ese sentido es forzoso hacer constar que aun
en el ámbito de las leyes físicas se hacen determinadas precisiones de cir-
cunstancias tales como la altura sobre el nivel del mar, la temperatura
ambiente o a cero grados centígrados, etc. Tal vez debamos conformarnos
con leyes suficientemente universales o generales.
En este sentido nos parece ilustrativa la aportación de M. Sherwood64 al
indicar que existen varios tipos de generalizaciones aceptables en las cien-
cias, y reseña los siguientes:

«1. AB se verifica (siempre).


2. En las ocasiones T1 … Tn , AB se verifica.
3. En las ocasiones T1 …Tn , en las condiciones C1 …Ck, AB se verifica.
4. En las ocasiones T1 … Tn , en las condiciones C1 …Ck, para los individuos
P1...Pl, AB se verifica.
5. AB se verifica en p % de casos (lo que sería la afirmación 1 con la adición de
una condición de probabilidad).
6. En las ocasiones T1...Tn , en las condiciones Pl...Pl, para los individuos C1...Ck,

AB se verifica en el p % de casos.
Siendo AB la relación entre variables, A y B, resulta que la situación (6) anterior
es la forma más débil de generalización, aunque no deje de ser generalización.»

63
Véase, entre otros, el trabajo de ROYCE (1891). Is There a Science of Education. En Educational
Review, 1, pp. 15-25.
64
SHERWOOD, M. (1969) The Logic of Explanation in Psychoanalysis. New York: Academic Press,
citado por RODRÍGUEZ, A. (1977). Investigación Experimental en Psicología y Educación, México: Trillas,
pp. 22 s.

86
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

Posición que salva tanto la libertad humana, eludiendo el postulado de


determinismo, característico de las ciencias en sentido más estricto —Bio-
logía, Física y Química—, cuanto las diferencias individuales; en efecto, las
afirmaciones se realizan y son válidas para grupos concretos —y para aque-
llos otros que representan— con características precisamente definidas,
pero tales leyes de grupo sobre no predicarlas con absoluta certeza sino a
niveles determinados de probabilidad, afectan a los grupos como tales pero
no a todos los sujetos concretos que los integran; esta idea se encuentra
maravillosamente expresada por unas palabras de Sherlock Holmes al doc-
tor Watson, recogidas por Allport65:

«El individuo aislado es un enigma insoluble, pero si los individuos forman


un grupo, en lugar de un enigma tenemos una certidumbre matemática. (...) Los
individuos varían, pero los porcentajes permanecen constantes.»

Como afirmábamos en otro lugar66,

«... probablemente el problema de las leyes generales en Educación se resuelve


incluyendo en su formulación suficientes variables: el método A es mejor que el B
cuando lo utiliza el profesor C, en las circunstancias de tiempo D y de espacio E,
con alumnos de tipo F, en ambientes educativos G, con material H, para fines 1,
con motivos J…»

Lo que, claro está, requiere en su base una metodología suficiente-


mente complicada y, naturalmente, unas técnicas estadísticas en línea
con tales modelos. Unas y otras parecen estar en vías de logro con avan-
ces como la investigación multivariable, los diseños factoriales o el análi-
sis causal, y con medios tan poderosos como los ordenadores, que son
capaces de hacer fácil cualquier proceso estadístico cuando se les da el
programa oportuno.

65
ALLPORT, G.W. (1975). La personalidad. Su configuración y desarrollo. Barcelona: Herder, pp.
38 s.
66
PÉREZ JUSTE, R. (1981) La base científica de la Educación. En R. Pérez Juste y otros. Pedagogía
experimental I, vol. I, Madrid: UNED, p. 39.

87
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

5.2. Medición y evaluación. Principales objeciones

Probablemente interese aquí justificar la importancia concedida a la


medición como criterio para decidir sobre la cientificidad de un conoci-
miento empírico; y en este sentido es interesante apoyarnos en Bunge67
según el cual la cuantificación de la realidad permite el afinamiento de con-
ceptos, la descripción precisa de la realidad, la precisa clasificación de los
sujetos, la formulación de hipótesis y teorías exactas, «estableciendo una
interrelación precisa entre variables y fórmulas», y la contrastación rigurosa
de hipótesis . El autor trae a colación la regla formulada por Galiei, de
«medir lo medible e intentar hacer medible lo que aún no lo es», que, de algu-
na manera, es una manifestación de la importancia que la medición tiene
en la ciencia experimental.
Así las cosas conviene analizar hasta qué punto puede aplicarse la medi-
ción a los fenómenos educativos. En ese sentido es preciso salir al paso de
las objeciones habituales a la medida en el campo de las ciencias humanas
y, en concreto, en Psicología y Educación. Yela68 ha sistematizado y recogi-
do estas objeciones, agrupándolas en cuatro grandes apartados: lo psíquico
no puede medirse

a) porque es espiritual,
b) porque es cualitativo
c) por ser una totalidad indivisible y
d) por ser irrepetible y en continuo cambio.

Estas objeciones, aunque referidas a la Psicología, son válidas para la


Educación, pues «la negación de la posibilidad de la medida en los fenóme-
nos pedagógicos es hija de esta misma negación en el terreno psicológico»69.
a) Lo psíquico no puede medirse porque es espiritual
La primera objeción puede superarse por vía de una medición indirec-
ta; no podremos medir lo espiritual —aunque no necesariamente debemos

67
O. c., p. 15
68
Vid. YELA, M. (1964.65). Necesidad y posibilidad de la medida en Psicología. En Psicometría y
Estadística, Madrid, pp. 5-16.
69
Vid. GARCÍA HOZ, V., o. c., p. 91.

88
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

admitir la igualdad entre lo psíquico y lo espiritual— pero siempre podre-


mos hacerlo con manifestaciones externas de los fenómenos psíquicos;
tampoco es posible medir fenómenos pedagógicos internos, como el apren-
dizaje, mas sí manifestaciones externas del mismo, como el número de
palabras correctamente escritas en cuanto a su ortografía. Bunge70 así lo
considera cuando afirma que «si se trae a colación el sustrato fisiológico de
la vida psíquica (...) entonces se encuentra a nuestra disposición todo un aba-
nico de indicadores objetivos y cuantitativos».
Por otra parte conviene aclarar que, sin negar la mayor calidad de la
medición de las ciencias físicas, también allí la medida es indirecta en la
mayoría de los casos, a veces notablemente indirecta, pues, como afirma
Towsend71, «¿es muy diferente el problema del físico al medir los efectos de la
electricidad, del que afronta el psicólogo al medir los efectos de la inteligen-
cia?».
Pero todavía hay más; ese carácter indirecto no parece ser demasiado
preocupante sino todo lo contrario, a autores como Bunge72, como se des-
prende de la siguiente afirmación:

«Los números más importantes para la ciencia son los determinados por
cómputos indirectos ... o sea, por el cómputo que requiere refinadas teorías y no
menos sutiles mediciones. La razón de este hecho es la siguiente: los números
fácilmente accesibles... pueden presentarse en descripciones, pero muy rara vez en
teorías... Por importantes que puedan ser para fines prácticos, los números direc-
tamente medibles tienen escasa importancia cognoscitiva comparados con los
números ‘ocultos’, los números que no son accesibles sino por medio de teorías.»

b) Lo psíquico no puede medirse porque es cualitativo


La segunda objeción debe enfrentarse igualmente desde la medición
indirecta referida a las manifestaciones externas y al substrato biológico
de lo psíquico; pero también presenta otros aspectos interesantes; en efec-
to, aunque puedan demostrarse las teorías de Piaget sobre la inteligencia
según las cuales sería un «desarrollo progresivo de una serie de estructuras

70
O. c., p. 770.
71
TOWSEND, J. C. (1953) Introduction to Experimental Method. New York: McGraw-Hill, p. 13.
72
O. c., p. 785.

89
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cualitativamente distintas a través de estadios que difieren cualitativamen-


te entre sí»73, esto no impide que los sujetos que han llegado a una estruc-
tura determinada difieran entre sí cuantitativamente y que puedan mejo-
rar con el tiempo y el ejercicio en las manifestaciones de tales estructuras
cualitativas.
García Hoz74 sale al paso de esta objeción afirmando que «en matemáti-
cas existe también la seriación y ordenación de magnitudes discontinuas, y
este concepto de seriación puede aplicarse también a un grupo de cualidades»
poniendo como un ejemplo de este tipo de medición la lograda con escalas
de producción escolar.
c) Lo psíquico no puede medirse porque es una totalidad indivisible
La objeción referente a la necesidad en toda medición de aislar un fenó-
meno frente al hecho de la totalidad indivisible del ser humano no es una
objeción solo a la medición psicopedagógica sino a cualquier medición,
siendo la diferencia únicamente la intensidad. Lo mismo que sin romper la
unidad humana yo puedo pesar a un sujeto, medir su talla, o estimar el
número de glóbulos rojos en la sangre, no hay razón que impida medir la
inteligencia, todo lo imperfectamente que se quiera, pero medirla; otra cosa
es que la inteligencia, como elemento integrante de esa totalidad, esté en
relación con otras muchas variables psíquicas y físicas del sujeto, y ambien-
tales, y, que, además, esté en cambio; las mediciones podrán poner en evi-
dencia tales relaciones y tal evolución, pero la personalidad total del sujeto
no se «romperá» en modo alguno por la medición de uno de sus aspectos
integrantes.
d) Lo psíquico no puede medirse porque es irrepetible y en continuo cambio
Por último, la objeción referida a la irrepetibilidad de los hechos psico-
pedagógicos no es solo objeción a la medida sino, también, a esa caracte-
rística que hemos denominado verificación intersubjetiva o contrastabili-
dad intersubjetiva en terminología de Popper, y, en consecuencia, a esa otra
nota básica de la ciencia que es la objetividad. En alguna medida esta obje-
ción vale para las ciencias físicas, al menos para alguna, o para algunas

73
YELA, M. (1976). Familia y nivel mental. En ROF CARBALLO, J. (edit.) La familia, diálogo recupera-
ble, Madrid: Karpós, p. 302.
74
O. c., p. 92.

90
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

mediciones, aunque en la inmensa mayoría de los casos los errores de


medida no se deben a los cambios en el objeto a medir sino a los instru-
mentos, ciertamente imperfectos aunque mucho más perfectos que los de
nuestro campo, o a quienes los utilizan.
No obstante, es cierto que en el campo de la Educación los posibles
«errores» derivan también de esta irrepetitibilidad nacida de la caracterís-
tica del ser humano consistente en estar en continuo cambio; como afirma
Kerlinger75, refiriéndose a la maduración como factor que atenta contra la
validez interna de un diseño:

«En realidad, esta es una de las exasperantes características de la investigación


educacional. Los niños se niegan a permanecer inmóviles mientras progresan en
sus estudios.»

Sin embargo, conviene aclarar con Yela76 que el que no se repita exac-
tamente un fenómeno «no quiere decir que no pueda medirse, sino que no
puede repetirse exactamente la misma medida». Consecuencia de este hecho
será el carácter estadístico y probabilístico, no exacto, de la medida y la
necesidad de comprobar la variabilidad propia de los diversos rasgos en cir-
cunstancias concretas y, siempre que sea posible, acudir a varias medicio-
nes para aumentar el grado de confianza en los valores medidos.
La irrepetibilidad de lo humano pone, al menos en cierto modo, en
entredicho uno de los supuestos básicos del método científico en las cien-
cias naturales, el de la «uniformidad de la naturaleza», es decir, «que lo que
ocurre una vez no solo volverá a ocurrir, sino que se repetirá siempre en cir-
cunstancias similares»77; ahora bien, aunque este supuesto, también deno-
minado de coherencia, no se cumpla plenamente en el ser humano, debe
tenerse en cuenta que, «aunque sea parcial, nos permite realizar mejores pre-
dicciones de las que haríamos sobre la base de la intuición, adivinando o
haciendo conjeturas al azar»78.

75
O. c., p. 333.
76
YELA, M. Psicometría y Estadística (apuntes de clase), p. 14.
77
Supuesto formulado por J. Stuart Mill en su obra A System of Logic. New York: Harper&Brothers,
recogido por Van Dalen en su o. c., pp. 44 s.
78
CORTADA DE KOHAN, N. (1968). Manual para la construcción de tests objetivos de rendimiento. Bue-
nos Aires: Paidós, p. 12.

91
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Para concluir con las objeciones a la medición es preciso reconocer un


hecho importante y que requiere ser tenido en cuenta al hablar del control;
se trata de la interacción entre el observador y lo observado, o, como afir-
ma Yela, el hecho de que «los fenómenos psicológicos se modifican incluso
al ser observados y medidos».
Objeciones a la medida y escalas de medida
En el fondo de varias de estas objeciones a la medición late el problema
mismo del concepto de medida; la complejidad del ser humano se refleja en
los fenómenos educativos en los que se proyecta el educando como perso-
na, con todos los condicionantes ambientales en que se desenvuelve; esta
razón ha hecho pensar a muchos en la imposibilidad de someter a medida
rigurosa muchos de tales fenómenos siendo hoy de uso más común el tér-
mino evaluación, término más amplio que incluye aquél, y del que los tests
no son sino el principal grupo de instrumentos, pero no el único.
Con todo, basta con recurrir a un adecuado concepto de medición y a la uti-
lización de pruebas estadísticas adecuadas al mismo para que podamos consi-
derar con garantías suficientes de rigor que la Pedagogía experimental —tér-
mino actualmente en desuso, sustituido por el de Métodos de Investigación—,
desde este punto de vista, es capaz de alcanzar conocimientos científicos. En
este sentido caben conceptos más o menos amplios de medida pero, probable-
mente, el más amplio sea el ofrecido por Stevens79, según el cual medición «es
la asignación de numerales a objetos o hechos de acuerdo con reglas».
Como las reglas de asignación de numerales alcanzan diversos niveles
de profundidad80, caben asimismo diversos niveles de medición, entre los
que comúnmente se aceptan el nominal, el ordinal, el de intervalo y el de
razón, si bien no hay acuerdo general81.
Las notas distintivas de estas escalas o niveles radican en las operacio-
nes que pueden realizarse con los objetos empíricos, trasladándose tales
operaciones a los números; en efecto, los números como tales representan

79
STEVENS, S. S. (1951). Handbook of Experimental Psychology, New York: Wiley.
80
Vid. al respecto los diversos postulados de medición en KERLINGER, F. N., o. c, p. 452 s.
81
En efecto, Torgerson habla de escalas, ordinal, ordinal con origen natural, de intervalos iguales
y de cocientes, mientras Glass y Stanley, refiriéndose al C.I. lo consideran de causi-intervalo; vid. GLASS,
G. V. y otro (1974). Métodos estadísticos aplicados a las Ciencias Sociales, Madrid, Prentice-Hall Inter-
nacional, p. 13.

92
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

los niveles de medición más exigentes pero, en tanto que obtenidos al apli-
car determinados instrumentos a ciertos objetos o fenómenos empíricos,
pueden perder información y reflejar únicamente aquella que el instru-
mento y los objetos ofrecen.
Así en el nivel nominal, los números solo indican que algo es igual o dis-
tinto de algo y, en consecuencia, con ellos podemos realizar cualquier
transformación numérica que siga manteniendo para las mismas cosas
idénticos números, mas no operaciones matemáticas; trabajamos en reali-
dad con las frecuencias que aparecen en cada categoría.
Las escalas ordinales, aparte de permitir diferenciar entre lo que es dife-
rente82 o afirmar la igualdad entre lo que es igual, posibilitan una seriación
en orden creciente o decreciente y, aunque la pérdida de información es
manifiesta, sobre todo en series con grandes diferencias en las distancias
entre valores consecutivos, permiten la aplicación de pruebas estadísticas
con diversos niveles de potencia, algunas muy próximas a la propia de las
escalas de intervalo.
Estas últimas escalas añaden la igualdad de diferencias entre intervalos
consecutivos y, aunque se carece de un cero absoluto u origen natural, es
posible utilizar «la suma y la resta entre los números atribuidos a las moda-
lidades, y la multiplicación y la división entre las diferencias entre los mismos
números»83. Por último las escalas de razón o cociente, al contar, además,
con el cero absoluto, permiten la realización de todo tipo de operaciones
matemáticas con los propios números surgidos del acto de la medición.
La tarea del investigador, por tanto, consistiría en examinar las opera-
ciones realizables con sus objetos empíricos, y, en virtud del isomorfismo
con el sistema numérico, realizar con los números las operaciones que el
nivel permita. Esto, traducido a las pruebas estadísticas, lleva a la inicial
dicotomía entre pruebas paramétricas y no paramétricas y, una vez toma-
da la decisión de elegir éstas, a escoger aquélla más acorde con los diversos
grados dentro del mismo nivel.

82
R. Ebel (Fundamentos de la medición educacional, México: Guadalupe, 1977, pp. 55-59), al pre-
guntarse por la posibilidad de medición del rendimiento, llega a la conclusión de que cualquier resul-
tado importante debe traducirse en una diferencia y «si se crea una diferencia, la base de la medición
existe» (p. 56).
83
AMÓN, J. (1976). Estadística para psicólogos, Madrid, vol. I, p. 15.

93
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

5.3. Posibilidades de control

Las ciencias humanas, cuando utilizan el método científico experimen-


tal, se proponen como modelo a las ciencias físicas. En general, en este tipo
de ciencias el objeto de la investigación suele ser bastante simple, al menos
relativamente simple si se compara con el caso del ser humano en cuanto
educable, que es el objeto de la investigación educativa. Esta complejidad
del objeto y el hecho de ser el hombre, a la vez, objeto de investigación y
elaborador de tal investigación, plantea problemas difíciles y particulares
como, con tino, reconoce Piaget84.
La diferencia entre los objetos de unas y otras ciencias no se refiere solo al
número de variables que intervienen en cualquier fenómeno a investigar, sino
que en el caso humano se encuentran interrelacionadas y en continuo cambio.
Por otra parte, mientras los fenómenos físicos son sensibles, en el caso
humano se dan muchos aspectos interiores a los sujetos, no siempre tras-
lucibIes al exterior; además, como consecuencia de la vida interior de las
personas, se puede apreciar una gran diversidad de respuestas a unos mis-
mos estímulos y viceversa, lo que hace más difíciles tanto el planteamiento
de hipótesis cuanto la interpretación de los resultados.
Estos hechos someramente apuntados se traducen en una dificultad real
para poner en práctica en las ciencias humanas lo que Best85 denomina
hipótesis básica y que no es sino uno de los cánones de Mill86:

«Si un caso en el que se presenta el fenómeno que se investiga y otro en el que


no se presenta tienen en común todas las circunstancias excepto una, y ésta se pre-
senta solo en el primero, la circunstancia única en la que los ejemplos difieren es
el efecto o la causa o una parte indispensable de la causa, del fenómeno.»

Si en las ciencias físicas es fácil relativamente llevar los fenómenos a


investigar al laboratorio, lograr tal situación común de circunstancias y
variar una de ellas, utilizando en el intento sistemas de control incluso de

84
PIAGET, J. (1973). La situación de las Ciencias del Hombre dentro del sistema de las Ciencias, en
J. PIAGET y otros: Tendencias de la investigación en las Ciencias sociales. Madrid: Alianza, pp. 44-120.
85
BEST, J. W. (1972) Cómo investigar en Educación. Madrid: Morata, p. 81.
86
O. c., p. 222.

94
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

carácter manipulativo, como procedimientos mecánicos, eléctricos, quirúr-


gicos o bioquímicos87, en el caso de las ciencias humanas las dificultades se
multiplican y, por lo general, no se puede recurrir a técnicas tan drásticas
como las apuntadas.
En el caso humano las dificultades para el control se hacen evidentes;
en primer lugar se plantea el problema, grave, de qué controlar, lo que, por
lo general, requiere ya investigación para determinar qué tipo de variables
están asociadas y qué otras son independientes.
En segundo lugar es preciso desarrollar técnicas que, sin ser tan drásti-
cas y definitivas, permitan un efectivo control de aquellas variables que, en
efecto, pueden contaminar el experimento. En este caso debe acudirse a
técnicas adecuadas de selección y asignación de sujetos, circunstancias y tra-
tamientos, y a la estadística como sistema de control, aspectos éstos a los
que nos referimos más adelante.
Pero además es necesario tener en cuenta los problemas éticos que
plantea la realización de determinados experimentos y que de hecho los
llegan a impedir, eso sin olvidar la casi imposibilidad real de realizar otros
por las decisiones drásticas que supondrían. Ahora bien, aun en el caso de
llevar a cabo experimentos en el laboratorio, el problema es lo que se ha
dado en llamar la artificialidad de la situación, esto es, el hecho de que, a
base de controlar una y otra y otra... variables se llega a situaciones tan
estilizadas e idealizadas que, realmente, están muy lejos de la realidad; por
contra, si llevamos a cabo experimentos o, todavía más, trabajos o estudios
de campo, la falta de control es tan evidente que las posibilidades de que
aquellos resultados no sirvan para nada deben ser tomadas seriamente en
consideración.
La solución a este dilema puede venir por una doble vía, entendemos
que complementaria; de una parte es necesaria la investigación de labora-
torio en condiciones rigurosas de control, confiriendo validez interna a los
resultados aunque la validez externa apenas exista por falta de representa-
tividad de la situación respecto de la vida diaria; pero aquellos resultados,
aunque no sean válidos para otros sujetos a no ser que se encuentren en
esas mismas situaciones —realismo mundano—, sí lo serán para aquéllos

87
Cfr. ARNAU, J., o. c., pp. 155 s.

95
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

en que se experimentó si la investigación fue bien diseñada —realismo expe-


rimental88—, por lo que el investigador habrá descubierto la dirección, la
tendencia, de las leyes que rigen el fenómeno en estado puro, o, como afir-
ma Kerlinger89, habrá puesto de manifiesto las relaciones en condiciones
«puras» y no contaminadas, lo que le permitirá probar predicciones deri-
vadas de la teoría y le facilitará la elaboración de sistemas teóricos.
La investigación de campo, aunque adolece de rigor en el control, tiene
la gran ventaja de una mayor generalización tras un proceso riguroso de
identificación y medición de las variables que intervienen y de la forma en
que lo hacen; en consecuencia, el experimento de campo —típico de la inves-
tigación educativa— permite poner a prueba en situaciones más reales los
resultados del experimento de laboratorio, y, en caso de concordancia, una
superior generalización de los logros. Lógicamente cabe un proceso a la
inversa, según el cual a partir de los datos que sugiere la investigación de
campo, se pueden formular teorías explicativas cuya comprobación habrá
de ponerse a prueba en condiciones de control riguroso.
Por otra parte, la replicación de experimentos permite conferir una
mayor credibilidad a los resultados aparte de una superior generalización,
sobre todo en el caso de la replicación sistemática, utilizando la terminolo-
gía de Sidman.
Ahora bien, el desarrollo espectacular de las técnicas estadísticas, unido
al progreso tecnológico, está permitiendo, y lo hará en mayor grado en el
futuro, plantear investigaciones con mayor realismo experimental en el
marco del realismo mundano, es decir, en situaciones naturales; en efecto,
las modernas técnicas de análisis multivariables —«familia de métodos ana-
líticos cuya característica principal es el análisis simultáneo de K variables
independientes y m variables dependientes»90— y del análisis de factores, per-
miten investigaciones en situaciones naturales o, al menos, más naturales
que hasta ahora.
Cabe reseñar, como ya apuntábamos más atrás, uno de los factores que
deben ser controlados con mayor cuidado y que es propio de la investiga-

88
Terminología debida a Aronson y Carlsmith en Experimentation in Social Psychology. En
LINDZEY, G. y otro (1968). Handbook of Social Psycology, vol. 2, Addison-Wesley.
89
O. c., p. 418.
90
KERLINGER, F. N., o. c., p. 153.

96
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

ción en ciencias humanas: se trata del propio investigador, cuya sola pre-
sencia puede interactuar, produciendo efectos no deseados, con la o las
variables independientes. Las condiciones estandarizadas de su interven-
ción, su «ocultamiento» o un adecuado muestreo de tipos pueden ayudar a
superar esta dificultad.

5.4. Verificabilidad intersubjetiva

Popper91, estudiando el problema que nos ocupa, y considerando este


punto como una característica del conocimiento científico, afirma:

«... una experiencia subjetiva, o un sentimiento de convicción, nunca pueden jus-


tificar un enunciado científico; (...) Por intenso que sea un sentimiento de con-
vicción nunca podrá justificar un enunciado.»

Y añade que cualquier otra postura sería incompatible con la idea de


objetividad científica.
Esta concepción empírica de la ciencia viene a suponer en definitiva sepa-
rar de la ciencia todo aquello que el individuo vive y siente interiormente:

«Lo que acontece en un hombre no pueden observarlo otros hombres, y, con-


secuentemente, no es verificable intersubjetivamente.»92

a no ser que puedan encontrarse manifestaciones externas, observables,


del fenómeno estudiado.

«La unión entre esta conducta observable del hombre y lo que probablemente
sucede en él debe establecerse, pues (...), por la aplicación de definiciones opera-
cionales», de un lado, y de «constructos teoréticos», de otro93.

91
POPPER, K. R. (1972). La lógica de la investigación científica. Madrid: Tecnos, p. 45.
92
Palabras que Seiffert en su citada obra, pone en boca de la teoría behaviorista que no comparte;
y propone la concepción fenomenológica de la ciencia según la cual la introspección es válida como
método científico.
93
Ibídem, pp. 174 s.

97
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Si una definición constitutiva es aquella que utiliza conceptos para defi-


nir conceptos, o lo que es lo mismo, la que sirve de construcciones para
definir otra construcción, la definición operativa pretende, según afirma
Bunge94

«… objetivizar un hecho inobservable sentando su relación según leyes con algún


hecho perceptible (...) que sirve como indicador del primero. Dicho de otro modo:
hacemos hipótesis sobre hechos no percibidos y los contrastamos por medio de
evidencia que consiste en datos acerca de hechos directamente observables, par-
tiendo de la suposición de que estos últimos son concomitantes de o efectos de los
primeros.»

El problema reside en que, mientras las relaciones entre la teoría, esto


es, entre las construcciones —integradas por definiciones constitutivas y
operativas— y los datos, a través de las reglas de correspondencia —«que
sirven al propósito de definir ciertas construcciones teóricas en términos de
datos observables»— son por lo general bastante claras en el caso de las
ciencias físicas, como lo demuestra el grado de acuerdo entre los científi-
cos, en el caso del estudio de la Educación tales relaciones no son tan
obvias; en efecto, en nuestro caso, la traducción operativa de un construc-
to teórico es problemática y solo se puede entender como un índice o indi-
cador de aquél con un grado de relación de magnitud desconocida, lo que
lleva aparejado, junto a la dificultad de validación o rechazo de teorías , la
correspondiente para lograr ese acuerdo entre observadores.
Sin embargo, es preciso reconocer el papel que una buena definición
operativa tiene para lograr tal acuerdo entre observadores pues, aunque no
se diera éste en la definición operativizada del constructo, sí permitiría que
otro investigador, en situación similar, y entendiendo las mismas cosas por
los mismos conceptos y utilizando instrumentos de medición que las pusie-
ran de manifiesto, pudiera llegar a resultados compatibles a determinados
niveles de probabilidad.
Una referencia especial dentro de este problema debe realizarse a la
relación existente entre la irrepetibilidad de lo humano, que ya hemos
apuntado, y la verificabilidad intersubjetiva.

94
O. c., p. 737.

98
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

Admitiendo lo primero como algo que ha sido puesto de manifiesto a lo


largo de la investigación una y otra vez, parece que la conclusión a que se
debe llegar es a la imposibilidad de que otros investigadores, o uno mismo
en otras ocasiones, puedan corroborar los resultados de investigaciones
anteriores; sin embargo esto solo es así si tal verificabilidad se entendiera
en sentido de identidad de resultados y, aún más, si se refirieran a los logros
y conductas de los sujetos individuales; por contra, si se entiende como
coherencia de resultados de una a otra ocasión, a determinados niveles de
probabilidad, y si los resultados se refieren a los grupos, la posibilidad de
verificación intersubjetiva parece, y está demostrado que así es, clara. Pero
aún más, cuando se trata de estudios de casos, de la aplicación de métodos
clínicos, puede apreciarse asimismo la coherencia de pautas de conducta,
el cumplimiento de leyes generales, la sucesión de estadios y etapas evolu-
tivas..., aunque se den ciertas divergencias entre sujetos y dentro de un
mismo sujeto, pero siempre dentro de los límites propios de la ley.
En definitiva, pues, las diferencias inter e intraindividuales no son un
obstáculo insalvable para el acuerdo entre observadores, característico de
la ciencia, a no ser que sean mal entendidas.

6. REPERCUSIONES METODOLÓGICAS

Del análisis de estos aspectos que están en la base del carácter científi-
co de los conocimientos experimentales se deriva una serie de problemas
que la investigación experimental debe resolver, problemas eminentemen-
te metodológicos, a los que nos referiremos ahora brevemente.
Las limitaciones de la medición educativa hacen de la determinación
de la validez y fiabilidad de las medidas dos cuestiones básicas, cuya deli-
mitación permite al investigador conocer con precisión el margen de
error que afecta a sus resultados. En efecto, la determinación de la fiabi-
lidad de los instrumentos de medición, entendida como precisión —fiabi-
lidad absoluta— permite ya que no conocer la magnitud del error de medi-
da propio de cada puntuación, sí, al menos, los límites entre los que cabe
esperar, con una determinada probabilidad, que se encuentre la verdade-
ra puntuación de cada uno. Algo similar ocurre con la validez, gracias a la
cual no es dado hacer pronósticos a corto, medio o largo plazo, cono-
ciendo la magnitud del error de estimación máximo para cada predicción

99
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

a partir del coeficiente de validez, del error típico de estimación y de la


teoría de la probabilidad.
Asimismo, tales limitaciones han llevado a artificios de medición por
los cuales, en muchas ocasiones, es necesario recurrir a formas de medir
consistentes en indicar no tanto lo que cada sujeto tiene del rasgo medio
cuanto el puesto relativo en el grupo, para cuya interpretación son necesa-
rias las normas o baremos correspondientes.
De otra parte es necesario resolver el problema de la selección de las
muestras con arreglo a criterios de suficiencia y representatividad a la vez
que elaborar estadísticas de contraste adecuadas al tipo de muestreo utili-
zado, lo que está implicando, al igual que antes, una adecuada teoría de la
probabilidad.
La probabilidad, asimismo, está implicada en el proceso de inferencia
por el cual, y partiendo de la suposición doble de validez interna y de la
representatividad de las muestras, además de una adecuación de los datos
al modelo, puedan generalizarse los valores de las muestras a las poblacio-
nes. Estos hechos llevan a determinar, asimismo, los errores muestrales
máximos que afectan a los valores de las muestras y que permiten estimar
los límites entre los que cabe esperar los correspondientes parámetros; en
este sentido los errores típicos de los respectivos estadísticos —estimado-
res—, la elección del estimador adecuado a la situación y la utilización de
las adecuadas distribuciones muestrales son elemento clave del proceso.
Las limitaciones apuntadas respecto al control obligan al investigador
educacional a una serie de decisiones de gran trascendencia entre las que
es necesario resaltar la de elección de un diseño adecuado que, a la vez que
permita responder a las preguntas de la investigación, lo haga con un ade-
cuado control de las variables extrañas, entendidas como hipótesis rivales
frente a la de que es la variable independiente o experimental la producto-
ra de los efectos medidos en la dependiente95. Y junto al diseño, la prueba
estadística que, siendo congruente con él, obtenga el máximo partido de los
datos y respete los supuestos del modelo. La elección del diseño adecuado
exige del investigador ser un profundo conocedor no solo de la metodolo-

95
Así se expresan D. Campbell y J. Stanley en Diseños experimentales y cuasi-experimentales en la
investigación social, publicada en Buenos Aires, en 1979 por Amorrortu editores, p. 74.

100
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

gía experimental sino también de la situación o campo en que va a investi-


gar para saber reconocer en éste aquellos factores que puedan atentar con-
tra el control y la manera más adecuada de organizar las actividades impli-
cadas para que aquél sea el máximo posible.
Por lo que se refiere a la verificabilidad intersubjetiva el investigador debe
tomar serias precauciones; es necesario, en primer lugar, partir de la acepta-
ción de determinadas definiciones operativas, cuyo lenguaje sea lo suficien-
temente preciso e inequívoco como para lograr el acuerdo inicial en lo que
se debe entender por tales conceptos, y utilizar instrumentos que sean la tra-
ducción de aquéllos; o bien, construir la propia definición y elaborar el pro-
pio instrumento; en segundo lugar deben especificarse con claridad las carac-
terísticas relevantes de los sujetos de la muestra en todo cuanto puede
suponer influencia en los resultados; y, por último, identificar y especificar
todo el conjunto de circunstancias, tanto temporales como locales y de situa-
ción, en que se alcanzan los resultados. Con todo, y al margen del marco en
que ahora no estamos moviendo, no debería olvidar el investigador que

«La afirmación o supuesto de que efectivamente se cumple esa relación legal


entre los observables (los datos) y los inobservables (el constructo) es, natural-
mente, una hipótesis, aunque por cierta misteriosa razón, suele decirse que es una
definición operativa u operacional.»96

En consecuencia, tal relación, como cualquier tipo de hipótesis, debería


intentar fundamentarse y probarse de algún modo, con lo que evitaría o al
menos se suavizaría una de las objeciones que se hacen al operacionalismo,
cual es la que da lugar a una multiplicidad de conceptos, tantos como ins-
trumentos para medir un mismo fenómeno.
Desde otra perspectiva, y para concluir, conviene hacer expresa referen-
cia a los problemas éticos que limitan la experimentación con sujetos
humanos, a los que se refieren Buyse y Mialaret entre otros97.

96
Vid. BUNGE, M., o. c., p. 737.
97
Para una visión general de los problemas morales de ciertas profesiones, puede consultarse PEI-
NADOR, A. (1969). Moral profesional, Madrid: BAC, especialmente su capítulo X.
Vid. BUYSE, R. (1947). Idea de un curso de Pedagogía experimental. En Revista Española de Peda-
gogía, n.º 20. MIALARET, G. Teoría y práctica de la investigación en Pedagogía. En M. DEBESSE, tomo I, pp.
137-214.

101
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Los problemas aludidos, y otros de índole similar, han dado lugar a ela-
boración de Códigos éticos, como los de la American Psychological Associa-
tion o el de la American Personnel and Guidance Association98.
Algunos de estos problemas se refieren a la aplicación de estímulos y tra-
tamientos, o a la utilización de técnicas de control que pueden resultar peli-
grosos para los sujetos, o que pueden, al menos, suponerles ciertos trastornos
o esfuerzos excesivos; en cualquier caso este tipo de investigaciones requie-
ren la previa información clara y precisa de lo que se hará y de sus riesgos.
Otros problemas se plantean en torno a la licitud de invertir determina-
das sumas de dinero, además de tiempo y esfuerzo, en la mejora de los gru-
pos experimentales, relegando al abandono a aquellos que el azar ha con-
vertido en grupo de control. Probablemente la solución consista en, una vez
determinados los efectos positivos de la variable experimental, invertir los
mismos medios en los sujetos controles.
En otro orden de cosas, G. Mialaret llega a proponer que no se lleven a
cabo experimentos que se alejen mucho del marco educativo habitua1 si ello
puede suponer ciertos riesgos de traumatización de sujetos o de la clase;
recomienda que se tomen precauciones para evitar la posible desorientación
de los sujetos a consecuencia de los tratamientos experimentales.
Como vemos, pues, a los problemas técnicos de toda investigación cien-
tífica se unen en el caso humano aquellas connotaciones que derivan del
carácter específico de su objeto, el más complejo de todos, y que no solo
conducen a una dificultad notoria para llevar adelante la investigación sino
que plantean al investigador problemas o preocupaciones que debe resolver
dentro de las normas deontológicas establecidas y en el marco de una con-
ciencia recta.

RESUMEN

Una vez analizada la naturaleza de la ciencia y la problemática de los


paradigmas como punto de arranque de las propuestas metodológicas para

98
Vid. LÓPEZ CASTELLÓN, E. (1974). Bases éticas para la investigación en Psicología. En R.S., 3, 139-
166.

102
LA INVESTIGACIÓN CIENTÍFICO-EMPÍRICA EN EDUCACIÓN. EL PROCESO Y LA LÓGICA DE LA INVESTIGACIÓN CIENTÍFICA

la investigación en Educación, en el presente tema hemos abordado cuatro


grandes cuestiones:
La primera se ha centrado en las características del conocimiento cien-
tífico y su ligazón al método como realidad inseparable.
La segunda se ha dedicado al estudio de la investigación científica, su
naturaleza, su proceso y su lógica. En este gran apartado hemos analizado
la importancia de tres grandes aspectos del citado proceso: el problema,
como punto de arranque de la investigación, la necesidad de su fundamen-
tación y adecuada formulación; la hipótesis, como una conjetura conside-
rada «a priori» como verosímil y adecuada para su resolución, con las
características que deben adornarla y las consecuencias que pueden seguir-
se tanto de su incumplimiento como de la rigidez ante hechos que pudie-
ran hacer aconsejable otras vías; y el riguroso proceso de su validación, con
las precauciones a tomar en el momento de sacar conclusiones dada la fali-
bilidad de todo lo humano, incluso del riguroso procedimiento del método
científico. El apartado concluye con un detenido análisis sobre los procesos
de inferencia, generalización y replicación.
La tercera gran cuestión se ha dedicado a la consideración de las carac-
terísticas del conocimiento científico-experimental y de las posibilidades y
limitaciones que tan exigente modelo puede tener a la hora de aplicarlo a la
investigación sobre temas educativos. La posibilidad de llegar a leyes gene-
rales, de control de las variables, de medir las variables relacionadas en la
hipótesis y de contrastar los resultados por parte de otros investigadores
nos han conducido a limitar las expectativas de este tipo de conocimiento
en nuestro ámbito del saber.
Por último, tras este análisis detallado, hemos analizado las consecuen-
cias que la naturaleza de los actos y procesos educativos deben representar
para la metodología de la investigación en educación, así como los ámbitos
y aspectos susceptibles de la aplicación de la metodología objeto de estudio.

103
Tema 3
El informe y la calidad de la investigación

Introducción

1. Valor, sentido y utilidad del informe de investigación

2. Elementos de contenido del informe

3. Distinta tipología de informes

4. La difusión de una investigación

5. La calidad de la investigación

6. Criterios de calidad

105
PRESENTACIÓN

El tema tiene como objeto de aprendizaje el conocimiento, comprensión


y valoración de lo que supone el informe de investigación, concretado con
frecuencia en las publicaciones en revistas especializadas, de las investiga-
ciones llevadas a cabo, para dar respuesta a las preguntas en que suele con-
cretarse el problema de investigación.
Estos contenidos son especialmente relevantes en el marco de una de las
competencias específicas de la asignatura, la de analizar y valorar la cali-
dad de la investigación.

INTRODUCCIÓN

Una de las finalidades que se establece en el proceso de investigación es


difundir los resultados obtenidos, y conseguir que lleguen al conocimiento
de todos los interesados; lo mismo a los que hayan participado activamen-
te en el proceso de investigación, pero también a cuantos resulten afecta-
dos o implicados por el objeto del estudio. Es más, la investigación en rea-
lidad no llega a buen término, si no se redacta un informe completo con la
que difundirla. En él se recoge, además de una explicación detallada del
proceso seguido en la investigación, las aportaciones más sobresalientes
con las que vaya a contribuir el estudio al conocimiento existente.
Comenzaremos referenciando el informe. Éste pudiera resultar una
actividad mecánica a ojos del propio investigador, pues una vez satisfechas
sus expectativas y verificadas las hipótesis, el hecho de analizar los resulta-
dos completa debidamente el proceso. Comunicarlo a otros colegas, facili-
ta que puedan repetirla, para confirmar los resultados, o darle continuidad,
bien sea enriqueciendo sus aportaciones iniciales o aplicándolas en la prác-
tica profesional.

107
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Una vez hayamos determinado su importancia, analizaremos el procedi-


miento que debe seguir la redacción del informe, el cual vendrá determinado
por los destinatarios de dicho informe, las necesidades planteadas en el proce-
dimiento desarrollado, o el estilo comunicativo del propio equipo investigador.
Por último, completaremos el tema con algunas referencias de interés
que caractericen la calidad del proceso de investigación. Éste, como seña-
lábamos, es posible que pueda responder a un planteamiento puramente
mecanicista, una forma muy poco científica de trabajar, a no ser que se
cuide que todo el proceso resulte extremadamente controlado.

1. VALOR, SENTIDO Y UTILIDAD DEL INFORME DE INVESTIGACIÓN

El verdadero valor, y el sentido o utilidad del informe de una investiga-


ción viene determinado por la propia investigación, su pertinencia y el inte-
rés que en el campo socioeducativo pueda despertar, la utilidad de sus con-
clusiones, las aportaciones que pueda hacer al conocimiento que acerca del
tema se tuviera y, sobre todo, el sentido con que lo enmarque en el contex-
to de su desarrollo, el equipo de investigación.
Así, apoyándonos en el profesor García Llamas (2010, 426), podemos
establecer la función primordial del informe como: comunicar los resulta-
dos a la comunidad científica y al público interesado, procurando alcanzar la
máxima objetividad en sus planteamientos. La investigación debe estar
directamente relacionada con la realidad, pues como decimos, su sentido lo
otorga esa relación con la práctica profesional.
El informe de la investigación es el documento que refrenda dicha rela-
ción. De ahí la importancia que tiene una buena elaboración, documentán-
dolo debidamente, explicando e interpretando todo el proceso con fidelidad
y, en virtud de su desarrollo, aportando respuestas y propuestas verdadera-
mente eficaces.
Fox (1981) esquematizaba muy claramente el valor del informe, con una
triple finalidad:
— Comunicar la naturaleza del trabajo realizada con el mayor rigor, de
modo que cualquier otro investigador, en las mismas condiciones,
pueda ser capaz de repetir el experimento.

108
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

— Comunicar las características propias del resultado, dándole todo


lujo de detalles, de modo que se puedan clarificar oportunamente las
conclusiones del trabajo.
— Comunicar la visión particular del investigador, su interpretación de
los datos, así como las conclusiones y recomendaciones que nos
quiera plantear.
Al objeto que la comunidad científica cuando conoce el estudio, a través
del citado informe, sea capaz de asumirlo con el rigor propio de todo tra-
bajo científico, e integrarlo convenientemente en el corpus actual del cono-
cimiento, para con él, enriquecer el saber precedente y dar pie a futuros tra-
bajos que lo desarrollen en plenitud.
Con el informe, la investigación cierra su proceso. Hemos de señalar que
no existe un modelo único, generalizado, de informe. El contenido, como
venimos resaltando, lo condicionan las circunstancias que motivan la inves-
tigación, al igual que el proceso de desarrollo. Lo interesante es el produc-
to final, que responde al triple planteamiento comunicativo que acabamos
de ver. Pero en lo formal, la diversidad es muy amplia. Weis (1991) identi-
ficaba siete posibles enfoques que es posible dar al informe: (1) investiga-
ción básica (enfoque impulsado por el conocimiento), (2) centrado en la
resolución de problemas, (3) interactivo (relacionando al investigador con
el pedagogo que ha de poner en práctica sus ideas), (4) ilustrado (funda-
mento del pensamiento que dirigirá todo el proceso), (5) político (con la
intención de legitimar el estudio), (6) táctico (el que se plantea con una
clara intención de estimular su posterior continuidad) y (7) el que tiene una
intención formativa del propio equipo de investigación. Cualquiera de ellos
debe resultar como mínimo práctico, denotar utilidad y efectividad en la
comunidad a la que se destina, contribuyendo de forma decisiva a aumen-
tar el caudal de conocimientos (teóricos y prácticos) que acerca del tema se
tiene en ese momento.
Por último, nos gustaría hacer hincapié en el estilo que debe caracteri-
zar la redacción del informe. Kerlinger (1985) decía al respecto que «no es
función del investigador convencer al lector, sino informarle de la forma
más precisa y clara posible sobre lo que hizo, por qué lo hizo, los resulta-
dos del trabajo y sus conclusiones». Al lector es a quien le queda la función
valorativa, y tiene la capacidad de juzgarlo, enjuiciando desde su utilidad
hasta la importancia de su contribución. El investigador ha de mantener,

109
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

en este sentido, una posición netamente descriptiva, aséptica, carente de


subjetividad, y en resumidas cuentas, con un contenido que resalte las siete
características que identifican la cientificidad de cualquier estudio que se
precie: objetiva, precisa, verificable, explicativa, empírica, lógica y condi-
cional (McMillan y Schumacher, 2005, 13).

2. ELEMENTOS DE CONTENIDO DEL INFORME

Independiente de la modalidad que presente el informe o del destino


que le pueda deparar, como vehículo de comunicación que es, éste ha de
dar cuenta del proceso de investigación, de los resultados y de las implica-
ciones que puedan establecerse en el devenir futuro del conocimiento. De
un modo general, podemos organizarlo en estos cuatro apartados:
Identificación. Al ser un documento a disposición de cuantos muestren
interés por conocer la investigación desarrollada, lo más lógico es que el
informe se abra con unas primeras páginas que lo identifiquen convenien-
temente, y faciliten el acceso a su contenido. Así habrá que asegurarse que
aparezcan claramente:
a) Título: Una frase que comunique debidamente del objeto de la inves-
tigación. Este ha de ser breve, si es posible, y descriptivo, de modo
que permita al lector identificar debidamente la naturaleza y el alcan-
ce de la investigación. Pero completo. Quien lo lea ha de captar per-
fectamente el alcance de su trabajo, y la determinación de su des-
arrollo. Debe acompañarlo, lógicamente, la identificación de los
autores, y el contexto académico donde trabajan, para facilitar el con-
tacto a quienes llegue a interesar. Una nota a pie de página puede, en
ocasiones, completar esa información académica.
b) Resumen: Un texto breve, diez o doce líneas, que aporte una idea
general del trabajo. Habrá de contener, en un tono expresivo, la hipó-
tesis, el método, la muestra, su instrumentalización y los procedi-
mientos seguidos para la recogida y el tratamiento de los datos, ade-
más de una descripción breve de los resultados y de su interpretación.
No pueden faltar las conclusiones más importantes a las que llega el
estudio.

110
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

c) Palabras clave: Su objetivo es facilitar la localización de la investiga-


ción en cualquier índice donde se realice una búsqueda. Por eso, han
de ser palabras e ideas que identifiquen claramente la naturaleza de
su contenido.
Aunque todo el contenido de la investigación se presente luego en espa-
ñol, es necesario que estos dos últimos datos, resumen y palabras clave, se
traduzcan además en lengua inglesa (identificados como abstract y key-
words, respectivamente), dada la generalización que alcanza esta lengua en
el mundo científico.
La presentación, según los casos y la voluntad de los autores, se completa
con unas líneas que recojan los agradecimientos que deseen manifestar éstos, a
quienes, personas o entidades, hayan facilitado el desarrollo de la investigación.
Por último, según la extensión y el alcance del trabajo, a continuación,
estas páginas preliminares, de presentación, conviene que se cierren con un
índice del contenido que el lector se vaya a encontrar a continuación. El
índice ha de secuenciar muy bien toda la extensión del trabajo, pero de un
modo organizado, para lo cual, se irán numerando sus diferentes partes
(únicamente con números arábigos, separados por puntos a medida que se
les vaya dando entrada), y que, así se categorice debidamente la informa-
ción (en apartados y subapartados sucesivos). Cada apartado ha de acom-
pañarse por la referencia al número de página que corresponda, para faci-
litar la búsqueda directa de su contenido.
Ahora, tras los prolegómenos propios de la presentación, pasaremos
directamente al contenido del trabajo, pues es el objetivo principal de este
informe. Al menos, otros tres han de ser los apartados que focalicen la aten-
ción del investigador en el momento de su desarrollo:
Marco conceptual: Pretende familiarizar al lector con el problema que
aborda el estudio, y el contexto donde se ha motivado. Igualmente, tienen
gran relevancia la(s) hipótesis planteada(s), pues en torno a ellas girará
todo el proceso que venga a continuación.
Se inicia el informe introduciendo su contenido y una referencia espe-
cífica a las aportaciones existentes de otros trabajos que lo hayan precedi-
do para, a continuación establecer las bases teóricas que sustentarán el tra-
bajo. Se presentan en este marco, los siguientes apartados:

111
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

a) Introducción: es una justificación previa de lo que se pretende inves-


tigar. En ella, lo fundamental es informar de la relevancia teórica y
práctica del tema elegido, así como de su oportunidad. De este modo
se perfila a grandes rasgos, el campo a investigar.
b) Objetivos de la investigación. Una vez tengamos debidamente jus-
tificado el tema de estudio, será necesario precisar los límites y
pretensiones del mismo, y el alcance que se espera del trabajo que
se presenta. Deben expresarse como proposiciones orientadas a
definir los logros que se esperan obtener a partir de los resultados
que arroje la investigación. Cada una de estas proposiciones la
constituyen: el verbo (siempre en infinitivo), la(s) variables, la(s)
relaciones y el contexto. Por tanto, los objetivos deben proyectar lo
que se espera obtener al estudiar cada variable (cuando no se esta-
blezca una relación bivariada), o lo que se espera al estudiar la
relación de dos o más variables. Igualmente, podemos tener en
cuenta la posibilidad de desglosar un objetivo general en varios
específicos, para completar debidamente la meta que se pretende
con el estudio.
c) Planteamiento teórico. Se trata de hacer una revisión de las aporta-
ciones previas que existen, estableciendo cuál es la línea de relación
del problema de estudio con el campo de conocimientos que se tienen
al respecto. Igualmente, los principales conceptos que se vayan a
emplear durante el estudio deberán quedar aquí definidos y acotados
teóricamente.
Resultará, por tanto, necesario, referenciar los antecedentes que se
conocen del tema que se investiga y el estado actual de la cuestión.
Además, se señalarán los resultados de investigaciones precedentes,
los criterios establecidos por los diferentes autores que lo hayan tra-
bajado, el tratamiento que se le haya podido dar al tema en diferentes
contextos, y en general, todo lo que hasta este momento pudiera
haber contribuido a conformar el planteamiento que se tenga del
tema a estudiar. Incluso, resulta oportuno, matizar las diferencias que
nuestro estudio vaya a establecer con otros de similares característi-
cas, bien por marcar una línea de desarrollo diferente, o por buscar
una nueva interpretación del tema.

112
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

d) Hipótesis. Tras la revisión de las aportaciones previas, debe ya con-


cretarse el marco teórico de la investigación, proponiendo las hipóte-
sis de solución al problema, que deberán ser confirmadas o rechaza-
das mediante esta investigación. Al respecto, conviene tener en
cuenta las indicaciones dadas en la materia de estadística (Pérez y
otros, 2009, 23-29), pues las hipótesis han de recoger, de forma ope-
rativa y concisa, qué pretende probar el investigador, tanto en su defi-
nición sustantiva, como estadística, cuando ello sea posible, de modo
que esté debidamente fundamentadas y que sean contrastables (es
decir, que puedan ser sometidas a comproblación empírica a lo largo
del estudio).
Con todo, se construye la base del proceso investigador, dotándolo de
fundamentos y planteando su visión de futuro, la cual, ocupará nuestro
próximo apartado.
Marco metodológico. Este va a ser el apartado más práctico de la investi-
gación. Su objetivo es describir convenientemente el estudio realizado, la
metodología seguida, y hacerlo con detalle de modo que pueda replicarse.
Para que resulte veraz, y adecuado, debe aportar, al menos, los siguientes
elementos referenciales:
a) Las variables: La explicación del proceso de investigación comienza
por identificarlas con claridad, pues en torno a ellas, girará todo este
marco. Es necesario identificar las diferentes variables que intervie-
nen en el trabajo, su categorización y las relaciones que se pretende
probar entre las mismas.
Habrán de ser definidas operativamente, para que el lector sepa con
exactitud cómo van a ser evaluadas. Será necesario por tanto, preci-
sar tanto la naturaleza que tengan, como su función en la investiga-
ción, el sistema de control establecido, y por supuesto, el instrumen-
to y la escala de medida aplicada para cada una de ellas (al respecto,
recuérdese lo ya estudiado en la materia de estadística (Pérez y otros,
2009, 29-40)).
Como veremos en el estudio de los diseños cuantitativos, será impor-
tante determinar el control que se vaya a aplicar sobre las variables
extrañas que puedan contaminar nuestra investigación, evitando
cualquier sesgo que pueda dar al traste con todo el estudio. Al res-

113
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

pecto, el informe, describirá detalladamente el proceso de control


ejercido sobre estas variables.
b) El método. Para justificar la confirmación o rechazo de las hipótesis,
se seguirá necesariamente una metodología de trabajo (descriptiva,
experimental, ex-post-facto,…), la cual fundamenta el diseño especí-
fico de la investigación. Será necesario explicitarlo, detalladamente,
en este apartado (las próximas unidades se centrarán en el estudio
detallado de los procedimientos que siguen los diferentes diseños de
la investigación).
c) La muestra. Tomando como referencia la población respecto a la cual
se pretende generalizar el estudio, será necesario garantizar debida-
mente tanto el tamaño de la muestra (que sea adecuado para el estu-
dio), como su representatividad.
Para ello, se dará primero una visión general de la población en su con-
junto (y sus características descriptivas), para luego, explicar detallada-
mente, el sistema de muestreo (los criterios y el procedimiento) que se
siga en la selección de los sujetos que van a participar directamente en
la investigación. En la materia de «Estadística» (Pérez y otros, 2009,
217-222), se estudió todo lo relacionado con el muestreo.
e) La recogida de datos. Este es uno de los momentos clave del proceso
investigador, por lo que el rigor y la metodicidad, deben caracterizar
el procedimiento y garantizar los resultados. Dos aspectos habrá que
tomar en consideración al respecto:
e.1: Las técnicas y los instrumentos empleados en la recogida de datos.
Podemos servirnos de instrumentos ya existentes, en cuyo caso deben
explicarse los criterios en los que basamos su idoneidad y por tanto
su elección, como de otros de elaboración propia, creados a medida
(ad hoc), para los que habrá que reflejar con precisión todo el proce-
so seguido en su elaboración y los procedimientos por los que se han
determinado sus características técnicas, de fiabilidad y validez. En
este caso, además, conviene recogerlo(s) íntegramente, en un anexo
del informe.
e.2: El proceso de recogida de los datos. Expresando con claridad el
nivel de participación e implicación personal del investigador en el

114
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

grupo, el control de sesgos, el modo en que se ha realizado la toma de


contacto con los participantes y su recogida de información, así como
el rol desempeñado por el investigador y por los demás agentes impli-
cados.
Se describe de este modo tanto el proceso (temporalización, agentes,
recursos y estilos) como los procedimientos utilizados para aplicar los ins-
trumentos a la muestra seleccionada. Además será necesario señalar el
nivel de respuestas obtenido y los problemas detectados a lo largo de todo
el proceso.
En algunos casos (como puede ser la investigación cualitativa), el estu-
dio no puede realizarse de manera intuitiva, por lo que se recurre a técni-
cas que aseguren la fiabilidad de los resultados (por ejemplo mediante a
triangulación de resultados, contrastando los obtenidos por diferentes pro-
cedimientos, buscando sus puntos coincidentes). La clave de un buen infor-
me, radicará en la explicitación adecuada de todo el proceso de investiga-
ción, y en la claridad de los detalles que faciliten a otros investigadores la
posibilidad de replicar el proceso.
Junto a los datos (que pueden recogerse en un anexo del informe), se
acompaña la estrategia estadística que se haya seguido, y las pruebas apli-
cadas en el análisis de los mismos. Habrá de tenerse en cuenta que los datos
recogidos deben ser oportunamente analizados, reflejando si dan respues-
ta a los interrogantes planteados inicialmente y si se estima que nos permi-
tirán contrastar empíricamente la consistencia de las hipótesis formuladas
(para aceptarlas o rechazarlas). También deben señalarse los niveles de sig-
nificación (margen de error) que presenten y los niveles de confianza con
los que se van a tomar decisiones en adelante.
Para concluir el apartado metodológico, de acuerdo con el diseño desa-
rrollado, habrá que enjuiciar, con sentido crítico la propia investigación,
determinando la validez (interna y externa) de los resultados obtenidos, las
probabilidades de acierto establecidas y la pertinencia del tratamiento esta-
dístico aplicado a los datos (incluso valorándolas en referencia a otras posi-
bilidades alternativas).
Resultados. Se concluye el trabajo señalando las aportaciones que el inves-
tigador puede dar al estudio, a la luz de la información que aportan los
datos manejados y elaborando con criterios de cientificidad garantizada,

115
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

sus conclusiones. Cuatro, consideramos que pueden ser los apartados en


los que se organice esta información de los resultados:
a) Análisis de los resultados. Se trata de comprobar la validez de las hipó-
tesis, para la muestra seleccionada, determinando si se han satisfe-
cho, y en qué medida, los objetivos previstos por la investigación.
Para ellos, tomaremos como justificación de los hechos, los datos
obtenidos en el análisis empírico anterior.
Es importante presentarlo de modo sistemático, manteniendo ade-
más, una línea de coherencia y continuidad, en la descripción de todo
el proceso.

b) Conclusiones. Con ellas, se supone que se completa todo el proceso de


investigación, pues deben reflejar sus aportaciones al conocimiento
del tema abordado.

Pero las conclusiones han de ser discutidas, por el propio investiga-


dor. Se trata de dar una buena interpretación de los resultados, valo-
rando éstos a la luz de los datos obtenidos y determinando la impli-
cación de los mismos de cara a la verificación de las hipótesis.

Según la finalidad del estudio y los destinatarios del informe, habrá


que acomodar su redacción a los aspectos en los que primará bien
la proyección del estudio en la práctica educativa, o las cuestiones
metodológicas que pueda conllevar. De cualquier modo, se redacta-
rán de forma categórica, si es preciso, acompañando los datos que
las confirman, pero también de modo claro y preciso, para que
resulten muy explícitas. Su contenido debe estar organizado cuida-
dosamente y escrito de forma concisa. Un informe bien organizado
incluye el desarrollo lógico de las ideas y conduce a unas conclu-
siones también lógicas. Por tanto, le exigiremos sistematicidad al
igual que al propio proceso de investigación que, con fidelidad, se
pretende reflejar.
c) Implicaciones. El investigador, a la luz de las conclusiones expues-
tas en el apartado anterior, podrá señalar cuantas recomendaciones
estime oportunas, y las líneas de desarrollo futuro que pueda esti-
mar que tenga el tema investigado. La investigación nunca para,
siempre continúa y evoluciona, por eso es necesario marcar este

116
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

carácter dinámico en todo cono- Contenido del informe


cimiento obtenido, dejándolo de la Investigación
explícitamente reflejado en el
informe. Identificación
Título
d) Limitaciones. Honradamente, con Resumen (Abstract)
sencillez y humildad científica, Palabras Clave (Keywords)
será necesario reconocer las limi- Agradecimientos
Índice
taciones que pueda tener la
investigación desarrollada, tanto Marco Conceptual
en sus planteamientos técnicos, lo Introducción
mismo que en la extrapolación de Objetivos
sus conclusiones. Igualmente, Planteamiento teórico
podrán establecerse sugerencias Hipótesis
precisas para las personas que se
Marco Metodológico
aproximen al estudio con interés y Variables
curiosidad científica. Estas, evi- Método
dentemente, plantearán aquellas Muestra
cuestiones que futuros trabajos de Recogida de datos
investigación podrán desarrollar o
Resultados
completar, por no alcanzar a
Análisis de los resultados
todas ellas el estudio presentado. Conclusiones
Implicaciones
Y a tenor de lo expuesto, el infor-
Limitaciones
me habrá de completarse con dos ele-
mentos de contenido no menos Bibliografía
importantes y necesarios que los pre- Anexos
cedentes:

Bibliografía citada en el informe, que referencie debidamente las


citas aportadas, según la normativa vigente, y

Anexos, donde se incluyen los originales de toda la información con-


siderada necesaria para facilitar o ayudar a una mejor comprensión
del trabajo (materiales, estadísticas, instrumentos, documentos bási-
cos, análisis de datos, etc.), así como los documentos originales que
hayan contribuido al desarrollo del estudio.

Por último, hemos de señalar que básicamente, todo informe de una


investigación reflejará los apartados aquí reseñados, matizando que las

117
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

características propias de algunos diseños de investigación, podrán deter-


minar que algunos contenidos se modifiquen, en virtud de su particulari-
dad. Tengamos presente que el objetivo de todo informe es reflejar fiel-
mente el proceso de una investigación, por lo que no puede tener un
carácter cerrado. Más bien, al contrario, ha de enriquecerse con cuanta
información, organizada y debidamente estructurada, pueda contribuir a
un mejor conocimiento del estudio realizado.

3. DISTINTA TIPOLOGÍA DE INFORMES

La forma de presentar el diseño de la investigación determinará, en gran


medida, el contenido que desarrolle el informe. Básicamente, tres son los
tipos de diseño que nos vamos a encontrar en el campo de la educación:
cuantitativa, cualitativa y evaluativa. El informe en cada caso, responderá
a los contenidos que acabamos de señalar en el apartado anterior, si bien
ofrecerá algunos matices que lo particularicen. Así, siguiendo el esquema
anterior, podemos señalar:
La investigación cuantitativa, requiere plantear con gran intensidad el
marco metodológico, pues su contenido corresponde a los aspectos de
mayor interés en el proceso de investigación. Igualmente, los resultados se
verán afectados por ese interés metodológico de su proceso. Destacamos
en este tipo de investigación la cientificidad de su carácter, la importancia
que tiene en ella su valoración crítica, la determinación de la validez del
diseño y el tratamiento estadístico aplicado a sus datos.
La investigación cualitativa, nos permite establecer mayor distancia del
fundamento numérico de los procesos, para intensificar los contenidos
propios del marco teórico, y la interpretación de resultados, punto fuer-
te del proceso, eminentemente reflexivo. También la documentación del
proceso investigador, cobrará gran importancia en este caso será muy
importante reforzar el análisis crítico mediante la triangulación del
estudio, en distintas aplicaciones.
La investigación evaluativa se centrará mucho más en el proceso meto-
dológico, de manera especial en la instrumentación y la técnica de aná-
lisis de los datos, la cual determinará fuertemente la toma de decisiones
final, objetivo básico del proceso.

118
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

4. LA DIFUSIÓN DE UNA INVESTIGACIÓN

Como ya hemos señalado, la principal función que desempeña el infor-


me, es comunicar los resultados de una investigación, a la comunidad cien-
tífica, interesada por ampliar el espectro de conocimiento del tema procu-
rando ofrecer la máxima objetividad en sus planteamientos. Por ello,
insistimos tanto en la conveniencia de que el informe resulte sencillo, claro
y bien preciso en cuanto al contenido que ofrece, además de bien completo,
de modo que se facilite a cualquier otro investigador que lo desee, la posibi-
lidad de repetirlo y con ello constatar que obtiene resultados comparables.
En cuanto a su difusión, en la comunidad científica, existen diferentes
alternativas. Cada contexto requiere un estilo de presentación diferente.
Así, publicar el informe en una revista o en un boletín científico, es muy
diferente a plantearlo como un recurso formativo que permita orientar la
práctica futura y la lectura del público en general. Se trata, de alguna
forma, de dejar constancia de cómo el objetivo del informe determina el
proceso de su elaboración.
No obstante, el objetivo de su difusión ha de ser hacerlo de un modo ágil
y preciso a la vez, explicando debidamente los logros y los procesos seguidos
en su desarrollo. Ha de presentar un enfoque más científico que divulgativo,
lo que supone darle un cierto rigor al tratamiento de la información, justifi-
cando todos los pasos que se siguen en el proceso investigador, y reflejando
oportunamente las dificultades y orientaciones que se hayan tomado en con-
sideración, para facilitar el camino que ha llevado al objetivo del estudio.
En cuanto a la forma de llegar a la comunidad científica, los más emplea-
dos en la actualidad son los siguientes:
a) La presentación oral. Es el recurso más usado, para presentar los resulta-
dos del trabajo de investigación, en algún foro científico (congreso, semi-
nario, jornadas…). Requiere la presencialidad de alguno de los investi-
gadores, quien ha de exponer el informe imprimiendo mayor énfasis en
los contenidos o procesos que mayor interés se tiene en difundir, y des-
tacando los logros del trabajo. Generalmente se utilizan medios técnicos,
audiovisuales e informáticos de apoyo, para dar un soporte más dinámi-
co a la exposición. El acto se completa generalmente, con preguntas que
plantea el público acerca del contenido de la investigación.

119
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

b) La comunicación escrita. Su difusión es grande, pues se aprovecha el


alcance que hoy día tienen los medios impresos (libros, revistas, bole-
tines, actas, etc.), sobre todo si se trata de publicaciones periódicas,
para llegar al público general (incluso trascendiendo el contexto aca-
démico). Con frecuencia, se hace uso del abstract de los trabajos para
facilitar al público interesado, una primera aproximación al tema,
que luego se podrá completar y matizar con mayor detalle, si la lec-
tura del contenido del informe ha despertado su interés.
c) Centros de Investigación. Se trata de instituciones que se constituyen
en unidades de apoyo a la investigación, para lo cual, recopilan el
mayor número de datos y regímenes sobre los estudios desarrollados
en diversas áreas o campos de conocimiento, para luego elaborar
sumarios y boletines que facilitan su difusión. Ofrecen un apoyo muy
valioso a la investigación y facilitan la difusión de todos los conteni-
dos aportados por los trabajos que recopilan.
d) Redes de información. Muy conocidas por la relación interactiva que
facilita el internet; cuentan con su proyección también en el mundo
académico, para facilitar la difusión de los estudios y sus resultados.
Además, las distintas redes han desarrollado ya un tupido entramado
que les ha permitido establecer relaciones múltiples, más allá del
campo de conocimiento específico, lo que ha supuesto un notable
enriquecimiento del saber.
Con todo, el único beneficiario es el propio conocimiento, que día a día
se engrosa con las aportaciones que la investigación científica va haciendo.

5. LA CALIDAD DE LA INVESTIGACIÓN

Cuando hablamos de calidad de la investigación, nos estamos refirien-


do a la que pueda devengar la pureza que presente la aplicación del méto-
do que hayan empleado los investigadores para obtener sus resultados, de
modo que se garantice la ecuanimidad de los resultados.
Entendemos que se debe superar la concepción de una calidad referida
a estándares y mediciones, que fomentan la simplificación y la funcionali-
dad elemental de los estudios. Ha de ser interpretada como la búsqueda

120
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

permanente de condiciones de excelencia para alcanzar de modo sistemáti-


co y operativo, el logro de los objetivos propuestos.
Así pues, se promueve ese criterio de calidad en la investigación, cuando:
• se garantizan los resultados en el producto final de la misma, y además,
• se asegura la adecuación del proceso desarrollado.
Hagamos la salvedad que no se trata de determinar la calidad de la
investigación, sino de valorar que métodos e instrumentos concurran a
mejorar la calidad de los resultados. La propia investigación también es
susceptible de ser evaluada, lo cual se realiza sometiéndola a la revisión de
los expertos (pares) en los campos específicos de cada área científica.
Se trata de un control que los investigadores aplican de forma volunta-
ria, y lo deben reflejar en el informe de la investigación, pues con ella su
rigor será la mejor garantía de la sistematicidad que debe ofrecer el proce-
so investigador.
Alonso (2005a), establece los siguientes beneficios, esperados de un
buen control de la calidad, en todo proceso de investigación:
a) Proporcionar un marco general de acción para la investigación
ganando tiempo para la creatividad: la creatividad es, de hecho, una
de las características más propias y destacadas de la investigación (no
en vano, ocupa aproximadamente el 20% de su desarrollo).
b) Ofrecer garantías y dar confianza, a quienes utilizan el conocimiento
generado.
c) Responder mejor a las demandas de socios y destinatarios de la inves-
tigación. Las herramientas de calidad pueden diseñarse para tener
más específicamente en cuenta esas demandas y, así, satisfacerlas. De
esta forma, a través del empleo de buenas prácticas y de la solidez de
los métodos empleados se puede conseguir finalmente una mejor
calidad de los resultados obtenidos.
d) Mejorar la eficacia económica en un entorno de competencia. La
obtención de recursos económicos para realizar nuevos proyectos o
líneas de investigación se produce en una situación de cada vez
mayor concurrencia competitiva.

121
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

e) Capitalizar los resultados y mejorar la gestión del conocimiento. Porque


si no está correctamente gestionado el conocimiento científico del grupo
de investigación, mediante sistemas documentales eficaces, éste no se
capitaliza ni deviene permanente en otros grupos de investigación.
f) Mejorar la competitividad científica. Si las buenas prácticas de inves-
tigación ayudan a seleccionar los métodos más adecuados, contribu-
yen a gestionar mejor los equipos y los recursos científicos y permiten
obtener una fiabilidad mayor de los resultados. Todo contribuirá de
forma global a disminuir los riesgos.
g) Producir información y conocimiento científicos fiables. Sólo a par-
tir de conocimientos científicos de los que se pueda asegurar su fia-
bilidad (que se obtiene con mayor facilidad a partir de la puesta en
marcha efectiva de herramientas de gestión de calidad en investiga-
ción), se pueden establecer debates constructivos entre científicos y
ciudadanos.
h) Facilitar el trabajo en red, los intercambios y el diálogo entre grupos
de. En la actualidad una gran parte de las actividades de investiga-
ción se organiza mediante proyectos realizados en red en el que par-
ticipan investigadores de distintas instituciones que movilizan com-
petencias y utilizan recursos complementarios. Trabajar en red
supone que se respeten las mismas prácticas y métodos de investiga-
ción, hablando para ello un mismo lenguaje, proveniente de la utili-
zación de herramientas de calidad comunes, el diálogo y los inter-
cambios de información se ven facilitados.
Así, se consigue utilizar los recursos investigadores de un modo más
rentable y eficaz, siguiendo procedimientos conocidos, respetados y reali-
zados por todos.

6. CRITERIOS DE CALIDAD

Determinar unos criterios de calidad en el proceso de investigación,


otorgará funcionalidad al mismo, y favorecerá la reflexión del equipo inves-
tigador. Adaptando el planteamiento que desarrollara Alonso (2005b) pode-
mos concretar los siguientes criterios:

122
EL INFORME Y LA CALIDAD DE LA INVESTIGACIÓN

a) Criterios de Calidad referidos a los objetivos iniciales. Se tratará de


valorar la «trazabilidad», un término que la RAE define como la
«posibilidad de identificar el origen y las diferentes etapas de un pro-
ceso de producción y distribución de bienes de consumo», de los tra-
bajos preparatorios de la investigación. Así pues, habrá que valorar la
definición de objetivos, y la aplicación que se haga de la metodología
general diseñada. En su evaluación, el referido autor nos propone
identificar los criterios, disposiciones y herramientas siguientes:

Criterios Disposiciones Herramientas

Pertinencia y novedad Evaluar los objetivos de acuerdo Revisiones bibliográficas


a los conocimientos actuales Contactos y referencias
académicas
Utilización de redes de
expertos

Factibilidad Evaluar los recursos necesarios Planificación detallada del


Analizar los riesgos asociados a Proyecto
la investigación

b) Criterios de Calidad referidos a los procesos. En esta fase de realización


de la investigación y en aplicación de la metodología general que se
ha indicado, podrían identificarse, entre otros, los criterios, disposi-
ciones y herramientas siguientes:

Criterios Disposiciones Herramientas

Transparencia Asegurar la trazabilidad de los Descripción detallada del


resultados procedimiento de trabajo
Informes de las diferentes fases de
su desarrollo
Validación de instrumentos
empleados.

Sistematización de Asegurar la trazabilidad de los Descripción de los criterios que


sus fases de procedimientos determinan el procedimiento de
desarrollo recogida y tratamiento de datos.
Revisiones periódicas
Puesta en marcha de acciones
correctivas y preventivas

123
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

c) Criterios de Calidad referidos a los resultados. En esta fase de valora-


ción de los resultados, y en aplicación de la metodología general que
se ha indicado, podrían identificarse, entre otros, los criterios, dispo-
siciones y herramientas siguientes:

Criterios Disposiciones Herramientas

Explotación de los Transferir los resultados Proceso de difusión académica


resultados Patentes y cesiones de licencias
Contrataciones

Maximizar el Determinar al público Envío de artículos a Revistas de


impacto científico concernido e identificar los alto factor de impacto (SCI)
de los trabajos mejores vectores de Planificación de comunicación en
comunicación medios de comunicación
Difusión

Terminamos refrendando la importancia que tiene para cualquier Proyec-


to de Investigación, elaborar un buen informe. Por costoso, laborioso e inte-
resante para la ciencia, el trabajo aplicado para llevar a efecto un Proyecto de
Investigación, merece dignificarse con un buen informe, analítico, objetivo,
que transmita seriedad y rigor, sin dejar ninguna duda de su contrastabilidad,
por haber controlado metódicamente la calidad del contenido, y del proceso
y, sobre todo, accesible, a la comunidad científica interesada en el tema.

RESUMEN

El informe, y su difusión, es el elemento final que cierra el proceso de la


investigación. Por ello, precisamente, es importante realizarlo de forma
adecuada, para que pase a contribuir, a partir de ese momento, el conoci-
miento científico que del tema se tiene. En él abordamos dos aspectos
importantes al respecto: el contenido del informe y su calidad. Uno y otro,
fundamentarán debidamente esta fase última de la investigación, la cual,
careciendo de un modelo referencial único, pues los procesos difieren gran-
demente de unas investigaciones a otras, el equipo responsable habrá de
cuidar siempre que se completen con esmero, resaltando el rigor y la sis-
tematicidad del proceso investigador, y ofreciendo la garantía de haberlo
seguido con total garantía de control y calidad.

124
UNIDAD DIDÁCTICA II

Tema 4. DISEÑO DE LA INVESTIGACIÓN.


PROBLEMAS EDUCATIVOS Y DISEÑOS.
TIPOS DE DISEÑOS: NO EXPERIMENTALES,
CUASI-EXPERIMENTALES Y EXPERIMENTALES.

Tema 5. EL EXPERIMENTO COMO REFERENCIA.


VALIDEZ DE LOS DISEÑOS.
LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA.

Tema 6. PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS.


DISEÑOS FACTORIALES Y DE CUADRADO LATINO.
DISEÑO DE COVARIANZA.

Tema 7. ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS.

Tema 8. ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS.

Tema 9. LAS PRUEBAS PARÁMETRICAS Y SU USO EN LOS DIFERENTES


DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F
DE FISHER.

Tema 10. ALGUNAS PRUEBAS NO PARÁMETRICAS: SIGNOS χ2, T, U.

Tema 11. LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS.


Tema 4
Diseño de la investigación. Problemas educativos
y diseños. Tipos de diseños: no experimentales,
cuasi-experimentales y experimentales

Presentación

1. Introducción

2. El diseño de investigación
2.1. Concepto
2.2.1. Responder a las preguntas del problema de investigación
2.2.2. Controlar la varianza
2.2. Objetivos
2.3. Tipos
2.3.1. Diseños pre-experimentales
2.3.2. Diseños experimentales
2.3.3. Diseños cuasiexperimentales

3. Criterios para seleccionar el diseño


3.1. Responder a las preguntas de la investigación
3.2. Controlar la varianza
3.3. Grado de generalización

4. Problemas educativos y diseños

5. El diseño experimental

Resumen

127
PRESENTACIÓN

Toda investigación arranca de un problema, esto es, de una realidad para


la que no tenemos una respuesta convincente o satisfactoria. Ante el mismo,
el investigador se plantea la forma de resolverlo, y hacerlo de un modo correc-
to y eficaz, tarea en la que encuentra en el diseño la solución adecuada.
Por ello, el objeto central del presente tema es el análisis de la vinculación del
problema a investigar con el diseño de investigación como medio para afrontar
su resolución, para dar respuesta a las preguntas en que aquel se concrete.
A los efectos pertinentes, se aconseja que la formulación del problema
se lleve a cabo en forma de preguntas, cuanto más claras y precisas, mejor.
Por tanto, la elección del diseño deberá atender a las exigencias derivadas
de la naturaleza de las preguntas; determinadas preguntas se limitan a
constatar si se da relación entre variables; pero otras, como apreciaremos
más adelante, nos ponen ante metas más ambiciosas, tales como establecer
si la relación es causal, esto es: si la variable independiente es la causa de
los efectos apreciados en la variable dependiente. Obviamente, las exigen-
cias en este caso son mayores y se concretan en un término clave en inves-
tigación cuantitativa: el de control, control de las variables extrañas que, de
no ser controladas, pueden conducir a invalidar el diseño y, en consecuen-
cia, a no poder responder a las preguntas del problema.
Siguiendo los planteamientos de Kerlinger, debemos analizar no sólo la
naturaleza de las preguntas en que se concreta el problema, sino esa idea
del control, que, además de referirse a las posibles variables extrañas, tiene
en la varianza un componente fundamental cuando de investigación cuan-
titativa se trata.
La varianza, medida de dispersión o variabilidad, es la expresión de la
incidencia de una variable —o de la falta de la misma— sobre otra. Cuan-

129
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

do tal influjo se da, apreciaremos dispersión en mayor o menor grado;


cuando no se produce, la dispersión es nula o despreciable en términos
estadísticos. La asignación de tal dispersión a un origen concreto, en nues-
tro caso a la variable independiente, será objeto del diseño y de nuestra
atención.
Como toda investigación no es sino un proceder riguroso, metódico y
sistemático destinado a dar respuesta a las preguntas en que se concreta el
problema de investigación, la calidad de un diseño vendrá relacionada,
entre otros aspectos, por su adecuación a la naturaleza de tales preguntas.
Dado que la investigación según el enfoque positivista tiene como
meta el establecimiento de relaciones causales entre las variables del dise-
ño —antecedentes o independientes y consecuentes o dependientes—
someteremos a análisis y valoración los tres grandes tipos de diseños exis-
tentes: pre, cuasi y experimentales.

1. INTRODUCCIÓN

Los saberes que adquirimos pueden ser clasificados de diversas formas;


una de ellas se refiere al tipo de conocimientos de que se trate. Así, la mayo-
ría de los conocimientos a adquirir tienen que ver con el saber disponible,
más o menos elaborado, organizado y estructurado.
Pero otros saberes, y este es el caso de la presente asignatura, tienen
como objeto no tanto lo ya conocido como el procedimiento para aumen-
tar, corregir o descubrir nuevos saberes.
El ser humano, a lo largo de su historia sobre la Tierra ha ido amplian-
do su acervo de conocimientos y lo ha hecho aplicando diversos procedi-
mientos, desde su observación de la realidad circundante o la acumulación
de experiencias fruto de su vivir diario a aquellas otras perseguidas y hasta
provocadas como consecuencia de su natural curiosidad y tendencia a
indagar sobre lo desconocido.
La investigación es una de esas formas de indagar, de abrir camino, de
buscar respuestas a fenómenos para los que el ser humano no tenía una res-
puesta convincente. Cuando eso ocurría, las respuestas han ido por la vía
de la magia, de la autoridad, la superstición…

130
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

Pero el ser humano tiene, entre sus cualidades naturales, la tendencia a


que las respuestas a sus inquietudes sean convincentes, satisfagan su racio-
nalidad. En estos casos, necesita procedimientos que, al menos de entrada,
sean capaces de satisfacer a su inteligencia y razón.
A tales procedimientos se les ha dado el nombre de investigación; investiga
el juez, investiga la policía, investiga el técnico, investiga el médico…, y cada
uno de ellos lo hace sobre sus problemas específicos, pero siempre buscando
una respuesta convincente capaz de descartar otras alternativas. Encontrar tal
respuesta y descartar otras posibles requiere procedimientos rigurosos.
El contenido de esta materia se centra, precisamente, en el aprendizaje
de procedimientos rigurosos para investigar. Ahora bien, de entre tales pro-
cedimientos, el objeto de nuestra atención se concreta en aquellos que
denominamos empíricos, esto es, que acuden a datos e información dispo-
nible o elaborada al efecto para encontrar estas respuestas.
Entre tales procedimientos se encuentran algunos especialmente exi-
gentes porque pretenden alcanzar respuestas que satisfagan las mayores
cotas de la curiosidad humana: nos referimos a los procedimientos experi-
mentales, difíciles de aplicar, como veremos, en el campo de la educación.
La investigación científica es la búsqueda intencionada de conocimiento
o de soluciones a problemas de carácter científico. La investigación se
caracteriza por ser un proceso sistemático, planificado, organizado y con
pretensiones de resultados objetivos.
Es sistemático, porque responde a un plan, cuya manifestación más
rigurosa es el denominado método científico; en los planteamientos de
enfoque cuantitativo, ese método suele conocerse como hipotéti-
co–deductivo–experimental. Hipotético, porque trata de contrastar en con-
diciones exigentes, rigurosas, la conjetura —hipótesis— que, a priori,
podría ser la solución del problema.
Es planificado y organizado porque, lejos de toda improvisación u ocu-
rrencia, todo el hacer al servicio del contraste de la hipótesis responde a un
plan ordenado, un plan exigente y convincente, aunque todo ello no asegu-
re el éxito tanto por limitaciones humanas como por las del propio plan, al
margen, claro está, de aquellas que se deben a los errores o a las limitacio-
nes del propio investigador.

131
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Y pretende unos resultados objetivos, esto es, unas conclusiones que deri-
ven de los datos rigurosamente obtenidos y no de la interpretación más o
menos subjetiva, a veces forzada, para que se ajusten a ideas preconcebidas.
Pues bien, un proceso así caracterizado encuentra en el diseño de la
investigación la herramienta fundamental, precisamente por responder a
tales exigencias. Pero no debemos dejar de lado que el diseño no es algo
infalible sino una forma rigurosa de proceder en manos del investigador,
que nunca debería intentar retorcer los procedimientos para que los resul-
tados concuerden con sus planteamientos iniciales. He ahí el papel de la
deontología profesional, clave aquí como en todo hacer humano.

2. EL DISEÑO DE INVESTIGACIÓN

Entre las diferentes acepciones del término «diseño» según el Dicciona-


rio de la RAE se encuentran las de «Traza o delineación de un edificio o de
una figura. Proyecto, plan. Concepción original de un objeto u obra… Por
su parte, en el de María Moliner leemos. «Apunte. Boceto. Croquis. Esbo-
zo. Esquema».
De alguna manera, todas esas acepciones enlazan con el concepto téc-
nico de diseño aplicado a la investigación empírica en general y a la expe-
rimental en particular.

2.1. Concepto

No obstante, tal vez sea la más adecuada la de «proyecto o plan» pudien-


do servir de referencia su aplicación a la arquitectura, donde toma la forma
de «plano».
En efecto: al igual que el arquitecto antes de ponerse a la compleja tarea
de levantar un edificio debe analizar con detalle la situación y tomar en
consideración cuantas variables tengan relación con su futura obra, desde
las características de lugar en que se ubicará o su peso y volumen hasta su
forma, tamaño, estructura… a fin de hacer un edificio sólido, funcional y
hasta bello, el investigador no puede ponerse sin más a la tarea de investi-
gar sin pararse a pensar en lo que quiere hacer, si cuenta con los medios y

132
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

recursos para ello y si están dispuestos de forma adecuada para llegar a


buen término su trabajo: resolver el problema.
Pues bien: en líneas generales esa es, de modo genérico, la concepción
del diseño. No obstante, y para precisar su naturaleza, funciones y objeti-
vos, será bueno acudir a las definiciones dadas por expertos en la materia.
Así, contamos con aportaciones que, sin dar una definición formal, acu-
den a la enumeración de las tareas que integran el diseño. Tal es el caso de
Finney1 para quien en el diseño deben considerarse, de una parte, aquellos
tratamientos que van a ser comparados y las unidades a las que se aplica-
rán los tratamientos, y de otra las reglas para asignar los tratamientos a las
unidades seleccionadas y las medidas a tomar en cada unidad.
Según McGuigan2 el diseño toma en consideración el planteamiento del
problema, la formulación de la hipótesis, la manipulación de la variable
independiente y su medida, el procedimiento a seguir, la previsión de los
análisis de datos recogidos y de los resultados esperados.
Entre nosotros, Arnau3, también desde una perspectiva descriptiva, con-
sidera que, bajo ese concepto, se incluyen «los procedimientos requeridos en
una investigación experimental», incluyendo entre ellos «desde la formula-
ción de la hipótesis a la obtención de las conclusiones».
Otros planteamientos se orientan a su finalidad. Tal es el caso de dos
importantes figuras en este campo, con su breve pero fundamental librito
sobre el tema. Se trata de Cambell y Stanley4, quienes entienden que lo fun-
damental del diseño es su capacidad para controlar las distintas fuentes de
invalidez interna y externa.
En línea con el enfoque de la finalidad del diseño, Domenech i Massons5
lo entiende como «las técnicas de realización de experiencias que permiten
estudiar la influencia de uno o varios factores o variables».

1
FINNEY, D. J. (1960). Experimental Design and its Statistical basics. Chicago: The University of Chi-
cado Press.
2
McGUIGAN, F. J. (1976). Psicología experimental. México: Trillas.
3
ARNAU GRASS, J. (1981). Diseños experimentales en Psicología y Educación. Vol. 3. México: Trillas.
4
CAMPBELL, D. y STANLEY, J. (1978). Diseños experimentales y cuasi-experimentales en la investiga-
ción social. Buenos Aires: Amorrortu.
5
DOMÉNECH I MASSONS, J. M. (1980). Bioestadística. Métodos estadísticos para investigadores. Barce-
lona: Herder.

133
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

A nuestro juicio, el planteamiento más correcto, y la definición más sen-


cilla a la vez que completa, es la debida a Kerlinger6. Estas son sus palabras:

«Diseño es el plan, estructura y estrategia de una investigación cuyo objetivo


es dar respuesta a ciertas preguntas y controlar la varianza.»

En apenas veinte palabras el autor hace una definición formal y, ade-


más, la completa incluyendo sus objetivos, como tendremos ocasión de
comentar. Veamos ahora cómo define cada uno de sus términos:

«El plan es un esquema global o programa que consiste en bosquejar lo que


hará el investigador, desde la redacción de la hipótesis y sus consecuencias opera-
cionales, hasta el análisis final de los datos. La estructura es más específica: es el
bosquejo, el esquema, el paradigma de operación de las variables. Al trazar dia-
gramas donde se describen las variables, su relación y yuxtaposición, construimos
esquemas estructurales que nos permiten alcanzar las finalidades operacionales de
la investigación. El significado de estrategia… comprende los métodos mediante
los cuales se reunirán y analizarán los datos. En otras palabras, indica cómo se
conseguirán los objetivos de la investigación y cómo se abordarán los problemas
que se hallen en ella.»

Como hemos podido apreciar, Kerlinger utiliza la mayoría de los térmi-


nos recogidos del diccionario y referidos al diseño en general.
Veamos estos planteamientos en un posible ejemplo de investigación,
ligado a un problema actual en nuestras universidades, como es el relacio-
nado con las competencias como objeto de formación de los estudiantes:

El problema surge en el investigador al plantearse dudas sobre qué pro-


cedimientos de actuación serán más eficaces para alcanzar las compe-
tencias asignadas a una determinada materia del currículo.
Después de analizada la literatura sobre el tema, de definir el concepto
de competencia, de analizar las diversas metodologías utilizadas… se
plantea una pregunta:

6
KERLINGER, F.N. (1981). Investigación del comportamiento. Técnicas y metodología. 2ª ed., México:
Interamericana, cap. 17.

134
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

• ¿Se darán diferencias en eficacia en el logro de las competencias en


función de las dos metodologías más utilizadas, A o B?
Su análisis sobre el «estado de la cuestión» le lleva a considerar que, tal
vez, variables como los estudios de que se trate (Grado académico) la
asignatura, el tipo de enseñanza (presencial o a distancia y, dentro de
esta, la tradicional o la que se realiza «on line»), la edad de los alumnos,
el curso (primeros o últimos cursos del grado), el lugar donde reside
(ciudad o pequeño núcleo rural), pueden influir en los resultados, lo que
le lleva a plantear su pregunta de forma más concreta:
• ¿Se darán diferencias en eficacia en el logro de las competencias en
función de las dos metodologías más utilizadas, A o B, cuando se apli-
can en los últimos cursos del Grado de Economía, en la asignatura
Macroeconomía, en estudios a distancia llevados a cabo «on line»?
Siguiendo con sus lecturas, reflexiones y experiencia profesional se
puede plantear que las metodologías, por su diferente naturaleza, deben
dar lugar a diferencias en eficacia, atreviéndose a formular la siguiente
hipótesis:
• La aplicación de las metodologías A o B en los últimos cursos del
grado de Economía, en la asignatura Macroeconomía avanzada, da
lugar a diferencias en la eficacia del aprendizaje por parte de alumnos
a distancia que siguen el curso «on line».
Incluso, como consecuencia de sus lecturas y experiencia docente,
basándose en sus conocimientos sobre el aprendizaje adulto, puede
arriesgarse a conjeturar que la metodología A debe ser más eficaz:
• La aplicación de la metodología A en los últimos cursos del grado de
Economía, en la asignatura Macroeconomía avanzada, da lugar
mejores resultados en el aprendizaje por parte de alumnos a distancia
que siguen el curso «on line».
La primera de las dos hipótesis se conoce como bilateral ya que se cum-
pliría —quedaría validada— tanto si la metodología A da mejores resul-
tados que la B como en el caso contrario. La segunda, en la que el inves-
tigador arriesga más, se denomina unilateral, y solo queda validada si,
en efecto, los mejores resultados se logran con la A y no con la B.

135
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En una concepción amplia de diseño la hipótesis forma ya parte del


mismo: el investigador ha llegado a una conjetura más o menos audaz, según
vimos decir a M. Bunge, pero ahora llega el momento de ser muy rigurosos
en someterla a contraste. Y aquí es donde aparece el diseño como plan.
La cuestión es ahora decidir qué hacer para dar la respuesta que deman-
da el problema y para contrastar la conjetura, de forma que quede o no vali-
dada, aunque, como tendremos ocasión de constatar, sea de forma proba-
bilística, esto es: no con seguridad sino con un riesgo más o menos elevado
de error, admitido a priori por el investigador.

En ese plan parece ser necesario:


• Definir con toda claridad las dos metodologías, A y B. Es más, con
el fin de que las diferencias puedan surgir, convendrá que ambas
sean claramente diferentes7.
• Decidir sobre los alumnos a los que se aplicarán las metodologías.
Nuestra formulación del problema deja fuera los de todas las carre-
ras excepto Economía y, dentro de esta, todos menos los de Macro-
economía avanzada.
• Del mismo modo, deberá decidir si selecciona a todos o a una
muestra, en cuyo caso deberá cuidar su tamaño y el procedimien-
to imparcial de muestreo.
• Habrá de tomar decisiones sobre la asignación de los alumnos a los
grupos y de la metodología a los grupos.
• Se deberá decidir cómo medirá la eficacia, cuándo recogerá los
datos y qué análisis hará de ellos, así como el tratamiento estadís-
tico de los mismos
• Y será preciso avanzar los resultados que le permitirían aceptar la
hipótesis como validada o, por el contrario, considerar que esto no
ha sido posible.
Junto al plan debe plantearse la estructura:
• Parece necesario contar con dos grupos de estudiantes de la asig-
natura, uno para cada una de las metodologías.

7
Más adelante analizaremos este punto, dentro del denominado principio MAX- MIN- CON de Ker-
linger, formando parte del MAX.

136
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

• Entre los posibles esquemas para abordar la cuestión, podemos


analizar los siguientes8:

Primero:

V. independiente V. dependiente V. independiente V. dependiente


Metodología A Media de A Metodología B Media de B
Resultado: Media A – Media de B

Segundo:

Variable independiente Variable dependiente


Metodología Logro de competencias
A Media de A
B Media de B
Resultado: Media de A - Media de B

Tercero:

Nivel previo V. independiente. V. dependiente


en competencias Metodología Logro de competencias
Media A1 A Media de A2
Media B1 B Media de B2
Resultado: (A2 - A1) - (B2 - B1)

Estos esquemas, en los que se relacionan la V.i. (metodología) con la


V.d. (logro de las competencias), nos indican diferentes formas de
actuar. Veamos:
En el primer caso, contamos con un solo grupo de estudiantes, al que se
aplican sucesivamente ambas metodologías, comprobando al final si de
dan diferencias entre los efectos de una y otra.
En el segundo nos valemos de dos grupos; cada uno de ellos recibe una
metodología y, al finalizar, constatamos los resultados, pudiendo com-

8
V.i.: variable independiente; V.d.: variable dependiente.

137
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

probar si se dan o no diferencias entre las medias de un grupo y otro, o


lo que es lo mismo, entre los resultados con una y con otra metodología.
Por último, en el tercer esquema, preocupados por las posibles diferentes
iniciales en competencias en los grupos sobre los que se aplicarán las
metodologías, medimos el nivel previo, aplicamos como en el caso anterior
las dos metodologías y medimos los resultados. Este esquema nos permi-
tirá comprobar el efecto de ambas tomando en consideración el nivel de
partida: podría darse el caso de que resultados más bajos en uno de los gru-
pos supusieran mayor ganancia que la debida al otro, teniendo en cuenta
ese nivel previo.
No entramos por el momento a valorar las alternativas, algo que hare-
mos más adelante; simplemente se trata de dejar constancia de diferen-
tes estructuras de acción.
Y, ahora, la estrategia.
Si optamos por la primera estructura, con un solo grupo, deberemos deci-
dir si es indiferente el orden en que se presenten las dos metodologías, si
cabe esperar que la aplicada en segundo lugar se verá alternada por la pri-
mera, cuál es el tiempo que debe mediar entre la aplicación de una y otra
metodologías, si convendría tener datos previos sobre la situación del
grupo en las competencias que se desea conseguir (línea de base)…
Si optamos por acudir a dos grupos es preciso decidir qué grupo recibirá
qué metodologías, por qué procedimiento se asignarán las metodologías,
qué actuaciones deberán llevarse a cabo que puedan garantizar no ya la
igualdad de ambos antes de aplicar la V.i. en sus dos niveles o modalida-
des pero sí al menos la equivalencia, de forma que no haya entre ellos dife-
rencias iniciales que pudieran explicar las diferencias finales. Se trata de
evitar una variable extraña que pueda anular nuestro planteamiento.
Así, en los modelos 2 y 3 anteriores se acude a dos procedimientos dife-
rentes; mientras en el tercero se ha decidido medir la situación de los
grupos antes de aplicar la metodología correspondiente (V.I.) lo que
implica contrastar al final las ganancias conseguidas por cada una9, en

9
Kerlinger no es partidario de este procedimiento sino sustituirlo por el análisis de covarianza, que pre-
sentaremos más adelante, y que compara al final las medias finales ajustadas a las diferencias iniciales.

138
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

el segundo no. Nada se dice sobre cómo se ha procedido, pero las opcio-
nes van desde la formación de los grupos tal como se han seleccionado
(incorrecta) a su constitución por procedimientos aleatorios (la mejor,
pero habitualmente difícil de lograr) pasando por la constitución de blo-
ques homogéneos o, en el extremo, la formación de los grupos median-
te emparejamientos, es decir: asignar a un grupo un sujeto y al otro un
nuevo sujeto que pueda considerarse «parejo» o equivalente al primero.
Deberemos buscar procedimientos que eviten la influencia de variable
extrañas durante el tiempo de dure la investigación.

2.2. Objetivos

Siguiendo lo indicado por Kerlinger, los grandes objetivos del diseño son:

• Responder a las preguntas del problema de investigación


• Controlar la varianza

Veamos una y otra cuestión, su significado y las actuaciones a su servicio.

2.2.1. Responder a las preguntas del problema de investigación

El diseño no es algo rígido, sino un plan al servicio de la investigación.


Preguntas como las siguientes exigen diseños diferentes:
1. ¿Hay relación entre los métodos y las competencias?
2. ¿Se dan diferencias en los resultados en el logro de competencias en
función del método utilizado?
3. ¿Aprenden los alumnos antes las competencias con una metodología
que con otra?
4. ¿Aprenden los alumnos más competencias con una metodología que
con otra?
5. ¿Permanece durante más tiempo el aprendizaje de competencias
con una metodología que con otra?

139
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

6. El aprendizaje de competencias alcanzado con una metodología, ¿es


de mayor aplicación que con otra?
7. ¿Aprenden más (antes, durante más tiempo…) los alumnos adultos
que los más jóvenes?
8. ¿Es más eficaz una concreta metodología con alumnas que con alumnos?
9. ¿Es más eficaz una metodología en el aprendizaje «on line» que en
la enseñanza presencial?
10. ¿Aprenden más (antes, durante más tiempo...) las competencias en
unos grados que en otros (ciencias frente a humanidades…)?
11. ¿Aprenden más (antes, durante más tiempo...) en una tipología de
materias y asignaturas que en otras?
12. Etc.
Pues bien, la primera pregunta, entendiendo el término «relación» como
correlación en términos estadísticos, solo pide contar con las medidas de
los resultados en competencias, diferenciados según el método y proceder
al cálculo estadístico mediante una correlación biserial puntual.
Sin embargo, en los casos 2 a 6 el interés del investigador parece ir más
allá de la mera constatación de tal relación, estando interesado en atribuir
al método el origen de las posibles diferencias. Decimos el origen aunque,
en realidad, querríamos decir la causa; ahora bien: para probar si los méto-
dos son esa causa entramos en el terreno de la investigación experimental
y necesitaremos de diseños que puedan controlar las hipótesis alternativas
a la del investigador, esto es, las variables extrañas.
Si analizamos las preguntas 7 a 11, nos encontramos ante una nueva
dificultad, por un lado tenemos la misma preocupación del investigador en
relación con el efecto que puedan producir las metodologías sobre el apren-
dizaje de las competencias. Pero, por otro, aparece una preocupación aña-
dida: si tal efecto difiere en función de la edad, el sexo, el tipo de enseñan-
za, la naturaleza de los grados académicos, las materias o las asignaturas.
Una solución consistiría en plantear diseños paralelos: uno para com-
probar la eficacia de las metodologías con alumnos adultos y otro para
alumnos jóvenes; uno para alumnas y otro para alumnos; uno para la ense-

140
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

ñanza presencial y otro para la enseñanza «on line»…, solución poco satis-
factoria y con evidentes dificultades a la hora de comparar.
Por ello, el investigador puede plantearse preguntas más complejas y, en
consecuencia, demandar diseños que también lo fueran. Por ejemplo:
1. ¿Se dan diferencias en los resultados en el logro de competencias en
función del método utilizado y de la tipología de las materias?
2. ¿Aprenden los alumnos antes las competencias con una metodología
que con otra en grados científicos y de humanidades?
3. ¿Aprenden los alumnos más competencias con una metodología que
con otra según la materia?
4. ¿Permanece durante más tiempo el aprendizaje de competencias con
una metodología que con otra en los primeros cursos o en los últimos?
5. El aprendizaje de competencias alcanzado con una metodología, ¿es
de mayor aplicación que con otra según la tipología de las materias?
6. ¿Aprenden más (antes, durante más tiempo…) los alumnos adultos
que los más jóvenes con una metodología que con otra?
7. ¿Es más eficaz una concreta metodología con alumnas que con alumnos?
8. ¿Es más eficaz una metodología en el aprendizaje «on line» que en
la enseñanza presencial?
9. ¿Se aprende más (antes, durante más tiempo...) las competencias en
unos grados que en otros (ciencias frente a humanidades…) según
las metodologías?
10. ¿Aprenden más (antes, durante más tiempo..) en una tipología de
materias y asignaturas que en otras según la metodología utilizada?
11. Etc.
En todos estos casos, el interés del investigador no se limita a la acción
de una variable independiente, la metodología, con al menos dos niveles (A
y B) sino que lo hace teniendo en cuenta, a la vez, el influjo de otra, sea el
sexo, el curso, el tipo de enseñanza, el grado, la materia… En este tipo de
situaciones, el esquema de acción que hemos analizado en el apartado ante-
rior será, obviamente, más complejo y contemplará simultáneamente esas
dos variables independientes. Por ejemplo (cuadro 4.1):

141
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Cuadro 4.1. Esquema de un diseño complejo, con dos


variables independientes

Grado universitario
Física Filosofía TOTAL
Metodología

A: presencial
B: «on line»
TOTAL

La ventaja de este planteamiento es que, simultáneamente podemos


probar el efecto de la variable «metodología» y de la variable «grado» sobre
el logro de las competencias y apreciar si una metodología da, en ambos
casos, mejores resultados que la otra.
Y algo más, y de mayor aportación científica y práctica: podría darse el
caso de que una metodología, la A, diera mejores resultados con Filosofía,
mientras la B lo hiciera con Física. Este caso, aportación específica de este
tipo de diseños, denominados factoriales, se denomina interacción, y es
especialmente relevante en el ámbito de las ciencias humanas.

2.2.2. Controlar la varianza

Hasta ahora hemos podido apreciar cómo diferentes enunciados de las


preguntas que se hace el investigador en torno a su problema, requieren
esquemas de acción diferentes, esto es, diseños distintos.
A continuación analizaremos con algún detenimiento la segunda gran
cuestión, el segundo objetivo del diseño: controlar la varianza
Debemos recordar que entendemos por varianza una medida de disper-
sión de las puntuaciones en torno a la medida del grupo. Si en un determi-
nado grupo todos sus componentes obtuvieran la misma puntuación, por
ejemplo, la misma talla, el mismo peso, la misma calificación en ortografía…,
su desviación típica –s- seria nula -0- y su varianza –s2- también. Sin embar-
go, con tan solo un caso en que la puntuación fuera diferente de las demás,
por pequeña que fuera la diferencia, sí habría dispersión, el valor de s y el de
s2 serían diferentes de 0. El problema en el diseño es el de poder asignar esa
dispersión o varianza a una fuente concreta, a una variable concreta.

142
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

Parece evidente en nuestro diseño que lo deseable es poder asignar la


dispersión a las metodologías, pero la situación no es tan sencilla como
parece. ¿No podría darse el caso de influencias alternativas o simultáneas a
las metodologías? Por ejemplo: el influjo del profesor que aplica la meto-
dología, la asignatura de que se trate, el grado académico, el curso de dicho
grado, la edad o el sexo de los alumnos…
La cuestión se nos plantea en términos de control: deberíamos poder
asignar la variación o dispersión a la metodología y solo a ella. No por el
hecho de que nos interese comprobar si una metodología es más eficaz que
otra podremos asignar la variación que se produzca (varianza) a tal varia-
ble; si hay otras variables que puedan influir, y parece razonable que las
enunciadas puedan hacerlo, deberemos evitar que se conviertan en explica-
ciones rivales de la nuestra, en conjeturas o hipótesis rivales o alternativas,
y eso solo podremos conseguirlo si el diseño cumple con este segundo obje-
tivo, el control de la varianza.
Este aspecto, crucial en toda investigación experimental, se denomina
técnicamente validez interna del diseño, consistente en poder afirmar que
los efectos medidos en la variable dependiente se deben a, y solo a, la varia-
ble independiente.
Como podemos comprender este objetivo presenta dos momentos cla-
ramente diferentes:
• Poder afirmar, antes de comenzar la investigación, que los dos gru-
pos que hemos formado para recibir cada uno de los niveles de la v.i.
metodología, A y B, son no ya iguales pero sí equivalentes, que tanto
da asignar a uno de ellos la metodología A como la B, y viceversa.
• Que una vez iniciada la investigación las condiciones y circunstan-
cias en que esta se desarrolla son las mismas para cada uno de los
grupos que forman parte de la investigación.
Si lo primero no siempre es fácil, como tendremos ocasión de apreciar, lo
segundo resulta francamente difícil en el campo de la Educación. Las dificul-
tades para controlar todos los posibles factores influyentes con seres humanos
y fuera del laboratorio —la vida habitual de los sujetos, al margen del tiempo y
el espacio de la investigación— lo hacen prácticamente imposible, aunque el
investigador deba hacer todo lo que esté en sus manos para acercarse al ideal.

143
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Si se lograra tal control estaríamos ante un caso como el siguiente: la


dispersión o variabilidad, medida en términos de varianza, sería igual en
términos estadísticos10 antes de comenzar la investigación. Por tanto, si
pasado el tiempo en que los grupos reciben diferentes metodologías, se
constatara una variación entre ambos, y se diera ese control, la dispersión
no podría tener otro origen que la v.i.: una metodología produciría cambios
mayores o diferentes a los originados por la otra.
Más adelante tendremos ocasión de conocer los procedimientos exis-
tentes para abordar este control en sus dos manifestaciones. Sin embargo,
sí es el momento de concretar las principales cuestiones en torno al diseño
acudiendo a un principio fundamental, formulado magistralmente por Ker-
linger: el principio MAX – MIN – CON.
Como señalábamos, con un buen diseño se pretende dar respuestas a las
preguntas en que se concreta el problema de investigación; junto a ello, y,
en gran medida, como un medio para lograrlo, el segundo objetivo es con-
trolar la varianza.
En toda medida de una variable, por ejemplo, de la variable dependien-
te de un diseño, se produce una determinada varianza, esto es, la dispersión
de las puntuaciones en tal variable. La dispersión, que puede ser mayor o
menor, puede tener su origen en los cambios introducidos por el investiga-
dor al manipular —al decidir sus niveles— la variable independiente, o bien
en otros factores alejados de los intereses del investigador. La primera
varianza se denomina sistemática porque tiene un origen concreto, y experi-
mental, porque la produce la variable independiente o experimental.
La segunda, suele ser una varianza aleatoria pues sus efectos vienen a
compensarse al afectar por igual a los grupos en que se concreta el diseño
de investigación. Su origen se encuentra en las diferencias individuales
existentes entre los sujetos dentro de los grupos del diseño y en las ligadas
a los errores de medida. Se la denomina varianza de error. El diseño nos
dará una u otra respuesta a las preguntas en función de la relación entre
una y otra. Parece lógico pensar que si la primera es claramente superior a
la segunda, cabe esperar que se deba a la manipulación de la variable inde-

10
Queremos decir que ese ser igual no debe entenderse como «exactamente igual», sino que las dife-
rencias entre uno y otro grupo no son estadísticamente significativas, esto es: sus diferencias no van más
allá de lo esperado por puro azar.

144
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

pendiente... siempre que se hayan controlado las posibles hipótesis rivales


de la formulada por el investigador.
En definitiva, pues, un buen diseño deberá responder al principio que
Kerlinger denominó Max-Min-Con:
Max representa la meta de maximizar, esto es, de hacer tan grande como
sea necesario, la varianza debida a la variable independiente; min, por el
contrario, la de minimizar o hacer tan pequeña como se pueda aquella
varianza explicable por efecto de las diferencias individuales o del azar; y
con no es sino la gran exigencia: el control de toda hipótesis rival o alter-
nativa de la formulada por el investigador, algo que se denomina técnica-
mente validez interna.
Max y min son importantes para conseguir que los resultados de
una investigación puedan llegar a ser estadísticamente significativos,
esto es, para que el investigador pueda decidir, con un elevado nivel de
confianza, que no se deben al azar sino al efecto de la variable inde-
pendiente, lo que representa la posibilidad de rechazar H 0, esto es, la
hipótesis nula o de nulidad y, en consecuencia, poder aceptar la suya,
H1, admitiendo un riesgo cuya probabilidad denominamos nivel de sig-
nificación, representado por α, y cuyo valor es complementario del
nivel de confianza.11
Pero aunque Max y Min logren ese objetivo, si con el diseño no se con-
sigue el Con, no habremos hecho nada. En efecto: podremos afirmar que
las diferencias son estadísticamente significativas, pero no sabremos a qué
se deben, ya que, junto a nuestra variable independiente, caben otras expli-
caciones, otras hipótesis rivales o alternativas: las correspondientes a las
variables extrañas, esto es, no controladas.

2.3. Tipos

Siguiendo la citada obra de Campbell y Stanley presentaremos tres tipos


de diseños: pre-experimentales, cuasi-experimentales y experimentales.

11
Si el nivel de confianza fuera del 95%, el de significación es del 5%. O en términos de probabili-
dad: 0,95 y 0.05 respectivamente.

145
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

2.3.1. Diseños pre-experimentales

Al presentarlos utilizaremos el símbolo X para la variable independien-


te e Y para la dependiente. Pues bien, los tres siguientes diseños son consi-
derados pre-experimentales ya que carecen de control (Cuadro 4.2):

Cuadro 4.2. Esquemas de los diseños pre–experimentales

1) Diseño de caso único, con una sola medición


X Y
2) Diseño pretest – postest de un solo grupo:
Y1 X Y2
3) Diseño de comparación con un grupo no tratado experimentalmente:
X Y1
Y2
En el diseño 1) no hay justificación que permita asignar los efectos
medidos en Y a la v.i. X; muchas otras variables distintas de X pueden estar
ocurriendo a la vez que X y ser la causa o parte de la causa de los resulta-
dos medidos en Y.
El investigador suele plantear sus resultados poniéndolos en relación
con la realidad que él conoce, por su experiencia, por datos de otros estu-
dios, por información acumulada de otros trabajos… Cualquiera estas
comparaciones no está justificada y las conclusiones derivadas no son
defendibles.
En el diseño 2) estamos ante una comparación formal: disponemos de
información previa al inicio del experimento —Y1— aplicamos la v.i. y
medimos sus efectos. Aparentemente, el planteamiento es más exigente;
desde luego, permite la comparación antes/después, pero no evita los ries-
gos de 1) ya que variables extrañas alternativas o simultáneas pueden estar
actuando a la vez que X. Es decir: la diferencia Y2 - Y1 será la que fuere, pero
su origen o causa no tiene por qué ser X sino otras X diferentes o ambas a
la vez en forma y proporción desconocidas.
Por último, en 3) estamos ante una comparación de nuestro grupo expe-
rimental con otro grupo; el primero ha recibido X y el segundo no, pero
¿disponemos de información que asegure que ambos grupos eran compa-

146
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

rables en todo menos en la recepción o no de X?. Evidentemente, no. El


segundo grupo puede ser muy diferente del primero en interés, motivación,
dedicación, conocimientos previos, dominio inicial de las competencias…
que podrían explicar la diferencia Y2 - Y1 al margen del hecho de haber reci-
bido o no X.

2.3.2. Diseños experimentales

Si en los tres tipos de diseños anteriores el problema reside en la falta


de control de la varianza, en los tres siguientes este hecho desaparece. Vea-
mos (Cuadro 4.3):

Cuadro 4.3. Esquemas de diseños experimentales

4) Diseño de dos grupos, inicialmente igualados por asignación al azar


Azar Y1 X Y2
Azar Y3 Y4
5) Diseño de cuatro grupos de Solomon
Azar Y1 X Y2
Azar Y3 Y4
Azar X Y5
Azar Y6
6) Diseño de grupo de control con solo pretest:
Azar X Y1
Azar Y2

En el diseño 4) estamos ante dos grupos, constituidos ambos por selec-


ción y asignación aleatoria de los sujetos, a uno de los cuales se somete a la
influencia de v.i, esto es, de X, y a otro no. Vale la pena señalar que ese no
estar sometido a X no equivale a no recibir ninguna influencia, esto es: no
contrastamos X contra no X, sino X frente a una forma de influencia no
especificada, que suele ser la forma ordinaria de trabajo, en nuestro caso la
forma ordinaria de actuación para alcanzar las competencias.
Conviene, por tanto, esmerarse en definir ese «no X» al igual que se defi-
ne X, porque las diferencias, si las hubiere, no serán de X frente a no X sino
de X frente a esa modalidad concreta de no X.

147
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Teóricamente, este diseño, al partir de una asignación de sujetos y tra-


tamientos al azar, controla las hipótesis rivales a la del investigador. Más
adelante analizaremos esta importantísima cuestión al hablar de la validez
interna.
Conocidas las limitaciones existentes en la medida de las variables, liga-
das a su fiabilidad (errores de medida), y las diferencias que se dan entre
muestras, incluso cuando han sido seleccionadas utilizando procedimien-
tos asépticos e imparciales como el azar (errores muestrales), cualquier ten-
tación de limitarnos a comparar directamente las dos medias: Y2 – Y4 no
estaría justificado.
Tampoco lo estaría, sin más, la comparación de las ganancias: (Y2 – Y4)
— (Y1 – Y3) ya que a ambas diferencias les podemos aplicar las mismas res-
tricciones de errores de medida y muestrales. Por otra parte, y como seña-
la Kerlinger12, «las diferencias del grupo de control y del grupo experimental
pueden carecer de importancia cuando de hecho existe un efecto sustancial»
y se apoya en Cronbach y Furby quienes afirman que las puntuaciones de
cambio no se deben utilizar, siendo lo importante si se dan diferencias
entre ambos grupos.
La alternativa en estos casos es la técnica del análisis de covarianza
que estudiaremos más adelante. En ella se contrastan las diferencias
finales ajustadas a las diferencias iniciales. Esto es: se comparan las
medias finales ajustadas a las diferencias iniciales medidas en el pre-test
(Y1 y Y3).
El diseño 5 hace una importante aportación a las posibilidades de gene-
ralización de los resultados, algo que estudiaremos más adelante como vali-
dez externa.
En efecto: como podemos apreciar, estamos ante una investigación en
que se combina el cuatro (los dos primeros grupos) con el tres, si bien aquí
con asignación de sujetos y tratamientos al azar.
Las principales comparaciones que podemos realizar son más que en el
caso anterior:

12
KERLINGER, F. N. (1981). Investigación del comportamiento. Técnicas y metodología. 2.ª vedi. Méxi-
co: Interamericana, p. 239.

148
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

• Por una parte Y2 frente a Y1: ¿hay ganancias por la introducción de


una v.i.?
• Por otra Y2 frente a Y4: ¿hay diferencias como efecto de X frente a
no X?
• Si tomamos ahora los dos primeros grupos podemos llevar a cabo
las comparaciones propias del diseño 4.
• Además, Y5 frente a Y6: ¿hay diferencias como consecuencia de la
introducción de una v.i.?
• Y, por último: Y6 frente a Y3: ¿hay diferencias en el caso de medi-
das iniciales en otro grupo con medidas finales en el propio?
• Tomando en conjunto estos dos últimos grupos podemos hacer las
comparaciones del diseño 3, mejoradas por contar con las ventajas
derivadas de la aleatorización.
Lo más importante de este diseño es que analiza la existencia o no de
diferencias en situaciones diferentes; caso de darse concordancia, se eleva
la credibilidad de los resultados.
Cuando conozcamos los factores que atentan a la validez interna y exter-
na podremos comprobar que este diseño sale al paso de factores como los
denominados historia y maduración (dos primeros grupos), de la interac-
ción entre pruebas y v.i. (tres primeras filas) y los efectos que puedan darse
durante la investigación (las cuatro filas).
Si desde el punto de vista de la finalidad del diseño este es un buen dise-
ño, los problemas que arrastra consigo se refieren, por un lado, a la difi-
cultad para llevarlo a cabo y, por otra, al análisis estadístico.
El primero es obvio: es más difícil articular un diseño con cuatro grupos
que con dos. El segundo reside en que no existe una prueba que permita
decidir de una forma global en torno a las preguntas del investigador y con-
trastar las hipótesis. Sí podemos, como hemos señalado en los diseños 3 y 4,
estudiar las diferencias entre Y5 e Y6 mediante una prueba t de Student y
entre Y2 e Y4 ajustadas a las diferencias iniciales mediante una covarianza.
Otras propuestas que se plantean son comparar las Y4 e Y5 con el pro-
medio de Y1 e Y3 a la vez que la magnitud de las diferencias entre Y2 e Y4.

149
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La complejidad y problemática apuntada llevan a Kerlinger a afirmar


que «sería mejor reservarlos para experimentos de gran trascendencia en los
cuales, hipótesis ya demostradas con diseños más sencillos, vuelven a ser veri-
ficadas con mayor rigor y control»13
El diseño 6) difiere del 4) en la carencia de pretest. Esta limitación no lo es
tal si tenemos en cuenta que sujetos y tratamientos son asignados acudiendo
al azar, la técnica por experiencia para lograr, en general, una equiparación de
los grupos antes de comenzar la investigación. Podríamos decir que si el azar
es posible, el diseño 6 puede ser preferible en la medida en que nos ahorra
medidas pretest y puede aplicársele un tratamiento estadístico más sencillo.

Por otra parte, debemos reconocer que no siempre estamos en condi-


ciones de disponer de pretest y que, a veces, su aplicación tiene inconve-
nientes14. Es más, si en el diseño 4 necesitaríamos identificar a los sujetos
para en el caso de formar grupos por emparejamiento, en este caso, al uti-
lizar el azar, no es preciso.

Si en el diseño 4, dada la existencia de medidas pretest se aconseja acu-


dir a la covarianza como técnica estadística específica, en este caso pode-
mos hacerlo con el análisis de la varianza sencillo, para dos grupos (prue-
ba F) si bien no es preciso porque se dispone de la conocida prueba t de
Student, aplicable en este caso.

Diseño 7: Diseño factorial

La complejidad de los procesos educativos hace que, con mucha fre-


cuencia, la simplificación que representan diseños tan correctos como el 4,
resulte poco concorde con la misma.

Es fácil argumentar que, en muchos procesos educativos, hay dos o más


variables independientes actuando simultáneamente sobre la v.d. Aunque
aquí representaremos el caso de dos v.i., la realidad es todavía más com-
pleja, pero nos sirve para comprender lo que este hecho representa para su
diseño y su resolución estadística (Cuadro 4.4).

13
Idem, p. 241. Recuerde el lector que no nos parece adecuado utilizar el término verificar; prefe-
rimos, por más preciso y correcto, el de validar.
14
Al estudiar la validez externa podremos comprender lo que se denomina el efecto reactivo del pre-
test, que puede alterar los resultados y limitar su generalización.

150
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

Cuadro 4.4. Esquema de un diseño factorial

Metodología Trabajo Trabajo Mixto


individual cooperativo Puntuaciones
Sistema de motivación A B C
Intrínseca (X) A/X B/X C/X
Extrínseca (Y) A/Y B/Y C/Y
Puntuaciones

Las aportaciones de este diseño son, fundamentalmente, dos:


Poder someter a contraste simultáneamente dos hipótesis, una en rela-
ción con cada una de las dos v.i., en nuestro caso Metodología y Sistema de
motivación.
Además, y esto es lo fundamental, poder apreciar si se da el efecto deno-
minado de interacción, esto es, el hecho de que los efectos de una de las v.i.
estén condicionados por la otra v.i. En efecto: puede ocurrir que una de las
dos v.i. siempre dé mejores resultados que la otra, pero también, y esto es
la interacción, que una v.i. dé mejores resultados con uno de los niveles de
la otra, alterándose la situación con el otro nivel. Por ejemplo: que la com-
binación motivación intrínseca / trabajo individual dé mejores resultados,
pero que la extrínseca los dé con la metodología cooperativa.
El tratamiento estadístico de este diseño es el análisis de la varianza
(ANAVA, o ANOVA en inglés), esto es, la prueba F de Fisher.
F sólo indica si alguna de las posibles diferencias entre medias es o no
significativa; por eso, en caso afirmativo, se deben proseguir las pesquisas
para ver entre qué par de medias se dan las diferencias, acudiendo a los
denominados contrastes a posteriori mediante pruebas como las de Tukey
(si el valor de n en las celdillas es el mismo) o Sheffé, también aplicable a
este caso pero especialmente adecuado cuando tales valores no lo son.

2.3.3. Diseños cuasiexperimentales

Podría parecer más correcto haber analizado estos diseños inmediata-


mente después de los pre-experimentales; sin embargo, hemos preferido

151
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

este orden porque la diferencia esencial entre ellos y los experimentales


radica en las limitaciones que pondremos de manifiesto en cuanto a las
posibilidades de control.
Este hecho es una realidad especialmente habitual en el campo de la
investigación sobre seres humanos en los que el experimento se realiza en
un contexto de «vida normal». Por ejemplo: las investigaciones sobre el
aprendizaje de competencias se llevarán a cabo principalmente en el ámbi-
to académico, pero luego los alumnos, en la calle y en su domicilio desa-
rrollan esa vida normal, de relaciones con amigos y la familia, de distrac-
ción, de acceso a las tecnologías… Incluso, hasta pueden comunicarse con
otros compañeros que pueden estar realizando el mismo «experimento», y
ello tanto participando de un mismo nivel de la v.i. como de la otra.
Esta situación es común en nuestro campo del saber por lo que debe-
mos familiarizarnos con ella a fin de trabajar con ella sacando el máximo
fruto. Para ello conviene conocer cuáles son las variables que no controla
cada diseño, algo que veremos más adelante.
Pasamos a analizar los principales diseños cuasi-experimentales (Cua-
dro 4.5).
Diseño 8: pretest/postest con grupo de control no equivalente.

Cuadro 4.5. Esquemas de un diseño cuasi-experimental: pretest/postet


con grupo de control no equivalente

Y1 X Y2
Y3 Y4

Como se aprecia aquí, ambos grupos, el experimental y el de control,


han recibido un pretest pero este no asegura la inicial equivalencia antes de
aplicar X, que deberá asignarse por procedimiento aleatorio.
Por lo general, los grupos son naturales, esto es: se encuentran consti-
tuidos previamente al diseño de la investigación, razón por la cual, aunque
puedan ser próximos a la equivalencia, no lo son en la realidad. Esta es la
razón fundamental para necesitar del pretest.
Si esos grupos naturales fueran en verdad cercanos a la equivalencia ini-
cial y, con ello, más similares las puntuaciones pretest de ambos grupos,

152
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

mejor resultará este diseño para probar el efecto de X. Más adelante, al


igual que en los demás diseños, analizaremos las posibles variables que
atentan a su validez.
Estadísticamente, el análisis de covarianza es la técnica más adecuada
pues, como se ha señalado, las puntuaciones de ganancia suelen estar des-
aconsejadas.
Diseño 9: Diseño de cuadrado latino (Cuadro 4.6)
Este tipo de diseños forma parte de un grupo más amplio denominado
de diseños compensados.
En él la v.i., generalmente denominada tratamiento, tiene tantos niveles
como grupos haya en el diseño, presentándose una vez por fila y columna,
de forma que no coincida el mismo nivel dos veces en la misma fila o en la
misma columna.
En cada una de las celdillas se cruzan dos variables independientes,
denominadas de bloqueo, porque su misión es homogenizar los grupos en
tales variables (bloques); las puntuaciones de cada celdilla son las de la
variable dependiente, por ejemplo, en nuestro caso, las obtenidas en com-
petencias, mediante la aplicación de tres metodologías, A, B y C:

Cuadro 4.6. Esquemas de un diseño cuasi-experimental: cuadrado latino

Rendimiento previo
ALTO MEDIO BAJO Puntuaciones
Clase social
A B C
Alta
Alto/alta Medio/alta Bajo/alta
B C A
Media
Alto/media Medio/media Bajo/media
C A B
Baja
Alto/baja Medio/baja Bajo/baja
Puntuaciones

La ventaja de este diseño radica en el control del efecto que puedan


representar las dos variables utilizadas para homogeneizar los grupos, en
nuestro caso la clase social y el rendimiento previo.

153
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Por el contrario, el riesgo salta a la vista: en cada casilla confluye el tra-


tamiento o variable independiente con el cruce de ambas variables de
homogeneización; a este efecto se le denomina interacción, un efecto que es
muy beneficioso y de utilidad en otro tipo de diseños ya conocidos, los
denominados factoriales, pero que en el diseño que analizamos resulta inde-
seable ya que no podríamos diferenciar el efecto debido a la variable trata-
miento (metodología) del existente por la interacción. Si recordamos que la
meta de los diseños experimentales es poder atribuir los resultados medi-
dos en la v.d. a y solo a la v.i., comprenderemos lo que este hecho repre-
senta.
El tratamiento estadístico adecuado a este tipo de diseños es el análisis
de varianza. Lo fundamental es poder descartar el efecto de interacción; si
así fuera, lo importante es probar si los tratamientos, niveles de la v.i. o fac-
tores, dan lugar a diferencias en la v.d. Si fuera así, tendríamos otro pro-
blema ya que la prueba F solo indica que al menos una de las diferencia son
significativas, pero nada dice de entre qué pares de medias se dan.
Diseño 10. Series cronológicas
En este tipo de diseño, el investigador cuenta con una serie de medidas
repetidas, previas a la introducción de la v.i.; después de introducirla, se
vuelven a realizar medidas de la v.d. de forma que se pueda apreciar si X da
lugar a cambios.
Su representación esquemática es la siguiente (Cuadro 4.7):

Cuadro 4.7. Esquemas de un diseño cuasi–experimental:


diseño de series cronológicas

Y1 Y2 Y3 Y4 X Y5 Y6 Y7 Y8

Algunas observaciones a tener en cuenta:


• Podemos aplicar esta estructura a sujetos individuales o a grupos.
Para que alcance un carácter riguroso, debe estar fundamentada la
hipótesis de que los cambios que puedan ocurrir después de X pue-
den deberse a X. No sería adecuado partir de datos existentes y
tomarlos como si fueran verdaderos Y1 Y2 Y3 Y4
• El número de medidas Y antes y después de X no es fijo. Nor-
malmente, las previas a X buscan lo que se denomina línea de

154
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

base, esto es, una situación estable del sujeto o del grupo en la
realidad medida.
La interpretación de los resultados Y5 Y6 Y7 Y8 depende de los pre-
vios a X y de la forma que tomen después de Y. Podemos apreciar-
lo en el gráfico que tomamos de Campbell y Stantley (figura 4.1).

Figura 4.1. Posibles resultados en un diseño de series cronológicas.


(Tomado de Campbell y Stanley, p. 78).

Como podemos comprobar, en el caso A la cuestión es clara: se dan o no


diferencias entre las mediciones O5 y O4. (Para nosotros Y5 e Y4)
En la situación B no es suficiente, dado que el cambio que se aprecia
desaparece pronto, tal vez producido por su novedad; pero pasada esta, la
situación vuelve a la normalidad.
C representa una situación especial: viene apreciándose antes de X una
ganancia, que aumenta con X y que sigue elevándose a continuación.
D muestra un efecto retardado; la situación se complica por la tenden-
cia a perder fuerza el efecto de X pasado el tiempo. Tal vez lo conveniente
fuera seguir haciendo mediciones de Y.
En fin: como se puede apreciar, se dan, o pueden darse, muchas situa-
ciones diferentes que obligan a contrastes estadísticos en algunos casos
pero, sobre todo, a análisis cuidadosos y, con frecuencia, prolongados.

155
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

3. CRITERIOS PARA SELECCIONAR EL DISEÑO

A la luz de lo hasta aquí dicho, es fácil deducir que los dos grandes cri-
terios tienen que ver con los dos objetivos planteados por Kerlinger. Esto
es, debemos seleccionar aquel diseño que pueda dar respuesta a las pre-
guntas en que se concreta el problema y acorde con la hipótesis del investi-
gador, y de entre los posibles, aquel que controle en mayor medida la
varianza de las variables extrañas, a fin de evitar que se conviertan en hipó-
tesis rivales a la del investigador.

3.1. Responder a las preguntas de la investigación

La primera cuestión parece obvia, pero no siempre el investigador ana-


liza si su diseño cumple con requisito tan lógico.
En este punto se puede fallar, fundamentalmente, de dos maneras: utilizan-
do un número menor o mayor de grupos que los aludidos en la pregunta, o acu-
diendo a diseños más sencillos que la complejidad de dicha pregunta. Veamos:
Si el investigador desea responder a la siguiente cuestión: ¿cuál de los
métodos, A, B y C, da mejores resultados en el logro de las competencias?,
se puede plantear un diseño con cuatro grupos, el de control y tres experi-
mentales (Cuadro 4.8):

Cuadro 4.8. Criterios para la selección del diseño adecuado

Grupo de control: Azar Y1


Grupo experimental A Azar XA Y2
Grupo experimental B Azar XB Y3
Grupo experimental C Azar XC Y4

Realmente, la pregunta no exige el grupo de control como tal ya que


todos ellos se pueden tomar como control de resto. Bastaría con los tres
grupos experimentales.
Sin embargo, ese diseño sería adecuado si la pregunta fuere: ¿cuál de los
tres métodos, A, B o C da mejores resultados para el logro de las compe-
tencias en relación con la actual metodología (no X)?

156
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

3.2. Controlar la varianza

El segundo criterio se puede apreciar en el siguiente enunciado del pro-


blema: ¿cuál de los métodos, A, B o C, y de los sistemas de motivación, M
y N, da mejores resultados en el logro de las competencias?

Si el investigador acude a dos diseños según el tipo 4, aparte de aumen-


tar el trabajo, estará renunciado a una excelente aportación a la teoría
pedagógica: la posibilidad de interacción.

Veamos primero las alternativas incorrectas:

Cuadro 4.9. Criterios para la selección del diseño adecuado.


Alternativas incorrectas

Grupo de control Azar Y1


Grupo experimental Azar X (método) Y2
Grupo de control Azar Y1
Grupo experimental Azar X (sistema de motivación) Y2

Como se puede apreciar, hacemos en realidad dos investigaciones y no


estará justificado integrar el resultado de una y otra.
Sin embargo, en el siguiente esquema, de una sola investigación, pro-
bamos las dos hipótesis y la posibilidad de interacción entre las variables
(aquí denominadas factores, por lo general).

Cuadro 4.10. Criterios para la selección del diseño adecuado.


Alternativa correcta

Sistema de motivación
M N
A M/A N/A
Método B M/B N/B
C M/C N/C

Los sujetos de cada una de las celdillas reciben el cruce del nivel corres-
pondiente de las dos v.i.

157
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Estas dos cuestiones deben completarse con otro importante aspecto: el


control de las posibles variables extrañas, antes y durante la realización del
trabajo experimental.
A tales efectos, en este momento nos debe bastar con saber:
Que hay sistemas para tratar de asegurar que, antes de aplicar la v.i.,
estamos controlando determinadas variables. Por ejemplo, la asignación al
azar de sujetos y tratamientos (en nuestro caso, métodos y sistemas de moti-
vación) es, en general, el preferido. Cuando no es posible, podemos acudir a
formar parejas de sujetos o bloques de sujetos, más o menos equiparados en
las variables relevantes. Veremos este importante aspecto más adelante.
Que debemos estar atentos, durante el tiempo de exposición de los suje-
tos a la variable independiente a que no ocurran acontecimientos que pue-
dan alterar el diseño. Este importante aspecto lo estudiaremos bajo el nom-
bre de validez interna.

3.3. Grado de generalización

Por último, un tercer criterio a tener en cuenta. Al investigador le inte-


resa ante todo, contrastar su hipótesis para poder decidir sobre su valida-
ción (no verificación), pero, una vez alzando esto, o sea, una vez lograda la
validez interna, su preocupación, como debemos recordar de aspectos ya
analizados, es la de poder extender sus conclusiones al mayor número de
sujetos y circunstancias posibles, esto es: generalizar los resultados por pro-
cedimientos de inferencia.
El análisis de la generalización, denominado validez externa, lo hare-
mos, también, más adelante.

4. PROBLEMAS EDUCATIVOS Y DISEÑOS

Como hemos señalado con anterioridad, la investigación realizada a tra-


vés del método científico experimental es transversal a prácticamente todas
las disciplinas que constituyen el curriculum pedagógico, probablemente
con la única excepción de la Filosofía de la Educación y materias anejas y,

158
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

tal vez, de las asignaturas históricas. ¿Se puede decir, pues, que todos los
problemas son abordables experimentalmente?
Esta parece ser la opinión de García Hoz15 cuando afirma:

«Cualquier cuestión pedagógica que pueda ser objeto de experiencia cae den-
tro de la Pedagogía experimental. Si muchos problemas quedan aún sin resolver
ello se debe no a la incapacidad intrínseca de la Pedagogía experimental, sino a la
imperfección actual de algunas técnicas de medida y de evaluación.»

y a la insuficiencia de ciertos diseños y de pruebas estadísticas adecuadas,


añadiríamos nosotros. García Hoz, de acuerdo con Buyse, llega a dejar fuera
de su campo únicamente «la determinación de los fines trascendentales» de la
educación y algunos temas por problemas morales, aunque reconoce que el
fin de la educación, en cuanto que ha de ser perseguido en forma progresiva,
puede ser objeto de estudio empírico, quedando únicamente fuera el fin en
cuanto tal, esto es, en cuanto que trasciende aquello de lo cual es fin.
En el mismo sentido se expresaba Piaget, para quien el que un proble-
ma sea abordable o no experimentalmente está ligado a un momento his-
tórico concreto, de tal manera que problemas típicos de la filosofía en el
siglo XIX son ahora abordados por la psicología experimental —Piaget16
pone el ejemplo del juicio en el marco de la inteligencia—; pues bien, nues-
tro autor considera que, en la medida en que un problema concreto pueda
delimitarse con suficiente precisión como «para dar lugar a una solución
por la experiencia y el cálculo» y en que las soluciones alcanzadas por este
procedimiento logren «la aceptación general de los investigadores», estamos
ante un problema abordable experimentalmente.
En el pasado, Buyse, en el II Congreso Internacional de la Enseñanza
Universitaria de la Pedagogía (Florencia, 1957), le señaló como contenido
propio para su actuación el representado por este triple campo:
• Los problemas generales referentes al estudio y el aprendizaje.
• Los problemas de didáctica experimental, referidos a la eficacia de méto-
dos y procedimientos para mejorar el rendimiento.

15
O. c., p. 93.
16
PIAGET, J. (1973). La psicología, en J. PIAGET y otros: o. c., pp. 121-198, p. 124.

159
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

• El estudio de las diferencias individuales y el tratamiento adecuado a las


deficiencias o talentos.
Más adelante, De Landsheere17 fijaría cinco grandes objetivos de inves-
tigación referidos al conocimiento:
• del alumno,
• de los educadores y de la enseñanza,
• de las materias que deben ser enseñadas
• del sistema educativo y
• de las soluciones aportadas por otros.
Por su parte, J. Simon, al estudiar el dominio propio de la disciplina,
reseña tres grandes sectores de interacciones, referidas al escolar y
a) los conocimientos,
b) los métodos, tanto generales como didácticos y,
c) sus profesores.
Como puede apreciarse existe un acuerdo prácticamente general en
referir la Pedagogía experimental —tomado este término en su sentido más
amplio de «empírica»— a una gran diversidad de campos; sin embargo,
salvo las palabras de Piaget y García Hoz, no hay una referencia expresa a
nuestra idea inicial de referirse a prácticamente todos los campos excepto
aquéllos que corresponden a materias que, como la propia Pedagogía expe-
rimental, son de carácter metodológico. En efecto, en las concreciones de
Simon, De Landsheere o de Buyse parece echarse de menos una referencia,
al menos explícita, a todo el proceso formativo, representado entre nosotros
por aquellas materias que englobamos bajo el área de Orientación, a no ser
que le otorguen un sentido muy amplio al concepto de aprendizaje; igual-
mente parecen faltar referencias explícitas a los problemas organizativos,
aunque puedan entenderse englobados bien en las referencias al sistema
educativo, bien a los tratamientos que se entienden adecuados a las defi-
ciencias o al desarrollo de los talentos.

17
LANDSHEERE, G. DE (1964). Introduction à la recherche pédagogique. París, Colin-Bourreliere, p. 16.

160
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

De cualquier manera la aplicación de la metodología experimental a


campos tan amplios y variados no puede por menos de requerir técnicas
más o menos específicas, además de un conocimiento general de aquélla, y,
por supuesto, un dominio suficientemente profundo de aquellas materias
sobre las que va a versar la investigación; ante la dificultad real para unir
en una sola persona conocimientos a veces muy dispares a un nivel de espe-
cialización suficiente, nosotros nos manifestamos por una investigación
empírica interdisciplinar dentro del marco de las ciencias de la educación,
sin excluir la participación de especialistas en otras áreas, especialmente en
economía y planificación, y, en el caso de los métodos y recursos didácti-
cos, de profesionales y especialistas en las diversas áreas (Física, Química,
idiomas, Geografía...) de docencia-aprendizaje.
Concluimos nuestra reflexión haciendo una mención expresa a la
importancia de la investigación en pro de la calidad de la educación, y acu-
dimos para ello a dos documentos de la UNESCO:
En el artículo 5 de la Declaración mundial sobre la educación superior
en el siglo XXI: Visión y acción y Marco de acción prioritaria para el cambio
y el desarrollo de la educación superior 18 leemos:

Artículo 5. Promoción del saber mediante la investigación en los ámbitos de la cien-


cia, el arte y las humanidades y la difusión de sus resultados

a) El progreso del conocimiento mediante la investigación es una función esencial de


todos los sistemas de educación superior que tienen el deber de promover los estudios
de postgrado. Deberían fomentarse y reforzarse la innovación, la interdisciplinariedad
y la transdisciplinariedad en los programas, fundando las orientaciones a largo plazo
en los objetivos y necesidades sociales y culturales. Se debería establecer un equilibrio
adecuado entre la investigación fundamental y la orientada hacia objetivos específicos.
b) Las instituciones deberán velar por que todos los miembros de la comunidad acadé-
mica que realizan investigaciones reciban formación, recursos y apoyo suficientes. Los
derechos intelectuales y culturales derivados de las conclusiones de la investigación debe-
rían utilizarse en provecho de la humanidad y protegerse para evitar su uso indebido.
c) Se debería incrementar la investigación en todas las disciplinas, comprendidas las
ciencias sociales y humanas, las ciencias de la educación (incluida la investigación sobre

18
http://www.unesco.org/education/educprog/wche/declaration_spa.htm

161
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

la educación superior), la ingeniería, las ciencias naturales, las matemáticas, la infor-


mática y las artes, en el marco de políticas nacionales, regionales e internacionales de
investigación y desarrollo. Reviste especial importancia el fomento de las capacidades
de investigación en los establecimientos de enseñanza superior con funciones de inves-
tigación puesto que cuando la educación superior y la investigación se llevan a cabo en
un alto nivel dentro de la misma institución se logra una potenciación mutua de la cali-
dad. Estas instituciones deberían obtener el apoyo material y financiero necesario de
fuentes públicas y privadas.

Y más adelante, en su artículo 11, en relación con la evaluación de la


calidad, íntimamente ligada a la evaluación en su enfoque de investigación
evaluativa, se lee

Artículo 11. Evaluación de la calidad

a) La calidad de la enseñanza superior es un concepto pluridimensional que


debería comprender todas sus funciones y actividades: enseñanza y programas
académicos, investigación y becas, personal, estudiantes, edificios, instalaciones,
equipamiento y servicios a la comunidad y al mundo universitario. Una autoeva-
luación interna y un examen externo realizados con transparencia por expertos
independientes, en lo posible especializados en lo internacional, son esenciales
para la mejora de la calidad. Deberían crearse instancias nacionales indepen-
dientes, y definirse normas comparativas de calidad, reconocidas en el plano
internacional. Con miras a tener en cuenta la diversidad y evitar la unifor-
midad, debería prestarse la atención debida a las particularidades de los
contextos institucional, nacional y regional. Los protagonistas deben ser parte
integrante del proceso de evaluación institucional.
b) La calidad requiere también que la enseñanza superior esté caracterizada por su
dimensión internacional: el intercambio de conocimientos, la creación de sistemas
interactivos, la movilidad de profesores y estudiantes y los proyectos de investigación
internacionales, aun cuando se tengan debidamente en cuenta los valores culturales
y las situaciones nacionales.
c) Para lograr y mantener la calidad nacional, regional o internacional, ciertos elemen-
tos son especialmente importantes, principalmente la selección esmerada del perso-
nal y su perfeccionamiento constante, en particular mediante la promoción de planes
de estudios adecuados para el perfeccionamiento del personal universitario, incluida
la metodología del proceso pedagógico, y mediante la movilidad entre los países y los
establecimientos de enseñanza superior y entre los establecimientos de educación

162
DISEÑO DE LA INVESTIGACIÓN. PROBLEMAS EDUCATIVOS Y DISEÑOS. TIPOS DE DISEÑOS: NO EXPERIMENTALES, CUASI-EXPERIMENTALES Y EXPERIMENTALES

superior y el mundo del trabajo, así como la movilidad de los estudiantes en cada país
y entre los distintos países. Las nuevas tecnologías de la información constituyen un
instrumento importante en este proceso debido a su impacto en la adquisición de
conocimientos teóricos y prácticos.

El comunicado de la Conferencia Mundial sobre la Educación Supe-


rior, 2009: La nueva dinámica de la educación superior y la investi-
gación para el cambio social y el desarrollo19, afirma en sus puntos 17
y 18:
17. Los resultados de la investigación científica deberían difundirse más ampliamente
mediante las TIC y el acceso gratuito a la documentación científica.
18. La formación que ofrecen los establecimientos de enseñanza superior debería aten-
der las necesidades sociales y anticiparse al mismo tiempo a ellas. Esto comprende la
promoción de la investigación con miras a elaborar y aplicar nuevas tecnologías y a
garantizar la prestación de capacitación técnica y profesional, la educación empresarial
y los programas de aprendizaje a lo largo de toda la vida.

RESUMEN

Una vez recordado lo que representa la investigación científica, hemos


analizado dos grandes cuestiones:
La primera se refiere a uno de los dos conceptos de nuestra asignatura,
el diseño. Tras considerar algunas definiciones, nos hemos centrado en la
ofrecida por Kerlinger, como el plan, la estructura y la estrategia de la inves-
tigación, por su calidad y capacidad de síntesis, así como por añadir, en
forma breve, sus dos grandes objetivos: responder a las preguntas de la inves-
tigación y controlar la varianza.
El concepto de diseño ha sido desarrollado mediante la consideración y
la caracterización de los tres grandes tipos: pre-experimentales, experimen-
tales y cuasi-experimentales, así como sus puntos fuertes y sus limitaciones.
La segunda gran cuestión analizada tiene que ver con los criterios que
deben someterse a consideración del investigador antes de decidir cuál es
el diseño más adecuado. En este punto, hemos tomado como referencia los

19
Vid. http://www.unesco.org/education/WCHE2009/comunicado_es.pdf

163
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

objetivos citados por Kerlinger: responder a las preguntas de la investiga-


ción y controlar la varianza En igualdad de estas características, añadimos
un tercer criterio, grado de generalización, dado que, añade a su validez
interna un mayor o menor grado de generalización de los resultados.
Por último, hemos analizado las posibilidades de aplicación de la meto-
dología científico-experimental, en su acepción más amplia, entendida esta
como «empírica», a los diferentes ámbitos y problemas educativos, com-
probando su gran aplicabilidad y su relación con la mejora de la calidad de
la Educación, aportando al respecto las ideas de UNESCO.

164
Tema 5
El experimento como referencia. Validez de los
diseños. La investigación ex-post-facto como
alternativa

Presentación

1. Introducción

2. El experimento y sus notas


2.1. Notas o características
2.1.1. Cambio planificado o provocación del fenómeno
2.1.2. Control
2.1.3. Medición
2.2. Tipos y características
2.2.1. Experimento de laboratorio
2.2.2. Experimento de campo
2.3. Limitaciones del experimento
2.3.1. Adecuación del experimento a la Educación

3. La validez de los diseños


3.1. Factores de invalidez interna de los diseños
3.2. Factores de invalidez externa de los diseños

4. La investigación ex-post-facto como alternativa


4.1. Concepto y características
4.2. Algunas modalidades
4.2.1. Los estudios de campo
4.2.2. Estudios transversales y longitudinales
4.2.3. Los estudios de casos

Resumen

165
PRESENTACIÓN

En este capítulo se aborda el estudio del experimento como meta ideal


del paradigma positivista. En el experimento, cuando está bien planteado,
se pueden someter a contraste hipótesis causales, esto es, hipótesis conoci-
das como de «implicación general», cuya formulación es:
«si… entonces…»
Por ejemplo: «si los alumnos estudian con métodos activos, entonces
alcanzarán las competencias en mayor grado».
En tal situación, los métodos activos, la variable que manipula el inves-
tigador (variable independiente) se convertiría en la causa de los mejores
resultados en el logro de las competencias (variable dependiente).
Pero, para alcanzar este nivel, el diseño debe asegurar el control de
cualquier hipótesis rival del investigador; tales hipótesis rivales o alternati-
vas suelen tomar el nombre de variables extrañas, esto es, variables que el
investigador no tiene bajo su control por lo que, caso de actuar, pueden
influir en la variable dependiente por si solas o junto a la variable indepen-
diente del investigador, invalidando el diseño al no poder mantenerse tal
hipótesis por no tener la certeza de que es aquella y sólo aquella la que pro-
duce los efectos hipotetizados.
Así, si resultara que el profesor que utiliza métodos activos tuviera una
superior formación y experiencia al que no los utiliza, los resultados supe-
riores de aquel, en caso de que se dieran, bien podrían explicar los resulta-
dos finales, solos o en unión con el método activo. O si los métodos activos
se utilizan en sesión matinal, cuando los alumnos están más atentos y des-
piertos, y los no activos se aplican por la tarde, nos entrará la duda razo-
nable de si los resultados se deben sólo o en parte a la diferencia en los
horarios.

167
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

A todos estos problemas se hace alusión con el término «validez», en


concreto cuando nos referimos a la validez interna; también se hablará de
otros tipos de validez.

1. INTRODUCCIÓN

El campo propio de nuestro ámbito de estudio es todo aquel de origen


empírico que cumpla las notas que lo convierten en científico; ahora bien,
resulta difícil lograr una clasificación de las diversas modalidades de investi-
gación empírica medianamente aceptada por los estudiosos del tema, como
se puede apreciar consultando la bibliografía al respecto1. En consecuencia,
la clasificación que ofrecemos, sobre ser una más, pretende basarse en crite-
rios de simplicidad y relevancia, acudiendo para ello a la clásica distin-
ción entre los procesos de investigación que toman la realidad sin alte-
rarla —observación científica2— y aquellos otros que requieren la
provocación del fenómeno a estudiar, o experimentación en sentido estricto;
ambas formas básicas de investigación empírica admiten modalidades varia-
das según el grado en que posean determinadas características, en especial la
de control. Entre una y otra, la investigación ex-post-facto, fundamentalmen-
te realizada a través de la evaluación y medición de la realidad y de los fenó-
menos ya acontecidos, dentro de la cual, y siguiendo el criterio de relevancia,
destacaremos la encuesta para su importancia y nivel de utilización.
Pasamos pues, a considerar los grandes tipos de la investigación empí-
rica y sus principales modalidades.

2. EL EXPERIMENTO Y SUS NOTAS

De todas las formas de experiencia científica, el experimento es, sin


duda, aquélla que es capaz no sólo de ofrecer resultados y conclusiones más

1
El lector puede comprobar la diversidad de clasificaciones en BEST, J.W., o. c., pp. 47-94; VAN DALEN,
D.B. y otro: o. c., pp. 191-321; BORG: (1963). Educational Research. An Introduction, New York: McKey; SAX:
Empirical Foundations of Educational Research, Englewoods Cliffs: Prentice Hall; TRAVERS, R. M. W. (1969).
Introducción a la Investigación Educacional, Buenos Aires: Paidós; KERLINGER, F. N. (1975). Investigación
del comportamiento, México: Interamericana, pp. 393-442; o FOX, D. J., o. c., pp. 119-142.
2
Conviene dejar constancia de que, en el marco del experimento, una vez provocado el fenómeno,
los datos pueden recogerse mediante una observación planificada, sistemática, que responda a los plan-
teamientos de M. Bunge: ser intencionada e ilustrada.

168
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

fiables sino, y esto es lo más importante tal vez, la única capaz de permitir
el establecimiento de relaciones causa-efecto3.
Si éstas son sus aportaciones, y lo son de gran importancia, convendre-
mos en la necesidad de precisar y profundizar un tanto en sus característi-
cas como medio adecuado para decidir tanto sobre su viabilidad cuanto
sobre su utilización real en el ámbito educativo.

2.1. Notas o características

Tres parecen ser las notas o características esenciales, centradas las pri-
meras en el dominio que ejerce el investigador, dominio que se traduce en
la capacidad para provocar el fenómeno y para mantenerlo bajo control, y
la tercera con la superior precisión a que hemos aludido, la utilización de
la medición. Profundicemos en ellas.

2.1.1. Cambio planificado o provocación del fenómeno

La capacidad del investigador para provocar el fenómeno tiene, al


menos, dos virtualidades que permiten, de una parte, al producirlo en el
momento que le interese, no sólo hallarse dispuesto y con todo preparado
para observar y registrar sus datos en las mejores condiciones, con la con-
siguiente repercusión en su fiabilidad, sino que el fenómeno se produzca en
las condiciones relevantes al problema, no sólo desde el punto de vista de
las circunstancias espacio-temporales, sino desde las de oportunidad en vir-
tud de las características personales y formales de las personas y relaciones
implicadas.
Pero esto no es todo; en efecto, la posibilidad de reproducirlo una y otra
vez permite el cumplimiento de una de las notas que veíamos caracterizar

3
Page, refiriéndose a la causalidad, cita otras vías de acceso que darán un gran impulso a las cien-
cias de la educación, vías que tienen en su origen a Sewal Wright, y se basan en la observación, no en
el experimento, siendo conocidas como análisis de sendas o análisis causal. Vid. PAGE, E.B. (1981). «El
extraño en el barrio». «La nueva disciplina en las Ciencias de la Educación». En ESCUELA ASTURIANA DE
ESTUDIOS HISPÁNICOS (1981). La calidad de la Educación. Madrid: CSIC. Instituto San José de Calasanz,
pp. 89-109.

169
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

el conocimiento científico, la verificabilidad inter e intra-subjetivas, nota


relacionada y exigida por muchos autores4.
Cabe resaltar otra consecuencia positiva derivada, asimismo, de la
posibilidad de provocación del fenómeno a voluntad; se trata de la repli-
cación que si, en idénticas condiciones y con muestras de sujetos diferen-
tes, confiere mayor fiabilidad a la generalización —validez externa— de los
resultados, variando las condiciones y circunstancias —replicación siste-
mática5— y si los resultados se manifiestan compatibles, permite generali-
zaciones más amplias que facilitan la formulación de leyes y el estableci-
miento de teorías.
No parece necesario detenernos en la necesidad de que el experimento,
como cualquier forma de investigación, requiere la acción intencionada y
guiada, esto es, puesta al servicio de los objetivos científicos que en cada
caso se pretenden. Es necesario que haya una observación intencionada del
fenómeno para poder «ver algo» en ello, una observación del fenómeno al
servicio de una idea directriz, de una meta a probar, de una hipótesis. La
actividad así organizada permite la concentración de los esfuerzos, evita la
dispersión de la atención, facilita la precisión en la observación y hace de
ella algo racional y en modo alguno casual o azaroso.

2.1.2. Control

Pero esta acción, que confiere sentido científico, no es de por sí eficaz si


las observaciones no se producen en un marco de control, cuya misión
esencial no es otra que descartar hipótesis rivales a la del investigador, a la
hora de afirmar que los efectos medidos en la variable dependiente —v.d.—
son debidos a y sólo a —causalidad— la variable independiente.
El control presenta diversas facetas que debemos considerar a conti-
nuación. En primer lugar hace falta un control de las condiciones en que el
experimento se produce; el dominio al que aludíamos al principio permite

4
Entre otros POPPER, K.R. (1977). La lógica de la investigación científica, Madrid: Tecnos, 99-100 o
ARNAU, J. (1979) Psicología Experimental, México: Trillas, p. 14. Previamente, S.S. Stevens, en 1939, ya
se había manifestado en ese sentido (Psychology and the Science of Sciences, en Psychological Bulletin,
36, pp. 261-263)
5
Vid. SIDMAN, M. (1978). Tácticas de investigación científica. Barcelona: Fontanella, 75-139

170
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

una forma de control consistente en que el investigador decide qué niveles


de v.i. —manipulación— son los que intervienen, es decir, modifica inten-
cionada y deliberadamente las condiciones para averiguar los efectos de
tales variaciones.
Así, puede hacer que un grupo de alumnos realice un examen en con-
diciones llamémoslas normales de ruido, temperatura y luz, mientras
que otro u otros grupos soporten niveles de ruido superiores, se exami-
nen en condiciones de temperatura inadecuados —calor o frío— o con
defecto de luz, con el fin de apreciar los efectos sobre el rendimiento aca-
démico. Naturalmente la atribución de tales efectos a las variaciones de
ruido, temperatura y luz —v.i.— sólo está justificada si no hay hipótesis
rivales que puedan explicarlos; entre tales hipótesis rivales podrían estar
la existencia de diferencias iniciales en inteligencia entre los grupos, la
acción diferenciada de los profesores de los grupos durante el experi-
mento —diferente metodología— edades distintas en los componentes de
ambos grupos, diferente duración del período dedicado a la preparación
de la materia objeto de examen, etc. Es decir, hay posibles diferencias
iniciales que podrían contribuir a los resultados finales, y a evitarlo se
dirigen las acciones a las que nos hemos referido, esto es, junto al rese-
ñado control inicial sobre la v.i. es necesario el control sobre los sujetos
en la formación de los grupos.
Ahora bien, con esto no basta; además es necesario mantener bajo con-
trol el proceso, evitando la aparición de variables extrañas que puedan con-
taminar los resultados finales. El problema de algunas de estas facetas del
control radica en que, como afirma Bunge, para lograrlo hace falta una lista
de sospechosos de la que no siempre disponemos. Una de las estrategias
fundamentales del control consiste en el grupo, o en los grupos, de control
o testigos. Como muy bien afirma Bunge:

«Si hay variaciones individuales apreciables, como ocurre en las ciencias no


físicas y en la tecnología, entonces hay que escoger colecciones de sistemas seme-
jantes, no ya de individuos; o sea, hay que formar un grupo experimental y un
grupo de control (o neutral) de tal modo que la única diferencia apreciable entre
ellos se deba a los estímulos situados bajo control del experimentador, y activos
sobre el grupo experimental, no sobre el grupo de control.» (pp. 830 s).

171
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La formación de ambos tipos de grupos6 puede llevarse a cabo con


técnicas individuales, como el apareamiento o emparejamiento, o colec-
tivas, éstas de carácter estadístico, bien sea por igualación en medidas
representativas de grupos (promedios, variabilidad...), bien por procedi-
miento del azar, que pretenden evitar cualquier tipo de tendenciosidad o
parcialidad.

2.1.3. Medición

Aunque en determinadas ocasiones se puedan dar, y se dan, experimen-


tos de carácter cualitativo, en los que se toman en consideración la inter-
vención y la aparición o no de determinadas variables, pero no son valora-
das cuantitativamente, la mayoría de los experimentos son cuantitativos,
requiriendo mediciones objetivas de v.d., y en ocasiones, y como medio de
igualar —emparejamiento— o controlar diferencias iniciales mediante pre-
tests, también en v.i.
Aquí aparece la necesidad de medición a que aludimos en momentos
anteriores como una de las notas distintivas de la metodología experimen-
tal y, consiguientemente, de técnicas adecuadas, eficaces, fiables y válidas
para dicho registro y cuantificación, técnicas para las que Bunge pide con-
validación doble: de índole teorética y experimental, la segunda para que
demuestren en la realidad su valía, al margen de justificaciones racionales
que pueden pasar por alto circunstancias reales que las invaliden, y la pri-
mera para evitar que el «funcionamiento» real sea algo puramente casual y
esporádico y, por tanto, no constante:

«Incluso una técnica que tenga éxito debe considerarse sospechosa mientras
sus éxitos —y sus limitaciones— no se expliquen en base a teorías científicas.»
(p. 849).

6
Conviene señalar, de una parte, que cabe contar con dos o más grupos de control frente a uno
experimental. Pero también podemos trabajar con varios grupos experimentales en los que cada uno
puede actuar como control de los demás: lo importante es poder proceder a la comparación de un nivel
de la v.i. frente a otro a frente a un nivel 0, esto es: la ausencia de v.i. Al respecto se puede acudir a cita-
da obra de Kerlinger, pp. 346 s.

172
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

2.2. Tipos y características

Sin embargo es necesario precisar que, cuanto llevamos dicho sobre el


experimento en general, es aplicable en diferente medida a las dos grandes
categorías de éste. En efecto, la realización estricta del experimento requie-
re un marco especial en que tales características puedan ser aplicadas,
marco que no es otro que el de laboratorio, cuya aplicación a la investiga-
ción pedagógica es menos frecuente y posible que a la psicológica, espe-
cialmente cuando ésta utiliza sujetos animales.

2.2.1. Experimento de laboratorio

El experimento de laboratorio es pues, prácticamente, el que acabamos


de definir; su sentido esencial es el de marco ideal para la investigación
pura y fundamental que permita identificar variables relevantes, elaborar
leyes, contrastar teorías.

2.2.2. Experimento de campo

Pero es preciso averiguar cómo funcionan tales descubrimientos en el


marco real de las comunidades educativas, objetivo propio de lo que se
conoce como experimento de campo, cuya caracterización vamos a abordar
a continuación y cuya importancia resaltó K. Lewin7.
Para French8 las características que le definen se centran en tres aspec-
tos: el diseño, la situación y el propósito.
Respecto del primer punto, el diseño, señala que al investigador le
incumbe la planificación del experimento por adelantado, siendo la v.i. ide-
ada, al menos en parte, por él. Para Kerlinger (p. 419) la diferencia en este
aspecto entre ambas modalidades de experimento es cuestión de grado,
hasta tal punto que, en ocasiones, parece difícil decidir si se trata de un
experimento de una u otra categoría. Probablemente la mayor debilidad en

7
Vid. LEWIN, K. (1951). Field Theory in Social Science. New York: Harper.
8
FRENCH, J.R.P. (1979). Experimentos en contextos de campo. En L. FESTINGER y otro (comp.). Los
métodos de investigación en las ciencias sociales. 3ª reimpr. Buenos Aires: Paidós, pp. 104-106.

173
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

este punto radica no en la posibilidad de control de la v.i. sino de que ésta


se encuentre contaminada por alguna variable extraña de carácter ambien-
tal, difícilmente removible por el experimentador salvo cuando el ambien-
te lo crea él (laboratorio).
El segundo aspecto se refiere al contexto o situación, situación real y
natural, y no artificial, como ocurre en el laboratorio. El experimento de
campo pretende llevarse a cabo en situaciones o contextos que, permitien-
do un grado de control suficiente, no lleven a los sujetos a «comportarse»
como tales, sino como lo harían en situaciones ajenas a una investigación,
lo que redunda en la validez de los resultados, entendida como que éstos
puedan ser extensibles a individuos diferentes. Con ello se pretende evitar
una de las limitaciones de la investigación humana consistente en que los
individuos tienden a modificar su comportamiento por el mero hecho de
sentirse observados o de ser sujetos de un experimento.
El tercer aspecto se refiere a los propósitos de este tipo de investigacio-
nes, que sitúa el autor en la prueba de hipótesis; en concreto, y de una
manera más específica, su objetivo fundamental se orienta a la comproba-
ción de la «aplicabilidad a situaciones de la vida real de leyes científicas cono-
cidas o de hipótesis específicamente desarrolladas en situaciones controladas
de laboratorio» (p. 105).

2.3. Limitaciones del experimento

Si tales son las características del experimento, de laboratorio y de


campo, y las virtualidades que llevan aparejadas, conviene hablar de sus
limitaciones o, si se prefiere mejor, de su alcance, es decir, de lo que se
puede y no se puede esperar de él. Si, de una parte, es la forma de expe-
riencia científica más precisa y sensible, por utilizar instrumentos refina-
dos en situaciones capaces de aminorar o eliminar «ruidos» que pudieran
obscurecer los resultados experimentales —maximización de la varianza
experimental y minimización del error, en terminología de Kerlinger— a la
vez que más válida —validez interna— como consecuencia del control que
es capaz de lograr, de otra todo ello se consigue en situaciones estilizadas,
idealizadas, en resumen, artificiales, que limitan grandemente la generali-
zación de los resultados. Claro que, como afirma Kerlinger, no se puede

174
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

hacer de la artificialidad, que es una característica, una acusación; en todo


caso estaremos ante una limitación nacida de que se ha primado el control,
exigencia de validez interna, frente a la generalización.
La aludida artificialidad se traduce en una superior simplicidad de las
situaciones, lo que las hace más fácilmente accesibles y tratables, pero, evi-
dentemente, las aleja de la realidad cotidiana a la que se pretenden aplicar
sus resultados.
Así las cosas, ¿cuál es el sentido y función del experimento? Kerlinger lo
expresa magistralmente9:

a) descubrir relaciones en condiciones «puras» y no contaminadas;


b) probar predicciones derivadas de la teoría o de otra investigación;
c) refinar teorías e hipótesis y ayudar a elaborar sistemas teóricos.

Así pues, la debilidad del experimento, traducible en limitaciones a la


generalización, no es sino un freno a extensiones injustificadas que única-
mente serían correctas si los resultados obtenidos en el laboratorio o en la
situación natural aludida han sido comprobados en situaciones más reales
y no alteradas. Como afirma Kerlinger, «ésta es una cuestión empírica, no
especulativa» (p. 417), es decir, no puede el investigador concluir que, como
tal cosa ocurrió en experimentos, acontecerá necesariamente en la realidad
educativa.

2.3.1. Adecuación del experimento a la Educación

Como hemos podido observar, la característica esencial de control es la


que define fundamentalmente la investigación estrictamente experimental
o experimento. Ella es la que diferencia entre los tipos de experimento a
que hemos aludido y la que permitirá establecer diferencias con la investi-
gación ex-post-facto. La adecuación al estudio de la Educación será en gran
medida el resultado de la posibilidad misma del control y de las dificulta-
des existentes para su logro. Una síntesis de tales dificultades las encontra-
mos en la excelente exposición de Fox que, en poco más de dos páginas, da

9
P. 418

175
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

todo un curso sobre el tema. Ya sabemos que lo que denominamos validez


interna no es otra cosa que poder asegurar que, frente a otras posibles
variables, es la v.i. y sólo ella la que produce —causa-efecto— los resultados
medidos en v.d. Pues bien, Fox dice al respecto:

«Esta afirmación es esencialmente teórica, ya que en la realidad, en las disci-


plinas sociales, muy pocas veces se pueden eliminar completamente todos los
demás factores significativos.» (p. 512).

Y justifica su afirmación sobre la base de varios aspectos, a los que, de


manera más o menos explícita, nos hemos referido en temas anteriores. El pri-
mero de ellos no es otro que el desconocimiento inicial de, precisamente, los
factores que han de ser controlados por resultar relevantes a la situación estu-
diada, lo que ocurre especialmente en las etapas primitivas de las ciencias en
las que se carece de un elenco suficiente de estudios correlacionales; el des-
arrollo progresivo y el conocimiento del estado de la cuestión pueden ir evi-
tando esta limitación; así por ejemplo, en los estudios de Kretschmer sobre
tipologías, la falta de control de la variable edad —variable extraña en este
caso— daba como resultado correlaciones entre constitución física y tempe-
ramento muy elevadas que, al ser controlada aquélla, se reducían sustancial-
mente10; si en su tiempo había una disculpa para este fallo, en el nuestro ya no
la habría pues ya se sabe de la importancia de la edad en este tipo de estudios.
La segunda dificultad se refiere a la posibilidad misma de medir las
variables a controlar, punto éste al que ya nos hemos referido con suficien-
te extensión. Los dos aspectos siguientes son asimismo serios obstáculos, y
se refieren a la disponibilidad de sujetos —profesores, alumnos, padres,
hijos...— que puedan ser atribuidos a los grupos para ejercer el control, así
como a la posibilidad de mantener el control inicialmente establecido. En
efecto, pocas veces puede el investigador disponer de personas de determi-
nadas características diferenciadas que puedan ser atribuidas a grupos con
la pretensión de comprobar su efecto sobre otros sujetos, o de asignar suje-
tos a grupos al azar, pongamos por ejemplo. Pero todavía más: cuando se
concibe un experimento en adecuadas condiciones, es necesario evitar que,

10
El lector puede acudir a GARVEY, C.R. (1933). Comparative body build of maniac-depresive and
schizophrenic patients. En Psychological Bulletin, 30.

176
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

durante su desarrollo, se den influencias diferenciales —a favor o en contra


de un grupo y no de otro—, o lo que es a veces más difícil, el intercambio
de información entre sujetos de diferentes grupos; así, si para lograr cir-
cunstancias similares, por ejemplo, se trabaja con dos grupos de una
misma institución educativa, no sería nada extraño el intercambio de infor-
mación entre profesores y alumnos de ambos tipos de grupos; pero si, para
evitar esto, tomamos grupos de diferentes unidades escolares, será muy
difícil asegurar que el conjunto de circunstancias que se dan durante el
tiempo del experimento, por lo general largo dentro de las Ciencias de la
Educación, sea intercambiable.
Así las cosas, parece más adecuado el experimento de campo por su
mayor flexibilidad, que se traduce en una superior aplicabilidad, aunque
para ello tenga que superar hasta donde sea posible las dos grandes limita-
ciones a que se refiere Kerlinger, las de manipulación de las v.i. y de asig-
nación al azar. Sin embargo la situación real hace posible estudiar los fenó-
menos en toda o en gran parte de su complejidad, con las consiguientes
interacciones entre variables lo que, si se dispone de modelos adecuados, de
técnicas estadísticas idóneas y de la correspondiente tecnología —ordena-
dores— puede dar lugar a la resolución de muchos de los problemas que
tienen planteadas las Ciencias de la Educación.

3. LA VALIDEZ DE LOS DISEÑOS

Siguiendo el texto clásico de Campbell y Stanley11, debemos considerar


dos grandes grupos de fuentes de invalidez de los diseños; se trata de diver-
sos factores que atentan contra la validez interna o la externa.
Al referirse a la validez interna, los citados autores afirman que es la
«mínima e imprescindible, sin la cual es imposible interpretar el modelo:
¿Introducirían, en realidad una diferencia los tratamientos empíricos en este
caso experimental concreto?» (p. 16). Como la hemos definido ya en otro
lugar, si existe tal validez podremos afirmar que las diferencias apreciadas
en la variable dependiente se deben a, y sólo a, la variable independiente.

11
CAMPBELL, D. y STANLEY, J. (1979). Diseños experimentales y cuasiexperimentales en la investiga-
ción social. Buenos Aires: Amorrortu ediciones.

177
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Por el contrario, la validez externa se plantea la posibilidad de generali-


zar los resultados de la investigación y el alcance de tal generalización.
Teniendo en cuenta esa finalidad del saber pedagógico que es llegar a
leyes tan generales como sea posible, de forma que los resultados alcanza-
dos con unos sujetos puedan aplicarse a otros diferentes que formen parte
de la misma población, el desideratum será llegar a diseños que, cumplien-
do con la validez interna, puedan alcanzar los más amplios niveles de vali-
dez externa.
Sin embargo, hemos de ser conscientes de que, cuanta mayor validez
interna logremos, las posibilidades de generalización se irán reduciendo; en
efecto: como tendremos ocasión de comprobar, la primera exigirá ir con-
trolando variables por procedimientos diferentes, lo que, en paralelo, repre-
senta la necesidad de limitar la aplicación de los resultados a aquellos casos
y situaciones que cumplan con tales condiciones.
Así, a un investigador le puede interesar poder afirmar que, en general,
los métodos cooperativos son más eficaces para el estudio de los idiomas
que aquellos otros en que los alumnos trabajan de modo independiente.
Fácilmente se comprenderá las dificultades para poder contar con suje-
tos representativos de todas las posibles variables. Así, por ejemplo, estu-
diantes de ambos sexos, de todas las edades, que estudian en todo tipo de
colegios, que cursan los principales idiomas que se hablan en un país, que
los estudian en todo tipo de centros —desde los colegios y universidades a
las academias—, con todo tipo de profesores…
Como esto resulta prácticamente imposible, el investigador puede ir
reduciendo su campo de trabajo a niños de 6 años, en colegios públicos,
con profesores nativos, que estudian inglés. Esta acotación de los sujetos
lleva implícita su generalización sólo a sujetos que cumplan con tales con-
diciones.

3.1. Factores de invalidez interna de los diseños

Presentamos a continuación los factores de invalidez interna, esto es,


aquellos que, en caso de darse, no permiten establecer la relación causa –
efecto entre la v.i. y la v.d.

178
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Historia. Se entiende por tal los hechos que ocurren, además de la varia-
ble independiente, entre el inicio de la investigación (introducción de la v.i.)
y la medida de la v.d., y que actúen diferencialmente sobre los grupos.
Por ejemplo, si se pretende probar que un determinado método de ense-
ñanza de idiomas es más eficaz que otro, tomaremos un diseño de dos gru-
pos, el experimental y el control. En el caso de que, además de la variable
método, con dos niveles o manifestaciones, uno de los grupos experimenta-
ra el cambio de profesor por enfermedad, podría ocurrir que este cambio
supusiera un influjo —positivo o negativo— que no afecta al otro grupo.
Este sencillo hecho lleva a tener dudas razonables sobre si lo medido en la
v.d. es fruto de la v.i., de este factor o de su interacción. Y ante la duda,
debemos considerar que el diseño no tiene validez interna.
Maduración. Este factor, lejos de ser ajeno al experimento, como ocurre
en el caso anterior, afecta directamente a los sujetos participantes. Su apa-
rición es tanto más probable cuanto mayor sea la duración del estudio y
cuanto más jóvenes sean los sujetos.
Los cambios madurativos ligados a la edad son el ejemplo más sencillo.
Los niños cambian con mucha mayor rapidez que los adultos, tanto en esta-
tura como en peso, pero también en inteligencia o personalidad.
Si en el caso anterior, el experimento dura un curso y los sujetos tienen
tres años, podría ocurrir que parte de los cambios pudieran deberse a la
maduración psicológica y fisiológica, sobre todo si no han sido selecciona-
dos al azar.
Otros factores que pueden ser considerados como «maduración» pue-
den ser determinadas reacciones psicofisiológicas, como el hambre, la sed,
el cansancio… siempre que afecten de modo diferencial a los grupos del
experimento.
Administración de pruebas. Someter a los sujetos a una prueba puede
producir un efecto sobre la v.d. en paralelo al atribuible a la v.i. En los dise-
ños con pre-test, habituales en educación como alternativa al azar en la
asignación de sujetos, cabe pensar en el efecto que tal pretest puede tener
sobre la medida de la variable dependiente, en especial en casos relaciona-
dos con las actitudes y los valores, y en menor grado cuando se trata de
pruebas académicas.

179
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Así, en el caso de una investigación destinada a probar el efecto de dos


tratamientos, por ejemplo el cine forum y el taller, para mejorar las actitu-
des hacia la inmigración, si se forman los grupos previa la aplicación de
una prueba de actitudes hacia los inmigrantes, esta prueba podría sensibi-
lizar a los sujetos hacia tal problema e influir en las respuestas finales en la
prueba para medir la variable dependiente.
Instrumentación. En este caso estamos ante el influjo que pueda produ-
cirse en los resultados de la v.d. como consecuencia de los cambios en lo
relacionado con los instrumentos de medida, con quienes los utilizan o con
quienes puntúan o califican.
Pensemos en las diferencias habituales en nuestro campo cuando un
mismo evaluador califica las pruebas en dos ocasiones diferentes, o cuan-
do dos evaluadores califican por separado la misma prueba; el hecho puede
ser mucho más profundo cuando de lo que se trate es de registrar el resul-
tado de la observación.
La mejor manera de evitar, o reducir, tales efectos, es que sea la misma
persona la que realice estas tareas; incluso, acudir a dos observadores o
calificadores para asignar las puntuaciones, analizando las discrepancias
antes de dar por buenos los resultados o asignando la media de los valores
en que se dé discrepancia.
Regresión estadística. La regresión es la tendencia existente en el caso
de puntuaciones extremas de «regresar» hacia la media del grupo. Cuan-
do los sujetos de la investigación se seleccionan a partir de las puntua-
ciones más elevadas o más bajas, esa tendencia hará bajar las puntua-
ciones en el primer caso o elevarlas en el segundo, y este efecto podrá
confundirse con el producido por la v.i. Si este hecho actúa diferencial-
mente sobre los grupos experimental y de control estaremos ante un caso
de invalidez interna.
Este término deriva de los trabajos de F. Galton sobre la herencia, en un
libro publicado en 1889 bajo el título Natural inheritance. Galton pudo com-
probar la tendencia de los hijos de padres de elevada estatura a «regresar»
hacia la media, esto es: a tener también hijos altos, pero en un grado menor.
A partir de estos datos, Galton formuló su «ley de la regresión universal»,
confirmada por K. Pearson.

180
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Selección diferencial. Cuando la selección de los sujetos no se realiza por


un procedimiento de azar, es probable que los grupos tengan una compo-
sición inicial no comparable, con ventaja de uno sobre otro. Este hecho
puede dar lugar a diferencias finales que oculten o aumenten las debidas al
efecto de la v.i., mezclándose con ellas e invalidando el diseño.
Tal puede ser el caso de una investigación sobre el efecto de dos méto-
dos de enseñanza aplicados a sendos grupos naturales de un centro educa-
tivo. Si tales grupos no son inicialmente equiparables en las variables rela-
cionadas con la dependiente, tales diferencias iniciales pueden incidir
diferencialmente en el efecto de la v.i. sobre la dependiente.
Mortalidad experimental. No se trata de muerte de sujetos sino de una
pérdida de estos, algo que ocurre con más frecuencia cuando el experi-
mento tiene larga duración. Traslados familiares, enfermedades, etc. pue-
den hacer que grupos inicialmente equiparados pierdan sujetos que, si no
son equiparables en los dos grupos, den lugar a resultados finales no atri-
buibles a la v.i., o solo a ella, sino también a este hecho diferencial.
En efecto, si de uno de los grupos se pierden sujetos más inteligentes,
más preparados, más motivados… que del otro, sus puntuaciones menores
pueden deberse al efecto de la v.i., pero también a lo que representa perder
sujetos con puntuaciones más elevadas. Lógicamente, lo mismo, pero al
contrario, podrá ocurrir si los que se pierden son los menos interesados,
preparados o inteligentes.
Interacción entre dos o más factores anteriores. La interacción es la acción
conjunta de dos o más factores. Así, puede actuar conjuntamente la madura-
ción y la regresión, o la historia y la maduración… dando lugar a efectos
sobre la v.d. que bien pudieran confundirse con los de la independiente.

3.2. Factores de invalidez externa de los diseños

Recordemos que nos estamos refiriendo a aquellos factores que limitan


la posibilidad de generalizar los resultados. Los principales factores son:
Efecto reactivo de las pruebas. Recordemos el factor administración de
pruebas en la validez interna. Si una prueba previa o pretest puede sensibi-
lizar a los sujetos sobre un problema e influir en cómo lo ven después de

181
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

haberla realizado, no cabe duda de que la generalización de los resultados


solo podría hacerse para sujetos que hayan experimentado dicha prueba y
no en general.
En el ámbito puramente académico este efecto es limitado, dado que los
sujetos / alumnos están acostumbrados a realizar pruebas académicas. Pero
no es lo mismo en otros ámbitos de la educación, como las actitudes.
Interacción entre selección de sujetos y variable independiente. Al igual que
en el caso anterior, si se diera una selección sesgada de sujetos en variables
relacionadas con la dependiente, sus efectos podrían mezclarse con los de la
independiente y limitar la generalización de resultados a casos similares.
Así, en el supuesto que los grupos a los que se aplican los dos métodos para
aprender inglés, uno de ellos tuviera una mayor presencia de alumnos con for-
mación previa en tal idioma como consecuencia de pertenecer a familias que
han llevado a sus hijos durante varios veranos al Reino Unido, este hecho inci-
diría en los resultados y limitaría la generalización a situaciones similares.
Efectos reactivos de los dispositivos experimentales. Bien puede ocurrir
que la propia investigación incluya una serie de aparatos, artilugios, tecno-
logías…que produzcan determinados efectos por su novedad, atracción,
etc., que contribuyan a los resultados en la v.d. En tales casos, obviamente,
la generalización quedaría limitada a situaciones similares.
Interferencias de los tratamientos múltiples. En determinados diseños,
buscando el control del efecto de los tratamientos, por ejemplo de los méto-
dos, acudimos a aplicar todos los métodos a todos los sujetos.
Pero el ser humano no pasa de una a otra situación sin dejar huellas de
la primera. Existe el recuerdo y, sobre todo, el hecho de que la reacción al
nuevo método no será independiente de aquella. Cabe pensar, además, que
el orden con que se presenten los métodos no será una cuestión indiferente.
En consecuencia, la generalización, de nuevo, quedará limitada.

4. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Si bien este tipo de investigación queda fuera del campo del experimen-
to, nuestro objeto de atención, conviene analizarla por sus relaciones con

182
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

aquel, en particular por los servicios que puede prestarle en la identifica-


ción de posibles variables a controlar.
Por otra parte, la investigación ex-post-facto es considerada por Camp-
bell y Stanley como uno de los esfuerzos más importantes en el marco de
la investigación cuasi-experimental, siendo su lógica y su aplicación espe-
cialmente válida en el campo de las ciencias pedagógicas.

4.1. Concepto y características

Una situación claramente diferente del experimento es aquélla en que el


investigador se plantea la prueba de sus hipótesis cuando los fenómenos a
que se refieren han ocurrido ya, esto es, actúa hacia atrás. Si en el experi-
mento de campo el investigador conserva la iniciativa y selecciona la v.i.,
aunque no pueda aplicarla en condiciones de riguroso control, en la inves-
tigación ex-post-facto carece de control sobre tales v.i. pues, como afirma
Kerlinger

«… sus manifestaciones ya han ocurrido o porque son inherentemente no mani-


pulables. Se hacen inferencias acerca de relaciones entre variables sin intervención
directa, partiendo de la variación concomitante de variables independientes y
dependientes.» (p. 395).

La realidad que el modelo de investigación representado por el experi-


mento pretende establecer es la situación ideal por su alcance y limitacio-
nes. Pero hay ocasiones en que tal control no es posible, al menos en todas
las modalidades; en efecto, en muchas ocasiones los sujetos no son asigna-
bles al azar a situaciones, tratamientos o niveles sino que se autoseleccio-
nan, esto es, pertenecen ya a determinados niveles, y no le es posible al
investigador sino seleccionar al azar de entre tales niveles. Así, los sujetos o
son varones o hembras, han alcanzado niveles académicos primarios o
medios o superiores, son médicos, abogados, profesores, obreros..., perte-
necen a determinada clase social, etc. El problema es que, cuando se toman
sujetos de tales grupos, a la vez que por poseer esa característica pueden
estar siendo seleccionados por otras, ajenas a la investigación, pero efica-
ces en cuanto a la producción de los efectos medidos en v.d., con lo que la

183
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

investigación queda contaminada y los aludidos efectos confundidos en su


origen.
En efecto, cuando se selecciona entre sujetos con determinado C.I., por
ejemplo, entre 90 y 110 y entre 120 y 130, para establecer la eficacia de
determinados procedimientos de estímulo a la creatividad según el nivel
intelectual, tal vez podemos estar seleccionando diferencialmente por las
oportunidades educativas de los sujetos y, subrepticiamente, por la clase
social12, con lo que tales variables pueden contaminar la investigación al
ejercer influjos manifiestos sobre el lenguaje (cantidad y calidad), los nive-
les de información o la riqueza de experiencias.
Junto a esto existe una manifiesta falta de control sobre v.i.; en efecto,
por definición, en este tipo de investigación se actúa después de que los
efectos de aquélla o aquéllas se han producido. Su proceso es a la inversa
del experimento: se mide la variable que se toma como dependiente y se
toman mediciones simultánea o sucesivamente de otra u otras que se con-
sideran independientes. A partir de ahí se tratará de probar cuál o cuáles
son las verdaderas variables independientes, es decir, se procurará inferir
hacia atrás.
El hecho de que, desde este punto de vista, nos encontramos ante una
investigación menos rigurosa, en el sentido de controlada, hace que, a par-
tir de ahora, el rigor y la exigencia hayan de ser máximos. En efecto, en la
investigación ex-post-facto es necesario proceder con extraordinaria cautela
y probar no una hipótesis sino varias que se pueden considerar alternativas
si se pretende acercarse al modelo de causalidad. Pero la prueba de tales
hipótesis pasa por la tarea, difícil y exigente, de encontrar tales hipótesis
rivales, continúa en la exigencia de máxima objetividad del investigador,
dejando hablar a los datos, naturalmente a datos relevantes, sometiendo a
todas ellas a contrastación dura y, probablemente lo más complicado, inten-
tando averiguar si es una adecuada combinación de las variables, integradas
en las hipótesis simples la que explica adecuadamente los efectos en la v.d.

12
El lector puede acudir a los datos presentados por Rodríguez de Velasco en un trabajo con
3000 niños madrileños. En estos datos se puede comprobar cómo el % de niños con C.I. entre 90
y 110 eran del 40,5 y del 48.8 según pertenecieran a familias de clase alta o baja. Por el contrario,
en el caso de CI entre 120 y 130, los % respectivos eran del 23 y del 1 respectivamente. FUNDA-
CIÓN FOESSA (1976) Estudios sociológicos sobre la situación social de España. Madrid: Euramé-
rica, p. 220.

184
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

En alguna medida la investigación ex-post-facto podría hacerse sinóni-


ma de los estudios de campo, caracterizados por Kerlinger como una inves-
tigación ex-post-facto, realizada en situaciones reales, ordinariamente sin
manipulación de variables y con la finalidad de establecer relaciones e
interacciones entre ellas.

4.2. Algunas modalidades

Dentro de la investigación ex-post-facto cabe reseñar modalidades varia-


das en alcance, objetivos y rigor. Probablemente las de mayor uso y tras-
cendencia sean la encuesta, los estudios de campo y los correlacionales,
aunque otros estudios, como los longitudinales y transversales, sean de
gran valor en el ámbito de la pedagogía diferencial, al igual que la metodo-
logía del caso único13, que está cobrando un especial valor en nuestro tiem-
po, si bien es preciso notar que su clasificación en este punto no siempre
está justificada, sino que, como afirma el profesor Vázquez, cuando se da
medición e intervención, deja de ser el diseño pre-experimental más débil
de los posibles para convertirse en un diseño cuasi-experimental más14.

4.2.1. Los estudios de campo

Dejando de lado un intento de alcanzar una clasificación generalmente


aceptada, situamos este tipo de investigaciones en el marco de los trabajos
ex-post-facto.
Kazt, refiriéndolos al marco de las ciencias sociales, señala como notas
distintivas una cierta despreocupación por la representatividad, sustituyén-
dola por la relevancia o ejemplaridad de la situación estudiada, el estudio
de la estructura y de la interacción social en forma directa por medio de la
observación y su aplicación tanto a la descripción de la realidad —estudios
exploratorios— cuanto a la validación de hipótesis.

13
Vid. HERSEN, M. y otro (1978). Single case experimental designs. Oxford: Pergamon Press; KRA-
TOCHWILL, Th. (1978). Siungle subject research. New York; Academic Press.
14
Vid. VAZQUEZ GÓMEZ, G. (1981). N = 1. Un nuevo paradigma de investigación pedagógica. En
Revista Española de Pedagogía, 151, enero-marzo, 3-13.

185
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Los estudios de carácter exploratorio son especialmente útiles en los ini-


cios de las ciencias para descubrir variables significativas y relevantes a la
situación estudiada y para averiguar las relaciones existentes entre las
variables identificadas. Estudios de tanta raigambre y de tan importantes
aportaciones en Psicología y Pedagogía como el análisis factorial, están
ligados al primer tipo; los estudios correlacionales al segundo.
Si bien los estudios de campo tienen las limitaciones propias de toda
investigación ex-post-facto, reúnen ciertas ventajas no desdeñables, entre
las que conviene citar el trabajar en situaciones reales, el facilitar la obser-
vación directa y continuada de la situación estudiada, y el posibilitar la uti-
lización de instrumentos variados e independientes para la medición y el
registro de datos, lo que permite apreciar la existencia o no de coherencia
de resultados.
Los estudios correlacionales, en cuanto estudios exploratorios, constitu-
yen la etapa inicial en el conocimiento de la realidad; no son, pues, estudios
de validación de hipótesis encaminadas precisamente a probar el tipo, la
forma e, incluso, la intensidad de las relaciones según determinadas cir-
cunstancias y condiciones. Se trata de proceder por medio de ellos a un
acercamiento a una realidad desconocida o no bien comprendida, como
etapa previa a posteriores estudios predictivos y de control en función de
las relaciones descubiertas. Kazt15 es claro en este punto.

«La principal diferencia existente entre este estudio exploratorio y la investiga-


ción que tiende a la verificación de hipótesis reside en que en el primero no se efec-
túan predicciones específicas de relaciones sobre la base de deducciones teóricas.
Los investigadores tienen hipótesis en sus mentes, pero éstas no se formulan con
precisión.»

No obstante, un estudio correlacional puede pasar a ser de validación


de hipótesis cuando, en virtud del conocimiento previo acumulado, que
permite la elaboración de teorías, el investigador se propone probar deter-
minadas predicciones derivadas de aquéllas. En general este tipo de hipó-
tesis suele exigir el desarrollo de técnicas más elaboradas que en el caso

15
KATZ, D. (1972). Los estudios de campo. En L. FESTINGER y otro: Los métodos de investigación en
las Ciencias Sociales. Buenos Aires: Paidós, pp. 68 s.

186
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

anterior para proceder a la medición de las variables a que se hace refe-


rencia en la hipótesis.
Estudios de tipo correlacional, de extraordinaria importancia sin duda
alguna por su carácter de fundamentación y aun de condicionamiento del
éxito de los anteriores, son aquéllos en que las correlaciones son utilizadas
para la determinación de las características técnicas de los instrumentos
de evaluación y medida utilizados en la recogida de datos, especialmente
en los casos de validación de hipótesis. Se trata de estudios para determi-
nar la validez y fiabilidad de los tests, en sus diferentes modalidades —coe-
ficientes de estabilidad, equivalencia y consistencia interna en el segundo
caso, y coeficientes de validez concurrente y predictiva en el de la validez,
además de las técnicas para el análisis de los elementos, ítems, de las cita-
das pruebas—.
Cabe reseñar aquí los estudios correlacionales de gran aplicación en Cien-
cias de la Educación, como los de predicción del rendimiento y de selección
de tests. Estos últimos permiten elaborar baterías o conjuntos de pruebas
especialmente adecuados para establecer con posterioridad pronósticos
sobre el nivel esperable para cada uno de los sujetos en diversos comporta-
mientos, uno de los más específicos el de rendimiento académico, ya sea
general ya referido a materias o áreas concretas; tales tipos de estudios son
especialmente valiosos en la educación personalizada dada la exigencia que
hace de niveles personales de rendimiento —rendimiento satisfactorio en
función de las peculiares características y circunstancias de los sujetos—.
La importancia de los estudios correlacionales queda justificada, además
de por lo ya dicho, sólo con recordar las objeciones que veíamos decir a Fox
referentes a la posibilidad misma de los experimentos referentes al control de
variables; controlarlas, decía también Bunge, requiere previamente el esta-
blecimiento de una lista de sospechosos; y éstos salen precisamente del cono-
cimiento previo de qué variables están relacionadas con aquellas que apare-
cen en el marco de la hipótesis guía de la investigación de que se trate.
La carencia, pues, de suficientes estudios correlacionales es un elemen-
to preocupante a la hora del control de variables extrañas.
El caso más claro de los estudios de campo que hemos denominado de
validación de hipótesis es el de lo que podemos llamar experimento natural,
es decir, el de aquella situación en que, sin darse manipulación de variables

187
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

independientes, sí puede identificarse claramente algún tipo de modifica-


ción o cambio, aunque no producido por el investigador, por lo que cabe
razonablemente pensar en la medición de sus efectos en una o varias varia-
bles dependientes.
Experimentos naturales de este tipo podrían ser los casos de los niños
lobo o de los gemelos univitelinos que fueron separados a raíz de la gue-
rra, y que fueron aprovechados por los psicólogos para estudiar el efecto
del ambiente, sobre la base de una herencia común, en la producción de
diferencias en aptitudes y personalidad16; en el campo de las Ciencias de
la Educación se dan situaciones propicias al estudio de campo, especial-
mente las derivadas de la implantación de innovaciones tecnológicas,
metodológicas u organizativas, propias de reformas legales, como la que
supuso en su tiempo la LGE, la LOGSE y, en la actualidad, la LOE y los
cambios derivados del proceso de Bolonia. Investigaciones de este tipo
son resueltas por Campbell y Stanley mediante lo que denominan diseño
de retazos o de ciclo institucional recurrente, afirmando que «el diseño es
apropiado para aquellas situaciones en que se presenta en forma cíclica, a
cada nuevo grupo de participantes, cierto aspecto de un proceso institucio-
nal»17.
Desde el punto de vista científico, los estudios de validación de hipóte-
sis resultan muy superiores a los meramente exploratorios, ya que la inter-
pretación que demos a unos determinados resultados en éstos será compa-
tible con otras muchas, como decíamos líneas atrás al caracterizar la
investigación ex-post-facto, lo que nos lleva a la necesidad de probar la
nuestra frente a las posibles rivales; sin embargo, en aquéllos, en los de vali-
dación de hipótesis, al plantear éstas inicialmente en virtud de la teoría, se
dan mayores garantías ante controles insuficientes e inadecuados y ante
mediciones poco precisas, especialmente en el caso de resultados clara-
mente positivos o negativos, aunque siempre debe tenerse en cuenta que
estamos ante investigaciones ex-post-facto.

16
Vid los estudios recogidos por TYLER, L. E. (1978). Psicología de las diferencias humanas, Madrid:
Marova, pp. 474-484; YELA, M. (1976). Familia y nivel mental, en J. ROF CARGBALLO (edit.): La familia,
diálogo recuperable, Madrid: Karpós, pp. 203-335; PINILLOS, J. L. (1975): Principios de Psicología. Madrid:
Alianza Universidad, o. c., 646-657.
17
CAMPBELL, D. y otro: o. c. p. 111.

188
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Sería conveniente completar esta diferenciación con aquella otra que se


realiza en función del grado de medición utilizado; determinados estudios de
campo se podrían clasificar desde esta perspectiva como de una mera obser-
vación de la realidad, observación, eso sí, planificada, estructurada y dirigi-
da, al servicio de cierta idea directriz, a cuya luz los resultados adquieren cier-
to valor; la pura observación y registro de datos puede ir acompañada, en
diversos grados, de la utilización de ciertos instrumentos más o menos estan-
darizados de registro de datos, como las listas de control e, incluso, las esca-
las de observación de diversos tipos, a las que se pueden aplicar niveles más
o menos finos de cuantificación mediante reglas de medida previamente ela-
boradas. Naturalmente, este tipo de estudios facilita, por su mayor objetivi-
dad, la validación de las hipótesis y la contrastación de los resultados por
parte de otros colegas o de él mismo en sucesivas ocasiones (verificación
inter e intrasubjetivas). Es frecuente que los estudios del primer tipo se den
más en las primeras etapas del conocimiento de un área determinada y que
se vaya procediendo a un progresivo refinamiento de los datos.
Como siempre ocurre, este tipo de investigación presenta ventajas e
inconvenientes que son, por lo general, opuestas a las de otras modalidades;
en efecto, la falta de dominio por parte del investigador y las dificultades
reales para formar grupos de control comparables, además de la mayor
dificultad para lograr un buen diseño, se inscriben entre las segundas. Sin
embargo, habría que resaltar entre las primeras su mayor realismo, y la
superior fuerza de sus variables, aunque haya que reconocer, con palabras
de Kerlinger, que el estudio de campo es un débil primo científico del expe-
rimento de laboratorio y de campo.

4.2.2. Estudios transversales y longitudinales

Modalidades de la investigación ex-post-facto, para algunos dentro de


los estudios de campo, son los estudios transversales y longitudinales o de
desarrollo, a través de los cuales se pretende obtener una información valio-
sa sobre algún aspecto o problema de cierta complejidad.
Los estudios transversales
Se han realizado estudios transversales en el ámbito de la Psicología
Diferencial con el fin de conocer las características evolutivas que definen

189
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

las diversas edades y etapas de la vida de los sujetos, en especial de aqué-


llos que se encuentran en el ámbito de la educación institucional. En un
momento determinado se toma una muestra que, como todas, debería
intentar ser representativa de varias edades, por ejemplo de 10 a 17 años;
los sujetos son examinados prácticamente en forma simultánea en caracte-
rísticas que se consideran relevantes, como inteligencia, aptitudes, intere-
ses o rasgos de la personalidad. Con ello, y una vez tratada adecuadamente
la información, se considera que se posee en forma rápida —su gran ven-
taja— una visión global del problema de las características de las diferen-
tes edades. Sin embargo, no se puede pretender, sin más, que las caracte-
rísticas diferenciales así delimitadas se puedan considerar como ligadas a
los diferentes niveles de edad.
En efecto, dos son, al menos, las razones fundamentales que impiden tal
conclusión, razones que vienen a constituir las limitaciones de este tipo de
estudios; la primera se refiere a la selección que suele producirse en las
muestras con el paso del tiempo, y la segunda a la no comparabilidad de las
experiencias con el paso de los años. Piénsese que, casi siempre, este tipo
de estudios se realizan con sujetos escolarizados que, como se hace eviden-
te, son los que han ido quedando tras las pérdidas que se suelen dar prefe-
rentemente entre los menos dotados académica e intelectualmente.
Por otra parte, las características que definieron la sociedad en la que se
desarrollaron los jóvenes que hoy cuentan con 17 años no son comparables
con las que han de vivir los que ahora cuentan con 10 años. Ambas razones
vienen a incidir fundamentalmente en la representatividad de las muestras
de sujetos y conductas, a la que afectan en grado notable.
Estudios longitudinales
La utilización de los métodos transversales, justificada fundamental-
mente por la rapidez en la obtención de los datos, empezó a ponerse en tela
de juicio a raíz de ciertos estudios de carácter longitudinal que ponían en
entredicho determinadas conclusiones generalmente aceptadas. En esa
línea se expresa Tyler al afirmar que «los estudios de crecimiento de los
niños han demostrado el mayor valor de los estudios longitudinales frente a
los métodos transversales»18.

18
TYLER, L. E.: o. c., p. 274 y, en general, el capitulo 11.

190
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Tal superioridad ha sido puesta de manifiesto, asimismo, por autores


como M. Haire y W.H. Starbuck en el campo de los estudios sobre la Orga-
nización, al reseñar que «los datos transversales no facilitan curvas válidas
de crecimiento»19.
Ante estos hechos es preciso que nos refiramos a los estudios de carác-
ter longitudinal que, como es obvio, pretenden el seguimiento de los fenó-
menos tal como se producen. En ellos se toma una muestra representativa
de sujetos en un momento dado, muestra que es seguida a lo largo de
varios meses o años según las exigencias del problema. Entre los estudios
longitudinales famosos podemos reseñar los de Terman y colaboradores,
con 1.528 sujetos de alto CI. —entre 135 y 200— iniciados en 1921 y con-
tinuados durante más de 35 años20 y los de Gessel21, de menos amplitud
pero de gran detalle, tratando de identificar las notas que distinguen las
diferentes edades de los sujetos que, en uno de sus estudios, abarcó 7 años
(entre 10 y 16).
Aparte de su más fiel reflejo de la realidad este tipo de estudios ofrece la
gran ventaja de poder delinear la forma en que se configura la evolución del
problema estudiado, justamente el gran inconveniente reprochado por
Haire y Starbuck a los transversales.
Con todo conviene reseñar que este método no está libre de limitacio-
nes, entre las que es preciso destacar aquellas que pueden afectar a la
representatividad de las muestras y a la utilidad misma de los resultados.
Como fácilmente puede comprenderse, investigaciones de tantos años
pueden dar lugar a lo que se conoce como mortalidad experimental, es
decir, a la pérdida de sujetos, bien como consecuencia de cambios de ins-
tituciones educativas o de población de residencia, bien por cansancio de
los mismos, que les lleva a abandonar o a no presentarse a todas las prue-
bas a que son requeridos.
Estas pérdidas pueden afectar diferencialmente a los grupos si los que
abandonan o cambian de residencia o institución son, como cabe esperar,

19
Referencia tomada de MUNICIO, P. (1982). Influencia del tamaño del centro en diversas variables
organizativas. Tesis doctoral. Universidad Complutense, p. 314.
20
Vid. TERMAN, L. M. y otro (1958). Genetic Studies of Genius. Vol. V. California: Stanford Univer-
sity Press.
21
GESSEL, A. y otros (1971). El adolescente de 10 a 16 años. Buenos Aires, Paidós.

191
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

miembros de familias con menor estabilidad en el empleo, o sujetos cuya


personalidad no les permite mantener sus propios compromisos. Por otra
parte, nada se ganaría si el investigador hiciera a priori la selección de los
sujetos buscando su mayor estabilidad, pues con ello empezaría por tener
ya esa muestra sesgada en cierto sentido.
Otro problema que afecta a estos estudios se refiere al hecho de saber-
se observados y sujetos de un grupo especial, lo que puede llevarles a
comportarse de modo no natural sin olvidar el efecto que sobre el apren-
dizaje de los tests tiene la exposición repetida a los mismos. Pero además
y para concluir, queda siempre el riesgo de que, como consecuencia del
paso del tiempo, y de los cambios cada vez más acelerados de la vida
moderna, los resultados, una vez obtenidos, tengan poca validez para su
aplicación a las poblaciones de las que los sujetos investigados no eran
sino muestras.
Conveniencia de complementariedad
Probablemente la solución a estos problemas, aparte claro está, del cui-
dado en la interpretación de los resultados, consista en una adecuada com-
binación de ambos tipos de estudios, transversales y longitudinales, siendo
la duración de éstos no excesivamente prolongada en los casos en que la
observación pueda dar lugar a las alteraciones descritas.
Será preciso, para concluir, añadir que este tipo de estudios únicamen-
te nos ofrecen tendencias de grupos, tendencias que son compatibles con
ciertas desviaciones temporales, es decir, con oscilaciones de los momentos
en que ciertas características aparecen y se desarrollan, y de intensidad,
esto es, del grado o nivel logrado por los sujetos concretos. Anastasi22 es
explicita al respecto:

«La curva basada sobre medidas de grupo no revelará... el aumento repentino


en ningún período, puesto que el fenómeno quedará completamente enmascarado
u oscurecido. (...) los estudios longitudinales han revelado señaladas diferencias
individuales en la proporción del desarrollo y en las formas de las curvas de cada
edad.»

22
ANASTASI, A. (1966): Psicología diferencial. Madrid: Aguilar, p. 211.

192
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

Estos hechos son especialmente importantes para el educador que, por


encima de los patrones de grupo, meramente orientativos, ha de estar siem-
pre atento a las peculiaridades personales y a los patrones específicos de los
educandos si desea poder acercarse al ideal de una educación personaliza-
da. Piénsese en la utilidad de trabajos como los de Piaget sobre los estadios
evolutivos de la inteligencia (senroriomotor, preoperatorio, de las operacio-
nes concretas y de las operaciones formales) o los de su discípulo, L. Kohlberg,
sobre los estadios del desarrollo del juicio moral (niveles pre-convencional,
convencional y post convencional (cuadro 4.11):

Cuadro 4.11. Los niveles y estadios del desarrollo del juicio moral

Nivel pre-convencional
Estadio 1: moralidad heterónoma
Estadio 2: de moral instrumental e individualizada
Nivel convencional
Estadio 3: moral normativa interpersonal
Estadio 4: moral del sistema social
Estadio 4.5: nivel transicional
Nivel post-convencional
Estadio 5: moral de contrato y de los derechos humanos
Estadio 6: moral de los principios éticos universales

4.2.3. Los estudios de casos

El estudio de casos es una modalidad de estudio descriptivo con conno-


taciones de investigación ex-post-facto y de estudio de observación.
Su característica fundamental es la de estudio intensivo frente a los de
carácter extensivo, y ello por planteamientos tanto teóricos como prácti-
cos. En el fondo se da una creencia de falta de adecuación de los estudios
de carácter experimental —experimentos de laboratorio y de campo—
para conocer en profundidad a la persona humana, ser individual, irrepe-
tible, inabarcable e inaprehensible por la cantidad y riqueza de sus carac-
terísticas y por la variedad de complejas interacciones que se establecen
entre ellas entre sí y con las circunstancias ambientales, en especial socia-
les, en que se mueve.

193
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Estos hechos harían de la persona un ser del que, sobre su unidad,


habría que predicar su individualidad, individualidad configurada23, cuyo
estudio sería algo tan sumamente complejo que requeriría añadir a los
métodos «nomotéticos», cuya pretensión es el logro de leyes generales, los
idiográficos, centrados en las peculiaridades de los individuos. Más aún All-
port, estudiando el tema, y apoyándose en Kluckhohn y Murray, acepta el
estudio de la persona a través de tres tipos de normas:
• las universales, propias de la psicología general;
• las de grupo, características de aquellos conjuntos de individuos en
que se encuadra cada persona, la persona concreta objeto de estudio
—grupo sexual, de edad, de profesión, residencia urbana o rural...—;
• y las individuales.
Los dos primeros tipos de normas serían propios de las ciencias nomo-
téticas y el tercero de las idiográficas. Nuestro autor acepta tal caracteriza-
ción con una puntualización sumamente importante:

«La individualidad no es el residuo que queda después de haber determinado


la parte que corresponde a las ciencias nomotéticas.» (p. 25).

no es un conjunto de residuos, sino que configura peculiarmente las nor-


mas generales y de grupo.
Al lado de esta justificación del estudio de casos, basada en la dificultad
de lograr algo efectivo en el conocimiento del hombre individual por otros
caminos, se encuentra el hecho de que «si nos enteramos de cómo interac-
cionan esos procesos en algunos individuos es probable que lleguemos a saber
más sobre esos procesos en abstracto, y a la larga podremos aprender todo
cuanto necesitemos sobre ellos».
Los estudios de casos pueden tener dos perspectivas fundamentales,
una de carácter científico y otra de tipo práctico. Esta segunda se da
cuando, por ejemplo, en los centros educativos, se trata de ayudar a la
solución de algún problema de cierta entidad presentado por una unidad

23
Allport dedica a este tema todo un libro: La personalidad, su configuración y desarrollo, editado
en Barcelona por Herder, en 1975 (5.ª ed.).

194
EL EXPERIMENTO COMO REFERENCIA. VALIDEZ DE LOS DISEÑOS. LA INVESTIGACIÓN EX-POST-FACTO COMO ALTERNATIVA

pedagógica, bien sea personal —alumno concreto— o grupal —un equi-


po de trabajo, una clase—, o cuando se utiliza tal estudio como método
para aprender a resolver tales tipos de problemas24. La primera se da
cuando un investigador, utilizando sujetos especial y cuidadosamente
seleccionados para ejemplificar un problema, se dedica a su estudio
intensivo con la intención de comprender mejor la situación, problema o
realidad estudiada.
Generalmente, en ambas perspectivas es preciso reunir una documen-
tación amplia y variada, y, por lo común, evolutiva, para poder comprender
la situación en su génesis y desarrollo; el estudio y análisis de las interrela-
ciones y secuencias permite llegar a un cuadro final en que los elementos
dispersos cobran cierta integración, unidad y estructura.

Clasificación de los métodos para el estudio de la personalidad individual

OBSERVACIÓN E INTERPRETACIÓN
“sentido común”
Ayudado por

1 2
Diagnóstico constitucional Situación sociocultural:
y fisiológico grupo, estado, papel

Técnicas psicológicas
especializadas

3 4 5 6
Documentos personales Evaluación de Muestras de Evaluación de
y estudio de casos sí mismo conducta otras personas

7 8 9 10

Tests y escalas Técnicas proyectivas Análisis profundo Conducta expresiva

11
Procedimientos
sinópticos

24
En este sentido es especialmente recomendable la obra de R. Muchielli, editado en Madrid por
Ibérico-Europea de Publicaciones, en 1970, titulada El método del caso.

195
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La complejidad de estos estudios puede apreciarse a través del cuadro 1,


debido a Allport, cuadro que requeriría varios volúmenes para su explica-
ción y una formación que difícilmente se encuentra en una sola persona al
exigir conocimientos sobre áreas profundas de la personalidad. Pero, toda-
vía, más, entendemos que, sin un conocimiento de la realidad en que tales
sujetos o grupos se insertan, la realidad estudiada, sujeto o grupo, no alcan-
za todo su sentido y significado.
Constate el lector la dificultad para diferenciar este tipo de investigacio-
nes de las que, en la tercera parte de nuestra temática, englobamos como
investigación cualitativa.

RESUMEN

En este capítulo hemos hecho objeto de estudio algunos de los tipos de


investigación empírica más importantes, comenzando por el experimento
—experimento de laboratorio— cuya gran aportación, el establecimiento de
relaciones causales entre la variable independiente y la dependiente, tiene
como contrapartida las dificultades existentes para su aplicación en nues-
tro campo del saber.
Dadas las dificultades para su utilización hemos analizado la alternati-
va del experimento de campo, que si bien no cumple en puridad todas las
exigencias del primero, ofrece como contrapartida su mayor aplicabilidad.
Ligado al experimento, hemos estudiado el problema de su validez en
sus dos manifestaciones, interna —la fundamental, la conditio sine qua,
non— y la externa, centrada en el grado en que los hallazgos pueden ser
generalizados. A tales efectos hemos estudiado los diferentes factores que
pueden invalidar el diseño en uno y otro tipo de validez.
Por último, y como alternativa a la experimentación en sentido estricto,
hemos analizado las características y algunas modalidades de la denomi-
nada investigación ex-post-facto, esto es, de aquella en el que investigador,
bien por imposibilidad de controlar variables bien porque estas ya han ocu-
rrido, debe proceder hacia atrás, tratando de encontrar posibles «causas»
de los efectos medidos.

196
Tema 6
Principales diseños: de uno, dos y más grupos.
Diseños factoriales y de cuadrado latino. Diseño
de covarianza

Presentación

1. La naturaleza del experimento y el diseño de dos grupos.


1.1. El dominio de la realidad y la provocación del fenómeno.
1.2. El control.
1.2.1. El control como grupo de control.
1.2.2. Azar y control.
1.2.3. Emparejamiento y control.
1.2.4. Valoración de las técnicas

2. Los principales diseños de dos grupos.


2.1. Diseños únicamente con pos-test.
2.2. Diseño pre-test.
2.3. Diseños con sujetos independientes o emparejados.
2.4. Valoración

3. Valoracion de los diseños de dos grupos.

4. El diseño factorial
4.1. Naturaleza del diseño factorial
4.2. Efectos a estudiar en los diseños factoriales

5. El diseño de cuadrado latino

6. El diseño de covarianza

7. Diseños de un solo grupo

Resumen

197
PRESENTACIÓN

En este capítulo se estudian algunos de los diseños más utilizados en el


ámbito de la investigación cuantitativa pedagógica.
El diseño más frecuentemente utilizado es el de dos grupos; en él se
suele tratar de comparar el efecto de una actuación pedagógica (método,
forma de agrupamiento, sistema de motivación, horario, tipo de evalua-
ción…) frente a otra, por lo general la que viene siendo habitual en el lugar
de que se trate. Por su importancia, hemos hecho de él objeto de especial
análisis.
Un diseño más complejo es aquel en el que se pretende comprobar el
efecto no de una actuación sino de dos (o más); en estos casos nos situamos
ante los denominados diseños factoriales, que tienen una ventaja añadida:
además de contrastar dos hipótesis a la vez —una por cada variable inde-
pendiente— hacen posible afrontar una tercera, la conocida como de inter-
acción, esto es, aquella en que los efectos sobre la dependiente proceden de
la actuación conjunta de las dos o más variables independientes sometidas
a contraste.
Estas «actuaciones pedagógicas» son denominadas «variables indepen-
dientes», y el efecto de las mismas, variable «dependiente».
Otro tipo de situaciones es aquella en la que deseamos contrastar el
efecto de una actuación pedagógica (variable independiente) pero en unas
determinadas condiciones: controlando el posible efecto de dos variables
que, de darse, afectarían a la validez de los resultados, contaminándolos.
Esas posibles variables denominadas «extrañas», tienen diferentes formas
para su control, como tendremos ocasión de apreciar.
Pues bien: una de ellas es introducirlas en el propio diseño haciendo
a los grupos de sujetos tan homogéneos como sea posible en tales varia-

199
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

bles (denominadas variables de bloqueo), con la intención de que sus


efectos queden controlados y el influjo que se produzca en la variable
dependiente se pueda atribuir únicamente a la variable independiente
que, aquí, suele denominarse «variable tratamiento». Estos diseños se
denominan de «cuadrado latino» cuando son dos las variables de esta
naturaleza.
En el campo pedagógico un tipo de diseños especialmente adecuado
es el de covarianza. Se entiende fácilmente que si comparamos el efecto
de una actuación pedagógica frente a otra (una variable independiente
con dos modalidades diferentes, por ejemplo dos métodos), y los sujetos
que las reciben fueran inicialmente muy diferentes unos de otros, siem-
pre nos quedaría la duda de si los resultados finales se deben a esas dife-
rencias iniciales a favor de un grupo, a su interacción con la acción peda-
gógica de que se trate o a esta misma, que es lo que en verdad interesa al
investigador.
Para salir del paso cuando no podemos evitar esas posibles diferen-
cias iniciales (por ejemplo, cuando nos vemos obligados a trabajar con
conjuntos de sujetos que forman grupos intactos, esto es, no selecciona-
dos al azar), la solución es contrastar el efecto de la variable indepen-
diente sobre la dependiente pero ajustando las diferencias finales a las
iniciales, tal como ocurre en algunos deportes. La resolución estadística
en estos casos se realiza con una prueba denominada «análisis de cova-
rianza».
Cerramos esta presentación haciendo referencia a aquellos diseños en
que se trabaja con un único grupo. Por lo general se trata de diseños desti-
nados a comprobar lo que denominamos «bondad de ajuste», esto es: si los
datos disponibles en una investigación son compatibles con un modelo
ideal, como puede ser la denominada curva normal de probabilidades o
campana de Gauss.

1. LA NATURALEZA DEL EXPERIMENTO Y EL DISEÑO


DE DOS GRUPOS

Si recordamos nuestra concepción del experimento y las notas que lo


definen, nos percataremos de su relación con el diseño al que, a lo largo de

200
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

este capítulo, nos vamos a referir, es decir, con los diseños de una sola
variable independiente con dos condiciones, tratamientos o niveles, uno de
los cuales es aplicado a uno de los grupos y el otro al segundo, o con una
condición o tratamiento que, aplicada al grupo experimental, se contrasta
con la ausencia del mismo en un grupo de control.

1.1. El dominio de la realidad y la provocación del fenómeno

Decíamos entonces que el experimento exigía del investigador un domi-


nio tal que le permitiera provocar el fenómeno introduciendo en el momen-
to oportuno la variación experimental —variable independiente—, a la vez
que estaba en su mano decidir los niveles de v.i que aplicaría, esto es, mani-
pular variable independiente atribuyendo las dos modalidades del trata-
miento a los grupos, una a cada uno.
Pues bien, esta manifestación del dominio es perfectamente compati-
ble con la modalidad de diseños que estudiamos ya que, al presentar dos
grupos, permite al investigador disponer de sujetos que experimenten, en
igualdad de otras condiciones, ambos niveles o tratamientos, uno por
grupo.
Naturalmente, la provocación del fenómeno nada tiene que ver con el
diseño como estructura, cuya misión, según O’Neil1 es probar, en condicio-
nes constantes de elementos extraños, los efectos de las variaciones experi-
mentales, mas no el acto mismo de la provocación del fenómeno, que es
una cuestión práctica en la que intervienen factores como los de oportuni-
dad y adecuación a las características de la variable independiente y del
ambiente en que se desarrolla el experimento.

1.2. Control

Al estudiar los objetivos del diseño experimental hay coincidencia entre


los autores en reseñar la palabra control como clave, y no podía ser de otro
modo si se entiende el diseño como la estructura escogida por el investiga-

1
O’NEIL, W. N. (1968). Introducción al método en Psicología. Buenos Aires: Eudeba.

201
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

dor para resolver el problema, para responder a la pregunta que dio origen
a su investigación, concretada en el experimento como metodología ade-
cuada. Desea responder a la pregunta o resolver el problema, pero ha de
hacerlo en condiciones tales que concedan validez y credibilidad a las res-
puestas alcanzadas, y ello sólo es así cuando las respuestas no admiten dis-
cusión razonable, esto es, si en las condiciones en que el experimento se ha
desarrollado, la única o las únicas respuestas plausibles son las alcanzadas
en el mismo. Todo esto no es otra cosa que reiterar el principio básico de
que, lo que interesa, es poder afirmar que los efectos medidos en la varia-
ble dependiente se deban a y sólo a las variaciones introducidas en varia-
ble independiente
Pero para que esto sea así hace falta, además de la variación, la cons-
tancia a la que también se refería dicho autor, constancia que podemos
entender aquí, de manera amplia, como control de las demás variables
independientes, control que, de no darse, haría que actuaran como
extrañas.
El término control, no obstante, como ya sabemos, presenta varias
acepciones2, referidas, de una parte, al dominio del investigador sobre la
variable independiente, lo que le permite su manipulación, aspecto este
al que ya nos hemos referido, y, de otra, a la forma de asignación de los
sujetos a los grupos y al control de las variables extrañas. Pues bien, el
diseño de dos grupos presenta una estructura adecuada para lograr el
control en estas dos últimas dimensiones; al existir dos grupos, si la asig-
nación de los sujetos a los mismos se realiza en condiciones adecuadas,
bien sea al azar bien por técnicas de equiparación como el empareja-
miento, el diseño habrá posibilitado el control como medio para asegu-
rar que, inicialmente, no se dan diferencias significativas entre los gru-
pos en variables relevantes, con lo que, desde este punto de vista, no cabe
pensar que tales variables hayan sido concausa, junto a la variación de
variable independiente, de los resultados medidos en variable depen-
diente (cuadro 6.1).

2
Vid. BORING, E. G.: «The nature and history of experimental control» in American Journal of
Psychology, 1954, 67, pp. 573-589; KERLINGER, F. N. (1975). Investigación del comportamiento, México,
Interamericana, 1975, pp. 321-323, 336-337 y 346-349. ARNAU, J. (1979). Psicología experimental, Méxi-
co: Trillas, pp. 154-161.

202
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

Cuadro 6.1. Manifestaciones del control

La estrategia experimental: el control

Estrategia o enfoque experimental


Manifestaciones del CONTROL: el investigador tiene
capacidad para
– Elegir las variables independientes (v.i.)
– Fijar sus niveles
– Seleccionar los sujetos.
– Asignar los niveles de v.i. y los sujetos a los grupos.
– Desarrollar la investigación manteniendo bajo control
las posibles variables extrañas.
– Establecer la parte de varianza atribuible a cada variable
independiente.

Pero además, al disponer de dos grupos, cada uno puede ser considera-
do como control del otro3, con lo que, si el diseño es adecuado, se habrán
puesto las bases para que todas las posibles variables que afecten a uno de
ellos lo hagan, y del mismo modo, al otro, lo que permitiría al final asegu-
rar que las diferencias medidas en variable dependiente, descartadas las
diferencias iniciales y las que pudieran producirse durante la realización
del experimento, no podrían deberse sino a la variación experimental, pro-
vocada y controlada por el investigador.

1.2.1. Control como grupo de control

El control de variables extrañas viene a ser la función fundamental que


pretende cubrir la existencia del grupo de control o testigo en la investiga-
ción experimental en ciencias humanas; en estos saberes, las variables que
intervienen son muchas y mantienen entre sí diversos grados de relación

3
Recordemos que del sentido inicial de grupo de control como aquel que recibe el nivel 0 de varia-
ble independiente se ha pasado, generalizándolo, a su consideración como grupo de comparación en
igualdad de condiciones salvo, precisamente, de la variable independiente.

203
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

—intensidad— además de presentar ciertas interacciones que hacen más


compleja la situación. Como consecuencia, la investigación experimental
en estas ciencias parece requerir inexcusablemente la existencia de control
entendido como grupo de comparación o referencia; el hecho tiene como
base la suposición de que todas las variables implicadas actuarán con una
misma fuerza y de igual modo en ambos grupos, con lo que las diferencias
finales, medidas en variable dependiente, no se deberían sino al tratamien-
to experimental o variable independiente
La importancia del grupo de control es tal que Campbell4 llega a afirmar
que el mínimo de información científica útil exige, por lo menos, la com-
paración formal, no obstante lo cual, según Kerlinger, probablemente no se
haya hecho uso del sistema de control hasta los albores del pasado siglo.
Arnau, refiriéndose al punto que tratamos, afirma:

«Si la técnica manipulativa constituyó un primer paso en la investigación


experimental en las ciencias psicológicas, hemos de señalar que el siguiente ele-
mento lo constituyó el »grupo de control». Sólo a partir del momento en que
comienza a introducirse el grupo de control, se empieza a contar con un elemen-
to decisivo que garantiza la validez interna del diseño.»5

Y hay algún autor que llega a considerar el descubrimiento de esta téc-


nica como uno de los más revolucionarios para la Humanidad, por la tras-
cendencia de sus aplicaciones y las repercusiones que su utilización ha
aportado y aportará.

1.2.2. Azar y control

La utilización del azar como técnica de control merece una mínima pro-
fundización. Conviene justificarla, explicar en qué consiste y cuáles son sus
dimensiones fundamentales.
Cuando de una misma población de sujetos se obtienen dos muestras al
azar, en virtud de las mismas leyes del azar los subgrupos o muestras tienden

4
Citado por F. N. KERLINGER, o. c., p. 331.
5
ARNAU, J. (1981). Diseños experimentales en Psicología y Educación. México: Trillas, vol. 1, p. 47.

204
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

a ser semejantes, comparables, intercambiables; más aún, los valores estadís-


ticos obtenidos en ambos tienden a ser muy similares, experimentando dife-
rencias explicables por tal factor, esto es, aleatorias o, en términos estadísticos,
no significativas. Estas afirmaciones cobran mayor firmeza en la medida en
que tales muestras sean grandes, cuanto más grandes —hasta un cierto lími-
te- mejor, pues el azar, para poder obrar, necesita de este requisito—.
Los fenómenos aleatorios, a la larga, tienden a producirse según leyes
de monótona regularidad, veíamos decir a Kerlinger (p. 96), con lo que las
diferencias entre los valores calculados en las diferentes muestras serán
menores conforme se eleve el valor de n —tamaño de las muestras— y, a la
vez, se acercarán progresivamente a los correspondientes valores para toda
la población o parámetros.
La distribución de los valores conforme al azar admite, naturalmente,
discrepancias entre las muestras, y entre éstos y los de la población, pro-
gresivamente mayores; cuanto más elevadas sean, menos frecuentes serán,
o menor probabilidad de ocurrencia se les podrá asignar, lo que no impide
que puedan surgir, precisamente cumpliéndose las características de la
extracción aleatoria. Cuando tales discrepancias son muy poco probables,
por ejemplo, 5 veces de cada 100, o una vez de cada 100 o de cada 1.000, no
suele considerarse que se deben al azar sino que algo diferente de este fac-
tor está obrando. Hablar, pues, de que los valores estadísticos en las mues-
tras tienden a ser similares entre sí y al parámetro no supone afirmar que
siempre lo sean; cabe pensar que en determinadas ocasiones, especialmen-
te con valores pequeños de n, puedan darse discrepancias muy elevadas,
discrepancias que por superar los niveles preestablecidos y aceptados por
la comunidad científica, como los de probabilidad igual o menor de 0,05,
de 0,01, de 0,001, etc., son considerados como no debidos al azar sino como
significativos: esto es, puede, por azar, haberse constituido dos grupos que,
inicialmente, sean estadísticamente diferentes, con lo que los resultados
finales vendrán viciados por esta inicial desigualdad.
Ante esta posibilidad caben dos grandes alternativas: o bien probar si,
efectivamente, dos grupos formados al azar han resultado ser diferentes
estadísticamente en variables relevantes para la investigación, en cuyo caso
podría acudirse a técnicas estadísticas de análisis de datos que permiten el
control de tales diferencias, como la covarianza, o bien optar por la forma
de constitución de grupos que denominamos emparejamiento.

205
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Si ninguna de estas cosas se hace puede ocurrir que, como conse-


cuencia de la falta de control inicial, demos por probadas determinadas
H1 —previo el rechazo de H0— que, en realidad, no lo están. Esto es una
realidad, un riesgo real, pero hay que reseñar que, aparte de un riesgo muy
poco probable, las ciencias empíricas tienen ya sus propios mecanismos de
defensa, protegiéndose utilizando lo que Kerlinger calificaba como enfoque
científico, utilizado sistemática y conscientemente por los científicos, enfo-
que que no es sino su carácter autocorrectivo6.
La aleatorización completa como técnica de control presenta tres gran-
des dimensiones o momentos igualmente importantes; en el primero, tras
la definición precisa de la población a la que deseamos referir los resulta-
dos del experimento, se procede a la selección al azar del número de casos
que, con arreglo a las exigencias del muestreo para permitir7 la representa-
tividad, sean necesarios. En un segundo momento, la muestra así obtenida
es asignada al azar a los dos grupos para, en uno tercero y último, decidir
al azar qué grupo recibirá el tratamiento experimental y cuál actuará como
control, o qué modalidad de tratamiento experimental recibirá cada uno.
Con esta modalidad de control se pretende, de una parte, el control de
variables extrañas en el momento inicial, pero, además, eliminar toda posi-
ble influencia del investigador, valiéndose del principio de imparcialidad al
que hacíamos alusión en la caracterización de la investigación científica.
Naturalmente la utilización de estos diseños al azar exige su comple-
mentación con el correspondiente tratamiento estadístico, un tratamiento
que permite tomar en consideración las oscilaciones aleatorias del mues-
treo a la hora de estimar los parámetros y de decidir sobre la significación
de las diferencias. Kerlinger insiste en este punto:

«El investigador tiene que hacer una elección de diseños, métodos de observa-
ción, métodos de medición y tipos de análisis de investigación. Todos ellos deben
ser congruentes, deben encajar unos con otros.»8

6
Ibídem, p. 6. Del mismo modo se expresa McGUIGAN, F. J. (1976). Psicología experimental, Méxi-
co: Trillas, p. 124.
7
«Desafortunadamente nunca podemos estar seguros de que una muestra al azar es representati-
va de la población de que se ha extraído», afirma Kerlinger, o. c., p. 122.
8
P. 158.

206
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

1.2.3. Emparejamiento y control

La aleatorizacián como forma de control resulta efectiva en la mayoría de


las ocasiones, pero presenta ciertos problemas y riesgos. Empezando por éstos,
es preciso aceptar que, por azar, como acabamos de reseñar, pueden formarse
grupos inicialmente diferentes, por lo que cabe tomar las decisiones igualmen-
te reseñadas de mediciones iniciales, o de emparejamiento, para que tales dife-
rencias se reduzcan a su mínima expresión o, a ser posible, desaparezcan.
Pero, de otra parte, para ser eficaz, la aleatorización requiere la utiliza-
ción de muestras grandes, cuanto más grandes dentro de ciertos límites
mejor. Lógicamente en tales ocasiones es factible que las diferencias indi-
viduales sean elevadas. Pues bien, como ya sabemos, la técnica estadística
utilizada para decidir sobre la significación de las diferencias empíricas
consiste en comparar, dividiéndolas, las diferencias encontradas, sean éstas
de medias, desviaciones, correlaciones, etc., con una estimación de la varia-
bilidad debida al azar, conocida como error típico, en el cual se incluye todo
tipo de diferencias no debidas al tratamiento experimental (errores de
medida, diferencias individuales...); consecuentemente, cuanto mayores
sean éstas más elevado será el denominador, por lo que las diferencias
empíricas deberán ser lo suficientemente elevadas como para superarlas;
dicho de otro modo, ante diferencias pequeñas el diseño al azar puede no
ser sensible, no detectarlas, y concluir con que no hay diferencias signifi-
cativas aunque, en realidad, las haya.
Una forma de lograr, de una parte, una mayor igualdad de los grupos y,
consiguientemente, el control a que nos estamos refiriendo y, de otra, la
reducción de las diferencias individuales entre pares o grupos de sujetos
con la consiguiente reducción de la variabilidad debida al azar (error típi-
co), consiste en la técnica del bloqueo.
La técnica consiste en constituir los grupos de la forma más homogénea
posible desde la perspectiva de algún criterio relevante, denominado varia-
ble del bloqueo, esto es, de una variable que mantiene una relación sustan-
cial, cuanto más elevada mejor, con la variable dependiente. Cada bloque
así constituido será más homogéneo respecto de tal variable que si se
hubiese constituido al azar; a continuación, y dentro de cada bloque, se for-
man tantos grupos como niveles, condiciones o tratamientos se experimen-
ten en el diseño.

207
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

El caso más simple del bloqueo es el del emparejamiento, propio de los


diseños de dos grupos; como únicamente se trabaja con dos niveles de
variable independiente, cada bloque, integrado por una o varias parejas de
sujetos, recibe los dos niveles que son experimentados, uno por el o los pri-
meros miembros de las parejas y el otro por el segundo o los segundos
miembros de dichas parejas. La formación de las parejas se lleva a cabo
sobre la base de la medición previa en la variable de bloqueo, apareamien-
to o emparejamiento, variable que, para que sea eficaz en los propósitos del
diseño -control y sensibilización- debe mantener una elevada correlación
con la variable dependiente
Conviene precisar que el emparejamiento no es un sustituto total de la
aleatorización, procedimiento que debe persistir en algunas fases; así es
conveniente que la selección de la muestra sea aleatoria, que las parejas,
especialmente si son muy similares o iguales en los valores alcanzados en
la variable de emparejamiento, se asignen al azar a los grupos y, por
supuesto, que los tratamientos se asignen al azar a los grupos.
Además de la técnica reseñada puede citarse aquella que consiste en la
constitución de grupos, previa la aplicación de la oportuna prueba, que ven-
gan a tener aproximadamente la misma tendencia central y variabilidad
respecto de la variable de homogeneización que, como antes, debe mante-
ner relación elevada con variable dependiente.

1.2.4. Valoración de las técnicas

En cuanto a la valoración de las técnicas estudiadas no hay unanimidad;


mientras autores como Arnau mantienen que «en principio, se puede afir-
mar que siempre es preferible la utilización de un diseño de grupos por blo-
ques que un diseño de grupos al azar»9 Kerlinger afirma que «el empareja-
miento deliberado no es, en general, un procedimiento deseable»10, añadiendo
más adelante: «En general un mejor procedimiento es el análisis de cova-
rianza u otro procedimiento de regresión» 11, si bien el mismo autor recono-
ce que «tener correlación entre grupos, debido a emparejamiento o medidas

9
ARNAU, J.: Psicología experimental, p. 408.
10
KERLINGER, F. N., o. c., nota 9, p. 349.
11
Ibídem, p. 350.

208
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

repetidas de individuos o unidades, como clases y escuelas, y no aprovechar-


se de la correlación es un error estadístico y de diseño» 12.
Convendría reseñar, además, un hecho importante: cuando se procede
al emparejamiento no se logra formar parejas homogéneas en todo sino en
una o varias variables —pocas por lo general— consideradas relevantes por
el investigador, persistiendo las diferencias individuales en las demás. Por
lo tanto, ante otras posibles variables consideradas relevantes, es decir,
capaces de actuar como extrañas, el investigador debe tomar en considera-
ción otros métodos de control.
Cabría pensar por qué no emparejar en todas, a lo que hay que respon-
der que si en verdad se piensa en todas, la única pareja posible para un suje-
to dado es él mismo, es decir, se sustituye el bloque por el sujeto; y una
matización importante: el sujeto mismo, con el paso del tiempo, ya no es
totalmente el mismo en el sentido de que, con el tiempo y las circunstan-
cias, incluidas las experimentales, cambia, se modifica.
Por otra parte, la afirmación anterior justifica la siguiente: para poder
emparejar en tres o cuatro variables es necesario disponer de un conjunto
inicial muy elevado de sujetos, lo que hace del sistema algo muy caro al
requerir mediciones iniciales a una gran cantidad de sujetos que, poste-
riormente, no serán tomadas en consideración.

2. LOS PRINCIPALES DISEÑOS DE DOS GRUPOS

Bajo la denominación general de diseños de dos grupos caben todas


aquellas modalidades en que el investigador manipula una sola variable
independiente, a través de dos condiciones, niveles o tratamientos, experi-
mentados uno en cada grupo, con la finalidad de contrastar la diferencia
apreciada en ambos grupos en una variable dependiente con las expectati-
vas de dichas diferencias como fruto del azar.
El paradigma general de este diseño incluye, pues, una variable inde-
pendiente, X, con dos tratamientos, X1 y X2, o, como puede encontrar el
lector en otros textos, X1 y X0 , reservando este valor para el grupo de con-

12
Ibídem, p. 349.

209
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

trol13 o, todavía de otra forma, X y ausencia de X, y la medida de la varia-


ble dependiente, T1 y T2 (test o prueba) (cuadro 6.2).

Cuadro 6.2. Paradigma general del diseño de dos grupos

Grupo Variable independiente Variable dependiente


Experimental X1 o X0 T1
Control X2, X0,, o – T2

La variable independiente propia de la investigación experimental en sen-


tido estricto es la que denominamos activa o de estímulo14, es decir, variables
que pueden ser manipuladas directamente por el investigador. En la investi-
gación ex-post-facto se trata con variables asignadas o atributivas15, esto es, de
variables que no pueden ser manipuladas sino medidas, procediéndose a con-
tinuación a la selección de los sujetos que reúnen las características definidas
por el investigador, tales como niveles de CI, o de neuroticismo, intereses teó-
ricos o prácticos, valores religiosos o políticos marcados, etc. Por lo general
estas variables suelen pertenecer a las denominadas organísmicas, que vienen
a ser características del ser humano tales como la inteligencia, el sexo, la per-
sonalidad, variables también conocidas como intermediarias.
La constitución de los grupos desde la perspectiva que acabamos de analizar
permite o no la utilización del azar; cuando se trabaja con variables indepen-
dientes activas el experimentador puede seleccionar y asignar al azar a los suje-
tos, mientras que con variables asignadas o atributivas únicamente puede, tras
la medición de las mismas, seleccionar de entre quienes están ya en los niveles,
selección que podrá ser al azar, y atribuirles al grupo que les corresponda.
La variable dependiente es justamente aquella en la que se desea apreciar
el efecto de la manipulación16 de la variable independiente Como conse-
cuencia, y por lo general, suele ser una variable de respuesta a los estímulos
o de conducta diferencial ligada presumiblemente a la variable asignada o
atributiva. Por lo general se trabaja con valores medidos que pueden ir de la

13
Aquí utilizaremos X1 y X2 porque, como ya hemos precisado, tomamos el concepto de grupo de
control en su acepción más generalizada.
14
Vid. ARNAU, J.: Psicología experimental, pp. 129 y 145; McGULGAN, F. J., o. c., pp. 177-197.
15
Terminologías de ARNAU, J.: Ibídem, p. 137, y KERLINGER, F. N.: o. c., p. 39.
16
Total o parcial, según acabamos de decir.

210
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

rapidez de las respuestas a su exactitud y corrección, pasando por la cantidad,


frecuencia o belleza de las mismas. Así puede tratarse de ver si la variable
independiente, en sus dos modalidades, da lugar a respuestas más inmedia-
tas, si se traduce en una ortografía con menos faltas, si permite la realiza-
ción de una mayor cantidad de operaciones aritméticas, si repercute en la
identificación de una superior cantidad de errores por unidad de tiempo, si
conduce a una mayor habilidad manual para ensartar o encajar, o si lleva a
una expresión literaria más bella, pongamos por ejemplo.
La resolución estadística suele traducirse en la comparación, comparación
que admite diversas modalidades, de las diferencias entre los valores T1 y T2
con los esperables como resultado del azar. Se pueden comparar con los valo-
res al azar las diferencias de medias aritméticas, de desviaciones típicas, de
correlaciones, de casos a favor, de rangos, de frecuencias en diferentes cate-
gorías. El enfoque clásico, en el caso de la prueba t, consiste en la compara-
ción de las medias aritméticas de los grupos con los valores de azar entendi-
dos como error típico de tales diferencias, cuya interpretación se hace en
función de la probabilidad de que dicho valor empírico se deba al azar. El
denominador de t es una medida de variabilidad, y, como sabemos por el estu-
dio de la curva normal, conociendo la separación de cualquier valor empírico
respecto de su valor central, medido en unidades de variabilidad, se le puede
asignar una probabilidad, traducible en frecuencia de ocurrencia o %.
Pues bien, si el valor t resultante tiene una probabilidad de azar menor
o, como mucho, igual, al margen de error que está dispuesto a aceptar el
investigador, simbolizado por α, toma la decisión de que tales diferencias
son reales y no aleatorias, si bien está dispuesto a admitir una probabilidad
de error o de decisión incorrecta, evaluada justamente en el valor de α como
mucho (Ecuación 6.1. Planteamiento general de la prueba t de Student).

Diferencia de medias aritméticas X1 − X 2


t= =
Error típico de la diferencia σ X A −X B
de tales medias

Los valores al azar son fruto de estudios estadísticos nacidos del cono-
cimiento de la forma en que se distribuyen los datos cuando se toman infi-
nitos valores muestreados a partir de una misma población; de ahí la
importancia de elegir para el contraste el modelo de distribución teórico

211
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

adecuado ya que, de no hacerlo así, los niveles de probabilidad asignados


no se corresponderán a la realidad y conducirán a decisiones erróneas.
Una alternativa a t es la prueba F; se trata del análisis de la varianza
(ANAVA) que estudiaremos más adelante, al hablar de las pruebas estadís-
ticas. Como su nombre indica, se trata de analizar la varianza, esto es, de
descomponerla en partes. La varianza total de las puntuaciones de los gru-
pos se descompone en dos partes, aquella que se puede atribuir al efecto de
la variable independiente, denominada varianza experimental, y aquella
otra cuya explicación se encuentra en el conjunto de diferencias que se dan
entre los sujetos pero que no son atribuibles a tal variable y que, en térmi-
nos técnicos, denominamos varianza de error; F nos ofrece un valor que será
significativo cuando su probabilidad de ocurrencia sea igual o mayor que
aquel que corresponda al nivel de confianza que se ha fijado el investigador.

Extensión del diseño de dos grupos

Si t es equivalente a F cuando tratamos de diseños de dos grupos, esto


es, de una variable independiente con dos niveles de la misma: nivel expe-
rimental y nivel de control, o experimental uno frente a experimental dos,
no es posible aplicarla cuando la variable independiente tiene tres o más
niveles, como tres métodos de enseñanza, cuatro tipos de motivación, cinco
formas de agrupamiento…
En su esencia, este diseño es igual que el anterior, pero la prueba F nos per-
mitirá apreciar si, en general, se dan diferencias estadísticamente significati-
vas entre los 3 métodos, los 4 tipos de motivación, las cinco formas de agru-
pamiento…
En el supuesto de que tal situación se diera, será preciso proceder, median-
te lo que denominamos pruebas post hoc o a posteriori, a comprobar entre qué
pares de medias se da la diferencia estadísticamente significativa. Podría ser
que se diera en todas las comparaciones, solo en una o en varias.
En el siguiente gráfico (Figura 6.1) hemos representado la varianza
total, esto es, las de las puntuaciones de todos los sujetos; podemos ver
cómo la parte de la varianza total atribuible a la varianza experimental es
menor que la explicable por esas diferencias de carácter aleatorio; F, por

212
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

tanto, es menor que 1, lo que significa que las diferencias entre las medias
de ambos grupos no son estadísticamente significativas.

LOS DISEÑOS EN LA ESTRATEGIA EXPERIMENTAL

EL DISEÑO BÁSICO: diseño de dos grupos


V total

V experimental
V experimental
F= <1
V error
V error

Diferencia estadísticamente NO SIGNIFCATIVA.

Figura 6.1 representación de la división o análisis de la varianza total en dos partes, correspondientes
a la varianza experimental y a la varianza de error, en el caso de diferencias no significativas.

Sin embargo, en la figura 6.2 la situación cambia radicalmente:

LOS DISEÑOS EN LA ESTRATEGIA EXPERIMENTAL

EL DISEÑO BÁSICO: diseño de dos grupos


V total

V experimental V experimental
F= >1
V error
V error

Diferencia estadísticamente significativa o no, a decidir mediante la consulta


de las tablas de probabilidad de F.

Figura 6.2 representación de la división o análisis de la varianza total en dos partes, correspondientes
a la varianza experimental y a la varianza de error. Diferencias posiblemente significativas.

213
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Como se aprecia, aquella parte de la varianza atribuible a la variable


independiente es claramente superior a la de error o explicable por azar. La
decisión ya no es algo de por sí evidente, como en el primer caso. La con-
sulta de las tablas de F nos permitirá atribuirle una probabilidad y su com-
paración con nuestro nivel de confianza nos servirá para decidir si la dife-
rencia es estadísticamente significativa o puede ser explicable por azar.
Bajo el paradigma general a que nos hemos referido caben modalidades
del mismo diseño, con sus correspondientes peculiaridades, en las que a
continuación, nos vamos a centrar.

2.1. Diseños únicamente con pos-test

Sobre el paradigma básico a que nos acabamos de referir, en el modelo que


estudiaremos ahora confiamos en que la asignación al azar nos habrá permiti-
do formar los dos grupos inicialmente equivalentes desde la perspectiva de las
variables relevantes, razón por la cual renunciamos a cualquier tipo de com-
probaciones de tal hecho. El paradigma es, pues, el siguiente (Cuadro 6.3):

Cuadro 6.3: paradigma del diseño de dos grupos con selección


y asignación de sujetos y tratamientos al azar

Selección Variable
Grupo Pretest Postest
y asignación independiente
Experimental Azar — X1 T1
Control Azar — X2 T2

Estadísticamente se parte del supuesto de que, al haber sido formados


ambos grupos al azar a partir de una misma población, la variabilidad apre-
ciada en T1 y T2 viene a ser una doble estimación de la variabilidad de dicha
población: el efecto diferencial de X -X1 y X2- se estima a través de las dife-
rencias de medias aritméticas en la prueba t o del cociente entre varianzas
en la prueba F. Ya veremos las modalidades que adquiere en otras pruebas,
en concreto en las no paramétricas.
Si X no ha producido influencias, o si éstas han sido de poca importan-
cia, las diferencias entre T1 y T2 se consideran explicables como efectos del

214
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

azar o de los errores u oscilaciones del muestreo aleatorio; por contra,


cuando aquéllas sean notoriamente elevadas, en concreto, cuando su pro-
babilidad de ocurrencia por azar es igual o menor que aquella que se ha
fijado el propio investigador, se considera que ambos grupos ahora ya no
forman parte de la misma población y, dado que inicialmente eran equiva-
lentes y que el diseño fue eficaz para controlar las variables extrañas, que
tales diferencias son debidas a que un grupo recibió X1 y el otro X2.

2.2. Diseños con pre-test

Hay ocasiones en que interesa, por diversas razones, comprobar que


los grupos son homogéneos, al menos en ciertas variables, antes de empe-
zar a recibir variable independiente Tales razones pueden ser las de mera
tranquilidad a la hora de afirmar que las diferencias finales en variable
dependiente no tienen que ver con iniciales diferencias entre grupos; no
obstante, en otros casos, puede ser necesario disponer de medidas de refe-
rencia para comprobar si se han producido cambios, o resulta conve-
niente disponer de tales medidas como elementos explicativos de los posi-
bles resultados finales, o la complejidad de la investigación requiere tales
medidas iniciales.
En tales casos el paradigma general del diseño difiere del anterior jus-
tamente en la existencia del pretest:

Cuadro 6.4: paradigma del diseño de dos grupos con


medidas iniciales (pre-test)

Selección Variable
Grupo Pretest Postest
y asignación independiente
Experimental Azar T1 X1 T2
Control Azar T3 X2 T4

Naturalmente, este diseño permite análisis estadísticos más amplios y


complejos que el anterior. De momento caben tres tipos diferentes:
● T1-T3, para decidir sobre la equivalencia o no de los grupos antes de la
introducción de variable independiente

215
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

● T2- T4 para probar la hipótesis. Este análisis coincide con el reseñado


en el diseño anterior.
Pero cabe, además, la contrastación (T1 – T2 ) - (T3 - T4), esto es, dife-
rencias en el grupo experimental menos diferencias en el grupo de control,
o comparaciones de ganancia entre ambos grupos entre sus respectivos pre-
tests y postests. Al respecto, Kerlinger indica que este tipo de análisis no es
recomendable salvo que «el efecto de la manipulación experimental sea muy
fuerte», pues considera que tales puntuaciones de diferencia «generalmente
son menos fidedignas que las puntuaciones de las que se calcularon»17
La solución que ofrece es la de utilizar análisis de covarianza y, todavía
mejor, análisis de regresión múltiple.
Puestas así las cosas, esta modalidad de diseño parece ser más comple-
ta que la de solamente postest. Sin embargo, conviene hacer algunas preci-
siones a tener en cuenta a la hora de optar por uno u otro tipo.
Como veíamos al hablar de la validez interna de los diseños, la medición
previa o pretest puede contaminar el experimento si se convierte en una
variable extraña al interactuar con X. En efecto, aunque el pretest se aplica
por igual a ambos grupos y, en consecuencia, su influjo parece controlado, la
prueba previa puede sensibilizar a los sujetos de forma que reaccionen a X de
modo distinto a si no lo hubieran experimentado -interacción- por lo que los
resultados ya no serían generalizables sino a grupos que hayan experimenta-
do la misma pre-prueba, lo que no suele resultar ni atractivo ni útil a los
investigadores. Camppbell, refiriéndose a tales medidas, las denomina reacti-
vas dado que su efecto es provocar una reacción determinada que influye en
X y, conjuntamente con ella, en los resultados de T2 y T4 de forma diferencial.
Así las cosas ya no parece tan positivo el uso de este diseño. Sin embargo
conviene matizar; en efecto, no todas las variables son igualmente reactivas
ni en todos los casos se da la oportunidad de que aparezca el citado efecto.
Los pretests referidos a temas familiares para los sujetos, realizados en el
marco de situaciones habituales, son menos propicios al efecto sensibiliza-
dor. Por otra parte, cuando pasa suficiente tiempo entre pretest y postest, el
efecto se reduce o desaparece. Ahora bien, si nos fijamos hemos dibujado una

17
KERLINGER, F. N., o. c., p. 351.

216
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

situación habitual en las instituciones educativas: en ellas, en efecto, habi-


tualmente hay pruebas, pruebas que se refieren a aspectos que, con frecuen-
cia, se consideran variables dependientes; por otra parte, en los «experimen-
tos» educativos la duración es, por lo general, bastante elevada, lo que, si
desde la perspectiva de la aparición de variables extrañas, como vimos, es
negativo, desde la de reducción o eliminación de la sensibilización a la pre-
prueba es enormemente positivo. La consecuencia parece clara: el diseño con
pretest es especialmente apto para su aplicación a la investigación educativa.

2.3. Diseños con sujetos independientes o emparejados

La modalidad a que ahora nos referimos ha sido considerada ya con


anterioridad al estudiar la forma de control inicial, bien por vía de azar
(grupos independientes), bien por vía de bloqueo —emparejamiento en
nuestro caso—; no obstante cabe una situación más realista y común, que
es aquella en que los sujetos que forman los grupos se toman de grupos
naturales tal como están constituidos, o se seleccionan de grupos naturales,
sin alterarlos, al azar o mediante emparejamiento.
Esta situación, como decimos, es más realista en el sentido de que resul-
ta muy difícil en la investigación educativa tomar sujetos al azar de pobla-
ciones amplias y constituir con ellos grupos al azar, ya que ello comporta-
ría, por lo general, sacarles de los grupos en que se encuentran insertos,
incluso de las mismas instituciones —colegios—, con lo que ello conlleva de
problemas familiares e incluso personales —acomodación, adaptación a
nuevos lugares y personas, etc.—, algo prácticamente imposible y ni siquie-
ra recomendable.
Lo más normal es utilizar las propias instituciones y trabajar con gru-
pos ya constituidos —clases— a las que se asigna al azar los tratamientos;
si aquéllas se formaron por sistemas cuasi-aleatorios, como el orden alfa-
bético, estamos ante una casi aleatorización, en la que la población no
puede ser definida sino como los grupos de tal institución y cualquier otro
con características similares.
Un caso más favorable es aquel en que la formación de los grupos se
deja al investigador, de forma que los atribuya a uno u otro, de acuerdo con
sus necesidades, al azar, decidiendo a continuación cuál de ellos recibirá

217
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cada tratamiento; no obstante es preciso reseñar que, si tal situación se da


tras haber estado constituidos los grupos de otro modo durante algún tiem-
po, la acción del investigador es ya una variable que puede producir efectos
junto a variable independiente, convirtiéndose en extraña.
En ocasiones es posible probar la eficacia de X en varias instituciones
simultáneamente sin alterar los grupos de forma que de todos los sujetos
que forman la población se toman en consideración únicamente aquellos
que han sido seleccionados por emparejamiento o azar; naturalmente los
sujetos de cada grupo, experimental y de control, se encuentran en clases
diferentes siendo, dentro de cada una de ellas, unos alumnos más.
El análisis estadístico es diferente según que estemos ante sujetos inde-
pendientes o ante correlacionados o emparejados. La razón es obvia si
recordamos, a título de ejemplo, lo que decíamos en líneas atrás; el enfoque
estadístico básico es la comparación de las diferencias empíricas con una
estimación de la variabilidad aleatoria; ahora bien, este término es más
pequeño en el caso de los grupos correlacionados por haberse podido
extraer varianza (varianza entre filas). Consecuentemente, la estimación del
término de error debe ser diferente en unos casos de otros, aspecto este de
gran trascendencia a la hora del análisis, y, consiguientemente, de las deci-
siones.
Los casos de grupos naturales parecen especialmente aptos para diseños
pretests, si se espera razonablemente que no se dé el citado efecto reactivo
sobre X, a fin de asegurar la equivalencia inicial que no se ha podido lograr
mediante un proceso totalmente aleatorio. En consecuencia suelen tratarse
estadísticamente mediante análisis de la covarianza, que toma en conside-
ración las diferencias iniciales y su influjo sobre variable dependiente
Los paradigmas de estos diseños, en el caso del azar, son los ya reseña-
dos. La única diferencia en el caso de los sujetos emparejados se hallaría en
la columna de selección donde habría que indicar emparejamiento, aunque
la asignación a los grupos y de los tratamientos sea al azar; en el caso de
grupos naturales, la asignación de los tratamientos sería al azar y la selec-
ción de los sujetos al azar o por emparejamiento, si bien, claro está, en el
marco de tales grupos (si no se toman todos los sujetos).
La prueba t, en este caso, tiene un denominador menor, por lo que, a
igualdad de diferencia de medias en el numerador, el cociente será más ele-

218
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

vado, aumentando así las probabilidades de que las diferencias sean esta-
dísticamente significativas (Ecuación 6.2 prueba t para grupos empareja-
dos o correlacionados).

XA − XB
t=
2 2
s s s s
A
+ − 2rAB A × B
B
nA nB nA nB

2.4. Valoración

Para concluir, tal vez convenga una comparación de las dos modalida-
des básicas, azar y emparejamiento, para resumir sus aspectos positivos y
negativos, y poder optar con juicio mejor formado entre uno y otro.
a) El diseño de bloques o emparejamiento asegura en mayor grado la
equivalencia inicial y, si el emparejamiento fue eficaz, aumenta la sen-
sibilidad del experimento, permitiendo constatar diferencias que, por
el sistema al azar, pueden quedar como explicables por casualidad.
b) El diseño de bloques puede contar con menos sujetos que el al azar;
sin embargo debe partir del estudio y medición a un grupo notoria-
mente elevado para poder seleccionar unas pocas parejas. El diseño
al azar no necesita de tales mediciones previas.
c) Si bien el diseño de bloques parece más sensible que el del modelo
aleatorio, al exigir restricciones quedan limitados los g.l. -grados de
libertad-, concretamente los reduce a la mitad en el caso de t. Por lo
tanto, si por una parte es más fácil rechazar H0 en un diseño de suje-
tos correlacionados por llevar a un denominador de t más reducido,
por otra, al reducirse los g.l. los valores críticos de t que deben igua-
larse o superarse para llegar a diferencias significativas son más ele-
vados que en un diseño aleatorio18. Por lo tanto la cuestión parece
clara: se trata de averiguar cuán grande debe ser la correlación para

18
Compruebe el lector en la tabla de t que con 42 sujetos, en un diseño al azar, con α = 0,05 e hipó-
tesis bilateral, t debería ser ≥ 2,021 (40 g.l.) mientras con esos mismos sujetos y α, en un diseño de empa-
rejamiento tendría que ser ≥ 2,086, pues aquí los g.l. son 28.

219
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que, a la vez que disminuya el denominador de t, compense la pérdi-


da de g.l. Kerlinger, de modo poco preciso, afirma que debe ser 0,50,
mientras McGuigan nos ofrece un cuadro en que se relaciona tal valor
de r con el de los casos de la muestra. Según este autor puede llegar
a ser conveniente este procedimiento incluso con valores de r cerca-
nos a 0,10 (ver figura 6.3).
d) La menor precisión de los diseños aleatorios, su inferior sensibilidad,
ha sido puesta de relieve entre otros por Cochran y Cox19 y W. S.
Ray20. Ray, en concreto, los compara con diseños de ganancias, de
emparejamiento, de convarianza y de medidas repetidas, llegando a
la conclusión de que, desde el punto de vista de la precisión., ocupa el
lugar más bajo de todos ellos.

Figura 6.3. Relación entre los valorores de r y de n a los efectos de elegir entre diseños
al azar y emparejamiento. Tomada de McGuigan, o. c., p 227.

3. VALORACIÓN DE LOS DISEÑOS DE DOS GRUPOS

En general, el diseño de dos grupos, en ambas modalidades —azar y empa-


rejamiento—, es un buen diseño en cuanto a la validez interna que, como
sabemos, representa la exigencia mínima de la investigación experimental.

19
En su conocida obra Diseños experimentales, México: Trillas, 1965.
20
En An introduction to experimental design, New York: McMillan, 1960, cap. 17.

220
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

La modalidad al azar recibe consideraciones positivas de Kerlinger21


consideraciones que se centran en dos aspectos: a) permite la comparabili-
dad mediante el grupo testigo o de control, y b) hace posible la equipara-
ción sí no de los sujetos sí de los grupos como tales en cualquier variable
relacionada con la dependiente. Justamente en este último punto el autor
considera que es inferior la modalidad de emparejamiento que, según él, no
permite alcanzar esta segunda meta ya que el emparejamiento lo es en una
o pocas variables.
La modalidad de emparejamiento, como hemos visto, plantea proble-
mas respecto de la posible sensibilización ante los instrumentos de medida
y, si a partir de tales resultados, se escogieran sujetos extremos, también
con la regresión estadística. En cuanto a la mortalidad experimental este
diseño, como cualquier otro cuya realización exija bastante tiempo, puede
venir afectado por ella.
En cuanto a la validez externa, y como fruto justamente del intento de
alcanzar las metas más exigentes en el control de las variables extrañas, los
diseños de dos grupos difícilmente permiten generalizaciones amplias más
allá de los marcos concretos con los que se trabaja; así, una investigación
en un centro educativo tal vez no pueda generalizarse a otro, so pena que
la consideración de las características que le definen pueda entenderse que,
razonablemente, es muy similar en metodología, ambiente educativo, pro-
yecto, formación del profesorado, extracción del alumnado y un largo etc.
de variables implicadas. Sin embargo sí parece razonable en la mayoría de
los casos que pueda extenderse a otros grupos similares del propio centro y
a los futuros alumnos de ese grupo en años sucesivos, a menos que cambien
significativamente variables relevantes.
En general, los diseños que estamos estudiando, cuyo origen se remonta
hacia los años 30 del pasado siglo XX, como consecuencia de la disponibili-
dad de pruebas tan potentes como t o F, son especialmente indicados para
estudios de carácter exploratorio. Para etapas más avanzadas resulta preferi-
ble utilizar diseños de una variable independiente con más de dos grupos y,
por consiguiente, más de dos niveles o tratamientos de la misma, y todavía
más, de diseños factoriales en que se puede apreciar el influjo simultáneo de
dos o más variables independientes sobre una misma variable dependiente.

21
KERLINGER, F. N., o. c., pp. 345-346.

221
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En efecto, el diseño de dos grupos presenta claras limitaciones, nacidas


de su propia estructura, que no permite probar sino un nivel de variable
independiente frente a su ausencia o a lo sumo frente a otro nivel de la
misma. Ahora bien, de una parte se dan muchas variables cuya amplitud de
recorrido hace difícil elegir correctamente el nivel a contrastar frente a X0
o los niveles X1 y X2 que se contrastarán entre sí, lo que puede llevar a con-
clusiones erróneas. Tal puede ser el caso de la contrastación de los índices
de fatiga en función del tiempo dedicado al estudio, donde se puede llegar
a no contrastar la existencia de diferencias en virtud de niveles muy próxi-
mos tanto si éstos se dan en los extremos cuanto en el centro de su recorri-
do, mientras pueden encontrarse claramente con dos niveles suficiente-
mente separados. El problema es que se generalicen los resultados sobre la
base de una relación supuestamente lineal entre las variables fatiga y tiem-
po cuando esta puede ser curvilínea. En estos casos, parece especialmente
indicado un diseño multigrupos con suficientes niveles como para conocer
la forma en que las variables se relacionan, lo que permite, además, encon-
trar valores intermedios si se descubre algún modelo matemático que
represente fielmente los datos e, incluso, en función del mismo, hacer pre-
dicciones para valores exteriores a los ya contrastados.
Pero además, los problemas a resolver en ciencias de la Educación son
lo suficientemente complejos como para admitir que resulta en muchos
casos excesivamente simple y estilizado pensar en el efecto de una sola
variable independiente sobre una dependiente. Es más realista hablar de la
acción simultánea de dos o más variables independientes, —cuantas más
mejor si hay medios tecnológicos y estadísticos para afrontar su resolu-
ción— sobre una dependiente (diseños factoriales) e, incluso, sobre varias
dependientes.

4. EL DISEÑO FACTORIAL

Los diseños hasta aquí estudiados siempre han mantenido un elemento


constante: la presencia de una única variable independiente que, en la
medida en que es adecuadamente controlada por el investigador (manipu-
lación de la misma, capacidad de decisión sobre los niveles a estudiar), y
siempre que éste sea capaz de mantener bajo control las variables extrañas
a fin de que no se conviertan, en terminología de Campbell y Stanley, en

222
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

hipótesis rivales de la suya, aseguran la validez interna y, en consecuencia,


hacen posible establecer relaciones causales entre la variable independien-
te y la dependiente, siempre, eso sí, con un riesgo de error prefijado por el
investigador.
Sin embargo, es preciso reconocer que, en aras de ese control, los dise-
ños con una única variable independiente simplifican en exceso una reali-
dad por lo general más compleja, como ocurre con la educación.

4.1. Naturaleza del diseño factorial

Una forma de acercar la complejidad de la realidad a la metodología de


la investigación consiste en estudiar simultáneamente dos, o más, variables
independientes, que actúan a la vez sobre una variable dependiente. Esta-
mos ante un diseño factorial.
Esta posibilidad es ya un gran avance respecto a los diseños estudiados
hasta el momento. Pero los diseños factoriales nos ofrecen una aportación
de mayor trascendencia: la posibilidad de descubrir la existencia de inter-
acción entre las variables.
Y es que, con frecuencia, la influencia de los niveles de una variable
independiente no siempre es uniforme; en efecto, ocurre en ocasiones que
el influjo mayor o más adecuado se da por medio de una determinada com-
binación de los efectos de una de ellas —de un factor— con los de la otra
variable independiente o factor. Así, bien puede ocurrir que un determina-
do método sea más eficaz que otro cuando se aplica a un determinado tipo
de niños, por ejemplo los de un estilo cognitivo, invirtiéndose la situación
con los de estilo cognitivo diferente. O que un sistema de disciplina (nor-
mativa de un colegio) resulte más eficaz con niños de primaria, cambiando
la situación cuando estos han pasado a la pubertad y se encuentran en el
nivel secundario.

4.2. Efectos a estudiar en los diseños factoriales

Los efectos que pueden estudiarse en un diseño factorial son los siguien-
tes:

223
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

— Efectos simples: se trata de analizar el efecto de cada variable inde-


pendiente o factor para los diferentes niveles de la otra variable
independiente o factor. En el ejemplo que sigue estudiaremos el
efecto simple de la variable o factor modalidades de trabajo en el
aula sobre los niveles de la variable o factor sistemas de recompen-
sa, y viceversa.
— Efectos principales: en este caso nuestro objeto de análisis es el efec-
to global de cada variable independiente o factor de forma indepen-
diente, esto es, al margen del otro o de los otros factores. Para ello
podemos actuar de dos formas diferentes: promediando los efectos
simples de cada variable independiente o factor o calculando la dife-
rencia de las medias para cada factor (filas y columnas).
— Efectos secundarios o de interacción: en este caso, como ya hemos
señalado, tratamos de apreciar si los efectos de un determinado nivel
de uno de los factores alcanza los mejores resultados sobre la varia-
ble dependiente en una concreta combinación con otro de los niveles
de la otra variable o factor.
Junto a ellos, y desde una perspectiva diferente, en este tipo de diseños
cabe hablar de otro tipo de efectos, en concreto de efectos fijos, aleatorios o
mixtos, en función del procedimiento que haya utilizado el investigador
para decidir en relación con los niveles de las variables independientes o
factores a estudiar.
En el campo educativo es habitual que estos niveles de la variable inde-
pendiente los decida el investigador, sometiendo a contraste su influjo. De
una parte, no son demasiadas las opciones a comparar y, de otra, y por lo
general, suele contrastarse la forma habitual de actuación con otra más
novedosa, innovadora, mejor elaborada o fundamentada en teorías que se
abren paso. Tales pueden ser las situaciones que se dan con los métodos,
las formas de organización, los sistemas de motivación...
Pues bien: cuando el investigador decide los niveles concretos en que se
toman cuerpo los factores, esto es, cuando los fija, se dice que el modelo es
de efectos fijos.
Sin embargo, puede darse el caso de factores o variables con muchas
manifestaciones, y que el investigador desee probar, en general, si alguna o

224
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

algunas de ellas producen efecto o cambio en la variable dependiente. Para


ello selecciona los niveles que se someterán a contraste por procedimientos
aleatorios en lugar por decisión personal. En tales casos, el diseño es de
efectos aleatorios.
Obviamente, cabe una situación mixta: los niveles de uno de los facto-
res los fija o decide el investigador mientras los del otro se seleccionan al
azar. Este caso se denomina de efectos mixtos.
Antes de plantear la resolución estadística de un diseño con dos facto-
res, es preciso reconocer de cuál de estos tres tipos se trata ya que la forma
de obtener las medias de cuadrados o cuadráticas (MC) tanto para cada fac-
tor como para su interacción, varía de un caso a otro, conceptos estos que
se estudiarán en su momento. Ahora nos limitamos a presenta de forma
intuitiva lo que representa el análisis de la varianza, como hicimos más
atrás en el diseño de dos grupos (Figura 6.4).

LOS DISEÑOS EN LA ESTRATEGIA EXPERIMENTAL

EL DISEÑO FACTORIAL:
Varianza total

VAB
V experimental VB
V experimental

F= >1
VA
V error
Verror

Diferencia estadísticamente significativa o no (a decidir consultando las tablas


de F). La mayor diferencia se encuentra en la INTERACCIÓN

Figura 6.4. Representación de la división o análisis de la varianza total en partes,


correspondientes a la varianza experimental y a la varianza de error. División de la varianza
experimental en partes en un diseño factorial.

En el gráfico, la varianza total queda dividida, como en el anterior, en


dos grandes partes: la experimental, debida al efecto de las variables inde-
pendientes o factores —A y B— y la varianza de error. Ahora bien, como

225
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

podemos apreciar esa varianza experimental queda analizada o dividida a


su vez en tres partes, una para el efecto de la variable independiente o fac-
tor A, otra para el factor B y una tercera para la interacción.
Por ello, cuanto apliquemos la prueba F trataremos de apreciar:
a) Si hay diferencias estadísticamente significativas en general.
b) Si las diferencias son o no estadísticamente significativas para el factor A.
c) Si lo son para el factor B.
d) Si se dan para la interacción entre A y B.

5. EL DISEÑO DE CUADRADO LATINO

En el diseño de cuadrado latino se utilizan tres variables independien-


tes, si bien una sola es la que interesa en verdad al investigador, la deno-
minada por lo general variable tratamiento. Las otras dos variables se utili-
zan para controlar su posible efecto sobre la variable dependiente, tratando
de evitar que se conviertan en variables extrañas.
Un sencillo ejemplo nos permitirá entender su peculiaridad.
Supongamos un investigador interesado por contrastar una hipótesis
sobre el influjo de tres modalidades de motivación en las aulas; una prime-
ra manifestación o nivel de esta variable independiente será la motivación
intrínseca; otro, el B, la extrínseca, concretada en premios en caso de cali-
ficaciones positivas; y la C, también extrínseca, pero concretada en castigos
ante las bajas calificaciones.
Ahora bien: tal investigador piensa que, tal vez, el curso que estudian
de los sujetos puede influir en los resultados, por lo que decide formar gru-
pos homogéneos con niños de 4.º de primaria, 2.º de ESO y 1.º de Bachi-
ller. Esta variable, curso, denominada aquí M, es independiente, pero el
investigador la utiliza para controlar su efecto, ya que cada uno de sus
niveles —4.º, 2.º y 1.º— recibirán los niveles A, B y C.
Pero considerando que el tipo de asignatura puede también influir, trata
de comprobar tales efectos con asignaturas de ciencias, de idiomas y de
humanidades (variable N). También esta variable es independiente pero su

226
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

utilización busca el control de sus posibles efectos sobre la dependiente, de


forma que los tres tipos de asignaturas serán cruzados con los niveles A, B
y C de la variable independiente o tratamiento.
Como podemos apreciar por el gráfico (cuadro 6.5), los niveles de la
variable tratamiento se encuentran en su interior, distribuidos adecuada-
mente entre filas y columnas.

Cuadro 6.5. Representación esquemática de un diseño de cuadrado latinol

Variable M: Curso
4º de 1º de
Variable N: 2º de ESO TOTAL
Primaria Bachiller
Tipo de asignatura
Ciencias A B C
Idiomas B C A
Humanidades C A B
TOTAL

Como podemos comprobar, la variable tratamiento, en sus tres niveles,


A, B y C, se aplica a las combinaciones de las variables M y N de bloqueo,
con lo que sus efectos parecen estar controlados. El orden en que se pre-
senten A, B y C es indiferente (debería hacerse al azar) pero de forma que
no aparezcan más de una vez por fila y columna.
Como podemos apreciar en la figura 6.5, la varianza experimental se
analiza o descompone en cuatro partes:
a) La que nos interesa, que es la correspondiente a los tratamientos A, B y C.
b) La atribuible a la variable de bloqueo M (columnas), que nos permiti-
rá apreciar si las diferencias entre los bloques son o no significativas.
c) La atribuible a la variable de bloqueo N (filas), con el mismo objetivo.
d) Y la correspondiente a la interacción.
Conviene hacer notar que si, en el caso de los diseños factoriales, la exis-
tencia de interacción se considera una aportación positiva, en este caso
ocurrirá todo lo contrario. En efecto, compruebe el lector que si se diera
interacción estaríamos englobando bajo el mismo concepto y cantidad el

227
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

efecto de la misma (filas y columnas) con el correspondiente a la variable


tratamiento o variable experimental. Con ello se daría confusión y no
podría cumplirse con la pretensión de la validez interna: que el efecto medi-
do en la variable dependiente se deba a, y solo a, la variable independiente,
en este caso la variable tratamiento.

LOS DISEÑOS EN LA ESTRATEGIA EXPERIMENTAL

EJEMPLO DE DISEÑO CUADRADO LATINO:

V experimental
V columnas
V residual entre celdas
V filas
Vexperimental
F= >1
V tratasmiento
V error
Verror

Diferencia estadísticamente significativa o no (a decidir mediante


la consulta de la tabla de F)

Figura 6.5. Representación de la división o análisis de la varianza total en partes,


correspondientes a la varianza experimental y a la varianza de error. División de la varianza
experimental en partes en un diseño de cuadrado latino

6. EL DISEÑO DE COVARIANZA

Como ha quedado dicho previamente, no es fácil, ni conveniente en


muchos casos, proceder a la selección aleatoria de sujetos en los «experi-
mentos» en el campo de la Educación.
El mero hecho de sacar a los alumnos de sus clases, con su red de ami-
gos, con el conocimiento de la «cultura» de grupo… para formar un nuevo
grupo, experimental o de control, puede ser ya una variable extraña. Nada
digamos, además, de la posibilidad misma de que el investigador sea auto-
rizado en un centro educativo a realizar ese tipo de actuaciones.
Pero cuando esto ocurre, siempre existe la duda razonable de si, al
comenzar la investigación, los sujetos de los grupos experimental y control

228
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

son equivalentes, si son intercambiables, si, en definitiva, podemos consi-


derar que están controladas las posibles variables extrañas. Ante esta duda
o disponemos de algún medio para asegurarnos o no merecería la pena pro-
ceder a la investigación.
Pues bien, en tales casos, en los que tratamos de investigar con sujetos
que forman parte de grupos naturalmente constituidos, de grupos intactos,
la actuación recomendable es la constatación inicial de la igualdad o des-
igualdad estadística antes de comenzar la investigación.
Pongamos por caso que deseamos comprobar la eficacia de tres méto-
dos para el aprendizaje de idiomas. Tomamos 10 sujetos —alumnos— al
azar de sendos grupos naturales de un centro educativo. Podríamos medir
su nivel de inglés antes de comenzar la investigación introduciendo la varia-
ble método, en sus tres niveles, A, B y C.
La previsible diferencia inicial es esta variable, denominada co-variable,
será tomada en consideración al finalizar el experimento con la medida de
la variable dependiente. En lugar de someter a contraste las medias en la
variable dependiente procederemos a contrastar las medias ajustadas en tal
variable, esto es: las medias finales teniendo en cuenta las diferencias ini-
ciales.
Este procedimiento es similar al que se utiliza en algunos deportes. Por
ejemplo, en vela, una vez terminadas las regatas se decide quién ha venci-
do teniendo en cuenta el tiempo compensado, en función de determinadas
variables que darían ventaja a unas sobre otras.
En hípica, antes de comenzar la prueba se atiende al hándicap o sobre-
peso que lleva el caballo; se trata de igualar las condiciones de la competi-
ción. Así, cuando un jinete es más ligero que lo dispuesto en las normas;
o en caso de que el jockey tenga un peso superior a lo establecido como
óptimo, se toman las medidas pertinentes.
En atletismo, cuando los atletas deben dar la vuelta al estadio, se com-
pensa a los que salen por el exterior de la pista en relación con los que lo
hacen por el interior a fin de que todos corran la misma longitud.
Pues bien: en nuestro caso, al contrastar las medias finales en idiomas
lo haremos comparando las medias finales de cada método tomando en
consideración, ajustándolas a las diferencias iniciales. De este modo, si un

229
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

grupo partió con ventajas, su media ajustada será menor que la real, y vice-
versa.

7. EL DISEÑO DE UN SOLO GRUPO

Ya hemos presentado estos diseños al hablar de los pre-experimentales,


haciendo notar sus muchas debilidades.
Como síntesis de la situación nos parece muy adecuada la siguiente cita
del profesor G. Vázquez22:

«Se han necesitado cerca de cincuenta años para verificar que la cuasi-experi-
mentación es el grado máximo de control pertinente para el estudio de la educa-
ción. Por ello, es hora ya de que se descalifique tanto la investigación llamada pre-
experimental como la experimental propiamente dicha. La primera, como pre
(mejor diríamos a) científica. La segunda, como inadecuada respecto de la inves-
tigación sobre la calidad de la educación.»

Pero junto a tales diseños pre-experimentales, podemos citar aquí dos


situaciones propias de los diseños de un solo grupo: los de bondad de ajus-
te y los diseños N = 1.
En el primer caso, tratamos de probar si unos determinados datos empí-
ricos se acomodan o no, en términos estadísticos, a un determinado mode-
lo, como puede ser un tipo de distribución, entre los que destaca la distri-
bución normal o campana de Gauss. Más adelante (tema 10) tendremos
ocasión de ver esta aplicación con pruebas como χ2.
En el segundo, se trata de intentos de aplicar el rigor de la metodología
experimental a un solo caso, se entienda por tal un solo sujeto o un solo grupo.
Los diseños presentados como de medidas repetidas se ubicarían en este
punto; caben modalidades como los diseños A – B o diseño reversible
incompleto; diseño balanceado simple: A – B; B – A; el diseño por empare-
jamiento o el diseño reversible (A – B – A).

22
VÁZQUEZ GÓMEZ, G. (1980). Prólogo a la obra de D.J. FOX: El proceso de investigación en educa-
ción. Pamplona: EUNSA.

230
PRINCIPALES DISEÑOS: DE UNO, DOS Y MÁS GRUPOS. DISEÑOS FACTORIALES Y DE CUADRADO LATINO. DISEÑO DE COVARIANZA

RESUMEN
En el presente tema hemos sometido a estudio la relación directa entre
los diseños de dos grupos y la naturaleza del experimento, realizando una
valoración de tal hecho.
En segundo lugar hemos estudiado los principales diseños de dos gru-
pos, con o sin pre-test, con grupos al azar, formando bloques o empareja-
dos, terminando con una valoración de las diferentes modalidades.
En el tema hemos presentado algunos diseños más complejos y, por lo
mismo, más adecuados para la investigación en educación, dada la com-
plejidad que la caracteriza: se trata de los diseños factoriales, de cuadrado
latino y de covarianza.
Por último, hemos hecho una breve referencia a los diseños de un solo
grupo, en general inadecuados por ser pre-experimentales; no obstante, nos
hemos referido a dos modalidades con algún interés: aquellos en los que
interesa simplemente comprobar la bondad de ajuste a un modelo, y aque-
llos otros que, con un solo grupo, pretenden aplicar el rigor experimental,
en formatos como los de medidas repetidas.

231
Tema 7
Estadística y diseños I. Estimación de parámetros

Presentación

1. Introducción

2. Conceptos básicos en la inferencia estadística


2.1. Propiedades de los estimadores

3. Distribución muestral, error muestral y error típico: estimación del


parámetro media aritmética
3.1. Estimación del parámetro proporción

4. Estimación del parámetro correlación de pearson. Introducción al


concepto de la significación estadística y al planteamiento de los diseños
de un solo grupo

5. Estimación del parámetro diferencia de medias

6. Estimación de parámetros y contraste de hipótesis: interpretación intuitiva

Resumen

233
PRESENTACIÓN

A través de este tema entramos en la lógica de la resolución estadística


de los diseños de investigación. Para avanzar en los temas siguientes de
forma comprensible, los lectores deberían haber estudiado previamente las
nociones básicas de estadística descriptiva: medidas de tendencia central,
variabilidad y representaciones gráficas. Por otra parte, también será fun-
damental tener actualizados los conocimientos sobre distribuciones de fre-
cuencias, en especial la distribución normal (puntuaciones típicas) y la
interpretación de las áreas o probabilidades asociadas a cada puntuación1.
En este tema haremos un repaso al concepto de inferencia estadística, dis-
tribución muestral y estimación de parámetros, su relación con los diseños
de un solo grupo y el acercamiento conceptual a los diseños de dos grupos.

1. INTRODUCCIÓN

A lo largo de esta obra estamos estudiando algunas formas de obtener


conocimiento riguroso sobre la educación mediante la investigación científi-
ca. En muchas ocasiones, a los profesionales de la educación simplemente les
interesa conocer la realidad en su contexto concreto (sus centros, sus aulas,
sus alumnos individuales) para tomar decisiones (áreas de mejora, incenti-
vos, promoción de alumnos, diagnósticos, etc.). Sin embargo, debemos ser
conscientes de que para poder beneficiarnos de los avances en el campo de la
educación, otros antes han tenido que investigar sobre métodos eficaces de
enseñanza, fiabilidad y validez de los instrumentos de medida, variables que
inciden sobre la mejora escolar, etc. Y para llegar a un conocimiento válido,

1
A este respecto, puede consultarse el texto 1. PÉREZ JUSTE, R.; GARCÍA LLAMAS, J. L.; GIL PASCUAL,
J. A. y GALÁN GONZÁLEZ, A. (2009). Estadística aplicada a la educación. Ed. Pearson-UNED. Madrid.

235
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

debemos realizar diseños de investigación rigurosos que nos proporcionen


las evidencias necesarias como para ir avanzando en la generación de leyes
generales. En este sentido, el investigador cambia su centro de interés desde
los resultados obtenidos en grupos o muestras de sujetos concretos hasta la
extrapolación de los resultados de dichos grupos a las grandes poblaciones a
las que pertenecen. Este interés científico por extrapolar los resultados, por
tratar de descubrir leyes generales aplicables de forma universal, se concreta
en la inferencia estadística. Las dos aplicaciones básicas de la inferencia son
la estimación de parámetros y el contraste de hipótesis.
La inferencia estadística se aplica con frecuencia en nuestro entorno.
Desde la publicación de encuestas de opinión, estudios demoscópicos,
encuestas electorales, etc., hasta investigaciones contra el cáncer, cálculos
para conquistar Marte o estudios de mercado.
Nuestra aproximación al campo de la inferencia estadística en este capí-
tulo va a ser fundamentalmente conceptual e intuitiva, buscando la com-
prensión de conceptos más que el cálculo de funciones. También relacio-
naremos la estimación de parámetros con los diseños de investigación.

2. CONCEPTOS BÁSICOS EN LA INFERENCIA ESTADÍSTICA

Como hemos dicho, la estadística es la ciencia que se ocupa de la orde-


nación y análisis de datos procedentes de muestras, y de la realización de
inferencias acerca de las poblaciones de las que éstas proceden (Botella et
al., 1993). Aclaremos los términos contenidos en esta definición:
• Población: Conjunto de todos los elementos que cumplen una o varias
características o propiedades. Los índices numéricos que describen a
la población se denominan parámetros. Por ejemplo, si quisiéramos
saber el nivel intelectual de todos los estudiantes que cursan 1.º de
Magisterio en España, la población estará constituida por todos aque-
llos sujetos que cumplan dicha propiedad, esto es, cursar 1.º de Magis-
terio en España. Si nos contentáramos con la media aritmética como
índice descriptivo de la población, tendríamos que aplicar un test de
inteligencia a cada uno de los sujetos (elementos) de la población y
luego calcular la media aritmética. El valor de dicha media aritméti-
ca, por ejemplo 109, sería el valor del parámetro media.

236
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

Como podrá imaginarse, normalmente los valores paramétricos son


desconocidos porque resultaría enormemente costoso y complicado
obtener datos de todos los sujetos de la población. Por esta razón se
trabaja con muestras a partir de las cuales —si procede— se trata de
estimar el valor de los parámetros.
• Muestra: Es un subconjunto de los elementos de una población. Los
índices numéricos que describen a las muestras se denominan estadísti-
cos. Como decíamos, normalmente resulta imposible trabajar con todos
los sujetos de una población, por lo que nos contentamos con trabajar
con una muestra perteneciente a la misma. La técnica para seleccionar a
los sujetos que entrarán a formar parte de la muestra se llama muestreo.
En el capítulo anterior se describieron las técnicas de muestreo. Siempre
que sea posible se debe utilizar el muestreo aleatorio porque nos da
mayores garantías de que la muestra sea representativa de la población.
Siguiendo el ejemplo anterior, si nos interesa estimar el CI (cociente
intelectual) de la población de estudiantes españoles de 1.º de Magisterio,
dada la imposibilidad de aplicar un test de inteligencia a todos los sujetos,
lo más fácil es seleccionar una muestra suficiente en número (existen pro-
cedimientos para calcular el número de sujetos necesarios) y representativa
de la población, es decir, que no esté sesgada. Podría estar sesgada, por
ejemplo, si seleccionamos como muestra a los alumnos de una sola univer-
sidad o de una única Comunidad Autónoma. El muestreo aleatorio no ase-
gura la representatividad de la muestra, pero es el método que nos ofrece
mayores garantías de obtener una muestra representativa de la población.
Evidentemente, a mayor tamaño de la muestra, mayores garantías de
representatividad. Decimos que no asegura la representatividad porque
podríamos tener tan mala suerte que, a pesar de haber elegido los sujetos
al azar, éstos pertenecieran a una sola provincia o fueran los más inteli-
gentes de la población (aunque esto sería muy improbable, pero posible).
Supongamos que la población a la que nos estamos refiriendo en el ejem-
plo es de 10.000 sujetos y seleccionamos una muestra aleatoria de 1.500. Una
vez que hemos elegido la muestra, el paso siguiente sería el proceso de medición.
La medición supone uno de los problemas más graves en educación y
en psicología. Pensemos que nos estamos enfrentando en muchas ocasio-
nes a la medida de lo que se denominan constructos, es decir, característi-

237
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cas del hombre que no son directamente mensurables. Lo que medimos son
las manifestaciones observables que atribuimos a dichos constructos. Así,
por ejemplo, cuando medimos la inteligencia a través de un test, lo que
medimos son las manifestaciones observables que teóricamente atribuimos
a la inteligencia, como la capacidad verbal, numérica, abstracta, etc. que
son más fácilmente mensurables. Se sigue el mismo procedimiento para
medir el rendimiento académico, la memoria, la capacidad de resolución de
problemas, las aptitudes, las actitudes, etc.
Lo que debe quedar claro es que necesitaremos uno o varios instru-
mentos adecuados para recoger los datos que permitan responder a los
objetivos e hipótesis de la investigación. Una vez elaborados los instrumen-
tos de medida, se aplican a la muestra, se recogen los datos y se elabora la
matriz de datos. Y a partir de aquí se realizaría la ordenación y categoriza-
ción de datos y el análisis descriptivo, obteniendo ya una información muy
valiosa para caracterizar la muestra respecto a las variables de interés.
La estadística inferencial o inferencia estadística pretende sacar con-
clusiones sobre gran número de datos a través de observaciones de parte de
esos datos. Mediante la estadística inferencial se puede estimar parámetros
y realizar contraste de hipótesis.
Es importante notar que se habla de estimación y no de cálculo de pará-
metros. Con el ejemplo anterior del C.I. se entiende perfectamente. Nos
puede interesar saber el cociente intelectual de una población de 10.000
alumnos. Sin necesidad de aplicar un test a todos ellos, es decir, seleccio-
nando una muestra aleatoria suficiente y representativa, probablemente
obtengamos un valor cercano al verdadero valor de la media aritmética del
C.I. poblacional (el parámetro). Decimos probablemente porque, como ya
comentamos, hemos podido tener tan mala suerte en la selección aleatoria
que la muestra no sea representativa de la población. Por esta razón, en la
inferencia estadística nunca se habla de certezas, sino de probabilidades de
acierto y de error en nuestras afirmaciones.
Dentro del marco de la estadística inferencial suelen distinguirse dos
objetos de estudio: la estimación de parámetros y el contraste de hipóte-
sis. Un parámetro se estima siempre a partir de un estadístico calculado en
una muestra. Se habla de dos tipos de estimación: estimación puntual y
estimación por intervalos. Básicamente, en la estimación puntual se hace
coincidir el estadístico con el parámetro, es decir, se escoge un solo punto

238
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

(el estadístico) para estimar el valor del parámetro. Por su parte, en la esti-
mación por intervalo se ofrece un intervalo de puntuaciones en el cual es
más probable que se encuentre el valor del parámetro.
El ejemplo del CI era clarificador: para estimar la media aritmética del CI
de una población (parámetro), podemos seleccionar una muestra aleatoria
suficiente y representativa en la que aplicar el instrumento de medida, y a par-
tir del estadístico calculado en la muestra (media aritmética), estimaremos el
valor del parámetro (de forma puntual si identificamos este valor con el valor
del parámetro) o, más comúnmente, estimaremos los valores (límites de con-
fianza) entre los cuales es más probable que se encuentre el verdadero valor del
parámetro, es decir, la estimación por intervalo o el intervalo de confianza.

2.1. Propiedades de los estimadores

Como se habrá podido comprender, la estimación consiste en la técnica


que permite conocer un valor aproximado de un parámetro de una pobla-
ción a partir de los datos proporcionados por una muestra. Un estimador
es un estadístico muestral que permitirá la estimación de un parámetro
poblacional, una función de los datos muestrales. Estas son las caracterís-
ticas que debe poseer un buen estimador: insesgado representa la población
sesgado la muestra
Carencia de sesgo: podemos decir que un estimador insesgado es aquel
que tiene sesgo igual a cero. La propiedad de insesgamiento nos garantiza
que las estimaciones que hagamos con el estimador se encuentran alrede-
dor del parámetro en cuestión, de forma simétrica, es decir, que el prome-
dio de los estadísticos coincide con el verdadero valor del parámetro.
Eficiencia: Un estimador es tanto más eficiente cuanto menor es su des-
Testo

viación típica. Lógicamente, si pensamos en una distribución muestral,


cuanto más «estrecha» sea, cuanto menor sea su error típico, más cercanos
estarán los estadísticos al valor del parámetro.
Consistencia: un estimador es consistente si a medida que aumenta el
tamaño de la muestra, la probabilidad de que el valor del estadístico se
acerque al valor del parámetro va siendo mayor.
Suficiencia: Un estimador es suficiente cuando es capaz de sustraer de
la muestra toda la información que ésta contenga acerca del parámetro.

239
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Estas cuatro propiedades se entenderán mejor después de leer el epí-


grafe siguiente.

3. DISTRIBUCIÓN MUESTRAL, ERROR MUESTRAL Y ERROR


TÍPICO: ESTIMACIÓN DEL PARÁMETRO MEDIA ARITMÉTICA

Para comprender cómo se realiza la estimación de un parámetro es nece-


sario conocer y entender algunos conceptos asociados. Entre las distintas for-
mas que pueden adoptar las distribuciones de frecuencias en distintas varia-
bles, el lector ya estará familiarizado con un tipo de distribución
característica que se denomina distribución normal o campana de Gauss.
Pues bien, al igual que la distribución normal, existen otra serie de distribu-
ciones teóricas (modelos matemáticos de distribución) como la binomial, la
t de student, la multinomial, la F, etc., en las que se conoce la probabilidad
de aparición asociada a todos los posibles valores del estadístico. La natura-
leza de las variables, el conocimiento de determinados valores paramétricos
y el tamaño muestral son algunas de las causas que dan lugar a estas dife-
rentes distribuciones. Estas distribuciones son como un polígono de fre-
cuencias suavizado: frecuencias relativas en el eje de ordenadas y puntuacio-
nes en el eje de abcisas. Pues bien, existe un concepto teórico de distribución
(función de densidad de probabilidad) que es la distribución muestral y que
puede definirse como la distribución de un estadístico en el muestreo. Esta
distribución está formada por los infinitos valores de un estadístico obteni-
dos de infinitas muestras aleatorias del mismo tamaño extraídas de la misma
población. Tratemos de comprender y ejemplificar estas definiciones:
Si nos remitimos a la distribución muestral de la media aritmética, está
demostrado que, según el teorema central del límite (la distribución de la
suma de variables aleatorias tiende a una distribución normal), para muestras
grandes2 y conocidos los parámetros µ y σ, esta distribución toma la forma de
una distribución normal. ¿Cómo se formaría esta distribución teórica?
Dada una población definida, podríamos extraer de ésta (teóricamente,
claro) infinitas muestras aleatorias (pongamos, de 1000 sujetos) y en cada
una de ellas calcular su media aritmética. Si el parámetro (µ) fuera conoci-

2
Algunos autores refieren al menos N>30, mientras otros prefieren hablar de N>100.

240
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

do, podríamos comprobar cómo la mayoría de las x– de las muestras se


encontrarían cerca del valor paramétrico, pero precisamente por ser mues-
tras aleatorias, algunas se alejarían un poco de dicho valor y muy pocas
(pero algunas) se alejarían mucho del valor del parámetro (porque por la
suerte del azar en esa muestra salieron sujetos más o menos inteligentes
que los que en realidad hay en la población). No obstante, en la inmensa
mayoría de los casos, si queremos estimar el valor del parámetro (pensemos
en las encuestas electorales) será porque su valor es desconocido. Por tanto,
confiamos en que nuestra muestra sea una de esas (entre las infinitas posi-
bles) en las que el valor de la x– sea próximo a µ (porque hay una alta pro-
babilidad de que sea así). Sin embargo, hemos podido tener tan mala suer-
te que nuestra muestra estuviera sesgada, es decir, que no sea
representativa de la población y que su x – fuera una de esas que se aparta
mucho del valor de µ. Por esta razón, en inferencia siempre hablamos del
nivel de confianza (porcentaje de confianza al hacer la estimación; tam-
bién puede darse como probabilidad en vez de porcentaje y representarse
por 1-α). Además es frecuente utilizar el término contrario: nivel de signi-
ficación (α, probabilidad de error que estamos dispuestos a cometer en la
estimación), aunque éste es más habitual en el contexto del contraste de
hipótesis. Así, si estamos dispuestos a trabajar con una probabilidad de
error de α = 0,05, nuestro nivel de confianza será del 95% (ó 0,95). O un
nivel de confianza del 99% implica un α = 0,01. El nivel de significación es
elegido por el investigador (profundizaremos en esta cuestión en el tema
siguiente), aunque se suelen utilizar como valores referenciales 0,01 y 0,05.
Por tanto, para hallar el intervalo confidencial, es decir, los valores
entre los cuales es más probable que se encuentre el verdadero valor del
parámetro (recordamos que ahora estamos hablando del parámetro media
aritmética, pero es análogo en casi todos los casos), necesitamos calcular la
– de la muestra a la que sumaremos y restaremos el error muestral, es
x
decir, la diferencia más probable entre el estadístico y el parámetro.
I.C. = x– ± E.M.
El error muestral nos da una idea de la precisión de nuestra inferencia
estadística. Como se deduce rápidamente de la fórmula anterior, cuanto
más grande sea el error muestral, menor será nuestra precisión en la esti-
mación y menor será la utilidad de la estimación (pensemos, por ejemplo,
lo inútil que sería estimar que la calificación media de un grupo en mate-

241
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

máticas se encontrará en el intervalo de 1 a 9; o que la estimación de voto


de un partido político se encuentra entre el 10 y el 90%. ¡Para eso no nos
hace falta una estimación!).
Habremos comprendido ya que una distribución muestral tiene variabi-
lidad, es decir, que en ese proceso de obtención de infinitas muestras alea-
torias, los estadísticos que obtendríamos (las medias en CI obtenidas en
cada muestra aleatoria) tendrían diferentes valores. Es decisivo en este
punto recordar qué índice descriptivo expresa la variabilidad: la desviación
típica. Por tanto, una distribución muestral tendrá su propia desviación
típica. A la desviación típica de la distribución muestral se le denomina error
típico. Es una medida de dispersión con respecto al parámetro, en este caso
con respecto al parámetro media aritmética; es decir, nos indicará la dis-
persión de las medias de las infinitas muestras aleatorias extraídas respec-
to a la media poblacional (la gran media o la media de las medias de la dis-
tribución muestral).
Pero de nuevo nos encontramos con la misma pregunta. Si es una dis-
tribución muestral, teórica, ¿cómo podremos conocer este dato? Si cono-
ciéramos el valor del parámetro σ (lo cual es inusual en la investigación
corriente), la fórmula sería la siguiente:

σx = σ
√ N-1
Cuando σ es desconocido, estimaremos su valor y nos basaremos en los
datos de la muestra, en este caso en su desviación típica. En el caso de la
distribución muestral de medias, esta es la fórmula3:

σx = s
√ N-1
Como vemos, el error típico no sólo depende de la desviación típica, sino
que depende en gran medida del tamaño de la muestra. El tamaño mues-
tral es decisivo en la inferencia estadística. Cuando más grande N, más
pequeño el cociente, más pequeño el error típico y más precisión en la esti-

3
En estas dos últimas fórmulas, recordamos que en denominador aparecerá N-1 cuando se haya
calculado en la muestra la desviación típica sesgada, o sólo N cuando se haya calculado la desviación
típica insesgada.

242
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

mación del parámetro. Pensemos de nuevo en una encuesta electoral: rea-


lizando un muestreo adecuado, cuanta más gente responda a la encuesta
electoral, menor será la probabilidad de cometer errores en la estimación
de la intención de voto. Por el contrario, si preguntamos a muy pocas per-
sonas, será más probable equivocarnos, que exista un sesgo, por lo que el
error típico será mayor y, en consecuencia, también lo será el error mues-
tral y se abrirá la horquilla del intervalo de confianza, lo que repercutirá en
una menor precisión de la estimación.
Sólo nos queda saber cómo calcular el error muestral.
Para ello hemos tenido que definir el nivel de significación con el que
vamos a realizar la estimación. Si σ es conocido (o también si la muestra es
grande), debemos entonces recurrir a la distribución normal y escoger la
puntuación z correspondiente a dicho nivel de significación (puntuación
conocida y que podemos consultar en las tablas de z gracias a que la distri-
bución muestral es normal) y multiplicar dicha z por el error típico, esto
es, la desviación típica de la distribución muestral.
E.M. = Z(α/2)· σx–,
Donde la Z(α/2) es la puntuación típica correspondiente al nivel de signi-
ficación (α) que hemos establecido (o al nivel de confianza).
Como sabemos, si trabajamos con un nivel de confianza del 95%, esto
equivale a α = 0,05. Puesto que tomamos el valor del estadístico como
estimador del parámetro, tomamos el 95% de los valores situados en el
centro de la distribución muestral, esto es, el 47,5% a cada lado del esta-
dístico, como la zona donde es más probable que se encuentre el pará-
metro. En otras palabras, consideramos que en la zona más grande de la
distribución muestral (zona no sombreada en el gráfico) se producen las
diferencias «normales» o esperables por efecto del azar entre el estadís-
tico y el parámetro, y que sería muy improbable que el verdadero valor
del parámetro se encontrara en la zona sombreada (tan improbable
como α). Como el error que estamos dispuestos a cometer es de α = 0,05,
esta probabilidad de error tenemos que repartirla en ambas colas de la
distribución, de ahí que la z utilizada sea la z de α/2, que encontramos
directamente en las tablas de la curva normal buscando en el área de la
parte menor 0,025. De modo análogo, la z para un nivel de confianza del
99% es 2,57.

243
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

p = /2 = 0,025 Zona más probable


para encontrar el
valor del parámetro
con un N.C. = 95 %

z
-1,96 +1,96

Límite Límite
confidencial X confidencial
inferior superior
Error muestral

Gráfico 7.1. Intervalo de confianza en la estimación de parámetros.

Siguiendo con el ejemplo anterior, supongamos que hemos aplicado un


test de cociente intelectual a una muestra aleatoria de 1.000 adolescentes
de la Comunidad de Madrid para estimar el cociente intelectual medio de
la población de adolescentes de Madrid. Obtenemos una x – = 105 y una s =
10. Para estimar el valor del parámetro m (intervalo confidencial) con un
nivel de confianza del 99%, haríamos lo siguiente:
I.C. = 105 ± E.M.
En este caso, la Z (α/2) = 2,57 y el σx– = 10 / √999 = 0,32, por lo que el
E.M. = 2,57 · 0,32 = 0,82.
En definitiva, I.C. = 105 ± 0,82, con lo que obtenemos ambos límites
confidenciales, inferior y superior: L.C.I = 104,18 y L.C.S = 105,82. En con-
clusión, podemos decir con un nivel de confianza del 99% que, si repitiése-
mos la estimación un número muy elevado de ocaciones, en el 99% de esas
muestras, la media en inteligencia de los adolescentes de la Comunidad de
Madrid se encontraría entre los valores 104,18 y 105,82.
De la misma forma que estimamos el parámetro media aritmética, se
pueden estimar otros como la varianza, el coeficiente de correlación, la

244
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

diferencia de medias, etc. La lógica del proceso en la mayoría de los casos


es exactamente igual: partiremos del estadístico cuyo parámetro se desea
estimar al que se le sumará y restará el error muestral (siempre que la dis-
tribución muestral sea simétrica). Para calcular el error muestral debemos
conocer la distribución muestral del estadístico que se trate (por lo que hay
que consultar las tablas apropiadas para saber el valor del estadístico
correspondiente al nivel de significación) y consultar la fórmula específica
para calcular el error típico.
Estimación del parámetro media aritmética (σ desconocido y para
muestras pequeñas).
Cuando σ es desconocido y contamos con muestras pequeñas (N<30), la
distribución muestral de la media sigue la distribución t de student. La dis-
tribución t varía en función del número de sujetos (y, en consecuencia, de
los grados de libertad), aunque se trata también de una distribución simé-
trica y asintótica. Cuando N tiende a infinito, la distribución t tiende a la
distribución Z. En este sentido, algunos programas estadísticos utilizan
sólo la distribución t, independientemente del tamaño de la muestra. En el
gráfico siguiente puede verse cómo varía la forma de la distribución mues-
tral según varía el tamaño de la muestra.

Gráfico 7.2. Distribución muestral t de student para varios tamaños muestrales4.

4
Gráfico tomado de Wikipedia.

245
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La lógica de la estimación del parámetro media en esta situación es


exactamente la misma, lo único que cambia es el estadístico para calcular
el error muestral. Es decir, en lugar de hablar de la Z(a/2), hablaremos de la
t(a/2), para lo que contamos también con las tablas correspondientes (o con
un programa de ordenador o múltiples páginas web que nos dan la proba-
bilidad asociada al valor del estadístico t, Z, F, etc.).
Pongamos que en el ejemplo anterior, con los mismos datos, en vez de
tener una muestra de 1000 sujetos, tenemos una muestra de 25.
I.C. = 105 ± E.M.
En este caso, al ser una muestra pequeña, corresponde la distribución
muestral t para N-1 grados de libertad, donde la t (α/2) = 2,797 y el σx– = 10 /
√24 = 2,04, por lo que el
E.M. = 2,797 · 2,04 = 5,71.
En definitiva, I.C. = 105 ± 5,71, con lo que obtenemos ambos límites
confidenciales, inferior y superior: L.C.I = 99,29 y L.C.S = 110,71. En con-
clusión, podríamos afirmar que el intervalo de confianza del 99% alrededor
de la medida de la muestra cae entre los valores de 99,29 y 110,71. También
podemos decir que si utilizásemos este mismo procedimiento de estima-
ción en cientos o miles de muestras, con un nivel de confianza del 99%, en
el 99% de esas muestras, la media en inteligencia de los adolescentes de la
Comunidad de Madrid se encontraría entre los límites confidenciales esta-
blecidos (y la nuestra podría ser, o no, una de ellas). Sería un error decir
que tenemos una probabilidad de 0.99 de que el valor del parámetro se
encontrará entre esos límites confidenciales. Como vemos en nuestro ejem-
plo, hemos perdido un gran nivel de precisión al disminuir el tamaño de la
muestra, de modo que ahora la horquilla del intervalo de confianza es supe-
rior a 11 puntos.
La utilidad de la estimación de parámetros (en este caso del parámetro
media) se concreta en distintas aplicaciones. Por ejemplo, nos puede intere-
sar saber si el CI de nuestra muestra puede considerarse igual al CI de la
población (podríamos considerar el CI poblacional el obtenido en una prue-
ba comercial aplicada a una muestra muy grande de sujetos). Si el CI de la
población se encuentra dentro de nuestro intervalo de confianza, podríamos
decir que nuestra muestra pertenece a la población, o que no hay diferencias

246
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

estadísticamente significativas entre la media de la muestra y la media pobla-


cional, aunque esto se explicará detenidamente al hablar de las pruebas de
contraste de hipótesis. Por otra parte, el error típico utilizado en la fórmula
tiene también importantes aplicaciones, como es el cálculo del tamaño mues-
tral necesario en función del margen de error máximo (error muestral máxi-
mo) que estamos dispuestos a aceptar. Así, se entenderá ya que, a menor
error muestral deseado, mayor tendrá que ser el tamaño de la muestra.
Resumiendo, los pasos para estimar el intervalo de confianza son los
siguientes:
1. Seleccionar una muestra aleatoria de una población definida.
2. Seleccionar el nivel de confianza.
Si σ es conocido (desviación típica de la población)
3. Usar su valor, junto con el N de la muestra, para calcular el error
típico.
4. Utilizar la distribución normal para buscar (en las tablas de z) los
valores «críticos» de z correspondientes a la parte central de la dis-
tribución según el nivel de confianza elegido.
5. Con los datos anteriores, calcular el error muestral y obtener el
límite confidencial superior sumando dicho error muestral a la
media aritmética de la muestra y el límite confidencial inferior
restándoselo.
Si σ es desconocido
6. Usar el valor de la desviación típica de la muestra (s), junto con el
N de la muestra, para calcular la estimación del error típico.
7. Utilizar la distribución t de student para buscar (en las tablas de t)
los valores «críticos» de t correspondientes a la parte central de la
distribución según el nivel de confianza elegido y los grados de
libertad.
Por último, es fundamental ser conscientes de los límites de la estima-
ción de parámetros. Muchas veces, en la investigación educativa, no es
posible definir con claridad la población objeto de estudio y menos aún
obtener una muestra aleatoria. En muchos casos se trabaja con muestras

247
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

accesibles o deliberadas, por lo que la muestra no es representativa de nin-


guna población real. En estos casos, a lo más que podemos llegar es a rea-
lizar inferencias sobre poblaciones hipotéticas con características similares
a la muestra utilizada.

3.1. Estimación del parámetro proporción

La estimación del parámetro proporción (p) es un caso particular del


anterior, en el que la media aritmética oscila entre 0 y 1 (variables dicotó-
micas o dummy: sí/no, acierto/error). Recordemos que en estas variables
(codificadas como 0 y 1), la nomenclatura p indica la proporción de unos y
q la proporción de ceros. Pues bien, si en el caso de la media, el error típi-
co era
σ x = s , en el caso de la proporción, sustituyendo, σ p = p·q .
√ N-1 √ N-1
El intervalo de confianza se establecerá igual que en la media aritméti-
ca, pero partiendo de una proporción. Este es el típico caso del muestreo
electoral, donde podemos obtener un estadístico de, por ejemplo, p= 0,36,
es decir, la media es 0,36, o también, que el 36% de la muestra va a votar al
partido X. Luego, calculamos los límites confidenciales para decir que la
horquilla de votantes a ese partido se encuentra entre el 34% y el 38%.

4. ESTIMACIÓN DEL PARÁMETRO CORRELACIÓN DE PEARSON.


INTRODUCCIÓN AL CONCEPTO DE LA SIGNIFICACIÓN
ESTADÍSTICA Y AL PLANTEAMIENTO DE LOS DISEÑOS
DE UN SOLO GRUPO

Uno de los índices descriptivos bivariados más importantes para descri-


bir la magnitud de la relación entre dos variables es el coeficiente de corre-
lación de Pearson. En muchas ocasiones, cuando calculamos una correla-
ción, en realidad estamos más interesados en la relación que existe entre
esas dos variables en la población que en la muestra. Supongamos que esta-
mos interesados en saber si hay relación entre la actitud hacia la Estadísti-
ca y las calificaciones finales. Esta correlación la tendremos que calcular en
una muestra, pero en realidad nos interesa saber si esa relación se da en la

248
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

población, es decir, para cualquier grupo de sujetos, para cualquier cohor-


te de alumnos, para alumnos también de próximos cursos académicos.
Por tanto, se trata de calcular, una vez más, el intervalo de confianza
para la correlación de Pearson, de modo que podamos estimar entre qué
valores se encuentra dicho coeficiente en la población.
Sabemos que la distribución muestral de la correlación de Pearson se
asemeja a la distribución normal con el siguiente error típico (cuando par-
timos de la hipótesis ρ= 0):

Para muestras grandes (N>100), σ r =


1 , y para muestras pequeñas,
√ N-1
σ r = 1-r
2

√ N-1
Por tanto, una vez más, I.C. = r ± E.M., donde E.M. = Z(α/2)·σr
Supongamos que tenemos una muestra de 20 sujetos y obtenemos una
correlación de r = 0,35. ¿Cómo será la correlación en la población con un
nivel de confianza del 95%?
Aplicando la fórmula, obtenemos que el error típico será de (1-0,352)/√19
= 0,20 y la Z(α/2) sabemos que es 1,96, luego el error muestral es igual a 0,39.
En consecuencia, la correlación en la población estará entre los límites
-0,04 y 0,74. Efectivamente, es un enorme intervalo de confianza, desde una
correlación casi nula hasta una correlación alta. ¿Por qué sucede esto? Se
debe al pequeño tamaño de la muestra. Cuanto más pequeña sea la mues-
tra, más imprecisa será nuestra estimación, ya que es más probable que la
muestra esté sesgada o que no sea representativa de la población, por lo que
la cautela debe ser mucho mayor a la hora de generalizar el resultado a la
población.
Podemos aprovechar para introducir aquí el concepto de significati-
vidad o significación estadística, aunque se tratará de nuevo en el epí-
grafe siguiente y más detenidamente en los temas dedicados al contras-
te de hipótesis. ¿Cuándo hablamos de significatividad estadística?
Cuando queremos referirnos al significado de la diferencia entre dos
medidas. Por ejemplo, en el caso de la correlación, ¿cuándo decimos
que un coeficiente de correlación es estadísticamente significativo? En
la mayoría de los casos, cuando es distinto de cero, es decir, cuando el

249
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

coeficiente de correlación obtenido es suficientemente grande como


para decir que la correlación en la población de referencia es distinta de
cero. Esto es todo, no decimos que el coeficiente sea grande o pequeño
en magnitud en la población, tan sólo que es distinto de cero. Si quere-
mos estimar su magnitud en la población, entonces calcularemos el
intervalo de confianza.
En este sentido, cuando estimamos el intervalo de confianza en el cual
podría encontrarse la verdadera correlación en la población, si este inter-
valo contiene el valor cero (ausencia absoluta de relación), diremos que
dicha correlación NO es estadísticamente significativa, es decir, que esta-
dísticamente hablando, esa correlación es (puede ser) igual a cero y la dife-
rencia con r=0 que hemos obtenido en la muestra se debe al azar, al error
de muestreo. Dicho de otra forma, nuestra correlación pertenecería a una
distribución muestral de correlaciones donde la correlación media es cero,
y lo que se aparta de 0 nuestro r empírico está dentro de lo «normal» en el
muestreo (el área de lo normal que queda definida en la parte central de
nuestra distribución muestral según nuestro nivel de confianza), es una
diferencia fruto del azar, de la probabilidad de obtener una muestra con
correlación distinta de cero al seleccionarla de una población donde no hay
relación entre las variables.
Sin embargo, debemos ser cuidadosos en la interpretación. Como dice
Morales (2007: 15), cuando una correlación no es estadísticamente signifi-
cativa (y, por ejemplo, nuestra conclusión es que p >.05):
A. Una correlación no significativa es una correlación que no podemos
generalizar sin más. Con los datos que tenemos no podemos afirmar
que en la población (en otras muestras semejantes) hay una relación,
aunque sea pequeña, y distinta de cero.
B. Por otra parte una correlación no significativa no es prueba de no
relación en la población (podríamos encontrarla quizás en mues-
tras mayores, o utilizando otras medidas más precisas, etc.; no
probar que hay relación no es lo mismo que probar que no hay rela-
ción).
En el ejemplo anterior, estaríamos diciendo que, con los datos que
tenemos, r = 0,35 puede ser lo mismo que r = 0 (al menos, no podemos
probar que en la población r ≠ 0), ya que al calcular el intervalo de con-

250
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

fianza el 0 está dentro de dicho intervalo, por lo tanto, no es estadística-


mente significativo.
Sugerencia: dibuje la distribución muestral a partir del estadístico corrre-
lación de Pearson del ejemplo y sitúe el intervalo de confianza y el valor r = 0.
Repetimos una vez más, por su importancia, que hablar de significativi-
dad estadística no es lo mismo que hablar de la magnitud de las diferencias,
de que existan grandes diferencias o, en este caso, que la correlación sea
elevada. La magnitud de la correlación (o de su diferencia con un r = 0) la
juzgaremos igualmente conforme a los criterios para interpretar un coefi-
ciente de correlación.
Así, por ejemplo, podemos obtener con el SPSS esta matriz de correla-
ciones:
Tabla 7.1: Matriz de correlaciones

pg81 pg82 pg83

pg81 Correlación de Pearson 1 ,408** ,183**


Sig. (bilateral) ,000 ,000
N 668 608 641
pg82 Correlación de Pearson ,408** 1 ,277**
Sig. (bilateral) ,000 ,000
N 608 614 594
pg83 Correlación de Pearson ,183** ,277** 1
Sig. (bilateral) ,000 ,000
N 641 594 652

** La correlación es significativa al nivel 0,01 (bilateral).

Como vemos, es una matriz de correlaciones entre tres preguntas de un


cuestionario. Las magnitudes de las correlaciones varían entre 0,18 y 0,41,
pero todas ellas son estadísticamente significativas (indicado con dos aste-
riscos**) con un nivel de confianza del 99% (α= 0,01). Correlación signifi-
cativa, es decir, distinta de cero en la población de referencia. r = 0,18 es
una correlación muy baja, poco relevante en la práctica, pero estadística-
mente significativa (véase que el tamaño de la muestra es grande, lo que
favorece la significatividad), esas dos variables tienen una correlación en la
población distinta de 0. ¿Cuál podría ser su magnitud en la población? Para
eso debemos estimar el intervalo de confianza.

251
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Aunque dedicaremos el tema siguiente al contraste de hipótesis, pode-


mos introducir aquí un primer esbozo relacionado con los diseños de un
solo grupo. La cuestión que estamos tratando podríamos plantearla así: ¿Es
nuestro coeficiente de correlación igual a cero en la población? En térmi-
nos simbólicos, este es el planteamiento de la hipótesis nula:
H0: ρ = 0, frente a la hipótesis alternativa que sería H0: ρ ≠ 0.
Es decir, tenemos un sólo grupo de sujetos en el cual queremos compa-
rar el valor muestral (r) con otro valor dado (r = 0). Si rechazamos la hipó-
tesis nula (utilizando la prueba estadística de contraste indicada), diremos
que nuestra correlación podría ser distinta de cero en la población. Por el
contrario, si no podemos rechazarla, diremos, a nuestro nivel de confianza,
que las diferencias encontradas entre nuestro r y r = 0 probablemente son
aleatorias y que nuestro r ha sido obtenido de una población donde ρ = 0.
Obviamente, podríamos plantear una hipótesis dando otro valor a ρ, aun-
que en ese caso la distribución muestral pasa a ser asimétrica.
El mismo planteamiento sucede cuando nos planteamos si la media de
un grupo será o no igual a un valor poblacional, µ, conocido. En este caso,
plantearíamos la hipótesis nula como H0: µ = a, comparando nuestro valor
muestral con el valor de la población definido en la hipótesis nula. A dife-
rencia de lo que sucede en la estimación de parámetros, donde estimamos
un intervalo confidencial a partir del valor del estadístico de la muestra, en
el contraste de hipótesis se puede establecer la zona donde es posible que
existan diferencias estadísticamente significativas en un único lado de la
distribución (contrastes unilaterales, como se verá con detenimiento en el
tema siguiente). De esta forma, la hipótesis alternativa podría ser: H0: µ ≠ a
(bilateral) o H0: µ < a o bien H0: µ > a (contrastes unilaterales).

5. ESTIMACIÓN DEL PARÁMETRO DIFERENCIA DE MEDIAS

La estimación del parámetro diferencia de medias µ1 - µ2 nos acerca tam-


bién a la lógica del contraste de hipótesis, que será tratada en el tema siguien-
te. Por seguir con el ejemplo del cociente intelectual, supongamos que en la
School of Education de la Universidad de Harvard obtenemos un CI medio de
110 puntos y en la Universidad de Alcalá, en la Escuela de Magisterio, se obtie-
ne un CI medio de 105. Nos podemos preguntar: ¿cómo es la diferencia entre

252
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

estas dos puntuaciones en la población de referencia, entre qué puntuaciones


oscilará dicha diferencia en la población? Dicho de otra forma: ¿es compati-
ble esta diferencia en la población con una diferencia igual a cero? Aún más:
¿la diferencia entre estas dos puntuaciones es estadísticamente igual a cero?,
es decir, ¿podemos considerar que esa diferencia de 5 puntos obtenida en
ambas muestras es fruto del azar, fruto de la selección aleatoria de las mues-
tras, y que ambas muestras pertenecen en realidad a la misma población? Por-
que si dicha diferencia es compatible con una diferencia igual a cero, enton-
ces concluiremos, al nivel de confianza fijado, que ambas muestras tienen el
mismo CI, y que la diferencia encontrada es aleatoria, es estadísticamente
igual a cero, se debe a la «suerte del azar».
En estas condiciones, si establecemos el intervalo de confianza a partir
del estadístico diferencia de medias, obtendremos los límites confidenciales
entre los cuales podría encontrarse la diferencia de medias en la población.
Si este intervalo de confianza incluye la puntuación cero, entonces dicha
diferencia es compatible con una diferencia de medias igual a cero y, en
consecuencia, podremos interpretar que dicha diferencia es estadística-
mente igual a cero.
I.C. = (x–1 - x–2) ± E.M. donde
E.M. = Z(α/2)·σ(x–1 - x–2), y donde, para muestras grandes e independientes,
σ 21 σ2
σ(x1 - x2) = + 2
N1-1 N2-1

y para muestras grandes o pequeñas e independientes utilizaremos la t(α/2) y


la siguiente fórmula para el error típico:

⎛ 2 ⎞⎛ ⎞
σ(x1 - x2) = ⎜N1σ 1 + N2 σ 2 ⎟⎜1 + 1 ⎟
2

⎝ N1 + N2 – 2 ⎠⎝N1 N2 ⎠

Supongamos que los datos que tenemos en el problema son estos:

Harvard Alcalá
— —
X1 = 110 X2 = 105
s = 10 s = 12
N = 90 N = 120

253
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

90 ⋅ 100 + 120 ⋅ 144 ⎛ 1 1 ⎞


σ(x–1 − x–2) = ⋅⎜ + ⎟ = 1, 57 , que es la desviación típica
90 + 120 − 2 ⎝90 120⎠
de la distribución muestral de diferencia de medias, es decir, el error típi-
co. Luego, para un nivel de confianza del 95%:
E.M. = t(α/2)· σ( —
X1

- X2) = 1,96 · 1,57 = 3,08; por tanto,
— —
I.C. = (X1 - X2) ± E.M. = (110-105) ± 3,08

p = /2 = 0,025 Valor más probable


del parámetro
diferencia de medias
con un N.C. = 95 %

z
-1,96 +1,96
x– 1 - x– 2
L.C. i=1,92 5 L.C. s=8,08

Error muestral

— —
Gráfico 7.2: Intervalo de confianza para la diferencia de medias X1 - X2 = 5

Podemos concluir que el parámetro diferencia de medias en la población


podría encontrarse entre una diferencia de 1,92 y 8,08. Por tanto, es una
diferencia incompatible con una diferencia de medias igual a 0, por lo que
podremos decir que dicha diferencia es estadísticamente significativa, esto
es, que las diferencias entre las medias en CI de los grupos no son aleatorias,
sino que esas muestras pertenecen a poblaciones con parámetro media dis-
tinto. Esto, sin embargo, no quiere decir que las diferencias sean importan-
tes o relevantes en la práctica, sólo que son estadísticamente significativas.

6. ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE HIPÓTESIS:


INTERPRETACIÓN INTUITIVA

El contraste de hipótesis sigue esta misma lógica inferencial. De


hecho, todo se reduce al contraste de una hipótesis estadística, denomina-

254
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

da hipótesis nula, según la cual se plantea una distribución muestral que


indica la no existencia de diferencias estadísticamente significativas. Es decir,
es una distribución muestral que indica que todas las diferencias encontra-
das entre dos sucesos se deben simplemente al azar. O como dicen Johnson
and Christensen (2008: 503), la hipótesis nula afirma: «no hay efecto pre-
sente» (efecto de la variable independiente sobre la variable dependiente).
Así, por ejemplo, si estamos estudiando el efecto de un programa para
mejorar la capacidad verbal de los sujetos, podemos realizar un diseño de
dos grupos: a un grupo (grupo experimental) le aplicamos el programa y
después le pasamos una prueba de rendimiento verbal. Al otro grupo
(grupo de control) no se le aplica el programa pero se le pasa también la
prueba de rendimiento. De esta forma obtenemos dos medias aritméticas,
una por cada grupo, esperando que nuestro programa sea eficaz, es decir,
que el grupo de sujetos al que hemos aplicado el programa obtenga una
media aritmética superior a la del grupo de control (también podría plan-
tearse simplemente la existencia de diferencias significativas entre ambas
medias). Pues bien, la hipótesis nula indica que la diferencia entre estas dos
medias aritméticas no es estadísticamente significativa porque se puede
explicar por efecto del azar. Al igual que hacíamos en la estimación de pará-
metros, se establece una zona en la que es más probable que las diferencias
encontradas entre las medias de las muestras se deba efectivamente a los
efectos del azar: es la zona de aceptación (más bien, de no rechazo, como
explicaremos en el tema siguiente) de la hipótesis nula (H0). Por tanto, al no
rechazar la H0 (decimos que H0 no es falsa) estamos deduciendo que las
muestras que comparamos pertenecen a la misma población, y que si
hemos encontrado una diferencia empírica, ésta se debe probablemente a
los efectos de la selección aleatoria de dichas muestras (error muestral).
Además, establecemos otra zona en la que las diferencias entre las medias
son de un tamaño tal que resultaría muy improbable (según la distribución
muestral conforme a H0) que fueran aleatorias, por lo que dicha diferencia
la atribuimos a la variable independiente. En este caso, expresamos la dis-
tribución muestral de la hipótesis nula del modo siguiente:
Hipótesis nula: H0: µΕ − µc = 0 (las diferencias entre las medias arit-
méticas de los grupos experimental y control son estadísticamente
igual a cero, es decir, las diferencias empíricas que existan entre las
medias de las muestras se deben al azar; los valores paramétricos
son iguales, las dos muestras pertenecen a la misma población).

255
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Es decir, se trata de la distribución muestral de diferencia de medias


que parte de una diferencia de medias igual a cero. Por tanto, las fórmulas
para hallar el intervalo de confianza son las mismas que en el epígrafe ante-
rior, para muestras grandes y pequeñas.

p = /2 = 0,025 Zona más probable


para encontrar una dif.
de medidas igual a 0 con
un N.C. = 95%

z
-1,96 +1,96
x– 1 - x– 2
L.C. i = 0 - EM 0 L.C. s = 0+EM

Error muestral

Gráfico 7.3. Distribución muestral de la diferencia de medias conforme a la H0.

Si resulta que nuestra diferencia empírica de medias se encuentra den-


tro del intervalo de confianza de la distribución muestral conforme a H0,
diremos que nuestra diferencia de medias es compatible con una diferencia
de medias igual a cero y, por tanto, que se trata de una diferencia estadís-
ticamente no significativa o igual a cero. Es decir, habremos encontrado
una diferencia de medias entre los grupos lo suficientemente pequeña
como para concluir que es una diferencia que probablemente se debe al
efecto del azar y no a la variable independiente.
En realidad, lo que haremos es calcular un estadístico (t, Z, etc.) que nos
dirá cuántas desviaciones típicas (errores típicos) se aleja nuestra diferen-
cia de medias de una diferencia de medias igual a cero. Un valor grande de
Z (por ejemplo, mayor que 1,96 o 2,57, según nuestro nivel de significación)
indicará una probabilidad pequeña de que nuestra diferencia de medias
pertenezca a una población donde la diferencia de medias sea igual a cero.
En todo caso, desde el punto de vista pedagógico, si bien es importante
la significatividad, lo es más lo que se denomina tamaño del efecto, que se
refiere a la relevancia práctica de los resultados, a la interpretación de si se
puede considerar que la diferencia encontrada entre las medias es grande o

256
ESTADÍSTICA Y DISEÑOS I. ESTIMACIÓN DE PARÁMETROS

pequeña, independientemente de que sea o no significativa. Como indica


Creswell (2008: 196), la razón para tener más de una aproximación al inter-
pretar los resultados de la estadística inferencial se basa en que, reciente-
mente, algunos investigadores sentían que un sí/no en el contraste de hipó-
tesis puede provocar incorrectas interpretaciones de los resultados. Los
intervalos de confianza y el tamaño del efecto proveen una lectura más prác-
tica de los resultados. Por ello, en los informes de investigación actuales
se recomienda informar de las tres estimaciones: contraste de hipóte-
sis, intervalos de confianza y tamaño del efecto. Pero dedicaremos los
temas siguientes a profundizar en el significado del contraste de hipótesis,
la significatividad estadística y la relevancia práctica de los resultados.

RESUMEN

En muchas ocasiones, el conocimiento empírico que obtenemos para


resolver un problema determinado no basta para generar un conocimiento
aplicable en otras situaciones. Podríamos probar que un método de ense-
ñanza produce mejores resultados que otro en el centro educativo que diri-
gimos pero, ¿cómo podrían beneficiarse otros de nuestros hallazgos? La
evidencia generada mediante el método inductivo puede llevar a plantea-
mientos que permitan una mayor generalización de resultados mediante el
método hipotético deductivo: ¿el método A produce mejores resultados que
el método B? La inferencia estadística permite generalizar los resultados
obtenidos en una muestra a la población de referencia (siguiendo un méto-
do sistemático y riguroso).
La inferencia se basa en una lógica sencilla: ¿qué pasaría si extrajésemos
infinitas muestras aleatorias de una población definida, calculando en cada
una de ellas un estadístico de interés (una media aritmética o una diferen-
cia de medias entre grupos)?
Obtendríamos una función de densidad de distribución, una distribu-
ción teórica llamada distribución muestral. La variabilidad de esta distri-
bución vendría dada por el error típico. El muestreo aleatorio implica la
posibilidad de que nuestra muestra, por efecto del azar, no sea representa-
tiva de la población, esté sesgada. Por tanto, es probable que el estadístico
que calculamos en la muestra no coincida con el valor del parámetro pobla-

257
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cional, diferencia que viene expresada por el error muestral. El tamaño de


la muestra influirá de forma determinante en el error muestral, que será
tanto más pequeño cuanto mayor sea la muestra.
Cuando estimamos el valor de un parámetro, solemos calcular un inter-
valo de confianza alrededor del estadístico de la muestra según el nivel de
confianza elegido. Un intervalo de confianza del 95% nos indicará que, si
repitiéramos el proceso de estimación un elevado número de veces, en el
95% de los casos el valor del parámetro se encontraría dentro de los límites
confidenciales.
El intervalo de confianza nos permite un primer acercamiento al con-
cepto de la significación estadística. Decimos que un resultado (una dife-
rencia entre medias, por ejemplo) es estadísticamente significativo cuando
su probabilidad de aparición es menor o igual que el nivel de significación,
es decir, es una diferencia tan grande que consideramos que no se debe al
azar, que en la población es distinta de cero. Así, afirmamos que una corre-
lación es significativa cuando puede considerarse distinta de cero, es decir,
que en la población hay relación entre las variables, aunque sea pequeña.
De forma análoga se funciona en el contraste de hipótesis en los diseños
de un grupo, pero en este caso se plantea una hipótesis nula que indica la
no existencia de diferencias estadísticamente significativas (por ejemplo,
entre nuestra correlación y una correlación poblacional de ρ = 0.
La significación estadística nos dice algo sobre si podemos extrapolar
las diferencias encontradas en la muestra a la población (inferencia), pero
no nos dice nada sobre la magnitud o relevancia práctica de las diferencias.
Para valorar la relevancia práctica de las diferencias recurrimos al tamaño
del efecto.

258
Tema 8
Estadística y diseños II. Contraste de hipótesis

Presentación

1. Introducción

2. Lógica de la prueba de significación de la hipótesis nula

3. Nivel de significación estadística y errores Tipo I y Tipo II

4. Los pasos del contraste de hipótesis


4.1. Selección de una muestra aleatoria
4.2. Formulación de las hipótesis estadísticas
4.3. Elección del valor de alfa o nivel de significación
4.4. Determinación de la distribución muestral y la región de rechazo
4.5. Utilización del valor exacto de p

5. Errores frecuentes en la utilización e interpretación de resultados de la


prueba de significación de la hipótesis nula

6. El tamaño del efecto

Resumen

259
PRESENTACIÓN

En este tema se pretende introducir al lector en los conceptos clave y la


lógica de pensamiento de cara a la puesta en práctica e interpretación de un
contraste de hipótesis. Aunque la mayoría de los ejemplos se refieren a un
diseño de dos grupos independientes, la lógica es aplicable a cualquier dise-
ño de investigación. La realización del contraste de hipótesis presupone el
cumplimiento de determinados supuestos rigurosos que en muchas ocasio-
nes no pueden cumplirse en la investigación educativa. Tras el estudio del
tema, el lector debe ser capaz de entender los conceptos básicos para
enfrentarse con la dinámica del contraste de hipótesis y debe saber ser crí-
tico a la hora de interpretar tanto los resultados de sus propios estudios
como los que puedan ser revisados en la literatura científica para la forma-
ción permanente del profesional de la educación.

1. INTRODUCCIÓN

Hemos visto en el tema anterior el proceso para establecer un intervalo


de confianza para estimar el parámetro desconocido de una población a
partir de la información conocida de una muestra. Así, hemos analizado,
por ejemplo, cómo es posible estimar el intervalo confidencial de la media
poblacional en CI con los datos obtenidos en una muestra y hemos visto
que también es posible compararlo con una media poblacional de CI dada.
Sin embargo, la media muestral puede ser utilizada de otra forma: para
hacer inferencias sobre los valores probables de una media poblacional des-
conocida, µ. Los valores de la media muestral, M, pueden ser usados para
probar la hipótesis sobre un valor específico de una media poblacional des-
conocida a través del uso de la prueba de significación de la hipótesis nula
(PSHN). Veremos posteriormente la lógica de este proceso.

261
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

El alumno de Pedagogía debe tener, en este momento, una idea bastan-


te certera de lo que es una hipótesis y de su relación directa con el proble-
ma de investigación. De acuerdo con Salkind (2010), a un buen científico le
gustaría poder decir que si el método A es mejor que el método B, esto es
cierto para siempre y para cualquier persona en el universo. Sin embargo,
es improbable ser capaz de decir algo así, ya que exigiría un enorme gasto
de dinero (¡probarlo en toda la población!) y de tiempo. Por ello, lo que
hacen los investigadores es seleccionar una muestra de la población y pro-
bar nuestra hipótesis sobre los métodos A y B.
El proceso de selección de la muestra y sus condicionantes (representa-
tividad y tamaño) es decisivo en las decisiones e interpretación de los resul-
tados tras el contraste de hipótesis.

2. LÓGICA DE LA PRUEBA DE SIGNIFICACIÓN DE LA HIPÓTESIS


NULA

Sabemos que la hipótesis nula representa la no relación entre las variables


que estamos estudiando (variable independiente o VI y variable dependiente o
VD). Dicho de otra forma, es la hipótesis de no diferencias (no hay diferencias
en los niveles de la VD (rendimiento, actitud, inteligencia, presión arterial,
razonamiento espacial…) en función de la VI (sexo, lugar de nacimiento,
fumador, raza, nivel de estudios de los padres…). En otras palabras, en un
diseño experimental, significa que la VI no produce ningún efecto en la VD.
La hipótesis nula tiene dos propósitos básicos (Salkind, 2010: 164):
a) Sirve como punto de partida cuando no tenemos conocimiento o no
hay razones para creer que existen diferencias entre los grupos que
estamos comparando. Por ejemplo, estamos estudiando la actitud de
los alumnos de Pedagogía hacia la Estadística y queremos contrastar
si hay diferencias entre hombres y mujeres. A falta de otras evidencias,
nuestra hipótesis será que no existen diferencias entre las actitudes
hacia la Estadística entre los alumnos y las alumnas. Hasta que poda-
mos probar que hay diferencias, debemos asumir, como punto de par-
tida, que no las hay. Y aún más: asumimos que, si encontramos algu-
na diferencia, esta diferencia es casual, se obtuvo por simple
casualidad, por azar. El azar explica lo que no tiene otra explicación

262
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

razonable (por ejemplo, por qué yo obtuve un póker de ases y mi rival


sólo una pareja de sietes).
b) Es un punto de referencia para comparar los resultados obtenidos y
deducir si las diferencias observadas pueden ser atribuidas a algún fac-
tor distinto a la casualidad. De este modo, como se explicó en el tema
anterior, la hipótesis nula ayuda a definir un intervalo en el que cual-
quier diferencia observada entre grupos puede atribuirse a la casualidad
o azar y otro intervalo de valores en el que dicha diferencia quizás se
deba a otro factor distinto del azar, como la manipulación de otra varia-
ble (VI) que esté ejerciendo un efecto sobre la variable medida (VD) en
los grupos que estamos comparando.
Decíamos en la introducción que los valores de la media muestral, M,
pueden ser usados para probar la hipótesis sobre un valor específico de una
media poblacional desconocida a través del uso de la prueba de significa-
ción de la hipótesis nula (PSHN). ¿Cuál es la lógica de este proceso? War-
ner (2008) indica que hay que seguir los siguientes pasos:
1. El primer paso de este proceso es que el investigador hace una conjetura
sobre un valor específico de un parámetro (digamos µ) para una pobla-
ción de interés. Por ejemplo, podríamos conjeturar que la media de velo-
cidad en autovía es de 120 km/h, el límite legal. H0: µ= µhip o, de otra
forma, µ - µhip = 0, donde hipotetizamos que H0: µ= 120. En este caso, el
«efecto» que el investigador trata de detectar es la diferencia entre la
media poblacional desconocida, µ, y la media poblacional hipotetizada.
2. El investigador selecciona una muestra aleatoria de la población (en
este caso, tomando controles de velocidad en distintos tramos de
autovías y calculando la media aritmética, digamos M= 132 Km/h).
3. Ahora, el investigador comparará la media observada (M= 132 Km/h)
con la media hipotetizada de la población (µ= 120) y se hará la siguien-
te pregunta: Si la media de la población es realmente de 120 Km/h,
¿puede considerarse la media obtenida en la muestra de (x–= 132 Km/h)
como un resultado probable o improbable? El intervalo de valores esta-
blecidos como improbables viene dado por el nivel elegido del nivel de
significación (alfa, α) y por la elección del tipo de contraste (de una cola
o de dos colas, como veremos más tarde). En este momento y de modo
general, podemos decir que los valores cuya probabilidad de aparición

263
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

es igual o menor de 0.05 (es decir, que aparecen 5 veces o menos de cada
100 sucesos) cuando la H0 es verdadera, son considerados improbables.
4. Evaluación de la probabilidad asociada al valor empírico obtenido,
supuesta H0 verdadera. Hemos adelantado en el capítulo anterior
cómo afrontar este juicio. Nos basamos en la distribución muestral
teórica del estadístico en cuestión. En el caso de la media, para mues-
tras grandes, sabemos que su distribución muestral puede ser la dis-
tribución normal. Por tanto, para evaluar cuán lejos está M del valor
µhip nos basamos en el error típico, es decir, medimos dicha distancia
en unidades de error típico. En este caso, la distancia entre M y µhip
es llamada z o puntuación típica estandarizada, cuya distribución
muestral es la distribución normal, de modo que podemos conocer
las áreas o probabilidad de obtener cualquier valor de z (usando las
tablas o un programa informático), mediante la fórmula general:
M– hip
z= σM

En el ejemplo que estamos poniendo, M es la media aritmética de una


muestra aleatoria, pero en los diseños de dos grupos, por ejemplo, M será
la diferencia entre las medias de los dos grupos sometidos a contraste,
mientras que µhip será la media hipotetizada según la distribución muestral
de diferencia de medias, que no es otra sino H0: µA - µB = 0. El error típi-
co, a su vez, tendrá que ser sustituido por el error típico de diferencia de
medias. En línea con el ejemplo anterior, podríamos estar comparando
aquí la media en velocidad de la autovía de A Coruña frente a la obtenida
en la autovía de Extremadura. O, si ponemos un ejemplo educativo, se tra-
taría de comparar la media en rendimiento lector obtenida con un método
experimental con la media obtenida con el método tradicional.
Una vez obtenido el valor de z, dado que conocemos su distribución mues-
tral, es fácil responder a la pregunta que planteábamos en el punto 3: Este
valor empírico de z, que estandariza la distancia entre nuestro valor muestral
y el hipotetizado según H0, ¿puede considerarse probable o improbable? O,
dicho de otra forma, el valor muestral obtenido, una vez estandarizado (con-
vertido en una puntuación z) y situado en la distribución muestral que inclu-
ye infinitos posibles valores de M, ¿está cerca o lejos del valor hipotetizado
conforme H0? y, por tanto, ¿cuál es la probabilidad de obtener un valor como

264
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

el obtenido si es cierta la hipótesis nula? Cuanto más lejos esté el valor de M


del valor hipotetizado, más grande será el valor de z y, en consecuencia, menor
será su probabilidad de aparición si H0 es verdadera. Como sabemos, el valor
de z nos indica dicha distancia en número de errores típicos.
En definitiva, la idea básica de la PSHN es que el investigador asume un
valor para la media poblacional desconocida, µ. Entonces obtiene una
media muestral M y la evalúa conforme a la distribución de valores de M
que cabría esperar si la H0 es verdadera. El investigador debe tomar la deci-
sión si rechazar o no rechazar H0 como inadmisible, dado el valor obte-
nido de M. Cuando el valor de M es un valor que puede ocurrir probable-
mente por casualidad cuando H0 es verdadera, entonces la decisión es no
rechazar H0. Por el contrario, si M es improbable que ocurra por casualidad
o azar cuando H0 es verdadera, entonces el investigador puede decidir
rechazar H0. ¿Cuándo estimamos que es improbable que ocurra por azar?
Dependerá del valor de α que hayamos establecido a priori (y nunca des-
pués de haber calculado z y conocer su p asociada). En este sentido,
siguiendo a Siegel (1988), la condición de rechazo es la siguiente:

RECHAZO H0 si p (t, z, F...) ≤ α

Sin embargo, esta forma de actuar ha tenido en los últimos años serias
críticas (nos detendremos en ellas posteriormente), especialmente porque
en la investigación real no se cumplen los supuestos que rigen la lógica de
la PSHN, en especial, la ausencia de una población claramente definida, la
selección de una muestra aleatoria de la misma (en la mayoría de los casos
se trabaja con muestras incidentales o de conveniencia) y la realización de
una única prueba de significación. En este sentido, en el campo de la Edu-
cación, conviene plantearse los resultados obtenidos más como «evidencia
acumulativa» que como una prueba irrefutable para tomar decisiones. En
esta línea, como veremos después, será de gran ayuda recurrir a índices
complementarios como la magnitud del efecto.

3. NIVEL DE SIGNIFICACIÓN ESTADÍSTICA Y ERRORES


TIPO I Y TIPO II

El nivel de significación, α, es lo que se conoce como error tipo I: la pro-


babilidad de rechazar la hipótesis nula cuando ésta es verdadera. Cuando

265
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

tomamos una decisión sobre rechazar o no la hipótesis nula, podemos obte-


ner cuatro resultados posibles, como vemos en la tabla siguiente:

Tabla 1. Resultados en la decisión estadística

Lo que de hecho sucede en la población

H0 es verdadera H0 es falsa
Decisión correcta
Error tipo I (α): nivel
Rechazar H0 (1- α): potencia
Decisión del de significación
investigador estadística
No rechazar H0 Decisión correcta (1- α) Error tipo II (β)

El error tipo I nos llevaría a afirmar, por ejemplo, que un medicamento


contra el cáncer es eficaz cuando en realidad no lo es o, en nuestro ámbito,
que un método de enseñanza de las matemáticas es mejor que otro cuando
lo cierto es que no hay diferencias en los resultados de aprendizaje que pro-
ducen. Dicho de otra forma, estaríamos afirmando que la diferencia de
medias entre el grupo experimental y el grupo de control es lo suficiente-
mente grande como para considerar que los grupos provienen de poblacio-
nes con parámetro media (µ) diferente, cuando la realidad es que la dife-
rencia obtenida entre las medias es aleatoria, debida a errores de muestreo,
y ambas muestras pertenecen a la misma población.

El error tipo II (β), por su parte, nos llevaría a afirmar que el medicamento
no es eficaz, cuando en realidad sí lo es. O nos llevaría a concluir que el nuevo
método de enseñanza de las matemáticas no eleva significativamente el ren-
dimiento en matemáticas de los alumnos, cuando en realidad produce mejo-
res resultados que el método tradicional. Por tanto, el error tipo II coincide
con la probabilidad de no rechazar la H0 cuando ésta es realmente falsa.

El riesgo de comenter error tipo II depende de varios factores. El tama-


ño de la muestra es uno de los más importantes, junto con el verdadero
tamaño de efecto en la población y el propio valor de α. Cuanto más gran-
des sean cada uno de estos tres valores, manteniendo los otros constantes,
más pequeño será el error tipo II.

En contraposición, la pontencia estadísitica (1-β) se define como la pro-


babilidad de rechazar la hipótesis nula cuando ésta es realmente falsa (deci-

266
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

sión correcta). Es deseable alcanzar una potencia de la prueba de 0.80 (es


decir, β ≤ 0.20). La potencia de la prueba se utiliza, entre otras cosas, para
concer el tamaño que tendría que tener nuestra muestra si queremos alcan-
zar un determinado valor de β, dado α y un valor previsto para el tamaño
del efecto1. Los factores mencionados que hacen reducir el error tipo II, son
a su vez los que permiten elevar la potencia estadística.
Los investigadores desean mantener ambos tipos de errores tan bajos
como sea posible. El valor teórico del error tipo I lo establece el investiga-
dor, siendo los valores convencionales utilizados de forma más frecuente
0.01 y 0.05. Cuando obtenemos un valor de nuestro estadístico de contras-
te (t, z, F…) que estandariza las diferencias empíricas encontradas (por
ejemplo, la diferencia de medidas entre dos grupos que estamos compa-
rando), podemos saber —gracias a la distribución muestral de dicho esta-
dístico conforme H0— la probabilidad de obtener por efecto del azar una
diferencia tan grande como la obtenida. Una probabilidad tan pequeña o
inferior a α nos estaría indicando que sería muy improbable que dicha dife-
rencia sea aleatoria (pero podría darse el caso, y por eso se trata de un error
posible, aunque improbable). Todo esto es cierto en tanto se cumplan los
rigurosos supuestos para aplicar la PSHN. Si se violan dichos supuestos (lo
que sucede con frecuencia en la investigación educativa), entonces el valor
del error tipo I puede ser mayor que el definido por el investigador.
La decisión sobre el valor que debemos dar a α no siempre es fácil. Depen-
derá en buena parte del tipo de variables que estén en juego. No es lo mismo
hablar de un medicamento que puede salvar miles de vidas y que implica el
gasto de millones de dólares en su producción, que someter a contraste el efec-
to de una técnica de estudio en la motivación de los estudiantes. En todo caso,
es muy poco frecuente utilizar valores superiores a 0.05, siendo una práctica
común utilizar el valor exacto de p, como se explicará posteriormente.

4. LOS PASOS DEL CONTRASTE DE HIPÓTESIS

Hemos visto en el tema 2 el proceso y la lógica de la investigación cien-


tífica. Se parte de la definición de un problema científico. Tras la necesaria

1
Para hacernos una idea del funcionamiento de la potencia, pueden consultarse tablas en páginas
web como la del prof. Soper http://www.danielsoper.com/statcalc/calc01.aspx

267
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

revisión del estado de la cuestión (consulta de la bibliografía científica más


relevante al respecto), el investigador formula una hipótesis como solución
tentativa al problema. Por tanto, el paso decisivo consiste ahora en validar
la hipótesis. En el paradigma cualitativo utilizamos la Estadística para tal
fin, realizando lo que se denomina contraste estadístico de hipótesis. Acaba-
mos de introducir el concepto de prueba de significación de la hipótesis nula
(PSHN) y hemos comentado la necesidad de cumplir con determinados
supuestos. Pues bien, veremos ahora cuál es el proceso básico que debere-
mos seguir con rigor si queremos llegar a unos resultados fiables e inter-
pretables que nos permitan llegar a validar nuestra hipótesis.

4.1. Selección de una muestra aleatoria

Retomemos el ejemplo del capítulo 11 de Pérez Juste et al. (2009). Si


estamos estudiando el efecto de un programa para mejorar el rendimiento
lecto-escritor de los sujetos, podemos realizar un diseño de dos grupos: a un
grupo (grupo experimental) le aplicamos el programa y después le pasamos
una prueba de rendimiento lecto-escritor. Al otro grupo (grupo de control)
no se le aplica el programa pero se le pasa también la prueba de rendi-
miento. Supongamos que la población de referencia son los alumnos espa-
ñoles que cursan tercer curso de educación primaria (no olvidemos que
para seleccionar una muestra aleatoria, debemos previamente haber defi-
nido con claridad la población). Pues bien, el muestreo aleatorio exige que
seleccionemos aleatoriamente de esa población (con un bombo como el de
la lotería o, como suele hacerse, con un programa informático) dos mues-
tras de tamaño n y, posteriormente, asignar aleatoriamente (valdría utilizar
una moneda) los tratamientos a los grupos. Una vez aplicados los progra-
mas a comparar (tratamientos), obtendríamos las puntuaciones de cada
sujeto en el test de rendimiento verbal, a partir de las cuales se calcularán
las medias aritméticas de cada grupo.

4.2. Formulación de las hipótesis estadísticas

Le corresponde ahora al investigador trasladar su hipótesis sustantiva o


textual a hipótesis estadísticas. Supongamos que la hipótesis sustantiva se
redacto de la siguiente forma: Con el programa de enseñanza García (tra-

268
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

tamiento experimental) conseguiremos mejores resultados en rendimiento


lecto-escritor que con el programa tradicional.
a) Formulación de la hipótesis nula (H0)
En primer lugar formulamos la hipótesis que se somete a contraste, esto
es, la hipótesis nula. La H0, como dicen Johnson and Christensen (2008:
503), afirma: «No hay efecto presente» (efecto de la variable independiente
sobre la variable dependiente). La hipótesis nula plantea la NO existencia
de diferencias entre los grupos sometidos a comparación. Podríamos for-
mularla así: No existen diferencias estadísticamente significativas entre las
medias aritméticas de los grupos en rendimiento lecto-escritor en función del
programa utilizado. Simbólicamente se expresa así:
H0: µExp. - µCont. = 0 o también H0: µExp. = µCont.
Es decir, las diferencias entre las medias aritméticas de los grupos expe-
rimental y control son estadísticamente igual a cero, por lo que las diferen-
cias empíricas que existan entre las medias de las muestras se deben al
azar; los valores paramétricos son iguales, las dos muestras pertenecen a la
misma población.
b) Formulación de la hipótesis alternativa (H1)
La hipótesis alternativa es llamada también la hipótesis del investigador.
Dependiendo de la formulación de la hipótesis sustantiva, la H1 podrá ser uni-
lateral (también llamada unidireccional o de una cola) o bilateral (bidirec-
cional o de dos colas). Cuando el investigador tiene fundamentos suficientes
como para hipotetizar qué grupo de los que estamos comparando obtendrá
una media superior, entonces la hipótesis y su posterior contraste será unila-
teral. En nuestro ejemplo, el investigador tiene razones suficientes (literatu-
ra de investigación, evidencia empírica, experiencia práctica) como para pen-
sar que con el método García se obtendrán mejores resultados en
lecto-escritura que con el tradicional. Por tanto formulará así la hipótesis:
H0: µExp. - µCont. > 0 o también H0: µExp. > µCont.
Es decir, espera que la media en rendimiento del grupo sometido al tra-
tamiento experimental sea superior a la del grupo de control. Como veremos
posteriormente, el contraste unilateral puede ser derecho o izquierdo. Cuan-
do la diferencia esperada sea positiva, el contraste será unilateral derecho (y
la región de rechazo de la H0 se encontrará en el extremo derecho de la dis-

269
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

tribución muestral, en torno a sus valores altos). Cuando la diferencia espe-


rada sea negativa (por ejemplo, se espera que el tratamiento experimental
reduzca los niveles de ansiedad), entonces tendremos una hipótesis unilate-
ral izquierda (y la región de rechazo de la H0 se encontrará en el extremo
izquierdo de la distribución muestral, en torno a sus valores bajos).
Sin embargo, cuando no tenemos apoyo como para pensar que la media
de un grupo será superior al del otro, es decir, cuando esperamos que haya
diferencias entre los grupos pero no sabemos a favor de cuál, entonces pro-
cede formular una hipótesis bilateral, que simbólicamente se expresará así:
H0: µExp. - µCont. ≠ 0 o también H0: µExp ≠ µCont.
Textualmente, podríamos formularlo así: Existen diferencias estadística-
mente significativas entre las medias aritméticas de los grupos en rendimien-
to lecto-escritor en función del programa utilizado.
El contraste bilateral es más exigente que el unilateral, ya que implica
repartir la probabilidad de error entre las dos colas de la distribución,
haciendo dividir por dos el valor de alfa.

4.3. Elección del valor de alfa o nivel de significación

Ya nos hemos referido a esta cuestión anteriormente. Se habla del valor


nominal de alfa porque es el investigador el que lo «nomina», el que establece
este valor como umbral para emitir un juicio sobre la significación estadística
de las diferencias. Aunque los valores más utilizados son 0.05 y 0.01, el inves-
tigador, por las características de su estudio y sus repercusiones (medicamen-
tos, decisiones que implican grandes recursos y grandes cambios, etc.) puede
necesitar reducir al máximo el error tipo I y establecer valores inferiores,
como α = 0.001. También puede suceder que en una investigación explorato-
ria con muestras pequeñas, el investigador decida utilizar un α = 0.1.

4.4. Determinación de la distribución muestral y la región de rechazo

Este es uno de los puntos clave en la comprensión y acierto en la deci-


sión estadística. Debemos recordar que estamos en un paso (contraste esta-
dístico de hipótesis) dentro del proceso general de investigación, que se

270
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

generó con la definición de un problema científico. En un paso previo al


contraste estadístico, habremos apuntado el diseño de investigación que, en
este caso, si hubiéramos cumplido la selección y asignación aleatoria,
podría tratarse de un diseño experimental de dos grupos. En este tipo de
diseños, para muestras grandes, suponiendo que hemos comprobado los
supuestos para aplicar pruebas paramétricas, sabemos que la prueba esta-
dística de contraste es la z o la t de student. Supongamos que elegimos la z.
¿Cómo se define la distribución muestral del estadístico z? Ya sabemos que
el estadístico z responde a una distribución normal. Sabemos también que
en un contraste de dos grupos, el estadístico z nos estandariza las diferen-
cias entre las medias de los grupos con respecto a una diferencia igual a
cero, es decir, respecto a la diferencia de medias hipotetizada en la H0. Si
nosotros dibujamos la distribución normal conforme a H0, esta estaría for-
mada por los infinitos valores de (x–exp. - x–cont.) obtenidos en infinitas mues-
tras aleatorias extraídas de la misma población. Esta distribución toma la
forma de la curva normal. Si la H0 es verdadera, la mayoría de las diferen-
cias serán igual o próximas a cero, disminuyendo la altura de la curva (pro-
babilidad de aparición de cada valor) según nos alejemos del valor central
que sería el cero. Así obtendríamos diferencias empíricas por efecto del
azar de -0.5, de 0.9, de -1,3, de 2,8, etc., tanto más improbables cuanto más
grande sea el valor de la diferencia. Se trata, en definitiva, de una distribu-
ción muestral que indica la no existencia de diferencias estadísticamente sig-
nificativas. Es decir, es una distribución muestral que indica que todas las
diferencias encontradas entre dos sucesos se deben simplemente al azar.
Como cualquier distribución de frecuencias, la distribución muestral
tiene una desviación típica (ver tema anterior) que se denomina error típi-
co, δ. Podremos saber, entonces, cuántas desviaciones típicas se aleja nues-
tra puntuación empírica (diferencia de medias) de la media de la distribu-
ción (que no es más que una diferencia de medias igual a cero).
De este modo, el estadístico de contraste, z en este caso, nos indica
cuántos errores típicos se desvía nuestra diferencia de medias de una dife-
rencia de medias igual a cero. Cuando este valor es tan grande que su pro-
babilidad de ocurrencia es igual o menor que el alfa definido por el investi-
gador, entonces diremos que es lo suficientemente improbable como para
considerar que dicha diferencia no es aleatoria, sino que se debe a otro fac-
tor distinto del azar y que atribuimos generalmente a la variable indepen-
diente, en este caso al programa García.

271
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Zona de rechazo
de H0; p = /2 Zona de no rechazo
de H0

Z
-1,96 0 +1,96
x– e. - x– c.
dif. – 1,96 σ – -x
x – dif. + 1 σ dif. + 2,57 σ
e. c. = 0

Gráfico 8.1: Zona de aceptación y rechazo de H0 en un contraste bilateral (µE - µC ≠ 0)

En consecuencia, la región de rechazo de H0 estará formada por todos


aquellos valores del estadístico de contraste cuya probabilidad de aparición
asociada sea menor o igual que alfa (o α/2 si el contraste es bilateral). De nuevo,

RECHAZO H0 si p(t, z, F...) ≤ α

Esta es la esencia del contraste estadístico de hipótesis. Algunos autores,


para tomar la decisión estadística, comparan el valor del estadístico empí-
rico de contraste (el que obtenemos al aplicar la fórmula de z, t, F, χ 2, etc.
con el llamado valor crítico del estadístico, que no es más que el valor
correspondiente al nivel de significación. Como vemos en el gráfico, para
un contraste bilateral con α = 0.05 y, por tanto, α/2 = 0.025, le corresponde
un valor crítico de z = ±1.96. Esto quiere decir que si nuestro estadístico
empírico es mayor que z = ±1.96, rechazaremos la hipótesis nula.

4.5 Utilización del valor exacto de p

Como habrá entendido el lector, el valor de α se establece a priori, antes


de calcular la probabilidad asociada al estadístico de contraste. p es preci-
samente esto, la probabilidad exacta asociada al estadístico de contraste
obtenida a posteriori. Nos indica, como ya hemos dicho, la probabilidad de

272
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

obtener un valor tan extremo o más que el valor observado obtenido al cal-
cular el estadístico de contraste (z, t, F, etc.), asumiendo que la hipótesis
nula es verdadera. Este valor viene dado por la mayoría de los actuales pro-
gramas estadísticos utilizados.
Mediante el nivel de significación, llegamos a una decisión binaria:
rechazamos o no rechazamos H0. Con el valor exacto de p damos una infor-
mación mucho más precisa: no sólo si es mayor o menor que el nivel de sig-
nificación, sino la probabilidad exacta de obtener un valor igual o superior
al observado si la H0 es verdadera. Ello nos permite juzgar si hubiéramos
podido rechazar H0 en caso de que se hubiera elegido un α más exigente.
De hecho, muchas revistas científicas del campo de la educación, siguien-
do las recomendaciones de la American Psychological Association (APA),
exigen a los autores informar del valor exacto de p en sus artículos. En pro-
gramas como el SPSS, el valor de p aparece bajo la abreviatura sig. (signi-
ficación).
Otra forma frecuente de informar del valor de p en artículos científicos
en los que se exponen numerosos contrastes en una misma tabla, es utili-
zar la siguiente nomenclatura:

n.s.➔ (la diferencia encontrada no es estadísticamente significativa: p > 0,05)


* ➔ p < 0,05 (la diferencia es est. sig. utilizando un a = 0,05)

** ➔ p < 0,01 (la diferencia es est. sig. utilizando un a = 0,01)

*** ➔ p < 0,001 (la diferencia es est. sig. utilizando un a = 0,001)

5. ERRORES FRECUENTES EN LA UTILIZACIÓN


E INTERPRETACIÓN DE RESULTADOS DE LA PRUEBA
DE SIGNIFICACIÓN DE LA HIPÓTESIS NULA

La PSHN se basa en la asunción de una serie de condiciones:


– Se ha realizado un muestreo aleatorio de N observaciones indepen-
dientes.
– Las puntuaciones de la variable dependiente son cuantitativas y su
nivel de medida es al menos de intervalo.
– Es deseable que la distribución de la variable dependiente sea normal.

273
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

– El investigador debe seguir rigurosamente los pasos que hemos defi-


nido en el epígrafe anterior.
– El investigador debería realizar sólo uno o un número limitado de
contrastes en el mismo estudio.
Sin embargo, en la práctica de la investigación educativa, los investiga-
dores violan o se alejan del cumplimiento de dichos supuestos, lo que puede
afectar gravemente al error tipo I, elevándolo por encima del alfa nominal.
Por tanto, el investigador educativo debe conocer los supuestos que se
deberían cumplir para contrastar la hipótesis nula, así como lo que de
hecho se hace en la práctica de la investigación educativa y los efectos de
dicha práctica a la hora de interpretar los resultados.
En este sentido, cuando se realizan investigaciones en educación rara-
mente es posible obtener una muestra aleatoria de una población bien defi-
nida (pensemos en esta imposibilidad si tenemos la idea de contrastar la
eficacia de dos métodos de enseñanza en un país determinado). Incumpli-
mos, por tanto, una de las condiciones fundamentales para tomar de refe-
rencia la distribución muestral conforme a H0. Esta limitación debe estar
bien reflejada en los artículos o informes de investigación, ya que su incum-
plimiento podría llegar incluso a invalidar el proceso de contraste de hipó-
tesis. Debemos, por tanto, definir tan claramente como sea posible la pobla-
ción de referencia y procurar que la muestra sea representativa de dicha
población, si es que queremos realizar inferencias posteriores. Normal-
mente se habla de una hipotética población de referencia de sujetos simila-
res a los de la muestra de investigación, muestra que generalmente es inci-
dental o de conveniencia. Como ya sabemos, esto limita de forma
importante la validez externa.
Otro error frecuente es no tener en cuenta la repercusión de realizar un
gran número de contrastes en un mismo estudio. Supongamos, por ejem-
plo, que hemos aplicado una escala de actitudes de 100 ítems y queremos
ver si en cada uno de ellos hay diferencias entre las medias obtenidas entre
hombres y mujeres. Suponiendo que en la población no hubiera diferencias
entre hombres y mujeres, sólo por el error de muestreo sería esperable,
supuesto un α = 0.05, que en 5 de esos 100 contrastes obtuviéramos una
diferencia de medias significativa cuando en realidad no la hay. Tendría-
mos entonces lo que se conoce como riesgo inflado de error tipo I (Warner,

274
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

2008: 96). Existen procedimientos para estimar el nuevo α que deberíamos


considerar al aumentar el número de contrastes, como el de Bonferroni.
Para reducir algunas de las complicaciones derivadas de las condiciones
reales en las que se puede realizar investigación en el ámbito de la educa-
ción, se realizan diversas prácticas. Una de ellas, dirigida a conseguir
mayor grado de certeza en las evidencias obtenidas en una línea de investi-
gación es la replicación del estudio. Es decir, se hace necesario que otros
grupos de investigación, utilizando nuevas muestras y repitiendo el estudio,
lleguen a la misma decisión estadística, produciendo así evidencias más
conclusivas y reduciendo la posibilidad de error tipo I. También es intere-
sante conocer el método de la validación cruzada. Este método supone obte-
ner de nuestra muestra de estudio una submuestra utilizando un porcenta-
je determinado de la muestra inicial.
En esta situación, nuevamente debemos llamar la atención sobre la necesi-
dad de ser conscientes de las graves implicaciones del no cumplimiento de los
supuestos para realizar el contraste estadístico de hipótesis, no realizar alegre-
mente dichos contrastes, ser éticos a la hora de hacer nuestros estudios y comu-
nicar los resultados de los mismos y, finalmente, saber ser críticos con los resul-
tados que leamos en revistas científicas de nuestra disciplina como parte
fundamental de nuestra formación profesional a lo largo de la vida.
Por lo que respecta a la interpretación de resultados, aunque habitual-
mente se habla de aceptar o rechazar la hipótesis nula, en realidad debemos
hablar de rechazar o no rechazar la H0. Recordemos que hemos visto ante-
riormente cuál es la condición para rechazar H0, no la condición para acep-
tarla. Por tanto, podemos rechazar la H0 si cumple dicha condición pero, si
no se cumple, simplemente no la rechazamos. Esta distinción de matiz
(entre aceptar y no rechazar) es importante porque puede haber muchas
razones que expliquen que un resultado ha sido estadísticamente no signi-
ficativo, cuando en realidad sí lo es (es decir, cuando concluimos que no
hay diferencias entre las medias entre dos grupos, puede ser que sí haya
tales diferencias en la población). Además del error de muestreo, quizás el
ejemplo más claro para entender esto es el tamaño de la muestra. Cuando
la muestra utilizada es demasiado pequeña resta potencia estadística a la
prueba de contraste y entonces necesitamos diferencias muy grandes para
concluir que rechazamos H0 (cuanto más pequeña es la muestra, más fácil
es que la muestra esté sesgada, que no sea representativa de la población, y

275
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

por tanto habrá que encontrar diferencias muy grandes para poder genera-
lizar que en la población de referencia también hay diferencias). En
muchas ocasiones que no hemos rechazado H0, bastaría haber tenido una
muestra más grande para haberla rechazado. Cuanto más grande es el
tamaño muestral, más fácil es obtener una diferencia estadísticamente sig-
nificativa, aunque las diferencias entre las muestras sean pequeñas.
Otra explicación factible es que no se eligieron o no se manipularon bien
los niveles de la variable independiente, es decir, volviendo a nuestro ejem-
plo, significaría que los programas de enseñanza son tan parecidos que no
permiten mostrar las diferencias que se habrían obtenido en rendimiento
lecto-escritor si el programa experimental no tuviera características en
común con el tradicional (puede pensarse también en la cantidad o la dosis
de medicamento suministrada a los pacientes para mostrar su efecto real).
También podría suceder que estemos midiendo inadecuadamente la varia-
ble dependiente (poca fiabilidad y validez) o que sea insensible a los efec-
tos de la variable independiente. En definitiva, concluimos que, en las con-
diciones en las que hemos realizado nuestra investigación, no podemos
rechazar la hipótesis nula, lo cual no quiere decir que sea cierta o aceptemos
la hipótesis nula, porque en otras condiciones (mayor tamaño de la mues-
tra, niveles de la VI…) podríamos haber llegado a rechazarla (por eso en
Educación es tan importante la replicación de las investigaciones).
Por otra parte, la interpretación de un resultado estadísticamente signi-
ficativo también debe hacerse con cautela. Deben tenerse en cuenta todos
los supuestos ya comentados para aplicar la prueba de significación de la
hipótesis nula. Además, deben tenerse en cuenta algunos efectos indesea-
dos que afectan a la validez interna, como la expectativa del investigador de
que se cumpla su hipótesis o de que tenga éxito el tratamiento experimen-
tal. También debe considerarse la posibilidad de que nuestra variable inde-
pendiente correlacione altamente con otra variable independiente no teni-
da en cuenta y que sea esta última, en realidad, la que está produciendo los
efectos sobre la variable dependiente que atribuimos a la primera. Como
afirma Wagner (2008: 102), «para evaluar si un valor de p aporta una infor-
mación precisa acerca de la magnitud del riesgo de cometer error tipo I, los
investigadores necesitan: comprender la lógica de los condicionantes de la
PSHN; reconocer los procesos que pueden violar dichos condicionantes en
sus estudios; y, finalmente, darse cuenta de cómo dichas violaciones pue-
den hacer que los valores nominales de p sean estimaciones imprecisas del

276
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

verdadero riesgo de error Tipo I. A este respecto, resulta clarificador el tra-


bajo de López (2003), donde se comentan los análisis alternativos a las
pruebas de significación: intervalo de confianza, tamaño del efecto, análi-
sis de la potencia, metanálisis e inferencia bayesiana.

6. EL TAMAÑO DEL EFECTO

Todo investigador debe ser consciente de que la significatividad estadís-


tica nada dice acerca de la magnitud o relevancia práctica o clínica de las
diferencias encontradas. Es decir, una diferencia estadísticamente signifi-
cativa no nos dice que tal diferencia sea importante, sino tan sólo que exis-
ten diferencias en la población de referencia, aunque dicha diferencia (o
correlación, o lo que proceda) sea en la práctica irrelevante.
Por tanto, la significación estadística por sí sola no nos dice gran cosa
como para tomar decisiones en la práctica. Además, tampoco permite com-
parar los resultados entre distintas investigaciones cuando la unidad de
medida, la métrica, varía.
Para solucionar este problema, desde hace algunos años se utiliza como
indicador complementario a la significación estadística el tamaño del efecto,
siendo la d de Cohen el índice más utilizado (hay otros como el de Hedges o
el de Glass). Este índice muestra el tamaño del efecto como una diferencia
tipificada (como una puntuación z), donde el numerador es la diferencia de las
medias entre los grupos (nos centramos ahora, para su comprensión, en los
diseños de dos grupos independientes) y el denominador es una desviación
típica, que recibe el nombre de desviación típica combinada y que no es más
que eso, la combinación de las desviaciones típicas de los grupos que estamos
comparando. En definitiva, d nos indica cuántas desviaciones típicas se apar-
ta una media aritmética de la otra. La fórmula de la d de Cohen es:
X 1 −X 2
d= ,
s combinada
donde la desviación típica combinada para diseños de dos grupos indepen-
dientes es
(N1 s 12 ) + (N2 s 22 )
σ=
N1+N2

277
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En Ciencias Sociales, los valores sugeridos para interpretar el valor de d


son los siguientes:
d ≤ .20 efecto pequeño
d ≈ .50 efecto moderado
d ≥ .80 efecto grande
Este valor también se interpreta en los siguientes términos: Si consi-
deramos la media menor como el valor que representa al sujeto medio del
grupo 1 (en el sentido del sujeto prototipo, típico, normal) y la media
mayor como el valor que representa al sujeto medio del grupo 2, supo-
niendo que ambos sujetos medios pertenecen a grupos que se distribu-
yen según la curva normal, si el valor de d es 0.5, podríamos decir que el
sujeto medio del grupo 2 está media desviación típica por encima que el
sujeto medio del grupo 1. Si nos vamos a las tablas de la curva normal,
vemos que a una z = 0.5 le corresponde un área hasta la media de p =
0.1915, lo que puede interpretarse como que el sujeto medio del grupo
dos supera en 19 percentiles (19,15%) al sujeto medio del grupo uno
(Morales, 2007: 27).
Otra forma sencilla de valorar el tamaño del efecto es mediante una
correlación biserial-puntual. La variable X sería dicotómica, es decir, per-
tenecer a uno de los dos grupos que se están comparando (valores posibles
0/1), mientras que la variable Y sería continua, la medida de la variable
dependiente. La interpretación es como cualquier coeficiente de correla-
ción de este tipo (cuyo valor varía de 0 a ±1). De esta forma podemos trans-
formar el valor de la t de student en otro valor que nos da la idea de la fuer-
za de la relación entre la variable independiente y la dependiente y que nos
permite comparar también los resultados en distintos estudios.
En definitiva, es importante combinar los resultados de la significación
estadística y el tamaño del efecto. De esta forma, podremos valorar con más
precisión los resultados obtenidos. Es importante ser consciente de que
podrían obtenerse resultados aparentemente contradictorios, es decir,
rechazar H0 y obtener un tamaño del efecto poco relevante (algo que puede
suceder cuando tenemos muestras muy grandes) o aceptar H0 y obtener un
tamaño del efecto muy relevante (más fácil que suceda cuando las muestras
son pequeñas).

278
ESTADÍSTICA Y DISEÑOS II. CONTRASTE DE HIPÓTESIS

RESUMEN

El contraste estadístico de hipótesis es un método, entre otros, para tra-


tar de llegar a evidencias empíricas en el campo de la educación, con el fin
de sumar conocimiento para llegar a teorías con un amplio grado de gene-
ralidad. El contraste de hipótesis se basa en la prueba de significación de la
hipótesis nula, es decir, se parte de que no existen diferencias en la pobla-
ción en aquello que se plantea en la hipótesis nula (por ejemplo, diferencias
entre las medias de dos grupos sometidos a distintos métodos o tratamien-
tos). La prueba de significación de la hipótesis nula exige que se cumplan
determinados supuestos (población definida, selección aleatoria, contrastes
limitados, normalidad…) que muchas veces no pueden cumplirse en la
investigación educativa. Por tanto, es necesario conocer dichos supuestos y
sus efectos a la hora de interpretar los resultados obtenidos. Por otra parte,
el contraste de hipótesis exige seguir unos pasos de forma sistemática y
rigurosa (hipótesis, muestra, comparación y decisión), lo que implica cono-
cer los errores que podemos estar cometiendo (error Tipo I y error Tipo II)
así como la importancia de la potencia estadística de la prueba utilizada.
Estos pasos, entrando ya en su formulación estadística, se concretan en los
siguientes: 1. Selección de una muestra aleatoria; 2. Formulación de las
hipótesis estadísticas (hipótesis nula y alterna) de acuerdo con la hipótesis
sustantiva, reconociendo cuando la alterna será unilateral o bilateral. 3.
Seleccionar el nivel de significación. 4. Definir la distribución muestral y la
región de rechazo y 5. Decisión estadística: rechazar o no la hipótesis nula.
Para un profesional de la educación, obligado a leer artículos científicos
para mantenerse actualizado, es esencial saber interpretar también el valor
de p que suele mostrarse en dichos artículos. Finalmente, la necesidad de ir
más allá de la significación estadística para conocer la relevancia práctica
de los resultados, nos lleva al cálculo del tamaño del efecto, lo que nos per-
mitirá también la comparación de los resultados de distintos estudios y la
acumulación de evidencia científica.

279
Tema 9
Las pruebas paramétricas y su uso en los diferentes
diseños: ANAVA. Las pruebas t de Student
y F de Fisher

Presentación

1. Variedad de pruebas para los diseños de dos grupos


1.1. Pruebas paramétricas frente a no paramétricas
1.2. Tipos de diferencias y pruebas estadísticas

2. Las pruebas parametricas en los diseños de dos grupos


2.1. Las exigencias del modelo y la prueba
2.2. Principales pruebas
2.2.1. Los enfoques z y t
2.2.2. Pruebas z y t
2.2.3. El análisis de la varianza como alternativa

3. La correlación como minimización de la varianza de error

4. Correlación y grados de libertad

5. Pruebas paramétricas para pruebas relacionadas


5.1. Pruebas z y t
5.2. La prueba F como alternativa

Resumen

281
PRESENTACIÓN

A lo largo de temas anteriores hemos hecho referencia al papel jugado


por la Estadística en la prueba de hipótesis y a la hora de tomar las deci-
siones correspondientes, en concreto la decisión de aceptar o rechazar la
denominada hipótesis nula o de nulidad (H0), cuyo rechazo a un determi-
nado nivel de significación estadística nos permitirá conceder la condición
de validada a la hipótesis del investigador (H1).
Tanto para una como para otra situación se dispone de una serie de
pruebas estadísticas. Las pruebas estadísticas son modelos estadísticos de
distribución de datos. En la medida en que unos datos empíricos, los del
investigador, sigan o se acomoden razonablemente a un modelo, es lógico
poder aplicar las propiedades del modelo a los datos empíricos. Por ejem-
plo, el modelo estadístico que se conoce como Campana de Gauss tiene
ciertas propiedades:
• La campana es simétrica en relación con la ordenada correspondien-
te a la media aritmética.
• Media, mediana y moda coinciden en su valor.
• Los valores correspondientes a las puntuaciones típicas ± z son el
punto de inflexión, de forma que la curva pasa de ser cóncava hacia
arriba a cóncava hacia abajo, y viceversa.
• La curva es asintótica en relación con el eje de abscisas: por mucho
que se acerque nunca lo corta, salvo en el infinito.
Pues bien: cuando unos datos empíricos cumplen con estas condiciones,
podemos tratarlos estadísticamente como si fueran una curva normal. El pro-
blema es que en la realidad nunca hay campanas de Gauss perfectas, como
tampoco hay pirámides o conos, y sí objetos piramidales o cónicos. La pirá-
mide, el cono, la esfera, son «modelos», al igual que la campana de Gauss.

283
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Sin embargo, si los datos no se apartan «mucho» del modelo nos servi-
mos de sus características para calcular, por ejemplo, el volumen del obje-
to cónico o piramidal. Pues eso mismo hacemos en nuestro caso.
El problema está en decidir cuánto es ese «mucho»; o mejor: a partir de
qué valor podemos decidir que nuestra distribución deja de acomodarse al
modelo. Para ello disponemos de las denominadas «pruebas de bondad de
ajuste», a las que hemos hecho referencia y a una de ellas le dedicaremos
espacio en el siguiente tema.
Para el momento, baste saber que entre las pruebas disponibles las hay
con mayores prestaciones, pero con mayores exigencias para poder ser uti-
lizadas. En este tema vamos a estudiar dos pruebas de este tipo, denomi-
nadas «paramétricas», la t de Student y la F de Fisher. Dedicaremos una
atención especial al análisis de la varianza en que consiste F.

1. VARIEDAD DE PRUEBAS PARA LOS DISEÑOS DE DOS GRUPOS

La resolución estadística de los diseños de dos grupos ofrece una cierta com-
plejidad en el sentido de que, dadas sus características y su uso, se dispone de
una amplia variedad de pruebas que se traducen en una primera exigencia al
investigador consistente en la elección de la más adecuada a sus necesidades.
Tal variedad tiene que ver con criterios de referencia que van de las
características de los datos a la manera en que se forman los grupos, pasan-
do por el tipo de diferencias que se contrastan. En efecto, el tratamiento
estadístico de los datos consiste en una serie de modelos teóricos que per-
miten atribuir a los datos empíricos, recogidos para validar la hipótesis del
investigador —H1—, un determinado valor de probabilidad.
Si el valor conforme a la hipótesis del azar —H0— es igual o más peque-
ño que el que inicialmente estaba dispuesto a admitir como riesgo de equi-
vocarse al rechazar H0 —error tipo I—, representado por α o nivel de signi-
ficación estadística, puede rechazarse esta, H0, y aceptar aquella — H1—.
Ahora bien, esos modelos de distribución teórica de datos vienen caracteri-
zados por ciertas notas y exigencias que, de cumplirse en los datos empíri-
cos, permiten o justifican la aplicación a estos de sus propiedades y, conse-
cuentemente, la asignación de valores de probabilidad; en caso contrario,
tal asignación no será correcta dando lugar a decisiones erróneas.

284
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Pues bien, desde este punto de vista se han elaborado dos grandes cate-
gorías de modelos teóricos, conocidos como pruebas paramétricas y no
paramétricas que, aparte de sus características, presentan ventajas e incon-
venientes que en cada caso deben ser objeto de consideración.
La formación de los grupos, como ya hemos visto, se puede realizar fun-
damentalmente mediante dos grandes procedimientos, la aleatorización y
el emparejamiento. En cada uno de ellos la estimación de las diferencias
debidas al azar1 se realiza de modo diferente dado que con el segundo pro-
cedimiento se ha actuado intencionadamente para lograr una mayor homo-
geneidad entre las parejas e identificar fuentes de varianza. Consecuente-
mente, el tratamiento estadístico debe tomar en consideración estos
hechos. Desde esta perspectiva hay que elegir entre pruebas para sujetos
seleccionados independientemente o para aquellos que se han emparejado.
Otro elemento a considerar es el tipo de diferencia entre los grupos sobre
el que se desea decidir. Hay casos en que las hipótesis son muy generales e
inespecíficas pero en otros se refieren a diferencias en posición o variabili-
dad, o pueden hacer mención de diferencias en proporciones o niveles de
relación (correlación). En cada caso tanto los estadísticos a calcular en las
muestras cuanto la estimación de las diferencias al azar son diferentes.
En una visión más amplia que el diseño de dos grupos será preciso tomar
en consideración justamente el número de variables independientes que actú-
an simultáneamente así como los niveles, condiciones o tratamiento de cada
una de ellas.
Una vez elegida la prueba, otros aspectos cobran especial relevancia
cuando se trata de decidir sobre el rechazo o no de H0 siendo los funda-
mentales el nivel de significación estadística —α— y el tipo de hipótesis
planteado, esto es, si es unilateral o de una cola o bilateral o de dos.

1.1. Pruebas paramétricas frente a no paramétricas

Se denominan pruebas paramétricas aquellas que se basan en una serie


de supuestos, muy concretos y restrictivos, acerca de los valores de la pobla-
ción o parámetros.

1
Ya sabemos que en este término se incluyen las diferencias no debidas a la variable experimental
o independiente.

285
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En el caso que nos ocupa, los supuestos del modelo teórico se refieren a
la independencia de las observaciones, a la normalidad de la distribución, a
la homogeneidad de las varianzas y al nivel o escala de medida, al menos de
intervalo.
Parece claro que la atribución de valores de probabilidad a los datos empí-
ricos valiéndose de modelos teóricos paramétricos debería partir de la com-
probación de que tales supuestos no son sólo supuestos sino que se cumplen
razonablemente en la realidad. Subrayamos lo de razonablemente porque, en
la conocida polémica sobre el uso de uno u otro tipo de pruebas, ésta puede
ser una buena regla; en efecto, parece ser que las violaciones de menor cuan-
tía son soportadas bien por las pruebas paramétricas (hablamos de su robus-
tez) siendo únicamente preocupante el caso de violaciones graves2.
Cuando alguno de tales supuestos no se cumple, los defensores de las
pruebas no paramétricas afirman que hay que recurrir a estas, caracteriza-
das por unas menores exigencias y, consiguientemente, una mayor aplica-
bilidad, aunque paguen ambas con una menor potencia, esto es, con una
menor probabilidad de rechazar H0 falsas. Debe indicarse, no obstante, que
se da otra alternativa, a la que no nos referiremos aquí, consistente en la
realización de transformaciones de las puntuaciones originales en otras que
den cumplimiento a tales restricciones3.
Las principales ventajas e inconvenientes de ambos tipos de pruebas
pueden resumirse en los siguientes puntos:
Pruebas paramétricas:
a) Sus ventajas se centran fundamentalmente en dos aspectos:

• Su mayor potencia para rechazar H0 falsas o, a igual potencia, el aho-


rro de sujetos en las muestras.
• Un desarrollo estadístico superior, más complejo y avanzado, que per-
mite proseguir los análisis más allá que en el caso de las no paramé-
tricas; teniendo en cuenta la complejidad del objeto de investigación
de Ciencias Humanas esta ventaja puede ser de gran relevancia.

2
KERLINGER, F. N. (1975). Investigación del comportamiento. México: Trillas, pp. 298-299.
3
El lector puede consultar OSTLE, B. (1974). Estadística aplicada, México: Limusa.

286
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Habría que reseñar, asimismo, el hecho de que estas pruebas permiten


hacer estimaciones de los parámetros indicando el margen de error que les
afecta, lo que supone una mayor precisión y riqueza.
b) Sus inconvenientes tienen relación con los supuestos sumamente res-
trictivos que se requieren para su aplicación, supuestos que limitan el
uso de las pruebas a su cumplimiento.
Pruebas no paramétricas:
Los aspectos más positivos son:

• Su más fácil cálculo por regla general


• Los menores supuestos de sus respectivos modelos, entre los que desta-
ca su aplicabilidad con niveles de medida tan elementales como el ordi-
nal e, incluso, el nominal, lo que se traduce en una superior aplicabilidad.
• Su especial adecuación a muestras pequeñas, en las que suelen ser tan
potentes como las paramétricas, sin olvidar que en ocasiones no tie-
nen alternativa entre éstas.

En general, su gran limitación se halla, como es lógico, en su menor


potencia y en el desarrollo estadístico menor.

1.2. Tipos de diferencias y pruebas estadísticas

Habitualmente los diseños suelen plantearse para decidir sobre diferen-


cias de los grupos en cuanto a su posición o tendencia central, por ser estas
medidas, en especial la media aritmética y la mediana, unos valores repre-
sentativos de todo el grupo. En tales casos se entiende que, si un grupo
––
difiere del otro significativamente en Media (X) o en Mediana (Md) es que,
como tal grupo, es superior, o inferior, en el aspecto analizado.
En ocasiones se trata de decidir si entre las distribuciones de frecuen-
cias de dos series de datos se da algún tipo de diferencias, diferencias que
se refieren en ese caso, por lo general, al modo en que tales frecuencias se
reparten a lo largo del recorrido de la variable.
Pero hay otras ocasiones en que puede interesar el contraste de diferen-
cias de otro tipo. En efecto, si junto a la posición, la variabilidad es una
característica definitoria de los grupos, puede interesar contrastar si tales

287
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

diferencias son o no significativas, esto es, si van o no más allá de los limi-
tes esperables por azar. En ocasiones el contraste a que nos referimos
puede ser justamente el objetivo de la investigación en cuestión, como
cuando se trata de estudiar las características que definen en una serie de
rasgos a determinada clase de grupos, como el sexo, la edad, la clase social,
la raza, etc. Pero en otros casos esos contrastes se realizan justamente para
decidir sobre la aplicabilidad o no a determinados datos empíricos de cier-
tas pruebas estadísticas; en efecto, como veremos más adelante, hay oca-
siones en que conviene contrastar la homogeneidad de varianzas para deci-
dir sobre la aplicabilidad o no de pruebas de tipo paramétrico.
Los planteamientos básicos sobre diferencias de medias aritméticas,
que veremos con detalle a lo largo de éste tema, son aplicables sustancial-
mente a las diferencias de variabilidad.
Otro tipo de pruebas que pueden llevarse a cabo se refieren a las corre-
laciones. La correlación es uno de los estadísticos de mayor uso en el ámbi-
to de la experimentación pedagógica. Decidir sobre la significación de los
coeficientes de correlación, esto es, sobre si representan o no correlación
real para la población toda de la que se extrajo la muestra, es un problema
frecuente; pero, en ocasiones, interesa decidir sobre diferencias de correla-
ciones obtenidas, bien sea sobre un mismo aspecto en muestras diferentes,
bien sobre varios aspectos diferentes en una misma muestra. La significa-
ción estadística de las diferencias de coeficientes de correlación puede,
pues, constituir un objetivo de la investigación empírica. En tales casos es
preciso tener en cuenta siempre el tipo de correlación que se ha calculado,
bien sea correlaciones que exigen mediciones muy perfectas, como el caso
del rxy de Pearson y sus derivados, bien otras como la correlación ordinal,
debida a Spearman, o la de carácter nominal, mejor denominada asocia-
ción. Cada coeficiente cuenta, como es natural, con su correspondiente
error típico para la estimación de la correlación esperable por puro azar.
Por último, determinadas pruebas pueden, asimismo, plantearse si las dife-
rencias entre proporciones a que han sido traducidas las puntuaciones brutas
para facilitar las comparaciones, son o no significativas; o, como en el caso
anterior, si las diferentes proporciones, en sí mismas, son o no significativas,
aunque sea éste un hecho con menor sentido que en el caso de la correlación.
Quede claro pues que el campo de las pruebas estadísticas no se reduce
a los aspectos que, a continuación, y de modo detallado, vamos a conside-

288
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

rar. Eso sí, en sus aspectos básicos, los conceptos que estudiaremos a con-
tinuación tienen gran aplicabilidad a los casos a los que de pasada nos aca-
bamos de referir.

2. LAS PRUEBAS PARAMÉTRICAS EN LOS DISEÑOS DE DOS


GRUPOS. SUJETOS INDEPENDIENTES

Consideraremos a continuación las pruebas paramétricas para aquellos casos


en que los sujetos se han seleccionado en forma independiente unos de otros, es
decir, de manera que la selección de uno no suponga restricción de las posibili-
dades de selección de otro o que, justamente, implique la selección de otro.
En concreto, el procedimiento clave para el caso que nos ocupa consiste
en la aleatorización a que nos hemos referido, aleatorización en tres niveles:
• Selección de la muestra al azar.
• Asignación de los sujetos a los dos grupos al azar.
• Atribución de tratamientos a los grupos al azar.

2.1. Las exigencias del modelo y la prueba

Además, claro está, de la independencia en la selección a que acabamos


de aludir4, es preciso que se dé:
a) Normalidad, esto es, que los datos extraídos para la prueba de la hipó-
tesis lo sean de poblaciones distribuidas normalmente. Los estudios
realizados para comprobar los efectos del incumplimiento de este
supuesto5 vienen a indicar que estos no son preocupantes ya que los
valores de α reales que se producen en tal caso se apartan muy poco
del que decidió el investigador.
Por otra parte, podemos asumir que gran cantidad de variables, las
antropológicas, bastantes psicológicas y muchas pedagógicas, siguen

4
Naturalmente, en el caso de muestras relacionadas este supuesto no se da, pero entonces se eli-
gen pruebas paramétricas especiales para el caso, como veremos más adelante.
5
BONEAU, C. (1960). «The efTects of Violations of Assumtions Underlying the t tests», in Psycho-
logical Bulletin, 57, pp. 49-64.

289
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

sustancialmente el modelo. Variables como el peso o la talla, la capa-


cidad mental o el rendimiento académico parecen ajustarse al men-
cionado modelo. En concreto las variables referidas a capacidades y
rendimientos suelen seguirlo.
b) Homogeneidad de varianzas. Las varianzas de los grupos deben ser
estadísticamente iguales, o lo que es lo mismo, las diferencias que
normalmente encontremos, deben quedar dentro de los límites espe-
rables como efecto de la extracción aleatoria de las muestras.
El efecto de varianzas claramente diferentes viene a consistir en alte-
rar lo que se conoce como varianza dentro de los grupos o varianza de
error y, puesto que este dato se utiliza como término de error en el
cálculo de F, el efecto consiste en modificar el valor de α decidido por
el investigador, En concreto, y según la síntesis ofrecida por Glass y
Stanley6, los efectos pueden ser:

- Mínima alteración del valor de alfa (α) cuando ambas muestras


tienen igual número de sujetos.
- Aumento de la probabilidad de error tipo I con respecto al valor
α prefijado cuando la muestra menor pertenece a la población
con mayor varianza.
- Disminución de la probabilidad de error tipo I con respecto al
valor α prefijado por el investigador cuando la muestra mayor
pertenece a la población con mayor varianza.

Al igual que existen pruebas para determinar la bondad de ajuste de


los datos empíricos al modelo, en concreto al normal, como pueden
ser Ji cuadrado (χ2) o Kolmogorov-Smirnov, disponemos de una cier-
ta variedad de pruebas que permiten comprobar el cumplimiento del
supuesto de homogeneidad de varianzas; tal vez las más sencillas sean
las de Hartley y Cochran, mientras la de Bartlet es la más compleja.
c) Nivel de medición, por lo menos de escala de intervalo, aspecto este
muy difícil de lograr y al que ya nos referimos con cierto detalle.

6
GLASS, G. V. y otro (1974). Métodos estadísticos aplicados a las Ciencias Sociales, Madrid, Prenti-
ce-Hall International, pp. 371-372.

290
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

d) Linealidad. Esta condición no es exigida para la prueba t, pero sí para


el análisis de la varianza (prueba F). Consiste, según Siegel, en la nece-
sidad de que «las medias de estas poblaciones normales y homoscedásti-
cas deberán ser combinaciones lineales de los efectos debidos a las colum-
nas y a los renglones de ambos. Por tanto, los efectos deben ser aditivos»7.
El incumplimiento de estos supuestos debe llevar, según Siegel, a no uti-
lizar tales pruebas a pesar de su mayor potencia. Pero en este punto no hay
unanimidad entre los autores. Kerlinger, refiriéndose al supuesto de homo-
geneidad, de efectos más graves en caso de incumplimiento que el de nor-
malidad, y apoyándose en Norton, Lindquist y Boneau, afirma:

«En resumen, en la mayor parte de los casos de educación y psicología es pro-


bablemente más seguro —y generalmente más eficaz— usar pruebas paramétricas
en vez de pruebas no paramétricas.»

si bien el mismo autor, unas líneas más abajo, refiriéndose a la medi-


ción de intervalos, afirma:

«A pesar de las conclusiones de Lindquist, Boneau, Anderson y otros, es con-


veniente tener presentes estos supuestos. No es acertado usar procedimientos esta-
dísticos (....) sin el debido respeto a los supuestos en que se basan los procedi-
mientos. Si son violados demasiado gravemente, las conclusiones extraídas de los
datos de investigación pueden ser erróneas.»

2.2. Principales pruebas

Nos vamos a centrar en las pruebas paramétricas para diferencias de


medias aritméticas, aunque, como hemos visto, se pueda hablar de dife-
rencias en variabilidad o en correlación, pongamos por caso. El conoci-
miento de la mecánica, fundamento y aplicaciones de aquéllas permitirá su
transferencia a los demás casos. Aquí lo haremos para sujetos selecciona-
dos de forma independiente (procedimientos aleatorios).

7
SIEGUEL, S. (1976). Estadística no paramétrica. México: Trillas, p. 39.

291
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Dentro de las pruebas de diferencias de medias aritméticas, los textos solían


informar de dos grandes modalidades en función de tamaño de las muestras; se
diferenciaba así entre pruebas para muestras grandes y para muestras peque-
ñas. La razón de tal diferenciación se hallaba en el hecho de que la distribución
de muestras de las diferencias de medias aritméticas sigue el modelo normal o
gaussiano con muestras grandes mientras que, en el caso de las pequeñas, se da
una discrepancia con dicho modelo, consistente en una elevación superior de la
curva por sus extremos en tanto que la ordenada de la media presente una altu-
ra inferior, como puede apreciarse en la figura 9.1. El punto de diferenciación
entre muestras grandes y pequeñas se encontraba en el tamaño de 30 casos: si
n < 30 la muestra se consideraba pequeña, y grande en caso de n > 30.

Figura 9.l. Distribuciones normal y t para diferentes grados de libertad.

Las muestras pequeñas no siguen el modelo normal sino el conocido


como distribución t, caracterizado por tratarse en realidad de una familia
de distribuciones cuya forma difiere de aquél, y entre sí, según los g.l. de
cada caso, siendo su límite justamente la distribución normal, que se da
cuando tales g.l. son infinitos. Es decir, entre los modelos normal y t no hay
un salto, sino un progresivo alejamiento conforme el valor de los g.l. se
reduce, algo que puede comprobar el lector comparando los valores críticos
de ambos modelos para el nivel α = 0,05. Aquí presentamos algunos:

Distribución g.l. Valores críticos


Normal Infinitos 1,96
t 500 1,96
t 100 1,98
t 50 2,01
t 20 2,09
t 10 2,23
t 2 4,30
t 1 12,71

292
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Como consecuencia, hoy no se encuentran en los textos tales distin-


ciones, sino una única ecuación para determinar el error o denominador
de t.
Con todo, es interesante reseñar una de las exposiciones más matizadas
sobre el tema, debida al profesor Amón8, según la cual la estimación de
dicho término de error es diferente según que las desviaciones típicas de
ambas poblaciones —σA y σB— se conozcan, se den por conocidas, o sean
desconocidas; en este último caso, distingue entre que se supongan iguales
al parámetro o no y, caso de no igualdad, que se trabaje con muestras gran-
des o pequeñas (n > 30 y n < 30) respectivamente. Precisamente por ser la
exposición más matizada y completa será la que seguiremos en el texto. Los
casos son, pues, los siguientes:
• Diferencia de medias aritméticas para grupos independientes
a) Supuestas conocidas σA y σB —desviaciones típicas— de las pobla-
ciones. El estadístico de contraste es la ecuación 9.1, distribuida según el
modelo normal:
XA - XB
z=
σ 2A σ 2B
+
nA nB
Ecuación 9.1. Contraste de diferencias entre medias aritméticas para grupos
independientes supuestas conocidas σA y σB

Desconocidas σA y σB , pero supuestas iguales entre sí y al parámetro. El


estadístico de contraste es la ecuación 9.2, cuya distribución sigue el mode-
lo t con (nA + nB - 2) g.l.

XA − XB
t=

[(n A
− 1) s2A + ( n B − 1) s2B
nA + nB − 2 ][
1
+
1
nA nB ]
Ecuación 9.2. Contraste de diferencias entre medias aritméticas cuando se desconocen
σA y σB, pero se suponen iguales entre sí y al parámetro, para grupos independientes

8
AMON, J. (1976). Estadística para psicólogos. Madrid, vol. 2, pp. 111-118.

293
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

c) Desconocidas σA y σB, supuestas distintas, pero nA y nB grandes. El


estadístico de contraste es la ecuación 9.3, distribuido según el modelo nor-
mal:

XA − XB
z=
s 2A s 2B
+
nA nB
Ecuación 9.3. Contraste de diferencias entre medias aritméticas cuando se desconocen
σA y σB, supuestas distintas, y con nA y nB grandes

d) Desconocidas σA y σB, supuestas diferentes, pero con nA y nB peque-


ñas. El estadístico de contraste es la misma ecuación 9.3, pero distri-
buido como t, con los grados de libertad iguales al número entero
más próximo al obtenido mediante la expresión 9.4:
2
(s 2
A
/ n A + s B2 / n B ) −2
2 2
( s 2A / n A ) +( s 2B / n B )
nA + 1 nB + 1
Ecuación 9.4. Grados de libertad para el contraste de diferencias entre medias aritméticas
cuando se desconocen σA y σB , supuestas distintas, y con nA y nB pequeñas

2.2.1. Los enfoques z y t

El enfoque básico de las pruebas paramétricas z y t, válido también para


el caso de muestras relacionadas —bloqueo, emparejamiento— consiste en
la contrastación del valor empírico de la diferencia de medias aritméticas
con el error típico de dicha diferencia.
Como sabemos, el error típico es la desviación típica de una distribución
muestral. La asignación de probabilidades para, a partir de ellas, decidir
sobre la aceptación o rechazo de H0 sólo puede hacerse sobre la base de
series infinitas de valores: «... puede afirmarse que para aplicar la teoría de la
probabilidad, debemos disponer de una secuencia ilimitada de observaciones
similares» afirma Von Mises. Pues bien, en el supuesto de que hubiéramos
obtenido infinitos pares de medias aritméticas, calculadas en infinitos

294
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

pares de muestras extraídas al azar de una población estadísticamente infi-


nita —o muestreada con reposición si es finita— la distribución de tales
diferencias —distribución muestral— sigue un determinado modelo, el nor-
mal o gaussiano cuando tales muestras tienen suficientes grados de liber-
tad (son suficientemente grandes)9.
En esa distribución, en efecto, habrá muchas diferencias muy pequeñas
mientras que, conforme vayan aumentando en tamaño, el número de casos
disminuirá. En esa distribución, como en cualquier otra, hay una media
aritmética, que es igual al parámetro —µ— o media aritmética de la pobla-
ción, y una desviación típica que no es sino el error típico, en este caso el
error típico de la distribución muestral de la diferencia de medias aritméticas.
Como muy bien sabemos, en una distribución normal los valores empí-
ricos que se apartan x desviaciones típicas de la media tienen una probabi-
lidad de ocurrencia determinada: esta probabilidad es tanto menor cuanto
más desviaciones típicas se aparte del valor central o media. Así, en una
distribución de la talla de 1.000 personas que resultara ser normal, con
––
X = 1,40 m. y s = 0,29, el hecho de encontrar una persona cuya talla sea 1,98
es un fenómeno muy raro ya que este valor se aparta de la media dos des-
viaciones típicas —1,40 + 0,29 + 0,29 = 1,98— un fenómeno en concreto
cuya probabilidad máxima no supera 0,0238, esto es, no ocurre más allá de
2,38 veces de cada 100 casos; por contra, otra cuya talla sea de 1,69 es
mucho más frecuente pues únicamente se aparta una desviación típica de
la media —1,40 + 0,29 = 1,69—; en efecto, su probabilidad sería de 0,1587,
con lo que la frecuencia de ocurrencia sería de 15,87 veces cada 100 casos.
Pues bien, estas afirmaciones sobre la base de distribuciones empíricas
de datos podemos trasladarlas a las distribuciones muestrales donde s se con-
vierte en error típico. El cálculo del error típico es pues el elemento clave por-
que, según ya sabemos, nos servirá para evaluar la diferencia empírica —en
este caso entre medias aritméticas— atribuyéndole una determinada proba-
bilidad de ocurrencia conforme a la hipótesis de que sea casual o debida al
azar (H0); naturalmente, si esa probabilidad conforme al azar o la casuali-
dad es muy pequeña, el investigador concluirá que no se debe al azar sino al
efecto de la variable independiente —v.i.— que ha hecho que dos grupos,

9
Naturalmente, conforme el tamaño de la muestra disminuya el modelo ya no será el normal sino
t para los g.l. concretos. El razonamiento, no obstante, es válido.

295
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que inicialmente eran estadísticamente iguales por proceder de una misma


población o de poblaciones equivalentes, difieran ahora de modo significa-
tivo. La probabilidad conforme al azar a partir de la cual el investigador está
dispuesto a pensar que ya no es éste el factor causante sino que lo es el tra-
tamiento experimental, se representa por alfa (α) y se denomina nivel de sig-
nificación: a la vez este nivel α coincide con la probabilidad aceptada por el
investigador de tomar una decisión errónea —error tipo I— consistente en
rechazar H0 siendo correcta y aceptar H1 siendo, por consiguiente, falsa, es
decir, de considerar que existen diferencias reales, atribuidas a v.i. cuando
en la realidad son explicables por la casualidad o azar.
Podemos comprender de alguna manera el proceso volviendo al ejemplo
de la talla; supongamos que aquella investigación se desarrolló hace 15 años
y un hipotético investigador trata de averiguar si, desde entonces, se ha pro-
ducido una elevación de la talla en la ciudad de Madrid; el investigador se
sitúa en una zona de la capital y toma las 300 primeras personas que pasan,
considerando que está tomando una muestra al azar; les pregunta o mide
su talla, encontrando que 32 de ellas superan los dos metros de altura.
Ante este hecho tiene que optar por pensar que, en efecto, la talla se ha
elevado (con arreglo a aquella investigación no debería haber más de 7 per-
sonas de tal talla) o que por azar —causas desconocidas— se han acumula-
do allí demasiadas personas de una característica dada, sesgando una
muestra que debería ser representativa. Aquí tal vez pueda encontrarse
fácilmente una explicación a ese azar, como pudiera ser haber tomado su
muestra en los alrededores de un pabellón de deportes en horas de un cam-
peonato de baloncesto.
Algo similar puede ocurrir con la lotería, prototipo de azar; si el premio
mayor saliera repetido 10 veces a lo largo de un año se puede pensar que ha
ocurrido por casualidad —azar— o que alguna manipulación o algún otro
fenómeno hace que tal bola tenga unas probabilidades superiores de apa-
recer. En ambos casos la decisión admite riesgos; en efecto, el azar ha podi-
do jugar una mala pasada al investigador que, habiendo recogido en forma
imparcial su muestra en un lugar inocuo, la ha obtenido sesgada hacia las
tallas altas, y lo mismo con la lotería. Lo extremo de ambos fenómenos
puede llevar a pensar que algo diferente del azar está jugando, bien sea que
la talla aumentó o que la bola está trucada o está siendo manipulada, pero
el fenómeno puede ser cierto, conduciéndole a una decisión errónea.

296
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

No obstante este riesgo hay que aceptarlo en las ciencias empíricas. Es


verdad que el investigador puede hacerlo tan pequeño como desee, disminu-
yendo el valor de alfa (α) hasta 0,01, 0,001, 0,00001..., pero a sabiendas de
que, al hacerlo, a la vez que aminora la probabilidad de error tipo I, eleva la
de cometer el error tipo II, esto es, de mantener que las diferencias, en este
caso de talla, son casuales o debidas al azar, no rechazando H0 y no aceptan-
do H1 cuando en realidad tales diferencias se dan; en el caso de la lotería se
trataría de decir que no hay anomalía en la bola cuando puede haberla, o
cuando puede estar siendo manipulada por alguna persona con acceso a ella.
Comprenderemos todos estos puntos con un ejemplo que explicaremos
detenidamente. En él ejercitaremos una de las situaciones reseñadas ante-
riormente presentando las otras con menor detenimiento.

2.2.2. Pruebas z y t

a) Ejemplo primero:
El profesor de Educación Física de un colegio desea contrastar su siste-
ma de entrenamiento en salto de altura con otro nuevo que ha conocido a
través de una revista especializada. A su sistema lo denomina A y al nuevo
B. Antes de lanzarse a su aplicación masiva decide llevar a cabo una inves-
tigación previa con 20 sujetos de sus clases de Educación Secundaria Obli-
gatoria (ESO) tomando al azar 4 de cada uno de los cinco grupos a los que
imparte clases y asignando al azar dos al grupo A y dos al B. Los sujetos
entrenan en sus respectivos cursos con todos sus compañeros, sin saber que
están siendo miembros de una investigación. El salto de altura es medido a
final de curso.
Desea probar su hipótesis de existencia de diferencias en salto de altu-
ra según el método a un nivel de confianza del 95 % —nivel de significa-
ción o α = 0,05— y parte del hecho de que desconoce los valores de σA y
σB, —desviaciones típicas de ambos grupos en la población— pero los supo-
ne iguales entre sí (no encuentra razones objetivas para otra cosa) e iguales
al parámetro por considerar que sus muestras al azar así lo permiten.
Los resultados medidos en salto de altura al final de curso, expresados
en centímetros, fueron:

297
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Grupo A: 174, 172, 169, 164, 163, 159, 154, 149, 146, 138.
Grupo B: 168, 153, 161, 176, 149, 175, 163, 172, 164, 146.

Análisis del caso


a) Estamos ante dos muestras de sujetos tomadas al azar de una misma
población, la constituida por los alumnos correspondientes a los cur-
sos de ESO de un colegio. Por tanto el análisis estadístico correspon-
diente seguirá el modelo de sujetos independientes o al azar.
b) Al tratarse de una variable como la altura, medida en forma perfecta,
con cero absoluto y con intervalos iguales —diferencia constante entre
valores de la misma clase consecutivos—, le es aplicable desde este
punto de vista una prueba paramétrica. Se sabe, además, que muchas
variables antropométricas, como la talla, siguen el modelo normal.
c) El investigador, por otra parte, asume que σA y σB son iguales entre sí
y al parámetro (iguales estadísticamente hablando, es decir, con dife-
rencias, si las hay, explicables por azar). Por todas estas razones se
adopta una prueba paramétrica.
d) Se trata de de una hipótesis bilateral pues sólo habla de la existencia
de diferencias entre sistemas de entrenamiento, mas no indica a favor
de cuál se darán tales diferencias si las hubiera. Aquí H0 : µA = µB , o
µA – µB = 0; y H1: µA ≠ µB , o µA – µB ≠ 0.
e) La variable independiente es el sistema de entrenamiento, con una
modalidad experimental, que ejercita en el grupo B, y otra de control,
la suya, que utiliza en el A. La variable dependiente es el salto de altu-
ra medido a final de curso.
El caso que nos ocupa se contrasta mediante el estadístico t de la ecua-
ción 9.2, distribuido con N-2 g.l. (nA + nB- 2) siguiendo el modelo t ya que
desconoce σA y σB de los grupos en la población, pero los supone iguales.
Dicho estadístico, recordémoslo, es:

XA − XB
t=

[(n A
− 1) s2A + ( n B − 1) s2B
nA + nB − 2 ][
1
+
1
nA nB ]
298
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

En consecuencia, y dado que trabaja con α = 0,05 y 18 g.l. en una hipó-


tesis bilateral, los valores críticos a partir de los cuales se podrá rechazar H0
son, según las tablas, ± 2,10110. Esto nos permite representar gráficamente
—figura 9.2—, en forma aproximada, sobre una curva, la zona conforme H0
y las zonas conforme a H1 o de rechazo de la hipótesis de nulidad (H0). Si el
valor empírico que obtengamos en la ecuación 9.2 queda dentro de la pri-
mera de ellas, no rechazaremos H0; si queda en cualquiera de las otras dos,
por tratarse de hipótesis bilateral, rechazaremos H0 y aceptaremos H1 —exis-
ten diferencias en salto de altura según el sistema A o B de entrenamiento—
admitiendo, eso sí, un riesgo de que tal decisión sea errónea cuyo valor
podremos calcular, pero que nunca será superior a 0,05 (valor α decidido
por el investigador), valor que será la probabilidad de lo que se conoce como
error tipo I. Si el valor empírico obtenido en la ecuación 9.2 quedara en cual-
quiera de las zonas de no azar afirmaremos que la diferencia entre las medias
aritméticas es significativa al nivel de confianza del 95% o, en términos de
probabilidad, de 0,95 (1 - α, o sea, 1 - 0,05) esto es, estimaremos que la dife-
rencia entre ambas es real y no meramente casual o debida al azar.

Figura 9.2. Zonas de la curva normal conforme a H0 y H1 en una hipótesis bilateral.

Resolución
Con los cálculos de la tabla 9.1 como base, los datos para calcular t son
los siguientes (Cuadro 9.1)11:

10
Este valor se obtiene entrando en la tabla de t por la columna encabezada por 0,05 bajo la rúbri-
ca de hip6tesis bilateral o de dos colas, y por la fila de 18 g.1.
11
El cálculo de la media y de la desviación típica se ha llevado a cabo mediantes las siguientes
fómulas:
n

∑ X1
∑x 2

X= i=1
; s=
n n −1

299
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Cuadro 9.1. Resumen de los principales estadísticos a partir


de los datos de la tabla 9.1

VALORES
GRUPOS ––
n ∑X ∑ X2 X s
A 10 1.588 1.269,6 158,8 11,88
B 10 1.627 1.008,1 162,7 10,58

Tabla 9.1. Centímetros saltados por dos muestras, A y B, de sujetos.


Principales cálculos
XA XB xA xA2 xB xB2
174 168 15,2 231,04 5,3 28,09
172 153 13,2 174,24 -9,7 94,09
169 161 10,2 104,04 -1,7 2,89
164 176 5,2 27,04 13,3 176,89
163 149 4,2 17,64 -13,7 187,69
159 175 0,2 0,04 12,3 151,29
154 163 -4,8 23,04 0,3 0,09
149 172 -9,8 96,04 9,3 86,49
146 164 -12,8 163,84 1,3 1,69
138 146 -20,8 432,64 -16,7 278,89
∑ 1.588 1.627 1.269,60 1.008,10

158, 8 − 162, 7 3, 9
Por tanto12: t = = = 0, 78
5, 03
( 9 × 11, 88 2 + 9 × 10, 58 2
10 + 10 − 2 )( 1 1
+
10 10 )
12
Esta fórmula puede encontrarse en algunos textos como
XA − XB
t=
1 1
( sc A + sc B
nA + nB − 2 )( +
nA nB )
n 2

n (∑ X )
i=1
1
2
donde SC = suma de cuadrados = ∑X 1
− y que es equivalente en sus resultados.
1=i n1

300
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

a) Interpretación
El valor empírico encontrado, t = 0,78, queda claramente dentro de la
zona de azar, esto es, conforme a H0 o a la explicación de las diferencias
empíricas como debidas a los errores aleatorios de muestreo. Se piensa que
tales diferencias no son significativas y que bien podría ocurrir que en nue-
vos experimentos las diferencias se invirtieran como fruto del azar, siendo
en realidad nulas. Por eso, y sin atrevernos a afirmar que las diferencias no
son reales13 las consideramos como si no lo fueran por ser demasiado ele-
vada de probabilidad de que sean casuales.
Una forma complementaria de proceder consistiría en calcular el inter-
valo confidencial alrededor de la diferencia empírica encontrada. Si en tal
intervalo apareciera el valor 0 (cero) —diferencia nula— como uno de los
posibles, tendríamos que admitir que nuestra diferencia empírica es com-
patible con que, para toda la población —que es el campo de referencia
que interesa al investigador— la diferencia fuera cero o nula, por lo que no
la tomaríamos en consideración. Y es que el investigador, a la hora de pro-
bar sus hipótesis, se comporta en forma conservadora, se protege contra
decisiones apresuradas dando un gran margen de probabilidades al azar14,
no decidiéndose a dar valor real, a considerar significativas, sino a aque-
llas diferencias en que la explicación por efecto del azar resulte muy poco
plausible15.
Como sabemos, tal estimación del intervalo confidencial consiste en
crear, alrededor del valor empírico, en este caso la diferencia de medidas
aritméticas = 158,88 - 162,7- un intervalo que incluya el 95 % de los valo-
res centrales alrededor del mismo16. En realidad deseamos apartarnos del
parámetro —diferencia para toda la población— tantas unidades de des-

13
Este es un hecho importante: no rechazar H0 no significa decir que no existen diferencias sino
que las que se encuentran pueden explicarse por azar; en tal caso el investigador, cauteloso, actúa como
si no existiesen, pues hay una clara hipótesis rival. La prueba de ello es que admite que en su decisión
de no rechazar H0 se puede equivocar, cometiendo ahora lo que se conoce como error tipo II.
14
«Hacemos una compleja apuesta con las probabilidades en contra nuestra», afirma Kerlinger; vid.
o. c., p. 159.
15
¿Sería plausible admitir que el azar es el único motivo por el que al sujeto x le toque la lotería en
4 sorteos de cada 5? Sin embargo, en la realidad, aunque las probabilidades de una explicación pura-
mente casual o de azar son muy escasas, el hecho en cuestión no es imposible, por lo que aceptar que
en él hay algo más que azar siempre comporta un riesgo, por reducidísimo que sea.
16
95% porque aquí trabajamos a ese nivel de confianza.

301
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

viación —tantos errores típicos— como sea necesario para incluir dicho
porcentaje de casos, esto es: µA - µB ± t x σ X––A – X––B, donde σ X––A – X––B es el error
típico de las diferencias de medias de los grupos A y B17.
Como en nuestra situación no conocemos el citado parámetro (diferen-
cia de medias aritméticas: (µA - µB) nos conformamos con su estimador la
diferencia de medias aritméticas empíricas; el número de unidades de des-
viación o errores típicos que debemos apartarnos ya lo sabemos —lo obtu-
vimos consultando las tablas de t— siendo 2,101 por encima y por debajo
del parámetro; y el del error típico de la diferencia de medias (σ X––A – X––B) ya
está calculado, siendo el denominador de t en la ecuación 9.2. Por tanto18,

3,9 + 10,57 = 14 47
|158,8 -162,71| ± 2,101 x 5,03 =
3,9 – 10,57 = - 6,67

Este resultado lo podemos observar en la figura 9.3; como se puede


apreciar, incluye en el intervalo la posibilidad, elevada por lo demás, de
diferencias nulas en la población; como consecuencia, no podemos recha-
zar H0 pues, si lo hiciéramos, correríamos un alto riesgo de decisión erró-
nea, muy superior al inicialmente aceptado que, como sabemos era un
máximo de 0.05.

Figura 9.3. Intervalo confidencial alrededor de α un nivel de confianza del 95%.


Situación del cero o diferencias nulas.

17
Para ser más exactos deberíamos precisar el valor de t, que será: t α/2 (nA + nB - 2) y t1 – α/2, (nA + nn
que debe leerse: t para un nivel de significación α/2 (en nuestro caso 0,05/2) y (nA + nB - 2) g.l., en
- 2)
nuestro caso 18 g.l.; y t para 1 - α/2 (en nuestro caso, l - 0,05/2 = 0,975) y18 g.1.
Como la distribución de t es simétrica ambos valores son iguales en valor absoluto: ± 2,101.
18
Recuerde que |158,8 -162,71| representa que tomamos la diferencia de medias en valor
absoluto.

302
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

El valor cero como una de las infinitas diferencias posibles en la distri-


bución muestral queda claramente dentro del intervalo de los posibles valo-
res que, para nuestro nivel de confianza —n.c.— son esperables por azar.
Por ello no se rechaza H0.
El producto de los valores de t y del error típico de las diferencias de
medias (2,101 x 5,03) se conoce como error muestral máximo, y debe ser
interpretado en este caso como que se da una probabilidad de 0,95 de que
la diferencia empírica de medias se halle a menos de 10,57 unidades de la
diferencia verdadera o diferencia para toda la población.
Consecuentemente, si se suma algebraicamente 10,57 puntos a cualquier
diferencia de medias aritméticas obtenidas a partir de pares de muestras
extraídas al azar de una misma población, en el 95% de los casos —p = 0,95—
el intervalo confidencial así construido captará la verdadera diferencia de
medias o parámetro19. En concreto, si nuestro valor empírico de diferencias
no es uno de esos 5 de cada 100 que se apartan del parámetro en más de 10,57
unidades, incluirá entre los límites de su intervalo confidencial al parámetro
o diferencia verdadera y, como uno de los posibles valores, según hemos
visto, es cero, estaría bien tomada la decisión de no rechazar H0. Tan sólo
habríamos tomado erróneamente nuestra decisión si nuestra diferencia
empírica fuera una de esas cinco de cada cien que se apartan del parámetro
en más de 10,57 puntos. Pero esto no lo sabemos, razón por la que admiti-
mos que nuestra decisión comporta un riesgo de error.
b) Ejemplo segundo.
La situación anterior puede valernos para un segundo ejemplo con algunas
pequeñas modificaciones a fin de practicar en las tablas: se referirán al tipo de
hipótesis, al nivel de significación y al número de casos. Haremos una modifica-
ción, asimismo, que nos obligue a utilizar como contraste otra de las ecuaciones.
Supongamos que el mencionado profesor lo es de dos colegios de la
misma capital a los que asisten alumnos de la misma extracción social; que
ha seleccionado 15 casos al azar de cada colegio, representativos de los cita-
dos cursos y que, desconociendo los valores de σA y σB, supone que son dife-

19
Conviene precisar que nuestra exposición se está refiriendo al muestreo aleatorio simple, que no
es exactamente nuestro caso, sino una situación más realista ya que aquél obligaría a reformar los gru-
pos de clase. No obstante entendemos que, para nuestros propósitos, puede ser válido el razonamiento.

303
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

rentes basándose en observaciones previas; en efecto, ha podido comprobar


que en uno de los colegios los muchachos tienen niveles de salto medios y
muy homogéneos, mientras en el otro se da una mayor dispersión: chicos que
saltan mucho frente a otros que alcanzan valores muy bajos. Por otra parte,
y en función de las razones que leyó en la revista especializada, piensa que el
sistema nuevo, el B, debe dar resultados superiores al suyo, deseando con-
trastar su hipótesis con un nivel de significación más exigente: α = 0,01.
Los resultados son los siguientes:
Grupo A: 176, 174, 172, 170, 169, 167, 164, 163, 159, 157, 154, 149, 146, 142, 138.
Grupo B: 165, 166, 153, 168, 172, 164, 159, 163, 166, 168, 156, 172, 170, 166, 165.
Análisis del caso
Como vemos, ahora estamos ante:
a) Una hipótesis unilateral: Diferencias a favor del grupo B. Por tanto:
H0 : µA = µB , o µA - µB = 0; H1: µA < µB , o µA - µB < 0
b) Nivel de confianza del 99 % (p = 0,99) como consecuencia del nivel
de significación α = 0,01.
c) Desconocidas σA y σB de la población, aunque supuestas diferentes y
con nA y nB pequeñas.
Los demás aspectos no han variado con respecto al ejemplo primero,
por lo que seguimos pensando en una prueba paramétrica. En concreto, el
estadístico de contraste es la ecuación 9.3, esto es:

XA − XB
t=
s 2A s 2B
+
nA nB

que sigue la distribución de t con los grados de libertad obtenidos a par-


tir de la ecuación 4, que recordamos a continuación:
2
(s 2
A
/ n A + s 2B / n B ) −2
2 2
( s 2A / n A ) +( s 2B / n B )
nA + 1 nB + 1

304
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Resolución
Los cálculos de la tabla 9.2 nos permiten obtener los datos para resolver
la ecuación 9.3, que figuran en el cuadro 9.2:

Cuadro 9.2. Resumen y principales estadísticos a partir de la tabla 2

Valores
Grupos ––
n ∑X ∑x2 X s
A 15 2.400 2.022 160 12,02
B 15 2.473 409,73 164,87 5,41

Por lo tanto:
164, 87 − 160 4, 87
t= = = 1, 43
5, 412 12, 022 3, 40
+
15 15

Tabla 9.2. Centímetros saltados por dos muestras de sujetos, A y B,


de 15 sujetos cada una. Principales cálculos

XA XB xA xA2 xB xB2
176 165 16 256 0,13 0,02
174 166 14 196 1,13 1,28
172 153 12 144 -11,87 140,90
170 168 10 100 3,13 9,80
169 172 9 81 7,13 50,84
167 164 7 49 -0,87 0,76
164 159 4 16 -5,87 34,46
163 163 3 9 1,87 3,50
159 166 -1 1 1,13 1,28
157 168 -3 9 3,13 9,80
154 156 -6 36 -8,87 78,68
149 172 -11 121 7,13 50,84
146 170 -14 196 5,13 26,32
142 166 -18 324 1,13 1,28
138 165 -22 484 0,13 0,02
∑ 2.400 2.473 2.022 409,73

305
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Interpretación
Para decidir si la diferencia empírica —4,87 cm— es lo suficientemente
elevada como para no achacarla al azar debemos encontrar el valor crítico
de t, pero, en este caso, como paso previo, debemos determinar los g.l.
correspondientes:
2

g.l. =
(12,02 2
/ 15+ 5,412 / 15) - 2 = 20,30
2 2
(
12,022 / 15 ) +( 5,412 / 15 )
16 16
Buscaremos, pues, t con 20 g.l. (valor del entero más próximo) y para α
= 0,01 en hipótesis unilateral. El valor critico es, pues, 2,528, muy superior
a 1,43, razón por la cual no podemos rechazar H0. Lo mismo puede ser
apreciado en la figura 9.4:

Figura 9.4. Zonas conforme a H0 y H1 y Figura 9.5. Intervalo confidencial alrededor


–– ––
situación del valor empírico de t. de XA – XB. Situación de las diferencias nulas.

A idéntica conclusión llegaríamos si estableciéramos el intervalo confi-


–– ––
dencial sobre el valor XA – XB = 164,87 - 160:
13,47
4,87 ± 2,528 x 3,40 = 4,87 ± 8,60 =
-3,73
Ya sabemos que el producto t x (σX––A – X––B) recibe el nombre de error mues-
tral máximo, cuyo valor en nuestro caso es 8,60. Pues bien, los cálculos
anteriores nos permiten:
a) Comprender que no podemos rechazar H0 porque hay una elevada
probabilidad —ver figura 9.5— de que la diferencia de medias para
toda la población sea nula, dado que, para nuestro nivel de confianza
(99% o p = 0,99) las puntuaciones extremas entre las que pueden
encontrarse tales diferencias en la población van de -3,73 a 13,47.

306
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

b) Afirmar que se da una probabilidad de 0,99 de que la diferencia empí-


rica de medias aritméticas se halle a menos de 8,60 puntos de la dife-
rencia verdadera. En concreto, si se suma y se resta —suma alge-
braica— 8,60 puntos a cualquier diferencia de medias calculadas
sobre la base de muestras extraídas al azar de una misma población,
en el 99 % de los casos el intervalo confidencial así construido capta-
rá la diferencia verdadera de medias o parámetro.
c) Ejemplo tercero.
En un estudio sobre la capacidad de atención realizado en un colegio a
principio de curso se ha podido establecer para todos los sujetos del segun-
do ciclo de Primaria los valores de posición y variabilidad del mismo.
Tales valores se refieren al número de fallos en un test de tachado de
símbolos, y se obtuvieron para sujetos del sexo masculino —grupo A— y
para los del femenino —grupo B— siendo los siguientes:

Cuadro 9.3. Datos de la primera aplicación


ESTADISTICOS n µ s
GRUPO A 126 23 7,9
GRUPO B 134 27 8,4

Tabla 9.3. Número de errores en una prueba de tachado, cometidos


por dos muestras de 15 sujetos cada una

28 – 27 – 25 – 24 – 23 – 20 – 18 – 15 – 13 – 12 – 12 – 10 – 10 – 9 – 9
XA
∑X A = 255

30 – 28 – 28 – 26 – 26 – 24 – 20 – 18 – 15 – 13 – 12 – 12 – 10 – 10 – 8
XB
∑X n = 280

Uno de los profesores, que está realizando su memoria de licenciatura,


desea probar la hipótesis de que se dan diferencias en función del sexo en
la capacidad de atención tras la práctica, entendida ésta como la repetición
de una misma prueba. Para comprobarla toma dos muestras al azar, una de
niños y otra de niñas, representativos de ese segundo ciclo, a los que aplica
de nuevo la prueba 30 días después. Desea poner a prueba su hipótesis a un

307
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

nivel de confianza del 95 %, y parte para ello del supuesto de que se cum-
plen las exigencias de las pruebas paramétricas.
Análisis del caso
a) Se trata de sujetos seleccionados al azar.
b) Hipótesis: Bilateral, pues no predice el sentido de las diferencias, esto
es, a favor de qué sexo se darán. Por tanto: H0 : µA = µB ; H1 : µA -
µB ≠0, o µA ≠ µB
c) Prueba paramétrica: Se cumplen los supuestos y la medición bien
puede considerarse próxima a intervalos.
d) Se conocen las desviaciones típicas de la población pues se examinó
a todo el colegio.
En consecuencia se utilizará como estadístico de contraste la ecuación
9.1 distribuido normalmente.
20

XA - XB
z=
σ 2A σ 2B
+
nA nB

Como estamos ante hipótesis bilateral y α = 0,05 los valores críticos a


partir de los cuales tomaremos la decisión de rechazar H0 son, según las
tablas, ± 1,96 (véase la figura 9.6).
Resolución
Sobre la base de la tabla 9.3 y de los cálculos allí presentados, así como
los del cuadro 9.3, podemos resolver tal ecuación a partir de los recogidos
en el cuadro 9.4:

Cuadro 9.4. Resumen y principales estadísticos a partir de la tabla 9.3


Valores
Grupos ––
n ∑X X
A 15 255 17
B 15 280 18,67

20
Fíjese el lector en que, con respecto a 9.3, aquí no aparece el símbolo sA y sB propios de las mues-
tras, sino σA y σB porque se conocen los parámetros.

308
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Por lo tanto:

17 -18,67 1,67
t= = = 0,56
2
7,9 8,4 2 2,98
+
15 15

Con lo que no podemos aceptar la hipótesis de diferencias en función


del sexo, dado que 0,56 < 1,96, hecho que puede apreciarse en la figura 9.6.

Figura 9.6. Zonas conforme a H0 y H1, Figura 9.7. Intervalo confidencial alrededor
–– ––
y situación del valor empírico de t. de XA – XB y situación del 0.

A idéntica conclusión llegaríamos si calculáramos el intervalo confiden-


cial alrededor de la diferencia empírica de medias aritméticas (figura 9.7).

7,51
1,67 ± 1,96 x 2,98 = 1,67 ± 5,84 =
-4,17
Como puede apreciarse, el valor cero o diferencias nulas es uno de los
posibles dentro de dicho intervalo, teniendo, además, una alta probabilidad
de aparecer como se desprende de la consideración de la figura 9.7 y de su
situación en la misma, muy cercano a la ordenada de la media.
d) Cuarto ejemplo:
Se trata de un investigador que desea probar el influjo del momento psi-
cológico en la realización de las pruebas de atención. Para ello utiliza dos
clases de 4.° de la ESO, formadas por orden alfabético, a las que pasa una
misma prueba de tachado a continuación del recreo. A uno de ellos, el A, se
la pasa un día de lluvia, en que el recreo ha tenido lugar en el aula, consis-
tiendo en juegos de mesa (dominó, parchís...); al otro, el B, se aplicó tras la
realización en dicho recreo del partido final de la liga entre los equipos del
colegio.

309
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Su hipótesis, que desea contrastar con un nivel de confianza del 95 % (α


= 0,05) es que en este segundo grupo se dará un mayor número de errores
que en el primero. Para el análisis estadístico parte de la idea de que los
supuestos de las pruebas paramétricas se cumplen, desconociéndose los
valores de σA y σB, que supone diferentes como consecuencia del influjo
diferencial del fútbol frente al de los juegos de mesa.
Análisis del problema
a) Se trata de sujetos independientes: los grupos se forman por orden
alfabético que permite pensar en una situación aleatoria.
b) Prueba paramétrica, pues parte de que se cumplen tales supuestos.
c) Hipótesis unilateral con α = 0,05. Por tanto: H0: µA = µB ; H1: µA < µB
d) Desconoce σA y σB y supone que son diferentes; los valores de nA y nB
son grandes. Por ello debe utilizar como estadístico de contraste la
ecuación 9.3, cuya distribución es normal:

XA − XB
z=
s 2A s B2
+
nA nB
Resolución
Al distribuirse normalmente, el valor crítico en una hipótesis unilateral
para un valor de α = 0,05, es el de -1,645; valores negativos (se trata de hipó-
tesis unilateral) iguales o superiores a - 1,645 permiten en rechazo de H0. En
–– ––
realidad el valor crítico puede ser + 1,645, si comparamos XB – XA —ya que
la hipótesis es que el grupo B tendrá mayor número de errores que el A.
Obsérvense estos puntos en las figuras 9.8 y 9.9:

Figura 9.8: se compara Figura 9.9: se compara

Sobre la base de los cálculos de la tabla 9.4 se calculan los estadísticos


que aparecen en el cuadro 9.5, que permite determinar el valor de t.

310
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Cuadro 9.5. Resumen y principales estadísticos, a partir


de los datos de la tabla 9.4

Valores
Grupos ––
n ∑X ∑x2 X s
A 33 309 701,64 9,36 4,61
B 33 394 671,85 11,94 4,51

9, 36 − 11, 94 −2, 58
t= = = −2, 30
2
4, 61 4, 51 2 1,12
+
33 33

Tabla 9.4. Número de errores, en una prueba de tachado, cometidos


por dos muestras de 33 sujetos. Cálculos básicos

XA XB xA xA2 xB xB2
20 23 10,64 113,21 11,06 122,32
19 20 9,64 92,93 8,06 64,96
17 16 7,64 58,37 4,06 16,48
15 19 5,64 31,81 7,06 49,84
15 18 5,64 31,81 7,06 36,72
14 18 4,64 21,53 6,06 36,72
12 17 2,64 6,97 5,06 25,60
12 15 2,64 6,97 3,06 9,36
12 14 2,64 6,97 2,06 4,24
12 14 2,64 6,97 2,06 4,24
11 13 1,64 2,69 1,06 1,12
11 12 1,64 2,69 0,06 0,0036
11 12 1,64 2,69 0,06 0,0036
10 12 0,64 0,41 0,06 0,0036
10 10 0,64 0,41 -1,94 3,76
10 13 0,64 0,41 1,06 1,12
10 12 0,64 0,41 0,06 0,0036
9 12 -0,36 0,13 0,06 0,0036
9 10 -0,36 0,13 -1,94 3,76
8 10 -1,36 1,85 -1,94 3,76
8 8 -1,36 1,85 -3,94 15,52

311
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

XA XB xA xA2 xB xB2
7 11 -2,36 5,57 -0,94 0,88
7 12 -2,36 5,57 0,06 0,0036
6 13 -3,36 11,29 1,06 1,12
5 6 -4,36 19,01 -5,94 35,28
5 9 -4,36 19,01 -2,94 8,64
4 9 -5,36 28,73 -2,94 8,64
4 8 -5,36 28,73 -3,94 15,52
4 6 -5,36 28,73 -5,9 35,28
4 6 -5,36 28,73 -5,94 35,28
3 6 -6,36 40,45 -5,94 35,28
3 5 -6,36 40,45 -6,94 48,16
2 5 -7,36 54,17 -6,94 48,16

Interpretación.
Dado que el valor -2,30 representa una separación de la diferencia de
medias mayor de -1,645 podemos rechazar H0, admitiendo un riesgo de
cometer el error tipo I con probabilidad de 0,0521 como máximo:
Una vez más podemos llegar a los mismos resultados si calculamos el
intervalo confidencial:
-0,74
(9,36 - 11,94) ± 1,645 x 1,12 = - 2,58 ± 1 84 =
-4,42
En él se aprecia que el valor cero o de diferencias nulas no aparece entre
los posibles alrededor de la diferencia empírica encontrada. Tal como
hemos visto en otros casos, existe una probabilidad de 0,95 de que las dife-
rencias empíricas no se alejen de la diferencia verdadera para la población
más allá de 1,84 puntos, por lo que, en 95 casos de cada 100, el intervalo
construido alrededor de diferencias de medias calculadas en pares de mues-

21
En realidad, y mirando a las tablas, para nuestro caso concreto, ese riesgo queda reducido a
0,0107, notoriamente inferior al que estábamos dispuestos a aceptar de 0,05.

312
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

tras extraídas al azar de una misma población, contendrá al parámetro o


diferencia verdadera.
Pues bien, como vemos, nuestra decisión de rechazar H0 solo estaría equi-
vocada si nuestra diferencia, obtenida de la pareja concreta de medias, fuera
una de esas cinco que se apartan del parámetro en más de 1,84 puntos.

2.2.3. El análisis de la varianza como alternativa

Sin pretender entrar en el tema sino del modo más sencillo, vamos a
presentar aquí la prueba F y su más elemental justificación.
En efecto, el análisis de la varianza —en adelante ANAVA22— , en dise-
ños de dos grupos no es sino una alternativa a la prueba t; se trata de una
prueba de idéntica potencia, cuya relación con t es sencilla: puede compro-
barse que, en los casos de un g.l. —diseños de dos grupos, t = F o, lógica-
mente, t2 = F—.
En los diseños de dos grupos el ANAVA o prueba F no añade nada
nuevo; sin embargo, en el caso de tres o más grupos para una misma varia-
ble independiente, F no tiene alternativa paramétrica, debiéndose proceder
a comprobar si F es o no significativa, y en caso positivo, pasar a compara-
ciones entre pares de medias aritméticas23; en tales diseños F nos indica, de
una sola vez, si entre todos los grupos se dan diferencias significativas, sin
indicar, eso sí, dónde se encuentran.
Centrándonos en nuestro caso, nos interesa explicar los planteamientos
básicos de la prueba F. La idea fundamental consiste en que la variabilidad
de las puntuaciones de los sujetos en la variable dependiente —v.d.— puede
descomponerse —analizarse— en partes que, juntas, constituyen la varia-
bilidad total, en nuestro caso la varianza total.
El análisis más elemental de tal variabilidad consiste en separar aque-
lla que es debida al efecto diferencial de de la v.i —tratamiento o condi-

22
En muchos libros podemos leer ANOVA, por analysis of variance.
23
Kerlinger, prefiere en vez de estas pruebas las comparaciones planeadas, aunque reconoce que
aquellas pueden ser importantes «para explorar datos propios y para obtener indicios sobre futura inves-
tigación» (p. 244), Vid. al respecto: ARNAU, J. (1981). Diseños experimentales en psicología y educación.
México: Trillas, pp. 88-95.

313
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

ciones— y aquella otra que está al margen de la misma, de la cual una


parte sustancial se conoce como diferencias individuales. A la primera de
las variabilidades, expresadas como varianza, se la conoce como varianza
experimental, mientras a la segunda se la denomina varianza de error. El
cálculo de la varianza experimental se lleva a cabo comparando los grupos:
la variabilidad de un grupo frente al otro —varianza entre grupos— se
entiende que incluye ambas fuentes de variación, esto es, la v.i. y las dife-
rencias individuales de los sujetos que los integran; al haberse formado
ambos grupos al azar, la varianza entre grupos debe ser aproximadamen-
te igual a la varianza dentro de los grupos antes de la aplicación del trata-
miento, mientras que si v.i. ha sido eficaz, debe producir un efecto dife-
rencial sobre tales grupos, de forma que uno de ellos aumente o
disminuya sus puntuaciones con respecto al otro, con lo que ahora la
varianza entre grupos o experimental habrá aumentado con respecto a la
varianza dentro de los grupos. En el primer caso el valor de F, cociente
entre ambas varianzas, será 1 o próximo a 1; en el segundo se elevará
tanto más cuanto más fuerte sea el efecto de v.i.
La segunda variabilidad, varianza de error, se estima como la variabili-
dad dentro de los grupos —varianza dentro de los grupos— por entender que
tales varianzas, al referirse a cada grupo por separado, no contienen efecto
alguno de la v.i, dado que todos sus miembros han recibido la misma
modalidad, nivel o tratamiento, debiéndose únicamente a factores aleato-
rios y a los errores de medida. Pues bien, esta varianza dentro de los grupos
no se altera como consecuencia del efecto de v.i, como veremos a conti-
nuación, con lo que prácticamente será igual antes que después del trata-
miento, cosa que no ocurre con la varianza entre grupos, como hemos visto
si v.i. fue eficaz24.
Inicialmente, pues, ambas varianzas, como se puede demostrar25,
son estimaciones de la varianza de la población, por lo que estadística-
mente deben ser iguales; si tras la aplicación de v.i la varianza experi-

24
Esta afirmación, y el ejemplo que pondremos, ilustrarán una situación «pura»; por ejemplo en
que, tras la formación de los grupos al azar, se aplicase una v.i de efectos inmediatos, medidos en ese
mismo momento; naturalmente cuando desde la formación de los grupos hasta la medición de v.d. pasa
un tiempo suficientemente amplio, pueden darse cambios en las diferencias individuales, cambios que
se integran en la varianza de error; si el diseño es bueno, esos cambios naturalmente afectarán por igual
a ambos grupos.
25
Vid. GLASS, G. V. y otro, o. c., cap. 15.

314
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

mental —varianza entre grupos— se ha elevado sustancialmente sobre la


otra, este hecho se toma como manifestación de que v.i ha sido eficaz, ha
dado lugar a cambios, ha producido efectos.
Se planteará ahora el problema de cuánto mayor debe ser la varianza
entre grupos que la varianza dentro de los grupos para conceder a tales
hechos el carácter de diferencias significativas entre las medias de ambos
grupos; el problema se resuelve como en el caso de t: si el mencionado
cociente entre varianzas, comparado con el correspondiente valor crítico
de las tablas, es igual o mayor que él —un cociente entre varianzas supe-
rior o igual al valor crítico de las tablas— la probabilidad de que tal hecho
se deba al azar es demasiado pequeña para considerarla como algo razo-
nable, por lo que el investigador decide rechazar H0 y tomar en conside-
ración su hipótesis —H1—; naturalmente esta decisión implica, además
de aceptar el riesgo de error tipo I, valorado como α, admitir, y esto ya no
es cuestión estadística sino de calidad del diseño, que las demás variables
independientes están controladas, esto es, que no han actuado como
variables extrañas.
Tal cociente indica, si es significativo, que ahora las dos varianzas
—entre grupos y dentro de los grupos— ya no son estimaciones de la
misma varianza de la población, sino de dos poblaciones diferentes, aque-
lla que recibió el tratamiento y aquella otra que no lo recibió —grupos
experimental y de control— o bien, aquellas que recibieron las dos moda-
lidades, A y B, de v.i.
Veamos estos hechos con un sencillo ejemplo, para el que debemos
comenzar por hacer ciertas precisiones. Para empezar es necesario indicar
que, dada la varianza total —s2t— de un conjunto de puntuaciones, ésta
puede ser descompuesta en por lo menos, como hemos señalado, dos
varianzas, la experimental o entre grupos —s2E— y la de error o dentro de los
grupos —s2D — esto es, como veremos en el ejemplo:
s2t = s2E + s2D
Sin embargo, esta relación, que se cumple cuando las varianzas son
calculadas como sabemos desde primer curso s2 = ∑x2 / n no es cierta
cuando se obtienen del modo en que se calculan en el ANAVA, en el que
el denominador no es n —número de casos de la muestra— sino (n – l) o
grados de libertad de que se trate en cada caso; la razón fundamental de

315
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

este cambio está en que, con este procedimiento, las varianzas son esti-
maciones imparciales del parámetro, tal como hemos indicado antes,
mas no si dividimos por n.
La otra precisión es que si bien las varianzas que calculamos no son
necesariamente aditivas, sí lo son las sumas de cuadrados —numeradores
que se utilizan como paso previo para la determinación de las diferentes
varianzas—.
Tras estas precisiones vayamos al ejemplo.
Ejemplo quinto:
Un investigador desea comprobar si el tipo de personalidad tiene influ-
jo en el número de intentos que llevan a cabo los sujetos para resolver deter-
minado test. Su hipótesis la concreta en que la personalidad tipo A debe dar
lugar a un número superior de intentos a los originados con el tipo B, como
consecuencia de que entre las características que definen ambos tipos se da
la tendencia a responder de inmediato (tipo A) o a considerar con mayor
reflexión las diferentes alternativas (tipo B).
Por ello, tras haber aplicado varios tests de personalidad para poder
seleccionar con cierta seguridad sujetos de uno y otro tipo, toma al azar 12
sujetos de tipo A y 14 del tipo B a los que aplica el referido test: En cada
caso la medición de v.d. consiste en anotar el número de intentos que ha
necesitado para resolver correctamente toda la prueba. Considera que se
dan los supuestos exigidos por las pruebas paramétricas, incluido el nivel
de medición. Desea probar su hipótesis con un nivel α = 0,01.
Los valores medidos sobre v.d. aparecen, con los oportunos cálculos, en
la tabla 9.6.
Análisis del caso
a) Se trata de sujetos seleccionados al azar26.
b) Se puede aplicar una prueba paramétrica,
c) La hipótesis es unilateral. Por tanto, H0: µA = µB; H1: µA > µB;
En consecuencia puede utilizar t o F. Elegimos F.

26
Recuerde el lector la diferencia entre variables activas y atributivas, y sus consecuencias.

316
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Resolución
Los datos y los principales cálculos aparecen en la tabla 9.5, origen del
cuadro 9.6 en que aparecen los valores de los principales estadísticos.

Tabla 9.5. Número de intentos en la resolución de un test por dos


grupos, uno de 12 sujetos y otro de 14

XA XB xA2 xB2

38 33 1.444 1.089

36 32 1.296 1.021

32 31 1.024 961

30 30 900 900

29 30 841 900

29 26 841 676

28 26 784 676

27 25 729 625

27 23 729 529

25 22 625 484

22 22 484 484

19 20 361 400

– 18 321

– 16 256

Cuadro 9.6. Principales estadísticos calculados a partir de los datos


de la tabla 9.5. Valores de s calculados con el denominador n-1

Estadísticas
Grupos ––
n ∑X ∑X2 (∑X)2 X s

A 12 342 10.058 116964 28,50 5,32

B 14 354 9.328 125.316 25,29 5,38

Total 26 696 19.386 484.416 26,77 5,49

317
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Pasemos, con estos datos, a calcular las Sumas de Cuadrados, total


(SCT), entre grupos (SCE) y dentro de los grupos (SCD)

N 2

N (∑ X ) 1

S.C.T = ∑ X - 2 i=1
1
i=1 N
N 2

(∑ X )
i=1
1

Al término N se le denomina término de corrección —C— y su efec-


to es reducir las puntuaciones brutas, con las que trabajamos, a puntuacio-
nes de desviación con que nos veníamos moviendo en el cálculo de la
varianza hasta ahora; tras esta corrección SC = ∑x2.
La expresión anterior debemos leerla así: sumemos todas las puntua-
ciones elevadas al cuadrado; la referencia a todas viene dado por las anota-
N

ciones del símbolo de sumar: desde la 1ª a la N-ésima; en realidad ∑ se lee: i=1

«suma total de Xi cuando i va desde 1 hasta N». De modo similar en el tér-


mino de corrección. Por lo tanto:

6962
S.C.T =19.386 − =19.386 − 18.631,38 = 754,62.
26

c) Suma de cuadrados entre grupos (SCE):

n 2 N 2

G
S.C.E = ∑
(∑ X )
i=1
1


(∑ X )
i=1
1

i=1 n N
G


El primer término debe leerse como sigue: suma total del término que i=1

le sigue cuando i = 1 hasta G (número de grupos que, en nuestro caso, es


2). Por tanto, lo que va antes del término de corrección es una suma de dos
sumandos. N 2

En cuanto a ( i=1 ) es todo igual que el numerador en C salvo que aquí


∑X 1

la suma va del sujeto 1 a n-ésimo de cada grupo. Por tanto:

S.C.E = (3422 3542 6962


12
+
14

26 )
= 9.747 + 8.951,14 − 18.631, 38 = 66, 76

318
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

c) Suma de cuadrado dentro (SCD), cuyos términos ya han sido explica-


dos:
n 2

N G (∑ X ) 1

S.C.D = ∑ X12 − ∑
i=1

i=1 i=1 n

Por tanto: SCD = 19.386 - (9.747 + 8.951,14) = 687,86


A modo de comprobación podremos ver que:
a) SCD = SCT – SCE: = 754,62 - 66,76 = 687,86
b) También, por lo tanto, que SCE + SCD = SCT
Con estos datos podemos pasar al cuadro resumen del ANAVA en el
que volcamos los valores calculados de las SC. El cuadro se completa con
el cálculo de las MC, dividiendo las SC por sus respectivos g.l., con lo que
disponemos de las varianzas (total, entre grupos y dentro de los grupos)
Por último, como ya sabemos, obtenemos el valor de F dividiendo la MCE
—varianza experimental— por la MCD o varianza de error. El resultado
empírico se compara, a fin de atribuirle una probabilidad conforme al
azar o H0 con el valor de las tablas para los g.l. de las MC entre y dentro
de los grupos.
Los g.l. de cada caso son: Para SCT, N - 1, o número total de sujetos
menos uno (12 + 14 - 1 = 25 en nuestro caso); para SCE, = G - 1, o sea, núme-
ro de grupos menos uno (2 - 1 en nuestro caso); para SCD se puede obtener
por sustracción de los dos anteriores o directamente como N - G, esto es,
número total de casos menos número de grupos (26 - 2). Naturalmente, los
g.l. para entre grupos y dentro de los grupos deben sumar los gl. del total.
Veamos el cuadro resumen de ANAVA aludido:

Cuadro 9.7. Cuadro resumen del ANAVA para grupos independientes

Fuente de variación S.C. g.l. M.C. F.


Entre grupos 66,76 1 66,76 2,33
Dentro de los grupos 687,86 24 28,66
Total 754,62 25

319
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Interpretación
Para interpretar este valor debemos encontrar en la correspondiente
tabla de F. el valor crítico a partir del cual rechazar H0 y tomar en conside-
ración H1, con un riesgo de error tipo I máximo de 0,01 (el valor de α deci-
dido por el investigador). Para ello vamos a la tabla con los g.l. de entre gru-
pos y dentro de los grupos, esto es, con 1 y 24; en la intersección de la fila
y de la columna correspondiente leemos el valor 7,82; como 7,82 > 2,33
entendemos que el valor de las diferencias es esperable como fruto de las
oscilaciones del azar, por lo que no podemos rechazar H0 y, en conse-
cuencia, no podemos aceptar H1 (que tales diferencias de personalidad, las
representadas por A y B, influirían en el número de intentos en la solución
del test)27.

3. LA CORRELACIÓN COMO MINIMIZACIÓN DE LA VARIANZA


DE ERROR

Ya sabemos que el diseño es un plan y una estructura, una estrategia


intencionalmente elegida por el investigador para resolver un problema que
le preocupa. La Estadística viene en su ayuda para valorar los resultados de
forma que, de modo objetivo, pueda decidir sobre los mismos. Y en ese
momento, el investigador, que ha venido siguiendo la regla que veíamos
expresar a Bunge como «audacia en el conjeturar», debe, de acuerdo con la
misma, manifestarse prudente y riguroso en la prueba de sus conjeturas,
protegiéndose contra cualquier decisión apresurada; esto es lo que hace al
utilizar el enfoque estadístico que, según Kerlinger28 consiste en no creer en
los resultados empíricos, en considerarlos casuales, mientras no demues-
tren que no lo son; la estrategia seguida consiste, como sabemos, en com-
parar los resultados obtenidos con los que podrían esperarse por azar o ser
explicados por dicho factor.
Pues bien, como consecuencia de esto, el investigador puede inten-
tar dos estrategias, supuesto ya el control de variables extrañas, para
alcanzar su meta de probar H1 frente a H0: una consiste en procurar

27
Compruebe el lector idéntico resultado con la prueba t.
28
KERLINGER, F. N. (1975). Investigación del comportamiento, México: Interamericana, p. 191.

320
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

que los efectos de v.i. sean lo más fuertes posible —maximizar la


varianza experimental, dice Kerlinger— lo que puede conseguir bien
mediante la utilización de valores de v.i. suficientemente diferentes,
bien mediante la selección de valores óptimos, lo que es especialmen-
te útil, como veíamos, cuando la relación entre las variables indepen-
diente y dependiente es curvilínea. Parece claro que no sería una estra-
tegia afortunada probar la eficacia de dos procedimientos de
aprendizaje que difieran en tiempo dedicado a la explicación, si éstos
fueran 15 y 20 minutos respectivamente; o el trabajo para encontrar el
número ideal de palabras nuevas con dificultad ortográfica que pueden
aprenderse por sesión, sí éstas fueran 3 y 4, o si fueran 3 y 25, pues, tal
vez, en el primer caso los resultados no fuesen significativos por la
mínima diferencia entre los niveles de v.i., mientras en el segundo caso
podría llegarse a un resultado similar porque la fatiga no permitiera
aprender tantas palabras .
Pero el problema que nos ocupa es otro. Lo mismo que una balanza
puede no acusar cambios de peso hasta que uno de sus platillos reciba can-
tidades superiores a 3, 4, 10, 20... gramos, según su sensibilidad y precisión,
mientras existen otras capaces de apreciar cambios de centésimas o milési-
mas de gramo y aún más, o que nuestros ojos y, en general, todos nuestros
sentidos, tienen ciertos umbrales mínimos para captar sensaciones, los
diseños pueden captar o no diferencias reales existentes. Dado el procedi-
miento estadístico ya conocido, la otra forma de aumentar la sensibilidad
del diseño consiste en reducir el valor del denominador —minimización de
la varianza de error en terminología de Kerlinger— cuanto sea posible.
Como sabemos, en el denominador se incluye toda variación no debida a la
variable independiente, destacando como fuentes las diferencias individua-
les, a las que tanta importancia se concede en Psicología y Pedagogía, y las
producidas por la imperfección de los instrumentos de medida. Por tanto, la
utilización de instrumentos fiables en grado elevado que reduzcan los erro-
res de medida al mínimo, y el control de la variabilidad —varianza ligada a
ciertas variables— puede reducir el término de error, con lo que, a igual
numerador, los cocientes serán superiores y se elevarán las probabilidades
de rechazo de H0.
El razonamiento es fácilmente comprensible: Si se toma una muestra
aleatoria de 1.000 personas de una población como Barcelona, sin nin-

321
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

guna restricción, allí aparecerán normalmente varones y mujeres, niños,


jóvenes y adultos, personas de todas las clases sociales, de todos los nive-
les de estudios, con rentas económicas de todos tipos, con intereses
variadísimos, etc. Cualquier encuesta o medida sobre sus opiniones, inte-
rés, inteligencia, conocimientos..., deberá arrojar una gran variabilidad o
dispersión alrededor de la medida de tendencia central del grupo; pero
podemos reducir tal variabilidad en la medida en que la muestra se cen-
tre en varones o en mujeres, en determinados niveles de edad, dentro de
una clase social y cierto nivel de estudios y de renta. Si aquellos 1.000
sujetos se hubieran distribuido al azar en dos grupos de 500, qué duda
cabe que el denominador de una prueba z, o la varianza dentro de los
grupos, hubieran sido muy elevados simplemente como consecuencia del
método de selección; por consiguiente, hubiera sido necesaria una v.i.
muy eficaz, capaz de producir unas diferencias lo suficientemente gran-
des como para estar por encima de tal error y cristalizar en diferencias
significativas; por contra, si dichos dos grupos de 500 sujetos, seleccio-
nados asimismo al azar, lo hubieran sido de niñas de 12 a 14 años, de
clase media y estudios de segundo ciclo de ESO, las diferencias indivi-
duales hubieran sido mucho más reducidas y, con una v.i. menos fuerte,
podrían llegar a darse diferencias significativas que no lo hubieran sido
en el caso anterior29.
Pues bien, una forma de reducir el denominador consiste en formar
intencionalmente grupos de tal manera que puedan identificarse parte de
las variaciones individuales; al quedar identificada tal variabilidad puede
restarse, extraerse, de la variación total, reduciéndose así el denominador
de forma que, tal vez, diferencias de otro modo no significativas, puedan
pasar serlo ahora.
La forma a que nos referimos fue considerada ya y consiste en la técnica
de bloqueo, en concreto y para nuestro caso de dos grupos, de empareja-
miento; la formación de parejas permite identificar, y luego extraer, la varia-
bilidad debida al emparejamiento, esto es, a la correlación; como esa variabi-
lidad no es sino una parte de la variabilidad total —varianza total— que no se
altera, al igual que la variabilidad producida por v.i —varianza experimental—,

29
La contrapartida de la mayor homogeneidad de las muestras es una menor generalización de los
resultados, en principio sólo a los grupos representados en las muestras.

322
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

es la varianza de error la que queda reducida, cumpliéndose así el objetivo del


investigador.
Sabiendo, como ya sabe el lector, que las varianzas —medida de varia-
bilidad— son aditivas, la división más elemental que podemos hacer de la
varianza total —análisis de la varianza— es la de dos partes: la experimen-
tal que, si se da control, es explicada por v.i., y la de error, a la que estamos
aludiendo. Pero dentro de ésta, podemos explicar una parte de la misma
como fruto del emparejamiento —correlación—, con lo que la varianza de
error queda reducida.
Vamos a ejemplificar este hecho utilizando como datos de referencia los
del primer ejemplo resuelto —tabla 9.1— aquí mediante análisis de la
varianza; presentamos los datos tal como lo hicimos allí pero, además,
como si tales sujetos hubieran sido emparejados con arreglo a una variable
de emparejamiento muy eficaz —en realidad r = 0,97. Fíjese en que las pun-
tuaciones directas, XA y XB son las mismas en ambos casos; lo único que
cambia es que en la tabla 9.7 se altera el orden de XB, respondiendo al
emparejamiento.

Tabla 9.6. Centímetros saltados por dos grupos de sujetos


y cálculos básicos para el ANAVA

XA XA2 XB XB2 (XA + XB)2 /2

174 30.276 168 28.224 58.482

172 29.584 153 23.409 52.812,5

169 28.561 161 25.921 54.450

164 26.896 176 30.976 57.800

163 26.569 149 22.201 48.672

159 25.281 175 30.625 55.778

154 23.716 163 26.569 50.244,5

149 22.201 172 29.584 51.520,5

146 21.316 164 26.896 48.050

138 19.044 146 21.316 40.328

∑ 1.588 253.444 1.627 265.721 518.137,5

323
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 9.7. Centímetros saltados por dos grupos de sujetos


emparejados y cálculos básicos para el ANAVA

XA XA2 XB XB2 (XA + XB)2 /2


174 30.276 175 30.625 60.900,5
172 29.584 176 30.976 60.552
169 28.561 172 29.584 58.140,5
164 26.896 168 28.224 55.112
163 26.569 163 26.569 53.138
159 25.281 164 26.896 52.164,5
154 23.716 161 25.921 49.612,5
149 22.201 149 22.201 44.402
146 21.316 153 23.409 44.700,5
138 19.044 146 21.316 40.328
1.588 253.444 1.627 265.721 519.050,5

Si ambos ejemplos, los de las tablas 9.6 y 9.7, se resuelven como si se tra-
tara de sujetos independientes, observamos que no hay diferencia alguna en
los resultados de ambas tablas y que las diferencias entre medias, dentro de
cada una, no son significativas; ahora bien, resolviendo ambas como grupos
correlacionados hay diferencias notables entre ambas tablas, diferencias que
se justifican porque los datos de la tabla 9.6 presentan lo que podríamos con-
siderar un emparejamiento no eficaz —compruebe el alumno que rAB =
0,17—, mientras en la tabla 9.7 la correlación, manifestación de la eficacia
del emparejamiento, alcanza el valor de 0,97. El lector no debe preocuparse
por el momento por los cálculos de ANAVA para grupos correlacionados;
fíjese en los resultados, compare ambas tablas y las soluciones. Vuelva sobre
los cálculos cuando haya estudiado el punto 3.2 de este mismo tema.
Veamos.
Resolución como grupos independientes (tabla 9.8):
DATOS DE LA TABLA 1

3.2152
S.C.T = 519.165 − = 2.353, 75
20

324
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

1.5882 1.6262 3.2152


S.C.E = + − = 76, 05
10 10 20

S.C.D = 519.165 – 516.887,30 = 2.277,7


Con estos datos pasamos al cuadro-resumen:

FUENTE DE VARIACIÓN S.C. g.l. M.C. F.


Entre grupos 76,05 1 76,05 0,60
Dentro de los grupos 2.277,7 18 126,54
TOTAL 2.373,75 19

Como F para 1 y 18 g.l., y α = 0,05 es 4,41, que es mayor que 0,60, las
diferencias no son significativas.
Los datos de la tabla 9.6 coinciden con los de la tabla 9.7 para el análi-
sis de la varianza para grupos independientes (fíjese que la única diferencia
se refiere a la última columna de ambas tablas, que no se usa aquí, y sí en
el caso de sujetos correlacionados). Consecuentemente, analizadas ambas
tablas por un ANAVA para grupos independientes, las diferencias entre las
medias de ambos grupos no son significativas; además no se dan diferen-
cias entre los análisis de los resultados de ambas tablas pues, en realidad,
son los mismos datos en diferente orden.
Resolución como grupos correlacionados (tabla 9.8):
DATOS DE LA TABLA 1

3.2152
S.C.T = 519.165 − = 2.353, 75
20

1.5882 1.6272 3.2152


S.C.E.COLUMNAS = + − = 76, 05
10 10 20
2 2 2

S.C.E.FILAS =
(174 + 168) + (172 + 153) + ... +
(138 + 146) −
3.2152
= 1.326, 25
2 2 2 20

S.C.RESIDUAL = 2.353,75 – (76,05 + 1.326,25) = 951,45


Con estos datos pasamos a la tabla resumen del ANAVA:

325
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

FUENTE DE VARIACIÓN S.C. g.l. M.C. F.


Entre filas (emparejamiento) 1.326,25 9 147,36 1,39
Entre columnas (entre grupos) 76,05 1 76,05 0,72
Residual (error) 951,45 9 105,72
TOTAL 2.353,75 19

Y ahora con la tabla 2


DATOS DE LA TABLA 2

3.2152
S.C.T = 519.165 − = 2.353, 75
20
1.5882 1.6272 3.2152
S.C.E.COLUMNAS = + − = 76, 05
10 10 20
2 2 2

S.C.E.FILAS =
(174 + 175) + (172 + 176) + ... +
(138 + 146) −
3.2152
= 2.239, 25
2 2 2 20
S.C.RESIDUAL = 2.353,75 – (76,05 + 2.239,25) = 38,45

Con estos datos pasamos a la tabla resumen del ANAVA:

FUENTE DE VARIACIÓN S.C. g.l. M.C. F.


Entre filas (emparejamiento) 2.239,25 9 248,81 58,24
Entre columnas (entre grupos) 76,05 1 76,05 17,80
Residual (error) 38,45 9 4,27
TOTAL 2.353,75 19

Como podemos apreciar, ahora tenemos dos F, una en que se compara


la MC entre filas y la residual, con 9 y 9 g.l. y otra en que el cociente se da
entre la MC entre columnas (grupos) y el mismo término residual, con 1 y 9
g.l. Los valores teóricos de F para α = 0,05 son:
F(9 y 9) = 3,18
(0.95)

F(1 y 9) = 5,12
(0.95)

Consecuentemente con los datos de la tabla 9.6 ni el emparejamiento ha


sido eficaz, pues 3,18 > 1,39, ni el tratamiento experimental ha dado lugar

326
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

a diferencias significativas: 5,12 > 0,72. Lo primero era de esperar porque,


como ya dijimos, y puede comprobar, rAB = 0,17; lo segundo, sabiendo este
dato, también, porque si para grupos independientes la diferencia no fue
significativa, para grupos correlacionados mediante una variable poco
correlacionada no podría esperarse sino un efecto mínimo.
Pero pasemos a los datos de la tabla 9.7. Aquí las cosas han cambiado
sustancialmente: el emparejamiento ha sido sumamente eficaz pues, como
puede apreciarse, 3,18 < 58,24, en realidad mucho menor; y el tratamiento
experimental ha dado lugar a diferencias significativas, muy significativas
podríamos precisar, ya que el valor empírico de F, 17,80, es muy superior
al valor crítico de 5,12. Si lo primero era de esperar sabiendo que rAB = 0,97,
lo segundo era lógico: ante un emparejamiento casi perfecto la disminución
del término de error tenía que ser sustancial y, consecuentemente, produ-
cirse una notoria elevación de nuestro F empírico.
Una nueva perspectiva de la explicación del hecho la encontramos en
que, mientras en el primer caso apenas hay varianza entre medias de las
filas —la media de las puntuaciones de cada pareja—, en el segundo tal
varianza es muy elevada; por ello, de la varianza total apenas puede sus-
traerse varianza en el primer caso, quedando casi toda la varianza de error,
mientras que en el segundo puede extraerse una elevada varianza entre
medias, reduciéndose sensiblemente la de error.
En efecto, si tomamos la media aritmética total, que en ambos casos es
de 160,75, la varianza entre medias de las filas en el caso de la tabla 9.76 es
de 663,6 mientras en el segundo caso o tabla 9.7 casi se duplica, alcanzan-
do el valor 1.119,1.

4. CORRELACIÓN Y GRADOS DE LIBERTAD

Sin embargo, conviene aclarar de inmediato que no todo son ventajas


en el emparejamiento. Centrándonos únicamente en el aspecto estadístico
es preciso reseñar que la correlación implica pérdida de grados de libertad,
y que esto lleva consigo la elevación de los valores críticos, es decir, la
necesidad de que los valores empíricos de t y F deban ser, desde este punto
de vista, más elevados que en el caso o modalidad al azar si se desea recha-
zar H0.

327
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Este hecho puede apreciarlo fácilmente el lector con sólo mirar las
tablas. En el ejemplo anterior, si se resuelve como si se tratara de sujetos
seleccionados al azar, el valor crítico de F lo hemos buscado con 1 y 18
g.1.mientras en el caso de emparejamiento lo hemos hecho con 1 y 9 (para
el caso de entre columnas, que es el equivalente). Si resolvemos el proble-
ma mediante t, en el caso del azar hubiéramos buscado t para 18 g.1.
(número de casos menos 2), y en el del emparejamiento con 9 g.1. (núme-
ro de parejas menos una). Veamos la comparación de estos valores:

Tabla 9.9. Valores críticos de t y F para valores de α de 0,05 y 0,01

Valores críticos
Prueba Sistema g.l.
0,05 0,01
Azar 18 2,10 2,88
t
Emparejados 9 2,26 3,25
Azar 1 y 18 4,41 8,28
F
Emparejados 1y 9 5,12 10,56

Dos hechos interesa resaltar en especial:


a) Los valores para 9 g.l. son, en ambas pruebas, más elevados que los
de 18 g.l.:
b) Observe cómo en F, para obtener el valor MC se divide la SC por un
número menor —9— en el caso residual que en el error -18.
Lógicamente, al dividir por un número menor en el caso de empareja-
miento, a igual numerador mayor cociente.
Es pues necesario que el efecto de la correlación sea suficientemente
elevado como para compensar estos dos efectos negativos: si la correlación
reduce como hemos visto el término de error, estos dos aumentan la esti-
mación del mismo.

5. LAS PRUEBAS PARAMÉTRICAS PARA MUESTRAS


RELACIONADAS

Disponemos de tres pruebas que, en realidad, son dos: t, z y F. Decimos


que, en realidad, son dos pruebas porque las dos primeras, t y z son una

328
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

misma, siendo su única diferencia el que la primera siga el modelo t y la


segunda el normal. Pero el estadístico de contraste es, en realidad, el mismo
aunque puedan encontrarse diferentes fórmulas en los libros. Como bien
dice McGuigan tal estadístico es, en todos los casos, el siguiente:
XA − XB
t=
2 2
s s s s
A
+ − 2rAB A × B
B
nA nB nA nB

Ecuación 9.5. Cálculo de t para muestras correlacionadas.

Recuerde el lector que esta ecuación ya la vimos excepto en lo que se


refiere al sustraendo del denominador, justamente, el efecto de la correla-
ción, esto es, la cuantía en que se reduce el término de error de la prueba t
como consecuencia de la misma. Eso sí, esta ecuación, en el caso de mues-
tras pequeñas, suele reemplazarse por la 9.6 en que, sin calcular rAB se llega
al mismo valor final.

XA − XB
t=
2
(∑ D)
∑D − n2

n ( n − 1)

Ecuación 9.6. Alternativa a 9.5 en el caso de muestras pequeñas.

Que equivale a:
XA − XB
t=
sd/ n

Ecuación 9.7.b. Cálculo de t para muestras correlacionadas.

D es igual a XA - XB y sd, desviación típica de los valores de D frente a su media:


9.8
2

sd =
(D − X )D

n −1
Ecuación 9.8. Cálculo de sd para muestras correlacionadas.

329
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Con el fin de comprobar estos hechos, vamos a resolver el problema a


que se refiere la tabla 9.8 mediante ambos tipos de ecuaciones, los de mues-
tras grandes y pequeñas (Tabla 9.9):

Tabla 9.9. Centímetros saltados por dos muestras correlacionadas


de sujetos y cálculos básico para t

1 2 3 4 5 6 7 8 9 10 11
––
XA XB xA x2
A xB x 2
B D=(XB–XA) D2 d=D–XD d2 XAXB–AB
174 175 15,2 231,04 12,3 151,29 1 1 -2,9 8,41 30.450
172 176 13,2 174,24 13,3 176,89 4 16 0,1 0,01 30.272
169 172 10,2 104,04 9,3 86,49 3 9 -0,9 0,81 29.068
164 168 5,2 27,04 5,3 28,09 4 16 0,1 0,0 27.552
163 163 4,2 17,64 0,3 0,09 0 0 -3,9 15,21 26.569
159 164 -0,2 0,04 1,3 1,69 5 25 1,1 1,21 26.076
154 161 -4,8 23,04 -1,7 2,89 7 49 3,1 9,61 24.794
149 149 -9,8 96,04 -13,7 187,69 0 0 3,9 15,21 22.201
146 153 -12,8 163,84 -9,7 94,09 7 49 3,1 9,61 22.338
138 146 -20,8 432,64 -16,7 278,89 8 64 4,1 16,81 20.148
1.588 1.627 1.269,6 1.008,1 39 229 76,90 259.468

Según estos datos, tenemos (cuadro 9.8):


––
Cuadro 9.8. valores de n, X y s para los grupos A y B, y para
las diferencias de ambos grupos
––
GRUPOS n X s

1.269, 6
A 10 158,8 = 11, 88
9
1.008,1
B 10 162,7 = 10, 58
9
76, 90
A-B 10 3,9 = 2, 92
9

Necesitamos, además, conocer la correlación entre las puntuaciones de


ambos grupos.

330
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

rAB =
∑ AB − ∑ A∑ B
[n∑ A − (∑ A) ][n∑ B − (∑ B) ]
2 2 2 2

259.468 − 1.588 × 1.627


rAB = = 0, 97
[10 × 253.444 − 1588 ] [10 × 265.721 − 1.627 ]
2 2

Por consiguiente, disponemos ya de todos los datos para calcular t por


las ecuaciones 9.5 y 9.6. Hagámoslo:

162, 7 − 158, 8 3, 9
t= = = 4,19
0, 93
( )( )
2 2
10, 58 11, 88 10, 58 11, 88
+ − 2 × 0, 97
10 10 10 10
162, 7 − 158, 8 3, 9 3, 9 3, 9
t= = = 4, 22 : t = = = 4, 22
392 0, 92 92 / 10 0, 92
2,9
229 −
10
10 × 9

resultados prácticamente idénticos, cuya diferencia mínima puede deberse


al redondeo con los decimales.

5.1. Pruebas z y t

Ejemplo primero
Un investigador trata de demostrar que existen diferencias ligadas al sexo
en cuanto a la capacidad para resolver determinada prueba. La variable
dependiente será el tiempo necesitado por los sujetos de uno y otro sexo para
resolver correctamente todos los items de la prueba de carácter espacial.
Considera que la v.d. se distribuye normalmente y que se da homogenei-
dad de varianzas. En cuanto al nivel de medición, al consistir en la medida
del tiempo, estima que es perfecta, cumpliendo los requisitos más exigentes.
Para probar su hipótesis de existencia de diferencias, a un nivel de sig-
nificación del 0,05, decide formar 12 parejas igualadas en los resultados de
una prueba similar, aplicada a principio de curso en el marco de las prue-
bas que todos los años se pasan a los alumnos del colegio en que trabaja.

331
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Los resultados expresados en segundos, fueron los siguientes:


Grupo A, femenino: 386, 368, 362, 350, 343, 320, 311, 290, 275, 253, 223, 211.
Grupo B, masculino: 394, 352, 374, 354, 349, 319, 326, 244, 278, 294, 230, 216.
Análisis del caso
a) Se trata de doce parejas: sujetos correlacionados.
b) Se cumplen los supuestos exigidos por las pruebas paramétricas.
c) La hipótesis es bilateral. Por tanto: H0: µA - µB = 0; H1: µA - µB ≠ 0; o
bien: µA ≠ µB
d) α = 0.05
Resolución
Aplicaremos la prueba t para sujetos correlacionados (emparejados).
Dado que estamos ante una hipótesis bilateral, con 11g.l. (número de pare-
jas menos uno), y α = 0,05, los valores críticos a partir de los cuales podre-
mos rechazar H0 son, según las tablas, ± 2,201. Este valor se encuentra en
la intersección de la columna encabezada por 0,05, bajo la rúbrica de prue-
ba de dos colas o bilateral, y por la fila de 11 g.l.
Veamos los cálculos:

Tabla 9.10. Segundos necesitados por sujetos de ambos sexos para


la realización de un test espacial
––
XA XB D=(XB–XA) D2 d=(D–XD) d2
386 394 8 64 4,83 23,33
368 352 -16 256 -19,17 367,49
362 374 12 144 8,83 77,97
350 354 4 16 0,83 0,69
343 349 6 36 2,83 8,01
320 319 -1 1 -4,17 17,39
311 326 15 225 11,83 139,95
290 244 -46 2.116 -49,17 2.417,69
275 278 3 9 -0,17 0,03
253 294 41 1.681 37,83 1.431,11
223 230 7 49 3,83 14,67
211 216 5 25 1,83 3,35
3.692 3.730 +38 4.622 4.501,68

332
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Por lo tanto:

X A = 3.692 / 12 = 307, 67
X B = 3.730 / 12 = 310, 83
17
X D = 38 / 12 = 3,1
s d = 4.501, 68 / 11 = 20, 23

y, en consecuencia:
310, 83 − 307, 67 3,16
t= = = 0, 54
38 2 5, 84
4.622 −
12
12 × 11

o bien
310, 83 − 307, 67 3,16
t= = = 0, 54
20, 23 / 12 5, 84

y, como 2,201> 0,54, a pesar de la elevada correlación existente nada menos


que 0,94, el resultado no representa una diferencia significativa, hecho que
puede apreciarse claramente sobre la figura 9.10, donde t = 0,54 se sitúa
claramente en la zona de azar —conforme a H0 o mediante el estableci-
miento del intervalo confidencial.

Figura 9.10. Zonas conforme a H0 y H1 Figura 9.11. Intervalo confidencial para


–– ––
y situación del valor empírico de t. α = 0.05, en torno a XA – XB y situación
de las diferencias nulas.

En efecto, en la figura 9.11 puede apreciarse cómo entre los límites del
–– ––
intervalo confidencial creado alrededor de XB - XA = 3,16, límites que se
extienden, para un n.c. del 95 %, entre 16,01 y -9,69, el valor cero o de dife-

333
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

rencias nulas es uno de los posibles. La determinación de estos valores se


hace, según ya sabemos, del siguiente modo:
16,01
3,16 ± 2,201 x 5,84 = 3,16 + 12,85 =
- 9,69
En consonancia con tales resultados el investigador no puede, pues,
rechazar H0 ni, en consecuencia, mantener su hipótesis acerca de que se
den diferencias ligadas al sexo en cuanto al tiempo necesitado para resolver
la citada prueba espacial.
Ejemplo segundo
Un alumno de la UNED decide, para realizar su trabajo de doctorado,
probar la hipótesis de que el método B es más eficaz que el A en cuanto a
la rapidez lectora, con niños entre 6,5 años y 7, fijándose un nivel de con-
fianza del 99%.
Para ello, y tras la formación de 40 parejas de niños de esta edad, en fun-
ción de la velocidad lectora en el momento de la medición, asigna al azar los
sujetos de las respectivas parejas a los grupos. Los niños están leyendo
durante todo el curso con sus respectivos métodos, realizando al final una
prueba consistente en la lectura de un texto de vocabulario y dificultad simi-
lar a la de las lecturas del curso. La variable dependiente se mide como los
segundos que les dura la terminación correcta de la lectura del citado texto.
A efectos del análisis estadístico el licenciado considera que v.d. se dis-
tribuye normalmente, que se da homogeneidad de varianzas y que la medi-
ción reúne los requisitos más exigentes. Los resultados son los que apare-
cen en la tabla 9.11, junto con los cálculos.
Análisis del caso
a) Se trata de grupos emparejados.
b) Se cumplen los supuestos exigidos para la aplicación de pruebas
paramétricas.
c) La hipótesis planteada es unilateral. Por tanto: H0: µA - µB = 0; H1: µA < µB
d) Las muestras son grandes.

334
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

En consecuencia, el valor crítico a partir del cual se puede rechazar H0


dado que la distribución del estadístico de contraste se acomoda a la nor-
mal, que la hipótesis es unilateral y que α = 0,01, es igual a 2,33. Para
encontrar tal valor hay que entrar en la tabla de la curva normal bajo la
columna del área de la parte mayor hasta hallar el valor más próximo a
0,9900, o por la columna del área de la parte menor, hasta encontrar el
valor más próximo a 0,0100. A la izquierda podrá leer 2,33, valor de la pun-
tuación z que en la distribución normal deja una parte por encima corres-
pondiente al 1% (p = 0,01) y por debajo otra del 99% (p = 0,99)
Resolución
De acuerdo con la tabla 9.11, los principales datos para el cálculo son
los siguientes: (Cuadro 9.9)

Cuadro 9.9. Datos para el cálculo de la ecuación 9.5 sobre la tabla 9.11
––
Grupos n X s
A 40 71 8,08
B 40 74,7 7,55

Tabla 9.11. Segundos que tardan dos conjuntos de niños, emparejados en


velocidad lectora, en leer un texto con diferente método

40 × 214.222 − 2.840 × 2.988


Además, rAB = = 0, 85
( )(
402 40 × 225.472 − 2.9882
40 × 204.250 − 2.84 )
XA xA xA2 XB xB xB2 XA xA xA2 XB xB xB2
82 11 121 89 14,3 204,49 72 1 1 79 4,3 18,49
82 11 121 78 3,3 10,89 72 1 1 80 5,3 28,09
80 9 81 84 9,3 86,49 71 0 0 69 -6,7 44,89
80 9 81 82 7,3 53,29 71 0 0 65 -9,7 94,09
80 9 81 85 10,3 106,09 81 0 0 71 -3,7 13,69
79 8 64 83 8,3 68,89 71 0 0 68 -6,7 44,89
78 7 49 83 8,3 68,89 71 0 0 68 -6,7 44,89
78 7 49 76 1,3 1,69 70 -1 1 72 -2,7 7,29
78 7 49 80 5,3 28,09 68 -3 9 75 0,3 0,09
77 6 36 76 1,3 1,69 66 -5 25 74 -0,7 0,49
76 5 25 75 0,3 0,09 66 -5 25 76 1,3 1,69

335
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

XA xA xA2 XB xB xB2 XA xA xA2 XB xB xB2


76 5 25 79 4,3 18,49 65 -6 36 68 -6,7 44,89
76 5 25 79 4,3 18,49 64 -7 49 69 -5,7 32,49
75 4 16 84 9,3 86,49 62 -9 81 66 -8,7 75,69
75 4 16 83 8,3 68,89 60 -11 121 65 -9,7 94,09
75 4 16 78 3,3 10,89 60 -11 121 74 -0,7 0,49
75 4 16 75 0,3 0,09 59 -12 144 68 -6,7 44,89
75 4 16 82 7,3 53,29 54 -17 289 62 -12,7 161,29
74 3 9 76 1,3 1,69 52 -19 361 58 -16,7 278,89
74 3 9 78 3,3 10,89 50 -21 441 56 -18,7 349,69
∑ 2.840 2.610 2.988 2.280,80

Por lo tanto:

74, 7 − 71 3, 7
z= = = 5, 43
0, 6816
7, 552 8, 082
40
+
40
− 2 × 0, 85
40 ( )( )
7, 55 8, 08
40

Interpretación
Como el valor de z empírico es mayor que el valor crítico de 2,33 pode-
mos rechazar H0 con un riesgo máximo de error tipo I evaluado en 0,01.
Esto mismo puede apreciarse en la figura 9.12, donde se ve que el valor
empírico queda claramente fuera de la zona de H0 En realidad el riesgo de
error es muy inferior a 0,01; en efecto, mirando las tablas puede apreciarse
que al valor de z más próximo a 5,43 le corresponde una probabilidad de
ocurrencia al azar no superior a 0,000003 esto es, una frecuencia inferior a
0,0003 veces por cada 100 casos.

Figura 9.12. Zonas conforme a H0 y H1 Figura 9.13. Intervalo confidencial para


–– ––
y situación del valor empírico de z. α = 0.01, en torno a XA – XB y situación
de las diferencias nulas.

336
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

Comprobemos estos mismos hechos a través del intervalo confidencial


alrededor de la diferencia empírica de medias:
5,28
3,7 ± 2,33 x 0,68 = 3,7 ± 1,58 =
2,12
como puede verse, entre tales límites no se encuentra el cero o diferencias
nulas (obsérvese la figura 9.13), razón por la cual rechazamos H0 y damos
por validada la hipótesis del investigador (H1).

5.2. La prueba F como alternativa

La prueba F, en el caso de muestras correlacionadas —emparejadas en


este caso—, presenta como diferencia respecto del ANAVA para grupos inde-
pendientes la obtención y extracción de varianza entre filas o debida al empa-
rejamiento; piénsese que en el caso de grupos formados al azar, las parejas,
que en tal caso no lo son, están aleatoriamente formadas, por lo que la varian-
za entre medias debe ser muy baja, tendiendo a cero en forma tanto más
clara cuanto más casos haya y más aleatoriamente se haya procedido.
Sin embargo, al emparejarse, las puntuaciones de cada pareja tienden a
ser entre sí más similares por lo que, si el emparejamiento fue eficaz, habrá
mayor variabilidad entre las filas: en efecto, por una parte habrá parejas
muy extremas en ambos sentidos y por otro parejas medias en cuanto a su
apartamiento o variabilidad con respecto a la media general, mientras en
aquel caso tenderán a distar —variabilidad— todas aproximadamente lo
mismo.
Pues bien, este hecho permite extraer de la varianza total una varianza
que no es experimental, aunque sí sistemática, esto es, identificable en su
fuente; lógicamente, al no alterarse la varianza experimental deberá quedar
reducida la varianza de error pues la varianza total no cambia ya que, en
realidad, las puntuaciones son las mismas para grupos independientes y
correlacionados, cambiando únicamente la ordenación de las puntuaciones
de los sujetos. La varianza de error, reducida tras la extracción de varianza
sistemática debida a emparejamiento, recibe ahora la denominación de
varianza residual dando a entender con su nombre tanto lo que significa

337
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cuanto cómo se calcula. Naturalmente la varianza residual, equivalente en


lo conceptual a la varianza dentro de los grupos en el ANAVA al azar, será
tanto menor cuanto más elevada sea la correlación y, en consecuencia, la
varianza entre filas.
La varianza entre filas se calcula igual que la varianza entre grupos,
denominada en este caso varianza entre columnas; si en este caso sumamos
todas las puntuaciones de cada columna, las elevamos al cuadrado y divi-
dimos por el número de casos de cada columna, repitiendo la operación
tantas veces como grupos haya, en la varianza entre filas sumamos hori-
zontalmente las puntuaciones de cada pareja, las elevamos al cuadrado y
dividimos por dos, repitiendo ahora la operación tantas veces como parejas
haya. Naturalmente, si no se trata de parejas sino de tríos, cuartetos, etc.,
sumaremos las tres, las cuatro, etc., puntuaciones, elevándolas al cuadrado
y dividiendo por tres, cuatro, etc. (Este caso puede darse cuando la v.i., con
tres, cuatro o más niveles, se aplica a grupos igualados que, en este caso,
serían tríos, cuartetos…).
La varianza residual, como su nombre indica, es la que queda cuando de
la varianza total se extraen las dos varianzas sistemáticas identificadas, esto
es, la varianza experimental o entre grupos o columnas y la varianza de
emparejamiento o entre filas.
Los grados de libertad para las varianzas total y entre grupos o colum-
nas son los mismos que en el caso al azar. Para la varianza entre filas se
obtienen restando al número de parejas la unidad, y para la residual, o bien
restando de los g.l. total los correspondientes a las varianzas sistemáticas,
o bien multiplicando los g.l. de la varianza entre columnas y entre filas.
Veamos ahora la aplicación a un caso.
Ejemplo tercero
En una determinada época se administraba a los escolares de primaria
un vaso de leche a media mañana. Un investigador decidió comprobar si la
cantidad de leche tenía algún influjo en el crecimiento. Tras medir la talla,
a principio de curso, de los alumnos de 6 años de un colegio, constituyó con
ellos 14 parejas igualadas en talla. A los primeros sujetos de cada pareja —
grupo A— les dio doble cantidad de leche que a los segundos, que constitu-
yeron el grupo B. Al final de curso volvieron a ser medidos, siendo los resul-
tados los que aparecen en la tabla 9.12, expresados en centímetros.

338
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

El investigador asumió que se cumplían los supuestos de las pruebas


paramétricas, incluido el nivel de medición.
Su hipótesis, que deseaba probar a un nivel de significación de 0,05, fue
que se darían diferencias en talla entre los grupos A y B.
Análisis del caso
a) Se trata de sujetos emparejados.
b) La hipótesis es bilateral. Por tanto: H0: µA - µB = 0; H1: µA ≠ µB
c) Se dan los supuestos para la utilización de pruebas paramétricas.
Resolución
Puede resolverse mediante t o F para grupos correlacionados. Se utili-
zará F.

Tabla 9.12. Talla, en cmts., de dos grupos de niños, emparejados


en su talla inicial

XA XA2 XB XB2 (XA + XB)2 /2


118 115 13.924 13.225 27.144,5
116 116 13.456 13.456 26.912
115 113 13.225 12.769 25.992
114 110 12.996 12.100 25.088
112 113 12.544 12.769 25.312,5
110 111 12.100 12.321 24.420,5
109 107 11.881 11.449 23.328
108 105 11.664 11.025 22.684,5
108 106 11.664 11.236 22.898
107 104 11.449 10.816 22.260,5
106 106 11.236 11.236 22.472
104 105 10.816 11.025 21.840,5
102 100 10.404 10.000 20.402
100 98 10.000 9.604 19.602

∑ 1.529 1.509 167.359 163.031 330.357

339
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Sobre la base de estos datos, calculamos las SC:


2

S.C.T = (167.359 + 163.031) −


(1.529 + 1.509) = 767
28

S.C.E.COLUMNAS = (
1.5292 1.5092 3.0382
14
+
14

28
)
= 14, 29

2 2 2

S.C.E.FILAS =
(118 + 115) + (116 + 116) + ... +
(100 + 98) −
3.0382
= 734
2 2 2 28

S.C.RESIDUAL = 767 – (14,29 + 734) = 18,71


Pasando estos datos al cuadro resumen del ANAVA, tendremos:

FUENTE DE VARIACIÓN S.C. g.l. M.C. F.


Entre filas (emparejamiento) 734 13 56,46 39,21
Entre columnas (entre grupos) 14,29 1 14,29 9,92
Residual (error) 18,71 13 1,44
TOTAL 767 27

Para decidir sobre la significación estadística o no, tanto del empare-


jamiento como de la diferencia de medias debidas al tratamiento experi-
mental, es preciso establecer los valores críticos de F, para 13 y 13 g,l. en
el primer caso y para 1 y 13 en el segundo, siendo α = 0,05. Estos valores
son:

0.95 F (13 y 13) = 2,60

0.95 F (1 y 13) = 4,67


Como vemos, en ambos casos las F empíricas son muy superiores a
los valores críticos, razón por la cual podemos rechazar H0 con un ries-
go de error tipo 1 máximo de 0,05; en realidad, dados los F empíricos
ese riesgo es muy inferior al que el investigador estaba dispuesto a
admitir: la dieta de mayor cantidad de leche tuvo influjo en la talla de
los niños de 6 años, siempre claro está, que el diseño controlara las
variables extrañas.

340
LAS PRUEBAS PARAMÉTRICAS Y SU USO EN LOS DIFERENTES DISEÑOS: ANAVA. LAS PRUEBAS T DE STUDENT Y F DE FISHER

RESUMEN

El presente tema, cuyo sentido es facilitar al lector la comprensión de


los conceptos y procedimientos estadísticos, por encima del aprendizaje del
cálculo, se ha centrado en la presentación de las principales pruebas para-
métricas, ilustradas en el caso de diseños de dos grupos, en concreto t y F.
Se ha puesto de relieve la ventaja de estas pruebas sobre las no paramé-
tricas siempre que la investigación de que se trate cumpla sus supuestos o
exigencias, superiores a las de las no paramétricas.
Las pruebas han sido presentadas en sus dos modalidades: para grupos
seleccionados de forma independiente, en especial si lo son al azar, y para
grupos formados de conformidad con alguna regla que permita pensar que
cada miembro de un grupo tiene su correspondiente pareja, igualada, en el
otro.
El efecto de esos emparejamientos en la reducción del término de error
al contrastar las hipótesis ha sido objeto de un especial análisis.

341
Tema 10
Algunas pruebas no paramétricas: Signos χ2, T, U

Presentación

1. Diversidad de pruebas. Selección de las más usadas

2. Escala de medida, potencia, tipo de diferencia y prueba a aplicar


2.1. (χ2) y datos de carácter nominal
2.1.1. El sentido y funciones de χ2
2.1.2. Principios de la prueba de χ2
2.1.3. Cálculo e interpretación
2.1.4. Potencia-eficiencia
2.2. Prueba de la mediana y medición ordinal burda
2.2.1. Prueba U, de Mann-Whitney
2.2.1.1. Principios
2.2.1.2. Cálculo
2.2.1.3. Potencia-eficiencia
2.2.2. Prueba de Kolmogorov-Smirnov

3. Pruebas no paramétricas para grupos correlacionados


3.1. Medición ordinal burda y prueba de los signos
3.1.1. Principios
3.1.2. Cálculo
3.1.3. Potencia-eficiencia
3.2. Medición ordinal y prueba de Wilcoxon
3.2.1. Principios
3.2.2. Cálculo
3.2.3. Potencia-eficiencia

343
PRESENTACIÓN
Continuando con el estudio de las pruebas más importantes para el con-
traste de hipótesis, pasamos a abordar las denominadas «no paramétricas».
Como se ha señalado, en el supuesto de que no se cumplan las condiciones
más exigentes para las pruebas paramétricas, aplicaremos estas otras, no
paramétricas, con menores prestaciones.
Debemos hacer notar, no obstante, que es posible conseguir la misma poten-
cia para rechazar H0 elevando el tamaño de la muestra, aspecto este conocido
como potencia-eficiencia. De esta forma, el investigador se encontrará ante la
alternativa de violar los supuestos de la prueba al utilizar la prueba paramétri-
ca, o tratar de lograr los mismos efectos contando con más casos en la muestra.
La variedad de pruebas no paramétricas es muy elevada; el lector puede
comprobarlo en el siguiente cuadro elaborado por el profesor Gil Pascual:

Organización Utilizada con medidas Utilizada con medidas


de los datos nominales ordinales
Una muestra Ji-cuadrado Kolmogorov-Smirnov
Binomial
Rachas
Dos muestras relacionadas McNemar Signos
T de Wilcoxon
K-muestras relacionadas Q-Cochran Análisis de la varianza de
Friedman
Dos muestras independientes Ji-cuadrado Mediana
Prueba exacta de Fisher U de Mann-Whitney
Kolmogorov-Smirnov
Rachas
K- muestras Ji-cuadrado Mediana
Independientes Análisis de la varianza de
Kruskal-Wallis
Principales pruebas no paramétricas y situaciones en que se aplican

345
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Sin embargo, nosotros únicamente estudiaremos una prueba para dos


grupos, en el supuesto de que los sujetos sean seleccionados independien-
temente (prueba U, debida a Mann-Whitney) y dos si están relacionados
(prueba de los signos y prueba T, de Wilcoxon).
También estudiaremos la prueba de chi cuadrado (χ2) tanto en su ver-
tiente de bondad de ajuste como de contraste entre las frecuencias de dos
grupos independientes.

1. DIVERSIDAD DE PRUEBAS. SELECCIÓN DE LAS MÁS UTILIZADAS

Ante un diseño de dos grupos, y tras haber optado por una prueba no
paramétrica por no cumplirse los supuestos del modelo paramétrico, tal vez
porque el más conocido de todos ellos, la escala de medida, diste mucho
alcanzar el nivel de intervalos, al investigador le incumbe la tarea de una
nueva decisión, la de elegir, entre las varias existentes, aquella que es la más
idónea a su situación concreta.
A tales efectos, una primera decisión deriva del procedimiento de selec-
ción de los sujetos, por procedimientos aleatorios o alguna modalidad de
relación, como puede ser el emparejamiento o el bloqueo.
Comenzando por el primero de ellos —dos grupos cuyos sujetos fueron
seleccionados y asignados al azar— uno de los manuales más conocido y com-
pleto1, nos habla de ocho pruebas diferentes; nosotros, con finalidad mera-
mente didáctica, nos limitamos a la prueba U, de Mann Whitney y a la de χ2.
Atendiendo al otro procedimiento de selección de sujetos, estudiaremos
las pruebas de los signos, para un nivel ordinal poco refinado o burdo, y la
T de Willcoxon, para un nivel de medida ordinal.

2. ESCALA DE MEDIDA, POTENCIA, TIPO DE DIFERENCIA


Y PRUEBA A APLICAR

La primera cuestión que debe abordarse ante un problema pedagó-


gico cuya solución deba afrontarse mediante la aplicación de pruebas

1
SIEGEL, S. (1976). Estadística no paramétrica, México: Trillas.

346
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

estadísticas para el contraste de hipótesis es la de selecciona la prueba


adecuada.
El primer gran criterio a aplicar es el del nivel o escala de medida; un
nivel nominal obliga a optar por χ2, así como el ordinal nos sitúa ante las
pruebas de la mediana, Kolmogorov-Smirnov o U de Mann-Witheney.
La opción entre estas últimas debe hacerse en función, además, del cri-
terio de potencia; la prueba de la mediana se utiliza en mediciones ordina-
les más burdas mientras que, en caso de niveles más finos y precisos, debe
elegirse Kolmogorov-Smirnov de una cola o U, prefiriéndose aquélla en el
caso de muestras más pequeñas y ésta en el de las grandes, ahora ya en fun-
ción del criterio de potencia2.
Todavía es necesario tomar en consideración un tercer criterio. Las
pruebas reseñadas pueden permitirnos detectar diferencias significativas
en posición o tendencia central de los grupos —en este caso en medianas3 o
de cualquier otro tipo—; en el caso de diferencias de medianas los criterios
apuntados en el párrafo anterior son los válidos. Ahora bien, en ocasiones
lo que interesa es comprobar si se dan diferencias de cualquier tipo, en
cuyo caso la opción está entre las pruebas de Ji cuadrado (χ2) y Kolmogo-
rov-Smirnov de dos colas, más potente ésta que aquélla. Es interesante
reseñar que a este tipo de pruebas no se les puede pedir una información
que no pueden dar, de forma que, si las aplicamos, podremos concluir que
entre los grupos comparados se dan, o no, diferencias, pero no podremos
identificar de qué tipo de diferencias se trata.

2.1. χ2 y datos de carácter nominal

Una de las pruebas no paramétricas más conocidas y usadas es la de Ji


Cuadrado (χ2), y ello, probablemente, porque ocupa un campo que no suele
ser disputado por otras, lo que no siempre ocurre con las de carácter ordinal,
que han de defender su parcela frente a la invasión de su espacio por las de
tipo paramétrico ya que, como es sabido, no todos aceptan la relación nivel de

2
Una prueba es tanto más potente cuanto mayor es la probabilidad que ofrece de rechazar hipóte-
sis de nulidad falsas.
3
Recuérdese que la mediana —Md— es una medida de nivel ordinal.

347
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

medición-tipo de pruebas, inclinándose muchos por las paramétricas por su


superior potencia y por las mayores posibilidades de análisis que ofrecen.
χ2 es una prueba apta para el nivel nominal al que no son aplicables
pruebas de tipo paramétrico. La medición nominal da lugar a la asignación
de los sujetos a las categorías —nombres— en que se ha dividido el con-
junto, lo que permite calcular frecuencias, tantos por ciento o proporcio-
nes, por ejemplo, medidas de tendencia central tales como la moda —Mo—
o calcular coeficientes de correlación4 como el de contingencia.
Afirmaciones como: a) la elección de carrera o profesión en función del
sexo; b) la relación entre clase social y niveles académicos alcanzados, c)
entre la clase social y el tipo de estudios universitarios elegidos; d) el nivel
de neuroticismo por sexos, o e) características concretas de la personalidad
—tipo de valor predominante— como definitorias de una profesión dada,
serían aspectos relacionados con hipótesis científicas a contrastar con prue-
bas que, como la de Ji cuadrado o la de Kolmogorov-Smirnov (de dos colas),
podrían poner de relieve en unos casos la existencia o no de diferencias liga-
das al sexo (a y d) o a la profesión (e) o la existencia de relación —asocia-
ción— entre variables —clase social y nivel académico (b) o tipo de estudios
universitarios (e). En todos estos casos el investigador, tras clasificar a los
sujetos como pertenecientes a uno u otro sexo, a una u otra clase social, a
uno u otro nivel académico, a una u otra carrera universitaria, o tras haber
medido el neuroticismo, u otras variables de la personalidad, y haberles con-
siderado neuróticos o no, paranoicos o no, tímidos o no, tiene ante sí unas
tablas en las que, para cada categoría, aparecen las veces que se da, es decir,
las frecuencias. Generalmente para el análisis se establecen tablas bidimen-
sionales que nos permiten determinar o establecer asociaciones. Las afir-
maciones anteriores podrían dar lugar a tablas como las siguientes:

Tabla 10.1. Hipótesis a)

Carreras
Sexo
Enfermería Medicina
Masculino
Femenino

4
De asociación, veíamos decir a Fox. Vid. FOX, D. J. (1981). El proceso de investigación en la Edu-
cación. Pamplona: EUNSA, pp. 238-246.

348
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Tabla 10.2. Hipótesis b)


Clase Social
Nivel Baja Media Alta
Académico
Univesitario
Medio
Primario
Analfabeto

Tabla 10.3. Hipótesis c)


Clase Social
Estudios Baja Media Alta
Universitarios
Letras
Ciencias
Derecho
Medicina
Técnicas

Tabla 10.4. Hipótesis d)

Neuroticismo
Sexo
SI NO
Masculino
Femenino

Tabla 10.5. Hipótesis e)


Profesión
Médico Abogado Militar Profesor Diputado
Valores
Económico
Político
Social
Estético
Teórico
Religioso
Epifántico

349
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

En ocasiones, el análisis y las pruebas pueden ser aplicados a los núme-


ros brutos que aparecen en las celdillas —frecuencias— pero no es menos
frecuente que se traduzcan, sobre todo cuando hay necesidad de comparar,
a valores como % o proporciones.
La recogida de los datos puede ser tan fácil y obvia como en el caso del
sexo o el nivel académico, que se solicitan de los sujetos en cualquier pro-
tocolo de investigación a fin de analizar los datos; pero en otras ocasiones
se requieren formulaciones operativas adecuadas para la obtención de
índices, como por ejemplo para decidir en qué clase social clasificar a los
sujetos, salvo si se trata de estudios sobre la clase social subjetiva. Por
último hay ocasiones en que se trabaja con variables más o menos conti-
nuas que artificialmente son dicotomizadas o politomizadas, como ocu-
rre con la afirmación d); en efecto, el investigador deberá aplicar una
prueba de neuroticismo y señalar una raya o línea divisoria, que puede ser
Mo. o Md., clasificando como neuróticos a quienes la superen y como no
a los que queden en ella o por debajo. Desde este punto de vista estamos
en realidad ante una cierta medición ordinal si entendemos que hay más
o menos neuroticismo, pero nosotros la tratamos cualitativamente: hay o
no lo hay. Algo similar ocurre con el punto e): la decisión sobre si una per-
sona queda fielmente representada por el hombre económico, político,
religioso, social o epifántico5 se hará probablemente en función de varias
respuestas a un cuestionario en que x elementos harán referencia a cada
tipo de hombre, clasificándose a cada uno en la categoría en que haya
obtenido más puntos, lo que hace referencia a un aspecto cuantitativo
aunque aquí sea tratado cualitativamente, esto es, que se es o no epifánti-
co, religioso o político.
Como puede apreciarse, hemos considerado dos tipos de variables: las
auténticamente nominales —dicótomas o polítomas—, como el sexo, la
raza, el estado civil (soltero, casado, viudo, divorciado) o el nivel académi-
co, y aquellas otras que son tratadas nominalmente, a las que Kerlinger
denomina cuasinominales.

5
Palabra relacionada con epifanía o manifestación; hombre cuyo interés o valor dominante es la
fama.

350
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

2.1.1. El sentido y funciones de χ2

En su esencia Ji cuadrado es una prueba para valorar estadística-


mente discrepancias entre frecuencias 6; esas frecuencias son, de una
parte, las empíricamente obtenidas —frecuencias observadas (f o)—
tras la recogida de los datos y, de otra, las teóricas o esperadas (f e) de
acuerdo con algún principio o con algún modelo teórico 7. En el
supuesto de que unas y otras fueran idénticas, el valor de χ 2 sería cero,
e indicaría una total identidad del fenómeno empírico con el modelo
teórico de referencia; normalmente, no obstante, se dan determinadas
discrepancias, la mayoría de las veces pequeñas, y a χ 2 le corresponde
evaluarlas, decidiendo bien sobre la compatibilidad de los datos empí-
ricos con el modelo —pruebas de bondad de ajuste— con una determi-
nada probabilidad de error que varía en función del nivel de confian-
za elegido, bien sobre la independencia o asociación de dos variables,
decidiendo sobre la probabilidad de que el valor empírico represente
una asociación real o casual.
Así, en el primero de los enunciados a título de ejemplo, si toma-
mos al azar 100 universitarios de cada sexo, representativos de todos
los distritos españoles, podemos encontrarnos con que se distribuyen
por sexos del mismo modo en todos los grandes bloques de carreras
universitarias, pero será más fácil que haya ciertas diferencias. χ 2 nos
ayudará a decidir si tales diferencias son casuales o, mejor, pueden ser
explicadas a partir del azar o la casualidad como fruto de los errores
de muestreo o, en el supuesto de estar bien planificada la investiga-
ción, ligadas a la variable sexo. Veamos las tablas 10.6 y 10.7, en las
que los valores entre paréntesis representan las frecuencias esperadas
o teóricas, frente a las demás, que son las frecuencias empíricamente
obtenidas

6
No se compara aquí estadísticos como la media aritmética, que representa el promedio de pun-
tuaciones obtenidas por los sujetos de la muestra, sino las veces que el hecho o fenómeno, en sus diver-
sas categorías o clases, se dé empíricamente —frecuencia— con las que se daría según ciertos princi-
pios.
7
En algunos libros se llama a aquéllas frecuencias empíricas, y se las representa por ne o fe; a las
otras se las representa bien por nt o ne, bien por ft fe

351
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 10.6 Tabla 10.7

Carreras Carreras
Sexo Sexo
Ciencias Letras Ciencias Letras

60 40 70 30
Masculino Masculino
(60) (40) (67,5) (32,5)

60 40 65 35
Femenino Femenino
(60) (40) (67,5) (32,5)

Tabla 10. 8

Carreras
Sexo
Ciencias Letras

70 30
Masculino
(55) (45)

40 60
Femenino
(55) (45)

Está claro que en la tabla 10.6, en que χ2 = 0 (identidad entre f o y fe) no


existen diferencias, es decir, los sujetos eligen al margen del sexo; sin embar-
go, en los otros dos casos —tablas 10.7 y 10.8— las discrepancias que se
aprecian deben ser valoradas mediante nuestra prueba. La tabla 10.7 repre-
senta discrepancias no significativas, mientras la 10.8 patentiza diferencias
estadísticamente significativas al exigente nivel de α ≤ 0,01, o lo que es lo
mismo, en la tabla 10.7 las diferencias encontradas podrían ser considera-
das como fruto del azar o, al menos, explicables por este factor, mientras en
la tabla 10.8 podremos considerar, con un riesgo de error no superior al 1%
(p ≤ 0,01) que están ligadas al sexo, es decir, a lo que conlleva en nuestra
sociedad el ser varón o mujer8. En este caso podemos rechazar H0 —no hay
diferencias ligadas al sexo— y aceptar H1, esto es, las diferencias en la elec-
ción del tipo de carrera universitaria son significativas entre los sexos.
Uno de los puntos clave de χ2 es, pues, decidir sobre las frecuencias teó-
ricas o esperadas (fe). En ocasiones éstas se determinan sobre el supuesto
de que los casos se reparten por igual en cada categoría o en forma pro-

8
Fíjese bien que no decimos «producidas» por el sexo biológico, pues ese es otro tema, y muy complejo.

352
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

porcional a las frecuencias marginales —sumas de las frecuencias de las


filas y de las columnas. En el caso anterior las fe han sido calculadas de
acuerdo con la ecuación 10.1 y son las que figuran entre paréntesis:
ff × fe
fe =
ftotal
Ecuación 10.1 para el cálculo de las frecuencias esperadas o teóricas (fe)

Los símbolos de la fórmula significan: ff = frecuencia de la fila; fc = fre-


cuencia de la columna. Si nos hubiera preocupado una sola variable, aspecto
este propio de las pruebas de bondad de ajuste, como por ejemplo, decidir si
se dan diferencias ligadas al sexo en la elección de Pedagogía, podríamos
haberlas determinado sobre la base de que ambos sexos, conforme a H0 debe-
rían estar por igual representados en nuestra especialidad, del siguiente modo:

Tabla 10.9. % de estudiantes por sexo en la carrera de Pedagogía

Sexo %
30
Masculino
(50)
70
Femenino
(50)

Sin embargo, es preciso reconocer que no siempre se ha de considerar


que fe debería estar, en el caso de conformidad con H0 repartida por igual o
de forma proporcional en cada celdilla. Así, cuando se sabe que una deter-
minada característica está representada en la población por un 30 % y la otra
por el 70 % restante, si obtenemos una muestra al azar podemos estar inte-
resados en averiguar si los % de ésta son compatibles con los de la población;
pues bien, en este caso, fe en el supuesto de N = 200, serían naturalmente 60
y 140 respectivamente. Cuando haya razones para dudar de la igualdad o de
la proporcionalidad en las distribuciones teóricas de frecuencias puede llegar
a ser necesario hacer un estudio previo para decidir sobre este punto.
Una vez establecidos los valores de fe la prueba de χ2 consiste en valorar las
discrepancias existentes; dado que χ2 es un modelo teórico, será necesario
comparar el valor empírico obtenido con el correspondiente teórico. Pero en
este punto no existe una única respuesta; al igual que veíamos en temas ante-

353
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

riores, el investigador debe tomar una decisión referente al riesgo máximo que
está dispuesto a correr de rechazar H0 siendo cierta —error tipo 1— riesgo que
es el valor complementario del nivel de confianza —n.c.— y que se expresa en
% o en probabilidad (p); así, para un n.c. del 99% o p = 0,99, el riesgo vale 1%
ó 0,01 y se suele conocer como nivel de significación estadística, representado
por α (alfa). Sin embargo, al igual que vimos ocurría con t o F, este valor no
es único —cosa que sí ocurre con la prueba z— sino que depende de los g.l. de
que dispongamos, ya que χ2 es una familia de curvas, no una única curva.
En consecuencia, la elección del valor teórico con el que comparar el
empírico se hace decidiendo primero el n.c. y determinando los g.l. En gene-
ral, el número de g.l. en el caso de tablas de contingencia se obtiene multi-
plicando el número de filas menos uno por el de columnas menos uno; en el
caso de una única variable los g.l. son el número de categorías menos una
cuando los parámetros son conocidos, o este valor menos el de los paráme-
tros necesarios, cuando éstos son desconocidos (así, en el caso de bondad de
ajuste a la curva normal los g.1. son el número de intervalos finalmente uti-
lizados menos uno, al que se restan, además, otros dos g.l. por desconocer-
se, si se desconocen, los parámetros media y desviación típica).
La prueba de χ2 presenta, fundamentalmente, dos usos o funciones cla-
ramente diferentes a los que hemos aludido: se puede aplicar para decidir
sobre su compatibilidad con un modelo —prueba de bondad de ajuste— o
para decidir sobre la asociación o independencia de variables.
Las pruebas de bondad de ajuste pueden referirse a cualquier modelo, sea
éste el de una distribución igual o proporcional por categorías, el de la curva
normal de probabilidades, el de la distribución binomial, el de la de Poisson o
cualquier otra. En cada caso, eso sí, el cálculo de fe seguirá sus propias normas.
Las pruebas de independencia estudian conjuntamente dos variables tra-
tándose de apreciar si los resultados medidos se distribuyen aleatoriamen-
te por las celdillas o si están asociadas, discrepando más allá del azar. Así,
la hipótesis de que el rendimiento académico en habilidad musical difiere
de la distribución normal llevaría a contrastar las frecuencias empíricas
con las esperadas de acuerdo con tal modelo; se trataría, pues, de una prue-
ba de bondad de ajuste, prueba de un solo grupo.
Pero la hipótesis de que existe relación —asociación— entre el nivel acadé-
mico de los sujetos y la clase socioeconómica de los padres, se resolvería median-

354
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

te una prueba de Ji cuadrado de independencia. Caso de no existir relación, fo y


fe se repartirían en forma similar por todas las celdillas de la tabla de contingen-
cia; en caso contrario, y cuanto mayor sea la asociación, mayores discrepancias
se darán de unas a otras; más aún, si H1 indica que cuanto más elevada sea la
clase social mayor será el nivel académico alcanzado y viceversa, estudiando la
forma en que se dé tal discrepancia cabe estimar si la asociación está en la línea
prevista, en otra o en dirección opuesta. Veamos los datos de la tabla 10.10:

Tabla 10.10. Asociación entre nivel académico y clase social

Nivel Académico
Clase social
Analfabeto Primaria Media Universidad
Muy alta 0 4 16 25
Alta 2 9 12 18
Media 7 18 30 14
Baja 15 15 13 9
Muy baja 23 6 4 2

La magnitud de la asociación viene determinada por la discrepancia,


mayor o menor, de las celdillas. El tipo de relación, positiva o negativa, no
siempre es fácil de determinar; cuando claramente, los valores de fo en las cel-
dillas que van del ángulo superior izquierdo al inferior derecho son inferio-
res a fe mientras ocurre lo contrario en la diagonal del ángulo inferior izquier-
do al superior derecho, se puede pensar en una relación (asociación) positiva,
como parece ser en nuestro caso.

2.1.2. Principios de la prueba χ2

Si bien la prueba χ2 no es exigente en cuanto al nivel de medición pues,


como hemos indicado, se usa con el nivel más elemental de medida, el
nominal, no por ello deja de suponer determinados requisitos que, de no
cumplirse, dan lugar a distorsiones o alteraciones, incluso graves, con
repercusiones de importancia en la interpretación de los resultados.
De una parte es preciso lograr la independencia de las observaciones, de
manera que la aparición de unos sujetos o su inclusión en una determina-

355
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

da celdilla no dependa, o esté condicionada o relacionada, con la inclusión


o no de otros. Veamos lo que afirma Kerlinger al respecto:

«… la independencia es a menudo difícil de alcanzar y debe saberse, no obstante,


que la falta de independencia cuando las operaciones de investigación suponen
independencia puede afectar gravemente a la interpretación de los datos.»
Y añade: «Si los acontecimientos registrados no son independientes unos de
otros, entonces la base de la prueba estadística y las inferencias extraídas de ella
están corrompidas.» 9

Profundizando un tanto en este punto se pueden reseñar situaciones en


que se viola la independencia, como cuando los sujetos se copian en el ins-
trumento de recogida de los datos o cuando las valoraciones de un deter-
minado hecho o situación han sido previamente discutidas por los sujetos
de los grupos que se comparan.
Algunos de los requisitos más importantes se refieren a la categoriza-
ción de los datos, de forma que cada observación se refiere exclusivamente
a una de tales categorías, esto es, que las categorías elaboradas sean ade-
más de exhaustivas, mutuamente excluyentes; de no cumplirse estos hechos
podría darse la falta de comparabilidad de los resultados al no coincidir las
frecuencias empíricamente obtenidas con las esperables por azar, bien por-
que algunas no aparecieran en el análisis —falta de exhaustividad— bien
porque aparecieran más de las existentes, como consecuencia de la inclu-
sión de alguna en más de una celdilla.
Una limitación, de carácter estadístico ésta, se refiere a la necesidad de
que las frecuencias esperadas o teóricas cumplan determinados requisitos
en cuanto a su número. En general, cuanto menor sea éste, menor estabili-
dad y fidelidad presentarán los resultados. En concreto Welkowitz10 afirma:

«Para un g.l. las frecuencias esperadas deben ser como mínimo 5; en caso con-
trario no debe utilizarse. Para 2 g.l. las frecuencias esperadas deberían ser supe-
riores a 2. Con 3 ó más g.l., si todas las frecuencias esperadas menos una no son

9
KERLINGER, F. N.: o. c., p. 110.
WELKOWITZ, J. y otros (1981). Estadística aplicada a las ciencias de la Educación, Madrid: Santi-
10

llana, pp. 315 s.

356
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

inferiores a 5, y esa una es al menos igual a 1, la χ2 constituye una buena aproxi-


mación. En otras palabras, cuanto más g.l. menos estricta es la exigencia respec-
to del valor mínimo de las frecuencias esperadas.»

Fox11 es más breve, indicando que nunca debe aplicarse χ2 si alguna


frecuencia esperada en menor que 1 o cuando estén comprendidas entre
1 y 5 en más de 20 % de las celdillas. Y Siegel12, tomando sus afirmacio-
nes de Cochran, distingue entre los casos con 1 ó más g.l. En el primero
de ellos se indica que χ2 no debería usarse si N < 20, utilizándose en su
lugar la prueba de Fisher y, si N está entre 20 y 40, utilizar χ2 sólo si
todas las fe ≥ 5; en el caso de más de 1 g.l. considera que χ2 puede utili-
zarse si menos del 20 % de las celdillas contienen fe < 5 y ninguna de
ellas sea < 1.
La solución a los casos en que tales frecuencias esperadas o teóricas se
dan, es doble: o abandonar el análisis, al menos mediante esta prueba, o
agrupar celdillas siempre que esto sea posible y tenga sentido. Naturalmente,
en una tabla de contingencia de dos categorías tal agrupación anula el aná-
lisis, pero cuando hay más no siempre es lógica la agrupación, ya que puede
llevar a números difíciles de interpretar; así, en una hipotética tabla en que
las categorías fueran: protestante, católico, episcopaliano, judío, mahome-
tano o ateo, tendría sentido incluir dos de las tres primeras o las tres bajo
la categoría cristiano, o las otras dos —judío y mahometano— como no cris-
tiano y teísta, pero, ¿qué sentido tendrá incluir en una misma categoría
cualquiera de las dos anteriores con la de ateo?

2.1.3. Cálculo e interpretación

La resolución estadística de un diseño de dos grupos mediante la prue-


ba χ2 pasa por las siguientes fases:
a) Recogida de los datos y determinación de las fo para cada celdilla.
b) Cálculo de las fe de acuerdo con la fórmula citada: (fr x fc) ftotal

11
FOX, D.J., o. c., p. 327.
12
SIEGEL, S., o. c., pp. 136-137.

357
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Si fe fueran menor que 1 ó 5, según acabamos de ver, proceder en la


forma indicada en el apartado anterior.
c) Cálculo de χ2 según la ecuación 10.2
Ecuación 10.2. Calculo de χ2
2

χ = ∑∑
2
G C
(f
o
− fe )
g=1 c=1 fe

Obsérvese que en ella aparece una constatación de la discrepancia (fo –


fe) que es elevada al cuadrado para eliminar el signo (lo que cuenta es .la
magnitud de la discrepancia, no su sentido); ahora bien, el valor de una dis-
crepancia no es algo absoluto, sino que está en relación con la magnitud en
que se encuadra, razón por la que el valor anterior se refiere o se hace rela-
tivo a la fe. El signo ∑ solo indica que hay que sumar los valores así calcu-
lados para cada celdilla.
d) Comparación del χ2 empírico con el teórico (el valor de las tablas)
para el valor de α elegido y los g.l. correspondientes y decisión sobre el
rechazo o no de H0.
e) A la hora de interpretar los resultados es preciso tener cuidado; como
muy bien afirma Fox, χ2 sirve para contrastar hipótesis relativas a distribu-
ciones de frecuencias consideradas como una entidad total. Naturalmente,
cuando se trata de dos grupos como ocurre en nuestro caso, las diferencias
pueden asignarse a favor del grupo que obtuvo valores de fo más elevadas,
pero esto no es posible cuando tenemos 3 ó más grupos o cuando los nive-
les de v.i. son 3 o más. Así, en el caso cuyo desarrollo ofrecemos, no pode-
mos afirmar si se dan o no diferencias entre las frecuencias parciales entre
dos carreras universitarias concretas. Como afirma Fox:

«Si hay otras hipótesis acerca de la posibilidad de que haya diferencias en las
proporciones en categorías concretas, hay que utilizar, después del método de chi
cuadrado, otros contrastes que sean adecuados para analizar esas hipótesis... Si el
método de chi cuadrado no revela diferencias estadísticamente significativas entre
las distribuciones, no se deben hacer más contrastes.»13

13
FOX, D. J.: O.c., p. 327.

358
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Algo similar a lo que vimos ocurría con F: si no había una F significativa


no había que seguir buscando diferencias parciales entre medias aritméticas.
Veamos un ejemplo.
Un licenciado en Pedagogía desea contrastar la hipótesis de que existen
diferencias ligadas al sexo en la elección de carrera universitaria; a tal efec-
to agrupa las carreras en los siguientes grandes bloques: ciencias, letras,
derecho, ciencias médicas (medicina, farmacia, veterinaria) y carreras téc-
nicas (ingeniería-arquitectura).
Para su contraste toma una muestra aleatoria de 1.000 estudiantes, 500
de cada sexo, de Bachiller del distrito universitario de la Universidad Com-
plutense, a los que pregunta, en el momento de realizar las pruebas de
selectividad, la carrera que van a elegir. Desea probar su hipótesis con un
riesgo de error —nivel de significación— no superior a 0,01.
Análisis del caso:
a) Nivel nominal de medida.
b) Sujetos seleccionados independientemente, al azar.
Resolución
Se escoge χ2 porque los datos parecen reunir las condiciones exigidas por
esta prueba, en particular la independencia de los datos y la escala de medida.
Los resultados, una vez organizados, se presentan del siguiente modo:
Fase a) Frecuencias observadas (fo) en cada una de las celdillas.

Tabla 10.11. Frecuencias observadas (fo) obtenidas en dos muestras de 500


sujetos cada una, sobre las intenciones de elegir una carrera universitaria
SEXO
MASCULINO FEMENINO
CIENCIAS 146 86 232
UNIVERSITARIAS
CARRERAS

LETRAS 28 164 192


DERECHO 69 133 202
CC.MEDICAS 151 94 245
TECNICAS 106 23 129
500 500 1.000

359
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Fase b) Frecuencias esperadas o teóricas (fe) para las fo de la tabla


10.11

Tabla 12. Frecuencias observadas (fo) y esperadas (f e) —entre paréntesis—


correspondientes a los datos de la tabla 10.1114

SEXO
MASCULINO FEMENINO

146 86 232
CIENCIAS
(116) (116)

28 164 192
LETRAS
UNIVERSITARIAS

(96) (96)
CARRERAS

69 133 202
DERECHO
(101) (101)

151 94 245
C. MEDICAS
(122,5) (122,5)

106 23 129
TECNICAS
(64,5) (64,5)

500 500 1.000

Fase c) Cálculo de χ2
Aplicaremos la ecuación correspondiente:
2

χ = ∑∑
2
G C
(f
o
− fe )
g=1 c=1 fe

χ2 = 7,76 + 7,76 + 48,17 + 48,17 + 10,14 + 10,14 + 6,63 + 6,63 + 26,7 +


26,7 = 198,80

14
Recuerde que el valor de fe (entre paréntesis, se obtiene multiplicando la frecuencia de la fila por
la de la columna y dividiendo por la frecuencia total. Así, el valor del ángulo superior izquierdo será:
(500 x 232) : 1000 = 116. Este valor sería el que debería darse en caso de una distribución proporcional
a filas y columnas. El hecho de que el valor empírico, 146, sea muy superior, ya nos indica que en la
otra columna deberá ocurrir todo lo contrario, lo que es un indicio de que el sexo de los alumnos inci-
de en la elección de la carrera. Después deberemos comprobar si, para el conjunto, estas discrepancias
son o no estadísticamente significativas para α ≤ 0.01.

360
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Fase d) Comparar este valor empírico con el de χ2 teórico (ver tablas)


para 4 g.l. (filas menos 1 x columnas -1: 4 x 1) para nuestro nivel de signi-
ficación estadística. Tal valor es 13,277.
Como 198,80 > 13,277 y χ2 es un estadístico que mide discrepancia, esto
nos indica que tal discrepancia va más allá, en realidad mucho más allá, de
la que podría explicarse como fruto del azar; por ello se puede concluir
rechazando H0 y afirmando que, en efecto, existen diferencias en la elección
de carrera que aparecen ligadas al sexo del alumnado.
Conviene precisar, no obstante, ciertos aspectos: a) no indica, porque la
prueba no lo permite, que el sexo sea la causa de tal fenómeno; b) la dife-
rencia encontrada es, como todas las de carácter estadístico, estocástica,
esto es, se puede predicar de los grupos como tales pero no de todos y cada
uno de los sujetos que los integran; c) como señalábamos líneas atrás, χ2 da
la razón al investigador en su planteamiento global; si desea ahora profun-
dizar en los resultados tratando de ver, por ejemplo, si son significativas las
diferencias en la proporción de estudiantes por sexos entre letras y derecho,
debería utilizar nuevos contrastes.
La resolución de χ2 puede ser más rápida cuando la tabla de contingencia
es de 2 x 2, esto es, dos grupos estudiados en una variable con dos categorías,
esto es, dicotómica o dicotomizada; el ejemplo anterior valdría aquí si se trata-
ra de carreras de humanidades (letras) frente a las de ciencias: así, si unimos
Derecho a Letras, y las demás a Ciencias, tendríamos los datos de la tabla 10.13.

Tabla 10.13. frecuencias observadas según tabla 10.11,


dicotomizando la variable «tipo de carrera»
SEXO
MASCULINO FEMENINO

TIPO DE
CARRERA { CIENCIAS
LETRAS
403
97
203
297
606
394
500 500 1.000

El cálculo sigue la ecuación 10.3 en la que debemos introducir la deno-


minada «corrección por continuidad, cuyo sentido es el de acomodar la dis-
tribución empírica a la teórica de χ2 , de forma que la asignación de proba-
bilidades sea lo más correcta posible. Los valores A, B, C y D se
corresponden con las frecuencias de las celdillas según de la tabla 10.3:

361
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

χ2 =
(N AD − BC −
N
2 ) A B

( A + B ) ( C + D) ( A + C ) ( B + D) C D

Ecuación 10.3. Cálculo de χ2 para tablas de contingencia 2 x 2 y ubicación


de los valores de A, B, C y D.

Con ello tendríamos15:


2

χ2 =
(
1000 | 403 × 297 − 203 × 97 | −
1000
2 ) = 165,86
606 × 394 × 500 × 500

2.1.4. Potencia-eficiencia

Ya sabemos que una de las limitaciones de las pruebas no paramétricas


consiste en su menor potencia; ahora bien, esta menor potencia se entien-
de cuando se aplican dos pruebas, una paramétrica y otra no paramétrica
a datos que pueden ser tratados con la primera.
Pues bien, en cada caso se puede hablar del número de observaciones
que deben ser recogidas cuando se va a aplicar una prueba no paramétrica
para alcanzar la misma potencia que con otra paramétrica; a este concepto
se le denomina potencia - eficiencia.
En el caso de χ2, dado que es una prueba que no tiene alternativa cuan-
do es obligada, no parece necesario hablar de este concepto, aunque Coch-
ran, citado por Siegel, indica que tiende a 1 cuando el valor de N es grande.

2.2. Prueba de la mediana y medición ordinal burda

Si bien no presentaremos esta prueba sí nos interesa dejar constancia de la


misma. Como sabemos, la Mediana —Md— es medida de posición que indica

15
Compruebe el lector que valor es muy similar al obtenido mediante la fórmula ordinaria, siem-
pre que se le aplique la denominada corrección de Yates, que aquí ya va incluida, propia de los casos en
que sólo cuentan con un g.l. La citada fórmula es la siguiente, y el resultado sería de 165,85.
2
G
χ2 = ∑ ∑
C
(f
o )
− fe − 0, 5
g=1 c=1 fe

362
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

el valor que ocupa el lugar central en una serie ordenada; se trata, pues, de una
medida de nivel ordinal, lo que implica la posibilidad de indicar con ella res-
pecto del rasgo o característica medida no sólo lo que es o lo que no es, lo igual
o diferente, sino también lo que es mayor o menor. Este aspecto debe tenerse en
cuenta para comprender el sentido y función de esta prueba estadística.

2.2.1. Prueba U de Mann-Whitney

La prueba U requiere una medición de nivel ordinal que permita esta-


blecer rangos de mayor a menor, o viceversa; dadas las limitaciones de la
medida, no se trabaja con las puntuaciones directas o brutas sino con sus
transformaciones a los rangos correspondientes.

2.2.1.1. Principios

La prueba U, debida a H.B. Mann y D.R. Whitney, es la más potente de


las no paramétricas con sujetos independientes —salvo en casos de N muy
pequeños en que puede preferirse la de Kolmogorov-Smirnov—.
Es la alternativa a la prueba de la mediana cuando se ha logrado un nivel
de medida como el que acabamos de definir, debiendo en tal caso ser ele-
gida por su superior potencia; se trata de una prueba especialmente apta
para contrastar diferencias en posición o tendencia central.
Para su resolución se dan fundamentalmente dos situaciones, según que
las muestras o grupos sean grandes16 o pequeñas; en el primer caso, como
suele suceder en las pruebas no paramétricas, la distribución muestral del
estadístico de la prueba de U, se acerca en forma progresiva al modelo nor-
mal, tanto más cuanto más aumente el valor de n; como consecuencia, los
valores empíricos de U se contrastarán con la curva normal de probabili-
dades; en el caso de muestras pequeñas la distribución muestral de U es
peculiar y tiene sus propias tablas.
Convendrá empezar por definir el estadístico U; en su sentido más ele-
mental U indica las veces que una puntuación del grupo experimental pre-

16
En sentido estadístico. En este caso el valor de n del grupo mayor —n2— deberá ser superior a 20.

363
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

cede, en una serie ordenada de menor a mayor, a una del grupo de control,
es decir, las veces que una puntuación teóricamente superior queda por
debajo de otra teóricamente inferior.
El supuesto en que se basa la prueba es el de que, habiéndose obtenido la
muestra al azar de una población, muestra que se divide al azar en dos grupos,
cabe pensar que ambos serán aproximadamente iguales, por lo que las puntua-
ciones de ambos grupos deberían aparecer mezcladas conforme a H0; ahora
bien, si ha obrado, y lo ha hecho eficazmente, un tratamiento experimental
—v.i.— sobre el grupo experimental no haciéndolo sobre el de control, o hacién-
dolo de diferente modo o con distinta intensidad, cabe esperar ahora que las
puntuaciones de ambos grupos tiendan a separarse; el caso más favorable sería
aquel en que todas las puntuaciones del grupo experimental resultaran superio-
res a todas las del de control como consecuencia de v.i., con lo que ninguna pun-
tuación del grupo experimental precedería a las de control, esto es, aquel caso en
que U = 0; así pues, en muestras pequeñas el valor de U es tanto más significa-
tivo cuanto más pequeño sea, cuanto más cercano a 0 se encuentre. Véase esto
en los dos casos siguientes del cuadro 10.1: está claro que en el caso A, si ha
actuado v.i. no lo ha hecho de modo eficaz, por lo que U es muy elevada (con-
cretamente 10)17 mientras que en el B ha ocurrido todo lo contrario y U = 0.

Cuadro 10.1. Cálculo de U con muestras muy pequeñas

CASO A CASO B

PUNTUACIONES OBTENIDAS POR PUNTUACIONES OBTENIDAS POR


GRUPOS GRUPOS
GRUPO A: 4, 5,7, 8, 10 GRUPO A: 3,5, 4, 5, 5,7
GRUPO B: 3,5, 5,7, 9, 11 GRUPO B: 7, 8, 9, 10, 11
PUNTUACIONES ORDENADAS Y PUNTUACIONES ORDENAS Y
MEZCLADAS MEZCLADAS

X 3,5 4 5 5,7 7 8 9 10 11 X 3,5 4 5 5,7 7 8 9 10 11


GRU- GRU-
B A B A B A B A B A A A A B B B B B
PO PO

U= 1 + 2 + 3 + 4= 10 U=O

17
La puntuación A = 4 es precedida por una B; la A = 5,7, por dos B; la A = 8, por tres B; y la A =
10, por cuatro B; por lo tanto U = 1 + 2 + 3 + 4 = 10.

364
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Ahora bien, como este procedimiento puede resultar tedioso cuando los
grupos tienen más sujetos, como cuando llegan a 20 cada uno18, cuando el
grupo mayor tiene 9 o más sujetos se suele utilizar otro procedimiento en
el que U se calcula a partir de la transformación de Xi en rangos; el valor de
U sigue siendo tanto más significativo cuanto menor sea, como veremos
más adelante.

2.2.1.2. Cálculo

Con muestras muy pequeñas, esto es, cuando el número de casos del
grupo mayor —n2— es igual o menor que 9, el procedimiento es el que aca-
bamos de ver. La decisión sobre si el valor empírico representa o no una
diferencia significativa se lleva a cabo mediante las oportunas tablas, y
teniendo en cuenta el tipo de hipótesis, uni o bilateral. Su manejo debe
hacerse teniendo en cuenta que estas tablas son unilaterales o de una cola
y, que, en caso de hipótesis bilaterales, el valor que en ellas encontremos
debe multiplicarse por dos. El modo de proceder es el siguiente
Se elige la tabla que corresponda al número de casos de la muestra más
grande –n2—. A continuación se entra en la misma por la columna corres-
pondiente a nI —muestra más pequeña— y por fila de valor de U empírico.
El número que se lee en la intersección es la probabilidad que corresponde
a nuestro U; para decidir sobre el rechazo o no de H0 comparamos esta pro-
babilidad con el valor alfa (α) o nivel de significación elegido: rechazaremos
H0 si el valor de las tablas es igual o menor que el de α.
En los casos ejemplificados en el cuadro 10.1, en el supuesto de una
hipótesis unilateral, entraríamos en la tabla para n2 = 5, por la columna
para n1 = 4 y por las filas 10 y 0 –según se trate del caso A o del B; así encon-
traríamos los valores p = 0,548 y p = 0,008. Si nuestro nivel de confianza
hubiera sido del 99%, α = 0,01, por lo que:
0,548 > 0,01 y 0,008 < 0,01
Con lo que, en el caso A, naturalmente no podríamos rechazar H0 mien-
tras que sí podíamos hacerlo en el caso B.

18
Cuando cualquiera de ellos llega n > 21 se considera muestra grande.

365
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Si se hubiera tratado de una hipótesis bilateral, los valores para con-


traste serían:
Caso A: p = 0,548 x 2 = 1,096
Caso B: p = 0,008 x 2 = 0,016
que no nos permitirían el rechazo de H0 en ninguno de los casos.
Centrándonos ahora en el caso más frecuente dentro de las muestras
pequeñas, el proceso a seguir es el siguiente:
Fase a)
Ordenación de las puntuaciones de cada grupo de menor a mayor o
viceversa. Esta operación no es necesaria, pero facilita los cálculos poste-
riores y reduce o elimina el riesgo de errores al atribuir los rangos.
Fase b)
Transformación de las puntuaciones de ambos grupos en rangos; de
ordinario se concede el rango 1.º a la menor puntuación de ambos grupos,
y así sucesivamente. La atribución de rangos se efectúa como si las pun-
tuaciones de ambos grupos estuvieran mezcladas.
Fase c)
Cálculo de U; tanto en el caso que nos ocupa —muestras con n2 entre 9
y 20— como en el de muestras grandes —n2 > 20— el procedimiento es el
derivado de aplicar las ecuaciones 10.4 y 10.5

Ecuaciones 10.4 y 10.5 para el cálculo de U (muestras entre 9 y 20)

n1 ( n1 + 1)
U = n1 + n 2 + − R1
2
n 2 ( n 2 + 1)
U = n1 + n 2 + − R2
2

En cada caso hay dos valores de U; con muestras de tamaño intermedio


podemos calcularlos a través de las ecuaciones pero puede abreviarse y,
habiendo determinado cualquiera de ellos, calcular el otro de forma más
rápida mediante 10.6:
Ecuación 10.6
U = n1 n2 – U´

366
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

es decir, a partir del valor U calculado —que aquí llamamos U’— determi-
namos el valor del otro U; necesitamos conocer ambos para poder utilizar
el más pequeño, pues a él se refieren las tablas19.
Fase d)
El valor de U empírico, esto es, el más pequeño de los dos, se compara
con el valor teórico que aparece en las tablas; si es igual o menor que éste
se puede rechazar H0 con un riesgo de decisión errónea máximo igual a α.
Debemos, pues, comprender cómo se busca el valor de U en las tablas;
las tablas de referencia, para valores de n2 entre 9 y 20 ambos inclusive, se
presentan para valores concretos de α, esto es, para la probabilidad máxi-
ma aceptada por el investigador de cometer errores tipo 1 o nivel de signi-
ficación.
Una vez seleccionada la tabla se entra por la columna correspondiente al
valor de la muestra mayor — –n2— y por la fila de la menor –n1. El valor U que
se encuentra en la intersección es el teórico a que nos estamos refiriendo.
Así, para un nivel de confianza del 99%, esto es, para α = 0,01, en una
hipótesis unilateral, cuando n1 = 15 y n2 = 19, U= 75, lo que significa que, si
nuestro valor de U empírico es 75 o menor podemos rechazar H0 con un
riesgo de error tipo 1 no superior a 0,01. Con los mismos datos, en hipóte-
sis bilateral y α = 0,05 el valor teórico o crítico de U sería 85.
Si se tratara de muestras grandes las fases a), b) y c) son idénticas. No
obstante conviene tener en cuenta que, al distribuirse U normalmente,
como indicábamos más atrás, y ser la distribución normal simétrica, tanto
da ahora contar con U como con U’, es decir, no es necesario calcular
ambos valores salvo como comprobación.
La fase d) es diferente. Al seguir el modelo normal debemos disponer
para decidir sobre H0 de una puntuación z —zU— que, como siempre, es
igual a un cociente entre la diferencia del valor empírico y la media de tales
valores —y la desviación típica de la distribución: s.— Pues bien, en nues-
tro caso el valor empírico es el de U, o U’ como hemos indicado, mientras

19
Convencionalmente U es el más pequeño y U’ el más elevado aunque, evidentemente, no se sabe
cuál es U ni cuál U’ hasta que ambos han sido calculados.

367
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que la media y la desviación típica se obtiene mediante las ecuaciones 10.7


y 10.8. Por consiguiente, zU se obtiene mediante la ecuación 10.9:

Ecuaciones 10.7, 10.8 y 10.9 para el cálculo de la media, la desviación típica y la z de U.

n1n 2 n1n 2 ( n1 + n 2 + 1) U − XU
XU = (21, 7) ; sU = ; zU =
2 12 sU

Lógicamente, si trabajamos con U el valor de ZU será negativo, y positi-


vo en caso contrario, esto es, con U’.
Al igual que veíamos en el tema anterior, cuando el valor de z empírico
sea igual o mayor que el de las tablas para el n.c. o para el valor de α elegi-
do, se puede rechazar H0; intuitivamente esto puede apreciarse sobre una
figura en que se hayan marcado las zonas conforme a H0 y H1 comproban-
do si nuestra z se sitúa en una u otra.
Veamos· ahora un ejemplo:
Un profesor de Pedagogía tiene la intuición de que las clases dialogadas
contribuyen a formar alumnos más críticos que las clases puramente expo-
sitivas , intuición que desea poner a prueba con un margen de error o nivel
de significación estadística de 0,01.
Como consecuencia, decide impartir sus dos clases de la mañana según
uno y otro modelo. Parte del supuesto de que ambas clases, en principio,
son estadísticamente iguales, al entender que no hay razones lógicas que
conduzcan a uno de los grupos a ser más crítico que el otro.
Durante todo un curso el grupo A sigue la metodología expositiva en
donde el único diálogo es el ocasional ante alguna pregunta de los alumnos;
el grupo B, por el contrario, trabaja sobre la base de documentos técnicos
que son leídos previamente y, después, son objeto de discusión y síntesis.
El profesor aplica a los alumnos tres pruebas, obteniendo con ellas una
nota media no sólo en conocimientos sino en aportaciones y personales
convenientemente razonadas habiendo advertido a ambos grupos que estos
dos últimos aspectos serán adecuadamente valorados.
La calificación final es la media de las tres pruebas; en cada una el valor
total es la suma de los productos de las posturas personales por el número
de argumentos diferentes con que las apoyan.

368
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

A los efectos de la investigación trabaja inicialmente con un grupo pilo-


to de n1 = 12 y n2 = 15, seleccionados al azar de entre el total de los que inte-
gran ambos grupos.
Análisis del caso
a) Los sujetos son independientes, seleccionados al azar de una pobla-
ción reducida.
b) La hipótesis es unilateral.
c) La medición no es de intervalo, pero permite jerarquizar la capacidad
crítica de los alumnos; desde luego es superior a la exigida por la
prueba de la mediana. Por ello escoge la prueba U. Como n1 = 12 y n2
= 15 se trata del caso de muestras pequeñas (intermedias).
Resolución
Fases a) y b)
Aparecen a continuación, tabla 10.14, con la correspondiente transfor-
mación en rangos:

Tabla 10.14. Puntuaciones directas de dos grupos y sus rangos correspondientes

Grupo A Grupo B
X1 Rangos X1 Rangos X1 Rangos
0 1 3 4,5 10 21
1 2
1,5 3 3,5 6,5 10 21
3 4,5 4 8 12,5 23
3,5 6,5
6 11 5 9 13 24
6,5 12 5,5 10 13,5 25,5
7 13
8 15 7,5 14 13,5 25,5
8,5 16 9 17 14 27
9,5 18,5
9,5 18,5 10 21

Como indicábamos antes, tal vez esta forma de hacer puede dar lugar a
confusiones en la atribución de los rangos; por ello, si el lector lo prefiere,
puede actuar como en el caso de muestra muy pequeñas, donde los rangos
aparecen de modo consecutivo (tabla 10.15):

369
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 10.15. Puntuaciones ordenadas por rangos y atribuidas a cada uno


de los grupos A o B

X1 0 1 1,5 3 3 3,5 3,5 4 5 5,5 6 6,5


RANGO 1 2 3 4,5 4,5 6,5 6,5 8 9 10 11 12
GRUPO A A A A B B A B B B A A

X1 7 7,5 8 8,5 9 9,5 9,5 10 10 10 12,5 13


RANGO 13 14 15 16 17 18,5 18,5 21 21 21 23 24
GRUPO A B A A B A A B B B B B

X1 13,5 13,5 14
RANGO 25,5 25,5 27
GRUPO B B B

Es preciso hacer algunas aclaraciones sobre la asignación de rangos.


Si se dispone de un instrumento y de una conceptualización suficiente-
mente finas, sería prácticamente imposible encontrar dos sujetos con
idéntica puntuación; como esto no siempre ocurre pueden aparecer
puntuaciones iguales —ligas— cuya resolución consiste en asignar a
todas las puntuaciones ligadas la media de los rangos que les hubiesen
correspondido en caso de ser consecutivas pero diferentes; así la pun-
tuación 3 aparece repetida en los lugares 4 y 5, lo mismo que la 3,5 en
los lugares 6 y 7 y la 10 en los lugares 20, 21 y 22; en consecuencia les
asignamos los rangos 4,5; 6,5 y 21, fruto de calcular la media de aque-
llos lugares; naturalmente, la puntuación siguiente pasa al rango que le
corresponda como si no se hubiera adjudicado tal media; así, tras los
tres dieces, a los que le corresponden los rangos 20, 21 y 22, aunque a
todos se les dé la media de ellos, o sea, el rango 21, adjudicaremos el
rango 23 a la puntuación 12,5.
Si las puntuaciones ligadas están dentro del mismo grupo, como ocurre
con la 13,5, no supone alteraciones para la suma de rangos del grupo ni, por
tanto, para la Ui; pero cuando ocurre como con las puntuaciones 3 y 3,5 que
se dan en ambos grupos, tal valor puede quedar afectado, razón por la cual,
si se trata de muestras grandes, existe una corrección que, más adelante,
veremos.

370
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Fase c)
Cálculo de U y de U´. Para ello primero obtenemos los valores de R1 y de
R2, o sea, de la suma de los rangos de los grupos A y B respectivamente y,
a continuación, U:20 R1 = 121; R2 = 257
12 × 13
U = 12 × 15 + − 121 = 137
2
15 × 16
U = 12 × 15 + − 257 = 43
2

Así pues, 43 es el valor U, y 137 el valor U‘´


Lo mismo habríamos encontrado si, a partir de U = 137 o de U = 43
hubiéramos aplicado la ecuación U = n1 n2 – U´. Veámoslo:
U = 12 x 15 - 137 = 43. U = 12 x 15 - 43 = 137
Fase d)
Del primer párrafo del enunciado se desprende que estamos ante una
hipótesis unilateral —alumnos más críticos, y ante un nivel de significación
de 0,01 (pues n.c. = 0,99)—. Por lo tanto, yendo a la tabla correspondiente,
encontramos U = 42. Como 42 < 43 no podemos rechazar H0 debiendo
admitir que las diferencias encontradas pueden ser explicadas por efecto
del azar.
Sin embargo, el haber obtenido un valor de U muy próximo al crítico,
con muy pocos casos le anima a seguir con su hipótesis. En efecto, en gene-
ral es más difícil rechazar H0 con muestras pequeñas. En consecuencia,
nuestro investigador decide ahora trabajar con toda clase, 51 alumnos en el
grupo A y 60 en el B. Los resultados, ya ordenados de menor a mayor, iden-
tificados los valores según el grupo a que pertenecen, y atribuidos los ran-
gos, aparecen en la tabla siguiente (10.16), cumplimentando así las fases a)
y b).

20
Obsérvese que si a estos datos les hubiéramos aplicado el procedimiento que vimos en
2.3.1.1, esto es, contar las veces que una puntuación del grupo experimental, el B, precede a otra
del grupo de control, el A, hubiéramos llegado al mismo resultado: U = 2 + 5 + 5 + 5 + 6 + 6 + 7 +
7 = 43

371
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 10.16. Puntuaciones ordenadas por rangos y atribuidas


a cada uno de los grupos A o B

X1 2 2 2 3,5 3,5 4 4 4 4,5 5 6 6,5


RANGO 2 2 2 4,5 4,5 7 7 7 9 10 11 13
GRUPO A A A A B A A A B A A A

X1 6,5 6,5 7 7 7 8 8 8 8,5 8,5 8,5 9


RANGO 13 13 16 16 16 19 19 19 22 22 22 24
GRUPO B A B A A A A B B B A B

X1 9,5 9,5 9,5 9,5 9,5 10 10 10 10 10 10


RANGO 27 27 27 27 27 34 34 34 34 34 34
GRUPO B B A A A A B B A B A

X1 10 10 10 10,5 10,5 11 11 11 11 11 11,5


RANGO 34 34 34 39,5 39,5 43 43 43 43 43 49,5
GRUPO B A B A A B A A B A A

X1 11,5 11,5 11,5 11,5 11,5 11,5 11,5 12 12 12 12


RANGO 49,5 49,5 49,5 49,5 49,5 49,5 49,5 57 57 57 57
GRUPO A B B B A A B B A A B

X1 12 12 12 12,5 12,5 12,5 12,5 12,5 13 13 13


RANGO 57 57 57 63 63 63 63 63 71 71 71
GRUPO B A A B A B A B A B B

X1 13 13 13 13 13 13 13 13 13,5 13,5 13,5


RANGO 71 71 71 71 71 71 71 71 79,5 79,5 79,5
GRUPO B A B A A B A B B A B

X1 13,5 13,5 13,5 14 14 14 14 14 14 14 14


RANGO 79,5 79,5 79,5 86,5 86,5 86,5 86,5 86,5 86,5 86,5 86,5
GRUPO A B B B B A A B B A B

X1 14,5 14,5 14,5 14,5 15 15 15 15 15,5


RANGO 92,5 92,5 92,5 92,5 96,5 96,5 96,5 96,5 100
GRUPO B B A B B B B B B

372
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

X1 15,5 15,5 16 16 16 16,5 16,5 17 17


RANGO 100 100 103 103 103 105,5 105,5 108 108
GRUPO B B A B B B B A B

X1 17 17,5 18
RANGO 108 110 111
GRUPO B B B

Los valores de R son: R1 = 2224,5; R2 = 3991,5


Consecuentemente, los valores de U serán los siguientes:
51× 52
U = 51× 60 + − 2.224, 5 = 2.161, 5
2
60 × 61
U = 51× 60 + − 3.9
991, 5 = 898, 5
2

A los mismos resultados se hubiera llegado si, a partir de uno cualquie-


ra de tales valores hubiéramos obtenido el otro mediante la ecuación U = n1
n2 – U´:
U = 51 × 60 – 2161,5 = 898,5
U = 51 × 60 – 898,5 = 2.161,5
Por tanto: U = 898,5 y U´ = 2.161,5
Fase d)
––
Calcularemos ahora XU y sU; a continuación zU.

51× 60 51× 60 (51+ 60 + 1)


XU = = 1.530; sU = = 169
2 12

Por lo tanto:

898, 5 − 1.530 2.161, 5 − 1.530


zU = = −3, 74; o z U = = 3, 74
169 169

La interpretación de estos resultados es fácil si se lleva, como hacíamos


en el tema anterior, sobre las figuras representativas de la distribución nor-
mal (figuras 10.1 y 10.2). En ellas, la zona rayada es la conforme a H0 y la
que queda en blanco es conforme a H1 aquella en que los valores que le

373
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

corresponden tienen muy poca probabilidad de ocurrencia por azar, en


concreto una probabilidad que, como máximo, iguala al valor de α fijado
por el propio investigador.

Figuras 10.1 y 10.2. Zonas conforme a Ho y H1 en una hipótesis unilateral y α = 0,0 l. Fig. 10.1:
U del Grupo A; 2) U del Grupo B.

Claro está que, al tratarse de una hipótesis unilateral no basta con que el
valor de zU sea significativo, en este caso > 2,33 sino que las diferencias vayan
en la dirección prevista por la hipótesis, lo que sí ocurre en nuestro caso ya que
R2 es la suma de rangos más elevada y da lugar al valor de U más reducido.
Por otra parte, no debe confundirnos el que pueda utilizarse cualquiera
de las dos curvas, las de la figura 10.1 o de la 10.2. Lógicamente. lo que
importa es la magnitud de la puntuación z si se trata de hipótesis bilateral,
y que vaya en el sentido previsto si se trata de una unilateral. Es natural que
si se utiliza el valor de U z sea negativa, y positiva si se calcula con U´. Pero
debe tenerse en cuenta a qué grupo pertenece cada U para ver si las dife-
rencias van en el sentido previsto.
Para concluir, una breve referencia al efecto de las puntuaciones liga-
das, efecto que, de no corregirse, puede hacer a la prueba U más conserva-
dora al reducir el valor de zU, lo que se puede traducir en dar por no signi-
ficativas diferencias que sí pueden serlo. Se habrá podido observar que,
como consecuencia de la poca precisión en la medición, se dan muchas
puntuaciones ligadas; pues bien, la corrección se refiere al cálculo de sU que
ahora seguirá la ecuación 10.10 en vez de la 10.8:
Ecuación 10.8 para el cálculo de sU:

sU
( n1n 2
N ( N − 1) )(
N2 − N
12
−∑T
)
374
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

fórmula en la que conocemos todos sus elementos salvo ∑T, siendo su


valor T = (t3 – t) / 12, y t el número de puntuaciones iguales. Como ejemplo,
en nuestro caso, el primero de los valores se refiere a X1 = 2, que aparece
repetido en tres ocasiones, por ello T = (33 - 3) /12; el valor de T que apare-
ce en el lugar 8° se refiere a Xi = 9,5, que aparece repetido en cinco ocasio-
nes, por lo que T = (53 – 5) /12, Y así sucesivamente.

Por tanto:

sU =
(
111× 110 )(
51× 60 1113 − 111
12 )
− 359 = 168, 726

Y en consecuencia:

898, 5 − 1.530
zU = = −3, 7
168, 726

Conviene que nos demos cuenta de que, aunque estamos ante un caso
con muchas puntuaciones ligadas, apenas ha disminuido sU y, por consi-
guiente, su efecto sobre zU ha sido muy pequeño. La consecuencia parece
obvia: no efectuar tan fatigoso trabajo salvo que:

a) El valor de zU esté muy próximo al valor crítico según la tabla normal


-2,58 ó 2,33 para a = 0,01, ó 1,96 ó 1,645 para a = 0,05 según se trate
de hipótesis bi o unilaterales.
b) No calcular la corrección salvo si los valores de t son muy elevados,
pues son éstos los que alteran el resultado y los que realmente dan
lugar a un valor ∑T elevado; en nuestro caso los únicos valores de
importancia serían la puntuación 10. repetida en 9 ocasiones y la 13,
repetida en 11; en efecto, en tales casos tenemos: T = (93 – 9) / 12 = 60,
y T = (113 – 11) / 12 = 140

2.2.1.3. Potencia-eficiencia

Los estudios de Mood indican que la potencia-eficiencia de U se encuentra


alrededor del 95%, si bien puede llegar al 95,5% cuando aumenta el valor de N.

375
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

2.2.2. Prueba de Kolmogorov-Smirnov

La prueba de Kolmogorov-Smirnov puede utilizarse como alternativa a


la de χ2 en aquellos casos en que se trate de poner a prueba la existencia de
diferencias de cualquier tipo, o a la prueba de Mann-Whitney en el caso de
probar si las muestras proceden de la misma población, o de poblaciones
diferentes con idéntica posición o tendencia central.
En el primero de los casos es más potente que la prueba de χ2 , por lo
que, de poderse aplicar ambas, debería elegirse ésta en su modalidad de dos
colas; en el segundo caso, cuando el valor de N es muy pequeño, suele pre-
ferirse Kolmogorov-Smirnov de una cola o unidireccional, mientras que
debe elegirse U si se trata de valores de N más grande.

3. PRUEBAS NO PARAMÉTRICAS PARA GRUPOS


CORRELACIONADOS

Tras haber optado por una prueba no paramétrica en un diseño de dos


grupos cuyos sujetos tienen algún tipo de relación, bien sea ésta a nivel de
grupo bien en forma de emparejamiento individual, el investigador deberá
hacer una nueva elección consistente en escoger la más idónea de las prue-
bas de este grupo.
Siegel en su citado texto sobre contrastes no paramétricos, nos presen-
ta cinco pruebas de las que nosotros elegimos dos, ambas de nivel ordinal
de medida, una para un nivel más burdo, como la prueba de los signos, y
otra para un nivel más preciso y fino, la T de Wilcoxon.
Dejamos fuera de prueba de McNemar, porque en realidad no es para
dos grupos sino para uno medido en dos ocasiones, esto es, para un diseño
de un solo grupo con pretest y postest. En cuanto a la prueba de Walsh, el
ser únicamente aplicable a muestras muy pequeñas y sus exigencias, muy
próximas a las propias de las pruebas paramétricas, nos hacen no tomarla
aquí en consideración, como tampoco a la prueba de aleatoriedad por idén-
ticas razones.
Estudiaremos, pues, las pruebas de los signos y de Wilcoxon, ambas
aptas para el nivel ordinal en sus diversos grados de perfección.

376
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

3.1. Medición ordinal burda y prueba de los signos

Como ya sabemos estamos ante el nivel ordinal siempre que, refiriéndonos


al objeto medido, al aplicarle el oportuno instrumento de medida podamos
decir de él no sólo si es igual o diferente de otro sino si es mayor o menor.

3.1.1. Principios

Pues bien, cuando nuestro nivel ordinal es tan burdo, tan poco preciso,
como para, estrictamente, no permitirnos ir más allá de decir que algo es
mayor que algo, pero no para precisar diferencias dentro de cada uno de
esos dos grandes bloques, el mayor y el menor, estamos ante una situación
cuya resolución estadística reclama la prueba de los signos.
Si comparamos dos grupos en los que podemos establecer parejas, y al
contrastar para cada pareja los resultados de la v.d. podemos afirmar que
un miembro tiene más que el otro, que lo ha hecho mejor, que ha conclui-
do antes o después, estamos ante el caso que nos ocupa. En tal situación
podemos asignar el signo + siempre que el primer miembro de la pareja
haya hecho más de algo, lo haya hecho mejor o antes, y el signo – en caso
contrario, o viceversa, despreciando, a efectos del análisis, aquellos casos
en que no se perciban diferencias entre ambos, tal vez como consecuencia
de lo basto del instrumento o de la regla de medida.
Pocas son las exigencias de la prueba, exigencias que se pueden limitar
a la continuidad de la variable y a su medición al nivel descrito, además, por
supuesto, de aplicarse a parejas constituidas con arreglo a una variable de
emparejamiento que se considera eficaz. Su aplicación puede valer tanto
para dos grupos emparejados —gemelos, apareamiento en una o varias
variables relevantes— cuanto para los mismos sujetos en un diseño de un
solo grupo con pretest-postest como en el caso de McNemar. La diferencia
entre ambos casos reside en que la de McNemar es aplicable a variables
nominales. No trataremos aquí la prueba de los signos para un solo grupo,
aunque su resolución es idéntica.
Su fundamento lógico es el siguiente: Dados dos grupos de sujetos cuya
igualdad inicial se ha tratado de conseguir mediante alguna forma de empa-
rejamiento, cabe pensar que si, tras la aplicación de v.i, ésta no hubiera pro-

377
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

ducido efectos, el número de sujetos primeros miembros de cada pareja que


puede recibir el signo más será aproximadamente igual al de los segundos
miembros, siendo muy frecuente el cero o ausencia de diferencias; en conse-
cuencia, si se encuentra que, o bien los primeros miembros de las parejas o
bien los segundos, tienen muchos más signos positivos que negativos, o vice-
versa, esto es, que, en total hay muchos más signos positivos que negativos,
o al contrario, es que algo ha ocurrido y, si el diseño está bien planteado, ese
algo no puede ser sino que la v.i ha resultado eficaz. A la prueba de los signos
le corresponde decidir sobre tal diferencia de signos más y menos, asignan-
do al resultado la probabilidad de que haya surgido por azar. Para ello el
investigador habá fijado de antemano el valor de α o nivel de significación
con el que desea contrastar la significación o no de las diferencias empíricas.

3.1.2. Cálculo

La resolución de una prueba de los signos es sumamente fácil, siendo igual


para muestras grandes o pequeñas, salvo en el momento de asignar las pro-
babilidades de acuerdo con la hipótesis del azar. El proceso es el siguiente:
Fase a)
Comparación de las puntuaciones de cada pareja y asignación del signo,
positivo o negativo, según que el primer miembro tenga valores superiores
o inferiores al segundo, o viceversa, según la hipótesis formulada; cuando
es unilateral parece más adecuado dar el signo positivo al grupo que en tal
hipótesis se prevé superior.
Fase b)
Determinar los valores n y x; n es el número de parejas que han obteni-
do signo, y x el número de parejas con el signo, positivo o negativo, que
haya resultado menos frecuente.
Fase c)
Interpretación del resultado por comparación con la distribución
teórica.
En el caso de muestras pequeñas —hasta valores de n = 25 casos— la
asignación de probabilidades es directa a través de la tabla correspondien-

378
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

te; en ella se entra por la columna del valor x y por la fila del valor de n
resultante, leyéndose aquella directamente en la intersección de ambas. Tal
resultado es el propio de hipótesis unilaterales; si nuestro caso fuera bila-
teral habría que multiplicar por dos el valor de las tablas
La probabilidad del modelo teórico se compara con el valor de α deci-
dido por el investigador; si éste es igual o mayor que aquél se rechaza H0
con un riesgo de decisión errónea máximo igual a α.
En el caso de muestras grandes —con n > 25— la distribución del esta-
dístico sigue el modelo binomial que tiende a la curva normal a partir de n
= 25, siendo la aproximación tanto más correcta cuando se hace la correc-
ción por continuidad.
En la distribución binomial X x = np y s x = npq donde p y q son las pro-
babilidades del fenómeno binomial, esto es, p la probabilidad de una clase,
como la de salir cara al lanzar una moneda, y q la probabilidad de la otra
clase. Cuando p y q son equiprobables, es decir, cuando valen cada uno 0,5,
las ecuaciones anteriores pueden sustituirse por las siguientes:

Ecuaciones 10.9, 10.10 y 10.11 para el cálculo de la media, de s y de z


en el modelo binomial
1
x− n
1 1 2
X x = n; sx = n ; y por tanto, z x =
2 2 1
n
2
Ahora bien, como estamos ante una distribución continua que se mani-
fiesta en forma discreta, las probabilidades asignadas a x son más exactas
si en dicha fórmula para el cálculo de zX se lleva a cabo la corrección por
continuidad, consistente en reducir el numerador en 0,5 puntos, lo que se
consigue sumando o restando al valor x ese medio punto según que x sea
menor o mayor que 1/2 n. Por lo tanto zX conviene que sea calculada
mediante la ecuación 10.12:

Ecuación 10.12 para el cálculo de z en el modelo binomial

( x ± 0, 5) − 12 n
zx =
1
n
2

379
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

El valor de zX así obtenido se contrasta con el de las tablas de la curva


normal para el nivel de confianza o de significación decidido por el investi-
gador. Ya sabemos que éstos son, en los casos más frecuentes de α = 0,05 y
de α = 0,01, a los que corresponden, respectivamente, 1,96 ó 1,645 y de 2,58
y 2,33 según se trate de hipótesis bi o unilaterales.
Si nuestra zX es menor que tal valor de las tablas no podemos rechazar
H0; si lo iguala o lo supera, podemos hacerlo, aceptando un riesgo máximo
de error tipo I de 0.05 o de 0,01 según los casos.

Ejemplo primero
Un profesor de la Facultad está preocupado por el hecho de que en los
exámenes los alumnos no suelen «ver» las indicaciones que les hace ten-
dentes a que contesten valorando, relacionando, haciendo esquemas, jus-
tificando sus opiniones, interpretando el resultado, etc., sino que más
bien parece como si tales indicaciones no fueran tenidas en cuenta. Deci-
de probar si una llamada de atención seria en el momento del examen,
consistente en indicar que, de no atenerse a tales indicaciones, que él
mismo les leerá, las calificaciones serán muy bajas, da lugar a unos exá-
menes más ajustados a sus pretensiones. Quiere probar su hipótesis con
α = 0,05.
Para ello, y pensando que tal vez el nivel de conocimientos puede ser
una variable relevante a la hora de ajustarse o no a las indicaciones, lo
mismo que el nivel intelectual, constituye 18 parejas igualadas en ambas
variables. La variable inteligencia la tiene medida como una práctica de
clase, y la de conocimientos la toma como las calificaciones del curso ante-
rior. Forma dos grupos, el A y el B, según que los alumnos pertenezcan al
primero o segundo grupos de la mañana. Al grupo A no les da ninguna indi-
cación personal en el momento del examen, salvo las escritas en la hoja; al
B les lee tales indicaciones y les hace la observación ya referida sobre las
consecuencias de no seguirlas.
La v.d. la mide asignando un punto por cada recomendación atendida;
a continuación atribuye el signo más si el miembro de la pareja del grupo
B tiene más puntos, el menos en caso contrario y el igual si no hay diferen-
cias en la pareja. He aquí los resultados y la resolución mediante la prueba
de los signos (tabla 10.17):

380
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Fase a)

Tabla 10.17. Datos correspondientes a 18 parejas de gemelos

PAREJA 1.ª 2.ª 3.ª 4.ª 5.ª 6.ª 7.ª 8.ª 9.ª 10.ª
GRUPO A 3 3 4 6 4 0 1 3 2 0
PUNTOS

GRUPO B 4 3 5 4 3 3 4 4 2 4
SIGNO + = + - - + + + = +

PAREJA 11.ª 12.ª 13.ª 14.ª 15.ª 16.ª 17.ª 18.ª


PUNTOS

GRUPO A 2 3 6 3 2 1 1 0
GRUPO B 3 3 4 5 6 4 3 3
SIGNO + = - + + + + +
Fase b)
Como ha habido tres casos en que los miembros de las parejas han reci-
bido el mismo número de puntos del profesor el valor de n es igual a las
parejas iniciales menos estas tres; el valor de x, correspondiente al signo
menos frecuente, es el de los casos con signo negativo.
Por tanto: n = 15 x=3
Fase c)
Según la tabla correspondiente, para estos valores en una hipótesis uni-
lateral como es la del investigador, p = 0,018; comparando este valor con el
de α = 0,05, decidido por el investigador, tenemos que: 0,05 > 0,018, o lo que
es lo mismo, si se rechaza Ho el investigador podría llegar a cometer un
error cuya probabilidad es menor que la que inicialmente estaba dispuesto
a admitir; en consecuencia debe rechazar H0.
En el supuesto de una hipótesis bilateral, que no sería lógica para el
enunciado del problema, p = 0,036 (0,018 x 2), valor que, asimismo, permi-
tiría el rechazado de H0.
Ejemplo segundo
Un investigador desea comprobar su hipótesis de que el sexo todavía
sigue siendo una variable relevante en nuestro país a la hora de dar las
familias estudios a sus hijos. Decide comprobar su hipótesis de que es el
sexo masculino el más favorecido, y hacerlo al nivel científico de significa-
ción de 1 %, esto es, con α = 0,01.

381
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

A la hora de diseñar su trabajo piensa que tal vez la clase social puede ser
relevante en los resultados, por lo que decide tomarla en cuenta. Para ello recu-
rre a los registros de nacimiento de 1991, individuos de 20 años en la actuali-
dad, y toma una muestra de gemelos de distinto sexo, de forma que hay 10 de
clase baja, 30 de clase media y 10 de clase alta: en total 100 sujetos, 50 parejas,
con 50 varones y 50 mujeres. En el fondo subyace el supuesto de que al tratar-
se de gemelos estarán igualados en capacidades y en los ámbitos familiares.
Tras identificarlos les pregunta por los estudios que hacen o que con-
cluyeron sin continuar con otros, asignando a cada sujeto los números 1, 2,
3, 4, o 5 según que no hayan acabado los estudios primarios (1) o si (2)
hayan hecho al menos un curso de bachillerato (3) o lo hayan concluido (4),
o iniciado estudios universitarios (5). Concede el signo más si es el varón de
la pareja el que ha llegado a un nivel más elevado, el menos si es la mujer y
el igual si no hay diferencias. Los resultados aparecen a continuación (tabla
10.18), ordenados de forma que las 10 primeras parejas son las de clase
baja, las 30 siguientes de clase media y las 10 últimas de clase alta:

Tabla 10.18. Datos correspondientes a 50 parejas de gemelos

PAREJA 1.ª 2.ª 3.ª 4.ª 5.ª 6.ª 7.ª 8.ª 9.ª 10.ª 11.ª
M 2 2 2 3 1 2 3 4 2 2 5
SEXO

F 1 1 1 1 1 1 1 1 2 1 3
SIGNO + + + + = + + + = + +

PAREJA 12.ª 13.ª 14.ª 15.ª 16.ª 17.ª 18.ª 19.ª 20.ª 21.ª
M 4 3 4 3 2 4 2 5 2 3
SEXO

F 4 2 5 2 2 3 3 5 1 2
SIGNO = + - + = + - = + +

PAREJA 22.ª 23.ª 24.ª 25.ª 26.ª 27.ª 28.ª 29.ª 30.ª 31.ª
M 4 3 4 5 3 2 5 4 3 2
SEXO

F 2 2 3 3 2 3 3 2 4 1
SIGNO + + + + + - + + - +

PAREJA 32.ª 33.ª 34.ª 35.ª 36.ª 37.ª 38.ª 39.ª 40.ª 41.ª
M 5 4 4 3 5 4 4 2 4 5
SEXO

F 2 2 5 2 5 3 5 1 2 5
SIGNO + + - + = + - + + =

382
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

PAREJA 42.ª 43.ª 44.ª 45.ª 46.ª 47.ª 48.ª 49.ª 50.ª
M 5 4 4 4 5 5 5 3 5
SEXO

F 4 5 4 4 4 4 5 5 4
SIGNO + - = = + + = - +

Fase b)
Como las parejas igualadas son 10, y el signo menos frecuente es el
negativo, que, además, apunta en la dirección prevista por el investigador,
lo que es necesario al tratarse de una hipótesis unilateral, tendremos:
n = 40 x=8
Conviene aclarar que, tratándose de muestras grandes —n > 25— y
dado que haremos el contraste con el modelo normal que, no lo olvide-
mos, es simétrico, da lo mismo calcular zX con los valores de x como los
del signo menos frecuente que como los del signo más repetido, como
veremos.
Fase c)

zx =
(6 + 0,5) − 13
= −2, 55
1
26
2

zx =
( − 0, 5) − 13 = 2, 55
20
1
26
2

Si llevamos estos valores sobre la representación gráfica apreciaremos


cómo claramente es rechazable H0 (figuras 10.3 y 10.4):

Figura 10.3 y 10.4. Zonas conforme a H0 y H1 cuando se toma x como signo más frecuente
(10.3) o menos (10.4). Situación del valor z empírico.

383
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Como vemos, los valores empíricos de x, sean 8 ó 32, dan lugar a valo-
res típicos (zX) que se sitúan claramente en la zona de no azar, esto es, en
la de rechazo de H0 con un riesgo de decisión errónea muy inferior a la ini-
cialmente aceptada por el investigador. El lector puede comprobar que tal
riesgo no supera la probabilidad de 0,00014, cuya frecuencia de aparición
por azar no supera el 0,014 por cien.
Ahora, el investigador desea comprobar su hipótesis por clases sociales.
Para las clases baja y alta debe acudir al primer procedimiento —muestras
pequeñas—, no así en el de la clase media, donde n = 26. Analicemos los
resultados:
A) PARA CLASE BAJA
N = 8; x = 0 (ningún signo negativo)
En las tablas, p = 0,004
Como 0,004 < 0,01, valor este aceptado por el investigador, puede recha-
zar H0 afirmando que, en la clase baja, en efecto, el sexo masculino es más
favorecido en el nivel de estudios alcanzados.
B) PARA CLASE ALTA
n = 6; x = 2
En las tablas, p = 0,344 que, evidentemente, es muy superior a 0,01, por
lo que no puede rechazar Ho; esto es, para la clase alta no hay diferencias
significativas a la hora de dar estudios a los hijos en función del sexo; las
diferencias apreciadas pueden explicarse por el azar en la selección muestral
C) PARA LA CLASE MEDIA
N = 26; x = 6
Por lo que

zx =
(6 + 0,5) − 13 = −2, 55
1
26
2

zx =
(20 − 0, 5) − 13 = 2, 55
1
26
2

384
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Llevados estos datos sobre la curva normal (figuras 10.5 y 10.6), nos per-
miten apreciar que, en efecto, podemos rechazar Ho dado que caen clara-
mente en la zona de no azar; el rechazo de H0 lleva consigo admitir una pro-
babilidad de error tipo I máxima de 0,01, que, en realidad, y dado el valor
empírico de zX, el alumno puede comprobar que es muy inferior (como
máximo, de 0,0054, esto es, de 0,54 %). Concluimos pues que, para la clase
media, se dan diferencias de oportunidades en cuanto al nivel de estudios
de los hijos en función del sexo.

Figuras 10.5 y 10.6. Zonas conforme a H0 y H1 cuando se toma x como signo más frecuente
(10.5) o menos frecuente (10.6); situación de los valores de zX empíricos.

3.1.3. Potencia-eficiencia

Se trata de una prueba cuya máxima potencia se encuentra en el caso de


muestras muy pequeñas —con n = 6—, alcanzando valores del 95%, si bien llega
a quedar reducida a un 63% en cuanto el valor de n aumenta progresivamente.

3.2. Medición ordinal y prueba de Wilcoxon

La medición ordinal puede permitir establecer una jerarquización, una


seriación de las puntuaciones en forma más fina y precisa, más allá de la
mera asignación de signos como expresión de que algo es mayor o menor que
algo. Cuando la medición lograda es tal que a las diferencias apreciadas en
cada pareja se les puede asignar rangos de mayor a menor, o viceversa, esta-
mos ante una medición más perfecta que en el caso anterior, a la que puede
aplicarse la prueba de Wilcoxon. Estamos entre la medición ordinal burda,
ya apuntada, y la de intervalos, ya que, en este último caso, tomaría en con-
sideración la cuantía de las diferencias de forma que pesaran proporcional-

385
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

mente a su valor, mientras en la prueba de Wilcoxon únicamente se tiene en


cuenta la magnitud para asignar el rango, con independencia de que, dentro
de cada diferencia, haya mayor o menor magnitud. Aquí radica, precisamen-
te, la menor potencia de esta prueba frente a la paramétrica.

3.2.1. Principios

Si la exigencia en cuanto a medición es la apuntada, el fundamento de


la prueba radica en el supuesto de que, al haberse igualado los grupos
mediante el emparejamiento inicial, las diferencias de las puntuaciones
para las parejas deben repartirse por igual entre los primeros y segundos
miembros de cada pareja; en consecuencia, cuando se asignen los rangos a
las diferencias entre parejas, las sumas de los rangos de los primeros miem-
bros debe ser igual, o muy próxima, a la suma de los rangos de los segun-
dos miembros de tales parejas. Si no aconteciera esto habría que pensar
que algo había ocurrido, y si el diseño está bien planeado, esto es, si hay
control de variables, ese algo no puede ser sino v.i., o lo que es lo mismo las
diferencias medidas en v.d. tendrían su origen en el efecto diferencial de v.i.
El estadístico de la prueba de Wilcoxon se simboliza por T, y se define
como la menor suma de los rangos, positivos o negativos, asignados a las
diferencias entre las puntuaciones de las parejas. Con arreglo a los plante-
amientos que acabamos de hacer, cabe esperar que tales diferencias favo-
rezcan tantas veces a los primeros miembros de cada pareja como a los
segundos, con lo que la suma de los rangos positivos será la misma o ten-
drá un valor muy próximo a la suma de los rangos negativos. La prueba de
Wilcoxon trata de decidir justamente si el valor de T es significativo, esto
es, si va más allá de las expectativas conforme al azar; como cabe esperar,
el valor de T será tanto más significativo cuanto menor sea: en efecto, en el
mejor de los casos todos los primeros miembros de las parejas podrían
resultar superiores, o inferiores, a los segundos miembros, con lo que la
suma de los rangos negativos, o positivos, respectivamente, será cero.
T tiene una distribución peculiar; con valores pequeños de n los valores crí-
ticos a partir de los cuales —ellos o menores que ellos— rechazar H0 aparecen
en la tabla correspondiente, diferenciados según el valor de α y el tipo de hipó-
tesis. Sin embargo, y como hemos visto ocurría en otros casos, cuando el valor
de n aumenta se da un progresivo acercamiento de su distribución al modelo

386
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

normal, acercamiento que es suficientemente válido a partir de n = 25; en tales


casos, lógicamente, deberemos calcular zT a fin de asignar a los resultados su
correspondiente probabilidad conforme a la hipótesis del azar.
Dada la poca precisión lograda en la medición no es raro que se den
valores iguales entre parejas —puntuaciones ligadas—, valores que, en con-
diciones de mayor finura de los instrumentos de medida, serían diferentes;
cuando esto ocurre es preciso romper los empates o ligas a fin de asignar-
les rangos obrando tal como lo hicimos en la prueba U. Cuando los valores
iguales se dan entre los dos miembros de la pareja la diferencia es cero, no
asignándosele rango alguno y eliminándola del análisis, de forma que el
valor n final resulta de restar del número inicial de parejas el de aquellas en
que la medición no descubrió diferencias.

3.2.2. Cálculo

El cálculo del valor del estadístico T sigue las fases que presentamos a
continuación:
Fase a)
Establecimiento de los valores de diferencia entre las puntuaciones de los
miembros de cada pareja y atribución del signo de conformidad con la hipótesis.
Las diferencias nulas no se toman en consideración, reduciendo el valor de n.
Fase b)
Atribución de rangos del 1º al n-ésimo, a las diferencias, comenzando
por la de menor valor absoluto; a continuación, asignación de los signos a
los rangos.
Fase c)
Cálculo de T o suma de los rangos de menor valor absoluto, sea cual
fuere el signo.
Fase d)
Interpretación del valor T empírico.
En el caso de muestras pequeñas, hasta valores de n = 25, la interpreta-
ción se hace contrastando directamente el valor empírico de T con los valo-

387
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

res críticos de la tabla para el tipo de hipótesis y nivel de significación de


que se trate. Valores empíricos de T iguales o menores que los de las tablas
permiten el rechazo de H0 con riesgo de error tipo I máximo igual al valor
de α elegido (nivel de significación). La determinación de tales valores crí-
ticos se lleva a cabo entrando por la columna correspondiente a α bajo la
rúbrica de hipótesis unilateral o de una cola o bilateral o de dos, y por la
fila correspondiente a n (N en las tablas) siendo éste el número de parejas
en que se ha constatado diferencia entre las puntuaciones de sus miembros.
Como ya hemos dicho, la distribución de T tiende a la normal a partir
de valores de n = 25; en tales casos deberemos calcular el valor zT, lo que,
––
naturalmente, exige previamente el cálculo de XT y sT por medio de las ecua-
ciones siguientes (10.13, 10. 14 y 10.15):

Ecuaciones 10.13, 10.14 y 10.15 para el cálulo de la media, sT y zT en la prueba de Wilcoson

n ( n + 1) n ( n + 1) (2n + 1) T − XT
XT = (23, 2) sT = zT =
4 24 sT

Como ya sabemos de las pruebas paramétricas, valores de zT iguales o


mayores a los del nivel de confianza o de significación elegidos permiten el
rechazo de H0 con riesgos de error tipo I no superiores al valor de α fijado
por el investigador.
Ejemplo tercero
Para la realización de la tesis doctoral un licenciado en Pedagogía desea
probar la hipótesis de que un método determinado, denominado aquí A, da
unos resultados superiores a los conseguidos mediante otro más antiguo, B,
utilizado en una determinada zona geográfica de España para el aprendi-
zaje de la ortografía.
Entiende que en tal aprendizaje hay al menos dos variables relevantes
que conviene controlar, siendo éstas el nivel ortográfico anterior y el Cocien-
te Intelectual (CI), además de la edad y curso de Educación Primaria.
En consecuencia, y a través de exploraciones que se realizan en su pro-
vincia, selecciona 40 niños, todos ellos de 10 años, y estudiantes de 5.° de
Primaria, formando 20 parejas igualadas en tales variables. Los sujetos for-
man parte de 8 colegios, siguiéndose en cuatro de ellos el método A y en los
otros cuatro el B.

388
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

La v.d. la mide como el número de palabras correctamente escritas de


un total de 200 con dificultad ortográfica, aprendidas a lo largo del curso,
cada grupo con su método.
Desea poner a prueba su hipótesis con un nivel de significación de 0,01.
He aquí los resultados:
Fase a)

Tabla 10.19. Datos de 20 parejas igualadas en sus resultados


en una prueba de ortografía

PAREJA 1.ª 2.ª 3.ª 4.ª 5.ª 6.ª 7.ª 8.ª 9.ª 10.ª 11.ª
XA 90 70 65 83 64 97 54 63 68 75 73
XB 86 75 61 74 59 82 79 63 62 70 71
Diferencia y signo +4 -5 +4 +9 +5 +15 -25 0 +6 +5 +2
RANGO +4 -7 +4 +15 +7 +18 +19 +9 +7 +1

PAREJA 12.ª 13.ª 14.ª 15.ª 16.ª 17.ª 18.ª 19.ª 20.ª
XA 69 82 66 69 80 82 65 63 69
XB 59 74 63 62 71 75 69 54 61
Diferencia y signo +10 +8 +3 +7 +9 +7 -4 +9 +8
RANGO +17 +12,5 +2 +10,5 +15 +10,5 -4 +15 +12,5

Fase b)
En la tabla anterior aparecen los rangos en la última fila. Esta forma de
asignar rangos puede originar alguna confusión. Por ello, aunque no es
necesario, se puede actuar ordenando las diferencias de menor a mayor, en
valor absoluto, y atribuyendo a continuación los rangos que, ahora, apare-
cen en forma consecutiva. El caso anterior, dejando ya fuera las filas XA y
XB, sería resuelto del modo siguiente:

Tabla 10.20. Datos de 20 parejas igualadas en sus resultados en una prueba


de ortografía, ordenadas sus diferencias de menor a mayor

PAREJA 8.ª 11.ª 14.ª 1.ª 3.ª 18.ª 2.ª 5.ª 10.ª 9.ª
Diferencia y signo 0 +2 +3 +4 +4 -4 -5 +5 +5 +6
Rango y signo – +1 +2 +4 +4 –4 –7 +7 +7 +9

389
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

PAREJA 15.ª 17.ª 13.ª 20.ª 4.ª 16.ª 19.ª 12.ª 6.ª 7.ª
Diferencia y signo +7 +7 +8 +8 +9 +9 +9 +10 +15 -25
Rango y signo +10,5 +10,5 +12,5 +12,5 -15 +15 +15 +17 +18 -19

La pareja 8ª quedará eliminada del análisis al no haber diferencia entre


las puntuaciones de sus miembros.

Obsérvese cómo vale tanto una diferencia de 1 punto como de 5 ó de


10 al asignar rangos: entre las parejas 11ª y 14ª hay una diferencia de un
punto —de 2 a 3—, pero entre la 12ª y la 6ª hay 5 puntos de diferencia
—de 10 a 15—, y entre la 6ª y la 7ª, de 10 puntos (al margen del signo)
—de 15 a 25—, y sin embargo, como todas esas puntuaciones son con-
secutivas en la lista ordenada de diferencias, quedan reducidas a un
rango de diferencia: 1º a 2º, 17º a 18º, y 18º a 19º respectivamente. He
aquí una de las claves de la menor potencia de las pruebas no paramé-
tricas y, en concreto, de ésta.

Fase c)

Suma de rangos de signo positivo: 160.

Suma de rangos de signo negativo: 30.

Por tanto, T = 30.

Fase d)

Para una hipótesis unilateral, y α = 0,01, siendo n = 19, el valor crítico


de T es 38. Como 38 > 30 podemos rechazar H0 con un riesgo de error tipo
I no superior a 0,01, es decir: afirmamos que el procedimiento o método A
da lugar a unos resultados en ortografía superiores a los alcanzados con el
método B, entendidos tales resultados como el número de palabras con difi-
cultad ortográfica correctamente escritas.

Conviene precisar que otras inferencias son supuestas, no demostradas;


si tales 200 palabras fueron bien seleccionadas —muestra suficiente y
representativa—, si la muestra de sujetos es, asimismo, representativa, y si
se dio control, cabe pensar en la superioridad del método A sobre el B en 5º
curso de Primaria.

390
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

Ejemplo cuarto
Un alumno de la UNED, para la realización de su trabajo de investi-
gación de doctorado, desea comprobar si se dan o no diferencias en el
rendimiento académico, entendido éste como calificación de fin de curso,
en función del tipo de material utilizado en la preparación del curso. Para
ello, y tras lograr la colaboración del profesor, se dividen al azar los cen-
tros asociados en dos grandes zonas, la A y la B, que estudiarán respecti-
vamente por las unidades didácticas, la A, y a través de una bibliografía
seleccionada y recomendada, integrada por 6 obras. La B.; para asegurar
la posibilidad de su uso, tales obras son depositadas en las bibliotecas de
los correspondientes centros asociados en número de cuatro ejemplares
de cada una.
Una vez dispuestas así las cosas, el autor del proyecto constituye 102
parejas de sujetos, dos por cada pareja de Centros, de forma que cada una
esté integrada por alumnos con la misma calificación media en cursos ante-
riores y, dado que la asignatura sobre la que se trabaja tiene otra similar en
el curso anterior, con idéntica nota en ella.
Al finalizar el curso recoge los datos de 81 parejas, además de los de 16
miembros de parejas de los que falta la calificación del otro por no haber-
se presentado a examen; faltan, asimismo, los resultados de 5 parejas com-
pletas por idéntica razón.
En el acto de examen se pidió a todos los sujetos que indicaran cómo
habían preparado el examen: a) mediante unidades didácticas únicamente;
b) por unidades didácticas y otros libros; c) mediante los libros recomen-
dados; d) a través de los libros recomendados y unidades didácticas; e) de
otras formas.
Como consecuencia de la respuesta a esta pregunta fueron descartados
del análisis estadístico los datos de 14 parejas por no ajustarse a las normas
de la investigación.
Los resultados aparecen a continuación. En todos los casos, y para evi-
tar en lo posible puntuaciones ligadas, el profesor calificó de 0 a 100, aun-
que luego las redujo a la clásica escala de 0 a 10.
Desea probar su hipótesis sobre la existencia de diferencias a un nivel
de confianza del 99%.

391
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Fases a y b)

Tabla 10.21. Datos correspondientes a 81 parejas atendiendo al material


utilizado en la preparación de la prueba presencial.

PAREJA 1.ª 2.ª 3.ª 4.ª 5.ª 6.ª 7.ª 8.ª 9.ª 10.ª 11.ª
XA 71 74 48 62 78 45 90 79 36 70 73
XB 55 22 65 59 26 40 57 37 84 45 65
Diferencia y signo 16 52 –17 3 52 5 33 42 –48 25 8
RANGO 23,5 64 –25,5 2,5 64 6 48 54,5 –59 37 13

PAREJA 12.ª 13.ª 14.ª 15.ª 16.ª 17.ª 18.ª 19.ª 20.ª
XA 72 60 74 38 37 30 41 88 49
XB 65 82 46 90 75 30 32 72 31
Diferencia y signo 7 –22 28 –52 –30 0 9 16 18
RANGO 10,5 –33 42 –64 –52,2 / 15 23,5 27,5

PAREJA 21.ª 22.ª 23.ª 24.ª 25.ª 26.ª 27.ª 28.ª 29.ª
XA 51 69 55 50 56 51 46 36 58
XB 81 41 43 50 39 50 16 86 32
Diferencia y signo –30 28 12 0 17 1 30 –50 26
RANGO -45,5 42 19 / 25,5 1 45,5 –60,5 39

PAREJA 30.ª 31.ª 32.ª 33.ª 34.ª 35.ª 36.ª 37.ª 38.ª
XA 79 52 61 40 65 45 43 48 78
XB 58 55 55 32 52 70 29 52 60
Diferencia y signo 21 –3 6 8 13 –25 14 –4 18
RANGO 32 –2,5 8 13 20 –37 21 –4,5 27,5

PAREJA 39.ª 40.ª 41.ª 42.ª 43.ª 44.ª 45.ª 46.ª 47.ª
XA 68 84 86 55 77 39 55 61 72
XB 37 42 39 35 54 32 51 42 36
Diferencia y signo 31 42 47 20 23 7 4 19 36
RANGO 47 54,5 58 31 34 10,5 4,5 29,5 50

392
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

PAREJA 48.ª 49.ª 50.ª 51.ª 52.ª 53.ª 54.ª 55.ª


XA 75 61 62 45 64 69 69 89
XB 51 67 52 37 39 63 50 53
Diferencia y signo 24 –6 10 8 25 6 19 36
RANGO 35 –8 16 13 37 8 29,5 50

PAREJA 56.ª 57.ª 58.ª 59.ª 60.ª 61.ª 62.ª 63.ª


XA 94 72 51 54 81 84 40 71
XB 49 45 62 39 53 39 51 35
Diferencia y signo 45 27 –11 15 28 45 –11 36
RANGO 56,5 40 –17,5 22 42 56,5 –17,5 50

PAREJA 64.ª 65.ª 66.ª 67.ª


XA 79 82 82 94
XB 50 44 32 43
Diferencia y signo 29 38 50 51
RANGO 44 52,5 60,5 62

Fase c)
Suma de rangos con signo positivo: 1.718.
Suma de rangos con signo negativo: 427.
Por lo tanto, T = 427.
Debe advertirse que, en un caso tan claro como éste, en que tan sólo 13
parejas exhiben signo negativo frente a 52 con signo positivo, no es necesa-
rio calcular la suma de rangos de ambos signos. Sin embargo, es un ele-
mento de comprobación ya que, al tratarse de muestras grandes, podemos
calcular zT para ambos, y si los cálculos están bien hechos, ambas deberán
resultar iguales salvo en el signo.
Fase d)
Al tratarse de muestras grandes, en las que T sigue el modelo normal,
calcularemos zT:

393
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

65 × 66 427 − 1.072, 5
XT = = 1.072, 5 zT = = −4, 22; o
4 153, 02
65 × 66 × 131 1.718 − 1.072, 5
sT = = 153, 02 zT = = 4, 22
24 153, 02

La interpretación de estos valores puede realizarse sobre la base de la


figura 10.7 —en la que aparecen marcadas las zonas correspondientes a las
diferencias explicables como fruto del azar, esto es, conforme a H0 y aque-
llas que, al ir más allá de tales límites, se consideran debidas al efecto de
v.i., con un riesgo de error máximo en este caso de 0,01—. Tales zonas,
teniendo en cuenta que el enunciado hace referencia a una hipótesis bila-
teral y a un valor α = 0,01, suponen la división de tal espacio de probabili-
dad —0,01— en dos mitades iguales, de 0,005 cada una.

Figura 10.7. Zonas conforme al azar H0 y no azar H1 y situación del resultado empírico.

Como puede apreciarse, los valores empíricos de zT quedan clara-


mente fuera de la zona de H0 dentro de las consideradas como de no
azar. En consecuencia podemos rechazar H0 y aceptar que estudiar con
unidades didácticas da lugar a calificaciones superiores a las consegui-
das utilizando los libros recomendados, siempre, claro está, que el dise-
ño sea correcto, esto es, que controle las variables extrañas. En cual-
quier caso el investigador acepta que su decisión cuenta con una
probabilidad de error de 0,01 como máximo, probabilidad que, en rea-
lidad, y dado el valor de zT empírico, es muy inferior. (Compruebe que
es inferior a 0,003%.)
Tal vez convendría aclarar que este resultado es algo fáctico, que nada
dice de la valía misma de los métodos que se contrastan. En realidad, y a
nivel universitario, no es conveniente reducirse al estudio de un libro de

394
ALGUNAS PRUEBAS NO PARAMÉTRICAS: SIGNOS χ2, T, U

texto, aunque tal afirmación venga matizada en este caso por las caracte-
rísticas especiales del alumno. de la UNED.

3.2.3. Potencia-eficiencia

La potencia-eficiencia de la prueba, tomando como referencia la para-


métrica t, según Mood, es aproximadamente del 95,5%, hallándose muy
próxima al 95% en muestras pequeñas.

395
Tema 11
Las pruebas paramétricas en diseños específicos

Presentación

1. Diseños de más de dos grupos


1.1. Resolución de un caso
1.2. Un caso de falta de validez interna

2. La covarianza en los diseños de grupos naturales


2.1. Estudio de un caso
2.2. Resolución estadística
2.3. Comparaciones entre medias ajustadas

3. Diseños de cuadrado latino


3.1. Estudio de un caso
3.2. Resolución estadística

4. Diseños factoriales
4.1. Estudio de un caso
4.2. Resolución estadística
4.3. Contrastes a posteriori
4.4. Manifestaciones de invalidez interna

Resumen

397
PRESENTACIÓN

Hasta ahora hemos presentado con mucho detalle los diseños de dos
grupos como elemento de referencia; con ello hemos pretendido facilitar la
comprensión de los conceptos fundamentales y las técnicas básicas a su
servicio.
En este último tema de la segunda unidad didáctica abordaremos sin
tanto detalle cuatro diseños que presentan diversas peculiaridades, bien sea
por el número de niveles de la variable independiente: tres o más; por la
forma de selección de los sujetos: como miembros de grupos naturales, esto
es, de grupos ya constituidos y por tanto no seleccionados al azar; por la
forma de controlar posibles variables extrañas mediante su introducción en
el propio diseño –cuadrado latino; o, por último, por el número de variables
independientes: diseños factoriales.
Los conceptos hasta aquí estudiados son aplicables a estos diseños, y las
ideas básicas de las pruebas paramétricas, también. Por ello, las explica-
ciones serán sensiblemente más breves que hasta aquí.

1. DISEÑOS DE MÁS DE DOS GRUPOS

Con frecuencia, la variable independiente que, hasta ahora, la hemos


considerado con solo dos manifestaciones o niveles (dos métodos, dos sis-
temas de agrupamiento, dos formas de motivación…) presenta más de dos;
podemos contrastar tres o más métodos para el aprendizaje de idiomas;
tres o más modalidades de motivación para mejorar el rendimiento; tres o
más formas de agrupamiento para mejorar las habilidades sociales…
Metodológicamente, estos diseños, si cumplen los requisitos ya ana-
lizados, se pueden resolver mediante una prueba F, dado que, como

399
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

hemos señalado, la prueba t solo es válida para contrastar medias de dos


grupos.
En la práctica, los planteamientos para el cálculo de las SC, tanto la
total (SCT), como la correspondiente a entre grupos (SCE),y dentro de los
grupos (SCD), son exactamente iguales que para diseños de dos grupos. La
única diferencia, obvia por otra parte, es que la SCE tendrá ahora tres o más
sumandos en lugar de solo dos. También este hecho repercutirá en los
correspondientes grados de libertad (g.l.).

1.1. Resolución de un caso

Presentamos a continuación un caso como ejemplo de este tipo de dise-


ños:

En el contexto del Espacio Europeo de Educación Superior se desea


someter a contraste diversas modalidades de actuación del profesorado
orientadas a promover el éxito en el aprendizaje de competencias.

Las modalidades de actuación son cuatro: A, B, C y D, las dos primeras, en


formato presencial y las dos últimas, on line. El aprendizaje se mide con una
buena prueba, altamente fiable y suficientemente válida, que permite estable-
cer diferencias aproximadamente iguales entre cada dos valores consecutivos
de la variable dependiente.

El investigador pudo comprobar que, durante el desarrollo de la investi-


gación, en dos grupos hubo que modificar el proceso previsto como conse-
cuencia de algunas alteraciones promovidas por el alumnado.

El investigador desea contrastar su hipótesis sobre la existencia de dife-


rencias estadísticamente significativas, para α≤ 0.05 entre las cuatro modali-
dades de actuación y, en el supuesto de una respuesta positiva, entre qué
pares de modalidades de actuación se dan tales diferencias.

Los datos medidos en la variable dependiente se presentan en la tabla


11.1:

400
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

Tabla 11.1. Datos medidos en la variable dependiente. según


la modalidad de intervención
MODALIDADES DE ACTUACIÓN
A B C D
7 5 6 7
5 5 9 6
9 6 5 8
7 4 6 7
9 5 8 6
8 3 7 9
6 7 7 9
6 5 5 9
4 4 6 5
8 4 8 6
ΣX = 67 ΣX = 48 ΣX = 67 ΣX = 72
ΣX2 = 428 ΣX2 = 242 ΣX2 = 532 ΣX2 = 538

Estamos, pues, ante un diseño de una sola variable independiente, pero que
presenta cuatro niveles diferentes, las modalidades de actuación A, B, C y D.
Es, por tanto, un análisis de la varianza simple, con la única diferencia
con el caso ya conocido referente a los g.l. para «entre grupos» y su corres-
pondiente SCE.
Como en el cuadro de datos no aparecen los valores totales, será preci-
so calcular las SC haciendo esos cálculos previamente.
2
N

S.C.T = ∑
N
2
X −
( ∑X )
i=1
i

1
i=1 N

SCT = (428 + 242 + 532 + 538) - (67 + 48 + 67 + 72)2 / 60 = 1740 – (254)2


/ 40 = 1740 – 1612,9 = 127,1.
El valor 1612,9, resultante de (254)2 / 40, se denomina C o término de
corrección y se utiliza en el cálculo de SCE.
2 2
n N

G (∑ X ) (∑ X )
1 1

S.C.E = ∑
i=1 i=1

i=1 n N

401
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

SCE = (672 + 482 + 672 + 722) / 10 – C = (4489 + 2304+ 4489 + 5184) / 10 –


C = 1646,6 – 1612,9 = 33,7
SCD = SCT – SCD = 127,1 – 33,7 = 93,4
Pasando los datos al cuadro resumen del ANAVA tenemos:

Tabla 11.2. Cuadro resumen para el ANAVA simple de una variable


independiente con cuatro niveles
Fuente de variación SC g.l. MC F Ttablas
Entre grupos 33,7 3 11,233 4,33 ~ 2,85
Dentro de los grupos 93,4 36 2,594
TOTAL 127,1 39

0.95F(3 y36) ~ 2,85 < 4,33. Por tanto, podemos rechazar H0 con una
probabilidad maxima de error tipo I de 0,05 (5 %)
Como F solo indica que hay diferencias «en general», conviene ahora
hacer pruebas «a posteriori» para ver entre qué pares de medias aritméti-
cas se dan. Lo haremos únicamente con las dos medias más extremas, las
de los grupos B y D, cuyas medias son, respectivamente, 4,8 y 7,2.
La prueba de Tukey:
Media de B – Media de D (en valor absoluto) dividido por la raíz cua-
drada de la MCD / n, esto es: (4,8 – 7,2) / √ 2,594 / 10 = 2,4 / √ 0,2594 = 2,4 /
0,509 = 4,71
Este valor debe contrastarse con el valor q con g y (N –g) g.l. donde g es el
número de grupos. En nuestro caso, tal valor para 4 y 36 g.l., siendo α ≤ 0,05 ~ 3,9
Dado que 3,9 < 4,71, la diferencia es estadísticamente significativa, con
una probabilidad máxima de error tipo I de 0.05 (5%)
Cabría hacer ahora lo mismo con los pares de medias siguientes: 4,8
frente a 6,7, y 6,7 frente a 7.2

1.2. Un caso de falta de validez interna

Al margen de este resultado, conviene hacer notar un hecho que afecta a la


validez interna del diseño. En efecto, en la información que se nos da se afirma:

402
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

El investigador pudo comprobar que, durante el desarrollo de la investi-


gación, en dos grupos hubo que modificar el proceso previsto como conse-
cuencia de algunas alteraciones promovidas por el alumnado.

Estamos claramente ante la fuente de invalidez interna conocida como


historia. Este hecho pone en tela de juicio la posibilidad de atribuir las dife-
rencias encontradas a la variable independiente ya que podrían deberse a la
citada modificación del proceso o a su interacción con la variable indepen-
diente. Pero esto, como es lógico, nada tiene que ver con el procedimiento
estadístico.

2. LA COVARIANZA EN LOS DISEÑOS DE GRUPOS NATURALES

Recordemos que en el principio MAX-MIN-CON se insiste en el papel


clave que debe jugar el control, tanto en el momento inicial (a fin de asegu-
rar que en la situación de partida los diversos grupos es equivalente, sin
diferencias estadísticamente significativas), como durante el proceso de la
investigación, con el de mantener controladas las variables extrañas, de
modo que no se conviertan en hipótesis rivales de la sometida a contraste
por el investigador.
A los efectos del control, hemos conocido varios procedimientos: el más
deseable en términos metodológicos, pero tal vez el más difícil de aplicar y
no siempre aconsejable desde perspectivas pedagógicas o educativas, el del
azar; a su lado hemos situado como alternativa los procedimientos de
emparejamiento y de bloqueo. Sin embargo, es preciso reconocer que uno y
otro sistema presentan serias dificultades en el ámbito educativo, donde,
con frecuencia, el investigador debe tomar como sujetos a personas que for-
man parte de grupos ya constituidos por otro tipo de procedimientos, ale-
jados tanto del azar como del emparejamiento o bloqueo.
En efecto: como bien se puede imaginar, muchas investigaciones se lle-
van a cabo en el marco de instituciones educativas, en especial de colegios;
o en grupos de personas en ámbitos no institucionales, como puede ser el
caso de la animación sociocultural... Podríamos afirmar que nos situamos
ante grupos naturales, que, por su propia forma de constitución, no asegu-
ran ese control inicial.

403
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

El caso es que, en tales situaciones, si no se dispone de alguna estrate-


gia para lograr el citado control, y de alguna herramienta para constatarlo,
poco podremos hacer en el marco de la investigación experimental.
La salida a la situación consiste en la posibilidad de disponer de alguna
o algunas covariables, esto es, variables que covarían con la dependiente,
con la que mantienen correlaciones significativas. En la medida en que dis-
pongamos de alguna o algunas variables de este tipo, el análisis de cova-
rianza nos aporta la posibilidad no sólo de contrastar si las diferencias fina-
les van más allá del azar, como ocurre con la prueba F (análisis de varianza),
sino que hace posible ajustar las diferencias así constatadas a las posibles
diferencias iniciales no controladas por los métodos ya reseñados.
Pues bien: este es el objeto del presente apartado, con el que se preten-
de conocer, comprender, reconocer y formular preguntas de investigación
para las que deba formularse una hipótesis que deba resolverse mediante
una prueba F de análisis de covarianza, así como resolver e interpretar pro-
blemas de investigación mediante diseños de covarianza y definir, con pre-
cisión y claridad, conceptos fundamentales como los de covarianza, cova-
riable, medias ajustadas o coeficiente de regresión.

2.1. Estudio de un caso

En un departamento universitario se está investigando la influencia de tres


sistemas de disciplina en las aulas sobre el aprendizaje de habilidades sociales. El
investigador plantea la hipótesis de que tales sistemas darán lugar a diferencias
significativas que desea contrastar para α≤ 0.05.
Los tres grupos son los que integran el primer curso de educación secundaria
en un determinado colegio privado de su localidad. La investigación se extiende
a lo largo del segundo trimestre del curso académico.
En el citado colegio se dispone de los datos de una prueba de habilidades
sociales pasada por el orientador a principios de curso; el investigador decide
tomarlos en cuenta en el marco de su investigación.
Los sujetos, n = 8 por grupo, se seleccionan al azar del total de los niños de
clase y los sistemas de disciplina se asignan también al azar a cada uno de los
grupos de seis alumnos.

404
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

Los datos se recogen en la tabla 11.3, donde X= covariable; Y = variable


dependiente o variante.

Tabla 11.3. Puntuaciones de 32 sujetos en habilidades sociales


(variable Y) y en una covariable (X)
GRUPO A GRUPO B GRUPO C TOTAL
X Y X Y X Y X Y
6 4 7 7 3 5 5 5
7 6 6 8 5 6 4 6
4 5 6 9 5 6 7 9
5 9 9 8 6 7 6 8
9 8 7 10 2 4 2 3
7 9 10 10 7 7 5 7
6 4 8 7 8 8 6 8
5 7 6 8 9 8 4 5

Como se desprende del enunciado, estamos en un caso cuya resolución


estadística más adecuada es una prueba F para el análisis de la covarianza.
Llegamos a tal conclusión al ver que los sujetos no han sido seleccionados
por ninguna de las formas orientadas a asegurar una equivalencia inicial,
como el azar, el emparejamiento (en este caso se trataría de la formación
de «cuartetos», esto es, de grupos de cuatro alumnos equiparados en una
variable relevante para el problema) o bloqueo, como veremos en los dise-
ños de cuadrado latino. Son grupos naturales.
Por otra parte, disponemos da datos previos al inicio de la investigación,
como es el caso de la prueba aplicada al inicio de curso por el orientador.
Parece ser que el investigador considera que la variable medida por ella
covaría con la variable dependiente (habilidades sociales). De hecho, en los
datos se nos ofrecen los resultados de la variable dependiente o variante (Y)
y de tal covariable (X).
Debemos señalar que no es suficiente contar con una covariable; debe
tratarse de una variable que correlacione —covaríe— con la variable depen-
diente, algo que podríamos constatar en este caso aplicando el coeficiente
de correlación adecuado.
Pues bien: con esta información, parece razonable que el investigador
decida probar su hipótesis (H1) frente a la de nulidad (H0) mediante un aná-
lisis de covarianza.

405
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

2.2. Resolución estadística

Veamos un nuevo ejemplo, convenientemente resuelto.

Se pretende comprobar la hipótesis de que los métodos de aprendizaje de pre-


lectura —A, B y C— influyen en diferente grado en los resultados alcanzados al
final de curso por los alumnos de educación infantil de un colegio determinado. Se
desea contrastar la hipótesis para α≤ 0,01 y, en caso de resultar validada, si se dan
diferencias estadísticamente significativas entre los resultados de los grupos A y B.

El investigador selecciona tres aulas, les asigna aleatoriamente los métodos


y, a los efectos de probar su hipótesis, escoge al azar 6 niños por aula cuyos
resultados tomará para tal fin. Dado que en el colegio existen datos de explora-
ciones psicopedagógicas previas sobre aptitudes, decide utilizar tales datos -
variable X, covariable- para probar su hipótesis.

Los datos recogidos en la tabla 11.4 nos presentan, para cada grupo y
para cada uno de sus miembros, los resultados de la aplicación de los méto-
dos, A, B y C (variable dependiente, Y) y de las correspondientes puntua-
ciones en la covariable (X)
Tabla 11.4. Resumen de las puntuaciones de los sujetos en la variable
dependiente Y y en la covariable X
MÉTODOS A, B y C
GRUPO A GRUPO B GRUPO C TOTAL
X Y X Y X Y X Y
ΣX 43 32 47 41 37 25 127 98
ΣX2 323 178 375 283 239 111 937 572
ΣXY 237 324 162 723
(*) Los valores ΣX y ΣX representan la suma de las puntuaciones directas –primer caso- y de sus cua-
2

drados –segundo caso- tanto para la variable Y como para la covariable. El valor ΣXY es la suma de los
productos de los valores X de cada uno de los 6 sujetos por grupo –y, en su caso, de los 18 del total- por
sus correspondientes valores de Y.

Veamos la situación:
a) Parece que nos encontramos ante tres grupos ya formados. No debe
confundirnos el hecho de que, dentro de ellos, se seleccionen 6 niños
al azar ni que la variable métodos sea asignada a los grupos también

406
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

al azar. El hecho es que los grupos ya estaban constituidos, lo que no


garantiza una equivalencia inicial antes de aplicarles los métodos que
les hayan correspondido.
b) Disponemos de una covariable: se trata de los resultados de una prue-
ba realizada en el marco de las exploraciones psicopedagógicas pre-
vias. Contamos, por tanto, con medidas pre-test, que podemos utili-
zar como covariable para, al final, controlar su posible efecto
diferencial sobre los resultados finales, ajustando las medias finales a
las posibles diferencias iniciales.
En consecuencia, procede resolver el caso mediante un análisis de la
covarianza. Veamos su resolución.
Debemos calcular las SC, las MC y las F tanto para el total como entre
grupos y dentro de los grupos, y ello no solo para la variable Y sino para X
y para su producto (XY). Si se tratara de un ANAVA simple solo tendríamos
que calcularlas para Y.
Veamos primero las tres SCT:
SCT(X) = 937 - (1272 : 18) = 937 - 896,05 = 40,94. Recordemos que
(1272 : 18) = 896,05 es el término de corrección que utilizamos en
cálculos posteriores.
SCT(Y) = 572 - ( 982 : 18) = 572 - 533,55 = 38,44
SCT(XY) = 723 - [(127 x 98) : 18] = 723 - 691,44 = 31,56

Ahora las SCE:


SCE(X) = [(432 + 472 + 372) : 6] - 896,05 = 904,5 - 896,05 = 8,44
SCE(Y) = [(322 + 412 + 252) : 6] - 533,55 = 555 - 533,55 = 21,44
SCE(XY) = [(43 x 32) + (47 x 41) + (37 x 25) : 6] - (127 x 98) : 18 = (4228:
6) - 691,44 = 704,67 - 691,44 = 13,23

Por último, las SCD:


SCD(X) = 40,94 - 8,44 = 32,5; SCD(Y) = 38,44 - 21,44 = 17; SCD(XY) =
31,56 - 13,23 = 18,33
Con estos datos podríamos realizar un ANAVA simple tanto para la
variable dependiente (Y) como para la covariable (X). Llegaríamos a cons-

407
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

tatar si hay o no diferencias significativas como resultado de la aplicación


de los métodos y si las había o no antes de comenzar la investigación. Sin
embargo, siempre nos quedaría la duda sobre el posible efecto de las dife-
rencias iniciales que puedan existir como consecuencia de no haber utili-
zado un sistema de control inicial.
El hecho de que contemos con datos de pretest nos permite realizar el
análisis de covarianza, para lo que debemos calcular las SC y MC corres-
pondiente a la variable dependiente (Y) ajustada1. Para ello aplicaremos las
ecuaciones correspondientes, recogidas en el cuadro 11.1:

Cuadro 11.1. Ecuaciones para el cálculo de las SC y MC ajustadas

SC 2T ( XY )
SC Y . X = SC T ( Y ) −
T
SC T ( X )

SC 2D( XY )
SC Y . X = SC D( Y ) −
D
SC D( X )

SC Y . X = SC Y . X − SC Y . X
E T D

MCY.X, esto es, M.C. de la variable Y ajustada: MCY.X ; MCY.XE;


T
MCY.XD.

SCY.X(T) = 38,44 - (31,562 : 40,94) = 38,45 - 24,33 = 14,11


SCY.X(D) = 17 - (18,332 : 32,5) = 17 - 10,34 = 6,66
SCY.X(E) = 14,11 - 6,66 = 7,45

Tabla 11.5. Resumen del análisis de la covarianza


Fuente de variación SCY.X SCXY (*) g.l. MCY.X F
- Entre grupos 7,45 13,23 2 3,73 7,77
- Dentro grupos 6,66 18,33 14 0,48
TOTAL 14,11 31,56 16
(*) Estos datos se utilizan para calcular bdentro, no para F.

1
Obsérvese la diferencia en el orden de los cálculos así como la pérdida de un g.l. en el caso de den-
tro de los grupos.

408
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

El contraste de nuestra F con la de las tablas, para 2 y 14 g.l. (6,51) nos


lleva a la conclusión de que podemos rechazar H0 al nivel de significación
(α) seleccionado, a pesar de lo elevado de este (0.01).

2.3. Comparaciones entre medias ajustadas

La siguiente cuestión que interesa al investigador se centra en apreciar


si las diferencias que, en general, han resultado ser significativas, lo son en
concreto para los grupos A y B. Debemos hacer, por tanto, un contraste
específico. Para ello debemos calcular las medias ajustadas de los grupos A
y B para α ≤ 0,01, lo que exige, según las ecuaciones recogidas en el cuadro
11.2, el cálculo del coeficiente de regresión dentro de los grupos (bdentro).

Cuadro 11.2. Ecuación para el cálculo de bdentro, de las medias ajustadas y


del correspondiente valor de F
–– –– ––
MediaY.X = Y – bD (X – XG), donde:
––
X = media de la variable X para cada uno de sus grupos.
––
XG = media general de la variable X.
––
Y = media de la variable Y para cada uno de sus grupos.
bD = coeficiente de regresión dentro de los grupos, sabien-
do que:
bD = SCD(XY)/SCD(X)
Contraste entre medias de Y ajustadas, por ejemplo para
los grupos A y B:

(Media Y . X ( A ) − Media Y . X ( B ) )2
F=
MC Y . X
D
[ 2 ( X A − X B )2
n
+
SC D( X ) ]
donde MediaY.X(A) = media ajustada de Y en el grupo A,
siendo F con 1 y con [g(n – 1) – 1] g.l.

bdentro = SCD(XY) : SCD(X) = 18,33 : 32,5 = 0,564

409
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Y, ahora, las medias ajustadas (simbolizadas por MediaY.X):


MediaY.X(A) = (32 : 6) - 0,564 [(43 : 6) - (127 : 18)] = 5,33 - 0,564 (7,17 -
7,05) = 5,33 – 0,07 = 5,26
MediaY.X(B) = (41 : 6) - 0,564 [(47 : 6) - (127 : 18)] = 6,83 - 0,564 (7,83 –
7,05) = 6,83 -0,44 = 6,39
Por último, el contraste F:

(6, 39 − 5, 26)2
F= = 1, 28 : 0, 48 (0, 333 + 0, 013)
0, 48 [2 / 6 + (7,17 − 7, 83)]2 / 32, 5

= 1, 28 : 0, 48 × 0, 346 = 1, 28 : 0,166 = 7, 71

Valor a todas luces significativo. En efecto:

0.95 F2 y 14 = 3,74 < 7,71


En el caso de comparar las medias ajustadas de los grupos B y C el resul-
tado sería F = 15,92, también estadísticamente significativo. Por último,
comparando las medias ajustadas de los grupos A y C, también F resulta ser
significativa.

3. DISEÑOS DE CUADRADO LATINO

Como sabemos desde el tema 6, este tipo de diseños incorpora, como


medio para controlar posibles variables extrañas, dos variables que deno-
minamos de bloqueo. Lo que se pretende con ellas, de forma similar a la
que hemos visto con el emparejamiento (o con la formación de tríos, o de
cuartetos igualados…) es constituir bloques de sujetos tan homogéneos
como sea posible en variables que, de no ser controladas, bien podrían
actuar como extrañas.
En estos casos, tales variables no son tomadas como independientes; lo
que le importa al investigador no es establecer estadísticamente su influen-
cia sobre la dependiente sino controlar su posible efecto sobre ella.
A tal fin, los sujetos de los diferentes grupos deberán pasar por los dis-
tintos niveles de la variable independiente, denominada por lo general «tra-
tamiento», haciendo así que su efecto quede equilibrado.

410
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

3.1. Estudio de un caso

En un departamento universitario se está investigando la influencia de tres


sistemas de disciplina en las aulas (sistemas M, N y O) sobre el aprendizaje de
habilidades sociales en el caso de niños que sufren minusvalía. El investigador
plantea la hipótesis de que tales sistemas darán lugar a diferencias estadística-
mente significativas que desea contrastar para α≤ 0.01.
Considera que tal aprendizaje está relacionado con el carácter, más o menos
extravertido, y con el grado de minusvalía. En consecuencia decide asignar los
citados sistemas de disciplina a grupos de 3 alumnos en función de su carácter
más o menos extravertido (bloques A, B y C) y del grado de minusvalía (bloques
1, 2 y 3, de mayor a menor minusvalía). Tales grupos se constituyen a partir de
los alumnos que integran el cuarto curso de educación primaria en determina-
dos colegios públicos de su localidad. La investigación se extiende a lo largo del
segundo trimestre del curso académico.
Los sistemas de disciplina M, N y O se asignan al azar a cada uno de los blo-
ques de alumnos en la combinación de grado de extraversión y de minusvalía.
Los datos se recogen en la tabla 11.6:

Tabla 11.6. Puntuaciones de nueve sujetos en un diseño


de bloques con un sujeto por celdilla

GRADO DE GRADO DE MINUSVALÍA


EXTRAVERSIÓN 1 2 3
M N O
A
5 6 9
N O M
B
6 6 8
O M N
C
4 8 6

Como podemos apreciar, cada combinación de «grado de extraversión»


con «grado de minusvalía» recibe los tres niveles –M, N y O- de la variable
independiente «sistemas de disciplina». De este modo, el posible influjo de
ambas variables posiblemente extrañas queda controlado, de forma que
podemos establecer si es la v.i., con sus tres niveles, M, N y O, y no otra
cosa, lo que produce los efectos que puedan darse en la v.d.: habilidades
sociales en niños con minusvalía.

411
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Obsérvese que los niveles M, N y O deben aparecer, para lograr su efec-


to, una sola vez por fila y columna.

3.2. Resolución estadística

En un departamento universitario se esta investigando sobre la influencia


de tres sistemas de disciplina en las aulas (sistemas M, N y O) sobre el apren-
dizaje de habilidades sociales. El investigador plantea la hipótesis de que tales
sistemas darán lugar a diferencias estadísticamente significativas, que desea
contrastar para α≤ 0.1 y para α≤ 0.05.

Considera que tal aprendizaje está relacionado con el carácter, más o


menos extravertido, y con la edad. En consecuencia decide asignar los citados
sistemas a grupos de 15 alumnos en función de su carácter más o menos extra-
vertido (bloques A, B y C) y de su edad (bloques 1, 2 y 3, integrados por niños
de 6 años a 6,2, de 6,3 a 6,6, y de 6,7 a 6,9 respectivamente). Tales grupos se
constituyen a partir de los que integran el cuarto curso de educación primaria
en un determinado colegio público de su localidad. La investigación se extien-
de a lo largo del segundo trimestre del curso académico.

Los sistemas de disciplina M, N y O se asignan al azar a cada uno de los


bloques de cinco alumnos en la combinación de grado de extraversión y edad,
pero de forma que se respete la presencia de cada sistema una vez por fila y
columna.

Los datos se recogen en la tabla 11.7.:

Tabla 11.7. Puntuaciones de 45 sujetos en un diseño de bloques


con más de un sujeto por celdilla

GRADO DE EDAD
EXTRAVERSIÓN 1 2 3
M N O
A
5,7,8,6,9 7,5,6,8,9 3,3,6,4,5
N O M
B
5,5,4,3,6 6,6,7,6,3 4,6,4,5,5
O M N
C
3,5,4,3,4 5,6,8,2,3 6,6,8,4,5

412
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

La resolución estadística de este diseño, de cuadrado latino con más de


un sujeto por celdilla, presenta la novedad de que aparece una nueva fuen-
te de variación, conocida como residual entre celdas.
He aquí los planteamientos y las soluciones. En primer lugar hacemos
los cálculos básicos para llevar a cabo las SC y las MC. Se recogen en la
tabla 11.8:

Tabla 11.8. Puntuaciones de 45 sujetos, y cálculos básicos,


en un diseño de bloques con un sujeto por celdilla

GRADO DE EDAD
TOTAL FILAS
EXTRAVERSIÓN 1 2 3
M N O
A 5,7,8,6,9 7,5,6,8,9 3,3,6,4,5 ΣX = 91
ΣX= 35; ΣX2 = 255 ΣX = 35, ΣX2 = 255 ΣX =21; ΣX2 = 95 ΣX2 = 605
N O M
B 5,5,4,3,6 6,6,7,6,3 4,6,4,5,5 ΣX = 75
ΣX =23; ΣX2 = 111 ΣX =28; ΣX2 = 166 ΣX =24; ΣX2 = 118 ΣX2 = 395
O M N
C 3,5,4,3,4 5,6,8,2,3 6,6,8,4,5 ΣX = 72
ΣX= 19; ΣX2 = 75 ΣX =24; ΣX2 = 138 ΣX = 29; ΣX2 = 177 ΣX2 = 390
TOTAL
TOTAL ΣX = 77 ΣX = 87 ΣX = 74
ΣX = 238
COLUMNAS ΣX2 = 441 ΣX2 = 559 ΣX2 = 390
ΣX2 = 1390

Pasamos ahora a plantear y calcular las diferentes SC:


SCT = 1.390 - (2382 : 45) = 1.390 - 1258,75 = 131,25
SCfilas = [ (912 + 752 + 722) : 15] - (2382 : 45) = 1.272,67 – 1.258,75 = 13,92
SCcolumnas = [ (772 + 872 + 742) : 15] - (2382 : 45) = 1264,93 – 1258,75 = 6,18
Para SCtratamientos debemos primero sumar los valores en la v.d. de cada
uno de los tres métodos:
Sistema M: 35 + 24 + 24 = 83
Sistema N: 35 + 23 + 29 = 87
Sistema O: 21 + 28 + 19 = 68

413
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

SCtratamientos = [(832 + 872 + 682) : 15] - (2382 : 45) = 1272,13 - 1258,75 =


13,38
SCentre celdas = [ (352 + 352 + 21 +.... + 292) : 5] - (2832 : 45) = 1311,6 -
1258,75 = 52,85
SCresidual entre celdas = 52,85 - (13,92 + 6,18 + 13,38) = 19.37
SCdentro (error) = 131,25 - 52,85 = 78,4
Planteamos ahora al cuadro resumen del ANAVA (tabla 11.9)

Tabla 11.9. Cuadro resumen del ANAVA en un diseño de cuadrado latino


con más de un sujeto por celdilla

Fuente de variación SC g.l. MC F


Entre celdas 52,85 8 6,61
- Tratamientos (Sistemas disciplina) 13,38 2 6,69 3,07
- Filas 13,92 2 6,96
- Columnas 6,18 2 3,90 4,44
- Residual entre celdas 19,37 2 9,69
Error (dentro celdas) 78,40 36 2,18
TOTAL 131,25 44

0.90F(2 y 36) ~ 2,46 < 3,07. Por tanto, la diferencia es estadísticamente sig-
nificativa. Podría rechazar H0 con una probabilidad máxima de cometer un
error tipo I de 0.1 (10 %)
En el caso de probar su hipótesis para α≤ 0.05

0.95F(2 y 36) ~ 3,28 > 3,07. En consecuencia, la diferencia no sería estadísti-


camente significativa; no se debería rechazar H0 porque lo estaría haciendo
con una probabilidad máxima de cometer un error tipo I superior a 0,05
que es la inicialmente aceptada al plantear su hipótesis.
En torno a estos datos, unos comentarios:
a) Cuanto más elevado es el nivel de significación estadística (esto es:
cuanto menor es el valor de α) más difícil resulta el rechazo de H0. Si
ese nivel es inferior a 0,05, como ocurre en el primer caso, podemos
rechazarla más fácilmente, pero no todos los científicos aceptan nive-
les con el de 0,1.

414
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

b) Si aceptamos el primero de los planteamientos, es decir, α≤ 0.1, debe-


remos analizar si los datos permiten atribuir los resultados a la v.i. o
a su interacción con las variables de bloqueo. Esto es muy importan-
te, y lo vamos a analizar.
Veamos: al analizar el cuadro, podemos ver que, en cada una de las cel-
dillas, confluyen el cruce de dos niveles de las variables de bloqueo con los
datos del correspondiente nivel de la v.i. Por ejemplo, en la celdilla superior
izquierda confluyen los datos de los niveles A (extraversión) y 1 (edad) con
los del nivel M de la v.i.
Si la interacción fuera estadísticamente significativa tendríamos un
grave problema: no poder dilucidar si los resultados en la v.d. se debe a la
v.i. o la citada interacción. Por ello, en estos diseños debemos analizar la
significación estadística denominada «residual entre celdas». Si no fuera sig-
nificativa deberíamos entender que su efecto es despreciable y que, por
tanto, el valor de F para los tratamientos o niveles de la v.i. sobre la depen-
diente sí pueden tomarse en consideración. De no ser así, no debería seguir
adelante el investigador.
En este caso estamos ante 0.90F(2 y 36) ~ 2,46 < 4,44. Por tanto, el valor es sig-
nificativo, lo que invalida nuestro diseño al no poder diferenciar ambos efec-
tos: el de v.i. y el de la interacción, también conocido como de «no aditividad»
En el segundo caso no es necesario valorar este valor, dado que F, como
hemos podido apreciar, es no significativa en términos estadísticos.
Recordemos, por tanto, que, en caso de de una F entre tratamientos
estadísticamente significativa, si F residual también lo fuera nos impediría
hacer inferencias correctas sobre la existencia de las diferencias entre sistemas
de disciplina ya que no podríamos deslindar lo que es efecto de la variable
independiente y lo que lo es de las interacciones. De hecho, esta es una de
las limitaciones de este tipo de diseños; obviamente, cuando no se da inter-
acción, el diseño tiene ventajas, como las relativas al control de dos varia-
bles que podrían actuar como extrañas.

4. DISEÑOS FACTORIALES

Los diseños hasta aquí estudiados siempre han mantenido un ele-


mento constante: la presencia de una única variable independiente que,

415
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

en la medida en que es adecuadamente controlada por el investigador


(manipulación de la misma, capacidad de decisión sobre los niveles a
estudiar), y siempre que éste sea capaz de mantener bajo control las
variables extrañas a fin de que no se conviertan, en terminología de
Campbell y Stanley, en hipótesis rivales de la suya, aseguran la validez
interna y, en consecuencia, hacen posible establecer relaciones causales
entre la variable independiente y la dependiente, siempre, eso sí, con un
riesgo de error prefijado por el investigador cuya probabilidad es la fija-
da para α.
Sin embargo, es preciso reconocer que, en aras de ese control, los dise-
ños con una única variable independiente simplifican en exceso una reali-
dad por lo general más compleja, como ocurre con la Educación.
Una forma de acercar la complejidad de la realidad a la metodología de
la investigación consiste en estudiar simultáneamente dos, o más, variables
independientes (aquí denominadas factores), que actúan a la vez sobre una
variable dependiente.
Esta posibilidad es ya un gran avance respecto a los diseños estudiados
hasta el momento. Pero los diseños factoriales nos ofrecen una aportación
de mayor trascendencia: la posibilidad de descubrir la existencia de inter-
acción entre las variables. Nótese que este aspecto, que era negativo en los
diseños de cuadrado latino, aquí no lo es dado que podemos distinguir lo
que es efecto de las variables independientes o factores del atribuible a tal
interacción.
Y es que, con frecuencia, la influencia de los niveles de una variable
independiente no siempre es uniforme; en efecto, ocurre en ocasiones que
el influjo mayor o más adecuado se da por medio de una determinada com-
binación de los efectos de una de ellas —de un factor— con los de la otra
variable independiente o factor. Así, bien puede ocurrir que un determina-
do método sea más eficaz que otro cuando se aplica a un determinado tipo
de niños, por ejemplo los de un estilo cognitivo, invirtiéndose la situación
con los de estilo cognitivo diferente. O que un sistema de disciplina (nor-
mativa de un colegio) resulte más eficaz con niños de primaria, cambiando
la situación cuando estos han pasado a la pubertad y se encuentran en el
nivel secundario.

416
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

4.1. Estudio de un caso

Se está investigando la influencia que ejercen dos sistemas de recompensas


—A y B— y dos modalidades de trabajo en el aula –X e Y- sobre la satisfacción
del alumnado en el aula.

Se trabaja con cuatro grupos de 5 niños cada uno, a los que se ha asignado
los niveles de ambos factores de forma aleatoria. Las hipótesis se contrastarán
para α≤ 0.05.

Los datos se recogen en la tabla 11.10.

Tabla 11.10. Datos correspondientes a 20 alumnos


en un diseño factorial de dos factores fijos

Sistemas de recompensa
Modalidades de trabajo en el aula
A B
X 4,6,3,6,1 4,6,5,4,6
Y 7,5,7,6,5 7,8,9,7,9

La tabla 11.10 podemos convertirla en la siguiente, donde sustituimos


las puntuaciones de los sujetos por las medias aritméticas de cada grupo

Tabla 11.11. Medias correspondientes a 20 alumnos


en un diseño factorial de dos factores fijos

Sistemas de recompensa
Modalidades de trabajo en el aula
A B
X 4 5
Y 6 8

Si ponemos en relación los valores de la variable modalidades de trabajo con


el nivel A de la variable sistemas de recompensa, apreciamos un efecto de dos
puntos (se pasa de un promedio de 4 a otro de 6), mientras que si lo hacemos
con el nivel B, el efecto es de 3 puntos (se llega a un promedio de 8 frente a 5).
Podemos interpretar estos datos señalando que el efecto diferencial de
la variable modalidades de trabajo es superior cuando actúa sobre el nivel B
de la variable o factor sistemas de recompensa.

417
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Podríamos analizar los datos desde la perspectiva de la variable inde-


pendiente o factor sistemas de recompensa; en este caso apreciamos un efec-
to de un punto cuando actúa sobre el nivel X de modalidades de trabajo, y
de dos cuando lo hace sobre el nivel Y.
Pues bien, a estos efectos se les denomina simples.
Según lo señalado, los efectos principales de la variable modalidades de
trabajo son: (2 + 3) : 2 = 2,5, o bien: [(4 + 5) : 2 – (6 + 8): 2] = |4,5 – 7| = 2,5.
En el caso de la variable o factor sistemas de recompensa, sus efectos
principales son: (1 + 2) : 2 = 1,5; o bien: (4 + 6) : 2 – (5 + 8) : 2 = |5 – 6,5| =
1,5.
Conviene que reflexione sobre lo que hubiera ocurrido si Vd. hubiera
planteado dos investigaciones diferentes: una, para apreciar el efecto de la
variable modalidades de trabajo en el aula sobre la satisfacción del alumna-
do, y otra para contrastar el efecto sobre dicha satisfacción debido a los sis-
temas de recompensa. En tales casos, hubiera encontrado estos efectos prin-
cipales. En análisis de la varianza simple que se ha estudiado en el tema 9
ayudaría a tomar decisiones sobre la posibilidad de rechazar H0 en alguno
de los dos casos o en los dos.
Los diseños factoriales permiten abordar directamente, de una vez,
ambos contrastes. Sin embargo, cabe hacerse una pregunta: ¿son indepen-
dientes ambas variables independientes o factores, o mantienen alguna
relación? Esta cuestión, importante, es la que tratamos de resolver median-
te el estudio de los efectos secundarios o de interacción que es la gran apor-
tación de estos diseños.
No habrá interacción cuando la diferencia entre los efectos simples de
un factor no sea significativa en términos estadísticos, es decir, pueda expli-
carse como consecuencia de oscilaciones propias del azar. Sí habrá inter-
acción si tal diferencia va más allá, indicando en ese caso que una deter-
minada combinación de niveles de ambos factores ofrece mejores
resultados que otra u otras. En el caso de no interacción el efecto de una
variable o factor da resultados superiores, o inferiores, con cualquiera de
los niveles de la otra variable o factor.
En nuestro caso, no habrá interacción si la diferencia entre los efec-
tos simples de la variable modalidades de trabajo, que son 2 y 3, son esti-

418
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

maciones independientes que pueden explicarse como fruto del azar; por
tanto, la variable sistemas de recompensas no interviene en ellos. Lo
mismo podríamos afirmar en el caso de los sistemas de recompensas,
cuyos efectos simples son 1 y 2, con respecto a la variable modalidades de
trabajo.
Para calcular el efecto de la interacción suele acudirse2 a la diferencia
entre las sumas de los promedios de las diagonales. En nuestro caso sería:
(6 + 5) – (4 + 8) = |11 – 12| = 1

4.2. Resolución estadística

La resolución estadística de los diseños factoriales mediante un análisis


de la varianza factorial resulta muy fácil una vez que se haya alcanzado el
dominio del ANAVA con un solo factor.
Claro está que aparecen nuevas fuentes de varianza, que habrá que cal-
cular, como ocurre en el caso de la varianza para cada uno de los factores.
Junto a ello, es preciso obtener la varianza propia de la interacción, que
también aprenderemos a calcular.
Por otra parte, y al igual que hemos podido aprender en el ANAVA sim-
ple (para un solo factor o variable independiente), en el momento en que un
factor o variable independiente tenga más de dos niveles, la obtención de
un valor de F estadísticamente significativo sólo indica que existen diferen-
cias estadísticamente significativas —no explicables por el simple efecto del
azar o la casualidad— pero no localiza tales diferencias.
Por esta razón, en tales casos es preciso proceder a contrastes específi-
cos a posteriori, para localizar entre qué pares de medias se dan tales dife-
rencias. A tales efectos se dispone de diversas pruebas estadísticas; nosotros
acudiremos a las pruebas de Tukey o de Scheffé, más general esta última
por poder utilizarse en casos de n desigual.
En ambos casos, contrastamos nuestros valores empíricos, para cuya
obtención disponemos de sendas ecuaciones, con los valores teóricos de las
correspondientes distribuciones, q en el primer caso y F en el segundo, para

2
En el caso de diseños factoriales de dos niveles.

419
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

el valor de α seleccionado, con g3 y (N – gA gB) g.l., en el caso del estadísti-


co q, y para (g - 1)4 y [N- (N – gA gB] g.l. en el de F.
Las ecuaciones para la obtención de los estadísticos empíricos para
Tukey y para Scheffé son, respectivamente, los siguientes:
TUKEY: Media A (1) – Media A(2) / √ MCD / N:gA
Esto es: si se comparan los niveles 1 y 2 de la variable o factor A, la dife-
rencia será estadísticamente si este cociente es > gA y (N-gAgB) q 0.01.
SCHFFÉ: Media A (1) – Media A(2) / √ MCD (a2 1 / n1 + .... a2 k / nk )
Esto es: si se comparan los niveles 1 y 2 de la variable o factor A, la dife-
rencia será estadísticamente significativa si este cociente es > √ (gA – 1) F,
donde F tiene (g A – 1) y [N – (gAgB) g.l.
Debe advertirse que, en determinadas ocasiones, el investigador puede
estar interesado a priori por determinados contrastes y no por otros; en
tales ocasiones hablamos de comparaciones planeadas, dado que el investi-
gador, antes de realizar el experimento, está interesado en ellas y no en
otras, probablemente porque su nuevo trabajo es continuación de otros o
porque, en su situación práctica algunos contrastes son irrelevantes mien-
tras otros le son de gran utilidad.
Con el fin de estudiar en la práctica todas estas cuestiones, presentamos
un enunciado, los correspondientes datos y su resolución estadística.

ENUNCIADO

En el marco de un plan de acción al servicio de la mejora de la calidad se


plantea la hipótesis de que tanto las formas de organización de la actividad en
el aula como la metodología utilizada por el profesorado inciden en la partici-
pación de los alumnos, que se desea aumentar y mejorar.

A los efectos de comprobar este supuesto, se diseña una investigación orien-


tada a contrastar la incidencia de tres formas diferentes de agrupamiento del

3
Este valor corresponde con el número de grupos de la variable o factor objeto de estudio. Los valo-
res gA gB se corresponden con el número de grupos de ambos factores, el estudiado y el otro.
4
Al igual que en la nota anterior, este valor corresponde al número de grupos, en este caso menos
uno, de la variable o factor objeto de estudio.

420
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

alumnado y de cuatro metodologías utilizadas por el profesorado sobre el grado


de participación de niños y niñas de corta edad, en concreto de educación
infantil. Se trata de las formas de agrupación A1, A2 y A3, y de las metodologías
B1, B2, B3, y B4, que interesan directamente al investigador.

Se asignan aleatoriamente 10 sujetos a cada situación experimental. La


investigación tuvo una duración de un curso completo, durante el cual la com-
posición de las clases se vio alterada por la incorporación de niños de culturas
diferentes de la occidental.

El investigador desea contrastar sus hipótesis para α ≤ 0,01.

DATOS

Tabla 11.12. Datos básicos de 120 sujetos en un diseño factorial


4 x 3 de dos factores fijos

FORMAS DE AGRUPAMIENTO
VARIABLES TOTAL
A1 A2 A3
M ΣX = 78 ΣX = 75 ΣX = 97 ΣX = 250
B4
E ΣX2 = 646 ΣX2 = 601 ΣX2 = 971 ΣX2 = 2218
T
ΣX = 44 ΣX = 49 SX = 53 ΣX = 146
O B3
ΣX2 = 220 ΣX2 = 259 ΣX2 = 311 ΣX2 = 790
D
O ΣX = 73 ΣX = 63 ΣX = 93 ΣX = 229
B2
L ΣX2 = 565 ΣX2 = 421 ΣX2 = 891 ΣX2 = 1877
O
ΣX = 64 ΣX = 65 ΣX = 79 ΣX = 208
G B1
ΣX2 = 452 ΣX2 = 443 ΣX2 = 641 ΣX2 = 1536
Í
A ΣX = 259 ΣX = 252 ΣX = 322 ΣX = 833
TOTAL
S ΣX2 = 1883 ΣX2 = 1724 ΣX2 = 2814 ΣX2 = 6421

SOLUCIÓN
Es obvio que se trata de un diseño factorial, de dos factores –metodolo-
gías y formas de agrupamiento- seleccionadas o fijadas por el investigador.
Deberemos, por tanto, someter a contraste los efectos de cada variable
independiente o factor y su interacción, para un nivel de significación esta-
dística de α ≤ 0.01.

421
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Procederemos a plantear y calcular, en primer lugar, las diferentes SC:


SCT = 6.421 - (8332 : 120) = 6.421 – 5.782,41 = 638,59
SCentre = [ (782 + 752 + ... + 792) : 10] - (8332 : 120) = 6.077,3 – 5.782,41 =
294,89
SCmetodologías (B) = [ (2502 + 1462 + 2292 + 2082): 30] - (8332 : 120) = 5.984,03
– 5.782,41 = 201,62
SCformas agrupamiento (A) = [ (2592 + 2522 + 3222) : 40] - (8332 : 120) = 5856,725
– 5.782,41 = 74,315
SCinteracción (AxB) = 294,89 - (201,62 + 74,315) = 18,955
SCdentro = 638,59 - 294,89 = 343,7
Planteamos ahora al cuadro resumen del ANAVA (tabla 11.13):

Tabla 11.13. Cuadro resumen del ANAVA en un diseño


factorial 3 x 4 de efectos fijos

Fuente de variación SC g.l. MC F

Entre grupos 294,89 11 26,81 8,43


- Entre metodologías 201,62 3 67,21 21,13
- Entre formas de agrupamiento 74,315 2 37,16 11,68
- Interacción 18,955 6 3,16 0,99
Dentro de los grupos 343,70 108 3,18

TOTAL 638,59 119

La F para la fuente de variación entre grupos (8,43) debe compararse con


la correspondiente en las tablas para 11 y 108 g.l. y el nivel de significación
(α) elegido. La notación habitual es la siguiente

0.99 F (11 y 108) ~ 2,4 < 8,435.


Por tanto, nos situamos ante una F empírica estadísticamente significa-
tiva, esto es, ante unas diferencias de medias no explicables por azar (aun-

5
Compruebe el alumno que en las tablas no encontramos 11 y 108 g.l., por lo que debemos inter-
polar. En nuestro caso no merece la pena hacer ese esfuerzo, dado que la distancia entre nuestro valor
empírico y el de las tablas es muy grande y no cabe duda de que, en cualquier caso, será significativo.
El valor más desfavorable sería 2,50, claramente inferior a nuestro valor empírico.

422
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

que reconocemos que la probabilidad de una decisión errónea en tal senti-


do —Error tipo I— es de 0.01, esto es, del 1% de los casos).
Dado que nuestro valor de F es el más general, tiene sentido analizar
dónde se encuentran tales diferencias: si en el factor «metodologías», en
«formas de agrupamiento» o en la interacción de ambos. Por ello, buscare-
mos las correspondientes F en las tablas y las compararemos con nuestros
valores empíricos:

0.99 F (3 y 108) ~ 3,95 < 21,13

0,99 F (2 y 108) ~ 4,79 < 11,68


Como podemos apreciar, en ambos casos los valores empíricos de F
son claramente superiores al valor a partir del cual, eso sí, con una pro-
babilidad de error de 0,01, podemos considerar que no se deben al azar;
en consecuencia, decidimos considerarlas como estadísticamente signi-
ficativas.
Para el caso de la interacción ni siquiera merece la pena buscar el valor
de contraste dado que nuestro valor empírico es inferior a la unidad. Este
hecho indica que la magnitud de las diferencias es, ya de entrada, menor
que la que puede explicarse por puro azar. Sin embargo, haremos la com-
probación como puro ejercicio de cálculo e interpretación:

0,99 F (6 y 108) ~ 2,96 > 0,99


Los datos, en efecto, corroboran nuestra afirmación: la magnitud de
las diferencias atribuibles a la interacción entre factores se sitúa en la
zona de las explicables por puro azar o casualidad, por lo que, siguiendo
a Bunge, la prudencia nos conduce a mantener H0 y no dar por buena
nuestra H1.
Una manifestación intuitiva de la ausencia de interacción la tenemos en
la figura 11.1, donde aparecen los valores que para las diferentes formas de
agrupamiento (eje de abscisas) toman los distintos valores de las metodolo-
gías (eje de ordenadas).
Como podemos apreciar, la metodología B4 obtiene siempre valores
medios superiores; la B3, por el contrario, los más bajos; B2 tiende a arro-
jar resultados superiores a B1, salvo en un caso, que, sin embargo, no es
estadísticamente significativo. No hay, por tanto, interacción.

423
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

12

10

8 B4
B3
6
B2
4 B1
2

0
6,475 6,3 8,05

Figura 11.1. Representación intuitiva de la interacción en un diseño factorial.

4.3. Contrastes a posteriori

Al igual que la F para la fuente de variación entre grupos nos indica que
existen diferencias que es preciso localizar y que, como hemos podido apre-
ciar, se situaban en los factores pero no en su interacción, ahora debemos
proceder a establecer contrastes post hoc o a posteriori dado que los facto-
res tienen tres y cuatro niveles. Obviamente, si uno de los factores, o ambos,
tuvieran únicamente dos niveles, estos contrastes serían innecesarios, dado
que las diferencias a las que se refiere F serían a favor del grupo cuya media
aritmética fuera más elevada.

Veamos los contrastes para la variable independiente o factor metodolo-


gías. Al tener cuatro niveles cabe contrastar el de uno de ellos con todos los
demás, y así sucesivamente.

Utilizaremos el procedimiento de Tukey:

|Media B4 – MediaB3 | / √MCD / N: gB > q

La anterior expresión nos dice que la diferencia entre las medias de la


metodología B4 y la B3, tomada en valor absoluto, será significativa en tér-
minos estadísticos, para α≤ 0,01, si su cociente entre la raíz cuadrada del
cociente entre la media cuadrática dentro de los grupos y el cociente entre

424
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

el número total del casos y el de grupos de la variable B, es mayor que el


estadístico q para gB = 4 y (N- gA gB) grados de libertad, esto es, para 4 y (120
– 3 x 4) g.l.

Pues bien, sustituyamos los valores y busquemos q:

Media B4 = 250 : 30 = 8,33

Media B3 = 146 : 30 = 4,87

MCD = 3,18

0.01 q 4 y 108 ~ 4,497

Sustituyendo los valores, tendremos:

|8,33 – 4, 87| / √3,18 /120 : 4 = 3,46 : √3,18 /30 = 3,46 : 0,325 = 10,65

Como 10,65 > 4,497, afirmamos que la diferencia es estadísticamente


significativa, esto es, no explicable por puro azar (aunque, recordemos,
admitimos una probabilidad de error tipo I igual a α, esto es, a 0.01 o al
1%).

Deberíamos hacer pruebas similares a estas entre los niveles 4 y 2, 4 y 1,


3 y 2, 3 y 1, y 2 y1.

Hay que proceder del mismo modo con el factor A (formas de agrupa-
miento). Lo ejemplificaremos con los niveles A1 y A2, a sabiendas que habría
que seguir el proceso entre A1 y A3, y entre A2 y A3

Media A1 = 259 : 40 = 6,475

Media A2 = 252 : 40 = 6,3

MCD = 3,18

0.01 q 3 y 108 ~ 4,2

Sustituyendo los valores, tendremos:

|6,475 – 6,3| / √3,18 /120 : 3= 0,175 : √3,18 /40 = 0,175 : 0,282 = 0,62

Como 0,62 < 4,2, afirmamos que la diferencia no es estadísticamente


significativa, esto es, resulta explicable por puro azar.

425
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

4.4. Manifestaciones de invalidez interna

Una valoración del diseño debe hacernos conscientes de un hecho rele-


vante. En el enunciado podemos leer:

La investigación tuvo una duración de un curso completo, durante el cual


la composición de las clases se vio alterada por la incorporación de niños de
culturas diferentes de la occidental.

No cabe duda de que la alteración de la composición de las clases a


que se alude puede tener incidencia en los resultados finales medidos en
la variable independiente. De hecho estamos ante uno de los factores de
invalidez interna, denominado historia.
Pero tampoco deberíamos olvidar otro elemento del enunciado:

A los efectos de comprobar este supuesto, se diseña una investigación orien-


tada a contrastar la incidencia de tres formas diferentes de agrupamiento del
alumnado y de cuatro metodologías utilizadas por el profesorado sobre el grado
de participación de niños y niñas de corta edad, en concreto de educación
infantil.

El hecho de trabajar con niños de educación infantil y que su duración


fuera de todo un curso, debe ponernos en guardia ante la posibilidad de
aparición de otro factor de invalidez interna: la maduración.

RESUMEN

Con el presente tema, que cierra la unidad didáctica dos, hemos amplia-
do el horizonte de los diseños. Si hasta ahora se ha dedicado una gran aten-
ción a los diseños de dos grupos porque los hemos tomado como referen-
cia para comprender el alcance de la investigación empírica experimental
así como a las pruebas estadísticas más adecuadas para su resolución, aquí
nos hemos detenido, sin tanto detalle, en otros diseños a los que podemos
aplicar tanto las aludidas ideas y conceptos como los principios de las prue-
bas estadísticas.

426
LAS PRUEBAS PARAMÉTRICAS EN DISEÑOS ESPECÍFICOS

Cuatro han sido los diseños estudiados; en tres de ellos hemos seguido tra-
bajando con una sola variable independiente. Pero en el cuarto hemos amplia-
do el horizonte haciendo objeto de estudio los diseños factoriales, de grandes
prestaciones a la investigación pedagógica, al permitir probar las hipótesis
correspondientes a cada factor así como a la posible interacción entre ellos.
El primero de los diseños estudiados no es sino una extensión del dise-
ño de dos grupos al caso en que la variable independiente tiene más de dos
niveles, algo habitual por otra parte.
Su resolución estadística es sencilla; se debe acudir a la prueba F (si se
cumplen las exigencias de los modelos paramétricos) dado que t solo puede
utilizarse en el caso de dos niveles.
Lógicamente, si F resultara significativa, es preciso proseguir el aná-
lisis para contrastar entre qué pares de medias se dan tales diferencias,
dado que, como sabemos, F sólo indica si se dan o no diferencias en
general.
Los otros dos diseños presentan prestaciones relevantes. El de cova-
rianza, porque es muy aplicable en los estudios pedagógicos, que, general-
mente, se ven obligados a trabajar con grupos naturales, lo que no asegura
el control inicial que permita considerar que los sujetos de los diferentes
grupos son intercambiables. En el caso en que, en tales situaciones, conte-
mos con pre-test cuyos resultados covaríen con la variable dependiente,
podemos utilizarlos como forma de control, ajustando las medias finales a
las posibles diferencias iniciales.
Por último, hemos presentado el diseño de cuadrado latino; su aporta-
ción es la de ofrecer un procedimiento de control de dos variables que
podrían convertirse en extrañas en caso de no ser controladas.

427
ANEXO A LA UNIDAD DIDÁCTICA II

Presentación

1. Sentido del Anexo

2. El Informe
2.1. Introducción
2.2. Hipótesis
2.3. Variables
2.4. Diseño
2.5. Muestra
2.6. Instrumento
2.7. Proceso
2.8. Resultados
2.9. Tratamiento estadístico e interpretación de resultados
2.10. Conclusiones

3. Enjuiciamiento de la investigacion
3.1. Aspectos generales
3.2. Validez interna
3.3. Validez externa
3.4. El tratamiento estadístico

429
PRESENTACIÓN

Una vez concluida la segunda unidad didáctica, se presenta este anexo


como un medio destinado a integrar la teoría sobre los diseños y la Esta-
dística como herramienta a su servicio.
Junto a ello, el presente documento también pretende ayudar en la tarea,
esencial en la asignatura, de aprender a valorar informes de investigación.

1. EL SENTIDO DEL ANEXO

Con este documento no se trata aquí de ampliar el campo de conoci-


mientos, habilidades y técnicas del alumno presentando nuevos aspectos,
diferentes de los incluidos en los temas anteriores. Lo que se pretende es
ofrecer, con sentido de síntesis, un informe de una investigación ficticia en
el que aparecen las principales fases y momentos de cualquier investigación
experimental o meramente empírica, incluido el tratamiento estadístico de
los datos y las conclusiones elaboradas por el investigador.
Con ello se pretende lograr una integración de aspectos que han ido des-
arrollándose a lo largo de los temas anteriores. Ahora bien, en línea con los gran-
des objetivos de la materia, en la segunda parte, punto 3, analizamos el informe
en sus puntos más positivos y negativos, tanto en cuanto a informe como en su
contenido, esto es, a la corrección de los pasos y decisiones tomadas por el inves-
tigador desde el momento de formular el problema a las conclusiones tomadas.

2. EL INFORME
2.1. Introducción

Los momentos actuales se vienen caracterizando por una progresiva implan-


tación de los sistemas personalizados de Educación en los que se precisa una cui-

431
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

dadosa atención a las diferencias individuales y de grupos —objetivos, metodo-


logía, ritmo, programas, ayudas— a la vez que se cultiva con atención todo lo que
supone dimensión social —trabajo cooperativo, puestas en común, técnicas de
grupo—, buscando un equilibrio entre ambas dimensiones. La atención a la indi-
vidualización de la enseñanza se ha venido realizando fundamentalmente
mediante dos tipos de técnicas, las fichas y la enseñanza programada, habiéndose
realizado algunos estudios sobre su eficacia relativa en la consecución de objeti-
vos de aprendizaje. Pero hay una dimensión de gran importancia; los sistemas
personalizados resaltan la importancia y trascendencia del cultivo de la creativi-
dad. Se plantea así la necesidad de hacer compatible la adecuación en forma indi-
vidualizada de todo el tratamiento educativo, buscando con ello la mayor efica-
cia, con la necesidad de respetar la vertiente creativa, original de cada persona.
Surge así pues, un tema a estudio. ¿Serán más eficaces unas técnicas
que otras en el aprendizaje? ¿Influirán de forma diferente en la creatividad
de los alumnos?

2.2. Hipótesis

Con la intención de dar respuesta a tales preguntas, un investigador


decide realizar su trabajo de investigación de doctorado tratando de some-
ter a prueba la eficacia relativa de ambas técnicas, evaluando además la
creatividad de los estudiantes.
Sus hipótesis de trabajo son:
1.º Existen diferencias en el rendimiento académico en función de la téc-
nica de individualización didáctica utilizada —enseñanza programada o
fichas— siendo estas diferencias favorables a la segunda de las técnicas.
2.º La técnica de las fichas da lugar a estudiantes más creativos que la
de la enseñanza programada.
Desea validar sus hipótesis a un nivel de confianza del 95 % (p = 0,95) o
lo que es lo mismo, con un nivel de significación α ≤ 0’05.

2.3. Variables

La variable independiente es la técnica de individualización, que admite


en este caso dos niveles o modalidades: —enseñanza programada y ense-

432
ANEXO A LA UNIDAD DIDÁCTICA II

ñanza por fichas—, siendo dos las variables dependientes, rendimiento aca-
démico y creatividad; la variable rendimiento académico va a ser puesta a
prueba en dos campos: a) ortografía (existe un texto de ortografía progra-
mada) y b) área social y natural, en la que el autor de la investigación ha lle-
vado a cabo la tarea de programación de un texto; en ambos casos trabaja
con alumnos de 11 años.

2.4. Diseño

Elige un diseño de dos grupos, pero, dadas las limitaciones que se impo-
nen en los centros, debe tomarlos como están. En realidad lo que hace es
actuar con dos grupos de un colegio del que él es profesor, adjudicando, eso
sí, los tratamientos al azar. Él se encarga del área social y natural y otro
compañero de la ortografía. Toma la precaución de llevar a cabo un pretest
en ambas materias con la intención de averiguar si, de entrada, se pueden
explicar posibles diferencias posteriores.
El paradigma del diseño es
ASIGNACION
GRUPO PRETEST TRATAMIENTO POSTEST
SUJETOS TRATAMIENTO
Experimental
No azar Azar T1 Fichas T3
(A)
Control Enseñanza
No azar Azar T2 T4
(B) Programada

Este diseño lo utiliza tres veces, una para apreciar la creatividad y dos
veces para el rendimiento, una en ortografía y otra en el área social y natu-
ral. En todos los casos trata de comparar los resultados medios de ambos
grupos en cada una de las dos variables dependientes, tras un curso acadé-
mico de utilización de los tratamientos.

2.5. Muestra

Trabaja con N = 63, divididos en dos subgrupos, nA = 32 y nB = 31.


Tras la asignación al azar de los tratamientos el grupo de 32 alumnos
trabajará con fichas y el de 31 con enseñanza programada.

433
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

El colegio en que trabaja es nacional, en una pequeña capital de pro-


vincia de Castilla-León, al que asisten niños pertenecientes a familias de
clase media y media-baja. El colegio es de nueva creación.

2.6. Instrumento

Para el pretest utiliza dos pruebas ideadas por él sobre conocimientos


básicos correspondientes al nivel de 5.° de Primaria; en cuanto a la creati-
vidad, utiliza un test existente en el mercado.

2.7. Proceso

El investigador ha dedicado el curso 06-07 a elaborar el texto progra-


mado del área social y natural. El texto lo ha compuesto él personalmente
en forma de folios multicopiados con pocas ilustraciones.
En la primera semana de octubre de 2007 aplica los pretest y, tras los
resultados, decide seguir adelante eligiendo al azar el grupo al que corres-
ponde cada tratamiento.
Los alumnos del grupo B trabajan por sí solos; únicamente el profesor
les somete a prueba mensual durante el primer trimestre —por si los resul-
tados le hicieran abandonar el trabajo (los padres podrían crear problemas
en caso de falta de rendimiento)— y una trimestral al final de los dos tri-
mestres restantes. Los resultados de la prueba final son comparados con los
de la prueba final —idéntica— del grupo A.
Los alumnos del grupo A siguen el proceso normal: trabajan con fichas,
consultan libros y al profesor, el profesor explica y realizan las evaluacio-
nes normales en el colegio.

2.8. Resultados

Se recogen a continuación (tablas 1 y 2):

434
ANEXO A LA UNIDAD DIDÁCTICA II

Tabla 1. Resultados del grupo A, experimental

GRUPO A – EXPERIMENTAL – FICHAS


ORTOGRAFÍA ÁREA SOCIAL – NATURAL CREATIVIDAD
Pretest Postest Pretest Protest Pretest Protest
5 4 3 4 15 6
7 9 7 8 17 7
3 5 9 6 20 8
8 9 5 7 18 7
6 7 6 5 14 5
5 6 7 7 13 5
6 6 7 7 16 4
5 8 6 7 17 7
7 7 8 9 22 8
5 6 4 5 15 6
4 7 3 5 9 4
5 5 6 5 7 6
9 8 5 6 12 5
4 6 4 7 13 6
5 – 8 – 16 –
5 6 7 8 21 8
6 7 2 5 24 8
7 6 5 6 29 9
6 5 3 5 14 5
3 – 6 – 13 –
6 6 2 6 17 6
6 7 4 7 18 6
5 5 3 5 25 8
6 7 5 6 13 5
5 7 8 9 16 6
7 7 6 4 15 6
5 6 7 7 17 5
4 3 9 8 18 7
6 4 5 6 14 4
5 – 4 – 16 –
3 3 6 7 17 5
8 7 5 6 22 8
n = 32 29 32 29 32 29
∑X = 177 179 174 183 532 180
––
X = 5,53 6,172 5,375 6,31 16,625 6,21
∑X2 = 1.043 1.169 1.046 1.205 9.456 1.172
s = 1,436 1,513 1,98 1,339 4,44 1,39

435
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 2. Resultados del grupo B, control


GRUPO B – CONTROL – ENSEÑANZA PROGRAMADA
ORTOGRAFÍA ÁREA SOCIAL – NATURAL CREATIVIDAD
Pretest Postest Pretest Protest Pretest Protest
3 4 4 3 16 5
6 7 6 7 17 6
5 5 7 8 22 7
8 7 8 7 13 4
5 6 5 5 15 4
8 9 5 6 17 6
6 6 9 7 15 6
5 6 6 7 10 4
6 7 7 6 20 7
5 4 5 5 14 5
5 6 5 5 18 5
6 6 4 6 6 3
3 5 5 6 14 4
4 – 6 – 15 –
6 7 5 5 21 6
6 7 5 5 22 7
5 6 5 5 17 5
4 5 4 4 16 5
4 3 8 9 14 4
7 8 5 6 18 7
5 5 4 5 17 5
6 5 6 6 15 4
5 6 5 5 16 5
4 5 4 5 16 5
5 4 5 5 22 6
6 8 4 4 19 4
3 4 6 5 18 5
5 6 7 9 16 5
7 7 6 5 17 6
6 8 5 5 15 5
9 – 4 – 18 –
n = 31 29 31 29 31 29
∑X = 168 171 170 166 509 150
X = 5,419 5,896 5,484 5,72 16,42 5,17
∑X2 = 972 1.069 984 1.004 8.693 808
s = 1,436 1,472 1,313 1,386 3,344 1,07

436
ANEXO A LA UNIDAD DIDÁCTICA II

La prueba final de creatividad consiste en dos redacciones, una sobre el


tema «Un mundo nuevo» y otra sobre «El hombre en ese mundo nuevo». Se
les indica a los niños que hablen sobre cómo harían de nuestro mundo
actual otro mejor para las plantas, los animales y el hombre; y, en la segun-
da, cómo debería ser el hombre para con ese mundo y sus semejantes de
forma que no se deteriorase.
Ambas redacciones fueron calificadas en creatividad por cinco profeso-
res del colegio, eliminando las puntuaciones extremas y presentando como
representativa la media de las tres centrales.
Los alumnos no fueron informados de que se estaba llevando a cabo la
investigación.

2.9. Tratamiento estadístico e interpretación de resultados

El tratamiento estadístico abarca dos aspectos: la existencia o no de


diferencias en el pretest y, caso de no existir éstas, la comprobación de su
aparición o no en el postest. El investigador considera que se puede utilizar
una prueba paramétrica en el caso de la ortografía dado que la posesión de
una correcta ortografía está en función del número de palabras correcta-
mente escritas y que, en general, la diferencia entre niveles consecutivos en
las pruebas puede representar de hecho una diferencia igual en saberes
ortográficos.
En el caso de la prueba en el área social y natural estima que el nivel de
medida logrado no pasa de ser ordinal, y por ello decide aplicar la prueba
de U de Mann-Whitney; por último confía todavía menos en los resultados
de la prueba de creatividad, por lo que decide analizarlos mediante la prue-
ba de la mediana.
ORTOGRAFÍA

Dado que las muestras son muy próximas al tamaño que delimita las
denominadas pequeñas, y puesto que estas muestras actúan de modo más
conservador, decide trabajar con la prueba «t».
De la tabla con los datos originales se desprende (tabla 3):

437
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla 3. Principales estadísticos correspondientes a las tabla 1 y 2

ESTADISTICOS GRUPO A GRUPO B

n 32 31
––
X 5,53 5,419

s 1,436 1,432

Como es sabido, «t» es el cociente entre la diferencia de medias y el


error típico de esta diferencia. Aplicando la fórmula correspondiente1 lle-
gamos a los siguientes resultados:

XA − XB
t= =

( (n A − 1) s2A + (n B − 1) s2B
nA + nB − 2 )( nA + nB
nAnB )
5, 53 − 5, 419 0,111
= = = 0, 31
0, 36
(31× 1, 436 ) + (30 × 1, 432 ) × (32 + 31)
2 2

32 + 31 − 2 32 × 31

ÁREA SOCIAL Y NATURAL

Tabla 4. Datos correspondientes a los grupos experimental


y de control en el pretest
GRUPO A – PRETEST GRUPO B – PRETEST
Puntuaciones Puntuaciones
Puntuaciones Puntuaciones
directas Rangos directas Rangos
directas directas
ordenadas ordenadas
3 2 1,5 4 4 13
7 2 1,5 6 4 13
9 3 5 7 4 13
5 3 5 8 4 13
6 3 5 5 4 13

1
Utilizar la ecuación 9.2 por suponer que σA y σB son desconocidos pero supuestos iguales entre si
y al parámetro.

438
ANEXO A LA UNIDAD DIDÁCTICA II

GRUPO A – PRETEST GRUPO B – PRETEST


Puntuaciones Puntuaciones
Puntuaciones Puntuaciones
directas Rangos directas Rangos
directas directas
ordenadas ordenadas
7 3 5 5 4 13
7 3 5 9 4 13
6 4 13 6 5 27,5
8 4 13 7 5 27,5
4 4 13 5 5 27,5
3 4 13 5 5 27,5
6 5 27,5 4 5 27,5
5 5 27,5 5 5 27,5
4 5 27,5 6 5 27,5
8 5 27,5 5 5 27,5
7 5 27,5 5 5 27,5
2 5 27,5 5 5 27,5
5 6 42 4 5 27,5
3 6 42 8 5 27,5
6 6 42 5 6 42
5 6 42 4 6 42
4 6 42 6 6 42
3 7 51,5 5 6 42
5 7 51,5 4 6 42
8 7 51,5 5 6 42
3 7 51,5 4 7 51,5
7 7 51,5 6 7 51,5
9 8 58 7 7 51,5
5 8 58 6 8 58
4 8 58 5 8 58
6 9 62 4 9 62
5 9 62
R1 = 1.010,5 R1 = 1.005,5

Como el número de casos es suficientemente grande, U se distribuye en


forma muy próxima a la normal, con lo que su significatividad se calcula
mediante:
nn
U− 1 2
U − Xu 2
zU = =
su n1n 2 ( n1 + n 21)
12

439
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Dado que los valores de n1 y n2 son los casos de que constan las mues-
tras, lo único que hay que calcular es el valor de U, lo que puede hacerse
por una de estas fórmulas:
n1 ( n1 + 1) n 2 ( n 2 + 1)
U = n1n 2 + − R1 ; U = n1n 2 + − R2
2 2

Donde R1 y R2 son la suma de los rangos de las muestras 1 y 2 (A y B) en


nuestro caso respectivamente. Debemos elegir el valor más pequeño de U.

n1 ( n1 + 1) n 2 ( n 2 + 1)
U = n1n 2 + − R1 ; U = n1n 2 + − R2
2 2

En consecuencia:

32 × 33
U = 32 × 31+ − 1.010, 5 = 992 + 528 − 1.010, 5 = 1.520 − 1.010, 5 = 509, 5
2
31× 32
U = 32 × 31+ + 1.005, 5 = 992 + 496 − 1.005, 5 = 1.488 − 1.0
005, 5 = 482, 5
2
992
482, 5 −
2 4825 − 496 −13, 5
zU = = = = −0,19
32 × 31× (32 + 31+ 1) 5.290, 667 72, 737
12

Valor a todas luces no significativo.


Realmente dado el valor tan bajo obtenido, no merece la pena corregir
los datos por el efecto de las puntuaciones ligadas; sin embargo, y tan sólo
para apreciar su efecto, se va a determinar el valor zU teniendo en cuenta
dicho influjo.
El valor de la sU con puntuaciones ligadas es:

( ( ))(
n1 − n 2
N N −1
N3 − N
12 )
− ∑ T donde el único valor por determinar es ∑T,

t3 − t
siendo T = , y t el número de casos o puntuaciones ligadas en cada
12
rango.

440
ANEXO A LA UNIDAD DIDÁCTICA II

Veamos las puntuaciones ligadas.

2 doses 11 seises
5 treses 8 sietes
11 cuatros 5 ochos
18 cincos 3 nueves

Luego:

23 − 2 53 − 5 113 − 11 183 − 18 113 − 11 83 − 8 53 − 5 33 − 3


T= + + + + + + + =
12 12 12 12 12 12 12 12
= 0, 5 + 10 + 110 + 484, 5 + 110 + 42 + 10 + 2 = 769

Por tanto

482, 5 − 992 / 2 −13, 5


zU = = =

( )( ) 0, 254 × (20.832 − 769)


3
32 × 31 63 − 63
− 769
63 × 62 12
−13, 5 −13, 5 −13, 5
= = = = −0,19
063
0, 254 × 20.0 5.096 71, 386

Como se ve, la corrección no ha sido suficiente para alterar el resultado.


CREATIVIDAD

El primer paso es calcular la mediana del conjunto de las 63 puntuacio-


nes (de ambos grupos), para, a continuación, obtener las frecuencias de los
sujetos que superan la mediana en ambos subgrupos y de los que quedan
por debajo de la misma.
Las puntuaciones ordenadas de ambos grupos son:
6, 7, 9, 10, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15,
15, 15, 15, 15, 16, 16, 16, 16, 16, 16, 16, 16, 16, 17, 17, 17, 17, 17, 17, 17,
17, 17, 17, 18, 18, 18, 18, 18, 18, 18, 19,20,20,21,21,22,22,22,22,22,
24, 24, 29.
La Md. es 16,39.
Al tratarse de N > 40 se usa la prueba de χ2 corregida por continuidad,
mediante la fórmula:

441
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

GRUPO A GRUPO B
> Md. A B
17 16
Mediana combinada = 16,39
C D
< Md. 15 15

2 2
N 63
N ( AD − BC ) − 63 ( 17 × 15 − 15 × 16 ) −
2 2
χ2 = = = 0, 02
( A + B ) ( C + D) ( A + C ) ( B + D) 33 × 30 × 32 × 31

Valor igualmente por debajo de la unidad, y claramente no significati-


vo. Tras comprobar la no existencia de diferencias en el pretest pasa a
someter a prueba sus hipótesis, utilizando en cada caso el mismo tipo de
prueba estadística que en el pretest.
ORTOGRAFÍA

6,172 − 5, 896
t= = 0, 71

(28 × 1, 5132 + 28 × 1, 4722


29 + 29 − 2 )( ) 29 + 29
29 × 29

Como puede apreciarse, aunque el valor de la razón crítica ha aumen-


tado respecto del pretest, dista mucho del t = 1,67 aproximadamente que
para 56 g.l. en una prueba unilateral delimita el valor a partir del cual las
diferencias son significativas con un margen de error no superior al 5%.
ÁREA SOCIAL Y NATURAL

Tabla 5. Datos correspondientes a los grupos experimental


y de control en el postest
GRUPO A – POSTEST GRUPO B – POSTEST

Puntuaciones Puntuaciones
Puntuaciones Puntuaciones
directas Rangos directas Rangos
directas directas
ordenadas ordenadas

4 4 3,5 3 3 7
8 4 3,5 7 4 3,5
6 5 15,5 8 4 3,5
7 5 15,5 7 5 15,5
5 5 15,5 5 5 15,5

442
ANEXO A LA UNIDAD DIDÁCTICA II

GRUPO A – POSTEST GRUPO B – POSTEST


Puntuaciones Puntuaciones
Puntuaciones Puntuaciones
directas Rangos directas Rangos
directas directas
ordenadas ordenadas
7 5 15,5 6 5 15,5
7 5 15,5 7 5 15,5
7 5 15,5 7 5 15,5
9 5 15,5 6 5 15,5
5 6 32 5 5 15,5
5 6 32 5 5 15,5
5 6 32 6 5 15,5
6 6 32 6 5 15,5
7 6 32 5 5 15,5
8 6 32 5 5 15,5
5 6 32 5 5 15,5
6 7 44,5 4 6 32
5 7 44,5 9 6 32
6 7 44,5 6 6 32
7 7 44,5 5 6 32
5 7 44,5 6 6 32
6 7 44,5 5 6 32
9 7 44,5 5 7 44,5
4 7 44,5 5 7 44,5
7 8 52,5 4 7 44,5
8 8 52,5 5 7 44,5
6 8 52,5 9 8 52,5
7 9 56,5 5 9 56,5
6 9 56,5 5 9 56,5
R = 966 R = 745

Como existen muchas puntuaciones ligadas, y ha aumentado notoria-


mente la diferencia en la suma de los rangos (R) se utiliza la fórmula que
cuenta con todas las puntuaciones ligadas; contamos con:

4 cuatros 12 sietes
20 cincos 4 ochos
13 seises 4 nueves

43 − 4 203 − 20 133 − 13 123 − 12 43 − 4 43 − 4


T= + + + + + = 5 + 665 + 182 + 143 + 5 + 5 = 1.005
12 12 12 12 12 12
29 × 30
U = 29 × 29 + − 966 = 841+ 435 − 966 = 1.276 − 966 = 310
2

443
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

29 × 30
U = 29 × 29 + − 745 = 531
2

841
310 −
z= 2 = 0, 2511× (16.254, 5 − 1.005) = −1, 77

( )(
29 × 29
58 × 57
583 − 58
12
− 1.005
)
La probabilidad de ocurrencia de este fenómeno es de 0,0384 (3,84 %)
y, por lo tanto, inferior al previamente fijado del 5 %. Luego sí existe dife-
rencia a favor del tratamiento A, esto es, da mejores resultados una ense-
ñanzapor fichas que otra de tipo programada.
CREATIVIDAD

Para calcular la mediana combinada de las dos series de puntuación se


ordenan previamente de menor a mayor (o viceversa):
3,4,4,4,4,4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6,
6, 6, 6, 6, 6,
6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9.
Evidentemente, al ser número par los casos (N = 58), la mediana es la
media de las dos puntuaciones centrales: 5 + 6/2 = 5,5. La Md. es, justa-
mente, 5,5 ya que la puntuación 5 deja por debajo de sí 29 casos y otros 29
por encima.

GRUPO A GRUPO B
> 5,5 A B
19 10
Md. combinada
C D
< 5,5 10 19

Aplicando la prueba de χ2:

( )
2
N
N AD − BC − 2

2
χ =
2
=
(
58 361 − 100 − 29 ) =
58 × 53.824 3.121.792
= = 4, 414
( A + B ) ( C + D) ( A + C ) ( B + D) 29 × 29 × 29 × 29 707.281 707.281

444
ANEXO A LA UNIDAD DIDÁCTICA II

Dado que este valor supera netamente al correspondiente para 1 g.l. y


nivel de confianza del 95% (α = 0,05), que es 3,84, podemos afirmar la exis-
tencia de diferencias en creatividad entre ambos grupos.

2.10. Conclusiones

Como resultado de su trabajo decide:


a) Mantener la primera de sus hipótesis en lo referente al área sacio-
natural. Considerar como no probada esta hipótesis en la relación
con la Ortografía.
b) Mantener la segunda hipótesis en el sentido de que los estudiantes
que utilizan fichas son más creativos que los que se sirven de textos
programados.
c) Entender que los resultados se pueden considerar generalizables a los
colegios públicos de su provincia.

3. ENJUICIAMIENTO DE LA INVESTlGACIÓN

3.1. Aspectos generales

• El problema, tal como aparece planteado en forma de preguntas en el


apartado de introducción, parece suficientemente bien delimitado.
• Su formulación de las hipótesis, en forma unilateral, parece indi-
car que el investigador ha tomado postura en función de sus lectu-
ras —estado de la cuestión— y reflexión previa; en un buen infor-
me conviene, además, justificar los motivos que llevan a esta toma
de postura.
• En torno a las variables conviene reseñar la necesidad de que se defi-
nan en forma más precisa; admitamos aquí que tal definición existe y
que los textos programados de ortografía y del área social y natural
responden fielmente a tal definición.
• Acerca de los sujetos el investigador informa de su edad y curso, su
pertenencia a la clase social media y media-baja, y su residencia en

445
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

una capital de provincia. Conviene ser más explícitos, indicando


características psicológicas de variables relevantes —inteligencia, apti-
tudes, conocimientos previos, intereses, etc.— así como precisar los
criterios con arreglo a los cuales han sido clasificados como pertene-
cientes a una clase social concreta. Asimismo conviene definir las
características del tipo de población.
Estas necesidades son aquí más exigibles, debido especialmente al
carácter de nuevo del colegio en que trabaja.
• El tratamiento estadístico de los datos se refiere a los valores medidos
por el investigador en la variable dependiente —en este caso rendi-
miento y creatividad—; habría que analizar si el instrumento utilizado
responde a las exigencias mínimas, entre ellas las de suficiencia y
representatividad de los contenidos y objetivos, así como a la correcta
formulación de los ítems, aspectos estos a los que no hace alusión el
informe.

3.2. Validez interna

Sobre los datos anteriores veamos el juicio que nos merece el diseño uti-
lizado:
• Es positivo que haya hecho la asignación de tratamientos —fichas o
enseñanza programada— al azar, así como el que el profesorado sea
el mismo en ambos grupos. Lo mismo podemos decir de la precau-
ción de aplicar un pretest para asegurarse de que no hay diferencias
iniciales; esta precaución es más explicable al verse forzado a utili-
zar grupos naturales, sin posibilidad de asignar los sujetos al azar a
los grupos. Destacable es su decisión de utilizar los mismos instru-
mentos de medida, lo que, naturalmente, exige que, al margen del
método o variable independiente —v.i.—, contenidos y objetivos
sean los mismos para ambos grupos; loable es su decisión de utili-
zar cinco jueces para medir la creatividad como variable depen-
diente —v.d.—.
• Un aspecto no tan positivo se refiere a las características externas del
texto programado —policopiado y con pocas ilustraciones— lo que
puede no motivar suficientemente a los sujetos del grupo B.

446
ANEXO A LA UNIDAD DIDÁCTICA II

En cuanto a las clásicas variables de validez interna:


• En líneas generales puede entenderse que la variable historia está
controlada; el mismo profesor, idéntico colegio con todo lo que esto
conlleva (objetivos y contenidos iguales para ambos grupos, discipli-
na, ambiente general…), parece que permiten considerar tal variable
como controlada.
• No obstante conviene reseñar la ausencia de información sobre algu-
nos aspectos, como el horario, que puede constituirse en historia no
controlada: al tratarse de los mismos profesores es evidente que no
pueden dar ambas clases a la vez, por lo que, si los horarios no fue-
ran equivalentes, en sus resultados podría darse un influjo diferen-
cial; tal podría ser el caso si un grupo recibiera clase por la mañana
y el otro por la tarde, o antes y después del recreo respectivamente...
Aparte de otras consideraciones aquí puede parecer el punto más
negativo del diseño: al trabajar en un mismo colegio cabe el riesgo
de que no se asegure la independencia entre los sujetos, de modo
que, fuera de las clases, y al hablar entre ellos sobre lo que hacen,
conozcan las diferencias metodológicas y, algunos de ellos, inter-
cambien y mezclen metodologías.
• En cuanto a la maduración habría que hacer alguna precisión; los
grupos son naturales, pero nada se nos dice sobre su formación, que
puede ser alfabética o por resultados de cualquier tipo —medición
en inteligencia; notas de años anteriores...—; si su constitución per-
mitiera pensar en algo similar a los efectos del azar, entendemos
controlada tal variable.
• La utilización de pretests, como sabemos, tiene ciertas posibles
repercusiones negativas que van de la sensibilización hacia temas o
problemas al aprendizaje; estas repercusiones, lógicamente, pueden
traducirse en dudas acerca de si los resultados finales tras el trata-
miento —v.i.—, se deben a y sólo a v.i. o, también en cierta medida
y en forma no determinable, a tales pretests. En el caso que exami-
namos no parece preocupante. El pretest está constituido por prue-
bas habituales en la escuela, y dista mucho tiempo del postest.
• Tampoco hay razones para preocuparse por los instrumentos de
medida como variable extraña; la forma de aplicación, por los pro-

447
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

pios profesores en ambos casos, parece adecuada, siempre que se


tomen en consideración los aspectos reseñados con anterioridad.
• La forma en que se seleccionan los sujetos, que fueron todos los de
ambos grupos de 5.º de Primaria, nos permite pensar en el control de
la regresión estadística; como se sabe, este factor de invalidez exige
una selección de sujetos con puntuaciones extremas en el pretest.
Algo similar podemos decir respecto de una posible selección dife-
rencial de los sujetos de los grupos; aunque la elección no fue al azar,
la comprobación por el investigador, a través de los resultados de los
pretest, de que no existían diferencias significativas, nos permite
creer que tal control es efectivo.
• Por último, en el caso que nos ocupa se da mortalidad experimental,
no muy preocupante por tratarse de pocos casos —tres en el grupo A
frente a 2 en el B—. Sin embargo, convendría considerar si la pérdi-
da afecta en forma similar a ambos grupos, a través de sujetos con
puntuaciones similares, o si desaparecen de unos sujetos superiores,
o inferiores, mientras en el otro lo hacen de modo opuesto. Asimis-
mo es conveniente considerar si, en virtud de los resultados empíri-
cos, la mortalidad podría llegar afectar a los resultados, lo que puede
ocurrir cuando aquellos están muy próximos a los valores críticos o
de significación estadística. En el caso que nos ocupa nada de esto
parece pasar; en efecto, en el caso más preocupante, referente a la
creatividad, la distancia entre el valor empírico —4,414— frente al
teórico —3,84— no permite pensar que el efecto pueda llegar a alte-
rar el resultado.

3.3. Validez externa

• La forma en que se seleccionan los sujetos —muestra a todas luces


incidental— no permite sin más pensar en generalizaciones a otros
colegios, pero sí probablemente a nuevas promociones de 5.° de Pri-
maria del mismo colegio. Es más, su pertenencia a unos estratos
sociales concretos —clase media y media baja— y su residencia
urbana en capital de provincia no hacen pensar en generalizaciones
más allá de estas variables.

448
ANEXO A LA UNIDAD DIDÁCTICA II

Para generalizaciones más amplias convendría realizar la investiga-


ción en otros centros de la provincia ya que pensar en tomar una
muestra al azar de centros de la misma parece impensable por las
complicaciones que conllevaría.
• Lo dicho anteriormente sobre los instrumentos nos permite enten-
der que la administración del pretest, en este caso, presumiblemen-
te no supone restricciones a la generalización de los resultados.
• Algo similar cabe afirmar sobre los posibles efectos reactivos de los
tratamientos experimentales; de una parte los alumnos no saben que
están siendo sometidos a una investigación que pretende ser experi-
mental, por lo que no alterarán su comportamiento habitual. El
único problema reside en si los profesores, aunque son los mismos
en ambos grupos, no lo son en realidad; si se han encariñado más
con un método que con el otro, o su formación es mayor en uno que
en otro, pueden llegar a comportarse, incluso inconscientemente, en
modo diferencial, influyendo en los resultados ya no en cuanto pro-
fesores sino en cuanto variable extraña por lo que los resultados ya
no serían generalizables sino con ellos o con profesores que cum-
plieran con ese sesgo.

3.4. El tratamiento estadístico

• En líneas generales está bien elegido desde la perspectiva de la medi-


ción. Aunque no es seguro que la medida de la ortografía constituya
una escala de intervalo, es verdad que, tal como es medida, ofrecerá
unos resultados bastante próximos. Habría que indicar en el debe del
investigador que nada dice sobre el cumplimiento de los demás
supuestos de la prueba t, como los de normalidad de distribución u
homogeneidad de varianzas.
• Las decisiones para las otras dos variables medidas parecen cierta-
mente bien tomadas.
• Es positivo asimismo que haya diferenciado hipótesis unilaterales y
bilaterales, y que haya elegido correctamente la fórmula de t para el
caso en que se desconocen las desviaciones típicas de la población

449
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

(parámetros) —σA y σB— pero se suponen iguales. Su nivel de con-


fianza parece correcto dado el carácter de su investigación como
aproximación al hecho, ya que su muestra no permite grandes gene-
ralizaciones.
• La existencia de pretest, y el trabajo con grupos naturales, le hubie-
ra permitido, eso sí, trabajar con el análisis de covarianza. No obs-
tante, dados los resultados apreciados en el pretest es presumible
que los resultados finales no hubieran experimentado variación.

450
UNIDAD DIDÁCTICA III

Tema 12. PROCESO DE LA INVESTIGACIÓN CUALITATIVA:


DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES.

Tema 13. MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS


CUALITATIVOS.

Tema 14. EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN


CUALITATIVA.
Tema 12
Proceso de la investigación cualitativa: del problema
a la selección de informantes

Presentación

Introducción

1. Los fundamentos de la metodología cualitativa de investigación


1.1 Su esencia
1.2. Notas que permiten conocer cómo ha sido su construcción histórica

2. La metodología cualitativa de investigación y sus características


2.1. Aportaciones y limitaciones

3. El proceso que sigue la investigación cualitativa


3.1. Propuesta inicial de partida
3.2. Trabajo de campo
3.3. Análisis e interpretación de datos cualitativos
3.4. Elaboración del informe y líneas de acción

4. Los métodos de investigación cualitativa en la educación

Resumen

453
PRESENTACIÓN

El tema aborda el proceso de la investigación cualitativa. Ésta, por el


modo y el procedimiento de aplicar, así como por el objetivo que persigue,
presenta unas características que la diferencian claramente de la modali-
dad de investigación cuantitativa. Pretendemos definirla convenientemente
y ofrecer al estudiante un conocimiento experiencial básico, que estimule
su aplicación en el contexto de la realidad escolar.

INTRODUCCIÓN

Hace ya más de una década, Rodríguez et al. (1996, 62) manifestaban su


preocupación porque el proceso de la investigación cualitativa, no era un
tema objeto de atención prioritaria entre los investigadores que cultivan esta
parcela del saber. Hoy esa idea ya ha sido superada, afortunadamente, y se
cuenta con referentes para ello. Interpretando el diseño en su acepción
amplia (Pérez Juste, 1985,71) lo definía como «planificación de las activida-
des que deben llevarse a cabo para solucionar los problemas o contestar a las
preguntas planteadas»). Así parece que deber ser considerada pues se con-
vierte en un puente entre la cuestión de investigación y la solución o res-
puesta que se le da. La investigación cualitativa, en realidad, lo que se plan-
tea es que observadores competentes y cualificados pueden informar con
objetividad, claridad y precisión acerca de sus propias observaciones de
mundo social, así como de las experiencias de los demás. Tendremos que
reconocer el criterio metodológico que debe corresponder a la investigación
cualitativa.
Como ya hemos visto, se le pueden dar diversos enfoques a la investigación
educativa. Desde una perspectiva cualitativa, las aproximaciones metodológi-
cas y el fundamento teórico de la investigación, hacen que cada una de las pro-

455
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

puestas que se realizan, de los distintos métodos de estudio, puedan aportar


matices bien diferentes, si bien todas presentan un emplazamiento común.
El diccionario de la RAE1 caracteriza el término «cualitativo», como que
«denota cualidad», una idea que con carácter más integral y comprehensivo,
hace referencia a la calidad que representa la naturaleza y esencia completa y
total de un producto. Cualidad participa de la misma raíz del término calidad;
ambas proceden del latino qualitas, que luego derivara en qualis, que puede tra-
ducirse por «cuál, qué». De este modo, si hablamos de cualidad, nos estamos
preguntando por la naturaleza o esencia de un ser, buscando qué es, o cómo es.
Precisamente este sentido, es el que se le atribuye a la «metodología cuali-
tativa». Con ella no se trata de estudiar cualidades que aparecen separadas,
independientes unas de otras, sino de aplicar el análisis a un todo integrado que
forma o constituye una unidad: una persona, una entidad étnica, social, empre-
sarial, un producto determinado, etc. Aunque también se podría estudiar una
cualidad específica, siempre que se tengan en cuenta los nexos y relaciones que
tiene con el todo, los cuales contribuyen a darle su significación propia.
Entendemos pues, que la investigación cualitativa trata de identificar la
naturaleza profunda de la realidad, buscando conocer su estructura e inter-
pretando su comportamiento o las manifestaciones de éste. Lo cualitativo
así, no se opone a lo cuantitativo sino que lo integra, sirviéndose de la cuan-
tificación para dotar de sentido y facilitar la interpretación de las cualida-
des, en su afán por interpretar los hechos. No tenemos más que reflexionar
sobre la esencia de la investigación, para entender que dos pilares funda-
mentan ésta: recoger información y estructurarla para conformar un mode-
lo que nos permita interpretar la realidad. Sabiendo esto, no resulta difícil
entender esa complementariedad que atribuimos a ambas metodologías de
la investigación, pero conviene que analicemos la cuestión desde sus oríge-
nes y planteemos nuestra reflexión desde su fundamento. Veámoslo.

1. LOS FUNDAMENTOS DE LA METODOLOGÍA CUALITATIVA


DE INVESTIGACIÓN
Ya Taylor y Bogdan (1986) definieron el término metodología como aquel
que «designa el modo en que enfocamos los problemas y buscamos las res-

1
[En línea: marzo’2011] <http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=cualitativo>

456
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

puestas», añadiendo que, en Ciencias Sociales, se utiliza para referirse a la


manera de realizar la investigación. Desde entonces, han ido surgiendo múl-
tiples definiciones que enriquecen esta idea, atendiendo a la diversidad de
puntos de partida, de intereses y propósitos, que el investigador puede
encontrar, en virtud de sus propias opciones y posibilidades metodológicas.

1.1. Su esencia

Desde luego, que no resulta nada fácil definir de una manera clara la
metodología cualitativa, algo que puede explicarse, entre otras razones, por-
que siempre, detrás de tal denominación, existen una gran variedad de méto-
dos. En efecto, tal como señalara Jacob, la investigación cualitativa puede
entenderse como la confluencia de tradiciones metodológicas diversas, de
métodos diferentes, en concreto de las siguientes: la psicología ecológica, la
etología humana, la etnografía holística, la antropología cognitiva, la etno-
grafía de la comunicación o el interaccionismo simbólico. Y en esta misma
línea se manifestaba Shulman (1989, 49), un investigador entregado al estu-
dio de la ecología en el aula, cuando señalaba: «Corro el riesgo de agrupar a
lo que muchos investigadores consideran líneas de investigación diferentes.
Sin duda, las orientaciones disciplinarias de las que provienen los partici-
pantes, son diversas: van desde la antropología y la sociolingüística a la psi-
cología ecológica. Están incluidos tanto etnometodólogos como interaccio-
nistas simbólicos. Pero, al compararlos con los psicólogos, sean conductistas
o mentalistas, cuyo trabajo ha dominado las programas examinados con
anterioridad (y el estudio de la cognición del profesor) se puede decir que
constituyen un grupo de investigación con características propias».
Esto nos lleva a entender que la metodología cualitativa está destinada a
producir «datos descriptivos: las propias palabras de las personas, habladas
o escritas». Un planteamiento excesivamente reduccionista, pues en este tipo
de investigación, lo importante no es tanto el tipo de datos a que da lugar sino
la naturaleza y sentido de tales datos. Y nos situaría en el marco del paradig-
ma de enfoque fenomenológico, cuya pretensión no es otra que la de enten-
der o comprender los fenómenos sociales desde la perspectiva de sus actores.
Lo característico, pues, es la comprensión que se pretende, y que ésta se con-
crete en palabras de las personas o en cualquier otro tipo de manifestación,
sean gestos, símbolos o de otro tipo. Este planteamiento queda avalado por

457
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

las palabras de Green (1983) cuando dice, refiriéndose a las investigaciones


sobre la enseñanza desde una perspectiva lingüística, que «el objetivo de este
trabajo es comprender la naturaleza de los procesos de enseñanza-aprendi-
zaje desde la perspectiva de los participantes...»

1.2. Notas que permiten conocer cómo ha sido su construcción histórica

Puestos a establecer referencias históricas, podíamos situar algunas pro-


pias de la metodología cualitativa de investigación en la Grecia clásica de
Aristóteles o Heterodoto, cuyas obras ya mostraban aspectos específicamen-
te cualitativos de trabajo, lo mismo que en el positivismo o el empirismo, que
recurrían a las ciencias sociales como herramienta de trabajo en su estudio
científico naturalista del ser humano, tanto individual como colectivamente.
No obstante, ha de ser en los trabajos de influencia antropológica del siglo
XIX lo que podamos referenciar de forma más precisa. Así García Llamas
(2010, 180) cita el trabajo de Le Play (1855) como la primera investigación
sociológica de base científica, donde se emplea la observación participante
como metodología de trabajo. Más adelante, es Malinowski quien el año 1922
realiza importantes aportaciones al desarrollo de la antropología social cuan-
do recurre no sólo a la observación, sino también a la entrevista en profun-
didad, en sus estudios con las tribus de Nueva Guinea. Estos trabajos, lo
mismo que los desarrollados por Thomas (1931) o Mead (1938) sitúan la
fenomenología en el origen de nuestra metodología de investigación cualita-
tiva, como un enfoque nuevo del conocimiento de los fenómenos sociales.
Siguiendo el estudio de García Llamas (2010, 180-181) descubrimos que
distintos autores sitúan variados referentes en el origen de la metodología
cualitativa de investigación. Así,
• Montero (1984), señala como antecedentes de la investigación cualitativa:
— La corriente funcional estructural de la antropología social británi-
ca (Malinowski)
— La corriente de cultura y personalización, n la antropolía cultural
americana.
— La lingüística antropológica (sociolingüística y etnociencia).
— La interacción simbóilica (etnometodología)

458
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

• Colás (1992), a partir de las aportaciones de Jacob (1987), menciona:


— La psicología ecológica, que se centra en la descripción de los fenó-
menos y sus manifestaciones naturales para descubrir las leyes que
rien los comportamientos (Herbert, Barker, Wright).
— Etnografía holística, busca la exploración, la descripción y el análi-
sis de las manifestaciones culturales (Mead, Malinowski).
— Etnografía de la comunicación, basada en los procesos de interac-
ción social (Green, Cicourel, Erikson).
— Antropología cognitiva o etnociencia, que se basa en el estudio de
la semántica para analizar el comportamiento cultural del grupo
(Spradley, Tyler.)
— Interaccionismo simbólico, basado en la conjunción del individuo
con la sociedad (Blumer, Glasser, Strauss).
• Denzin y Lincoln (1994), establecen cinco etapas en la configuración
de la investigación cualitativa:
— Tradicional (primera mitad del siglo XX), donde destacan la etno-
grafía clásica y realista, protagonizada por la Escuela de Chicago.
— Modernista (1950-1970), caracterizada por el intento de integración
y sistematización de los métodos cuantitativos y cualitativos.
— Período de confusión de géneros (1970-1985), presencia de distin-
tos enfoques como el interaccionismo simbólico o la teoría crítica.
— Crisis de la representación (los últimos quince años del siglo), en
donde se pone en entredicho los fundamentos del conocimiento
etnográfico, apostando por un sistema más discursivo y relexivo.
— El postmodernismo (que incluso se vive en el siglo XXI), donde se
centra el estudio en la crítica social.
Estos diferentes enfoques nos permiten obtener una visión global del
trabajo desarrollado en la época reciente para elaborar este constructo, y de
todo ello, nos parece relevante destacar un hecho, sucedido el año 1969,
cuando Gephart realiza por primera vez una clasificación de las metodolo-
gías de investigación educativa, en la que a la tipología tradicional (históri-
ca, estudio de caso, descriptiva, cuasiexperimental, experimental sin mani-

459
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

pulación de medidas y experimental) añade una nueva, que denomina «no


experimental» (término sugerido por Egon Guba, que intenta contrastar
una metodología naturalista (Tesch, 1990) de indagación, con la ya tradi-
cional que se caracterizaba como experimental).
Luego, a partir de los años ochenta, son ya numerosos los autores que
se refieren a ella en estos términos (Bryman, 1988; Hammersley, 1989; Sil-
verman, 1997), lo que otorga rango de identidad a este paradigma de la
investigación, en el que podemos señalar como elementos diferenciadores
su carácter contextual, el uso del conocimiento tácito y la interpretación
idiográfica de los hechos, la interrelación directa con los participantos o el
análisis inductivo, todo lo cual desemboca, como destaca Sandín (2003,
120), en resaltar la importancia y el rol de la persona como «instrumento»
de recogida de información en ambientes naturales.
En este momento, resulta significativa la contribución realizada por
Bartolomé (1992) en el sentido de romper con la exclusividad otorgada a la
dualidad investigación cualitativa-comprensión, ofreciendo una amplia
gama de perspectivas paradigmáticas, que nos confirman que la compren-
sión (investigación etonográfica, evaluativa, etc.) puede avanzar en el
marco del paradigma sociocrítico, propio de la investigación cualitativa.
Y desde entonces, encontramos autores que continúan señalando el tér-
mino «indagación naturalista», como sucede con Glesne y Peshkin (1992),
Maxwell (1996), Denzin y Lincoln (2000), al tiempo que en nuestro contex-
to más cercano cobra fuerza el concepto cualitativo de la investigación, ya
que además de permitirnos identificar los métodos que se han significado
por su carácter naturalista o interpretativo, ofrece otras perspectiva propias
del análisis o la comprensión de la realidad, en modalidades de investiga-
ción más activas, tal es el caso de Strauss y Gorbin (1990), del Rincón
(1995) o la propia Sandín (2003).

2. LA METODOLOGÍA CUALITATIVA DE INVESTIGACIÓN


Y SUS CARACTERÍSTICAS

La principal característica de la investigación cualitativa, como ya se ha


indicado, es que busca interpretar o valorar los acontecimientos, las accio-
nes, los hechos, desde la perspectiva que tienen los sujetos que las protago-

460
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

nizan. Sustentada en un planteamiento subjetivo del conocimiento, preten-


de una comprensión del fenómeno social, confiriendo importancia y valor
científico a lo personal, buscando en lo particular una descripción o una
comprensión de los hechos objeto de estudio. Sabemos que la realidad del
mundo social depende de los sujetos y son ellos quienes lo construyen y lo
vivencian. Por tanto, si queremos conocerlo no podemos conformarnos con
desarrollar una explicación objetiva de los hechos, sino que tendremos que
apoyar la realidad en la percepción particular que presenten sus protago-
nistas, los sujetos o los grupos. Esta visión nos desvela el carácter dinámi-
co que tiene la realidad, una cualidad que condiciona el desarrollo de la
investigación, pues conocerla supone, como señalaran Gutiérrez y Santana
(2001) «valorar la multiplicidad de visiones que nos ofrece».
Por todo ello, resulta importante aceptar esa necesidad que se tiene de
interpretar qué es lo que está pasando en términos de un entendimiento de
la sociedad como un todo y del significado que tienen los hechos para los
participantes. Sólo podemos entender los acontecimientos si son situados
en un contexto social amplio. Lo que nos permite abordar a partir de este
momento una estrategia de investigación que sea abierta y no estructurada,
evitando la formulación de teorías, que a priori especulan con las distintas
hipótesis hasta aventurar un posible resultado.
A lo largo de nuestra historia más reciente, encontramos distintos auto-
res que nos han diferenciado algunas de las características propias de la
metodología cualitativa de investigación. Una de las aportaciones más sis-
temáticas que conocemos ha sido la de Taylor y Bogdan (1986,20-23) quie-
nes identificaron una decena de características, con las que identificar debi-
damente esta metodología:
a) Carácter inductivo (básico). En lugar de partir de hipótesis, modelos
o teorías, como hace la metodología cuantitativa para someterlas a
contraste mediante la oportuna recogida de datos, el investigador
cualitativo parte de datos que le permiten elaborar conceptos.No
obstante, hemos de señalar que el carácter básico no es incompati-
ble con el constante devenir entre la inducción y la deducción, obli-
gando al investigador a una reelaboración constante de sus plante-
amientos en función de los datos con que cuente y de sus propias
interpretaciones.

461
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

b) Enfoque holista. Los objetos de investigación son analizados en su


contexto. En lugar de reducirse a variables a observar, los objetos de
investigación son estudiados como un todo.
c) Actuación naturalista. El investigador procura interactuar de modo
natural, sin alterar la realidad objeto de observación y análisis salvo
en lo que se refiere a su propia presencia.
d) Enfoque comprensivo. Se trata de comprender a los sujetos investiga-
dos poniéndose en su lugar, tratando de identificarse con ellos tanto
como sea posible.
e) Trabajo sin posiciones apriorísticas. Si bien el investigador, como
cualquier persona, siempre cuenta con ideas y creencias propias, en
su trabajo trata de estudiar la realidad como si las cosas «estuvieran
ocurriendo por primera vez. Nada es sobreentendido».
f) Apertura. Dado que lo importante es la perspectiva, la visión, la percep-
ción de los sujetos, cualquiera de sus enfoques o posiciones sobre la rea-
lidad estudiada merece la pena ser tomada en consideración.
g) Humanismo. Dado que los métodos que se utilizan en la investigación
influyen o condicionan el modo en que se ve a los diferentes sujetos
y nos permiten conocer mejor a las personas o experimentar lo que
ellas sienten.
h) Primacía de la validez sobre la fiabilidad. Lo que preocupa fundamen-
talmente al investigador es la concordancia, el ajuste, entre los datos
y lo que las personas realmente dicen o hacen. El conocimiento así
alcanzado es directo y no filtrado por sus conceptos y definiciones
previas.
i) Cualquier persona y escenario puede ser objeto de estudio. Dado que
cada uno somos a la vez, similar y único, ningún aspecto resulta tri-
vial para ser estudiado.
j) Naturaleza artística. Dada su flexibilidad, el investigador resulta un
artífice, un creador de su propia metodología. Aunque se cuente con
ciertas líneas básicas de actuación no puede hablarse de reglas o pro-
cedimientos que deban seguirse.
Otros muchos investigadores, han sentado el fundamento de la meto-
dología cualitativa. Tal es el caso de Lincoln & Guba, quienes establecie-

462
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

ron unos criterios generacionales de evaluación, señalando algunas


notas identificativas. En esta misma línea TayLor y Bogdan ofrecieron
un muy interesante análisis de los aspectos más relevantes de esta meto-
dología; los factores que igualmente señala Eisner, cuando describe la
participación que tiene el investigador en la investigación cualitativa.
Por último, recogemos la propuesta de Rossman y Rallis, porque com-
pleta muy bien toda esta recopilación, que podemos apreciar de un modo
global en la tabla siguiente:

Caracterización que hacen diversos autores acerca


de la Metodología cualitativa de investigación

Lincoln & Guba (1984) Taylor y Bogdan (1986)

– Concepción múltiple de la realidad. – Es inductiva, desde lo particular, generaliza.


– El principal objetivo es la comprensión – El investigador contempla la realidad
de los hechos. desde una perspectiva holística, de glo-
– El investigador y el objeto de la investi- balidad.
gación se encuentran interrelacionados. – El investigador mantiene una postura natu-
– Se pretende el desarrollo de una serie de ralista, es sensible a los posibles efectos.
conocimientos idiográficos. – El investigador debe superar sus creen-
– No resulta fácil diferenciar entre causas cias y perspectivas particulares.
y efectos. – El método cualitativo es de naturaleza
– Los valores están presentes en la inter- humanista.
pretación de los datos y en el desarrollo – Se pone un gran énfasis en la validez de
de la investigación. la investigación.
– Todos los escenarios y personas deben
ser objeto de estudio.

Eisner (1991) Rossman y Rallis (1998)


– Los trabajos se desarrollan en un contex- – Fundamenta su credibilidad en su cohe-
to de campo. rencia, intuición y utilidad instrumental.
– La actuación del investigador se trans- – Se desarrolla en contextos naturales.
forma en instrumento de trabajo. – Utiliza múltiples estrategias interactivas.
– Prima su naturaleza interpretativa. – Se focaliza en contextos de forma holís-
– Se centra en el estudio en profundidad tica.
de casos particulares. – Naturaleza emergente.
– Se recurre a un lenguaje expresivo que – Proceso basado en un razonamiento
recoja matices específicos de cada fenó- multifacético e interactivo.
meno estudiado. – Es fundamentalmente interpretativa.
– Están adquiriendo gran credibilidad, por
la coherencia de sus planteamientos.

463
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Esta caracterización que ofrecen los autores citados, le permite al pro-


fesor García Llamas (2010, 184) destacar cuáles son las características que
definen a la metodología cualitativa de investigación educativa:

1. Su objetivo último se dirige hacia el estudio de los hechos y fenómenos educa-


tivos, en su contexto general de actuación.
2. Se interesa por el significado más que por la mera descripción de los hechos, de
ahí su enfoque subjetivo en la percepción de la realidad.
3. Parte de concepciones abiertas sobre la realidad estudiada, lo que implica no des-
echar, de entrada, ninguna de las posibles alternativas de respuesta.
4. Su procedimiento de trabajo es de tipo inductivo: mediante el análisis en pro-
fundidad de muchos casos particulares, pretende llegar a establecer generaliza-
ciones, siendo sus puntos de partida muy débiles.
5. Suele trabajar con las muestras de sujetos situadas en su escenario natural, por
lo que no recurre, en general, a la selección aleatoria de sujetos.
6. Se genera un contacto directo entre el investigador y el objeto de la investiga-
ción, lo que llega a producir interferencias e implicaciones mutuas que pueden
distorsionar la propia realidad estudiada.
7. Debe recurrir a la triangulación de métodos, tanto en la recogida como en el
análisis de datos, para evitar sesgos y visiones parciales, lo que contribuye a
aumentar la propia validez de los resultados.
8. Prima el lenguaje expresivo, de tipo conceptual y metafórico, frente al de tipo
estadístico y de algoritmos. Ello permite una riqueza de matices sobre los fenó-
menos estudiados.
9. Dado su carácter analítico y descriptivo, puede servir de base para generar hipó-
tesis de trabajo, sobre las cuales pueda actuar el método cuantitativo.

E igualmente, facilita su desarrollo el contar con la aportación de Colás


(1998, 293), en el sentido de permitirnos sistematizar los objetivos que pre-
senta la investigación cualitativa:

■ Descriptivos ■ Identificación de elementos y exploración de


sus conexiones:
– Descripción de procesos, contextos, institu-
ciones, sistemas y personas

464
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

■ Interpretativos ■ Comprensión del significado del texto o


acción y descubrimiento de patrones:

– Desarrollar nuevos conceptos

– Reelaborar conceptos existentes

– Identificar problemas

– Refinar conocimientos

– Explicar y crear generalidades

– Clasificar y comprender la complejidad

■ Contrastación teórica ■ Elaborar, contrastar o verificar postulados,


generalidades y teorías

■ Evaluativos ■ Evaluar políticas e innovaciones

Tendríamos aún que insistir, como hiciera Bartolomé (1992), en el hecho


de que, detrás de estos objetivos, subyace la idea de transformación de la rea-
lidad, máxime cuando nos movemos en el ámbito educativo, donde las ideas
de conocimiento, intervención o investigación no tienen sentido si no aportan
una vía de transformación a esta sociedad. Así identificar o comprender los
fenómenos educativos, ha de llevarnos a una situación de transformación real
de éstos, que suponga una contribución efectiva a la propia evolución social.
De este modo, vemos que la metodología cualitativa resulta una alternati-
va muy válida y eficaz para el análisis de la realidad educativa, lo cual no sor-
prende a tenor de la gran cantidad de trabajos que se han aportado según este
modelo, y de la notable calidad de los mismos. Estos están contribuyendo a
que en los últimos años se esté trabajando en cuestiones como la construc-
ción y la interpretación de la realidad, la etnicidad de los procesos de inves-
tigación o el poder y el control del proceso investigador, lo cual ha contribui-
do, en cierta manera, a repensar el enfoque cualitativo de la investigación así
como el papel que juega el investigador en todo este proceso.
Para situarla contextualmente, nos parece muy interesante el esquema
elaborado por Del Rincón (1995, 27), a partir de los estudios referenciados
con anterioridad, el cual nos ofrece una visión clara y sintética de su posi-
ción en el marco de las metodologías de investigación:

465
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Esquematización de las Metodologías y tipos de investigación


(Del Rincón, et al., 1995, 27)

Metodologías Tipos de Investigación


Experimental
Empírico-analítica Cuasi-experimental
(cuantitativa) Cuasi-experimental
ex-post-facto
Fenomenológica
Interaccionismo simbólico
Constructivista Etnografía
(cualitativa) Teoría fundamentada
Etnometodología
Fenomenográfica
Investigación-acción
Sociocrítica Participativa
(cualitativa) Colaborativa
Feminista

Es una propuesta que ha sido muy reconocida por todos los autores, ya
que vincula los paradigmas tradicionales de investigación con las metodo-
logías, si bien encontramos algunas carencias que debiéramos considerar,
como es el caso de la investigación evaluativa (de carácter mixto) o cues-
tionamos la presencia de algunos tipos, como el feminista, cuya perspecti-
va investigadora, dada la evolución que ha marcado con el tiempo, hoy es
posible considerarla en el marco de la investigación etnográfica. No obs-
tante, como decimos, esta clasificación nos señala perfectamente el maco
referencial de nuestra investigación cualitativa, en la que situaríamos los
estudios que desarrollan objetivos de comprensión de los fenómenos
socioeducativos y de transformación de la realidad.
Y podemos concluir, haciendo nuestra una definición muy clara y pre-
cisa del término de investigación cualitativa, de Sandín (2003,123), cuando
la describe como:

«Una actividad sistemática, orientada a la comprensión en profundidad de los


fenómenos educativos y sociales, a la transformación de prácticas y escenarios
socioeducativos, a la toma de decisiones y también hacia el descubrimiento y el
desarrollo de un cuerpo organizado de conocimientos.»

466
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

Cuyas características, a la luz de los diferentes planteamientos aludidos,


y de los trabajos complementarios por ellos generados, podemos concretar
en que:
• Es un esquema dialéctico de procesos inductivos y deductivos (Agar,
1980).
• Los datos no se obtienen por técnicas predeterminadas (Guba y Lin-
coln, 1981).
• Sigue algunas orientaciones teóricas (Bogdan y Biklen,1982).
• La selección de los informantes se realiza con criterios etnográficos y
no por procedimientos de muestreo (Goetz y LeCompte, 1984).
• Es necesaria la presencia prolongada en el campo (Malinowski, 1986).
• Toma en consideración las perspectivas y los significados de los acto-
res (Erikson, 1986).

2.1. Aportaciones y limitaciones

Siguiendo al profesor Pérez Juste, es posible establecer, de todo este


planteamiento, tres grandes aportaciones de la metodología cualitativa:
a) Lo que es su razón de ser: una comprensión en profundidad de la rea-
lidad personal del sujeto, organización o, en general, objeto estudia-
do. Las especiales características de la metodología están orientadas
justamente en esta dirección.
b) Las percepciones de los protagonistas, expresadas por ellos mismos.
Otras formas de investigación nos sitúan ante las interpretaciones
que otros hacen de los hechos o dichos de tales protagonistas. Aquí
nos hallamos ante la propia forma de ver la realidad por quienes la
han experimentado o vivido. Para justificar esta aportación tal vez
convenga acudir al famoso aforismo de W.I. Thomas: «Si los hombres
definen las situaciones como reales, estas serán reales en sus conse-
cuencias».
c) Información básica para teorizar. A partir de los resultados de la
investigación cualitativa es más fácil avanzar hipótesis susceptibles

467
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

de ser sometidas a contraste y, en la medida en que se cuente con los


medios necesarios y se lleve a cabo con el rigor propio de los métodos
cuantitativos, generalizar los resultados.
También es justo reconocer que las aportaciones de la investigación
cualitativa dependen, en gran medida, de la calidad misma de la investiga-
ción. Si es cuantitativa y, sobre todo, experimental, cuenta con una serie de
indicios de su calidad, tales como la validez interna y externa de los diseños
y la validez y fiabilidad de los instrumentos utilizados en la recogida de los
datos. No parece que se pueda exigir a una modalidad diferente, la cualita-
tiva, los mismos criterios de calidad. Pero en el caso de la investigación cua-
litativa, tendremos que hablar de credibilidad o confianza, algo que depen-
de, entre otros factores, del hecho de la presencia prolongada del
investigador en el campo, de la persistencia en su tarea, de la comprobación
reiterada de los datos y anotaciones, de la coherencia entre los plantea-
mientos y sus desarrollos y de las comprobaciones y del contraste que se
lleve a efecto con los participantes.
Junto a la credibilidad, la cuestión de transferencia de los hallazgos —
validez externa o generalización en las investigaciones cuantitativas—, será
algo que va a depender del grado de semejanza que exista entre el contexto
estudiado y aquel al que se pretende aplicar los resultados hallados, lo que
implica la presentación detallada de aspectos como el proceso de selección
de informantes o de la abundancia y detalle de la información recogida.
Por otro lado, también encontramos que la metodología cualitativa pre-
senta limitaciones, las cuales podemos concretar en dos:
a) La influencia del investigador en los resultados de la investigación.
Aunque parezca contradictorio con la característica que hemos seña-
lado de ser naturalista, la continuada relación entre el investigador y
los sujetos, puede «crear» artificialmente los hechos y hasta llevar a
los sujetos a asumir como propias las posiciones expresadas o intui-
das en el investigador a la hora de etiquetar o clasificar sus posicio-
nes, ideas o comportamientos.
Para evitarlo, en la medida de lo posible, no se debe aportar infor-
mación sobre los propósitos de la investigación ya que podría llegar
a encontrarse con auténticas puestas en escena» de los acontecimien-
tos para que «se vean».

468
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

b) Las dificultades para generalizar. Cualquier realidad, grupo, organi-


zación, entidad..., presenta, junto a los casos ordinarios o medios,
una cierta dispersión, con lo que conocer el caso típico no asegura el
conocimiento de lo fundamental de la realidad.

3. EL PROCESO QUE SIGUE LA INVESTIGACIÓN CUALITATIVA

Ya señalaron en su momento Ruiz e Ispizua (1989) que la investigación


cualitativa está sometida a un proceso de desarrollo similar al de cualquier
otra de naturaleza cuantitativa, el cual sigue las cinco fases ya señaladas en
temas anteriores: definir el problema, diseñar el proceso de trabajo, la reco-
gida de datos, su análisis y la validación e informe correspondiente. Pero
también es cierto, que la disparidad metodológica y técnica de la investiga-
ción cualitativa, obliga a respetar matices diferenciadores en cada una,
fruto de la particularidad de sus circunstancias, que determinan el desa-
rrollo que en cada caso, pueda seguir. Una peculiaridad que nos lleva a esta-
blecer matices muy específicos, que la otorgan especificidad y que a los
investigadores los convierte, en cierto modo, en artífices (artistas) de su
propia y particular obra.
Y este mismo nos lleva a resaltar una doble evidencia que de algún
modo matiza el proceso metodológico. En primer lugar, significaríamos
que no resulta nada fácil establecer un procedimiento de actuación único,
ni tampoco uniforme. Esto hace que la literatura al respecto, se diversifi-
que. A modo de ejemplo, como puede apreciarse en el cuadro adjunto,
Colás (1992) establece un desarrollo interactivo de todo el proceso, el cual
Denzin y Lincoln (1994) lo determina en función de una serie de activida-
des genéricas igualmente interrelacionadas. Latorre (1996), por su parte, lo
sistematiza en seis fases, en cuyo planteamiento destaca una primera etapa
de carácter exploratorio, como fundamento de todo el proceso.

Colás (1992) Desarrollo teórico.

Desarrollo del diseño: formular hipótesis, planear la reco-


gida de datos…

Muestra.

Análisis de datos.

469
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Denzin y Lincoln (1994) Teoría: marco determinado por el conjunto de ideas del
mundo circundante al investigador.

Epistemología: interrogantes y cuestiones que se preten-


den resolver.

Metodología y análisis: la forma en que se recogen los


datos y se analiza la realidad.

Latorre et al. (1996) Fase exploratoria, de reflexión: identificación del problema,


cuestiones previas, revisión documental y perspectiva teórica.

Fase de planificación: selección del escenario y de la estra-


tegia de investigación, redefinir el problema y las cuestio-
nes de la investigación.

Fase de entrada en el escenario: negociación del acceso,


selección de participantes, selección de participantes,
muestreo intencional.

Fase de Recogida y análisis de la información: estrategias


para la recogida de la información, técnicas de análisis y
rigor de éste.

Fase de retirada del escenario: finalizar la recogida de


información, análisis de la información.

Fase de elaboración del informe: tipo de informe y elabo-


ración.

Y en segundo lugar, que nos parece conveniente tomar en consideración


estas características de los diseños de investigación cualitativa, las cuales
todo estudioso es necesario que tenga muy presente para conseguir un ade-
cuado desarrollo de su investigación:
• Una primera característica de los métodos cualitativos se manifiesta
en su propia estrategia de trabajo, ya que tratan de conocer los
hechos, procesos, estructuras y personas en su totalidad, y de un modo
directo, no como les diferencia de los métodos cuantitativos, que lo
hacen a través de la medición de algunos de sus elementos. La misma
estrategia indica ya el empleo de procedimientos que dan un carácter
único a las observaciones.
• La segunda característica es el uso de procedimientos aplicados, que
hacen menos comparables las observaciones en el tiempo y en dife-

470
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

rentes circunstancias culturales. Es decir, se busca menos la generali-


zación de las conclusiones y se acerca más a la fenomenología y al
interaccionismo simbólico, en su búsqueda de la interpretación de los
hechos.
• Una tercera característica la encontramos en el papel que juega el
investigador, quien mantiene un trato directo con las personas involu-
cradas en el proceso de investigación, pues no en vano, pretende inter-
pretar los hechos para llegar a entenderlas.
• Por último, hemos de tener presente que el investigador desarrolla
o afirma las pautas y problemas centrales de su trabajo durante el
mismo proceso de la investigación. Por tal razón, los conceptos que
se manejan en las investigaciones cualitativas, en la mayoría de los
casos, no están operativizados desde el principio de la investiga-
ción, es decir, no se definen desde el inicio los indicadores que se
tomarán en cuenta durante el proceso lo que en cierto modo condi-
ciona y determina la objetividad de la investigación.
En cuanto al procedimiento en sí, hechas las salvedades anteriores,
planteamos un corpus de trabajo general, para la metodología de investi-
gación cualitativa, que ya desarrollara García Llamas (2010), basada,
como puede apreciarse en el esquema adjunto, en cuatro fases o etapas de
trabajo:

Proceso de Investigación
Cualitativa

Trabajo de campo:
Propuesta inicial de partida:
– Marco teórico – Acceso al campo
– Diseño – Selección de técnicas
– Proceso de recogida de datos

Elaboración del informe y


Análisis e interpretación
líneas de acción: de datos cualitativos
(Retroalimentación)

471
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

3.1. Propuesta inicial de partida

Se trata de una fase preparatoria, en la que se plantea el futuro desa-


rrollo del trabajo. Por eso, hemos de comtemplar al menos estos dos apar-
tados:
Marco teórico del trabajo
Esta es una fase eminentemente reflexiva, en la que el investigador ha
de consultar cuantas fuentes documentales se encuentren a su alcance,
con el objeto de «fundamentar» la idea inicial que ha motivado su estu-
dio, y que ha de ser el eje en torno al que gire todo el trabajo. Conocer dis-
tintas perspectivas, experiencias y opiniones, va a enriquecer el punto de
vista que tenga acerca del problema, así como las decisiones que del estu-
dio se deriven. Por eso es muy importante esa riqueza del planteamiento,
documentarse debidamente, y obtener un sentido abierto de la cuestión a
trabajar.
Siguiendo a Wolcott (1992), podemos encontrar tres enfoques en la fina-
lidad de los trabajos: aquellos que están orientados a la teoría, los que se
orientan a la conceptualización y los que lo hacen hacia las reformas y pro-
blemas de carácter político. De cualquier modo, será necesario delimitar
con nitidez ese marco teórico conceptual donde se llevará a efecto nuestro
estudio, y que servirá de referencia a lo largo de todo el proceso.
Comenzaremos seleccionando una serie de preguntas que resulten rele-
vantes para la investigación; éstas han de focalizar oportunamente la cues-
tión que queremos trabajar. Eso sí, no serán definitivas. No olvidemos que
hemos insistido en el carácter dinámico del proceso, por lo que podrán ser
reformuladas a medida que avanza la investigación.
Las fuentes de documentación pueden ser muy variadas. Así podemos
plantearnos:
• Fuentes documentales escritas, como puedan ser tesauros, reposito-
rios, bases de datos, o cualquier otra fuente bibliográfica que nos apor-
te información al respecto.
• Fuentes documentales orales, unas veces, recopilando información de
otros especialistas, otras en el marco escolar donde las vamos a encon-
trar en torno al aula o las actividades propias de la vida educativa.

472
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

• Registros, en distintos soportes, de datos, reuniones, experiencias,


estudios o trabajos desarrollados en relación al tema de estudio.
Todos nos permitirán, lo mismo obtener las fuentes documentales,
como recoger referencias indirectas. Todas valiosas y enriquecedoras para
el conocimiento de la cuestión. Lo que es importante, siempre, que el inves-
tigador justifique las razones (que pueden ser personales, sociales, educati-
vas o profesionales) por las que se eligen esas fuentes, para luego proceder
a su análisis y estudio detallado. La descripción del estudio que se preten-
de, ha de ir focalizando progresivamente el centro de interés de nuestro
estudio, pues éste tiene necesariamente que ir mediatizado por el enfoque
o la teoría subyacente a la investigación.
Diseño
Muy importante, pues marcará las pautas de actuación futuras del
investigador, por lo que debe preocupar al investigador descubrir progresi-
vamente los caminos de solución al problema. En cierto modo, hasta que el
investigador no entre dentro del campo de estudio, no podrá percibir todas
las peculiaridades de su trabajo. Este planteamiento inicial del procedi-
miento a seguir en el trabajo, habrá de estar igualmente abierto, para ir
luego delimitándose durante el proceso. Aún así, es necesario, para tomar
un buen punto de partida, recoger en un documento, la previsión de los
posibles aspectos a contemplar.
El método de trabajo a seguir, queda supeditado a la intención de
la investigación (los interrogantes generados por el marco teórico de
trabajo). De cualquier modo, en el diseño redactado, hay que contem-
plar al menos: posibles (1) hipótesis directivas, u objetivos del estudio,
lo que implicará identificar el caso particular que va a estudiarse, (2)
el escenario social donde se lleve a efecto la investigación (su accesibi-
lidad, las manifestaciones que se tendrán que identificar en el estudio,
las relaciones a establecer con los informantes y sus límites espacio-
temporales), así como (3) los recursos necesarios (y disponibles) para
trabajar.
Y por supuesto, hay que contar con todas las garantías posibles sobre la
eficacia de la propuesta, la cual nos la aportará el desarrollar una buena
triangulación metodológica. Janesick (1994) nos recomienda dirigirla al
tiempo, al espacio, a las teorías, a los investigadores y a los datos, de modo

473
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que el diseño tome en consideración cambios temporales, espaciales, alter-


nativas, de observadores y de fuentes de datos).
De cualquier modo, resulta claro que la postura adoptada por el investi-
gador en esta primera fase, va a influir sobre las siguientes, pues las técni-
cas e instrumentos empleados en la recogida de información, lo mismo que
el tratamiento de los datos, vendrá condicionada por ese planteamiento ini-
cial, por el rigor y el alcance que el investigador, aplique sobre su progra-
ma de trabajo.
El producto final de esta fase, será un documento escrito, el PROYECTO
DE INVESTIGACIÓN, para el cual encontramos muy adecuada la propuesta
de contenido que hacen Rodríguez et al. (1996, 66):
1. Marco teórico (resultado de la fase de reflexión),
2. Cuestiones de investigación.
3. Objeto de estudio.
4. Método de investigación.
5. Triangulación.
6. Técnicas e instrumentos de recogida de datos.
7. Análisis de datos.
8. Procedimientos de consentimiento y aprobación.
y siempre en el marco de flexibilidad o de adaptabilidad al medio que
requiera la propia realidad educativa que se estudia.

3.2. Trabajo de campo

Si en la fase anterior, el investigador trabajaba fuera del campo, salvo


algún esporádico contacto de aproximación, ahora inicia una fase mucho
más operativa. Esto significa que, si la etapa anterior exigía del investiga-
dor una sólida investigación, y un dominio metodológico, ahora requerirá
de unas cualidades personales, en la forma de actuar y comportarse con los
demás, pues no en vano, se llevará a efecto en el campo. Precisará una
mayor versatilidad y una adaptación a las distintas situaciones que le toca-

474
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

rá vivir con los informantes, una notable persistencia en el trabajo, y gran


paciencia en las tareas que habrá de aplicar. A estas cualidades, tenemos
que añadir las de iniciativa y adaptabilidad, pues el investigador tendrá que
tomar decisiones de forma permanente.
Y siguiendo el esquema de trabajo presentado, dos será las actividades
a desarrollar por los investigadores en esta fase:
• Acceso al campo de estudio
Este será el primer contacto que se establezca con el campo de traba-
jo, al cual nos dirigimos para recoger información y datos, para nues-
tro estudio. Esta recogida habrá de ser, dadas las peculiaridades que
venimos atribuyendo a la investigación cualitativa, real, presencial, in
situ, por lo que el investigador necesita cuidar el acceso que tenga al
grupo, y el modo en que su incardinación sea lo más fácil y natural
posible.
Con habilidad, paciencia, perspicacia y visión, el investigador planifi-
ca su «entrada» en el grupo donde trabajará. Para ello tendrá que obte-
ner cuanta información sea posible del grupo donde vaya a trabajar, y
luego, con paciencia, esperar (de forma activa, pues no tiene sentido
una espera pasiva) a ser aceptado por los informantes. Incluso, será
necesario que el investigador conozca de antemano las normas for-
males e informales de funcionamiento del lugar en el que tendrá que
trabajar. Una buena toma de contacto, recopilando cuanta informa-
ción sea posible conocer, nos permite un conocimiento informal, para
luego ir programando las relaciones a establecer, las características y
posibilidades de colaboración de cada uno, horarios, espacios y tiem-
pos, en los que llevar a efecto el trabajo. De este modo, se prepara el
acceso y la entrada en el campo nos familiariza con él.
Pero, ¿qué caracteriza a los buenos informantes? Parece claro que su
efectividad en el estudio vendrá dada porque es quien dispone del
conocimiento sobre la experiencia que requiere el investigador, por-
que presenta una cierta habilidad para reflexionar sobre el objeto de
estudio, pero también porque se expresa con claridad y ofrece dispo-
nibilidad para colaborar positivamente. No obstante, no siempre es
posible seleccionar la muestra, y más frecuentemente es necesario tra-
bajar con sujetos aportados por el propio sistema, para lo cual, con-

475
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

viene describir lo más detalladamente, el perfil requerido para la


muestra.
En algunos casos es posible realizar previamente un estudio piloto, que
determine referencias a considerar, además de permitir un modo de
entrenamiento del investigador. Cuando esto no sea posible, habrá que
cuidar de manera muy especial y meticulosa el comportamiento y todo
el procedimiento de actuación.
Otra cuestión importante que se debe estudiar con anterioridad será el
proceso de selección de la muestra del estudio (no olvidemos que estos
sujetos serán quienes proporcionen la información que se precisa). La
metodología cualitativa obliga a trabajar con muestras de tipo inten-
cional, dinámico y secuencial, no siempre deseable, ni tampoco moti-
vada, cómoda ni satisfactoria. El investigador ha de fijar los criterios
de selección, de modo que se garantice la posibilidad de generaliza-
ción de los resultados (o al menos poder extrapolarlos a otros contex-
tos). No siempre se trabajará con expertos, e incluso habrá ocasiones
en los que se deberán buscar situaciones extremas, para comparar
resultados. Además, los roles de los diferentes participantes en la
investigación, en virtud del carácter dinámico que se le ha atribuido,
variarán a lo largo del estudio, cambiando y adaptándose a las necesi-
dades de cada momento.
• Selección de técnicas e instrumentos
Una vez preparado el campo, será preciso seleccionar la técnica y el
instrumento de recogida de información que mejor se acomode a los
objetivos de la investigación. Éstas básicamente son tres:
■ La observación, que si bien es una técnica que también encontramos
en la metodología cuantitativa de investigación, cuando el investiga-
dor se hace miembro del grupo, interactuando con él en su propio
medio y tomando datos de forma sistemática, aunque no intrusiva
(Pérez Juste, 2011), resulta una técnica muy útil al servicio de la
metodología cualitativa.
■ La entrevista, corresponde a un esquema de relación que establece el
investigador, basado en el cuestionario, para obtener la información
necesaria para su estudio (Colás, 1998).

476
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

■ Y las técnicas narrativas y documentales, que implican todo el trata-


miento de datos informativos en los procesos de investigación (Cor-
betta, 2010)
En el próximo tema, vamos a ocuparnos de analizar con mayor profun-
didad las posibilidades de trabajo que nos permiten cada una de éstas téc-
nicas. No obstante, en estos momentos diremos que a diferencia de la ins-
trumentación técnica descrita en la metodología cuantitativa (muy
generalizada), aquí es preciso una concepción y una elaboración muy pre-
cisa y específica de los instrumentos y técnicas, incluso, como vamos vien-
do a lo largo del tema, con la posibilidad de que evolucione, según va trans-
curriendo el estudio, para adaptarse a las situaciones cambiantes del grupo
y de los sujetos.
• Proceso de recogida de información y datos
El diseño de esta fase de la investigación, implica por parte del inves-
tigador, una descripción bien detallada del modo en que se recogerán
los datos, el personal implicado y sus oportunas instrucciones y nor-
mas, tiempos y espacios concretos, momentos en que se lleve a efecto
y los instrumentos y recursos a emplear. La meticulosidad en esta des-
cripción se transformará en mayor riqueza y efectividad de los datos
obtenidos. No olvidemos que la calidad de toda investigación la deter-
mina precisamente la calidad de los datos recogidos. Para ello habrá
que tener en cuenta los criterios de suficiencia y adecuación de los
datos. La suficiencia se refiere a la cantidad de datos recogidos, y se
consigue cuando se llega a un estado de «saturación informativa», de
modo que la nueva información ya no aporte nada nuevo a la investi-
gación. La adecuación se refiere a la selección de la información de
acuerdo con las necesidades teóricas del estudio y el modelo emer-
gente.
Con los primeros análisis irá surgiendo un modelo de trabajo que
puede ser devuelto a los informantes, asegurándonos con ello el rigor
en el estudio. En algunas ocasiones éstos permitirán confirmar de
forma inmediata la pertinencia, adecuación y validez del estudio.
Incluso, no será extraño que este proceso se desarrolle en dos etapas,
de modo que el análisis de los datos obtenidos en un momento, nos
haga ver la necesidad de una segunda toma, mucho más selectiva, en
la que se obtengan datos más relevantes para el estudio, un criterio

477
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que nos indicará el desarrollo de la triangulación de datos que había-


mos previsto en el diseño del Proyecto.
Por último, señalar que tan importante como la entrada en el
grupo, es la salida del investigador. Ésta debe estar programada, de
modo que cuando se tengan los datos necesarios y con la suficien-
te validez, se retire para evitar que su implicación contamine la
sensibilidad de los datos, pudiendo llegar a convertirse en lo que se
llama un «nativo».
El producto de esta fase, será un DOCUMENTO-GUÍA de planificación,
específico de la investigación, en el que no solamente se describa sino que
también se especifique con detalle la muestra y el campo de trabajo, así
como los instrumentos y técnicas que se vayan a aplicar y el procedimien-
to que se seguirá en la recogida de los datos. Todo con sumo detalle, si bien,
como ya viene siendo característico, sabemos que se tratará de un docu-
mento referencial, que habrá de acomodarse al proceso, al grupo y a los
sujetos, lo que supondrá una constante reelaboración.

3.3. Análisis e interpretación de datos cualitativos

El proceso que venimos describiendo, no requiere el cierre de una


fase para la apertura de la siguiente, sino que es posible superponerlas.
Conviene proceder a realizar el análisis interpretativo de los datos, cuan-
do éstos aún se están recogiendo en el escenario de trabajo, al objeto de
proceder a una constante secuencia de reelaboración en la interpreta-
ción, de modo que ésta se modifique y enriquezca constantemente. Un
procedimiento nada sorprendente en el marco de la investigación que
estamos desarrollando, pues constatar su optimismo, es la mejor garan-
tía de validez.
Dos son los momentos que conforman esta fase:
• El análisis de datos cualitativos
Se trata de recopilar datos, organizarlos adecuadamente, sinteti-
zarlos y buscar relaciones entre ellos, al objeto de descubrir el con-
tenido de información y aportaciones que sea posible. Son tareas
que requieren la reducción, categorización, clasificación, síntesis

478
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

y comparación de la información que se ha recogido en la fase


anterior.
El carácter abierto y flexible que ha caracterizado todo el proceso,
no permitirá sistematizar fácilmente dicho estudio, requiriendo
seguir directrices nada concretas, con enfoques, perspectivas y
orientaciones bien dispares. El investigador tendrá que descifrar el
mensaje de los datos, partiendo de la base de que no existe un pro-
cedimiento general válido para todo tipo de análisis cualitativo. De
este modo, el análisis de datos cualitativos va a ser considerado aquí
como un proceso realizado con un cierto grado de sistematización;
no obstante, resulta difícil hablar de una estrategia o procedimien-
to general de análisis de datos cualitativos, con la salvedad de lo que
pueda inferirse a partir de las acciones identificadas enun análisis
ya realizado.
Partiendo de estas inferencias, distintos autores han intentado orga-
nizar la estructura de trabajo de esta fase, coincidiendo al menos en
las siguientes tres tareas que sistematizan debidamente el procedi-
miento:
• La reducción de los datos
• Su disposición y transformación, en formas de presentación que
facilite la interpretación
• La obtención de resultados o conclusiones.
• La interpretación de datos cualitativos
En continuidad con lo anterior, el investigador ha de interpretar, es
decir, valorar, el sentido y la información obtenida de los datos. Dos
niveles de compromiso se identifican en ella:
• Una interpretación aproximativa de naturaleza descriptiva, en la que
se analizan los datos tal y como se han recogido, conforme al com-
portamiento que hayan presentado en la muestra.
• Una interpretación significativa, que añade a la anterior la significa-
ción estadística de los valores que alcanzan los diferentes estadísti-
cos, para poder afirmar, con cierto grado de probabilidad de acierto,
que los cambios producidos en el grupo, no son explicables por efec-

479
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

to del azar, sino por las diferencias reales que presentan los sujetos
o los grupos estudiados.
El producto de esta fase, resultará una TABLA de DATOS debidamente
INTERPRETADA, fruto de las dos etapas que acabamos de describir en su
desarrollo.

3.4. Elaboración del informe y líneas de acción

Y con la presentación (y difusión) de los resultados, se culmina el pro-


ceso de la investigación. Es lo que se denomina el INFORME.
El informe de la investigación nos permite alcanzar una mayor y mejor
comprensión de los fenómenos estudiados, pero también difundirlos en la
comunidad científica, interesada en su conocimiento. Puede presentar un
doble formato:
• Un informe de estilo descriptivo debe ser un argumento convincente
presentando los datos sistemáticamente que apoyen el caso del inves-
tigador y refute las explicaciones alternativas. Su redacción exigirá
prestar especial cuidado a la presentación, al objeto de acomodarlo al
público al que vaya destinado. Y su contenido, explicitará el procedi-
miento seguido en la investigación, a lo largo de dos fases preceden-
tes, de trabajo de campo y de análisis interpretativo de datos, que con-
firmen la efectividad y la validez de los datos así como el conocimiento
que se aporta con el estudio.
• Por su parte, si se trata de un informe divulgativo, ha de reflejar muy
genéricamente el proceso, centrándose de manera principal en las res-
puestas y soluciones que el estudio aporta a los problemas educativos
estudiados.
Además, tengamos presente que, respondiendo al carácter cíclico de
esta propuesta metodológica, la investigación no concluye con el informe,
pues conviene, ofrecer una vía de desarrollo futuro que permita dar conti-
nuidad al conocimiento obtenido, y marcar las pautas de retroalimentación
que ofrezcan nuevas reformulaciones con las que completar y enriquecer el
estudio de los hechos educativos abordados. El investigador cualitativo
puede verse como un incansable crítico interpretativo. De este modo, el

480
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

conocimiento desarrollado podrá repercutir de forma directa en la propia


realidad social y educativa, a la que va dirigida.

4. LOS MÉTODOS DE INVESTIGACIÓN CUALITATIVA


EN LA EDUCACIÓN

Nos queda, para completar el tema, realizar una reflexión acerca de las
posibilidades que presenta esta metodología de investigación para la edu-
cación. A priori, pensamos que son muchas, puesto que la persona, es su
objeto de estudio, y ésta, en el marco escolar, reporta un contexto rico, idó-
neo para la realización de estudios de naturaleza cualitativa. Frente a la
postura neopositivista, como fuente de rigor metodológico, actualmente se
acepta ya la consideración de que las técnicas cualitativas pueden aportar
una contribución válida a la producción y al análisis de evidencia empírica,
facilitando la generación y el contraste de hipótesis.
En principio, hemos de tener en cuenta, como vimos al inicio del tema,
la gran diversidad de perspectivas metodológicas que presenta la investiga-
ción cualitativa. Esta complejidad se percibe en la realización de estudios
de carácter socioeducativo. Los estudios de Jacob (1988), Strauss y Corbin
(1990), Bartolomé (1992), Buendía (1998)… han permitido clasificaciones
muy distintas, entre las que podemos extraer tres metodologías que con-
forman un recurso de gran interés para la escuela:
• La investigación etnográfica y el estudio de casos
Si bien los primeros estudios desarrollados desde los inicios del siglo XX
aparecen ligados a los estudios antropológicos y a la sociología, a media-
dos de siglo ya se desarrollan estudios acerca de la integración de la cul-
tura en el campo de la educación (Kimbal y Spindler). Luego, en los
años setenta, estos trabajos se extienden a otros aspectos como los sis-
temas didácticos o la evaluación (Cazden, Spradley, Erikson, Arkin-
son…), alcanzando notable difusión los trabajos desarrollados por la
Escuela de Chicago acerca del análisis de las relaciones en el aula. De
este modo, se nos confirma que la etnografía educativa es una modali-
dad de investigación cualitativa, encuadrada en el paradigma interpre-
tativo, cuyas aportaciones se hacen extensivas a diversas disciplinas del
campo social y educativo. Su objetivo podemos establecerlo en aportar

481
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

datos valiosos, de naturaleza descriptiva, sobre los contextos, las activi-


dades y las creencias que presentan los sujetos que protagonizan el esce-
nario educativo.
Tomamos de García Llamas (2010, 206) sus rasgos más distintivos:
■ El problema nace ligado al contexto, donde ha de evitar todo tipo de
influencia.
■ La observación de los fenómenos debe llevarse a cabo «in situ», de
forma directa, por lo que el investigador debe permanecer en el esce-
nario escolar, el tiempo que sea preciso.
■ El investigador ha de tener una perspectiva holística del marco contextual
de estudio, lo que le obliga a recoger gran cantidad de datos.
■ Por su carácter evolutivo, el estudio presenta un carácter dinámico a
lo largo del estudio, cambiando en virtud de la experiencia desarro-
llada.
■ El análisis de datos debe recurrir a la triangulación, para su adecua-
da validación.
■ La utilidad de esta metodología, debe proceder de una visión de la rea-
lidad selectiva y contextualizada en el entorno inmediato.
En cuanto al proceso de desarrollo, responde al que acabamos de des-
cribir, acomodándose perfectamente al planteamiento cualitativo de
investigar.
Por último, queremos destacar una modalidad muy particular de inves-
tigación, el estudio de casos, que facilita el estudio en profundidad de
determinados fenómenos educativos. Si esta metodología tradicional-
mente, aparecía ligada al estudio clínico, su objetivo de comprender
profundamente la realidad singular, nos confirma su adecuada integra-
ción en el contexto escolar, donde con un planteamiento particularista,
descriptivo, inductivo, los estudios desarrollados permiten ofrecer solu-
ciones a problemas planteados, a partir de la discusión y el análisis de
un caso particular, en una situación real.
• El grupo de discusión
En torno al tema de investigación, se genera un grupo que represente las
distintas unidades de estudio que conforman el proyecto de trabajo.

482
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

Durante un tiempo, discuten acerca del tema propuesto, dirigidos por el


mediador correspondiente, registrando las participaciones de todos los
miembros del grupo, para su posterior estudio.
Como dice Colás (1998, 253), «es una técnica de investigación que tra-
baja con el habla». Lo que se manifiesta en el grupo, discutiendo acer-
ca del tema de investigación, por la representatividad de sus compo-
nentes, se considera que refleja la población a la que representan. De
este modo, se incardinan en él, grupo social y subjetividad, de modo
que el discurso sostenido en la discusión, corresponde a un campo
semántico que define los elementos y las relaciones que son aceptadas
o rechazadas.
Para su desarrollo, Gee, Michaels y O’Connor (1992, 228) ofrecen las
siguientes pautas:
■ El discurso humano es gobernando por reglas que lo estructuran
internamente.
■ Es generado por hablantes que están situados en un contexto socio-
histórico concreto.
■ El discurso, por sí mismo, incorpora elementos propios del contexto
sociolingüístico del que procede (el sujeto que lo sustenta).
Con todo, el desarrollo de un grupo de discusión permite evidenciar
dimensiones cognitivas y sociales propias de sus grupos sociales de
referencia. Y así es como resulta un dispositivo que facilita la recons-
trucción del sentido social en el seno de una situación grupal discur-
siva (Canales y Peinado, 1994, 295).
• La investigación-acción
Ya está generalizada la aceptación de Kurt Lewin como el creador de
esta línea de investigación científica, ya que fue el año 1946 cuando
formuló sus principios fundamentales. No obstante, son las aportacio-
nes de Dewey acerca del carácter democrático de la educación, lo que
estimuló la implicación de los docentes, con pensamiento crítico y
reflexivo, a investigar desde la propia experiencia (acción).
Pérez Serrano (1994), destaca las siguientes corrientes de investiga-
ción-acción:

483
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

■ La corriente francesa (Delorme, Barbier), se centraron en la anima-


ción sociocultural, el análisis psico-sociológico y el compromiso polí-
tico.
■ La corriente anglosajona (Stenhouse, Elliot), se ocupan de que el
maestro investigue para comprender lo que sucede en el aula, con un
sentido operativo, que más adelante derivó en una corriente de
carácter cooperativo.
■ La corriente americana (Lewin, Hébert), que concede un gran prota-
gonismo a las prácticas educativas.
■ La corriente australiana (Kemmis, Carr) centrada en la crítica social,
trata de identificar estrategias para la observación, la reflexión o el
cambio.
En nuestro contexto, la investigación-acción pretende que el profesor
investigue sobre su práctica educativa, de forma que repercuta luego
en la calidad del aprendizaje y en la propia enseñanza. Estás serían sus
características:
– Intenta mejorar la educación pues estimula el cambio.
– Participativa de todas las personas que trabajan en la educación.
– Sigue un proceso espiral de trabajo, reelaborando su planteamiento,
a partir de la propia experiencia.
– Promueve la colaboración de todos los agentes educativos.
– Presenta una visión amplia de la realidad, que sistematiza para su
estudio.
– Propugna el análisis crítico de la realidad, lo mismo que de la propia
experiencia.
Su desarrollo se acomoda perfectamente al modelo descrito anteriormen-
te, si bien hemos de considerar que precisa un constante procedimiento
de retroalimentación, reiniciándose de una forma espiral, como ya se ha
señalado, enriqueciendo el estudio (en sucesivos reinicios), con el conoci-
miento obtenido (en cada secuencia anterior).
Por último, hemos de señalar que su desarrollo, ha permitido ya con-
tar con diferentes enfoques, como es la investigación-acción del pro-

484
PROCESO DE LA INVESTIGACIÓN CUALITATIVA: DEL PROBLEMA A LA SELECCIÓN DE INFORMANTES

fesor, la investigación participativa o la investigación colaborativa. La


diferencia entre ellas, radica en el estilo que adopte el procedimiento
de trabajo. Así:
■ La investigación-acción del profesor, busca profundizar en la situa-
ción problemática del profesor.
■ La investigación participativa, quiere conocer en profundidad los
problemas educativos cotidianos, buscando soluciones que resulten
satisfactorias para todos los participantes implicados.
■ La investigación cooperativa, estimula el trabajo participativo de un
grupo de personas, de manera simultánea a lo largo del proceso de
estudio.
• La investigación evaluativa
Esta metodología enriquece las características propias de la investiga-
ción (probar, extraer conclusiones, generalización) con las que aporta
la evaluación (mejorar, toma de decisiones, valoración del fenómeno
estudiado).
Prima su consideración como investigación aplicada. Centrada en la
práctica, que a través de un proceso selectivo de recogida de informa-
ción, sobre un determinado problema del contexto educativo, facilita
la toma de decisiones de mejora del mismo.
De este modo, su objetivo principal es medir la eficacia de los progra-
mas, aportando propuestas para el enriquecimiento y la mejora. En su
desarrollo, nos propone Pérez Juste (1994) tres fases:
■ Establecer de forma clara y precisa los objetivos de la evaluación, a
la vez que se fijen los criterios para su realización.
■ Planificar adecuadamente la investigación, lo que supone seleccionar
y elaborar el diseño, elegir la metodología apropiada para la recogi-
da de datos, definir operativamente las variables y prever un trata-
miento de datos que facilite la toma de decisiones.
■ Ejecutar el plan, conforme a las previsiones realizadas.
Todas estas consideraciones reflejan la importancia que tiene la investi-
gación en la formación académica del profesional de la pedagogía, puesto

485
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

que su tarea, amén de estar ligada a la orientación y a la intervención psi-


copedagógica, puede ser la de asesor, especialista en temas de investigación
en centros escolares y de formación continua en diferentes esferas de acti-
vidad, con la pretensión de lograr unos buenos niveles de calidad en los ser-
vicios educativos que se ofrecen en nuestra sociedad.

RESUMEN

El tema aborda el proceso de la investigación cualitativa. Ésta, por el


modo y el procedimiento de aplicar, así como por el objetivo que persigue,
presenta unas características que la diferencian claramente de la modali-
dad de investigación cuantitativa. En este tema, pretendemos definirla con-
venientemente y ofrecer al estudiante un conocimiento experiencial básico,
que estimule su aplicación en el contexto de la realidad escolar, para lo cual
se describirá el procedimiento a seguir en toda investigación de carácter
cualitativo, así como un breve estudio de algunos métodos que encuentran
acomodo en el ámbito escolar.

486
Tema 13
Métodos y técnicas para la recogida de datos
cualitativos

Presentación

Introducción

1. Los datos cualitativos en la investigación

2. La observación participante

3. La entrevista cualitativa

4. Técnicas narrativas para el registro y el tratamiento de los datos


4.1. Documentos personales
4.2. Documentos institucionales

Resumen

487
PRESENTACIÓN

El desarrollo de toda investigación, ha de apoyarse, inevitablemente, en


los procesos de recogida de datos, fundamento básico de todo él. En este
tema, abordaremos algunos de los métodos más frecuentes en la investiga-
ción cualitativa, fáciles y sencillos de aplicar, pero no por ello, carentes de
rigor y sistematicidad, criterios que habrán de dirigir el estudio en todo
momento, pues éstas serán características que contribuyan a optimizar el
resultado que derive de todo el proceso investigador.

INTRODUCCIÓN

Cuando en el tema anterior, describíamos el procedimiento que sigue


una investigación cualitativa, a la hora de llevar a efecto el trabajo de
campo, es muy importante la recogida de datos, la cual requiere la aplica-
ción de técnicas e instrumentos que faciliten convenientemente esa infor-
mación. Si además tenemos en cuenta que las tres acciones fundamentales
en las técnicas de investigación cualitativa son observar, preguntar y leer,
convendrá que desarrollemos estrategias que nos faciliten esta recogida de
información en los tres ámbitos.
Con la recogida de información, se trata de aplicar cualquier procedi-
miento capaz de facilitarnos información veraz, adecuada, que no necesa-
riamente ha de responder a una fórmula de cuantificación propiamente
dicha. Esto no quiere decir que la medida no esté presente, en la recogida
de datos cualitativos, muy al contrario, pero sí resultará un medio que faci-
lite la manipulación y el uso de los datos, desprendiéndose de cualquier
otro fin que se le pueda atribuir «per se». No olvidemos que la utilidad y la
validez de la información, se sustenta en el procedimiento que siga su
obtención, y no en la categorización de los datos.

489
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

De un modo general, se considera que las técnicas cualitativas…


— Se centran en el sujeto, pues para obtener datos, el investigador ha de
entrar en interacción directa con él.
— Fundamentan su aplicación en la comunicación y en el lenguaje,
obteniendo los datos empíricos de los hechos captados por esta vía.
— Su interpretación establece una relación directa con el ser humano,
y su entorno.
— Requieren datos referidos a creencias, percepciones, opiniones y pre-
ferencias de los sujetos.
— Exigen del investigador que adopte una postura absolutamente neu-
tral, en la que se muestre aséptico, sin implicarse en la actividad que
desarrolla el grupo que investiga.
— Focalizan la atención en rasgos específicos, más que en aspectos nor-
mativos.
— Explican la realidad con un sentido multidimensional, completo, de
ahí que se trate de técnicas abiertas e interactivas, contrastando
mediante la triangulación los datos obtenidos, pero también a los
informantes e incluso hasta el propio método.
El mismo índice de nuestro tema, evidencia ya que pretendemos llevar
a efecto un estudio metodológico basado en tres de estas técnicas, por el
hecho de que simplemente las consideramos más recurrentes, en virtud del
uso que de ellas se hace en el campo de la metodología. Así nos ocupare-
mos de la observación participante, la entrevista cualitativa y las técnicas
narrativas, que algunos autores caracterizan como técnicas grupales para la
recogida de información.
No nos ocuparemos del How the thing, o del método hipotético-deducti-
vo, o del analítico, o del sintético... Ahora bien, dentro de cada uno de estos
métodos que vamos a ver, es posible aplicar diversidad de técnicas.
Por eso, no resulta extraño encontrar determinados autores que se refie-
ren a una misma realidad, empleando indistintamente uno u otro término.
Lo mismo que aparecen referencias a la observación, o a la entrevista, con-
siderándolos métodos, e investigaciones en las que la observación se cons-
tituye en una técnica básica para poder llevar a cabo el método de estudio

490
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

de casos, mientras en otras ocasiones tal tipo de observación es considera-


do el método de la investigación de que se trate.
Dejando constancia de tal discrepancia, pasaremos pues, a estudiar los
referidos métodos, o técnicas, como se prefiera, generalmente más utiliza-
dos en el marco de la metodología cualitativa, si bien antes se nos impone
la necesidad de referenciar adecuadamente la idea que sostenemos de lo
que son o deben ser los datos cualitativos en la investigación.

1. LOS DATOS CUALITATIVOS EN LA INVESTIGACIÓN

De entrada, hemos de señalar la imprecisión que representa del término


«dato», que en su origen latino se refiere a algo dado, cuando, en realidad,
los datos –data- serán construidos y elaborados por el propio investigador.
Al respecto, es muy ilustrativa la siguiente cita, de Ibáñez (1985): «... en vez
de hablar de “data” habría que hablar de “capta”, pues los dispositivos de
captura no sólo seleccionan sino que también conforman, —transformán-
dolo para informar de ello—, lo que captan...»
En la investigación cualitativa, se tomará como datos el conjunto de
informaciones en que se concretan las interacciones entre los sujetos y
entre estos y el investigador, así como las relativas a los propios contex-
tos en que la información se produce y a las mismas circunstancias en que
se origina. Tales datos, tal información, se registra de forma muy variada,
fundamentalmente mediante notas de campo y notas del mediador
(observador y/o entrevistador), así como de gráficos, fotografías, docu-
mentos de diversa índole (diarios, documentación legal o administrati-
va...) y, desde luego, en los relatos de los propios protagonistas. En cual-
quier caso, queda claro que esta modalidad de investigación da lugar a
una muy elevada cantidad de material, en forma de texto, cuyo análisis
será el que nos permitirá extraer la información relevante para alcanzar
los objetivos del trabajo.

2. LA OBSERVACIÓN PARTICIPANTE

Generalmente se reconocen dos grandes estrategias de acceso al saber


científico: la experimentación, realizada en condiciones controladas para

491
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

proceder al establecimiento de relaciones de causa a efecto, y la observa-


ción, realizada en situaciones naturales y, por tanto, no controladas.
La observación es, también, considerada como una técnica cuando se
limita su uso a la forma que tenemos de recoger la información. Este plan-
teamiento hace posible que, en cuanto tal, se puedan utilizar técnicas de
observación en el marco de los métodos experimentales: así, en un auténtico
experimento de laboratorio el investigador puede recoger una gran canti-
dad de datos bien por observación directa y presencial, bien mediante el
registro de todo cuanto ocurre a través de procedimientos técnicos.
Pero ese método básico de acceso al conocimiento de la realidad figura
también entre los cualitativos, cuando se puede adjetivar de participante (es
decir, observación participante), queriendo con ello indicar que el observa-
dor se integra en el grupo, como un miembro más, participando en su pro-
pio medio y tomando datos de forma sistemática pero no intrusiva.
Comenzaremos reseñando que, para llevar a cabo una observación par-
ticipante, son necesarias una serie de actuaciones y una determinada forma
de proceder. En cuanto a su proceso de desarrollo, sigue básicamente, la
siguiente secuencia de actividad:
a) Selección de un problema. Como cualquier investigación, se pone en
marcha planteando un problema. En general, el investigador lo defi-
ne o lo acota en términos tan precisos y hasta empíricos como sea
posible, partiendo de una realidad más amplia conocida como foco o
propósito del estudio.
Luego, y como consecuencia de reflexiones, experiencias, lecturas o con-
versaciones, se acota o delimita el problema al que se desea hacer frente.
b) Diseño o plan de la investigación. Se trata de preparar un plan de
actuación que sea flexible, ya que se parte de una importante premi-
sa: hasta que no se entra en el campo ni siquiera sabremos qué pre-
guntas son relevantes para el caso.
Es inevitable que un investigador cuente con una serie de interro-
gantes o preguntas que, a priori, resulten significativas para los inter-
locutores, y su plan inicial requiera ya una transformación.
Por eso, el investigador debe estar abierto y dispuesto a incorporar
las modificaciones que sean precisas en función del desarrollo que

492
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

vaya tomando el trabajo del trabajo de campo, donde sólo lo no pre-


visible, los imponderables, pueden estar a la orden del día.
c) Selección y acceso al escenario. No es una cuestión fácil. Idealmente se
debe tender a encontrar escenarios en los que el observador tenga
fácil acceso y donde pueda establecer una buena relación con los
informantes. Junto a ello, es conveniente descartar aquellos escena-
rios en los que el observador se sienta implicado o comprometido,
personal o profesionalmente, con el grupo.
Una vez contemos con la preceptiva autorización, el acceso puede
intentarse de modo directo, solicitando poder entrar para realizar la
tarea de observación, o indirecto, a través del apoyo de terceras per-
sonas con influencia en las organizaciones y que pueden avalar la
presencia del observador, facilitándole su actuación profesional en
los primeros días. Tengamos en cuenta que estos van a ser los más
difíciles, hasta conseguir una buena implicación «participante». En
cualquier caso, es preciso plantear la solicitud de forma que ni la per-
sona ni la tarea sean percibidas como amenazantes o peligrosas para
el proceso.
Generalmente este hecho implica el dar a conocer, sin demasiado
detalle, las razones que han llevado a la elección del escenario y el
objeto del trabajo, algo que puede hacerse con un breve y claro docu-
mento, a través de una entrevista, donde se presenten los propósitos
del estudio de un modo sencillo y atrayente.
No es fácil ofrecer un procedimiento infalible que permita al obser-
vador el acceso al campo; en ocasiones, según la tipología de los esce-
narios y de las personas, puede ser conveniente para lograr la acep-
tación dar a conocer su identidad al poco tiempo de establecer el
contacto; en otras, será preciso hacer saber a la persona de enlace
nuestras intenciones y los objetivos perseguidos, insistiendo en el
carácter de no amenazante para la organización. En muchos casos,
lo que abre las puertas es la percepción de quienes deben autorizar el
acceso, la nobleza e importancia de su contribución. También hay
que considerar la posibilidad de que se nos pida, a cambio de la cola-
boración, algún tipo de información; en este punto, por cuestiones de
ética profesional, hay saber qué puede darse a conocer y de qué
forma hacerlo.

493
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

d) Selección de los informantes. Esta selección deja de lado los procedi-


mientos tradicionales de muestreo, orientados a la suficiencia y
representatividad de las muestras, para pasar a utilizar criterios etno-
gráficos, donde el grado de conocimiento de la cultura propia del
escenario se considera el elemento fundamental.
No resulta extraño que, a pesar de ralentizar el proceso, se siga un pro-
cedimiento progresivo de selección de la muestra, hasta tomar la deci-
sión de cuál será el informante principal y qué otros informantes
podrán componer el cuadro final. La prudencia es fundamental para
evitar el riesgo de tener que elegir personas que no resulten adecuadas,
aunque se presten fácilmente por interés o por su carácter abierto.
Goetz y LeCompte (1984, 82) proponen llevar a cabo una selección
«basada en el criterio», algo que exige la elaboración de un perfil que
incluya las características que ha de cumplir el sujeto o el grupo a
seleccionar. Uno de los procedimientos se orienta a la selección del
caso típico, esto es, aquel que, a juicio del investigador mejor respon-
da a dicho perfil. Para configurarlo adecuadamente, es necesario
conocer los requisitos del buen informante, entre los que conviene
reseñar expresamente los siguientes: profunda inculturación o viven-
cia automatizada de la cultura en que se encuentra, implicación e
interés por el tema objeto de estudio, capacidad para transmitir la
información... y tiempo libre suficiente.
e) Negociación de ‘roles’. El investigador debe establecer con claridad sus
funciones y, aun así, será fácil que desde dentro se espere de él otra
cosa, con frecuencia el papel de asesor, observador externo o, inclu-
so, de voluntario. Será conveniente que, de forma firme aunque cor-
dial, vayan estableciéndose con claridad los roles de observador y
observados.
f) Probablemente, lo más importante de esta etapa es actuar de forma
pausada y prudente; es necesario conocer bien el escenario, las per-
sonas que lo integran, su forma de actuar... y ganarse su confianza del
personal (rapport), antes de proceder a la recogida de datos. La clave
radica en la generación de un clima de relación humana abierta y sin-
cera (Spradley (1979) decía, armonía), donde las personas se puedan
manifestar sin doblez. Este, necesariamente, aparece lentamente y
que, cuando se consigue, ha de cuidarse con esmero pues resulta frá-

494
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

gil, por la necesidad que impone el estudio de acomodarse a las ruti-


nas de los informantes, poner de relieve lo que se comparte con ellos,
ayudarles, presentarse como personas normales (incluso con cierto
grado de humildad) y, desde luego, mostrar interés por lo que los
informantes desean decirle, aunque no sea inicialmente lo que él espe-
ra saber.
g) Recogida de información. Las etapas anteriores ponen al observador
en contacto con la realidad que se desea observar, pero la informa-
ción no siempre está «ahí» para ser recogida, ni disponible o adecua-
da para los propósitos del investigador, que puede encontrarse con
zonas ocultas, con información sesgada o incompleta y hasta con
materiales falsos.
Para conseguir una información veraz, habrá que recurrir a algunas
estrategias que la propia experiencia profesional acaba por convertir
en rutina: la actuación «ingenua», el no informar con detalle sobre
los verdaderos objetivos de la investigación o el proceder paso a paso,
sin querer llegar demasiado pronto al núcleo de sus preocupaciones,
o dejar las cuestiones más agresivas para el final. No nos queda más
remedio que dejarnos llevar por nuestra intuición, y por las habilida-
des sociales adquiridas, para conseguir «estar en el lugar adecuado
en el momento oportuno».
Para distinguir la información correcta, adecuada, válida, de la que
no lo es, el investigador tiene que realizar un contraste de la misma,
mediante procedimientos de comparación y de triangulación. La
comparación de la información recibida con la ya disponible permi-
te poner de relieve discrepancias e incoherencias que es preciso
resolver. La triangulación, por su parte, impone la posibilidad de
disponer de información procedente de otras fuentes y obtenida por
otras vías y técnicas, para, no sólo enriquecerlas y matizarlas, sino
también confirmar su adecuación. Una forma de triangulación espe-
cialmente interesante es la que permite el caso de equipos de investi-
gación: sus miembros pueden jugar diferentes papeles, lo que puede
dar lugar a informaciones desde perspectivas distintas, que resultan
más completas y veraces. En ocasiones, la edad, el aspecto o el sexo
de los miembros del equipo hacen especialmente posible este tipo de
aplicación.

495
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

La recogida de datos puede iniciarse desde el mismo momento de


acceder al campo de trabajo. Por lo general, cada tipo de informa-
ción, o la información recogida en cada momento, además de servir
para los propósitos específicos, puede resultar de gran utilidad para
la siguiente etapa e, incluso, para arrojar luz y aclarar aspectos con-
fusos u oscuros en etapas posteriores.

h) Registro de la información. En general, los expertos suelen preferir el


registro de notas de campo detalladas y completas, algo no siempre
fácil de hacer si no se cuenta con
La observación participante.
el equipo técnico adecuado, o no
Procedimiento:
se pueden registrar los aconteci-
a) Selección de un problema.
mientos sobre la marcha.

Una y otra cuestión son objeto b) Diseño o plan de la investigación.
de debate ya que, de alguna

manera, contribuyen a que la
situación resulte más artificial y c) Selección y acceso al escenario.
pueden producir modificaciones ↓
de la misma. De ahí que algunos d) Selección de los informantes.
investigadores prefieran evitar

estos procedimientos y entre-
narse para lograr el recuerdo tan e) Negociación de roles.

detallado y completo como sea ↓


posible. Otros, en cambio, se f) Recogida de información.
encuentran en la necesidad de ↓
registrar con precisión el mate-
g) Registro de la información.
rial empleado.

Tres son las recomendaciones h) Análisis y elaboración de
que el profesor Pérez Juste nos conclusiones.
hace para este momento de la ↓
investigación:
i) Redacción del informe final.
• Llevar a cabo un registro de
las notas de campo tan detallado y amplio como sea posible, par-
tiendo del supuesto de que en el momento en que se produce la
información no es posible saber si será irrelevante o imprescindible
para interpretar después otras informaciones y acontecimientos.

496
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

• Las notas deben referirse a las personas, circunstancias o senti-


mientos, sin olvidar el escenario, la secuencia, la duración... y cuan-
tos elementos ayuden a la comprensión.

• Se deben diferenciar las notas descriptivas de los comentarios del


propio observador, referidos a la forma en que los hechos, datos o
informaciones son percibidos e interpretados por él en el momento
y las circunstancias en que se producen.

i) Elaboración y análisis de la información. Se trata de la fase más


técnica del proceso, donde habrá que ver qué es lo que se hace y
cómo se hace para llegar al informe final del proceso de observa-
ción participante. Aunque más adelante volvamos sobre el tema,
una de las propuestas más interesantes al respecto es la conocida
como Secuencia del Desarrollo de la Investigación, debida a Spra-
dley, en la que se nos propone un ir y venir de la información a los
análisis a través de una secuencia que comienza con la formula-
ción de cuestiones descriptivas y llega a las de contraste, pasando
por las denominadas estructurales. Cada uno de estos tipos de
cuestiones va seguido de la correspondiente modalidad de análi-
sis: de dominio, (para las descriptivas), de tipo taxonómico (para
las estructurales) y de componentes (para las de contraste), para
culminar en el análisis de temas, que permite conectar varios
dominios de una cultura mostrando las semejanzas y diferencias
entre ellos.

j) Redacción del Informe final. Finalmente, hemos de tener en cuenta


que no es suficiente con que el observador alcance la comprensión
que va buscando en la realidad. Además, tendrá que dar a conocer
los resultados de su trabajo, para aumentar el conocimiento en
general y para someterse a la crítica de la comunidad científica.

Al redactar el informe final, habrá que dejar constancia del problema


objeto de investigación, de la forma de acceder al escenario, de los
procedimientos seguidos para recoger, organizar y elaborar la infor-
mación. Y, obviamente, el relato de la observación realizada y un
análisis de las conclusiones obtenidas.

497
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

3. LA ENTREVISTA CUALITATIVA

Junto a la observación participante, la entrevista, en su modalidad deno-


minada en profundidad, es uno de los métodos cualitativos fundamentales
en la investigación de carácter interpretativo.
El carácter en profundidad es lo que distingue a esta forma de proceder
de otras modalidades de entrevista utilizadas en el marco de metodologías
clásicas de carácter cuantitativo. Esta, resulta estructurada, con preguntas
y respuestas predeterminadas, de forma que pueda ser aplicada a un con-
junto más o menos amplio de sujetos; bien con el carácter de muestra
representativa de una población, o bien para contrastar mediante esta
opción metodológica los datos recogidos con cuestionarios autoadminis-
trados. En estas modalidades de entrevista se espera del investigador que
actúe con la mayor objetividad, sin inmiscuirse ni interactuar con los entre-
vistados, dado que lo que se pretende en alcanzar una información cuyas
únicas diferencias sean las que proceden de los puntos de vista, valoracio-
nes, actitudes o sentimientos personales de los entrevistados.
Se caracteriza, precisamente, por su flexibilidad tanto en las preguntas
como en las respuestas, cuya extensión, enfoque, grado de detalle... El pro-
pio entrevistado es quien lo determinada, pues la única norma de referen-
cia es alcanzar el objetivo del trabajo, de conseguir la comprensión, tan pro-
funda como sea posible, de las posiciones y perspectivas que tiene el sujeto
en el tema objeto de la investigación: su vida, sus valores, sus experiencias...
Esta es una técnica que presenta muchos puntos en común con la obser-
vación, si bien presenta sus matices diferenciadores a lo largo del proceso
de desarrollo, como podremos apreciar a continuación, en cuatro de sus
fases. Partiendo ya del hecho de que el investigador tiene en mente un pro-
blema y que ya ha optado por la entrevista en profundidad como el método
adecuado para su investigación, habiendo establecido sus objetivos y dise-
ñado el plan de trabajo en función de la especificidad y de las característi-
cas del estudio, el procedimiento a seguir sería:
a) Selección de los entrevistados. Debe clarificar qué tipo de personas
serán entrevistadas y cuántas constituirán la muestra del estudio.
Una vez identificadas las personas que cumplen con el perfil deseado,
tendrá que aproximarse a ellos para hacerles saber su interés y al
tiempo, conocer el grado de disponibilidad que presenten.

498
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

b) Establecimiento del «rapport», o nivel de confianza. Ya hemos dicho,


en el caso anterior, que lograr la aceptación de los informantes selec-
cionados requiere técnica, tiempo, habilidad y delicadeza.
Establecida la comunicación es preciso decidir las sesiones que se
consideran necesarias de modo aproximado, la duración de las mis-
mas y hasta el contexto en que se realicen las entrevistas, para facili-
tar que el entrevistado se encuentre a gusto, y no haya elementos dis-
tractores.
c) Realización de las entrevistas. El proceso de la entrevista requiere
que se vaya generando ese clima de confianza, facilitando, median-
te preguntas de amplio espectro, la apertura del entrevistado. Este
tipo de preguntas, denominadas por algunos descriptivas, hacen
posible hablar en general de temas variados de forma espontánea y
natural; posteriormente, y a partir de aspectos concretos de tales
respuestas, el entrevistador podrá ir perfilando su interés a través
de preguntas más concretas. El clima es facilitado en la medida en
que el entrevistador no emita valoraciones y juicios negativos; tam-
poco es conveniente ofrecer valoraciones positivas, que pueden
representar, al menos en apariencia, apoyo explícito para pensa-
mientos, actitudes o valores no siempre aceptables. Lo mejor es evi-
denciar una actitud de aceptación profunda de la persona, al mar-
gen de los contenidos de sus experiencias, palabras o actitudes, y
animar con nuestro buen hacer a que el entrevistado se siga expre-
sando con naturalidad.
Dos elementos resultan claves para el desarrollo de las entrevistas: el
saber escuchar, aunque las personas entrevistadas lo hagan de aspec-
tos que, en principio, no interesan al entrevistador, y el mostrar inte-
rés por lo que dicen, algo que se aprecia en la atención que se presta.
Tras las primeras entrevistas, el investigador puede ir perfilando su
interés en cuestiones progresivamente más concretas y específicas
que le permitan especificar los significados, aclarar las dudas, deta-
llar sus afirmaciones, traer a la memoria aspectos pretendidamente
olvidados... La clarificación es muy importante dado que los relatos
pueden tener sentidos no evidentes para el investigador; por otro
lado, los acontecimientos triviales de la vida diaria pueden guardar
claves que permitan, en un momento posterior, dar las claves inter-

499
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

pretativas de mucha de la información recogida. Esto obliga, al entre-


vistador, a estar atento «a todo».

En la última etapa, el entrevistador puede plantearse la realización de


preguntas más arriesgadas en la medida en que sean más directivas y
hasta, si fuera necesario, sólo si fuera necesario, incisivas. Douglas
propone la «táctica de la aserción en etapas», que supone actuar ante
el entrevistado como si uno estuviera al tanto de las cosas, de forma
que le «fuerce» a ofrecer más información.

Para la realización de las entrevistas, sobre todo en los casos en que


su número es elevado y, en especial, si son varios los entrevistadores,
conviene elaborar pauta, que
La entrevista en profundidad.
permita uniformar la actuación
Procedimiento:
de todos. En cuanto al control,
el entrevistador debe garantizar - Selección de un problema.
la validez de la información, por ↓
lo que interesa la coherencia de - Diseño o plan de las
los relatos, algo que puede entrevistas.
ponerse a prueba relacionando

lo dicho en diferentes ocasiones,
a) Selección de los entrevistados.
comparando unos pasajes con
otros o sabiendo leer entre líne- ↓
as: gestos, dudas, pausas... Y, b) Establecimiento del rapport
aunque lo que interesa es la

comprensión, debe mantenerse
la diferencia entre las percepcio- c) Realización de las entrevistas.

nes y fabulaciones, acudiendo al ↓


contraste de fuentes, al análisis d) Registro de las entrevistas.
de los registros existentes e,

incluso, a poner al entrevistado
ante las contradicciones aprecia- - Análisis de la información.
Obtención de Conclusiones
das, a fin de que se manifieste
sobre ellas. ↓
- Redacción del informe.
d) Registro de las entrevistas. Lo
dicho en relación con la observa-
ción participante puede valer en este punto, si bien, por su propia natu-
raleza, las entrevistas se prestan en mayor medida a ser objeto de gra-

500
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

bación, siempre contando con la debida autorización y cuidando que


no sean elementos distorsionadores del contenido.
No obstante, pese al registro de lo hablado por los entrevistados, se
aconseja contar con un diario del entrevistador, en cierta medida
equivalente a las notas del observador a las que nos referimos ante-
riormente. En el diario el entrevistador puede ir anotando sus apre-
ciaciones, sospechas, intuiciones, conjeturas... y cuanto pueda ayu-
dar en momentos posteriores para llevar a cabo el análisis y la
interpretación de la información recogida.
Por último, en las fases de análisis de la información y obtención de con-
clusiones, y la redacción del informe, el proceso sigue las mismas pautas que
vimos en la técnica anterior.
Existe una modalidad de entrevista cualitativa, de carácter grupal, que
a priori puede responder a distintos propósitos: definir un problema de
investigación o identificar a informantes claves. También se puede utilizar
para poner a prueba la formulación de hipótesis, escalas de medida y otros
elementos del diseño de investigación. Comparte con la entrevista el hecho
de abordar problemas y formas de estudio de modo colectivo.

4. TÉCNICAS NARRATIVAS PARA EL REGISTRO


Y TRATAMIENTO DE LOS DATOS

Nos corresponde ahora, ocuparnos de la tercera de las técnicas señala-


das al comienzo del tema: la lectura de documentos, que permite una inves-
tigación en la que se profundiza en el conocimiento de la información que
las personas o las instituciones han generado en su actividad, mediante
recursos de comunicación oral o escrita.
De este modo, podemos definir el documento como el material infor-
mativo que registra un hecho, situación o circunstancia, en relación con
la/s persona/s que lo protagonizan. Los hay de distintos tipos, según la
intencionalidad o el procedimiento que determine su naturaleza: carta,
artículo, biografía, autobiografía, actas, certificados, narraciones… Gene-
ralmente resultan escritos aunque también puede tratarse de cualquier
tipo de huella material del sujeto, como los testimonios o recuerdos.

501
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Como señala Corbetta (2007, 376), el hecho de que estos documentos se


generan independientemente de la acción del investigador, comporta dos
ventajas claras respecto a las técnicas anteriores: por un lado, se trata de
información no reactiva, es decir, no se ve afectada por la interacción del
investigador y por tanto, no sufre efectos de distorsión. Se trata de un con-
tenido que se encuentra cerrado y por tanto, el investigador ha de trabajar
con lo que hay, sea suficiente o no. Por otro lado, se trata de documentos
que permiten, además de estudiar el presente, hacerlo en el pasado.
Siguiendo a este mismo autor, vamos a considerar su clasificación en vir-
tud de la implicación del sujeto en el contenido documental. Así hablaremos de:
– Documentos personales, los que han sido elaborados en primera
persona, para un uso particular. Son documentos eminentemen-
te expresivos, en los que se proyecta la personalidad de su autor.
En esta categoría tendremos las cartas, las (auto)biografías y los
diarios.
– Documentos institucionales, por su parte, son documentos producidos
por instituciones o individuos que los elaboran en su faceta también
institucional de la vida, por lo que presentan un carácter público. Así
se trataría de discursos, artículos o actas, historias de vida o historias
profesionales, y narraciones pedagógicas.
Veamos con mayor detalle las posibilidades que todas ellas ofrecen para
el registro de datos narrativos.

4.1. Documentos personales

Podríamos, a su vez, organizar éstos en dos tipos de documentos: los


narrativos y los registros.
Documentos personales de carácter narrativo. Como ya se ha indicado, se
trata de testimonios en los que los sujetos han proyectado su personalidad,
narrando hechos, y expresando sus opiniones y sentimientos. Un aspecto
muy peculiar supone el que proceden de una experiencia interior del suje-
to, y en su origen, no fueron generados para el público, sino para el uso par-
ticular. Esta visión interna de los hechos hace que vayan siempre matiza-
dos por darles enfoque interpretativo. Este carácter biográfico de su

502
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

contenido es precisamente el que le otorga valor, para ser considerado un


recurso muy valioso en la investigación social.
Algunos de los documentos más empleados en esa recogida de informa-
ción, son:
(Auto)biografía ~ diario
El prefijo auto se aplica únicamente cuando el propio protagonista es
quien narra los hechos de su vida, biografía. Generalmente presenta un
carácter retrospectivo de la narración, pues de lo contrario, cuando la des-
cripción se contemporaliza con los hechos, hablaríamos de un diario.
En la investigación cualitativa, el investigador encara la autobiografía,
al objeto de cubrir un espacio temporal limitado del sujeto (la situación
ideal vendría determinada por el hecho de que los documentos biográficos
sean redactados de manera espontánea por sus protagonistas).
El diario es el documento personal por excelencia. Su peculiaridad resi-
de en que está escrito para un uso estrictamente personal, inmediato del
acaecimiento de los hechos descritos. Por eso carece de los matices de leja-
nía y distancia que podemos encontrar en la biografía.
La proyección que el sujeto consigue en el diario, lo convierte en un
documento reconocido en la investigación, aunque eso sí, de ningún modo
generalizable su contenido.
Relatos diarios. Hemos de significar este modelo muy particular de dia-
rio, que es elaborado a petición del investigador. Son documentos de encar-
go; se trata de fichas que se les da a los sujetos estudiados para que reflejen
en ellas los hechos sucedidos en el contexto de estudio. Incluso se les espe-
cifica el tipo de información requerida.
Cartas
Las investigaciones basadas en documentación epistolar son muy esca-
sas y prácticamente reducidas a la investigación social.
Se trata de un instrumento que permite expresar las vivencias internas
de los individuos y su particular visión de los hechos. Además, no sólo refle-
jan la percepción de la persona que escribe, sino también la que ésta tiene
de su destinatario.

503
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Historias de vida
Sabemos que una historia es una narración en torno a determinados
eventos en los que se proyectan los valores humanos y patrones significati-
vos de una cultura particular. Como nos recuerda Colás (1998, 280), a la
peculiaridad narrativa le añaden la temporalidad y la causalidad. De este
modo, en las historias de vida se entrelazan eventos, descripciones y situa-
ciones, resaltando con ello, el significado de las acciones humanas.
Describen la narrativa vital de una persona, acompañada de cuantos regis-
tros documentales y personales, y cuanto material pueda acompañarse, a fin
de reconstruir la biografía de la persona de una forma exhaustiva y objetiva.
En la investigación cualitativa contribuyen a sugerir, ilustrar o contras-
tar hipótesis y a proporcionar nuevos hechos que sirvan para la mejor com-
prensión de los problemas de la investigación.
Una versión particular de las historias de vida, es la que se escribe para
desarrollar una faceta de la vivencia de la persona, como es la profesional,
en cuyo caso hablamos de historias profesionales. Resultan de gran utilidad
en la investigación por cuanto focalizan el estudio y lo ciñen a un aspecto
muy concreto del sujeto.
Los registros resultan una particularidad en los documentos persona-
les. Encontramos registros orales, que pretenden la perduración de una
información particular, y registros escritos, de carácter informativo y/o
valorativo. A saber:
Los registros orales son una forma de conservar el testimonio que ofre-
cen los sujetos y que luego se emplean para el desarrollo de algunos de
los documentos que acabamos de citar, como la biografía o la historia
de vida. Si no se elabora ex profeso (cuando se crea por encargo para la
investigación puede provocar reactividad en el sujeto que lo protagoni-
za), es decir, si se crea en condiciones de naturalidad, esta técnica puede
presentar las mismas características que hemos señalado para los docu-
mentos, por lo que puede participar del estatus que se les otorgue a
todos ellos en el proceso de la investigación: veracidad, rigor, oportuni-
dad y validez. Es más, las fuentes orales aportan algunas ventajas al uso
de documentación escrita, como que permiten elegir las personas a
entrevistar o la constante revisión que puede hacerse del material regis-
trado, pues no caduca.

504
MÉTODOS Y TÉCNICAS PARA LA RECOGIDA DE DATOS CUALITATIVOS

En cuanto a los registros escritos, lo que pretenden es facilitar la


recopilación de datos, informaciones, opiniones o valoraciones que
los sujetos realizan de los hechos estudiados. Algunos estimulan en
análisis crítico de realidades vivenciadas, como es la matriz emplea-
da en la técnica DAFO (un documento en el que el sujeto presenta las
debilidades, amenazas, fortalezas y oportunidades que percibe de una
institución), otros como los cuestionarios, resultan muy cómodos en
cuanto a la recogida de información más general, y si se emplean con
un sentido evaluativo, facilitan mucho la sistematización en el trata-
miento de los datos.

4.2. Documentos institucionales

Estos documentos se abren a la esfera pública, permaneciendo como


huellas de nuestra cultura, además de contribuir al estudio mediante la
aplicación de investigaciones. Son el producto de la vida institucionali-
zada de nuestra sociedad, por lo que abarcan todo tipo de material
escrito.
Esta documentación puede convertirse en datos para la investigación,
en material empírico para el estudio de los fenómenos sociales. Un caso
particular, lo representan las huellas físicas, que pueden ilustrar contextos
de investigación muy diversos, desde soportes y modelos de representación
muy variados.

Técnicas narrativas para el registro y tratamiento de datos:


➢ Documentos personales:
• Documentos narrativos
- Biografía, autobiografía, diario, relatos diarios
- Cartas
- Historias de vida, o profesionales
• Registros:
- Orales: documentos sonoros
- Escritos: informativos (cuestionarios) o evaluativos (DAFO)
➢ Documentos institucionales

505
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Y en la misma línea encontramos los textos narrativos pedagógicos, que


con un interés didáctico, reflejan la realidad social en la que son contex-
tualizados. Además, en la escuela, se genera mucho material escrito, que de
algún modo, acaba por proyectar la vida que llevan a efecto sus habitantes,
día a día. Todo ello, resulta igualmente valioso para algunas de las investi-
gaciones que se llevan a cabo con un carácter social.

RESUMEN

En este tema estudiamos algunas técnicas propias de la metodología


cualitativa, destacando entre ellas las relativas a su flexibilidad, tanto meto-
dológica como procesual. Tres son las técnicas abordadas al respecto, las
cuales responden al triple criterio de observar, preguntar o leer, que puede
resumir la intencionalidad del estudio cualitavio. De este modo, nos apare-
cen las tres técnicas que vamos a analizar, pues se trata también de las más
utilizadas: la observación participante (una técnica que le permite al obser-
vador conocer in situ la realidad que estudia, de un modo participativo), la
entrevista en profundidad (una técnica de interacción directa con los suje-
tos a investigar) y las técnicas narrativas (en las que se trabaja con textos,
orales o escritos, que registran las opiniones, sentimientos, valoraciones y
apreciaciones, que los sujetos tienen de la realidad que se pretende estu-
diar).

506
Tema 14
El tratamiento de datos en la investigación
cualitativa

Presentación

Introducción

1. Procedimientos y técnicas a seguir en el análisis cualitativo de los datos

2. El procedimiento analítico de datos en la investigación cualitativa

3. De los datos a la teoría

4. Aportaciones de la informática
Software de referencia:
AQUAD
NUD.IST
QSR-NVIVO
WIN MAX pro
MAX QDA
ATLAS.TI
ETHNOGRAPH
DECISION EXPLORER

Resumen

507
PRESENTACIÓN

Completaremos el proceso de investigación cualitativa con este último


tema, en el que se abordarán procedimientos que nos facilitan el trata-
miento de datos así como, lo que resulta más importante en toda investiga-
ción, la extracción de conclusiones.
Dado el volumen de información que se maneje en esta fase de la inves-
tigación, la informática se convertirá en una aliada de gran valor, por lo que
facilitaremos al estudiante una aproximación a uno de los diversos progra-
mas informáticos más intuitivos y funcionales con que actualmente conta-
mos para ello.

INTRODUCCIÓN

Nos ocuparemos en este tema de una de las actividades más delicadas


en el proceso de investigación cualitativa: el tratamiento de datos. Su impor-
tancia obliga al investigador a centrar su atención y poner especial cuidado
en que el procedimiento resulte apropiado y desemboque en una informa-
ción adecuada, veraz, oportuna y de calidad, para que la investigación
pueda tener buen fin.
La diversidad de metodologías que hemos podido conocer por los temas
precedentes, así como la variedad de técnicas que nos permiten obtener los
datos, hace que la fase de análisis también requiera un acomodo a las cir-
cunstancias del proceso, para darles a los datos la interpretación adecuada.
No obstante, podremos ver, a lo largo del tema, que en realidad no va a
haber mayor disparidad entre una y otra situación, pues en realidad los
datos son componentes de información que dan respuesta a una cuestión
inicial, la que motivó la investigación. La interpretación de esa realidad,

509
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

dirigirá nuestra actuación con los datos que tenemos delante a la hora de
completar el estudio
Además, indicar que merece la pena insistir en el tema en lo relativo
a algunas cuestiones técnicas, por lo cual llevaremos a efecto una men-
ción específica a las aportaciones que representa la informática en este
momento.

1. PROCEDIMIENTOS Y TÉCNICAS A SEGUIR EN EL ANÁLISIS


CUALITATIVO DE LOS DATOS

El estudio de los trabajos desarrollados al respecto, nos determina que


el análisis cualitativo de los datos puede llevarse a efecto de distintas for-
mas: autores como Huberman y Miles (1994) o Wolcott (1994) focalizan el
análisis en actividades de manipulación de los datos (como la codificación,
la indexación o la recuperación de información), mientras que otros como
Woods (1987) lo hacen desde una perspectiva teórica, seleccionando los
contenidos como tareas de análisis especulativo, para confirmar conceptos,
tipologías o teorías. En este sentido, nos parece interesante la propuesta
que desarrolla Colás (1992, 293-302), estructurando el análisis cualitativo
en tres formas diferentes de proceder, cada uno de los cuales, se lleva a tér-
mino mediante técnicas específicas, como podremos ver a continuación:

Procedimiento Procedimiento de expansión y Procedimiento analíticos


de generación teórica contrastación de hipótesis y/o teorías manipulativos
Exploración Muestreo teórico Reducción de Datos
Descripción, Casos discrepantes Exposición de datos
Interpretación Casos negativos Elaboración y verificación
Teorización de conclusiones

Procedimiento de generación teórica


La teorización es el objetivo último de todo investigador, el cual en la
investigación cualitativa requiere descubrir y manipular categorías abs-
tractas, para establecer relaciones entre ellas. El proceso a seguir sería el
siguiente:
– Descubrir las unidades de análisis (reducción de datos)

510
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

– Categorización (agrupamiento de datos)


– Formulación de hipótesis (elaboración teórica)
Procedimiento de expansión y contrastación de hipótesis y/o teorías
Su objetivo es hacer evolucionar formulaciones teóricas incipientes,
para lo cual, bien se amplía la teoría, generalizándola, o bien, matizándola.
Se sigue para ello, la selección de casos negativos o discrepantes, mediante
el método de comparación constante. Los casos negativos son los que per-
miten perfilar la aplicabilidad de la investigación; representan la excepción,
la cual mediante un proceso de comparación, facilita la delimitación del
objeto de estudio.
Procedimiento analítico
Lo desarrollaremos a continuación de una forma más exhaustiva.

2. EL PROCEDIMIENTO ANALÍTICO DE DATOS EN LA


INVESTIGACIÓN CUALITATIVA

Comenzaremos por señalar que entendemos por análisis cualitativo de


datos, el que se opera sobre textos, la fuente principal de datos que tiene
nuestra metodología de investigación.
Sabemos pues, que los textos, producciones que expresan las acciones
humanas, son el material físico que manipularemos en el estudio de la
investigación. En este sentido, hemos de tener presente que el contenido de
esta documentación supone un compendio lingüístico, con lo que esto con-
lleva, pues cada persona, lugar o grupo presenta una forma diferente de
expresión e incluso de organizar el lenguaje. Y como las expresiones son los
mecanismos que tienen los sujetos para expresar su pensamiento, con total
subjetividad, su estructura supone en cierto modo, el conocimiento y la
interpretación del mismo. Diversidad y particularidad se funden en un
único proceso comunicativo, que será el que desentrañe el investigador,
para poder interpretarlo y dotarlo de sentido.
Así, la interpretación que se haga de los datos, vendrá determinada
por los objetivos que orientan la investigación, que puede ser (Colás,
1998, 293):

511
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Carácter de los objetivos Carácter y tratamiento que se haga de los datos

Descriptivos Identificación de elementos y exploración de sus


conexiones:
• Descripción de procesos, contextos, sistemas y
personas.

Interpretativos Comprensión del significado del texto/acción y


descubrimiento de patrones
• Desarrollar nuevos conceptos
• Reelaborar conceptos existentes
• Identificar problemas
• Refinar conocimientos
• Explicar y crear generalidades
• Clasificar y comprender la complejidad

Contrastación teórica Elaborar, contrastar o verificar postulados, generalidades y


teorías.

Evaluativos Evaluar políticas, prácticas e innovaciones.

Ante la gran problemática que representa la manipulación de los datos


de esta índole, es necesario considerar la dimensión creativa y cuasi-artís-
tica de este tipo de investigación, por su propia naturaleza, pues se trata de
textos, que resultan más difíciles de reducir a realidades interpretables (los
números resultan mucho más sencillos de manipular).
Así pues, podríamos definir el análisis cualitativo de los datos, en base
al tipo de dato que se maneja en cada momento, o al que hace referencia,
lo que se traduce en las distintas formas que adopta el lenguaje (textos) y
en la intención de quien lo interpreta, que corresponde al objetivo de la
investigación, para conferir valor, sentido y significado a la subjetividad
intrínseca que presenta cualquier texto.
Por tanto, el primer paso que debe darse, a la hora de analizar
datos, es clarificar la encrucijada que supone la gran variedad de tipos
de datos y perspectivas que se nos abre ante cualquier documento. Si
bien, todos coinciden en facilitar su interpretación, focalizándola en la
interpretación impuesta por el objetivo del estudio. La metodología
cualitativa opera de forma cíclica a lo largo de toda la investigación,
resulta recurrente, lo que hace que se trabaje con los datos de manera
exhaustiva.

512
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

Además, no podemos olvidar que el análisis de datos no corresponde a


una etapa concreta, una fase específica, determinada, en un proceso de
investigación, como sucedía con los métodos cuantitativos, sino que tiene
una presencia continua a lo largo del proceso de investigación, en un esta-
do de constante reelaboración, lo que impone un control mayor, al rigor del
investigador.
Y en su aplicación, los datos se van dividiendo y segmentando sucesiva-
mente, en unidades significativas, de acuerdo con ese objetivo establecido.
Siguiendo a Pérez Juste (2011), de un modo general, ese proceso de aná-
lisis podremos concretarlo en tres grandes tipos de tareas, cada una de las
cuales supone además, un conjunto de actividades:
TAREAS ACTIVIDADES
Tareas Actividades

Separación de unidades
a) Reducción de datos Identificación y clasificación
Agrupamiento

b) Disposición de datos Transformación simbólica

c) Obtención y validación de Extracción de conclusiones


conclusiones Validación

a) Reducción de datos
Este proceso es imprescindible en la investigación cualitativa, donde ya
hemos dicho que siempre nos vamos a encontrar ante una elevada cantidad
de material que debemos hacer inteligible, mediante un proceso de reduc-
ción, una tarea que se abordara separando, o más bien troceando, la infor-
mación original en partes. Para ello, se puede distribuir el contenido de for-
mas diferentes, atendiendo a criterios de carácter temporal o espacial, a
unidades de tipo gramatical (como la palabra, el párrafo o la oración) o de
tipo temático.
Tengamos presente que esa segmentación de datos, textos verbales o
escritos, se realiza en base a unidades relevantes, significativas, que man-
tienen a su vez, conexión con un objetivo más global (planteado por el pro-
yecto que se investiga). Es decir, se mantiene una conexión muy estrecha
entre aspectos específicos del texto (tratamiento manipulativo de los datos)

513
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

e interpretaciones teóricas, simultaneando el aspecto concreto y el concep-


tual, pues el análisis no responde a una caracterización mecánica del trata-
miento de los datos, sino que supone ir acompañada de una actividad refle-
xiva, interpretativa y teórica de los mismos.
Los datos segmentados son categorizados, de acuerdo a un sistema
organizado, el cual surge del propio análisis de los datos. Algunas categorí-
as y tópicos, se obtienen del propio marco conceptual del estudio, parecen
impuestos por el planteamiento de la investigación. Y resulta lógico que así
sea. Pero no resulte extraño que al interrogar los datos, se observe su con-
tenido y de él, mediante un proceso inductivo de pensamiento, se establez-
can las categorías. Un proceso
que, evidentemente, hemos de
considerar abierto, pues el lis-
tado se irá acomodando pro-
gresivamente, en virtud de los
nuevos datos que se vayan
incorporando.
La codificación y la cate-
gorización de los datos, su
reducción a categorías debi-
damente codificadas, será el
procedimiento que nos permi-
tirá alcanzar una correcta
Ejemplo de codificación (Revuelta y Sánchez, 2003)
identificación de los conteni-
dos y su clasificación en unidades separadas. El proceso final de esta pri-
mera gran tarea consiste en la síntesis o agrupamiento de la información
asignada a cada una de las categorías.
b) Disposición de los datos
Vemos, que el procedimiento intelectual que se aplica es la comparación
constante, para formar categorías, valorar y verificar su pertinencia, asig-
narlas a los contenidos del texto, y contrastar las hipótesis, proceso que más
adelante veremos que se realiza mediante el rastreo de evidencias negati-
vas. Se trata pues, como destaca Colás (1992, 289), de discernir similitudes
conceptuales, refinar el poder discriminatorio de las categorías y descubrir
patrones. Como se ve, resulta un proceso complejo, en el que el investiga-
dor ha de mantener una postura ecléctica, para considerar todas las vías

514
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

posibles de desarrollo, pues no existe un procedimiento único, y requiere


una gran competencia intelectual, para la toma adecuada de decisiones,
que determinan el proceso.
Así pues, una vez agrupada y reducida, la información debe ser presen-
tada de modo que resulte manejable y comprensible. Esto se consigue
mediante el uso de tablas (o matrices) o de representaciones gráficas. Entre
las primeras podemos reseñar las de contingencia (llamadas así porque pre-
sentan la relación entre al menos dos variables nominales u ordinales), de
incidencia (en las que se aprecia la presencia o ausencia de fenómenos) y
de valores numéricos que, como su nombre indica, reflejan los valores apre-
ciados para las variables de que se trate (que corresponden con los sujetos
estudiados). En cuanto a las representaciones gráficas, podemos reseñar los
tan conocidos diagramas (de caja, en árbol...) y los sistemas de redes
(esquemas, redes causales o mapas conceptuales).

Modelo de esquema Red causal

c) Obtención y validación de conclusiones


Durante las dos fases anteriores, el investigador puede ir estableciendo rela-
ciones que le permiten avanzar en la comprensión de los hechos y en la
forma en que éstos se organizan y estructuran. Con ello, avanza en la pre-
sentación de los datos de carácter descriptivo, aportando su correspon-
diente explicación. La extracción de conclusiones implica aportar informa-
ción que resulte coherente, que respalde determinados enunciados, que
pueda ser argumentada. Para ello se acude a los procesos ya enunciados, al

515
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

análisis de la información organizada o a la comparación de los diversos


elementos analizados.

Modelo de Mapa conceptual (Correa, Álvarez y Correa, Centro de recursos de la Fundación


Universitaria Luis Amigó)
<http://virtual.funlam.edu.co/repositorio/?q=node/218&size=_original>

En este proceso, el investigador debe contar con una enorme creativi-


dad, además de un sólido bagaje de conocimientos y amplia experiencia.
Además, no puede faltar de ningún modo, una lectura atenta, intensa y rei-
terada de la documentación, la aceptación inicial de todo tipo de intuicio-
nes e interpretaciones surgidas durante dicha lectura y una notable dosis de
prudencia antes de darlas por buenas.

516
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

Para validar las conclusiones, es necesario someterlas a algún tipo de


procedimiento que permita comprobar la veracidad o la validez de las mis-
mas. Este proceso veremos que corresponde a determinadas actuaciones
tales como la conocida triangulación, la discusión con colegas, el contraste
con la posición de los sujetos investigados o la búsqueda de la evidencia en
contra, sin olvidar algunas manifestaciones de rigor en el proceso que ava-
lan las conclusiones del investigador.
Por último, no podemos olvidar que hoy la informática se ha converti-
do en un aliado fundamental en todo proceso de investigación. En la inter-
pretación de los datos, ofrece una gran versatilidad, acomodándose a los
requerimientos establecidos por el investigador, y un enorme potencial,
permitiendo dar tratamiento a un enorme volumen de datos, con seguri-
dad, eficacia y utilidad. No obstante, este proceso de análisis y tratamiento
de los datos, lo veremos con mayor detalle en el tema siguiente.

3. DE LOS DATOS A LA TEORÍA

Si bien un investigador cualitativo puede conformarse con “resolver” su


problema, con la comprensión profunda de la realidad estudiada, la natu-
raleza de la investigación pide más: demanda que, a partir de la investiga-
ción, se pueda llegar a elaborar leyes o planteamientos generales, teorías,
que sean capaces de explicar la realidad.
Dos son las posiciones que se mantienen en este punto: la de quienes
consideran que los estudios cualitativos deben orientarse a la generación y
desarrollo de teorías y la de quienes optan por su verificación o validación.
Naturalmente hay quienes, la mayoría, aceptan ambas posiciones.
Al frente de los primeros podríamos situar a Glaser y Strauss (1967,
6-7), con su obra The Discovery of Grounded Theory y su propuesta de
la teoría fundamentada. Para estos autores tal tarea se encuentra reser-
vada a personas capacitadas: “sólamente los sociólogos están entrenados
para desearla, buscarla y generarla”.
Para alcanzar esta meta, los autores proponen dos grandes estrategias:
el muestreo teórico y la comparación constante. A través de ésta, el investi-
gador refina sus conceptos, descubre relaciones, tantea interrelaciones y
llega a integrar sus elaboraciones en una teoría coherente. Mediante la pri-

517
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

mera, el investigador va añadiendo nuevos casos que, una vez estudiados,


le permiten refinar sus conceptos y expandir sus teorías.
Para Glaser y Strauss, el propósito de los investigadores no es verificar
o probar sus ideas sino comprobar si se ajustan y si funcionan, concepto
que definen del siguiente modo:
“Por ‘ajuste’ entendemos que las categorías deben ser fácilmente aplica-
bles (sin forzarlas) a los datos que se estudian y surgir de ellos; el ‘funcio-
namiento’ supone que deben ser apropiadas y capaces de explicar la con-
ducta en estudio”.
Por su parte, la opción que centra el objeto de los estudios en la verifi-
cación o validación acude a la inducción analítica que, para Znaniecki, pre-
tende nada menos que llegar a proposiciones universales y a leyes causales.
Una caracterización detallada de este procedimiento, aunque bajo la
denominación de investigación analítica, se debe a Katz (1992), siendo sus
momentos fundamentales los siguientes:
• Definición aproximada del fenómeno objeto de atención.

• Formulación de una hipótesis explicativa de tal fenómeno.

• Estudio de un caso con la finalidad de apreciar si tal hipótesis se ajus-


ta o no.

• En caso negativo, reformulación de la hipótesis o redefinición del


fenómeno.

• Búsqueda activa de casos que refuten la hipótesis.

• Si se encuentran casos negativos, reformulación de la hipótesis o rede-


finición del fenómeno.

• Continuación del proceso hasta que la hipótesis haya sido plenamen-


te puesta a prueba.
Es preciso reconocer la importancia del procedimiento, en especial en
lo relativo a la búsqueda activa de casos negativos, para plantear generali-
zaciones. Sin embargo, son muchos los que dudan del mismo como herra-
mienta adecuada para el establecimiento de leyes causales.

518
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

4. APORTACIONES DE LA INFORMÁTICA

Los avances tecnológicos en la información y la comunicación han


generado nuevos ambientes de aprendizaje y socialización que la investiga-
ción cualitativa puede aprovechar para acercarse más fácilmente a los fenó-
menos estudiados mediante la aplicación de técnicas y protocolos que exis-
ten para el tratamiento informático de los datos. De este modo, el
investigador, pese a la ingente cantidad de información que debe manejar,
puede hacerse una visión de conjunto del objeto de estudio y de ese modo,
manipular con mayor eficacia su trabajo.
Hablamos pues de programas informáticos para la ayuda del análisis
cualitativo, como lo que son: herramientas que nos facilitan la larga tarea
de reducir los datos obtenidos en el proceso de investigación dentro de un
paradigma cualitativo. Por lo cual, conviene que conozcamos, al menos
algunos programas de los existentes en el mercado, que nos podrán ayudar
notablemente en nuestros estudios.

Analysis of Qualitative Data,


conocido como AQUAD, es un
programa desarrollado en Alema-
nia por G. Huber en 1987. Está
elaborado al servicio de las com-
plejas y, con frecuencia, tediosas
tareas de análisis de datos cualita-
tivos. En concreto, el investigador
cualitativo puede servirse de este
programa en las fases de reduc-
ción, presentación y extracción o
elaboración de las conclusiones.
La codificación es una de las
tareas en las que el programa
muestra su gran aportación. De un
lado hace posible la división del
texto en fragmentos, marcando su

519
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

inicio y final, así como el etiquetado de cada uno mediante la asignación de


códigos.
Por su parte, el programa facilita el agrupamiento de los diferentes frag-
mentos que hayan sido etiquetados con el mismo código, lo que hace más
asequible el establecimiento de las comparaciones destinadas al descubri-
miento de las metacategorías.
Incluso las tareas más creativas, como son las de formulación y com-
probación de hipótesis, se ven facilitadas por medio de la utilización de
AQUAD. En efecto, mediante el estudio de los temas más frecuentes y de los
correspondientes agrupamientos en relación con los códigos que alcanzan
frecuencias más elevadas, pueden detectarse “regularidades y estructuras
de significado” que facilitan la tarea de formulación de hipótesis.
Por último, señalar que mediante un estudio empírico de las agrupacio-
nes de códigos, que se nos muestran como tendencia, se puede llegar al con-
traste de las hipótesis formuladas.

NUD.IST es un
programa desarrolla-
do en la Universidad
de La Trobe, Austra-
lia. Corresponde a las
siglas de “Non-nume-
rical Unstructured
Data * Indexing Sear-
ching and Theorizing”, que se puede traducir por Datos No numéricos y no
estructurados * Indexar, registrar y teorizar. Sirve para segmentar y organi-
zar los datos de la investigación, asignar categorías, establecer relaciones
entre ellos, realizar búsquedas textuales específicas, y por último, construir
matrices y tablas de frecuencias con la información relevante.
Gil y Perera (2001, 33) señalan que soporta los procesos de categoriza-
ción deductiva e inductiva, incluso ambas. De este modo nos permite dise-
ñar en principio, un sistema propio de categorías a partir de las estableci-
das en la investigación, o bien o bien de las hipótesis que se van

520
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

incorporando durante la recogida de datos. Además, estas categorías las


podemos agrupar y organizar de forma jerárquica, para luego, observar las
relaciones que existen entre las categorías tratadas, compararlas y desarro-
llar conclusiones pertinentes.
Puede manejar dos grandes sistemas: el de documentos, referido a las
fuentes de información de que parte el investigador, sean éstas sus teorías,
sus ideas previas e, incluso, las hipótesis que pretende someter a contraste,
o el conjunto de la información recopilada a través de los diferentes méto-
dos y técnicas utilizados, tales como la observación participante o las entre-
vistas en profundidad. Y el de indización, que consiste en un gráfico en
forma de árbol invertido en el que los conceptos se ponen en relación a tra-
vés de diferentes ramificaciones.
El sistema de documentos está integrado por dos grandes grupos: los
denominados online, que consisten en la transcripción textual de la
información, que deben ser almacenados en el ordenador para, más ade-
lante, poder realizar búsquedas de palabras o recuperación de fragmen-
tos, y los offline, integrados por la documentación no almacenable en el
ordenador, tal como fotografías, vídeos o información considerada no
relevante.
En cuanto al sistema de indización permite organizar la información
mediante el análisis de las intersecciones de las diversas ramas, formando
lo que se conoce como nudos (se distingue el nudo raíz, el primero, y los
nudos hijo, hermano o padre), lo que hace posible el manejo de la informa-
ción con enorme flexibilidad.
La forma de trabajo es lo suficientemente compleja como para poder
reflejarla aquí. Por ello recomendamos acudir a la documentación original
o a alguno de los manuales editados para su aplicación.

Se trata de un programa muy avanzado que facilita el análisis de datos


cualitativos. Es un producto asociado de actualización opcional del
NUD.IST 4 ó 6, un software de los más usados.
Con él, es posible gestionar tanto datos enriquecidos, como texto enri-
quecido, usando negrita, cursiva, colores y otros formatos. Además, cuenta

521
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

con una gran versatilidad para editar, visualizar código y vincular documen-
tos tal y como son creados, codificados, filtrados, manejados y registrados.
Para conocerlo mejor, nos parece interesante la tabla comparativa que
presentan Revuelta y Sánchez (2003):

QSR NVivo NUD.IST

Análisis de texto enriquecido con Análisis de texto plano, con unidades de


unidades de análisis no fijas. texto fijas.

Editar texto del documento sin desorganizar la codificación

Relacionar anotaciones, archivos externos Añadir anotaciones al texto como las


y páginas web. unidades de texto.
Relacionar documentos memo editables Adjuntar una memo a algún documento
y codificables. o nudo.

Ver y hacer informes de la codificación de varias maneras.

Ojear y depurar la codificación en un visualizador de nudos que proporciona acceso


al contexto.

Archivar demográficos y otros datos descriptivos.

Usar un archivo de comando de macros


Organizar y describir documentos y
facilita las acciones repetitivas tales
nodos automáticamente y secciones de
como la codificación de secciones.
código usando el menú “sets” (conjunto)

Buscar datos en esquemas de texto y palabras clave autocodificadas

Integrar la búsqueda de códigos, Buscar y comparar codificación y


atributos y esquemas de texto. resultados de búsqueda textuales.

Buscar un subset (sub-conjunto) de los datos y extender el resultado codificado

Cruzar algunos nudos, valores de Cruzar codificación de dos nudos hijos y


atributo, y esquemas textuales, y exportar tabla.
exportar la tabla.
Conceptualizar las ideas en una Exportar nudos y otras propiedades a
herramienta gráfica de modelo que programas externos de modelo.
enlaza los datos.

522
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

WinMAX es un programa que facilita el análisis de contenido de un


texto. La primera versión fue lanzada en 1989. Los usuarios lo describen
como una herramienta robusta y fácil de manejar que puede ser usado bajo
la teoría fundamentada de “codificar y recuperar”, incluso para los más
sofisticados análisis textuales, utilizando procedimientos cuantitativos y
cualitativos de forma combinada.
De este modo, permite la…
• Visualización de funciones básicas como códigos y memos.
• Codificación compleja y flexible y funciones de recuperación (Boolea-
na, proximidad y recuperación semántica).
• Búsqueda lexical y codificación automática.
• Combinación de datos cuantitativos y cualitativos.
• Importar y exportar matrices de datos.
• Complejas y robustas herramientas de construcción de teoría.
• Funciones únicas como codificación de variables según su peso signi-
ficativo y procedimientos de trabajo en grupo.
• Procedimientos especiales como el análisis de preguntas abiertas-
cerradas.
El programa presenta una interfaz simple y fácil de usar, que muestra
cuatro ventanas: los grupos de textos, la lista de códigos, la lista de seg-
mentos codificados y los propios textos ya importados.

523
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

MAXqda es una versión más moderna de WinMAX, ofrecida por los mis-
mos desarrolladores, que optimiza el análisis cualitativo de textos. Conserva
sus características de ofrecer una estructura clara y ordenada, junto a unas
funciones más amplias y diferenciadas en combinación con una visualización
única y avanzada de alta disponibilidad para los procesos de codificación.
Su desarrollo mantiene la interfaz en base a las cuatro opciones de tra-
bajo, que se corresponden con las necesidades de gestión en el proceso de
análisis de datos cualitativos:
– El conjunto completo de datos, o textos (Text groups).

– Los códigos y la categorización del sistema (Code system).

– El texto único, siempre y directamente accesible (“Text Browser”).

– Realizar búsquedas básicas y complejas, la verificación de sus con-


ceptos teóricos (“Retrieved Segments”).

Todas las funciones esenciales de gestión están directamente integradas


en cada ventana ofreciendo además un amplio espectro de posibilidades
complementa-
rias, como por
ejemplo trabajar
con textos en
formato de texto
enriquecido
(.RTF), impor-
tar los textos
desde Internet,
crear grupos de
texto y organi-
zar el material
textual, generar
conjuntos de
texto para el
análisis tempo-

524
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

ral o establecer un código jerárquico (categoría) del sistema con hasta diez
niveles.
Además, cuenta con una versión ampliada en la que ofrece funciones
como MAXDictio, un módulo para el análisis de vocabulario, la creación de
diccionarios especializados y la realización de análisis de contenido cuan-
titativo, o MAXMapas, que facilita la representación gráfica de los diferen-
tes elementos de un proyecto.

También es un potente software


para el análisis visual de datos cuali-
tativos de textos, gráficos, audio y
video. Ofrece una variedad de herra-
mientas para llevar a cabo las tareas
asociadas con una aproximación sis-
temática a los datos “sensibles”.
ATLAS.ti ayuda a descubrir los
fenómenos complejos que se
encuentran ocultos en los datos
cualitativos, ofrece un potente e
intuitivo ambiente para la copia
con la complejidad heredada de
las tareas y datos, y mantiene el
interés de los datos bajo el análisis. De este modo, permite:
• Recopilar y organizar el texto, audio o archivos de datos visuales,
junto con la codificación, memos y búsquedas, en su proyecto o “uni-
dad hermenéutica”
• Llevar a efecto las actividades comprometidas en el análisis y la inter-
pretación, en selecciones particulares, codificación, anotaciones y en
comparar segmentos significativos
• Una comprensión general del trabajo, mediante rápidas búsquedas, y
recuperación y navegación por todos los segmentos de datos y notas
relevantes a una idea.

525
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

• Construir una extraordinaria red con la cual le permite conectar


visualmente pasajes seleccionados, memos y codificaciones, de tal
manera que facilita la construcción de conceptos y teorías basadas en
las relaciones visibles, o en otras no tan visibles.
• Servirse de esas redes generadas, para explorar y descubrir la estruc-
tura interna de los datos, es decir, los significados interrelacionados.

Se trata de uno de los más antiguos programas para el análisis de datos


cualitativos (data de 1984). En este caso, se trata de un programa creado por
John Seidel, de manera específica para
el análisis descriptivo-interpretativo de
textos. Responde a esta secuencia de
desarrollo: recopilación de datos, codi-
ficación, memos y análisis.
Diseñado en torno a los conceptos
de descontextualización y recontextua-
lización, ofrece una serie de funciones
entre las que destacan:
• Búsqueda selectiva: compila segmentos codificados en carpetas con
características específicas.
• Frecuencias: Cuenta las ocurrencias de un código determinado. Un tipo
de contexto de información puede ser usado para identificar hablantes
en una conversación de grupo. Después el programa puede contar el
número de veces que el hablante ha intervenido.
• Búsqueda de códigos múltiples: el texto de un segmento es codificado
con dos o más categorías simultáneamente.

526
EL TRATAMIENTO DE DATOS EN LA INVESTIGACIÓN CUALITATIVA

Ha sido desarrollado por académi-


cos de las universidades inglesas de
Bath y Strathclyde.
Se trata de una herramienta que
facilita para la gestión de temas “blan-
dos” (“soft”), es decir la información
cualitativa que rodea a las situaciones
complejas o inciertas.
Permite, a partir de la captura de fragmentos de los textos, explorar su
contenido y obtener nueva información, generando un mapa conceptual a
partir de ellos. El resultado es una nueva perspectiva temática, y ahorro de
tiempo mediante una mayor productividad, el desarrollo de la creatividad
y un mejor enfoque al tratamiento del texto.
Terminaremos señalando que existen otros programas interesantes, como
el Paquete SPAD.T, MECA, QUALOG, TAP, etc., que ayudan en aspectos espe-
cíficos del análisis textual, su utilidad queda debidamente solventada con las
incorporaciones técnicas que ofrecen los que acabamos de reseñar. Con nues-
tro repaso, no hemos pretendido, más que hacer una somera referencia al
potencial que ofrece cada programa. Para profundizar en su estudio, remiti-
mos al estudiante a los manuales correspondientes a cada programa, pues
además de ofrecerle una guía de primera mano, elaborada por el propio crea-
dor, ésta le llegará debidamente actualizada, para trabajar con la última ver-
sión del software. No olvidemos que éste, el de la tecnología, es un mundo
muy dinámico, en constante evolución, que resulta prácticamente imposible
abordar, si no es con la convicción de su inmediata obsolescencia.

RESUMEN

El tratamiento de datos en la investigación cualitativa, requiere una


consideración muy especial, pues al no abordar el uso de material cuantifi-
cable, sino de textos convertidos en datos de contenido, su aplicabilidad

527
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

está limitada, requiriendo una preparación previa de los datos, para facili-
tar ese tratamiento. De este modo, hemos de considerar que el procedi-
miento de datos en la investigación cualitativa, presenta un carácter analí-
tico, cuya secuencia desarrollamos convenientemente.
A partir de este conocimiento, dos serán las cuestiones que completen el
tema: por un lado la teorización que requiere el estudio cualitativo, abor-
dando el procedimiento que permite su aplicación, y la informática como
recurso de aplicabilidad técnica, de cuya potencialidad hoy en día nadie
duda. En esta última cuestión, referenciamos diversos programas que per-
miten llevar a efecto de una manera técnica, el análisis de contenido de los
textos empleados en los estudios de este tipo.

528
GLOSARIO

Análisis (cualitativo)
El análisis que se refiere a los aspectos de calidad, valor o pondera-
ción de un objeto, individuo, entidad o estado. Por oposición, existe el
análisis cuantitativo, que se emplea para determinar la cantidad de un
ingrediente, elemento o variable en una entidad dada.
Análisis de varianza
El análisis de la varianza (ANAVA o ANOVA) es una de las pruebas
paramétricas más importantes y útiles para el contraste de hipótesis
estadísticas.
Como su nombre indica, consiste en analizar, dividir o descomponer la
varianza total de las puntuaciones de un grupo de sujetos al menos en
dos partes: aquella atribuible a los efectos de la variable independiente,
esto es, a la varianza sistemática experimental, y aquella otra cuyo ori-
gen es difícil de delimitar y que se denomina varianza de error, aleato-
ria, en la que se incluyen las diferencias individuales, los errores de
muestreo y los errores debidos a las limitaciones de la medida.
El análisis de la varianza, simbolizado por F, consiste en el cociente
entre ambos tipos de varianza y pretende establecer si la diferencia
entre las medias aritméticas de los grupos es o no estadísticamente
significativa para el nivel de significación (α) decidido de antemano
por el investigador. El valor de F se interpreta en términos de la pro-
babilidad de que tal valor pueda ocurrir por efecto del azar; si tal pro-
babilidad fuera menor que α, se rechaza H0 y se acepta H1, si bien
admitiendo una probabilidad de error tipo I ≤ α.
Ciencia. Su objetivo. Tipos de ciencia
Para M. Bunge la ciencia tiene como finalidad «El conocimiento obje-
tivo del mundo».

529
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

«La peculiaridad de la ciencia tiene que consistir en el modo con que


opera para alcanzar algún objetivo determinado, o sea, en el método
científico y en la finalidad para la cual se aplica dicho método»
El creciente cuerpo de ideas llamado «ciencia» «puede caracterizarse
como conocimiento racional, sistemático, exacto, verificable y, por con-
siguiente, falible».
Según este autor cabe hablar de diferentes tipos de ciencia: ciencia
pura, cuyo objetivo primordial es el incremento de nuestro conoci-
miento (objetivo intrínseco o cognitivo), y ciencia aplicada, cuyo obje-
tivo es el de aumentar nuestro bienestar y nuestro poder (objetivos
extrínsecos o utilitarios), denominando a éstas tecnologías.
Atendiendo a su objeto hay ciencias formales, como la Lógica y la
Matemática (estudian ideas) y factuales, como la Física, la Química, la
Biología, la Economía, la Sociología..., que estudian hechos.
Las formales –la Lógica y la Matemática- dan lugar a enunciados que
consisten en relaciones entre signos, mientras las factuales –caso de la
Física, la Química o la Economía- producen enunciados referidos, en
la mayoría de las ocasiones, a sucesos o procesos.
Para M. Bunge «el objetivo fundamental de la ciencia e la teoría. Dicho
en un lenguaje menos críptico, su finalidad consiste en explicar los fenó-
menos naturales. Tales explicaciones reciben el nombre de teorías.»
Comprensión
W. Dilthey introduce una clara distinción entre el modo de conocer pro-
pio del ámbito natural (Ciencias Naturales) y el humano (Ciencias Huma-
nas): si las primeras se orientaban a la explicación, las segundas buscaban
la comprensión, conceptos ambos no siempre fáciles de diferenciar. La
línea de demarcación entre ambos tipos de ciencias se encontraría en un
importante hecho: mientras el investigador de las Ciencias Naturales cen-
tra su atención en lo que ocurre «ahí fuera», una realidad objetiva, estáti-
ca, dócil al investigador, el de las Ciencias Humanas aborda fenómenos
intencionales, dinámicos, en continuo cambio, para cuyo conocimiento
debe acudir a la «experiencia interior» de sus protagonistas.
Cuando se habla de comprensión en el contexto de las metas de la
investigación debemos entender «la captación de las relaciones

530
GLOSARIO

internas y profundas a través de la penetración en su intimidad, res-


petando la originalidad y la indivisibilidad de los fenómenos», pala-
bras que pone Freund en boca de Jaspers. Y añade: «en lugar de par-
celar lo real, como hace la explicación, la comprensión respeta su
totalidad vivida. Los resultados a los que llega no son, en general,
directamente verificables por la experiencia, pero se nos imponen por
la evidencia».
Conocimiento científico. Características.
El conocimiento experimental se nos presenta como una modalidad
de conocimiento científico, concretamente aquél que se funda en la
observación y experimentación científica sobre la base de la expe-
riencia.
La experiencia a la que nos referimos es una experiencia sistemática o
experimentación controlada. En este sentido, la Pedagogía experimen-
tal se caracteriza por el «esfuerzo de medir los hechos pedagógicos,
estudiar las condiciones, determinar las leyes».
La Pedagogía experimental, de carácter científico, procede
«por vía de experimentación cuidadosamente estudiada y de encuestas
objetivamente planteadas que afectan a los problemas de la pedagogía y
de la enseñanza susceptibles de medirse exactamente y controlarse
mediante métodos de la ciencia y en particular de la estadística» .
Por tanto contamos con unos criterios para reconocer qué experien-
cia se considera incluida en la Pedagogía experimental o, si se prefie-
re, cuándo la experiencia, lo empírico, es científico: debe haber posi-
bilidad de medición y control.
Parecida posición mantiene García Hoz propone, apoyándose en
Decroly y Buyse, dos criterios:
• «la aplicación de la medida o la evaluación objetiva a los fenóme-
nos estudiados», y
• «la posibilidad de comprobar la investigación por parte de personas
ajenas a ellas».
Así pues, nuestra disciplina se caracteriza por procurar un conoci-
miento científico de carácter experimental, esto es, basado en la

531
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

observación y experimentación científicas, cuyas notas son la medición,


el control y la verificabilidad intersubjetiva.
A estas notas es preciso añadir la necesidad de que, como en cualquier
ciencia, sea posible el logro de leyes generales -scientia non est indivi-
duorum- decían los escolásticos.
Sus características:
■ Precisión
■ Búsqueda de las causas
■ Objetividad
■ Seguridad
■ Falibidad
■ Provisionalidad
■ Sistema ordenado y coherente de relaciones que mutuamente se
apoyan y sostienen
Contraste de hipótesis
Proceso sistemático que concluye tomando una decisión sobre la
hipótesis nula (H0): rechazo o no rechazo, con la consiguiente acepta-
ción o no de la hipótesis alternativa (H1) asumiendo un riesgo de error
tipo I ≤ α .
Control
El método científico pretende establecer relaciones causales entre las
variables relacionadas en su hipótesis. Lograr una meta tan elevada
como esta exige del investigador el dominio de la situación, de forma
que, teniendo bajo su dominio la variable independiente, controle el
conjunto de circunstancias, hechos, personas… que, además de dicha
variable, puedan influir en la dependiente.
Si no fuera así, quedaría la duda de si la relación encontrada se debe
a la variable independiente, a alguna de esas otras variables –conver-
tidas en extrañas, esto es, en hipótesis rivales de la suya- o la la inter-
acción entre unas y otras.

532
GLOSARIO

Como dirá Kerlinger, el diseño es el plan, la estructura y la estrategia


de una investigación cuyo objetivo es dar respuesta a las preguntas de
la investigación y controlar la varianza.
Pues bien: ese control se debe traducir en lo que denominamos vali-
dez interna, que pretende asegurar que los cambios apreciados en la
variable dependiente se deben a, y solo a, la manipulación de la varia-
ble independiente, descartando el influjo de la variables extrañas.
El control forma parte de un principio fundamental en la investiga-
ción científico experimental, denominado por Kerlinger MAX–MIN-
CON, esto es: maximizar la varianza experimental, minimizar la
varianza de error y controlar la varianza de las variables extrañas.
Correlación
Entendemos por correlación la relación existente entre dos o más
variables (en este caso, correlación múltiple, correlación parcial).
La correlación puede ser perfecta, positiva o negativa (valor de ± 1),
nula (valor de 0), o imperfecta, que incluye toda la gama de valores
que van de 0 a 1, tanto positivos como negativos.
La correlación es positiva cuando a los valores de las variables aumen-
tan o disminuyen en la misma dirección, y negativa en caso contrario.
El índice de correlación más conocido es el de Pearson, representado
por rxy; hay otros índices para variables ordinales, para los casos de
una variable continua y otra dicotómica o dicotomizada, para varia-
bles dicotómicas, para variables dicotomizadas. En el caso de varia-
bles nominales se prefiere el término asociación al de correlación.
En la prueba de hipótesis, la existencia de correlación entre variables
es un elemento importante a tener en cuenta; en efecto: tal correla-
ción representa un nueva fuente de varianza (además de la variable
independiente y la incluida en el término de error). Este hecho repre-
senta que el denominador de F será menor y, por ello, habrá mayores
posibilidades de rechazar H0.
Co-variable
Se trata de una variable relacionada sustancialmente con la variable
dependiente, cuyos datos son utilizados en los diseños con grupos

533
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

intactos, y que permite aplicar la prueba del análisis de la covarianza;


esta técnica permite contrastar las diferencias finales medidas en la
variable dependiente, ajustándolas a las posibles diferencias iniciales
antes de comenzar la investigación.
Su eficacia depende, en gran medida, de la intensidad de la correla-
ción existente entre la covariable y la variable dependiente.
Diseño
Siguiendo a Kerlinger
«Diseño es el plan, estructura y estrategia de una investigación cuyo
objetivo es dar respuesta a ciertas preguntas y controlar la varianza».
Como se aprecia, el autor define el término e incluye en su concepto
los dos objetivos fundamentales del mismo.
A continuación se presenta el desarrollo que realiza el autor de los tér-
minos incluidos en el concepto: plan, estructura y estrategia.
«El plan es un esquema global o programa que consiste en bosque-
jar lo que hará el investigador, desde la redacción de la hipótesis y
sus consecuencias operacionales, hasta el análisis final de los
datos. La estructura es más específica: es el bosquejo, el esquema,
el paradigma de operación de las variables. Al trazar diagramas
donde se describen las variables, su relación y yuxtaposición, cons-
truimos esquemas estructurales que nos permiten alcanzar las fina-
lidades operacionales de la investigación. El significado de estrate-
gia… comprende los métodos mediante los cuales se reunirán y
analizarán los datos. En otras palabras, indica cómo se consegui-
rán los objetivos de la investigación y cómo se abordarán los pro-
blemas que se hallen en ella».
Tipos de diseños:
Pre-experimentales: diseños que carecen de posibilidad de compara-
ción del efecto de la v.i. sobre la dependiente y del debido control de
variables extrañas.
Kerlinger afirma lo siguiente sobre este tipo de diseños: una verdade-
ra investigación requiere

534
GLOSARIO

«… como mínimo dos grupos: uno que reciba el tratamiento experi-


mental y otro que no lo reciba, o bien que lo reciba de forma diferen-
te. Requiere, además, la manipulación de una variable independiente
por lo menos, la asignación aleatoria de los sujetos a los grupos y la
asignación al azar de los tratamientos a los grupos. Cuando por una
u otra razón se viola uno o varios de los requisitos mencionados, nos
encontramos ante un diseño preexperimental».
La definición dada por Kerlinger incluiría los que nosotros hemos
denominado cuasi-experimentales.
Experimentales: diseños que cumplen con el principio fundamental de
la investigación experimental: el control de la varianza de la v.i. y de
las variables extrañas, de forma que se pueda asegurar que los efectos
medidos en la v.d. se deben a, y solo a, la v.i. Cumplen con la condi-
ción de validez interna.
Cuasi-experimentales: para Campbell y Stanley se trata de diseños en
que
«… el investigador puede introducir algo similar al diseño experi-
mental en su programación de procedimientos para la recolección de
datos (p.ej., el cuándo y el a quién de la medición) aunque carezca de
control total acerca de la programación de estímulos experimentales
(el cuándo y el a quién de la exposición y la posibilidad de aleatori-
zarla) que constituye el auténtico experimento»
Diseños factoriales:
Una tipología diferente de diseños se refiere al número de variables
independientes. Cuando estas son dos o más que actúan simultáne-
amente sobre la v.d. estamos ante los diseños factoriales, que per-
miten probar el efecto de cada variable o factor por separado y,
además, el de interacción. Campbell y Stanley los sitúan entre los
experimentales.
Diseños compensados. Diseños de cuadrado latino.
Se trata de diseños en los que, además de la v.i., aquí denominada
generalmente variable tratamiento, se incluyen en el propio diseño
otras dos v.i., pero no en función de tales sino como instrumento para
su control al formar grupos homogéneos o bloques de sujetos, inicial-

535
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

mente similares antes de introducir la variable independiente (X). Si


en el diseño factorial su gran aportación es la posibilidad de consta-
tar la posible existencia de interacción, en este caso, tal existencia
sería perjudicial, ya que no nos permitiría distinguir el efecto de los
factores y el de la propia interacción, contraviniendo el principio fun-
damental de la validez interna.
Diseños de series cronológicas
Se trata de diseños, generalmente de un solo sujeto o grupo, en los
que se trata de apreciar el efecto de la v.i. –X- una vez comprobada la
situación de los mismos en lo que será la v.d. (Y). Estas mediciones
previas a X nos permiten establecer una línea de base que nos servirá
de referencia para valorar las mediciones posteriores a X.
Por lo general es preciso tomar varias mediciones de Y para apreciar
tanto si se dan cambios como si, de darse, persisten.
Criterios para selección del diseño adecuado:
Fundamentalmente son dos: el diseño más adecuado será el que per-
mita dar la respuesta mejor y más adecuada a la pregunta de la inves-
tigación y a la hipótesis a contrastar, y el que mejor controle la varian-
za, tanto inicialmente de la v.i. como durante el proceso de
investigación con las variables extrañas.
En igualdad de estas condiciones, el tercer criterio tiene que ver con
las mayores o menores posibilidades de generalización de los resulta-
dos.
Distribución muestral
Puede definirse como la distribución de un estadístico en el muestreo.
Esta distribución está formada por los infinitos valores de un estadís-
tico obtenidos de infinitas muestras aleatorias del mismo tamaño
extraídas de la misma población.
Entrevista
Técnica de investigación que, basada en un diálogo interesado, con un
acuerdo previo y unos intereses y expectativas concretas, busca obte-
ner información del entrevistado

536
GLOSARIO

Error típico. Error muestral


Error típico: Es la desviación típica de una distribución muestral
Error muestral: en el marco de la estimación de parámetros, es la
diferencia más probable entre el estadístico y el parámetro
Escenario
Espacio en el que tiene lugar el desarrollo de una investigación.
Estadística inferencial
Se distinguen dos grandes tipos de Estadística: la descriptiva y la infe-
rencial, que estudia la inferencia estadística.
La inferencia estadística pretende sacar conclusiones sobre gran
número de datos a través de observaciones de parte de esos datos. Se
trata de generalizar los datos de una muestra a la población de la que
procede. Mediante la estadística inferencial se puede estimar pará-
metros y realizar contraste de hipótesis.
Estadístico
Valores obtenidos en una muestra. Los más conocidos son los agru-
pados bajo las medidas de posición o tendencia central (media,
mediana, moda), las de dispersión o variabilidad (desviación media,
desviación típica, varianza) o los coeficientes de correlación. Suelen
representarse con letras latinas (s, r…).
A partir de ellos, por inferencia estadística, podemos estimar sus
correspondientes parámetros con determinados niveles de probabili-
dad, asumiendo un riesgo de error tipo I prefijado por el investigador.
Estimación. Estimador. Estimación de parámetros
Mientras en las muestras se obtienen sus valores representativos apli-
cando las oportunas fórmulas, los parámetros correspondientes se
estiman, es decir: se indica cuál es su valor aproximado a partir de los
calculados para las muestras.
Cuando estimamos el valor de un parámetro, solemos calcular un
intervalo de confianza alrededor del estadístico de la muestra (esti-
mador) según el nivel de confianza. Un intervalo de confianza del 95%

537
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

nos indicará que, si repitiéramos el proceso de estimación un elevado


número de veces, en el 95% de los casos el valor del parámetro se
encontraría dentro de los límites confidenciales.
Etnografía
Concepto clave de la antropología, que se ocupa de entender la organi-
zación y la construcción de significados en diferentes grupos sociales.
Experimento
Es la modalidad de investigación empírica más exigente; como con-
secuencia, su aportación esencial es la posibilidad de establecer, con
razonable seguridad, relaciones de causa a efecto entre una o varias
variables independientes (v.i.) y otra denominada dependiente.
Para poder lograrlo se deben cumplir determinadas exigencias: el
investigador debe poder planificar la acción y provocar el fenómeno,
ha de poder realizarlo en condiciones de control y debe contar con
medidas de calidad, tan válidas, fiables y precisas como sea posible.
Para Kerlinger, su finalidad es triple: a) descubrir relaciones en con-
diciones «puras» y no contaminadas; b) probar predicciones deriva-
das de la teoría o de otra investigación; c) refinar teorías e hipótesis y
ayudar a elaborar sistemas teóricos.
Si lo anterior define el denominado experimento de laboratorio, dado
que en ese marco es más fácil cumplir con los tres requisitos, en el
experimento de campo no pude cumplirse plenamente con ellos. En
efecto: si la planificación y provocación del fenómeno no siempre es
posible en plenitud, su realización no en ambiente artificial como es
el laboratorio, sino en la vida real, hace posible la aparición de varia-
bles extrañas a la vez, que, ahora en sentido positivo, permite ver
cómo funciona en la realidad. Y esta es la tercera cuestión: este tipo
de experimentos hacen posible comprobar en qué medida lo descu-
bierto en el laboratorio es aplicable a la vida real.
Deontología
La investigación y la evaluación tiene notables repercusiones sociales.
Por ello, no debe extrañar que, al igual que en otras profesiones, se
hayan elaborado códigos deontológicos.

538
GLOSARIO

La Deontología hace referencia al deber y a las normas morales. Se


refiere a un conjunto ordenado de deberes y obligaciones morales que
tienen los profesionales de una determinada materia.
En http://www.uv.es/RELIEVE/v6n2/RELIEVEv6n2_2.htm puede encon-
trar referencias al tema, en el artículo Ética e investigación educativa.
La ANECA, presenta su código ético en la siguiente dirección:
http://www.aneca.es/var/media/185313/academia_codigoetico_080115
.pdf (CÓDIGO ÉTICO DE LA AGENCIA NACIONAL DE EVALUACIÓN
DE LA CALIDAD Y ACREDITACIÓN)

Explicación
El concepto de explicación debe entenderse en el sentido de encontrar
enunciados generales que permitan dar una respuesta a un conjunto
de fenómenos. Para Jaspers, la explicación tiene por objeto establecer
las causas de los fenómenos, por lo que la considera como una meta
propia de las Ciencias de la Naturaleza.
En la misma línea se manifiesta Russell Hanson en Patrones de des-
cubrimiento. Observación y explicación: «Las explicaciones causales
son importantes para nosotros. Existen, por supuesto, otros muchos
modos de hacer comprensibles los fenómenos».
Fenomenología
Estudia la relación que hay entre los hechos (fenómenos) y el ámbito
en que se hace presente esta realidad (psiquismo, la conciencia).
Generalización
Entendemos por generalización el hecho de extender los resultados de
la investigación desde los sujetos estudiados a los grupos de los que
forman parte, desde las muestras a sus respectivas poblaciones.
Teniendo en cuenta que finalidad del saber pedagógico consiste en
lograr leyes tan generales como sea posible, de forma que los resulta-
dos alcanzados con unos sujetos puedan aplicarse a otros diferentes
que formen parte de la misma población, el desideratum será llegar a
diseños que, cumpliendo con la validez interna, puedan alcanzar los
más amplios niveles de validez externa.

539
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Hipótesis. Características. Validación de la hipótesis


Entendemos por hipótesis las conjeturas sobre la posible relación
entre los elementos -variables- integrantes del problema.
Investigar sin hipótesis directrices puede llevar a la utilización
inadecuada de los datos, elaborando a posteriori explicaciones que
cuadren con ellos. Por ello, Kerlinger afirma que «el investigador que
no supone una relación por anticipado no da a los hechos la oportu-
nidad de demostrar o negar algo», añadiendo que si se recogen pri-
mero los datos y luego se les busca explicación se está violando el
juego científico.
Sus características fundamentales son:
• Su buena fundamentación, aunque ello «puede retrasar o hasta
impedir cambios revolucionarios en la ciencia» (M. Bunge)
• Su contrastabilidad por procedimientos empíricos. Esto suele exigir
la operacionalización de las variables que se relacionan en la hipó-
tesis
• Si verosimilitud : ser lógicamente congruente y no contradictoria
con las leyes naturales
• Armoniosa con otras hipótesis del campo de investigación
• Sencillez o simplicidad, generalidad y potencia deductiva.
Bunge afirma que «la mejor fundamentación de una hipótesis es su
inserción en una teoría, o sea, en un sistema de hipótesis que se apoyan
y controlan mutuamente».
Kerlinger es taxativo:
«si una explicación no puede ser formulada en forma de una hipótesis
comprobable, puede ser considerada entonces como una explicación
metafísica y no susceptible de investigación científica».
Hipótesis unilateral o bilateral
La hipótesis del investigador se puede formular en el sentido de que
una determinada variable independiente con al menos dos niveles
–variable método, con los niveles A: método analítico; nivel B: méto-

540
GLOSARIO

do sintético) da lugar a diferencias en la variable dependiente. En tal


caso, la hipótesis se denomina bilateral, dado que quedaría validada
tanto si los resultados favorecen al nivel A como al B.
Cuando el investigador tiene razones para decantarse por uno de
los dos niveles, la hipótesis se denomina unilateral, y sólo quedará
validada si las diferencias van en la dirección apuntada por el inves-
tigador.
Validación de la hipótesis
Procedimiento riguroso de poner a prueba la hipótesis planteada por
investigador una vez analizado que cumple con las características y
cualidades anteriores.
Planteada la hipótesis deben extraerse sus consecuencias, esto es: lo
que debe ocurrir si es válida la hipótesis planteada, la relación esta-
blecida entre las variables. La validación de la hipótesis implica la
elección de un diseño adecuado, esto es, de un plan de acción capaz de
dar respuesta a las preguntas del problema en condiciones exigentes
de control.
Las variables se deben operacionalizar, recoger los datos mediante
técnicas e instrumentos adecuados y de calidad —válidos, fiables y
valiosos— y someterlos a contraste mediante pruebas estadísticas que
atribuyan a los resultados una determinada probabilidad de ocurren-
cia por puro azar.
La validación exige definir no sólo las variables sino delimitar la
población, contar con muestras representativas. Además de la opera-
tivización es preciso, como se ha indicado, que la validación se dé en
condiciones de control.
La información y los datos recogidos para someter a prueba la hipó-
tesis deberán ser analizados y tratados adecuadamente para extraer
de ellos la información necesaria; en este punto, la Estadística ayuda-
rá a atribuir a los resultados una determinada probabilidad de ocu-
rrencia por puro azar; en caso de ser tan pequeña o más que el error
que está dispuesto a aceptar el investigador, se concluirá aceptando
que la hipótesis ha quedado validada mientras no haya otros resulta-
dos que la pongan en tela de juicio.

541
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Hipótesis nula
Es una afirmación algebraica sobre el valor específico de un paráme-
tro poblacional. Por ejemplo, en los diseños de un grupo puede pre-
sentarse H0: µ = a, donde a es un valor numérico específico. En la
prueba de significación de la hipótesis nula (por ejemplo, en los dise-
ños de dos grupos), ésta afirma: «no hay efecto presente» (efecto de la
variable independiente sobre la variable dependiente). Expresa que
las diferencias observadas son aleatorias, se deben a errores de mues-
treo, no hay diferencias en la población.
Interacción
En los diseños factoriales, esto es, aquellos en que trabajamos con dos
o más v.i., podemos someter a contraste los denominados efectos prin-
cipales, esto es, los de cada v.i. o factor por separado, similares a los
diseños de una v.i., y los de interacción. En este caso, se trata de los
efectos diferenciales de una v.i. sobre la v.d. en función de los que
toma la otra v.i. o factor. Si tales efectos no son constantes sino que
varían, estamos ante la interacción. Tal puede ser el caso de que un
determinado método no dé siempre mejores resultados que otro, sino
que los dé en sujetos con dislexia, mientras el otro método los dé con
niños no disléxicos.
Interaccionismo
Una de las corrientes de pensamiento relacionada también con la
antropología y la psicología social, que se basa en la comprensión de
la sociedad a través de la comunicación.
Investigación. Investigación empírica
Para Selltiz, «Investigar es buscar de nuevo, echar otra mirada más cui-
dadosa para averiguar más. Echamos otra mirada porque puede haber
algo erróneo en lo que ya sabemos [...]
La actitud investigadora presupone que la primera mirada –y las poste-
riores- pueden ser propensas a error, y por ello tenemos que mirar una y
otra vez, de forma diferente y completa cada vez».
La investigación científica ha de ser sistemática, organizada, discipli-
nada y rigurosa.

542
GLOSARIO

Para Kerlinger: «La investigación científica es una investigación siste-


mática, controlada, empírica y crítica, de proposiciones hipotéticas
sobre supuestas relaciones que existen entre fenómenos naturales».
Investigación empírica es aquella que acude a la experiencia, a los datos,
para llegar a conclusiones en relación con las hipótesis de partida.
Estudio evaluativo
Se refiere a cualquier proceso que se ocupa de evaluar, o lo que es lo
mismo, de determinar el valor, importancia o trascendencia de su
objeto de estudio.
Investigación ex-post-facto
Se trata de una modalidad de investigación en la el investigador no puede
proceder al control de variables bien porque sus manifestaciones ya han
ocurrido bien porque son no manipulables por su propia naturaleza.
Las inferencias sobre las relaciones entre variables se formalizan par-
tiendo de la variación concomitante de variables pretendidamente
independientes y dependientes.
Mapa conceptual
Procedimiento intuitivo que permite sintetizar información para
comprenderla mejor en el momento de proceder a su estudio
Medida. Escalas o niveles de medida
La medida es una de las exigencias del método hipotético-deductivo-
experimental. Galileo Galilei llega a afirmar: «Medir lo que es medible
y tratar de hacer medible lo que todavía no lo es» Sin embargo, no todos
aceptan la posibilidad de medida en nuestro ámbito; otros lo admiten
con ciertas limitaciones que tienen consecuencias para los números
asignados.
La definición más amplia se debe a Stevens: Medir es asignar nume-
rales a los objetos o hechos de acuerdo con ciertas reglas. Un nume-
ral puede ser un número o un símbolo, lo que permite admitir el nivel
o escala de medida nominal.
Para Russell, «la medición de magnitudes es, en el sentido más general,
cualquier método por el cual se establece una correspondencia única y

543
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

recíproca de todas o algunas magnitudes de una clase y todos o algunos


números, sean estos enteros, racionales o reales según el caso».
Por su parte, Campbell entiende la medición como «la asignación de
números para representar propiedades de los sistemas materiales que no
son números, en virtud de las leyes que siguen estas propiedades».
Por último, Siegel, defensor de una concepción estricta de la medida,
según la cual en la mayoría de los casos sólo podríamos utilizar prue-
bas no paramétricas (con escalas de medida nominal u ordinal),
mantiene que «para hacer ciertas operaciones con los números que ha
asignado a las observaciones, la estructura del método de correspon-
dencia de los números a las observaciones debe ser isomórfica con res-
pecto a alguna estructura numérica que incluya estas operaciones. Si
los dos sistemas son isomórficos, sus estructuras son las mismas en las
relaciones y operaciones que permiten». Este es el planteamiento que
nos lleva a las escalas de medida según esos diversos grados de iso-
morfismo. En este planteamiento coincide Bunge cuando afirma:
«Hay tantas clases de medición como clases de propiedades y técnicas
de medición. En lo esencial podemos contar, comparar o medir en sen-
tido estricto».
En función de las operaciones que pueden asignarse a los números
tenemos cuatro grandes escalas o niveles de medida.
• Nominal. Los números no significan cantidad sino cualidad. Esta-
mos en este nivel cuando asignamos numerales (números o letras) a
las categorías en que se ha divido un conjunto; por ejemplo, en fun-
ción del sexo (1, mujer; 0, varón), del estado civil (1, soltero; 2, casa-
do; 3, viudo; 4, separado…). Estos números solo indican igualdad o
desigualdad. Todas las cosas con el mismo número son iguales (en
lo que se refiere a esa categoría). A esta escala se le pueden aplicar
estadísticos como la Moda, la frecuencia, el coeficiente C de contin-
gencia o la prueba χ2 de bondad de ajuste.
• Ordinal: Cuando los números asignados admiten orden o rango,
creciente o decreciente, pero entre dos consecutivos no existe la
misma distancia. Si asignamos un 1, 2, 3.. n a los niños de una
clase en función del momento en entregan un trabajo, el número
es ordinal; podemos saber quién es el primero, el segundo, etc.,

544
GLOSARIO

pero el tiempo que media entre el 3º y el 4º puede ser claramente


mayor o menor que el que se da entre el 8º y el 9º, por ejemplo.
Estos números no deben sumarse o restarse, multiplicarse o divi-
dirse. Los estadísticos propios de esta escala son la Mediana, los
percentiles, la desviación mediana, los coeficiente de correlación
S de Sperman o τ y w de Kendall.
• De intervalo. Además de lo anterior, la diferencia entre dos números
consecutivos es constante. Así, cuando asignamos números a los
exámenes de alumnos de una clase en función del número de res-
puestas correctas en una prueba objetiva, los números, además del
orden, permiten sumar y restar, así como multiplicar y dividir las
diferencias, no los valores directos. Los casos más conocidos son la
temperatura o el calendario utilizado en Occidente. Se pueden utili-
zar la mayoría de estadísticos, como la Media, la s, la s2 y el coefi-
ciente de correlación de Pearson (rxy)
• De razón o cociente. Esta escala de medida es la más perfecta ya que
añade a la anterior la existencia de un cero absoluto. Esto implica
que con los objetos empíricos se pueden realizar las mismas opera-
ciones del sistema numérico y, por ello, decidir si algo es el doble,
tiple, .. la mitad, la tercera parte, etc. que otro. Si al hablar de tem-
peratura utilizamos la escala absoluta de grados Kelvin, estaríamos
en este nivel; lo mismo ocurre con la edad, la talla, etc. Se le puede
aplicar la media geométrica o el coeficiente de variación.
Metodología
Conjunto de métodos que se utilizan en una investigación científica o
en la enseñanza.
Método. Método científico
Por método se entiende, según el Diccionario de la RAE, un «modo de
obrar o proceder… Procedimiento que se sigue en las ciencias para
hallar la verdad y enseñarla». Para Bunge, «El método científico es la
estrategia de la investigación científica: afecta a todo ciclo completo de
investigación y es independiente del tema de estudio».
Para Bunge: «El método científico es un rasgo característico de la cien-
cia…: donde no hay método científico no hay ciencia»

545
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

«La peculiaridad de la ciencia tiene que consistir en el modo como


opera para alcanzar algún objetivo determinado, o sea, en el método
científico».
En otro lugar añade: «Donde no hay método científico, no hay ciencia»
Y caracterizándolo, afirma:
«El método científico es falible… Tampoco es autosuficiente: no puede
operar en un vacio de conocimiento, sino que requiere algún tipo de
conocimiento previo que pueda luego reajustarse y elaborarse; y tiene
que complementarse mediante métodos especiales adaptados a las pecu-
liaridades de cada tema».
A John Dewey se debe una reconocida caracterización del método
científico, consistente en cinco grandes pasos, momentos o etapas:
a) El hombre se da cuenta de que está ante una situación para la que
no tiene una respuesta satisfactoria, una solución adecuada (un
problema).
b) Busca soluciones a tal situación o problema.
c) Analiza cuál de ellas es la que puede ser considerada, a priori,
como la mejor, la más adecuada, y la plantea como hipótesis.
d) Deduce las consecuencias que deberían darse si tal solución fuera
la correcta.
e) Somete la hipótesis a contraste, tratando de apreciar si, en efecto,
se dan tales consecuencias esperadas.
Para Bunge, más que un método general hay que hablar de una
serie de operaciones a seguir para alcanzar el conocimiento cien-
tífico:
1. Enunciar preguntas bien formuladas y verosímilmente fecundas.
2. Arbitrar conjeturas, fundadas y contrastables con la experiencia,
para contestar a las preguntas.
3. Derivar consecuencias lógicas de las conjeturas
4. Arbitrar técnicas para someter las conjeturas a contrastación.

546
GLOSARIO

5. Someter a su vez a contrastación esas técnicas para comprobar su


relevancia y la fe que merecen.
6. Llevar a cabo la contrastación e interpretar sus resultados
7. Estimar la pretensión de verdad de las conjeturas y la fidelidad de
las técnicas.
8. Determinar los dominios en los cuales valen las conjeturas y las téc-
nicas y formular nuevos problemas originados por la investigación».
Y concluye con esta afirmación en relación con lo que denomina la
única regla de oro del trabajo científico: «audacia en el conjeturar,
rigurosa prudencia en el someter a contrastación las conjeturas.»
Método hipotético-deductivo-experimental
Para algunos autores, todo campo del saber que pretenda ser deno-
minado ciencia debe ser capaz de aplicar el denominado método
general, un método que en su formulación más exigente se denomina
hipotético-deductivo-experimental, en atención a sus tres grandes
momentos: plantear hipótesis, sacar consecuencias de las mismas y
contrastarlas de modo riguroso –experimento- en la realidad.
Modelo. Modelo estadístico
Es una representación simplificada de la realidad. Tal representación
puede ser icónica, analógica, matemática.
Los modelos matemáticos tienen una gran utilidad en Estadística. En
la medida en que unos datos empíricos sigan razonablemente un
modelo, podemos aplicar las propiedades de este al tratamiento esta-
dístico de aquellos.
Tal vez, el modelo más conocido y utilizado es el denominado normal
o campana de Gauss, al que se acomodan razonablemente muchas
variables empíricas antropométricas, pedagógicas y psicológicas.
Una vez comprobado que los datos empíricos se ajustan al modelo,
por ejemplo mediante pruebas de bondad de ajuste, como puede ser la
de χ2, podemos utilizar sus propiedades aplicando pruebas estadísti-
cas adecuadas. Así, la t de Student o la F se Fisher siguen su propio
modelo, mientras la prueba z sigue el modelo normal.

547
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Muestra. Muestreo
Entendemos por muestra un subconjunto de una población. La mues-
tra debe ser representativa de la población, para lo que deberá contar
con un tamaño suficiente y con una selección por procedimientos
imparciales, como el muestreo aleatorio.
Multiplismo
Frente a la idea de un único método o de la necesidad de adscri-
birse a un único tipo de métodos en función del paradigma prefe-
rido, determinados autores plantean el multiplismo. Para Cook
esto supone:
a) Conveniencia de acudir a enfoques teóricos múltiples.
b) Necesidad de plantear objetivos diferentes que hagan posible la uti-
lización de diferentes análisis de los resultados.
c) Acudir a modelos variados de evaluación.
d) Someter a prueba modelos causales multivariados.
e) Plantear variedad de hipótesis rivales alternativas.
f) Elaborar diversas definiciones operativas de las diversas variables
de la investigación.
g) Llevar a cabo análisis de datos y contrastes de hipótesis múltiples.
h) Acudir a valoraciones diversas, recogiendo los puntos de vista de
las diferentes partes implicadas (audiencias).

«Campbell demuestra también la complementariedad inherente a los métodos


cualitativos y cuantitativos al describir cómo el conocimiento cuantitativo sólo
supera al cualitativo cuando se apoya en éste»

Nivel de significación (α):


Representa el valor que se toma como criterio respecto a lo improba-
ble que puede resultar un hecho bajo la hipótesis nula. Puede referir-
se también al valor exacto de p. Los valores más utilizados de alfa (α)
son: 0.05 y 0.01.

548
GLOSARIO

Observación
Actividad realizada para detectar y registrar información correspon-
diente a un hecho, del cual se toman datos.
Paradigma
Gage define a los paradigmas como «modelos, pautas o esquemas. Los
paradigmas no son teorías; son más bien maneras de pensar o pautas
para la investigación que, cuando se aplican, pueden conducir al des-
arrollo de la teoría».
Según Patton es «una visión del mundo, una perspectiva general, un
modo de desmenuzar la complejidad del mundo real (...) los paradigmas
les dicen lo que es importante, legítimo y razonable. Los paradigmas son
también normativos: señalan al profesional lo que ha de hacer sin nece-
sidad de prolongadas consideraciones existenciales o epistemológicas».
Paradigma cuantitativo, según Cook y Reichardt: «El conglomerado de
atributos que integran el paradigma cuantitativo procede de las ciencias
naturales y agronómicas, mientras que el paradigma cualitativo tuvo su
origen en los trabajos de antropología social y de sociología, sobre todo
de la Escuela de Chicago».
En las ciencias humanas nos enfrentamos a dos grandes paradigmas: el
positivista, cuantitativo, y el naturalista, interpretativo o cualitativo. Pero
hay quienes consideran que son tres, añadiendo a los dos anteriores un
tercero, denominado crítico. Si los dos primeros se diferencian en el
procedimiento, en la forma de construir el conocimiento, el paradigma
crítico lo hace en lo que se refiere a su finalidad: lo importante es que
el conocimiento haga posible la transformación de la sociedad -hacién-
dola más justa- y la emancipación y liberación del ser humano.
Parámetro
Entendemos por parámetro del valor de un determinado estadístico
no en la muestra en que se obtiene sino en el total de la población. Si
los estadísticos más comunes, como las medidas de posición y varia-
––
bilidad: (X ; mediana: Md; moda: Mo; desviación típica: s; varianza:
s2...) se suelen representar por letras latinas, los parámetros lo
hacen por letras griegas (µ = media; σ = desviación típica; σ2 =
varianza...)

549
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Población
Conjunto de todos los casos o elementos que cumplen con las carac-
terísticas que la definen: los varones, las mujeres, los estudiantes de
Farmacia, los políticos, los abogados...
En ciencias sociales no suele estar muy claramente definida. El inves-
tigador desea generalizar los datos de la muestra a la población.
En los estudios empíricos no suele ser posible —ni, en la mayoría de
los casos, aconsejable— estudiar todos los casos; se acude en su
lugar a muestras, que deben ser representativas del conjunto total o
población.
Por medio de la Estadística inferencial se pueden hacer estimaciones
––
de los parámetros a partir de las muestras (por ejemplo: desde X a µ).
Positivismo
El positivismo asume la unidad de la ciencia, la explicación científica
de carácter causal y la elaboración de leyes generales así como la uti-
lización de la metodología propia de las ciencias naturales, en con-
creto del método hipotético-deductivo-experimental.
La reacción frente al positivismo tiene en la Escuela de Frankfut de
filosofía crítica otro importante hito. Esta concepción filosófica
mantiene que, frente a las Ciencias Naturales, en que se da una dis-
tancia entre el investigador y el objeto de conocimiento, lo que per-
mite el conocimiento objetivo, en las Ciencias Sociales se produce
una interacción entre la realidad estudiada y el propio investigador,
que se acerca a ella con unas ideas y posicionamientos previos, con
una teoría. En estas condiciones, ni el planteamiento positivista ni
siquiera el post-positivista, resultarían aptos para captar el com-
portamiento humano; la alternativa propuesta es el interaccionismo
simbólico.
Potencia:
La potencia de una prueba estadística (la t de student, por ejemplo) es
la probabilidad que tiene de rechazar la hipótesis nula cuando ésta es
realmente falsa. La potencia varía en función de n, α y el tamaño del
efecto.

550
GLOSARIO

p: El valor de p indica la probabilidad teórica de obtener en una inves-


tigación un estadístico de contraste de hipótesis (t de student, por
ejemplo) igual o más grande que el valor empírico u observado que
hemos obtenido en nuestro estudio, cuando H0 es correcta. Dicho de
otro modo, si seleccionáramos cientos de muestras de la misma
población, es la probabilidad de obtener una diferencia de medias tan
grande o mayor que la que hemos obtenido en nuestro estudio cuan-
do en la población no ha diferencias entre dichas medias. Cuando esta
probabilidad es menor que α, el investigador puede decidir rechazar
la H0.
Problema
Punto de arranque de cualquier investigación científica.
Problema es cualquier situación para la que no se encuentra una solu-
ción satisfactoria, para la que no disponemos de una respuesta ade-
cuada.
Los problemas científicos requieren una teoría de fondo en que incar-
dinarlos; como la ciencia actúa con pretensiones de sistematización,
los problemas científicos suelen integrarse en un sistema problemáti-
co o «un conjunto parcialmente ordenado de problemas, esto es, una
secuencia ramificada de problemas dispuestos en orden de prioridad
lógica».
Asimismo se pide su formulación correcta y precisa, por lo general en
forma de preguntas.
Los problemas, según McGuigan, deben ser resolubles; dejarían de ser
científicos, por importantes y sugerentes que se presentaran, en caso
de no ser resolubles. «Un problema es resoluble si:
a) puede proponerse una hipótesis relevante como una tentativa de solu-
ción para el mismo; y
b) es posible comprobar dicha hipótesis determinando un grado de pro-
babilidad para ella»
Cabría añadir que los problemas deben ser relevantes, aunque este
concepto sea difícil de decidir teniendo en cuenta que las grandes
aportaciones científicas han estado en flagrante contradicción o, al
menos, en lucha abierta, con lo establecido hasta entonces.

551
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Procedimiento
El modo de ejecutar determinadas acciones en el proceso de la inves-
tigación, siempre de la misma o parecida manera, con una serie
común de pasos claramente definidos.
Rapport
Literalmente significa acompasar, y se refiere al procedimiento que
permite establecer una comunicación efectiva con los demás.
Región crítica
Es aquella parte de la distribución muestral formada por todos aque-
llos valores de un estadístico (como t, Z, F…) cuya probabilidad de
aparición asociada sea ≤ α. Es la región donde puede tomarse la deci-
sión de rechazar la hipótesis nula.
En las hipótesis unilaterales, tal región se concentra –según el enun-
ciado- en la parte superior o inferior de la distribución; en las bilate-
rales, se reparte entre los dos extremos de la misma.
Registro
Constatación de un hecho o un dato, para facilitar su estudio en el
proceso de investigación.
Replicación
La replicación o réplica de experimentos es una exigencia del
nivel de incertidumbre con el que se trabaja en la investigación
empírica.
Por otra parte, tal réplica contribuye a aumentar la credibilidad y
confianza en los resultados así como a facilitar la generalización de
los mismos, sin olvidar su contribución a la verificabilidad inter-
subjetiva.
Si no cabe esperar identidad de resultados, si es lógico que se dé cohe-
rencia en los mismos, reduciendo a la vez la probabilidad de que se
den por azar.
Los beneficios de la replicación aumentan cuando se lleva a cabo la
denominada replicación sistemática, según terminología de Sidman.

552
GLOSARIO

Significación estadística
Decimos que un resultado (una diferencia entre medias aritméticas,
por ejemplo) es estadísticamente significativo cuando su probabilidad
de aparición por azar es menor o igual que el nivel de significación, es
decir, es una diferencia tan grande que consideramos que no se debe
al azar, que en la población es distinta de cero.
Software
(Programas) Se refiere al conjunto de los componentes lógicos, nece-
sarios, que hacen posible la realización de tareas específicas.
Tamaño del efecto
Valor numérico que indica la relevancia práctica de las diferencias
encontradas, independientemente del tamaño muestral.
Técnica
Conjunto de reglas, normas o protocolos, que tienen como objetivo
obtener un resultado determinado.
Teoría
Sistema de pensamiento lógico-deductivo que, a partir de unas hipó-
tesis y siguiendo algunas reglas, nos permitan extraer consecuencias
generalizables.
Teoría sociocrítica
Así se califica la teoría que tiene como objetivo principal deter-
minar la manera en que la sociedad se presenta en la producción
textual.
Validez de los diseños
Los diseños pretenden, según Kerlinger, dar respuesta a las preguntas
en que se concreta el problema de la investigación y controlar la
varianza. Lograr estas metas es cuestión de validez.
La validez puede ser interna y externa. La primera trata de asegurar
que los efectos apreciados en la variable dependiente se deben a, y
sólo a, la variable independiente.

553
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Esta meta puede verse amenazada por un conjunto de factores.


Veamos:
Historia. Aquellos hechos que ocurren, además de la variable inde-
pendiente, entre el inicio de la investigación (introducción de la v.i.)
y la medida de la v.d., y que actúen diferencialmente sobre los grupos.
Maduración. Cambios madurativos ligados a la edad que pudieran
mezclar su efecto con el de la variable independiente. Los niños
cambian con mucha mayor rapidez que los adultos, tanto en esta-
tura como en peso, pero también en inteligencia o personalidad.
Administración de pruebas. Se trata del efecto que la aplicación de
pruebas a los sujetos pueda producir sobre la v.d. en paralelo al
atribuible a la v.i. Su aparición puede ser frecuente en los diseños
con pre-test, habituales en educación como alternativa al azar en la
asignación de sujetos.
Instrumentación. En este caso estamos ante el influjo que pueda
producirse en los resultados de la v.d. como consecuencia de los
cambios en lo relacionado con los instrumentos de medida, con
quienes los utilizan o con quienes puntúan o califican.
Regresión estadística. Tendencia existente en el caso de puntuacio-
nes extremas de «regresar» hacia la media del grupo. Cuando los
sujetos de la investigación se seleccionan a partir de las puntuacio-
nes más elevadas o más bajas, esa tendencia hará bajar las pun-
tuaciones en el primer caso o elevarlas en el segundo, y este efecto
podrá confundirse con el producido por la variable independiente.
Selección diferencial. Cuando la selección de los sujetos no se reali-
za por un procedimiento de azar, es probable que los grupos ten-
gan una composición inicial no comparable, con ventaja de uno
sobre otro. Este hecho puede dar lugar a diferencias finales que
oculten o aumenten las debidas al efecto de la v.i., mezclándose
con ellas e invalidando el diseño.
Mortalidad experimental. Con este concepto nos referimos a la pér-
dida de sujetos, algo que ocurre con más frecuencia cuando el
experimento tiene larga duración. Traslados familiares, enferme-
dades, etc. pueden hacer que grupos inicialmente equiparados

554
GLOSARIO

pierdan sujetos que, si no son equiparables en los dos grupos, den


lugar a resultados finales no atribuibles a la v.i., o solo a ella, sino
también a este hecho diferencial.
Interacción entre dos o más factores anteriores. La interacción es la
acción conjunta de dos o más factores. Así, puede actuar conjunta-
mente la maduración y la regresión, o la historia y la maduración…
dando lugar a efectos sobre la v.d. que bien pudieran confundirse
con los de la independiente.
La validez externa se refiere a la posibilidad de generalizar los resul-
tados alcanzados en la muestra a toda la población. Esta meta es
deseable en toda investigación, pero entra en conflicto con la validez
interna.
Los principales factores que limitan la validez externa tienen que ver
con la interacción entre factores, en ocasiones debida a los efectos
reactivos de otras variables. Veamos:
Efecto reactivo de las pruebas. Si una prueba previa o pretest puede
sensibilizar a los sujetos sobre un problema e influir en cómo lo
ven después de haberla realizado, la generalización de los resulta-
dos solo podría hacerse para sujetos que hayan experimentado
dicha prueba y no en general.
Interacción entre selección de sujetos y variable independiente. Si se
diera una selección sesgada de sujetos en variables relacionadas
con la dependiente, sus efectos podrían mezclarse con los de la
independiente y limitar la generalización de resultados a casos
similares.
Efectos reactivos de los dispositivos experimentales. Si la propia
investigación utiliza una serie de aparatos, artilugios, tecnologí-
as…que produzcan determinados efectos por su novedad, atrac-
ción, etc., puede que contribuyan a los resultados en la v.d. En tales
casos, obviamente, la generalización quedaría limitada a situacio-
nes similares.
Interferencias de los tratamientos múltiples. En determinados dise-
ños, buscando el control del efecto de los tratamientos, por ejem-
plo de los métodos, acudimos a aplicar todos los métodos a todos

555
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

los sujetos. El recuerdo de los tratamientos anteriores supone una


influencia que puede mezclarse con la de la v.i.
Variable
Frente a una constante, la variable es aquella realidad que admite
diversos valores, como la edad, la clase social, la inteligencia, el ren-
dimiento académico o diferentes dimensiones o factores de la perso-
nalidad.
Cuando una variable solo admite valores enteros la denominamos dis-
creta, tal como ocurre con el sexo; frente a ellas, las continuas, que
pueden tener todo tipo de valores intermedios, como ocurre con la
talla, el peso o la edad.
Las primeras pueden ser dicotómicas, si únicamente admiten dos
valores o politómicas, en el caso contrario; en el primer caso se ha
venido situando el sexo, mientras en el segundo podemos citar el esta-
do civil.
Desde la perspectiva de la investigación las variables suelen clasifi-
carse, en función del papel que desempeñan, en independientes, las
manipuladas por el investigador, y dependientes, aquellas sobre las
que se mide la influencia de las primeras; también podemos hablar de
variables extrañas, esto es, variables que pueden convertirse en rivales
de la hipótesis del investigador al influir sobre la dependiente junto a
la independiente o en lugar de ella.
En la investigación correlacional, donde la relación causal no se plan-
tea, es preferible utilizar los términos antecedente y consecuente, pre-
dictora y criterio, en lugar de independiente y dependiente.
Operativización de variables
En el marco de la investigación se entiende por tal el proceso por el
que el concepto en cuestión es definido por las acciones u operacio-
nes que deben llevarse a cabo para medirlo o manipularlo.
Verificabilidad intersubjetiva
Entre las características del conocimiento científico se encuentran las
de medición, control y verificabilidad intersubjetiva.

556
GLOSARIO

Por esta última se entiende la posibilidad de que los resultados alcan-


zados por un investigador puedan ser corroborados por otro u otros,
si bien no en el sentido de que tales resultados sean idénticos sino
coherentes.
A tal verificabilidad contribuye la definición operativa de las varia-
bles, al margen de que se dé o no acuerdo precisamente en tal defi-
nición.

557
BIBLIOGRAFÍA

AGAR. M. (1976). Themes revisited. Some problems in cognitive anthropology. Unpub-


lished paper. Houston (USA): Departament of Anthropology University of Hous-
ton.

ALONSO MIGUEL, P. (2005a). Calidad en investigación. «De qué trata la gestión de


calidad en la investigación» (1.ª parte). En mi+d Aula Abierta madrimasd.org/,
n.º 32. Octubre. Revista digital [En línea: febrero 2011] <http://www. revis-
ta/revista32/aula/aula1.asp>.

ALONSO MIGUEL, P. (2005b). Calidad en investigación. «Aproximación metodológica


a la mejora de las actividades de investigación» (2.ª parte). En mi+d Aula Abier-
ta madrimasd.org/, n.º 33 (diciembre, 2005). Revista Digital [En línea: febrero
2011] <http://www.madrimasd.org/revista/revista33/tribuna/tribuna3.asp>.

BALLESTEROS, B. y GARCÍA LLAMAS, J.L. (2010). U.D. III: Instrumentos de recogida de


información (pp., 263-338). En García Llamas, J.L., Métodos y técnicas de inves-
tigación en educación. Madrid UNED (no venal).

BARTOLOMÉ, M. (1992). Investigación cualitativa en educación: ¿comprender o


transformar? Revista de Investigación Educativa, 20(2), 7-36.

BAUSELA, E. (2005). NUD*IST: VVO, Programa informático para el análisis de datos


en investigaciones cualitativas. En Pixel-Bit. Revista de Medios de Educación.
Sevilla. N.º 25. Enero, pp. 53-59.

BOGDAN, R.C. y BIKLEN, S. (1982). Qualitative research for education. An introduc-


tion to theory and methods. Boston (USA): Allyn and Bacon.

BOTELLA, J.; LEÓN, G. O. y SAN MARTÍN, R. (1993). Análisis de datos en Psicología I.


Madrid, Pirámide.

BUENDÍA, L. – COLÁS, P. y HERNÁNDEZ, F. (1998). Métodos de investigación en psico-


pedagogía. Madrid: McGraw-Hill.

BUNGE, M. (1979). La investigación científica. Barcelona: Ariel.

559
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

CANALES, M. y PEINADO, A. (1994). Grupos de discusión, en Métodos y Técnicas Cua-


litativas de Investigación en Ciencias Sociales. Editorial Síntesis S.A. Madrid,
España.

COCHRAN, W.G. y COX, G.M. (1980). Diseños experimentales. México: Trillas

COFFEY, A. y ATKINSON, P. (2005). Encontrar el sentido a los datos cualitativos:


estrategias complementarias de investigación. Alicante: Servicio de Publica-
ciones de la Universidad de Alicante.

COLÁS, P. (1992). Evaluación de Programas: Modelos y Enfoques Metodológicos.


Cuestiones Pedagógicas. Revista de Ciencias de la Educación. Núm 162, octu-
bre-diciembre, pp. 411-427.

COLÁS, P. (1998). Métodos y técnicas cualitativas de investigación en psicopedagogía.


En Buendía, L – Colás, P. y Hernández, F. Métodos de investigación en psicope-
dagogía. Madrid: McGraw-Hill. Cap. 8, pp. 251-286.

COLÁS, P. (1998). El análisis cualitativo de datos. En L. BUENDÍA, P. COLÁS, y P. HER-


NÁNDEZ. Métodos de investigación en psicopedagogía. Madrid: McGraw-Hill.
Cap. 9, pp. 288-312.

CORBETTA, P. (2007). Metodología y técnicas de investigación social. Madrid:


McGraw-Hill.

CORBETTA, P. (2010). Metodología y técnicas de investigación social. Madrid: Mac-


Graw- Hill.

CRESWELL, J. W. (2008). Educational research: planning, conducting, and evaluating


quantitative and qualitative research. Upper Saddle River, N.J.: Pearson/Merrill
Prentice Hall.

CRESWELL, John W. (2009). Research design: qualitative, quantitative, and mixed


methods approaches. Thousand Oaks, Calif.: Sage Publications. 3rd ed.

DEL RINCÓN, D.; ARNAL, J.; LATORRE, A. y SANS, A. (1995). Técnicas de investigación
en Ciencias Sociales. Madrid: Dykinson.

DENZIN, N.K. y LINCOLN, Y. S. (2000). Introduction. The discipline and practice of


qualitative research. En N. K. Denzin e Y. S. Lincoln (Eds.), Handbook of qual-
itative research (pp.1-28). Londres: Sage.

EISNER, ELLIOT W. (1991). The enlightened eye: qualitative inquiry and the enhance-
ment of educational practice. New York: Macmillan Publishers.

560
BIBLIOGRAFÍA

ERICKSON, F. (1986). Qualitative methods in research on teaching. In M. C. Wittrock


(Ed.), Handbook of Research on Teaching; Third Edition. New York USA): Mac-
millan.

FERGUSON, G.A. (1981). Statiscical Análisis in Psychology and Education (Fifth edi-
tion) New York: McGraw Hill

FERNÁNDEZ BALLESTERIOS, R. (Coord.) (1996). Evaluación de Programas. Madrid,


Síntesis.

FESTINGER, L. y KATZ, D. (Comp.) (1992). Los métodos de investigación en las cien-


cias sociales. Barcelona: Paidós.

FLICK, U. (2004). Introducción a la investigación cualitativa. Madrid: Morata.

FOX, D. J. (1981). El proceso de investigación en educación. Pamplona: EUNSA.

GARCÍA LLAMAS, J. L. (2010). Métodos y técnicas de investigación en educación.


Madrid UNED (no venal).

GARCIA LLAMAS, J. L. y otros (2003). Introducción a la investigación en educación.


Madrid: UNED

GARCÍA LLAMAS, J. L.; PÉREZ JUSTE, R. y RIO SADORNIL, D. del (2006). Problemas y dise-
ños de investigación resueltos. Madrid: Dykinson (3.ª edición, ampliada y revisada).

GEE, J.P.; MICHAELS, S. y O’CONNOR, M.C. (1992). Discourse analysis. En M.D.


LeCompte & J.Preissle (Eds.). The hzndbook of qualitative research ineduca-
tion (pp. 228-291). San Diego: Academic Press.

GEPHART, W. (1969). The eight general research methodologies: A facet analysis of the
research process. Center on Evaluation Development and Research: Phi Delta
Kappa Occasional Paper. En Tesch, R. (1990). Qualitative research. Analysis
types and software tools. New York: The Falmer Press, p. 52.

GIL, J. y PERERA, V. (2001). Análisis informatizado de datos cualitativos. Sevilla: Kronos.

GLASER, B.G. y STRAUSS, A.L. (1967). The Discovery of Grounded Theory: Strategies
for Qualitative Research. Chicago (USA): Aldine.

GLESNE, C. Y PESHKIN, A. (1992). Becoming qualitative researchers. An introduction.


New York (USA): Longman.

GOETZ, C.D. y LeCOMPTE, M. (1984). Etnography and qualitative desing in educa-


tional research. Orlando (Florida): Academic Press Inc.

561
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

GREEN, J. L. (1983). Teaching and learning: A linguistic perspective. En Elementary


School Journal, n.º 83, 4, 353-391.
GUBA, E. G. y LINCOLN, Y. S. (1981) Effective evaluation: Improving the uselfulness
of evaluation results through responsive and naturalistic approaches. San Fran-
cisco, CA (USA): Jossey Bass.

GUNTER, H.; FERNÁNDEZ, G.I. y LORENZO, O. (2001). Análisis de datos cualitativos con
AQUAD. Granada: Grupo Editorial Universitario.

GUTIÉRREZ, L. y SANTANA, D. (2001). La Investigación Etnográfica. Experiencia de su


aplicación en el ámbito Educativo. [En línea: marzo 2011] <http://redes-cepal-
cala.org/inspector/DOCUMENTOS%20Y%20LIBROS/INVESTIGACION/I-
NVESTIG-ETNOGR.htm>.
HUBER, G. L. (2001). AQUAD cinco: manual del programa para analizar datos cuali-
tativos. V.5. Berlín: Verlag Ingeborg Huber.
IBAÑEZ, J. (1985). Análisis sociológico de textos o discursos. En Revista Internacio-
nal de Sociología, nº 43, 1, pp. 119-160.

JACOB, E. (1988). Clarifying Qualitative Research. A focus on Traditions. En Educa-


tional Researcher, january-february.
JANESICK, V. (1994). The dance Qualitative Research Design. En Denzin, N.K. & Lin-
coln, Y.S. (Eds.), Handbook of qualitative research. London: Sage Publication
(pp. 209-219).
JOHNSON, B.; CHRISTENSEN, L. B. Educational Research (2008). Quantitative, Qualita-
tive, and Mixed Approaches. Los Ángeles: Sage Publications.

KERLINGER, F. N. (1975). Investigación del comportamiento. México: Nueva Edito-


rial Iberoamericana.

LATORRE, A. – DEL RINCÓN, D. y ARNAL, J. (1996). Bases metodológicas de la investi-


gación educativa. Barcelona: GR92.
LINCOLN, Y. S. y GUBA, E. (1984). Naturalistic inquiry. California (USA): Sage Publi-
cations.

LÓPEZ GONZÁLEZ, E. (2003). Las pruebas de significación: una polémica abierta.


Bordón, 55 (2).

LÓPEZ, O. (2008). Tutorial AQUAD v.6 A. Versión on line [Disponible: junio’2011]


<http://www.slideshare.net/guest549104/tutorial-aquad-v-6-presentation>.

562
BIBLIOGRAFÍA

MALINOWSKI, B. (1986). Introducción: objeto, método y finalidad de la investigación.


En B. Malinowski, Los argonautas del Pacífico Occidental. Un estudio sobre
comercio y aventura entre los indígenas de los archipiélagos de la Nueva Gui-
nea melanésica (pp. 19-42). Barcelona: Ediciones Península.
MARTÍN MARTÍN, Q. (2001): Contraste de hipótesis. Madrid: La Muralla.

MAXWELL, J.A. (1996). Qualitative research design. An Interactive Approach. En Qua-


litative research design (vol. 41, pp. 14-24). California: Sage Publications.
MCMILLAN, JAMES H. y SCHUMACHER, S. (2005). Investigación educativa. Madrid:
Pearson Educación.
MILES, M.B. y HUBERMAN, A. (1994). Qualitative data analysis: an expanded source-
book. Newbury Park, CA: Sage.

MONTERO (1984). La investigación cualitativa en el campo educativo. La Educación


(96), 19-31.
MORALES, P. (2008). Estadística aplicada a las Ciencias Sociales. Contraste de medias. Uni-
versidad Pontificia Comillas, Madrid. [http://www.upcomillas.es/personal/peter/]

MUÑOZ, J. (2001). Análisis cualitativo de datos textuales con ATLAS/ti. Versión on line
[Disponible: junio’2011] <http://antalya.uab.es-/jmunoz/Cuali/ManualAtlas.pdf>

MURH, T. (1997). Atlas.ti- Visual Qualitative data analysis-Management-Model Build-


ing-Release 4.1. Berlín, Short User´s Manual.

PÉREZ JUSTE, R. (1985). Estadística descriptiva. Madrid: UNED.


PÉREZ JUSTE, R. (1994). Investigación evaluativa. En V. García Hoz (Dir.), Problemas
y métodos de Educación Personalizada (pp. 404-418). Madrid: Rialp.
PÉREZ JUSTE, R. (coord.). Evaluación de Programas educativos. En Revista de Inves-
tigación Educativa, monográfico. 2000, vol. 18, 2.

PEREZ JUSTE, R. (2005). Evaluación de Programas educativos. Madrid: La Muralla.

PÉREZ JUSTE, R. (2011). Métodos cualitativos en la investigación en Educación a Dis-


tancia, tema 62. UNED (Edición no venal).
PÉREZ, R; GARCÍA, J. L.; GIL, J. A. y GALÁN, A. (2009). Estadística aplicada a la Edu-
cación. Madrid: Pearson Prentice Hall.
PÉREZ SERRANO, G. (1994). Investigación cualitativa. Retos e interrogantes (2 tomos).
Madrid: La Muralla.

563
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

P ORTA , L. y S ILVA , M. (2003). La investigación cualitativa: El Análisis de Con-


tenido en la investigación educativa. [En línea: junio’2011]
<http://www.uccor.edu.ar/paginas/REDUC/porta.pdf>

R EVUELTA , F. I. y S ÁNCHEZ , M. C. (2003). Programas de análisis cualitativo para


la investigación en espacios virtuales de formación. Universidad de Sala-
manca. [En línea: junio’2011] <http://campus.usal.es-/~teoriaeduca-
cion/rev_numero_04/n4_art_revuelta_sanchez.htm>.

RICHARDS, L. (1999). Using Nvivo in Qualitative Research. London. Sage.

RICHARDS, L. (2002). Introducing N6 a workshop handbook. QSR International.


[Disponible: junio’2011] <http://www.qsrinternational.com>.

RÍO SADORNIL, D. del (2005). Diccionario-glosario de metodología de la investigación


social. Madrid: UNED.

RODRÍGUEZ, G.; GIL, J. y GARCÍA, E. (1996). Metodología de la investigación cualitati-


va. Málaga: Aljibe.

RODRÍGUEZ, G. y otros (1995). Análisis de datos cualitativos asistido por ordenador:


AQUAD y NUDIST. Barcelona: EUB/PPU EDITORIAL.

RODRÍGUEZ, S. (2008). Investigación educativa: análisis de datos cuantitativos y cua-


litativos en la metodología de encuesta. Granada: Grupo Editorial Universitario.

ROSSMAN, G. B. y RALLIS, S. F. (1998). Learning in the field. An introduction to qual-


itative research. Londres: Sage.

RUIZ OLABÉNAGA, J. I. E ISPIZUA, M. A. (1989). La descodificación de la vida cotidia-


na. Métodos de investigación cualitativa. Bilbao: Universidad de Deusto.

SALKIND, Neil J. (2007). Statistics for people who (think They) hate statistics. Sage.
California.

SANDÍN, M. P. (2003). Investigación cualitativa en Educación. Madrid: McGraw-Hill.

SANDIN, M. P. (2010). Investigación cualitativa en educación: fundamentos y tradi-


ciones. Madrid: McGraw-Hill.

SHULMAN, L. S. (1989). Paradigmas y programas de investigación en el estudio de la


enseñanza: una perspectiva contemporánea. En M.C. WITTROCK (Edit): La inves-
tigación de la enseñanza. I: Enfoques, teorías y métodos, pp. 9-94.

SNEDECOR, G. W. y COCHRAN, W. G. Métodos Estadísticos. México: CECSA.

564
BIBLIOGRAFÍA

SPRADLEY, J. P. (1979). The ethnographic interview. New York: Holt, Rinehart and
Winston.

STRAUSS, A. y CORBIN, J. (1990). Basics of qualitative research. Grounded theory pro-


cedures and techniques. Califormia: Sage Publications.
TAYLOR, S. J. y BOGDAN, R. (1986). Introducción a los métodos cualitativos de inves-
tigación. México: Paidós.

TEJEDOR, F. J. (1999): Análisis de varianza. Madrid: La Muralla.

TESCH, R. (1990). Qualitative research. Analysis types and software tools. New York
(USA): The Falmer Press.
TÓJAR, J. C. (2006). Investigación cualitativa. Comprender y actuar. Madrid: La Muralla.
TROCHIM, W. M. K. (2009). Research Methods Knowledge Base. [http://www.social-
researchmethods.net/kb/contents.php].

TROCHIM, W. M. K.; DONNELLY, J. P. (2009). Research methods knowledge Base, 3e.


Cengage Learning, Mason, USA.

VASILACHIS, I. (2009). Ontological and epistemological foundations of qualitative


research. En Forum Qualitative Sozialforschung / Forum: Qualitative Social
Research , 10(2)
VV.AA. (2001). MAXqda 2001: Introducción. Berlín. [Disponible: junio’2011]
<http://www.maxqda.com/maxqda-spa/download/mxintro.pdf>
VV.AA. (2010). Decision Explorer. Manual de uso. [Disponible: junio’2011]
<http://www.banxia.com/pdf/de/DEbrochure.pdf>.
WAGNER, R. M. (2008). Applied statistics: from bivariate through multivariate tech-
niques. Sage. California.

WEIS, C.H. (1991). Investigación evaluativa. México: Trillas.


WOLCOTT, HARRY F. (1994). Transforming Qualitative Data: Description, Analysis,
and Interpretation. Oregon (USA): Sage.
WOLCOTT, HF. (1992). Posturing in qualitative inquiry. En MD LeCompte, WL Mill-
roy & J Preissle (Eds.) The Handbook of Qualitative Research in Education (pp.
3-52). New York: Academic Press.
WOODS, P. (1987). La escuela por dentro. La etnografía en la investigación educativa.
Barcelona: Paidós-MEC.

565
ANEXO
TABLAS ESTADÍSTICAS
ANEXO. TABLAS ESTADÍSTICAS

Tabla I. Areas y ordenadas de la curva de distribución normal en función χ/σ

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada
χ
tipificada —
σ( ) χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
0.00 .0000 .5000 .5000 .3989
0.01 .0040 .5040 .4960 .3989
0.02 .0080 .5080 .4920 .3989
0.03 .0120 .5120 .4880 .3988
0.04 .0160 .5160 .4840 .3986
0.05 .0199 .5199 .4801 .3984
0.06 .0239 .5239 .4761 .3982
0.07 .0279 .5279 .4721 .3980
0.08 .0319 .5319 .4681 .3977
0.09 .0359 .5359 .4641 .3973
0.10 .0398 .5398 .4602 .3970
0.11 .0438 .5438 .4562 .3965
0.12 .0478 .5478 .4522 .3961
0.13 .0517 .5517 .4483 .3956
0.14 .0557 .5557 .4443 .3951
0.15 .0596 .5596 .4404 .3945
0.16 .0636 .5636 .4364 .3939
0.17 .0675 .5675 .4325 .3932
0.18 .0714 .5714 .4286 .3925
0.19 .0753 .5753 .4247 .3918
0.20 .0793 .5793 .4207 .3910
0.21 .0832 .5832 .4168 .3902
0.22 .0871 .5871 .4129 .3894
0.23 .0910 .5910 .4090 .3885
0.24 .0948 .5948 .4052 .3876
0.25 .0987 .5987 .4013 .3867
0.26 .1026 .6026 .3974 .3857
0.27 .1064 .6064 .3936 .3847
0.28 .1103 .6103 .3897 .3836
0.29 .1141 .6141 .3859 .3825
0.30 .1179 .6179 .3821 .3814
0.31 .1217 .6217 .3783 .3802
0.32 .1255 .6255 .3745 .3790
0.33 .1293 .6293 .3707 .3778
0.34 .1331 .6331 .3669 .3765
0.35 .1368 .6368 .3632 .3752
0.36 .1406 .6406 .3594 .3739
0.37 .1443 .6443 .3557 .3725
0.38 .1480 .6480 .3520 .3712
0.39 .1517 .6517 .3483 .3697
Tomada del Formulario y tablas de Pedagogía Experimental. UNED. 1983, p. 119-126 (ambas
inclusive).

569
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
0.40 .1554 .6554 .3446 .3683
0.41 .1591 .6591 .3409 .3668
0.42 .1628 .6628 .3372 .3653
0.43 .1664 .6664 .3336 .3637
0.44 .1700 .6700 .3300 .3621
0.45 .1736 .6736 .3264 .3605
0.46 .1772 .6772 .3228 .3589
0.47 .1808 .6808 .3192 .3572
0.48 .1844 .6844 .3156 .3555
0.49 .1879 .6879 .3121 .3538
0.50 .1915 .6915 .3085 .3521
0.51 .1950 .6950 .3050 .3503
0.52 .1985 .6985 .3015 .3485
0.53 .2019 .7019 .2981 .3467
0.54 .2054 .7054 .2946 .3448
0.55 .2088 .7088 .2912 .3429
0.56 .2123 .7123 .2877 .3410
0.57 .2157 7157 2843 .3391
0.58 .2190 .7190 .2810 .3372
0.59 .2224 .7224 .2776 .3352
0.60 .2257 .7257 .2743 .3332
0.61 .2291 .7291 .2709 .3312
0.62 .2324 .7324 .2676 .3292
0.63 .2357 .7357 .2643 .3271
0.64 .2389 .7389 .2611 .3251
0.65 .2422 .7422 .2578 .3230
0.66 .2454 .7454 .2546 .3209
0.67 .2486 .7486 .2514 .3187
0.68 .2517 .7517 .2483 .3166
0.69 .2549 .7549 .2451 .3144
0.70 .2580 .7580 .2420 .3123
0.71 .2611 .7611 .2389 .3101
0.72 .2642 .7642 .2358 .3079
0.73 .2673 .7673 .2327 .3056
0.74 .2704 .7704 .2296 .3034
0.75 .2734 .7734 .2266 .3011
0.76 .2764 .7764 .2236 .2989
0.77 .2794 .7794 .2206 .2966
0.78 .2823 .7823 .2177 .2943
0.79 .2852 .7852 .2148 .2920

570
ANEXO. TABLAS ESTADÍSTICAS

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
0.80 .2881 .7881 .2119 .2897
0.81 .2910 .7910 .2090 .2874
0.82 .2939 .7939 .2061 .2850
0.83 .2967 .7967 .2033 .2827
0.84 .2995 .7995 .2005 .2803
0.85 .3023 .8023 .1977 .2780
0.86 .3051 .8051 .1949 .2756
0.87 .3078 .8078 .1922 .2732
0.88 .3106 .8106 .1894 .2709
0.89 .3133 .8133 .1867 .2685
0.90 .3159 .8159 .1841 .2661
0.91 .3186 .8186 .1814 .2637
0.92 .3212 .8212 .1788 .2613
0.93 .3238 .8238 .1762 .2589
0.94 .3264 .8264 .1736 .2565
0.95 .3289 .8289 .1711 .2541
0.96 .3315 .8315 .1685 .2516
0.97 .3340 .8340 .1660 .2492
0.98 .3365 .8365 .1635 .2468
0.99 .3389 .8389 .1611 .2444
1.00 .3413 .8413 .1587 .2420
1.01 .3438 .8438 .1562 .2396
1.02 .3461 .8461 .1539 .2371
1.03 .3485 .8485 .1515 .2347
1.04 .3508 .8508 .1492 .2323
1.05 .3531 .8531 .1469 .2299
1.06 .3554 .8554 .1446 .2275
1.07 .3577 .8577 .1423 .2251
1.08 .3599 .8599 .1401 .2227
1.09 .3621 .8621 .1379 .2203
1.10 .3643 .8643 .1357 .2179
1.11 .3665 .8665 .1335 .2155
1.12 .3686 .8686 .1314 .2131
1.13 .3708 .8708 .1292 .2107
1.14 .3729 .8729 .1271 .2083
1.15 .3749 .8749 .1251 .2059
1.16 .3770 .8770 .1230 .2036
1.17 .3790 .8790 .1210 .2012
1.18 .3810 .8810 .1190 .1989
1.19 .3830 .8830 .1170 .1965

571
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
1.20 .3849 .8849 .1151 .1942
1.21 .3869 .8869 .1131 .1919
1.22 .3888 .8888 .1112 .1895
1.23 .3907 .8907 .1093 .1872
1.24 .3925 .8925 .1075 .1849
1.25 .3944 .8944 .1056 .1826
1.26 .3962 .8962 .1038 .1804
1.27 .3980 .8980 .1020 .1781
1.28 .3997 .8997 .1003 .1758
1.29 .4015 .9015 .0985 .1736
1.30 .4032 .9032 .0968 .1714
1.31 .4049 .9049 .0951 .1691
1.32 .4066 .9066 .0934 .1669
1.33 .4082 .9082 .0918 .1647
1.34 .4099 .9099 .0901 .1626
1.35 .4115 .9115 .0885 .1604
1.36 .4131 .9131 .0869 .1582
1.37 .4147 .9147 .0853 .1561
1.38 .4162 .9162 .0838 .1539
1.39 .4177 .9177 .0823 .1518
1.40 .4192 .9192 .0808 .1497
1.41 .4207 .9207 .0793 .1476
1.42 .4222 .9222 .0778 .1456
1.43 .4236 .9236 .0764 .1435
1.44 .4251 .9251 .0749 .1415
1.45 .4265 .9265 .0735 .1394
1.46 .4279 .9279 .0721 .1374
1.47 .4292 .9292 .0708 .1354
1.48 .4306 .9306 .0694 .1334
1.49 .4319 .9319 .0681 .1315
1.50 .4332 .9332 .0668 .1295
1.51 .4345 .9345 .0655 .1276
1.52 .4357 .9357 .0643 .1257
1.53 .4370 9370 .0630 .1238
1.54 .4382 .9382 .0618 .1219
1.55 .4394 .9394 .0606 .1200
1.56 .4406 .9406 .0594 .1182
1.57 .4418 .9418 .0582 .1163
1.58 .4429 .9429 .0571 .1145
1.59 .4441 .9441 .0559 .1127

572
ANEXO. TABLAS ESTADÍSTICAS

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
1.60 .4452 .9452 .0548 .1109
1.61 .4463 .9463 .0537 .1092
1.62 .4474 .9474 .0526 .1074
1.63 .4484 .9484 .0516 .1057
1.64 .4495 .9495 .0505 .1040
1.65 .4505 .9505 .0495 .1023
1.66 .4515 .9515 .0485 .1006
1.67 .4525 .9525 .0475 .0989
1.68 .4535 .9535 .0465 .0973
1.69 .4545 .9545 .0455 .0957
1.70 .4554 .9554 .0446 .0940
1.71 .4564 .9564 .0436 .0925
1.72 .4573 .9573 .0427 .0909
1.73 .4582 .9582 .0418 .0893
1.74 .4591 .9591 .0409 .0878
1.75 .4599 .9599 .0401 .0863
1.76 .4608 .9608 .0392 .0848
1.77 .4616 .9616 .0384 .0833
1.78 .4625 .9625 .0375 .0818
1.79 .4633 .9633 .0367 .0804
1.80 .4641 .9641 .0359 .0790
1.81 .4649 .9649 .0351 .0775
1.82 .4656 .9656 .0344 .0761
1.83 .4664 .9664 .0336 .0748
1.84 .4671 .9671 .0329 .0734
1.85 .4648 .9678 .0322 .0721
1.86 .4686 .9686 .0314 .0707
1.87 .4693 .9693 .0307 .0694
1.88 .4699 .9699 .0301 .0681
1.89 .4706 .9706 .0294 .0669
1.90 .4713 .9713 .0287 .0656
1.91 .4719 .9719 .0281 .0644
1.92 .4726 .9726 .0274 .0632
1.93 .4732 .9732 .0268 .0620
1.94 .4738 .9738 .0262 .0608
1.95 .4744 .9744 .0256 .0596
1.96 .4750 .9750 .0250 .0584
1.97 .4756 .9756 .0244 .0573
1.98 .4761 .9761 .0239 .0562
1.99 .4767 .9767 .0233 .0551

573
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
2.00 .4772 .9772 .0228 .0540
2.01 .4778 .9778 .0222 .0529
2.02 .4783 .9783 .0217 .0519
2.03 .4788 .9788 .0212 .0508
2.04 .4793 .9793 .0207 .0498
2.05 .4798 .9798 .0202 .0488
2.06 .4803 .9803 .0197 .0478
2.07 .4808 .9808 .0192 .0468
2.08 .4812 .9812 .0188 .0459
2.09 .4817 .9817 .0183 .0449
2.10 .4821 .9821 .0179 .0440
2.11 .4826 .9826 .0174 .0431
2.12 .4830 .9830 .0170 .0422
2.13 .4834 .9834 .0166 .0413
2.14 .4838 .9838 .0162 .0404
2.15 .4842 .9842 .0158 .0396
2.16 .4846 .9846 .0154 .0387
2.17 .4850 .9850 .0150 .0379
2.18 .4854 .9854 .0146 .0371
2.19 .4857 .9857 .0143 .0363
2.20 .4861 .9861 .0139 .0355
2.21 .4864 .9864 .0136 .0347
2.22 .4868 .9868 .0132 .0339
2.23 .4871 .9871 .0129 .0332
2.24 .4875 .9875 .0125 .0325
2.25 .4878 .9878 .0122 .0317
2.26 .4881 .9881 .0119 .0310
2.27 .4884 .9884 .0116 .0303
2.28 .4887 .9887 .0113 .0297
2.29 .4890 .9890 .0110 .0290
2.30 .4893 .9893 .0107 .0283
2.31 .4896 .9896 .0104 .0277
2.32 .4898 .9898 .0102 .0270
2.33 .4901 .9901 .0099 .0264
2.34 .4904 .9904 .0096 .0258
2.35 .4906 .9906 .0094 .0252
2.36 .4909 .9909 .0091 .0246
2.37 .4911 .9911 .0089 .0241
2.38 .4913 .9913 .0087 .0235
2.39 .4916 .9916 .0084 .0229

574
ANEXO. TABLAS ESTADÍSTICAS

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
2.40 .4918 .9918 .0082 .0224
2.41 .4920 .9920 .0080 .0219
2.42 .4922 .9922 .0078 .0213
2.43 .4925 .9925 .0075 .0208
2.44 .4927 .9927 .0073 .0203
2.45 .4929 .9929 .0071 .0198
2.46 .4931 .9931 .0069 .0194
2.47 .4932 .9932 .0068 .0189
2.48 .4934 .9934 .0066 .0184
2.49 .4936 .9936 .0064 .0180
2.50 .4938 .9938 .0062 .0175
2.51 .4940 .9940 .0060 .0171
2.52 .4941 .9941 .0059 .0167
2.53 .4943 .9943 .0057 .0163
2.54 .4945 .9945 .0035 .0158
2.55 .4946 .9946 .0054 .0154
2.56 .4948 .9948 .0052 .0151
2.57 .4949 .9949 .0051 .0147
2.58 .4951 .9951 .0049 .0143
2.59 .4952 .9952 .0048 .0139
2.60 .4953 .9953 .0047 .0136
2.61 .4955 .9955 .0045 .0132
2.62 .4956 .9956 .0044 .0129
2.63 .4957 .9957 .0043 .0126
2.64 .4959 .9959 .0041 .0122
2.65 .4960 .9960 .0040 .0119
2.66 .4961 .9961 .0039 .0116
2.67 .4962 .9962 .0038 .0113
2.68 .4963 .9963 .0037 .0110
2.69 .4964 .9964 .0036 .0107
2.70 .4965 .9965 .0035 .0104
2.71 .4966 .9966 .0034 .0101
2.72 .4967 .9967 .0033 .0099
2.73 .4968 .9968 .0032 .0096
2.74 .4969 .9969 .0031 .0093
2.75 .4970 .9970 .0030 .0091
2.76 .4971 .9971 .0029 .0088
2.77 .4972 .9972 .0028 .0086
2.78 .4973 .9973 .0027 .0084
2.79 .4974 .9974 .0026 .0081

575
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
2.80 .4974 .9974 .0026 .0079
2.81 .4975 .9975 .0025 .0077
2.82 .4976 .9976 .0024 .0075
2.83 .4977 .9977 .0023 .0073
2.84 .4977 .9977 .0023 .0071
2.85 .4978 .9978 .0022 .0069
2.86 .4979 .9979 .0021 .0067
2.87 .4979 .9979 .0021 .0065
2.88 .4980 .9980 .0020 .0063
2.89 .4981 .9981 .0019 .0061
2.90 .4981 .9981 .0019 .0060
2.91 .4982 .9982 .0018 .0058
2.92 .4982 .9982 .0018 .0056
2.93 .4983 .9983 .0017 .0055
2.94 .4984 .9984 .0016 .0053
2.95 .4984 .9984 .0016 .0051
2.96 .4985 .9985 .0015 .0050
2.97 .4985 .9985 .0015 .0048
2.98 .4986 .9986 .0014 .0047
2.99 .4986 .9986 .0014 .0046
3.00 .4987 .9987 .0013 .0044
3.01 .4987 .9987 .0013 .0043
3.02 .4987 .9987 .0013 .0042
3.03 .4988 .9988 .0012 .0040
3.04 .4988 .9988 .0012 .0039
3.05 .4989 .9989 .0011 .0038
3.06 .4989 .9989 .0011 .0037
3.07 .4989 .9989 .0011 .0036
3.08 .4990 .9990 .0010 .0035
3.09 .4990 .9990 .0010 .0034
3.10 .4990 .9990 .0010 .0033
3.11 .4991 .9991 .0009 .0032
3.12 .4991 .9991 .0009 .0031
3.13 .4991 .9991 .0009 .0030
3.14 .4992 .9992 .0008 .0029
3.15 .4992 .9992 .0008 .0028
3.16 .4992 .9992 .0008 .0027
3.17 .4992 .9992 .0008 .0026
3.18 .4993 .9993 .0007 .0025
3.19 .4993 .9993 .0007 .0025

576
ANEXO. TABLAS ESTADÍSTICAS

Tabla I (continuación)

(1) (2) (3) (4) (5)


z A B C y
Puntuación Area desde Area de Area de Ordenada

( )
χ
tipificada —
σ
χ
la media a —
σ
la parte
mayor
la parte
menor
en —
χ
σ
3.20 .4993 .9993 .0007 .0024
3.21 .4993 .9993 .0007 .0023
3.22 .4994 .9994 .0006 .0022
3.23 .4994 .9994 .0006 .0022
3.24 .4994 .9994 .0006 .0021
3.30 .4995 .9995 .0005 .0017
3.40 .4997 .9997 .0003 .0012
3.50 .4998 .9998 .0002 .0009
3.60 .4998 .9998 .0002 .0006
3.70 .4999 .9999 .0001 .0004

Tomada de DOWNIE, N. M. y HEATH, R. W.: Métodos Estadísticos Aplicados. Ed. del Castub,
Madrid, 1979. pp. 320-327.

577
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla IV.- Tabla de valores criticos de t*

Nivel de significación para prueba de una cola


.10 .05 .025 .01 .005 .0005
gl
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2920 4.303 6.965 9.925 31.598
3 1.638 2.353 3.182 4.541 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
10 1.372 1.812 2.228 2.764 3.169 4.587
11 1.363 1.796 2.201 2.718 3.106 4.437
12 1.356 1.782 2.179 2.681 3.055 4.318
13 1.350 1.771 2.160 2.650 3.012 4.221
14 1.345 1.761 2.145 2.624 2.977 4.140
15 1.341 1.753 2.131 2.602 2.947 4.073
16 1.337 1.746 2.120 2.583 2.921 4.015
17 1.333 1.740 2.110 2.567 2.898 3.965
18 1.330 1.734 2.101 2.552 2.878 3.922
19 1.328 1.729 2.093 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.850
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460
120 1.289 1.658 1.980 2.358 2.617 3.373
∞ 1.282 1.645 1.960 2.326 2.576 3.291

Tomada de SIEGEL., S.: Estadística no paramétrica, México. Trillas, 1980, p. 282.

578
Tabla V.- Percentiles de distribuciones chi-cuadrado*
Percentil
gl 1 2 5 10 20 30 50 70 80 90 95 98 99 99.9
1 .0002 .0006 .00393 .0158 .0642 .148 .455 1.074 1.642 2.706 3.841 5.412 6.635 10.827
2 .0201 .0404 .103 .211 .446 .713 1.386 2.408 3.219 4.605 5.991 7.824 9.210 13.815
3 .115 .185 .352 .584 1.005 1.424 2.366 3.665 4.642 6.251 1.815 9.837 11.341 16.268
4 .297 .429 .711 1.064 1.649 2.195 3.357 4.878 5.989 7.779 9.488 11.668 13.277 18.465
5 .554 .752 1.145 1.610 2.343 3.000 4.351 6.064 7.289 9.236 11.070 13.388 15.086 20.517
6 .872 1.134 1.635 2.204 3.070 3.828 5.348 7.231 8.558 10.645 12.592 15.033 16.812 22.457
7 1.239 1.564 2.167 2.833 3.822 4.671 6.346 8.383 9.803 12.017 14.067 16.622 18.475 24.322
8 1.646 2.032 2.733 3.490 4.594 5.527 7.344 9.524 11.030 3.362 15.507 18.168 20.090 26.125
9 2.088 2.532 3.325 4.168 5.380 6.393 8.343 10.656 12.242 14.684 16.919 19.679 21.666 27.877
10 2.558 3.059 3.940 4.865 6.179 7.267 9.342 11.781 13.442 15.987 18.307 21.161 23.209 29.588
11 3.053 3.609 4.575 5.578 6.989 8.148 10.341 12.899 14.631 17.275 19.675 22.618 24.725 31.264
12 3.571 4.178 5.226 6.304 7.807 9.034 11.340 14.011 15.812 18.549 21.026 24.054 26.217 32.909
13 4.107 4.765 5.892 7.042 8.634 9.926 12.340 15.119 16.985 19.812 22.362 25.472 27.688 34.528
14 4.660 5.368 6.571 7.790 9.467 10.821 13.339 16.222 18.151 21.064 23.685 26.873 29.141 36.123
15 5.229 5.985 7.261 8.547 10.307 11.721 14.339 17.322 19.311 22.307 24.996 28.239 30.578 37.697
16 5.812 6.614 7.962 9.312 11.152 12.624 15.338 18.418 20.465 23.542 26.296 29.633 32.000 39.252
17 6.408 7.255 8.672 10.085 12.002 13.531 16.338 19.511 21.615 24.769 27.587 30.995 33.409 40.790
18 7.015 7.906 9.390 10.865 12.857 14.440 17.338 20.601 22.760 25.989 28.869 32.346 34.805 42.312
19 7.633 8.567 10.117 11.651 13.716 15.352 18.338 21.689 23.900 27.204 30.144 33.687 36.191 43.820
20 8.260 9.237 10.851 12.443 14.578 16.266 19.337 22.775 25.038 28.412 51.410 35.020 37.566 45.315
21 8.897 9.915 11.591 13.240 15.445 11.182 20.337 23.858 26.171 29.615 32.671 36.343 38.932 46.797
22 9.542 10.600 12.338 14.041 16.314 18.101 21.337 24.939 27.301 30.813 33.924 37.659 40.289 48.268
23 10.196 11.293 13.091 14.848 17.187 19.021 22.337 26.018 28.429 32.007 35.172 38.968 41.638 49.728
24 10.856 11.992 13.848 15.659 18.062 19.943 23.337 27.096 29.553 33.196 36.415 40.270 42.980 51.179
25 11.524 12.697 14.611 16.473 18.940 20.867 24.337 28.172 30.675 34.382 37.652 41.566 44.314 52.620

ANEXO. TABLAS
26 12.198 13.409 15.379 17.292 19.820 21.792 25.336 29.246 31.795 35.563 38.885 42.856 45.642 54.052
27 12.879 14.125 16.151 18.114 20.703 22.719 26.336 30.319 32.912 36.741 40.113 44.140 46.963 55.476
28 13.565 14.847 16.928 18.939 21.588 23.647 27.336 31.391 34.027 37.916 41.337 45.419 48.278 56.893
29 14.256 15.574 17.708 19.768 22.475 24.577 28.336 32.461 35.139 39.087 42.557 46.693 49.588 58.302
30 14.953 16.306 18.493 20.599 23.364 25.508 29.336 33.530 36.250 40.256 43.773 47.962 50.892 59.703

ESTADÍSTICAS
* Si χ2 es una variable con más de 30 gl, entonces z = 2χ2 − 2gl −1

se distribuye casi normalmente con una media de 0 y una desviación tipica de 1.


579

Tomada de DOMENECH, I. MASSONS, J.: Bioestadística, Herder, Barcelona, 1980. pp. 612-614 (ambas inclusive).
Tabla XXI.- Percentiles de distribuciones F

MÉTODOS
580

Percentil 75
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞

Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN


1 5.83 7.50 8.20 8.58 8.82 8.98 9.10 9.19 9.26 9.32 9.41 9.49 9.58 9.63 9.67 9.73 9.76 9.80 9.85
2 2.57 3.00 3.15 3.23 3.28 3.31 3.34 3.35 3.37 3.18 3.39 3.43 3.43 3.43 3.44 3.45 3.46 3.47 3.48
3 2.02 2.28 2.36 2.39 2.41 2.42 2.43 2.44 2.44 2.44 2.45 2.46 2.46 2.46 2.47 2.47 2.47 2.47 2.47
4 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08
5 1.69 1.85 1.88 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.88 1.88 1.88 1.88 1.87 1.87 1.87
6 1.62 1.76 1.78 1.79 1.79 1.78 1.78 1.78 1.77 1.77 1.77 1.76 1.76 1.75 1.75 1.75 1.74 1.74 1.74
7 1.57 1.70 1.72 1.72 1.71 1.71 1.70 1.70 1.69 1.69 1.66 1.68 1.67 1.67 1.66 1.66 1.65 1.45 1.65
8 1.54 1.66 1.67 1.66 1.66 1.65 1.64 1.64 1.63 1.63 1.62 1.62 1.63 1.60 1.60 1.59 1.59 1.58 1.58
9 1.51 1.62 1.63 1.63 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.54 1.54 1.53 1.53
10 1.49 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.54 1.53 1.52 1.52 1.51 1.53 1.50 1.49 1.48
11 1.47 1.58 1.58 1.57 1.56 1.55 1.54 1.53 1.53 1.52 1.53 1.50 1.49 1.49 1.48 1.47 1.47 1.46 1.45
12 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.53 1.51 1.50 1.49 1.48 1.47 1.46 1.45 1.45 1.44 1.43 1.42
13 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49 1.48 1.47 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40
14 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47 1.46 1.45 1.44 1.43 1.42 1.41 1.41 1.40 1.39 1.38
15 1.43 1.52 1.52 1.51 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.43 1.41 1.41 1.40 1.39 1.38 1.37 1.36
16 1.42 1.51 1.53 1.50 1.48 1.47 1.46 1.45 1.44 1.44 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34
17 1.42 1.51 1.50 2.49 1.47 1.46 1.45 1.44 1.43 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.33
18 1.43 1.50 1.49 1.48 1.46 1.45 1.44 1.43 1.42 1.42 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.33 1.52
19 1.41 1.49 1.49 1.47 1.46 1.44 1.43 1.42 1.41 1.41 1.40 1.38 1.37 1.36 1.35 1.34 1.33 1.32 1.30
20 1.40 1.49 1.48 1.47 1.45 1.44 1.43 1.42 1.41 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.33 1.29
21 1.40 1.48 1.48 1.46 1.44 1.43 1.42 1.43 1.40 1.59 1.38 1.37 1.35 1.34 1.33 1.32 1.31 1.30 1.28
22 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39 1.39 1.37 1.36 1.34 1.33 1.32 1.31 1.30 1.29 1.28
23 1.39 1.47 1.47 1.45 1.45 1.42 1.41 1.40 1.39 1.38 1.37 1.35 1.34 1.33 1.32 1.33 1.30 1.28 1.27
24 1.39 1.47 1.46 1.44 1.43 1.41 1.40 1.39 1.38 1.38 1.36 1.35 1.33 1.32 1.31 1.30 1.29 1.28 1.26
25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.32 1.31 1.29 1.28 1.27 1.25
26 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.37 1.35 1.34 1.32 1.31 1.30 1.29 1.28 1.26 1.25
27 1.38 1.46 1.45 1.43 1.42 1.40 1.59 1.38 1.37 1.36 1.35 1.33 1.32 1.33 1.30 1.28 1.27 1.26 1.24
28 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.31 1.30 1.29 1.28 1.27 1.25 1.24
29 1.38 1.45 1.45 1.43 1.41 1.40 1.38 1.37 1.36 1.35 1.34 1.32 1.31 1.30 1.29 1.27 1.26 1.25 1.23
30 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36 1.33 1.34 1.32 1.30 1.29 1.28 1.27 1.26 1.24 1.23
40 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.31 1.30 1.28 1.26 1.25 1.24 1.22 1.21 1.19
60 1.35 1.42 1.41 1.38 1.37 1.33 1.33 1.32 1.31 1.30 1.29 1.27 1.25 1.24 1.22 1.23 1.19 1.37 1.15
120 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29 1.28 1.26 1.24 1.22 1.21 1.19 1.18 1.16 1.13 1.30
∞ 1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27 1.25 1.24 1.22 1.19 1.18 1.16 1.14 1.12 1.08 1.00
Tomada de GLASS. G. V. y otros: o. c. pp. 520-526.
Tabla XXI (continuación)
Percentil 90
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 39.16 49.50 33.59 55.83 57.24 51.20 58.91 59.44 59.86 60.29 60.71 62.22 62.74 62.00 62.26 62.53 62.79 63.06 63.33
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.42 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49
3 5.54 5.46 5.39 5.34 5.32 5.28 5.27 5.25 5.24 5.23 5.22 5.20 5.28 3.18 5.27 5.26 5.25 5.24 5.23
4 4.54 4.32 4.19 4.12 4.05 4.01 3.98 3.95 3.94 3.92 3.90 3.87 3.84 3.93 1.82 3.80 4.79 3.78 3.76
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.27 3.24 3.22 3.19 3.27 3.26 3.24 3.22 3.20
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.52 2.49 2.47
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.22 2.18 2.16
10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.28 2.24 2.20 2.28 2.26 2.23 2.21 2.08 2.06
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.22 2.17 2.12 2.20 2.08 2.05 2.03 2.00 1.97
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.22 2.29 2.15 2.20 2.06 2.04 2.02 2.99 2.96 2.93 2.90
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.26 2.24 2.20 2.05 2.02 1.99 2.96 2.93 2.90 2.88 1.85
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.22 2.20 2.05 2.02 1.96 1.94 1.91 1.89 1.86 2.83 1.80
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.22 2.09 2.06 2.02 2.97 2.92 1.90 2.87 2.85 2.82 2.79 2.76
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 1.99 2.94 2.89 2.87 1.84 2.82 2.78 1.75 1.72
17 3.03 2.64 2.44 2.31 2.22 2.25 2.20 2.06 2.03 2.00 2.96 2.92 2.86 2.84 1.82 1.78 1.75 1.72 2.69
18 3.01 2.62 2.42 2.29 2.20 2.23 2.08 2.04 2.00 2.98 2.93 2.89 2.84 2.82 2.78 2.75 2.72 2.69 2.66
19 2.99 2.61 2.40 2.27 2.18 2.21 2.06 2.02 2.98 2.96 1.92 2.86 2.82 2.79 2.76 2.73 2.70 1.67 1.63
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 2.96 1.94 2.89 2.84 2.79 2.77 2.74 2.72 2.68 2.64 2.62
21 2.96 2.57 2.36 2.23 2.24 2.08 2.02 2.98 2.95 1.92 1.87 2.83 2.78 2.75 2.72 2.69 2.66 2.62 2.59
22 2.95 2.56 2.35 2.22 2.23 2.06 2.01 2.97 2.93 2.90 2.86 2.52 2.76 1.73 2.70 2.67 1.64 2.60 2.57
23 2.94 2.53 2.34 2.22 2.22 2.05 1.99 2.95 2.92 1.89 2.84 2.80 2.74 2.72 2.69 2.66 2.62 2.59 2.55
24 2.93 2.54 2.33 2.29 2.10 2.04 2.98 2.94 1.91 2.88 2.83 2.78 1.73 2.70 2.67 1.64 2.61 2.57 2.53
25 2.92 2.53 2.32 2.28 2.09 2.02 1.97 2.93 2.89 2.87 2.82 1.77 1.72 2.69 1.66 2.63 2.59 1.56 2.52

ANEXO. TABLAS
26 2.91 2.52 2.32 2.27 2.08 2.02 2.96 2.92 2.88 2.86 1.81 2.76 2.72 2.68 2.65 1.61 1.58 1.54 2.50
27 2.90 2.52 2.30 2.27 2.07 2.00 2.95 2.91 2.87 2.85 2.80 2.75 2.70 2.67 2.64 2.60 1.57 1.53 1.49
28 2.89 2.50 2.29 2.26 2.06 2.00 2.94 2.90 2.87 2.84 1.79 2.74 2.69 2.66 2.63 1.59 2.56 2.52 2.48
29 2.89 2.50 2.28 2.15 2.06 2.99 2.93 2.89 2.86 2.83 2.78 2.73 1.68 1.65 2.62 2.58 2.55 2.52 2.47
30 2.88 2.49 2.28 2.24 2.05 2.98 2.93 2.88 2.85 2.82 2.77 1.72 1.67 1.64 2.61 1.57 2.54 2.50 1.46
40 2.84 2.44 2.23 2.09 2.00 2.93 2.87 2.83 2.79 2.76 1.71 2.66 1.61 2.57 2.54 1.51 1.47 1.42 2.38

ESTADÍSTICAS
60 2.79 2.39 2.18 2.04 2.95 2.87 2.82 2.77 2.74 1.71 2.66 1.60 2.54 1.51 1.48 2.44 2.40 2.33 2.29
120 2.75 2.35 2.13 2.99 2.90 2.82 1.77 2.72 2.68 2.65 2.60 2.55 2.48 2.45 1.42 2.37 1.32 2.26 2.29
∞ 2.72 2.30 2.08 2.94 2.85 2.77 2.72 2.67 1.63 1.60 2.55 2.49 2.42 2.38 1.34 1.30 2.24 1.17 2.00
581
Tabla XXI (continuación)

MÉTODOS
582

Percentil 95
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞

Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN


1 161.4 399.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3
2 18.51 19.00 19.36 19.25 39.30 19.53 39.35 19.37 19.38 19.40 19.43 39.43 39.45 19.45 19.46 39.47 19.48 19.49 19.50
3 10.13 9.55 9.26 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 5.99 5.14 4.76 4.55 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.53 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 5.32 4.46 4.07 3.84 3.69 5.58 3.50 3.44 5.39 3.35 3.28 3.22 3.35 3.12 3.08 3.04 3.03 2.97 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.73
10 4.96 4.10 5.71 3.48 5.55 5.22 3.14 3.07 3.02 2.98 2.93 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 4.84 3.98 3.59 5.36 3.20 3.09 3.03 2.95 2.90 2.85 2.79 2.72 2.65 2.63 2.57 2.53 2.49 2.45 2.40
12 4.75 3.89 3.49 3.26 5.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 4.67 1.81 3.41 3.18 1.05 2.92 2.83 2.77 2.73 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.50 2.25 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 2.39 2.35 2.33 2.27 2.22 2.18 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.36 2.11 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 2.28 2.24 2.39 2.35 2.11 2.06 2.01
17 4.45 3.59 5.20 2.96 2.83 2.70 2.63 2.55 2.49 2.45 2.38 2.33 2.23 2.39 2.15 2.30 2.06 2.01 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 2.19 2.35 2.31 2.06 2.02 1.97 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 2.36 2.11 2.07 2.03 3.98 1.93 1.88
20 4.35 3.49 3.30 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.99 3.95 1.90 1.84
21 4.32 5.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.38 2.30 2.05 2.01 3.96 3.92 1.87 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.35 2.07 2.03 3.98 1.94 3.89 1.84 1.78
23 4.28 5.42 3.03 2.80 2.64 2.35 2.44 2.37 2.52 2.27 2.20 2.13 2.05 2.01 3.96 3.93 3.86 1.81 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.56 2.30 2.25 2.18 2.11 2.03 3.98 3.94 3.89 3.84 1.79 1.73
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.03 3.96 1.92 1.87 3.82 1.77 1.71
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 3.99 3.95 3.90 3.85 1.80 1.75 1.69
27 4.23 3.35 2.96 2.73 2.57 2.46 2.37 2.33 2.25 2.20 2.33 2.06 1.97 3.93 1.88 3.84 1.79 1.73 1.67
28 4.20 3.34 2.95 2.73 2.56 2.45 2.36 2.29 2.24 2.19 2.32 2.04 1.96 1.91 3.87 3.82 3.77 1.71 1.65
29 4.18 3.33 2.93 2.70 2.55 2.45 2.35 2.28 2.22 2.18 2.30 2.03 1.94 3.90 1.83 3.81 3.75 1.70 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.23 2.16 2.09 2.03 1.93 3.89 3.84 3.79 3.74 1.68 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 1.84 3.79 1.74 3.69 3.64 1.58 1.51
60 4.00 3.15 2.76 2.53 2.57 2.25 2.37 2.30 2.04 1.99 1.92 1.84 1.35 1.70 3.65 3.59 1.53 1.47 1.39
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96 1.91 l.83 1.75 1.66 1.61 1.55 3.30 3.43 1.35 1.25
∞ 3.84 3.00 2.60 2.37 2.23 2.10 2.01 3.94 3.88 1.83 1.75 1.67 1.57 1.52 3.46 1.39 3.32 1.22 1.00
Tabla XXI (continuación)
Percentil 97.5
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 647.8 799.5 864.2 899.6 922.8 937.1 948.2 956.7 963.3 968.6 976.7 984.9 993.1 997.2 2001 2006 1010 1014 1018
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 59.40 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.49 39.50
3 27.44 16.04 15.44 15.10 24.88 24.73 14.62 24.54 24.47 24.42 24.34 24.25 14.27 14.22 24.08 14.04 13.99 23.95 13.90
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.75 8.66 8.56 8.52 8.46 8.41 8.36 8.31 8.26
5 20.02 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.52 6.43 6.33 6.28 6.25 6.28 6.22 6.07 6.02
6 8.81 7.26 6.60 6.23 3.99 5.82 5.70 5.60 5.52 5.46 5.37 5.27 5.17 5.22 5.07 5.02 4.96 4.90 4.85
7 8.07 6.54 5.89 5.52 5.29 5.22 4.99 4.90 4.82 4.76 4.67 4.57 4.47 4.42 4.36 4.31 4.25 4.20 4.24
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 4.10 4.00 3.95 3.89 3.84 3.18 3.73 3.67
9 7.21 3.71 5.08 4.72 4.48 4.32 4.20 4.20 4.03 3.96 3.87 3.77 3.67 3.61 3.56 3.51 3.45 3.39 3.33
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.24 3.08
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 3.33 3.23 3.27 3.22 3.06 3.00 2.94 2.88
12 6.55 5.20 4.47 4.12 3.89 3.73 3.62 3.31 3.44 3.37 3.28 3.18 3.07 3.02 2.96 2.91 2.85 2.79 2.72
13 6.42 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.23 3.25 3.05 2.95 2.89 2.84 2.78 2.72 2.66 2.60
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.62 2.55 2.49
15 6.20 4.77 4.25 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40
16 6.22 4.69 4.08 3.73 3.50 3.34 3.22 3.22 3.05 2.99 2.89 2.79 2.68 2.63 2.57 2.52 2.45 2.38 2.32
17 6.04 4.62 4.02 3.66 3.44 3.28 3.26 5.06 2.98 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.29
19 5.92 4.51 3.90 3.56 3.33 3.27 5.05 2.96 2.88 2.82 2.72 2.62 2.52 2.45 2.39 2.33 2.27 2.20 2.13
20 5.87 4.46 3.86 3.52 3.29 3.13 3.01 2.92 2.84 2.77 2.68 2.57 2.46 2.42 2.35 2.29 2.22 2.26 2.09
21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.64 2.53 2.42 2.37 2.32 2.25 2.28 2.21 2.04
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 2.50 2.39 2.53 2.27 2.22 2.24 2.08 2.00
23 5.75 4.35 3.75 3.42 3.28 3.02 2.90 2.82 2.75 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97
24 3.72 4.32 3.72 3.38 3.25 2.99 2.87 2.78 2.70 2.64 7.54 2.44 2.33 2.27 2.21 2.25 2.08 2.02 2.94
25 3.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.52 2.42 2.30 2.24 2.28 2.12 2.05 2.98 2.91

ANEXO. TABLAS
26 5.66 4.27 5.67 3.33 3.20 2.94 2.82 2.73 2.65 2.59 2.49 2.39 2.28 2.22 2.26 2.09 2.03 2.95 2.88
27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.57 2.41 2.36 2.25 2.19 2.13 2.07 2.00 2.93 2.85
28 5.62 4.23 3.63 3.29 3.06 2.90 2.78 2.69 2.62 2.55 2.45 2.34 2.23 2.17 2.11 2.05 1.98 1.92 1.83
29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.39 2.53 2.43 2.32 2.21 2.15 2.09 2.03 1.96 1.89 1.81
30 5.57 4.28 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.52 2.42 2.32 2.20 2.24 2.07 2.01 1.94 2.87 2.79
40 5.42 4.05 3.46 3.23 2.90 2.74 2.62 2.53 2.45 2.39 2.29 2.18 2.07 2.01 2.94 2.88 1.80 1.72 1.64

ESTADÍSTICAS
60 5.29 3.93 3.34 3.01 2.79 2.63 2.52 2.41 2.33 2.27 2.27 2.06 2.94 2.88 1.82 2.74 1.67 2.58 1.48
120 5.25 3.80 3.25 2.89 2.67 2.52 2.39 2.30 2.22 2.26 2.05 2.94 1.82 1.76 1.69 2.61 1.53 2.43 1.31
∞ 5.02 3.69 3.12 2.79 2.57 2.42 2.29 2.29 2.11 2.05 1.94 2.85 1.71 1.64 1.57 1.40 1.39 1.27 2.00
583
Tabla XXI (continuación)

MÉTODOS
584

Percentil 99
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞

Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN


1 4052 4999.5 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.81 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 13.75 10.92 9.78 9.15 8.73 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14. 7.06 6.97 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.73 2.65
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 5.22 3.13 2.99 2.83 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
∞ 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
Tabla XXI (continuación)
Percentil 99.5
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 16211 20000 21615 22500 23056 23437 23715 23925 24092 24224 24426 24630 24836 24940 25044 25248 25253 25359 25465
2 198.5 199.0 199.2 199.2 199.3 199.3 199.4 199.4 199.4 299.4 299.4 199.4 199.4 199.5 199.5 299.3 199.5 199.5 199.5
3 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.39 43.08 42.78 42.62 42.47 42.31 42.15 41.99 41.83
4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.70 20.44 20.17 20.03 19.89 19.75 19.61 29.47 19.32
5 22.78 18.31 26.33 25.56 24.94 14.51 24.20 23.96 13.77 13.62 13.38 13.15 22.90 22.78 22.66 12.53 22.40 22.27 22.24
6 18.63 24.54 22.92 12.03 11.46 11.07 20.79 20.57 10.39 20.25 20.03 9.82 9.59 9.47 9.36 9.24 9.22 9.00 8.88
7 26.24 12.40 20.88 20.05 9.52 9.26 8.89 8.68 8.52 8.38 8.28 7.97 7.75 7.63 7.53 7.42 7.32 7.29 7.08
8 14.69 11.04 9.60 8.82 8.30 7.95 7.69 7.50 7.34 7.22 7.02 6.81 6.62 6.50 6.40 6.29 6.28 6.06 5.93
9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.23 6.03 5.83 5.73 5.62 5.52 5.42 5.30 5.29
10 22.83 9.43 8.08 1.34 6.87 6.54 6.30 6.22 5.97 5.85 5.66 5.47 5.27 5.17 5.07 4.97 4.86 4.75 4.64
11 22.23 8.91 7.60 6.88 6.42 6.20 5.86 5.68 5.54 5.42 5.24 5.05 4.86 4.76 4.65 4.55 4.44 4.34 4.23
12 11.75 8.32 7.23 6.52 6.07 5.76 5.32 5.35 5.20 5.09 4.92 4.72 4.55 4.43 4.33 4.23 4.22 4.02 3.90
13 22.37 8.29 6.93 6.23 5.79 5.48 5.25 5.01 4.94 4.82 4.64 4.46 4.27 4.17 4.07 3.97 3.87 3.76 3.65
14 11.06 7.92 6.68 6.00 3.56 5.26 3.03 4.86 4.72 4.69 4.43 4.25 4.06 3.96 3.86 3.76 3.66 3.55 3.44
15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.25 4.07 3.88 3.79 3.69 3.58 3.48 3.37 3.26
16 20.58 7.52 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.20 3.92 3.73 3.64 3.54 3.44 3.33 3.22 3.22
17 20.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.24 3.97 3.79 3.62 3.52 3.41 3.31 3.22 3.10 2.98
18 20.22 7.22 6.03 3.37 4.96 4.66 4.44 4.28 4.14 4.03 3.86 3.68 3.30 3.40 3.30 3.20 3.20 2.99 2.87
19 10.07 7.09 3.92 5.27 4.83 4.56 4.34 4.28 4.04 3.93 3.76 3.59 3.40 3.31 3.21 3.11 3.00 2.89 2.78
20 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.68 3.50 3.32 3.22 3.22 3.02 2.92 2.82 2.69
21 9.83 6.89 5.73 5.09 4.68 4.39 4.28 4.01 3.88 3.77 3.60 3.43 3.24 3.25 3.05 2.95 2.84 2.73 2.62
22 9.73 6.81 5.65 5.02 4.62 4.32 4.22 3.94 3.81 3.70 3.54 3.36 3.28 3.08 2.98 2.88 2.77 2.66 2.55
23 9.63 6.73 5.58 4.95 4.54 4.26 4.05 3.88 3.75 3.64 3.47 3.30 3.22 3.02 2.92 2.82 2.72 2.60 2.48
24 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59 3.42 3.25 3.06 2.97 2.87 2.77 2.66 2.53 2.43
25 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.37 3.20 3.02 2.92 2.82 2.72 2.62 2.50 2.38

ANEXO. TABLAS
26 9.42 6.54 5.42 4.79 4.38 4.10 3.89 3.73 3.60 3.49 3.33 3.25 2.97 2.87 2.77 2.67 2.56 2.45 2.33
27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56 3.45 3.28 3.11 2.93 2.83 2.73 2.63 2.52 2.41 2.29
28 9.28 6.44 5.32 4.70 4.30 4.02 3.82 3.65 3.52 3.41 3.25 3.07 2.89 2.79 2.69 2.59 2.48 2.37 2.23
29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.62 3.48 3.38 3.21 3.04 2.86 2.76 2.66 2.56 2.45 2.33 2.21
30 9.18 6.35 5.24 4.62 4.23 3.95 1.74 3.58 3.45 3.34 3.28 3.02 2.82 2.73 2.63 2.52 2.42 2.30 2.18
40 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.95 2.78 2.60 2.50 2.40 2.30 2.18 2.06 1.93

ESTADÍSTICAS
60 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.23 3.02 2.90 2.74 2.37 2.39 2.29 2.19 2.08 2.96 1.83 1.69
120 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.54 2.37 2.19 2.09 1.98 1.87 1.75 1.62 1.43
7.88 5.30 4.28 3.72 3.35 2.09 2.90 2.74 2.62 2.52 2.36 2.19 2.00 1.90 1.79 1.67 1.53 1.36 1.00
585
Tabla XXI (continuación)

MÉTODOS
586

Percentil 99.9
n2 n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞

Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN


1 4053• 5000• 5404• 5625• 5764• 5859• 5929• 5981• 6023• 6056• 6107• 6158• 6209• 6235• 6261• 6287• 6313• 6340• 6366•
2 998.5 999.0 999.2 999.2 999.3 999.3 999.4 999.4 999.4 999.4 999.4 999.4 999.4 999.5 999.5 999.5 999.5 999.5 999.3
3 167.0 148.5 141.1 137.1 134.6 132.8 131.6 130.6 129.9 129.2 128.3 127.4 126.4 125.9 125.4 125.0 124.5 124.0 123.5
4 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 48.47 48.05 47.41 46.76 46.10 45.77 45.43 45.09 44.75 44.40 44.05
5 47.18 37.12 33.20 31.09 29.75 28.84 28.16 27.64 27.24 26.92 26.42 25.91 25.39 25.14 24.87 24.60 24.33 24.06 23.79
6 35.51 27.00 23.70 21.92 20.81 20.03 19.46 19.03 18.69 18.41 17.99 17.56 17.12 16.89 16.67 16.44 16.21 15.99 15.75
7 29.25 21.69 18.77 17.19 16.21 15.52 15.02 14.63 14.35 14.08 13.71 13.32 12.93 12.73 12.33 12.33 12.12 11.91 11.70
8 25.42 18.49 15.83 14.39 13.49 12.86 12.40 32.04 11.77 11.54 11.19 10.84 10.48 10.30 10.11 9.92 9.73 9.53 9.33
9 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 9.57 9.24 8.90 8.72 8.55 8.37 8.19 8.00 7.81
10 21.04 14.91 12.55 11.28 10.48 9.92 9.52 9.20 8.96 8.75 8.45 8.13 7.80 7.64 7.47 7.30 7.12 6.94 6.76
11 19.69 13.81 11.56 10.35 9.58 9.05 8.66 8.35 8.12 7.92 7.63 7.32 7.01 6.85 6.68 6.52 6.35 6.17 6.00
12 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 7.00 6.73 6.40 6.25 6.09 5.93 5.76 5.59 5.42
13 17.81 12.31 10.21 9.07 8.35 7.86 7.49 7.21 6.98 6.80 6.52 6.23 5.93 5.78 5.63 5.47 5.30 5.14 4.97
14 17.14 11.78 9.73 8.62 7.92 7.43 7.08 6.80 6.58 6.40 6.13 5.15 5.56 5.41 5.25 5.10 4.94 4.77 4.60
15 16.59 11.34 9.34 8.25 7.57 7.09 6.74 6.47 6.26 6.08 5.81 5.54 5.25 5.10 4.95 4.80 4.64 4.47 4.31
16 16.12 10.97 9.00 7.94 7.27 6.81 6.46 6.19 5.98 5.81 5.55 5.27 4.99 4.85 4.70 4.54 4.39 4.23 4.06
17 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75 5.58 5.32 5.05 4.78 4.63 4.48 4.33 4.18 4.02 3.85
18 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 5.13 4.87 4.59 4.45 4.30 4.15 4.00 3.84 3.67
19 15.08 10.16 8.28 7.26 6.62 6.18 5.85 5.59 5.39 5.22 4.97 4.70 4.43 4.29 4.14 3.99 3.84 3.68 3.51
20 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.82 4.56 4.29 4.15 4.00 3.86 3.70 3.54 3.35
21 14.59 9.77 7.94 6.95 6.32 5.88 5.56 5.31 5.11 4.95 4.70 4.44 4.17 4.03 5.88 3.74 3.58 3.42 3.26
22 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99 4.83 4.58 4.33 4.06 5.92 3.78 3.63 3.48 5.32 3.15
23 14.19 9.47 7.67 6.69 6.08 5.65 5.33 5.09 4.89 4.73 4.48 4.23 3.96 3.82 3.68 3.53 3.38 3.22 3.03
24 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80 4.64 4.39 4.14 3.87 3.74 3.59 3.45 3.29 3.14 2.97
25 13.88 9.22 7.45 6.49 5.88 5.46 5.15 4.91 4.71 4.56 4.31 4.06 3.79 3.66 3.52 3.37 3.22 3.06 2.89
26 33.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64 4.48 4.24 3.99 3.72 3.59 3.44 3.50 3.15 2.99 2.82
27 13.61 9.02 7.27 6.33 5.73 5.31 5.00 4.76 4.57 4.41 4.11 3.92 3.66 3.52 3.38 3.23 3.08 2.92 2.75
28 13.50 8.93 7.39 6.25 5.66 5.24 4.93 4.69 4.50 4.35 4.11 3.86 3.60 3.46 3.32 3.38 3.02 2.86 2.69
29 13.39 8.85 7.32 6.19 5.59 5.38 4.87 4.64 4.45 4.29 4.05 3.80 3.54 3.41 3.27 3.32 2.97 2.83 2.64
30 13.29 8.77 7.05 6.12 5.53 5.32 4.82 4.58 4.39 4.24 4.00 3.15 3.49 3.36 3.22 3.07 2.92 2.76 2.59
40 12.61 8.25 6.60 5.70 5.33 4.73 4.44 4.21 4.02 3.87 3.64 3.40 3.35 3.01 2.87 2.73 2.57 2.43 2.23
60 11.97 1.76 6.17 5.31 4.76 4.37 4.09 3.87 3.69 3.54 3.33 3.08 2.83 2.69 2.55 2.41 2.25 2.08 3.89
120 11.38 7.32 5.79 4.95 4.42 4.04 3.77 3.55 3.38 3.24 3.02 2.78 2.53 2.40 2.26 2.11 3.95 1.76 1.54
∞ 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.74 2.51 2.27 2.13 1.99 1.84 1.66 1.45 1.00
• Multiplicar por 100 estas entradas.
Tomada de GLASS. G. V. y otros: o. c.. pp. 520-526.
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXII. Tabla de probabilidades asociadas con valores tan pequeños como
los valores observados de U en la prueba de Mann-Whitney*

n2 = 3 n2 = 4
n1 n1
U 1 2 3 U 1 2 3 4

0 .250 .100 .050 0 .200 .067 .028 .014


1 .500 .200 .100 1 .400 .133 .057 .029
2 .750 .400 .200 2 .600 .267 .114 .057
3 .600 .350 3 .400 .200 .100
4 .500 4 .600 .314 .171
5 .650 5 .429 .243
6 .571 .343
7 .443
8 .557

n2 = 5 n2 = 6
n1 n1
U 1 2 3 4 5 U 1 2 3 4 5 6

0 .167 .047 .018 .008 .004 0 .143 .036 .012 .005 .002 .001
1 .333 .095 .036 .016 .008 1 .286 .071 .024 .010 .004 .002
2 .500 .190 .071 .032 .016 2 .428 .143 .048 .019 .009 .004
3 .667 .286 .125 .056 .028 3 .571 .214 .083 .033 .015 .008
4 .429 .196 .095 .048 4 .321 .131 .057 .026 .013
5 .571 .286 .143 .075 5 .429 .190 .086 .041 .021
6 .393 .206 .111 6 .571 .274 .129 .063 .032
7 .500 .278 .155 7 .357 .176 .089 .047
8 .607 .365 .210 8 .452 .238 .123 .066
9 .452 .274 9 .548 .305 .165 .090
10 .548 .345 10 .381 .214 .120
11 .421 11 .457 .268 .155
12 .500 12 .545 .331 .197
13 .579 13 .396 .242
14 .465 .294
15 .535 .350
16 .409
17 .469
18 .531

* Reproducida de Mann, H. B., y Whitney, D. R. 1947. En una prueba de si una


o dos variables aleatorias es estocásticamente mayor que la otra. Ann Math. Statist.,
18, 52-54, con el amable permiso de los autores y el editor.

Tomada de SIEGEL, S. o. c., pp. 305-307.

587
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXII. Tabla de probabilidades asociadas con valores tan pequeños como
los valores observados de U en la prueba de Mann-Whitney*

(continuación)

n2 = 7

n1
U 1 2 3 4 5 6 7

0 .125 .028 .008 .003 .001 .001 .000


1 .250 .056 .017 .006 .003 .001 .001
2 .375 .111 .033 .012 .005 .002 .001
3 .500 .167 .058 .021 .009 .004 .002
4 .625 .250 .092 .036 .015 .007 .003
5 .333 .133 :055 .024 .011 .006
6 .444 .192 .082 .037 .017 .009
7 .556 .258 .115 .053 .026 .013
8 .333 .158 .074 .037 .019
9 .417 .206 .101 .051 .027
10 .500 .264 .134 .069 .036
11 .583 .324 .172 .090 .049
12 .394 .216 .117 .064
13 .464 .265 .147 .082
14 .538 .319 .183 .104
15 .378 .223 .130
16 .438 .267 .159
17 .500 .314 .191
18 .562 .365 .228
19 .418 .267
20 .473 .310
21 .527 .355
22 .402
23 .451
24 .500
25 .549

* Reproducida de Mann, H. B., y Whitney, D. R. 1947. En una prueba de si una


o dos variables aleatorias es estocásticamente mayor que la otra. Ann Math. Statist.,
18, 52-54, con el amable permiso de los autores y el editor.

Tomada de SIEGEL, 5.: o. c., p. 284.

588
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXII. Tabla de probabilidades asociadas con valores tan pequeños como
los valores observados de U en la prueba de Mann-Whitney*

(continuación)

n2 = 8

n1
U 1 2 3 4 5 6 7 8 t Normal

0 .111 .022 .006 .002 001 .000 .000 .000 3.308 .001
1 .222 .044 .012 .004 .002 .001 .000 .000 3.203 .001
2 .333 .089 .024 .008 .003 .001 .001 .000 3.098 .001
3 .444 .133 .042 .014 .005 .002 .001 .001 2.993 .001
4 .556 .200 .067 .024 .009 .004 .002 .001 2.888 002
5 .267 .097 .036 .015 .006 .003 .001 2.783 .003
6 .356 .139 .055 .023 .010 .005 .002 2.678 .004
7 .444 .188 .077 .033 .015 .007 .003 2.573 .005
8 .556 .248 .107 .047 .021 .010 .005 2.468 .007
9 .315 .141 .064 .030 .014 .007 2.363 .009
10 .387 .184 .085 .041 .020 .016 2.258 .012
11 .461 .230 .111 .054 .027 .014 2.153 .016
12 .539 .285 .142 .071 .036 .019 2.048 .020
13 .341 .177 .091 .047 .025 1.943 .026
14 .404 .217 .114 .060 .032 1.838 .033
15 .467 .262 .141 .076 .041 1.733 .041
16 .533 .311 .172 .095 .052 1.628 .052
17 .362 .207 .116 .065 1.523 .064
18 .416 .245 .140 .080 1.418 .078
19 .472 .286 .168 .097 1.313 .094
20 .528 .331 .198 .117 1.208 .113
21 .377 .232 .139 1.102 .135
22 .426 .268 .164 .998 .159
23 .475 .306 .191 .893 .185
24 .525 .347 .221 .788 .215
25 .389 .23 .683 .247
26 .433 .287 .578 .282
27 .478 .323 .473 .318
28 .522 .360 .368 .356
29 .399 .263 .396
30 .439 .158 .437
31 .480 .052 .481
32 .520

* Reproducida de Mann, H. B. y Whitney, D. R. 1947. En una prueba de si una


o dos variables aleatorias es estocásticamente mayor que la otra. Ann Math. Statist.,
18, 52-54, con el amable permiso de los autores y el editor.

589
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXIII. Tabla de los valores críticos de U en la prueba de MannWhitney*

Valores críticos de U para una prueba de una cola en α = 0.001 o para una prueba
de dos colas en α = 0.002

n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1
2
3 0 0 0 0
4 0 0 0 1 1 1 2 2 3 3 3
5 1 1 2 2 3 3 4 5 5 6 7 7
6 2 3 4 4 5 6 7 8 9 10 11 12
7 3 5 6 7 8 9 10 11 13 14 15 16
8 5 6 8 9 11 12 14 15 17 18 20 21
9 7 8 10 12 14 15 17 19 21 23 25 26
10 8 10 12 14 17 19 21 23 25 27 29 32
11 10 12 15 17 20 22 24 27 29 32 34 37
12 12 14 17 20 23 25 28 31 34 37 40 42
13 14 17 20 23 26 29 32 35 38 42 45 48
14 15 19 22 25 29 32 36 39 43 46 50 54
15 17 21 24 28 32 36 40 43 47 51 55 59
16 19 23 27 31 35 39 43 48 52 56 60 65
17 21 25 29 34 38 43 47 52 57 61 66 70
18 23 27 32 37 42 46 51 56 61 66 71 76
19 25 29 34 40 45 50 55 60 66 71 77 82
20 26 32 37 42 48 54 59 65 70 76 82 88

Tomada de SIEGEL, S.: o. c., pp. 308-311.

590
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXIII. Tabla de los valores críticos de U en la prueba de MannWhitney*


(Continuación)

Valores críticos de U para una prueba de una cola en α = 0.01 o para una prueba
de dos colas en α = 0.02

n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1
2 0 0 0 0 0 0 1 1
3 1 1 1 2 2 2 3 3 4 4 4 5
4 3 3 4 5 5 6 7 7 8 9 9 10
5 5 6 7 8 9 10 11 12 13 14 15 16
6 7 8 9 11 12 13 15 16 18 19 20 22
7 9 11 12 14 16 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 16 18 21 23 26 28 31 33 36 38 40
10 16 19 22 24 27 30 33 36 38 41 44 47
11 18 22 25 28 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
16 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114

* Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para


la estadística de Mann-Whitney. Bulletin of the Institute of Educational Research at Indiana Uni-
versity, 1, núm. 2, con el amable permiso del autor y el editor.

591
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXIII. Tabla de los valores críticos de U en la prueba de MannWhitney*


(Continuación)

Valores críticos de U para una prueba de una cola en α = 0.025 o para una prueba
de dos colas en α = 0.005

n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1
2 0 0 0 1 1 1 1 1 2 2 2 2
3 2 3 3 4 4 5 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 65 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 69 76 83 90 98 105 112 119 127

* Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para


la estadística de Mann-Whitney. Bulletin of the Institute of Educational Research at Indiana Uni-
versity, 1, núm. 2, con el amable permiso del autor y el editor.

592
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXIII. Tabla de los valores críticos de U en la prueba de MannWhitney*


(Continuación)

Valores críticos de U para una prueba de una cola en α = 0.05 o para una prueba
de dos colas en α = 0.10

n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1 0 0
2 1 1 1 2 2 2 3 3 3 4 4 4
3 3 4 5 5 6 7 7 8 9 9 10 11
4 6 7 8 9 10 11 12 14 15 16 17 18
5 9 11 12 13 15 16 18 19 20 22 23 25
6 12 14 16 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 83 88 94 100
16 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138

* Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para


la estadística de Mann-Whitney. Bulletin of the Institute of Educational Research at Indiana Uni-
versity, 1, núm. 2, con el amable permiso del autor y el editor.

593
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXVI. Tabla de valores críticos de T en la prueba de los rangos


señalados de pares igualados de Wilcoxon*

Nivel de significación para


prueba de una cola

.025 .01 .005


N
Nivel de significación para
prueba de dos colas

.05 .02 .01

6 0 — —
7 2 0 —
8 4 2 0
9 6 3 2
10 8 5 3

11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16

16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38

21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68

Tomada de SIEGEL, S.: o. c. p. 2.

594
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXVII. Percentiles de las distribuciones por rangos, q,


de Student para J y v grados de libertad*
Percentil 90
J 2 3 4 5 6 7 8 9 10
v
1 8.929 113.44 16.36 18.49 20.15 21.51 22.64 23.62 24.48
2 4.130 5.733 6.773 7.538 8.139 8.633 9.049 9.409 9.725
3 3.328 4.467 5.199 5.738 6.162 6.511 6.806 7.062 7.287
4 3.015 3.976 4.586 5.035 5.388 5.679 5.926 6.139 6.327
5 2.850 3.717 4.264 4.664 4.979 5.238 5.438 5.648 5.816
6 2.748 3.559 4.065 4.435 4.726 4.966 5.168 5.344 5.499
7 2.680 3.451 3.931 4.280 4.555 4.780 4.972 5.137 5.283
8 2.630 3.374 3.834 4.169 4.431 4.646 4.829 4.987 5.126
9 2.592 3.316 3.761 4.084 4.337 4.545 4.721 4.873 5.007
10 2.563 3.270 3.704 4.018 4.264 4.465 4.636 4.783 4.913
11 2.540 3.234 3.658 3.965 4.205 4.401 4.568 4.711 4.838
12 2.521 3.204 3.621 3.922 4.156 4.349 4.511 4.652 4.776
13 2.505 3.179 3.589 3.885 4.116 4.305 4.464 4.602 4.724
14 2.491 3.158 3.563 3.854 4.081 4.267 4.424 4.560 4.680
15 2.479 3.140 3.540 3.828 4.052 4.235 4.390 4.524 4.641
16 2.469 3.124 3.520 3.804 4.026 4.207 4.360 4.492 4.608
17 2.460 3.110 3.503 3.784 4.004 4.183 4.334 4.464 4.579
18 2.452 3.098 3.488 3.767 3.984 4.161 4.311 4.440 4.554
19 2.445 3.087 3.474 3.751 3.966 4.142 4.290 4.418 4.531
20 2.439 3.078 3.462 3.736 3.950 4.124 4.271 4.398 4.510
24 2.420 3.047 3.423 3.692 3.900 4.070 4.213 4.336 4.445
30 2.400 3.017 3.386 3.648 3.851 4.016 4.155 4.275 4.381
40 2.381 2.988 3.349 3.605 3.803 3.963 4.099 4.215 4.317
60 2.363 2.959 3.312 3.562 3.755 3.911 4.042 4.155 4.254
120 2.344 2.930 3.276 3.520 3.707 3.859 3.987 4.096 4.191
∞ 2.326 2.902 3.240 3.478 3.661 3.808 3.931 4.037 4.129

J 11 12 13 14 15 16 17 18 19
v
1 25.24 25.92 26.54 27.10 27.62 28.10 28.54 28.96 29.35
2 10.01 10.26 10.49 10.70 10.89 11.07 11.24 11.39 11.54
3 7.487 7.667 7.832 7.982 8.120 8.249 8.368 8.479 8.584
4 6.495 6.645 6.783 6.909 7.025 7.133 7.233 7.327 7.414
5 5.966 6.101 6.223 6.336 6.440 6.536 6.626 6.710 6.789
6 5.637 5.762 5.875 5.979 6.075 6.164 6.247 6.325 6.398
7 5.413 3.530 5.637 5.735 5.826 3.910 5.988 6.061 6.130
8 5.250 5.362 5.464 5.558 5.644 5.724 5.799 5.869 5.935
9 5.127 5.234 5.333 5.423 5.506 5.383 5.635 5.723 3.786
10 5.029 5.134 5.229 5.317 5.397 5.472 5.542 5.607 3.668
11 4.951 5.053 5.146 5.231 5.309 5.382 5.450 5.514 5.573
12 4.886 4.986 5.077 5.160 5.236 5.308 5.374 5.436 5.495
13 4.832 4.930 5.019 5.100 5.176 5.245 5.311 5.372 5.429
14 4.786 4.882 4.970 5.050 5.124 5.192 5.256 5.316 5.373
15 4.746 4.841 4.927 5.006 5.079 5.147 3.209 5.269 5.324
16 4.712 4.805 4.890 4.968 5.040 5.107 5.169 5.227 5.282
17 4.682 4.774 4.858 4.935 5.005 5.071 5.133 5.190 5.244
18 4.655 4.746 4.829 4.905 4.975 5.040 5.101 5.158 5.211
19 4.631 4.721 4.803 4.879 4.948 5.012 5.073 5.129 5.182
20 4.609 4.699 4.780 4.855 4.924 4.987 5.047 5.103 5.155
24 4.541 4.628 4.708 4.780 4.847 4.909 4.966 5.021 5.071
30 4.474 4.559 4.635 4.706 4.770 4.830 4.886 4.939 4.988
40 4.408 4.490 4.564 4.632 4.695 4.752 4.807 4.857 4.905
60 4.342 4.421 4.493 4.558 4.619 4.675 4.727 4.775 4.821
120 4.276 4.353 4.422 4.485 4.543 4.597 4.647 4.694 4.738
∞ 4.211 4.285 4.351 4.412 4.468 4.519 4.568 4.612 4.654

Tomada de GLASS, G. V. y otro: o. c., pp. 527-531.


* En un análisis de varianza de un factor con n observaciones en los J grupos, v = J(n – 1).
En general, v es el número de grados de libertad para la media de cuadrados «intra» del análisis
de varianza.

595
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXVII (continuación)


Percentil 95
J 2 3 4 5 6 7 8 9 10
v
1 17.97 26.98 32.82 37.08 40.41 43.12 45.40 47.36 49.01
2 6.085 8.331 9.798 10.88 11.74 12.44 13.03 13.54 13.99
3 4.501 5.910 6.825 7.502 8.037 8.478 8.853 9.177 9.462
4 3.927 5.040 5.751 6.287 6.707 7.053 7.341 7.602 7.826
5 3.635 4.602 5.218 5.673 6.033 6.330 6.582 6.802 6.995
6 3.461 4.339 4.896 5.305 5.628 5.895 6.122 6.319 6.493
7 3.344 4.165 4.681 5.060 5.359 5.606 5.815 5.998 6.158
8 3.261 4.041 4.529 4.886 5.167 5.399 5.597 5.767 5.918
9 3.199 3.949 4.415 4.756 5.024 5.244 5.432 5.595 5.739
10 3.151 3.877 4.327 4.654 4.912 5.124 5.305 5.461 5.599
11 3.113 3.820 4.256 4.574 4.823 5.028 5.202 5.353 5.487
12 3.082 3.773 4.199 4.508 4.751 4.950 5.119 5.265 5.395
13 3.055 3.735 4.151 4.453 4.690 4.885 5.049 5.192 5.318
14 3.033 3.702 4.111 4.407 4.639 4.829 4.990 5.131 5.254
15 3.014 3.674 4.076 4.367 4.595 4.782 4.940 5.077 5.198
16 2.998 3.649 4.046 4.333 4.557 4.741 4.897 5.031 5.150
17 2.984 3.628 4.020 4.303 4.524 4.705 4.858 4.991 5.108
18 2.971 3.609 3.997 4.277 4.495 4.673 4.824 4.956 5.071
19 2.960 3.593 3.977 4.253 4.469 4.645 4.794 4.924 5.038
20 2.950 3.578 3.958 4.232 4.445 4.620 4.768 4.896 5.008
24 2.919 3.532 3.901 4.166 4.373 4.541 4.684 4.807 4.915
30 2.888 3.486 3.845 4.102 4.302 4.464 4.602 4.720 4.824
40 2.858 3.442 3.791 4.039 4.232 4.389 4.521 4.635 4.735
60 2.829 3.399 3.731 3.977 4.163 4.314 4.441 4.550 4.646
120 2.800 3.356 3.685 3.917 4.096 4.241 4.363 4.468 4.560
∞ 2.772 3.314 3.633 3.858 4.030 4.170 4.286 4.387 4.474

J 11 12 13 14 15 16 17 18 19
v
1 50.59 51.96 53.20 54.33 55.36 56.32 57.22 58.04 58.83
2 14.39 14.75 15.08 15.38 15.65 15.91 16.14 16.37 16.57
3 9.717 9.946 10.15 10.35 10.53 10.69 10.84 10.98 11.11
4 8.027 8.208 8.373 8.525 8.664 8.794 8.914 9.028 9.134
5 7.168 7.324 7.466 7.596 7.717 7.828 7.932 8.030 8.122
6 6.649 6.789 6.917 7.034 7.143 7.244 1.338 7.426 7.508
7 6.302 6.431 6.550 6.658 6.759 6.852 6.939 7.020 7.097
8 6.054 6.175 6.287 6.389 6.483 6.571 6.653 6.729 6.802
9 5.867 5.983 6.089 6.186 6.276 6.359 6.437 6.510 6.579
10 5.722 5.833 5.935 6.028 6.114 6.194 6.269 6.339 6.405
11 5.605 5.113 5.811 5.901 5.984 6.062 6.134 6.202 6.265
12 5.511 5.615 5.710 5.798 5.878 5.953 6.023 6.089 6.151
13 5.431 5.533 5.625 5.111 5.189 5.862 5.931 5.995 6.055
14 5.364 5.463 5.554 5.637 5.114 5.786 5.852 5.915 5.974
15 5.306 5.404 5.493 5.574 5.649 5.720 5.785 5.846 5.904
16 5.256 5.352 5.439 5.520 5.593 5.662 5.127 5.786 5.843
17 5.212 5.307 5.392 5.471 5.544 5.612 5.675 5.734 5.790
18 5.174 5.267 5.352 5.429 5.501 5.568 5.630 5.688 5.143
19 5.140 5.231 5.315 5.391 5.462 5.528 5.589 5.647 5.701
20 5.108 5.199 5.282 5.357 5.427 5.493 5.553 5.610 5.663
24 5.012 5.099 5.179 5.251 5.319 5.381 5.439 5.494 5.545
30 4.917 5.001 5.077 5.147 5.211 5.271 5.327 5.379 5.429
40 4.824 4.904 4.977 5.044 5.106 5.163 5.216 5.266 5.313
60 4.732 4.808 4.878 4.942 5.001 5.056 5.107 5.154 5.199
120 4.641 4.114 4.781 4.842 4.898 4.950 4.998 5.044 5.086
∞ 4.552 4.622 4.685 4.743 4.796 4.845 4.891 4.934 4.974

596
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXVII (continuación)


Percentil 97.5
J 2 3 4 5 6 7 8 9 10
v
1 35.99 54.00 65.69 74.22 80.87 86.29 90.85 94.77 98.20
2 8.776 11.94 14.01 15.54 16.75 17.74 18.58 19.31 19.95
3 5.907 7.661 14.808 9.660 10.34 10.89 1.37 11.78 12.14
4 4.943 6.244 7.088 7.716 8.213 8.625 8.976 9.279 9.548
5 4.474 5.558 6.257 6.775 7.186 7.527 7.816 8.068 8.291
6 4.199 5.158 5.772 6.226 6.586 6.884 7.138 7.359 7.554
7 4.018 4.897 5.455 5.868 6.194 6.464 6.695 6.895 7.072
8 3.892 4.714 5.233 5.616 5.919 6.169 6.382 6.568 6.732
9 3.797 4.578 5.069 5.430 5.715 5.950 6.151 6.325 6.479
10 3.725 4.474 4.943 5.287 5.558 5.782 5.972 6.138 6.285
11 3.667 4.391 4.843 5.173 5.433 5.648 5.831 5.989 6.130
12 3.620 4.325 4.762 5.081 5.332 5.540 5.716 5.869 6.004
13 3.582 4.269 4.694 5.004 5.248 5.449 5.620 5.769 5.900
14 3.550 4.222 4.638 4.940 5.178 5.374 5.540 5.684 5.811
15 3.522 4.182 4.589 4.885 5.118 5.309 5.471 5.612 5.737
16 3.498 4.148 4.548 4.838 5.066 5.253 5.412 5.550 5.672
17 3.477 4.118 4.512 4.797 5.020 5.204 5.361 5.496 5.615
18 3.458 4.092 4.480 4.761 4.981 5.162 5.315 5.448 5.565
19 3.442 4.068 4.451 4.728 4.945 5.123 5.275 5.405 5.521
20 3.427 4.047 4.426 4.700 4.914 5.089 5.238 5.368 5.481
24 3.381 3.983 4.347 4.610 4.816 4.984 5.126 5.250 5.358
30 3.337 3.919 4.271 4.523 4.720 4.881 5.017 5.134 5.238
40 3.294 3.858 4.197 4.439 4.627 4.780 4.910 5.022 5.120
60 3.251 3.798 4.124 4.356 4.536 4.682 4.806 4.912 5.006
120 3.210 3.739 4.053 4.276 4.447 4.587 4.704 4.805 4.894
∞ 3.170 3.682 3.984 4.197 4.361 4.494 4.605 4.700 4.784

J 11 12 13 14 15 16 17 18 19
v
1 101.3 104.0 106.5 108.8 110.8 112.7 114.5 116.2 117.7
2 20.52 21.03 21.49 21.91 22.30 22.67 23.01 23.32 23.62
3 12.46 12.75 13.01 13.26 13.48 13.69 13.88 14.06 14.23
4 9.788 10.01 10.20 10.39 10.55 10.71 10.85 10.99 11.11
5 8.490 8.670 8.834 8.984 9.124 9.253 9.374 9.486 9.593
6 7.729 7.887 8.031 8.163 8.286 8.399 8.506 8.605 8.698
7 7.230 7.373 7.504 7.624 7.735 7.839 7.935 8.025 8.111
8 6.879 7.011 7.132 7.244 7.347 7.443 7.532 7.616 7.695
9 6.617 6.742 6.856 6.961 7.058 7.148 7.232 7.311 7.385
10 6.416 6.534 6.643 6.742 6.834 6.920 7.000 7.075 7.146
11 6.256 6.369 6.473 6.568 6.657 6.739 6.815 6.887 6.955
12 6.125 6.235 6.335 6.427 6.512 6.591 6.665 6.734 6.799
13 6.017 6.123 6.220 6.309 6.392 6.468 6.539 6.607 6.670
14 5.926 6.029 6.123 6.210 6.290 6.364 6.434 6.499 6.560
15 5.848 5.949 6.041 6.125 6.203 6.276 6.344 6.407 6.467
16 5.781 5.879 5.969 6.052 6.128 6.199 6.265 6.328 6.386
17 5.722 5.818 5.907 5.987 6.062 6.132 6.197 6.258 6.315
18 5.670 5.765 5.852 5.931 6.004 6.073 6.137 6.197 6.253
19 5.624 5.718 5.803 5.881 5.954 6.020 6.083 6.142 6.198
20 5.583 5.675 5.759 5.836 5.907 5.974 6.036 6.093 6.148
24 5.455 5.543 5.623 5.697 5.764 5.827 5.886 5.941 5.994
30 5.330 5.414 5.490 5.560 5.624 5.684 5.740 5.792 5.841
40 5.208 5.288 5.360 5.426 5.487 5.544 5.597 5.646 5.693
60 5.089 5.164 5.232 5.295 5.352 5.406 5.456 5.503 5.546
120 4.972 5.043 5.107 5.166 5.221 5.271 5.318 5.362 5.403
∞ 4.858 4.925 4.985 5.041 5.092 5.139 5.183 5.224 5.262

597
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN EN EDUCACIÓN

Tabla XXVII (continuación)


Percentil 99
J 2 3 4 5 6 7 8 9 10
v
1 90.03 135.0 164.3 185.6 202.2 215.8 227.2 237.0 245.6
2 14.04 19.02 22.29 24.72 26.63 28.20 29.53 30.68 31.69
3 8.261 10.62 12.17 13.33 14.24 15.00 15.64 16.20 16.69
4 6.512 8.120 9.173 9.958 10.58 11.10 11.55 11.93 12.27
5 5.702 6.976 7.804 8.421 8.913 9.321 9.669 9.972 10.24
6 5.243 6.331 1.033 7.556 7.973 8.318 8.613 8.869 9.097
7 4.949 5.919 6.543 7.005 7.373 7.679 7.939 8.166 8.368
8 4.746 5.635 6.204 6.625 6.960 7.237 7.474 7.681 7.863
9 4.596 5.428 5.957 6.348 6.658 6.915 7.134 7.325 7.495
10 4.482 5.270 5.769 6.136 6.428 6.669 6.875 7.055 7.213
11 4.392 5.146 5.621 5.970 6.247 6.476 6.672 6.842 6.992
12 4.320 5.046 5.502 5.836 6.101 6.321 6.507 6.670 6.814
13 4.260 4.964 5.404 5.727 5.981 6.192 6.372 6.528 6.667
14 4.210 4.895 5.322 5.634 5.881 6.085 6.258 6.409 6.543
15 4.168 4.836 5.252 5.556 5.796 5.994 6.162 6.309 6.439
16 4.131 4.786 5.192 5.489 5.722 5.915 6.079 6.222 6.349
17 4.099 4.742 5.140 5.430 5.659 5.847 6.007 6.147 6.270
18 4.071 4.703 5.094 5.379 5.603 5.789 5.944 6.081 6.201
19 4.046 4.670 5.054 5.334 5.554 5.735 5.889 6.022 6.141
20 4.024 4.639 5.018 5.294 5.510 5.688 5.839 5.970 6.087
24 3.956 4.546 4.907 5.168 5.374 5.542 5.685 5.809 5.919
30 3.889 4.455 4.799 5.048 5.242 5.401 5.536 5.653 5.756
40 3.825 4.367 4.696 4.931 5.114 5.265 5.392 5.502 5.599
60 3.762 4.282 4.595 4.818 4.991 5.133 5.253 5.356 5.447
120 3.702 4.200 4.497 4.709 4.872 5.005 5.118 5.214 5.299
∞ 3.643 4.120 4.403 4.603 4.757 4.882 4.987 5.078 5.157

J 11 12 13 14 15 16 17 18 19
v
1 253.2 260.0 266.2 271.8 277.0 281.8 286.3 290.4 294.3
2 32.59 33.40 34.13 34.81 35.43 36.00 36.53 37.03 37.50
3 17.13 11.53 17.89 18.22 18.52 18.81 19.07 19.32 19.55
4 12.57 12.84 13.09 13.32 13.53 13.73 13.91 14.08 14.24
5 10.48 10.70 10.89 11.08 11.24 11.40 11.55 11.68 11.81
6 9.301 9.485 9.653 9.808 9.951 10.08 10.21 10.32 10.43
7 8.548 8.711 8.860 8.997 9.124 9.242 9.353 9.456 9.554
8 8.027 8.176 8.312 8.436 8.552 8.659 8.760 8.854 8.943
9 7.647 7.784 7.910 8.025 8.132 8.232 8.325 8.412 8.495
10 7.356 7.485 7.603 7.712 7.812 7.906 7.993 8.076 8.153
11 7.128 7.250 7.362 7.465 7.560 7.649 7.732 7.809 7.883
12 6.943 7.060 7.167 7.265 7.356 7.441 7.520 7.594 7.665
13 6.791 6.903 7.006 7.101 7.188 7.269 7.345 7.417 7.485
14 6.664 6.772 6.871 6.962 7.047 7.126 7.199 7.268 7.333
15 6.555 6.660 6.757 6.845 6.927 7.003 7.074 7.142 7.204
16 6.462 6.564 6.658 6.744 6.823 6.898 6.967 7.032 7.093
17 6.381 6.480 6.572 6.656 6.734 6.806 6.873 6.937 6.997
18 6.310 6.407 6.497 6.579 6.655 6.725 6.792 6.854 6.912
19 6.247 6.342 6.430 6.510 6.585 6.654 6.719 6.780 6.837
20 6.191 6.285 6.371 6.450 6.523 6.591 6.654 6.714 6.771
24 6.017 6.106 6.186 6.261 6.330 6.394 6.453 6.510 6.563
30 5.849 5.932 6.008 6.078 6.143 6.203 6.259 6.311 6.361
40 5.686 5.764 5.635 5.900 5.961 6.017 6.069 6.119 6.165
60 5.528 5.601 5.667 5.728 5.785 5.837 5.886 5.931 5.974
120 5.375 5.443 5.505 5.562 5.614 5.662 5.708 5.750 5.790
∞ 5.227 5.290 5.346 5.400 5.448 5.493 5.535 5.574 5.611

598
ANEXO. TABLAS ESTADÍSTICAS

Tabla XXVII (continuación)


Percentil 99.5
J 2 3 4 5 6 7 8 9 10
v
1 180.1 270.1 328.5 371.2 404.4 431.6 454.4 474.0 491.1
2 19.93 26.97 31.60 35.02 37.73 39.95 41.83 43.46 44.89
3 10.55 13.50 15.45 16.91 18.06 19.01 19.83 20.53 21.15
4 7.916 9.814 11.06 11.99 12.74 13.35 13.88 14.33 14.74
5 6.751 8.196 9.141 9.847 10.41 10.88 11.28 11.63 11.93
6 6.105 7.306 8.088 8.670 9.135 9.522 9.852 10.14 10.40
7 5.699 6.750 7.429 7.935 8.339 8.674 8.961 9.211 9.433
8 5.420 6.370 6.981 7.435 7.797 8.097 8.354 8.578 8.777
9 5.218 6.096 6.657 7.074 7.405 7.680 7.915 8.120 8.303
10 5.065 5.888 6.412 6.800 7.109 7.365 7.584 7.775 7.944
11 4.945 5.727 6.222 6.588 6.878 7.119 7.325 7.505 7.664
12 4.849 5.597 6.068 6.416 6.693 6.922 7.118 7.288 7.439
13 4.770 5.490 5.943 6.277 6.541 6.760 6.947 7.111 7.255
14 4.704 5.401 5.838 6.160 6.414 6.626 6.805 6.962 7.101
15 4.647 5.325 5.750 6.061 6.308 6.511 6.685 6.837 6.971
16 4.599 5.261 5.674 5.977 6.216 6.413 6.582 6.729 6.859
17 4.557 5.205 5.608 5.903 6.136 6.329 6.493 6.636 6.763
18 4.521 5.156 5.550 5.839 6.067 6.255 6.415 6.554 6.678
19 4.488 5.113 5.500 5.783 6.005 6.189 6.346 4.482 6.603
20 4.460 5.074 5.455 5.732 5.951 6.131 6.285 6.418 6.537
24 4.371 4.955 5.315 5.577 5.783 5.952 6.096 6.221 6.332
30 4.285 4.841 5.181 5.428 5.621 5.780 5.914 6.031 6.135
40 4.202 4.731 5.053 5.284 5.465 5.614 5.739 5.848 5.944
60 4.122 4.625 4.928 5.146 5.316 5.454 5.571 5.673 5.762
120 4.045 4.523 4.809 5.013 5.172 5.301 5.410 5.504 5.586
∞ 3.970 4.424 4.694 4.886 5.033 5.154 5.255 5.341 5.418

J 11 12 13 14 15 16 17 18 19
v
1 506.3 520.0 532.4 543.6 554.0 563.6 572.5 580.9 588.7
2 46.16 47.31 48.35 49.30 50.17 50.99 51.74 52.45 53.12
3 21.70 22.20 22.66 23.08 23.46 23.82 24.15 24.46 24.76
4 15.10 15.42 15.72 15.99 16.24 16.48 16.70 16.90 17.09
5 12.21 12.46 12.69 12.90 13.09 13.27 13.44 13.60 13.75
6 10.63 10.83 11.02 11.20 11.36 11.51 11.65 11.78 11.90
7 9.632 9.812 9.977 10.13 10.27 10.40 10.52 10.64 10.75
8 8.955 9.117 9.265 9.401 9.527 9.644 9.754 9.857 9.953
9 8.466 8.614 8.749 8.874 8.990 9.097 9.198 9.292 9.381
10 8.096 8.234 8.360 8.476 8.583 8.683 8.777 8.865 8.947
11 7.807 7.937 8.055 8.164 8.265 8.359 8.447 8.530 8.608
12 7.575 7.697 7.810 7.914 8.009 8.099 8.183 8.261 8.335
13 7.384 7.502 7.609 7.708 7.800 7.886 7.965 8.040 8.111
14 7.225 7.338 7.442 7.537 7.625 7.707 7.784 7.856 7.924
15 7.091 7.200 7.300 7.392 7.477 7.556 7.630 7.699 7.765
16 6.976 7.081 7.178 7.267 7.349 7.426 7.498 7.566 7.629
17 6.876 6.979 7.072 7.159 7.239 7.314 7.384 7.449 7.511
18 6.788 6.888 6.980 7.064 7.142 7.215 7.283 7.347 7.407
19 6.711 6.809 6.898 6.981 7.057 7.128 7.195 7.257 7.316
20 6.642 6.738 6.826 6.907 6.981 7.051 7.116 7.177 7.235
24 6.431 6.520 6.602 6.677 6.747 6.812 6.872 6.930 6.983
30 6.227 6.310 6.387 6.456 6.521 6.581 6.638 6.691 6.741
40 6.030 6.108 6.179 6.244 6.304 6.360 6.412 6.461 6.507
60 5.841 5.913 5.979 6.039 6.094 6.146 6.194 6.239 6.281
120 5.660 5.726 5.786 5.842 5.893 5.940 5.984 6.025 6.064
∞ 5.485 5.546 5.602 5.652 5.699 5.742 5.783 5.820 5.856

599

También podría gustarte