Está en la página 1de 445

INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 1

INTRODUCCIÓN A LA ESTADÍSTICA
Para gente de letras
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 2

Colección CAMPUS

55
Últimos títulos publicados:

25. Didáctica de la educación física. J. L. Chinchilla / Mª L. Zagalaz


26. Diversidad con calidad. L. Álvarez / E. Soler / J. A. González-Pienda / J. C. Núñez / P. González-Castro (coords.)
27. La enseñanza de la matemática. J. C. Sánchez / J. A. Fernández
28. Teoría y práctica de la educación. V. Martínez-Otero
29. Investigar. Metodología y técnicas del trabajo científico. J. M. Prellezo / J. M. García
30. Guía de recursos para la evaluación del lenguaje. J. M. Moreno / Mª E. García-Baamonde
31. Equipos y Departamentos de Orientación. L. Álvarez / G. Fernández
32. Discapacidad intelectual. J. González-Pérez
33. Necesidades educativas específicas. E. González (coord.)
34. Ciencias físicas en Primaria y Secundaria. J. Lahera / A. Forteza
35. Psicología de la Educación para una enseñanza práctica. J. González-Pérez / Mª J. Criado
36. Psicología de la Educación y del Desarrollo en la Edad Escolar. E. González / J. A. Bueno (coords.)
37. Estrategias para mejorar la práctica docente. Jesús Mª Nieto
38. Dificultades de aprendizaje e intervención psicopedagógica. Víctor Santiuste / Joaquín González-Pérez
39. Lenguaje y nuevas tecnologías. Mª Isabel Reyzábal / Víctor Santiuste
40. Educar y reeducar el hablar con cuentos. Ángel Suárez / J. M. Moreno / Mª E. García-Baamonde
41. La intervención en educación especial. F. Peñafiel / J. Fernández / J. Domingo / J. L. Navas (coords.)
42. La evaluación de aprendizajes. AA. VV.
43. Educación infantil: orientaciones y recursos metodológicos para una enseñanza de calidad.
José Quintanal / Emilio Miraflores (coords.)
44. Estadística básica aplicada a la educación. José Carlos Sánchez Huete
45. Comunidad educativa. Valentín Martínez-Otero
46. AT hoy. Ian Stewart / Vann Joines
47. Artículos seleccionados de Análisis Transaccional. Margery Friedlander (ed.)
48. La educación no formal y diferenciada. César Torres / José Antonio Pareja (coords.)
49. Análisis Transaccional I. Francisco Massó
50. La inteligencia afectiva. Valentín Martínez-Otero
51. Educación Primaria: orientaciones y recursos metodológicos para una enseñanza de calidad.
José Quintanal / Emilio Miraflores (coords.)
52. Análisis Transaccional II. Francisco Massó
53. Compendio de didáctica general. Juan Carlos Sánchez Huete (coord.)
54. El discurso educativo. Valentín Martínez-Otero
55. Introducción a la estadística. Joseph Mafokozi
56. Personalidad, madurez humana y contexto familiar. José Antonio Ríos González (dir.)
57. Parálisis cerebral. AA. VV.
58. Aprendiendo a enseñar. Lucía Hernández / Mª Ángeles Caballero
59. Fundamentos de Física para el grado de Magisterio. Jesús Lahera Claramonte
60. Formación didáctica para docentes. Lucía Pellejero / Benjamín Zufiaurre
61. La excelencia en los centros educativos. Rubén Fernández / Leonor González / Fermín Navaridas
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 3

Joseph MAFOKOZI

INTRODUCCIÓN
A LA ESTADÍSTICA
Para gente de letras

Editorial CCS
INT ESTAD 01_ENSEÑANZA MATEMAT 19/03/14 15:33 Página 4

Página web de EDITORIAL CCS: www.editorialccs.com

© Joseph Mafokozi
© 2009. EDITORIAL CCS, Alcalá 166 / 28028 MADRID
Cualquier forma de reproducción, distribución, comunica-
ción pública o transformación de esta obra sólo puede ser
realizada con la autorización de sus titulares, salvo excep-
ción prevista por la ley. Diríjase a CEDRO (Centro Español
de Derechos Reprográficos, www.cedro.org) si necesita
fotocopiar o escanear algún fragmento de esta obra.

Diagramación editorial: Concepción Hernanz


ISBN (pdf): 978-84-9842-538-3
Fotocomposición: M&A, Becerril de la Sierra (Madrid)
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 5

Índice

Introducción ................................................................................................ 13

CAPÍTULO 1
¡ESTADÍSTICA! ¿PARA QUÉ? .............................................................. 15
1.1. Una breve historia de la estadística ............................................... 16
1.2. Estadística versus «sadística» ............................................................ 18
1.3. Estadística descriptiva ..................................................................... 19
1.4. Estadística inferencial, ¿qué será eso? ............................................ 22
1.5. ¿Por qué razón estás leyendo este volumen? ................................ 23
1.6. Sí, puedes ........................................................................................ 23

CAPÍTULO 2
¿QUÉ ES UN PROBLEMA DE INVESTIGACIÓN?
¿Y SUS IMPLICACIONES? .................................................................... 27
2.1. Un vistazo sobre los métodos de adquisición del conocimiento . 28
2.2. Modos precientíficos de conocimiento .......................................... 29
2.3. El método científico y sus críticos ................................................. 31
2.4. El lenguaje de la investigación ....................................................... 31
2.5. Nivel de medida de las variables ................................................... 32
2.6. Posible manipulación de las variables medidas ............................ 35
2.7. Paradigmas, teorías e investigación ............................................... 37
2.8. El problema de investigación: un obstáculo, una duda ............... 38
2.9. Teoría como conjunto coherente de hipótesis .............................. 40
2.10. Hipótesis sustantivas ....................................................................... 41
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 6

6 Introducción a la estadística

2.11. Operacionalización y medición de las variables ........................... 42


2.12. Causalidad e inferencia causal ....................................................... 43
2.13. Idoneidad de distintos tipos de diseños de investigación
como fuentes de evidencias creíbles ............................................. 45
2.13.1. Naturaleza y función de las variables en el diseño ....... 46
2.13.2. Una aproximación a la clasificación de los diseños
según el criterio del grado de control ............................ 48
2.13.2.1. Los diseños experimentales
propiamente dichos ....................................... 48
2.13.2.2. Diseños preexperimentales ........................... 49
2.13.2.3. Diseños cuasiexperimentales ......................... 50
2.14. Validez de un diseño de investigación .......................................... 51
2.15. Tu turno ........................................................................................... 53

CAPÍTULO 3
DESCRIBIENDO MIS DATOS ............................................................. 55
3.1 Simbolización .................................................................................. 58
3.2. Frecuencias absolutas ..................................................................... 59
3.3. Frecuencias relativas ....................................................................... 62
3.4. Cálculo de los percentiles ............................................................... 63
3.5. Representación gráfica de las distribuciones de frecuencias ........ 65
3.6. Representación de las frecuencias acumuladas ............................. 71
3.7. Diagrama de tallo y hojas ............................................................... 72
3.8. Con la ayuda de la herramienta informática ................................. 74
3.9. Tu turno ........................................................................................... 78

CAPÍTULO 4
INICIANDO EL ANÁLISIS DE MIS DATOS .................................... 81
4.1. Medidas de tendencia central ......................................................... 81
4.2. Medidas de dispersión o de variabilidad ....................................... 88
4.3. Medidas de la forma de una distribución de frecuencias ............. 100
4.3.1. Asimetría ........................................................................... 100
4.3.2. Curtosis (χνρτός[kirtós]: encorvado) o apuntamiento ... 102
4.4. Tu turno ........................................................................................... 104

CAPÍTULO 5
LA CURVA NORMAL COMO MODELO
PARA ANALIZAR MIS DATOS ........................................................... 105
5.1. Propiedades de la curva normal .................................................... 106
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 7

Índice 7

5.2. Algunas características de las puntuaciones típicas ...................... 109


5.3. Proporción de sujetos o datos ........................................................ 111
5.4. Puntuaciones derivadas .................................................................. 121
5.5. Tu turno ........................................................................................... 121

CAPÍTULO 6
¿CÓMO TRATAR LA INCERTIDUMBRE
ASOCIADA A MIS DATOS? ................................................................. 123
6.1. Nociones básicas de muestreo ....................................................... 124
6.2. Errores de muestreo ........................................................................ 130
6.3. Algunas nociones de probabilidad ................................................ 131
6.4. Algunas definiciones relativas a la probabilidad ........................... 132
6.4.1. Probabilidad a priori o clásica ........................................ 132
6.4.2. Probabilidad a posteriori, empírica o frecuentista .......... 133
6.4.3. Probabilidad subjetiva ..................................................... 134
6.5. Algunas reglas básicas .................................................................... 135
6.6. Muestreo y cálculo de probabilidades ........................................... 137
6.6.1. Regla de la suma ............................................................. 137
6.6.2. Regla del producto ........................................................... 143
6.6.3. Regla de la suma y del producto ................................... 148
6.6.4. Teorema de Bayes ............................................................ 149
6.6.5. Probabilidad y variables continuas
con distribución normal ................................................... 151
6.7. Tu turno ........................................................................................... 152

CAPÍTULO 7
¿QUÉ ES UNA DISTRIBUCIÓN DE PROBABILIDADES? ........... 155
7.1. Distribución binomial ..................................................................... 157
7.2. Interpretación de la tabla de distribución binomial ...................... 161
7.3. Distribución de Poisson .................................................................. 166
7.4. Interpretación de la tabla de distribución de Poisson .................. 168
7.5. Distribución normal ........................................................................ 171
7.6. Tu turno ........................................................................................... 177

CAPÍTULO 8
¿QUÉ ES UNA DISTRIBUCIÓN MUESTRAL? ................................. 179
8.1. La ley de los grandes números y el teorema del límite central ... 181
8.2. Estimación de parámetros e inferencia .......................................... 192
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 8

8 Introducción a la estadística

8.3. Estimación por intervalo y nivel de error (α) ............................... 194


8.4. Formulación de hipótesis estadísticas ............................................ 201
8.5. Introducción al contraste de hipótesis ......................................... 203
8.6. Error del Tipo I y del Tipo II ......................................................... 206
8.7. Relaciones entre α, β, N y la potencia de una prueba ................. 207
8.7.1. ¿Qué es la potencia de una prueba? ............................... 207
8.7.2. ¿Qué relación existe entre α, β y la potencia? ................ 208
8.7.3. ¿Qué relación existe entre α, β, n y la potencia? ............ 209
8.8. ¿«Estadísticamente significativo» equivale a «educativamente
relevante»? ........................................................................................ 211
8.9. Tu turno ........................................................................................... 212

CAPÍTULO 9
¿CÓMO RELACIONAR DOS CARACTERÍSTICAS
DE UNA DETERMINADA MUESTRA? .............................................. 215
9.1. Relación y función .......................................................................... 216
9.2. Aproximación intuitiva a la medición de una relación ................. 217
9.3. Correlación y causalidad ................................................................ 220
9.4. Coeficiente de correlación: cuantificación de una relación .......... 221
9.5. Relación de rxy con la varianza común .......................................... 225
9.6. Algunas precauciones para utilizar rxy ........................................... 227
9.7. Interpretación de rxy ....................................................................... 227
9.8. Otros coeficientes de correlación .................................................. 230
9.9. Covarianza ....................................................................................... 231
9.10. Regresión lineal simple ................................................................... 233
9.11. Cálculo de los coeficientes a y b ................................................... 236
9.12. Error típico de estimación .............................................................. 238
9.13. Interpretación del error típico de estimación ................................ 240
9.14. Con la ayuda de programas informáticos ...................................... 241
9.15. Tu turno ........................................................................................... 245

CAPÍTULO 10
¿CÓMO AVERIGUAR SI DOS MUESTRAS SON SIMILARES
O NO EN UNA DETERMINADA CARACTERÍSTICA? .................. 247
10.1. Objetivo del análisis de diferencia entre dos medias ..................... 248
10.2. Caso de N grande y muestras independientes ............................... 251
10.3. Caso de N grande y muestras correlacionadas ............................... 254
10.4. Caso de N pequeña y muestras correlacionadas ............................ 256
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 9

Índice 9

10.5. Caso de N pequeña y muestras independientes ............................ 258


10.6. Con la ayuda de programas informáticos ....................................... 260
10.7. Caso de una media teórica .............................................................. 264
10.8. Tu turno ............................................................................................ 266

CAPÍTULO 11
¿CÓMO AVERIGUAR SI TRES MUESTRAS
O MÁS SON SIMILARES O NO EN UNA DETERMINADA
CARACTERÍSTICA? ................................................................................ 267
11.1. Fuentes de varianza ....................................................................... 268
11.2. Descomposición de la varianza total ............................................ 271
11.3. Requisitos del análisis de varianza ................................................ 275
11.4. Análisis de varianza simple para grupos independientes ............ 276
11.5. Sucintas consideraciones en torno a la lógica de F ..................... 280
11.6. ¿Qué hacer si se rechaza H0? ......................................................... 284
11.7. Caso de muestras correlacionadas ................................................ 287
11.8. Relación entre una variable independiente
y una variable dependiente ........................................................... 292
11.9. Relación entre la prueba t y la prueba F ...................................... 294
11.10. Con la ayuda de programas informáticos ..................................... 296
11.11. Tu turno .......................................................................................... 302

CAPÍTULO 12
¿CÓMO AVERIGUAR SI DOS O MAS VARIABLES
DEBIDAMENTE CONTROLADAS INFLUYEN
SIMULTÁNEAMENTE SOBRE UN DETERMINADO
RESULTADO? ........................................................................................... 303
12.1. Nueva fuente de variación: la interacción ...................................... 304
12.2. Análisis de varianza factorial ........................................................... 305
12.3. Acotaciones al cálculo de F factorial ............................................... 312
12.4. Posibles resultados de un análisis de varianza factorial ................ 315
12.5. Con la ayuda de programas informáticos ....................................... 317
12.6. Tu turno ............................................................................................ 326

CAPÍTULO 13
¿QUÉ HACER CUANDO LAS VARIABLES SON NOMINALES
O CONSIDERADAS COMO TALES? .................................................. 329
13.1. Cuando los datos son categóricos ................................................... 330
13.2. Objetivo de la prueba χ2 .................................................................. 330
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 10

10 Introducción a la estadística

13.3. Procedimiento A: igualdad de probabilidades ................................ 331


13.4. Procedimiento B: conociendo el tipo de distribución previa ........ 337
13.5. Procedimiento C: prueba de bondad de ajuste .............................. 340
13.6. Procedimiento D(i): asociación de dos variables ........................... 345
13.7. Procedimiento D(ii): asociación de dos variables -
caso de las tablas de contingencia 2 × 2 ......................................... 351
Opción A: calcular la discrepancia mediante
la fórmula 13.1 corregida ........................................... 353
Opción B: Hallar la discrepancia total aplicando
la fórmula unitaria ...................................................... 355
13.8. Con la ayuda de programas informáticos ..................................... 256
13.9. Tu turno ........................................................................................... 263

CAPÍTULO 14
¿QUÉ HACER CUANDO LAS VARIABLES SON ORDINALES
Y LOS GRUPOS SON INDEPENDIENTES? ..................................... 365
14.1. Cuando los datos son ordinales ................................................... 366
14.2. Objetivo de la prueba U de Mann-Whitney ................................ 366
14.3. Procedimiento ............................................................................... 366
14.4. ¿Qué ocurre si utilizas como referencia n2 en lugar de n1? ....... 370
14.5. Magnitud de U y probabilidad asociada ...................................... 371
14.6. Objetivo de la prueba H de Kruskal-Wallis ................................. 376
14.7. Procedimiento ............................................................................... 377
14.8. Consideraciones complementarias ............................................... 381
14.9. Con la ayuda de programas informáticos .................................... 381
14.10. Tu turno ......................................................................................... 387

CAPÍTULO 15
¿QUÉ HACER CUANDO LAS VARIABLES SON ORDINALES
Y LOS GRUPOS SON CORRELACIONADOS? ................................ 389
15.1. Objetivo de la prueba de rangos señalados y pares igualados
de Wilcoxon .................................................................................... 390
15.2. Procedimiento ................................................................................. 390
15.3. ¿Qué ocurre si N es mayor que 25 sujetos? ................................... 393
15.4. Objetivo de la prueba χ2r de Friedman ........................................... 396
15.5. Procedimiento ................................................................................. 396
15.6. Consideraciones complementarias ................................................. 400
15.7. Con la ayuda de programas informáticos ...................................... 400
15.8. Tu turno ............................................................................................ 406
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 11

Índice 11

APÉNDICES
Apéndice A: Soluciones ............................................................................ 407
Apéndice B: Tablas .................................................................................. 417
Tabla IIIII. Área bajo la curva normal (p > 0,5) ............................ 417
Tabla IIIII. Distribución binomial ................................................... 418
Tabla IIIII. Distribución de probabilidades de Poisson ................ 423
Tabla IIIV. Valores críticos de la distribución t de Student ........... 427
Tabla IIIV. Valores críticos de la distribución F ............................. 428
Tabla IIVI. Valores críticos de chi cuadrado (χ2) .......................... 431
Tabla IVIIa a VIIg. Valores críticos de U de Mann-Whitney .... 432 a 436
Tabla VIII. Valores críticos de H en el análisis de varianza
de una clasificación por rangos de Kruskal-Wallis ..... 437
Tabla IIIXa a IXc. Valores críticos de χ2r en el análisis de varianza
de dos clasificaciones por rangos de Friedman .... 439 a 440
Tabla IIIX. Valores críticos de T en la prueba de los rangos
señalados de pares igualados de Wilcoxon ............... 441

Bibliografía ............................................................................................ 443


INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 12
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 13

Introducción

Si es la primera vez que te aproximas a esta materia, quizá te preguntes qué


puede tener que ver con la formación de un maestro, pedagogo, psicopedago-
go, logopeda, educador social o incluso profesor de Educación Secundaria.
Pues de entrada te diré que también «gente de letras» utiliza la herramienta esta-
dística para escudriñar su entorno. Eso sí, no faltan quienes consideran que es-
to es una osadía que la «gente de letras» no se puede permitir. Y sin embargo,
hay sobradas razones para entrenarse en el uso de esta herramienta.
Piensa un poco. ¿Seguro que en tu vida diaria no utilizas resultados esta-
dísticos? ¿Cómo sabes, por ejemplo, que las mujeres tienden a cobrar menos
que los hombres (¡menuda injusticia!)? Lo has leído u oído en alguna ocasión
y no se te ocurre pensar que esa información pueda ser errónea y, sin embar-
go, no la has comprobado personalmente. ¿Te has parado a pensar cómo pro-
cedió el equipo de investigadores que emitió una conclusión tan sensible? Se-
guro que no fue de oficina en oficina, de taller en taller, de tienda en tienda...,
preguntando a hombres y mujeres cuánto cobraban por su trabajo.
Otro ejemplo: estoy seguro de que ya has oído hablar del IPC (índice de
precios al consumo) y del impacto que tiene, por ejemplo, el precio del pe-
tróleo en su incremento. ¿Crees que para computar este índice se necesita
preguntar a todos los españoles con capacidad para consumir sobre cualquier
tipo de gastos? Te aseguro que a mí nadie me ha preguntado hasta ahora y
probablemente a ti tampoco. Y, sin embargo, ni a ti ni a mí se nos ocurre po-
ner en duda la bondad de esta información.
Más ejemplos: habrás oído y probablemente estarás de acuerdo en que los
niños no deben ver determinados programas de televisión si no es bajo la su-
pervisión de sus padres. ¿Cómo se ha llegado a formular un consejo de estas
características? Para empezar, los investigadores no han podido ir de casa en ca-
sa observando cómo los padres actúan con sus hijos ante la «caja tonta». Tam-
poco han podido observar a todos los niños en tanto que consumidores de
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 14

14 Introducción a la estadística

contenidos televisivos. Pero han procedido de algún modo para recoger infor-
mación que, una vez analizada, sugería que los padres debían actuar en una
determinada dirección para promover el desarrollo psicosocial de sus hijos.
Si dedicas un tiempo a pensarlo un poco, verás que a lo largo de un solo
día manejas una cantidad impresionante de este tipo de datos. Ahora intenta
estimar la cantidad de informaciones de similares características que tendrás
que manipular a lo largo de tu período de formación.
A estas alturas te habrás dado cuenta de que la estadística es tan sólo una
herramienta, entre otras, que tiene por objetivo organizar y analizar la informa-
ción para facilitar su comprensión. Si tomas los datos que puedes observar de
modo aislado, difícilmente podrás sacar una conclusión que resulte inteligible no
sólo para ti sino también para aquéllos a los que puedas desear comunicarla.
Por cierto, ¿sabías que el ser humano, y con toda probabilidad la mayoría
de los seres vivos, tiende a agrupar la diversidad de estímulos que le llegan
para que éstos puedan tener un sentido global? Fíjate: cuando sales de tu casa
lo primero que ves no es un camino más o menos bien asfaltado, sino una
clase de pista que, por formación recibida, clasificas inconscientemente en el
grupo de las vías de tránsito llamadas acera, calle, avenida, paseo, etc. El ob-
jeto compacto que ves moverse sobre el firme de la calle no es un simple
objeto en movimiento, seguido de otros muchos más o menos similares, sino
que estos objetos automóviles los tienes debidamente agrupados en turismos,
taxis, autobuses, autocares, camiones, etc. Lo mismo ocurre cuando entras en
una sala; clasificas lo que allí sucede como cine, clase, conferencia, debate,
etc. Lógicamente, en cada caso sabes cómo actuar, siempre que hayas hecho
una clasificación correcta. Aquello que no entra en el grupo recibe un trato
diferente.
Cuando se clasifican eventos siempre cabe la posibilidad de que interven-
gan estímulos extraños que dificultan el agrupamiento. Te puedes encontrar
con un autoturismo que arrastra un remolque sin que por ello lo clasifiques
como un camión. Tú y yo damos crédito a los resultados de determinados es-
tudios, como los comentados más arriba, porque creemos que los investiga-
dores han hecho una buena clasificación de los eventos observados y han lle-
vado a cabo una adecuada organización y análisis de los más apropiados.
El objetivo de este libro es proporcionarte una comprensión de las herra-
mientas básicas y cómo se utilizan en esta tarea. Más aún, al final de este ca-
mino, deberías ser capaz de utilizarlas con cierta soltura o, como mínimo, ser
capaz de leer y comprender el contenido de las publicaciones de los investi-
gadores de tu ámbito.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 15

Capítulo 1
¡ESTADÍSTICA! ¿PARA QUÉ?

Si es tu primer contacto con esta materia, probablemente te preguntes por


qué hace falta justificarla en el marco de tus asignaturas. Considérala como
una más y pasa al siguiente punto.
Este apartado está pensado sobre todo para quienes tuvieron algún en-
cuentro previo más bien poco afortunado o que llegaron con cierta apren-
sión. Es probable que hayan oído comentarios similares a los siguientes: «Tal
profesor de estadística es un hueso duro de roer»; «La estadística no la aprue-
bas ni con recomendación»; «No me gusta la estadística porque me recuerda
las matemáticas»; «La estadística tiene un razonamiento tan enrevesado, que
no puedo con ella»; «Por mucho que lo intento, no me entero de nada», etc.
«Encima eso del proceso de datos es una verdadera gaita; no veo qué tiene
que ver una cosa con la otra.»
Bueno, respira hondo. No eres ni seguramente serás el único en pensar así
en algún momento de tu contacto con la estadística. Es muy probable que yo
mismo pensara así cuando me tocó sentarme ante mis profesores, aunque
ahora mismo no me acuerde muy bien si eso ocurrió así. No digo que la esta-
dística sea pan comido, pero tampoco es ese hueso imposible de roer. Para
muestra vale un botón: el que suscribe, logró aprender algo, siendo de letras,
como dicen muchos, para explicar su sensación de desamparo ante el desa-
fío. Bromas aparte, es probable que haya cursos de estadística que bien po-
drían describirse como cursos de «sadística». Puede ser que los libros se escri-
ban para iniciados y resulten incomprensibles y/o aburridos para el resto de
los mortales. Espero que no sea el caso de éste.
Si este libro ha llegado a tus manos es que buscas, o quizá tu mentor, una
aproximación diferente, tal vez menos desafiante o frustrante. Sin abandonar
la pretensión de que entiendas y quizá llegue a gustarte, en este libro se
adopta un enfoque que intenta simplificar lo que necesitas saber acerca del
uso de la estadística como herramienta valiosa que es. Espero que el recurso
a una presentación inicial algo jocosa y desenfadada rebaje esa tensión que
parece acompañar el estudio de la estadística y podamos entre ambos lograr
el principal objetivo de este libro: menos «sadística» y más estadística.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 16

16 Introducción a la estadística

1.1. UNA BREVE HISTORIA DE LA ESTADÍSTICA

No parece que éste sea el mejor momento para hacerte conocer la apasionan-
te historia de la estadística. Pero sí puede ser interesante realizar una pequeña
reflexión histórica sobre su evolución. Tengo ciertas dudas de que quieras sa-
ber por qué razón tienes que aprender algo que a primera vista te puede re-
sultar hasta repulsivo. Sin embargo, un poco de historia quizá te ayude a si-
tuar las técnicas de las que hablaremos más adelante en un marco que les
pueda dar sentido más allá de lo meramente coyuntural. Por otro lado, puede
ser interesante saber por qué se enseña estadística en todos los ámbitos cien-
tíficos, desde las ciencias puras hasta las ciencias humanas.
Como te decía en la introducción, clasificar es una actividad inherente a
cualquier ser vivo: distinguir los estímulos potencialmente dañinos de los
que favorecen la supervivencia de la especie es fundamental. Los diferentes
estadios evolutivos que el ser humano tuvo que superar le llevaron del me-
ro reconocimiento de tales estímulos a sucesivos y denodados esfuerzos por
controlar su entorno. Este control implicó una cuidadosa recogida de infor-
mación. Esta información le permitió averiguar, por ejemplo, que se dispone
de más cantidad de comida si se produce que si se recoge en la naturaleza
o que la cantidad de trigo recogida se incrementa en función de la cantidad
de abono, etc.
Contar cantidades parece ser un método de incremento del conocimiento
que aún hoy sigue siendo útil. Con el recuento se desarrolla la aritmética y las
matemáticas y se incorpora paulatinamente ese lenguaje formalizado en el ha-
bla ordinario. Sin embargo, no faltan quienes manifiestan cierta desconfianza
hacia esos matemáticos cuyo lenguaje no resulta siempre comprensible. Una
desconfianza que se remonta probablemente a los primeros que se atrevieron
a utilizar un vocabulario matemático para informar a sus conciudadanos y
que se observa aún hoy.
Los albores de la estadística moderna suelen situarse en el siglo XVII cuan-
do se recogen los primeros datos relativos a poblaciones, pero seguro que se
pueden encontrar rastros en la Antigüedad y más allá. Los historiadores sugie-
ren que los comienzos más lejanos de la estadística se hallan hacia el año
3050 antes de Cristo, en el antiguo Egipto: ya por aquella época los faraones
mandaron a sus escribas recopilar datos relativos a la población y a la riqueza
del país.
¿Sabías que la palabra «estadística» fue acuñada por el profesor Godofredo
Achenwall en 1760 a partir del término italiano «statista» (estadista), una pala-
bra derivada del latín «status» (estado o situación)? Así pues, etimológicamente
hablando, parece que la estadística se presenta como una herramienta básica
para un gobernante que pretende ser eficaz en su tarea: actuar teniendo en
cuenta una información cuantitativa lo más veraz posible. Ahora bien, lo mis-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 17

¡Estadística! ¿Para qué? 17

mo que sirve de ayuda para el gobernante, también puede ser útil para el pe-
dagogo, psicopedagogo, logopeda, educador social o profesor de Educación
Secundaria.
Con el incremento de los conocimientos científicos, surge la necesidad de
desarrollar herramientas de análisis susceptibles de ayudar a descubrir res-
puestas a las numerosas preguntas que los estudiosos se plantean. A título de
ejemplo, Francis Galton (1822-1911) (por cierto, primo de Charles Darwin
[1809-1882]), fue el primero en idear una técnica de análisis que le permitió
superar el mero recuento y cuantificar la similitud de la inteligencia entre los
miembros de una misma familia; llamó a este índice coeficiente de correla-
ción. Las ciencias sociales y de la conducta adoptaron rápidamente este índi-
ce. El prominente matemático británico Karl Pearson (1857-1936) mejoró la
propuesta de sir Francis Galton con su índice producto-momento.
Para ser exacto, una gran parte de las técnicas estadísticas que vas a
aprender proceden de los campos de la agricultura, astronomía e incluso de
la política. Su aplicación al ámbito humano es relativamente tardía.
Con el siglo XX se produce una explosión de propuestas en cuanto a técni-
cas de análisis. Al principio se hacen las primeras propuestas para analizar las
diferencias entre las puntuaciones medias de dos grupos. La comunidad cien-
tífica no sólo las acoge con mucho interés, sino que las utiliza abundantemen-
te e incluso las mejora.
La irrupción del ordenador personal hacia los años 1980 supone una ver-
dadera revolución en lo que concierne a las técnicas de análisis y a la investi-
gación científica en general: se abre el horizonte de las técnicas analíticas
avanzadas a cualquiera que quiere explorar nuevas preguntas o pasar revista
a las antiguas. Los tediosos y largos cálculos manuales son rápidamente susti-
tuidos por unas pocas horas para la preparación de los datos y apenas unos
pocos minutos o segundos para la obtención de los resultados.
Ahora bien, esta irrupción viene acompañada tanto por un efecto positivo
como por uno negativo: por una parte, para los análisis que requiere la ma-
yoría de los investigadores, ya no se necesita recurrir a potentes ordenadores,
por lo general bastante caros; por otra, el uso de esta nueva herramienta exi-
ge un nuevo tipo de alfabetización, la alfabetización informática. Dicho de
otro modo, un estudiante que no está familiarizado con la informática, como
usuario suficientemente informado, tiene dos dificultades añadidas. En primer
lugar, no domina lo esencial de la gramática informática: el lenguaje informá-
tico tiene una gramática que responde a una lógica muy sencilla pero poco
flexible y de la que hay que conocer los pocos fundamentos que exige. Te-
niendo en cuenta que esta gramática se repite en la mayoría de los programas
informáticos de uso generalizado, con conocer uno o dos con cierta soltura,
el resto no supone ningún esfuerzo prohibitivo. En segundo lugar, el carácter
mágico que adquiere el ordenador ante algunos alumnos —espero que no
sea tu caso— lo convierte en ese ser misterioso en el que se introducen unos
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 18

18 Introducción a la estadística

datos de procedencia misteriosa —el formato para la introducción de los da-


tos es otro misterio— y de donde salen unos resultados tan misteriosos como
el mismo ordenador. ¡Demasiados misterios juntos! En estas condiciones, el
estudiante pasa por alto una verdad muy simple: de unos datos malos sólo
pueden salir resultados igualmente malos. No hace mucho había una tercera
dificultad añadida: todos los programas venían escritos en inglés, lengua aún
desconocida para una proporción preocupante de alumnos. En las salidas de
ordenador de algunos programas traducidos a medias, aún aparecen resulta-
dos escritos en la lengua hablada en el otro lado del Canal de la Mancha o
del Atlántico, como prefieras.
Si quieres aprender más detalles sobre la historia de la estadística, ¿por
qué no echas una ojeada sobre la siguiente página: <http://www.eumed.net/
cursecon/libreria/drm/cap1.pdf>. Espero que la página siga activa cuando es-
te libro llegue a tus manos.
Hoy en día, campos tan diversos como la medicina, la criminalística o la
psicología recurren básicamente a las mismas técnicas analíticas para respon-
der preguntas propias de cada ámbito. Evidentemente, las técnicas de recogi-
da de datos difieren; sin embargo, los análisis tienden a asemejarse aunque
lleven nombres diferentes.
¿Te imaginas poder leer el informe de investigación de cualquier campo
científico y poder comprender el vocabulario estadístico que se utiliza? Sólo te
queda ser un erudito para comprender prácticamente cualquier cosa. Genial,
¿verdad? Todo esto por unos pocos créditos.

1.2. ESTADÍSTICA VERSUS «SADÍSTICA»


Este volumen pretende ser un libro acerca de la estadística básica y de cómo
aplicarla a situaciones relativas a la educación en sus diferentes aspectos, sin
pasar por alto el análisis y la comprensión de la información.
En nuestro caso, obviamos la definición formal de lo que es la estadística y
su objeto, y simplemente consideramos que la estadística se entiende como un
conjunto de herramientas y técnicas utilizadas para describir, organizar e inter-
pretar los datos y los resultados de los análisis. Puedes estar seguro de que an-
te semejante definición, un matemático puro y duro no dudaría en echarme a
los leones, sin pensarlo dos veces. Pero es que ni tú ni yo queremos ser mate-
máticos, ni siquiera estadísticos; lo único que nos interesa es utilizar esta herra-
mienta para lo que nos importa: la investigación socioeducativa.
Los datos que van a ser objeto de descripción y análisis a lo largo de este
volumen se toman de un estudio realizado con un grupo de 93 alumnos ma-
triculados en una asignatura en la que se imparten contenidos básicos relacio-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 19

¡Estadística! ¿Para qué? 19

nados con la investigación en el ámbito educativo. De cada alumno se reco-


gen diversos tipos de información (el conjunto de estas informaciones se ex-
plica al final del capítulo 2).
En este ejemplo, como en otros muchos que se te pueden ocurrir, se reco-
gen datos, se organizan, se resumen, se analizan y, finalmente, se interpretan.
En este libro se pretende que aprendas a recoger, organizar y resumir los da-
tos mediante la estadística descriptiva; y como complemento imprescindible
para una interpretación de datos más completa, aprenderás la utilidad de la
estadística inferencial.

ESTADÍSTICA DESCRIPTIVA 1.3.

La estadística descriptiva se utiliza para organizar y describir las características


de un conjunto de datos.
Por ejemplo, en la tabla 1 de la página siguiente se exponen los datos reco-
gidos de 40 de los 93 alumnos del estudio antes mencionado. Observa que, en
caso de estudios reales, puede que falte algún dato. Se trata de una situación
completamente normal en cualquier recogida de datos en ciencias humanas.
Eso no debe preocuparte en exceso, pero debes procurar que no te falten de-
masiados datos.
Si necesitaras saber con qué especialidad de Bachillerato se identifica la
mayoría de los alumnos matriculados en esta clase, podrías recurrir a un es-
tadístico descriptivo como la moda; en este caso, la mayoría procede de le-
tras. Si quisieras conocer la puntuación media en lógica, podrías calcular otro
estadístico como la media. Ambos estadísticos se utilizan para describir los
datos de un grupo de sujetos, pues nos permiten representar mediante un
único guarismo las características de un amplio conjunto de datos, como los
40 alumnos de este grupo.
Como puedes ver es bastante simple: para saber de qué especialidad pro-
cede la mayoría de los alumnos matriculados en esta clase, basta identificar el
valor más común; para determinar la media de conocimientos de lógica de
este grupo de alumnos, es suficiente con dividir la suma de sus puntuaciones
por 40. Y así sucesivamente.
20

TABLA 1
RECOGIDA DE DATOS

Especialidad Lógica Probabilidad Muestreo Inferencia Correlación Conocimientos Competencia


previos percibida
Ciencias 7 3 1 2 2 3,75 6,5
Ciencias 8 5 1 2 1 4,25 5,83
Letras 8 5 1 5 4 5,75 5,83
Letras 8 6 1 4 2 5,25 5,33
Letras 6 5 0 4 3 4,5 6
Letras 8 3 2 4 2 4,75 5,33
Letras 6 5 1 1 3 4 .
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 20

Letras 10 1 0 1 0 3 .
Letras 7 4 2 1 3 4,25 5,17
Letras 9 4 1 2 2 4,5 5,33
Letras 7 4 0 1 1 3,25 6,18
Letras 6 5 1 3 2 4,25 6,17
Ciencias 7 3 1 3 2 4 5,67
Letras 9 8 0 2 2 5,25 7,17
Ciencias 9 1 2 1 1 3,5 5,83
Letras 11 8 2 5 1 6,75 5,5
Letras 9 4 1 3 2 4,75 .
Letras 9 6 1 2 2 5 5,83
Letras 8 3 2 0 2 3,75 6,17
Letras 3 5 1 1 3 3,25 5,83
Introducción a la estadística
Especialidad Lógica Probabilidad Muestreo Inferencia Correlación Conocimientos Competencia
previos percibida
Letras 10 4 1 2 2 4,75 6,33
Letras 7 5 1 2 3 4,5 6
Ciencias 8 6 2 3 1 5 5,33
¡Estadística! ¿Para qué?

Letras 8 3 1 2 4 4,5 6,5


Letras 9 4 1 2 4 5 6
Letras 9 3 1 0 1 3,5 5,33
Letras 8 5 2 2 0 4,25 6
Letras 8 4 1 4 1 4,5 6
Letras 6 2 0 2 1 2,75 7,09
Letras 8 2 1 2 2 3,75 5,17
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 21

Ciencias 9 3 0 1 3 4 4,83
Letras 9 6 2 2 2 5,25 6,5
Letras 6 4 0 1 0 2,75 .
Letras 8 4 1 3 3 4,75 7,33
Letras 7 4 0 0 3 3,5 6
Letras 8 4 2 2 3 4,75 6,33
Letras 10 3 2 3 3 5,25 .
Letras 7 6 0 1 2 4 6,83
. 8 2 1 0 3 3,5 4,17
Letras 6 6 1 0 0 3,25 6,55
21
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 22

22 Introducción a la estadística

1.4. ESTADÍSTICA INFERENCIAL, ¿QUÉ SERÁ ESO?

Pero, ¿qué es la inferencia? Según el diccionario de la Real Academia Españo-


la, la inferencia es una «operación intelectual por la que se pasa de una ver-
dad a otra que se juzga en razón de su unión con la primera: la deducción es
una inferencia». ¿Te acuerdas de cómo se llega a una conclusión lógica des-
pués de aplicar las reglas de inferencia a una o varias proposiciones tomadas
como hipótesis en el marco de una teoría deductiva? ¿Lo estudiaste alguna
vez? Si aún tienes tus libros de filosofía de Bachillerato, échales una buena
ojeada. Volveremos sobre este punto en el capítulo 8.
Este tipo de estadística se utiliza para llevar a cabo inferencias a partir de
grupos pequeños de datos, como los 93 alumnos, a un grupo posiblemente
mayor, como todos los alumnos matriculados en esta materia.
El grupo más pequeño recibe el nombre de «muestra», que es un subcon-
junto de un grupo más amplio llamado «población».
Veamos otro ejemplo. El director del centro educativo donde prestas servi-
cio te pide que determines el nivel de aceptación mutua de los alumnos au-
tóctonos e inmigrantes. Podrías tomar los datos de todos y cada uno de los
alumnos, pero el esfuerzo resulta prohibitivo; por tanto, decides tomar un
grupo más reducido en representación de cada subconjunto. Si haces las co-
sas correctamente, puedes extrapolar lo que descubras al conjunto del centro.
Lo mismo se hace en otros ámbitos. Para averiguar cuál podría ser el
efecto de un medicamento, los investigadores de la medicina no lo aplican
sobre toda la población de enfermos, sino sobre una muestra. Luego extra-
polan los resultados obtenidos a toda la población de sujetos aquejados de
una determinada dolencia. Para saber cómo reacciona la población española
ante la llegada de los inmigrantes, se observa a un pequeño grupo de espa-
ñoles y se concluye que probablemente el resto mostrará un tipo de con-
ducta similar, etc.
En resumen, la estadística es una herramienta que nos ayuda a compren-
der mejor el mundo que nos rodea. Lo hace mediante la organización de la
información recogida. Además, nos permite hacer previsiones sobre cómo las
características estudiadas podrían afectar a otros contextos más o menos pare-
cidos. La estadística descriptiva es un paso previo a la estadística inferencial;
ésta es la continuación lógica de la estadística descriptiva, puesto que no pa-
rece tener demasiado interés científico limitarnos a describir una o varias ca-
racterísticas de un único grupo de sujetos sin intentar extrapolar lo descubier-
to a grupos similares más amplios (tendremos ocasión de volver sobre esta
cuestión más adelante).
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 23

¡Estadística! ¿Para qué? 23

¿POR QUÉ RAZÓN ESTÁS LEYENDO


ESTE VOLUMEN? 1.5.

¿Quién sabe? Bueno, tú seguramente sí lo sabes o quien te haya sugerido to-


mar prestado este libro de la biblioteca o comprarlo para tu uso y disfrute.
Son muchas las razones, algunas muy buenas, para estudiar esta materia.
Si has leído, siquiera superficialmente, las páginas anteriores, ya deberías ha-
berlo descubierto. Si resulta que estás matriculado en una asignatura troncal u
obligatoria que trata de cuestiones relativas a la investigación, considérate un
estudiante de estadística y vete mentalizándote para sacarle el máximo benefi-
cio. Y si has elegido esta materia porque te gusta la investigación, entonces
bienvenido, y que la disfrutes.
Quizá convenga que te animes pensando que:
1. Si la materia que tienes delante de ti es troncal u obligatoria, no podrás
sacar tu título si no la apruebas. En consecuencia, vale la pena empezar
a trabajar ya para comprenderla y asimilarla.
2. Si la has elegido por tu cuenta, esto te señala como una persona capaz
de comprometerse con una materia cuyo nivel de dificultad está por
encima de la media. Por otra parte, puedes estar seguro de que te pro-
porcionará unas habilidades que otros querrían para sí.
3. La estadística básica es de hecho un desafío intelectual al que posible-
mente no estés acostumbrado. Se necesita una cierta dosis de capacidad
de razonamiento, algo de matemáticas —más bien aritmética— y bastan-
te capacidad de integración de ideas y de aplicación. Piensa sobre todo
en la enriquecedora experiencia intelectual que implica aprender una dis-
ciplina completamente nueva en la que vas a poder ejercitar algunas ha-
bilidades que otras materias de tu plan de estudios descuidan.
4. La estadística mejora tu capacidad de aprendizaje en otras áreas como
las ciencias sociales o de la conducta, pues potencia tu capacidad de
comprensión de lo que lees en las revistas y de lo que hacen o discu-
ten tus profesores y compañeros más adelantados.
5. Puedes demostrarte a ti mismo, y a todo el mundo, que eres capaz de
responder al desafío ante una materia que se suele presentar como muy
difícil, sin arredrarte.

SÍ, PUEDES 1.6.

Posiblemente éste no sea el formato de los libros de estadística que te reco-


miendan habitualmente. Pero no deja de ser otro libro de estadística. En este
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 24

24 Introducción a la estadística

caso, pretende ser algo diferente: no presupone casi nada en cuanto a lo que
deberías saber antes de empezar y avanza paso a paso, dejando que progre-
ses a tu ritmo. Ahora bien, no olvides que esta materia tiene un ritmo propio
así como un tiempo limitado a lo largo del curso académico. Es una limita-
ción que tendrás que tomar en consideración. Así pues, dedícale el tiempo
que tú necesitas y que la materia reclama.
Generalmente se dice que esta materia es difícil. No puedo decir que esta
impresión sea completamente falsa porque ciertas partes son notablemente
más exigentes que otras. Me consta que la elegante simplicidad de algunas
fórmulas que tendrás que utilizar —no memorizar— no oculta la necesidad
de que alcances un cierto nivel de comprensión lectora. Sin embargo, si otros
cientos de alumnos como tú la han dominado, ¿por qué tú no?
Toma en cuenta las siguientes pistas a la hora de programar tus activida-
des en esta materia:
1. Si estás matriculado en la universidad es que no eres tan tonto
como podrías tener la tentación de creer ante esta materia. Considera
que la estadística es igual a cualquier otra. Haz caso a tu profesor:
asiste a todas las clases, mantén tus apuntes al día, prepara los ejerci-
cios sugeridos en su totalidad o hasta donde puedas y, sobre todo, no
te limites a copiar las soluciones.
2. ¿Es esta materia difícil? Sí y no. Si prestas atención sólo a aquéllos
que tuvieron un infausto encontronazo con ella, desde luego que tra-
bajarás con la sensación de estar ante una tarea imposible. Ahora
bien, toma la precaución de averiguar si trabajaron seriamente, si asis-
tieron a clase de forma regular, si realizaron los ejercicios propues-
tos..., si pusieron todo su empeño. No olvides que es más fácil oír
quejas que elogios. Te aconsejo que empieces el estudio de esta ma-
teria con una actitud expectante, nada de derrotismo inicial. Habla
también con quienes sí tuvieron una experiencia positiva. Quizá te
orienten en cuanto al mejor modo de enfrentarte a la estadística.
3. Esta materia está configurada como un edificio cuya construc-
ción se basa en un principio muy simple: se construye en altura em-
pezando por los cimientos. No se puede pasar a la etapa siguiente si
la anterior está sin terminar; el riesgo de que el edificio acabe desplo-
mándose, se incrementa a medida que se sube en altura. Está en tus
manos evitar que eso ocurra: no faltes a ninguna clase. Recuerda que
cada clase es un ladrillo absolutamente necesario para la correcta ter-
minación del edificio. Utiliza este volumen con esa idea en mente: no
intentes avanzar si no has entendido a fondo la idea que se desarrolla
en cada capítulo.
4. En caso de duda, pregunta en primer lugar a tu profesor. Si no
entiendes lo que se te está enseñando, puedes estar absolutamente
seguro de que no eres el único. Si tus compañeros no preguntan eso
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 25

¡Estadística! ¿Para qué? 25

no quiere decir que lo entienden mejor que tú, sino que quizá no se
atreven a exponer sus dudas. Juraría que más de uno agradece que
un compañero pregunte lo que no se atreve a formular en voz alta él
mismo. Por otra parte, tu profesor agradece que le hagas preguntas
que le permitan aclarar dudas (no tanto repetir una frase que no has
podido copiar literalmente).
5. No plantees tus dudas a tus compañeros; como te decía, es posible
que tengan las mismas dudas que tú. Es conveniente formar un
grupo de trabajo desde el principio del curso, no sólo para llevar
a cabo los tradicionales trabajos de equipo, sino sobre todo para fo-
mentar la ayuda y beneficio mutuos en el estudio de esta materia. De
las cogitaciones del grupo podrían salir las dudas que se plantearían
al profesor. Conviene fijar un horario de trabajo semanal durante el
cual los componentes del equipo trabajan los ejercicios de cada capí-
tulo o se interrogan mutuamente sobre el contenido de la materia.
6. Haz los ejercicios sugeridos al final de cada capítulo. Están dise-
ñados para ayudarte a revisar y afianzar lo aprendido en el capítulo,
aplicar los conceptos y, sobre todo, incrementar tu nivel de confianza
(y autoestima) en tus propias destrezas y habilidades en esta materia.
7. Hacia el dominio de esta materia por la práctica. La estadística
no es diferente a otras asignaturas: debes utilizar lo que aprendes una
y otra vez para dominar las diferentes ideas y técnicas. Esto significa
práctica, práctica y más práctica. Ya sabes, a Dios rogando y con el
mazo dando.
8. La materia es lo que es; el profesor no puede reducirla sin per-
juicio para tu aprendizaje. Recuerda que la estadística es como un
edificio donde cada capítulo es una planta: no se puede suprimir una
planta sin que el edificio peligre en cuanto a su equilibrio y consisten-
cia. Por tanto, no le pidas al profesor que suprima algún capítulo por-
que quien sale perjudicado eres tú; más bien pídele que te ayude a te-
ner una visión lo más completa y equilibrada posible de esta materia.
9. Pásatelo bien. Pues sí, y espero que no te suene a chirigota. Es
más divertido salir vencedor que vencido. Dominar una materia nueva
es siempre excitante y satisfactorio. Si lo has experimentado alguna
vez, sabes a qué me refiero. Ahora bien, organízate adecuadamente,
trabaja duro y no pierdas de vista el objetivo final.
10. Empieza por completar tu cambio de actitud, si repites esta ma-
teria. Es posible que tengas la impresión de que, diga lo que diga,
esta materia es un verdadero laberinto de fórmulas, ideas inconexas e
insoportable sufrimiento neuronal. No puedo negar que tu experien-
cia es tuya y sólo tuya y que por tanto sólo tú puedes juzgarla. Si
nunca has asistido a clase, tu temor únicamente es el reflejo de lo que
te cuentan tus compañeros o amistades. Atrévete a hacerte una idea
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 26

26 Introducción a la estadística

propia. Y si ya has tenido ocasión de presenciar alguna clase de esta


materia, pregúntate con qué actitud lo hiciste. Recuerda que el profe-
sor no está para buscar tu suspenso.
11. Si suspendes un curso preparatorio, no es aconsejable que te
matricules en un curso más avanzado. Lo mismo que se desacon-
seja pasar al siguiente capítulo sin haber dominado el capítulo ante-
rior es lógico considerar una pérdida de tiempo probar suerte con
cursos más avanzados. Y si a eso se añade que generalmente la mate-
ria que se imparte en ambos cursos coincide en el tiempo (horario se-
manal), el alumno suele optar por abandonar el curso anterior creyen-
do que el contenido es el mismo y, por tanto, su presencia en clase es
irrelevante. Craso error. Si no pudo aprobar acudiendo a clase con
cierta regularidad, ¿qué le permite esperar aprobar sin aparecer por el
aula? No te extrañes si le oyes al profesor afirmar que un repetidor
tiene la misma probabilidad de aprobar —o incluso menos— que
quien cursa la materia por primera vez. Si alguna vez has tenido que
presentarte a un examen en la convocatoria de septiembre, sabes a
qué me refiero: las vacaciones veraniegas hacen verdaderos estragos.
¡Qué hará entonces todo un curso!
12. Procura comprender antes que esforzarte por memorizar. La ex-
periencia de muchos de tus compañeros sugiere que la memorización
es una tarea prácticamente inútil en esta materia, más inútil si cabe en
relación con la solución de problemas. Lo más importante es hacer to-
do lo posible por comprender el objetivo de esta materia, razonar ló-
gicamente. Es muy poco probable que el profesor te plantee un pro-
blema para el que tengas necesidad de recordar más allá del 10-20%
del contenido de la materia para poder responder correctamente.
13. Se lo expliqué a un compañero y aprobó, y sin embargo yo sus-
pendí. ¡Curiosa confidencia! Pues sí, más de un alumno comenta des-
consolado que el compañero a quien estuvo dando explicaciones
aprobó mientras él no. Quizás debería preguntarse si lo que hizo que
su compañero aprobara fueron sus explicaciones o justo lo contrario,
o sea lo que le permitió percatarse del error en que estaba.
14. Soy de letras o humanidades y no puedo con los números. Sé
realista: desde antes de levantarte por la mañana estás tratando con
números. Intenta averiguar la proporción de tus actividades diarias li-
bres de cualquier referencia al número. Casi ninguna: incluso tu des-
pertador se rige por el número. Si el número es una parte sustancial
de tu vida, incorpóralo a tus quehaceres para aprender esta materia.
Por otro lado, en nuestro caso, el número es sólo un instrumento. Se-
guro que no dejarás de ser de letras o humanidades por utilizar este
lenguaje con sentido y hasta con gusto.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 27

Capítulo 2
¿QUÉ ES UN PROBLEMA DE INVESTIGACIÓN?
¿Y SUS IMPLICACIONES?

Al finalizar este capítulo deberías ser capaz de:


• Reconocer las manifestaciones observables de un problema sus-
ceptible de ser investigado en el contexto de las ciencias sociales.
• Seleccionar las manifestaciones medibles y relevantes en el con-
texto de las ciencias sociales.
• Traducir las manifestaciones seleccionadas a un lenguaje de variables.
• Identificar el nivel de medida de las variables.
• Formular hipótesis sustantivas relativas al problema de investigación.

Si has hojeado, siquiera por curiosidad, alguna de las numerosas revistas gra-
tuitas que encuentras en el campus de tu universidad, habrás leído comenta-
rios como los siguientes:
• Una tesis doctoral realizada «por un tal» demuestra que el aprendizaje
de nuevas tecnologías aumenta la atención, la velocidad de compren-
sión, así como la discriminación visual en la persona con síndrome de
Down y otras discapacidades intelectuales.
• De todo lo que forma el universo, menos del 4% es la materia que per-
cibimos, la materia que conforma aquello que somos capaces de visua-
lizar y que lo compone. El resto, es decir, casi todo, es algo práctica-
mente desconocido para los científicos.
• Entre un 25 y un 45% de los pacientes que sufren un infarto cerebral,
evolucionan mal a pesar de los tratamientos. En estos pacientes se ob-
serva un nivel elevado de glutamato, tanto en el plasma como en el nú-
cleo cefalorraquídeo.
• Un informe de la OCDE advierte: «Los países que invierten con decisión
en educación, se benefician económica y socialmente».
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 28

28 Introducción a la estadística

Cuando lees unas afirmaciones como las anteriores, algunas parecen tan
evidentes, que ni siquiera les prestas atención, y otras parecen tan inverosími-
les, que apenas excitan tu curiosidad. Sin embargo, si te paras a pensar un
poco, verás que cada una implica en realidad más preguntas que respuestas.
Imagínate la cantidad de afirmaciones de este tipo que pasan completamente
desapercibidas a tus sentidos. Para quien tiene sus sentidos en alerta, cada
una de las hipotéticas respuestas plantea a su vez preguntas como aquéllas
que en su día pusieron en marcha el proceso de búsqueda. Ahora bien, lo que
puede aparecer aquí como una pregunta clara, en realidad fue en su día una
duda o un conjunto de preguntas bastante difusas.
Veamos por ejemplo el caso del aumento de la atención en personas con
síndrome de Down gracias al aprendizaje de nuevas tecnologías. ¿No te llama
la atención que alguien se interesara por la posibilidad de que el aprendizaje
de las nuevas tecnologías pudiera tener algún tipo de influencia positiva?
¿Qué ocurrió para que así fuera?
Y para el caso de ese 4% de materia del universo que percibimos, cabe pre-
guntarse cómo se pudo definir la cuantía total de la materia del universo y de
ese total determinar la parte que los sentidos humanos son capaces de percibir.
Aunque parezca una perogrullada, no hay respuesta sin pregunta previa; por
tanto, es lógico suponer que alguien debió plantearse una pregunta o una duda
parecida a la siguiente: ¿cuánta materia hay en el universo? Esta pregunta debió
absorber una gran cantidad de esfuerzo de búsqueda para contestarla. Y sólo
después se pudo plantear la de la proporción de materia que los sentidos huma-
nos son capaces de apreciar. Una advertencia: quien plantea una pregunta o una
duda no es necesariamente quien contesta, ni la respuesta se produce necesaria-
mente como un todo. Cabe la posibilidad de que la respuesta se vaya dibujando
con el tiempo, con mejoras que van aportando distintos investigadores. Otra vez
el símil del edificio: la construcción de la ciencia, del conocimiento, se hace pa-
so a paso en cualquier campo. Los científicos actuales se yerguen sobre los
hombros de los numerosos constructores del conocimiento que les precedieron
y que fueron planteando preguntas y contestando algunas.
Podríamos seguir así con las numerosas afirmaciones científicas que a lo
largo de un día es posible leer en numerosos escritos u oír en boca de nues-
tros profesores y amistades.

UN VISTAZO SOBRE LOS MÉTODOS


2.1. DE ADQUISICIÓN DEL CONOCIMIENTO

Si admites que aquéllos que nos precedieron nos dejaron su legado a través
del conjunto de conocimientos que atesoraron y si aceptas también que nos
toca hacer lo propio con nuestros descendientes, quizá te resulte comprensi-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 29

¿Qué es un problema de investigación? ¿Y sus implicaciones? 29

ble la necesidad de conocer cómo lo hicieron nuestros antepasados, no sólo


para evitar los errores que pudieron cometer, sino sobre todo para enriquecer
el acervo intelectual y técnico con nuevas aportaciones.
Si tomamos el término método en su sentido etimológico como camino
para intentar lograr un fin (´µετα, a lo largo; `οδο´ζ, camino), es decir, una
forma y manera de proceder en cualquier dominio, entonces cabe pensar que
todo procedimiento, cualquiera que sea su nivel de cientificidad o de sistema-
ticidad, puede ser considerado como método.
Dependiendo de cuál sea el criterio que se utiliza para la clasificación de
los modos de adquirir y afianzar el conocimiento, nos podemos encontrar
con distintas propuestas. Nos apoyaremos en el criterio que toma como refe-
rencia el método científico. Si aplicamos este criterio obtenemos dos grupos
generales: modos precientíficos y método científico.

MODOS PRECIENTÍFICOS DE CONOCIMIENTO 2.2.

Entre los modos de investigar considerados anteriores al método científico, ca-


be señalar:
a) El sentido común. A través de este modo se puede adquirir un conjunto
de conceptos y esquemas teóricos que pueden ser útiles para la prácti-
ca. Sin embargo, la falta de sistematicidad y de control en la recogida
de los conocimientos los convierte en potencialmente equívocos o en-
gañosos.
b) La tenacidad. Se basa en la creencia en la verdad como dogma: las co-
sas son como son porque para el sujeto siempre han sido así. El auto-
convencimiento y la repetición sirven para reforzar la validez de las
verdades. Sin embargo, una breve ojeada a la cuestión del criterio de
la verdad o al problema de la observación en el marco de la filosofía
de la ciencia muestra lo débil que es este modo de conocimiento.
c) La autoridad. Se basa en una indiscutida confianza en el peso del presti-
gio personal, de la tradición y de la opinión pública. Sin embargo, aun
siendo aceptable que sean los sabios los que deberían ser tenidos en
cuenta cuando hablan sobre temas de su competencia, no parece que
sea éste el método más adecuado para ampliar los conocimientos. Eso
es, la rigidez de determinadas afirmaciones corre el riesgo de frenar, en
vez de estimular, la búsqueda de conocimientos más avanzados.
d) El modo artístico. Potencia el procedimiento de la percepción intuitiva
de la verdad: a la existencia objetiva de las cosas se añade un alto gra-
do de subjetivismo. Ahora bien, como modo de investigar en educa-
ción, resulta cuando menos intrigante. Por un lado, es evidente que el
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 30

30 Introducción a la estadística

investigador educativo, en tanto que ser humano que estudia a otros


seres humanos, observa e interpreta el mundo a partir de sus propias
vivencias y conocimientos. Por otro lado, la interpretación puede adop-
tar distintos niveles de aproximación al objeto observado: desde la má-
xima literalidad al más alto subjetivismo. La ambigüedad propia de este
modo de conocimiento parece complicar, en vez de facilitar, la com-
prensión del funcionamiento del mundo educativo. El descubrimiento
de un cierto conjunto de elementos constantes, no debidos a una inter-
pretación más o menos iluminada, simplificaría la tarea de los profesio-
nales de la educación.
e) El modo apriorístico. El supuesto básico de este modo consiste en con-
siderar evidentes sus proposiciones iniciales, proposiciones que, por
otra parte, deben concordar con la razón, aunque no necesariamente
con la experiencia. Quizá la debilidad de este modo de conocimiento
radique precisamente en la naturaleza de su supuesto básico: lo evi-
dente elimina toda veleidad comprobatoria convirtiéndolo en algo pró-
ximo a un dogma. No parece, pues, que la investigación en ciencias
sociales pueda alcanzar su objetivo partiendo de apriorismos, aunque
puedan ser útiles para la acción social o educativa. Además, uno de los
objetivos del científico es conseguir que sus conocimientos concuerden
con la realidad ante todo. Y tratándose de conocimientos sobre la edu-
cación, la referencia a la realidad es una condición sine qua non, por-
que tratamos con educandos concretos en situaciones concretas. La ne-
cesidad de que esos conocimientos respondan a la razón puede ser un
complemento interesante aunque no nuclear.
f) El modo racionalista. Parte de la consistencia del universo, del que la
naturaleza que nos rodea es un ejemplo, y persigue el establecimiento
de leyes explicativas del funcionamiento general de ese universo. Una
vez descubierta una ley, cualquier suceso que no responde a ese prin-
cipio universal se considera como una excepción que, en contra de la
lógica más elemental, suele interpretarse a favor del principio que pare-
ce negar: a todos nos resulta familiar la expresión «es la excepción que
confirma la regla». Ahora bien, el carácter rígido y autoritario de las le-
yes universales despierta las sospechas de aquéllos que son hostiles a
la inflexibilidad. Estas sospechas son desde luego legítimas siempre
que los datos en que se apoyan esas leyes no hayan sido obtenidos de
manera sistemática o que las creencias del investigador, sujetas a opi-
nión, hayan influido decisivamente en la formulación de la ley. Estas li-
mitaciones quedan superadas por el método que hoy por hoy se consi-
dera como el de mayor nivel de garantía científica, el modo de
conocimiento caracterizado por el método científico.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 31

¿Qué es un problema de investigación? ¿Y sus implicaciones? 31

EL MÉTODO CIENTÍFICO Y SUS CRÍTICOS 2.3.

En general, los filósofos de la ciencia reconocen que el paradigma positivista


ha sido el modelo dominante durante mucho tiempo; sin embargo, ya hacia
1890, mucho antes del despertar de las ciencias sociales de finales de los años
sesenta del siglo XX, William Dilthey (1833-1911) había adelantado la idea de
que hay diferencias básicas en modos de saber entre las ciencias naturales y
las ciencias humanas. Antes de proseguir, conviene destacar una observación
que con frecuencia se pasa por alto: la investigación educativa no se puede
catalogar estrictamente en la categoría de la investigación de línea positivista;
tan sólo responde a algunos de los supuestos del paradigma positivista, que,
por cierto, no tiene un significado unívoco. La reacción contra el positivismo,
en tanto que programa de investigación predominante en ciencias sociales, se
ha debido en gran medida al carácter de determinados supuestos del positi-
vismo trasladados sin suficiente crítica al contexto de las humanidades.
Puedes encontrar una discusión más detallada sobre este punto en los li-
bros que tratan de la epistemología de la ciencia.

EL LENGUAJE DE LA INVESTIGACIÓN 2.4.

Al estudiar los distintos modos desarrollados con el objetivo de adquirir y


afianzar los conocimientos necesarios para el progreso humano, observamos
que algunos implican efectos segundarios no deseados: en caso de que una
autoridad en su materia se equivoque en sus vaticinios, esos errores son difí-
ciles de descubrir y si se cometen en ámbitos en los que tal autoridad no es
experta las consecuencias pueden ser graves. Imagínese lo que puede ocurrir
cuando un famoso futbolista habla del consumo de la droga, por ejemplo. Los
errores pueden ocurrir cuando:
• Se llevan a cabo observaciones imprecisas. En este caso se debe recurrir
a una observación conscientemente planificada.
• Se generaliza abusivamente, más allá de lo permitido por el modo y
contexto de ejecución de la investigación. La solución puede consistir
en una repetición mejor controlada del estudio, así como el recurso al
muestreo.
• Se seleccionan determinadas situaciones y sucesos ignorando todo lo de-
más. Para una investigación objetiva ningún suceso potencialmente rela-
cionado con el contenido que se ha de observar debería ser rechazado.
• Se aplica un razonamiento ilógico del tipo «es la excepción que confir-
ma la regla». En su lugar, habría que utilizar los sistemas lógicos de for-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 32

32 Introducción a la estadística

ma consciente y explícita. De hecho, es un contrasentido afirmar que


un suceso puede confirmar un principio que está invalidando.
En resumen, los dos pilares de la ciencia deben ser la lógica y la observa-
ción. Bien es cierto que la cuestión de la observación sigue provocando im-
portantes discusiones; parece que no hay acuerdo sobre si lo que se ve son
los objetos como son realmente, si se debe admitir que cada observador está
legitimado para ver los objetos desde su propia perspectiva o si lo que parece
que es real, no deja de ser una mera imagen que los sentidos perciben. Cual-
quiera que sea la definición que se dé a lo observado, no cabe duda de que,
a menos que nos dediquemos a discurrir sin hacer referencia a nada real, las
afirmaciones que hagamos sobre la realidad deben fundamentarse en lo ob-
servado. En este marco, la lógica se relacionaría con la teoría, en el sentido de
que el cuerpo teórico debe ser internamente coherente; la recogida de los da-
tos se llevaría a cabo en relación con el contenido del cuerpo teórico; y final-
mente se haría el análisis de los datos recogidos buscando la presencia de los
esquemas formulados por la teoría.
La actividad científica busca ante todo encontrar esquemas constantes a
través de los datos recogidos en la realidad. Sin embargo, puesto que estos
esquemas no aparecen en cada estudio que se lleve a cabo, el investigador
está dispuesto admitir que son de naturaleza probabilística, es decir, que po-
drá haber casos en que no ocurran naturalmente, por azar. Por otra parte, el
investigador se interesa por comprender el funcionamiento del esquema, es
decir, por descubrir cuál es la naturaleza de la pauta, y no tanto por los indi-
viduos en los que se manifiesta dicha pauta.
Para el estudio del esquema o de la pauta, el investigador recurre a la va-
riable como elemento fundamental. Cada dato que se recoge en la realidad
refleja una variable. En consecuencia, los esquemas son conjuntos de varia-
bles, es decir, las variables constituyen las unidades básicas del vocabulario
utilizado en las teorías de las ciencias sociales; las personas sólo son mencio-
nadas como portadoras de esas variables. Una variable se puede definir como
cualquier característica personal o contextual susceptible de adoptar distintos
valores, como sexo o centro escolar; un valor se puede definir como una cua-
lidad que describe una persona (hombre o mujer) o un contexto (grande, me-
diano o pequeño). Una variable debe ser un agrupamiento lógico de valores;
por ejemplo, al no formar un conjunto internamente coherente, los siguientes
valores no pueden constituir una variable: grande, hombre, redondo.

2.5. NIVEL DE MEDIDA DE LAS VARIABLES

Los datos que se pueden recoger en la realidad no gozan todos del mismo ni-
vel de exactitud informativa. Se conoce como nivel de medida la exactitud
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 33

¿Qué es un problema de investigación? ¿Y sus implicaciones? 33

que se alcanza al recoger los datos. A este respecto se pueden establecer cua-
tro niveles de medida:
• Nivel nominal: si se utilizan números, éstos se asignan meramente a los
individuos o a las categorías de alguna variable por la que cabe clasifi-
car a dichos individuos.
3 Por ejemplo: variable «facultades de una universidad»:
1. Educación.
2. Medicina.
3. Farmacia.
4. Etc.
En este caso el dígito 1 ni siquiera significa primero, sino que es senci-
llamente un valor que permite distinguir el objeto que tiene este atribu-
to de otro que no lo tiene. Si estuviéramos estudiando a los sujetos en
función de las facultades en las que están cursando sus estudios, sabría-
mos que el sujeto marcado con un 1 está matriculado en una facultad
de Educación. El investigador podría haber asignado este valor a cual-
quier otra facultad sin que esto supusiera efecto alguno sobre su estu-
dio o podría haber utilizado cualquier otro símbolo para diferenciar los
valores, como pueden ser las letras del alfabeto.
• Nivel ordinal: si se utilizan números, éstos se asignan a los valores de
tal forma que el orden de los mismos corresponde al orden de los valo-
res con respecto a la propiedad que se estudia.
3 Por ejemplo: variable «cursos de Educación Primaria»:
1. Primero.
2. Segundo.
3. Tercero.
4. Etc.
En este caso el dígito 2 no sólo sirve para distinguir este valor de cual-
quier otro, sino que además indica que es superior al dígito 1 e inferior
al dígito 3. Si estuviéramos estudiando a los sujetos en función de su ni-
vel de formación en Educación Primaria, sabríamos que el sujeto marca-
do con un 2 está matriculado en un segundo curso. Esta información
implica que este alumno está en un nivel superior al de 1º pero inferior
al de 3º: hay un orden implícito sin que esto signifique que la diferencia
de formación sea la misma entre 1º y 2º, y entre 2º y 3º, por ejemplo.
Esto quiere decir a su vez que no tendría sentido afirmar que la diferen-
cia entre 1º y 2º es la misma que entre 2º y 3º en rendimiento académi-
co, por ejemplo. De hecho, no podemos asegurar que los contenidos
impartidos sean completamente comparables, aunque la duración del
curso escolar sea la misma.
• Nivel de intervalo: si se utilizan números, las diferencias entre éstos co-
rresponden, en sentido amplio, a las diferencias o distancias entre los
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 34

34 Introducción a la estadística

valores de la variable. Sin embargo, la unidad de medida y el punto que


corresponde al 0 son arbitrarios.
3 Por ejemplo: temperatura:
— Escala Celsius: de 0 ºC a 100 ºC.
— Escala Fahrenheit: 32 °F a 212 °F.
Supón que eres capaz de medir tu rendimiento en esta materia con una
escala similar a la de Celsius, obtendrías unos datos con un nivel de
exactitud muy superior a la simple distinción entre valores. De hecho, si
dijeras que tu nivel de rendimiento es de 95, esta afirmación llevaría
consigo al menos tres implicaciones: a) tu nivel es diferente a cualquier
otro de la escala, b) tu nivel es superior a 94 pero inferior a 96, y c)
dentro de tu escala la diferencia entre 94 y 95 es la misma que entre 95
y 96, es decir, la diferencia es constante. Pero tu escala tiene un proble-
ma: no define con claridad qué significa tener un rendimiento igual a 0
o, si has intentado definirlo, los demás investigadores muestran serias
reticencias para aceptarlo. Hazte a la idea de que, en lo humano, es
prácticamente imposible que una característica esté absoluta y comple-
tamente ausente. Por cierto, ¿conoces a alguien que sea totalmente ig-
norante?
Una variable medida a nivel de intervalo admite las operaciones de res-
ta y suma. Así, de un nivel de rendimiento académico de 90 podemos
restar 20 puntos, debido, por ejemplo, a que ese alumno ha contado
con unas ayudas externas irregulares. Por tanto, su rendimiento final re-
al sería 90 – 20 = 70; operación impensable si el nivel de medida fuera
nominal u ordinal.
• Nivel de razón: si se utilizan números, su orden, diferencias y razones
corresponden al orden, diferencias y razones de los valores de la varia-
ble. Reciben en conjunto una interpretación numérica: tienen un autén-
tico punto cero.
3 Por ejemplo: variable «edad»:
— Unidad de medida: año cumplido.
A la suposición anterior vamos a añadir otra: esta vez has podido resol-
ver el problema del nivel 0. ¡Enhorabuena! Lo has hecho tan bien que el
nivel de exactitud que has logrado te permite aplicar todas las operacio-
nes aritméticas a los datos que recojas.
Habrás observado que la exactitud de los datos se incrementa desde la
simple distinción de valores del nivel nominal hasta llegar a la utiliza-
ción del número en toda su plenitud en el nivel de razón. En la investi-
gación social los estudiosos tienden a considerar que una variable ordi-
nal que tiene cinco valores o más se comporta como una variable de
intervalo y se analiza como tal. Sin embargo, una decisión de este tipo
debe tomarse con mucha cautela.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 35

¿Qué es un problema de investigación? ¿Y sus implicaciones? 35

Una pregunta para tu consideración personal: piensa en la capacidad


real de medir que tiene el investigador social. Ahora, pregúntate sobre
el nivel de medición que de hecho es capaz de alcanzar para distintos
tipos de características típicamente humanas.

POSIBLE MANIPULACIÓN
DE LAS VARIABLES MEDIDAS 2.6.

De acuerdo con su naturaleza, cada variable tiene un determinado nivel de


medida. Así por ejemplo, la edad es por naturaleza una variable medible a ni-
vel de razón. De hecho, la edad de un ser humano antes de nacer equivale a 0;
por tanto, es una variable que tiene un 0 absoluto. Ahora bien, en muchas
ocasiones no interesa el estudio de la edad en relación con toda la escala si-
no solamente una parte o en relación con grupos de edad. Eso implica que la
variable deberá ser sometida a algunas modificaciones para facilitar su estu-
dio. Se conocen estas modificaciones como manipulación de la variable.
Es importante saber cuándo el investigador está utilizando la variable natu-
ral y cuándo la manipula y por qué.
• Variables dicotómicas versus politómicas. Una variable dicotómica es
aquélla que por naturaleza tiene solamente dos valores, como sexo.
Una variable politómica es la que, por naturaleza, tiene más de dos va-
lores, como facultades de una universidad. Una variable dicotómica es
normalmente de nivel nominal. En cambio, una variable politómica
puede ser de nivel ordinal, de intervalo o de razón.
• Variables dicotómicas versus dicotomizadas. Una variable dicotomizada
es aquélla que es politómica por naturaleza, pero cuyos valores se redu-
cen a dos para un determinado estudio. Por ejemplo, en lugar de tomar
por separado todas las facultades de una universidad, el investigador
puede agruparlas en dos categorías: a) facultades que imparten conteni-
dos de ciencias y b) facultades que imparten contenidos de letras. Cual-
quier variable que tenga más de dos valores, independientemente de su
nivel de medición, puede ser dicotomizada. Por ejemplo, la variable co-
ciente intelectual (CI) —generalmente considerada como de intervalo—
puede ser reducida a dos valores: a) bajo nivel intelectual y b) alto nivel
intelectual. El criterio de dicotomización depende en cada caso del ob-
jeto de la investigación.
• Variables politómicas versus politomizadas. Una variable politomizada
es aquélla que es politómica por naturaleza pero cuyos valores son ex-
cesivos y por ello se reducen a un número más manejable para un de-
terminado estudio. Por ejemplo, en lugar de tomar por separado todos
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 36

36 Introducción a la estadística

los posibles valores de la variable CI, el investigador decide agruparlos


en tres, cuatro, cinco o más categorías: a) bajo nivel intelectual, b) nivel
intelectual medio y c) alto nivel intelectual. El criterio de politomización
depende en cada caso del objeto de la investigación.
• Variables «categóricas o discretas» versus continuas. Una variable discre-
ta es aquélla que no tiene valores posibles entre las unidades adyacen-
tes de una escala como sexo o facultades de una universidad: no hay
valores intermedios entre hombre y mujer para sexo, ni entre Educa-
ción, Medicina o Farmacia para las facultades. Una variable continua es
la que puede asumir un número infinito de valores entre las unidades
adyacentes de una escala, como CI o rendimiento académico.
Una variable como sexo es nominal, dicotómica, categórica. Cociente inte-
lectual es una variable que, por naturaleza, es de intervalo, por tanto, conti-
nua, pero puede ser dicotomizada o politomizada, dependiendo del objetivo
de la investigación. La variable facultades es nominal por naturaleza, politómi-
ca, categórica, pero puede ser dicotomizada o politomizada si así lo requiere
el objetivo de un estudio.
Podría parecerte superfluo conocer este vocabulario. Sin embargo, si no
conoces las ideas relativas a la manipulación de variables, te puede resultar
difícil comprender que el CI, por ejemplo, se presente unas veces como
una variable continua y otras veces como una variable dicotomizada o poli-
tomizada. En cada caso, para actuar como lo hace, el estudioso se apoya
en razones fundadas generalmente en la tradición investigadora del campo;
es, por tanto, importante comprender cómo actúa esa tradición y dominar
su vocabulario básico. Cuando comprendas esta tradición quizá seas capaz
de descubrir en qué aspecto le falta rigor y de aportar los medios para me-
jorarlo. Por otra parte, las descripciones y las explicaciones científicas se
basan en la relación entre valores y variables. Si no eres capaz de estable-
cer la debida relación entre el conjunto de valores y la variable, difícilmen-
te podrás entender la estructura de las teorías. Éstas se expresan en térmi-
nos de relaciones entre valores de variables que se esperan lógicamente
(causalidad). Para ser un poco más explícito, se espera que los valores al-
canzados en una variable causen, predispongan o estimulen determinado
valor en otra variable en una persona. Un ejemplo puede ayudar: se espera
que un individuo con un alto nivel intelectual obtenga un alto nivel de ren-
dimiento.
Observa la siguiente tabla:
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 37

¿Qué es un problema de investigación? ¿Y sus implicaciones? 37

TABLA 2.1
ELECCIÓN DE LA CARRERA DE PEDAGOGÍA VS.
ESPECIALIDAD DE BACHILLERATO

Elección de la carrera de Pedagogía

No la La elegí La elegí La elegí Total


elegí en primer en segundo en tercer
lugar lugar lugar

Especialidad Ciencias 1 8 4 5 18
de Bachillerato Letras 0 30 35 8 73

Total 1 38 39 13 91

Relacionar las variables «Elección de la carrera de Pedagogía» y «Especiali-


dad cursada en Bachillerato con la que el alumno se identifica», se hace nece-
sariamente a través de sus correspondientes valores. Por tanto, es básico tener
una idea lo más clara posible de las implicaciones de cada conjunto de valo-
res respecto de la variable que determinan.

PARADIGMAS, TEORÍAS E INVESTIGACIÓN 2.7.

Todos los seres vivos recogemos información de nuestro entorno, investiga-


mos nuestro ambiente y en base a los resultados obtenidos sacamos conclu-
siones que nos llevan a actuar de una manera o de otra. Ahora bien, el tipo
de recogida de información que hacemos diariamente no se puede llamar in-
vestigación en sentido estricto, ni los resultados pueden llamarse resultados
de investigación. De hecho, cabe la posibilidad de que los esquemas que
identificamos sean casuales, aleatorios. Si no somos capaces de proporcionar
explicaciones lógicas de dichos esquemas, las regularidades que observamos
bien pueden ser meras coincidencias, casualidades.
Para evitar enredarnos en casualidades, necesitamos disponer de líneas teó-
ricas a modo de balizas que orientan nuestra pesquisa. Las teorías imponen
un sentido a las pautas observadas de modo que, a partir de lo observado,
pueden surgir nuevas posibilidades hasta entonces no contempladas de suce-
sos regulares. Desde la perspectiva de la investigación social, las teorías pue-
den perfilar y dirigir los esfuerzos de búsqueda al señalar la dirección de po-
sibles descubrimientos mediante una observación empírica. De este modo, las
teorías organizan nuestras observaciones y les asignan un sentido. Ahora
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 38

38 Introducción a la estadística

bien, no conviene pasar por alto que suele haber más de una manera de en-
tender las cosas. Ya habrás oído hablar de las propuestas procedentes del po-
sitivismo, postpositivismo, interaccionismo simbólico, etnometodología, fun-
cionalismo estructural, paradigmas feministas, paradigmas de los conflictos,
etc., como otros tantos modos de concebir la observación del mundo buscan-
do esquemas explicativos.
En términos muy generales, el modus operandi dentro cada propuesta
tiende a adoptar un formato común. En primer lugar, el investigador identifica
un problema. Para resolver ese problema o simplemente para encontrar una
explicación plausible, en unos casos hay investigadores que simplemente re-
cogen datos de la realidad para construir una teoría al final, mientras otros
empiezan por proponer un esquema explicativo previo para luego recoger
datos empíricos susceptibles de confirmar o falsar dicha explicación teórica.
En nuestro caso, seguiremos el segundo modelo, es decir, una vez identificado
el problema, propondremos una teoría explicativa. Como ya sabes, la teoría
explicativa se expresa necesariamente a través del vocabulario específico de
la investigación, las variables. En consecuencia la teoría se expresará en unos
términos que implican relaciones entre variables. Cada teoría es a su vez un
conjunto integrado y coherente de hipótesis, inicialmente sustantivas y poste-
riormente estadísticas. Lógicamente las hipótesis se expresan como relaciones
entre valores de variables. Para el contraste de estas hipótesis se necesita ope-
racionalizar las variables, es decir, indicar de un modo claro cómo se va a re-
coger la información de la realidad. Una vez operacionalizadas las variables,
el investigador puede recoger los datos que necesita en la forma previamente
definida y analizarlos con el objetivo final de confirmar o falsar su teoría.
En el párrafo anterior se resume lo esencial del contenido de este libro:
aprender a definir un problema de investigación, proponer una teoría explica-
tiva, definir un conjunto adecuado de hipótesis, especificar las variables y el
modo de operacionalizarlas y, finalmente, aplicar las técnicas adecuadas de
análisis y el contraste de hipótesis.

EL PROBLEMA DE INVESTIGACIÓN:
2.8. UN OBSTÁCULO, UNA DUDA
Cuando lees un artículo en el que se expone la solución de un problema, es
probable que te extrañe que un investigador haya dedicado meses y hasta
años para llegar a una conclusión así. Sé indulgente: lo que te parece eviden-
te lo es porque alguien invirtió mucho tiempo en averiguarlo y sólo después
de que te lo presenta te parece evidente. ¿Serías capaz de recorrer un camino
parecido, es decir, identificar un problema digno de ser investigado y aportar
una respuesta explicativa, quizá parcial?
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 39

¿Qué es un problema de investigación? ¿Y sus implicaciones? 39

Para empezar, ¿qué camino se sigue para formular un problema? Empece-


mos con una verdad de Perogrullo: un problema no es una pregunta con lí-
mites nítidos y a la que se puede proporcionar una respuesta rápida y senci-
lla; es más bien algo parecido a un obstáculo que se opone a la comprensión,
una inquietud indefinida frente a los fenómenos observados y/o vagamente
percibidos, una curiosidad por conocer las causas de los sucesos del entorno,
o sea nada suficientemente concreto. Este estado puede deberse a múltiples
causas que pueden ir desde las observaciones casuales, las deducciones de la
teoría, la bibliografía relacionada con un marco teórico dado, los temas socia-
les y políticos de actualidad, las situaciones prácticas, la experiencia personal
hasta la serendipity, una especie de iluminación repentina que unos investiga-
dores muy privilegiados vivencian.
Para despejar este estado de indefinición, lo más importante es conseguir
una idea clara, formular el problema con cierto grado de inteligibilidad.
En no pocas ocasiones la formulación de un problema parte de una serie
de manifestaciones que, tomadas en su conjunto, sugieren la existencia de
una situación difícil de explicar y que podría ser objeto de investigación. A tí-
tulo de ejemplo, en relación con esta materia se observan, entre otras, las si-
guientes manifestaciones:
• Muchos alumnos empiezan el curso con la impresión de que la materia
va a ser muy difícil y que, por tanto, no van a superarla.
• El porcentaje de alumnos que logran dominar esta materia está consis-
tentemente por debajo del 50% de los matriculados.
• Entre el 10% y el 15% de los alumnos no realiza ninguna actividad rela-
cionada con esta materia (asistencia a clase y trabajos) a lo largo del
curso ni se presenta a ningún examen.
• Prácticamente ningún repetidor asiste a clase.
• Entre el 20 y el 30% de los alumnos que se presenta al primer examen
del curso, abandona la materia.
• La tasa de repetición es considerablemente más alta en esta materia que
en cualquier otra.
• El profesor de la materia es considerado por la mayoría de los alumnos
como una persona a la que no se puede plantear ninguna duda y cuyo
vocabulario es, de entrada, incomprensible.
• Los alumnos parecen más interesados en tomar apuntes que en com-
prender los contenidos que el profesor intenta explicar.
• Muy pocos alumnos se atreven a preguntar en clase, salvo para pedir
que se repita el dictado de una frase.
• El profesor percibe que la capacidad de razonamiento lógico de la ma-
yoría de los alumnos matriculados en esta materia es más bien baja.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 40

40 Introducción a la estadística

• Los alumnos muestran una notable dificultad a la hora de formalizar


ideas, conceptos, resultados.
• Etc.

TEORÍA COMO CONJUNTO COHERENTE


2.9. DE HIPÓTESIS

Sería un atrevimiento considerar que lo que vamos a proponer dentro de un


momento puede considerarse como una teoría en sentido estricto. De nin-
gún modo podemos comparar nuestra propuesta con una teoría científica
como la del aprendizaje vicario, la de las atribuciones causales o la de la
dependencia/independencia del campo perceptivo. Sin embargo, puede en-
tenderse que antes de llegar a proponer una denominación de estas caracte-
rísticas, el investigador ha debido recorrer un largo camino. Es este camino
el que nos interesa.
Tomemos la definición de teoría que nos propone Kerlinger (1975); la de-
fine como el «conjunto de construcciones hipotéticas (conceptos), definiciones
y proposiciones relacionadas entre sí, que ofrecen un punto de vista sistemá-
tico de los fenómenos, al especificar las relaciones existentes entre variables,
con objeto de explicar y predecir los fenómenos». Esta definición nos sugiere
que sistematicemos la caótica gama de manifestaciones observadas en la reali-
dad, que busquemos ese factor común susceptible de dar sentido al conjunto
de observaciones. Es posible que alguien nos recuerde que no podemos ob-
servar nada si previamente no tenemos un marco que dé sentido a lo que
pretendemos observar. Éste no es el lugar adecuado para suscitar la discusión
sobre si la teoría es previa a las observaciones o si es lo contrario. Es una dis-
cusión muy interesante que trata la filosofía de la ciencia en profundidad y
que puedes ampliar consultando libros ad hoc.
En el caso que nos ocupa, podríamos sistematizar el anárquico conjunto
de observaciones diciendo, por ejemplo, que el rendimiento académico en
esta materia está condicionado por diversos factores personales de los estu-
diantes, del profesor y del contexto en el que se desarrolla la docencia, tanto
individualmente como en interacción unos con otros. Así, se intenta dar una
explicación lo más completa posible del conjunto de hechos observados. El
objetivo es delimitar el marco en el que el investigador va a trabajar. Después
tendrá que ir paso a paso para comprobar todo aquello que esté potencial-
mente relacionado con su campo de estudio.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 41

¿Qué es un problema de investigación? ¿Y sus implicaciones? 41

HIPÓTESIS SUSTANTIVAS 2.10

El marco teórico definido previamente rara vez equivale a una única hipóte-
sis; lo más habitual es que el marco teórico permita formular un conjunto co-
herente de diversas hipótesis. Éstas se definen como enunciados conjetura-
les, proposiciones provisionales sobre la relación que hay entre dos o más
fenómenos o variables. En general, reflejan lo que el investigador cree que
ocurre en el campo en estudio o espera lograr como resultado de algún tipo
de intervención. En todo caso, la formulación debe responder al razonamien-
to hipotético-deductivo para deducir las consecuencias implicadas en el mar-
co teórico.
Con relación a la cuestión del rendimiento en esta materia, se podrían for-
mular, entre otras, las siguientes hipótesis:
1. El nivel medio de rendimiento discente está en torno a 5 en una esca-
la 0-10.
2. El nivel de rendimiento discente está relacionado con la percepción
previa del nivel de dificultad de la materia.
3. El nivel de rendimiento en esta materia está relacionado con el nivel
de conocimientos previos de los alumnos.
4. El nivel de perseverancia en la realización de las actividades académi-
cas influye sobre el nivel de rendimiento de los alumnos.
5. La progresiva disminución del número de alumnos que acuden regu-
larmente a clase está relacionada con la percepción del nivel de difi-
cultad de la materia.
6. El método didáctico utilizado por el profesor influye en el nivel de
rendimiento de sus alumnos.
7. El nivel de comprensión de conceptos formales está relacionado con
el nivel de rendimiento discente en esta materia.
8. La percepción previa del nivel de dificultad y el nivel de conocimien-
tos previos influyen conjuntamente sobre el nivel de rendimiento dis-
cente.
9. La percepción previa del nivel de dificultad, el nivel de conocimientos
previos y el método didáctico explican una gran parte del nivel de
rendimiento discente.
10. El nivel de interés en esta materia está relacionado con el nivel de difi-
cultad percibida por los alumnos.
11. Etc.
Este tipo de hipótesis recibe el nombre de hipótesis sustantivas. Éstas de-
berán ser transformadas en otras susceptibles de ser contrastadas, llamadas hi-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 42

42 Introducción a la estadística

pótesis estadísticas. En el apartado «Formulación de las hipótesis estadísticas»


del capítulo 8, veremos en detalle cómo se procede para transformar las hipó-
tesis sustantivas en hipótesis estadísticas.

OPERACIONALIZACIÓN Y MEDICIÓN
2.11. DE LAS VARIABLES

Al hablar del lenguaje de la investigación, dijimos que la unidad básica es


la variable. Si te fijas en el modo en que se formulan las hipótesis sustanti-
vas, te darás cuenta de que se ponen en relación dos o más variables. Sin
embargo, queda un problema por resolver: el modo de formular las hipóte-
sis no permite saber cómo se debe proceder para recoger los datos suscep-
tibles de ayudar a confirmar o falsar cada hipótesis. En consecuencia, pare-
ce evidente que es necesario especificar el significado de cada una de las
variables que comprende la teoría. En otras palabras, hay que indicar las
operaciones mediante las cuales se mide una variable. De hecho, algunas
variables pueden tener una multitud de formas de ser medidas u operacio-
nalizadas. Por ejemplo, la variable rendimiento académico puede ser enten-
dida como el conjunto de ejercicios realizados y evaluados a lo largo de un
trimestre, la calificación obtenida después de realizar una prueba al final
del trimestre o la nota media obtenida de ambas actividades. Será necesario
indicar cuál de los tres modos, o cualquier otro que se nos ocurra, se utili-
zará para medir esa variable. En cambio, la operacionalización de una va-
riable como el sexo no implica dificultad alguna. Ahora bien, la mayor par-
te de las variables consideradas relevantes en la investigación social tiene
una notable dificultad para su operacionalización.
Una vez tomada la decisión sobre la forma más adecuada de medir una va-
riable, se puede pasar a la siguiente etapa: recoger la información pertinente.
Las variables mencionadas en las hipótesis sustantivas antes formuladas,
podrían operacionalizarse de la siguiente manera:
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 43

¿Qué es un problema de investigación? ¿Y sus implicaciones? 43

Variable Operacionalización

Rendimiento académico I Calificación en una prueba objetiva de 40


ítems aplicada al final del primer trimestre

Rendimiento académico II Calificación en una prueba objetiva de 50


ítems aplicada al final del curso

Percepción previa del nivel de difi- Escala de dificultad percibida tras dos
cultad de la materia meses de curso 0-100

Nivel de conocimientos previo de los Calificación en una prueba objetiva de co-


alumnos nocimientos previos de 40 ítems

Nivel de perseverancia en la realiza- Número de ejercicios entregados a lo lar-


ción de las actividades académicas go del cuatrimestre

Asistencia a clase Número de alumnos presentes en cada


sesión

Método didáctico 1. Simple asistencia a clase


2. Asistencia a clase y realización de ejer-
cicios de solución de problemas
3. Asistencia a clase y realización de ejer-
cicios en la plataforma Campus Virtual
4. Asistencia a clase, realización de ejer-
cicios de solución de problemas y Cam-
pus Virtual

Nivel de comprensión de conceptos Calificación en una prueba objetiva sobre


formales razonamiento lógico-matemático (10 ítems)

Interés Escala de interés percibido de la materia


tras dos meses de curso 0-100

Etc.

CAUSALIDAD E INFERENCIA CAUSAL 2.12.

Vuelve a la formulación de las hipótesis sustantivas y fíjate en que en la ma-


yoría de los casos se formulan como relaciones causales entre las variables
implicadas. Se dice, por ejemplo, que «la percepción previa del nivel de difi-
cultad de la materia influye sobre el nivel de rendimiento discente»; eso quie-
re decir que la percepción previa del nivel de dificultad de la materia es en
cierto modo una causa, entre otras presumiblemente, del nivel de rendimiento
discente.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 44

44 Introducción a la estadística

Desde la perspectiva del sentido común, se podría decir que un aconteci-


miento singular (causa) siempre lleva a otro acontecimiento singular (el efec-
to). Por ejemplo, un pinchazo siempre provoca dolor; por tanto, el pinchazo
es la causa del dolor. Ahora bien, en la ciencia moderna esta visión no es
completamente admisible. Más bien se entiende que un evento se explica en
función de una multiplicidad de «condiciones determinantes»; éstas son las
que hacen probable la ocurrencia de un determinado acontecimiento.
Así pues, el pensamiento científico se ocupa de descubrir las condiciones
necesarias y suficientes para que ocurra un fenómeno. Una condición se
considera necesaria cuando ésta debe ocurrir para que se produzca el fenó-
meno del que es «causa». Por ejemplo, es absolutamente necesario que se
produzca el contacto discente con el material que se va a aprender para que
pueda aparecer el efecto del aprendizaje. De hecho, el ser humano no tiene
otro modo de aprender destrezas y habilidades si no es mediante el contacto
con algún elemento ambiental, llámese material didáctico, profesor o ambos.
Y sin embargo, sabemos por experiencia que, aun dándose, estas condicio-
nes, no siempre se produce el aprendizaje. Esto significa que estas condicio-
nes no son suficientes.
Una condición es suficiente cuando es siempre seguida por el fenómeno
del que es «causa»: por ejemplo, la destrucción del nervio óptico es siempre
seguida por la aparición de la ceguera. Ahora bien, este tipo de relaciones
causales, fácil de establecer en las ciencias naturales, no ocurre tan claramen-
te en las ciencias sociales. Es prácticamente inútil intentar identificar condicio-
nes suficientes. De hecho, como veíamos en el caso del aprendizaje, sabemos
que no es suficiente establecer el contacto entre el discente y el material por
aprender para que se produzca el tan anhelado aprendizaje: el contacto es
una condición necesaria pero no es suficiente. En consecuencia, la investiga-
ción debe estudiar las condiciones que aumentan la probabilidad de ocurren-
cia del fenómeno, en nuestro caso, del aprendizaje. Estas otras condiciones se
conocen como condiciones contribuyentes. Para ser más concreto, la investi-
gación debe identificar las condiciones que contribuyen a la aparición del
aprendizaje, como por ejemplo el método didáctico, que es una condición
que tiene por objetivo incrementar la probabilidad de que el discente aprenda
más allá de lo que aprendería por azar.
Puesto que la investigación social no es susceptible de determinar las con-
diciones suficientes para el aprendizaje, debe al menos determinar las condi-
ciones necesarias y contribuyentes. Además, tiene algo que aportar a la hora
de identificar las condiciones contingentes, es decir, aquéllas bajo las cuales
una determinada variable es causa contribuyente de un fenómeno. En el caso
del aprendizaje, la investigación debe ayudar a identificar en qué condición o
condiciones el efecto del aprendizaje se incrementa, habida cuenta el contac-
to discente con el material y el método didáctico aplicado. Esta condición
contingente podría referirse, por ejemplo, a las aptitudes discentes. Es decir,
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 45

¿Qué es un problema de investigación? ¿Y sus implicaciones? 45

no basta con que el alumno esté en contacto con el material que va a apren-
der aplicándole para ello un determinado método didáctico, sino que todo
debe estar en relación con el nivel de capacidades y habilidades del discente.
Esta relación es la que explicaría el incremento del aprendizaje más allá de lo
que podría ocurrir por azar.
Por otra parte, el hecho de establecer un determinado esquema causal no
autoriza a afirmar que un suceso dado determina otro causalmente, por la
sencilla razón de que es imposible demostrar directamente que un suceso A
determina otro B, ya sea por sí mismo o en combinación con otros. A lo su-
mo, el esquema causal permite inferir, a partir de la observación, que la hipó-
tesis de que A es una condición para la ocurrencia de B es o no sostenible
con cierto grado específico de confianza (nivel de confianza). Y aun así, se
deben producir tres evidencias para poder inferir la existencia de relaciones
causales:
1. Variación concomitante. Debe quedar demostrado el grado en que dos
sucesos A y B se dan conjuntamente o varían al mismo tiempo en la
forma prevista por la hipótesis.
2. Ordenación temporal de la ocurrencia de sucesos. Debe demostrarse
que el suceso B no ocurrirá antes que A. Por definición, un suceso no
puede ser considerado la causa de otro si ocurre después de aquél.
3. Eliminación de otros posibles factores causales. Debe quedar claro que
una vez descartados los demás factores como posibles condiciones de-
terminantes de B, el que queda es la verdadera causa.

IDONEIDAD DE DISTINTOS TIPOS


DE DISEÑOS DE INVESTIGACIÓN
COMO FUENTES DE EVIDENCIAS CREÍBLES 2.13.

Conviene que nos preguntemos si todos los modos de diseñar la recogida de


información tienen igual capacidad de producir resultados con una calidad
suficiente como para confirmar o rechazar una hipótesis. En buena lógica es
lícito pensar que, dado que existen distintos modos de concebir la investiga-
ción social, es probable que existan también diferentes formas de recoger in-
formación cuya calidad posiblemente varíe. Pero como los modos de investi-
gar no son directamente comparables entre sí, la calidad de los mismos de
recoger información se deberá establecer en el marco de cada paradigma.
Como comentamos en su momento, el modelo de investigación del que
venimos hablando es el relacionado con el método científico. Teniendo en
cuenta esta referencia básica, la búsqueda de evidencias viene determinada
por el diseño, que es el plan, estructura y estrategia de una investigación. El
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 46

46 Introducción a la estadística

diseño establece un marco de referencia suficientemente explícito para dar


respuestas a las preguntas de investigación proporcionando guías en cuanto a
las pruebas adecuadas para establecer de modo fiable las relaciones existen-
tes entre las variables. De hecho, el diseño indica qué tipo de análisis estadís-
tico se debe usar, además de señalar las posibles conclusiones que son admi-
sibles en función del análisis estadístico.

Naturaleza y función
2.13.1. de las variables en el diseño
Ante de pasar a comentar brevemente la cuestión de los diseños de investiga-
ción, nos conviene echar una ojeada sobre la diferencia entre la naturaleza de
una variable y la función de ésta en un determinado diseño. Una misma va-
riable puede cumplir una multitud de funciones dentro de los diseños; lógica-
mente, en un diseño sólo puede cumplir una única función. Ya sabes que las
variables pueden ser clasificadas en función de su naturaleza, es decir, de su
nivel de medida original. También sabes que las variables pueden ser mani-
puladas. Generalmente, se manipulan para que puedan cumplir determinadas
funciones dentro de los diseños. Entre éstas cabe señalar las siguientes:

a) La función de variable independiente


Se define como variable independiente aquélla que dentro del esquema cau-
sal cumple la función de ser la causa, es decir, aquélla que afecta a otra y ex-
plica, al menos parcialmente, los cambios producidos en ésta.
Las variables independientes suelen ser de naturaleza nominal. Sin embar-
go, las variables ordinales, de intervalo y de razón pueden ser manipuladas y
utilizadas como variables independientes. Por ejemplo, se puede querer saber
si el género (variable nominal) es una variable relevante en relación con el
número de accidentes de carretera. Lo que el investigador se está preguntan-
do es si el factor género explica al menos parcialmente la tasa de siniestrali-
dad de las carreteras. Otro investigador puede querer saber hasta qué punto
el nivel educativo máximo alcanzado (variable ordinal) tiene alguna relación
con el bienestar económico que un ciudadano logra en su vida. Un tercer in-
vestigador puede interesarse por el efecto del nivel intelectual (variable de
intervalo) en los resultados académicos; en este tercer caso, como el nivel in-
telectual se considera una variable continua, será necesario manipularla: la
manipulación consistirá en agrupar todos los hipotéticos valores de la variable
en tres, cuatro o cinco intervalos, según las necesidades del estudio. Un cuar-
to investigador puede desear saber si la edad (variable de razón) es un factor
relevante a la hora de explicar las diferencias en la agudeza auditiva o visual
de la población española.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 47

¿Qué es un problema de investigación? ¿Y sus implicaciones? 47

b) La función de variable dependiente


Es una variable dependiente que sufre el efecto de la variable independiente.
Si relees el párrafo anterior, verás que el efecto se produce en el número de
accidentes de carretera, el bienestar económico, los resultados académicos o
la agudeza auditiva o visual. Como veremos más adelante, lo que se mide re-
almente es la variable dependiente.
Resumiendo, las variables categóricas (nominal, ordinal; dicotómicas, dico-
tomizadas; politómicas, politomizadas) suelen ser utilizadas como variables
independientes. Las variables continuas (de intervalo o de razón), por lo ge-
neral son variables dependientes. No olvides que una variable medida a nivel
de intervalo o de razón puede ser dicotomizada o politomizada para utilizarla
como variable independiente.

c) Otras posibles funciones


• Variable extraña: variable desconocida —o conocida pero no controla-
da— que puede influir sobre la variable dependiente. Por ejemplo, en el
número de accidentes de tráfico puede estar influyendo, además del gé-
nero, el consumo de algún tipo de bebidas alcohólicas o de medicinas.
• Variable enmascarada: variable no controlada que influye sobre la varia-
ble dependiente y que tiene la propiedad de variar de forma simultánea
con los cambios en los niveles de la variable independiente. Debido a
esta circunstancia, rivaliza con la variable independiente como posible
causa. Por ejemplo, los efectos medidos en los resultados académicos
no se deben sólo al nivel intelectual, sino posiblemente también al nivel
social de la familia a la que pertenece el educando. De hecho, pudiera
ser que sea este hecho el que explica mejor los resultados académicos
que el nivel intelectual.
• Variable bloqueada: variable utilizada para emparejar los grupos. Su uso
consiste en hacer «bloques» de sujetos con similares valores y posterior-
mente asignarlos al azar, en igual número, a los grupos del experimen-
to. Por ejemplo, los educandos pueden ser agrupados por nivel intelec-
tual y posteriormente ser asignados por azar a distintos métodos de
enseñanza, para estudiar el efecto que éstos tienen en los resultados
académicos. Por tanto, la variable bloqueada sería el nivel intelectual.
• Variable controlada: variable conocida que influye sobre la variable de-
pendiente y cuyo efecto es anulado por la acción del investigador. Las
técnicas de control pueden variar desde la eliminación (elegir un único
nivel), la aleatorización, la incorporación en el diseño o el empareja-
miento de sujetos. Si quieres aprender más sobre cómo se procede,
consulta el capítulo 17 del libro de F. N. Kerlinger: Investigación del
comportamiento. Técnicas y metodología. México: Interamericana.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 48

48 Introducción a la estadística

Una aproximación a la clasificación de los diseños


2.13.2. según el criterio del grado de control
El propósito de un buen diseño de investigación es asegurar un alto nivel
de credibilidad de los resultados, teniendo en cuenta las diversas fuentes de
variabilidad. Algunos tipos de diseños proporcionan bases convincentes pa-
ra obtener más inferencias causales que otros. Si utilizamos el grado de con-
trol como criterio de clasificación, podríamos identificar tres tipos de dise-
ños: los preexperimentales, los experimentales propiamente dichos y los
cuasiexperimentales.

2.13.2.1. Los diseños experimentales propiamente dichos


Este tipo de diseños se caracteriza por:
a) La manipulación de la variable independiente.
b) La asignación aleatoria de sujetos a grupos.
c) La asignación aleatoria de tratamientos a grupos.

DIAGRAMA DEL DISEÑO EXPERIMENTAL BÁSICO

Variable experimental o
independiente: Motivación

Con motivación Sin motivación


Grupo experimental Grupo de control

Medición de la VD ¿iguales? Medición de la VD

Estímulo Variable dependiente:


experimental Rendimiento

Nueva medición ¿diferentes? Nueva medición


de la VD de la VD

En este diseño se manipula la variable independiente «Motivación», crean-


do dos grupos: uno que va a recibir algún tipo de estimulación, como puede
ser un premio cada vez que sus miembros realizan alguna tarea correctamen-
te, y otro que no recibe nada.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 49

¿Qué es un problema de investigación? ¿Y sus implicaciones? 49

Los sujetos del estudio son elegidos al azar y además son asignados a cual-
quiera de los dos grupos también al azar. Y, finalmente, los tratamientos
—con motivación y sin motivación— son asignados a los grupos aleatoriamente.
A la hora de ejecutar el diseño se empieza por comprobar que, efectiva-
mente, los dos grupos parten con el mismo nivel de rendimiento. Para ello se
aplica a ambos la misma prueba inicial cuyos resultados permitirán contestar
a la pregunta de si son de hecho iguales, comparables en la característica que
es objeto de estudio, el rendimiento. Si no lo fueran, podríamos sospechar
que el resultado final es posible que quedase contaminado por las diferencias
iniciales.
Una vez comprobada la igualdad inicial, se podrá aplicar el estímulo co-
rrespondiente al grupo experimental mientras el grupo de control permanece
sin estimulación alguna.
Terminado el tiempo experimental, los dos grupos son sometidos a la
misma prueba que se utilizó al principio para comprobar los resultados al-
canzados. Se espera obtener unas diferencias claras entre los dos grupos y
poder asignar la fuente de estas diferencias al estímulo experimental. Por
ello, el análisis de los resultados pretende averiguar si ahora los dos grupos
son diferentes.
Todo este proceso tiene por objetivo:
a) Maximizar la varianza sistemática o experimental, es decir, incrementar
las diferencias entre los grupos experimental y de control.
b) Minimizar la varianza de error o aleatoria, es decir, disminuir la variabi-
lidad que se debe a factores no conocidos.
c) Controlar la varianza debida a variables extrañas, es decir, identificar
cuantos factores sean susceptibles de influir sobre la variable depen-
diente, con el objetivo de cuantificar su efecto.
Este diseño puede ser ampliado mediante el incremento del número de
variables dependientes e independientes.

Diseños preexperimentales 2.13.2.2.


Suelen ser diseños de grupo único, por tanto, sin grupo de control, con una
variable independiente y sin control estadístico, en general; incluyen también
los ex post-facto: son diseños que pretenden llevar a cabo una búsqueda sis-
temática pero en la cual el investigador no tiene control directo sobre las va-
riables independientes, porque ya acontecieron sus manifestaciones o por ser
intrínsecamente no manipulables.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 50

50 Introducción a la estadística

DIAGRAMA DE UN DISEÑO PREEXPERIMENTAL

Variable experimental o
independiente: Motivación

Grupo experimental

Medición de la VD

Estímulo
experimental

Nueva medición
de la VD

La ejecución se inicia con la elección de una muestra aleatoria de sujetos a


los que se aplica una prueba para determinar su nivel inicial en la característi-
ca que se debe estudiar, por ejemplo, el rendimiento. Después, se aplica el
estímulo experimental, como felicitar a los componentes del grupo cada vez
que realizan correctamente una determinada tarea de aprendizaje.
Una vez concluido el tiempo experimental, los sujetos son sometidos a la
misma prueba inicial para evaluar el efecto experimental en la variable estu-
diada. El investigador espera obtener unas diferencias claras entre los dos mo-
mentos —antes y después— para así poder asignar la fuente de estas diferen-
cias al estímulo experimental. Por ello, el análisis de los resultados pretende
averiguar si el nivel de la variable estudiada es claramente diferente después
de la aplicación del estímulo experimental que antes de dicha estimulación.
Ahora bien, al comparar un grupo consigo mismo respecto de una variable, no
hay ninguna garantía de que el efecto que se mide al final se deba exclusiva-
mente a la influencia del estímulo experimental. Por ejemplo, en relación con
el rendimiento cabe la posibilidad de que el nivel alcanzado haya sido influido
por la evolución natural de los sujetos durante la aplicación del estímulo expe-
rimental, especialmente si el tiempo ha sido largo. Por ello, se suele considerar
inadecuado este tipo de diseños para probar hipótesis de investigación.

2.13.2.3. Diseños cuasiexperimentales

Son los diseños en los que el investigador varía deliberadamente los valores
de la variable independiente para evaluar los efectos que produce dicha va-
riación en la variable dependiente, pero sin el control propio del método ex-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 51

¿Qué es un problema de investigación? ¿Y sus implicaciones? 51

perimental. En realidad, muchas variables extrañas quedan sin controlar, ya


que sólo controla algunas de ellas. Esto es lo que ocurre cuando el investiga-
dor trabaja con situaciones reales o en estudios de campo.
El investigador selecciona aleatoriamente a varios grupos de alumnos per-
tenecientes a otras tantas aulas. Les aplica una prueba para averiguar su nivel
inicial en una determinada característica, por ejemplo el rendimiento. Después,
aplica diferentes niveles del estímulo experimental a cada grupo diferente; por
ejemplo, en lugar de proporcionar el mismo tipo de premio, cada grupo de
alumnos recibe sucesivamente distintas formas de estimulación.
Al finalizar el tiempo experimental, los sujetos son sometidos a la misma
prueba inicial para evaluar el efecto experimental en la variable estudiada. El
investigador espera obtener unas diferencias claras entre los diferentes niveles
de la variable experimental para así poder asignar la fuente de estas diferencias
a la estimulación experimental. Por ello, el análisis de los resultados pretende
averiguar si los niveles de la variable experimental producen efectos clara-
mente diferentes. Ahora bien, al comparar diferentes grupos, cada uno asigna-
do a un nivel de estimulación distinto, no hay ninguna garantía de que el
efecto que se mide al final pueda ser comparable entre los grupos. Aunque
los grupos tengan un mismo punto de partida no se puede estar seguro de
que evolucionen de la misma manera, especialmente en contextos reales co-
mo el aula. Se desconoce si el hecho de saber que están participando en un
estudio experimental ha tenido algún efecto, si el encargado de aplicar el estí-
mulo ha seguido todas las indicaciones, si las interferencias debidas a distin-
tas causas han potenciado o, por el contrario, debilitado el objetivo del estu-
dio. En resumen, al no tener control alguno sobre lo que ocurre en la
realidad, resulta aventurado afirmar que se puede confirmar o rechazar una
hipótesis de investigación con datos resultantes de este tipo de diseño.
Como puedes sospechar, las evidencias producidas por los tres tipos de
diseños de investigación no son comparables en cuanto a su capacidad para
confirmar o rechazar una hipótesis. El diseño experimental ofrece el máximo
nivel de garantía; sin embargo, sus exigencias lo convierten en un diseño difí-
cil de aplicar en la investigación social. Los diseños más comunes son preex-
perimentales y cuasiexperimentales.

VALIDEZ DE UN DISEÑO DE INVESTIGACIÓN 2.14.

El mejor de los diseños de investigación producirá resultados poco útiles si


no cumple el criterio de la validez. Un diseño de investigación es válido si los
resultados que proporciona reflejan el objeto de estudio. Este hecho tiene a
su vez dos implicaciones: a) el diseño debe permitirnos atribuir con cierta
confianza los cambios ocurridos en la variable dependiente a la influencia de
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 52

52 Introducción a la estadística

la independiente (validez interna); b) y como generalmente no nos limitamos


a hacer afirmaciones referidas exclusivamente al grupo o grupos estudiados,
sino que buscamos extender las conclusiones a entidades y ámbitos más am-
plios, es lógico exigir que el diseño permita que los resultados obtenidos en
el laboratorio o en contextos muy controlados sean generalizables a las con-
diciones naturales, a la población (validez externa). Tanto la validez interna
como la validez externa pueden verse afectadas por factores negativos. Si quie-
res saber más sobre cómo actúan estos factores, consulta el libro de D. Campbell
y A. Stanley (1975): Diseños experimentales y cuasi-experimentales en la in-
vestigación social (Amorrortu, B. A.) o el artículo de J. Tejedor (1981): «Validez
interna y externa en los diseños experimentales», publicado en la Revista Es-
pañola de Pedagogía, 151, 15-39.
Para seleccionar un diseño no existe un único conjunto de criterios de va-
lidez universal. Entre otros principios, hay que tener en cuenta las considera-
ciones de orden práctico: no está de más apoyarse en la forma en que tradi-
cionalmente se trabaja en una determinada área. Eso no quiere decir que
habría que evitar la utilización de nuevos métodos; al contrario, podrían in-
cluso favorecer el descubrimiento de los errores de los métodos tradicionales
o de facetas de un problema dado no contempladas hasta entonces. A nues-
tro entender, podríamos decir que un diseño es adecuado si:
• Reduce al mínimo el nivel de error sistemático.
• Permite la obtención de resultados unívocos con un mínimo esfuerzo
experimental.
• Mantiene bajo control todas las condiciones que pueden afectar a la va-
lidez interna y externa del experimento.
• Es simple, es decir no innecesariamente complicado.
• Permite la determinación del grado de incertidumbre de los resultados
obtenidos.
Por otro lado, existe una relación de dependencia entre la naturaleza del
problema y de las hipótesis, y el diseño: si el diseño no es adecuado, cabe la
posibilidad de que la investigación dé lugar a resultados que admiten explica-
ciones alternativas para los efectos de la variable independiente sobre la va-
riable dependiente. Peor aún, es posible que no se consiga responder a las
preguntas iniciales. Aunque el progreso de la estadística haya proporcionado
a los investigadores una gran variedad de medios para aumentar la precisión de
sus experimentos, sus aportaciones no pueden resolver los fallos de un trabajo
mal diseñado. Así pues, la mayor o menor precisión y validez de los resultados
depende de la selección de un diseño adecuado.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 53

¿Qué es un problema de investigación? ¿Y sus implicaciones? 53

TU TURNO 2.15.

Identificando un problema de investigación. Elige una entre las si-


guientes propuestas o haz la tuya propia:
— Mira a tu alrededor y redacta una lista de manifestaciones de lo que
podría ser un problema que merece ser investigado.
— Elige al azar una revista y léela intentando identificar alguna cuestión
que podría merecer la atención de un investigador.
— Elige una revista entre las que te haya recomendado tu profesor, selec-
ciona un artículo de investigación e identifica las cuestiones que el in-
vestigador ha tratado de responder.
— Elige una revista entre las que te haya recomendado tu profesor, seleccio-
na un artículo de investigación e identifica las cuestiones que el investiga-
dor ha dejado sin contestar o cuyas respuestas sean incompletas.
— Entra en Internet y elige una de las numerosas páginas web que con-
tienen datos sobre el ámbito social, educativo, pedagógico, etc. Antes
de elegir una base datos, recopila la información necesaria que te ayude
a entender su contenido y empieza a trabajar.

Proponiendo una teoría explicativa:


— Intenta proponer una explicación al conjunto de sucesos que hayas ob-
servado.

Especificando hipótesis sustantivas:


— Tendrás que relacionar variables a la hora de explicitar tus hipótesis
sustantivas.
— Haz un listado lo más completo posible de tus variables. Te conviene
indicar el nivel de medida de cada variable.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 54
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 55

Capítulo 3
DESCRIBIENDO MIS DATOS

Al finalizar este capítulo deberías ser capaz de:


• Representar tus datos gráficamente.
• Elegir entre diferentes opciones de representación gráfica.
• Transformar una distribución original de datos en una distribución
de intervalos.
• Interpretar los resultados gráficos obtenidos.
• Hallar el rango.
• Distinguir entre diferentes tipos de frecuencias: absolutas, acumu-
ladas, relativas, porcentuales.
• Hallar la moda y la mediana.
• Hallar cuartiles y centiles.
• Hallar intervalos de clase.
• Determinar los límites aparentes y reales de los intervalos de clase.
• Realizar análisis estadísticos mediante programas informáticos.

En el capítulo 2 hablamos de lo que es un problema y de sus implicaciones.


También te presentamos lo que supondría un problema que podría resumirse
con el nombre de «dificultades de aprendizaje de los métodos de investiga-
ción social» y cuyas manifestaciones tuvimos ocasión de comentar. De ahora
en adelante, los distintos análisis que se van a llevar a cabo tendrán este mar-
co como referencia.
Algunas de las variables que fueron tomadas en consideración para el es-
tudio de este problema fueron:
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 56

56 Introducción a la estadística

Variables Nivel de medida Medición

Grupo de investigación Nominal 1. Simple asistencia a clase


2. Asistencia a clase y realización
de ejercicios de solución de
problemas
3. Asistencia a clase y realización
de ejercicios en la plataforma
Campus Virtual
4. Asistencia a clase, realización
de ejercicios de solución de
problemas y Campus Virtual

Realización de ejercicios de solu- Nominal 1. Sí


ción de problemas 2. No

Aprendizaje a través de la plata- Nominal 1. Sí


forma Campus Virtual 2. No

Repetidor/a Nominal 1. Sí
2. No

Nivel de dificultad esperada de la Intervalo Cuestionario (0-100)


materia I, al principio del curso

Nivel de interés esperado de la Intervalo Cuestionario (0-100)


materia I, al principio del curso

Elección de pedagogía como ca- Nominal 1. Carrera no elegida


rrera 2. Carrera elegida en primer lugar
3. Carrera elegida en segundo lu-
gar
4. Carrera elegida en tercer lugar

Orientación académica con la que Nominal 1. Ciencias


el alumno se identifica 2. Letras

Puntuación total en «Conocimien- Intervalo Prueba de «Conocimientos pre-


tos previos» sobre 10 vios»

Puntuación total en la escala de Intervalo Cuestionario de «Actitudes hacia


«Actitud hacia la estadística» la estadística» (0-10)

Teoría I Intervalo Prueba - Primer parcial

Práctica I Intervalo Prueba - Primer parcial

Parcial I Intervalo Prueba - Primer parcial

Calificación I Intervalo Prueba - Primer parcial

Teoría II Intervalo Prueba - Segundo parcial


INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 57

Describiendo mis datos 57

Variables Nivel de medida Medición

Práctica II Intervalo Prueba - Segundo parcial

Parcial II Intervalo Prueba - Segundo parcial

Calificación II Intervalo Prueba - Segundo parcial

Nivel de dificultad percibida de la Intervalo Cuestionario (0-100)


materia II, al final del curso

Nivel de interés percibido de la Intervalo Cuestionario (0-100)


materia II, al final del curso

Algunas aclaraciones sobre estos datos:


1. Todos los alumnos matriculados en este grupo tienen libertad para rea-
lizar o no las pruebas que se mencionan, salvo los exámenes oficiales.
2. Todos los alumnos participan libremente en las actividades propuestas,
tales como la realización de ejercicios de solución de problemas o el
uso de la plataforma Campus Virtual.
3. Esta situación podría haber favorecido un efecto de autoselección. De
hecho, un estudio inicial de los datos sugiere que el nivel de dificultad
esperada y el nivel de interés esperado varían sustancialmente entre los
alumnos en función del grupo que eligen para realizar sus actividades
de aprendizaje.
4. Se trata de un diseño esencialmente cuasi-experimental. Por ello, las
conclusiones extraídas del mismo deberán tomarse con cautela.
Para el análisis de los datos, el primer paso consiste en la descripción de
lo que se acaba de recoger de la realidad, es decir, los resultados de la medi-
ción. Recordarás que cada conjunto medido refleja una variable. Por tanto,
inicialmente las variables se describirán por separado. Ahora bien, la descrip-
ción de los datos utiliza un lenguaje característico. Ante este lenguaje te con-
viene adoptar la misma actitud que la de quien aprende un nuevo idioma: in-
tentar imponer la estructura gramatical de procedencia al aprendizaje de un
nuevo idioma suele conducir al fracaso. Para evitarte un inútil dolor de cabe-
za, te conviene actuar del mismo modo que aprendiste tu lengua materna, es
decir, con paciencia y trabajo. Quizá no te acuerdes de cuántas veces repetis-
te tus primeras palabras hasta que por fin se formaron frases inteligibles. Pues
aquí lo mismo. Para representar tus datos vas a aprender símbolos nuevos.
Memorízalos, pero considéralos ante todo como parte de un nuevo vocabulario
que es consustancial con el lenguaje de la investigación. Estos símbolos han si-
do inventados para simplificar la comunicación de conceptos unívocos entre los
investigadores. Verás lo útil que son cuando tengas que presentar tus datos de
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 58

58 Introducción a la estadística

una manera concisa y clara. Cuando vayas aprendiendo nuevos símbolos es


probable que acabes descubriendo la elegancia de la expresión estadística. Me
atrevo a vaticinar que llegarás incluso a disfrutar hablando este nuevo lenguaje,
que en realidad está muy emparentado con el álgebra elemental.

3.1. SIMBOLIZACIÓN
Tomemos por ejemplo los datos recogidos sobre lo que piensan los alumnos
respecto del nivel de dificultad de esta materia a principios del curso; 93 alum-
nos matriculados se avinieron a expresar sus impresiones iniciales en una esca-
la de 0 a 100 puntos: 0 indica que el alumno cree que esta materia tiene un ba-
jo nivel de dificultad mientras que 100, que el alumno piensa que se trata de
una materia muy difícil. Los datos recogidos de los 93 alumnos fueron:

TABLA 3.1
NIVEL DE DIFICULTAD. PUNTUACIONES

60, 50, 90, 90, 80, 65, 80, 75, 85, 60, 67, 80, 85, 90, 90, 72, 100, 65, 25, 95, 79, 82,
70, 88, 50, 88, 80, 80, 90, 80, 90, 90, 90, 90, 70, 75, 70, 89, 70, 85, 95, 50, 85, 75,
80, 95, 80, 80, 85, 88, 50, 84, 87, 75, 88, 70, 85, 90, 80, 85, 90, 81, 65, 90, 90, 70,
85, 90, 96, 80, 82, 95, 100, 20, 100, 70, 90, 80, 90, 79, 79, 80, 80, 70, 80, 85, 90,
50, 80, 68, 92, 80, 90.

Si considerásemos estos datos cada uno por separado, posiblemente no


estaríamos en condiciones de dar sentido al conjunto. Pero antes de iniciar el
análisis, conviene que dediquemos algún tiempo al estudio del formato en
que los datos son habitualmente presentados. Fíjate en los cinco primeros da-
tos. Formalmente se presentan como:

Número Simbolización Valor del dato,


de sujeto del dato nivel de dificultad
1 X1 60

2 X2 50

3 X3 90

4 X4 90

5 X5 80

· ·· ··
· ·· ··
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 59

Describiendo mis datos 59

Con el símbolo X se representa la variable «nivel de dificultad» y con el subín-


dice 1, 2, 3, 4, 5... se representa el valor que tiene esa variable para cada uno de
los alumnos del grupo, siendo N el número total de individuos. Eso significa que
el último alumno de la clase quedaría representado de la siguiente manera: X93 =
90. Podemos generalizar la representación de cualquier conjunto de datos X de
una distribución como Xi , donde i puede asumir cualquier valor de 1 a N.

FRECUENCIAS ABSOLUTAS 3.2.

Volvamos a nuestro problema. Parece lógico que el profesor se interese por


saber cómo su clase percibe la materia que le toca impartir o cuántos alum-
nos llegan con la impresión de que esta materia es muy difícil. Para respon-
der a esta pregunta, de poco le sirve observar los datos tal como aparecen en
la tabla anterior. Aunque sean muchos los alumnos que le han suministrado la
información que pedía, es difícil que el profesor pueda hacerse una idea del
nivel de dificultad que perciben, debido sobre todo a la forma en que están
presentados en la tabla. Este profesor debería someter estos datos a algún ti-
po de cambio para facilitar su interpretación. El cambio más lógico sería con-
tar las veces que una determinada valoración aparece. La información sería
aún más útil si se empieza por clasificar los valores de la variable en orden
ascendente o descendente y después se cuenta cuántas veces cada valor apa-
rece. Se obtendría una distribución de frecuencias absolutas, f.

TABLA 3.2
NIVEL DE DIFICULTAD. PUNTUACIONES ORGANIZADAS EN UNA
DISTRIBUCIÓN DE FRECUENCIAS
Nivel de dificultad Frecuencia (f) Nivel de dificultad Frecuencia (f)
20 1 81 1
25 1 82 2
50 5 84 1
60 2 85 9
65 3 87 1
67 1 88 4
68 1 89 1
70 8 90 18
72 1 92 1
75 4 95 4
79 3 96 1
80 17 100 3
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 60

60 Introducción a la estadística

Si te fijas en los valores de la variable «Nivel de dificultad», verás que su va-


lor más pequeño es 20, mientras que su valor más alto asciende a 100. Si enu-
meras individualmente los valores entre 20 y 100, te darás cuenta de que el ran-
go es amplísimo y de que hay muchos valores, por ejemplo 21 ó 97, con una
frecuencia nula y que, por tanto, no aparecen en la tabla 3.2. Una presentación
que incluyera los valores con frecuencia 0 dificultaría la interpretación, ya que
en estas condiciones no se percibiría con suficiente claridad el valor que podría
servir como referencia para la interpretación. Tampoco mejora sensiblemente la
presentación en la que se eliminan los valores con una frecuencia nula.
Para mejorar las posibilidades de la interpretación, se aconseja agrupar los
valores. En la tabla 3.3 se propone una distribución con 10 unidades de an-
cho y otra con un intervalo de 20 unidades de ancho, con un punto de origen
elegido al azar.

TABLA 3.3
NIVEL DE DIFICULTAD. PUNTUACIONES AGRUPADAS
EN INTERVALOS DE CLASE DE ANCHURA 10 Y 20
Nivel de dificultad Frecuencia (f) Nivel de dificultad Frecuencia (f)
(Anchura = 10) (Anchura = 20)
11-20 1 01-20 1
21-30 1 21-40 1
31-40 0 41-60 7
41-50 5 61-80 38
51-60 2 81-100 46
61-70 13 N = 93
71-80 25
81-90 37
91-100 9
N = 93

Ahora bien, cuando agrupas los datos, te surge un problema, el de la ampli-


tud del intervalo. Date cuenta de que cuando formas grupos de valores pierdes
cierta información sobre la distribución de las frecuencias dentro de los interva-
los. Cuanto más amplio sea el intervalo, más información pierdes. Compara la
distribución de anchura 10 con la de 20. Puedes ver que en la de 20 ya no hay
intervalo con frecuencia nula; en cambio, ya no sabes cómo se distribuyen los
46 alumnos que hay dentro del intervalo 81-100. Observa que la pérdida de in-
formación se incrementa con el aumento de la anchura del intervalo.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 61

Describiendo mis datos 61

La decisión respecto de la anchura del intervalo al agrupar los valores de


una variable supone intentar elegir un punto medio entre perder información
y tener una presentación que sea interpretable. En la práctica se aconseja de-
terminar la amplitud del intervalo, dividiendo la distribución entre 10 y 20 in-
tervalos. Los pasos que se deben seguir para la construcción de una distribu-
ción de frecuencias agrupadas son:
• Calcular el rango de los valores, siendo el rango la diferencia entre el
valor máximo y el valor mínimo. Rango = 100 – 20 = 80.
• Calcular la amplitud de cada intervalo de clase (i). Todos los intervalos
deben ser de igual magnitud. Suponiendo que quieres formar 10 inter-
valos de clase, el valor de i será el cociente entre el rango y el número
de intervalos de clase, o sea:
• Enumerar los intervalos comenzando por el intervalo inferior. Para determi-
nar el límite inferior, asegúrate de que ese intervalo contiene como mínimo
un dato y procura que ese límite sea divisible por i. En nuestro caso, ese lí-
mite es 16 ya que 20 no es un múltiplo de 8. Una vez hallado el punto de
comienzo, puedes enumerar los demás intervalos. Es necesario que com-
pruebes que los intervalos son continuos y mutuamente excluyentes, es de-
cir: ningún dato puede pertenecer válidamente a dos intervalos contiguos.
• Contar los datos.
• Sumar las frecuencias.

TABLA 3.4
NIVEL DE DIFICULTAD. PUNTUACIONES AGRUPADAS
EN INTERVALOS DE CLASE DE ANCHURA 8
Intervalo de clase Intervalo de clase Frecuencia (f)
Límites aparentes Límites reales o exactos
16-23 15,5-23,5 1
24-31 23,5-31,5 1
32-39 31,5-39,5 0
40-47 39,5-47,5 0
48-55 47,5-55,5 5
56-63 55,5-63,5 2
64-71 63,5-71,5 13
72-79 71,5-79,5 8
80-87 79,5-87,5 31
88-95 87,5-95,5 28
96-103 95,5-102,5 4
N = 93
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 62

62 Introducción a la estadística

3.3. FRECUENCIAS RELATIVAS

Si lo que te interesa es saber la proporción de alumnos que creen que esta


materia tiene un cierto nivel de dificultad, te basta convertir las frecuencias
absolutas en frecuencias relativas. Para ello, debes dividir la frecuencia abso-
luta de cada intervalo por la frecuencia total, N. El resultado puede expresarse
también como un porcentaje. Así la frecuencia relativa del primer intervalo es
1 : 93 = 0,01 y su porcentaje 0,01 × 100 = 1.

TABLA 3.5
NIVEL DE DIFICULTAD. FRECUENCIA RELATIVA
Y FRECUENCIA PORCENTUAL

Intervalo Frecuencia Frecuencia Frecuencia


de clase absoluta (f) relativa (fr) porcentual (fp)

16-23 1 0,01 1
24-31 1 0,01 1
32-39 0 0,00 0
40-47 0 0,00 0
48-55 5 0,05 5
56-63 2 0,02 2
64-71 13 0,14 14
72-79 8 0,09 9
80-87 31 0,33 33
88-95 28 0,30 30
96-103 4 0,04 4
N = 93 1,00 100

Si lo que te interesa es saber cuántos alumnos creen que esta materia tiene
un nivel de dificultad que está por encima o por debajo de un determinado
nivel, lo que necesitas es calcular las frecuencias acumuladas. Para ello, sumas
la frecuencia del intervalo en cuestión a las frecuencias de todos los interva-
los de clase que le preceden. Así, por ejemplo, la frecuencia acumulada para
el intervalo 48-55 es 1 + 1 + 0 + 0 + 5 = 7. Para hallar las frecuencias relativas
acumuladas basta con acumular las frecuencias absolutas y convertirlas en fre-
cuencias relativas. Así, para el intervalo 48-55 la frecuencia relativa acumulada
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 63

Describiendo mis datos 63

sería 7 : 93 = 0,08. Para la conversión de las frecuencias relativas acumuladas


en frecuencias porcentuales acumuladas, se procede del mismo modo y se
multiplica el resultado por 100. Por tanto, la frecuencia porcentual acumulada
para este intervalo sería (7 : 93) × 100 = 8.

TABLA 3.6
NIVEL DE DIFICULTAD. FRECUENCIAS ACUMULADAS

Intervalo Frecuencia Frecuencia Frecuencia Frecuencia


de clase absoluta absoluta relativa porcentual
(fi) acumulada acumulada acumulada
(fa) (fra) (fpa)

16-23 1 1 0,01 1
24-31 1 2 0,02 2
32-39 0 2 0,02 2
40-47 0 2 0,02 2
48-55 5 7 0,08 8
56-63 2 9 0,10 10
64-71 13 22 0,24 24
72-79 8 30 0,32 32
80-87 31 61 0,66 66
88-95 28 89 0,96 96
96-103 4 93 1,00 100
N = 93

CÁLCULO DE LOS PERCENTILES 3.4.

Las distribuciones de frecuencias porcentuales acumuladas son útiles cuando


se necesita establecer la posición relativa de determinados individuos dentro
de su grupo de referencia. Por ejemplo, se utilizan en educación cuando se
quiere comparar el rendimiento de un individuo con el de sus compañeros
de clase o de sus pares. En lugar de hablar de frecuencias porcentuales acu-
muladas, se utiliza el término «percentiles»; el percentil (P) se define como el
valor de la escala de medida por debajo del cual cae un porcentaje dado de los
datos de una distribución. Así, el percentil 75 es el valor de la escala de medi-
da por debajo del cual cae el 75% de los datos de esta distribución.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 64

64 Introducción a la estadística

Los pasos que se deben seguir para computar un percentil, como el per-
centil 75 por ejemplo, son:
• Calcular la frecuencia acumulada por debajo del percentil.
— fpa para P75 = 0,75 × 93 = 69,75. Así sabemos que unos 70 sujetos
tienen una puntuación que está por debajo de un determinado va-
lor. Con esta información vamos a la tabla de frecuencias porcen-
tuales acumuladas para poder averiguar el intervalo donde está si-
tuado el percentil P75.
• Establecer el límite inferior exacto XL del intervalo de clase que contie-
ne el percentil que se busca.
— En nuestro caso este límite XL está situado en el valor 87,5 (ver tabla
3.4). Esto nos permite averiguar cuántos sujetos hay por debajo de
esta puntuación; en nuestro caso son 61 sujetos (ver tabla 3.6).
• Calcular el número de datos adicionales que necesitamos para llegar al
percentil deseado. Para ello se resta de la frecuencia acumulada por de-
bajo del percentil la frecuencia que corresponda al límite inferior exacto
del intervalo de clase.
— Número de datos adicionales = fpa – fL.
— Número de datos adicionales = 70 – 61 = 9.
• Calcular el número de valores adicionales en el intervalo que se debe
incrementar para obtener el número de sujetos adicionales.
— Recuerda que fi es la frecuencia absoluta dentro del intervalo mien-
tras que i es la amplitud del intervalo. Por tanto, i/fi proporciona in-
formación sobre el número de sujetos que corresponde a cada uni-
dad del intervalo. En nuestro caso mirando en la tabla 3.6 vemos que
hay 28 sujetos dentro del intervalo y éste tiene 8 unidades. En conse-
cuencia, cada unidad i tiene 8/28 sujetos, y como necesitamos nueve
datos adicionales, realizamos la siguiente operación:
• Calcular el percentil sumando las unidades adicionales al límite inferior
exacto del intervalo que contiene el percentil.
— Percentil = XL + unidades adicionales.
— P75 = 87,5 + 2,57 = 90,07.
Con frecuencia, en vez de calcular el porcentaje de sujetos que están por
debajo de una determinada puntuación llamada percentil, se habla de cuartil.
Esta vez en lugar de dividir la distribución en cien partes, se reparte dicha
distribución en cuatro, siendo cada una de 25%. Y para calcular la puntuación
que corresponde a cada cuartil se procede del mismo modo que para el per-
centil, excepto que en este caso se calculan sólo tres valores: el primer cuartil,
Q1: es la puntuación que deja por debajo de sí al 25%; el segundo cuartil, me-
diana (Md o Me): es la puntuación que deja por debajo de sí al 50% de sujetos;
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 65

Describiendo mis datos 65

y el tercer cuartil, Q3: es la puntuación que deja por debajo de sí al 75% de la


distribución. En el caso que nos ocupa, Q3 = P75 = 90,07.

REPRESENTACIÓN GRÁFICA
DE LAS DISTRIBUCIONES DE FRECUENCIAS 3.5.

Si te has fijado en la presentación de datos socioeconómicos en los periódi-


cos, habrás observado que raramente se proporcionan bajo la forma de tablas
únicamente. En general, se prefiere presentar este tipo de información en grá-
ficos porque se cree que una presentación visual es probablemente más fácil
de interpretar que un cúmulo de cifras. Esta forma de presentación la encon-
trarás también en documentos tales como artículos, informes de investigación,
etc. En ocasiones, tablas y gráficos se presentan simultáneamente.
Es muy probable que los gráficos no sean ningún misterio para ti. Sin em-
bargo, conviene prestar una atención muy especial a la representación gráfi-
ca, sobre todo en relación con tu capacidad para interpretar correctamente su
contenido y no tanto en relación con tu capacidad para realizar gráficos rela-
tivamente sencillos. En relación con este último punto, existe una gran varie-
dad de posibles modos de representar un conjunto de datos recogidos en el
marco del estudio de una determinada cuestión. De hecho, puedes elegir en-
tre diagramas de barras, histogramas, sectores o cualquier otra representación
que se te pueda ocurrir.
En general, en un gráfico bidimensional se representan los valores de la
variable en un eje, habitualmente el horizontal, mientras en el otro eje, el ver-
tical, se indican cuántos individuos tiene cada valor. Si quieres hacer una re-
presentación que sea suficientemente clara, has de elegir adecuadamente las
unidades: los valores de la variable pueden ser reflejados todos en el gráfico,
pero cuando el rango es muy elevado, conviene recurrir a intervalos de clase
que permitan una interpretación del gráfico que tenga sentido. Ten cuidado
con una posible distorsión: cabe la posibilidad de que tu representación re-
sulte equívoca. Para evitar una situación así, se acostumbra a poner ceros en
la intersección entre los dos ejes; de hecho, la interpretación de un gráfico
puede variar notablemente si se pone como origen 0 o cualquier otro valor,
como por ejemplo el valor más pequeño de una escala. Si la intersección en-
tre los dos ejes no se encuentra en 0, conviene indicar que una parte de la
escala no entra en la representación en el eje correspondiente. Por otra parte,
al elegir la escala de representación, procura que la altura de los datos sea
aproximadamente 3/4 de la anchura, si realizas el gráfico manualmente. En
general, los programas informáticos pueden ayudar a resolver esta dificultad
de modo automático. Finalmente, no olvides la etiqueta para cada uno de los
ejes.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 66

66 Introducción a la estadística

GRÁFICO 3.1
HISTOGRAMA VERTICAL

20

15
Frecuencias absolutas

10

0
20 25 50 60 65 67 68 70 72 75 79 80 81 82 84 85 87 88 89 90 92 95 96 100
Frecuencias absolutas 1 1 5 2 3 1 1 8 1 4 3 17 1 2 1 9 1 4 1 18 1 4 1 3

Nivel de dificultad

Esta misma información se puede representar horizontalmente, como pue-


des ver en el siguiente gráfico.

GRÁFICO 3.2
HISTOGRAMA HORIZONTAL

Nivel de dificultad
20
25
50
60
65
67
68
70
72
75
79
80
81
82
84
85
87
88
89
90
92
95
96
10 0

0 5 10 15 20
Frecuencias absolutas
20 25 50 60 65 67 68 70 72 75 79 80 81 82 84 85 87 88 89 90 92 95 96 100
Frecuencias absolutas 1 1 5 2 3 1 1 8 1 4 3 17 1 2 1 9 1 4 1 18 1 4 1 3
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 67

Describiendo mis datos 67

Si unes los puntos medios de las barras del gráfico 3.1, obtendrás un polí-
gono de frecuencias, como el que está representado en el gráfico 3.3a.

GRÁFICO 3.3a
POLÍGONO DE FRECUENCIAS

20

15
Frecuencias absolutas

10

0
20 25 50 60 65 67 68 70 72 75 79 80 81 82 84 85 87 88 89 90 92 95 96 100
Frecuencia absoluta 1 1 5 2 3 1 1 8 1 4 3 17 1 2 1 9 1 4 1 18 1 4 1 3

Nivel de dificultad

A veces el área por debajo del polígono de frecuencias se oscurece para


facilitar la percepción de la distribución, dando lugar a una estructura pareci-
da al gráfico 3.3b.

GRÁFICO 3.3b
POLÍGONO DE FRECUENCIAS (ÁREAS)

20

15
Frecuencias absolutas

10

0
20 25 50 60 65 67 68 70 72 75 79 80 81 82 84 85 87 88 89 90 92 95 96 100
Frecuencias absolutas 1 1 5 2 3 1 1 8 1 4 3 17 1 2 1 9 1 4 1 18 1 4 1 3

Nivel de dificultad
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 68

68 Introducción a la estadística

La representación de las frecuencias agrupadas en intervalo de clase sigue


el mismo esquema.

GRÁFICO 3.4a
HISTOGRAMA. NIVEL DE DIFICULTAD

35

30

25

20

15

10

5
Frecuencias

GRÁFICO 3.4b
HISTOGRAMA. NIVEL DE DIFICULTAD

3
30

2
Frecuencia

20

10

5
4

2
1 1
0
16-23 24-31 48-55 56-63 64-71 72-79 80-87 88-95 96-103
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 11:08 Página 69

Describiendo mis datos 69

Observa que dependiendo del programa informático que utilices para la


representación gráfica, los intervalos nulos se mantienen (gráfico 3.4a) o son
eliminados (gráfico 3.4b). En este último caso, los intervalos 32-39 y 40-47
han sido suprimidos. Esta supresión tiene consecuencias. Por una parte, ayu-
da a simplificar y economizar el espacio para la representación. Sin embargo,
a la vez oculta el hecho de que no haya ningún sujeto en el intervalo 32-47.
No se nos escapa que la ausencia de sujetos en un intervalo tan amplio po-
dría ser una observación relevante para la interpretación del evento que se
está estudiando.

GRÁFICO 3.5
SECTORES. NIVEL DE DIFICULTAD

4 1 1
5 16-23
2
24-31
48-55
13
56-63
28
64-71
72-79
80-87
8
88-95
96-103

31

¿Te has fijado en que cualquiera que sea el formato de representación que
utilices, siempre hay un valor o intervalo que destaca por el número de suje-
tos que se concentran en él? En el caso del agrupamiento por intervalos des-
taca el 80-87; aquí se acumulan 31 de los 93 individuos. Este tipo de intervalo
recibe el nombre de moda, Mo.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 70

70 Introducción a la estadística

GRÁFICO 3.6
ÁREA. NIVEL DE DIFICULTAD

35

30
Frecuencias absolutas

25

20

15

10

0
16-23 24-31 32-39 40-47 48-55 56-63 64-71 72-79 80-87 88-95 96-103
F 1 1 0 0 5 2 1 8 3 2 4

Nivel de dificulta d

GRÁFICO 3.7
HISTOGRAMA Y CURVA SUPERPUESTA

30 31

28
Frecuencia

20

13

10

5
4

2
1 1
0 0 0
0 2 4 6 8 10 12
Nivel de dificultad
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 71

Describiendo mis datos 71

Sin embargo, en ocasiones la interpretación de ciertos gráficos, como el


3.7, no resulta evidente a primera vista. Para empezar, se trata de dos gráficos
superpuestos. El primero, donde aparecen unas barras, se interpreta como ya
sabes: cada barra representa un valor o una categoría y tiene una altura equi-
valente al número de sujetos que poseen una determinada característica. El
que está representado mediante una suave línea punteada, muestra en reali-
dad un modelo teórico de distribución, pero sigue las mismas reglas para su
interpretación que el gráfico de barras, es decir, en su parte central se en-
cuentra la proporción más alta de sujetos, mientras que en los extremos hay
cada vez menos. Tendremos ocasión de hablar más adelante de la importan-
cia de la forma de una distribución.

REPRESENTACIÓN DE
LAS FRECUENCIAS ACUMULADAS 3.6.

Las distribuciones de las frecuencias acumuladas, sean absolutas, relativas o


porcentuales, son esencialmente similares y tienen una forma peculiar con
cierto parecido a la letra S. Esta semejanza le ha valido a este tipo de curva el
nombre de ojiva.

GRÁFICO 3.8a
FRECUENCIAS ABSOLUTAS ACUMULADAS

100

80
Frecuencias acumuladas

60

40

20

0
16-23 24-31 32-39 40-47 45-55 56-63 64-71 72-79 80-87 88-95 96-103
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 72

72 Introducción a la estadística

En algunas ocasiones, las aristas de este tipo de gráficos se suavizan, dan-


do lugar al siguiente gráfico.

GRÁFICO 3.8b
GRÁFICO SUAVIZADO
DE LAS FRECUENCIAS ABSOLUTAS ACUMULADAS

100
!
!

80
Frecuencias acumuladas

60 !

40

20 !

!
!
! ! ! !
0
16-23 24-31 32-39 40-47 45-55 56-63 64-71 72-79 80-87 88-95 96-103

3.7. DIAGRAMA DE TALLO Y HOJAS

Este tipo de diagrama se debe a J. Tukey y es una alternativa al histograma, si


lo que se pretende es resumir un conjunto de datos que no supera las cien
unidades. A diferencia del histograma, el diagrama de tallo y hojas tiene la
ventaja de conservar los datos originales. El gráfico 3.9 muestra un diagrama
de tallo y hojas para las puntuaciones de la variable «Nivel de dificultad».
¿Cómo se construye un diagrama de tallo y hojas? Coge una hoja como la
que aparece en el dibujo de dicho gráfico y colócala verticalmente sobre tu
mesa de trabajo. En la parte central del limbo, puedes ver la prolongación del
pecíolo. De esta prolongación salen unos nervios laterales. Fíjate únicamente
en la parte derecha de la prolongación del pecíolo; ésta hace el papel de tallo
mientras los nervios laterales hacen de hoja. Por tanto, el tallo queda a la iz-
quierda mientras la hoja se encuentra a la derecha. Para construir un diagra-
ma de tallo y hojas, el tallo se forma verticalmente ordenando los valores de
menor a mayor mientras las hojas se distribuyen horizontalmente.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 73

Describiendo mis datos 73

GRÁFICO 3.9
DIAGRAMA DE TALLO Y HOJAS

Frecuencia *
acumulada Tallo * Hojas
inferior *
1 2 * 0
2 * 5
2 3 *
2 *
2 4 *
2 *
7 5 * 00000
7 *
9 6 * 00
14 E 55578
23 7 * 000000002
30 Q 5555999
+ 21 8 M 000000000000000001224
42 * 555555555788889
27 9 Q 0000000000000000002
8 * 55556
3 10 * 000
0 *
*
Frecuencia Tallo * Hojas
acumulada *
superior *

En nuestro caso, el tallo lo componen los valores que están en la posición


de las decenas mientras las hojas son los valores que ocupan la posición de
las unidades. El tallo está dividido en dos segmentos: en el primero se inclu-
yen las hojas cuyos valores están entre 0 y 4, y en el segundo se ponen los
valores entre 5 y 9. Vuelve un momento a la tabla 3.2 y fíjate en las frecuen-
cias absolutas de las puntuaciones cuyo tallo es 8. Habrás observado que 80
aparece 17 veces, 81 una vez, 82 dos veces, 84 una vez, 85 nueve veces, 87
una vez, 88 cuatro veces y 89 una vez. Ahora fíjate en el tallo 8 del gráfico 3.9
y comprueba que lo que se acaba de comentar en la línea anterior queda re-
flejado en este gráfico: aparecen 17 ceros, un 1, dos veces 2, un 4, nueve ve-
ces 5, un 7, cuatro veces 8 y un 9. Este modo de representación afecta por
igual a todos los tallos: si un tallo no tiene hojas, o sea, si la frecuencia es nu-
la, como es el caso de 3 y 4, lógicamente queda vacío.
Si el rango de los datos lo exige, por ejemplo en el caso de que el dato
esté formado por tres dígitos, el tallo estaría compuesto por dos dígitos.
Si te fijas un poco más verás que hay un cierto parecido entre la forma del
diagrama de tallo y hojas y el histograma horizontal.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 74

74 Introducción a la estadística

Para la lectura de un diagrama de tallo y hojas conviene que recuerdes


que los valores de la parte izquierda son decenas mientras que cada dígito de
la parte derecha representa la unidad. Las letras que aparecen en el emplaza-
miento del tallo se refieren a las puntuaciones que delimitan el primer cuartil
Q1 (73,5), la mediana (80) y el tercer cuartil Q3 (90).
Para formar la columna de frecuencias acumuladas se parte simultánea-
mente de los límites inferior y superior de la distribución y se van acumulan-
do las frecuencias hasta el valor más próximo a la mediana. De hecho, si su-
mas las frecuencias acumuladas correspondientes al segundo tramo del tallo 7
(tramo inferior) [30], las del segundo tramo del tallo 8 (tramo superior) [42] y
la frecuencia absoluta del primer tramo del tallo 8 [21] entre cuyas hojas se
encuentra el valor de la mediana, obtendrás la frecuencia total: 93.

CON LA AYUDA
3.8. DE LA HERRAMIENTA INFORMÁTICA

Evidentemente eres libre de realizar todos los cálculos a mano. Sin embargo,
deberías saber que gracias a los programas informáticos, muchos cálculos que
antaño podían durar meses de duro trabajo manual, se realizan actualmente
en décimas de segundo. Ahora bien, el uso de la herramienta informática exi-
ge al menos un nivel básico de alfabetización informática. Espero que ya no
te asusten términos tales como abrir un programa o un fichero. Lo cierto es
que no hace falta ser un lince para manejar programas informáticos que a pri-
mera vista parecen complicados: basta un cierto espíritu ordenado para ejecu-
tar una secuencia lógica de comandos simples.
Para el análisis de los datos, vamos a recurrir al programa informático
SPSS. Sin embargo, si te resulta más cómodo utilizar otro, como Excel, Stat-
graphics, Minitab, Sigmaplot o cualquiera de la amplísima oferta del mercado,
puedes hacerlo. Por otra parte, si ya estás familiarizado con el programa SPSS,
pasa por alto los párrafos siguientes y ve directamente a los ejercicios.
El programa SPSS se activa del mismo modo que cualquier otro programa
y se abre en una típica hoja de cálculo vacía, lista para que el usuario la relle-
ne con sus datos. En caso de haber creado una base de datos SPSS basta ha-
cer doble clic sobre el nombre del fichero para abrirlo, siempre que el orde-
nador que utilices tenga instalado este programa.
Si te fijas en la parte inferior de la figura 3.1, verás que hay dos pestañas.
Si activas la pestaña «Vista de datos», es que quieres incorporar datos a tu ba-
se, y si activas la «Vista de variables», es que deseas llevar a cabo alguna espe-
cificación de las características de las variables.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 75

Describiendo mis datos 75

FIGURA 3.1
VISTA INICIAL

En la figura 3.2 se muestra en la «Vista de variables» el nombre de la varia-


ble «Prueba», que se acaba de crear, así como sus características.

FIGURA 3.2
VISTA DE VARIABLES
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 76

76 Introducción a la estadística

En la figura 3.3 se muestra una vista parcial de la base de datos que se va


a utilizar de aquí en adelante.

FIGURA 3.3
VISTA PARCIAL DE LA BASE DE DATOS

Para los análisis estadísticos, basta activar la orden de «Analizar». El des-


plegable que resulta de esta orden nos permite seleccionar el tipo de análisis
que queremos llevar a cabo.
Además de seleccionar las variables que quieres analizar, puedes indicar
los estadísticos que deseas obtener así como los gráficos correspondientes.
Una vez terminado el proceso de selección de variables y de estadísticos,
activas el comando «Aceptar» y, pocos segundos después, se abre automática-
mente la ventana de los «Resultados».
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 77

Describiendo mis datos 77

FIGURA 3.4
SELECCIÓN DEL TIPO DE ANÁLISIS

FIGURA 3.5
SELECCIÓN DE LAS VARIABLES QUE ANALIZAR
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 78

78 Introducción a la estadística

Puedes recurrir a las utilidades «Copiar» y «Pegar» para trasladar la totalidad


o parte de la salida a cualquiera de tus habituales programas de tratamiento
de textos.

FIGURA 3.6
VISTA PARCIAL DE LA VENTANA DE RESULTADOS

3.9. TU TURNO

1. Elige una variable continua de tu base de datos y halla las frecuen-


cias absolutas, acumuladas, relativas, porcentuales y porcentuales
acumuladas.
2. Calcula la puntuación que corresponde al primer cuartil de la distribu-
ción de tus datos.
3. Utiliza el medio (representación manual o programa informático) que
te resulte más cómodo para representar gráficamente tus datos. Si el
rango de tus datos es muy amplio, reduce la amplitud mediante inter-
valos. Para ello, fíjate en las tablas 3.2 y 3.3.
4. Comenta el gráfico anterior: ¿en qué intervalo se concentra el mayor
número de sujetos?, ¿hay algún intervalo nulo?, ¿los sujetos se concen-
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 79

Describiendo mis datos 79

tran en la parte inferior, media o superior de la distribución? Añade


cuantas observaciones te parezcan pertinentes.
5. Señala la moda y la mediana de la distribución de tu variable.
6. ¿Qué consecuencias tiene la amplitud de los intervalos sobre la calidad
de la información que contiene una tabla de frecuencias?
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 80
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 81

Capítulo 4
INICIANDO EL ÁNALISIS DE MIS DATOS

Al finalizar este capítulo deberías ser capaz de:


• Interpretar sencillas fórmulas estadísticas.
• Calcular los estadísticos adecuados para representar la tendencia
central de tus datos.
• Calcular el nivel de dispersión de tus datos mediante distintos es-
tadísticos.
• Conocer las medidas de la forma de una distribución de frecuencias.
• Realizar análisis estadísticos mediante programas informáticos.

Describir datos mediante un gráfico es ciertamente un paso muy importante,


comparado con el cúmulo más o menos incoherente de datos. Sin embargo, se
trata de un paso que no va más allá del simple recuento de frecuencias. En el
proceso de investigación es a menudo necesario superar la fase de conteo. Por
ejemplo, en lugar de discurrir sobre el número de alumnos que hay por debajo o
por encima de un determinado nivel de percepción de la dificultad de los conte-
nidos relacionados con el aprendizaje de los métodos de investigación social,
puede ser más informativo proporcionar información sobre el nivel medio de
percepción y/o el nivel de consenso del grupo de alumnos sobre esta cuestión.
Además de aprender vocabulario específico, en este capítulo vas a adquirir
nuevas habilidades respecto a cómo se procede para extraer informaciones
descriptivas de un grupo de individuos a partir de un cierto conjunto de datos.

MEDIDAS DE TENDENCIA CENTRAL 4.1.

Uno de los primeros pasos para describir tus datos fue la utilización de gráficos.
Ahora se trata de dar otro paso que consiste en hallar un único valor suscepti-
ble de representar el grupo entero respecto de la variable que estás estudiando,
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 82

82 Introducción a la estadística

el nivel de dificultad percibida. En realidad, tres pueden ser los valores que
cumplen el cometido de resumir un grupo de datos de una manera más o me-
nos válida: son la media, la mediana y la moda, y son conocidas como medi-
das de tendencia central. Al hablar de los gráficos definimos e indicamos cómo
hallar la mediana y la moda. A título de recordatorio, la mediana es el valor que
deja por debajo de sí la mitad de los datos de una distribución y equivale al se-
gundo cuartil o al percentil 50; la moda es el valor más frecuente en una distri-
bución. Ahora nos centraremos en el proceso que se debe seguir para averiguar
el valor de la media aritmética, habitualmente llamada media, sin más.
En el análisis de los datos de una investigación la media es uno de los valo-
res más comunes que se calcula; es sencillamente la suma de todos los valores
de una distribución, dividida por el número de individuos pertenecientes a un
determinado grupo. En nuestro caso, tendríamos que sumar las 93 valoracio-
nes y después dividir el total obtenido por 93.
La explicación contenida en el párrafo anterior se resume en una fórmula
sobria y elegante que dice...

(Fórmula 4.1)

... y que se interpreta de la siguiente manera:


• La X con una barra horizontal encima es el valor medio de la variable
para el grupo de individuos o media aritmética1.
• El símbolo ∑, letra griega conocida como sigma, se utiliza como signo
de suma; indica que se debe sumar todo lo que le sigue. En este caso,
estipula que hay que sumar todos los valores Xi desde el sujeto número
1 (i = 1) hasta el último, N.
• N, como ya sabes, se refiere al tamaño del grupo. Es posible que te en-
cuentres con fórmulas donde, en lugar de N, se utiliza n. En este caso,
n se refiere a una parte del grupo. Supongo que entiendes que en lugar
de calcular la media para todo el grupo se puede calcular dicho valor
para un grupo más reducido.
• Xi es un símbolo que ya conoces y que es el valor de la distribución
que le corresponde a cada individuo del grupo.
Para el grupo de los siete primeros alumnos, la media en cuanto a su per-
cepción del nivel de dificultad de esta materia se calcularía así:

1
Por cierto, cuando se trata de la media de toda la población, se utiliza el siguiente símbo-
lo: μ, que se lee «mu».
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 83

Iniciando el análisis de mis datos 83

El valor que obtienes no tiene por qué coincidir con alguno de los valores
que has utilizado para calcular la media. Piensa que es el resultado lógico de
dividir dos magnitudes. Por ello, no debe extrañarte que dicho resultado in-
corpore cifras decimales, que no aparecen en los datos originales. Mantener o
no dichas cifras depende del analista e implica decisiones relativas al nivel de
redondeo que piensa aplicar. En muchos campos científicos se utiliza el mis-
mo número de cifras significativas que tienen los datos originales. En el mar-
co de la investigación socioeducativa no se ha atendido al número de cifras
significativas, sino que la tradición establece el uso de resultados con tres y
hasta cuatro cifras decimales. Ya que no disponemos de un poderoso argu-
mento contra esta costumbre, en este volumen vamos a respetar la tradición.
Como habrá ocasiones en que demos nuestras respuestas definitivas hasta
con cuatro cifras decimales, nos conviene decidir cómo determinar el valor
del último dígito. Algunas orientaciones sencillas nos pueden ayudar a tomar
decisiones correctas aplicando las reglas básicas del redondeo. Te bastará
proceder del siguiente modo:
• Toma una decisión en relación con el número de cifras decimales que
formarán parte de tu respuesta final. Eso significa que ahora tu repuesta
parcial consta de dos partes: la respuesta potencial y el residuo.
• Pon un símbolo que separe la parte potencial del residuo. Recuerda que
en nuestro caso la parte residual es siempre decimal.
• Si el residuo es mayor que 0,5, entonces suma una unidad al último dí-
gito de tu respuesta potencial.
• Si el residuo es menor que 0,5, entonces deja el último dígito de tu res-
puesta potencial sin modificar.
• Si el residuo es igual a 0,5, entonces suma una unidad al último dígito de
tu respuesta potencial si es impar; no hagas nada si el último dígito es par.
La media 73,571429 se podría redondear de la siguiente manera:

Entero 1o decimal 2o decimal 3er decimal 4o decimal 5o decimal 6o decimal

73 5 7 1 4 2 9
73 5 7 1 4 3 0
73 5 7 1 4 0 0
73 5 7 1 0 0 0
73 5 7 0 0 0 0
73 6 0 0 0 0 0
74 0 0 0 0 0 0
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 84

84 Introducción a la estadística

Por cierto, la media para los 93 individuos asciende a


y se podría redondear del siguiente modo:

Entero 1o decimal 2o decimal 3er decimal 4o decimal 5o decimal 6o decimal

79 3 9 7 8 4 9
79 3 9 7 8 5 0
79 3 9 7 8 0 0
79 3 9 8 0 0 0
79 4 0 0 0 0 0

¿Obtendrías exactamente el mismo valor si tus datos estuvieran agrupados


en intervalos? Vamos a verlo. Para ello, vamos a utilizar los datos de la tabla
3.6 en combinación con la siguiente fórmula:

(Fórmula 4.2)

La fórmula anterior se interpreta de la siguiente manera:


• Xi es el punto medio del intervalo o marca de clase. Se calcula como la
media de los extremos del intervalo. Dicho de otro modo, se suma el
extremo inferior al extremo superior y se divide el resultado por dos.
• fi se refiere a la frecuencia dentro de cada intervalo.
• I es el número total de intervalos.

• se computa como la suma de todos los productos de cada mar-

ca de clase por su correspondiente frecuencia.

TABLA 4.1
MEDIA PARA DATOS AGRUPADOS

Intervalo de clase Marca de clase Xi fi Xifi

16-23 19,5 1 19,5


24-31 27,5 1 27,5
32-39 35,5 0 0,0
40-47 43,5 0 0,0
48-55 51,5 5 257,5
56-63 59,5 2 119,0
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 85

Iniciando el análisis de mis datos 85

Intervalo de clase Marca de clase Xi fi Xifi

64-71 67,5 13 877,5


72-79 75,5 8 604,0
80-87 83,5 31 2588,5
88-95 91,5 28 2562,0
96-103 99,5 4 398,0

Total N = 93

Por tanto, .
Te habrás dado cuenta de que las dos medias no coinciden por completo.
En realidad la media calculada a partir de datos agrupados en intervalos es
tan sólo una estimación de la verdadera media. Para comprender esta idea,
debes recordar lo que dijimos sobre la distribución de los individuos dentro
del intervalo: se supone que se distribuyen por igual dentro del intervalo co-
rrespondiente y eso es lo que justifica que se recurra a la marca de clase Xi.
Es evidente que esta suposición no refleja la distribución real dentro del inter-
valo. De hecho, si vuelves a la tabla 3.6 verás, por ejemplo, que dentro del in-
tervalo 16-23 sólo hay un sujeto cuya puntuación verdadera es 20 mientras
que en la tabla 4.1 este dato se ha convertido en 19,5. Las pequeñas diferen-
cias que se producen entre ambas distribuciones quedan reflejadas en las más
o menos inapreciables diferencias entre la media de datos sin agrupar
(79,400) y la media de datos agrupados (80,145).
Volviendo al concepto de media, ¿te has preguntado por qué se clasifica
en el grupo de las medidas de tendencia central? Por una razón muy sencilla:
resulta que, al igual que la mediana o la moda, la media se encuentra en el
centro de la distribución. Es decir, que todos los demás datos tienden a distri-
buirse en torno a estos valores.
La media es un valor muy interesante; su difundido uso en la investigación
socioeducativa se debe sobre todo a sus propiedades especiales:
• Es sensible a todos los datos de una distribución. Piensa en la media
como un valor que representa el punto de equilibrio de toda la distribu-
ción. Esto quiere decir que la modificación de cualquier dato de una
distribución afecta a la media desplazando el punto de equilibrio, ya
que la suma de todos los datos se ve igualmente afectada. Esto no le
pasa ni a la mediana ni a la moda.
• Es una medida que se ve especialmente afectada por los valores extre-
mos de la distribución. En otras palabras, un valor extremo superior
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 86

86 Introducción a la estadística

arrastra sensiblemente el valor de la media hacia arriba mientras un va-


lor extremo bajo influye rebajando el valor de la media. Si quieres com-
probarlo, prueba a añadirle a nuestra distribución un sujeto ficticio 94º
y asígnale un nivel de dificultad igual a 0, por ejemplo. Obtendrás una
media de 78,55; lo cual implica la caída de prácticamente un punto. La
mediana no variará en la misma medida. En cuanto a la moda, no cam-
bia en absoluto.
• Es una medida que es más estable que la mediana y la moda; es menos
sensible a la variación debida al muestreo.
Si la moda y la mediana son medidas de tendencia central, ¿por qué mo-
lestarse en hallar la media? ¿No sería más cómodo utilizar las dos anteriores,
que son mucho más fáciles de identificar? Es seguramente más cómodo ya que
basta con leer las frecuencias para saber qué valor es la moda o acumular las
frecuencias para saber qué valor de la escala divide al grupo de sujetos en
dos mitades, siendo este valor la mediana. Sin embargo, debemos darnos
cuenta de que la moda y la mediana no coinciden necesariamente con el
punto de equilibrio de la distribución; no siempre representan la distribución
adecuadamente. Y para comprobar esta afirmación, recordemos los valores
que acabamos de calcular: resulta que la media (79,398) es levemente más
pequeña que la mediana (80) y ésta es inferior a la moda (90). Estos valores
quedan reflejados en el gráfico 4.1.

GRÁFICO 4.1
MEDIA, MEDIANA Y MODA

Media = 79,40; Mediana = 80; Moda = 90


20

15
Frecuencias absolutas

10

0
20 25 50 60 65 67 68 70 72 75 79 80 81 82 84 85 87 88 89 90 92 95 96 100
Frecuencias absolutas 1 1 5 2 3 1 1 8 1 4 3 17 1 2 1 9 1 4 1 18 1 4 1 3

Nivel de dificultad
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 87

Iniciando el análisis de mis datos 87

Por otro lado, conviene no pasar por alto un hecho crucial: una distribu-
ción sólo tiene una media; en cambio puede tener varias modas. Fíjate en las
frecuencias del gráfico 4.1 y observarás que el valor 80 aparece 17 veces
mientras que el valor 90 se menciona 18 veces; sólo una unidad de diferencia
permite decir que 90 es la moda en vez de o junto con 80. Esta distribución
podría haber sido bimodal, es decir, tener dos modas. Así pues, no te extra-
ñes si te encuentras con distribuciones de más de una moda, es decir, distri-
buciones multimodales. También cabe la posibilidad de que una distribución
no tenga moda; esto ocurre cuando todos los valores de una escala tienen
igual frecuencia.
En cuanto a la mediana, se trata de un valor que se fija en función de la
distribución de los individuos y no refleja adecuadamente el rango de la esca-
la. Es un valor que es poco sensible al modo en que se distribuye la caracte-
rística que se está estudiando.
Ante estas diferencias entre las tres medidas de tendencia central, es evi-
dente que la más sensible al modo en que se distribuyen los datos es la me-
dia aritmética. Es esta propiedad la que convierte su uso en especialmente lla-
mativo.
Además de la media aritmética existen otras medias que son más bien de
poco uso en nuestro contexto tales como la media geométrica, la media ar-
mónica o la media cuadrática. De entre éstas hablaremos muy brevemente de
la media armónica, sobre todo debido a que, al hacer análisis con programas
informáticos, tenemos que ser capaces de hacer buenas interpretaciones de
los resultados obtenidos que hagan referencia a este estadístico.
La media armónica se define como el recíproco de la media aritmética de

los recíprocos de los datos X1, X2, X3..., XN; su símbolo es H o X a.

Para datos agrupados:

A título de ejemplo, podemos utilizar los datos del gráfico 4.1.


En primer lugar, vamos a calcular el denominador, es decir:

.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 88

88 Introducción a la estadística

Por tanto, H .

Como puedes observar, la media armónica (74,567) es notablemente infe-


rior a la media aritmética (79,400).

4.2. MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD


Ya habrás observado que los valores de la variable que estamos estudiando
varían. Dicho de otro modo, los individuos del grupo no asignan todos el
mismo valor a su percepción de la dificultad de esta materia. Si hubiesen asig-
nado el mismo valor, tendríamos un valor constante. Por cierto, si todos los
valores fueran iguales, es decir, si tuviéramos una constante, la estadística per-
dería su razón de ser; la estadística existe sólo porque los valores que estudia
están dispersos en cierto grado. Por ello, puede ser muy interesante estable-
cer una medida que nos ayude a cuantificar el nivel de dispersión de los da-
tos. Pero entonces hará falta que establezcamos un punto de referencia para
una medida de estas características. La pregunta que nos debemos plantear
es: ¿con respecto a qué punto de origen estos datos se dispersan? En la biblio-
grafía al respecto nos encontraremos con varios puntos de referencia. Veamos
a continuación algunas de las medidas de dispersión:

• Amplitud total, recorrido o rango (R)


Punto de referencia: los valores extremos de la distribución de frecuencias.
El rango es tan sólo la diferencia entre el valor superior (Xs) y el valor in-
ferior (Xi) de la distribución. La fórmula correspondiente tiene el siguiente
formato:

R = Xs – Xi (Fórmula 4.3)

Ahora bien, es probable que te encuentres con manuales donde se indica


que hay que añadir 1 a la diferencia entre Xs y Xi. Y es que en realidad hay
dos tipos de R cuyo uso depende de las preferencias de los usuarios. La R de
la fórmula 4.3 se considera menos inclusiva que la que estamos comentando.
En nuestro caso el rango sería R = 100 – 20 = 80. Es un dato que es bastante
fácil de computar, pero que en realidad es muy poco informativo sobre el ni-
vel de dispersión de los datos de la distribución. De hecho, obtendríamos
exactamente el mismo resultado si 92 de los 93 alumnos hubiesen marcado el
nivel de dificultad 100 y sólo un alumno, 20, o al revés. Y es que realmente
el rango se centra en la dispersión de los datos extremos y pasa por alto la de
los intermedios.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 89

Iniciando el análisis de mis datos 89

• Recorrido semiintercuartílico (Q)


Punto de referencia: los cuartiles 1 y 3.
El recorrido semiintercuartílico se define como la mitad de la diferencia
entre el valor correspondiente al tercer cuartil y el del primer cuartil. La fór-
mula correspondiente a este estadístico es:

(Fórmula 4.4)

En nuestro caso, el recorrido semiintercuartílico equivale a:

Q .

Sigue siendo un valor poco útil, ya que sólo toma en consideración dos
valores de todos los que hay en la distribución.

• Diferencia media respecto de la mediana (DMMd)


Punto de referencia: la mediana.
Recuerda que la mediana es un valor de la distribución que divide la fre-
cuencia total en dos mitades, pero eso no significa que se encuentre en el
punto de equilibrio de la distribución. De hecho, para comprobar este aserto,
te bastaría sumar las diferencias absolutas por encima de la mediana y com-
parar dicha suma con la obtenida sumando las diferencias por debajo de ella.
Probablemente no sean sumas iguales.
La diferencia media respecto de la mediana es la suma de las diferencias
absolutas entre cualquier valor de la distribución y la mediana. Como sabes,
el valor absoluto se representa con dos barras verticales. La diferencia media
responde a la siguiente fórmula:

(Fórmula 4.5)

Para datos agrupados habría que tener en cuenta la frecuencia que le co-
rresponde a cada diferencia Xi-Md; es decir, habría que multiplicar esta dife-
rencia por su frecuencia. Así, la fórmula anterior se convertiría en:

(Fórmula 4.6)
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 90

90 Introducción a la estadística

En nuestro caso, si utilizamos los datos agrupados, este estadístico asciende a:

TABLA 4.2
DIFERENCIA MEDIA RESPECTO DE LA MEDIANA,
CON DATOS AGRUPADOS
Xi fi | Xi-Md | | Xi-Md | fi

20 1 60 60
25 1 55 55
50 5 30 150
60 2 20 40
65 3 15 45
67 1 13 13
68 1 12 12
70 8 10 80
72 1 8 8
75 4 5 20
79 3 1 3
80 17 0 0
81 1 1 1
82 2 2 2
84 1 4 4
85 9 5 45
87 1 7 7
88 4 8 32
89 1 9 9
90 18 10 180
92 1 12 12
95 4 15 60
96 1 16 16
100 3 20 60

DMMd .
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 91

Iniciando el análisis de mis datos 91

TABLA 4.3
DIFERENCIA MEDIA RESPECTO DE LA MEDIANA, CON DATOS
AGRUPADOS EN INTERVALOS DE CLASE

I Xi | Xi-Md | fi | Xi-Md | fi

16-23 19,5 60,5 1 60,5


24-31 27,5 52,5 1 52,5
32-39 35,5 44,5 0 0,0
40-47 43,5 36,5 0 0,0
48-55 51,5 28,5 5 142,5
56-63 59,5 20,5 2 41,0
64-71 67,5 12,5 13 162,5
72-79 75,5 4,5 8 36,0
80-87 83,5 3,5 31 108,5
88-95 91,5 11,5 28 322,0
96-103 99,5 19,5 4 78,0

DMMd .

Puedes darte cuenta de que la diferencia media respecto de la mediana


estimada con los datos agrupados en intervalos de clase es ligeramente más
alta que la de los datos sin agrupar. Recordarás que observamos un fenómeno
parecido con la estimación de la propia mediana.
La diferencia media respecto de la mediana proporciona una información
algo más precisa que el rango o el recorrido semiintercuartílico sobre el gra-
do de dispersión de los datos de una distribución. Sin embargo, hemos de
destacar que la mediana es un valor que carece de suficiente sensibilidad a
los datos de una distribución.

• Diferencia respecto de la media (DMX–)


Punto de referencia: la media.
La diferencia respecto de la media se calcula prácticamente de la misma
manera que en el caso anterior, excepto que esta vez el punto de referencia
es la media. Se trata, por tanto, de hallar la suma de las diferencias absolutas
entre cualquier valor de la distribución y la media; responde a la siguiente
fórmula:
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 92

92 Introducción a la estadística

(Fórmula 4.7)

Al igual que en el caso de la diferencia media respecto de la mediana, pa-


ra datos agrupados habría que tener en cuenta la frecuencia de cada diferen-

cia | Xi – X |, es decir, habría que multiplicar esta diferencia por su corres-
pondiente frecuencia. Así, la fórmula anterior se convertiría en:

(Fórmula 4.8)

Por cierto, la diferencia entre cualquier dato y la media de su distribución


se conoce también como puntuación diferencial, xi:

(Fórmula 4.9)

Si Xi está por encima de la media, entonces xi tiene un valor positivo; en


cambio, si Xi está por debajo de la media, el valor de xi es negativo.
En nuestro caso, teniendo en cuenta que la media es 79,40, los datos agru-
pados arrojan como valor para este estadístico:

TABLA 4.4
DIFERENCIA RESPECTO DE LA MEDIA, CON DATOS AGRUPADOS

– –
Xi fi | Xi – X | | Xi – X |fi

20 1 |–59,40| |–59,40|
25 1 |–54,40| |–54,40|
50 5 |–29,40| |–147,00|
60 2 |–19,40| |–38,80|
65 3 |–14,40| |–43,20|
67 1 |–12,40| |–12,40|
68 1 |–11,40| |–11,40|
70 8 |–9,40| |–75,20|
72 1 |–7,40| |–7,40|
75 4 |–4,40| |–17,60|
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 93

Iniciando el análisis de mis datos 93

– –
Xi fi | Xi – X | | Xi – X |fi

79 3 |±0,40| |–1,20|
80 17 0,60 10,20
81 1 1,60 1,60
82 2 2,60 5,20
84 1 4,60 4,60
85 9 5,60 50,40
87 1 7,60 7,60
88 4 8,60 34,40
89 1 9,60 9,60
90 18 10,60 190,80
92 1 12,60 12,60
95 4 15,60 62,40
96 1 16,60 16,60
100 3 20,60 61,80

TABLA 4.5
DIFERENCIA RESPECTO DE LA MEDIA, CON DATOS AGRUPADOS
EN INTERVALOS DE CLASE

(Recuerda que la media para datos agrupados en intervalos de clase es de 80,145.)


– –
I Xi | Xi – X | fi | Xi – X |fi

16-23 19,5 |–60,645| 1 |60,645|


24-31 27,5 |–52,645| 1 |52,645|
32-39 35,5 |–44,645| 0 0,000
40-47 43,5 |–36,645| 0 0,000
48-55 51,5 |–28,645| 5 |143,225|
56-63 59,5 |–20,645| 2 |41,290|
64-71 67,5 |–12,645| 13 |164,385|
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 94

94 Introducción a la estadística

– –
I Xi | Xi – X | fi | Xi – X |fi

72-79 75,5 |–4,645| 8 |37,160|


80-87 83,5 3,355 31 104,005
88-95 91,5 11,355 28 317,940
96-103 99,5 19,355 4 77,420

Puedes darte cuenta de que la diferencia respecto de la media estimada


con los datos agrupados en intervalos de clase es ligeramente más alta que la
de los datos agrupados. Recordarás que observamos un fenómeno parecido
con la estimación de la propia media. Sin embargo, no siempre ocurre así.
La media tiene otra propiedad muy especial que merece la pena resaltar:
la suma de todas las diferencias respecto de la media es cero. Es posible que
debido al efecto del redondeo, el resultado no sea exactamente 0, pero siem-
pre será un valor muy próximo a este número. La forma algebraica de esta
propiedad responde a la siguiente fórmula:

(Fórmula 4.10)

Comprueba esta propiedad sumando todas las diferencias; recuerda que


en este caso estas diferencias deben conservar cada una su signo, positivo o
negativo. Es una propiedad que se debe al hecho de que la media se encuen-
tra en el punto de equilibrio de la distribución.

• Varianza2 (s2X)
Punto de referencia: la media.
Ya sabes que si sumamos todas las diferencias respecto de la media obte-
nemos 0 como resultado. Si calculamos la media de los valores absolutos de
todas las diferencias, obtenemos un dato que nos informa sobre el nivel me-
dio de dispersión de la distribución en torno a la media, pero es un valor ob-
tenido tras eliminar el signo de las puntuaciones diferenciales.

2
Cuando se trata de la varianza de toda la población, se utiliza el siguiente símbolo: σ2.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 95

Iniciando el análisis de mis datos 95

En cambio, la varianza es un estadístico que supera las dificultades antes re-


señadas y que nos proporciona una información más exacta. De hecho, nos
permite saber cuánta variación hay en torno a la media con la que lógicamente
comparte su nivel de sensibilidad a todas las puntuaciones de una distribución.
Eso quiere decir que la variación total está influida por la modificación de cual-
quier dato de la distribución, especialmente si se trata de un dato extremo.
Por otra parte, la mejor manera de concebir la varianza es considerarla co-
mo un área en torno a la media; en esa área se encuentran más o menos dis-
persos todos los datos de la distribución. Siendo un área es, pues, lógico calcu-
lar su extensión y para ello se eleva al cuadrado todos los valores hallados
tomando la media como referencia. Por ello, formalmente, la varianza se define
como la media de la suma de los cuadrados de todas las puntuaciones diferen-
ciales. No creas que te están hablando de otra cosa si en algún momento se uti-
liza la expresión «sumas cuadráticas»; en realidad, te estarán diciendo: eleva al
cuadrado cada uno de tus datos y luego súmalo todo. Nada más y nada menos.
Parece complicado calcular la varianza, pero la idea es bastante sencilla: se
trata de elevar al cuadrado todas las puntuaciones diferenciales, sumarlas y divi-
dir la suma por N-1. ¿Por qué N-1? Porque estamos estudiando el caso de un
único grupo de sujetos, una muestra. Bueno, esto no es todo, pero de momen-
to nos vale como explicación. Ampliaremos esta explicación más adelante.
La forma algebraica de lo que acabas de leer es...

(Fórmula 4.11a)

... o su equivalente:

(Fórmula 4.12a)

Para los datos agrupados, las fórmulas anteriores se convierten en...

(Fórmula 4.11b)

... o su equivalente:

(Fórmula 4.12b)
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 96

96 Introducción a la estadística

TABLA 4.6a
CÁLCULO DE LA VARIANZA CON PUNTACIONES DIFERENCIALES

Xi fi xi x2i x2i fi

20 1 –59,40 3.528,360 3.528,360


25 1 –54,40 2.959,360 2.959,360
50 5 –29,40 864,360 4.321,80
60 2 –19,40 376,360 752,720
65 3 –14,40 207,360 622,080
67 1 –12,40 153,760 153,760
68 1 –11,40 129,960 129,960
70 8 –9,40 88,360 706,880
72 1 –7,40 54,760 54,760
75 4 –4,40 19,360 77,440
79 3 –0,40 0,160 0,480
80 17 0,60 0,360 6,120
81 1 1,60 2,560 2,560
82 2 2,60 6,760 13,520
84 1 4,60 21,160 21,160
85 9 5,60 31,360 282,240
87 1 7,60 57,760 57,760
88 4 8,60 73,960 295,840
89 1 9,60 92,160 92,160
90 18 10,60 112,360 2.022,480
92 1 12,60 158,760 158,760
95 4 15,60 243,360 973,440
96 1 16,60 275,560 275,560
100 3 20,60 424,360 1273,080

N = 93

En consecuencia, la varianza total es .


INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 97

Iniciando el análisis de mis datos 97

Si quieres utilizar los datos originales puedes recurrir a la siguiente fórmu-


la genérica:

(Fórmula 4.13)

A primera vista, se trata de una fórmula que echa atrás al más atrevido y, sin
embargo, te aseguro que no tardarás nada en comprenderla. Vamos por partes:
Esta parte es menos complicada de lo que puede parecer y
sólo dice «eleva al cuadrado cada una de las puntuaciones
directas y después súmalo todo».

Esta parte es aún más sencilla que la anterior. Si te fijas en el


contenido de los paréntesis, te darás cuenta de que se trata
de la fórmula de media. Por tanto, aquí lo que se te pide es
simplemente elevar la media al cuadrado.
Resumiendo, la fórmula global te pide que de la suma de cuadrados de las
puntuaciones directas sustraigas el cuadrado de la media.
Te aconsejo que utilices esta fórmula porque te exige menos cantidad de
operaciones y, por tanto, produce una menor acumulación de errores de cálculo
y de redondeo.
La siguiente fórmula es el equivalente exacto de la fórmula 4.13:

(Fórmula 4.14)

Para datos agrupados las fórmulas 4.13 y 4.14 se transforman en...

(Fórmula 4.15)

... o su equivalente (Fórmula 4.16)


INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 98

98 Introducción a la estadística

TABLA 4.6b
CÁLCULO DE LA VARIANZA, CON PUNTUACIONES DIRECTAS

Xi fi Xi fi X2i X2i fi

20 1 20 400 400
25 1 25 625 625
50 5 250 2.500 12.500
60 2 120 3.600 7.200
65 3 195 4.225 12.675
67 1 67 4.489 4.489
68 1 68 4.624 4.624
70 8 560 4.900 39.200
72 1 72 5.184 5.184
75 4 300 5.625 22.500
79 3 237 6.241 18.723
80 17 1.360 6.400 108.800
81 1 81 6.561 6.561
82 2 164 6.724 13.448
84 1 84 7.056 7.056
85 9 765 7.225 65.025
87 1 87 7.569 7.569
88 4 352 7.744 30.976
89 1 89 7.921 7.921
90 18 1.620 8.100 145.800
92 1 92 8.464 8.464
95 4 380 9.025 36.100
96 1 96 9.216 9.216
100 3 300 10.000 30.000

N = 93

Por tanto, .
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 99

Iniciando el análisis de mis datos 99

• Desviación típica3 (sX)


Punto de referencia: la media.
Conocer la cantidad de variación total en torno a la media es útil, pero no
suficiente. Es evidente que los datos pueden ser más o menos densos en torno a
la media y que unos datos pueden estar más cerca de la media que otros. La
cuestión que se nos plantea ahora es cómo cuantificar su grado de dispersión.
Dicho de otro modo, ¿con qué unidad mediremos el nivel de alejamiento de los
datos de su centro, la media? La respuesta a esta pregunta ya está parcialmente
dada al computar la varianza. Para hallar la unidad con la que mediremos el gra-
do de dispersión absoluta o de desviación respecto de la media nos bastará cal-
cular la raíz cuadrada de la varianza y el resultado lo llamaremos desviación típi-
ca, s. Así pues, la desviación típica de nuestra distribución es:

La operación de sacar la raíz cuadrada de la varianza nos permite volver a


la misma unidad de medida con la que iniciamos todo el proceso. Esto quiere
decir que la desviación típica es una unidad de medida que se refiere al suce-
so o evento que estamos estudiando. En nuestro caso, la desviación típica nos
dice que por término medio los datos de la distribución se dispersan en torno
a la media con una distancia de unos 14,288 puntos. Si piensas en términos
de distancia métrica, los 14,288 puntos equivaldrían a un metro. Si te dijeran
que uno de los 93 alumnos del grupo se encuentra a una distancia de dos
metros sabrías que 28,576 puntos le separan de la media. Y si otro alumno es-
tuviera a medio metro dirías que está separado de la media la mitad de los
14,288 puntos, o sea, 7,144 puntos.
Lógicamente la desviación típica comparte todas sus características con la va-
rianza: su sensibilidad a todos los datos de la distribución, especialmente los extre-
mos, y su notable estabilidad en comparación con otras medidas de dispersión.
Es muy importante que comprendas esta idea, pues en ella se basan otros
conceptos que veremos próximamente.

• Coeficiente de variación (CV)


Puntos de referencia: la media y la desviación típica.
Ante dos distribuciones de las que conocemos la media y la desviación tí-
pica, parece legítimo preguntarnos si tienen el mismo grado de variación, es-
pecialmente si sus escalas de medida son desproporcionadamente diferentes.
Esta situación podría ocurrir si medimos, por ejemplo, el nivel de dificultad

3
Cuando se trata de la desviación típica de toda la población, se utiliza el siguiente símbo-
lo: σ; se lee «sigma».
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 100

100 Introducción a la estadística

percibida de esta materia, cuyo rango es de 80 puntos, y el nivel de conoci-


mientos previos, medido en una escala de 0 a 10.

Variable Media Desviación típica

Nivel de dificultad 79,400 14,288

Conocimientos previos 4,269 0,918

Por curiosidad, podemos preguntarnos si hay menos variación en conoci-


mientos previos que en la percepción del nivel de dificultad o si ambas varia-
bles se equiparan a este respecto. La respuesta a esta pregunta pasa por calcu-
lar un índice que permita comparar directamente ambas variables en cuanto a
su grado de dispersión. Este índice se llama dispersión relativa o coeficiente
de variación (CV). Se trata del cociente entre la desviación típica y la media y
se expresa generalmente como un porcentaje.

o (Fórmula 4.17)

Variable Coeficiente de variación

Nivel de dificultad

Conocimientos previos

A pesar de las apariencias, resulta que la dispersión relativa de los conoci-


mientos previos es ligeramente mayor que la de la percepción del nivel de di-
ficultad de esta materia. Hablando de apariencias, en estadística huye de ellas
todo lo que puedas. Ante todo, razonamiento.

MEDIDAS DE LA FORMA
4.3. DE UNA DISTRIBUCIÓN DE FRECUENCIAS

4.3.1. Asimetría
Una distribución de frecuencias es simétrica si las dos áreas en que la media-
na (Md) divide dicha distribución son imagen una de la otra. Si la distribución
es simétrica, entonces la mediana, la moda y la media coinciden.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 101

Iniciando el análisis de mis datos 101

FIGURA 4.1
DISTRIBUCIÓN SIMÉTRICA

Una distribución es asimétrica positiva si tiene muchas puntuaciones bajas


y pocas altas. Esta situación se produce cuando, por ejemplo, una prueba re-
sulta difícil. En este caso, la moda es más pequeña que la mediana y ésta es a
su vez inferior a la media.

FIGURA 4.2
DISTRIBUCIÓN ASIMÉTRICA POSITIVA

Una distribución es asimétrica negativa en el caso contrario, es decir, si


tiene muchas puntuaciones altas y pocas bajas; es el caso de una prueba fácil.
Entonces, la media es más pequeña que la mediana y ésta es a su vez, infe-
rior a la moda.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 102

102 Introducción a la estadística

FIGURA 4.3
DISTRIBUCIÓN ASIMÉTRICA NEGATIVA

Si As = 0, la distribución es simétrica. Si As > 0, la asimetría es positiva. Si


As < 0, la asimetría es negativa.
Así, si As = –1,740, entonces estamos ante una distribución asimétrica negativa.

Curtosis (χνρτός[kirtós]: encorvado)


4.3.2. o apuntamiento
Es una medida que cuantifica el grado de elevación de la distribución sobre
el eje horizontal.
Si el valor de Curt = 0, la distribución es mesocúrtica (mesos [μέσος]: me-
dio) y estamos ante una curva normal. Si Curt es negativa, la curva es plati-
cúrtica (platís [πλατύς]: ancho), poco apuntada, es decir, baja y ancha. Si Curt
es positiva, la curva es leptocúrtica (leptós [λεπτός]: delgado), muy apuntada, es
decir, muy alta y estrecha.

FIGURA 4.4
DISTRIBUCIÓN PLATICÚRTICA
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 103

Iniciando el análisis de mis datos 103

FIGURA 4.5
DISTRIBUCIÓN MESOCÚRTICA

FIGURA 4.6
DISTRIBUCIÓN LEPTOCÚRTICA

Si Curt = 4,306, entonces estamos ante una distribución leptocúrtica.


Para dos curvas de igual sx, la más apuntada contiene más puntuaciones
bajo los dos extremos alejados de la media que la que es menos apuntada.
INT ESTAD 01:ENSEÑANZA MATEMAT 09/03/11 9:13 Página 104

104 Introducción a la estadística

4.4. TU TURNO
1. Elige una única variable y halla la mediana, la moda y la media de tus da-
tos. Puedes utilizar el programa informático que te resulte más cómodo.
2. ¿Cuál de las medidas que acabas de hallar representa mejor los datos del
grupo? Explica por qué.
3. Halla la varianza y la desviación típica de tu distribución.
4. Elige otra variable y halla la varianza y la desviación típica. Comprueba si
tu nueva distribución tiene un nivel de variabilidad similar a tu primera
distribución.
5. Una distribución de puntuaciones que resulta ser asimétrica positiva se
caracteriza por:
a) Ser mesocúrtica.
b) Tener muchas puntuaciones bajas.
c) Tener muchas puntuaciones altas.
d) Ser platicúrtica.
6. Una distribución de puntuaciones en la que coinciden la mediana, la mo-
da y la media se considera como una distribución:
a) Sin apuntamiento.
b) Simétrica.
c) Asimétrica positiva.
d) Asimétrica negativa.
7. Si se añade un valor extremadamente pequeño a una distribución de pun-
tuaciones se observa como consecuencia:
a) Un cierto incremento de la media.
b) Una cierta disminución de la media.
c) Una cierta disminución de la desviación típica.
d) La media y la desviación típica no cambian.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 105

Capítulo 5
LA CURVA NORMAL COMO MODELO
PARA ANALIZAR MIS DATOS

Al finalizar este capítulo deberías ser capaz de:


• Transformar tus datos de la escala original a la escala estandarizada.
• Calcular la proporción de sujetos que cumplen determinados criterios.
• Convertir datos estandarizados a otras escalas.

¿Qué tendrá que ver lo «normal» con la estadística? Mucho más de lo que crees.
Y si no, lee lo que sigue.
Si consultas el diccionario de la Real Academia Española verás que define
«normal» como «ordinario, corriente». En otras palabras, lo que no es normal,
lo que no es conforme a la norma, al modelo, a lo que es corrientemente co-
nocido y aceptado como común debe considerarse como anormal, extraordi-
nario, diferente.
Ahora, intentemos la cuadratura del círculo: formalizar matemáticamente
esta idea sin recurrir a complicadas fórmulas matemáticas. Piensa en el peso
de cualquier ciudadano de la población española. Si te encuentras con una
persona que pesa 250 kg, ¿puedes afirmar que se trata de un individuo con
un peso «normal» en la población española? Seguramente que no; dirás más
bien que se trata de un caso anómalo, extraordinario, fuera de lo común, bas-
tante o muy alejado del peso habitualmente considerado ordinario, y esto por
exceso. Y si te presentan a un adulto que pesa 20 kg, con toda probabilidad
asegurarás que se trata de otro caso anómalo, esta vez por defecto. En cam-
bio, es muy probable que consideres que un adulto que pesa más o menos
70 kg es «normal». ¿Por qué? Por una razón muy sencilla: se considera normal
aquel suceso que en una determinada población ocurre con mucha frecuen-
cia. Por tanto, puede decirse que la frecuencia determina la consideración de
un suceso como normal o, por el contrario, como extraordinario.
Si te paras a pensarlo un poco más te darás cuenta de que se trata de una
representación modelizada de lo que se observa a diario en la naturaleza. Por
ejemplo, la talla poblacional tiene un cierto nivel por encima o por debajo del
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 106

106 Introducción a la estadística

cual a determinados individuos se les considera aquejados de gigantismo, por


exceso, o de enanismo, por defecto. En cuanto a la inteligencia, se considera
que el nivel intelectual medio de la población está en torno a un valor tal co-
mo 90-100; esto significa que la mayor parte de la población es medianamen-
te inteligente mientras que una proporción progresivamente menor de indivi-
duos se aleja de este valor medio.
Y esto ya suena a conocido, la media; de hecho, lo normal se encuentra
en torno al valor medio de cualquier suceso y resulta que es por definición lo
más corriente, lo más frecuente. Esta idea tan simple fue elegante y magistral-
mente representada por Gauss mediante una curva en forma de campana,
que lleva su nombre, y que responde a la fórmula matemática...

(Fórmula 5.1)

...donde:

Y = Frecuencia de un valor dado de X N = Frecuencia total de la distribución


X = Cualquier dato de la distribución π = Constante 3,14159
M = Media de la distribución e = Constante 2,71828
σ = Desviación típica de la distribución

Evidentemente, se trata de una distribución meramente teórica. O si lo pre-


fieres, es la formulación matemática de lo que hipotéticamente ocurre en la
realidad. Ahora bien, las distribuciones que puedes obtener al recoger un de-
terminado conjunto de datos no tienen que coincidir exactamente con el mo-
delo teórico, pero lo más «normal» es que se aproximen bastante. Si tienes
una vena científica, ya te habrás preguntado ¿y cuándo sabré yo si mi distri-
bución está lo bastante cerca de la curva normal? Esta pregunta tiene una res-
puesta muy interesante, pero tendrás que esperar hasta el capítulo 13 para
averiguarla. Por ahora será suficiente con aceptar el supuesto de que tus da-
tos se distribuyen de acuerdo con este modelo teórico.
Por cierto, de momento tómatelo con tranquilidad: no creo que tu profe-
sor te vaya a pedir que apliques la fórmula 5.1; en cambio, debes ser capaz
de utilizar esta curva para describir los datos que hayas recogido.

5.1. PROPIEDADES DE LA CURVA NORMAL

Fíjate en el gráfico 5.1. Observa su parecido con el polígono de frecuencias. La


diferencia consiste en que en este caso la línea se ha suavizado hasta tal punto
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 107

La curva normal como modelo para analizar mis datos 107

que da la impresión de formar una curva. Fíjate en que a medida que nos aleja-
mos de la media, las frecuencias van disminuyendo hasta aproximarse a 0 en
los extremos, pero sin llegar a ser 0. Eso quiere decir que la curva nunca llega a
tocar el eje horizontal. En otras palabras, la curva es asintótica a este eje.

GRÁFICO 5.1
CURVA NORMAL

Esta curva tiene unas propiedades que merece la pena comentar:


• Existe una relación muy particular entre la media y la desviación típica
con respecto a la proporción de datos que se encuentran debajo de la
curva. Resulta que la proporción de datos que hay entre la media y una
desviación típica es de 0,3413. Esto significa que a una distancia de una
desviación típica en torno a la media se concentra una proporción de
0,3413 × 2 = 0,6826 datos o sujetos. También puedes expresar esta pro-
porción en forma de porcentaje: 68,26%.
• La curva es simétrica, siendo la media el eje de simetría que, como ya
sabes, es el punto de equilibrio de la distribución. En consecuencia, el
50% de los sujetos está a un lado de media y la otra mitad, en el otro
lado. Ampliando el punto anterior, se puede afirmar que el 34,13% de
los sujetos se encuentra entre la media y una desviación típica en el la-
do positivo y un porcentaje equivalente en el lado negativo.
• La media, la mediana y la moda coinciden. Recuerda lo que acabamos
de decir sobre la simetría de las distribuciones.
• Por lo general, se considera que prácticamente el cien por cien de los
datos o sujetos está comprendido en el área que hay entre tres desvia-
ciones típicas a ambos lados de la media.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 108

108 Introducción a la estadística

GRÁFICO 5.2
ÁREA O PROPORCIÓN DE DATOS POR DEBAJO DE LA CURVA

2,28% 13,59% 34,13% 34,13% 13,59% 2,28%

–3 –2 –1 0 1 2 3

Supongamos que conocemos la media (μ = 79,40) y la desviación típica


(σ = 14,288) de la percepción del nivel de dificultad de esta materia en la po-
blación y que sabemos que dicha variable se distribuye normalmente; enton-
ces, podríamos afirmar que el 68,26% de la población experimenta un nivel
de dificultad que se encuentra entre 79,40 – 14,288 y 79,40 + 14,288, es decir,
entre 65,112 y 93,688. Redondeando, podríamos afirmar que el nivel de difi-
cultad percibida por el 68% de la población oscila entre 65 y 94.
Ahora bien, supongamos que un compañero de clase te dice: para mí el
nivel de dificultad de esta materia es 95. ¿Cómo podrías interpretar este dato?
Imposible interpretarlo si no recibes más información, como puede ser la
que procede de un grupo de referencia, por ejemplo, otros compañeros de
clase. Con este marco de referencia, podrás averiguar por ejemplo cuál es el
percentil de tu compañero. Entonces sabrás si llega aterrorizado o más bien
confiado dentro de su grupo de clase. Te acuerdas cómo se hacía, ¿verdad?
Podemos utilizar otra vía: vamos a cuantificar la distancia que le separa de la
media de su grupo. Ya conocemos el significado de la puntuación diferencial.
Como recordarás, la puntuación diferencial conserva la unidad de medida origi-
nal de la variable, al igual que las medidas de tendencia central. Utilizaremos la
desviación típica como unidad de medida de la dispersión en torno a la media;
ésta nos ayudará a transformar la puntuación diferencial a una escala que gene-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 109

La curva normal como modelo para analizar mis datos 109

ralmente varía hasta tres desviaciones típicas en torno a la media. La puntuación


obtenida de esta transformación recibe el nombre de puntuación típica y se re-
presenta con la letra z. Se calcula aplicando la siguiente fórmula:

(Fórmula 5.2)

Como puedes observar, se trata de transformar la puntuación directa Xi en otra


exactamente igual, pero que pertenece a una escala de medida diferente. En nues-
tro caso, la puntuación típica que le corresponde a la puntuación directa 95 es:

La puntuación típica 1,09 nos informa que la distancia que aleja a este
alumno de la media de su grupo supera apenas una desviación típica.
Ahora nos podemos preguntar si este mismo alumno se encuentra a la misma
distancia en cuanto a sus conocimientos previos en esta materia. Sabiendo que su
grupo tiene una media de 4,269 y una desviación típica de 0,918, y sabiendo que
su puntuación directa es de 3,25 podemos calcular su puntuación típica.

Esto es genial. Si te das cuenta, nos encontramos ante dos variables, nivel de
dificultad y conocimientos previos, medidas en dos escalas diferentes: 0 a 100
en el primer caso y 0 a 10 en el segundo. Sin embargo, después de someterlas
al proceso de transformación ahora están ambas en la misma escala. Esta situa-
ción nos resulta beneficiosa: ya estamos en condiciones de interpretarlas a la
vez. Resulta que este alumno está prácticamente a la misma distancia en ambas
variables pero en sentido opuesto: está por encima de la media en el nivel de
dificultad percibida y por debajo de la media en conocimientos previos.
Al igual que comparamos dos puntuaciones de un mismo sujeto podemos
hacer comparaciones de dos sujetos respecto de una única variable.

ALGUNAS CARACTERÍSTICAS
DE LAS PUNTUACIONES TÍPICAS 5.2.

1. Las puntuaciones típicas son una simple transformación de las puntua-


ciones directas y, por tanto, ambas son equivalentes. En consecuencia,
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 110

110 Introducción a la estadística

la forma de la distribución de las puntuaciones zi es la misma que la


de las puntuaciones Xi.
2. En segundo lugar, del mismo modo que la suma y la media de las pun-
tuaciones diferenciales son iguales a 0, la suma y la media de las puntua-
ciones típicas son iguales a 0. Recuerda que hay tantos valores positi-
vos como negativos, tanto para las puntuaciones diferenciales como
para las puntuaciones típicas. Por tanto, al sumarlos todos, el resultado
tiene que ser 0. Y si hallas la media de 0, lógicamente obtendrás 0.
3. La desviación típica de cualquier distribución de puntuaciones típicas
es igual a 1. Esto se debe a que a una puntuación directa que está a
una distancia de la media de una desviación típica, le corresponde un
valor de z de 1, positivo o negativo. Observa la siguiente fórmula y lo
comprenderás fácilmente.

Supongamos que tenemos una Xi = X + s, su puntuación típica será:

Por cierto, con toda la información de la que ya dispones, ¿serías capaz de


averiguar algunos de los siguientes datos de la muestra?
1. Hallar la puntuación directa conociendo la puntuación diferencial 12,20
y la media 79,40.
– –
Se sabe que Xi – X = xi. Por tanto Xi = xi + X .
En consecuencia Xi = 12,20 + 79,40 = 91,60.
2. Hallar la puntuación típica conociendo la puntuación diferencial 12,20
y la desviación típica 14,288.

Se sabe que . Por tanto

3. Hallar la desviación típica conociendo la puntuación diferencial 12,20 y


la puntuación típica 0,854.

Se sabe que . Entonces, xi = zisX. En consecuencia


INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 111

La curva normal como modelo para analizar mis datos 111

PROPORCIÓN DE SUJETOS O DATOS 5.3.

Suponiendo que nuestra distribución se ajusta a la curva normal y conocien-


do la media y la desviación típica, se puede averiguar la proporción de suje-
tos o datos que cumplen determinados criterios.
Para ello se ha desarrollado una tabla en la que se indica la proporción de
sujetos partiendo del supuesto de que los sujetos se reparten por igual entre
las dos mitades de la curva.

TABLA 5.1
PROPORCIONES DE LA CURVA NORMAL (p > 0,50)

Z 0 1 2 3 4 5 6 7 8 9
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7516 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7703 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9430 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9648 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9700 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9762 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 112

112 Introducción a la estadística

Z 0 1 2 3 4 5 6 7 8 9
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9874 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9986 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

¿Cómo se utiliza esta tabla?


En primer lugar, observa atentamente los gráficos 5.3a y 5.3b.
Te habrás dado cuenta de que la parte positiva es exactamente igual a la
parte negativa. Eso significa que puedes partir de cualquiera de las dos mita-
des para establecer la proporción de sujetos que hay entre cualesquiera dos
puntuaciones típicas. Incluso puedes partir de las proporciones conocidas pa-
ra establecer las puntuaciones típicas y/o las puntuaciones directas que co-
rrespondan.
Vayamos paso a paso. En primer lugar, ¿cómo se lee la información conte-
nida en la tabla? En general, como guarismo, la puntuación típica contiene
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 113

La curva normal como modelo para analizar mis datos 113

GRÁFICO 5.3a GRÁFICO 5.3b


MITAD NEGATIVA MITAD POSITIVA
DE LA CURVA NORMAL DE LA CURVA NORMAL

–3 –2 –1 0 1 2 3 –3 –2 –1 0 1 2 3

tradicionalmente una parte entera y dos decimales. En esta tabla, la parte en-
tera y una decimal se encuentran en la primera columna y la segunda decimal
está recogida en la primera fila. Por ello, para leer la proporción correspon-
diente a la puntuación típica 2,25, tendrás que buscar en la primera columna el
dato correspondiente a la fila 2,2 y en la primera fila buscarás la columna
donde aparece 5. En la intersección de la fila 2,2 y de la columna 5 puedes
leer el dato 0,9878.

¿Y cómo se interpreta?
Si no se proporcionan orientaciones más claras, el dato 0,9878 puede inter-
pretarse indistintamente a partir de una puntuación típica positiva o negativa.
De acuerdo con el gráfico 5.4a, el 98,78% de los datos se encuentra por
encima de la puntuación típica –2,25, mientras que en el caso del gráfico 5.4b
el mismo porcentaje se encuentra por debajo de la puntuación típica +2,25.
Esto significa a su vez que el 48,78% se encuentra por encima de la media pa-
ra el gráfico 5.4b y el mismo porcentaje por debajo de la media para el gráfi-
co 5.4a. Para comprender el razonamiento seguido, recuerda que la propor-
ción que le corresponde a la mitad de la curva normal es el 50%.
Ahora ya deberías estar preparado para hallar las proporciones que cum-
plan determinados criterios.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 114

114 Introducción a la estadística

GRÁFICO 5.4a GRÁFICO 5.4b


PUNTUACIÓN TÍPICA NEGATIVA PUNTUACIÓN TÍPICA POSITIVA

0,9878
0,9878

–3 –2 –1 0 1 2 3 –3 –2 –1 0 1 2 3

1. Averiguar la proporción de sujetos o de datos que se encuentran en


torno a la media.
Halla la proporción de sujetos que hay entre zi = –1,63 y zi = +1,63.
Se trata de hallar una proporción de sujetos en torno a la media. La ta-
bla 5.1 proporciona como información una proporción de 0,9484. Pero
en esta proporción se incorpora el 50% de la distribución. Por tanto,
para hallar la proporción desde la media hasta zi = 1,63, tendremos
que restar del total que proporciona la tabla 5.1 el valor que corres-
ponde a la mitad de la distribución.
Proporción desde la media: 0,9484 – 0,50 = 0,4484.
Como hay tantos sujetos entre la media y zi = –1,63, y la media y
zi = +1,63, podemos afirmar que la proporción de sujetos entre zi = –1,63
y zi = +1,63 equivale a 0,4484 × 2 = 0,8968 (gráfico 5.5).
2. Averiguar la proporción de sujetos que hay por encima de una determi-
nada puntuación típica.
a) Halla la proporción de sujetos que hay por encima de la puntuación
típica zi = +1,77.
Si vas a la tabla 5.1, para zi = 1,77, obtendrás una proporción de
sujetos de 0,9616. Te toca decidir si estás consultando la tabla a
partir de una zi positiva o negativa. En nuestro caso se trata de una zi
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 115

La curva normal como modelo para analizar mis datos 115

GRÁFICO 5.5
PROPORCIÓN EN TORNO A LA MEDIA

–3 –2 –1 0 1 2 3

positiva. Por tanto, se entiende que en esta proporción se cuentan


todos los sujetos de la mitad negativa, a los que se añaden algunos
de la parte positiva. Esto significa que en la pregunta se nos pide
que averigüemos la proporción de sujetos que faltan para el total.
Sabiendo que el total es 1, la proporción restante de sujetos es de
1 – 0,9616 = 0,0384.
El gráfico 5.6a representa el resultado que nos piden.
b) Halla la proporción de sujetos que hay por encima de la puntuación
típica zi = –0,75
Vuelve a la tabla 5.1. Al buscar el valor correspondiente a zi = 0,75,
obtienes una proporción de sujetos de 0,7734. Esta proporción in-
cluye tanto la mitad positiva de la distribución como la parte negati-
va desde la media hasta –0,75. Por tanto, ésta es la proporción que
buscamos. Véase gráfico 5.6b.
3. Averiguar la proporción de sujetos que hay por debajo de una determi-
nada puntuación típica.
a) Halla la proporción de sujetos que hay por debajo de la puntuación
típica zi = +0,80.
La tabla 5.1 nos aporta como información una proporción de suje-
tos de 0,7881. Esta proporción incluye tanto la mitad negativa de la
distribución como la parte positiva desde la media hasta +0,80. Así
pues, ésta es la proporción que buscamos. Véase gráfico 5.7a.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 116

116 Introducción a la estadística

GRÁFICO 5.6a GRÁFICO 5.6b


PUNTUACIÓN TÍPICA POSITIVA PUNTUACIÓN TÍPICA NEGATIVA

–3 –2 –1 0 1 2 3 –3 –2 –1 0 1 2 3

GRÁFICO 5.7a GRÁFICO 5.7b


PUNTUACIÓN TÍPICA POSITIVA PUNTUACIÓN TÍPICA NEGATIVA

–3 –2 –1 0 1 2 3 –3 –2 –1 0 1 2 3
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 117

La curva normal como modelo para analizar mis datos 117

b) Halla la proporción de sujetos que hay por debajo de la puntuación


típica zi = –2,09.
De acuerdo con la tabla 5.1, para zi = 2,09, la proporción que corres-
ponde es de 0,9817. Se entiende que en esta proporción se cuentan
todos los sujetos de la mitad positiva, a los que se añaden algunos de
la parte negativa, desde la media hasta zi = –2,09. Esto significa que
en la pregunta se nos pide que averigüemos la proporción de sujetos
que faltan para el total. Sabiendo que el total es 1, la proporción res-
tante de sujetos es de 1 – 0,9817 = 0,0183. Véase gráfico 5.7b.
4. Averiguar la proporción de sujetos que hay entre dos puntuaciones tí-
picas dadas.
a) Halla la proporción de sujetos que hay entre las puntuaciones típi-
cas zi = –1,87 y zi = +1,31.
En este caso tenemos que buscar dos datos en la tabla 5.1: las pro-
porciones que corresponden a zi = 1,87 y a zi = 1,31 son respectiva-
mente 0,9693 y 0,9049. Como se trata de puntuaciones que se en-
cuentran a ambos lados de la media, deberemos hallar la proporción
que corresponde desde la media.
Para zi = –1,87, la proporción desde la media es: 0,9693 – 0,50 = 0,4693.
Para zi = +1,31, la proporción desde la media es: 0,9049 – 0,50 = 0,4049.
Por tanto, la proporción de sujetos entre zi = –1,87 y zi = +1,31 es
0,4693 + 0,4049 = 0,8742. Véase gráfico 5.8.

GRÁFICO 5.8
PROPORCIÓN ENTRE DOS PUNTUACIONES
TÍPICAS DE SIGNO OPUESTO

–3 –2 –1 0 1 2 3
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 118

118 Introducción a la estadística

b) Halla la proporción de sujetos que hay entre las puntuaciones típi-


cas zi = –1,67 y zi = –1,23.
Al igual que en el caso anterior, tendremos que buscar dos datos en la
tabla 5.1: las proporciones que corresponden a zi = 1,67 y a zi = 1,23 son
respectivamente 0,9525 y 0,8907. Como se trata de puntuaciones que se
encuentran en el mismo lado de la media, debemos tener en cuenta que
hay una proporción que estamos midiendo dos veces. Observa el gráfico
5.9 para hacerte una idea de lo que se acaba de afirmar. Por ello, si de la
proporción mayor restamos la menor, obtendremos el resultado que es-
tamos buscando, es decir 0,9525 – 0,8907 = 0,0618.

GRÁFICO 5.9
PROPORCIÓN ENTRE DOS PUNTUACIONES
TÍPICAS DEL MISMO SIGNO

0,8907

–3 –2 –1 0 1 2 3

0,9525

Procederíamos del mismo modo si las puntuaciones típicas fueran ambas


positivas.
Si puedes averiguar la proporción de sujetos a partir de lo que sabes sobre
la puntuación típica de un individuo, seguro que puedes hacer la operación
contraria, es decir, averiguar la puntuación típica y la puntuación directa co-
nociendo la proporción que corresponda. Veamos algunos ejemplos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 119

La curva normal como modelo para analizar mis datos 119

1. Averiguar las puntuaciones típicas entre las que se encuentra un deter-


minado porcentaje de sujetos en torno a la media.
Halla las puntuaciones típicas entre las que se encuentra el 60% central
de la distribución.
Para resolver el problema planteado, debes fijarte en que los sujetos
sobre los que te preguntan están concentrados en torno a la media. Por
tanto, el 30% se encuentra en la parte positiva y la otra mitad en la par-
te negativa. En consecuencia, teniendo en cuenta cómo está con-
figurada la tabla 5.1, habría que buscar un valor igual o próximo a
0,50 + 0,30 = 0,80. La tabla 5.1 proporciona un valor de 0,7995. Ahora
se procede a leer la puntuación típica que corresponda: en este caso,
zi = 0,84. Esto significa que el 60% de los sujetos está entre el límite in-
ferior zi = –0,84 y el límite superior zi = +0,84.
Sabiendo que la distribución tiene como media 79,40 y desviación típi-
ca 14,288, puedes averiguar fácilmente el valor de las puntuaciones di-
rectas que corresponden a zi = –0,84 y a zi = +0,84.

Recordarás que Por tanto, En conse-

cuencia, el límite inferior equivale a Xi= 79,40 + (–0,84 × 14,288) =


79,40 – 12,002 = 67,398, y el límite superior equivale a Xi = 79,40 +
(+0,84 × 14,288) = 79,40 + 12,002 = 91,402.
2. Averiguar la puntuación típica por debajo de la cual se encuentra un
determinado porcentaje de sujetos.
a) Halla la puntuación típica que deja debajo de sí al 90% de la distri-
bución.
Para dar una respuesta cabal a esta pregunta, te basta ir la tabla 5.1
y buscar una proporción igual o muy próxima a 0,90. El dato que
proporciona la tabla es 0,8997 y la zi correspondiente es 1,28. Como
resulta que te informan de que se trata de una puntuación que deja
debajo de sí al 90% de la distribución, en buena lógica esta puntua-
ción tiene que ser positiva. En consecuencia zi = +1,28.
Al igual que en el ejercicio anterior, puedes transformar esta pun-
tuación típica en puntuación directa, o sea, aquella puntuación di-
recta que deja debajo de sí al 90% de la distribución.

Xi = 79,40 + (+1,28 × 14,288) = 79,40 + 18,289 = 97,689.

b) Halla la puntuación típica que deja debajo de sí al 25% de la distri-


bución.
Vayamos a la tabla 5.1. Pero antes hemos de recordar que esta tabla
empieza en 0,50. Por tanto, tenemos que buscar una proporción
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 120

120 Introducción a la estadística

igual o muy próxima a 0,50 + 0,25 = 0,75. El valor más próximo que
obtenemos es 0,7486 y la zi correspondiente es 0,67. Como resulta
que te informan que se trata de una puntuación que deja por deba-
jo de sí al 25% de la distribución, en buena lógica esta puntuación
tiene que ser negativa. En consecuencia zi = –0,67.
A estas alturas ya debes saber cómo transformar esta puntuación tí-
pica en puntuación directa.

Xi = 79,40 + (–0,67 × 14,288) = 79,40 – 9,573 = 69,827.

3. Averiguar la puntuación típica por encima de la cual se encuentra un


determinado porcentaje de sujetos.
a) Halla la puntuación típica que deja por encima de sí al 70% de la
distribución.
Volvamos a la tabla 5.1 y busquemos una proporción igual o muy
próxima a 0,70. El dato que proporciona la tabla es 0,6985 y la zi
correspondiente es 0,52. Como se trata de averiguar una puntuación
que deja por encima de sí al 70% de la distribución, en buena lógi-
ca tiene que ser negativa. En consecuencia zi = –0,52.
Transformemos esta puntuación típica en puntuación directa:

Xi = 79,40 + (–0,52 × 14,288) = 79,40 – 7,430 = 71,970.

b) Halla la puntuación típica que deja por encima de sí al 30% de la


distribución.
Esta vez simplemente tienes que pensar que si una puntuación típi-
ca deja por encima de sí al 30% de la distribución, eso significa que
deja debajo de sí al 70% de dicha distribución. Si esto es así, proce-
deríamos del mismo modo que en el ejercicio anterior. Es decir, la
puntuación típica debe ser 0,52, con la diferencia de que esta vez
debe ser positiva. En consecuencia, zi = +0,52.
Transformemos esta puntuación típica en puntuación directa:

Xi = 79,40 + (+0,52 × 14,288) = 79,40 + 7,430 = 86,830.

4. Averiguar las puntuaciones típicas entre las que se encuentra un deter-


minado porcentaje de sujetos.
Halla las puntuaciones directas entre las que se encuentra el 40% de
sujetos cuyas puntuaciones están por debajo de la media y el 30%
de sujetos cuyas puntuaciones están por encima.
Procedemos del mismo que en el caso 1, excepto que esta vez las pro-
porciones en torno a la media no son iguales.
Empezamos por buscar un valor igual o próximo a 0,50 + 0,40 = 0,90.
La tabla 5.1 proporciona un valor de 0,8997. Ahora se procede a leer la
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 121

La curva normal como modelo para analizar mis datos 121

puntuación típica que corresponda: en este caso, 1,28. Como el 40% de


sujetos está situado por debajo de la media, la puntuación típica debe
ser negativa. Por ello zi = –1,28.
Procedemos de una manera similar para el 30%: buscamos un valor
igual o próximo a 0,50 + 0,30 = 0,80 y obtenemos 0,7995. Sabiendo
que el 30% está por encima de la media, la puntuación típica corres-
pondiente ha de ser zi = +0,84.
Conociendo la media 79,40 y la desviación típica 14,288, sólo queda averi-
guar el valor de las puntuaciones directas que corresponden a zi = –1,28
y a zi = +0,84.
Aplicando las fórmulas conocidas, averiguamos que el límite inferior equi-
vale a Xi = 79,40 + (–1,28 × 14,288) = 79,40 – 18,289 = 61,111 y el límite
superior equivale a Xi = 79,40 + (+0,84 × 14,288) = 79,40 + 12,002 = 91,402.

PUNTUACIONES DERIVADAS 5.4.

• T = 50 + (10 · Zi).
• S = 50 + (20 · Zi).
• CEEB = 500 + (100 · Zi).
• Penta: P = 3 + (1 · Zi).
• Eneatipos: E = 5 + (2 · Zi).
Conociendo cualquier puntuación típica, puedes averiguar la puntuación
derivada que le corresponde. Por ejemplo, si Zi = 1,25, entonces:
T = 50 + (10 × 1,25) = 50 + 12,50 = 62,50;
S = 50 + (20 × 1,25) = 50 + 25 = 75;
CEEB = 500 + (100 × 1,25) = 625;
P = 3 + (1 × 1,25) = 3 + 1,25 = 4,25;
E = 5 + (2 × 1,25) = 5 + 2,50 = 7,50.

TU TURNO 5.5.

Sabiendo que en la variable «Conocimientos previos» se obtuvo una media de


4,269 y una desviación típica de 0,918, y suponiendo que las puntuaciones se
distribuyan normalmente, halla:
1. La proporción de alumnos que hay entre zi = –1,57 y zi = +1,57.
2. La proporción de alumnos que hay por encima de la puntuación típica
zi = +2,05.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 122

122 Introducción a la estadística

3. La proporción de alumnos que hay por encima de la puntuación típica


zi = –0,55.
4. La proporción de alumnos que hay por debajo de la puntuación típica
zi = +0,70.
5. La proporción de alumnos que hay por debajo de la puntuación típica
zi = –2,95.
6. La proporción de alumnos que hay entre las puntuaciones típicas zi = –2,02
y zi = +0,51.
7. La proporción de alumnos que hay entre las puntuaciones típicas zi = –1,77
y zi = –1,57.
8. Las puntuaciones típicas entre las que se encuentra el 97% central de la
distribución.
9. La puntuación directa que deja debajo de sí al 65% de la distribución.
10. La puntuación directa que deja debajo de sí al 15% de la distribución.
11. La puntuación directa que deja por encima de sí al 70% de la distribución.
12. La puntuación directa que deja por encima de sí al 30% de la distribución.
13. Las puntuaciones directas entre las que se encuentra el 25% de alumnos
cuyas puntuaciones están por debajo de la media y el 35% de alumnos
cuyas puntuaciones están por encima de la media.
14. En cualquier distribución, la puntuación típica correspondiente a la media:
1. Es 0.
2. Se aproxima a 1.
3. Es –3 ó +3.
4. Depende de cada distribución.
15. Las distribuciones de puntuaciones típicas tienen como desviación típica
un valor:
1. Igual 0.
2. Igual a 1.
3. Que se encuentra entre –3 y +3.
4. Que depende de cada distribución.
16. Entre las siguientes afirmaciones en torno a la distribución normal, señala
la que carece de sentido
1. Lo normal es lo frecuente.
2. Lo normal es lo común.
3. Lo normal está relacionado con la media.
4. Lo normal lo reflejan los sucesos extremos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 123

Capítulo 6
¿CÓMO TRATAR LA INCERTIDUMBRE
ASOCIADA A MIS DATOS?

Al finalizar este capítulo deberías:


• Conocer algunas de las técnicas de muestreo.
• Conocer el concepto de experimento aleatorio.
• Conocer el concepto de probabilidad.
• Ser capaz de relacionar muestreo y probabilidad.
• Ser capaz de calcular la probabilidad de ocurrencia por azar de un
determinado suceso.

Al lo largo de los capítulos anteriores has podido darte cuenta de los pasos
que implica llegar a afirmar por ejemplo que, por término medio, los alumnos
matriculados en esta materia inician el curso con la impresión de que van a
tener muchas dificultades o de que su nivel de conocimientos previos está en
torno a 4 en una escala de 0-10. Ahora bien, sabiendo que hemos preguntado
a un único grupo de alumnos, ¿podemos estar absolutamente seguros de que
en general los alumnos comparten esta impresión o que su nivel medio está
por debajo de la media de la escala? En realidad, la respuesta a estas pregun-
tas implica responder al menos a otras dos interrogantes:
a) ¿Cómo procedimos para seleccionar a los componentes de este grupo?
¿Los alumnos fueron elegidos al azar o se aplicó algún criterio determi-
nado? Esto nos debe llevar a estudiar someramente la cuestión del
muestreo.
b) ¿Cuál es la influencia del azar en la obtención de este resultado? Dicho
de otro modo, ¿es posible que hayamos obtenido este resultado por
pura casualidad? O ¿hasta qué punto ha influido el azar? Esto nos debe
llevar al estudio de la probabilidad de ocurrencia de este suceso que
sea imputable al azar.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 124

124 Introducción a la estadística

6.1. NOCIONES BÁSICAS DE MUESTREO

Algunas definiciones iniciales:


a) Una población o universo es el conjunto total de sujetos sobre los que se
realiza el estudio y sobre los que se pretende generalizar los resultados.
Es muy importante definir la población de manera precisa, es decir, es-
pecificar las unidades elementales que la componen, así como sus lími-
tes con exactitud. En nuestro caso, constituyen la población de todos
los alumnos matriculados en esta materia en un determinado curso de
una determinada carrera universitaria de una determinada universidad.
Si no especificásemos estos límites, la población podría incrementarse
sensiblemente, ya que virtualmente cualquier alumno cursando estu-
dios universitarios podría ser un elemento válido de la población.
Cuando la población se compone de más de 100.000 unidades elemen-
tales, se suele considerar infinita.
b) Una unidad estadística es el elemento básico que compone la población.
Cuando se trata de una población infinita, cabe la posibilidad de des-
componerla en diferentes tipos de unidades elementales. De hecho, se
puede pensar en varios niveles en la descomposición de la población
en unidades más simples. A título de ejemplo, respecto de esta materia,
los alumnos podrían agruparse en distintos conjuntos según:
• La carrera que cursan (primer nivel): Pedagogía, Psicología, Psicope-
dagogía, Magisterio, Medicina, Farmacia, Ciencias de la Información,
etc.
• La universidad en la que están matriculados (segundo nivel): Univer-
sidad Complutense de Madrid, Universidad de Sevilla, Universidad
del País Vasco, Universidad Autónoma de Barcelona, etc.
• El curso (tercer nivel): 1er curso, 2º curso, 3er curso, etc.
• El grupo al que han sido asignados por la Secretaría de Alumnos
(cuarto nivel): mañana, tarde y noche.
En el caso que nos ocupa, se trata de una población finita para la que
la especificación de la unidad elemental es muy sencilla: tan sólo se
trata de cada uno de los alumnos matriculados en uno de los grupos
del curso introductorio a los métodos de investigación educativa.
c) Una muestra es una parte, un subconjunto de unidades estadísticas ex-
traído de la población y sobre el que efectivamente se realiza el estu-
dio. A partir de los resultados obtenidos de la muestra, se procede por
extrapolación para producir estimaciones sobre el universo o población
de procedencia.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 125

¿Cómo tratar la incertidumbre asociada a mis datos? 125

Se conoce como muestreo el procedimiento que se utiliza para extraer de


una población la/s muestra/s con la/s que el investigador trabaja de hecho. A
este respecto, los investigadores del entorno socioeducativo recurren a dos
grandes tipos de muestreo: muestreo probabilístico y muestreo no pro-
babilístico.
En el caso del muestreo probabilístico, cada miembro de la población tie-
ne la misma posibilidad de ser incluido en la muestra. Para garantizar la equi-
probabilidad de las muestras, es decir, la igualdad de probabilidad, a la hora
de seleccionar a los sujetos, se recurre al azar. La selección al azar permite
calcular de antemano la probabilidad de obtener cada una de las muestras
posibles. Así se evita sacar muestras sesgadas, es decir, muestras desequilibra-
das, donde puede haber más sujetos de determinadas características que
otros.
Existen varios tipos de muestreos aleatorios. Entre los más conocidos para los
investigadores socioeducativos, cabe señalar los que se enumeran a continuación.

• Muestreo aleatorio simple


Para formar parte de la muestra, cada elemento es elegido al azar; por tanto,
cada unidad de la población tiene la misma probabilidad de ser seleccionada.
Para proceder de este modo, se da por supuesto que los elementos son inde-
pendientes entre sí, es decir, la elección de un elemento cualquiera no influye
sobre la elección de ningún otro. Ahora bien, para la aplicación de este pro-
cedimiento es imprescindible conocer previamente a toda la población. Eso
permite numerar a todos los componentes, lo que a su vez facilita la extrac-
ción posterior. Como puedes adivinar, se trata de un proceso de una extraor-
dinaria complejidad cuando la población es infinita.

• Muestreo aleatorio sistemático


En este tipo de muestreo, después de elegir al azar al primer elemento, se selec-
ciona uno a uno a los sucesivos componentes siguiendo una enésima secuencia
de un listado de la población.
Para ello, se divide el total de unidades de la población por el número de
componentes que tendrá la muestra y el cociente, llamado coeficiente de ele-
vación, indica cada cuántos elementos hay que elegir una unidad del listado
de la población, una vez elegido el primero al azar con la condición de que
su número de orden sea inferior al coeficiente de elevación. , donde k
es el coeficiente de elevación, N, la población y n, la muestra.
Supongamos que tenemos una población ordenada de N = 5.000 sujetos
de los que queremos obtener una muestra de n = 500, el coeficiente de eleva-
ción k resultante es 5.000 : 500 = 10. Eso significa que si el azar ha señalado
al elemento nº 7 como el primero de la muestra, los siguientes serán: 17, 27,
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 126

126 Introducción a la estadística

37, 47, etc. Muy sencillo: se aplica el coeficiente de elevación a partir del pri-
mer elemento elegido aleatoriamente, siempre que sea inferior a dicho coefi-
ciente.
¿Y si el primer elemento fuera 42, por ejemplo? También en este caso se
aplica el procedimiento anterior, pero una vez llegado a la última unidad de la
población, se empieza la serie de nuevo hasta encontrar el punto de arranque.

• Muestreo aleatorio estratificado


Se trata del tipo de muestreo que necesitas si lo que buscas es homogeneizar
los elementos de cada subgrupo con respecto a la característica o conjunto de
características que te interesan en un estudio dado. Para ello, debes dividir a
la población en subgrupos o estratos, en función del conjunto de característi-
cas de la población en estudio y finalmente eliges de cada uno de ellos un
número determinado de unidades al azar.
Con frecuencia nos encontramos con poblaciones que no son homogé-
neas como cuando estudiamos el rendimiento de la población escolar espa-
ñola, que está lejos de ser igual en su composición en todos los rincones del
Estado: en unas Comunidades Autónomas la tasa de alumnos inmigrantes es
más elevada que en otras o el abandono escolar es más notable en unas zo-
nas que en otras, etc. En estos casos, el muestreo aleatorio estratificado ase-
gura que toda la población esté debidamente representada en la muestra fi-
nal, es decir que los aspectos más significativos de la población son tomados
en consideración.
Si deseas seleccionar una muestra de forma que cumpla las condiciones
arriba señaladas, puedes elegir entre dos tipos de muestreo aleatorio estratifi-
cado:
— El muestreo aleatorio estratificado constante
Si optas por este tipo de muestreo debes elegir un número constante
de unidades; el tamaño y la variabilidad de las unidades dentro de la
población no importan. Por ejemplo, para evaluar el rendimiento aca-
démico a nivel nacional te bastaría elegir el mismo número de alum-
nos en representación de cada Comunidad Autónoma.
— El muestreo aleatorio estratificado proporcional
Si eliges este tipo de muestreo debes seleccionar un número de unida-
des que sea proporcional al tamaño del estrato en la población. Si es-
tás ante una población heterogénea, parece lógico recurrir a este tipo
de muestreo. En el caso del sistema educativo, se sabe que los alum-
nos no se reparten por igual entre todas las Comunidades Autónomas
o en todos los niveles educativos. En consecuencia, parece lógico que
en la muestra final se reflejen las diferencias que existen entre las Co-
munidades Autónomas o los niveles educativos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 127

¿Cómo tratar la incertidumbre asociada a mis datos? 127

Y si optas por el muestreo aleatorio estratificado proporcional, puedes ele-


gir entre dos posibles opciones:
— El muestreo aleatorio estratificado por conglomerados o racimos
Si quieres recurrir a este tipo de muestreo, primero asegúrate de que
la población esté previamente agrupada en conglomerados naturales o
artificiales y que en cada conglomerado esté apropiadamente repre-
sentada la diversidad propia de las unidades que componen la pobla-
ción. Date cuenta de que en este caso el individuo pasa a un segundo
plano; lo que importa es el conglomerado o racimo: la unidad no es el
sujeto sino el grupo o el conjunto de unidades (conglomerados). Aho-
ra la selección aleatoria se aplica sobre el número total de conglome-
rados que agrupan a toda la población.
Si conoces el número total de conglomerados o racimos, el siguiente
paso consiste en seleccionar aleatoriamente un determinado número de
conglomerados. En este caso debes trabajar con todos los individuos
que forman un determinado racimo. En el caso del rendimiento acadé-
mico sabes que son 17 las Comunidades Autónomas. Por tanto, sólo
debes elegir aleatoriamente entre estas 17 comunidades y evaluar el
rendimiento de todos los alumnos de las comunidades seleccionadas.
— El muestreo aleatorio estratificado por etapas o polietápico
Si has entendido lo dicho en el caso anterior, verás que se trata de un
tipo de muestreo muy parecido al de conglomerados. Pero esta vez,
además de elegir aleatoriamente entre los conglomerados originales
unos cuantos que constituirán las unidades primarias, hay que dar un
segundo paso, sacar una submuestra a partir de éstas. Es decir, de ca-
da unidad primaria se selecciona al azar una muestra que constituiría
unas unidades secundarias. Este proceso puede proseguir hasta el ni-
vel que quiera alcanzar el investigador.
Por ejemplo, en relación con la evaluación del rendimiento académico
de los alumnos y si se aplica el muestreo aleatorio estratificado por
etapas o polietápico, la selección podría incluir las siguientes etapas:
a) Seleccionar algunas Comunidades Autónomas entre las 17 que
constituyen el Estado.
b) Seleccionar algunos distritos escolares dentro de cada Comunidad
Autónoma elegida.
c) Seleccionar unos centros educativos dentro de cada distrito escolar
escogido.
d) Seleccionar unos cursos dentro de los centros educativos elegidos.
e) Seleccionar unas aulas dentro de los cursos escogidos.
f) Seleccionar a unos alumnos dentro de las aulas escogidas.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 128

128 Introducción a la estadística

A estas alturas ya te habrás dado cuenta de que se habla de alumnos


concretos en la última etapa. Pero si se analiza la lectura del gráfico
6.1, verás que un determinado alumno seleccionado pertenece a un
aula que es parte de un curso que se encuentra dentro de un centro
educativo que depende de un distrito escolar de una Comunidad Au-
tónoma. ¿Y todo eso para qué? ¿Sabes que existen técnicas de análisis
capaces de cuantificar la parte del rendimiento que se debe a cada
uno de esos niveles por separado y en conjunto? Ya tendrás ocasión
de aprenderlas en cursos más avanzados.

GRÁFICO 6.1
MUESTREO ALEATORIO ESTRATIFICADO POLIETÁPICO

Comunidad Autónoma

Distrito escolar
Centro educativo
Curso
Aula
Alumno

En aquellos casos en los que el investigador no recurre al azar para la se-


lección de las unidades muestrales, entonces atiende a determinados criterios
que considera relevantes para su investigación, como puede ser la escasez
de medios para llevar a cabo la investigación, la comodidad, la facilidad de
acceso, etc. Si lo hicieras así, estarías aplicando el muestreo no probabilísti-
co. Puedes elegir entre tres modalidades para llevar a cabo la selección de tu
muestra:
— Muestreo deliberado o intencional
Esto significa que seleccionas a los sujetos que te interesan para su es-
tudio por alguna razón que consideras relevante. Puedes entender que
la intervención de factores no estrictamente debidos a la investigación
en sí, como el uso de sujetos elegidos por ti, introduce de hecho un
sesgo que no puedes ignorar. Es pues más que conveniente que espe-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 129

¿Cómo tratar la incertidumbre asociada a mis datos? 129

cifiques con claridad el criterio de selección que hayas utilizado para


elegir tu muestra.
— Muestreo accidental o incidental
En este caso recurres sencillamente a los sujetos disponibles, aquéllos
que están a tu alcance o que se ofrecen como voluntarios para el estu-
dio. El muestreo que se basa en la proximidad o en la facilidad de ac-
ceso, etc. es considerado muy débil porque introduce un sesgo de difí-
cil control. Por ejemplo, si deseas probar un nuevo sistema de
enseñanza y sólo cuentas con voluntarios para dicho ensayo pero re-
sulta que hay más torpes que listos, o al revés, no puedes asegurar
que el éxito o el fracaso de tu sistema se deben a la eficacia o a la ine-
ficacia del mismo.
— Muestreo por cuota
Seleccionas las unidades teniendo en cuenta la información previa que
ya posees sobre los estratos de la población. Por ejemplo, sabiendo
cómo se distribuye el sexo, la raza, las creencias religiosas, etc., eliges
muestras que proporcionalmente representan los estratos de la pobla-
ción. Este tipo de muestreo suele utilizarse sobre todo cuando se apli-
can encuestas de opinión.
¡Paciencia! Aún no hemos terminado. Podrías caer en la tentación de creer
que con la aplicación cualquiera de los sistemas de muestreo que acabamos de
comentar está resuelto el problema de la selección de una muestra. Me temo
que aún te quedan algunas preocupaciones más que estudiar antes de que
puedas pasar a la fase de la recogida de datos. La muestra debe cumplir al me-
nos dos condiciones adicionales, las cuales pasamos a explicar a continuación.

• Representatividad
Una muestra debe ser representativa; esto significa que la muestra debe tener
las mismas características que te interesa estudiar en la población, o sea que
la muestra representa realmente a la población. Si estás trabajando con una
población heterogénea, la muestra debe exhibir esta característica también. Si
no fuera así, no podrías generalizar los resultados obtenidos a la población de
la que se supone procede tu muestra. Y como recordarás, los problemas liga-
dos al muestreo pueden invalidar un estudio.

• Tamaño de la muestra
Esta cuestión se refiere a la cantidad de unidades que hay que tomar en re-
presentación de la población. La pregunta que se nos plantea es: ¿cuántas
unidades debemos extraer de una determinada población, suponiendo que la
técnica utilizada para la extracción sea la adecuada? Intuitivamente puedes
darte cuenta de que son más fiables los datos obtenidos a partir de una
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 130

130 Introducción a la estadística

muestra extraída con rigor que de otra elegida en condiciones menos riguro-
sas. Por otra parte, si lo piensas un poco verás que, si aplicas la técnica de mues-
treo más exigente y extraes dos muestras, una de 20 sujetos y otra de 2.000
de una población de 100.000 unidades, los resultados procedentes de la pri-
mera muestra te merecerán menos confianza que los de la segunda. De he-
cho, los cálculos que puedes realizar sobre muestras de mayor tamaño son
más precisos que los obtenidos de muestras pequeñas. Consecuentemente se
te recomienda que utilices muestras grandes sobre todo porque en éstas actúa
con mayor probabilidad el principio de la distribución aleatoria. El concepto
de distribución aleatoria lo desarrollaremos en los siguientes apartados.
No nos vamos a enfrascar en una tediosa exposición de la teoría de las
muestras. Si te interesa este apasionante campo, puedes consultar las numero-
sas publicaciones que hay al respecto, como el Manual de Muestreo de Rémy
Clairin y Philippe Brion (2001).

6.2. ERRORES DE MUESTREO

Para la investigación en general la mejor situación es aquélla en la que el in-


vestigador tiene un acceso irrestricto a toda la población. Pero raramente se
produce. Esto ha obligado a desarrollar unas elaboradas técnicas de muestreo.
Sin embargo, en estadística como en la vida, no hay rosa sin espinas: al apo-
yarnos en muestras, corremos el riesgo de cometer errores que podrían llevar-
nos a extraer conclusiones inexactas respecto de la población.
El tipo de errores que más debe preocuparnos es el conocido como error
de muestreo; es un error que se produce cuando los resultados muestrales
son diferentes a los resultados poblacionales. De hecho, podemos elegir una
muestra que no sea una réplica exacta de la población. Por ejemplo, al elegir
entre los alumnos de una clase puede ocurrir que la mayoría de los elegidos
sean excelentes cuando la clase está efectivamente formada por alumnos que
por término medio son más bien de nivel bajo. Todos conocemos lo poco ati-
nados que son en general los pronósticos electorales. ¿Podría deberse a pro-
blemas de muestreo? Es más que probable.
El error de muestreo se considera un mal menor cuando no se puede ac-
ceder a toda la población.
Y como resulta que raramente medimos a toda la población, el error de
muestreo no se puede calcular directamente. Ahora bien, eso no significa que
sea imposible calcular la probabilidad de que ocurra una cierta cantidad de
error de muestreo. Se sabe, por ejemplo, que si se incrementa el tamaño de la
muestra, disminuye el error muestral. Es decir, si la muestra aumenta hasta
igualar la población, entonces el error muestral es igual a 0. Pero si lo haces
así, perderías los beneficios del muestreo, ¿verdad?
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 131

¿Cómo tratar la incertidumbre asociada a mis datos? 131

Hablaremos de esto cuando tratemos de cuestiones relativas a la estadísti-


ca inferencial.

ALGUNAS NOCIONES DE PROBABILIDAD 6.3.

Como investigadores, nos interesa sobremanera llegar a enunciar leyes capa-


ces de explicar el comportamiento de sucesos reales. Aspiramos a formular
leyes determinísticas, es decir, aquéllas que predicen con absoluta certeza,
por ejemplo, que conociendo la velocidad y el tiempo se puede calcular la
distancia con total seguridad. Sin embargo, en las ciencias sociales debemos
contentarnos con proponer leyes aleatorias, es decir, realizar predicciones que
llevan asociadas un cierto nivel de incertidumbre.

• Experimento aleatorio
Cuando no puedes predecir el resultado con absoluta exactitud, como cuando
sometes a un grupo de alumnos a un examen sorpresivo o cuando lanzas una
moneda o un dado al aire, estás ante un experimento aleatorio. De hecho, en
ciencias sociales la recogida de los datos implica la aceptación del supuesto
de que estamos ante experimentos aleatorios.

• Suceso elemental
En un experimento aleatorio cada uno de los posibles resultados, aprobar o
suspender en el caso del examen sorpresivo, cara o cruz en el caso de una
moneda, se denomina suceso elemental.

• Espacio muestral
Se denomina espacio muestral (Ω) al conjunto de todos los posibles resulta-
dos de un experimento muestral. En el caso del examen, aprobar y suspender
son los dos posibles resultados, cara y cruz para la moneda, mientras que el
dado tiene seis posibles resultados, a saber Ω = {1, 2, 3, 4, 5, 6}. Eso quiere
decir que el espacio muestral se define en función de los aspectos que anali-
zar en cada problema concreto. Por otra parte, en el caso del examen el es-
pacio muestral es diferente si se considera la respuesta correcta o errónea a
cada una de las preguntas de la prueba o si se toma en consideración la
prueba en su conjunto. Lo mismo ocurre con la moneda o el dado; hay que
tener en cuenta su número.
Si se toma en consideración el número de sucesos elementales, el espacio
muestral se puede contar. Si le preguntamos al azar a un transeúnte sobre su
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 132

132 Introducción a la estadística

nivel de aceptación de los extranjeros en una escala de 0 (ninguna acepta-


ción) a 5 (total aceptación), el espacio muestral es Ω = {0, 1, 2, 3, 4, 5}.
Si para medir su grado de aceptación de los extranjeros cronometramos en
segundos el tiempo que tarda en desplazarse a otro asiento cuando un ex-
tranjero se sienta a su lado, el espacio muestral tiene infinitos elementos que
pueden contarse (Ω = {0, 1, 2, 3…}); por tanto, se trata de un espacio muestral
infinito numerable.
Si intentamos medir con absoluta precisión (minutos, segundos, décimas
de segundos, etc.) el tiempo de reacción ante la presencia de un extranjero,
entonces estamos considerando el tiempo como una variable real cuyo espa-
cio muestral es infinito no numerable (Ω = {t; t ≥ 0}). Para ayudarte a com-
prender este concepto, recuerda lo que dijimos sobre las variables continuas.

ALGUNAS DEFINICIONES
6.4. RELATIVAS A LA PROBABILIDAD

Ya sabemos que en un experimento aleatorio no podemos determinar con


absoluta seguridad cuál será el resultado. Sin embargo, el sentido común y/o
nuestra experiencia nos llevan a sospechar o afirmar que unos resultados son
más verosímiles que otros. Intuitivamente, creemos que si lanzamos una mo-
neda al aire, lo mismo sale una cara que una cruz. Es decir, pensamos que si
no ocurre nada raro, tan probable es una cara como una cruz. Por tanto, la
probabilidad indica nuestra confianza en que ocurra un suceso, siempre que
no intervengan factores extraños.
Entre otras interpretaciones, el concepto de probabilidad se puede enfocar
desde tres puntos de vista.

6.4.1. Probabilidad a priori o clásica


Según el Diccionario de la Real Academia Española, a priori se define como
los conocimientos que son independientes de la experiencia, es decir, aquello
que se puede deducir usando sólo la razón, sin la experiencia. Desde este
punto de vista, la probabilidad se puede definir como el cociente entre el nú-
mero de casos favorables y el número total de casos, con la condición de que
todos sean igualmente posibles.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 133

¿Cómo tratar la incertidumbre asociada a mis datos? 133

El símbolo p(A) se lee como «la probabilidad de ocurrencia del suceso A».
Según la ecuación, la probabilidad de ocurrencia del suceso A es igual al nú-
mero de casos favorables A dividido entre el número total de sucesos posi-
bles. Por ejemplo, todo el mundo sabe que un dado tiene seis caras iguales
numeradas todas desde el número 1 hasta el 6. Si no se trata de un dado tru-
cado, acertarás si afirmas que la probabilidad de que salga cualquiera de las
seis caras es de 1/6. Para realizar esta afirmación no necesitas ejecutar el ex-
perimento. Aplicando una lógica sencilla, puedes establecer la probabilidad
independientemente de la ejecución del experimento; depende exclusivamen-
te de lo que sabes sobre la forma y el comportamiento normal del objeto lla-
mado dado.
Si arrojas un dado normal, es decir, de los que no hacen el pino sobre al-
guna de sus aristas, ¿cuál es la probabilidad de que se detenga con un «cua-
tro» hacia arriba? Ya sabes que existen seis números posibles, de los cuales
sólo uno es un «cuatro»; por tanto, la probabilidad de un «cuatro» en una tira-
da de un dado es:

Ahora supongamos que deseas averiguar la probabilidad de que el núme-


ro que saques en tu próxima tirada sea menor que tres. ¿Cómo lo averigua-
rías? Basta recordar que de los seis números del dado hay dos que cumplen
el requisito de ser menores que tres: son uno y dos. Por tanto, realmente es-
tás intentando averiguar la probabilidad de obtener un «uno» o un «dos» en tu
próxima tirada. Puedes resolver este problema mediante un razonamiento a
priori del siguiente modo:

Probabilidad a posteriori, empírica o frecuentista 6.4.2.


El diccionario define la expresión a posteriori como «a partir de los datos de
la experiencia». En el contexto de la probabilidad, esta expresión significa
«una vez comprobados algunos datos de la experiencia». Desde este punto de
vista, la probabilidad responde a la siguiente formulación:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 134

134 Introducción a la estadística

Para establecer la probabilidad de un «seis» al tirar un dado, desde el pun-


to de vista frecuentista, deberíamos tomar un dado real, arrojarlo un número
suficientemente alto de veces y contar el número de veces que ha salido un
«seis». Se puede entender que cuantas más veces arrojemos el dado, mejor se-
rá. Imagínate que tienes suficiente paciencia y lanzas tu dado 50.000 veces y
que obtienes un «seis» en 8.000 ocasiones. Puedes determinar la probabilidad
de que un «seis» ocurra en una tirada del dado mediante:

Como puedes ver, de acuerdo con el punto de vista empírico, es necesario


obtener datos lanzando un dado real para establecer la probabilidad. Se ha
observado que si el dado es honesto, a medida que se incrementa el número
de veces que se lanza, la probabilidad a posteriori se acerca a la probabilidad
a priori y se igualan cuando el número de tiradas se aproxima al infinito.
Generalizando, la definición frecuentista de la probabilidad de obtener el
resultado A responde a la siguiente fórmula:

No te asustes. En esta fórmula no se te sugiere que repitas el experimento


aleatorio un número ilimitado de veces para calcular la probabilidad. Tal re-
petición es imposible, porque no sólo cambian las condiciones ambientales
(humedad, velocidad del aire, temperatura, etc.), sino que se deteriora el da-
do o cualquiera que sea el instrumento que utilices. Por tanto, considera que
esta definición es tan sólo una forma conceptual de entender lo que es un ex-
perimento aleatorio y el cálculo de su probabilidad.
Por cierto, ¿qué ocurre si el dado está cargado, es decir, si un lado aparece
con más frecuencia que otros? Lógicamente la probabilidad a posteriori es dife-
rente a la probabilidad a priori. Para ser más concreto, el lado opuesto al que es-
tá cargado aparece con una frecuencia muy por debajo de lo que ocurriría nor-
malmente. Por ejemplo, si el dado está «cargado» para que aparezca un «dos»,
entonces el «seis» aparecerá con mucha más dificultad. En realidad, al aplicar la
ecuación a priori se da por supuesto que cada resultado posible es equiprobable.

6.4.3. Probabilidad subjetiva


Desde una perspectiva subjetiva, la probabilidad se concibe como un grado
de confianza que tiene una persona en el resultado de un experimento y no
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 135

¿Cómo tratar la incertidumbre asociada a mis datos? 135

como una propiedad del mismo. Tres propiedades fundamentan esta concep-
ción de la probabilidad:

• Consistencia
Si el resultado A es más probable que el resultado B, y el resultado B es más
probable que el resultado C, entonces el resultado A es más probable que el
resultado C (propiedad transitiva).

• Principio de racionalidad o coherencia


Si un alumno está dispuesto a invertir (apostar) una determinada cantidad de
esfuerzo (X) para aprender esta materia y espera recibir como premio un cier-
to nivel de satisfacción (Y) bajo la forma de un cierto nivel de calificación,
donde X < Y, se define su nivel de probabilidad subjetiva como el cociente
entre X e Y.
No es infrecuente que la probabilidad se exprese como posibilidades res-
pecto a 10 ó 100. Es incluso posible que hayas oído una expresión como la
siguiente: la probabilidad de que ocurra el suceso A (por ejemplo, llover una
tarde de verano) es de 50 posibilidades de 100, de 5 sobre 10 o simplemente
del 50%. Lo que nuestro informante quiere dar a entender es que p(A) = 0,50.
Cuando se trata de apuestas, la probabilidad se expresa generalmente co-
mo las posibilidades a favor de una determinada jugada. Por ejemplo, en las
carreras de caballos una apuesta de 3 a 1 significa que el apostador cree que
el caballo X tiene tres veces más posibilidades de ganar la carrera que sus
contrincantes. En términos de probabilidad, p(gane caballo X) = 0,75.

• Intercambiabilidad
Supongamos que A, B, C, D…, Z son un conjunto de sucesos, como por
ejemplo la respuesta de un transeúnte elegido al azar sobre su nivel de acep-
tación de los extranjeros en una escala de 0 (ninguna aceptación) a 5 (total
aceptación). La probabilidad de que se den todos ellos simultáneamente no
depende del orden de los mismos. Dicho de otro modo, p(A, B, C, D…, Z) =
p(a, b, c, d…, z), el espacio muestral es Ω = {0, 1, 2, 3, 4, 5}.

ALGUNAS REGLAS BÁSICAS 6.5.

Seguramente ya te habrás dado cuenta de que la probabilidad de ocurrencia


de un suceso se expresa como una fracción (por ejemplo, 1/6) o un número
+); por tanto, se trata de una sencilla
decimal equivalente (por ejemplo, 0,16
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 136

136 Introducción a la estadística

proporción cuyo valor oscila entre 0,00 y 1,00. En consecuencia, desde un


punto de vista meramente formal, se puede decir que una medida de proba-
bilidad es una función p con dominio del espacio muestral de sucesos A y
recorrido el intervalo {0,1} y cumple las propiedades que enumeramos a
continuación.

• p(A) ≥ 0 para todo suceso A  Ω


Esto significa que cualquier suceso del espacio muestral tiene una probabilidad
de ocurrencia igual o mayor que 0. De hecho, puedes observar que la probabi-
lidad de obtener por ejemplo un «cinco» al tirar un dado es mayor que 0.

• p(Ω) = 1,00
La probabilidad de que ocurra un suceso seguro es igual a 1,00. Por ejemplo, la
probabilidad de que al tirar un dado salga un número de 1 a 6 es igual a
1,00. Por otra parte, sabes que el espacio muestral de la tirada de un dado es-
tá formado por los números 1, 2, 3, 4, 5 ó 6, que constituyen cada uno un ele-
mento, punto de muestreo o unidad muestral; el conjunto de los seis elemen-
tos forma el espacio muestral o universo de resultados posibles. Si sumas la
probabilidad de cada elemento del espacio muestral, obtienes 1,00.
Por cierto, ¿cuál es la probabilidad de que quien está leyendo este párrafo aho-
ra mismo sea un terrícola? Es 1,00, ¿verdad?, a menos que seas un extraterrestre.

• Definición axiomática de probabilidad


Si A1, A2, A3, A4, A5…, An es un conjunto de sucesos excluyentes en A, entonces:

Si aplicamos esta definición al caso de la tirada de un dado, la idea subya-


cente se expresaría de la siguiente manera: teniendo en cuenta que cuando
sale un «uno» no puede aparecer ningún otro número debido a que son suce-
sos excluyentes, entonces para hallar la probabilidad conjunta de los sucesos,
basta sumar la probabilidad de cada suceso por separado.
De este axioma derivan las siguientes consecuencias:

a) La probabilidad del suceso A , complemento o contrario del suceso A, es:

b) La probabilidad del suceso imposible es cero:

p(∅) = 0
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 137

¿Cómo tratar la incertidumbre asociada a mis datos? 137

c) Si A ⊂ B (A está incluido en el subconjunto de B) entonces:

p(A) ≤ p(B)
d) Dado dos sucesos cualesquiera, la probabilidad de su unión es:

p(A∪B) = p(A) + p(B) – p(A∩B)1

MUESTREO Y CÁLCULO DE PROBABILIDADES 6.6.

Te recuerdo que este libro no pretende ser un manual de matemáticas o de


estadística en sentido estricto. Por tanto, no te eches las manos a la cabeza:
no hay de qué preocuparse. Nadie tiene la mala idea de apabullarte con te-
diosas operaciones carentes de sentido. Veremos tan sólo las dos reglas básicas
—suma y producto— que necesitamos para comprender lo suficiente y así
poder enfrentarnos a las pruebas de inferencia con alguna garantía de éxito.

Regla de la suma 6.6.1.


Se trata de una regla derivada de la definición axiomática de la probabilidad;
esta regla permite determinar la probabilidad de ocurrencia de alguno de va-
rios eventos posibles. El caso más sencillo es el que se refiere a dos sucesos
posibles: A o B. Para este caso, la probabilidad de ocurrencia de A o B es
igual a la probabilidad de ocurrencia de A más la probabilidad de que ocurra
B menos la probabilidad de que A y B ocurran conjuntamente:

p(A o B) = p(A) + p(B) – p(A y B)

Así dicho parece un insoportable galimatías y, sin embargo, resulta relati-


vamente sencillo de entender. Veamos un ejemplo práctico: queremos deter-
minar la probabilidad de sacar por azar un «dos» o un «seis» de un juego ordi-
nario de dominó, de 28 fichas. Vamos a resolver el problema de dos maneras:
a) gráficamente, por enumeración, y b) aplicando la regla de la suma. Y com-
probaremos si obtenemos el mismo resultado.
En primer lugar, echa una ojeada sobre el gráfico 6.2.
Del juego se sacan fichas que contengan «doses» o «seises».

1
Como nos interesa más el concepto que la formalización propia de los manuales de pro-
babilidad, en adelante utilizaremos la expresión p(A o B) en lugar de p(A∩B) y p(A y B) en lu-
gar de p(A∪B).
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 138

138 Introducción a la estadística

GRÁFICO 6.2
PROBABILIDAD POR ENUMERACIÓN

Y ahora lo único que nos toca hacer es enumerar todas las fichas que cum-
plen el requisito de tener un «dos» o un «seis». Luego simplemente contamos y
observamos que son 13 las fichas que contienen un «dos» o un «seis». En conse-
cuencia, la probabilidad de obtener un «dos» o un «seis» es de
Y ahora, apliquemos la regla de la suma. Según esta regla, la probabilidad
de obtener una ficha con un «dos» es de y la probabilidad de conseguir
una con un «seis» es de . La probabilidad de sacar una ficha que tenga a la
vez un «dos» y un «seis» es igual a . Ya tenemos los datos necesarios para
aplicar la regla de la suma; es decir, la probabilidad de conseguir una ficha
con un «dos» o un «seis» es .
Y, ¿por qué debemos restar la probabilidad de obtener una ficha con un
«dos» y un «seis» a la vez? Por una sencilla razón: hemos contado la ficha con
un «dos» y un «seis» dos veces. Sin restarlo, pensaríamos de manera errónea
que existen 14 sucesos favorables en vez de 13. Compruébalo en la siguiente
secuencia de gráficos.

GRÁFICO 6.3
FICHAS DE CADA CRITERIO

Doses

Seises
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 139

¿Cómo tratar la incertidumbre asociada a mis datos? 139

Si te fijas bien, verás que esta ficha ha sido


contada dos veces: la primera vez entre los «do-
ses» y la segunda vez entre los «seises». Por tan-
to hay que restarla una vez.
Tanto si procedemos por enumeración como si aplicamos la regla de la
suma, obtenemos el mismo resultado: la probabilidad de sacar por azar una
ficha que sea un «dos» o un «seis» es de 0,464. Comprobación terminada.
Éste sería el tratamiento que habría que dar al caso más general. Sin em-
bargo, hay situaciones, que pasamos a explicar a continuación, en las que de-
be haber un tratamiento algo diferente:

• Sucesos mutuamente excluyentes


Se considera que dos eventos son mutuamente excluyentes si no pueden ocu-
rrir al mismo tiempo o, dicho de otro modo, cuando la ocurrencia de uno im-
pide la del otro.
Lanza un solo dado. ¿Cabe la posibilidad de que obtengas un «tres» y un
«seis»? Desde luego que no; si obtienes un «tres», entonces no puedes sacar
un «seis». Y ahora extrae una carta de una baraja española (40 cartas). ¿Serías
capaz de sacar por azar una carta que sea a la vez una «sota» y un «caballo»? Si
puedes hacer tal cosa es que eres un mago. En condiciones normales es im-
posible sacar una carta de estas características porque si la carta es una «sota»,
entonces no puede ser un «caballo».
Lógicamente, en el caso de que dos sucesos sean mutuamente excluyen-
tes, la probabilidad de que ambos ocurran al mismo tiempo sólo puede ser
igual a 0, es decir, p(A y B) = 0.
Veamos qué dicen las ecuaciones. La fórmula genérica de la regla de la su-
ma se debe simplificar:

p(A o B) = p(A) + p(B) – p(A y B)

Pero como p(A y B) = 0, entonces...


p(A o B) = p(A) + p(B) – 0
... por tanto:
p(A o B) = p(A) + p(B)

¿Cómo se aplica este razonamiento a un caso práctico?


Veamos cómo calcularíamos la probabilidad de sacar una carta al azar que
sea un «rey» o un «caballo».
Al igual que procedimos para la comprobación de la fórmula genérica de
la regla de la suma, vamos a llevar a cabo las operaciones para resolver este
problema en dos fases:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 140

140 Introducción a la estadística

a) Probabilidad por enumeración


Simplemente contamos las cartas.

GRÁFICO 6.4
CARTAS DE CADA CRITERIO

Cuatro son las


cartas que
cumplen el criterio
de ser «reyes»

Cuatro son las


cartas que
cumplen el criterio
de ser «caballos»

No hay ninguna carta que sea a la vez «rey» y «caballo».


Por consiguiente, la probabilidad de sacar por azar una carta de una ba-
raja de 40 unidades que sea un «rey» es , la probabilidad de sacar una

carta que sea un «caballo» es , y la probabilidad de sacar una carta que


sea «rey» y «caballo» es 0. Eso quiere decir que la probabilidad de sacar al
azar una carta que sea «rey» o «caballo» es .

b) Regla de la suma para los sucesos mutuamente excluyentes


No existen cartas que sean a la vez «rey» y «caballo». Por tanto, estamos
ante eventos mutuamente excluyentes. Así pues, simplemente sumamos
las probabilidades de cada suceso por separado. Entonces, p(rey o ca-
ballo) = p(rey) + p(caballo). Como en la baraja de 40 cartas hay cuatro
«reyes» y cuatro «caballos», p(rey) = y p(caballo) = .

En consecuencia, p(rey o caballo) = .


INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 141

¿Cómo tratar la incertidumbre asociada a mis datos? 141

• Probabilidad y muestreo
Hasta ahora quizá hayas tenido la impresión de que probabilidad y muestreo
no están relacionados. Y sin embargo, si lo piensas un poco, verás que sí lo
están, especialmente en el caso del muestreo aleatorio, donde se procede por
extracción de una unidad y con reemplazo. Y si no es así, ¿cómo podrías re-
solver el siguiente problema?
Imagínate que tienes bajo tu responsabilidad un aula con 93 alumnos;
constituyen tu población. Resulta que esta población está dividida en tres gru-
pos: 60 alumnos de primera matrícula, 22 repetidores de segunda matrícula y
11 repetidores de tercera matrícula. Estás interesado en averiguar la probabili-
dad de que el primer alumno que selecciones sea un alumno de primera ma-
trícula o un repetidor de segunda matrícula.
En primer lugar, debes averiguar si te encuentras ante sucesos excluyentes
o no. Y en este caso, queda claro que si un alumno es de primera matrícula,
entonces no puede ser un repetidor. En consecuencia, los sucesos que estás
analizando son excluyentes. Si esto es así, puedes aplicar la regla de la suma
para sucesos excluyentes. Por tanto, p(alumno de primera matrícula o repeti-
dor de segunda matrícula) = p(alumno de primera matrícula) + p(repetidor
de segunda matrícula). Como hay 60 alumnos de primera matrícula y 22 repe-
tidores de segunda matrícula en una población de 93 individuos, p(alumno de
primera matrícula) = y p(repetidor de segunda matrícula) = . Así,
p(alumno de primera matrícula o repetidor de segunda matrícula) =
.

También puedes averiguar la probabilidad de que el primer alumno que


selecciones sea de primera matrícula, un repetidor de segunda matrícula o un
repetidor de tercera matrícula. Simplemente asumes que sigues en el caso de
sucesos excluyentes y procedes a generalizar la regla de la suma, esta vez
aplicándola a los Z sucesos que estás analizando.
La ecuación generalizada toma la siguiente forma, donde Z es el último
suceso:

P(A o B o C o ... o Z) = p(A) + p(B) + p(C) + ... + p(Z)

Si te encuentras ante sucesos que no sólo son mutuamente excluyentes, si-


no también exhaustivos, debes aplicar también la regla de la suma que ya co-
noces. Por cierto, se considera que un conjunto de sucesos es exhaustivo si
incluye a todos los sucesos posibles. Por ejemplo, en el caso del aula, sabes
que los sucesos posibles son tres: ser alumno de primera matrícula, repetidor
de segunda matrícula y repetidor de tercera matrícula. Es decir, que cada uno de
los alumnos del aula debe necesariamente estar en una de estas tres situacio-
nes. Para el lanzamiento de dados, los sucesos posibles son seis, es decir, en
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 142

142 Introducción a la estadística

cualquier tirada sólo puede salir uno de los seis números. Si se cumplen estas
condiciones, la suma de las probabilidades individuales de cada evento del
conjunto debe ser igual a 1. La ecuación que refleja esta afirmación tiene la
siguiente forma, donde A, B, C..., Z son los sucesos mutuamente excluyentes
y exhaustivos:

p(A) + p(B) + p(C) + ... + p(Z) = 1,00

Puedes verificar este aserto aplicando la ecuación anterior sobre el lanza-


miento de dados. Al lanzar un dado no cargado una sola vez, los posibles re-
sultados que podemos obtener son uno, dos, tres, cuatro, cinco o seis. Si apli-
camos la ecuación, lo que obtenemos es:

p(uno) = , p(dos) = , p(tres) = , p(cuatro) = , p(cinco) = y p(seis) = .

En consecuencia, p(uno) + p(dos) + p(tres) + p(cuatro) + p(cinco) + p(seis) = 1,00.


Lo mismo ocurriría con el aula:
p(alumno de primera matrícula) = ,

p(repetidor de segunda matrícula) = ,

p(alumno de tercera matrícula) = .

Por tanto, 1,00.

• Caso de dos sucesos mutuamente excluyentes


Esta situación se produce por ejemplo en el caso del lanzamiento de una mo-
neda. De hecho, los resultados posibles son sólo dos: cara o cruz. Estos dos
resultados son a todas luces exhaustivos y mutuamente excluyentes, es decir,
cuando sale cara no puede salir cruz. Cuando esto ocurre, se suele asignar el
símbolo P a la probabilidad de que ocurra uno de los sucesos y Q a la proba-
bilidad de que suceda el otro. Si se trata de una moneda no trucada, P debe
ser 0,50 y Q también. Y como los sucesos son exhaustivos y mutuamente ex-
cluyentes, la suma de sus probabilidades debe ser 1,00. De hecho P + Q =
0,50 + 0,50 = 1,00.
Volveremos sobre esta idea más adelante.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 143

¿Cómo tratar la incertidumbre asociada a mis datos? 143

Regla del producto 6.6.2.


Acabas de utilizar la regla de la suma para averiguar la probabilidad de ocu-
rrencia de uno de varios sucesos. Recuerda que se te preguntaba sobre la
probabilidad de que obtuvieras un número entre uno y seis al lanzar un da-
do, de que sacaras un alumno de primera matrícula o un repetidor de segun-
da matrícula, etc. Fíjate en que siempre te preguntaban por un único suceso.
La regla del producto amplía tu capacidad de responder, ya que permite to-
mar en cuenta la ocurrencia conjunta o sucesiva de varios sucesos. Date
cuenta de que se trata de que puedas averiguar la probabilidad de ocurrencia
cuando lances tres o cuatro dados a la vez en lugar de lanzar uno solo.
La regla básica del producto se formula de la siguiente manera: la probabi-
lidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A
por la probabilidad de que B ocurra, dado que A ha ocurrido.
Muy importante: fíjate en que en la formulación no se utiliza el nexo «o» si-
no el nexo «y» al hablar de los sucesos A «y» B.
En su forma de ecuación general, la regla antes enunciada toma la siguien-
te forma:

p(A y B) = p(A)p(B|A)

Cuidado con la lectura e interpretación del siguiente símbolo p(B|A). No


te confundas: no se trata de ninguna división entre B y A. Se debe leer como
la «probabilidad de que ocurra B dado que A ha ocurrido».
La aplicación de la regla básica del producto está condicionada por el tipo
de sucesos de que se trate. De hecho, ya hemos visto cómo se comporta la
regla de la suma cuando se trata de sucesos mutuamente excluyentes y cuan-
do además estos sucesos son exhaustivos. Ocurre igual respecto de la regla
del producto; se ve afectada por tres situaciones: cuando los sucesos son a)
mutuamente excluyentes, b) independientes o c) dependientes.

• Sucesos mutuamente excluyentes


Recordarás que cuando dos sucesos A y B son mutuamente excluyentes, la
ocurrencia de uno impide la del otro y que, por tanto, la probabilidad de su
ocurrencia conjunta es nula. Esta idea se expresaba así: p(A y B) = 0.

• Sucesos independientes
Se considera que dos sucesos son independientes si la ocurrencia de un suce-
so A no tiene efecto sobre la probabilidad de ocurrencia de otro B. Esto suce-
de cuando aplicas el muestreo aleatorio con reemplazo, es decir, cuando
vuelves a poner la unidad extraída en la población. Si de una baraja ordinaria
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 144

144 Introducción a la estadística

extraes varias cartas al azar, pero sacándolas de una en una y con reemplazo,
obtendrás una serie de sucesos independientes, ya que, puesto que la carta A
se devuelve a la baraja antes de extraer la carta B, la ocurrencia de la carta A en
la primera extracción no tiene efecto alguno sobre la probabilidad de ocurren-
cia de la carta B. Para ser más concreto, si A fuese un «rey», como se devuelve a
la baraja antes de elegir la segunda carta, la ocurrencia de un «rey» en la prime-
ra extracción no tendrá efecto alguno sobre la probabilidad de la ocurrencia de
la carta elegida en la segunda extracción: podría volver a ser un «rey».
Eso implica que si A y B son independientes, entonces la probabilidad de
B no queda condicionada por A. Por tanto, si A no influye sobre B, la «proba-
bilidad de que ocurra B dado que A ha ocurrido», se reduce a la probabilidad
de que ocurra B, o sea p(B|A) = p(B). Esta conclusión nos lleva a revisar la
ecuación general...

p(A y B) = p(A)p(B|A)

... pero como resulta que tratándose de sucesos independientes, p(B|A) = p(B)
entonces,

p(A y B) = p(A)p(B|A) = p(A)p(B)

Apliquemos esta conclusión a nuestra aula.


Del aula de 93 alumnos se extraen al azar 2, uno a uno y con reemplazo.
¿Cuál es la probabilidad de que la muestra extraída contenga sólo alumnos re-
petidores de segunda matrícula?
De acuerdo con el problema, en la primera extracción se saca un alumno re-
petidor de segunda matrícula y lo mismo en la segunda. Tratándose de una ex-
tracción de dos sucesos independientes y con reemplazo, procede aplicar la re-
gla del producto. Así, p(repetidor de segunda matrícula en la primera extracción
y repetidor de segunda matrícula en la segunda extracción) = p(repetidor de se-
gunda matrícula en la primera extracción) × p(repetidor de segunda matrícula
en la segunda extracción). Si miras en el ejercicio anterior verás que
p(repetidor de segunda matrícula) = . Por tanto, p(repetidor de segunda
matrícula en la primera extracción y repetidor de segunda matrícula en la se-
gunda extracción) =
La regla del producto para sucesos independientes se puede generalizar a
más de dos eventos. En este caso, la probabilidad de la ocurrencia conjunta
de los sucesos es igual al producto de las probabilidades individuales de cada
suceso. La ecuación generalizada tiene la siguiente forma, donde Z es el últi-
mo suceso:

p(A y B y C y ... y Z) = p(A)p(B)p(C) ... p(Z)


INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 145

¿Cómo tratar la incertidumbre asociada a mis datos? 145

Esta ecuación es muy útil si se quiere obtener una muestra más grande
que la de dos sujetos y con reemplazo. Te recuerdo los datos del aula: la po-
blación está compuesta por 60 alumnos de primera matrícula, 22 repetidores
de segunda matrícula y 11 repetidores de tercera matrícula. ¿Podrías averiguar
la probabilidad de extraer un alumno de cada categoría y en el mismo orden
del enunciado?
El problema pide un alumno de primera matrícula, un repetidor de segun-
da matrícula y un repetidor de tercera matrícula. Sabiendo que se trata de un
problema de más de dos sucesos independientes, vamos a aplicar la regla ge-
neralizada del producto para sucesos independientes. Por ello, p(un alumno de
primera matrícula, un repetidor de segunda matrícula y un repetidor de tercera
matrícula) = p(un alumno de primera matrícula) × p(un repetidor de segunda
matrícula) × p(un repetidor de tercera matrícula). Se sabe que las probabili-
dades individuales son las siguientes: p(un alumno de primera matrícula) = ;
p(un repetidor de segunda matrícula) = ; p(un repetidor de tercera matrí-
cula) = . Teniendo en cuenta que el muestreo es con reemplazo, p(un
alumno de primera matrícula, un repetidor de segunda matrícula y un repeti-
dor de tercera matrícula) = .
Y si, en lugar de extraer uno de cada categoría, sacas tres de la primera,
dos de la segunda y uno de la tercera, en ese orden, ¿serías capaz de calcular
la probabilidad de este resultado?
Si aplicas la regla del producto para varios sucesos independientes y con
reemplazo, el resultado que buscas debería ser:

• Sucesos dependientes
¿En qué caso podemos decir que nos encontramos ante sucesos dependien-
tes? Se considera que dos sucesos A y B son dependientes, cuando la proba-
bilidad de que ocurra B se ve afectada por la ocurrencia de A. La ecuación
que se aplica en esta situación es la siguiente:

P(A y B) = p(A)p(B|A)

Recuerda que p(B|A) se lee: probabilidad de B dado que A ha ocurrido.


Esta ecuación no puede ser simplificada. Se debe utilizar cuando se recu-
rre al muestreo aleatorio sin reemplazo, eso es, cuando las unidades seleccio-
nadas aleatoriamente no se devuelven a la población, lo que significa que ca-
da vez que se extrae una unidad, hay que restarla de la población total.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 146

146 Introducción a la estadística

Apliquemos esta ecuación al caso de nuestra aula de 93 alumnos. Te re-


cuerdo que su distribución es la misma que la del ejercicio anterior, a saber:
60 alumnos de primera matrícula, 22 repetidores de segunda matrícula y 11
repetidores de tercera matrícula. Se te pide que calcules la probabilidad de
extraer un alumno de primera matrícula y un repetidor de segunda matrícula.
Como el muestreo es sin reemplazo, aplicamos la regla del producto para su-
cesos dependientes. Así pues, p(un alumno de primera matrícula y un repetidor
de segunda matrícula) = p(un alumno de primera matrícula) × p(un repeti-
dor de segunda matrícula, dado que se extrajo un alumno de primera matrícula).
Para la primera extracción sabemos que la población es de 93 alumnos, de
los cuales, 60 son de primera matrícula. Eso quiere decir que p(un alumno
de primera matrícula) = .
Como el muestreo es sin reemplazo, la segunda extracción está condicio-
nada por la primera extracción, es decir, que ahora quedan 93 – 1 = 92 alum-
nos. Por ello, p(un repetidor de segunda matrícula dada la extracción de un
alumno de primera matrícula) =
Como p(un alumno de primera matrícula y un repetidor de segunda matrícu-
la) = p(un alumno de primera matrícula) × p(un repetidor de segunda matrícula,
dado que se extrajo un alumno de primera matrícula), entonces p(un alumno de
primera matrícula y un repetidor de segunda matrícula) = .
¿Y si se te pidiera que calculases la probabilidad de extraer tres alumnos
de primera matrícula, dos repetidores de segunda matrícula y un repetidor de
tercera matrícula?
Como el muestreo sigue siendo sin reemplazo, aplicamos la misma regla
que en el caso anterior. Así pues, p(tres alumnos de primera matrícula, dos
repetidores de segunda matrícula y un repetidor de tercera matrícula) =

p(el primer alumno de primera matrícula)


p(el segundo alumno de primera matrícula, dado que se extrajo el primer
alumno de primera matrícula)
p(el tercer alumno de primera matrícula, dado que fueron extraídos el
primero y el segundo alumno de primera matrícula)
p(el primer repetidor de segunda matrícula, dado que fueron extraídos los
tres alumnos de primera matrícula)
p(el segundo repetidor de segunda matrícula, dado que fueron extraídos
los tres alumnos de primera matrícula y el primer repetidor de segunda
matrícula)
p(el repetidor de tercera matrícula, dado que fueron extraídos los tres alum-
nos de primera matrícula y los dos repetidores de segunda matrícula)
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 147

¿Cómo tratar la incertidumbre asociada a mis datos? 147

Vayamos paso a paso. Para la primera selección sabemos que la población


es de 93 alumnos, de los cuales 60 son de primera matrícula. Por tanto:

p(el primer alumno de primera matrícula) = ;

p(el segundo alumno de primera matrícula, dado que se extrajo el primer


alumno de primera matrícula) = ;

p(el tercer alumno de primera matrícula, dado que fueron extraídos el pri-
mero y el segundo alumno de primera matrícula) = ;

p(el primer repetidor de segunda matrícula, dado que fueron extraídos los
tres alumnos de primera matrícula) = ;
p(el segundo repetidor de segunda matrícula, dado que fueron extraídos
los tres alumnos de primera matrícula y el primer repetidor de segunda
matrícula) = ;
p(el repetidor de tercera matrícula, dado que fueron extraídos los tres alum-
nos de primera matrícula y los dos repetidores de segunda matrícula) = ;
Como p(tres alumnos de primera matrícula, dos repetidores de segunda
matrícula y un repetidor de tercera matrícula) =
p(el primer alumno de primera matrícula) ×
p(el segundo alumno de primera matrícula, dado que se extrajo el primer
alumno de primera matrícula) ×
p(el tercer alumno de primera matrícula, dado que fueron extraídos el pri-
mero y el segundo alumno de primera matrícula) ×
p(el primer repetidor de segunda matrícula, dado que fueron extraídos los
tres alumnos de primera matrícula) ×
p(el segundo repetidor de segunda matrícula, dado que fueron extraídos los
tres alumnos de primera matrícula y el primer repetidor de segunda matrícula) ×
p(el repetidor de tercera matrícula, dado que fueron extraídos los tres
alumnos de primera matrícula y los dos repetidores de segunda matrícula),
entonces p(tres alumnos de primera matrícula, dos repetidores de segunda
matrícula y un repetidor de tercera matrícula) =

Acabas de comprobar que se puede aplicar la regla del producto para su-
cesos dependientes a más de dos eventos. En otras palabras, sabiendo que Z
es el último suceso, esta regla se puede generalizar de la siguiente manera:
p(A y B y C y ... y Z) = p(A)p(B|A)p(C|AB)...p(Z|ABC...)
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 148

148 Introducción a la estadística

Se interpreta como sigue:


p(A) probabilidad de A.
p(B|A) probabilidad de B dado que A ha ocurrido.
p(C|AB) probabilidad de C dado que A y B han ocurrido.
P(Z|ABC...) probabilidad de Z dado que A, B, C y todos los demás even-
tos anteriores han ocurrido.

6.6.3. Regla de la suma y del producto


Intenta resolver el siguiente problema: ¿cuál es la probabilidad de que al lan-
zar dos dados, los números obtenidos sumen 15? Quieto/a. Antes de lanzarte,
párate y piensa. El resultado 15 es imposible porque el máximo que pueden
sumar es 6 + 6 = 12; por tanto p(suma de 15) = 0.
¿Y si la suma fuera 7? Primero mira el gráfico 6.5.

GRÁFICO 6.5
POSIBLES RESULTADOS DE SUMA 7

1er dado 2º dado 1er dado 2º dado

A B

C D

E F

Te habrás dado cuenta de que existen seis resultados posibles cuya suma
es 7; de hecho, puede ser (A) 1 en el primer dado y 6 en el segundo, (B) 6
en el primer dado y 1 en el segundo, (C) 2 en el primer dado y 5 en el se-
gundo, (D) 5 en el primer dado y 2 en el segundo, (E) 3 en el primer dado y
4 en el segundo, y (F) 4 en el primer dado y 3 en el segundo. Has de supo-
ner que los dados son legales e independientes; esto debe autorizarte a recu-
rrir a la regla del producto para sucesos independientes con el fin de calcular
las probabilidades de (A), (B), (C), (D), (E) y (F). Sabes que cualquier número
del dado tiene la misma probabilidad de ocurrir, es decir 1/6. Por ello, puedes
pasar directamente a la siguiente etapa, consistente en determinar las probabili-
dades de (A), (B), (C), (D), (E) y (F). Por tanto:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 149

¿Cómo tratar la incertidumbre asociada a mis datos? 149

• p(A) = p(1 y 6) = p(1) p(6) =

• p(B) = p(6 y 1) = p(6) p(1) =

• p(C) = p(2 y 5) = p(2) p(5) =

• p(D) = p(5 y 2) = p(5) p(2) =

• p(E) = p(3 y 4) = p(3) p(4) =

• p(F) = p(4 y 3) = p(4) p(3) =

Aquí no termina todo. Hay que tener en cuenta que de acuerdo con el
enunciado del problema, puede haber seis resultados que cumplen el requisi-
to de sumar 7. Y además resulta que los seis sucesos son exhaustivos y mutua-
mente excluyentes. De hecho si sucede A, entonces no puede ocurrir ninguno
de los demás casos. En estas circunstancias, es procedente aplicar la regla de la
suma para sucesos mutuamente excluyentes. Si te fijas muy atentamente, te da-
rás cuenta de que en realidad en el enunciado se te está planteando un pro-
blema en torno a p(suma igual a 7) = p(A o B o C o D o E o F). Esta presenta-
ción te debería recordar la ecuación generalizada de la regla de la suma para
sucesos mutuamente excluyentes que, como recordarás, tiene la siguiente for-
mulación: p(A o B o C o ... o Z) = p(A) + p(B) + p(C) + ... + p(Z).
Si esto es así, entonces p(suma igual a 7) = p(A o B o C o D o E o F) = p(A)
+ p(B) + p(C) + p(D) + p(E) + p(F).

Por tanto, p(suma de 7) = .

Teorema de Bayes 6.6.4.


El matemático Thomas Bayes (1701-1761) se las ingenió para desarrollar una
regla que trata de calcular p(B|A) a partir de la información conocida acerca
de p(A|B). Bayes formuló esta idea de la siguiente manera:

Donde:
p(B’) = la probabilidad del complemento del suceso B.
p(A|B’) = la probabilidad del suceso A, dado que el complemento al su-
ceso B ha ocurrido
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 150

150 Introducción a la estadística

Veamos el siguiente ejemplo: de un grupo de alumnos que han consegui-


do aprobar esta materia, seleccionamos al azar una muestra de 23. Para saber
un poco más sobre cómo se las arreglaron para trabajar esta materia, les pre-
guntamos si habían asistido regularmente a clase y si habían estudiado al me-
nos una hora diaria durante el curso. El resultado final fue el siguiente:

Asistencia a clase Total


Sí – A No – A´
Número de horas Más de una hora – B 12 6 18
de estudio Menos de una hora – B’ 2 3 5
Total 14 9 23

Aplicando el teorema de Bayes, podríamos averiguar la probabilidad de


aprobar esta materia estudiando más de una hora diaria, si previamente
se asiste regularmente a clase. Para contestar, necesitamos transformar la tabla
de frecuencias absolutas en una tabla de frecuencias relativas.

Asistencia a clase Total


Sí – A No – A´
Número de horas Más de una hora – B 0,52 0,26 0,78
de estudio Menos de una hora – B’ 0,09 0,13 0,22
Total 0,61 0,39 1,00

Necesitamos calcular previamente:

1)

2)

Por lo tanto,

0,78 0,67
0,78 0,67 0,22 0,41

Así pues, la probabilidad de aprobar esta materia dedicándole al menos


una hora de estudio después de asistir a clase regularmente es de 0,85. En
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 151

¿Cómo tratar la incertidumbre asociada a mis datos? 151

otras palabras, si un alumno desea incrementar la probabilidad de superar es-


ta materia, debería adoptar esta técnica de trabajo. Por cierto, puedes confir-
mar estos resultados recurriendo directamente a las frecuencias absolutas.

( )

Probabilidad y variables continuas


con distribución normal 6.6.5.
Como recordarás, un suceso (obtener una ficha de dominó que contenga un
«dos» o un «seis», sacar una carta que sea «caballo» y «espada», obtener una su-
ma de 7 al lanzar dos dados, etc.) es el resultado de un experimento aleato-
rio; cada suceso pertenece a un determinado espacio muestral Ω (fichas de
un juego de dominó, cartas de una baraja española, todos los resultados posi-
bles del lanzamiento de dos dados, etc.) en el marco del cual se define un es-
pacio de sucesos A, así como una función de probabilidad p. Esta función in-
dica el grado de certeza en la aparición por azar de cada resultado. Los tres
elementos, Ω, A y p, definen el espacio probabilístico. Así pues, dado un es-
pacio probabilístico, se define una variable aleatoria como una función con
dominio Ω y recorrido la recta real. Esto significa que teniendo en cuenta la
definición anterior, una variable aleatoria convierte los sucesos del espacio Ω
en números reales. Esta conversión facilita el estudio de las variables aleato-
rias así como el establecimiento de relaciones entre las mismas a través del
análisis estadístico.
Por ejemplo, los alumnos matriculados en esta materia no saben si su pro-
fesor, quien es algo impuntual, habrá empezado la clase cuando llegan. El es-
pacio muestral de este experimento aleatorio es el siguiente:
Ω = {El profesor no ha empezado, El profesor ha empezado}
Por tanto, la variable aleatoria X = «Comienzo de la clase», puede definirse
del siguiente modo:
X = 1, cuando el profesor ha comenzado la clase.
X = 2, cuando el profesor no ha comenzado la clase.
Como puedes ver, se trata de una variable que sólo tiene dos posibles va-
lores, o sea, una variable que puede considerarse discreta. Ahora imagínate
que dentro de este marco definimos el experimento aleatorio como el núme-
ro de alumnos que entran en el aula en un momento dado, o sea, antes o
después de que empiece el profesor. En este caso, el espacio muestral sería:
Ω = {0, 1, 2, 3…}. La variable aleatoria «número de alumnos» toma un número
contable y finito de valores diferentes. Generalizando, podríamos definir una
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 152

152 Introducción a la estadística

variable aleatoria discreta como una variable que toma un número contable
de valores, que puede ser finito o infinito. Te sugiero que vuelvas al capítulo
3 para comprender mejor esta idea.
Mantengamos la definición de variable aleatoria discreta. La función de
probabilidad de X, f(x) indica la probabilidad de que X tome el valor de x. En
otras palabras: f(x) = p(X = x).
A diferencia de una variable aleatoria discreta, una variable aleatoria conti-
nua toma valores en un intervalo de números reales; puede tomar infinitos
valores. Así ocurriría si definieras el experimento aleatorio como el tiempo, t,
medido en número de minutos que median entre el comienzo de la clase y la
llegada de los alumnos. De hecho, en este caso el espacio muestral sería: Ω =
{t; t ≥ 0}.
De momento dejemos apuntado que para calcular la probabilidad en ca-
sos parecidos, siempre que se trate de una distribución normal, aplicaremos
la siguiente fórmula:

Completaremos esta idea al final del capítulo siguiente.

6.7. TU TURNO

1. En el muestreo se define como unidad estadística:


1. Cualquier elemento básico que forma parte de una población.
2. El conjunto total de sujetos que componen una población.
3. Una parte representativa de una población.
4. Cualquier estadístico que representa a una población.
2. ¿En qué tipo de muestreo el investigador recurre al coeficiente de eleva-
ción?
1. Muestreo aleatorio simple.
2. Muestreo aleatorio sistemático.
3. Muestreo aleatorio estratificado constante.
4. Muestreo aleatorio estratificado proporcional.
3. ¿Qué tipo de muestreo aconsejarías a un investigador interesado en averi-
guar el nivel de rendimiento de los alumnos en función del aula, del ci-
clo, del centro y del distrito escolar?
1. Muestreo aleatorio simple.
2. Muestreo aleatorio estratificado por racimos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 153

¿Cómo tratar la incertidumbre asociada a mis datos? 153

3. Muestreo aleatorio estratificado por etapas.


4. Muestreo aleatorio estratificado por cuota.
4. ¿Qué tipo de muestreo utiliza un investigador que recurre a una muestra
de sujetos que están disponibles?
1. Muestreo aleatorio estratificado por racimos.
2. Muestreo intencional.
3. Muestreo incidental.
4. Muestreo por cuota.
5. ¿De qué sucesos elementales se compone el espacio muestral del experi-
mento muestral llamado «cursos de pedagogía»?
1. 5.
2. 1, 2, 3, 4, 5.
3. Primer ciclo, Segundo ciclo.
4. 1.
6. Un jugador tramposo truca un dado para que le salgan «seises». Lanza di-
cho dado varias veces, calcula las probabilidades y obtiene los siguientes
resultados. Señala la probabilidad que contradice las expectativas del ju-
gador tramposo:
1. La probabilidad de obtener un 3 es de 1/6.
2. La probabilidad de obtener un 4 es de 1/6.
3. La probabilidad de obtener un 5 es de 1/6.
4. La probabilidad de obtener un 6 es de 1/6.
7. Lanzas un dado no trucado y mientras está rodando se te pregunta sobre
la probabilidad de que salgan un «dos» y un «cuatro». Tu respuesta debe
ser:
1. La probabilidad de obtener un 2 es de 1/6.
2. La probabilidad de obtener un 4 es de 1/6.
3. La probabilidad de obtener un 2 y un 4 es de 6/6.
4. La probabilidad de obtener un 2 y un 4 es de 0/6.
8. ¿Cuál de las siguientes afirmaciones sobre probabilidad es correcta?
1. La probabilidad a priori se refiere a un conocimiento derivado de la
experiencia.
2. La probabilidad a posteriori se refiere a un conocimiento independien-
te de la experiencia.
3. La probabilidad a posteriori se aproxima a la probabilidad a priori al
incrementarse el número de experimentos.
4. La probabilidad subjetiva se refiere tanto a la probabilidad a priori co-
mo a la probabilidad a posteriori.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 154
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 155

Capítulo 7
¿QUÉ ES UNA DISTRIBUCIÓN
DE PROBABILIDADES?

Al finalizar este capítulo deberías ser capaz de:


• Calcular una distribución de probabilidades de ocurrencia por azar
de un determinado conjunto de sucesos elementales.
• Conocer la distribución binomial.
• Conocer la distribución de Poisson.
• Conocer la distribución normal.
• Utilizar correctamente las tablaps binomial, de Poisson y normal.

Acabamos de ver en el capítulo anterior cómo se procede para calcular la


probabilidad de ocurrencia al azar de sucesos individuales bajo diferentes
condiciones. Esta vez vamos a generalizar la idea aún más. Veremos cómo se
calcula la probabilidad de ocurrencia al azar de los sucesos elementales de un
determinado espacio muestral.
Retomemos el caso de la tirada de dos dados y la obtención de una suma
de 7. Echa una ojeada sobre el proceso seguido, si no te acuerdas. Puedes se-
guir el mismo procedimiento para averiguar la probabilidad de cualquier su-
ma en el caso de dos dados. Pero quizá te convenga averiguar primero el
conjunto de sucesos elementales del espacio muestral que podríamos llamar
«suma de dos dados». Debes tener en cuenta que si los números de cada dado
varían entre 1 y 6, entonces la suma más pequeña debe ser 1 + 1 = 2 y la su-
ma más grande 6 + 6 = 12. Eso quiere decir que una suma igual a 1 ó 13 tie-
ne una probabilidad de ocurrir por azar igual a 0, por ser sucesos imposibles.
El siguiente paso consistirá en calcular, por enumeración, la probabilidad de
cada una de las sumas desde 2 hasta 12, sin olvidar que en cada experimento
se trata de sucesos independientes y mutuamente excluyentes.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 156

156 Introducción a la estadística

TABLA 7.1
UNA DISTRIBUCIÓN DE PROBABILIDADES

Suma de Tipos de sucesos Número de sucesos


Probabilidad
dos dados elementales elementales

1 {} 0 0,000
2 {1,1} 1 0,028
3 {1,2}{2,1} 2 0,056
4 {1,3}{3,1}{2,2} 3 0,083
5 {1,4}{4,1}{2,3}{3,2} 4 0,111
6 {1,5}{5,1}{2,4}{4,2}{3,3} 5 0,139
7 {1,6}{6,1}{2,5}{5,2}{3,4}{4,3} 6 0,167
8 {2,6}{6,2}{3,5}{5,3}{4,4} 5 0,139
9 {3,6}{6,3}{4,5}{5,4} 4 0,111
10 {4,6}{6,4}{5,5} 3 0,083
11 {5,6}{6,5} 2 0,056
12 {6,6} 1 0,028
13 {} 0 0,000

Aunque te pueda parecer extraño, ya sabes construir una distribución de


probabilidad. En realidad, una distribución de probabilidad es tan sólo una
lista de todos los posibles resultados de un experimento aleatorio con sus co-
rrespondientes frecuencias relativas o probabilidad. La suma de las probabili-
dades de todos los posibles resultados debe ser 1.
En el caso de una variable aleatoria discreta, esta distribución recibe el
nombre de distribución de probabilidad para variables discretas. Pero para
que se pueda aplicar este concepto a una distribución el espacio muestral de-
be cumplir los siguientes requisitos:
— El espacio muestral contiene un conjunto de N experimentos.
— En cada experimento los resultados posibles son mutuamente exclu-
yentes; si los resultados son sólo dos, por ejemplo a favor y en contra
o cara y cruz, estamos ante un experimento binomial1.

1
Los experimentos binomiales se conocen también como proceso de recuento de sucesos a
favor o proceso de Bernouilli.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:03 Página 157

¿Qué es una distribución de probabilidades? 157

— Los resultados de cada experimento son independientes entre sí.


— La probabilidad de cada resultado posible en cualquier experimento es
la misma de un experimento a otro.

DISTRIBUCIÓN BINOMIAL 7.1.

En el caso de que los posibles resultados sean dos, como cuando se lanza
una moneda, se suele utilizar la letra P para representar la probabilidad a fa-
vor de un determinado resultado, por ejemplo cara, y la letra Q para la probabi-
lidad en contra. Si se trata de monedas, P = 0,50 y Q = 1- P = 1 – 0,50 = 0,50. Si
se tratase de un examen, cabe la posibilidad de que la probabilidad a favor
de su superación pueda ser P = 0,25, si el tema es extremadamente complica-
do. En estas condiciones, Q = 0,75. En cambio, si el tema fuera sencillo P po-
dría ser 0,80, siendo Q = 0,20.
Con estas indicaciones, ¿serías capaz de construir la correspondiente distri-
bución de probabilidad, si lo que se busca es obtener caras al lanzar dos mo-
nedas?

TABLA 7.2
DISTRIBUCIÓN DE PROBABILIDADES BINOMIALES, DOS CARAS

Número
Posibles resultados Moneda 1ª Moneda 2ª Probabilidad
de resultados

1º Dos caras Cara Cara 1 0,250

2º Una cara Cara Cruz


2 0,500
3º Una cara Cruz Cara

4º Cero caras Cruz Cruz 1 0,250

Bien; ya eres capaz de construir una distribución de probabilidades bi-


nomiales. Y como acabas de comprobar, la distribución de probabilidades
binomiales permite determinar la probabilidad a favor de varios sucesos de
un determinado espacio muestral. Eso significa que la variable aleatoria es el
número de sucesos a favor que se obtienen.
¿Y si fueran tres monedas?
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 158

158 Introducción a la estadística

TABLA 7.3
DISTRIBUCIÓN DE PROBABILIDADES BINOMIALES, TRES CARAS

Posibles Moneda Moneda Moneda Número de


Probabilidad
resultados 1ª 2ª 3ª resultados

1º Tres caras Cara Cara Cara 1 0,125

2º Dos caras Cara Cara Cruz

3º Dos caras Cara Cruz Cara 3 0,375

4º Dos caras Cruz Cara Cara

5º Una cara Cruz Cruz Cara

6º Una cara Cruz Cara Cruz 3 0,375

7º Una cara Cara Cruz Cruz

8º Cero caras Cruz Cruz Cruz 1 0,125

Podríamos seguir aumentando el número de monedas y además variar el


valor de P y Q. En este caso, sólo lo hemos hecho para P = 0,50 y Q = 0,50.
Supongo que no tienes demasiado interés en repetir los cálculos que otros ya
hicieron hace tiempo (o que algún programa informático te puede proporcio-
nar). Si éste es tu caso, te bastará con ir a cualquier libro de estadística para
investigadores socioeducativos y allí encontrarás estos datos en la tabla de la
distribución binomial. Tiene en general la siguiente forma:
TABLA 7.4
EXTRACTO DE LA TABLA DE DISTRIBUCIÓN BINOMIAL
PoQ
N 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
0 0,9900 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000
1
1 0,0100 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000

0 0,9800 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500
2 1 0,0200 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000
2 0,0000 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500
¿Qué es una distribución de probabilidades?

0 0,9700 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 159

1 0,0290 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750
3
2 0,0000 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750
3 0,0000 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250

0 0,9610 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625
1 0,0390 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500
4 2 0,0010 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750
3 0,0000 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500
4 0,0000 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625
159
0 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0312
1 0,0480 0,2036 0,3280 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1562 160
2 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125
5
3 0,0000 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125
4 0,0000 0,0000 0,0004 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1562
5 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0312

0 0,9410 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156
1 0,0570 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938
2 0,0010 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344
6 3 0,0000 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125
4 0,0000 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344
5 0,0000 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0205 0,0369 0,0609 0,0938
6 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 160

0 0,9320 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078
1 0,0660 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547
2 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641
3 0,0000 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734
7
4 0,0000 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734
5 0,0000 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641
6 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547
7 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078

0 0,9230 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039
8 1 0,0750 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0312
… … … … … …. … … … … …
Introducción a la estadística
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 161

¿Qué es una distribución de probabilidades? 161

INTERPRETACIÓN DE LA TABLA
DE DISTRIBUCIÓN BINOMIAL 7.2.

En la tabla 7.3 pusiste los resultados de la distribución de probabilidades bi-


nomiales para el caso de tres monedas o, si lo prefieres, de tres preguntas del
tipo verdadero/falso. Si miras en la tabla 7.4, verás los mismos resultados
cuando N = 3, siendo P = 0,50 y Q = 0,50. Fíjate en que en la parte superior
de la tabla 7.4 se indican los distintos valores de P o Q ligados a la ocurrencia
por azar de un determinado suceso elemental. En la columna izquierda, N re-
presenta el número de sucesos elementales de un determinado espacio mues-
tral y la columna contigua detalla el número de sucesos elementales. En las
demás columnas se proporcionan las probabilidades de ocurrencia al azar de
cada uno de esos sucesos elementales en función de los valores de P y Q.
Así, suponiendo que N = 6 preguntas del tipo verdadero/falso, la probabilidad
de contestar correctamente al azar a tres, siendo P = 0,25, es de 0,1318. Eso
quiere decir que si hicieras un examen de seis preguntas de estas característi-
cas 100 veces y recurrieras en cada intento al «pinto, pinto, gorgorito» para res-
ponder, entonces tendrías tres respuestas correctas en sólo 13 ocasiones.
Por cierto, si quieres comprobar si este resultado es correcto y en el caso de
que te acuerdes de las combinaciones, te bastaría aplicar la siguiente fórmula...

... donde:
n = número de intentos o experimentos.
r = número de éxitos obtenidos.
p = probabilidad a favor.
q = probabilidad en contra.
Y si no te lo crees, mira:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 162

162 Introducción a la estadística

Si N se incrementa hasta 20, manteniendo P igual, resulta que la probabili-


dad de acertar la mitad de las preguntas es de 0,0099. En otras palabras, nece-
sitarías repetir la prueba 1.000 veces para poder sacar la mitad de respuestas
en sólo 10 ocasiones. Te animo a que intentes calcular la probabilidad de
acertar la mitad de 40 preguntas, siendo P = 0,25. Yo en tu lugar, y basándo-
me sólo en el cálculo de probabilidades, me olvidaría del clásico «pinto, pinto,
gorgorito» en los exámenes teóricos de esta materia, sobre todo si se trata de
pruebas de elección múltiple.
Aquí tienes la respuesta a la pregunta que acabo de plantearte:

Por cierto, ¿te diste cuenta de que la tabla de distribución de probabilida-


des binomiales está compuesta por muchas subtablas de frecuencias relativas.
Toma por ejemplo la subtabla de N = 7, para P = 0,50; verás que está com-
puesta por los datos de la tabla siguiente.

TABLA 7.5
TABLA DE FRECUENCIAS – DISTRIBUCIÓN BINOMIAL

Número de caras, Xi Frecuencias relativas, fi

0 0,0078

1 0,0547

2 0,1641

3 0,2734

4 0,2734

5 0,1641

6 0,0547

7 0,0078
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 163

¿Qué es una distribución de probabilidades? 163

Ya que se trata de una tabla de frecuencias, se puede calcular su media,


así como su desviación típica. Espero que no hayas olvidado cómo se hace.

Xi fi xifi xi2 x2ifi

0 0,0078 0,0000 0 0,0000


1 0,0547 0,0547 1 0,0547
2 0,1641 0,3282 4 0,6564
3 0,2734 0,8202 9 2,4606
4 0,2734 1,0936 16 4,3744
5 0,1641 0,8205 25 4,1025
6 0,0547 0,3282 36 1,9692
7 0,0078 0,0546 49 0,3822
Total 1,0000 3,5000 14,000

µ = 3,5 : 1 = 3,5

Tus cálculos se pueden simplificar de la siguiente manera:


1) μ = NP
Donde N = el número de intentos y P = la probabilidad a favor.
Si N = 7 y P = 0,50, entonces NP = 7 × 0,50 = 3,5

2) σ = NPQ
Donde Q = la probabilidad en contra.

Antes de seguir, me gustaría plantearte la siguiente pregunta: ¿por casuali-


dad te has fijado en cómo se distribuyen las probabilidades en las tablas 7.1 a
7.4 que venimos comentando? ¿Qué te recuerdan?
Para empezar, en todas las tablas las frecuencias de los extremos son infe-
riores a las frecuencias centrales; en otras palabras, la probabilidad de los su-
cesos extremos es menor que la de los sucesos del medio. Por otra parte, a
medida que N crece se observa este fenómeno con cada vez más claridad, es-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 164

164 Introducción a la estadística

pecialmente cuando P = 0,50. Y esto debería recordarte lo que dijimos en el


capítulo anterior al comentar la curva normal. Y si no te lo crees, fíjate en los
cuatro gráficos siguientes:

GRÁFICO 7.1
PROBABILIDAD DE 3 CARAS

0,35

0,30

0,25

0,20

0,15

0,0 0,5 1,0 1,5 2,0 2,5 3,0

GRÁFICO 7.2
PROBABILIDAD DE 6 CARAS

0,30

0,25

0,20

0,15

0,10

0,05

0 1 2 3 4 5 6
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 165

¿Qué es una distribución de probabilidades? 165

GRÁFICO 7.3
PROBABILIDAD DE 12 CARAS

0,20

0,15

0,10

0,05

0,00

0 2 4 6 8 10 12

A medida que se incrementa N el parecido con la distribución normal se


hace cada vez más patente. La similitud es tan patente que con N = 30, por
ejemplo, obtenemos la siguiente distribución:

GRÁFICO 7.4
PROBABILIDAD DE 30 CARAS

0,15

0,10

0,05

0,00

0 5 10 15 20 25 30
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 166

166 Introducción a la estadística

7.3. DISTRIBUCIÓN DE POISSON


En ocasiones no interesa tanto el recuento de los sucesos a favor en un deter-
minado experimento como el recuento del número de eventos a lo largo de un
período concreto de tiempo, área, distancia o cualquier otro tipo de medida.
No se trata pues de constatar resultados que se limitan a dos, o sea a favor o
en contra, cara o cruz, aprobar o suspender, sino que pueden ocurrir diferen-
tes resultados respecto de la unidad de medida. Por ejemplo, el número de
alumnos que entran en el aula donde se imparte esta materia una vez comen-
zada la clase podría ser 0, 1, 2, 3…
Se entiende que la variable aleatoria para la distribución de Poisson es el
número de eventos que ocurren en las condiciones definidas por el investiga-
dor. La media de esta variable aleatoria es el número de eventos esperados
por término medio. Para que se pueda considerar que se trata de una distri-
bución de Poisson, se deben cumplir dos condiciones: a) la media ha de ser
constante para cada intervalo de medición (eso quiere decir que para el caso
del aula el número de alumnos que por término medio llega después de que
el profesor ha empezado la clase debe ser constante, por ejemplo 6; b) Por
otra parte, el número de eventos que se producen durante un determinado
período de tiempo es independiente del número de eventos en otros interva-
los. En otras palabras, si el profesor imparte esta materia dos veces por sema-
na y cuatro alumnos llegan tarde el primer día de la semana, esta situación no
debe influir sobre el número de tardones del segundo día.
Algunos ejemplos de variables aleatorias cuya distribución se ajusta bas-
tante bien a la distribución de Poisson podrían ser:
• El número de accidentes de tráfico del fin de semana.
• El número de alumnos que consiguen terminar la ESO.
• El número de alumnos que consiguen dominar esta materia.
• La tasa de mortalidad/natalidad en una determinada área geográfica.
• El número de aviones que aterrizan o despegan de un determinado ae-
ropuerto en verano.
• El número de accidentes en un determinado punto negro de la carrete-
ra x.
Si comprobamos que una variable aleatoria cumple las condiciones antes
mencionadas, entonces podemos calcular la probabilidad de que ocurra un
cierto número de eventos en un determinado período de tiempo. Para ello,
podemos aplicar la siguiente fórmula:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 167

¿Qué es una distribución de probabilidades? 167

Donde:
x = el número de eventos ocurridos a lo largo de un determinado período.
μ = la media de eventos ocurridos en determinadas circunstancias2.
e = constante 2,71828.
P[x] = la probabilidad de ocurrencia de x eventos.

Si la media de alumnos que llegan tarde es de seis, podemos calcular la


probabilidad de que un día cualquiera de la semana sean ocho los alumnos
que interrumpen al profesor en su quehacer docente.

Resulta pues que este profesor debe tener una alta capacidad de tolerancia
a la interrupción, ya que en prácticamente una de cada diez clases le puede
tocar soportar que casi una decena de alumnos entre en medio de sus expli-
caciones.
¿Qué te parece si calculamos la probabilidad de que de uno a cuatro
alumnos le interrumpan? Vamos allá. Bueno, antes he de aclararte que te toca
calcular la probabilidad acumulada, es decir, desde uno hasta cuatro. Se for-
mula de la siguiente manera:

P[1≥x≤4] = P [x = 1] + P [x = 2] + P [x = 3] + P [x = 4]

P[x≤4] = 0,0149 + 0,0446 + 0,0892 + 0,1339 = 0,2826

Este profesor ha de armarse de paciencia porque en al menos una de cada


cuatro clases va a ser interrumpido por la entrada de uno a cuatro alumnos.
Me temo que este profesor o cierra el aula tan pronto entra a su clase o la in-
terrupción es prácticamente inevitable.

2
Por cierto, en algunos libros se utiliza el símbolo λ («lambda») en vez de μ.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 168

168 Introducción a la estadística

¿Tendrá este profesor la suerte de que alguna vez no le interrumpa ningún


alumno?

La probabilidad de que no entre ningún alumno una vez comenzada la


clase es de prácticamente 0: este profesor ha de hacerse a la idea de que lo
más probable es que sea interrumpido.
Una aclaración más y casi terminamos: la varianza de esta distribución y la
media coinciden, o sea, σ2 = μ.

INTERPRETACIÓN DE LA TABLA
7.4 DE DISTRIBUCIÓN DE POISSON

Vamos a hacer sólo un extracto que nos va a servir para saber cómo interpre-
tar los valores que puedes ver en multitud de libros de investigación socioe-
ducativa. Aquí sólo se recoge la parte que refleja los datos que analizamos en
los párrafos anteriores.
La tabla de probabilidades está organizada en columnas en cuyo encabe-
zamiento figura el valor de μ, como 5,0 por ejemplo. Debajo de cada enca-
bezamiento se pone la probabilidad que le corresponde a cada evento x ex-
plicitada en la primera columna izquierda de la tabla; en dicha tabla, los
valores de x van de 0 a 18, pero puede ser que en otras tablas el máximo
sea menor. Para identificar la probabilidad que se desea, basta leer vertical-
mente el valor de μ que es objeto de estudio y horizontalmente el número
de sucesos cuya probabilidad se quiere averiguar; el cruce entre la columna
y la fila señala la probabilidad que se busca. Por ejemplo, cuando el núme-
ro de eventos x es igual a 10, siendo μ igual a 5,0, su probabilidad de ocu-
rrencia por azar es de 0,0181. Eso quiere decir que si μ = 5,0, entonces es
muy difícil que el evento 10 pueda tener lugar; a lo sumo, ocurrirá en apro-
ximadamente 2 de 100 ocasiones. Si aplicas esta idea al caso de aquellos
alumnos que llegan tarde a clase, puedes afirmar que si la media es de cin-
co alumnos, a lo sumo en dos ocasiones de 100 puede ocurrir que 10 alum-
nos lleguen tarde.
Toma nota y/o comprueba: la suma de las probabilidades de cada colum-
na μ es igual a 1.
Recuerda que esta tabla es un extracto; deberías consultar una tabla más
amplia y que refleje mejor tus datos. También puedes calcular la probabilidad
TABLA 7.6
EXTRACTO DE LA TABLA DE POISSON
Valores de µ entre 5,0 y 7,0
x 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0
0 0,0067 0,0055 0,0045 0,0037 0,0030 0,0025 0,0020 0,0017 0,0014 0,0011 0,0009
1 0,0337 0,0287 0,0244 0,0207 0,0176 0,0149 0,0126 0,0106 0,0090 0,0076 0,0064
2 0,0842 0,0746 0,0659 0,0580 0,0509 0,0446 0,0390 0,0340 0,0296 0,0258 0,0223
3 0,1404 0,1293 0,1185 0,1082 0,0985 0,0892 0,0806 0,0726 0,0652 0,0584 0,0521
4 0,1755 0,1681 0,1600 0,1515 0,1428 0,1339 0,1249 0,1162 0,1076 0,0992 0,0912
5 0,1755 0,1748 0,1728 0,1697 0,1656 0,1606 0,1549 0,1487 0,1420 0,1349 0,1277
¿Qué es una distribución de probabilidades?

6 0,1462 0,1515 0,1555 0,1584 0,1601 0,1606 0,1601 0,1586 0,1562 0,1529 0,1490
7 0,1044 0,1125 0,1200 0,1267 0,1326 0,1377 0,1418 0,1450 0,1472 0,1486 0,1490
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 169

8 0,0653 0,0731 0,0810 0,0887 0,0962 0,1033 0,1099 0,1160 0,1215 0,1263 0,1304
9 0,0363 0,0423 0,0486 0,0552 0,0620 0,0688 0,0757 0,0825 0,0891 0,0954 0,1014
10 0,0181 0,0220 0,0262 0,0309 0,0359 0,0413 0,0469 0:0528 0,0588 0,0649 0,0710
11 0,0082 0,0104 0,0129 0,0157 0,0190 0,0225 0,0265 0,0307 0,0353 0,0401 0,0452
12 0,0034 0,0045 0,0058 0,0073 0,0092 0,0113 0,0137 0,0164 0,0194 0,0227 0,0263
13 0,0013 0,0018 0,0024 0,0032 0,0041 0,0052 0,0065 0,0081 0,0099 0,0119 0,0142
14 0,0005 0,0007 0,0009 0,0013 0,0017 0,0022 0,0029 0,0037 0,0046 0,0058 0,0071
15 0,0002 0,0002 0,0003 0,0005 0,0007 0,0009 0,0012 0,0016 0,0020 0,0026 0,0033
16 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0005 0,0006 0,0008 0,0011 0,0014
17 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0004 0,0006
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002
169
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 170

170 Introducción a la estadística

tú mismo, ya que conoces la fórmula adecuada para ello, o bien utilizar un


programa informático.
Intentemos representar gráficamente las probabilidades de ocurrencia de
distintos valores de x.

GRÁFICO 7.5
DISTRIBUCIÓN DE p, SIENDO μ = 6,0

0,15

0,10

0,05

0,00

0 5 10 15

GRÁFICO 7.6
DISTRIBUCIÓN DE p, SIENDO μ = 7,0

0,15

0,10

0,05

0,00

0 5 10 15
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 171

¿Qué es una distribución de probabilidades? 171

Los valores que tienen más probabilidad de ocurrir por azar son lógica-
mente los que se encuentran muy próximos a μ: 5 y 6 en el primer caso, 6 y
7 en el segundo.
Si comparas la forma de estas dos distribuciones con la de la distribución
binomial, te darás cuenta de que éstas se caracterizan por ser asimétricas po-
sitivas: hay más valores a la izquierda de μ que a su derecha. Por otra parte,
los valores muy altos de x tienen una probabilidad cercana a 0 de ocurrir por
azar y no tienen límite superior, o sea, se extienden hasta el infinito.
La distribución de probabilidad para μ = 30 tiene la siguiente forma:

GRÁFICO 7.7
DISTRIBUCIÓN DE p, SIENDO μ = 30

0,06

0,04

0,02

0,00

15 20 25 30 35 40 45 50

DISTRIBUCIÓN NORMAL 7.5.

El viaje por el territorio de la distribución de probabilidades está a punto de


culminar. Acabamos de hablar de la distribución de probabilidades para varia-
bles discretas. Creo que estás preparado para ampliar tus horizontes, es decir,
incluir las variables aleatorias continuas y sus correspondientes distribuciones
de probabilidad. Seguramente aún te acordarás de cómo definimos la variable
continua: te recuerdo que es aquélla que puede tener un número infinito de
valores dentro de un intervalo dado. Piensa en los valores que pueden adop-
tar las variables tiempo, longitud, peso, rendimiento, etc.
Si vuelves al principio del capítulo 5, te darás cuenta de que en realidad
ya hemos hablado de la distribución normal. Lo que ocurre es que en aquel
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 172

172 Introducción a la estadística

momento preferimos hablar de porcentajes y proporciones en vez de proba-


bilidades. Es decir, partiendo de un caso particular, de una muestra, asumi-
mos que los datos recogidos mediante los correspondientes experimentos se
distribuían normalmente y procedimos a calcular la frecuencia relativa con la
que se podría obtener determinados tipos de resultados. Si recuerdas la defi-
nición que dimos al concepto de probabilidad, verás que no se distingue de
frecuencia relativa, proporción o porcentaje.
Ahora bien, hay un cambio cualitativo que no conviene pasar por alto. Al
calcular las probabilidades de las variables aleatorias discretas, lo hicimos a
partir del espacio muestral Ω, es decir, a partir de la población de experimen-
tos o sucesos elementales. La dificultad en relación con las variables aleatorias
continuas consiste en que la población de experimentos es contable pero infi-
nita. Piensa en todas las posibles notas de rendimiento académico que una
población escolar puede obtener entre, por ejemplo, 0 y 100 puntos, si ade-
más se admiten calificaciones con tres decimales o más. Con una población
de estas características es imposible calcular todas las posibilidades, por ser
infinitas. Por otra parte, no existe un único modelo de distribución normal si-
no una familia de modelos, ya que cada μ y su correspondiente σ implican
un modelo diferente; sin embargo, todos esos modelos tienen la ventaja de
compartir una serie de cualidades comunes. Son estas las cualidades que nos
conviene destacar porque son muy útiles a la hora de estudiar muchos fenó-
menos del entorno socioeducativo. Con el riesgo de que me consideres de-
masiado repetitivo, te los recuerdo seguidamente:
• En la curva normal se representan los eventos que son independientes
y mutuamente excluyentes.
• La curva normal tiene una forma de campana.
• La suma de las probabilidades (área total) comprendidas bajo la curva
normal es de 1.
• Los límites de la curva normal son –∞ y +∞.
• La curva normal es simétrica, siendo la media, el eje de simetría.
• La media, la mediana y la moda coinciden.
• La curva normal tiene de media μ = 0 y desviación típica σ = 1.
• El valor de la curtosis de la curva normal es de 0,263.
• La curva normal es asintótica respecto del eje horizontal.
• La probabilidad comprendida entre dos valores cualesquiera de la distri-
bución normal es independiente del valor de μ y σ de una población
concreta.
Veamos un ejemplo. Un investigador fue encargado por el Ministerio de
Educación y Ciencia para evaluar la capacidad de razonamiento general de to-
dos los alumnos aspirantes a entrar en cualquiera de las más de cincuenta
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 173

¿Qué es una distribución de probabilidades? 173

universidades españolas. Dispuso del presupuesto suficiente para diseñar un


instrumento adecuado y de una suerte bárbara para acceder a toda la pobla-
ción. Aplicó su prueba y obtuvo como media 55 y desviación típica 3. Si de
esta población elige al azar a un alumno que está en una cola para matricu-
larse, ¿cuál es la probabilidad de que la puntuación en razonamiento general
del susodicho aspirante sea igual o superior a 61 puntos?
Antes de intentar contestar, debes darte cuenta de que los datos que este in-
vestigador está manejando no pertenecen a una muestra. Por tanto, no puedes

utilizar los símbolos muestrales X y sX. Como se trata de datos poblacionales,
debes recurrir a μ y σ. Una vez aclarado este punto, puedes aplicar la regla de
la puntuación típica para resolver este problema. Supongo que recordarás

que para las muestras. Para la población debe ser En

consecuencia, para el problema que nos ocupa


Una vez obtenido el valor de z, como de costumbre vamos a la tabla de
distribución normal y leemos 0,9772. Como nos piden la probabilidad de que
el sujeto elegido al azar tenga una puntuación por encima de 61, en realidad
nos preguntan por el complemento de 0,9772. Por ello, nuestra respuesta de-
be ser: 1 – 0,9772 = 0,0228.
Por tanto, p(X ≥ 61) = 0,0228.
Gráficamente este problema se representa del siguiente modo:

GRÁFICO 7.8
PROBABILIDAD DE X ≥ 61

55 61
–3 –2 –1 0 1 2 3
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 174

174 Introducción a la estadística

Si te enteraste muy bien de lo explicado en el capítulo 5, esto te habrá re-


sultado muy familiar. A estas alturas debes estar preparado para calcular la
probabilidad bajo ciertas condiciones.
1. Hallar la probabilidad de que los sujetos seleccionados al azar se en-
cuentren en torno a la media.
Halla la probabilidad de que un sujeto elegido al azar tenga una pun-
tuación típica que se encuentre entre zi = –1,51 y zi = +1,51.
Probabilidad desde la media: 0,9345 – 0,50 = 0,4345.
Como la probabilidad es la misma entre la media y zi = –1,51, y la me-
dia y zi = +1,51, la probabilidad de que el sujeto seleccionado tenga
una puntuación que se encuentre entre zi = –1,51 y zi = +1,51 equivale
a 0,4345 × 2 = 0,8690.
2. Hallar la probabilidad de que los sujetos elegidos se encuentren por
encima de una determinada puntuación típica.
a) Halla la probabilidad de que un sujeto seleccionado al azar tenga
una puntuación típica mayor o igual a +2,02.
Si vas a la tabla 5.1, para zi = 2,02, obtendrás una probabilidad de
0,9783. Recuerda que estás consultando la tabla a partir de una zi
positiva. Por tanto, se trata de hallar el complemento de lo que te
proporciona la tabla. Sabiendo que el total es 1, la probabilidad
de que este sujeto tenga una puntuación mayor o igual a 2,02 es de
1 – 0,9783 = 0,0217.
b) Halla la probabilidad de que un sujeto elegido al azar tenga una
puntuación típica igual o mayor que –1,17.
La tabla 5.1 proporciona como valor p = 0,8790. Esta probabilidad
incluye tanto la mitad positiva de la distribución como la parte ne-
gativa desde z = 0 hasta z = –1,17. Por tanto, ésta es la probabilidad
que buscamos.
3. Hallar la probabilidad de que los sujetos elegidos al azar se encuentren
por debajo de una determinada puntuación típica.
a) Halla la probabilidad de que un sujeto seleccionado al azar tenga
una puntuación típica inferior o igual a +2,43.
Si miras en la tabla 5.1 obtienes como información una probabilidad
de 0,9925. Esta probabilidad incluye tanto la mitad negativa de la
distribución como la parte positiva desde la media hasta +2,43. Por
tanto, ésta es la probabilidad que buscas.
b) Halla la probabilidad de que un sujeto seleccionado al azar tenga
una puntuación típica inferior o igual a –0,34.
De acuerdo con la tabla 5.1, para zi = –0,34, la probabilidad que co-
rresponde es de 0,6331. Como ya sabes, la pregunta pide que averi-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 175

¿Qué es una distribución de probabilidades? 175

gües el complemento. Por tanto, 1 – 0,6331 = 0,3669 es la probabili-


dad de que un sujeto seleccionado al azar tenga una puntuación tí-
pica inferior o igual a –0,34.
4. Hallar la probabilidad de que los sujetos elegidos se encuentren entre
dos puntuaciones típicas dadas.
a) Halla la probabilidad de que un sujeto elegido al azar tenga una
puntuación típica entre –1,92 y +1,01.
Buscamos la probabilidad que corresponde a cada puntuación típi-
ca: son respectivamente 0,9726 y 0,8438. Las dos puntuaciones típicas
tienen signos opuestos, es decir, se encuentran a ambos lados de la
media. Por tanto hay que hallar la probabilidad que corresponde
desde la media:
Para zi = –1,92, la probabilidad desde la media es: 0,9726 – 0,50 =
0,4726.
Para zi = +1,01, la probabilidad desde la media es: 0,8438 – 0,50 =
0,3438.
Por tanto, la probabilidad de que un sujeto elegido al azar tenga
una puntuación típica entre –1,92 y +1,01 es de 0,4726 + 0,3438 =
0,8164.
b) Halla la probabilidad de que un sujeto elegido al azar tenga una
puntuación típica entre –0,15 y –0,93.
Al igual que en el caso anterior, buscamos la probabilidad que co-
rresponde a cada puntuación típica: son respectivamente 0,5596 y
0,8238. Se trata de puntuaciones que tienen el mismo signo; por
consiguiente, se encuentran en el mismo lado de la media. Eso sig-
nifica que hay una parte de probabilidad que estamos contando dos
veces. Si de la probabilidad mayor restamos la menor, obtendremos
el resultado que nos piden, es decir, 0,8238 – 0,5596 = 0,2642.
Procederíamos del mismo modo si las puntuaciones típicas fueran
ambas positivas. Véase el apartado c) que sigue.
c) Halla la probabilidad de que un sujeto elegido al azar tenga una
puntuación típica entre +2,36 y +3,05.
La probabilidad que corresponde a cada puntuación típica es res-
pectivamente 0,9909 y 0,9989. Por tanto, la probabilidad de que un
sujeto elegido al azar tenga una puntuación típica entre +2,36 y
+3,05 es de 0,9989 – 0,9909 = 0,0080.
Ya sabes cómo hallar la probabilidad de seleccionar al azar a sujetos bajo
determinadas condiciones, conociendo la puntuación típica. Puedes llevar a
cabo la operación contraria, es decir, averiguar la puntuación típica y la pun-
tuación directa conociendo la probabilidad que corresponda. Veamos algunos
ejemplos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 176

176 Introducción a la estadística

1. Hallar los límites (puntuaciones típicas) en torno a la media entre los


que se encuentra un sujeto seleccionado al azar, conociendo la proba-
bilidad de ocurrencia.
La probabilidad de seleccionar a un sujeto en torno a la media es de 0,30.
Averiguar las puntuaciones típicas que podría tener como máximo.
Recuerda que la media es el eje de simetría de la distribución normal.
Por tanto, 0,30 está dividido en dos partes iguales, 0,15 en la parte po-
sitiva y 0,15 en la parte negativa. Al ir a la tabla 5.1 tenemos que bus-
car un valor igual o próximo a 0,50 + 0,15 = 0,65; el más próximo es
0,6517, al que corresponde una puntuación típica de 0,39. Esto significa
que si la probabilidad de elegir al azar a un sujeto es de 0,30, entonces
su puntuación típica se encuentra entre el límite inferior zi = –0,39 y el
límite superior zi = +0,39.
Conociendo la media μ y la desviación típica σ de la distribución, pue-
des averiguar fácilmente el valor de la puntuación directa.
2. Hallar el límite (puntuación típica) por debajo del cual se encuentra un
sujeto seleccionado al azar, conociendo la probabilidad de ocurrencia.
a) Se sabe que la probabilidad de que un sujeto seleccionado al azar
tenga una determinada puntuación típica es de 0,75. Se pide averi-
guar su puntuación típica.
Buscamos en la tabla 5.1 una probabilidad igual o muy próxima a
0,75; obtenemos 0,7486. La zi correspondiente es 0,67. Como se tra-
ta de una probabilidad mayor que 0,50, la puntuación típica corres-
pondiente tiene que ser positiva. En consecuencia zi = + 0,67.
b) Se sabe que la probabilidad de que un sujeto seleccionado al azar
tenga una determinada puntuación típica es de 0,10. Se pide averi-
guar su puntuación típica.
Volvamos a la tabla 5.1 y busquemos el complemento de 0,10, o
sea, el valor más próximo o igual a 0,90. Obtenemos 0,8997. La ta-
bla proporciona una puntuación típica de 1,28. Como se trata de
una probabilidad menor que 0,50, la puntuación típica correspon-
diente tiene que ser negativa, o sea, zi = –1,28.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 177

¿Qué es una distribución de probabilidades? 177

TU TURNO 7.6.

Los alumnos realizan el examen teórico del primer parcial y obtienen una me-
dia de 4,977 y una desviación típica de 1,618. Suponiendo que estos datos
son poblacionales y que se distribuyen normalmente, halla:
1. La probabilidad de que un sujeto elegido al azar tenga una puntuación
típica que se encuentre entre zi = –1,04 y zi = +1,04.
2. La probabilidad de que un sujeto elegido al azar tenga una puntuación
típica que se encuentre por encima de +2,71
3. La probabilidad de que un sujeto elegido al azar tenga una puntuación
típica que se encuentre por encima de –0,62
4. La probabilidad de que un sujeto elegido al azar tenga una puntuación
típica que se encuentre por debajo de +0,83.
5. La probabilidad de que un sujeto elegido al azar tenga una puntuación
típica que se encuentre por debajo de –2,97.
6. La probabilidad de que la puntuación típica del sujeto elegido al azar se
encuentre entre zi = –1,32 y zi = +0,47.
7. La probabilidad de que la puntuación típica del sujeto elegido al azar se
encuentre entre zi = –1,29 y zi = –1,59.
8. La puntuación típica límite, sabiendo que la probabilidad de que el suje-
to seleccionado al azar supere a un cierto grupo de compañeros es de
0,85.
9. La puntuación típica límite, sabiendo que la probabilidad de que el suje-
to seleccionado al azar supere a un cierto grupo de compañeros es de
0,15.
10. Calcula la probabilidad de acertar por azar la mitad de una prueba de 10
ítems, sabiendo que p = 0,20.
11. Calcula la probabilidad de acertar por azar entre 7 y 9 ítems de una
prueba de 15 ítems, sabiendo que p = 0,25.
12. El profesor sabe que la media de aciertos del examen teórico del primer
parcial suele estar en torno a 21 de un total de 40 ítems. Si para este cur-
so el profesor no hizo nada especial para mejorar la situación, ¿cuál es la
probabilidad de que la media de aciertos sea de 25?
13. ¿Cuál es la probabilidad de que el número de aciertos del examen ante-
rior esté entre 18 y 20?
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 178
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 179

Capítulo 8
¿QUÉ ES UNA DISTRIBUCIÓN MUESTRAL?

Al finalizar este capítulo deberías:


• Conocer las características de las distribuciones muestrales.
• Conocer las características de las distribuciones muestrales de la
media.
• Conocer el teorema del límite central.
• Ser capaz de calcular el error típico de la media.
• Ser capaz de utilizar el error típico de la media.
• Ser capaz de diferenciar el tamaño de una muestra y el número de
muestras.
• Conocer las características de los estimadores.
• Ser capaz de diferenciar los estadísticos de los parámetros.
• Conocer los tipos de hipótesis estadísticas.
• Ser capaz de diferenciar la hipótesis nula de la hipótesis alterna.
• Ser capaz de diferenciar la hipótesis alterna direccional de la hipó-
tesis alterna bidireccional.
• Ser capaz de formular las hipótesis estadísticas adecuadas en
función del problema que se quiera investigar.
• Ser capaz de aplicar el contraste de hipótesis.
• Conocer el Error del Tipo I y del Tipo II.
• Conocer el concepto de potencia de un experimento.

Podría parecer que estás a punto de ver algo completamente nuevo. No estés
tan seguro. Dentro de poco te darás cuenta de que estás estudiando otro caso
particular de una simple distribución de probabilidades, pero con unas pecu-
liaridades que merece la pena conocer.
¿Te acuerdas de aquel problema general que definimos al principio del ca-
pítulo 2? Pues reléelo. Después, toma una variable, por ejemplo Conocimien-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 180

180 Introducción a la estadística

tos previos. Supongamos que la muestra de los 93 sujetos es aleatoria; la me-


dia que hemos obtenido es de 4,2688. Imagínate que al año siguiente repeti-
mos el experimento: sacamos otra muestra similar a la primera, le aplicamos
la misma prueba de conocimientos previos y hallamos una media de, ponga-
mos, 4,4343. Y como nos gusta este tipo de experimentos y además tenemos
una paciencia infinita, decidimos repetir otras cinco veces. Por cierto, en lugar
de repetir el mismo proceso curso tras curso, podríamos haber sacado de la
población cinco muestras aleatorias equivalentes a la de nuestra primera in-
vestigación. De este modo obtenemos la siguiente tabla:

TABLA 8.1
DISTRIBUCIÓN DE HIPOTÉTICAS MEDIAS MUESTRALES
Muestra Media de conocimientos previos fi

1ª 4,2781 1

2ª 4,3130 1

3ª 4,0126 1

4ª 3,9925 1

5ª 4,4011 1

6ª 3,8916 1

7ª 4,5623 1

¿Se trata de una distribución? Por supuesto que sí, salvo que en esta oca-
sión las puntuaciones directas, que, como sabes, son todas medias muestrales,
aparecen casualmente una sola vez. Sin embargo, si la extracción de muestras
se repitiera un número suficientemente alto de veces, entonces seguro que la
distribución de frecuencias de medias sería diferente. Así pues, podríamos de-
finir la distribución muestral de la media como el patrón de distribución de
las medias muestrales extraídas aleatoriamente de la población.
¿De esta distribución se puede hallar la media y la correspondiente desvia-
ción típica? Claro que sí. Es una distribución semejante a cualquiera de las
que ya hemos visto.
¿Se podría calcular la probabilidad de obtener por azar una determinada
media dentro de esa distribución? Desde luego que sí. Ya conoces el razona-
miento básico al respecto.
En resumen, la distribución muestral de la media es una distribución en la
que constan todos los valores que puede asumir la media, así como la proba-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 181

¿Qué es una distribución muestral? 181

bilidad de ocurrencia por azar de cada valor. Y si generalizas la definición an-


terior, puedes decir que la distribución muestral de cualquier estadístico es la
distribución de frecuencias de los valores que ese estadístico toma en un nú-
mero infinito de muestras del mismo tipo y tamaño, así como la probabilidad
de obtener cada valor, suponiendo que éste sea producto del azar.

LA LEY DE LOS GRANDES NÚMEROS


Y EL TEOREMA DEL LÍMITE CENTRAL 8.1.

Quizá antes de entrar en detalles convenga detenernos un momento para es-


tudiar el efecto del tamaño de la muestra sobre la forma de la distribución de
la media. Para ello, vamos a recurrir a una herramienta del programa estadísti-
co SPSS que permite extraer reiteradas muestras aleatorias de un conjunto de
sujetos como los 93 alumnos que hicieron la prueba de conocimientos pre-
vios. Basta con seguir los siguientes pasos:

a) Abre el desplegable de Datos y activa «Seleccionar casos …».

b) Marca «Muestra aleatoria de casos», pulsa «Muestra» y escribe el número


exacto de casos que deseas extraer de una determinada población. En
nuestro caso la población es de 93 individuos.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 182

182 Introducción a la estadística

c) Pulsa «Continuar» y después «Aceptar». Finalmente, el programa te muestra


tanto a los sujetos no seleccionados que aparecen tachados como a los se-
leccionados.

Una vez hecha la selección aleatoria, puedes hallar la media tal como lo
vimos al final del capítulo 3.
Tendrás que repetir este proceso cada vez que quieras extraer una nueva
muestra aleatoria, aunque mantengas el mismo número. Se trata de un mues-
treo con reemplazo que, como recordarás, implica que un mismo sujeto pue-
de ser seleccionado en varias muestras. Quizá te parezca algo engorroso pero
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 183

¿Qué es una distribución muestral? 183

resulta interesante observar que cada nueva extracción aleatoria tiene una
media que es algo diferente de las que ya hayas extraído.
Hemos realizado esta operación diez veces para cada n. Los resultados es-
tán recogidos en las siguientes tablas y los correspondientes gráficos reflejan
la forma de la distribución para distintos tamaños muestrales de n, para la va-
riable «conocimientos previos». Observa muy especialmente las puntuaciones
típicas. Las muestras están ordenadas en función de los valores Zi.

TABLA 8.2
MEDIAS PARA n = 4


Muestra X sX Z
5ª 3,6250 0,77728 –1,37
8ª 3,6875 0,96555 –1,20
4ª 4,0000 0,70711 –0,33
2ª 4,0625 0,80039 –0,16
9ª 4,0625 0,42695 –0,16
6ª 4,1250 0,14434 0,02
7ª 4,1250 1,79699 0,02
10ª 4,1250 0,82916 0,02
1ª 4,5000 0,86603 1,06
3ª 4,8750 0,47871 2,10
Media general 4,1180 0,36018

TABLA 8.3
MEDIAS PARA n = 25

Muestra X sX Z
9ª 4,0900 0,73201 –1,43
4ª 4,1400 0,95764 –1,13
2ª 4,2000 1,05574 –0,77
1ª 4,2600 0,92837 –0,42
5ª 4,2600 1,02184 –0,42
6ª 4,3700 1,00291 0,24
3ª 4,4300 0,92286 0,59
8ª 4,4300 0,90289 0,59
10ª 4,5000 0,82916 1,01
7ª 4,6200 1,10661 1,72
Media general 4,3300 0,16832
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 184

184 Introducción a la estadística

TABLA 8.4
MEDIAS PARA n = 50

Muestra X sX Z
2ª 4,1350 0,88238 –1,23
5ª 4,1500 0,94626 –1,02
3ª 4,1650 0,97757 –0,82
4ª 4,2000 0,96230 –0,35
6ª 4,2150 0,78573 –0,14
8ª 4,2150 0,86751 –0,14
1ª 4,2250 0,86786 –0,01
10ª 4,2700 0,95677 0,60
9ª 4,3050 0,91514 1,08
7ª 4,3750 0,79899 2,02
Media general 4,2255 0,07384

TABLA 8.5
MEDIAS PARA n = 80

Muestra X sX Z
9ª 4,1969 0,86025 –1,86
5ª 4,2188 0,93064 –1,30
3ª 4,2500 0,91662 –0,49
6ª 4,2563 0,89033 –0,33
2ª 4,2656 0,93655 –0,09
8ª 4,2938 0,94197 0,64
10ª 4,2938 0,94699 0,64
1ª 4,3000 0,93660 0,80
4ª 4,3031 0,94776 0,88
7ª 4,3125 0,92221 1,12
Media general 4,2691 0,03873
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 185

¿Qué es una distribución muestral? 185

GRÁFICO 8.1
10 MUESTRAS DE n = 4

GRÁFICO 8.2
10 MUESTRAS DE n = 25
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 12:10 Página 186

186 Introducción a la estadística

GRÁFICO 8.3
10 MUESTRAS DE n = 50

GRÁFICO 8.4
10 MUESTRAS DE n = 80

Si incrementas el número de muestras hasta 20, podrías obtener un gráfico


parecido al siguiente:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 187

¿Qué es una distribución muestral? 187

GRÁFICO 8.5
20 MUESTRAS DE n = 80

0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Como eres un gran observador, te habrás dado cuenta de varios hechos


llamativos:
a) Las medias sacadas de las 40 muestras aleatorias no son todas equiva-
lentes. Por tanto, es lícito pensar que cada una de ellas es tan sólo una
estimación de la verdadera media poblacional. Tratándose de una esti-
mación, algunas de estas medias están por encima de la media pobla-
cional, otras por debajo y, probablemente, algunas sean iguales a la
media poblacional. Recuerda que las muestras son aleatorias. Por consi-
guiente, las diferencias observadas entre las medias y la media pobla-
cional se consideran diferencias aleatorias, es decir, debidas a la in-
fluencia del azar en el proceso de muestreo.
b) A medida que crece la magnitud de las muestras, en nuestro caso des-
de n = 4 hasta n = 80, la distribución muestral tiende a asemejarse a
una distribución normal de probabilidades. Recuerda que en su mo-
mento dijimos que no sabíamos si la distribución de la variable «cono-
cimientos previos» era normal o no. Eso no nos impide observar que la
distribución muestral de la media de esta variable sí es normal. Esto se
ve cada vez mejor cuando se incrementa el número de muestras; cuan-
to más cerca del infinito, resulta más clara la semejanza con la curva
normal. Mira lo que ocurre en el gráfico 8.5. Por tanto, toma nota: aun-
que una distribución de frecuencias no sea normal, eso no significa
que su distribución muestral de la media sea diferente a la normal. Esta
observación (además de sesudos y complejos cálculos matemáticos)
llevó a la formulación de la «ley de los grandes números» que dice lo si-
guiente: si se extraen diversas muestras del tamaño N al azar de una
población cualquiera con media μx y varianza σ2x, entonces, a medida
que N crece, la distribución muestral de las medias se aproxima a la
curva normal con media μx y varianza .
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 188

188 Introducción a la estadística

c) Como acabamos de comentar a medida que crece el tamaño de N la dis-


tribución muestral de la media se aproxima a la distribución normal. Aho-
ra bien, cabe preguntarse sobre el tamaño mínimo de N para poder decir
que la aproximación a la distribución normal es suficiente. Para empezar,
se puede entender que cuanto más alejados de la distribución normal es-
tén los datos originales, mayor debe ser el tamaño de la muestra necesa-
rio para que la forma de la distribución muestral de la media sea próxima
a la normal. Si N≥30, la forma de la distribución de los datos originales ya
no afecta de una manera sensible a la forma de la distribución muestral
de la media: una distribución similar se desvía tan poco de la normalidad
que para lo que nos interesa podemos considerarla como normal.
d) Vuelve a las tablas 8.2 hasta 8.5 y esta vez fíjate en las medias muestra-
les. ¿Te has dado cuenta de que a medida que crece el tamaño de las
muestras la distribución de las medias muestrales tiende a aproximarse
a un determinado valor? Seguro que ya sabes de qué valor se trata: μ.
Exacto. De hecho, la media de las medias muestrales cuando n es igual
a 80, o sea 4,2691, se aproxima mucho a la media de la población
4,2688. Eso quiere decir que μX– = μ.
e) No te alejes todavía de estas tablas. Ahora fíjate en los valores de las
desviaciones típicas. Pues sí; a medida que el tamaño muestral crece,
disminuye la desviación típica de las medias muestrales. Habrás visto
que cuando n es igual a 4, la amplitud de oscilación es considerable: la
desviación más pequeña es de 0,14434 y la más grande de 1,79699; sin
embargo, cuando n es igual a 80 esta amplitud es muy pequeña: va de
0,86025 a 0,94776. En realidad este valor se va acercando a 0 a medida
que crece N, porque las diferencias aleatorias por encima y por debajo
de la media van igualándose y, por tanto, anulándose mutuamente, ha-
ciendo que la estimación sea más precisa.
f) Y vamos terminando: teniendo en cuenta lo dicho en los dos apartados
anteriores y en el supuesto de que la característica estudiada se distri-
buya normalmente en la población, cabe esperar que la distribución
muestral de la media sea normal. Esta observación, corroborada por
otros no menos sesudos y complejos cálculos matemáticos, permitió
formular el «teorema central del límite», que dice lo siguiente: si de una
población normal con media μx y varianza σx2, se extraen infinitas
muestras al azar, de tamaño N, la distribución de las medias de las
muestras será normal con media μx y varianza .
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 189

¿Qué es una distribución muestral? 189

–3 –2 –1 0 1 2 3

Anteriormente dijimos que de una distribución de medias se puede calcu-


lar la media y la correspondiente desviación típica. Las tablas 8.2 hasta 8.5 así
lo atestiguan. Ahora bien, aunque los conceptos hayan quedado claros, espe-
ro, te conviene tener cuidado con el vocabulario que utilizas. Fíjate en la si-
guiente tabla de equivalencias:

Medidas de tendencia central Medidas de dispersión



Muestra Media muestral X Desviación típica sX

Población Media poblacional μ Error típico σ X–

Ya lo sabes: no te confundas. No es lo mismo hablar de la muestra que de


la población. Aunque sean medidas que son conceptualmente similares, tie-
nes que extremar las precauciones cuando tengas que operar simultáneamen-
te con medidas muestrales y poblacionales.
Por cierto, ¿ya has averiguado cómo se calcula el error típico de la media?
Se aplica la siguiente fórmula, si se conoce σ:

(Fórmula 8.1)

Donde:
σX– = error típico de la media.
σ = desviación típica poblacional.
N = tamaño de la muestra.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 190

190 Introducción a la estadística

Y si no se conoce σ, entonces habrá que estimar el error típico de la me-


dia a partir de la desviación típica de la muestra. En este caso se recurre a la
siguiente fórmula:

(Fórmula 8.2)

Donde:
sX = desviación típica de la muestra.
N = tamaño de la muestra.

Esta fórmula confirma lo observado en el apartado c), puesto que al incre-


mentarse N manteniéndose constante el valor de σ, disminuye necesariamente
el valor de σX–. Por otra parte, es lógico que el error típico esté directamente
relacionado con la desviación típica de la distribución muestral de la media,
ya que si las medias varían mucho, el error típico será elevado y si varían po-
co, ese valor se aproximará a 0.
En cuanto a la variación inversa del error típico con respecto al tamaño de
la muestra, puede entenderse que, cuando N crece, se incrementa la exactitud
con la que cada media muestral estima la media poblacional. De hecho, las
medias muestrales varían menos de una muestra a otra, es decir, decrece la
varianza σX2–. Así pues, σX2– varía de forma inversa a N. Si no te lo crees, obser-
va los gráficos 8.6 y 8.7. Supongamos que la escala en la que los sujetos han
sido medidos es la misma: va de 0 a 100. En ambos casos, sólo por casuali-
dad, los sujetos se encuentran a una distancia regular uno del otro, pero en el
primero se toman datos de cinco sujetos y en el segundo se incrementa el nú-
mero hasta 26. Se pregunta: ¿en qué caso habrá más varianza?

GRÁFICO 8.6
VARIABILIDAD DE 5 SUJETOS

0 100

GRÁFICO 8.7
VARIABILIDAD DE 26 SUJETOS

0 100
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 191

¿Qué es una distribución muestral? 191

Es evidente que los sujetos se encuentran a una mayor distancia entre sí y


con respecto a la media en el primer caso que en el segundo. Por cierto, si te
tomas la molestia de calcular las dos varianzas, obtendrás 39,52847 en el pri-
mer caso y 30,59412 en el segundo, siendo la media 50. También puedes vol-
ver a los gráficos 8.2 a 8.5 para observar el mismo fenómeno. El efecto es
idéntico si se trata de una distribución de medias.
Si N influye sobre la magnitud de la varianza, entonces parece razonable
pensar que cada tamaño de N tiene una distribución muestral de la media
que le es propia. Eso quiere decir que cuando N es igual a 5, su distribución
muestral es distinta de cuando N es igual a 26.
En el caso de la variable «conocimientos previos», el error típico de la me-
dia, en el supuesto de que conozcamos los estadísticos poblacionales, ascien-
de a:

Si sabemos que las medias muestrales se distribuyen normalmente y cono-


cemos también la media y la desviación típica de esta distribución, o sea, el
error típico, entonces estamos en condiciones de averiguar la probabilidad de
que las medias muestrales sean iguales o mayores que unos valores dados.
Por ejemplo, sabiendo que n = 93, μ = 4,2688 y σX– = 0,09519, entonces
podemos averiguar la probabilidad de obtener una media muestral igual o
mayor que 4,5 en nuestro próximo estudio.
Como hicimos en el capítulo 5, tan sólo necesitamos calcular la puntua-
ción típica que corresponde a la media 4,5. Utilizamos una ecuación idéntica
a la que vimos en el capítulo antes mencionado; simplemente debemos recor-
dar que esta vez estamos trabajando con estadísticos poblacionales. Por tanto,
la fórmula que utilizamos es la siguiente:

(Fórmula 8.3)

Donde:

X = media muestral.
μ = media poblacional.
σX– = error típico de la media.

Por tanto, .
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 192

192 Introducción a la estadística

Si utilizas la tabla 5.1 y realizas las operaciones adecuadas, podrás averi-


guar que
Ahora bien, como ya debes saber, raramente conocemos los estadísticos
poblacionales. En su lugar, trabajamos con los estadísticos muestrales que nos
sirven como estimaciones de los que corresponden a la población. En el si-
guiente apartado haremos algunos comentarios sobre la bondad de este tipo
de estadísticos cuando se utilizan como estimadores.
Imagínate que de una población, cuyas características ignoras, sacas una
muestra aleatoria de 50 sujetos y les aplicas una prueba de conocimientos
previos. Calculas la media y la desviación típica y obtienes respectivamente
4,2250 y 0,86786. Encontrarás estos datos en la tabla 8.4. Y te preguntan: si
sacas otra muestra de similares características y en iguales condiciones, ¿cuál
es la probabilidad de obtener una media igual o inferior a 4?
Como desconoces los datos poblacionales, recurres a la información mues-
tral disponible. Eso quiere decir que:

Por tanto:

Teniendo en cuenta la pregunta planteada y la información procedente de


la tabla 5.1, puedes decir que
Como ya has observado con los ejercicios realizados al final del capítulo 5,
puedes hallar fácilmente la probabilidad de obtener una media muestral por
encima de un valor o entre dos valores dados.

8.2. ESTIMACIÓN DE PARÁMETROS E INFERENCIA

Como ya sabes, la inferencia estadística se propone partir de la información


obtenida de una muestra y generalizar sus conclusiones sobre una población,
siempre que se cumplan las condiciones que tuvimos ocasión de comentar en
el capítulo 6.
Hemos visto varios estadísticos que permiten describir muestras y que a la
vez sirven para estimar los valores que tendrían en la población de la que
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 193

¿Qué es una distribución muestral? 193

han sido extraídas. Sin embargo, los estadísticos tales como la media o la des-
viación típica no tienen el mismo nivel de bondad para estimar los respecti-
vos parámetros μ y σ.
Un estadístico utilizado como estimador de su correspondiente parámetro
debe tener tres propiedades: ha de ser insesgado, consistente y eficiente.
¿En qué consiste cada una de estas características?

a) Carencia de sesgo
Se considera que un estimador es insesgado si el promedio de todos los valo-
res posibles de todas las muestras posibles de tamaño n de una población es
igual al parámetro, es decir, si la media de la distribución muestral del estadís-

tico considerado es igual al valor del parámetro. Así, la media X es un estima-
dor insesgado de μ porque se puede demostrar que la media aritmética de
una distribución muestral coincide con el valor del parámetro.

b) Consistencia
Un estimador es consistente en la medida en que, al aumentar el tamaño de
la muestra, n, su valor se acerca cada vez más al parámetro correspondiente
o, lo que es lo mismo, si, a medida que aumenta el tamaño de la muestra, las
estimaciones que ésta proporciona son cada vez más próximas al valor del
parámetro.
Como veíamos en el apartado anterior la media sería un estimador consis-
tente, ya que al incrementarse N su valor se aproxima al parámetro.

c) Eficiencia
Un estimador es eficiente si es preciso a la hora de alcanzar los estadísticos
en la estimación de los parámetros. Dicho de otro modo, un estimador será
tanto más eficiente cuanto menos varíe de muestra a muestra de una misma
población. Como la variabilidad de una distribución muestral viene dada por
su error típico, un buen estimador será aquél que menor error típico alcance.
En general, para escoger un óptimo estimador de un parámetro, deben
combinarse los criterios de carencia de sesgo y de eficiencia. Ante dos estima-
dores insesgados del mismo parámetro, se preferirá el que tenga mayor efi-
ciencia, es decir, el que tenga el mínimo error en términos de varianza.
He aquí la clasificación de los estimadores desde la perspectiva de las tres
características que acabamos de comentar:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 194

194 Introducción a la estadística

TABLA 8.6
CLASIFICACIÓN DE ESTIMADORES

Insesgados Sesgados

Media, mediana, moda, sx (distribución


, sx, rxy≠0
normal n → ∞), rxy=0,

Insesgados y eficientes Insesgados y no eficientes

μ y σ2
Me muestral y [son esti-
madores insesgados de μ]

Sesgados y no eficientes Consistentes

σ y desviación típica modificada


Proporciones,
( ) y rango semiintercuartílico

ESTIMACIÓN POR INTERVALO


8.3. Y NIVEL DE ERROR (␣)

Para empezar, ¿aceptarías sin más la afirmación de que la media obtenida de


una muestra es el parámetro? Seguramente tendrías alguna duda para emitir una
respuesta claramente positiva. Basta pensar que si pesas una muestra de espa-
ñoles y obtienes una media de 75 kg eso no te autoriza a afirmar que la me-
dia del peso de la población española es de 75 kg. Una estimación puntual,
como el caso anterior, no es precisamente la vía más segura para determinar
el valor de un parámetro. Posiblemente lo más inteligente sea tomar en consi-
deración un amplio número de valores.
Probablemente tu agudo sentido de la observación te haya hecho caer en
la cuenta de unos cuantos hechos llamativos. Por ejemplo, si sacas un número
infinito de muestras y calculas la media que representa cada muestra, obtie-
nes un número infinito de medias. Eso te debe llevar a admitir que estas me-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 195

¿Qué es una distribución muestral? 195

dias pueden adoptar un infinito número de valores. Pero, ¿sabrías indicar en-
tre qué valores podría oscilar este número infinito de medias? Si admites el
supuesto de la distribución normal de la media, entonces estarás de acuerdo
en que esta distribución de medias varía entre –∞ y +∞.
Y aquí se nos plantea otra duda. Si sólo conocemos la media de una única
muestra obtenida mediante el más escrupuloso muestreo aleatorio y a partir
de aquí pretendemos estimar la media poblacional, ¿hasta qué punto pode-
mos estar seguros de que cualquier media de la distribución se aproxima lo
bastante al parámetro como para considerarla equivalente al mismo? Sabemos
que unas están muy cerca del parámetro y otras están alejadas. Si decidimos
desechar las más alejadas del parámetro y quedarnos con las más cercanas,
entonces previamente debemos especificar el criterio que permite diferenciar
unas de otras. Se entiende que debemos elegir aquellas medias que nos per-
mitan tener un alto nivel de confianza para asegurar que entre ellas se en-
cuentra el parámetro o que cualquiera de ellas puede ser el parámetro. Eso
quiere decir que si, por ejemplo, procedemos a una nueva recogida de datos
sobre los «conocimientos previos» y obtenemos una media de 7,50, debemos
poder contestar con un alto nivel de confianza si este valor representa válida-
mente la media poblacional, sabiendo que la primera media empírica que ob-
tuvimos fue de 4,2688, o si estas dos medias representan dos muestras proce-
dentes de la misma población. Si proceden de la misma población, las
diferencias que podríamos observar diríamos que se deben al azar. Y si no
fuera así, deberíamos afirmar que las diferencias indican que las dos muestras
proceden de dos poblaciones diferentes.
Para responder a la pregunta anterior hemos de establecer unos límites,
suponiendo que la distribución muestral de la media cumple el requisito de
ser normal. Recordemos que el parámetro es un valor que tiene una alta pro-
babilidad de ser obtenido por azar al recoger los datos de una población. Pe-
ro, ¿qué significa «alta probabilidad»? En realidad la teoría no ofrece orienta-
ciones claras sobre cómo establecer un valor que sirva de criterio. La pista
procede más de lo que tradicionalmente hacen los investigadores que de una
fundamentación teórica debidamente desarrollada. El razonamiento básico,
que ya conocemos, sugiere que un suceso se debe al azar si ocurre con mu-
cha frecuencia, tomando siempre como referencia el modelo de la distribu-
ción normal. En términos probabilísticos, decimos que un suceso es aleatorio
si su probabilidad de ocurrencia por azar alcanza 0,95 ó 95%. Eso quiere de-
cir que, si repitiéramos la recogida de datos 100 veces en las mismas condi-
ciones, en 95 ocasiones obtendríamos una determinada media que considera-
ríamos equivalente al parámetro. Esto a su vez significaría que en 5 ocasiones
obtendríamos un valor diferente. En todo caso, le toca al investigador decidir
respecto a este valor.
Al tomar la decisión anterior, el investigador establece dos zonas en la dis-
tribución muestral del estadístico:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 196

196 Introducción a la estadística

• La primera zona corresponde a los sucesos que considera aleatorios, es


decir, todos aquellos valores estimados equivalentes al parámetro, y por
ello esta zona se llama región de aceptación de la hipótesis nula, H0.
• La segunda está compuesta por todos aquellos sucesos que, según el lí-
mite fijado, no se deben al azar, o sea, cuya probabilidad de ocurrencia
por azar es igual o inferior a 0,05 ó 5%. También se conoce este valor
como nivel de error o alfa (α) y la zona que define como región de re-
chazo de la hipótesis nula, H0, o si lo prefieres, región de aceptación de
la hipótesis alterna, H1.

GRÁFICO 8.8
REGIÓN DE RECHAZO/ACEPTACIÓN DE LA HIPÓTESIS NULA

H1
p = 0,05
H0
p = 0,95

–3 –2 –1 0 1 2 3

Así pues, se puede decir que el intervalo confidencial está formado por el
conjunto de medias muestrales entre las cuales el investigador afirma, a un
determinado nivel de confianza, que se encuentra el parámetro (μ). Este inter-
valo está delimitado por los límites confidenciales cuyos valores están directa-
mente relacionados con el nivel de confianza.
Para calcular los límites confidenciales deberás proceder prácticamente del
mismo modo que hiciste para hallar las puntuaciones en torno a la media que
dejan entre sí una determinada proporción de sujetos. Para ello vuelve al final
del capítulo 5. En este caso, se sigue tratando de puntuaciones pero que son
en realidad medias muestrales y lo que antes llamabas proporciones ahora lo
llamas probabilidad.
Se calcula el intervalo confidencial mediante la siguiente fórmula:

(Fórmula 8.4)
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 197

¿Qué es una distribución muestral? 197

Donde:
IC = intervalo confidencial.

X = media muestral.
σX– = error típico de la media.
Za/2 = puntuación típica que corresponde a la mitad del nivel de error.

Te preguntarás por qué razón has de dividir el nivel de error por 2. Si te fi-
jas en el gráfico 8.8, te darás cuenta rápidamente de que la región de rechazo de
la hipótesis nula está dividida en dos partes iguales. Así pues, 0,05 : 2 = 0,025.
Para determinar la puntuación típica que necesitas teniendo en cuenta cómo
está diseñada la tabla 5.1, procederás así: 1 – 0,025 = 0,975. Las tablas te pro-
porcionan una z = 1,96.
Sabiendo que la media muestral es 4,2688, el error típico de la media 0,09519
y el nivel de error 0,05, entonces los límites del intervalo confidencial son:
Límite confidencial superior = 4,2688 + (0,09519 × 1,96) = 4,2688 + 0,18657
= 4,45537.
Límite confidencial inferior = 4,2688 – (0,09519 × 1,96) = 4,2688 – 0,18657
= 4,08223.
Por tanto, se puede afirmar con un nivel de confianza del 95% que el pa-
rámetro se encuentra entre 4,08223 y 4,45537.
El producto del error típico de la media y de la puntuación típica que co-
rresponde al nivel de error se conoce como error muestral máximo.

GRÁFICO 8.9
LÍMITES DEL INTERVALO CONFIDENCIAL

Límite confidencial inferior Límite confidencial superior

Intervalo confidencial
Una cola Una cola

Error muestral máximo Error muestral máximo

–3 –2 –1 0 1 2 3

Hasta ahora hemos supuesto que el modelo de distribución muestral que


se ajusta a nuestro problema de investigación es el de la distribución normal.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 198

198 Introducción a la estadística

Sin embargo, al estudiar la forma de las distribuciones hemos visto que si N


es inferior a 30, entonces el modelo de distribución es diferente. En realidad,
se trata del modelo de distribución t cuyas características ya conoces.
A semejanza de la distribución normal, este modelo tiene su propia tabla,
que es la siguiente:

DISTRIBUCIÓN t

Nivel de significación para un contraste de una cola

0,05 0,025 0,01 0,005 0,0005

Nivel de significación para un contraste de dos colas

g.l. 0,10 0,05 0,02 0,01 0,001

1 6,314 12,706 31,821 63,657 636,619

2 2,920 4,303 6,965 9,925 31,598

3 2,353 3,182 4,541 5,841 12,924

4 2,132 2,776 3,747 4,604 8,610

5 2,015 2,571 3,365 4,032 6,869

6 1,943 2,447 3,143 3,707 5,959

7 1,895 2,365 2,998 3,499 5,408

8 1,860 2,306 2,896 3,355 5,041

9 1,833 2,262 2,821 3,250 4,781

10 1,812 2,228 2,764 3,169 4,587

11 1,796 2,201 2,718 3,106 4,437

12 1,782 2,179 2,681 3,055 4,318

13 1,771 2,160 2,650 3,012 4,221

14 1,761 2,145 2,624 2,977 4,140

15 1,753 2,131 2,602 2,947 4,073

16 1,746 2,120 2,583 2,921 4,015

11 1,740 2,110 2,567 2,898 3,965

18 1,734 2,101 2,552 2,878 3,922

19 1,729 2,093 2,539 2,861 3,883

20 1,725 2,086 2,528 2,845 3,850

21 1,721 2,080 2,518 2,831 3,819


INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 199

¿Qué es una distribución muestral? 199

22 1,717 2,074 2,508 2,819 3,792

23 1,714 2,069 2,500 2,807 3,767

24 1,711 2,064 2,492 2,797 3,745

25 1,708 2,060 2,485 2,787 3,725

26 1,706 2,056 2,479 2,779 3,707

27 1,703 2,052 2,473 2,771 3,690

28 1,701 2,048 2,467 2,763 3,674

29 1,699 2,045 2,462 2,756 3,659

30 1,697 2,042 2,457 2,750 3,646

40 1,684 2,021 2,423 2,704 3,551

60 1,671 2,000 2,390 2,660 3,460

120 1,658 1,980 2,358 2,617 3,373

∞ 1,645 1,960 2,326 2,576 3,291


Extracto tomado de Calvo, F. (1989): Estadística aplicada. Bilbao: Deusto, p. 530.

La fórmula que se aplica para calcular el intervalo confidencial es muy pa-


recida a la anterior; la única diferencia reside en la sustitución de z por t.
Cuando N < 30, se calcula el intervalo confidencial mediante la siguiente
fórmula:

(Fórmula 8.5)

Donde:
IC = intervalo confidencial.

X = media muestral.
σX– = error típico de la media.
ta/ y gl = puntuación t que corresponde a la mitad del nivel de error y
2
grados de libertad.

Grados de libertad, ¿qué será eso? Aprovechemos esta ocasión para aclarar
este importante concepto. Imagínate que tres amigos forman una peña que
juega a la quiniela regularmente y que tiene la suerte bárbara de ganar un mi-
llón de euros. Pero resulta que los tres amigos no se acuerdan de qué canti-
dad ha ido aportando cada uno y, como jugadores empedernidos —no ludó-
patas— que son, deciden repartirse el premio al azar. Piden a una persona
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 200

200 Introducción a la estadística

que pasa en ese momento por allí que diga un número entre 1 y 330.000. Sin
pensarlo dos veces, el transeúnte suelta 328.995, y esa fue la cantidad que co-
bró el primero de los amigos. Abordaron a otro transeúnte y le pidieron lo
mismo; éste dijo 329.990. ¿Hace falta parar a un tercer transeúnte? Sabiendo
que el máximo es un millón de euros y que el reparto se hace entre tres ami-
gos, no hace falta: al tercero le tocará necesariamente el resto, o sea 341.015.
Eso quiere decir que el reparto del premio sólo tiene dos grados de libertad.
Dicho de otro modo, sólo dos de los tres posibles valores pueden variar libre-
mente; el tercero está bloqueado, fijo, debido a que el total también es fijo.
Por ello, podríamos definir los grados de libertad como el número de datos
que pueden variar libremente con relación a un estadístico. En el caso que es-
tamos comentando, los grados de libertad serían N, el número de amigos que
se reparten el premio, menos 1. O sea, el último no puede variar libremente,
porque el premio total es una cantidad fija.
Sabiendo que N = 25, entonces los grados de libertad son 25 – 1 = 24. Y si
la media muestral es 4,3300, el error típico de la media 0,17720 y el nivel de
error 0,05, entonces los límites del intervalo confidencial son:
Límite confidencial superior = 4,3300 + (0,17720 × 2,064) = 4,3300 +
0,36574 = 4,69574.
Límite confidencial inferior = 4,3300 – (0,17720 × 2,064) = 4,3300 – 0,36574
= 3,96426.
Por tanto, se puede afirmar con un nivel de confianza del 95% que el pa-
rámetro se encuentra entre 3,96426 y 4,69574.
Merece la pena prestar atención a la diferencia entre las formas de la dis-
tribución de probabilidad de t cuando los grados de libertad son 4 y cuando
son 24:

GRÁFICO 8.10
DISTRIBUCIÓN DE PROBABILIDADES DE t
PARA 4 Y 24 GRADOS DE LIBERTAD
4 grados de libertad 24 grados de libertad
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 201

¿Qué es una distribución muestral? 201

FORMULACIÓN DE HIPÓTESIS ESTADÍSTICAS 8.4.

Es hora de volver al capítulo 2 y echar una ojeada sobre el apartado de las hi-
pótesis sustantivas. Conviene recordar que las hipótesis sustantivas reflejan lo
que cree el investigador que ocurre o podría ocurrir en la realidad que está
investigando. Por ejemplo, cuando el investigador dice que el nivel de rendi-
miento discente está en torno a 5, está expresando una creencia que puede
estar basada en una percepción más o menos difusa o en una deducción ori-
ginada en sus lecturas previas. Como manifestación de una creencia esta ex-
presión no puede ser verificada en el marco del modelo de investigación que
venimos comentando. Para su verificación, se necesita convertir la creencia, la
hipótesis sustantiva, en dos hipótesis estadísticas complementarias: la hipóte-
sis nula (H0) y la hipótesis alterna o alternativa (H1).
Se considera como hipótesis nula (H0) a la proposición conjetural en la que
se afirma que no existen diferencias entre los resultados obtenidos en la prác-
tica y los teóricos. Recuerda que el modelo teórico está basado en lo que
ocurre por azar. Por tanto, en realidad la hipótesis nula afirma que los resulta-
dos empíricos no se diferencian de los que se obtienen por azar. Por ejemplo,
en relación con la hipótesis sustantiva anterior, se podría decir: no hay dife-
rencias estadísticamente significativas entre el nivel medio de rendimiento dis-
cente y 5. Dicho de otro modo, la diferencia entre el nivel medio de rendi-
miento discente y 5 es aleatoria.
Es muy importante que te des cuenta de que todo el proceso de investiga-
ción gira en torno al contenido de la H0. No lo olvides.
Se considera como hipótesis alterna o alternativa (H1) a la proposición en
la que se afirma que sí existen diferencias entre los resultados obtenidos en la
práctica y los teóricos. Como sin duda habrás observado, viene a ser una afir-
mación contraria a la hipótesis nula.
Otro detalle importante que tomar en consideración: la formulación esta-
dística de la hipótesis alterna debe de reflejar necesariamente el contenido de
la creencia del investigador. A este respecto, la formulación puede tomar una
de dos formas:
— Hipótesis alterna bilateral, bidireccional o de dos colas
Como el investigador no está seguro de la orientación de las diferen-
cias, formula su creencia sin ofrecer una pista de lo que cree que ocu-
rre sobre la posición de las diferencias en la distribución muestral. Por
tanto, desde la perspectiva de la formulación de la hipótesis estadística
alterna sólo se puede afirmar que las diferencias se pueden encontrar
en cualquiera de los dos lados de la distribución muestral, a un nivel
de confianza dado. Por ello, este tipo de hipótesis se formularía así:
hay diferencias estadísticamente significativas entre los resultados obte-
nidos en la práctica y los teóricos. En el caso del ejemplo que estamos
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 202

202 Introducción a la estadística

comentando, el nivel medio de rendimiento discente puede estar por


cualquiera de los dos lados en torno a 5, es decir, por encima o por de-
bajo de 5. Ahora comprenderás por qué a esta hipótesis alterna la llama-
mos bilateral, bidireccional o de dos colas. Fíjate en el gráfico 8.11. La
formulación de la hipótesis alterna en el marco del problema de investi-
gación podría ser la siguiente: hay diferencias estadísticamente signifi-
cativas entre el nivel medio de rendimiento discente y 5.

GRÁFICO 8.11
HIPÓTESIS ALTERNA BIDIRECCIONAL

Cola negativa Cola positiva

–3 –2 –1 0 1 2 3

— Hipótesis alterna unilateral, unidireccional, direccional o de una cola


El investigador se muestra bastante seguro de sus creencias y eso le
lleva a atreverse a indicar la dirección de las diferencias esperadas. Por
ejemplo, en nuestro caso el investigador podría haber formulado el si-
guiente aserto como hipótesis sustantiva: el nivel medio de rendimien-
to discente está por encima de 5. Con esta afirmación, queda claro que
el investigador espera que las diferencias estén por encima de 5, o sea,
en una única dirección o cola. Fíjate en el gráfico 8.12. Desde la pers-
pectiva de la formulación estadística, las diferencias se encuentran en
un determinado lado de la distribución muestral, a un nivel de con-
fianza dado. Por ello, se podría decir en el marco de este problema de
investigación: el nivel medio de rendimiento discente es estadística-
mente superior a 5.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 203

¿Qué es una distribución muestral? 203

GRÁFICO 8.12
HIPÓTESIS ALTERNA DIRECCIONAL

Cola positiva

–3 –2 –1 0 1 2 3

INTRODUCCIÓN AL CONTRASTE DE HIPÓTESIS 8.5.

Una vez formulada la hipótesis nula, es necesario recoger datos susceptibles


de ayudar a contrastarla. Ya conoces las precauciones que hay que tomar pa-
ra recoger los datos. Ahora de lo que se trata es de llevar a cabo los análisis
pertinentes para obtener los resultados estadísticos adecuados con el fin de
rechazar o aceptar la hipótesis nula. Para ello, aplicaremos un procedimiento
estándar que nos ayudará en el proceso de contraste de hipótesis; consta de
siete pasos lógicamente encadenados:
1. Formulación de H0 y de su correspondiente H1.
2. Elección justificada de la prueba estadística.
3. Especificación del nivel de error (α).
4. Definición de la distribución muestral.
5. Zona de rechazo de H0.
6. Cálculo del estadístico: prueba estadística.
7. Interpretación estadística y pedagógica.
En primer lugar, conviene que definamos el problema de investigación: el
investigador desea averiguar si, tal como lo cree, el nivel medio de rendimien-
to de sus alumnos está en torno a 5. Para ello, aplica una prueba que califica
en una escala de 0 a 10 y, posteriormente, halla la media. Para despejar sus
dudas, procede a aplicar el contraste de hipótesis:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 204

204 Introducción a la estadística

1. Formulación de H0 y de su correspondiente H1
Hipótesis nula → H0: μ = 5; esto quiere decir: el nivel medio de rendi-
miento de los alumnos es estadísticamente igual a 5.
Hipótesis alternativa → H1: μ ≠ 5; esto significa: el nivel medio de ren-
dimiento de los alumnos es estadísticamente diferente a 5. Se trata de
una H1 bilateral.
2. Elección justificada de la prueba estadística
En la investigación socioeducativa no aplicamos la primera prueba es-
tadística que se nos ocurra; debemos ser capaces de proporcionar razo-
nes lógicas para justificar la elección de una prueba u otra. De momento
estás empezando, pero más adelante esta etapa adquirirá más impor-
tancia aún.
En primer lugar, es esencial que conozcas el nivel de medida de la va-
riable que va a ser objeto de análisis. En nuestro caso, la variable rendi-
miento es una variable medida a nivel de intervalo. En segundo lugar,
debes prestar atención al número de grupos así como al número de su-
jetos en cada grupo. Sólo tenemos un grupo y en él hay de 93 sujetos,
es decir N ≥ 30. Por tanto, si pensamos en términos de distribución mues-
tral de la media, estamos en el caso del modelo de distribución normal.
Por ello, recurriremos al modelo Z o razón crítica (RC). Así pues, se tra-
ta de calcular una simple puntuación típica Zi.
3. Especificación del nivel de error o de significación (α)
Como recordarás, el establecimiento del nivel de error es una prerroga-
tiva del investigador, pero es de obligado cumplimiento. Si no se indi-
ca, no se conocería el nivel de confianza que habría que tener en las
conclusiones estadísticas.
Pongamos que nuestro nivel de error es 0,05. Teniendo en cuenta que
H1 es bilateral, la zi crítica es 1,96.
4. Definición de la distribución muestral de la media
Es posible que tengas serios problemas a la hora de la interpretación si
no comprendes el concepto de distribución muestral. Vuelve al princi-
pio del capítulo si tienes alguna duda.
La distribución muestral de la media es una distribución de probabili-
dad, que se forma con infinitas medias aritméticas obtenidas de infini-
tas muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,05.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 205

¿Qué es una distribución muestral? 205

Es importante hacer referencia a si estamos ante una H1 direccional o


bidireccional. En nuestro caso, puesto que H1 no indica la dirección de
las diferencias, la zona de rechazo está situada en ambos extremos de la
distribución que incluye todos los valores cuya probabilidad sea ≤ 0,05.
Esta información ya nos ha ayudado a determinar el criterio, 1,96, con
el que comparar el valor empírico.
6. Cálculo del estadístico: prueba estadística

Sabiendo que la media poblacional es 5, la media muestral 4,2688 y el


error típico de la media 0,09519, entonces:

7. Interpretación estadística y pedagógica

TABLA 8.7
VALORES CRÍTICOS DE Z PARA H1 BILATERAL O UNILATERAL
SEGÚN EL NIVEL DE ERROR

Nivel de error 0,05 0,01 0,005 0,002 0,001

Valores críticos de Z para H1 unilateral 1,64 2,33 2,58 2,88 3,08

Valores críticos de Z para H1 bilateral 1,96 2,58 2,81 3,08 3,27

a) Interpretación estadística: la probabilidad de obtener por azar una zi


= –7,68 es menor que la de una zi = –1,96 (α = 0,05); por tanto, se
rechaza H0.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 206

206 Introducción a la estadística

GRÁFICO 8.13
REGIÓN DE RECHAZO DE H0

Valor empírico zi = –7,68

Valor crítico zi = –1,96 Valor crítico zi = +1,96

Región de rechazo H0 Región de rechazo H0

–3 –2 –1 0 1 2 3

b) Interpretación pedagógica: esto significa que el nivel medio de rendi-


miento de los alumnos no es igual a 5 puntos.
c) Sin embargo, antes de dar el contraste de hipótesis por concluido, tie-
nes que plantearte una pregunta bastante sencilla: ¿estás absolutamente
seguro de que tu decisión de rechazar H0 es correcta? ¿No cabe la posi-
bilidad de que hayas elegido un nivel de error demasiado laxo o dema-
siado estricto? Vamos a tratar estas dudas en el siguiente apartado.

8.6. ERROR DEL TIPO I Y DEL TIPO II

Cuando te enfrentas a la tarea de tomar una decisión como consecuencia de


los resultados estadísticos obtenidos, sólo hay dos posibles opciones: aceptar
H0 o rechazarla. Por otra parte, cuando formulas una H0 sólo hay dos posibles
estados: tu H0 es verdadera o es falsa.

ESTADO REAL
DECISIÓN H0 es verdadera H0 es falsa
Aceptar H0 Decisión correcta Error del Tipo II [β=1-Potencia]
Rechazar H0 Error del Tipo I [α] Decisión correcta

Si relacionas tu decisión estadística con el estado real de tu H0, resulta que


tu decisión es correcta si aceptas una H0 que es realmente cierta o rechazas
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 207

¿Qué es una distribución muestral? 207

una H0 que es realmente falsa. Pero, ¿cómo puedes saber si tu H0 es realmente


cierta o realmente falsa? Es absolutamente imposible saberlo con seguridad al
formularla. Recuerda que una hipótesis es tan sólo una conjetura, que por de-
finición carece de seguridad. Siendo las cosas así, cuando emites una conclu-
sión estadística nunca estás completamente seguro de que lo que concluyes
es totalmente cierto. De hecho, cabe la posibilidad de que rechaces una H0
que es verdadera, pero tú no lo sabes con absoluta seguridad. En este caso es
evidente que estás cometiendo un error, que técnicamente se conoce como
error del Tipo I; la probabilidad de que cometas este tipo de error equivale a
α o «nivel de significación».
También puede ocurrir que, en aplicación de tu exquisito razonamiento
probabilístico, aceptes una H0 que en realidad es falsa. De nuevo estarías co-
metiendo un error, que técnicamente se conoce como error del Tipo II. La
probabilidad de cometer este error se conoce como β.
En resumen, si la media muestral pertenece a la región crítica, entonces
rechazamos H0. Esto significa que α es la probabilidad de rechazar H0, siendo
ésta verdadera. Del mismo modo, si la media muestral pertenece a la región
no-crítica, lo lógico es aceptar H0. En consecuencia, β debe considerarse co-
mo la probabilidad de aceptar H0, siendo ésta falsa.
La inseguridad que acompaña tu interpretación estadística debe quedar re-
flejada en la explícita aceptación del posible error que estés cometiendo. En
nuestro caso, como el razonamiento probabilístico nos obliga a rechazar H0 ,
debemos añadir que cabe la posibilidad de que estemos cometiendo un error
del Tipo I.
Si lo piensas un poco te darás cuenta de que el tipo de error que cometes
está relacionado el nivel de error que eliges. Si decides que lo mejor es que tu
nivel de error debe ser pequeño, como por ejemplo 0,001, se incrementa nota-
blemente la posibilidad de que aceptes una H0 que en realidad es falsa. En cam-
bio, si decides que tu nivel de error sea grande, como por ejemplo 0,50, se in-
crementa la posibilidad de que acabes rechazando una H0 que es verdadera. El
actual estado de desarrollo de la investigación socioeducativa no permite liberar-
nos de este tipo de errores; en cambio, nos permite controlar su magnitud.

RELACIONES ENTRE ␣, ␤, N
Y LA POTENCIA DE UNA PRUEBA 8.7.

¿Qué es la potencia de una prueba? 8.7.1.


Rechazar H0 es una decisión que debería ir acompañada por el esfuerzo
orientado a determinar el nivel de sensibilidad del experimento a la hora de
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 208

208 Introducción a la estadística

detectar un efecto estadísticamente significativo o identificar la causa que ex-


plica el cambio o la diferencia observada, es decir, la potencia de una prueba.
Definimos la potencia de una prueba como la probabilidad de que los resul-
tados de un experimento permitan rechazar la hipótesis nula si la variable in-
dependiente tiene un efecto real o, en términos matemáticos, como la proba-
bilidad de rechazar H0, siendo ésta falsa, es decir, 1 – β.
Echa una ojeada sobre lo que comentamos acerca de los errores que se
pueden cometer al tomar una decisión estadística: si decides rechazar Ho y
ésta es verdadera, entonces cometes un error del Tipo I; la probabilidad de
cometer un error del Tipo I queda limitada por α. Por otro lado, si decides re-
chazar H0 y resulta que H1 es verdadera, entonces tu decisión es correcta; la
probabilidad de elegir esta decisión acertada es la potencia del experimento.
Los experimentos se diferencian en su capacidad para detectar un efecto esta-
dísticamente significativo. Cuanto mayor sea la potencia, más sensible será el
experimento. Finalmente, si decides aceptar H0 pero resulta que H1 es verda-
dera, entonces cometes un error del Tipo II; β indica la probabilidad de co-
meter esta clase de error.
Ya te habrás dado cuenta de que se puede definir una infinidad de regio-
nes críticas para un determinado valor de α. Te basta comparar las regiones
críticas de los gráficos 8.11 y 8.12 que representan una zona equivalente a
α = 0,05. ¿Tienen ambas la misma potencia para rechazar H0? Puedes enten-
der que no todas las regiones así definidas tienen la misma potencia para re-
chazar H0 siendo ésta falsa, lo que nos lleva a sugerir que una región crítica
es la mejor o la más potente cuando, para un α dado, su potencia es mayor
que la de cualquiera otra de las infinitas regiones críticas que llevan asociada
esa misma probabilidad α.

8.7.2. ¿Qué relación existe entre ␣, ␤ y la potencia?


Si el número de sujetos, n, es fijo, entonces resulta que cuando aumenta α, β
disminuye, y viceversa.
Veamos un ejemplo. El investigador desea averiguar si, tal como lo cree, el
nivel medio de rendimiento de sus alumnos es mayor que la puntuación de 5.
Selecciona al azar una muestra de 35 sujetos a los que aplica una prueba que
califica en una escala de 0 a 10. Comprueba que la población es normal con
σ = 0,92939 y error típico = 0,15710.
La hipótesis nula del investigador se formula H0 : μ = 5 y la hipótesis al-
terna como H1: μ > 5. Por tanto, se trata de una región crítica unilateral. El ni-
vel de error lo fija en α = 0,05. El valor crítico Z0,95 es de 1,64. Así pues, deberá

rechazar H0 siempre que X ≥ 5 + (0,15710 × 1,64) = 5,25764: la región crítica
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 209

¿Qué es una distribución muestral? 209

está constituida por todo valor igual o mayor que 5,25764. Por consiguiente,
si resulta que la media es de 5,15 y H1 fuese verdadera, entonces:

En conclusión, de acuerdo con la tabla 5.1:

β = p(Z ≤0,68) = 0,7518.

Manteniendo las mismas condiciones y cambiando el valor de α = 0,13, re-


sulta que z0,87 = 1,13. Por tanto, rechazaremos H0 siempre que...

... es decir, la región crítica está constituida por todo valor igual o mayor
que 5,17752. Por consiguiente, si la media es de 5,15 y H1 fuese verdadera,
entonces:

En conclusión, de acuerdo con la tabla 5.1:

β = p(Z ≤1,84) = 0,5714

Te habrás dado cuenta de que si incrementas α de 0,05 a 0,13, entonces β


disminuye de 0,7518 a 0,5714. Ocurre lo contrario si en vez de aumentar α le
impones valores cada vez más pequeños. Sin embargo, aumentar o disminuir
α y su corolario β tiene costes. De hecho, sabiendo que β = 1 – potencia, si β
aumenta, entonces la potencia disminuye. Eso quiere decir que si disminuyes
α, disminuye la potencia también.

¿Qué relación existe entre ␣, ␤, n y la potencia? 8.7.3.


Si lo que pretendes es que los errores del Tipo I y del Tipo II sean mínimos,
la mejor solución no consiste en variar α y β manteniendo constante el tama-
ño de la muestra, ya que esto afecta a la potencia. Tendrías que averiguar qué
tamaño muestral, n, consigue que los dos tipos de errores sean pequeños y
que a la vez asegure una gran potencia.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 210

210 Introducción a la estadística

Empieza fijando un nivel de error que sea pequeño, por ejemplo 0,05. Y
ahora te toca averiguar el tamaño de la muestra para que β sea también pe-
queño. Pongamos que tienes una población normal cuya σ = 0,91799. Se su
pone que la distribución muestral de la media es normal con ,
donde n es el valor que necesitas averiguar. Pongamos que Ho:μ = 5 y H1:
μ > 5. Si α = 0,05, la zi crítica es 1,64 para H1 unilateral. Por tanto, debes re-
chazar H0 siempre que:

Por consiguiente, el punto crítico, lc, equivale a:

Por otro lado, quieres que β sea igual a 0,15. La tabla 5.1 te informa de
que z0,15 = –1,04. Por consiguiente:

Así pues,

En consecuencia:

Es decir:

n = 16,401422 = 269,00658 ≈ 269

Es decir, con una muestra igual a 269 podemos contrastar la hipótesis


H0: μ = 5 frente a la hipótesis H1: μ = 5,15, de manera que valga 0,05 la pro-
babilidad de rechazar H0 , siendo verdadera, y que valga 0,15 la probabilidad
de aceptar H0 , siendo falsa, naturalmente, bajo la condición de que la pobla-
ción sea normal con σ = 0,91799.
¿Qué ocurre si aumentas el tamaño de tu muestra hasta 400. En ese caso:
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 211

¿Qué es una distribución muestral? 211

Por tanto, el límite inferior de la región crítica unilateral, para α = 0,05,


viene dado por:

De donde la z empírica correspondiente es:

En consecuencia, β = p(Z≤ –1,63) = 0,0516 y la potencia es 1 – 0,0516 = 0,9484.


En conclusión, si mantienes α = 0,05 y aumentas n de 269 a 400, consi-
gues que β descienda de 0,15 a 0,0516 y que la potencia se incremente hasta
0,9484. Observa que si quieres que α y β sean pequeños, entonces n tiene
que ser grande para que la potencia de la prueba sea máxima. Ahora bien, si
el incremento de n es demasiado grande, el experimento puede resultar in-
viable no sólo a causa del volumen de la muestra sino también por el coste
que esto implica. Los valores más comunes se encuentran entre 0,40 y 0,60;
se buscan valores que superen 0,80 de potencia. Si el incremento de n resulta
costoso, como solución alternativa se puede recurrir a la utilización de prue-
bas estadísticas más poderosas, tomando en consideración el nivel de medida
de los datos. De esto nos ocuparemos más delante. Hay una tercera solución
que consiste en un control estricto de las condiciones en las que se aplica el
experimento; este control debe facilitar la reducción de la influencia de varia-
bles extrañas y limitar, por tanto, la variabilidad de los datos.

¿«ESTADÍSTICAMENTE SIGNIFICATIVO»
EQUIVALE A «EDUCATIVAMENTE RELEVANTE»? 8.8.

Rechazar una hipótesis nula equivale a afirmar que tus resultados son estadís-
ticamente significativos. Es decir, das a entender que tus resultados no se de-
ben al azar. En nuestro caso, te consideras autorizado a afirmar que el nivel
medio de rendimiento de los alumnos no sólo no es igual a 5 puntos sino
que está significativamente por debajo de 5. Ahora bien, hay que tener cuida-
do; no debes confundir lo que es estadísticamente significativo con lo que es
educativamente relevante. Un resultado estadísticamente significativo no indi-
ca que el efecto medido sea educativamente importante. Por ejemplo, en
nuestro caso, el investigador dice que espera que el nivel medio de rendi-
miento de los alumnos sea igual a 5 puntos, en una escala de 0 a 10, pero re-
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 212

212 Introducción a la estadística

sulta que el nivel medio obtenido es igual a 4,2688 puntos. ¿Se puede consi-
derar esta diferencia educativamente relevante? Posiblemente una respuesta
positiva dependa de un conjunto de otras consideraciones colaterales como,
por ejemplo, qué significa un rendimiento de 4 en una escala de 0 a 10. En
experimentos cuidadosamente diseñados y ejecutados es posible detectar di-
ferencias aún más pequeñas, pero sigue siendo necesario preguntarnos por la
relevancia práctica o incluso teórica del efecto obtenido.
¿Y qué hacemos con los resultados no significativos? ¿Basta con aceptar
H0? Ya sabes que la aceptación de H0 puede ocurrir porque a) H0 es realmen-
te verdadera o porque b) H0 es falsa pero el experimento carece de suficiente
potencia para detectarla. Esta segunda opción nos obliga a ser muy precavi-
dos: nunca podemos aceptar H0 como verdadera si el experimento no produ-
ce resultados significativos. Lee el siguiente ejemplo y lo comprenderás fácil-
mente: tu profesor elige al azar a un grupo de cuatro compañeros tuyos y les
somete a un experimento. Pasado cierto tiempo mide el efecto para compro-
bar si ha habido mejora o no y califica a cada uno con un signo positivo si ha
habido mejora y con un signo negativo si ha retrocedido. Ponte en la situa-
ción extrema, es decir, aquélla en la que todos los alumnos mejoran o empe-
oran como consecuencia de haber sido sometidos a este experimento. La pro-
babilidad de la mejora es igual a la del empeoramiento, es decir, p = 0,50.
Esto significa que la probabilidad de los resultados posibles del profesor es:
p(4 signos positivos o 4 signos negativos) = 0,0625 + 0,0625 = 0,1250. Como
0,125 > 0,05, tienes que aceptar H0 aun sabiendo que el experimento ha sido
un éxito o un fracaso total. Seguro que te das cuenta de que en realidad de-
berías rechazar H0 ya que todos los signos son positivos o negativos. Pero de
hecho, los resultados obtenidos en este experimento no pueden ser estadísti-
camente significativos. Con toda probabilidad estés de acuerdo en que sería
un grave error aceptar H0 sencillamente porque esta prueba carece de poten-
cia. La prueba no permite rechazar H0 pero los hechos dicen lo contrario.

8.9. TU TURNO

1. ¿Cuál de las siguientes afirmaciones sobre la distribución muestral de la


media es cierta?
1. A medida que crece la magnitud de las muestras, la distribución mues-
tral tiende a asemejarse a una distribución normal de probabilidades.
2. Las medias sacadas de n muestras aleatorias son todas equivalentes.
3. Cada media de la distribución muestral es equivalente a la verdadera
media poblacional.
4. Si la distribución de frecuencias directas de una variable no es normal,
entonces la distribución muestral de medias tampoco es normal.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 213

¿Qué es una distribución muestral? 213

2. De las siguientes afirmaciones tres son correctas y una es errónea. Señala


la errónea:
1. A medida que el tamaño muestral crece, disminuye la desviación típica
de las medias muestrales.
2. Si las medias varían mucho, el error típico es elevado, y si varían po-
co, ese valor se aproxima a 0.
3. Cuando N crece, disminuye la exactitud con la que cada media mues-
tral estima la media poblacional.
4. Cada tamaño de N tiene una distribución muestral de la media que le
es propia.
3. De una población cuyas características son desconocidas, se saca una
muestra aleatoria de 80 sujetos a los que se aplica una prueba. Se calcula
la media y la desviación típica y se obtienen datos equivalentes a los de la
9ª muestra de la tabla 8.5. Si se saca otra muestra de similares característi-
cas y en iguales condiciones, ¿cuál es la probabilidad de obtener una me-
dia igual o superior a 4,5?
4. Calcula el intervalo confidencial de la media de la 9ª muestra de la tabla
8.5 a un nivel de confianza del 99%.
5. Calcula el error muestral máximo de la 9ª muestra de la tabla 8.5 a un ni-
vel de confianza del 96%.
6. Calcula el intervalo confidencial de la media de la 9ª muestra de la tabla
8.3 a un nivel de confianza del 99%. Fíjate en el valor de N.
7. Calcula el error muestral máximo de la 9ª muestra de la tabla 8.3 a un ni-
vel de confianza del 98%. Fíjate en el valor de N.
8. ¿Se puede aceptar que la media de la 10ª muestra de la tabla 8.4, 4,15, es
equivalente a μ, con un nivel de confianza del 98%? Demuéstralo.
9. Vuelve al principio del capítulo 3, fíjate en la lista de variables incluidas
en el estudio general e intenta formular una sola hipótesis nula similar al
ejemplo de este capítulo. Una vez formulada dicha H0 , intenta aplicar el
contraste de hipótesis.
INT ESTAD 02:ENSEÑANZA MATEMAT 09/03/11 10:04 Página 214
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 215

Capítulo 9
¿CÓMO RELACIONAR DOS CARACTERÍSTICAS
DE UNA DETERMINADA MUESTRA?

Al finalizar este capítulo deberías:


• Conocer los conceptos de relación y de función.
• Conocer las características de las distribuciones bivariadas.
• Conocer la representación bidimensional.
• Ser capaz de realizar diagramas de dispersión bivariada.
• Ser capaz de hallar el coeficiente de correlación producto-momen-
to de Pearson.
• Ser capaz de interpretar el coeficiente de correlación producto-
momento de Pearson.
• Ser capaz de realizar el contraste de hipótesis con respecto al ín-
dice de correlación.
• Conocer los correspondientes índices de relación entre variables
de distinta naturaleza.
• Ser capaz de calcular la covarianza.
• Ser capaz de relacionar la covarianza con el coeficiente de corre-
lación producto-momento de Pearson.
• Conocer el concepto de regresión.
• Conocer el concepto de recta de regresión.
• Ser capaz de hallar los valores de una recta de regresión.
• Ser capaz de hallar los límites de una región de confianza de la
recta de regresión.

Hasta ahora hemos centrado nuestros esfuerzos en el estudio de una única carac-
terística o variable de una sola muestra. Seguimos hablando de una única mues-
tra, pero vamos a ver cómo podemos establecer la relación entre dos variables. Y
antes de entrar en materia, se han de aclarar algunos conceptos importantes.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 216

216 Introducción a la estadística

Puedes sospechar que en investigación no nos basta describir la muestra


con relación a cada una de las características medidas; ni siquiera es suficien-
te que seamos capaces de hablar de la población a partir de lo que sabemos
de una única muestra. Para obtener esquemas causales, necesitamos como
mínimo establecer relaciones entre al menos dos variables. Para ello, uno de
los conceptos utilizados se refiere a los índices que permiten afirmar, dentro
de un cierto margen de confianza, que dos o más variables están relacionadas
entre sí, es decir, el índice de correlación.

9.1. RELACIÓN Y FUNCIÓN

En el Diccionario de la Real Academia Española se define la relación, en una


de sus numerosas acepciones, como conexión, correspondencia de algo con
otra cosa. Esta definición nos sugiere que la relación se produce siempre en-
tre clases o conjuntos de objetos, al menos dos. Por ejemplo, en cualquier fa-
cultad existen como poco dos conjuntos, los profesores y los alumnos. Admi-
nistrativamente hablando, lo habitual es que a cada alumno le corresponda
un único profesor con relación a una determinada asignatura. El estudio de
estas clases facilita el conocimiento de la relación contenida en un conjunto
de sucesos o de observaciones particulares.
En matemáticas se define una función del tipo y = f(x) como una regla de
correspondencia que permite relacionar un elemento de un grupo x con otro
elemento del grupo y. En el caso que nos ocupa, en la expresión y = f(x), x
representa los objetos del dominio y f(x) denota a los objetos del rango que
se asignan a las x del dominio. Es decir, a cada valor x le corresponde un va-
lor y, formando ambos lo que se conoce como par ordenado. Así pues, un
par ordenado está constituido por un conjunto de dos elementos que apare-
cen en un orden fijo.
Todas las funciones son relaciones; sin embargo, no todas las relaciones
son funciones. Cuando desarrollas una función, lo normal es que asignes a un
determinado valor x sólo un valor y concreto. En el caso de la relación admi-
nistrativa entre profesores y alumnos, queda claro que a cada alumno le co-
rresponde un único profesor; esto indica una función y, por consiguiente, una
relación. Sin embargo, no sería correcto decirlo al contrario, porque es evi-
dente que a cada profesor no le corresponde un único alumno. Eso quiere
decir que entre ambos grupos hay una relación y no una función.
Si tenemos dos conjuntos de observaciones y los representamos gráfica-
mente en dos ejes de coordenadas, será más fácil apreciar a simple vista la re-
lación que tienen entre ellas. Cada punto está definido por dos clases de in-
formaciones, x e y. Ahora podemos definir una relación como un conjunto de
pares ordenados.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 217

¿Cómo relacionar dos características de una determinada muestra? 217

APROXIMACIÓN INTUITIVA
A LA MEDICIÓN DE UNA RELACIÓN 9.2.

Las relaciones entre dos variables se pueden estudiar dibujando sobre una
gráfica los pares de medidas y representando cada par ordenado de observa-
ciones mediante un punto. Tales representaciones se denominan diagramas
de dispersión. Si los observamos, podemos tener una cierta idea sobre el gra-
do de relación entre las dos variables.
Deseamos cuantificar la relación que creemos que existe entre las dos par-
tes en que se divide el rendimiento en el primer examen del curso, a saber: la
parte teórica y la parte práctica. A título de ejemplo, tomemos los datos de los
cinco primeros alumnos del grupo.

TABLA 9.1
RENDIMIENTO EN EL PRIMER EXAMEN DEL CURSO

Alumno Parte teórica Parte práctica

1º 5,08 7,00

2º 3,08 3,65

3º 3,25 2,15

4º 5,58 6,25

5º 6,58 6,50

Observamos que el primer alumno ha obtenido 5,08 en la prueba teórica


y 7 en la parte práctica. Por tanto, en el diagrama de dispersión estará repre-
sentado por un punto definido por un valor de 5,08 para x y de 7 para y. Los
restantes cuatro componentes se sitúan del mismo modo en el espacio bidi-
mensional definido por los valores de x e y, formando algo parecido a una
nube de puntos. La representación gráfica resultante es la siguiente:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 218

218 Introducción a la estadística

GRÁFICO 9.1
DIAGRAMA DE DISPERSIÓN

7 1º

6 4º
Parte práctica

4

3

2
3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Parte teórica

Para dar una interpretación adecuada a este tipo de gráficos, es importante


tener en cuenta cómo están agrupados los puntos dentro del diagrama de dis-
persión. Si están agrupados como en el gráfico 9.2, decimos que la relación
entre ambas variables es perfecta positiva; esto ocurrirá si relacionamos, por
ejemplo, la longitud del radio con la de la circunferencia: si incrementamos el
radio, aumenta la circunferencia linealmente.

GRÁFICO 9.2
RELACIÓN PERFECTA POSITIVA

20

15
Variable 2

10

0 2 4 6 8 10
Variable 1
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 219

¿Cómo relacionar dos características de una determinada muestra? 219

En cambio, si la relación se parece a la del gráfico 9.3, entonces es perfec-


ta negativa; obtendrás un gráfico parecido si para recorrer una distancia dada
representas la relación que existe entre la velocidad y el tiempo: ya sabes que
si incrementas la velocidad disminuye el tiempo.

GRÁFICO 9.3
RELACIÓN PERFECTA NEGATIVA

20

18

16

14
Variable 2

12

10

0 2 4 6 8 10 12 14 16 18 20
Variable 1

Si ocurre lo que aparece en el gráfico 9.4, es que estamos ante una rela-
ción nula o que se debe al azar. Imagínate que de una determinada pobla-
ción sacas una muestra representativa y mides el cociente intelectual (CI) y
el peso de cada sujeto; es muy probable que obtengas una representación
amorfa si intentas representar la relación que existe entre el CI y el peso.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 220

220 Introducción a la estadística

GRÁFICO 9.4
RELACIÓN NULA

20

18

16

14
Variable 2

12

10

0 2 4 6 8 10 12 14 16 18 20
Variable 1

Volviendo al gráfico 9.1, observamos una situación que sugiere una rela-
ción que no llega a ser perfecta, pero que se aproxima bastante, y con una
orientación claramente positiva.

9.3. CORRELACIÓN Y CAUSALIDAD

Una advertencia que tendrás que mantener en mente: descubrir que existe una
relación de cualquier tipo no te autoriza a afirmar que has descubierto un esque-
ma causal. Basta con contemplar el contenido de los gráficos 9.2 a 9.4 para com-
prender esta advertencia. Sin una teoría previa, no hay modo alguno de interpre-
tar causalmente la relación que se observa entre la variable 1 y la variable 2.
Ten en cuenta que la explicación de una correlación puede basarse en que:
• X es realmente la causa de Y. Ahora bien, para asegurar que esto es así,
hay que comprobar previamente el grado de cumplimiento de las con-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 221

¿Cómo relacionar dos características de una determinada muestra? 221

diciones que comentamos en el apartado «Causalidad e inferencia cau-


sal» del capítulo 2. En todo caso, recuerda que actualmente la ciencia
no es capaz de proporcionar una seguridad absoluta sobre las causas
de los fenómenos que ocurren en nuestro entorno.
• X e Y están relacionadas aleatoriamente: la relación se debe a causas
desconocidas, lo cual sugiere que si se repitiera el experimento se po-
dría obtener un resultado completamente diferente. En este caso, sería
erróneo afirmar que X es la causa de Y.
• Y es la causa de X. Esto implica que se está considerando como causa un
fenómeno que en realidad es el efecto y, por tanto, no se está respetando
las condiciones relativas al establecimiento de cualquier esquema causal.
• X e Y se relacionan porque hay una tercera variable que provoca tal rela-
ción. Por ejemplo, supongamos que relacionamos la edad del profesorado
con el rendimiento académico del alumnado. En realidad, no parece que
sea la edad del profesorado la que puede explicar causalmente el rendi-
miento de los alumnos, sino la experiencia docente que va ligada a la edad.
En el entorno socioeducativo ocurre otro fenómeno bastante llamativo: X
e Y se relacionan, pero cambian de función dependiendo de las circunstan-
cias. En ocasiones, no resulta fácil determinar qué variable cumple la función
de causa y qué variable cumple la de efecto. Por ejemplo, con frecuencia re-
sulta difícil saber si es el rendimiento el que influye sobre la motivación o si
es la motivación la que influye sobre el rendimiento.
Por tanto, tenemos que ser precavidos: no podemos establecer ningún la-
zo de causalidad entre dos variables partiendo únicamente de la correlación
entre ambas.

COEFICIENTE DE CORRELACIÓN:
CUANTIFICACIÓN DE UNA RELACIÓN 9.4.

El concepto de correlación incorpora lógicamente la idea de la variación simultá-


nea de al menos dos conjuntos de datos que reflejan cada uno determinadas ca-
racterísticas medidas. Un coeficiente de correlación indica dos propiedades de
una relación. La primera es la magnitud de la relación, es decir, la fuerza, el gra-
do en que las variables varían juntas. La segunda es la dirección de la relación,
es decir, el hecho de que las variables varíen en forma conjunta de manera posi-
tiva, inversa o negativa, independiente o libre. El coeficiente de correlación pre-
senta el siguiente rango de valores convencionales: +1,0 (correlación perfecta
positiva); 0,0 (correlación nula); –1,0 (correlación perfecta negativa).
Para medir la fuerza de una relación, se puede recurrir a una amplia varie-
dad de coeficientes. Sin embargo, el coeficiente de correlación producto-mo-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 222

222 Introducción a la estadística

mento de Pearson, rxy, es el más utilizado, siendo las otras variedades casos
particulares del mismo; se utiliza rxy cuando el nivel de medida de las varia-
bles es igual o superior al de intervalo.
Si lo que tienes son puntuaciones directas, puedes utilizar la siguiente fórmula:

(Fórmula 9.1)

Donde:
N = número de sujetos.
= suma de los productos cruzados de X e Y.

= suma de las puntuaciones X.

= suma de las puntuaciones Y.

= producto de las sumas de las puntuaciones X e Y.

= suma de los cuadrados de las puntuaciones X.

= cuadrado de la suma de las puntuaciones X.

= suma de los cuadrados de las puntuaciones Y.

= cuadrado de la suma de las puntuaciones Y.

= raíz cuadrada.

A título de ejemplo, aplicamos la fórmula anterior a los datos de los pri-


meros cinco alumnos de nuestro estudio:

TABLA 9.2
rxy CON PUNTUACIONES DIRECTAS

X Y X2 Y2 XY

5,08 7,00 25,8064 49,0000 35,5600

3,08 3,65 9,4864 13,3225 11,2420

3,25 2,15 10,5625 4,6225 6,9875

5,58 6,25 31,1364 39,0625 34,8750

6,58 6,50 43,2964 42,2500 42,7700

23,57 25,55 120,2881 148,2575 131,4345


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 223

¿Cómo relacionar dos características de una determinada muestra? 223

Obtenemos:

Si en lugar de puntuaciones directas dispones de puntuaciones diferencia-


les, entonces debes utilizar la siguiente fórmula:

(Fórmula 9.2)

Donde:

= suma de los productos cruzados de x e y.

= suma de los cuadrados de las puntuaciones x.

= suma de los cuadrados de las puntuaciones y.

= producto de las sumas de los cuadrados de las puntuacio-


nes x e y.

= raíz cuadrada.

Aplicamos la fórmula anterior sobre las puntuaciones diferenciales:

TABLA 9.3
rxy CON PUNTUACIONES DIFERENCIALES

X Y x2 y2 xy

0,366 1,890 0,1340 3,5721 0,69174

–0,634 –1,460 2,6700 2,1316 2,38564

–1,464 –2,960 2,1433 8,7616 4,33344

0,866 1,140 0,7500 1,2996 0,98724

1,866 1,390 3,4820 1,9321 2,59374

0,000 0,000 9,1791 17,6970 Σ = 10,99180


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 224

224 Introducción a la estadística

Obtenemos:

Y si en lugar de puntuaciones directas o diferenciales tienes puntuaciones


típicas, entonces debes utilizar la siguiente fórmula:

(Fórmula 9.3)

Donde:

N = número de sujetos.
= suma de los productos cruzados de las puntuaciones típicas de
X e Y.

ZX ZY ZXZY

0,242 0,899 0,217

–1,079 –0,694 0,749

–0,966 –1,407 1,360

0,572 0,542 0,310

1,232 0,661 0,814

0,000 0,000 3,450

Es necesario advertir que un coeficiente de correlación no indica nada res-


pecto al porcentaje de una relación. Es decir, una correlación de 0,30 no
constituye la mitad de la relación de una de 0,60. El coeficiente aislado es
simplemente un índice muy útil, no una escala de medición real.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 225

¿Cómo relacionar dos características de una determinada muestra? 225

RELACIÓN DE rxy CON LA VARIANZA COMÚN 9.5.

Si dos distribuciones están relacionadas, esto significa que varían juntas total-
mente o hasta cierto punto. En consecuencia, se puede considerar la correla-
ción desde el punto de vista del grado de la varianza real que tienen en co-
mún las dos distribuciones. Esto es igual a r2.

GRÁFICO 9.5
r2 COMO PROPORCIÓN DE VARIANZA COMÚN

Parte teórica Parte práctica

Variación común

Para tener una idea más clara de lo que implica un valor de r, conviene
prestar atención al significado de r2 puesto que r2 es la proporción de varianza
que tienen en común dos medidas. A diferencia de r, el valor de r2 se puede
considerar en términos de una proporción o porcentaje de relación. Cuando se
emplea con este objetivo, r2 se conoce como coeficiente de determinación.

Coeficiente de determinación: r 2xy


En términos de este coeficiente, podemos decir que dos medidas con un va-
lor r2 de 0,50 poseerán el doble de varianza común que dos medidas que
tengan un valor r2 = 0,25.
En nuestro caso, el coeficiente de determinación asciende a 0,8622 =
0,743044, es decir, que las variables «Parte teórica» y «Parte práctica» comparten el
74,3044% de su varianza. A primera vista, se trata de una cantidad que es consi-
derable si tenemos en cuenta la naturaleza compleja de la variable rendimiento.
El porcentaje de varianza compartida es una estimación de la eficacia pre-
dictiva de los datos en estudio, en el sentido de que el porcentaje de varia-
ción compartida nos da cierta base para saber con qué eficacia podemos pre-
decir una variable cuando tenemos información acerca de la otra. De lo
relativo a la predicción hablaremos más adelante.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 226

226 Introducción a la estadística

El resto, conocido con el nombre de coeficiente de alienación, implica la


presencia de otras variables no contempladas en este estudio.

Coeficiente de alienación: 1 – r 2xy


En nuestro caso, la parte de la varianza total debida a la influencia de varia-
bles desconocidas asciende a:
Coeficiente de alienación: 1 – 0,743044 = 0,256956 o 25,6956%.

GRÁFICO 9.6
RELACIÓN ENTRE ÍNDICE DE CORRELACIÓN
Y COEFICIENTE DE DETERMINACIÓN

1,00
Coeficiente de determinación

0,75

0,50

0,25

0,00

0,00 0,25 0,50 0,75 1,00

Coeficiente de correlación

En este gráfico podemos intuir el significado de la relación de r con r2. De


hecho, los valores relativamente bajos de r (por ejemplo, 0,20) indican una
cantidad casi insignificante (por ejemplo, 0,04) de varianza común entre dos
medidas. Por otro lado, se observa que a medida que r se incrementa (por
ejemplo, 0,90) la proporción correspondiente de la varianza común (r2 = 0,81)
se acerca al valor de r; existe un solapamiento considerable entre r y r2.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 227

¿Cómo relacionar dos características de una determinada muestra? 227

ALGUNAS PRECAUCIONES PARA UTILIZAR rxy 9.6.

Ciertas condiciones deben cumplirse al usar rxy, especialmente si se piensa


someter rxy a una prueba de significatividad.
1. La relación entre X e Y debe ser esencialmente monotónica y de prefe-
rencia lineal.
2. La relación debe ser homoscedástica, es decir, los errores de estimación
en torno a la recta de mejor ajuste son similares en todos los niveles de
X e Y.
3. Los errores que afectan a cada una de las variables deben ajustarse a la
distribución normal; las variables en sí no tienen por qué distribuirse
normalmente.
Los diagramas de dispersión son una herramienta muy útil para identificar
una relación entre X e Y que no cumple la condición de monotonicidad. El
gráfico 9.6 es un buen ejemplo de esto. Si una relación no es monotónica, las
afirmaciones de probabilidad respecto de rxy son inexactas. Esto no es dema-
siado grave si se utiliza un nivel de error suficientemente restrictivo como
0,001. Si se sospecha que las tres condiciones han sido gravemente violadas,
lo más apropiado sería recurrir a una medida no lineal.

INTERPRETACIÓN DE rxy 9.7.

En el ejemplo que estamos comentando, intentamos averiguar la magnitud de


la relación que existe entre las dos partes que constituyen el primer examen
del curso. Obtuvimos un coeficiente de correlación de 0,862. Como comentá-
bamos antes, aparentemente se trata de un valor muy alto teniendo en cuenta
el tipo de variable. Ahora bien, cabe preguntarse si este valor, por muy alto
que sea, no se pudo obtener por azar. Dicho de otro modo, ¿estamos seguros
de que este valor es estadísticamente diferente a 0? Para despejar esta duda
parece lógico proceder a aplicar el contraste de hipótesis.
1. Formulación de H0 y de su correspondiente H1
Hipótesis nula: H0: rxy (0,862) = ρxy (= 0). El coeficiente de correlación
0,862 es estadísticamente igual a 0.
Hipótesis alternativa: H1: rxy (0,862) ≠ ρxy (= 0). El coeficiente de corre-
lación 0,862 no es estadísticamente igual a 0.
2. Elección justificada de la prueba estadística
rxy es un estadístico que se distribuye de acuerdo con el modelo t. Por tan-
to, la prueba estadística adecuada es la prueba t (modelo de distribución t).
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 228

228 Introducción a la estadística

3. Especificación del nivel de error o de significación (α)


Nivel de error: 0,01.
4. Definición de la distribución muestral del coeficiente de correlación rxy
La distribución muestral es una distribución de probabilidad, que se
forma con infinitos coeficientes de correlación obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,01.
Puesto que H1 no indica la dirección de las diferencias, la zona de re-
chazo está situada en ambos extremos de la distribución que incluye
todos los valores cuya probabilidad sea ≤ 0,01.
6. Cálculo del estadístico: prueba estadística
Para calcular el valor de t utilizamos la siguiente fórmula:

O bien:

(Fórmula 9.4)

Donde:
t = valor empírico correspondiente a rxy.
r = coeficiente de correlación.
n = número de sujetos.
1 – r2 = coeficiente de alienación.
= raíz cuadrada.

Aplicando la fórmula obtenemos:

O bien:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 229

¿Cómo relacionar dos características de una determinada muestra? 229

7. Interpretación estadística y pedagógica


Necesitamos determinar el valor crítico de t con el que comparar la t empírica
que acabamos de calcular. Para ello, es imprescindible conocer los grados de
libertad que tiene este estadístico.
a) Interpretación estadística
Los grados de libertad del estadístico t para la prueba de hipótesis relativa
a rxy son N-2. Sabiendo que α = 0,01, que H1 es bilateral y que los grados
de libertad son 5 – 2 = 3, el valor de la t crítica es de 5,841. Por tanto, po-
demos decir que la probabilidad de obtener por azar una t = 2,945 es ma-
yor que la de una t = 5,841, (α = 0,01). En consecuencia, se acepta H0. Al
tomar esta decisión, podríamos cometer un error del Tipo II. En esencia, la
aceptación de H0 equivale a afirmar que aceptamos que un coeficiente de
0,862 obtenido con cinco sujetos es bastante similar al que podríamos ob-
tener por azar.
b) Interpretación pedagógica
Teniendo en cuenta lo dicho en el apartado anterior, tendríamos que acep-
tar que la relación entre las dos partes del primer examen del curso es más
bien nula a pesar de la magnitud del coeficiente.
La interpretación de la magnitud de una correlación con frecuencia es un
asunto subjetivo. En la práctica, una relación que se considera como acep-
table en una situación puede parecer relativamente insignificante en otra.
En este caso, nos referimos a la implicación pedagógica del coeficiente y
no simplemente a su magnitud en el sentido estadístico. En nuestro caso, al
profesor de esta materia el coeficiente 0,862 le podría parecer excelente.
Aunque la descripción verbal de un coeficiente de correlación pueda resul-
tar sumamente relativa respecto a lo que evalúa, tenemos que admitir que
ayuda a uniformar la terminología al describir la magnitud del coeficiente
en sí mismo. Sin embargo, también hemos de destacar que hay algunas dis-
crepancias en las propuestas para la interpretación del coeficiente rxy. Vale
la pena destacar dos de estas propuestas:
• Guilford (1956) propone partir de los valores absolutos de los coeficien-
tes de correlación a los que asigna una valoración cualitativa:
<0,20 correlación ligera; relación casi insignificante.
0,20-0,40 correlación baja; relación definida pero pequeña.
0,40-0,70 correlación moderada; relación considerable.
0,70-0,90 correlación elevada; relación notable.
>0,90 correlación sumamente elevada; relación muy fiable.
• En cambio Fox (1981) se apoya básicamente en la proporción de varian-
za común para hacer su propuesta:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 230

230 Introducción a la estadística

± 0,50 o menos: correlación baja => apenas 25% de varianza común.


± 0,50 a ± 0,70: correlación moderada => 25% a 50% de varianza
común.
± 0,70 a ± 0,86: correlación alta => 50% a 75% de varianza común.
± 0,86 o más: correlación muy alta => más del 75% de varianza común.
Sabiendo lo que significa el coeficiente de determinación, probable-
mente consideres más defendible la propuesta de Fox que la de
Guilford. Sin embargo, sin una argumentación mejor desarrollada,
no parece que una propuesta sea mejor que otra.
En resumen, la secuencia de comprobaciones debe ir lógicamente de los
aspectos estadísticos a los pedagógicos. De hecho, carece de sentido proce-
der en orden inverso puesto que antes de considerar la dirección y magnitud
de un coeficiente, es necesario saber si es significativo o no.
Si se tiene un valor de r significativo, su interpretación depende esencial-
mente de la naturaleza de lo que se estudia. Desde luego, se espera que la di-
rección del coeficiente sea congruente con las expectativas del investigador.
Si se satisfacen, la interpretación de la dirección es un problema sencillo. En
el caso del profesor de esta materia, quizá deba fijarse en que el número de
alumnos que ha utilizado es muy pequeño. Obtendría una información más
precisa si utilizara los datos de todos los alumnos que han hecho el primer
examen del curso en vez de un número tan reducido. Recuerda que un nú-
mero pequeño de sujetos dificulta el rechazo de H0.

9.8. OTROS COEFICIENTES DE CORRELACIÓN

Como acabamos de ver, el coeficiente rxy se utiliza cuando el nivel de medida


de las variables es de intervalo o de razón. En los demás casos, se recurre a
otras fórmulas que producen resultados similares a rxy y con una interpreta-
ción equivalente.
• Cuando una o ambas variables son de nivel ordinal, entonces se utiliza
el coeficiente rho, rs de Spearman, cuya fórmula es:

• Cuando ambas variables son de nivel ordinal, entonces se utiliza el coe-


ficiente de correlación τ de Kendall, cuya fórmula es:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 231

¿Cómo relacionar dos características de una determinada muestra? 231

• Cuando una de las variables es de intervalo y la otra es dicotomizada,


entonces se utiliza el coeficiente biserial rb , cuya fórmula es:

• Cuando una de las variables es de intervalo y la otra es dicotómica, en-


tonces se utiliza el coeficiente biserial puntual rbp , cuya fórmula es:

• Cuando ambas variables son dicotomizadas, entonces se utiliza el coefi-


ciente tetracórico rt cuya fórmula es:

• Cuando ambas variables son dicotómicas, entonces se utiliza el coefi-


ciente cuádruple o Φ (phi), cuya fórmula es:

COVARIANZA 9.9.

Si deseas cuantificar la relación que existe entre dos series de puntuaciones o


variables puedes hacerlo mediante la covarianza, cuyo símbolo es Sxy. No te
extrañes si en algún otro manual te encuentras el símbolo σxy: ambos símbo-
los son similares; la diferencia consiste en que mientras el primero es un esta-
dístico muestral, el segundo es un parámetro.
Para calcular la covarianza basta aplicar la siguiente fórmula:

(Fórmula 9.5)
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 232

232 Introducción a la estadística

Donde:
Sxy = covarianza.
xiyi = producto cruzado de las puntuaciones diferenciales x e y.
XY = producto cruzado de las puntuaciones directas X e Y.
N = número de sujetos.
= suma.

Matemáticamente se puede definir la covarianza como el promedio del


producto cruzado de las puntuaciones diferenciales o el cociente del produc-
to cruzado de las puntuaciones diferenciales por el tamaño de la muestra o n
pares de puntuaciones; se suele tomar como denominador n-1 para obtener
el valor insesgado de la covarianza.
Si aplicamos la fórmula anterior sobre los datos de los primeros cinco
alumnos, obtenemos:

TABLA 9.4
COVARIANZA

X Y XY x y xy

5,08 7,00 35,5600 0,366 1,890 0,69174

3,08 3,65 11,2420 –0,634 –1,460 2,38564

3,25 2,15 6,9875 –1,464 –2,960 4,33344

5,58 6,25 34,8750 0,866 1,140 0,98724

6,58 6,50 42,7700 1,866 1,390 2,59374

ΣX = 23,57 ΣY = 25,55 ΣXY = 131,4345 Σxy =10,9918

Sx = 1,51485 Sy = 2,10339

Puntuaciones directas:

Puntuaciones diferenciales:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 233

¿Cómo relacionar dos características de una determinada muestra? 233

A diferencia del coeficiente de correlación, la covarianza varía entre –∞ y


+∞. La escala de medida no afecta a la magnitud de rxy; en cambio, sí a la
magnitud de Sxy. Tan amplio rango sólo permite establecer la tendencia, no el
grado de relación lineal que existe entre las dos variables. Para interpretar
una covarianza podrías utilizar como orientación general las siguientes suge-
rencias:
1. Si la covarianza es positiva, entonces la relación lineal entre las varia-
bles X e Y también es positiva.
2. Si la covarianza es negativa, entonces la relación lineal entre las varia-
bles X e Y también es negativa.
3. Si la covarianza es 0, entonces la relación lineal entre las variables X e
Y es nula o aleatoria.
Te habrás dado cuenta de que la interpretación de la covarianza sigue
aproximadamente la misma línea que la del coeficiente rxy con el que com-
parte algunas de sus características.
La covarianza es un estadístico que está lógicamente relacionado con el
coeficiente de correlación. De hecho, se puede definir la correlación rxy como
un cociente que se obtiene dividiendo la covarianza entre el producto de las
desviaciones típicas de X e Y:

(Fórmula 9.6)

Como recordarás, dividir un valor cualquiera de una distribución por la


desviación típica de dicha distribución equivale a estandarizarlo. Por ello, se
puede definir el coeficiente rxy como una covarianza estandarizada.

REGRESIÓN LINEAL SIMPLE 9.10

En el caso que nos ocupa, no le basta al profesor relacionar, por ejemplo, el


rendimiento de la parte teórica con los resultados de la parte práctica. Seguro
que su ya larga experiencia le lleva a intentar predecir, por ejemplo, el nivel
de rendimiento de cualquier alumno de su aula a partir de lo que sabe del ni-
vel de dominio de la teoría. El coeficiente rxy ya le ha informado que ambas
variables están relacionadas entre sí aunque no de un modo estadísticamente
significativo; pero lo que necesita es establecer una relación de tipo funcional
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 234

234 Introducción a la estadística

entre estas dos variables. Necesita otra herramienta de análisis, una que le
permita decir por ejemplo Y = f(X), o sea, Y es una función de X; lo cual im-
plica que X es la causa de Y, al menos parcialmente. Dicho en términos de su
problema de investigación, el dominio de la teoría es, en parte, la causa de
los resultados de la parte práctica del primer examen del curso. La herramien-
ta que necesita es el análisis de regresión, es decir, un método susceptible de
ayudarle a determinar la función específica que relaciona Y con X.
En la estadística moderna el término regresión no sólo refleja la interpreta-
ción biológica que le dio Galton (1822–1911) en su artículo de 1885, sino que
en general se refiere al problema de la predicción de una variable a partir del
conocimiento de otra u otras. Esto implica que previamente el investigador ha
debido establecer un marco teórico que le permita definir dos variables relacio-
nadas entre sí, de tal forma que una variable sea causa y otra efecto. Es decir, el
investigador podrá manipular la primera para ver qué ocurre en la segunda.
Cuando se utiliza el análisis de regresión, principalmente interesa la des-
cripción de una relación de predicción. El profesor de nuestro ejemplo puede
tener interés en averiguar de qué modo puede predecir el rendimiento de la
parte práctica conociendo el rendimiento de la parte teórica. Se trata, pues,
de averiguar de qué modo el dominio de la teoría determina el nivel de ren-
dimiento en la parte práctica. Esto significa que a partir de lo que sabemos de
una variable llamada causa, pretendemos predecir el valor de otra variable
considerada efecto. Por ello, la primera variable, X, recibe el nombre de varia-
ble predictora o independiente y la segunda, Y, se conoce como variable pre-
dicha, dependiente o criterio.
Se puede calcular esta predicción si se tiene un conjunto de puntuaciones
para las dos variables o aun si solamente se tienen sus medias, los errores tí-
picos de las dos medias y la correlación entre las dos variables. En cualquier
caso, interesa deducir una fórmula que permita estimar los valores pronostica-
dos de la variable predicha (Y) si se conocen los valores de la variable predic-
tora (X), así como determinar la fiabilidad de las estimaciones.
En realidad, con el análisis de regresión nos referimos al intento de des-
cribir la relación entre conjuntos de puntuaciones de dos variables mediante
una línea o una recta, conocida como recta de regresión o recta de mejor
ajuste.
Si te fijas en el gráfico 9.7 verás una recta que pasa en medio de los cinco
pares ordenados y que parece representarlos; y sin embargo, si te paras a
pensarlo, cualquier otra recta podría representar ese conjunto de cinco pun-
tos. De hecho, es infinito el número de rectas que podrían representar los
cinco pares ordenados del diagrama de dispersión. Ahora bien, sólo hay una
única recta que cumple el requisito de pasar a la mínima distancia de los cin-
co puntos a la vez. Piensa en esta recta como si fuera una línea óptima de
fuerza y lo entenderás perfectamente. Cualquier otra recta pasa necesariamen-
te a una distancia mayor.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 235

¿Cómo relacionar dos características de una determinada muestra? 235

El método utilizado para ajustar una recta de estas características a una nu-
be de puntos es el método de los mínimos cuadrados. Este nombre se debe a
que si nuestro interés reside en la predicción de Y a partir de X, el método de
mínimos cuadrados nos ayuda a colocar la recta de tal forma, que la suma
de los cuadrados de las distancias de cada par ordenado a la recta, medidas
dichas distancias sobre el eje Y, sea la mínima posible.

GRÁFICO 9.7
RECTA DE REGRESIÓN

6
Parte práctica

2
3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Parte teórica

Matemáticamente esta recta responde a una ecuación llamada ecuación de


regresión, que permite establecer la relación entre las variables X e Y. Me-
diante la ecuación de regresión se puede deducir la mejor estimación de un
valor Y a partir de cualquier valor de X. En el marco del problema que preo-
cupa al profesor de esta materia, esta ecuación le permite aventurar una pre-
dicción del rendimiento en la parte práctica gracias al conocimiento del nivel
de dominio de la parte teórica.
La forma general de esta recta responde a la siguiente ecuación: Y’ = a +
bX. Lógicamente, cuando haces una predicción, el valor que obtienes no es
un valor empírico ya que no procede de una prueba real. Por ello se utiliza el
símbolo Y’ para distinguir el valor predicho del valor empírico Y. Para una
recta dada, a define lo que se conoce como su ordenada al origen o constan-
te de intersección; éste es el valor de Y’ cuando X es igual a 0. b define la
pendiente o coeficiente de regresión de la recta e indica las unidades de incre-
mento de Y por una unidad de incremento de X.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 236

236 Introducción a la estadística

9.11. CÁLCULO DE LOS COEFICIENTES a Y b

Lo esencial en el cálculo de la fórmula anterior es determinar a qué equivalen


a y b en un problema dado.
Partiendo de las puntuaciones directas, puedes calcular la pendiente b
aplicando la siguiente fórmula:

(Fórmula 9.7)

Si utilizas los datos de la tabla 9.1, obtienes:

También puedes utilizar la siguiente fórmula:

(Fórmula 9.8)

Para calcular la constante de intersección, puedes utilizar la siguiente fórmula:

(Fórmula 9.9)

También puedes recurrir a la siguiente fórmula, cuyos resultados sufren el


leve efecto de la acumulación de errores de cálculo:

(Fórmula 9.10)
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 237

¿Cómo relacionar dos características de una determinada muestra? 237

Una vez averiguados los valores de los coeficientes a y b, puedes repre-


sentar la recta de regresión en el diagrama de dispersión.
Obsérvese que a medida que la recta se aproxima a valores menores de
los ejes horizontal y vertical, ésta se cruza con el eje vertical (gráfico 9.7). De
hecho, se puede observar que la intersección con el eje Y es, aproximada-
mente, –0,535, lo que indica que, en términos de la ordenada al origen, los
puntos correspondientes de Y exceden en –0,535 a los de los puntos de X. Se
trata del valor de Y cuando X = 0. Por otro lado, la pendiente, b, indica cuán-
tas unidades se incrementa la variable Y para cada incremento de la variable
X. En nuestro ejemplo, b es igual a 1,197, lo que significa que, además de la
ordenada al origen, para cada unidad que se incremente X, Y se incrementa
1,197. Si se incrementara b, la pendiente sería cada vez más pronunciada
cuando un incremento de una unidad en X presentara un incremento mayor
en la unidad correspondiente para Y. O bien si disminuyera b, el incremento
de una unidad X llevaría consigo un incremento menor para una unidad Y. O
sea, la pendiente de cualquier recta describe la razón del incremento de Y
con respecto al incremento de X.
A partir del conocimiento de los coeficientes de regresión y teniendo en
cuenta los valores de X sin sus correspondientes parejas en Y, podemos utili-
zar esta recta de regresión para estimar o predecir los valores de Y correspon-
dientes a esos valores de X. En nuestro caso, la función que relaciona X e Y
se formula así: Y’ = –0,535 + 1,197X. Con estos datos podemos hallar el valor
de Y’ para un valor cualquiera de X: bastaría multiplicar X por b y sumar a al
resultado. Por ejemplo, si X = 5, entonces Y’ = –0,535 + (1,197 × 5) = 5,45.
La distancia de cualquier punto a la recta, medida sobre el eje Y, es senci-
llamente Y-Y’. Como acabamos de explicar, el método de mínimos cuadrados
coloca la recta en una posición tal que la suma de los cuadrados de estas dis-
tancias es la mínima posible; esto es, la recta está colocada en tal posición
que la expresión es un mínimo.
Las diferencias que implica la expresión exigen plantearse y
responder a la pregunta de qué tan satisfactoria es la predicción. Dicho de
otro modo, suponiendo que el experimento consistente en realizar la parte
teórica del primer examen del curso, se repite un número infinito de veces y
arroja como resultado 5 para el alumno X, ¿podemos estar seguros de que
obtendrá siempre 5,45 en la parte práctica? Al estimar su rendimiento en la
parte práctica, ¿no cabe la posibilidad de que estemos cometiendo algún tipo
de error? Para contestar estas preguntas necesitamos determinar la variación
ligada al nivel de confianza en la predicción; necesitamos calcular el error tí-
pico de estimación.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:17 Página 238

238 Introducción a la estadística

9.12. ERROR TÍPICO DE ESTIMACIÓN


Cuando la correlación es perfecta, la predicción es perfecta también. De he-
cho, si conoces X puedes predecir Y con total exactitud. Por ejemplo, si co-
noces el radio puedes predecir la longitud de la circunferencia con absoluta
certeza. A medida que rxy se aleja de |1|, disminuye el nivel de seguridad
de la predicción. Es decir, los errores de predicción se incrementan a medida
que disminuye el índice de correlación; alcanzan su nivel máximo cuando
rxy = 0.
Determinar la cuantía del error típico de estimación tiene por objetivo
proporcionar una estimación de la exactitud o del error de la predicción. En
el diagrama de dispersión se puede observar cómo varían los valores reales
de las puntuaciones Y en torno a la recta de regresión. Por cierto, ¿te diste
cuenta de que todos los valores predichos están alineados en la recta de re-
gresión?
Lógicamente, cuanto más varíen los valores Y respecto a los valores predi-
chos Y’, mayor será el error que se comete al hacer predicciones a partir de la
ecuación. El error se incrementa a medida que disminuye la correlación lineal
entre las dos variables. Observa la ecuación que se utiliza para el cálculo del
error típico de estimación de Y a partir de X:

(Fórmula 9.11)

Los componentes de esta ecuación muestran a) que cuanto mayor sea la


correlación de X e Y, menor será el error típico de estimación, y b) que cuan-
to mayor sea la variabilidad de Y (sy), mayor será el error típico de estima-
ción. Luego, podemos concluir que el error típico de estimación varía de 0 a
sy. Cuando r = 1 y todos los puntos caen exactamente sobre la recta de regre-
sión, σyx = 0; cuando r = 0, entonces σyx = sy.
Consideremos, por ejemplo, la variable Y, con una desviación típica
sy = 2,10339. Para diferentes valores de r, los valores correspondientes de σyx
son los siguientes:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 239

¿Cómo relacionar dos características de una determinada muestra? 239

TABLA 9.5
ERRORES DE PREDICCIÓN PARA DISTINTOS VALORES DE rxy

rxy

0,00 1,000 2,10339

0,10 0,995 2,09287

0,20 0,980 2,06132

0,30 0,954 2,00663

0,40 0,917 1,92881

0,50 0,866 1,82154

0,60 0,800 1,68271

0,70 0,714 1,50182

0,80 0,600 1,26203

0,90 0,436 0,91708

1,00 0,000 0,00000

Un detenido análisis de esta tabla nos muestra que, incluso para valores
realmente altos de rxy, la magnitud del error de estimación es bastante consi-
derable y que la disminución del error de estimación es más lenta que el au-
mento de la correlación. Esto nos indica que cuando hagamos predicciones
de los valores de una variable a partir de los de otra, debemos tener mucho
cuidado con el alcance de nuestras afirmaciones.
Por otra parte, el error típico de estimación tiende a ser relativamente
grande cuando la muestra es pequeña.
Nótese que el error típico de estimación no es sensible al signo de rxy.
Desde el punto de vista de la predicción, una correlación de –0,70, por ejem-
plo, proporciona la misma exactitud en la estimación que una correlación de
+0,70.
Cuando se utilizan puntuaciones típicas, el error típico de estimación es
sencillamente , o sea, la raíz cuadrada del coeficiente de alienación.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 240

240 Introducción a la estadística

INTERPRETACIÓN DEL ERROR TÍPICO


9.13. DE ESTIMACIÓN
Como indica su nombre, el error típico de estimación se puede interpretar en
el mismo sentido que el error típico de una distribución de medias, pero esta
vez en referencia a la diferencia entre las puntuaciones Y e Y’. En consecuen-
cia, se puede interpretar en términos de valores de probabilidad. Ya sabemos
que el error típico de la media equivalente a 1 comprende el 34% de una dis-
tribución normal a cada lado de la media, o bien el 68% central. En el caso
del error típico de estimación σyx, el procedimiento es similar. Es decir, si σyx
= 1 se espera que la predicción verdadera de Y quede comprendida a más o
menos 1 σyx de la estimación de Y, el 68% de las veces, o bien el 32% fuera
de este intervalo. Más concretamente, para el alumno cuya puntuación en la
parte teórica es de 5, se le predice un rendimiento en la parte práctica que se
encuentra entre 5,45 + 1,06622 = 6,51622 y 5,45 – 1,06622 = 4,38378. Si bajá-
semos el nivel de error que estamos dispuestos a asumir en nuestra predic-
ción hasta el 5%, la puntuación predicha para este alumno estaría entre
7,53979 y 3,36021.
Una forma sencilla de comprender el σyx es representarlo gráficamente
junto con una recta de regresión como se ve en el gráfico adjunto: a la recta
de regresión se agrega una línea a ambos lados para representar el 34% de
probabilidad de que las estimaciones de Y puedan ser mayores que las pro-
nosticadas por la recta de regresión, y el 34% de que sean menores.

GRÁFICO 9.8
RECTA DE REGRESIÓN Y PREDICCIÓN DE Y

6
Parte práctica

2
3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Parte teórica
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 241

¿Cómo relacionar dos características de una determinada muestra? 241

CON LA AYUDA
DE PROGRAMAS INFORMÁTICOS 9.14.

Como ya sugerimos al final del tercer capítulo, la ayuda de programas infor-


máticos puede facilitar la tarea de realizar tediosos análisis estadísticos. Traba-
jar con cinco sujetos es sin duda más fácil que realizar operaciones que impli-
can a un gran número de alumnos. De hecho, no fueron cinco los alumnos
que se presentaron al primer examen del curso, sino 73.
Si quieres calcular el coeficiente de correlación entre la parte teórica «Teo-
ría I» y la parte práctica «Práctica I», ésta es la secuencia de comandos del
programa SPSS que deberás activar.
Como se trata de analizar datos, deberás abrir el desplegable «Analizar» y
seleccionar la opción que convenga a tu propósito.
1. Empezamos por calcular el coeficiente de correlación producto-mo-
mento de Pearson (figura 9.1). Por ello seleccionamos «Correlaciones» y
finalmente activamos la opción «Bivariadas».

FIGURA 9.1
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «CORRELACIONES»

Una vez fijado el objetivo de tu análisis, deberás seleccionar las variables


que serán analizadas (figura 9.2). Puedes seleccionar tantas variables como
quieras; el programa procederá al cálculo de los coeficientes rxy de todas
las combinaciones de variables tomadas de dos en dos. Por defecto, el
programa calcula el coeficiente de correlación producto-momento de Pear-
son. Puedes marcar otros coeficientes si el nivel de medida así lo exige.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 242

242 Introducción a la estadística

FIGURA 9.2
SELECCIÓN DE VARIABLES QUE ANALIZAR

Cuando pulses la orden «Aceptar», el programa producirá resultados pa-


recidos al contenido de la tabla rotulada «Correlaciones». Como la co-
rrelación de X con Y es la misma que la de Y con X, el programa da
los resultados una sola vez.

FIGURA 9.3
RESULTADOS DEL ANÁLISIS DE CORRELACIÓN DE PEARSON
Correlaciones

Teoría 1 Práctica 1

Teoría I Correlación de Pearson


Sig. (bilateral)
N

Práctica I Correlación de Pearson ,474*


Sig. (bilateral) ,000*
N 73

En nuestro caso, rxy es de 0,474. Con el término Sig. (bilateral), el pro-


grama te informa sobre la probabilidad de obtener un coeficiente de
correlación de 0,474 por azar, siendo H1 bilateral; este coeficiente tiene
una probabilidad de ocurrir por azar prácticamente igual a 0 con
N = 73. Esto significa que si el nivel de error (α) es 0,01, debes recha-
zar H0.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 243

¿Cómo relacionar dos características de una determinada muestra? 243

Posiblemente te estés preguntado: ¿cómo es posible aceptar H0 con


rxy = 0,862 siendo N = 5 y, sin embargo, rechazar H0 con rxy = 0,474
siendo N = 73, cuando las variables son exactamente iguales? En primer
lugar, recuerda lo que decíamos sobre los errores del Tipo I y II y muy
especialmente sobre la potencia de las pruebas. Cuando el tamaño de N
es muy pequeño, resulta muy difícil rechazar H0 aunque tengamos la im-
presión de que lo deberíamos hacer. Con N = 73 resulta más fácil recha-
zar H0 que con N = 5 porque la potencia de la prueba mejora notable-
mente. Por otra parte, seguro que te parece que 0,474 es un coeficiente
más bien pobre aunque sea estadísticamente significativo. Es probable
que tengas razón, pero te conviene saber que el tamaño de un coeficiente
de correlación depende de alguna manera de la homogeneidad o hete-
rogeneidad de la población de la cual se ha extraído la muestra. Se sabe
que la selección que se produce a lo largo de los años de escolarización
acaba restringiendo la amplitud de variación entre los estudiantes. Dicho
de otro modo, los alumnos matriculados en esta materia se parecen mu-
cho entre sí debido a su historial escolar. Esto se traduce en una conside-
rable disminución del coeficiente de correlación puesto que al disminuir
la varianza en cuanto a su capacidad para comprender la teoría (X) tam-
bién decrece la varianza en cuanto a su capacidad para ejecutar aquellas
operaciones lógico-matemáticas (Y) ligadas a los aspectos teóricos. En
consecuencia, no es extraño que el índice de correlación entre las pun-
tuaciones en ambos aspectos parezca más bien bajo.
2. Calculemos los coeficientes a y b para la predicción de Y a partir de X. Por
ello seleccionamos «Regresión» y finalmente activamos la opción «Lineal».

FIGURA 9.4
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «REGRESIÓN»
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 244

244 Introducción a la estadística

Una vez decidido que tu objetivo es el de llevar a cabo un análisis de


regresión lineal, deberás seleccionar las variables teniendo en cuenta
que cada una cumple una función diferente en tu diseño: una es pre-
dictora y se incorpora en el análisis como variable independiente y la
otra es predicha y el programa la reconoce como variable dependiente
(figura 9.4).

FIGURA 9.5
SELECCIÓN DE LA VARIABLE DEPENDIENTE
Y DE LA VARIABLE INDEPENDIENTE

A la orden de «Aceptar», el programa responde con varios tipos de resulta-


dos. El que nos interesa es el que hace referencia a los coeficientes a y b (fi-
gura 9.5).

FIGURA 9.6
RESULTADOS DEL ANÁLISIS DE REGRESIÓN LINEAL

Coeficientes no Coeficientes
estandarizadas estandarizados
Modelo t Sig.
B Error tip. Beta

1 (Constante) –,146 ,940 –,155 ,877


Teoría 1 ,815 ,180 ,474 4,536 ,000
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 245

¿Cómo relacionar dos características de una determinada muestra? 245

Para N = 73, el programa nos informa de que el valor de la ordenada al


origen o constante de intersección a es de –0,146 y la pendiente o coeficien-
te de regresión b de la recta es de 0,815. Para cada uno de estos valores, el
programa calcula también el error típico. Vale la pena prestar atención al
coeficiente estandarizado 0,474 que, como sabes, es igual al coeficiente de
correlación producto-momento de Pearson. Para la constante a y para el co-
eficiente b estandarizado el programa proporciona los datos necesarios para
el contraste de hipótesis mediante los valores empíricos para la prueba t y
la probabilidad asociada de ocurrencia por azar. Así, observamos que para
la constante se puede aceptar H0 mientras para rxy habría que rechazarla, si
α = 0,01.
La recta de regresión podría definirse como sigue: Y’ = –0,146 + 0,815 X.
Así, para un alumno que tiene un 5 en la teoría se le podría predecir –0,146 +
(0,815*5) = 3,929 en la parte práctica.

TU TURNO 9.15.

1. ¿Cuál de las siguientes afirmaciones sobre la relación entre dos variables


es cierta?
1. Si descubres que existe una fuerte relación entre dos variables, puedes
afirmar que estás ante un esquema causal.
2. Si dos variables están relacionadas de forma que cuando los valores
de la primera bajan los de la segunda suben, puedes afirmar que la re-
lación es positiva.
3. Si dos variables están relacionadas de forma que cuando los valores
de la primera bajan los de la segunda bajan también, puedes afirmar
que la relación es positiva.
4. Si en una ocasión obtienes un coeficiente de correlación de 0,90 y en
otra obtienes 0,45, puedes afirmar que el primer coeficiente constituye
el doble de la relación de la segunda.
2. Si al calcular el coeficiente de correlación entre dos variables se obtiene
un valor de 0,90, se puede afirmar que:
1. Su varianza común es de 0,90.
2. Su coeficiente de determinación es 0,81.
3. Su coeficiente de alienación es de 0,10.
4. Su covarianza es de 0,90.
3. Empieza por formular —no copiar— dos afirmaciones consecutivas como
las siguientes: a) el rendimiento de la parte práctica está relacionado con
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 246

246 Introducción a la estadística

el rendimiento de la parte teórica; b) el rendimiento de la parte teórica


condiciona el rendimiento de la parte práctica.
1. Calcula el coeficiente de correlación entre las variables mencionadas en
a). Comprueba si se trata de un coeficiente igual o no a 0. No te olvides
de que te toca decidir el nivel de error que estás dispuesto a asumir.
2. Calcula la covarianza entre ambas variables.
3. Indica la variable predictora y la variable predicha y calcula los valores
de a y b en b). Finalmente, establece la función que relaciona ambas
variables en el marco de este problema.
4. Calcula el valor que se predice para la variable predicha si el alumno
tiene una determinada puntuación, que fijas tú, en la variable predicto-
ra, a un nivel de confianza del 98%.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 247

Capítulo 10
¿CÓMO AVERIGUAR SI DOS MUESTRAS SON
SIMILARES O NO EN UNA DETERMINADA
CARACTERÍSTICA?

Al finalizar este capítulo deberías:


• Conocer el concepto de diferencia entre las medias de dos grupos.
• Conocer las diferencias entre muestras independientes y correla-
cionadas.
• Conocer las diferencias entre muestras pequeñas y grandes.
• Ser capaz de hallar el error típico de la diferencia entre dos medias.
• Ser capaz de realizar el contraste de hipótesis con relación a la di-
ferencia de medias.

(Antes de proseguir, te recuerdo que es importante que eches una atenta mi-
rada retrospectiva sobre el capítulo 2; el apartado 2 que trata de la aproxi-
mación a la clasificación de los diseños según el criterio del grado de con-
trol, merece una atención especial. Detente sobre las funciones de las
variables en el marco de los diseños experimentales y muy especialmente so-
bre los conceptos de variable dependiente e independiente.)

En el capítulo anterior acabamos de ver cómo se procede no sólo para rela-


cionar dos características sino también para predecir los resultados de una va-
riable a partir de lo que se sabe de otra. Esta vez vamos a centrar nuestros es-
fuerzos en determinar el impacto de una variable, llamada causa o variable
independiente, sobre otra variable, llamada dependiente, en la que se mide el
efecto. Si has hecho una buena revisión sabrás que las variables nominales,
dicotómicas, dicotomizadas, politómicas o politomizadas son las que se sue-
len utilizar como variables independientes mientras que las variables de razón
o de intervalo aparecen en los diseños experimentales como variables depen-
dientes.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 248

248 Introducción a la estadística

OBJETIVO DEL ANÁLISIS DE DIFERENCIA


10.1. ENTRE DOS MEDIAS

Como sugerimos en el capítulo anterior, nos interesa identificar esquemas


causales cuya vigencia vaya más allá de lo que ocurre por azar. Con la predic-
ción fuimos capaces de establecer un inicio de esquema causal cuando pudi-
mos indicar de qué modo los resultados obtenidos en una variable predecían
los que se podían alcanzar en otra variable. Sin embargo, saber que una va-
riable permite predecir otra, no nos indica de qué modo la primera influye
sobre la segunda. De hecho, no sabemos qué es lo que habría que modificar
para mejorar la relación predictiva entre las dos variables. Para mejorar lo que
sabemos sobre este esquema causal necesitamos conocer las condiciones que
explican estos resultados. Para ello tenemos que pensar en términos de dise-
ño experimental o cuasiexperimental. Por ejemplo, el profesor de esta materia
debería preguntarse si hay alguna condición que está influyendo sobre los re-
sultados de sus estudiantes. Dicho en referencia al problema de investigación
de este profesor, ¿cabe la posibilidad de que el hecho de que sus estudiantes
asistan a clases de apoyo tenga algo que ver con los resultados que obtienen?
Para dar una respuesta cabal a su pregunta, debería formar dos grupos que
sean iguales en aptitudes básicas relativas a esta materia y asignar aleatoria-
mente un grupo a la asistencia a clases de apoyo y otro sólo a las clases habi-
tuales. Al comparar las medias de rendimiento de ambos grupos, sabrá cuál
de los dos obtiene mejores resultados, siempre que las divergencias observa-
das sean claramente diferentes a las que ocurren por azar.
El diseño susceptible de proporcionar los datos necesarios para responder
a la pregunta del profesor es relativamente sencillo:
• Una variable independiente como la asistencia a clases de apoyo. Esta
variable permite definir dos grupos: a) alumnos que asisten a clases de
apoyo y b) alumnos que no asisten a clases de apoyo. Además de sus
clases habituales, los primeros realizan una serie de ejercicios comple-
mentarios y reciben explicaciones para su desarrollo. Los segundos sólo
asisten a clase.
• Una variable dependiente: rendimiento que se mide a través de una
prueba en la que los alumnos deben resolver varios ejercicios relaciona-
dos con la investigación, además de un cierto conjunto de preguntas
teóricas relacionadas.
El proceso que hay que ejecutar para responder a la pregunta de investi-
gación sigue una lógica bastante sencilla: hallar las medias de ambos grupos
y compararlas. Si la diferencia entre las dos medias es estadísticamente signifi-
cativa, entonces los dos grupos se distinguen en su nivel de rendimiento. Esto
permitiría afirmar que lo que explica esta diferencia es la asistencia o no a las
clases de apoyo.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 249

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 249

Sin embargo, la aplicación de este proceso exige que se cumplan ciertos


prerrequisitos:
• La característica que se estudia, el rendimiento en este caso, debe distri-
buirse normalmente en la población.
• La distribución de las diferencias entre las medias debe ser normal. Sin
embargo, esta condición no se cumple cuando N es inferior a 30; en este
caso, la distribución de las diferencias entre medias sigue el modelo t.
• En el caso de grupos independientes, es decir, cuando la asignación de
un sujeto a un grupo no influye sobre la asignación de cualquier otro
sujeto, las varianzas de ambos grupos deben ser similares.
Por cierto, tras sesudas comprobaciones se ha llegado a la conclusión de
que aunque no se cumplan todos los requisitos matemáticos, ésta es una
prueba robusta.
Antes de entrar en materia conviene que prestemos atención a algunas
cuestiones de lógica básica. Seguro que recuerdas qué significa el concepto
de H0. Si es así, ¿podrías decirme el valor que representa H0 en relación con
las diferencias entre medias? Si no esperas que haya diferencias entre las me-
dias de los dos grupos, lo lógico es que obtengas 0 o un valor muy próximo.
Esto a su vez significa que a medida que el valor obtenido se aleja de 0, ma-
yores serán las diferencias entre las medias de los grupos que estás compa-
rando.
Por cierto, si midieras un número infinito de pares de muestras y hallaras
la diferencia entre las medias de cada par, ¿cuál sería la media de esta distri-
bución? Creo que ya debes suponer que, si el número de diferencias es infini-
to, en unos casos obtendrás resultados positivos y en otros casos negativos,
aproximadamente en igual proporción. Si sumas todas las diferencias entre
los pares de medias, lo lógico es que los valores positivos anulen los negati-
vos y que obtengas como suma 0. Como ya sabes, la media de 0 es 0.
Por otro lado, al hallar las diferencias entre tus infinitos pares de medias
habrás observado cómo aparece paulatinamente una distribución de diferen-
cias entre medias, ya que todas las diferencias no son iguales. Las más nume-
rosas son las que se encuentran cerca de 0, siendo cada vez menos frecuentes
a medida que el valor de la diferencia se incrementa a ambos lados de 0. Si
obtienes una distribución, eso significa que puedes calcular el grado de dis-
persión de esas diferencias en torno a su media 0; esa dispersión se conoce
como error típico de las diferencias entre medias, σdif.
El modo de calcular el error típico depende de dos factores: el tamaño y
la relación que tienen las muestras entre sí. En cuanto al tamaño, las muestras
se clasifican en dos grupos: a) muestras pequeñas, si N es inferior a 30 y b)
muestras grandes, si N es igual o mayor que 30. En cuanto al segundo factor,
las muestras se clasifican en a) independientes cuando, como ya sabes, son
muestras cuyos miembros han sido elegidos y asignados de un modo aleato-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 250

250 Introducción a la estadística

rio y b) correlacionadas, cuando la misma muestra se mide en dos ocasiones


diferentes, como antes y después de un experimento, o cuando los miembros
se eligen de forma que los sujetos sean iguales dos a dos en determinadas va-
riables relevantes.
Si cruzamos el tamaño de las muestras con su relación, obtenemos cuatro
modos diferentes de calcular el error típico de las diferencias entre las medias:
• Muestras grandes e independientes:

(Fórmula 10.1)

Donde:
σdif = error típico de las diferencias entre medias.
N = número de sujetos de cada uno de los grupos A y B.
S2 = varianza de cada uno de los grupos A y B.
= raíz cuadrada.

• Muestras pequeñas e independientes

(Fórmula 10.2)

Donde:
σdif = error típico de las diferencias entre medias.
N = número de sujetos de cada uno de los grupos A y B.
S2 = varianza de cada uno de los grupos A y B.
= raíz cuadrada.

Como el tamaño de N es pequeño hay que tener en cuenta que se pier-


de un grado de libertad para cada uno de los grupos. Por tanto, quedan
NA + NB – 2 grados de libertad.

• Muestras grandes y correlacionadas:

(Fórmula 10.3)

Donde:
σdif = error típico de las diferencias entre medias.
N = número de sujetos de cada uno de los grupos A y B.
S2 = varianza de cada uno de los grupos A y B.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 251

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 251

rAB = coeficiente de correlación entre las puntuaciones A y B.


S = desviación típica de cada uno de los grupos A y B.
Sdif = desviación típica de la distribución de diferencias entre las
puntuaciones A y B.
= raíz cuadrada.

• Muestras pequeñas y correlacionadas:

(Fórmula 10.4)

Donde:
σdif = error típico de las diferencias entre medias.
N = número de sujetos de cada uno de los grupos A y B.
S2 = varianza de cada uno de los grupos A y B.
rAB = coeficiente de correlación entre las puntuaciones A y B.
S = desviación típica de cada uno de los grupos A y B.
Sdif = desviación típica de la distribución de diferencias entre las
puntuaciones A y B.
= raíz cuadrada.

Cuando el tamaño de N es pequeño y las muestras están correlacionadas,


hay que tener en mente que es como si tuviéramos un único grupo de suje-
tos. Por tanto, el número de grados de libertad equivale a N-1.

CASO DE N GRANDE
Y MUESTRAS INDEPENDIENTES 10.2.

Veamos cómo poner todo lo que acabamos de exponer al servicio de la solu-


ción de nuestro problema de investigación. Ahora bien, antes de proceder al
contraste de hipótesis, conviene recalcar que la asignación de los alumnos no
se hizo de forma aleatoria: cada alumno decidió libremente acogerse a la
oferta que hizo el profesor. Esta oferta consistía en que unos monitores debi-
damente entrenados ayudaban a los alumnos a resolver sus dudas para la solu-
ción de problemas de investigación, así como la relación de éstos con la teoría.
Al finalizar los primeros cuatro meses del curso, 73 de los 93 alumnos matri-
culados realizaron su primer examen de la materia; de éstos, sólo 12 habían
participado activamente en el experimento. El profesor se pregunta si la asis-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 252

252 Introducción a la estadística

tencia a las clases de apoyo ha supuesto una mejora (véase capítulo 2, aparta-
do «Hipótesis sustantivas»). Para despejar sus dudas, el profesor procede al
consiguiente contraste de hipótesis respecto de la parte práctica de dicho
examen.
1. Formulación de H0 y de su correspondiente H1
Hipótesis nula: H0: μA – μB = 0 o bien μA = μB. El rendimiento pro-
medio obtenido por los alumnos que asistieron a las clases de apoyo
es estadísticamente similar al rendimiento promedio de los que asistie-
ron sólo a las clases tradicionales.
Hipótesis alternativa: H1: μA ≠ μB. El rendimiento promedio obtenido
por los alumnos que asistieron a las clases de apoyo es estadísticamen-
te diferente al rendimiento promedio de los que asistieron sólo a las
clases tradicionales.
2. Elección justificada de la prueba estadística
Para elegir la prueba estadística que se debe aplicar es necesario tener
en cuenta tanto la variable dependiente como la independiente. En
cuanto a la variable dependiente, rendimiento en la parte práctica, se
trata de una variable de intervalo. La variable independiente, métodos
de enseñanza, es una variable nominal que tiene dos valores: a) con
clases de apoyo y b) sin clases de apoyo. La prueba estadística adecua-
da es la que nos permite establecer la diferencia entre dos medias; ésta
es la prueba conocida como t de Student, desarrollada por William
Gosset (1876-1937). Como uno de los grupos comprende 61 sujetos, se
considera que estamos en el caso de N>30. Por tanto, el modelo de dis-
tribución de las diferencias entre medias es el de la distribución nor-
mal, modelo Z o de la Razón Crítica para dos muestras grandes e in-
dependientes.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,01.
4. Definición de la distribución muestral de Zi
La distribución muestral es una distribución de probabilidad, que se
forma con infinitos valores de Zi obtenidos de infinitas muestras aleato-
rias de la misma población, todas del mismo tamaño que la del proble-
ma de investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,01.
Puesto que H1 no indica la dirección de las diferencias, la zona de re-
chazo está situada en ambos extremos de la distribución e incluye to-
dos los valores cuya probabilidad sea ≤ 0,01.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 253

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 253

6. Cálculo del estadístico: prueba estadística


Para calcular el valor de Zi utilizamos la siguiente fórmula:

(Fórmula 10.5)

Donde:
Zi = puntuación típica correspondiente a la diferencia entre medias.

X = media de cada una de las dos muestras.
H0 = valor que representa la hipótesis nula.
σdif = error típico de las diferencias entre medias.

TABLA 10.1
ESTADÍSTICOS DESCRIPTIVOS: CLASES DE APOYO

N Media Desviación típica

Clases de apoyo Sí 12 5,5083 1,71780

No 61 3,5984 2,85292

Primero, hallamos el error típico partiendo del supuesto de que las dos
muestras son grandes e independientes:

Luego aplicamos la fórmula 10.5 para obtener Zi:

7. Interpretación estadística y pedagógica


a) Interpretación estadística: los resultados obtenidos nos permiten
afirmar que la probabilidad de obtener por azar una Zi = 5,03 es
menor que la de una Zi crítica de 2,58 (α = 0,01). En consecuencia,
se rechaza H0. Al tomar esta decisión, se podría cometer un error
del Tipo I. En esencia, el rechazo de H0 equivale a afirmar que la
diferencia observada se debe a alguna causa distinta del mero azar;
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 254

254 Introducción a la estadística

esta diferencia está a favor de la muestra que ha asistido a las clases


de apoyo.
b) Interpretación pedagógica: teniendo en cuenta la conclusión esta-
dística, podríamos decir que por término medio los alumnos que
han participado en las clases de apoyo rinden más que los que sólo
asistieron a las clases tradicionales.

CASO DE N GRANDE
10.3. Y MUESTRAS CORRELACIONADAS

Este profesor no ha terminado con las preguntas relacionadas con el primer


examen del curso: ahora se pregunta si el rendimiento de sus alumnos en la
parte teórica es igual al de la parte práctica. Para despejar sus dudas, procede
a llevar a cabo el correspondiente contraste de hipótesis.
1. Formulación de H0 y de su correspondiente H1
Hipótesis nula: H0: μA – μB = 0 o bien μA = μB. El rendimiento pro-
medio obtenido por los alumnos en la parte teórica es estadísticamente
similar al de la parte práctica.
Hipótesis alternativa: H1: μA ≠ μB. El rendimiento promedio obtenido
por los alumnos en la parte teórica es estadísticamente diferente al de
la parte práctica.
2. Elección justificada de la prueba estadística
La variable dependiente, rendimiento, es una variable de intervalo. La va-
riable independiente, aspecto medido de la materia, es una variable nomi-
nal que define dos valores: parte teórica y parte práctica. La prueba esta-
dística adecuada es la prueba t de Student. Como los 73 alumnos son
examinados una primera vez en la parte teórica y una segunda vez en la
parte práctica, se considera que estamos en el caso de muestras correla-
cionadas y con N>30. Por tanto, se entiende que el modelo de distribu-
ción de las diferencias entre medias es el de la distribución normal, mo-
delo Z o de la Razón Crítica para dos muestras grandes y correlacionadas.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,05.
4. Definición de la distribución muestral de Zi
La distribución muestral es una distribución de probabilidad, que se
forma con infinitos valores de Zi obtenidos de infinitas muestras aleato-
rias de la misma población, todas del mismo tamaño que la del proble-
ma de investigación.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 255

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 255

5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,05.
Puesto que H1 no indica la dirección de las diferencias, la zona de re-
chazo está situada en ambos extremos de la distribución e incluye to-
dos los valores cuya probabilidad sea ≤ 0,05.
6. Cálculo del estadístico: prueba estadística
Para calcular el valor de Zi utilizamos la siguiente fórmula:

(Fórmula 10.5)

Donde:
Zi = puntuación típica correspondiente a la diferencia entre medias.

X = media de cada una de las dos muestras.
H0 = valor que representa la hipótesis nula.
σdif = error típico de las diferencias entre medias.

TABLA 10.2
ESTADÍSTICOS DESCRIPTIVOS:
PARTE TEÓRICA Y PARTE PRÁCTICA

N Media Desviación típica

Primer examen Parte teórica 73 4,9772 1,61758


del curso
Parte práctica 73 3,9123 2,78236

Como en el caso anterior, primero hallamos el error típico partiendo


del supuesto de que las dos muestras son grandes y están correlaciona-
das. Recuerda que el coeficiente de correlación producto-momento de
Pearson ya lo calculamos en el capítulo anterior y era 0,474. Ahora
aplicamos la fórmula 10.3:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 256

256 Introducción a la estadística

Luego aplicamos la fórmula 10.5 para obtener Zi:

7. Interpretación estadística y pedagógica


a) Interpretación estadística: los resultados obtenidos permiten al pro-
fesor afirmar que la probabilidad de obtener por azar una Zi = 3,68
es menor que la de una Zi crítica de 1,96 (α = 0,05). En consecuen-
cia, rechaza H0. Al tomar esta decisión, podría cometer un error del
Tipo I. El rechazo de H0 equivale a afirmar que la diferencia obser-
vada se debe a alguna causa distinta del mero azar; esta diferencia
está a favor de la parte teórica frente a la parte práctica.
b) Interpretación pedagógica: esto significa que por término medio los
alumnos no rinden por igual en las dos partes del examen; es más,
parecen entender mejor la teoría que la práctica. Dicho en otros tér-
minos, parece que les resulta difícil traducir los conceptos teóricos
en operaciones estadísticas concretas.

CASO DE N PEQUEÑA
10.4. Y MUESTRAS CORRELACIONADAS

Sin embargo, aquí no terminan las ganas de saber del profesor en cuanto a
su materia. Ahora, el profesor se interesa por lo que ocurre con los alumnos
que aceptaron participar activamente a las clases de apoyo que diseñó: ¿rin-
den como la clase en su conjunto en la parte teórica y en la parte práctica?
Para calcular el error típico, tenemos que recordar que el tamaño de N
es pequeño y que las dos muestras están relacionadas; por ello, se aplica la
fórmula 10.4.
Primero, calculas los valores de una nueva columna, la de la diferencia
entre las puntuaciones de la parte teórica y las de la parte práctica. Des-
pués, averiguas la desviación típica de esta columna y obtienes 2,2222. Este
valor equivale a Sdif.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 257

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 257

TABLA 10.3
PRUEBA t PARA N = 12 Y MUESTRAS CORRELACIONADAS

Alumnos Parte teórica Parte práctica Diferencia (dif)

1º 6,58 6,50 0,08

2º 6,83 3,50 3,33

3º 6,08 1,75 4,33

4º 5,42 7,00 –1,58

5º 4,25 6,50 –2,25

6º 3,92 6,25 –2,33

7º 4,92 5,50 –0,58


8º 4,75 6,50 –1,75

9º 4,92 6,60 –1,68

10º 4,92 3,25 1,67

11º 4,50 5,75 –1,25

12º 8,00 7,00 1,00

Media = 5,4242 Media = 5,5083 Sx = 2,2222

Ahora, aplicas la última parte de la fórmula 10.4; esto te permite averiguar


que el error típico de la diferencia de medias entre la parte teórica y la parte
práctica es:

Como el tamaño de N es pequeño, la distribución muestral sigue el mode-


lo t. Para calcular el valor empírico de t utilizas la misma fórmula que para Zi,
o sea, la fórmula 10.5, y obtienes:

1
Si utilizas los programas SPSS o EXCEL obtienes un valor de σdif ligeramente más pequeño
(0,64149) debido a que ambos programas aplican la fórmula 10.3 en lugar de la fórmula 10.4.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 258

258 Introducción a la estadística

Teniendo en cuenta que los grados de libertad son 12 – 1 = 11 y siendo


α = 0,05, el valor crítico de t sería 2,201 para H1 bilateral. Por tanto, la probabilidad
de obtener por azar una ti = –0,12552 es mayor que la de una ti crítica de -2,201
(α = 0,05). En consecuencia, se acepta H0, pudiendo cometer un error del Tipo II.
Esto significa que los alumnos que asistieron a las clases de apoyo tienen
el mismo nivel de rendimiento en la parte teórica y en la parte práctica del
primer examen de la materia. Este resultado difiere del obtenido con el con-
junto de alumnos que hizo el examen.

CASO DE N PEQUEÑA
10.5. Y MUESTRAS INDEPENDIENTES
Y finalmente si, en vez de comparar los 12 alumnos del experimento consigo
mismos, el profesor los compara con otros 12 compañeros elegidos al azar
entre los 61 que no asistieron a las clases de apoyo, ¿obtendrá los mismos re-
sultados que ya observó con la clase en su conjunto?
Esta vez vamos a obviar el detalle del contraste de hipótesis y pasar direc-
tamente al cálculo de la prueba estadística.

TABLA 10.4
PRUEBA t PARA N = 12 Y MUESTRAS INDEPENDIENTES

Con clases de apoyo Sin clases de apoyo


Alumnos Parte teórica Parte práctica Parte teórica Parte práctica
1º 6,58 6,50 5,58 6,25
2º 6,83 3,50 5,83 1,75
3º 6,08 1,75 2,25 0,00
4º 5,42 7,00 6,08 5,50
5º 4,25 6,50 5,25 0,75
6º 3,92 6,25 1,92 6,80
7º 4,92 5,50 2,50 0,00
8º 4,75 6,50 5,33 0,00
9º 4,92 6,60 4,33 7,60
10º 4,92 3,25 6,08 5,45
11º 4,50 5,75 –0,17 0,00
12º 8,00 7,00 4,58 3,00

X 5,4242 5,5083 4,1300 3,0917
Sx 1,20942 1,71780 2,02484 3,02924
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 259

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 259

Vamos pues a comprobar si el rendimiento en la parte teórica de la mate-


ria es similar entre los alumnos que asistieron a las clases de apoyo y los que
no. Para ello, calculamos σdif , utilizando la fórmula 10.2:

Sabemos que la distribución muestral sigue el modelo t. Por ello, calcula-


mos la t empírica aplicando la fórmula 10.5:

Como los grados de libertad son 24-2 = 22 y α = 0,05, el valor crítico de t


es 2,074 para H1 bilateral. Por tanto, la probabilidad de obtener por azar una
ti = 1,94567 es mayor que la de una ti crítica de 2,074 (α = 0,05). Esto lleva a
la aceptación de H0, pero con la posibilidad de cometer un error del Tipo II.
Esto significa que los alumnos que participaron en las clases de apoyo tie-
nen el mismo nivel de rendimiento en la parte teórica que aquéllos que sólo
asistieron a las clases teóricas.
Por curiosidad, comprobemos si el rendimiento en la parte práctica de
la materia es similar entre los alumnos que asistieron a las clases de apoyo
y los que no. Para ello, calculamos el correspondiente σdif, utilizando la
fórmula 10.2:

Sabemos que la distribución muestral sigue el modelo t. Por ello, calcula-


mos la t empírica aplicando la fórmula 10.5:

Como los grados de libertad son 24 – 2 = 22 y α = 0,05, el valor crítico de


t es 2,074 para H1 bilateral. Por tanto, la probabilidad de obtener por azar una
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 260

260 Introducción a la estadística

ti = 2,40391 es menor que la de una ti crítica de 2,074 (α = 0,05). Esto lleva al


rechazo de H0, pero con la posibilidad de cometer un error del Tipo I.
Esto significa que en la parte práctica los alumnos que participaron en las
clases de apoyo no tienen el mismo nivel de rendimiento que los que sólo asis-
tieron a las clases teóricas: de hecho, su nivel de rendimiento es mayor.

CON LA AYUDA DE PROGRAMAS


10.6. INFORMÁTICOS

Para llevar a cabo el análisis de la diferencia de medias mediante el programa


SPSS, se abre, como de costumbre, el desplegable «Analizar» y como nos inte-
resa «Comparar medias», seleccionamos esta opción. Como acabamos de ver
en este capítulo, se puede proceder a la comparación de medias de diversas
maneras que reflejan los distintos modos de diseñar una investigación. Por
ello debemos seleccionar la opción que refleja con exactitud el diseño de
nuestra investigación o el tipo de pregunta para la que estamos buscando una
respuesta cabal.

FIGURA 10.1
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «COMPARAR MEDIAS»
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 261

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 261

FIGURA 10.2
SELECCIÓN DEL TIPO DE ANÁLISIS DE DIFERENCIA DE MEDIAS
Y DE LAS VARIABLES QUE ANALIZAR

La zona «Contrastar variables» es la franja reservada a las variables de-


pendientes. Puedes insertar tantas variables como lo exija tu problema de
investigación. El programa realizará los cálculos necesarios para cada una
de ellas por separado. La zona «Variable de agrupación» está reservada a la
variable independiente; es única. Si tienes varias variables independientes,
deberás repetir este proceso para cada una de ellas. Por otra parte, como re-
cordarás, una variable independiente es, por naturaleza, una variable nomi-
nal que puede tener varios valores. Por tanto, como el programa no sabe
qué dos valores quieres utilizar, te pide que se lo especifiques; verás que
aparecen signos de interrogación junto al nombre de la variable indepen-
diente «Apoyo». Para proporcionar la información solicitada, debes activar la
opción «Definir grupos».
Una vez abierta la ventana para definir grupos, basta poner en Grupo 1 y
Grupo 2 los valores que representan los grupos para los que queremos reali-
zar el análisis de diferencia de medias. Recuerda que se trata de los valores
que asignaste en tu base de datos a cada uno de los sujetos de la muestra pa-
ra indicar su grupo de pertenencia. En este caso, 1 representa a los alumnos
que asistieron a las clases de apoyo, mientras que 2 es para los alumnos que
no. Cuando termines, pulsa «Continuar»; esta ventana se cierra y el programa
muestra la identificación de los dos valores que acabas de seleccionar.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 262

262 Introducción a la estadística

FIGURA 10.3
DEFINICIÓN DE LOS VALORES DE LA VARIABLE INDEPENDIENTE

Con la orden final de «Continuar», el programa responde proporcionando


dos tablas:
a) La primera tabla contiene la información completa sobre los estadísti-
cos descriptivos de cada uno de los dos grupos.

TABLA 10.5
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS

Estadísticos de grupo

Apoyo (Sí-No) N Media Desviación Error tip.


tip. de la media

Teoría I Sí 12 5,4236 1,21099 ,34958


No 61 4,8893 1,68027 ,21514

Práctica I Sí 12 5,5083 1,71780 ,49589


No 61 3,5984 2,85292 ,36528

b) La segunda tabla contiene los datos necesarios para el contraste de hi-


pótesis.
TABLA 10.6
ESTADÍSTICOS INFERENCIALES PARA EL CONTRASTE DE HIPÓTESIS
Prueba de muestras independientes

Prueba de Levene
para la igualdad
de varianzas Prueba T para la igualdad de medidas

95% intervalo de
confianza para la
Error tip. diferencia
Sig. Diferencia de la
F Sig. t gl (bilateral) de medias diferencia Inferior Superior
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 263

Teoría I Se han asumido ,938 ,363 1,047 71 ,299 ,53427 ,51049 –,48361 1,55215
varianzas iguales

No se han asumido 1,202 20,374 ,208 ,53427 ,41048 –,32097 1,38950


varianzas iguales

Práctica I Se han asumido 13,849 ,000 2,233 71 ,029 1,90997 ,85530 ,20456 3,61538
varianzas iguales

No se han asumido 3,101 24,935 ,005 1,90997 ,6159- ,64108 3,17887


varianzas iguales
¿Cómo averiguar si dos muestras son similares o no en una determinada característica?
263
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 264

264 Introducción a la estadística

Como se trata de grupos independientes, hace falta comprobar si se da


uno de los supuestos para la utilización de esta prueba: la igualdad de varian-
zas. La prueba F de Levene se encarga de esta comprobación. Se supone que
H0 a este respecto asevera que las varianzas de ambos grupos son iguales y,
por tanto, que la diferencia es 0. En el caso de la variable «Teoría I» observa-
mos que la diferencia empírica entre las dos varianzas queda reflejada me-
diante una F igual a 0,838. La probabilidad de que esta diferencia ocurra por
azar es de 0,363. Por cierto, el término «Sig.» equivale a probabilidad de ocu-
rrencia por azar. Como la probabilidad de obtener esta diferencia por azar es
mayor que α (0,05), debemos aceptar H0, y admitir a la vez la posibilidad de
estar cometiendo un error del Tipo II. En consecuencia, podemos decir que
se cumple el supuesto de homoscedasticidad.
Además de la información sobre el cumplimiento o incumplimiento del
supuesto de igualdad de varianzas, el programa proporciona información
necesaria sobre la prueba t, tanto en el caso de que las varianzas sean
iguales como en el caso contrario. Lo esencial en tu caso es que seas capaz
de elegir adecuadamente la información que interpretar. Dos son los datos
básicos: el valor de t y la probabilidad de que ocurra por azar, una vez he-
cha la comprobación del supuesto de homoscedasticidad. En el caso de
«Teoría I», puedes ver que t = 1,047 y Sig. = 0,299. Esto quiere decir que la
probabilidad de obtener una t = 1,047 por azar es de 0,299. Si α = 0,05, en-
tonces debemos aceptar H0, puesto que la probabilidad de t empírica es
mayor que α; a la vez hay que admitir la posibilidad de estar cometiendo
un error del Tipo II. En cuanto a la conclusión pedagógica, ya hemos teni-
do ocasión de comentarla antes.

10.7. CASO DE UNA MEDIA TEÓRICA

Supongamos que este profesor es lo suficientemente paciente como para re-


petir un examen parecido a lo largo de su vida docente, ¿cuál es la probabili-
dad de que alguna vez sus alumnos obtengan una media de 5,00.
Para responder a esta pregunta, podemos recurrir a lo que tuvimos oca-
sión de ver con relación al intervalo confidencial. También podemos utilizar
el programa SPSS, del siguiente modo:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 265

¿Cómo averiguar si dos muestras son similares o no en una determinada característica? 265

FIGURA 10.4
SELECCIÓN DEL TIPO DE ANÁLISIS DE DIFERENCIA DE MEDIAS

En este caso, partimos de lo que sabemos de una única muestra; por tan-
to, seleccionamos la opción de la «Prueba T para una muestra…».

FIGURA 10.5
SELECCIÓN DE LA VARIABLE QUE ANALIZAR E IDENTIFICACIÓN
DEL VALOR DE PRUEBA
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 266

266 Introducción a la estadística

Aparecen dos zonas claramente diferenciadas. En la primera zona hay que


incorporar la variable para la que el programa va a hallar la media empírica.
En este caso, se trata de la variable «Práctica I»; se puede poner tantas varia-
bles como se considere oportuno. En la segunda zona, sólo cabe un valor, la
media teórica que queremos comparar con la media empírica.
Al pulsar «Aceptar», aparecen dos tablas. En la primera tabla quedan con-
signados los habituales estadísticos descriptivos que ya conocemos y que no
hace falta reproducir. En la segunda tabla, el programa proporciona todos los
estadísticos inferenciales necesarios para responder a la pregunta planteada.

TABLA 10.7
ESTADÍSTICOS INFERENCIALES PARA EL CONTRASTE
DE HIPÓTESIS PARA UNA MUESTRA

Valor de prueba = 5,00

95% Intervalo de
confianza para la
diferencia
Sig. Diferencia
t gl (bilateral) de medias Inferior Superior

Práctica I –3,340 72 ,001 –1,08767 –1,7368 –,4385

Como decíamos más arriba, los datos que te interesan en esta tabla son: el
valor empírico de t, –3,340, y la probabilidad asociada, 0,001. Por tanto, pue-
des decir que la probabilidad de obtener por azar una media igual a 5 es de
0,001.

10.8. TU TURNO

Teniendo en cuenta el contenido de tu base de datos, formula una hipótesis


sustantiva como la siguiente: los alumnos que repiten esta materia rinden más
que los que la cursan por primera vez. Después, transforma tu hipótesis sus-
tantiva en una hipótesis estadística y procede al contraste de hipótesis. Es me-
jor que utilices algún programa estadístico para ayudarte en el análisis de tus
datos. Recuerda que antes de interpretar los resultados, debes comprobar si
se cumple el supuesto de homoscedasticidad, en el caso de que tu hipótesis
haga referencia a grupos independientes.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 267

Capítulo 11
¿CÓMO AVERIGUAR SI TRES MUESTRAS
O MÁS SON SIMILARES O NO EN
UNA DETERMINADA CARACTERÍSTICA?

Al terminar este capítulo deberías:


• Conocer los distintos tipos de varianza.
• Ser capaz de relacionar cada parte de la varianza total con su
fuente o causa.
• Conocer el objetivo del análisis de varianza.
• Ser capaz de partir la varianza total en al menos dos componentes.
• Conocer los requisitos del análisis de varianza.
• Conocer la lógica del estadístico F.
• Ser capaz de interpretar el estadístico F.
• Ser capaz de aplicar el contraste de hipótesis para resolver pro-
blemas de tres o más grupos.
• Ser capaz de realizar contrastes posteriores.
• Ser capaz de calcular la magnitud de F para muestras correlacio-
nadas.
• Ser capaz de establecer la magnitud de la relación entre una va-
riable independiente y una variable dependiente.
• Ser capaz de relacionar la prueba t de Student con la prueba F.

(¡Otra mirada atrás antes de proseguir! Pues sí. Te convendría revisar el ca-
pítulo 4 y concretamente el apartado 2, que trata de las medidas de disper-
sión o de variabilidad. Detente especialmente en el concepto de varianza.)

En el capítulo anterior acabamos de ver cómo se procede para averiguar si


dos muestras pertenecen o no a la misma población. Si tuviéramos tres mues-
tras o más ciertamente, podríamos aplicar la misma técnica, o sea, comparar
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 268

268 Introducción a la estadística

las medias de las muestras dos a dos, y eso nos permitiría saber si existen di-
ferencias estadísticamente significativas. Ahora bien, en este caso, la compara-
ción de pares de medias es una técnica que carece de parsimonia. De hecho,
en el caso de tres muestras tendríamos que repetir la misma operación tres
veces, ya que habría que comparar la media de la primera con la de la segun-
da muestra y posteriormente con la de la tercera muestra. Finalmente, se de-
bería comparar la media de la segunda muestra con la de la tercera. Y además
al hacerlo así se pierde de vista el conjunto del problema de investigación. En
aplicación de la ley del mínimo esfuerzo, procurando obtener el máximo be-
neficio, habría que utilizar una técnica capaz de proporcionar el mismo resul-
tado que las tres comparaciones, pero con una única ejecución. Esta técnica
existe y se conoce como análisis de varianza.

11.1. FUENTES DE VARIANZA


Cuando calculas la varianza obtienes un estadístico, como s2, que te informa
sobre la magnitud de la dispersión de los datos recogidos. Pero, ¿has pensado
en la causa de esta variabilidad? Si no hubiera ninguna causa que provocase
la aparición de diferencias entre los sujetos, habría que suponer que todos los
miembros de una determinada muestra o población tienen la misma puntuación
y, por tanto, la varianza sería 0. Ahora bien, sabemos, quizá por experiencia,
que no hay dos alumnos que tengan exactamente el mismo rendimiento, por
ejemplo. ¿A qué se puede deber? Para empezar, lo que obtenemos como mag-
nitud total de la varianza es en realidad la suma de los efectos debidos a va-
rias causas. Eso significa que la varianza se puede dividir en diferentes com-
ponentes en función de la causa o fuente que lo produce. Teóricamente se
definen cinco clases de varianza:
1. Varianza poblacional o muestral: se trata de la dispersión de datos que
se produce en la población o en la muestra.
2. Varianza de muestreo: recordarás que se puede utilizar una multitud
de técnicas para extraer una muestra de una población. Pues bien, ca-
da una de estas técnicas introduce un tipo específico de sesgo o va-
rianza. Si vuelves al capítulo 6, podrás darte cuenta de que las implica-
ciones del muestreo aleatorio no son las mismas que las del muestreo
incidental, puesto que el procedimiento de extracción muestral no es el
mismo.
3. Varianza sistemática: se refiere a un efecto constante y preciso y que
se produce en un determinado sentido debido a la influencia de facto-
res conocidos o desconocidos. Imagínate que, en un experimento so-
bre el rendimiento académico, por azar, el grupo experimental recibe
sus clases por la mañana y el grupo de control por la tarde. Pero resul-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 269

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 269

ta que por la mañana los alumnos están más descansados que por la
tarde. Eso significa que el nivel de descanso es un factor que, sin ser el
objeto de estudio, sistemáticamente favorece más a los alumnos matuti-
nos que a los vespertinos. En cualquier experimento inciden tanto fac-
tores conocidos, cuyo efecto puede ser neutralizado o controlado, co-
mo desconocidos.
4. Varianza experimental: es la que se debe a la manipulación de la va-
riable independiente o experimental. Cuando al ejecutar un determina-
do diseño de investigación, un investigador asigna aleatoriamente el
tratamiento A al grupo A y el tratamiento B al grupo B, espera que se
produzcan diferencias entre ambos que sean atribuibles en gran medi-
da al factor que ha manipulado. Naturalmente se trata de diferencias
que han de ser sistemáticas y producirse en el sentido hipotetizado por
el investigador. Por tanto, la varianza experimental es por naturaleza
sistemática.
5. Varianza de error o aleatoria: una multitud de factores puede influir
sobre un diseño experimental. De éstos, en el mejor de los casos, el in-
vestigador es capaz de identificar unos cuantos que de algún modo
controlará. En cuanto al resto, al investigador le cabe la sospecha de
que están allí y de que están influyendo subrepticiamente; no los con-
trola pero espera que influyan por igual en todos los grupos o trata-
mientos. Por ello, tras identificar la parte de la varianza total que co-
rresponde a cada una de las fuentes sistemáticas conocidas, concluye
que lo que queda sin identificar es la varianza de error o aleatoria.
De lo que se acaba de explicar cabe deducir que cuando obtenemos un
dato de una medición en realidad, lo que tenemos entre manos es la suma de
varios componentes. Así, en el caso de obtener un valor Xi de un experimen-
to en el que manipulamos un único factor, este valor puede considerarse co-
mo la suma de una parte poblacional, una parte sistemática debida al factor
experimental y una parte aleatoria. Eso quiere decir que el modelo de análisis
de la varianza de un único factor se puede representar del siguiente modo:
Xig = μ + αg + εig ; donde:
Xig = es el valor de la variable dependiente medido para el sujeto i del
grupo o tratamiento g; se trata del valor tal y como lo obtenemos al
aplicar cualquier instrumento de medida.
μ = es el valor de la media de la variable Xi en la población. Como ya
sabes, éste es un valor que en general se desconoce, a menos que
se trate de una población finita o de reducido tamaño.
αg = es el efecto que el tratamiento g produce. Este efecto tiene un valor
constante. En otras palabras, se trata de un valor igual para cualquier
miembro del grupo g. Por otra parte, todos los individuos de la
muestra lógicamente tienen la misma media μ pero al haber sido
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 270

270 Introducción a la estadística

asignados a diferentes grupos o tratamientos, cada situación tendrá


su propio α. En suma, cada αg refleja el cambio introducido en cada
grupo respecto de μ. Por ello, μ + αg = μg.
εig = Es el error aleatorio correspondiente a Xig. Se asume que todos los
errores se distribuyen normalmente con media 0 y varianza σ2. Para
entendernos, si el investigador repitiera la medición una infinidad de
veces, en unas ocasiones el valor obtenido coincidiría con μg y en
otras estaría por encima o por debajo. Recuerda lo que dijimos sobre
la distribución de las diferencias entre medias y comprenderás que
la media de esta distribución sólo puede ser 0 y su varianza σ2.
Así, cuando se mide el rendimiento de un sujeto hay una parte que coinci-
de con la población de donde ha sido extraído, una parte que se debe al tra-
tamiento al que ha sido sometido y una parte que es propia del sujeto. Con
estos datos podríamos escribir este modelo de la siguiente manera para un
sujeto que ha obtenido, por ejemplo, un 7:

Xig = μ + αg + εig.
Rendimiento = 4 + 2,5 + 0,5.

Cuando tenemos varios tratamientos, lo que realmente nos interesa es


averiguar si la magnitud de los diferentes valores αg es lo bastante grande
para sugerir que los efectos de los tratamientos son diferentes. Para verificar
esta sugerencia, recurrimos al análisis de varianza. Scheffé (1907-1977) defi-
ne el análisis de varianza como «una técnica para analizar mediciones o da-
tos que dependen de varios tipos de fuentes, que operan simultáneamente,
para decidir qué clases de efectos son importantes, y calcular la magnitud
de los mismos» (1959).
Hay que tener cuidado con la terminología: el hecho de llamar a esta téc-
nica «análisis de varianza» no debe en absoluto hacerte pensar que la hipóte-
sis nula se formula respecto a las varianzas. El objetivo del análisis de varian-
za radica en la comprobación de hipótesis acerca de medias únicamente.
Ahora bien, el procedimiento que utiliza es sin duda genial: parte del supues-
to de que la varianza total es una suma de varios efectos y por tanto se pro-
pone llevar a cabo la descomposición de la variabilidad total de las medicio-
nes de las muestras. En el caso de un único factor se descompone la varianza
total, conocida también como sumas cuadráticas totales (SCT), en dos compo-
nentes aditivos que son la variabilidad entre los tratamientos y la variabilidad
aleatoria. La variabilidad entre los tratamientos representa el efecto debido a
la variable independiente o experimental y se representa como sumas cuadrá-
ticas entre o intergrupos (SCE). La variabilidad aleatoria representa el efecto
debido a múltiples causas o fuentes desconocidas y se representa como su-
mas cuadráticas dentro o intragrupos (SCD).
En resumen, SCT = SCE + SCD o bien VT = VE + VD.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 271

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 271

DESCOMPOSICIÓN DE LA VARIANZA TOTAL 11.2.

Un ejemplo sencillo puede ayudarnos a comprender en qué consiste la parti-


ción de la varianza total en los dos componentes antes aludidos. Volvamos
atrás y tomemos prestado el problema planteado respecto a la igualdad de
medias de dos grupos independientes (tabla 10.4): los alumnos que asistieron
a las clases de apoyo y los que no lo hicieron. Esta vez nos planteamos partir
la varianza total en varianza sistemática y en varianza de error, pero sólo res-
pecto de la parte práctica.

TABLA 11.1
PARTICIÓN DE LA VARIANZA TOTAL

Con clases de apoyo (XA) Sin clases de apoyo (XB)

1º 6,50 6,25

2º 3,50 1,75

3º 1,75 0,00

4º 7,00 5,50

5º 6,50 0,75

6º 6,25 6,80

7º 5,50 0,00

8º 6,50 0,00

9º 6,60 7,60

10º 3,25 5,45

11º 5,75 0,00

12º 7,00 3,00



X 5,5083 3,0917

Primero empecemos por lo más sencillo, es decir: calcular la varianza to-


tal. Para ello nos basta considerar que todas las puntuaciones directas perte-
necen a un único grupo. Después aplicamos la fórmula 4.12a que acabamos
de revisar en el apartado 2 del capítulo 4.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 272

272 Introducción a la estadística

TABLA 11.2
CÁLCULO DE LA VARIANZA TOTAL

Xi xi xi2

1º 6,50 2,20 4,8400

2º 3,50 –0,80 0,6400

3º 1,75 –2,55 6,5025

4º 7,00 2,70 7,2900

5º 6,50 2,20 4,8400

6º 6,25 1,95 3,8025

7º 5,50 1,20 1,4400

8º 6,50 2,20 4,8400

9º 6,60 2,30 5,2900

10º 3,25 –1,05 1,1025

11º 5,75 1,45 2,1025

12º 7,00 2,70 7,2900

13º 6,25 1,95 3,8025

14º 1,75 –2,55 6,5025

15º ,00 –4,30 18,4900

16º 5,50 1,20 1,4400

17º ,75 –3,55 12,6025

18º 6,80 2,50 6,2500

19º ,00 –4,30 18,4900

20º ,00 –4,30 18,4900

21º 7,60 3,30 10,8900

22º 5,45 1,15 1,3225

23º ,00 –4,30 18,4900

24º 3,00 –1,30 1,6900



X 4,300

168,4400
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 273

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 273

Por tanto, la varianza total asciende a .

Nuestro segundo paso consistirá en averiguar la magnitud de la varianza


experimental. Primero, podemos observar que las medias de los dos trata-
mientos no son iguales; por tanto, concluimos que hay varianza entre los dos
tratamientos. Volvemos a aplicar la fórmula 4.12a con el objetivo de calcular
la magnitud de la varianza experimental. Para ello, consideramos la media de
cada grupo como puntuación directa que representa cada tratamiento.

TABLA 11.3
CÁLCULO DE LA VARIANZA EXPERIMENTAL O INTERGRUPOS

Xi xi x2i

5,5083 1,2083 1,4600

3,0917 –1,2083 1,4600



X 4,3000

2,9200

Así pues, la varianza entre los tratamientos asciende a:

Este dato nos permite conocer la magnitud de la varianza de los grupos


en torno a la media general, 4,3000. Para ser más concreto, cuanto más ele-
vada sea la diferencia entre estas medias, mayor es el valor de la varianza
intergrupos.
Ahora nos queda como tercer y último paso calcular la varianza de error.
Para ello, nos basta con calcular primero la variación que se produce dentro
de cada tratamiento y, finalmente, hallar la media entre ambas varianzas para
conocer la magnitud de la variación que se produce por término medio den-
tro de los grupos.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 274

274 Introducción a la estadística

TABLA 11.4
CÁLCULO DE LA VARIANZA DENTRO
DE LOS GRUPOS O INTRAGRUPOS

Con clases de apoyo (XA) Sin clases de apoyo (XB)

Xi xi x2i Xi xi x2i

1º 6,50 0,9917 0,9835 6,25 3,1583 9,9749

2º 3,50 –2,0083 4,0333 1,75 –1,3417 1,8002

3º 1,75 –3,7583 14,1248 0,00 –3,0917 9,5586

4º 7,00 1,4917 2,2252 5,50 2,4083 5,7999

5º 6,50 0,9917 0,9835 0,75 –2,3417 5,4836

6º 6,25 0,7417 0,5501 6,80 3,7083 13,7515

7º 5,50 –0,0083 0,0001 0,00 –3,0917 9,5586

8º 6,50 0,9917 0,9835 0,00 –3,0917 9,5586

9º 6,60 1,0917 1,1918 7,60 4,5083 20,3248

10º 3,25 –2,2583 5,0999 5,45 2,3583 5,5616

11º 5,75 0,2417 0,0584 0,00 –3,0917 9,5586

12º 7,00 1,4917 2,2252 3,00 –0,0917 0,0084



X 5,5083 3,0917

32,4592 100,9390

Si la varianza del primer grupo es y la del se-

gundo grupo es , entonces el promedio es

. Fíjate en que la diferencia entre las medias


de ambos grupos es completamente independiente de la varianza intragrupos.
Si el método que hemos utilizado para partir la varianza total es correcto,
entonces debemos poder comprobar con los datos obtenidos que se cumple
la igualdad SCT = SCE + SCD. De hecho, podemos observar que:

7,0183 = 1,46 + 5,5583

A estas alturas te habrás dado cuenta de la insistencia con la que venimos


hablando de las sumas cuadráticas. Si te fijas en las tablas 2 a 4 verás que el
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 275

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 275

cálculo de se basa siempre en la suma de los cuadrados de las puntua-


ciones diferenciales. Simplificando la terminología, decimos sumas cuadráticas.
Utilizaremos esta misma terminología cuando tengamos que elevar al cuadra-
do y sumar las puntuaciones directas.

REQUISITOS DEL ANÁLISIS DE VARIANZA 11.3.

Al igual que la prueba t de Student, la utilización del análisis de varianza implica


el cumplimiento de una serie de requisitos, entre los cuales cabe señalar:
• Esta técnica es aplicable sólo cuando el nivel de medida de la variable
dependiente es de intervalo o de razón.
• La variable dependiente debe distribuirse normalmente en torno a la
media poblacional en cada uno de los tratamientos. Como resulta que
εij representa la variabilidad de cada sujeto en torno a la media del tra-
tamiento, este requisito en realidad dice que el error se distribuye nor-
malmente dentro de los tratamientos. De allí que dicho requisito se for-
mule con frecuencia como «distribución normal del error». Ahora bien,
una moderada desviación respecto a la distribución normal no suele te-
ner consecuencias graves.
• Tanto la técnica de muestreo que se utilice como la asignación de los
sujetos a los distintos tratamientos deben ser aleatorias. Como se decía
para la prueba t, para dos sujetos cualesquiera dentro de un tratamiento
experimental, el hecho de conocer la posición de uno con respecto a la
media no nos informa sobre la del otro. Descuidar este requisito puede
tener graves consecuencias para el análisis.
• En el caso de grupos independientes, las varianzas de los g grupos de-
ben ser similares, o sea, .
— La varianza de error no debe estar ligada a ninguna diferencia de tra-
tamiento. Lo normal es que las varianzas sean homogéneas si un trata-
miento tiene por consecuencia añadir una constante a las puntuacio-
nes de cada sujeto del grupo. Se puede prescindir de la condición de
homogeneidad de varianzas en algunos casos sin que la prueba que-
de afectada. Sin embargo, se debe cumplir si el hecho de que las po-
blaciones tengan diferentes varianzas provoca serios problemas.
• La varianza de la variable dependiente es σ2.
Sin embargo, al igual que para la prueba t, diversas comprobaciones han
permitido llegar a la conclusión de que ésta es una prueba relativamente in-
sensible a la violación de los supuestos matemáticos; se trata de una prueba
robusta.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 276

276 Introducción a la estadística

ANÁLISIS DE VARIANZA SIMPLE


11.4. PARA GRUPOS INDEPENDIENTES

Veamos cómo poner todo lo que acabamos de mostrar al servicio de la solu-


ción de nuestro problema de investigación. Al igual que para la prueba t he-
mos de recordar que algunos de los requisitos para la utilización del análisis
de varianza no se han respetado y esto puede condicionar las conclusiones a
las que podamos llegar. Posiblemente el requisito cuyo incumplimiento puede
causar serios problemas sea la falta de aleatorización, ya que cada alumno eli-
gió libremente el tratamiento que quería para sí. De hecho, ante la imposibili-
dad de asignar aleatoriamente los alumnos a distintos tratamientos, el profe-
sor investigador optó por ofrecerles la posibilidad de dominar la materia a)
acudiendo únicamente a sus clases magistrales o, además b) realizando ejerci-
cios de solución de problemas con monitores entrenados o c) ejecutando
ejercicios con ayuda de un campus virtual bajo la supervisión del profesor.
Las medidas tomadas respecto a la prueba t para averiguar si sólo los alum-
nos más interesados o con más aptitudes se decidieron a participar en este
experimento se aplicaron también, y se comprobó la existencia de diferencias
estadísticamente significativas en nivel de dificultad percibida y nivel de inte-
rés al principio del curso. Este hecho merece una atención muy especial. Al
finalizar los primeros cuatro meses, el profesor elige al azar a seis alumnos de
cada grupo para estudiar el efecto de los tratamientos sobre la materia, espe-
cialmente con relación a la solución de problemas de investigación. Quiere
saber si estos efectos se diferencian estadísticamente de los obtenidos por
azar (α = 0,05).

TABLA 11.5
TABLA DE LOS DATOS ORIGINALES DE LOS TRES GRUPOS

Sólo clase (XA) Campus virtual (XB) Prácticas (XC)

2,15 3,65 6,50

4,50 0,00 3,25

2,00 0,00 6,25

0,00 6,25 7,00

2,50 5,25 6,50

1,75 6,50 6,60


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 277

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 277

1. Formulación de H0 y de su correspondiente H1
Hipótesis nula: o bien H0: μA = μB= μC. No hay diferen-
cias estadísticamente significativas en rendimiento debidas al método
de estudio elegido por cada alumno.
Hipótesis alternativa: o bien H1: μA ≠ μB ≠ μC. Hay dife-
rencias estadísticamente significativas en rendimiento debidas al méto-
do de estudio elegido por cada alumno.
2. Elección justificada de la prueba estadística
Al igual que para la prueba t, la elección de la prueba estadística que
aplicar exige tener en cuenta tanto la variable dependiente como la inde-
pendiente. En cuanto a la variable dependiente, rendimiento en la parte
práctica, se trata de una variable de intervalo. La variable independiente,
métodos de estudio, es nominal; define tres grupos independientes. La
prueba estadística adecuada es la que permite establecer la diferencia
entre más de dos medias a la vez; ésta es la prueba F llamada así por
Snedecor (1957)1 en honor a R. A. Fisher.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,05.
4. Definición de la distribución muestral del estadístico F
La distribución muestral es una distribución de probabilidad que se for-
ma con infinitos valores de F obtenidos de infinitas muestras aleatorias
de la misma población, todas del mismo tamaño que la del problema
de investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,05.
6. Cálculo del estadístico: prueba estadística
Como veíamos en el primer apartado, nuestro próximo cometido con-
siste en partir la varianza total en dos componentes, la varianza inter-
grupos y la varianza intragrupos. Esta vez en lugar de utilizar las pun-
tuaciones diferenciales, vamos a recurrir a las puntuaciones directas.
Por ello, cuando calculemos las sumas cuadráticas será necesario corre-
gir el resultado obtenido mediante el término de corrección.
Por cuestiones de orden práctico, resulta más cómodo hallar primero
todos los cuadrados de las puntuaciones directas para aplicar las fór-
mulas adecuadas.

1
Snedecor, G. W. (1957): Statistical methods. Iowa State Univ. Press, Ames, EE.UU. (5th ed.).
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 278

278 Introducción a la estadística

TABLA 11.6
DATOS DE LOS TRES TRATAMIENTOS

XA X2A XB X2B XC X2C

1º 2,15 4,6225 3,65 13,3225 6,50 42,2500

2º 4,50 20,2500 0,00 0,0000 3,25 10,5625

3º 2,00 4,0000 0,00 0,0000 6,25 39,0625

4º 0,00 0,0000 6,25 39,0625 7,00 49,0000

5º 2,50 6,2500 5,25 27,5625 6,50 42,2500

6º 1,75 3,0625 6,50 42,2500 6,60 43,5600

Σ 12,90 38,185 21,65 122,1975 36,10 226,685

Para calcular las sumas cuadráticas totales, utilizamos la siguiente fórmula:

(Fórmula 11.1)

Donde:
SCT = sumas cuadráticas totales.

= suma de todos los cuadrados de las puntuaciones directas.

= cuadrado de la suma de todas las puntuaciones directas.

N = número total de sujetos de la muestra.

En resumen, se trata de restar de la suma de todos los cuadrados de las


puntuaciones directas el término de corrección, que es el cuadrado de la su-
ma de las puntuaciones directas dividido por el número de sujetos.

Para calcular las sumas cuadráticas entre los grupos, utilizamos la siguiente
fórmula:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 279

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 279

(Fórmula 11.2)

Donde:
SCE = sumas cuadráticas entre los grupos.

= cuadrado de la suma de todas las puntuaciones directas de


cada grupo.

n = número total de sujetos de cada grupo.


= resultado de dividir el cuadrado de la suma de todas las
puntuaciones directas de cada grupo por su correspon-
diente n.

= suma de los cocientes de los g grupos.

N = número total de sujetos de la muestra.

En pocas palabras, se trata de sumar todos los cocientes correspondientes


a cada grupo y, del resultado obtenido, restar el término de corrección. Así:

Una vez identificadas las sumas cuadráticas totales e intergrupos, queda


calcular las sumas cuadráticas que corresponden a la fuente de variación alea-
toria. Para ello, recurrimos a la siguiente fórmula:

(Fórmula 11.3)

Donde:
SCD = sumas cuadráticas intragrupos.

= suma de todos los cuadrados de las puntuaciones directas.


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 280

280 Introducción a la estadística

= cuadrado de la suma de todas las puntuaciones directas de


cada grupo.

n = número total de sujetos de cada grupo.


= resultado de dividir el cuadrado de la suma de todas las
puntuaciones directas de cada grupo por su correspon-
diente n.

= suma de los cocientes de los g grupos.

N = número total de sujetos de la muestra.

En realidad, se trata de restar de la suma de los cuadrados de todas las


puntuaciones directas, la suma de los cocientes de los g grupos. Así:

SUCINTAS CONSIDERACIONES
11.5. EN TORNO A LA LÓGICA DE F
Conviene que recordemos que la hipótesis que se debe poner a prueba es
una afirmación global, según la cual no hay diferencias estadísticamente signi-
ficativas en rendimiento debidas al método de estudio. En consecuencia, el
análisis de varianza debe poder decirnos si hay una variación significativa en-
tre las medias de esta afirmación global; no nos proporcionará información
alguna sobre comparaciones de medias tomadas de dos en dos. El análisis de
varianza se centra en la cuestión de si las tres muestras proceden de la misma
población en términos de sus medias.
Hasta ahora, hemos visto cómo las medias de los tres grupos varían. En bue-
na lógica, cuanto más difieran en rendimiento entre sí, más variabilidad habrá
entre sus medias. Es decir, el incremento de la diferencia entre las medias de
los grupos se traduce lógicamente en el incremento correlativo de la varianza in-
ter-grupos. Lo que necesitamos ahora es descubrir el mejor modo de interpretar
esta varianza, o sea, determinar la probabilidad de que ocurra, si se cumple H0.
Supongamos que aceptamos que los tres grupos proceden de la misma
población. Si esto es cierto, entonces, ¿cuánta variabilidad habría entre las
puntuaciones individuales en esta población? En realidad, esta variabilidad ya
la hemos estimado: es la variabilidad que observamos dentro de cada grupo y
que llamamos varianza aleatoria.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 281

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 281

En el análisis de varianza, lo verdaderamente fundamental radica en que si


no hay diferencia entre los grupos, entonces la varianza intergrupos y la va-
rianza intragrupos son aproximadamente iguales, o sea, la varianza experi-
mental es igual a la varianza aleatoria. En términos del problema de investiga-
ción, la variación producida por la fuente experimental «método de estudio»
es igual a la que se debe a la acción del azar. El aumento del efecto experi-
mental sólo se puede observar a través del incremento de la varianza expe-
rimental. Es decir, a medida que aumenta la varianza intergrupos, disminuye
la probabilidad de que los g grupos procedan de la misma población, lo cual
significa que se incrementa la probabilidad de rechazar H0.
Para medir la magnitud del efecto experimental se utiliza, como estadísti-
co, F:

(Fórmula 11.4)

Si se cumple H0 y además no hay errores de muestreo, entonces se espera


que F sea igual a 1. Pero sabemos que hay errores de muestreo; por ello, re-
currimos a una distribución muestral para formular una afirmación de carácter
probabilístico. Si H0 es verdadera, la distribución muestral de F afirma que se
espera que la varianza intergrupos sean tantas veces mayor que la varianza
intragrupos. Al igual que para otras pruebas estadísticas, si esta probabilidad
cumple el criterio fijado se considerará que se puede rechazar H0. Por cierto,
la hipótesis alterna en este caso es de tipo no direccional. De hecho, la hipó-
tesis alterna sólo puede afirmar que los tratamientos tienen distintos efectos,
en al menos un caso, sobre el rendimiento.
Antes de completar el cálculo de F conviene que recordemos que las opera-
ciones que acabamos de realizar nos proporcionan una estimación de la varian-
za intergrupos o intragrupos de la población H0, σ2. Ahora bien, la variabilidad
que nos ocupa es la que se refiere no a la población sino a la muestra objeto de
estudio. En consecuencia, hemos de encontrar una medida de variación relacio-
nada con la muestra. Esto nos obliga a tomar en consideración dos magnitudes:
SC y el número de entidades computadas, teniendo en cuenta las limitaciones
que éstas imponen a cualquier suma, en otras palabras, los grados de libertad de
las sumas. El estadístico que refleja la variabilidad relacionada con la muestra re-
cibe el nombre de media cuadrática (MC) y se calcula del siguiente modo:

(Fórmula 11.5)

Donde:
MC = medias cuadráticas.
SC = sumas cuadráticas.
gl = grados de libertad.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 282

282 Introducción a la estadística

Como recordarás, los grados de libertad se definen como el número de da-


tos que pueden variar libremente al calcular un determinado estadístico y se
calculan aplicando el mismo razonamiento que ya hemos tenido ocasión de
comentar con la prueba t. En este caso, las SCE tienen como grados de libertad:
3 – 1 = 2, ya que el estudio consta de tres grupos o tratamientos. En cuanto a
las SCD, teniendo en cuenta que se pierde un grado de libertad por cada gru-
po de sujetos y sabiendo que son tres los tratamientos, quedan 3(6 – 1) = 15
grados de libertad. En cuanto a las SCT, tienen 18 – 1 = 17 grados de libertad,
ya que 18 son los sujetos de la muestra. Si sumas los grados de libertad inter-
grupos (2) e intragrupos (15), obtienes el mismo resultado (17).
Resumiendo, los grados de libertad de las tres SC se calculan así:

SCE SCD SCT

Grados de libertad G–1 N – G = G(n – 1) N–1

2 15 17

Donde:
G = número total de grupos o tratamientos.
N = número total de sujetos.
n = número de sujetos de cada grupo o tratamiento.
Una vez conocidos los grados de libertad, estamos en condiciones de ave-
riguar las medias cuadráticas intergrupos e intragrupos:

Y disponemos de todos los datos necesarios para calcular F aplicando la


fórmula 11.4.

Todo el proceso de cálculo suele resumirse en las salidas de ordenador en


una tabla parecida a la siguiente:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 12:13 Página 283

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 283

TABLA 11.7
TABLA RESUMEN DE F

Fuentes de Sumas Grados de Medias F Significación


variación cuadráticas libertad cuadráticas

Intergrupos 45,755830 2 22,8779150 5,3611388

Intragrupos 64,010417 15 4,2673611

Total 109,766250 17

Recordarás que afirmamos en el punto 4 del contraste de hipótesis que el


estadístico F tenía su propia distribución muestral de probabilidad. La forma
de esta distribución depende de los grados de libertad del numerador y del
denominador. En este caso, como el numerador es 2 y el denominador es 15,
entonces la distribución de probabilidad de F toma la siguiente forma:

FIGURA 11.1
DISTRIBUCIÓN DE PROBABILIDAD DE F
PARA 2 Y 15 GRADOS DE LIBERTAD

1,0

0,8

0,6

0,4

0,2

0,0
0 2 4 6 8 10 12
F

7. Interpretación estadística y pedagógica


a) Interpretación estadística: en manuales similares a éste en los que se
insertan tablas como la de F, suele presentarse como una tabla de
doble entrada. En la fila de cabecera se insertan los grados de liber-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 284

284 Introducción a la estadística

tad correspondientes a la varianza intergrupos (numerador) y en la


primera columna se colocan los grados de libertad de la varianza
intragrupos (denominador). En el caso de una tabla sencilla, se po-
ne dentro de la misma un único valor crítico de F según el nivel de
error elegido. Para determinar el valor crítico de F, basta localizar en
la primera fila los grados de libertad intergrupos, en este caso 2, y
después localizar verticalmente la fila equivalente a los grados de li-
bertad intragrupos, en este caso 15. En el cruce se sitúa el valor crí-
tico que buscamos, que es en este caso 3,68 para α = 0,05. Recuer-
da que H1 para esta prueba es no direccional; por tanto, se trata de
una tabla bidireccional. Si H1 fuera direccional, habría que dividir
los valores de esta tabla por dos.
Con estos datos ya podemos proponer una interpretación probabi-
lística: la probabilidad de obtener por azar una F = 5,3611388 es
menor que la de una F crítica de 3,68 (α = 0,05). Por ello, se re-
chaza H0. Al tomar esta decisión podríamos cometer un error del
Tipo I.
b) Interpretación pedagógica: teniendo en cuenta la conclusión esta-
dística, podríamos decir que por término medio las diferencias ob-
servadas en el rendimiento de los alumnos se deben a alguna causa
distinta del mero azar; en este caso, la causa es el método de estu-
dio de la materia.

11.6. ¿QUÉ HACER SI SE RECHAZA H0?

Recuerda que la formulación de H0 es global; por tanto, el rechazo de esta hi-


pótesis es también global. Sin embargo, una vez rechazada H0, nos interesa
saber entre qué par o pares de medias se encuentran las diferencias. Para ave-
riguarlo, necesitaremos llevar a cabo comparaciones de medias de dos en
dos. En la literatura ad hoc existen varias propuestas. Vamos a ver dos:
a) Prueba de Scheffé
El punto de partida de esta prueba es parecido al de la distribución de
diferencias entre medias, excepto que en este caso se trata de más de dos
grupos. Si no te acuerdas, vuelve a la introducción del capítulo ante-
rior. Por tanto, el primer paso consiste en hallar el error típico de la di-
ferencia entre medias, σdif, aplicando la siguiente fórmula:

(Fórmula 11.6)
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 285

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 285

Donde:
σdif = error típico de la distribución de diferencias entre medias.
MCD = medias cuadráticas intragrupos.
n1, n2 = número de sujetos de cada grupo o tratamiento.

En este caso:

El siguiente paso consiste en calcular un valor muy similar a la puntua-


ción Zi o ti correspondiente a la diferencia entre dos medias. Esta vez
en lugar de llamarlo Zi o ti, se conoce como FAB y se calcula con una
fórmula muy parecida a la que vimos en el capítulo 5 (Fórmula 5.2) y
que es la siguiente:

(Fórmula 11.7)

Donde:
FAB = puntuación típica correspondiente a la diferencia entre las
medias A y B.
= valor absoluto de la diferencia entre las medias A y B.
σdif = error típico de la distribución de diferencias entre medias.

Lógicamente, para cada diferencia entre dos medias habrá que calcular
el correspondiente valor FAB:
• Diferencia entre las medias A y B:

• Diferencia entre las medias A y C:

• Diferencia entre las medias B y C:

Es necesario fijar un valor crítico con el que comparar las diferencias


identificadas con el objetivo de saber si son estadísticamente significati-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 286

286 Introducción a la estadística

vas o no, teniendo en cuenta el nivel de error fijado previamente, o


sea, 0,05. Para ello aplicamos la siguiente fórmula:

(Fórmula 11.8)

Donde:
Scrítica = equivalente de una puntuación típica correspondiente a
una Zi crítica.
K = número de grupos o tratamientos.
F(K-1)(N-1),α = valor de la tabla F cuyos grados de libertad son K-1 y N-1, al
α señalado.

El valor crítico con el que hemos de comparar los diferentes valores


FAB es:

Aplicamos el acostumbrado razonamiento probabilístico:


• Con respecto a la diferencia entre las medias A y B: la probabilidad
de obtener por azar un valor FAB de 1,2227502 es mayor que la de S
crítica de 2,680 (α = 0,05). Por ello, se acepta H0. Al tomar esta deci-
sión se podría cometer un error del Tipo II.
• Con respecto a la diferencia entre las medias A y C: la probabilidad
de obtener por azar un valor FAC de 3,2420348 es menor que la de S
crítica de 2,680 (α = 0,05). Por ello, se rechaza H0. Al tomar esta de-
cisión se podría cometer un error del Tipo I.
• Con respecto a la diferencia entre las medias B y C: la probabilidad
de obtener por azar un valor FBC de 2,0192846 es mayor que la de S
crítica de 2,680 (α =0 ,05). Por ello, se acepta H0. Al tomar esta deci-
sión se podría cometer un error del Tipo II.
• Como has podido observar sólo hay una diferencia significativa de
las tres que comprobamos. Eso quiere decir que la prueba F es tan
sensible que es capaz de descubrir una única diferencia significativa.
b) Diferencia mínima significativa (DMS): esta prueba es relativamente si-
milar a la de Scheffé. El primer paso consiste en hallar el valor absoluto
de la diferencia entre cada par de medias:

(Fórmula 11.9)

Diferencia entre las medias A y B: |2,15-3,6083333| = |1,4583333|


Diferencia entre las medias A y C: |2,15-6,0166667| = |3,8666667|
Diferencia entre las medias B y C: |3,6083333-6,0166667| = |2,4083334|
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 287

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 287

El segundo paso consiste en determinar el valor crítico, llamado Dife-


rencia Mínima Significativa, con el que se compararán las diferencias
que se acaba de calcular.
Diferencia Mínima Significativa = σdif Scrítica (Fórmula 11.10)
Diferencia Mínima Significativa = 1,1926666 × 2,680 = 3,196
La comparación sigue la misma pauta que acabamos de ver en la prue-
ba de Scheffé. Para no repetir algo que seguramente ya sabes, sólo se-
ñalaremos que únicamente la diferencia entre las medias de los grupos
A y C, |3,8666667|, tiene una probabilidad de ocurrir por azar inferior
a la de la diferencia mínima significativa, 3,196.
En referencia al problema de investigación, se puede decir que los efec-
tos del método de estudio basado en la realización de ejercicios aloja-
dos en el campus virtual se encuentran a medio camino entre los de la
mera asistencia a clase y los de la ejecución de prácticas de resolución
de problemas. El método de estudio basado en prácticas proporciona
resultados mucho mejores que el de la simple asistencia a clase.

CASO DE MUESTRAS CORRELACIONADAS 11.7.


Aunque no haya sido el caso, y sólo a efectos didácticos, vamos a suponer
que este profesor ha podido establecer una suerte de equiparación entre los
alumnos de los tres grupos tomados de tres en tres y basándose en sus cono-
cimientos previos, nivel de dificultad percibida y nivel de interés inicial en la
materia. Esto significa que se ha introducido una nueva fuente de variación, la
de las filas, ya que se supone que los tres sujetos de cada fila son similares en
las tres variables antes mencionadas. La pregunta que se plantea ahora es sa-
ber si el hecho de equiparar a los sujetos implica diferencias en el rendimien-
to de los alumnos en la parte práctica. Para responder a esta pregunta proce-
demos a llevar a cabo el correspondiente contraste de hipótesis. Sin embargo,
como casi todos los pasos son idénticos a los que acabamos de comentar en
el caso de las muestras independientes, nos vamos a centrar en lo relativo a
esta nueva fuente de variación.
En cuanto a la formulación de H0 y de su correspondiente H1, podríamos
expresarlas del siguiente modo:
Hipótesis nula: no hay diferencias estadísticamente significativas en rendi-
miento debidas a la equiparación de los sujetos.
Hipótesis alternativa: hay diferencias estadísticamente significativas en ren-
dimiento debidas a la equiparación de los sujetos.
Para los cálculos que necesitamos realizar, debemos añadir una columna
referida a las sumas por filas (Σf).
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 288

288 Introducción a la estadística

TABLA 11.8
DATOS DE LOS TRES TRATAMIENTOS

XA X2A XB X2B XC X2C Σf

1º 2,15 4,6225 3,65 13,3225 6,50 42,2500 12,30

2º 4,50 20,2500 0,00 0,0000 3,25 10,5625 7,75

3º 2,00 4,0000 0,00 0,0000 6,25 39,0625 8,25

4º 0,00 0,0000 6,25 39,0625 7,00 49,0000 13,25

5º 2,50 6,2500 5,25 27,5625 6,50 42,2500 14,25

6º 1,75 3,0625 6,50 42,2500 6,60 43,5600 14,85

Σ 12,90 38,1850 21,65 122,1975 36,10 226,6850 70,65

Para calcular las sumas cuadráticas totales, utilizamos la fórmula 11.1 que
ya conocemos y obtenemos:

Siendo el mismo problema y los mismos datos, lógicamente obtenemos


los mismos resultados.
Para calcular las sumas cuadráticas entre los tratamientos, utilizamos la fór-
mula 11.2 que ya conocemos y obtenemos:

Al igual que para las sumas cuadráticas totales obtenemos los mismos re-
sultados por las mismas razones. De hecho, siguen siendo tres los grupos o
tratamientos. Por otra parte, si te fijas en las siguientes fórmulas que puedes
encontrar en algunos manuales, es probable que te des cuenta de su gran si-
militud:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 289

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 289

Muestras independientes Muestras correlacionadas

De hecho, la única diferencia radica en que la primera se refiere a los G gru-


pos y la segunda a los K tratamientos. En ambos casos se están refiriendo a lo
mismo, ya que cada tratamiento se aplica a un determinado grupo de sujetos.
En el caso de las muestras correlacionadas es necesario calcular el efecto
debido a la igualación de los sujetos por fila. Para ello se aplica la siguiente
fórmula:

(Fórmula 11.11)

Donde:
SCENTRE FILAS = sumas cuadráticas entre filas.

= suma de todas las puntuaciones directas de cada fila.

= cuadrado de la suma de todas las puntuaciones directas de


cada fila.
n = número total de sujetos de cada fila.

= resultado de dividir el cuadrado de la suma de todas las


puntuaciones directas de cada fila por su correspondiente n.

= suma de los cocientes de las F filas.

N = número total de sujetos de la muestra.

Te habrás dado cuenta de que se trata de restar de la suma de los cocien-


tes de las f filas lo que conoces como término de corrección. Así:
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 290

290 Introducción a la estadística

Sabemos ya cuál es la parte de la varianza total que se debe a las diferen-


cias entre los tratamientos y entre las filas. Sin embargo, aún nos queda una
parte de varianza desconocida, que llamaremos varianza residual (SCR). Para
determinar su magnitud, podemos restar de la varianza total la suma de las
varianzas conocidas. Podríamos hacerlo del siguiente modo:

SCR = SCT – (SCET + SCEF)

Donde:
SCR = sumas cuadráticas residuales.
SCT = sumas cuadráticas totales.
SCET = sumas cuadráticas entre tratamientos.
SCEF = sumas cuadráticas entre filas.

Así:

SCR = 109,76625 – (45,75583 + 15,88625) = 109,76625 – 61,64208 = 48,12417.

También podemos aplicar la siguiente fórmula para lograr el mismo resul-


tado:

(Fórmula 11.12)

Tómate el tiempo necesario para comparar la magnitud de la varianza alea-


toria bajo el supuesto de muestras independientes y la de las varianzas entre
filas y residual bajo el supuesto de muestras correlacionadas: resulta que la
suma de las varianzas entre filas y residual es igual a la varianza aleatoria.
Con la operación que acabamos de realizar, tan sólo hemos partido la varian-
za aleatoria bajo el supuesto de muestras independientes en dos componen-
tes: uno la varianza entre filas y otro lo que queda, la varianza residual.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 291

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 291

Una vez calculadas las diferentes sumas cuadráticas que, como sabes, son
estimaciones de las correspondientes varianzas poblacionales, debemos deter-
minar los grados de libertad de cada una con el objeto de llevar a cabo las
estimaciones de varianzas para la muestra del estudio. Para ello, podemos
guiarnos por el contenido de la siguiente tabla:

TABLA 11.9
TABLA RESUMEN PARA EL ANÁLISIS DE VARIANZA
DE MUESTRAS CORRELACIONADAS

Fuente de variación SC g.l. MC F

Entre tratamiento SCE g.l.E = t-1 MCE F = MCE : MCR

Entre filas SCEF g.l.EF = f-1 MCEF F = MCEF : MCR


Residual SCR g.l.R = (t-1)(f-1) MCR

Total SCT g.l.T = N-1

Con relación a nuestro problema de investigación, los resultados del análi-


sis de varianza quedan reflejados en la tabla siguiente.

TABLA 11.10
TABLA RESUMEN DE LOS RESULTADOS DEL ANÁLISIS
DE VARIANZA PARA MUESTRAS RELACIONADAS

Fuente de Variación SC g.l. MC F

Entre tratamiento 45,75583 2 22,877915 4,7539345

Entre filas 15,88625 5 3,177250 0,6602191

Residual 48,12417 10 4,812417

Total 109,76625 17

Con respecto al efecto de los métodos de estudio, podemos proponer la si-


guiente interpretación probabilística: la probabilidad de obtener por azar una F =
4,7539345 es menor que la de F crítica de 4,10 (α = 0,05). Por ello, se rechaza
H0. Al tomar esta decisión se podría cometer un error del Tipo I. Los métodos de
estudio se diferencian en sus efectos en el rendimiento en esta materia.
Con respecto al efecto de la igualación por filas, podemos proponer la si-
guiente interpretación probabilística: la probabilidad de obtener por azar una
F = 0,6602191 es mayor que la de F crítica de 3,33 (α = 0,05). Por ello, se
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 292

292 Introducción a la estadística

acepta H0. Al tomar esta decisión, se podría cometer un error del Tipo II. La
igualación de los sujetos por fila no produce efectos sensibles en el rendi-
miento en esta materia.

RELACIÓN ENTRE UNA VARIABLE


11.8. INDEPENDIENTE Y UNA VARIABLE DEPENDIENTE
Como habrás observado, la prueba F, al igual que la prueba t, nos permite con-
trastar H0, es decir, verificar si existen diferencias significativas entre dos o más
medias. Sin embargo, ninguna de las dos pruebas nos informa sobre el nivel de
relación que existe entre la variable independiente y la variable dependiente. En
nuestro caso desconocemos la fuerza de la relación que existe entre el método
de estudio y el rendimiento en esta materia. De momento, lo único que pode-
mos inferir de lo que hemos averiguado es que, como hemos tenido que recha-
zar H0, la relación entre ambas variables es estadísticamente significativa. Sólo
disponemos de una medida más bien indirecta de esta relación, que nos sugiere
que la variable independiente «método de estudio» hace que varíe el rendimiento
de un modo significativo. Podemos afirmar con cierta seguridad que los sujetos
que eligieron las prácticas (Media = 6,02) rinden por encima de aquéllos que de-
cidieron realizar ejercicios del campus virtual (Media = 3,61) o asistir a clase úni-
camente (Media = 2,15). Basta mirar la figura 11.2 para darnos cuenta de que las
medias varían en función de los distintos métodos de estudio de esta materia.

FIGURA 11.2
MEDIAS DE LOS TRES MÉTODOS DE ESTUDIO

8,00

6,00
95% IC Rendimiento

4,00

2,00

0,00

Sólo clase Campus virtual Prácticas


Método de estudio
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 293

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 293

Posiblemente nos resulte más fácil averiguar la magnitud de la relación entre


el método de estudio y el rendimiento si partimos de lo que sabemos del análi-
sis de varianza. Aunque según Kerlinger (1975) la siguiente fórmula no ofrezca
una solución totalmente satisfactoria, al menos ofrece la posibilidad de estable-
cer un coeficiente de correlación entre variables cuya relación es curvilínea.

(Fórmula 11.13)

Donde:
η = coeficiente «eta».
SCE = sumas cuadráticas inter-grupos.
SCT = sumas cuadráticas totales.
= raíz cuadrada.

Si aplicamos esta fórmula a nuestros datos, obtenemos:

Si recurrimos a la propuesta de Fox (1981) para interpretar este coeficien-


te, diríamos que existe una correlación moderada entre ambas variables.
Además podemos interpretar este coeficiente en el mismo sentido que rxy,
es decir, calcular la proporción de varianza común entre la variable indepen-
diente «método de estudio» y «rendimiento en esta materia». De hecho, si ele-
vamos al cuadrado el coeficiente η, obtenemos 0,4168478. En términos por-
centuales, podemos decir que la proporción de la varianza de la variable
rendimiento determinada por la varianza del método de estudio es de
41,68478%, o sea, los distintos modos de enfrentarse al estudio de esta mate-
ria explican el 41,68478% de la variación de las puntuaciones de rendimiento.
Existen otras medidas de asociación, entre las que cabe citar el coeficiente o
correlación intraclase o RI. Para su cálculo, se puede utilizar la siguiente fórmula:

(Fórmula 11.14)

Donde:
RI = coeficiente o correlación intraclase.
MCE = medias cuadráticas intergrupos.
MCD = medias cuadráticas intragrupos.
n = número de sujetos de cada grupo.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 294

294 Introducción a la estadística

Si aplicamos la fórmula 11,12 obtenemos el siguiente resultado:

Como sin duda habrás observado el valor de RI (0,4209142) está más cer-
ca de η2 (0,4168478) que de η (0,6456375). RI y η2 reciben la misma interpre-
tación. RI y η2 se asemejan especialmente en lo que concierne a los princi-
pios que guían su concepción: en ambos casos se trata de comparar la
varianza intergrupos con la varianza total o la varianza aleatoria. Se entiende
que cuanto mayor sea la varianza intergrupos con respecto a la varianza total
o a la varianza aleatoria, mayor es la correlación entre la variable indepen-
diente y la variable dependiente.

11.9. RELACIÓN ENTRE LA PRUEBA t Y LA PRUEBA F

En la práctica ya sabes que ambas pruebas comparten el mismo objetivo, ave-


riguar si dos o más medias proceden de la misma población. ¿Comparten algo
más que el objetivo? La respuesta, al final de este apartado.
Te acuerdas de que en el apartado «Descomposición de la varianza» utili-
zamos dos grupos para demostrar la partición de la varianza. Vamos a recurrir
a estos mismos datos para demostrar que se puede aplicar la prueba F y obte-
ner resultados parecidos a los que ya conoces.
Los datos son los siguientes:

TABLA 11.11
ANÁLISIS DE VARIANZA PARA DOS GRUPOS

Con clases de apoyo Sin clases de apoyo

XA X A2 XB XB2
1º 6,50 42,2500 6,25 39,0625

2º 3,50 12,2500 1,75 3,0625

3º 1,75 3,0625 0,00 0,0000

4º 7,00 49,0000 5,50 30,2500

5º 6,50 42,2500 0,75 0,5625

6º 6,25 39,0625 6,80 46,2400

7º 5,50 30,2500 0,00 0,0000


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 295

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 295

Con clases de apoyo Sin clases de apoyo

XA X A2 XB XB2

8º 6,50 42,2500 0,00 0,0000

9º 6,60 43,5600 7,60 57,7600

10º 3,25 10,5625 5,45 29,7025

11º 5,75 33,0625 0,00 0,0000

12º 7,00 49,0000 3,00 9,0000

Σ 66,10 396,5600 37,10 215,6400



X 5,5083 3,0917

Calculemos las tres SC:

Sabiendo que los grados de libertad son 23 para las SCT, 1 para las SCE y
22 para las SCD, podemos calcular la información restante para la tabla resu-
men de F:

TABLA 11.12
ANÁLISIS DE VARIANZA PARA DOS GRUPOS INDEPENDIENTES

Fuentes de variación Sumas cuadráticas g.l. MC F

Intergrupos 35,041667 1 35,0416670 5,7790579

Intragrupos 133,398330 22 6,0635605

Total 168,440000 23
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 296

296 Introducción a la estadística

Ahora consulta el apartado del capítulo anterior que trata del «caso de n
pequeño y muestras independientes». El resultado que obtuviste en la parte
práctica es de t i = 2,40391. Si elevas este valor al cuadrado, obtienes
2,403912 = 5,7787833. Compara el valor de F (5,7790579) con el de t2
(5,7787833) y verás que son prácticamente iguales. Por ello se suele estable-
cer la siguiente igualdad en el caso de dos grupos independientes: F = t2.
Por cierto, no es necesario que n sea igual para todos los grupos. Así sue-
le ocurrir en los diseños con grupos naturales.

CON LA AYUDA
11.10. DE PROGRAMAS INFORMÁTICOS

Como acabamos de ver, el análisis de varianza simple es una extensión de la


prueba t. Por tanto, es lógico que en los programas de ordenador ambas prue-
bas se encuentren bajo el mismo epígrafe. Así pues, para llevar a cabo el aná-
lisis de varianza mediante el programa SPSS se abre, como ya sabes, el des-
plegable «Analizar» y, como nos interesa «Comparar medias», seleccionamos
esta opción. Como tenemos más de dos grupos, marcamos «ANOVA de un fac-
tor». Por si no lo sabes, ANOVA es un acrónimo de «Analysis of variance», que
quiere decir análisis de varianza.

FIGURA 11.3
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «ANOVA DE UN FACTOR»
DENTRO DE «COMPARAR MEDIAS»
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 297

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 297

En la ventana «ANOVA de un factor» aparecen dos franjas vacías: la franja


superior «Dependientes» está reservada a las variables dependientes. Puedes
insertar tantas variables como lo exija tu problema de investigación. El pro-
grama realizará los cálculos necesarios para cada una de ellas por separado.
Como en este caso nos interesa lo relativo a los resultados de la parte práctica
del examen del primer parcial, seleccionamos la variable «Práctica I». La zona
«Factor» está reservada a la variable independiente; es única. Al igual que para
la prueba t, si tienes varias variables independientes deberás repetir este pro-
ceso para cada una de ellas. Seleccionamos la variable «Grupo de investiga-
ción»; esta variable tiene cuatro valores, pero esta vez tomaremos tres, a sa-
ber: «Sólo clase», «Campus virtual» y «Prácticas».

FIGURA 11.4
SELECCIÓN DE LAS VARIABLES QUE ANALIZAR

Puede ser útil prever la aplicación de los contrastes posteriores puesto que
esperas que las diferencias resulten estadísticamente significativas. Para ello
abres la ventana «Post hoc» y marcas la prueba o pruebas que desees. En este
caso, se ha seleccionado la prueba de Scheffé. Una vez terminado, pulsas
«Continuar» y esta ventana se cierra.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 298

298 Introducción a la estadística

FIGURA 11.5
SELECCIÓN DE LOS CONTRASTES POSTERIORES QUE APLICAR

Una vez cerrada la ventana de comparaciones múltiples vuelves a la de


«ANOVA de un factor». Esta vez abres la ventana de «Opciones» para seleccionar
aquéllas que consideres necesarias para tu estudio. En este caso deseamos que
el programa nos proporcione, además de los resultados propios del análisis de
varianza, información sobre los estadísticos Descriptivos y la Prueba de homoge-
neidad de las varianzas. Marcamos ambas opciones y cerramos la ventana ha-
ciendo clic sobre «Continuar».

FIGURA 11.6
SELECCIÓN DE OPCIONES
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 299

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 299

Una vez completada toda la información que consideramos necesaria para el


análisis de varianza, pulsamos «Aceptar» y el programa proporciona tres tablas:
a) La primera tabla contiene información completa sobre los estadísticos
descriptivos de cada uno de los tres grupos.

TABLA 11.13
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS
Descriptivos
Práctica I

Intervalo de confianza
para la media al 95%

N Media Desviación Error Límite Límete Mínimo Máximo


típica típico inferior superior

Sólo clase 53 3,7991 2,85651 ,39237 3,0117 4,5864 ,00 8,25


Prácticas 9 5,5389 1,80741 ,60247 4,1496 6,9282 1,75 7,00
Campus 8 2,2688 2,61232 ,92360 ,0848 4,4527 ,00 6,25
virtual
Total 70 3,8479 2,80790 ,33561 3,1783 4,5174 ,00 8,25

b) La segunda tabla contiene datos relativos a la hipótesis sobre la igual-


dad de varianzas.

TABLA 11.14
ESTADÍSTICOS INFERENCIALES PARA LA PRUEBA
DE HOMOGENEIDAD DE VARIANZAS
Práctica I

Estadístico
gl1 gl2 Sig.
de Levene

5,489 2 67 ,006

Como ya sabes, el dato de la tabla en el que debes fijarte es «Sig.». A


partir de este dato puedes proponer una interpretación estadística co-
mo la siguiente: la probabilidad de obtener por azar una F empírica de
5,489 es de 0,006; como esta probabilidad es menor que 0,05, hay que
rechazar H0 y admitir a la vez la posibilidad de cometer un error del Ti-
po I. En consecuencia, puedes decir que no se cumple el supuesto de
homoscedasticidad.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 300

300 Introducción a la estadística

c) La tercera tabla contiene datos necesarios para el contraste de hipótesis


respecto al problema de investigación.

TABLA 11.15
ESTADÍSTICAS INFERENCIALES PARA EL CONTRASTE
DE HIPÓTESIS
ANOVA
Práctica I

Suma de gl Media F Sig.


cuadrados cuadrática

Intergrupos 45,811 2 22,906 3,080 ,053


Intragrupos 498,206 67 7,436
Total 544,017 69

Al igual que en la tabla anterior, utilizas «Sig.» para proponer una inter-
pretación estadística como la siguiente: la probabilidad de obtener por
azar una F empírica de 3,080 es de 0,053; como esta probabilidad es
mayor que 0,050, se debe aceptar H0 y admitir al mismo tiempo la po-
sibilidad de cometer un error del Tipo II. En consecuencia, puedes de-
cir que el método de estudio no influye en las diferencias de rendi-
miento en esta materia.
d) La tercera tabla contiene los datos relativos a los contrastes posteriores
(Scheffé y DMS).

TABLA 11.16
CONTRASTES POSTERIORES: PRUEBA DE SCHEFFE
Comparaciones múltiples
Variable dependiente: Práctica I
Scheffé

Intervalo de confianza
al 95%

(I) Grupo de (J) Grupo de Diferencia de Error Sig. Límite Límite


investigación investigación medias (I-J) típico inferior superior

Sólo clase Prácticas –1,73983 ,98311 ,216 –4,2011 ,7214


Campus virtual 1,53031 1,03431 ,341 –1,0591 4,1197

Prácticas Sólo clase 1,73983 ,98311 ,216 –,7214 4,2011


Campus virtual 3,27014 1,32503 ,054 –,0471 6,5874

Campus virtual Sólo clase –1,53031 1,03431 ,341 –4,1197 1,0591


Prácticas –3,27014 1,32503 ,054 –6,5874 ,0471
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 301

¿Cómo averiguar si tres muestras o más son similares o no en una determinada característica? 301

El programa te proporciona información detallada relativa a las compa-


raciones de las medias tomadas de dos en dos. Como de costumbre,
Sig. te permite aventurar una interpretación estadística. Si F no es esta-
dísticamente significativa, entonces es lógico esperar que ninguna com-
paración arroje un resultado estadísticamente significativo. De hecho,
ninguna probabilidad asociada a las diferencias entre pares de medias
es igual o inferior a 0,050. Y esto simplemente confirma lo que ya sa-
bes: todas las medias son estadísticamente similares entre sí. Ahora
bien, recuerda la advertencia que vimos sobre la aceptación de H0
cuando el valor de n es muy pequeño.
La elección de la prueba para los contrastes post hoc implica riesgos
que conviene evaluar, especialmente cuando las n son claramente desi-
guales. De haber elegido la prueba de la Diferencia Mínima Significa-
tiva (DMS), habríamos obtenido los datos de la siguiente tabla:

TABLA 11.17
CONTRASTES POSTERIORES: PRUEBA DMS
Comparaciones múltiples
Variable dependiente: Práctica I
DMS

Intervalo de confiaza
al 95%

(I) Grupo de (J) Grupo de Diferencia de Error Sig. Límite Límite


investigación investigación medias (I-J) típico inferior superior

Sólo clase Prácticas –1,73983* ,98311 ,081 –3,7021 ,2225


Campus virtual 1,53031* 1,03431 ,144 –,5342 3,5948

Prácticas Sólo clase 1,73983* ,98311 ,081 –,2225 3,7021


Campus virtual 3,27014* 1,32503 ,016 –,6254 5,9149

Campus virtual Sólo clase –1,53031* 1,03431 ,144 –3,5948 ,5342


Prácticas –3,27014* 1,32503 ,016 –5,9149 ,6254

Como puedes observar, esta tabla nos sorprende con una diferencia
significativa en rendimiento entre Prácticas y Campus virtual. La dife-
rencia entre los resultados DMS y Scheffé radica en que, dada la amplia
disparidad de los tamaños muestrales, la segunda recurre a la media ar-
mónica en vez de a la media aritmética y además no garantiza el recha-
zo de H0 si es falsa. Recuerda que la media armónica es notablemente
más pequeña que la media aritmética.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 302

302 Introducción a la estadística

11.11. TU TURNO
1. La manipulación de la variable independiente produce un tipo de varian-
za que se conoce como:
1. Varianza experimental.
2. Varianza muestral.
3. Varianza aleatoria.
4. Varianza de muestreo.
2. La varianza total se divide en al menos dos componentes que son
1. Varianza poblacional y varianza muestral.
2. Varianza experimental y varianza aleatoria.
3. Varianza de muestreo y varianza muestral.
4. Varianza experimental y varianza sistemática.
3. Si αg tiene el mismo valor para los g grupos, entonces se puede concluir
que:
1. La varianza experimental es igual a 0.
2. La varianza de error es igual a 1.
3. El efecto del experimento es óptimo.
4. La varianza debida a la manipulación de la variable experimental es
máxima.
4. Si al realizar los cálculos estadísticos obtienes una F = 1, entonces puedes
estar seguro de que
1. Hay un error en tus cálculos.
2. La varianza experimental y la varianza de error son iguales.
3. La varianza experimental es superior a la varianza de error.
4. El efecto debido al azar es muy superior al efecto debido a la manipu-
lación de la variable experimental.
5. Teniendo en cuenta el contenido de tu base de datos, formula una hipó-
tesis sustantiva como la siguiente: los métodos de estudio utilizados para
aprender esta materia deben producir efectos diferentes. Después, trans-
forma tu hipótesis sustantiva en una hipótesis estadística y procede al
contraste de hipótesis. Es mejor que utilices algún programa estadístico
para ayudarte en el análisis de tus datos. Recuerda que antes de interpre-
tar los resultados debes comprobar si se cumple el supuesto de homosce-
dasticidad, en el caso de que tu hipótesis haga referencia a grupos inde-
pendientes.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 303

Capítulo 12
¿CÓMO AVERIGUAR SI DOS O MÁS
VARIABLES DEBIDAMENTE CONTROLADAS
INFLUYEN SIMULTÁNEAMENTE SOBRE
UN DETERMINADO RESULTADO?

Al terminar este capítulo deberías:


• Conocer el concepto de interacción entre variables independientes.
• Conocer las características de los diseños factoriales.
• Ser capaz de descomponer la varianza en más de dos componentes.
• Ser capaz de relacionar cada parte de la varianza total con su
fuente o causa.
• Conocer la lógica del cálculo de F en función de las características
del diseño factorial.
• Ser capaz de diferenciar los efectos fijos y los efectos aleatorios.
• Ser capaz de distinguir los tipos básicos de diseños bifactoriales.
• Ser capaz de realizar el contraste de hipótesis de un diseño factorial.

(Si hay algún concepto que no te haya quedado claro, más vale revisar a
fondo aquello que esté confuso antes de proseguir. En este capítulo vas a am-
pliar tus conocimientos y habilidades. Es muy importante prestar atención
al proceso de partición de la varianza total.)

En el capítulo anterior acabamos de ver cómo proceder para averiguar si dos


muestras o más pertenecen o no a la misma población, suponiendo que en el
experimento intervenga una única variable independiente. Esta vez nos inte-
resa saber qué hacer si el experimento implica a dos o más variables inde-
pendientes.
Como sin duda recordarás cada variable independiente, permite definir un
cierto número de grupos. En el caso más simple cada variable independiente
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 304

304 Introducción a la estadística

determina dos grupos, por ejemplo uno de control y otro experimental. Supon-
gamos que tenemos dos variables independientes como «métodos de estudio de
esta materia» y tipo de «estudios cursados en Bachillerato». La variable «métodos
de estudio de esta materia» tiene dos valores: a) realizar el aprendizaje a través
del campus virtual y b) no realizar el aprendizaje a través del campus virtual. La
variable «estudios cursados en Bachillerato» tiene también dos valores: a) haber
realizado estudios catalogados globalmente como de ciencias, b) haber realiza-
do estudios catalogados globalmente como de letras. Si cruzamos ambas varia-
bles, obtenemos un conjunto de cuatro grupos. Si te fijas en la tabla siguiente,
observarás que los cuatro grupos son independientes entre sí, es decir, un
alumno que ha cursado «ciencias» y elige o es asignado al campus virtual, no
puede estar en el mismo grupo que el alumno que ha cursado «letras» y tam-
bién ha elegido o ha sido asignado al campus virtual: la pertenencia a un gru-
po excluye automáticamente la pertenencia a cualquier otro grupo.

TABLA 12.1
CRUCE DE DOS VARIABLES INDEPENDIENTES

Métodos de estudio de esta materia

Realizar el aprendizaje a No realizar el aprendizaje a


través del campus virtual través del campus virtual

Realizar el aprendizaje a No realizar el aprendizaje


Ciencias través del campus virtual, a través del campus vir-
habiendo cursado previa- tual, habiendo cursado
Estudios mente «ciencias» previamente «ciencias»
cursados en
Bachillerato Realizar el aprendizaje a No realizar el aprendizaje
Letras través del campus virtual, a través del campus vir-
habiendo cursado previa- tual, habiendo cursado
mente «letras» previamente «letras»

NUEVA FUENTE DE VARIACIÓN:


12.1. LA INTERACCIÓN

Además de las fuentes de varianza que ya conocemos, hemos de añadir una


nueva. Por una parte, lógicamente cada una de las variables independientes
implica una fuente conocida de variación sistemática. Por tanto, la varianza
experimental medida en la variable dependiente se divide como mínimo en
dos partes: una parte debida a cada una de las variables independientes. Por
otro lado, si nos paramos a pensarlo un poco, nos daremos cuenta de que
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 305

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 305

hay una tercera fuente de varianza y es aquélla que se debe a la relación que
establecemos entre las dos variables independientes. De hecho, si especifica-
mos dos variables independientes es que esperamos que exista algún tipo de
relación entre ambas. Así, en este diseño sugerimos implícitamente que una
parte del rendimiento se debe a la vez al tipo de estudios cursados en Bachi-
llerato y al método de estudio de esta materia. Esto significa que hay una par-
te de la varianza experimental que se debe a la participación conjunta de las
dos variables independientes en la variación que se observa en el rendimien-
to de esta materia. Esta participación conjunta se conoce como interacción.
En resumen, de lo que acabamos de comentar se deduce que lo que conoce-
mos como varianza experimental es en realidad la suma de la influencia de tres
tipos de fuentes: la primera VI, la segunda VI y la interacción entre las dos VIs.
Por cierto, cada una de las variables independientes se considera como
factor o causa que explica parcial o totalmente los efectos medidos en la va-
riable dependiente. De ahí el apelativo de factorial con el que se conoce este
tipo de diseños de investigación. En nuestro caso, estamos ante un diseño bi-
factorial 2 × 2 porque tenemos dos factores o VIs que tienen cada uno dos
valores. En esta etapa nos centraremos en el diseño más sencillo, el de 2 × 2;
pero los diseños factoriales pueden llegar a ser bastante más complejos. Por
otro lado, conviene recordar que hay un aspecto básico de los diseños expe-
rimentales que no se ha podido aplicar en este estudio: la aleatorización.

ANÁLISIS DE VARIANZA FACTORIAL 12.2.

Para analizar los resultados de un diseño de investigación que implica a dos o


más variables independientes, necesitamos recurrir a una técnica capaz de deter-
minar la magnitud de los efectos debidos a cada una de las variables inde-
pendientes, así como la debida al efecto conjunto de las variables indepen-
dientes. Este método estadístico se conoce como análisis de varianza factorial.
Sabemos que nuestra investigación no responde a un diseño factorial en
sentido estricto. Asumimos, por tanto, que el incumplimiento de los requisitos
para la utilización del análisis de varianza puede condicionar las conclusiones
a las que podamos llegar. Con estas salvedades, vamos a ver qué pasos hay
que dar para el análisis de los datos que fueron recogidos al finalizar los pri-
meros cuatro meses del curso.
El profesor desea averiguar si producen diferencias en el rendimiento en
esta materia el método de estudio elegido por el alumno, el hecho de haber
cursado ciencias o letras en Bachillerato y la interacción entre el método ele-
gido y el tipo de Bachillerato. Para ello, el profesor elige al azar a cinco alumnos
de cada grupo para llevar a cabo su comprobación, especialmente con rela-
ción a la solución de problemas de investigación.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 306

306 Introducción a la estadística

TABLA 12.2
RENDIMIENTO EN ESTA MATERIA

Campus virtual

Sí No

X X

3,65 7,00

5,25 6,00
Ciencias
6,50 2,50

6,25 7,60

Bachillerato 6,50 3,00

X X

0,00 5,45

3,50 5,50
Letras
0,00 6,80

0,00 6,50

5,75 5,50

1. Formulación de las H0s y de sus correspondientes H1s


Teniendo en cuenta que estamos ante tres fuentes de variación, hay
que formular tres H0s:
a) Hipótesis nula: H0: σ2A = 0 o H0: μA1= μA2. Los dos métodos de estu-
dio no producen diferencias estadísticamente significativas en rendi-
miento en esta materia.
Hipótesis alternativa: H1: σ2A ≠ 0. Los dos métodos de estudio sí pro-
ducen diferencias estadísticamente significativas en rendimiento en
esta materia.
b) Hipótesis nula: H0: σ2B = 0 o H0: μB1= μB2. El tipo de estudios cursa-
dos en Bachillerato no produce diferencias estadísticamente signifi-
cativas en rendimiento en esta materia.
Hipótesis alternativa: H1: σ2B ≠ 0. El tipo de estudios cursados en Ba-
chillerato sí produce diferencias estadísticamente significativas en
rendimiento en esta materia.
c) Hipótesis nula: H0: σ2A × B = 0. No hay diferencias estadísticamente
significativas en rendimiento en esta materia debidas al efecto inte-
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 307

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 307

ractivo de las dos VIs (método de estudio y tipo de estudios cursa-


dos en Bachillerato).
Hipótesis alternativa: H1: σ2A × B ≠ 0. Sí, hay diferencias estadística-
mente significativas en rendimiento en esta materia debidas al efec-
to interactivo de las dos VIs (método de estudio y tipo de estudios
cursados en Bachillerato).
2. Nivel de significación: α = 0,05.
3. Elección de la prueba estadística: por una parte la variable dependiente
«rendimiento» es de intervalo; por otra, las variables independientes
«método de estudio» y «tipo de estudios cursados en Bachillerato» deter-
minan cuatro grupos independientes. Por ello, la prueba estadística
adecuada es la prueba F para muestras independientes.
4. Distribución muestral: La distribución muestral es una distribución de
probabilidad, que se forma con los valores de F obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 está
formada por todos los valores de la distribución muestral cuya probabi-
lidad asociada, si H0 es verdadera, sea ≤ 0,05.
6. Cálculo de la prueba estadística. Análisis de varianza factorial, F, para
grupos independientes.
Hallamos todas las sumas que vamos a necesitar.

Campus virtual (A)

Sí No

X X2 X X2

3,65 13,3225 7,00 49,0000

Ciencias 5,25 27,5625 6,00 36,0000


Bachillerato
(B)
6,50 42,2500 2,50 6,2500

6,25 39,0625 7,60 57,7600

6,50 42,2500 3,00 9,0000

ΣX = 54,25 n=5 ΣX2 = 164,4475 n=5 ΣX2 = 158,010


ΣX = 322,4575 ΣX = 28,15
2
ΣX = 26,10
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 308

308 Introducción a la estadística

Campus virtual (A)

Sí No

X X2 X X2

0,00 0,0000 5,45 29,7025

Letras 3,50 12,2500 5,50 30,2500


Bachillerato
(B)
0,00 0,0000 6,80 46,2400

0,00 0,0000 6,50 42,2500

5,75 33,0625 5,50 30,2500

ΣX = 39 n=5 ΣX2=45,3125 n=5 ΣX2 = 178,6925


ΣX = 224,005
2
ΣX = 9,2 ΣX = 29,75

ΣX = 93,25 n = 10 ΣX2 = 209,76 n = 10 ΣX2 = 336,7025


Total
ΣX2 = 546,4625 ΣX = 37,40 ΣX = 55,85

Como ya sabes, conviene calcular en primer lugar la varianza total. Para


ello, aplicamos la siguiente fórmula:

(Fórmula 12.1)

Donde:
Xijk = cada una de las puntuaciones de la muestra.
X2ijk = cuadrado de cada una de las puntuaciones de la muestra.
N = número total de sujetos.

Por cierto, en las salidas SPSS la suma de los cuadrados de todas las pun-

tuaciones directas recibe el nombre de Total. El término

de corrección se llama Intersección y

las SC totales, 111,684, Total corregida.


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 309

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 309

En segundo lugar, hemos de calcular la magnitud del efecto de cada una


de las variables independientes. Podemos empezar por cualquiera de ellas. En
este caso, vamos a comenzar por la variable independiente «Método de estudio
de esta materia»:

(Fórmula 12.2)

Donde:

= cuadrado de la suma de las puntuaciones directas en fun-


ción de la variable independiente A (lectura de datos en
columna).
n = número de sujetos de cada tratamiento.

= cociente obtenido al dividir cada cuadrado de la suma de


las puntuaciones directas en función de la variable inde-
pendiente A por su correspondiente n.

= suma de todos los cocientes.


N = número total de sujetos.

Seguimos con el estudio del efecto debido a la variable independiente «Es-


tudios cursados en Bachillerato»:

(Fórmula 12.3)

Donde:

= cuadrado de la suma de las puntuaciones directas en fun-


ción de la variable independiente B (lectura de datos en
fila).
n = número de sujetos de cada tratamiento.

= cociente obtenido al dividir cada cuadrado de la suma de


las puntuaciones directas en función de la variable inde-
pendiente B por su correspondiente n.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 310

310 Introducción a la estadística

= suma de todos los cocientes.

N = número total de sujetos.

En tercer lugar, calculamos el efecto debido a la interacción entre A (Méto-


do de estudio de esta materia) y B (Estudios cursados en Bachillerato). Para
ello, aplicamos la siguiente fórmula:

SCAB = SCentre subgrupos – (SCA + SCB) (Fórmula 12.4)

Como paso previo al cálculo de la interacción entre A y B, debemos calcu-


lar las SC entre subgrupos. Para ello, aplicamos la siguiente fórmula:

(Fórmula 12.5)

Donde:

= cuadrado de la suma de las puntuaciones directas de ca-


da subgrupo.
n = número de sujetos de cada subgrupo.

= cociente obtenido al dividir cada cuadrado de la suma de


las puntuaciones directas de cada subgrupo por su co-
rrespondiente n.

= suma de todos los cocientes.

Por cierto, las SCentre subgrupos aparecen en las salidas SPSS con el rótulo «Mo-
delo corregido».

SCAB = 54,073 – (17,020 + 11,628) = 25,425


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 311

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 311

El cuarto y último paso consiste en calcular la varianza de error. Y para


ello, aplicamos la siguiente fórmula:

SCError = SCT – SCentre grupos (Fórmula 12.6)


SCError = 111,684 – 54,073 = 57,611

Para calcular los grados de libertad y las correspondientes MC, puedes re-
currir a la siguiente tabla:

TABLA 12.3
CÁLCULO DE LOS GRADOS DE LIBERTAD

Fuentes de variación SC Grados de libertad (gl) MC

A a-1

B b-1

A*B (a-1)(b-1)

Error (ab)(n-1)

Total N-1

Donde:
a = número de valores de la variable independiente A.
b = número de valores de la variable independiente B.
N = número total de sujetos.
n = número de sujetos de cada subgrupo.

TABLA 12.4
TABLA RESUMEN DEL ANÁLISIS DE VARIANZA FACTORIAL

Fuentes de variación SC gl MC

Métodos - A 17,020 1 17,020

Bachillerato - B 11,628 1 11,628

Métodos * Bachillerato 25,425 1 25,425

Error 57,611 16 3,601

Total 111,684 19
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 312

312 Introducción a la estadística

12.3. ACOTACIONES AL CÁLCULO DE F FACTORIAL

El razonamiento que venimos aplicando para el cálculo de F se basa en la compa-


ración de la varianza correspondiente a cada fuente de variación con la varianza
de error. Cuando se trata de una única variable independiente, este razonamiento
apenas plantea dudas. Sin embargo, cuando el diseño implica a dos o más varia-
bles independientes, entonces hay que tomar en consideración otros dos elemen-
tos a la hora de calcular F: el modo de determinar los valores de cada variable in-
dependiente, así como la naturaleza de las variables independientes implicadas.
A la hora de seleccionar los valores de cualquier variable independiente,
se puede proceder de una de las siguientes maneras:
a) Seleccionar aleatoriamente dos o más entre los finitos o infinitos valores
de una variable
Por ejemplo, si quisiéramos formar grupos en función del nivel de difi-
cultad percibida de esta materia, podríamos seleccionar al azar dos ni-
veles o más dentro de la escala de esta variable que, como recordarás,
se extiende entre 0 y 100. Si aplicamos la técnica del muestreo aleato-
rio, podríamos obtener, por ejemplo, tres valores tales como 27, 80 y
95. En consecuencia, en la muestra entrarían, exclusivamente por azar,
alumnos con un nivel de dificultad percibida de 27, 80 y 95.
En este caso nos interesarían, en primer término, los efectos aleatorios
producidos por esta variable.
b) Elegir dos o más entre los valores de una variable aplicando un criterio
sistemático o utilizar todos los valores de la variable
Volviendo al caso del nivel de dificultad percibida, el investigador podría
decidir elegir tres valores que considera como más significativos en fun-
ción del objetivo de la investigación. Por ejemplo, podría tomar los valo-
res 25, 50, 75 si desea averiguar si las diferencias en rendimiento están
relacionadas con el incremento del nivel de dificultad percibida.
Si el número de valores es limitado, como por ejemplo en el caso de
los métodos diseñados por el propio investigador, lo lógico es que uti-
lice todos los valores de la variable.
Cuando el investigador elige los valores aplicando un criterio propio, le in-
teresan sobre todo los efectos fijos producidos por la variable que manipula.
En los diseños factoriales, el investigador trabaja con al menos dos va-
riables independientes. Para cada una de ellas debe especificar de qué
modo procede para elegir los valores de las variables. Con relación a
los métodos de estudio de esta materia, el investigador se centra en los
efectos del campus virtual en el rendimiento. Para ello, define sólo dos
valores y utiliza ambos. Con relación a los estudios cursados en Bachi-
llerato, de nuevo define dos valores y utiliza los dos. Por tanto, en este
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 313

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 313

diseño destaca el interés por los efectos fijos. Por ello, este tipo de di-
seño se conoce como de efectos fijos o Tipo I.
Para conocer las características de los demás diseños, basta cruzar el modo
de selección de los valores con el número de variables independientes y se
obtiene un total de cuatro modelos de diseños factoriales.

TABLA 12.5
MODELOS DE DISEÑOS BIFACTORIALES
Modo de selección de valores
Fijo Aleatorio

Variables independientes A B Mixto Tipo III


B A Mixto Tipo IV
Tipo I Tipo II

El problema que se plantea ante esta diversidad de diseños se relaciona


con el modo de calcular F. No resulta evidente que se deba comparar en to-
dos los casos la variación debida a la fuente de variación experimental o de
interacción con la fuente de error. Como éste no es el lugar indicado para dis-
cutir sobre qué se debería comparar con qué, simplemente vamos a reflejar lo
que los resultados de sesudos y complejos cálculos matemáticos sugieren co-
mo más adecuado. Para calcular las distintas Fs, hay que tener en cuenta las
indicaciones contenidas en la siguiente tabla:

TABLA 12.6
CÁLCULO DE F SEGÚN EL MODELO DE DISEÑO

Tipo II Tipo III Tipo IV


Fuentes Tipo I
Efectos Mixto con A fijo Mixto con A
de variación Efectos fijos
aleatorios y B aleatorio aleatorio y B fijo

Sistemática

A× B
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 314

314 Introducción a la estadística

Ya sabes que en teoría el diseño de este estudio se adecua al Tipo I, ya que


A y B son factores fijos. Por ello, las magnitudes que reflejan la variación debida
a las distintas fuentes conocidas, a saber A, B, y A*B, se comparan con la va-
rianza de error. Esto nos permite pasar al cálculo de las correspondientes Fs.

TABLA 12.7
TABLA RESUMEN DEL ANÁLISIS DE VARIANZA FACTORIAL

Fuentes F crítica
SC Gl MC F
de variación (α = 0,05)

Métodos - A 17,020 1 17,020 4,727 4,49

Bachillerato - B 11,628 1 11,628 3,229 4,49

Métodos * Bachillerato 25,425 1 25,425 7,061 4,49

Error 57,611 16 3,601

Total 111,684 19

7. Interpretación estadística y pedagógica


Recuerda que al principio formulamos tres H0s Por tanto, en nuestras
conclusiones deberemos mencionar cada una de ellas:
• H01: la probabilidad de obtener por azar una F = 4,727 es menor
que la de una F crítica de 4,49 (α = 0,05). Por ello, se rechaza H0. Al
tomar esta decisión se podría cometer un error del Tipo I. En conse-
cuencia, los alumnos que eligieron el campus virtual rinden peor
que quienes no lo eligieron.
• H02: la probabilidad de obtener por azar una F = 3,229 es mayor
que la de una F crítica de 4,49 α = 0,05). Por ello, se acepta H0. Al
tomar esta decisión se podría cometer un error del Tipo II. En con-
secuencia, los alumnos que cursaron ciencias en Bachillerato rinden
igual que los que cursaron letras o viveversa.
• H03: la probabilidad de obtener por azar una F = 7,061 es menor
que la de una F crítica de 4,49 (α = 0,05). Por ello, se rechaza H0. Al
tomar esta decisión se podría cometer un error del Tipo I. En conse-
cuencia, los estudios cursados en Bachillerato y la realización o no
del aprendizaje de esta materia a través del campus virtual influyen
conjuntamente sobre el rendimiento de los alumnos.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 315

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 315

Si el efecto interactivo es significativo, entonces el factor A (Campus


virtual) no tiene el mismo efecto en todos los niveles del factor B (Es-
tudios cursados en Bachillerato).

POSIBLES RESULTADOS DE UN ANÁLISIS


DE VARIANZA FACTORIAL 12.4.

La tabla 12.8 así como la figura 12.1 muestran los resultados del análisis que
acabamos de completar.

TABLA 12.8
MEDIAS ESTIMADAS DE LA INTERACCIÓN

Métodos de estudio de esta materia

Realizar el No realizar el
aprendizaje a través aprendizaje a través
del campus virtual del campus virtual

Estudios Ciencias 5,630 5,220


cursados en
Bachillerato Letras 1,850 5,950

Los datos de la tabla 12.8 y los del siguiente gráfico nos permiten observar
que los alumnos que cursaron ciencias en Bachillerato rinden más si eligen el
campus virtual mientras los de letras rinden más si evitan el campus virtual.
Es muy interesante observar que sólo uno de los dos factores tomado por se-
parado produce diferencias estadísticamente significativas en el rendimiento.

3 Campus virtual

2 n Sí

n No
1
Ciencias Letras
Bachillerato
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 316

316 Introducción a la estadística

Si repitiéramos este estudio varias veces, posiblemente obtendríamos re-


sultados diferentes. Estos resultados se podrían reflejar mediante alguno de
los siguientes gráficos:

FIGURA 12.1
POSIBLES RESULTADOS DE UN DISEÑO BIFACTORIAL

7 a) En este gráfico puedes observar que las medias



6 X de Ciencias y Letras de los grupos «ciencias» y «letras» son aproxima-
5
damente iguales. Además la media de quienes
que utilizaron el campus virtual prácticamente es
4
igual a la de los que no lo hicieron. Finalmente, las
3 Campus virtual medias de rendimiento de los cuatro grupos ape-
2 n Sí nas se diferencian entre sí. En consecuencia, este
1
n No gráfico refleja resultados que no muestran ningún
Ciencias Letras efecto significativo.
Bachillerato

7 b) Al igual que el gráfico anterior, aquí puedes


6 observar que las medias de los grupos «cien-
5
cias» y «letras» son iguales. No se puede asegu-
rar que la media de los de ciencias que utilizaron
4
el campus virtual sea diferente a la media de los
3 Campus virtual de letras que estuvieron en iguales condiciones
2 n Sí experimentales. La única diferencia significativa
n No en rendimiento es la referida a la superioridad del
1
Ciencias Letras rendimiento de los alumnos que trabajaron con
Bachillerato el campus virtual sobre los que no.

7
c) En este gráfico puedes observar que las medias
6 de los grupos de campus virtual «sí» y «no» son
5 prácticamente iguales. Tampoco se puede asegu-
4
rar que la media de los de ciencias que utilizaron el
campus virtual sea diferente a la media de los que
3 Campus virtual
no lo utilizaron; lo mismo ocurre en letras. La única
2 n Sí diferencia significativa en rendimiento es la referida
1
n No a la superioridad del rendimiento de los alumnos
Ciencias Letras de «ciencias» sobre los de «letras».
Bachillerato

6 d) En este gráfico dos observaciones llaman la


atención. Por una parte, las medias de los gru-
5
pos de campus virtual «sí» y «no» son significati-
4 vamente desiguales. Lo mismo ocurre con las
3 Campus virtual medias de los grupos de «ciencias» y «letras».
2 n Sí Sin embargo, no se puede asegurar que un mé-
n No
todo sea mejor para unos que para otros, porque
1
Ciencias Letras en apariencia recurrir al campus virtual produce
Bachillerato resultados superiores para los dos grupos en
comparación con el no uso de esta herramienta.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 317

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 317

7
e) Si calculas las medias de los grupos de cam-
6
pus virtual «sí» y «no», observarás que son simi-
5
lares. Si haces lo mismo con las medias de los
4 grupos de «ciencias» y de «letras», obtendrás
3 Campus virtual
un resultado parecido. Sin embargo, si hallas
n Sí
las medias de interacción llegarás a la conclu-
2
sión de que los alumnos de ciencias que utiliza-
n No
1
Ciencias Letras
ron el campus virtual y los de letras que no lo
Bachillerato
utilizaron obtienen resultados igualmente desta-
cados.

f) Si calculas las medias de los grupos de «cien-


7
cias» y «letras» observarás que son diferentes. Si
6 haces lo mismo con las medias de los grupos de
5 campus virtual «sí» y «no», obtendrás un resulta-
do parecido. Y, si hallas las medias de interac-
4
ción, llegarás a la conclusión de que aquellos
3 Campus virtual alumnos de ciencias que utilizaron el campus vir-
2 n Sí tual y aquellos de letras que no lo utilizaron ob-
1
n No tienen resultados estadísticamente diferentes. En
Ciencias Letras este caso, observas que todos los efectos son
Bachillerato
significativos.

Conviene que sepas que los efectos principales, es decir, los debidos a ca-
da una de las variables independientes, pueden ser no significativos y, sin
embargo, la interacción ser significativa.

CON LA AYUDA
DE PROGRAMAS INFORMÁTICOS 12.5.

Al iniciar el estudio del análisis de varianza en el capítulo anterior especifica-


mos que partíamos del modelo lineal general Xig = μ + αg + εig para el caso de
un único factor. La incorporación de un segundo factor no cambia el supues-
to inicial. Para llevar a cabo el análisis de varianza factorial mediante el pro-
grama SPSS abrimos, como ya es costumbre, el desplegable «Analizar», y co-
mo nos interesa verificar el modelo lineal general para el caso de dos
variables independientes, seleccionamos la opción «Univariante» dentro del
«Modelo lineal general».
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 318

318 Introducción a la estadística

FIGURA 12.1
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «UNIVARIANTE»
DENTRO DE «MODELO LINEAL GENERAL»

En la ventana «Univariante» aparecen cinco franjas vacías: la franja superior


«Dependiente» está reservada a la única variable dependiente objeto de estudio.
Como en este caso nos interesa lo relativo a los resultados de la parte práctica
del examen del primer parcial, seleccionamos la variable «Práctica I». La zona
«Factores fijos» está reservada a las variables independientes cuyos efectos dese-
amos comprobar en la variable dependiente; podemos indicar tantas variables
independientes como lo exija nuestra investigación. En este caso, nos interesa
averiguar el efecto de las variables «WEB-CT» y «Ciencias o Letras» sobre el ren-
dimiento en esta materia. Las demás franjas se quedan vacías.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 319

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 319

FIGURA 12.2
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Por defecto, el programa nos propone el modelo Tipo III. Podemos selec-
cionar el modelo que mejor responde a nuestro estudio. En este caso, hemos
seleccionado el modelo Tipo I que, como sabes, es de efectos fijos.

FIGURA 12.3
SELECCIÓN DEL MODELO DE ANÁLISIS
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 320

320 Introducción a la estadística

Puede ser útil prever la aplicación de los contrastes posteriores, ya que es-
peras que las diferencias resulten estadísticamente significativas. Para ello,
abres la ventana «Contrastes» y en la sección «Contraste» seleccionas entre las
diversas pruebas la que mejor responda a tu problema y la marcas. En este
caso, se ha seleccionado la prueba de la «Diferencia», entre las medias de los
cuatro grupos experimentales. Hay que pulsar sobre la orden «Cambiar» para
que este cambio surta efecto. Sabrás que ha surtido efecto cuando aparezca
junto al nombre del factor para el que quieres llevar a cabo el contraste pos-
terior. Sin embargo, si las variables tienen cada una sólo dos valores, esta in-
dicación es superflua. Una vez terminado pulsas «Continuar» y esta ventana se
cierra.

FIGURA 12.4
SELECCIÓN DE CONTRASTES

Una vez cerrada la ventana de los contrastes posteriores, conviene abrir la


de «Opciones» para seleccionar todas las que consideres necesarias para tu es-
tudio. En este caso deseamos que el programa nos proporcione, además de
los resultados propios del análisis de varianza factorial, las medias globales, y
para cada grupo experimental, las comparaciones de los efectos principales,
aplicando la prueba DMS, los estadísticos Descriptivos y la Prueba de homoge-
neidad de las varianzas. Marcamos todas estas opciones y cerramos la venta-
na haciendo clic sobre «Continuar».
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 321

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 321

FIGURA 12.5
SELECCIÓN DE OPCIONES

Como ya sabes, en muchas ocasiones se presentan algunos resultados de


manera gráfica. Por ello, para obtener una representación de tus resultados será
necesario proporcionar al programa los datos idóneos. Se procede del siguiente
modo: una vez abierta la ventana de Gráficos, hay que seleccionar la variable
que debe ir en el eje horizontal y después la que debe ir en el eje vertical. En
realidad el orden de inserción de las variables es completamente irrelevante.

FIGURA 12.6
DATOS PARA EL GRÁFICO DE LA INTERACCIÓN
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 322

322 Introducción a la estadística

Una vez seleccionadas las variables, debes pulsar la orden «Añadir». Si deseas
obtener más gráficos, puedes repetir los pasos anteriores tantas veces como
quieras sin olvidar «Añadir» cada vez que introduzcas un gráfico. Finalmente,
pulsas «Continuar».
Una vez completada toda la información que consideramos necesaria para
el análisis de varianza factorial pulsamos «Aceptar» y el programa proporciona
varias tablas entre las que seleccionamos las siguientes:
a) Estadísticos descriptivos de cada uno de los cuatro grupos.

TABLA 12.9
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS

WEB-CT Ciencias o Letras Media Desv. tip. N

Sí Ciencias 5,1917 1,53148 6


Letras 2,3214 3,07108 7
Total 3,6462 2,81265 13
No Ciencias 3,2625 3,22620 8
Letras 4,0788 2,74347 52
Total 3,9700 2,79629 60
Total Ciencias 4,0893 2,73645 14
Letras 3,8703 2,81468 59
Total 3,9123 2,78236 73

b) Comprobación del supuesto de la igualdad de varianzas

TABLA 12.10
CONTRASTE DE LEVENE
Variable dependiente: Práctica I

F gl1 gl2 Significación

2,469 3 69 ,069

Contrasta la hipótesis nula de que la varianza error de la variable depen-


diente es igual a lo largo de todos los grupos.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 323

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 323

A partir de lo que sabes de la Significación puedes proponer una inter-


pretación estadística como la siguiente: la probabilidad de obtener por
azar una F empírica de 2,469 es de 0,069; como esta probabilidad es
mayor que 0,05, hay que aceptar H0 y admitir a la vez la posibilidad de
cometer un error del Tipo II. En consecuencia, puedes decir que se
cumple el supuesto de que la varianza error de la variable dependiente
es aproximadamente igual a lo largo de los cuatro grupos.
c) Pruebas de los efectos entre los sujetos

TABLA 12.11
PRUEBAS DE LOS EFECTOS ENTRE LOS SUJETOS

Variable dependiente: Práctica I

Suma de
Fuente cuadrados gl Media F Significación
tipo I

Modelo corregido 32,357ª 3 10,786 1,414 ,245

Intersección 1117,361 1 1117,361 146,644 ,000

WEB-CT 1,121 1 1,121 ,147 ,702

v44 1,284 1 1,284 ,169 ,682

WEB-CT * v44 29,952 1 29,952 3,936 ,051

Error 525,032 69 7,609

Total 1674,750 73

Total corregida 557,389 72

Al igual que en la tabla anterior, la Significación te ayuda a la hora de


proponer interpretaciones estadísticas como las siguientes:
a) WEB-CT: la probabilidad de obtener por azar una F empírica de
0,147 es de 0,702; como esta probabilidad es mayor que 0,05, se
acepta H0 y se admite al mismo tiempo la posibilidad de cometer
un error del Tipo II. En consecuencia, se puede decir que el cam-
pus virtual no tiene una influencia diferencial notable en el rendi-
miento de los alumnos.
b) v44 (ciencias o letras): la probabilidad de obtener por azar una F
empírica de 0,169 es de 0,682; como esta probabilidad es mayor
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 324

324 Introducción a la estadística

que 0,05, se acepta H0 y se admite al mismo tiempo la posibilidad


de cometer un error del Tipo II. En consecuencia, el hecho de cur-
sar ciencias o letras en Bachillerato no influye en las diferencias de
rendimiento en esta materia.
c) WEB-CT * v44 (Interacción WEB-CT * ciencias o letras): la probabi-
lidad de obtener por azar una F empírica de 3,936 es de 0,051; co-
mo esta probabilidad es mayor que 0,05, se acepta H0 y se admite
al mismo tiempo la posibilidad de cometer un error del Tipo II. En
consecuencia, el hecho de cursar ciencias o letras no influye con-
juntamente con el campus virtual en las diferencias de rendimiento
en esta materia.

TABLA 12.12
MEDIAS MARGINALES ESTIMADAS
1. Media global
Variable dependiente: Práctica I

Intervalo de confianza
al 95%
Media Error tip.
Límite Límite
inferior superior

3,714 ,465 2,787 4,640

2. WEB-CT
Variable dependiente: Práctica I

Intervalo de confianza
al 95%
WEB-CT Media Error tip.
Límite Límite
inferior superior

Sí 3,757 ,767 2,226 5,287

No 3,200 ,555 2,092 4,308


INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 325

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 325

3. Ciencias o Letras
Variable dependiente: Práctica I

Intervalo de confianza
al 95%
Ciencias o Letras Media Error tip.
Límite Límite
inferior superior

Ciencias 4,227 ,745 2,741 5,713

Letras 3,200 ,555 2,092 4,308

4. WEB-CT * Ciencias o Letras


Variable dependiente: Práctica I

Intervalo de confianza
al 95%
WEB-CT Ciencias o Letras Media Error tip.
Límite Límite
inferior superior

Sí Ciencias 5,192 1,126 2,945 7,438


Letras 2,321 1,043 ,241 4,401

No Ciencias 3,263 ,975 1,317 5,208


Letras 4,079 ,383 3,316 4,842

FIGURA 12.7
GRÁFICO DE LA INTERACCIÓN

Medias marginales estimadas de Práctica I

5,50 WEB-CT

Medias marginales estimadas

5,00 No

4,50

4,00

3,50

3,00

2,50

2,00

Ciencias Letras
Ciencias o Letras
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 326

326 Introducción a la estadística

12.6. TU TURNO

1. ¿Cuál de las siguientes afirmaciones sobre la relación entre los efectos


principales y la interacción es correcta?
1. Si los efectos principales son significativos, entonces la interacción
también es significativa.
2. Si uno de los efectos principales es significativo, entonces la interac-
ción tiene que ser significativa.
3. Aunque los efectos principales no sean significativos, la interacción
puede ser significativa.
4. Si los efectos principales no son significativos, entonces la interacción
no puede ser significativa.
2. Teniendo en cuenta el contenido de tu base de datos, formula una hipóte-
sis sustantiva. Después, transforma tu hipótesis sustantiva en una hipótesis
estadística y procede al contraste de hipótesis. Es mejor que utilices al-
gún programa estadístico para ayudarte en el análisis de tus datos. Re-
cuerda que antes de interpretar los resultados, debes comprobar si se
cumple el supuesto de homoscedasticidad.
3. Sabiendo que se trata de un diseño bifactorial de efectos fijos, completa
los datos que faltan de la siguiente tabla:

Fuentes de variación SC gl MC F

MÉTODOS - A 5,333 1 a 3,555

Autoconcepto - B 21,500 2 10,750 7,167

MÉTODOS*Autoconcepto 0,167 b 0,0835 c

Error d 6 1,500

Total 36,000 11

4. ¿Cuál de los siguientes comentarios sobre esta tabla es correcto, sabiendo


que α = 0,05?
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 327

¿Cómo averiguar si dos o más variables debidamente controladas influyen simultáneamente...? 327

Suma de Media
Fuente gl F Significación
cuadrados tipo I cuadrática

Sexo 164,118 1 164,118 40,959 ,000

Edad 47,890 9 5,321 1,328 ,217

Sexo * Edad 76,063 8 9,508 2,373 ,016

Error 4740,165 1183 4,007

Total 5028,235 1201

1. Las diferencias en resistencia cultural en el ámbito escolar debidas al


sexo no son significativas.
2. Las diferencias en resistencia cultural en el ámbito escolar debidas a la
edad no son significativas.
3. Las diferencias en resistencia cultural en el ámbito escolar debidas al
sexo y a la edad no son significativas.
4. Las diferencias en resistencia cultural en el ámbito escolar debidas a la
varianza error no son significativas.
INT ESTAD 03:ENSEÑANZA MATEMAT 09/03/11 10:18 Página 328
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 329

Capítulo 13
¿QUÉ HACER CUANDO LAS VARIABLES
SON NOMINALES O CONSIDERADAS
COMO TALES?

Al terminar este capítulo deberías:


• Conocer las características de la tabla de contingencia.
• Conocer los conceptos de frecuencia observada y de frecuencia
teórica.
• Ser capaz de hallar la frecuencia teórica partiendo de diferentes
supuestos.
• Conocer el concepto de discrepancia entre frecuencia observada y
frecuencia teórica.
• Ser capaz de hallar la discrepancia, parcial y total, entre las fre-
cuencias observadas y las frecuencias teóricas.
• Ser capaz de colapsar las filas y/o las columnas.
• Ser capaz de hallar los grados de libertad en función de distintos
supuestos.
• Conocer las características y uso de la prueba χ2.
• Ser capaz de realizar el contraste de hipótesis aplicando la prueba χ2.

(Si no te acuerdas de las características de las variables categóricas, te con-


viene consultar el capítulo 2.)

Hasta ahora hemos centrado nuestro esfuerzo en intentar averiguar cómo de-
terminar la fuerza de la influencia de una variable independiente, como los
métodos instructivos, sobre una variable dependiente, como el rendimiento.
Ahora bien, ¿qué ocurre cuando en una investigación o en alguno de sus as-
pectos sólo se dispone de variables nominales u ordinales? Recuerda que para
las variables nominales y ordinales carece de sentido sumar o restar los valo-
res de dichas variables y menos aún multiplicar o dividir, como hicimos con las
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 330

330 Introducción a la estadística

variables dependientes medidas a nivel de intervalo. Como no se puede hacer


nada con los valores de las variables, sólo cabe trabajar con las frecuencias que
corresponden a cada uno de los valores. Vamos a ver cómo se procede.

13.1. CUANDO LOS DATOS SON CATEGÓRICOS

Cuando los datos que hemos conseguido son sólo categóricos, podemos re-
currir a una prueba estadística mucho menos exigente que las pruebas para-
métricas Z, t o F. Esta prueba es chi cuadrado de Pearson, simbolizada así χ2.
Entre sus ventajas, frente a las pruebas paramétricas, podemos decir que se
trata de una prueba adecuada cuando a) el nivel de medida de las variables
es nominal u ordinal, b) las muestras son pequeñas y c) las distribuciones po-
blacionales no cumplen las condiciones exigidas por muchas de las técnicas
paramétricas. En realidad se trata de una prueba de distribución libre que se
emplea con datos nominales o datos de otro nivel expresados en categorías
mutuamente excluyentes y exhaustivas. Para los alérgicos a los números, la
relativa sencillez de cálculo de esta prueba la convierte en la mejor de todas.
Sin embargo, antes de lanzar las campanas al vuelo, es necesario que pres-
tes atención a las importantes desventajas de esta prueba frente a las técnicas
paramétricas. Si analizas una variable continua con una técnica diseñada para
variables categóricas, pierdes información. Imagínate que, en vez de analizar
la variable cociente intelectual tal como es, decides agrupar sus valores en
tres categorías, por ejemplo a) bajo nivel intelectual [70-85], b) medio nivel in-
telectual [86-100] y c) alto nivel intelectual [101-120]. Para empezar, ya no pue-
des hallar la media. Ahora la has convertido en una variable ordinal y, por
tanto, sólo puedes contar el número de sujetos que hay en cada categoría.
Tampoco puedes saber la puntuación concreta que tenía cada uno de los su-
jetos que hay ahora en cada intervalo. Vuelve al capítulo 3 y relee lo que de-
cíamos sobre la amplitud de los intervalos en el apartado «Distribuciones de
frecuencias y su representación». Además de la pérdida de información, hay
un segundo inconveniente: χ2 es una prueba mucho menos potente que cual-
quier prueba paramétrica. Te recuerdo que esto significa que tiene una proba-
bilidad menor de rechazar H0, siendo falsa, que las pruebas paramétricas. Peor
aún, es una prueba poco sensible al efecto del orden.

13.2. OBJETIVO DE LA PRUEBA χ2

χ2 es un estadístico que se utiliza para medir la discrepancia entre las fre-


cuencias empíricas u observadas (fo) y las teóricas o esperadas (fe). Con fo se
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 331

¿Qué hacer cuando las variables son nominales o consideradas como tales? 331

simbolizan los datos que se observan, recogen o miden, y con fe se simboli-


zan los valores que hay que determinar. Éstos, en teoría, representan cómo
deberían distribuirse los sujetos, si y sólo si interviene el azar. El cálculo de
las fe se realiza en función de algún modelo, norma o criterio fijado por el
problema que hay que resolver. El problema planteado puede encontrarse en
una de las siguientes cuatro posibles situaciones:
a) Igualdad de probabilidades.
b) Conocimiento del tipo de distribución previa.
c) Prueba de bondad de ajuste.
d) Asociación de dos variables; caso de las tablas de contingencia 2 × 2.

PROCEDIMIENTO A:
IGUALDAD DE PROBABILIDADES 13.3.

En ocasiones se utiliza χ2 sencillamente para averiguar si las frecuencias ob-


servadas entre distintas categorías de una variable se distribuyen aleatoria-
mente o no.
El profesor desea saber cómo se distribuyen sus 93 alumnos a la hora de ca-
lificar el nivel de dificultad de esta materia. Para ello, al principio del curso les
pide que le digan el nivel de dificultad que creen que va a tener esta materia
en una escala de 0 «Muy fácil» a 100 «Muy difícil»1. Posteriormente, con los datos
recogidos, forma cinco intervalos de acuerdo con el baremo de la tabla 13.1. Al
hacer el recuento de las frecuencias, se obtienen los siguientes datos:

TABLA 13.1
NIVEL DE DIFICULTAD DE ESTA MATERIA

Frecuencia

0-20 (Muy fácil) 1

21-40 (Fácil) 1

41-60 (Ni fácil ni difícil) 7

61-80 (Difícil) 38

81-100 (Muy difícil) 46

Total 93

1
Si te lo piensas a fondo, te darás cuenta de que esta variable es en realidad ordinal. Esto
significa que al utilizar la prueba χ2 se acepta perder información.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 332

332 Introducción a la estadística

Como la mayoría de sus alumnos cursa esta materia por primera vez, el
profesor espera que tiendan a distribuirse al azar entre estas cinco categorías:
1. Formulación de H0 y de su correspondiente H1
a) Hipótesis nula: Las frecuencias empíricas son estadísticamente igua-
les a las frecuencias esperadas o teóricas.
H0: fo (x) = fe (x) para todo x. En latín paladino, esto quiere decir, la
frecuencia empírica de cualquier casilla o categoría x es igual a la fre-
cuencia esperada para esa misma casilla o categoría x.
Hipótesis alternativa: las frecuencias empíricas son estadísticamente
diferentes a las frecuencias esperadas o teóricas.
H1: fo (x) ≠ fe (x) para al menos algún valor de x. Esto significa que
la frecuencia empírica de cualquier casilla o categoría x es diferente
a la frecuencia esperada para al menos alguna casilla o categoría x.
2. Nivel de significación: podemos tomar α = 0,05.
3. Elección de la prueba estadística: nos encontramos ante datos que pue-
den considerarse medidos a nivel nominal y que están agrupados en
cinco categorías exhaustivas y mutuamente excluyentes. Por tanto, la
prueba estadística adecuada es la prueba χ2 para muestras indepen-
dientes.
4. Distribución muestral: la distribución muestral es una distribución de
probabilidad, que se forma con los valores de χ2 obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 de la
distribución muestral de χ2 está formada por todos los valores cuya
probabilidad asociada, si H0 es verdadera, sea ≤ 0,05.
6. Cálculo de la prueba estadística χ2
Suponiendo que los alumnos no tengan información previa susceptible
de predisponerles en un sentido u otro, o sea, si se cumple H0, debe-
rían distribuirse por igual entre las cinco casillas. Por tanto, en cada ca-
silla debería haber 93 : 5 = 18,6 alumnos.

TABLA 13.2
FRECUENCIAS EMPÍRICAS Y TEÓRICAS

Frecuencias empíricas Frecuencias teóricas

0-20 (Muy fácil) 1 18,6

21-40 (Fácil) 1 18,6

41-60 (Ni fácil ni difícil) 7 18,6


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 333

¿Qué hacer cuando las variables son nominales o consideradas como tales? 333

Frecuencias empíricas Frecuencias teóricas

61-80 (Difícil) 38 18,6

81-100 (Muy difícil) 46 18,6

Total 93 93,0

Es evidente que la distribución de las frecuencias teóricas no coincide


con la de las frecuencias empíricas. Sin embargo, nunca te fíes de tus pri-
meras impresiones. Debes procurar averiguar a cuánto asciende la verda-
dera discrepancia que se observa entre ambas distribuciones de frecuen-
cias. Para calcular esta discrepancia, aplicamos la siguiente fórmula:

(Fórmula 13.1)

Donde, como ya debes saber:


fo = frecuencia observada o empírica.
fe = frecuencia esperada o teórica.
Por ejemplo, para la casilla 1 la discrepancia entre la frecuencia empíri-
ca 1 y la frecuencia esperada 18,6 es de:

Una vez calculados todos los valores de χ2 que cuantifican las discre-
pancias parciales, obtenemos los datos de la última columna:

TABLA 13.3
DISCREPANCIAS PARCIALES
Frecuencias Frecuencias Discrepancia
empíricas teóricas χ2
0-20 (Muy fácil) 1 18,6 16,654

21-40 (Fácil) 1 18,6 16,654

41-60 (Ni fácil ni difícil) 7 18,6 7,234

61-80 (Difícil) 38 18,6 20,234

81-100 (Muy difícil) 46 18,6 40,363

Total 93 93,0 101,139


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 334

334 Introducción a la estadística

Ya disponemos de todos los datos necesarios para cuantificar la discre-


pancia total. Para ello, nos basta sumar todas las discrepancias parciales
aplicando la siguiente fórmula:

(Fórmula 13.2)

En este caso, obtenemos una discrepancia total de 101,139.


7. Interpretación estadística y pedagógica
Lo que acabamos de obtener es una suma. Y como recordarás, una su-
ma implica una restricción de grados de libertad. Seguramente ya de-
bes saber que para calcular los grados de libertad de un total de cinco
valores sumados, nos basta con restar uno de este total, eso es 5 – 1 = 4.
En relación con la prueba χ2, lo que es realmente fundamental que
comprendas es que si no hay discrepancia entre las frecuencias empí-
ricas y las teóricas, entonces χ2 = 0. Eso significa que habría que
aceptar H0. Por otra parte, es lógico pensar que el valor de χ2 aumen-
ta a medida que crece la discrepancia entre las frecuencias empíricas
y las teóricas. Si el valor de χ2 es muy elevado, eso significa que la
discrepancia es muy elevada también; lo que indica que la distribu-
ción de las frecuencias empíricas se aparta mucho de la de las fre-
cuencias teóricas. Eso sugiere, por tanto, que es poco probable que
ese hecho ocurra por mero azar; lo cual sugiere a su vez que habría
que rechazar H0.
Nuestra dificultad radica ahora en determinar el valor de χ2 a partir del
cual debemos rechazar H0. Sabemos que el número de grados de liber-
tad es específico de cada problema concreto. Por tanto, es lógico admi-
tir que el valor crítico de χ2 sea diferente para distintos grados de liber-
tad y en función del nivel de error. En otras palabras, a medida que se
incrementan los grados de libertad, crecen también los valores críticos
de χ2. Y a medida que disminuye el nivel de error, aumenta el valor
crítico de χ2.
Para ayudarnos en la tarea de determinar el valor crítico de χ2, ya se
han publicado las correspondientes tablas (tabla 13.4). Observa lo que
se acaba de comentar sobre los valores críticos de χ2 y la disminución
de α.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 335

¿Qué hacer cuando las variables son nominales o consideradas como tales? 335

TABLA 13.4
VALORES CRÍTICOS DE «CHI-CUADRADO»
αr
0,50 0,40 0,30 0,20 0,10 0,05 0,01 0,001
g.l. f

1 0,455 0,708 1,074 1,642 2,706 3,841 6,635 10,828


2 1,386 1,833 2,408 3,219 4,605 5,991 9,210 13,816
3 2,366 2,946 3,665 4,642 6,251 7,815 11,345 16,266
4 3,357 4,045 4,878 5,989 7,779 9,488 13,277 18,467
5 4,351 5,132 6,064 7,289 9,236 11,070 15,086 20,515
6 5,348 6,211 7,231 8,558 10,645 12,592 16,812 22,458
7 6,346 7,283 8,383 9,803 12,017 14,067 18,475 24,322
8 7,344 8,351 9,524 11,030 13,362 15,507 20,090 26,125
9 8,343 9,414 10,656 12,242 14,684 16,919 21,666 27,877
10 9,342 10,473 11,781 13,442 15,987 18,307 23,209 29,588
11 10,341 11,530 12,899 14,631 17,275 19,675 24,725 31,264
12 11,340 12,584 14,011 15,812 18,549 21,026 26,217 32,909
13 12,340 13,636 15,119 16,985 19,812 22,362 27,688 34,528
14 13,339 14,685 16,222 18,151 21,064 23,685 29,141 36,123
15 14,339 15,733 17,322 19,311 22,307 24,996 30,578 37,697
16 15,338 16,780 18,418 20,465 23,542 26,296 32,000 39,252
17 16,338 17,824 19,511 21,615 24,769 27,587 33,409 40,790
18 17,338 18,868 20,601 22,760 25,989 28,869 34,805 42,312
19 18,338 19,910 21,689 23,900 27,204 30,144 36,191 43,820
20 19,337 20,951 22,775 25,038 28,412 31,410 37,566 45,315
21 20,337 21,991 23,858 26,171 29,615 32,671 38,932 46,797
22 21,337 23,031 24,939 27,301 30,813 33,924 40,289 48,268
23 22,337 24,069 26,018 28,429 32,007 35,172 41,638 49,728
24 23,337 25,106 27,096 29,553 33,196 36,415 42,980 51,179
25 24,337 26,143 28,172 30,675 34,382 37,652 44,314 52,620
26 25,336 27,179 29,246 31,795 35,563 38,885 45,642 54,052
27 26,336 28,214 30,319 32,912 36,741 40,113 46,963 55,476
28 27,336 29,249 31,391 34,027 37,916 41,337 48,278 56,892
29 28,336 30,283 32,461 35,139 39,087 42,557 49,588 58,302
30 29,336 31,316 33,530 36,250 40,256 43,773 50,892 59,703
35 34,336 36,475 38,859 41,778 46,059 49,802 57,342 66,619
40 39,335 41,622 44,165 47,269 51,805 55,758 63,691 73,402
50 49,335 51,892 54,723 58,164 63,167 67,505 76,154 86,661
60 59,335 62,135 65,226 68,972 74,397 79,082 88,379 99,607
70 69,334 72,358 75,689 79,715 85,527 90,531 100,425 112,317
80 79,334 82,566 86,120 90,405 96,578 101,879 112,329 124,839
90 89,334 92,761 96,524 101,054 107,565 113,145 124,116 137,208
100 99,334 102,946 106,906 111,667 118,498 124,342 135,806 149,448
150 149,334 153,753 158,577 164,349 172,581 179,581 193,207 209,264
200 199,334 204,434 209,985 216,609 226,021 233,994 249,445 267,540
Tomada de Seisdedos, N. (1977): El error en psicometría. Madrid: Marova, p. 323.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 336

336 Introducción a la estadística

a) Interpretación estadística: para determinar el valor crítico de χ2 bas-


ta localizar en la primera columna los grados de libertad, 4, y des-
pués buscar horizontalmente la columna equivalente a α, 0,05. En el
cruce se sitúa el valor crítico que buscamos, 9,488.
Con estos datos ya podemos proponer una interpretación probabilís-
tica: la probabilidad de obtener por azar un χ2 = 101,139 es menor
que la de un valor crítico de χ2 = 9,488. Por ello, se rechaza H0. Al to-
mar esta decisión, se podría cometer un error del Tipo I.
Aprovechemos la ocasión para recordar que en el punto nº 4 afir-
mamos que el estadístico χ2 tiene su propia distribución muestral de
probabilidad. La forma de esta distribución depende de sus grados
de libertad. En este caso, la distribución de probabilidad de χ2
adopta la siguiente forma:

FIGURA 13.1
DISTRIBUCIÓN DE PROBABILIDAD DE χ2 PARA gl = 4

0,15

0,10

0,05

0,00

0 5 10 15 20
χ2

b) Interpretación pedagógica: podríamos decir que los alumnos no se


distribuyen por igual entre las cinco categorías a la hora de conside-
rar el nivel de dificultad de esta materia.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 337

¿Qué hacer cuando las variables son nominales o consideradas como tales? 337

PROCEDIMIENTO B: CONOCIENDO
EL TIPO DE DISTRIBUCIÓN PREVIA 13.4.

En ocasiones, el investigador desea averiguar si las frecuencias que acaba de


obtener se distribuyen del mismo modo que unos datos recogidos previamen-
te o como lo sugiere alguna teoría al uso. En este caso, también puede recu-
rrir a la prueba χ2.
Al finalizar el primer cuatrimestre de un curso, la distribución de las califi-
caciones obtenidas por los 113 alumnos matriculados en el grupo de clase fue
la siguiente: 33 suspensos, 37 aprobados, 5 notables, 2 sobresalientes y 36 no
presentados. Al empezar el siguiente curso el profesor introduce una serie de
cambios con la esperanza de influir positivamente en el rendimiento de sus
alumnos. El profesor se pregunta si la distribución de las calificaciones obteni-
das por los 93 alumnos del siguiente curso es similar o no a la del curso ante-
rior al finalizar el primer cuatrimestre. Esta vez obtiene 32 suspensos, 34 apro-
bados, 5 notables, 2 sobresalientes y 20 no presentados.

1. Formulación de H0 y de su correspondiente H1
Hipótesis nula: las frecuencias empíricas son estadísticamente iguales a
las frecuencias esperadas o teóricas.
La distribución de las calificaciones del curso actual es estadísticamente
similar a la del curso anterior.
Hipótesis alternativa: las frecuencias empíricas son estadísticamente di-
ferentes a las frecuencias esperadas o teóricas.
La distribución de las calificaciones del curso actual es estadísticamente
diferente a la del curso anterior.
2. Nivel de significación: podemos tomar α = 0,05.
3. Elección de la prueba estadística: se considera que estos datos están
medidos a nivel nominal y están agrupados en cinco categorías ex-
haustivas y mutuamente excluyentes. Por tanto, la prueba estadística
adecuada es la prueba χ2 para muestras independientes.
4. Distribución muestral: la distribución muestral es una distribución de
probabilidad, que se forma con los valores de χ2 obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 de la
distribución muestral de χ2 está formada por todos aquellos valores cu-
ya probabilidad asociada, si H0 es verdadera, sea ≤ 0,05.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 338

338 Introducción a la estadística

6. Cálculo de la prueba estadística χ2


Si la distribución de las calificaciones de este curso fuera similar a la
del curso anterior, ambas tendrían la misma proporción de suspensos,
aprobados, notables, sobresalientes y no presentados.

TABLA 13.5
FRECUENCIAS EMPÍRICAS DE AMBOS CURSOS

Curso anterior Curso actual

Suspenso 33 32

Aprobado 37 34

Notable 5 5

Sobresaliente 2 2

No presentado 36 20

Total 113 93

Si tomamos como modelo teórico de distribución la distribución de ca-


lificaciones del curso anterior, eso significa que debemos averiguar
cuántos de los 93 alumnos del curso actual deberían tener la califica-
ción de suspenso, aprobado, notable, sobresaliente y no presentado. Si
lo piensas un poco, verás que te encuentras ante un problema en el
que se aplica la clásica regla de tres. O sea, si hubo 33 suspensos de
un total de 113 alumnos, ¿cuántos suspensos habrá en un grupo de 93?
En forma esquemática:
Si 33 113
entonces x 93

por tanto

Si repetimos esta operación para los demás niveles, obtenemos la últi-


ma columna de la siguiente tabla:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 339

¿Qué hacer cuando las variables son nominales o consideradas como tales? 339

TABLA 13.6
FRECUENCIAS EMPÍRICAS Y TEÓRICAS AJUSTADAS
AL MODELO DEL CURSO ANTERIOR

Frecuencias empíricas Frecuencias teóricas

Suspenso 32 27,159

Aprobado 34 30,451

Notable 5 4,115

Sobresaliente 2 1,646

No presentado 20 29,628

Total 93 93,000

Antes de pasar al cálculo de la discrepancia, debemos analizar la distri-


bución de frecuencias teóricas para hacer dos comprobaciones: cuando
el número de categorías es mayor que 2, y por tanto los grados de li-
bertad son mayores que 1, no puede usarse la prueba χ2 a) si más del
20% de las casillas tiene una fe menor que 5 y b) si hay alguna casilla
con una fe menor que 1. Estas comprobaciones son obligatorias siem-
pre que se utilice la prueba χ2.
En nuestro caso, observamos que de las 5 casillas 2 tienen una fe inferior
a 5. Esto representa una proporción de 2 : 5 = 0,40, o sea, el doble de lo
permitido. Podemos resolver este problema uniendo las filas Notable y So-
bresaliente, ya que obtenemos una fe de 5,761, que es superior a 5.
Ahora podemos pasar a la siguiente etapa, que consiste en calcular las
discrepancias parciales y finalmente la cuantía total aplicando las fór-
mulas 13.1 y 13.2.
TABLA 13.7
DISCREPANCIA χ2

Frecuencias Frecuencias Discrepancia


empíricas teóricas χ2

Suspenso 32 27,159 0,863

Aprobado 34 30,451 0,414

Notable y Sobresaliente 7 5,761 0,266

No presentado 20 29,628 3,129

Total 93 93,000 4,672


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 340

340 Introducción a la estadística

La discrepancia total entre la distribución de las calificaciones del curso


anterior y la del curso actual asciende a 4,672.
7. Interpretación estadística y pedagógica
a) Interpretación estadística: determinamos el valor crítico de χ2 de la
misma manera que en el caso anterior. O sea, si los grados de libertad
son 4 – 1 = 3 y α = 0,05, entonces el valor crítico es 7,815.
Los datos disponibles nos permiten proponer como interpretación
probabilística la siguiente: la probabilidad de obtener por azar un
χ2 = 4,672 es mayor que la de un valor crítico de χ2 = 7,815. Por
ello, se acepta H0. Al tomar esta decisión, se podría cometer un error
del Tipo II.
b) Interpretación pedagógica: la distribución de las calificaciones del
curso actual es esencialmente similar a la del curso anterior.

PROCEDIMIENTO C:
13.5. PRUEBA DE BONDAD DE AJUSTE

Acabamos de ver cómo se comprueba si una determinada distribución se


ajusta o no a un modelo concreto de distribución teórica. Lo hicimos con un
modelo simple como es el de una distribución cuyas características conoce-
mos previamente. Podríamos aplicar esta misma idea a modelos más comple-
jos, como por ejemplo el modelo de distribución normal. En este caso tam-
bién el investigador puede recurrir a la prueba χ2.
Por ejemplo, al finalizar el primer trimestre, el profesor recoge las puntua-
ciones de los 73 alumnos que se atrevieron a examinarse tanto de la parte
teórica como de la práctica. Se pregunta si las puntuaciones obtenidas tien-
den a distribuirse normalmente o no.
1. Formulación de H0 y de su correspondiente H1
a) Hipótesis nula: las frecuencias empíricas son estadísticamente igua-
les a las frecuencias esperadas o teóricas.
La distribución de las calificaciones es similar a la distribución normal.
Hipótesis alternativa: las frecuencias empíricas son estadísticamente
diferentes a las frecuencias esperadas o teóricas.
La distribución de las calificaciones es diferente a la distribución
normal.
2. Nivel de significación: podemos tomar α = 0,05.
3. Elección de la prueba estadística: se considera que estos datos están
medidos a nivel intervalo pero están agrupados en categorías mutua-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 341

¿Qué hacer cuando las variables son nominales o consideradas como tales? 341

mente excluyentes cuyas frecuencias se distribuyen normalmente. Por


tanto, la prueba estadística adecuada es la prueba χ2 de bondad de
ajuste a la curva normal de probabilidades.
4. Distribución muestral: la distribución muestral es una distribución de
probabilidad, que se forma con los valores de χ2 obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 de la
distribución muestral de χ2 está formada por todos aquellos valores cu-
ya probabilidad asociada, si H0 es verdadera, sea ≤ 0,05.
6. Cálculo de la prueba estadística χ2
Si la distribución de las calificaciones fuera similar a la distribución nor-
mal, tendría que haber tantos alumnos en cada categoría como los que
habría si la distribución fuera normal.

TABLA 13.8
DISTRIBUCIÓN DE PUNTUACIONES DIRECTAS Y FRECUENCIAS
ABSOLUTAS POR INTERVALO

Puntuación media Frecuencia absoluta

0,00-1,50 1,00 4

1,51-2,50 2,00 11

2,51-3,50 3,00 8

3,51-4,50 4,00 12

4,51-5,50 5,00 11

5,51-6,50 6,00 19

6,51-7,50 7,00 5

7,51-8,50 8,00 3

Total 73

Ciertamente se trata de aplicar la regla de tres, pero de un modo un


tanto peculiar. Vayamos paso a paso. Necesitamos calcular tanto la me-
dia y la desviación típica de la distribución como los límites exactos de
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 342

342 Introducción a la estadística

cada intervalo. Vuelve al apartado «Distribuciones de frecuencias y su


representación» del capítulo 3, concretamente a la tabla 3.4, para recor-
dar cómo se procede.
Una vez obtenida la media, 4,466, y la desviación típica, 1,871, se pue-
de pasar a calcular a) la puntuación típica que corresponde a cada lí-
mite superior exacto, b) así como la proporción de sujetos que, de
acuerdo con el supuesto de la distribución normal, hay por debajo de ca-
da puntuación típica. Conociendo la puntuación típica, podemos recu-
rrir a la tabla 5.1 para averiguar la proporción de sujetos que cumplen
determinadas condiciones, como estar por debajo de una determinada
puntuación típica. Se trata de proporciones acumuladas.

TABLA 13.9
PROPORCIÓN DE SUJETOS POR DEBAJO
DE CADA PUNTUACIÓN TÍPICA

Intervalo Límite superior Puntuación Proporción


de clase exacto típica de sujetos por debajo

0,00-1,50 2,00 –1,32 0,0934

1,51-2,50 3,00 –0,78 0,2177

2,51-3,50 4,00 –0,25 0,4013

3,51-4,50 5,00 0,28 0,6103

4,51-5,50 6,00 0,82 0,7939

5,51-6,50 7,00 1,35 0,9115

6,51-7,50 8,00 1,89 0,9706

7,51-8,50 9,00 2,42 0,9922

El siguiente paso consiste en calcular la proporción de alumnos que hay


en cada intervalo, siempre según el supuesto de la distribución normal.
Recuerda que en la tabla anterior la proporción de sujetos que se indica
se refiere a todos los que tienen una puntuación por debajo del límite
superior exacto de que se trate. Por tanto, la proporción acumulada
0,2177 quiere decir que el 21,77% de los alumnos tiene una puntuación
por debajo de 3. Ese porcentaje incluye evidentemente el 9,34% que tie-
ne una puntuación por debajo de 2. Si quisiera saber la proporción de
alumnos que tienen entre 1,51 y 2,50 (límites aparentes), tendría que res-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 343

¿Qué hacer cuando las variables son nominales o consideradas como tales? 343

tar el porcentaje 9,34% de 21,77%. Obtendría: 0,2177 – 0,0934 = 0,1243 ó


12,43%. Aplicamos el mismo razonamiento para los demás intervalos.
Una vez que conocemos la proporción de sujetos que hay en cada inter-
valo, podemos aplicar una sencilla regla de tres para calcular el número
de sujetos. O sea, si la proporción de sujetos que hay en el primer inter-
valo es de 0,0934, sabiendo que el total es de 73, resulta fácil calcular el
número de sujetos: 0,0934 × 73 = 6,818. Y así sucesivamente.

TABLA 13.10
PROPORCIÓN Y NÚMERO DE SUJETOS EN CADA INTERVALO

Proporción de Proporción de
Intervalo de clase sujetos sujetos dentro Número de sujetos
por debajo del intervalo

0,00-1,50 0,0934 0,0934 6,8182

1,51-2,50 0,2177 0,1243 9,0739

2,51-3,50 0,4013 0,1836 13,4028

3,51-4,50 0,6103 0,2090 15,2570

4,51-5,50 0,7939 0,1836 13,4028

5,51-6,50 0,9115 0,1176 8,5848

6,51-7,50 0,9706 0,0591 4,3143

7,51-8,50 0,9922 0,0216 1,5768

Como puedes adivinar, el número de sujetos de la última columna


equivale a la frecuencia teórica de acuerdo con el modelo de distribu-
ción normal. Antes de pasar al cálculo de las discrepancias, debemos
analizar la distribución de frecuencias teóricas para hacer las oportunas
comprobaciones.
Por una parte, observamos que ninguna casilla tiene una frecuencia teó-
rica inferior a 1, pero por otra hay dos casillas cuya fe es menor que 5.
Estas dos casillas representan 2 : 8 = 0,25, es decir, 25%. Y como este
porcentaje es mayor que 20%, no podemos pasar a la siguiente etapa
sin antes tomar medidas correctoras. Para ello, sumamos las frecuencias
tanto empíricas como teóricas de dos filas contiguas —en este caso la
última y la penúltima— con el objetivo de que no más del 20% de las
fe sea inferior a 5. Una vez finalizada la corrección, pasamos a calcular
las discrepancias parciales y totales.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 344

344 Introducción a la estadística

TABLA 13.11
CÁLCULO DE LA DISCREPANCIA χ2

Intervalo Frecuencia Frecuencia Discrepancia


de clase empírica teórica χ2

0,00-1,50 4 6,8182 1,165

1,51-2,50 11 9,0739 0,409

2,51-3,50 8 13,4028 2,178

3,51-4,50 12 15,2570 0,695

4,51-5,50 11 13,4028 0,431

5,51-6,50 19 8,5848 12,636

6,51-8,50 8 5,8911 0,755

Total 18,269

La discrepancia total entre la distribución de frecuencias empíricas de


las calificaciones y la de las frecuencias teóricas de acuerdo con el mo-
delo normal asciende a 18,269.
7. Interpretación estadística y pedagógica
a) Interpretación estadística: en el caso del uso de la prueba χ2 como
prueba de bondad de ajuste, el cómputo de los grados de libertad ha
de tomar en consideración las principales etapas por las que transcu-
rre el proceso para llegar a la cuantificación de las frecuencias teóri-
cas. Las etapas más sensibles incluyen el cálculo de a) la suma, b) la
media y c) la desviación típica. Cada una de estas etapas implica pér-
dida de grados de libertad. Por tanto, para determinar los grados de
libertad, en este caso se debe restar 3 del total de las categorías k. Es
decir, si hay 7 categorías el número de grados de libertad asciende a
7 – 3 = 4.
Formalizando, g.l. = k – 3.
Por lo demás, el resto sigue la pauta que ya conoces. Es decir, si los
grados de libertad son 7 – 3 = 4 y α = 0,05, entonces el valor crítico
es 9,488.
Los datos disponibles permiten proponer como interpretación proba-
bilística que la probabilidad de obtener por azar un χ2 = 18,269 es me-
nor que la de un valor crítico de χ2 = 9,488. Por ello, se rechaza H0. Al
tomar esta decisión, se podría cometer un error del Tipo I.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 345

¿Qué hacer cuando las variables son nominales o consideradas como tales? 345

b) Interpretación pedagógica. la distribución de las calificaciones del


primer cuatrimestre es diferente a la distribución normal.

PROCEDIMIENTO D(i):
ASOCIACIÓN DE DOS VARIABLES 13.6.

El uso más extendido de la prueba χ2 se relaciona con el esfuerzo de los in-


vestigadores por asociar dos variables nominales entre sí.
Al iniciar el curso, el profesor desea saber con qué predisposición vienen sus
93 alumnos y cómo se distribuyen a la hora de calificar el nivel de dificultad y
de interés de esta materia. Para ello, al principio del curso les pide que le digan
el nivel de dificultad así como el nivel de interés que a su juicio puede tener es-
ta materia en una escala de 0 «Muy fácil» o «Muy poco interesante» a 100 «Muy di-
fícil» o «Muy interesante». Posteriormente, con los datos recogidos, forma cinco
intervalos. Al hacer el recuento de las frecuencias, obtiene los siguientes datos:

TABLA 13.12
TABLA DE CONTINGENCIA. FRECUENCIAS EMPÍRICAS

Nivel de interés

0-20 21-40 61-80 81-100


41-60
(Nada (Poco (Bastante (Muy Total
(Interesante)
interesante) interesante) interesante) interesante)

0-20
(Muy 0 0 1 0 0 1
fácil)

21-40
0 0 0 0 1 1
(Fácil)

41-60
Nivel de
(Ni fácil 0 2 3 1 1 7
dificultad
ni difícil)

61-80
0 3 21 14 0 38
(Difícil)

81-100
(Muy 1 7 26 10 2 46
difícil)

Total 1 12 51 25 4 93
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 346

346 Introducción a la estadística

1. Formulación de H0 y de su correspondiente H1
a) Hipótesis nula: las frecuencias empíricas son estadísticamente igua-
les a las frecuencias esperadas o teóricas.
El nivel de interés no está estadísticamente relacionado con el nivel
de dificultad de esta materia.
Hipótesis alternativa: las frecuencias empíricas son estadísticamente
diferentes a las frecuencias esperadas o teóricas.
El nivel de interés está estadísticamente relacionado con el nivel de
dificultad de esta materia.
2. Nivel de significación: podemos tomar α = 0,05.
3. Elección de la prueba estadística: se considera que estos datos están
medidos a nivel nominal y están agrupados en categorías exhaustivas y
mutuamente excluyentes. Por tanto, la prueba estadística adecuada es
la prueba χ2 para muestras independientes.
4. Distribución muestral: la distribución muestral es una distribución de
probabilidad, que se forma con los valores de χ2 obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 de la
distribución muestral de χ2 está formada por todos aquellos valores cu-
ya probabilidad asociada, si H0 es verdadera, sea ≤ 0,05.
6. Cálculo de la prueba estadística χ2
Si no hubiera relación entre el nivel de interés (5 categorías) y el de di-
ficultad (5 categorías), los alumnos deberían distribuirse aleatoriamente
entre las 5 × 5 = 25 casillas que se forman al cruzar ambas variables.
Por cierto, al cruzar las dos variables obtienes una distribución de fre-
cuencias que recibe el nombre de tabla de contingencia, en la que las
categorías de cada variable son exhaustivas y mutuamente excluyentes.
La lectura del contenido de la tabla se hace tomando en consideración
las dos variables a la vez. Por ejemplo, la cifra 26 que vemos en el cru-
ce entre la tercera columna y la quinta fila se interpreta así: estos 26
alumnos consideran que esta materia es muy difícil pero interesante.
La simple lectura de las frecuencias de la tabla es absolutamente insufi-
ciente para que tengas una idea clara acerca del nivel de asociación
que puede haber entre estas dos variables. Debes hallar la discrepancia
entre las fo y las fe. Ahora bien, para el cálculo de las fe se debe utilizar
la siguiente fórmula:

(Fórmula 13.3)
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 347

¿Qué hacer cuando las variables son nominales o consideradas como tales? 347

Donde:
ffila = frecuencia de la fila.
fcolumna = frecuencia de la columna.
ftotal = frecuencia total.

Supongamos que queremos calcular la fe de la primera casilla que se


encuentra en el cruce entre la primera fila y la primera columna donde
aparece fo = 0. Según la fórmula, debemos multiplicar la frecuencia to-
tal de la fila, 1, por la frecuencia total de la columna, 1, y dividir el re-
sultado por la frecuencia total de la tabla, 93, o sea:

¿Y cuál sería la que corresponde a la casilla de los 26 alumnos que co-


mentamos más arriba?

Hay que repetir esta operación tantas veces como casillas haya, en
nuestro caso 25 veces. Obtenemos:

TABLA 13.13
TABLA DE CONTINGENCIA. FRECUENCIAS ESPERADAS

Nivel de interés

0-20 21-40 61-80 81-100


41-60
(Nada (Poco (Bastante (Muy Total
(Interesante)
interesante) interesante) interesante) interesante)

0-20
(Muy 0,011 0,129 0,548 0,269 0,043 1,0
fácil)

21-40
0,011 0,129 0,548 0,269 0,043 1,0
(Fácil)

41-60
Nivel de
(Ni fácil 0,075 0,903 3,839 1,882 0,301 7,0
dificultad
ni difícil)

61-80
0,409 4,903 20,839 10,215 1,634 38,0
(Difícil)

81-100
(Muy 0,495 5,935 25,226 12,365 1,978 46,0
difícil)
Total 1,000 12,000 51,000 25,000 4,000 93,0
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 348

348 Introducción a la estadística

Antes de proseguir, es obligatorio comprobar si se cumplen las dos


condiciones a las que nos referíamos en el caso B: observarás que hay
muchas casillas con una fe inferior a 1 y además el porcentaje de casi-
llas con fe inferior a 5 es muy elevado. Tanto es así, que de las 25 casillas
sólo 5 tienen una fe superior a 5. Es decir, el 80% tiene una frecuencia
inferior a 5.
Ante esta circunstancia no se puede seguir adelante con el análisis, a
menos que se resuelva el problema antes. Para cumplir con la segunda
condición, se puede proceder de la siguiente manera: plegar las filas
y/o las columnas para reducir el porcentaje de casillas con una fe infe-
rior a 5 así como evitar las fe cuya frecuencia es inferior a 1. Plegar sig-
nifica sumar las fe de dos o más filas y/o columnas. Sin embargo, se de-
be hacer de tal forma, que la operación tenga sentido en el marco del
análisis y del problema en estudio. Por ejemplo, no resulta difícil acep-
tar la suma de las filas 1, 2 y 3 de tal forma que los alumnos que creen
que la materia es muy fácil, fácil o ni difícil ni fácil formen un único
grupo. Esta operación produce el siguiente resultado:

TABLA 13.14
TABLA DE CONTINGENCIA. FRECUENCIAS ESPERADAS. PRIMER PLEGAMIENTO

Nivel de interés

0-20 21-40 61-80 81-100


41-60
(Nada (Poco (Bastante (Muy Total
(Interesante)
interesante) interesante) interesante) interesante)

0-60
(Muy
fácil- 0,097 1,161 4,935 2,420 0,387 9,0
Ni fácil
ni difícil)
Nivel de
dificultad 61-80
0,409 4,903 20,839 10,215 1,634 38,0
(Difícil)

81-100
(Muy 0,495 5,935 25,226 12,365 1,978 46,0
difícil)

Total 1,000 12,000 51,000 25,000 4,000 93,0


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 349

¿Qué hacer cuando las variables son nominales o consideradas como tales? 349

El problema sigue sin resolver, ya que 10 de las 15 casillas tienen una


fe por debajo de 5. El último intento de resolver esta dificultad va a
consistir en plegar las columnas 1, 2 y 3 por una parte y las columnas 4
y 5 por otra.
Obtenemos como resultado:

TABLA 13.15
TABLA DE CONTINGENCIA. FRECUENCIAS ESPERADAS.
SEGUNDO PLEGAMIENTO

Nivel de interés

0-60 61-100 Total


(Nada (Bastante
interesante- interesante-
Interesante) Muy interesante)

0-60 (Muy
fácil-Ni fácil 6,193 2,807 9,0
ni difícil)
Nivel de
dificultad 61-80 (Difícil) 26,151 11,849 38,0

81-100
31,656 14,343 46,0
(Muy difícil)

Total 64,000 29,000 93,0

Esta vez el problema está resuelto ya que, de un total de 6 casillas, sólo


queda una con una fe por debajo de 5 y esto sólo representa 1 : 6 =
0,17 ó 17%.
Antes de pasar al cálculo de las discrepancias por casilla, deberás ple-
gar la tabla de contingencia original para que se asemeje a la del ple-
gamiento final de las fe. Así:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 350

350 Introducción a la estadística

TABLA 13.16
TABLA DE CONTINGENCIA ORIGINAL PLEGADA

Nivel de interés

0-60 61-100 Total


(Nada (Bastante
interesante- interesante-
Interesante) Muy interesante)

0-60 (Muy
fácil-Ni fácil 6 3 9
ni difícil)
Nivel de
dificultad 61-80 (Difícil) 24 14 38

81-100
34 12 46
(Muy difícil)

Total 64 29 93

A partir de aquí, los demás pasos son los que ya conoces, o sea, calcu-
lar la discrepancia casilla por casilla y finalmente sumar las discrepan-
cias parciales.

TABLA 13.17
TABLA DE DISCREPANCIAS χ2

Nivel de interés

0-60 61-100 Total


(Nada (Bastante
interesante- interesante-
Interesante) Muy interesante)

0-60 (Muy
fácil-Ni fácil 0,006 0,013 0,019
ni difícil)
Nivel de
dificultad 61-80 (Difícil) 0,177 0,390 0,567

81-100
0,174 0,383 0,557
(Muy difícil)

Total 0,357 0,786 1,143


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 351

¿Qué hacer cuando las variables son nominales o consideradas como tales? 351

La discrepancia total entre las fo y las fe asciende a 1,143.


7. Interpretación estadística y pedagógica
a) Interpretación estadística: en el caso del uso de χ2 como prueba de
asociación entres dos variables el cómputo de los grados de libertad
ha de tomar en consideración las categorías de ambas variables
conjuntamente. En este caso la variable «Nivel de interés» tiene dos
categorías y, dado que la suma es siempre una restricción, pierde
un grado de libertad. Lo mismo ocurre con la variable «Nivel de difi-
cultad»: tiene tres categorías y por las mismas razones que la otra
variable, pierde un grado de libertad. En consecuencia, los grados
de libertad conjuntos son (2 – 1) × (3 – 1) = 2.
Formalizando, los grados de libertad para el caso de la asociación
de variables, se calculan así: g.l. = (número de columnas – 1) × (nú-
mero de filas – 1).
Completamos el análisis como de costumbre: si los grados de liber-
tad son 2 y α = 0,05, entonces el valor crítico es 5,991.
Ante estos resultados, la interpretación probabilística más adecuada
es la siguiente: la probabilidad de obtener por azar un χ2 = 1,143 es
mayor que la de un valor crítico de χ2 = 5,991. Por ello, se acepta
H0. Al tomar esta decisión se podría cometer un error del Tipo II.
b) Interpretación pedagógica: el nivel de interés no está relacionado
con el nivel de dificultad de esta materia.
Observa que en ningún momento nos atrevemos a sugerir que una
variable influye sobre otra. Resulta que la prueba χ2 no es capaz de
confirmar o desmentir la dirección de una supuesta influencia. Sólo
es capaz de indicar si dos variables están estadísticamente relaciona-
das entre sí o no.

PROCEDIMIENTO D(ii):
ASOCIACIÓN DE DOS VARIABLES -
CASO DE LAS TABLAS DE CONTINGENCIA 2 × 2 13.7.

Se trata de un caso especial de asociación de variables en el que ambas tie-


nen cada una sólo dos categorías. Ante un problema de estas características
se han ideado dos soluciones que proporcionan resultados idénticos.
Al finalizar el primer cuatrimestre y observar las calificaciones obtenidas por
los 73 alumnos que se presentaron a examen, el profesor se pregunta si hay al-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 352

352 Introducción a la estadística

guna relación entre el hecho de haber aprobado o suspendido y el de ser repeti-


dor o no. Hace el recuento de frecuencias y obtiene la siguiente tabla:

TABLA 13.18
TABLA DE CONTINGENCIA 2 X 2. FRECUENCIAS EMPÍRICAS

Repite

Sí No Total

Suspenso 8 24 32
Calificación
Aprobado 18 23 41

Total 26 47 73

1. Formulación de H0 y de su correspondiente H1
a) Hipótesis nula: las frecuencias empíricas son estadísticamente igua-
les a las frecuencias esperadas o teóricas.
Aprobar o suspender esta materia no está estadísticamente relacio-
nado con repetir o no.
Hipótesis alternativa: las frecuencias empíricas son estadísticamente
diferentes a las frecuencias esperadas o teóricas.
Aprobar o suspender esta materia está estadísticamente relacionado
con repetir o no.
2. Nivel de significación: podemos tomar α = 0,05.
3. Elección de la prueba estadística: se considera que estos datos están
medidos a nivel nominal y están agrupados en categorías exhaustivas y
mutuamente excluyentes. Por tanto, la prueba estadística adecuada es
la prueba χ2 para muestras independientes.
4. Distribución muestral: la distribución muestral es una distribución de
probabilidad, que se forma con los valores de χ2 obtenidos de infinitas
muestras aleatorias de la misma población, todas del mismo tamaño
que la del problema de investigación.
5. Zona de rechazo: según el α señalado, la zona de rechazo de H0 de la
distribución muestral de χ2 está formada por todos aquellos valores cu-
ya probabilidad asociada, si H0 es verdadera, sea ≤ 0,05.
6. Cálculo de la prueba estadística χ2
Disponemos de dos opciones para hallar el valor empírico de χ2 las
cuales se explican a continuación.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 353

¿Qué hacer cuando las variables son nominales o consideradas como tales? 353

Opción A: calcular la discrepancia


mediante la fórmula 13.1 corregida
Primero calculamos las fe aplicando la fórmula propia de la asociación de dos
variables nominales (Fórmula 13.3).

TABLA 13.19
TABLA DE CONTINGENCIA 2 X 2.
FRECUENCIAS EMPÍRICAS Y TEÓRICAS

Repite

Sí No Total

fo 8 24
Suspenso 32
fe 11,397 20,602
Calificación
fo 18 23
Aprobado 41
fe 14,603 26,397

Total 26 47 73

Para el cálculo de las discrepancias casilla por casilla es necesario proce-


der a la corrección de la fórmula habitual. Esta corrección se conoce co-
mo corrección por continuidad de Yates y consiste en restar medio punto
al valor absoluto de la diferencia entre cada fo y su correspondiente fe. La
fórmula es la siguiente:

(Fórmula 13.4)

Por ejemplo, la discrepancia entre la fo y la fe de la primera casilla se


calcula así:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 354

354 Introducción a la estadística

TABLA 13.20
TABLA DE CONTINGENCIA 2 X 2. DISCREPANCIAS χ2

Repite

Sí No Total

fo 8 24

Suspenso fe 11,397 20,602 32

χ2 0,736 0,408
Calificación
fo 18 23

Aprobado fe 14,603 26,397 41

χ2 0,575 0,318

Total 26 47 73

La discrepancia total entre las fo y las fe asciende a χ2 = 0,736 + 0,408 +


0,575 + 0,318 = 2,037.
Si no se procede a la corrección de Yates, se obtiene un χ2 sobreesti-
mado. Es decir, un valor de excesivamente alto. Esto podría llevar al re-
chazo de una H0 que, sin embargo, es verdadera.
7. Interpretación estadística y pedagógica
a) Interpretación estadística: completamos el análisis como en cual-
quier otro caso de asociación de variables nominales: si los grados
de libertad son (2 – 1) × (2 – 1) = 1 y α = 0,05, entonces el valor
crítico es 3,841.
Estos resultados nos autorizan a concluir que la probabilidad de ob-
tener por azar un χ2 = 2,037 es mayor que la de un valor crítico de
χ2 igual a 3,841. Por ello, se acepta H0. Al tomar esta decisión se po-
dría cometer un error del Tipo II.
b) Interpretación pedagógica: aprobar o suspender esta materia no es-
tá relacionado con el hecho de repetir o no.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 355

¿Qué hacer cuando las variables son nominales o consideradas como tales? 355

Opción B: hallar la discrepancia total


aplicando la fórmula unitaria

(Fórmula 13.5)

Donde N es el número total de sujetos de la muestra mientras A, B, C y D re-


presentan las frecuencias de cada uno de los cuatro grupos y deben ser colo-
cadas de acuerdo con la siguiente posición:

A B

C D

Así, en el problema que estamos analizando, la posición sería:

TABLA 13.21
TABLA DE CONTINGENCIA 2 X 2. POSICIÓN DE A, B, C Y D

Repite

Sí No Total

Suspenso 8→A 24 → B 32
Calificación
Aprobado 18 → C 23 → D 41

Total 26 47 73

Sólo queda situar cada frecuencia en la posición que le es propia dentro


de la fórmula y operar:

Como puedes comprobar, las opciones A y B proporcionan el mismo re-


sultado.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 356

356 Introducción a la estadística

CON LA AYUDA
13.8. DE PROGRAMAS INFORMÁTICOS

Como acabamos de comprobar, el modo de llevar a cabo el análisis estadísti-


co con la prueba χ2 exige determinar en primer lugar el supuesto del que se
parte. El uso de la herramienta informática ha de respetar este hecho también.

Caso 1. Igualdad de probabilidades


Para llevar a cabo el análisis estadístico con χ2 mediante el programa SPSS,
abres, como ya sabes, el desplegable «Analizar» y, como nuestra variable es
nominal, buscamos en el apartado de las «Pruebas no paramétricas» la opción
«Chi-cuadrado».

FIGURA 13.2
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «CHI-CUADRADO»
DENTRO DE «PRUEBAS NO PARAMÉTRICAS»

En la ventana «Prueba de chi-cuadrado» aparece un cuadro con el rótulo


«Contrastar variables». Es en este cuadro donde deberás insertar las variables
que quieres analizar. En este caso seleccionamos la variable «Nivel de dificul-
tad (5)». Podríamos añadir tantas variables como resulte necesario.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 357

¿Qué hacer cuando las variables son nominales o consideradas como tales? 357

FIGURA 13.3
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Una vez seleccionadas las variables, puedes pulsar la orden de «Aceptar»


para ejecutar el análisis. El programa proporciona dos tablas:
a) Frecuencias empíricas y esperadas

TABLA 13.22
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS

N observado N esperado Residual

0-20 (Muy fácil) 1 18,6 –17,6


21-40 (Fácil) 1 18,6 –17,6
41-60 (Ni fácil ni difícil) 7 18,6 –11,6
61-80 (Difícil) 46 18,6 19,4
81-100 (Muy difícil) 46 18,6 27,4
Total 93
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 358

358 Introducción a la estadística

b) Contraste con chi-cuadrado.

TABLA 13.23
ESTADÍSTICOS DE CONTRASTE

Nivel de dificultad (5)

Chi-cuadradoa 101,140
gl 4
Sig. asintót. ,000
a. 0 casillas (0%) tienen frecuencias esperadas menores que 5.
La frecuencia de casilla esperada mínima es 18,6.

Lo que sabemos de Sig. asintót. nos permite afirmar que la probabilidad


de obtener por azar un chi-cuadrado de 101,140 es de 0,000; como esta pro-
babilidad es menor que 0,05, hay que rechazar H0 y admitir a la vez la posibi-
lidad de cometer un error del Tipo I.
El resto tuvimos ocasión de comentarlo más arriba.

Caso 2. Prueba de bondad de ajuste


De nuevo abrimos el desplegable «Analizar»; esta vez seleccionamos la op-
ción «K-S de 1 muestra» dentro de las «Pruebas no paramétricas».

FIGURA 13.4
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «K-S DE 1 MUESTRA»2

2
Z de Kolmogorov-Smirnov proporciona el mismo tipo de información que χ2 para el caso
del estudio de la bondad de ajuste.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 359

¿Qué hacer cuando las variables son nominales o consideradas como tales? 359

En la ventana «Prueba de Kolmogorov-Smirnov» aparece un cuadro con el


rótulo «Contrastar variables»; insertas aquí las variables que quieres analizar.
En este caso, seleccionamos la variable «Parcial I-Intervalos». Además, se pue-
de indicar el modelo de contraste: viene señalado por defecto «Normal», pero
se puede marcar cualquiera de los que están en la lista o todos ellos (en
nuestro caso nos interesa el modelo de distribución normal).

FIGURA 13.5
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Una vez seleccionadas las variables y marcado el modelo teórico, puedes


pulsar la orden de «Aceptar» para ejecutar el análisis. El programa proporciona
una única tabla:

TABLA 13.24
PRUEBA DE KOLMOGOROV-SMIRNOV

Parcial I
Intervalos

N 73
Parámetros normalesa,b Media 4,4658
Desviación típica 1,87144
Diferencias más Absolutas ,164
Positiva ,112
Negativa –,164
Z de Kolmogorov-Smirnov 1.399
Sig. asintót. (bilateral) ,040

a. La distrbución de constrate es la normal.


b. Se han calculado a partir de los datos.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 360

360 Introducción a la estadística

Lo que sabemos de Sig. asintót. nos permite afirmar que la probabilidad


de obtener por azar una Z de Kolmogorov-Smirnov de 1,399 es de 0,040; co-
mo esta probabilidad es menor que 0,05, hay que rechazar H0 y admitir a la
vez la posibilidad de cometer un error del Tipo I. Es decir, esta distribución
no se asemeja a la distribución normal.

Caso 3 ó 4. Asociación de dos variables


Abre, como de costumbre, el desplegable «Analizar» y, como vas a cruzar dos
variables, seleccionas «Tablas de contingencia» dentro de «Estadísticos descrip-
tivos».

FIGURA 13.6
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS «TABLAS
DE CONTINGENCIA» DENTRO DE «ESTADÍSTICOS DESCRIPTIVOS»

En la ventana «Tablas de contingencia» aparecen dos zonas: las variables


seleccionadas para el estudio pueden ir indistintamente en la zona de «Filas»
o de «Columnas»; el programa cruza automáticamente cada una de las varia-
bles que están en «Filas» con cada una de las de «Columnas».
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 361

¿Qué hacer cuando las variables son nominales o consideradas como tales? 361

FIGURA 13.7
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Abrimos la ventana «Estadísticos». Dependiendo de cuál sea el nivel de me-


dida de las variables que tenemos, señalaremos los estadísticos que deseamos
obtener. En nuestro caso, sólo nos interesa χ2. Pulsamos «Continuar» para ce-
rrar esta ventana.
FIGURA 13.8
SELECCIÓN DE LOS ESTADÍSTICOS DE SALIDA DEL ANÁLISIS
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 362

362 Introducción a la estadística

Una vez seleccionadas las variables y cerrada la ventana «Tabla de contin-


gencia: Estadísticos», mediante la orden «Continuar», puedes pulsar «Aceptar»
para ejecutar el análisis. El programa proporciona dos tablas:
a) Frecuencias empíricas y esperadas

TABLA 13.25
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS

Repetidor/a
Total
Sí No

Calificación Suspenso 8 24 32
Aprobado 18 23 41
Total 26 47 73

b) Estadísticos de contraste

TABLA 13.26
ESTADÍSTICOS DE CONTRASTE

Sig. Sig. Sig.


Valor gl asintótica exacta exacta
(bilatiera) (bilateral) (unilateral)

Chi-cuadrado de 2,800b 1 ,094


Perason
Corrección por 2,037b 1 ,154
continuidada
Razón de 2,856b 1 ,091
verosimilitudes
Estadístico exacto ,139 ,076
de Fisher
Asociación lineal 2,762b 1 ,097
por lineal
N de casos válidos 73b

Lo que sabes de Sig. asintótica te permite afirmar que la probabilidad de


obtener por azar un chi-cuadrado de 2,037 es de 0,154; como esta probabili-
dad es mayor que 0,05, hay que aceptar H0 y admitir a la vez la posibilidad
de cometer un error del Tipo II.
El resto tuvimos ocasión de comentarlo más arriba.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 363

¿Qué hacer cuando las variables son nominales o consideradas como tales? 363

TU TURNO 13.9.

1. ¿Cuál es el principal objetivo de la prueba χ2?


2. ¿Qué tipo de problemas de investigación se puede resolver mediante una
prueba χ2?
3. Explica mediante un ejemplo por qué un χ2 = 0 implica la aceptación de H0.
4. Repites una misma investigación en cuatro ocasiones bajo condiciones simi-
lares y obtienes los siguientes valores de χ2: 0, 8, 16 y 24. Sabes que los gra-
dos de libertad de tu investigación son 8 y en ninguna ocasión has tomado
la precaución de fijar el nivel de error. ¿En qué caso o casos crees que sería
aconsejable rechazar H0 y por qué? Observa la tabla 13.4 antes de contestar.
5. Comprueba si las siguientes variables, dicotomizadas utilizando la media
como criterio de división, están estadísticamente relacionadas entre sí o no:

Nivel de interés

Debajo Encima Total


de la media de la media

Nivel de Debajo de la media 16 14 30


dificultad
Encima de la media 36 27 63

Total 52 41 93

6. La distribución de puntuaciones obtenidas por los alumnos en la prueba


de conocimientos previos son las siguientes:

Xi fi

2,50 1
2,75 4
3,00 6
3,25 5
3,50 9
3,75 6
4,00 10
4,25 13
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 364

364 Introducción a la estadística

Xi fi

4,50 7
4,75 10
5,00 7
5,25 5
5,50 2
5,75 4
6,00 2
6,75 1
7,00 1

Comprueba si estas puntuaciones se distribuyen normalmente.


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 365

Capítulo 14
¿QUÉ HACER CUANDO LAS VARIABLES
SON ORDINALES Y LOS GRUPOS
SON INDEPENDIENTES?

Al terminar este capítulo deberías:


• Conocer el objetivo de las pruebas para variables ordinales.
• Conocer las características generales de las pruebas para varia-
bles ordinales.
• Conocer las características de la prueba U de Mann-Whitney.
• Ser capaz de establecer una referencia adecuada para hallar el
estadístico U cuando el tamaño de n2 sea muy pequeño.
• Ser capaz de diferenciar U y U ´.
• Ser capaz de transformar U ´en U.
• Ser capaz de asignar adecuadamente los números de orden en
caso de ligas.
• Ser capaz de hallar U con distintos valores de n2.
• Ser capaz de utilizar las tablas de probabilidades exactas de U.
• Ser capaz de utilizar las tablas de valores críticos de U.
• Ser capaz de relacionar la distribución de U con la distribución
normal de probabilidades.
• Ser capaz de utilizar la prueba U de Mann-Whitney en un contraste
de hipótesis.
• Conocer las características de la prueba H de Kruskal-Wallis.
• Ser capaz de hallar el estadístico H para n1, n2 y n3 muy pequeñas.
• Relacionar la distribución del estadístico H con la distribución del
estadístico χ2.
• Ser capaz de utilizar la prueba H de Kruskal-Wallis en un contraste
de hipótesis.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 366

366 Introducción a la estadística

(Si no te acuerdas de las características de las variables ordinales te convie-


ne volver a echar una ojeada al capítulo 2.)

En el capítulo anterior vimos cómo proceder ante datos medidos o simple-


mente considerados como de nivel nominal. Seguramente recordarás que en
el caso de las variables ordinales seguimos sin poder sumar o restar los valo-
res de dichas variables y menos aún multiplicar o dividirlos. Sin embargo, por
lo menos podemos ordenarlos. Vamos a ver cómo se procede para sacar la
máxima información de este tipo de datos.

14.1. CUANDO LOS DATOS SON ORDINALES

Cuando los datos que hemos conseguido son sólo ordinales podemos recurrir
a una prueba estadística mejor que χ2 pero no tan exigente como las pruebas
paramétricas Z, t o F. Se trata de la prueba U de Mann-Whitney. Sus ventajas,
frente a las pruebas paramétricas, se asemejan a las de χ2. En cambio no se
trata de una prueba de distribución libre.

OBJETIVO DE LA PRUEBA U
14.2. DE MANN-WHITNEY

La prueba U de Mann-Whitney es relativamente potente; su principal objetivo


es probar si dos grupos independientes han sido tomados de la misma pobla-
ción. Desde esta perspectiva, el estadístico U proporciona una prueba que es
una excelente alternativa a la prueba t de Student, siempre que el nivel de
medición sea inferior al de intervalo.

14.3. PROCEDIMIENTO

El modo de calcular el estadístico U depende de la magnitud de N. En los


próximos apartados veremos tres modos diferentes: desde N muy pequeña
hasta N grande.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 367

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 367

a) Caso de n2 muy pequeña, es decir, cuando la muestra más grande es


igual o inferior a 8 sujetos
Volvamos a nuestro problema de investigación para ver este proceso de cer-
ca. El profesor considera que, a lo largo del curso, sus clases han actuado de
algún modo como un tratamiento igual para todos sus alumnos. Sin embargo,
también considera que el hecho de ser repetidor o no ha podido tener algún
efecto sobre la sensación que los alumnos han tenido en cuanto al nivel de
dificultad de la materia. Supone que los alumnos que cursan la materia por
segunda o tercera vez deberían sentir un menor nivel de dificultad. Para ase-
gurarse, pide el profesor a cada alumno que determine el nivel de dificultad
de esta materia en una escala típicamente ordinal como ésta que va desde 0
—ninguna dificultad— hasta 100 —máxima dificultad—. Esta vez al finalizar
el curso el profesor solicita a los alumnos que realizan el examen final que
evalúen el nivel de dificultad de esta materia en la misma escala inicial, es de-
cir, de 0 a 100. Selecciona al azar a seis alumnos repetidores y a otros ocho
de primera matrícula. El profesor desea saber si, al finalizar el curso, el nivel de
dificultad percibida por los repetidores es netamente inferior al de los alumnos
de primera matrícula.
Para ello procede al ya habitual contraste de hipótesis.
1. Formulación de H0 y de su correspondiente H1
H0: no hay diferencias estadísticamente significativas en nivel de difi-
cultad percibida entre los alumnos repetidores y los no repetidores.
H1: los alumnos repetidores exhiben un nivel de dificultad percibida
estadísticamente inferior al de los no repetidores.
2. Elección justificada de la prueba estadística
Como de costumbre, para elegir la prueba estadística que aplicar debe-
mos tomar en consideración el nivel de medida. Sabemos que la varia-
ble dependiente «Nivel de dificultad percibida» es ordinal; la variable
independiente «Número de matrícula» define dos niveles: a) Repetidor
y b) No repetidor. Como se trata de hallar diferencias entre dos grupos
independientes respecto de una característica ordinal, la prueba ade-
cuada es la prueba U de Mann-Whitney.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,01.
4. Definición de la distribución muestral de U
La distribución muestral es una distribución de probabilidad que se for-
ma con infinitos valores de U obtenidos de infinitas muestras aleatorias
de la misma población, todas del mismo tamaño que la del problema de
investigación.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 368

368 Introducción a la estadística

5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,01.
Puesto que H1 indica la dirección de las diferencias, la zona de rechazo
está situada en un extremo de la distribución que incluye todos los va-
lores cuya probabilidad sea ≤ 0,01.
6. Cálculo del estadístico: prueba estadística
Los datos recogidos por el profesor son los siguientes:

No repetidores (n2) 35 41 50 63 75 80 82 90
Repetidores (n1) 24 61 70 78 85 95

Para calcular el valor empírico de U, hemos de recordar que n2, es de-


cir, el grupo más grande, es igual o menor que 8 y por ello procede-
mos del siguiente modo:
• En primer lugar combinamos los grupos n1 y n2 y al mismo tiempo
clasificamos los valores combinados de menor a mayor; así:

24 35 41 50 61 63 70 75 78 80 82 85 90 95
n1 n2 n2 n2 n1 n2 n1 n2 n1 n2 n2 n1 n2 n1

• Una vez hecha la combinación y la clasificación, tomamos uno de


los dos grupos, por ejemplo n1, como referencia. Posteriormente, pa-
ra cada valor del grupo n2, empezando por el más pequeño, pre-
guntamos: ¿cuántas puntuaciones n1 preceden a cada puntuación n2?
Por ejemplo, ¿cuántas puntuaciones n1 preceden a la puntuación 35?
Sólo hay una puntuación n1 que es más pequeña que 35. Se repite
esta misma pregunta cada vez que nos encontramos con una pun-
tuación n2. Si cuentas el número de valores n1 que se encuentran
por debajo de 80 verás que son cuatro, a saber 78, 70, 61 y 24. Es así
como obtenemos la tabla siguiente:

24 35 41 50 61 63 70 75 78 80 82 85 90 95
n1 n2 n2 n2 n1 n2 n1 n2 n1 n2 n2 n1 n2 n1
1 1 1 2 3 4 4 5

• Finalmente, sumamos todas las veces que las puntuaciones n1 prece-


den a cualquier puntuación n2. Esta suma es el valor de U que bus-
camos. Por tanto, U = 1 + 1 + 1 + 2 + 3 + 4 + 4 + 5 = 21.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 369

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 369

7. Interpretación estadística y pedagógica


a) Interpretación estadística: para la interpretación estadística necesita-
mos determinar el valor crítico de U. Sin embargo, en este caso las
tablas disponibles proporcionan directamente la probabilidad exacta
asociada a cada valor de U bajo el supuesto de H1 direccional o de
una cola.
Para consultar esta tabla es necesario tener en cuenta que:
a) Hay tantas subtablas como valores desde n2 = 3 hasta n2 = 8.
b) n2 se indica en la parte superior de cada subtabla.
c) En la primera fila se indican los posibles valores de n1.
d) En la primera columna se indican los posibles valores empíricos
de U.
e) Finalmente, dentro de la tabla se indica la probabilidad asociada
a cada valor de U teniendo en cuenta n1 y n2.
Veamos como ejemplo la subtabla n2 = 8.

TABLA 14.1
PROBABILIDADES ASOCIADAS CON VALORES PEQUEÑOS DE U

n2 = 8

n1→ 1 2 3 4 5 6 7 8 t Normal
U↓

0 0,111 0,022 0,006 0,002 0,001 0,000 0,000 0,000 3,308 0,001
1 0,222 0,044 0,012 0,0004 0,002 0,001 0,000 0,000 3,203 0,001
2 0,333 0,089 0,024 0,008 0,003 0,001 0,001 0,000 3,098 0,001
3 0,444 0,133 0,042 0,014 0,005 0,002 0,001 0,001 2,993 0,001
4 0,556 0,200 0,067 0,024 0,009 0,004 0,002 0,001 2,888 0,002
5 0,267 0,097 0,036 0,015 0,006 0,003 0,001 2,783 0,003
6 0,356 0,139 0,055 0,023 0,010 0,005 0,002 2,678 0,004
7 0,444 0,188 0,077 0,033 0,015 0,007 0,003 2,573 0,005
8 0,556 0,248 0,107 0,047 0,021 0,010 0,005 2,468 0,007
9 0,315 0,141 0,064 0,030 0,014 0,007 2,363 0,009
10 0,387 0,184 0,085 0,041 0,020 0,010 2,258 0,012
11 0,461 0,230 0,111 0,054 0,027 0,014 2,153 0,016
12 0,539 0,285 0,142 0,071 0,036 0,019 2,048 0,020
13 0,341 0,177 0,091 0,047 0,025 1,943 0,026
14 0,404 0,217 0,114 0,060 0,032 1,838 0,033
15 0,467 0,262 0,141 0,076 0,041 1,733 0,041
16 0,533 0,311 0,172 0,095 0,052 1,628 0,052
17 0,362 0,207 0,116 0,065 1,523 0,064
18 0,416 0,245 0,140 0,080 1,418 0,078
19 0,472 0,286 0,168 0,097 1,313 0,094
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 370

370 Introducción a la estadística

20 0,528 0,331 0,198 0,117 1,208 0,113


21 0,377 0,232 0,139 1,102 0,135
22 0,426 0,268 0,164 0,998 0,159
23 0,475 0,306 0,191 0,893 0,185
24 0,525 0,347 0,221 0,788 0,215
25 0,389 0,253 0,683 0,247
26 0,433 0,287 0,578 0,282
27 0,478 0,323 0,473 0,318
28 0,522 0,360 0,368 0,356
29 0,399 0,263 0,396
30 0,439 0,158 0,437
31 0,480 0,052 0,481
32 0,520

Extracto tomado de Río Sadornil, D. del (2003): Métodos de investigación en educación. Volumen I.
Proceso y diseños no complejos. Madrid: UNED, p. 729.

Para averiguar el valor crítico de U nos fijamos en la columna que


corresponde a n1 = 6. Después hallamos la fila que corresponde al
valor de U (= 21) que acabamos de calcular. En el punto de inter-
sección entre esta fila y la columna n1 = 6, se encuentra la probabi-
lidad asociada a U; en este caso es 0,377.
Una advertencia: las probabilidades exactas dadas en esta tabla son
de una cola. Por tanto, para una H1 de dos colas, el valor de p debe
duplicarse.
Como conclusión de todo lo anterior, podemos decir que la probabi-
lidad de obtener por azar una U = 21 es 0,377, probabilidad que es
mayor que α (0,01). En consecuencia, tenemos que aceptar H0. Al to-
mar esta decisión podríamos cometer un error del Tipo II.
b) Interpretación pedagógica: teniendo en cuenta la conclusión esta-
dística, podríamos decir que por término medio los alumnos repeti-
dores comparten con los no repetidores su impresión sobre el nivel
de dificultad de esta materia.

¿QUÉ OCURRE SI UTILIZAS


14.4. COMO REFERENCIA n2 EN LUGAR DE n1?
Veámoslo. Procedemos del mismo modo que en el caso anterior, excepto que
esta vez la referencia es n2. Es decir, nos preguntamos cuántas puntuaciones
n2 preceden a cada puntuación n1. Obtenemos lo siguiente:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 371

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 371

24 35 41 50 61 63 70 75 78 80 82 85 90 95
n1 n2 n2 n2 n1 n2 n1 n2 n1 n2 n2 n1 n2 n1
0 3 4 5 7 8

La suma proporciona como resultado 27. ¿Se trata de otro valor de U para
el mismo conjunto de datos? Claro que no. En realidad, cualquier valor empí-
rico que sea igual o superior a (n1 × n2)/2 se considera como U´. En nuestro
caso (6 × 8) : 2 = 24 es el valor límite que permite distinguir U de U´. Como el
valor que hemos obtenido, 27, es mayor que 24, entonces debemos conside-
rarlo como U´.
Este valor se puede transformar en U. Para ello basta aplicar la siguiente
fórmula:

U= n1 × n2 -U´ (Fórmula14.1)

En consecuencia, U = (6 × 8)-27 = 48 – 27 = 21.

MAGNITUD DE U
Y PROBABILIDAD ASOCIADA 14.5

Hasta ahora todos los estadísticos que hemos estudiado se comportan del
mismo modo en lo que se refiere a la relación entre su magnitud y su proba-
bilidad asociada. De hecho, hemos constatado que a medida que los valores
absolutos de Z, t, F o χ2 aumentaban, disminuía la probabilidad de que ocu-
rrieran por azar. ¿Pasa lo mismo con el estadístico U? La respuesta al final de
este apartado.
Sigamos utilizando el mismo enunciado e incluso los mismos datos. Sin
embargo, esta vez, por cuestiones didácticas, vamos a organizarlos de manera
diferente. Fíjate en la siguiente tabla:

No repetidores (n2) 70 75 78 80 82 85 90 95
Repetidores (n1) 24 35 41 50 61 63

Apliquemos el mismo procedimiento de análisis, a saber combinar n1 y n2,


establecer n1 como referencia y contar el número de puntuaciones n2 que pre-
ceden a cada n1. Obtenemos la siguiente tabla:

24 35 41 50 61 63 70 75 78 80 82 85 90 95
n1 n1 n1 n1 n1 n1 n2 n2 n2 n2 n2 n2 n2 n2
0 0 0 0 0 0
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 372

372 Introducción a la estadística

Si sumamos los diferentes valores obtenidos, el resultado es 0. Es decir,


cuando n1 está completamente separada de n2 entonces U = 0. Esto significa a
su vez que n1 y n2 son dos muestras estadísticamente diferentes entre sí en la
característica estudiada. Esta observación nos permite afirmar que a medida
que se mezclan los dos grupos, disminuye la diferencia entre ellos o, si se
prefiere, la diferencia es aleatoria. Al mismo tiempo que los dos grupos se en-
tremezclan aumenta la magnitud de U.
Por tanto, a diferencia de otros estadísticos, la probabilidad de ocurrencia
por azar de U se incrementa a medida que aumenta su magnitud.

b) Cuando n2 está entre 9 y 20 sujetos


Supongamos que el profesor decide incrementar el número de alumnos de
ambos tipos seleccionados al azar para ver si obtiene el mismo resultado. Son
seleccionados 14 alumnos no repetidores y 10 repetidores.
Como el planteamiento del problema es idéntico al caso anterior, nos cen-
traremos sólo en el desarrollo de los pasos 6 y 7 del contraste de hipótesis.
Cuando la magnitud de n2 está entre 9 y 20, se procede del siguiente modo:
• Combinar n1 y n2 y al mismo tiempo asignar un número de orden a ca-
da una de las puntuaciones n1 y n2.
Así, a la puntuación más baja, 24, que está en el grupo n1, le correspon-
de el número 1; a la siguiente puntuación, 35, que está en el grupo n2,
se le asigna el número 2. Y así sucesivamente hasta el último de los 24
sujetos. Por cierto, a medida que se incrementa el tamaño de la muestra
aumenta también la posibilidad de que dos o más sujetos de ambos
grupos tengan la misma puntuación en la característica que estamos es-
tudiando.
Puntuación n2 35 41 50 60 61 63 70 70 75 75 80 80 82 90
Nº de orden 2º 3º 4º 5º 6º 8º 9º 10º 12º 13º 16º 17º 19º 21º
Puntuación n1 24 61 70 75 78 80 85 90 90 95
Nº de orden 1º 7º 11º 14º 15º 18º 20º 22º 23º 24º
Date cuenta de que asignamos un número de orden diferente indepen-
dientemente de que las puntuaciones sean iguales o no. En el paso si-
guiente veremos cómo tratar el problema de las puntuaciones iguales.
Por cierto, estas puntuaciones se conocen como ligas.
• En caso de ligas, asignar el rango medio de los que les correspondería
de no ser iguales.
Si observas la tabla anterior verás que la puntuación 61 aparece dos ve-
ces: como nº 6 y como nº 7. Como no tiene sentido asignar un número
de orden diferente a una misma puntuación, lo lógico sería asignarle un
número de orden igual para ambas: la mejor opción es, sin duda, el or-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 373

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 373

den medio entre 6º y 7º, o sea, (6 + 7)/2 = 6,5. También habrás obser-
vado que la puntuación 70 aparece tres veces: 9º, 10º y 11º. Si aplicas el
razonamiento anterior resulta que el número de orden que le corres-
ponde a la puntuación 70 es (9 + 10 + 11)/3 = 10. Así procedemos para
calcular el número de orden de cualquier liga. Esto nos lleva a la si-
guiente tabla:

Puntuación n2 35 41 50 60 61 63 70 70 75 75 80 80 82 90
Nº de orden ajustado 2 3 4 5 6,5 8 10 10 13 13 17 17 19 22
Puntuación n1 24 61 70 75 78 80 85 90 90 95
Nº de orden ajustado 1 6,5 10 13 15 17 20 22 22 24

• Trabajar sólo con los números de orden ajustados, es decir, hallar su suma.
El resultado obtenido se conoce como suma de rangos R de n1 y n2.

R
n2 2 3 4 5 6,5 8 10 10 13 13 17 17 19 22 149,5
n1 1 6,5 10 13 15 17 20 22 22 24 150,5

• Calcular U.
Para ello se puede utilizar una de las siguientes dos fórmulas:
— A partir de n1: (Fórmula 14.2), donde
R1 es la suma de rangos de n1.
Aplicando la fórmula obtenemos:

— A partir de n2: (Fórmula 14.3), donde


R2 es la suma de rangos de n2.
Aplicando la fórmula obtenemos:

Recuerda que (n1 × n2)/2 te permite saber si estás ante U o U´. Como
(10 × 14)/2 = 70, entonces 44,5 es U y 95,5 es U´.
En realidad no hace falta aplicar las dos fórmulas. Basta con aplicar una y
comprobar si el valor obtenido es U o U´. Si es U´ se procede a su trans-
formación en U. Así, si 95,5 es U´ entonces U = (10 × 14) – 95,5 = 44,5.
Como n1 = 10 y n2 = 14, debes consultar una subtabla diferente a la an-
terior; esta subtabla proporciona el valor crítico de U y se elige en fun-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 374

374 Introducción a la estadística

ción del nivel de error. Teniendo en cuenta que H1 es de una cola y


que α = 0,01, la subtabla adecuada es la siguiente:

TABLA 14.2
VALORES CRÍTICOS DE U
Valores críticos de U para una prueba de una cola en α = 0,01 o para una prueba de
dos colas en α = 0,02.

n2
9 10 11 12 13 14 15 16 17 18 19 20
n1

1
2 0 0 0 0 0 0 1 1
3 1 1 1 2 2 2 3 3 4 4 4 5
4 3 3 4 5 5 6 7 7 8 9 9 10
5 5 6 7 8 9 10 11 12 13 14 15 16
6 7 8 9 11 12 13 15 16 18 19 20 22
7 9 11 12 14 16 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 16 18 21 23 26 28 31 33 36 38 40
10 16 19 22 24 27 30 33 36 38 41 44 47
11 18 22 25 28 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
16 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114

Extracto tomado de Río Sadornil, D. del (2003): Métodos de investigación en educación. Volumen I.
Proceso y diseños no complejos. Madrid: UNED, p. 731.

Puesto que n1 = 10 y n2 = 14, entonces el valor crítico de U es 30, siendo


α = 0,01. Teniendo en cuenta lo que comentamos más arriba sobre la re-
lación entre el incremento de U y la probabilidad asociada, la conclusión
estadística apropiada se formula en los siguientes términos: la probabili-
dad de obtener por azar una U = 44,5 es mayor que la de una U crítica
de 30 (α = 0,01). En consecuencia, tenemos que seguir aceptando H0. Al
tomar esta decisión podríamos cometer un error del Tipo II.

c) Cuando n2 es mayor que 20 sujetos


Cuando el tamaño de n2 supera 20 sujetos, entonces la distribución muestral
de U se considera como relativamente próxima a la distribución normal. En
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 375

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 375

este caso, la media equivale a (Fórmula 14.4) y la desvia-


ción típica a:

(Fórmula 14.5)

Veamos cómo se procede. El enunciado del problema sigue siendo el mis-


mo. Pero esta vez el profesor decide utilizar los datos de los 55 alumnos que
le proporcionaron información sobre el nivel de dificultad que habían experi-
mentado a lo largo del curso. Los datos son los siguientes:

TABLA 14.3
DISTRIBUCIÓN DE LAS PUNTUACIONES DE NIVEL
DE DIFICULTAD PERCIBIDA

Repetidor/a
Nivel de dificultad
Sí No

24 1 0
35 0 1
41 0 1
50 0 1
60 0 1
61 1 3
62 0 1
63 0 1
64 0 1
65 1 1
70 3 4
75 1 4
78 1 1
80 4 7
81 0 2
82 0 1
85 1 1
88 1 0
90 6 3
95 1 0
Total 21 34

Aplicando las fórmulas arriba reseñadas, se obtiene la media y la desvia-


ción típica:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 376

376 Introducción a la estadística

Por otra parte, se calculan, como acabamos de ver en el caso de n2 entre 9


y 20, las sumas de rangos de cada uno de los dos grupos: se obtiene 707 para
los 21 repetidores (n1) y 833 para los 34 no repetidores (n2). Por tanto:

Conociendo la media y la desviación típica, resulta sencillo calcular la


puntuación típica zi que corresponde al valor empírico U:

Esta vez la conclusión estadística se formula de un modo similar dentro


del modelo de distribución Z: la probabilidad de obtener por azar una zU = –2,06
es mayor que la de una z crítica de –2,33 (α = 0,01). En consecuencia, tene-
mos que seguir aceptando H0. Al tomar esta decisión podríamos cometer un
error del Tipo II. Date cuenta de que si α fuera 0,05, la conclusión sería dife-
rente: se aceptaría que el nivel de dificultad experimentada por los alumnos
repetidores es superior al de los alumnos de primera matrícula. Por cierto,
hay una explicación lógica para una situación que parece anómala. Recuerda
la 11ª pista del capítulo 1 y lo entenderás.

OBJETIVO DE LA PRUEBA H
14.6. DE KRUSKAL-WALLIS

Si, en lugar de tener dos, el experimento consta de tres o más muestras, la


prueba adecuada para el análisis de datos ordinales es el análisis de varianza
de una clasificación por rangos, conocida como prueba H de Kruskal-Wallis.
Esta prueba es una excelente alternativa a la prueba F, para el caso de datos
ordinales. Además se trata de una prueba potente si lo que el investigador
busca es probar la hipótesis de si las k muestras independientes proceden de
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 377

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 377

la misma población o no. O sea, se trata de determinar si la diferencia entre


las sumas de rangos se debe al azar o no.

PROCEDIMIENTO 14.7.

El modo de calcular el estadístico H de Kruskal-Wallis es relativamente similar


al de hallar la magnitud del estadístico U de Mann-Whitney.
Veamos cómo se procede. En el marco de su problema de investigación el
profesor desea comprobar el efecto diferencial que el hecho de cursar esta
materia ha podido producir en el nivel de interés de los alumnos en función
de cómo cada alumno ha llevado a cabo sus tareas de aprendizaje: sólo asistir
a clase, realizar además prácticas de solución de problemas de investigación y
realizar ejercicios del campus virtual además de las clases teóricas. Para reca-
bar los datos necesarios, al finalizar el curso, el profesor pide a cada alumno
que evalúe el nivel de interés que esta materia le ha producido en una escala
ordinal que se extiende desde 0 —ningún interés— hasta 100 —máximo inte-
rés—. Selecciona al azar un cierto número de alumnos de cada categoría. El
profesor desea saber si, al finalizar el curso, el nivel de interés percibido de
los alumnos difiere en función del tipo de actividades de aprendizaje que ha-
yan realizado a lo largo del curso.
Para ello se procede al ya habitual contraste de hipótesis.
1. Formulación de H0 y de su correspondiente H1
H0: no hay diferencias estadísticamente significativas en el nivel de in-
terés de esta materia debidas a las diferentes tareas de aprendizaje de
los alumnos.
H1: sí hay diferencias estadísticamente significativas en el nivel de inte-
rés de esta materia debidas a las diferentes tareas de aprendizaje de los
alumnos.
2. Elección justificada de la prueba estadística
Sabemos que la variable dependiente «Nivel de interés de la materia» es
ordinal; la variable independiente «Grupo de investigación» define tres
niveles: a) sólo clase, b) prácticas de solución de problemas de investi-
gación, c) ejercicios del campus virtual. Como se trata de hallar diferen-
cias entre tres grupos independientes respecto de una característica or-
dinal, la prueba más indicada es la prueba H de Kruskal-Wallis.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,01.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 378

378 Introducción a la estadística

4. Definición de la distribución muestral de H


La distribución muestral es una distribución de probabilidad que se for-
ma con infinitos valores de H obtenidos de infinitas muestras aleatorias
de la misma población, todas del mismo tamaño que la del problema de
investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos aquellos valores cuya probabilidad, si H0 es
verdadera, sea ≤ 0,01.
6. Cálculo del estadístico: prueba estadística
Por cuestiones de orden didáctico, vamos a seleccionar aleatoriamente
a 13 alumnos de los 55 de la muestra global. Los datos para analizar
son los reflejados en la siguiente tabla:

Sólo clase Prácticas Campus virtual

42 20 41
50 40 61
60 60 71
70 70 85
80

Como se sugirió al inicio de este apartado, se calcula el valor empírico


de H aplicando prácticamente el mismo procedimiento que para U. Eso
quiere decir:
• En primer lugar, combinamos todas las muestras y al mismo tiempo
clasificamos los valores combinados de menor a mayor; así:

Sólo clase Prácticas Campus virtual

42 4º 20 1º 41 3º
50 5º 40 2º 61 8º
60 6º 60 7º 71 11º
70 10º 70 9º 85 13º
80 12º

• En caso de ligas, hay que reajustar el orden de número, tal como hici-
mos con la prueba U:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 379

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 379

Sólo clase Prácticas Campus virtual

42 4º 20 1º 41 3º
50 5º 40 2º 61 8º
60 6,5º 60 6,5º 71 11º
70 9,5º 70 9,5º 85 13º
80 12º

• Calcular la suma de rangos de cada muestra.

Sólo clase Prácticas Campus virtual

4,00 1,00 3,00


5,00 2,00 8,00
6,50 6,50 11,00
9,50 9,50 13,00
12,00

Suma de rangos R 37,00 19,00 35,00


Promedio 7,40 4,75 8,75

• Calcular H aplicando la siguiente fórmula:

(Fórmula 14.6)

Donde:
N = número de sujetos de la muestra total.
nj = número de sujetos de cada submuestra.
R 2j = cuadrado de los rangos sumados de cada submuestra.

= cociente resultado de dividir el cuadrado de los rangos


sumados por el tamaño de cada submuestra.

= suma de los cocientes.

Si aplicamos la fórmula 14.6 obtenemos:


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 380

380 Introducción a la estadística

7. Interpretación estadística y pedagógica


a) Interpretación estadística: para la interpretación estadística necesita-
mos determinar el valor crítico de H. En muchos libros de estadísti-
ca para las Ciencias Sociales existe una multitud de tablas prepara-
das para el caso de tres muestras de hasta cinco sujetos. En estas
tablas se proporciona la probabilidad de ocurrencia por azar de di-
ferentes valores de H para cada combinación de distintos tamaños
de n1, n2 y n3. En nuestro caso, recurrimos a la tabla donde aparece
la combinación 5, 4 y 4, o sea, cinco sujetos en la primera muestra
(n1), cuatro en la segunda (n2) y cuatro en la tercera (n3).

TABLA 14.4
PROBABILIDADES ASOCIADAS CON VALORES DE H PARA
n1 = 5, n2 = 4 y n3 = 4

Tamaño de muestras
H P
n1 n2 n3

5 4 4 7,7604 0,009

7,7440 0,011

5,6571 0,049

5,6176 0,050

4,6187 0,100

4,5527 0,102

Extracto tomado de Río Sadornil, D. del (2003): Métodos de investigación en educación. Volumen I.
Proceso y diseños no complejos. Madrid: UNED, p. 750.

Teniendo en cuenta que α = 0,01 podemos considerar como valor


crítico más próximo 7,7440. Por ello, como conclusión, podemos
decir que la probabilidad de obtener por azar una H = 2,196 es ma-
yor que la de una H crítica de 7,7440. En consecuencia, tenemos
que aceptar H0. Al tomar esta decisión, podríamos cometer un error
del Tipo II.
b) Interpretación pedagógica: esto significa que por término medio las
actividades de aprendizaje no influyen en el nivel de interés de los
alumnos por esta materia.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 381

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 381

CONSIDERACIONES COMPLEMENTARIAS 14.8.

Cuando el tamaño de las muestras es superior a cinco no se recurre a las ta-


blas a las que nos referíamos en el apartado anterior. En este caso, se consi-
dera que la distribución de H se aproxima lo bastante a la de χ2. En conse-
cuencia, se utiliza este estadístico para el contraste de hipótesis.

CON LA AYUDA
DE PROGRAMAS INFORMÁTICOS 14.9.

Caso 1. Comparación de dos grupos (U de Mann-Whitney)


Como de costumbre, abrimos el desplegable «Analizar». Como nuestra varia-
ble es ordinal, buscamos en el apartado de las «Pruebas no paramétricas» la
opción «Dos muestras independientes».

FIGURA 14.1
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS
«DOS MUESTRAS INDEPENDIENTES»

En la ventana «Pruebas para dos muestras independientes» aparecen dos


espacios. El primero es un cuadro con el rótulo «Contrastar variables». Es en
este cuadro donde deberás insertar las variables que quieres analizar. En este
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 382

382 Introducción a la estadística

caso seleccionamos la variable «Nivel de dificultad II». Podríamos añadir tantas


variables como resulte necesario. El segundo espacio, «Variable de agrupa-
ción», sólo admite una variable, igual que en el caso de la prueba t. Seleccio-
namos la variable «Repite». Los signos de interrogación que aparecen entre pa-
réntesis junto a esta variable significan que hay que especificar los códigos
que representan los dos grupos que se quiere comparar.

FIGURA 14.2
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Para fijar los dos valores para los que deseamos llevar a cabo el contraste,
pulsamos «Definir grupos». Se abre una pequeña ventana en la que hay que
poner los códigos que corresponden a los dos grupos que hay que comparar,
en este caso 1 y 2. Una vez finalizado, se pulsa «Continuar» y se vuelve a la
ventana «Pruebas para dos muestras independientes».
En «Tipo de prueba» está marcada por defecto «U de Mann-Whitney». Una
vez seleccionadas las variables, puedes pulsar la orden de «Aceptar» para que
se ejecute el análisis.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 383

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 383

FIGURA 14.3
DEFINICIÓN DE LOS DOS GRUPOS QUE COMPARAR

El programa proporciona dos tablas:


a) Información sobre los rangos

TABLA 14.5
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS
Rangos

Rango Suma de
Repetidor/a N promedio rangos

Nivel de dificultad Sí 21 33,67 707,00


percibida II No 34 24,50 833,00
Total 55

b) Contraste con chi-cuadrado.

TABLA 14.6
ESTADÍSTICOS DE CONTRASTE
Estadísticos de contrastea

Nivel de dificultad
percibida II

U de Mann-Whitney 238,000
W de Wilcoxon 833,000
Z –2,078
Sig. asintót. (bilateral) ,038

a.
Variable de agrupación: Repetidor/a
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 384

384 Introducción a la estadística

Sig. asintót. nos proporciona la información que necesitamos para proceder


a la interpretación estadística: la probabilidad de obtener por azar una U de 238
es de 0,038; como esta probabilidad es mayor que 0,01, hay que aceptar H0 y
admitir a la vez la posibilidad de cometer un error del Tipo II.
El resto tuvimos ocasión de comentarlo más arriba.

Caso 2. Comparación de más de dos grupos (H de Kruskal-Wallis)


De nuevo abrimos el desplegable «Analizar» y como nuestra variable es ordi-
nal, buscamos en el apartado de las «Pruebas no paramétricas» la opción
«K muestras independientes».

FIGURA 14.4
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS
«K MUESTRAS INDEPENDIENTES»

Se abre la ventana «Pruebas para varias muestras independientes» y, al igual


que para la prueba U, aparecen dos espacios. El primer espacio es un cuadro
con el rótulo «Contrastar variables». Es en este cuadro donde deberás insertar
las variables que quieres analizar. En este caso, seleccionamos la variable «Nivel
de interés II». Podríamos añadir tantas variables como resulte necesario. El se-
gundo espacio, «Variable de agrupación», sólo admite una variable, igual que en
el caso de la prueba F. Seleccionamos la variable «Grupinve».
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 385

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 385

FIGURA 14.5
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Para fijar el rango de valores para los que deseamos llevar a cabo el con-
traste, pulsamos «Definir grupos». Se abre una pequeña ventana en la que hay
que poner los códigos que corresponden a los dos grupos extremos. En nues-
tro caso, marcamos los valores 1 y 3 porque deseamos que el programa com-
pare los grupos 1, 2 y 3.

FIGURA 14.6
DEFINICIÓN DE LOS DOS GRUPOS QUE COMPARAR
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 386

386 Introducción a la estadística

Una vez finalizado, pulsamos «Continuar» y volvemos a la ventana «Prue-


bas para varias muestras independientes».
En «Tipo de prueba» está marcada por defecto «H de Kruskal-Wallis». Una
vez terminada la selección de las variables, podemos pulsar la orden de «Acep-
tar» para ejecutar el análisis.
El programa proporciona dos tablas:
a) Información sobre los rangos

TABLA 14.7
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS
Rangos

Rango
Grupo de investigación N promedio

Nivel de interés II Sólo clase 35 26,33


Prácticas 8 15,38
Campus virtual 6 30,08
Total 49

b) Contraste con chi-cuadrado.

TABLA 14.8
ESTADÍSTICOS DE CONTRASTEa,b

Nivel de
interés II

Chi-cuadrado 4,738
gl 2
Sig. asintót. ,094

a.
Prueba de Kruskal-Wallis.
b.
Variable de agrupación: grupo de investigación.

De acuerdo con la información proporcionada por Sig. asintót., la proba-


bilidad de obtener por azar un χ2 de 4,738 es de 0,094; como esta probabili-
dad es mayor que 0,01, hay que aceptar H0 y admitir a la vez la posibilidad
de cometer un error del Tipo II.
El resto tuvimos ocasión de comentarlo con anterioridad.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 387

¿Qué hacer cuando las variables son ordinales y los grupos son independientes? 387

TU TURNO 14.10.

1. ¿Cuál es el principal objetivo de las pruebas U de Mann-Whitney y H de


Kruskal-Wallis?
2. Un investigador repite un estudio cinco veces y obtiene los siguientes va-
lores de U: 30, 20, 15, 5, 0. Como no proporciona datos sobre el tamaño
de n1 y n2 y tampoco sobre el nivel de error, ¿serías capaz de indicar en
qué caso ese investigador debe haber rechazado H0 y por qué?
3. Mira en la primera página del capítulo 3. Formula una pregunta de inves-
tigación que relacione la orientación académica con la que el alumno se
identifica y el mayor o menor nivel de interés en esta materia al final del
curso. Selecciona al azar cinco alumnos de un tipo y tres de otro y proce-
de al correspondiente contraste de hipótesis.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 388
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 389

Capítulo 15
¿QUÉ HACER CUANDO LAS VARIABLES
SON ORDINALES Y LOS GRUPOS
SON CORRELACIONADOS?

Al terminar este capítulo deberías:


• Conocer las características de la prueba de rangos señalados y
pares igualados de Wilcoxon.
• Ser capaz de hallar la diferencia di entre cada par de puntuaciones.
• Ser capaz de hallar el valor empírico de T.
• Ser capaz de diferenciar el número total de sujetos del valor de N
en la tabla de valores críticos de T.
• Ser capaz de averiguar el valor crítico de T.
• Ser capaz de relacionar la prueba de rangos señalados y pares igua-
lados de Wilcoxon con la distribución normal de probabilidades.
• Ser capaz de utilizar la prueba de rangos señalados y pares igua-
lados de Wilcoxon en un contraste de hipótesis.
• Conocer las características del análisis de varianza de dos clasifi-
caciones por rangos de Friedman.
• Ser capaz de hallar el estadístico χ2r de Friedman.
• Ser capaz de relacionar la distribución del estadístico χ2r de Fried-
man con la distribución del estadístico χ2.
• Ser capaz de utilizar la prueba χ2r de Friedman en un contraste de
hipótesis.

(Si no te acuerdas de lo que significa «grupos correlacionados», deberías vol-


ver a echar una ojeada al inicio del capítulo 10.)

En el capítulo anterior vimos cómo proceder ante datos ordinales recogidos


de grupos independientes. El procedimiento que tuvimos ocasión de estudiar
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 390

390 Introducción a la estadística

en detalle se aplica de un modo prácticamente similar en el caso de grupos


correlacionados. Ahora vamos a ver lo específico del análisis de rangos para
grupos correlacionados.

OBJETIVO DE LA PRUEBA DE RANGOS


15.1. SEÑALADOS Y PARES IGUALADOS DE WILCOXON

En una investigación en la que los pares de sujetos son equiparados o un


mismo sujeto es medido antes y después de un experimento, puede resultar
muy informativo establecer la dirección de las diferencias de los pares de
puntuaciones, es decir, indicar el signo de la diferencia señalando cuál de los
dos miembros del par es mayor1. Sin embargo, puede ser aún más informati-
vo considerar la magnitud de la diferencia de las parejas de puntuaciones,
además de su dirección; esta circunstancia debe permitir ordenar los valores
absolutos de las diferencias de menor a mayor. Es decir, no sólo se puede in-
dicar qué valor es mayor en una pareja de puntuaciones, sino que además se
puede indicar qué diferencia es mayor en un conjunto de tales diferencias. Es-
to es lo que pretende la prueba de rangos señalados y pares igualados de
Wilcoxon.

15.2. PROCEDIMIENTO

Recurrimos a nuestro conocido problema de investigación para ver este pro-


ceso de cerca. El profesor cree que la asistencia a sus clases influye sobre el
nivel de dificultad que los alumnos muestran al final del curso. Para contrastar
su conjetura, el profesor pide a cada alumno que determine el nivel de difi-
cultad inicial de esta materia en una escala típicamente ordinal como ésta que
va desde 0 —ninguna dificultad— hasta 100 —máxima dificultad—. Esta vez,
finalizado el curso, el profesor vuelve a solicitar a sus alumnos que evalúen el
nivel de dificultad experimentado en la misma escala inicial. Selecciona al
azar a una docena de alumnos entre los que se presentaron al examen final.
El profesor desea saber si, al finalizar el curso, el nivel de dificultad que los
alumnos le manifestaron al principio del curso ha variado sensiblemente.
Para ello procede al ya habitual contraste de hipótesis.

1
La prueba de los signos se basa en este principio.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 391

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 391

1. Formulación de H0 y de su correspondiente H1
H0: no hay diferencias estadísticamente significativas entre el nivel de
dificultad inicial y el nivel de dificultad final.
H1: sí hay diferencias estadísticamente significativas entre el nivel de di-
ficultad inicial y el nivel de dificultad final.
2. Elección justificada de la prueba estadística
Sabemos que la variable dependiente «Nivel de dificultad» se considera
ordinal; la variable independiente «Momento del curso» define dos nive-
les: a) inicial y b) final. Como se trata de hallar diferencias entre dos
grupos correlacionados respecto de una característica ordinal, la prue-
ba más indicada es la prueba T de Wilcoxon.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,01.
4. Definición de la distribución muestral de T de Wilcoxon
La distribución muestral es una distribución de probabilidad que se for-
ma con infinitos valores de T obtenidos de infinitas muestras aleatorias
de la misma población, todas del mismo tamaño que la del problema de
investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos los valores cuya probabilidad, si H0 es verdade-
ra, sea ≤ 0,01.
Puesto que H1 no indica la dirección de las diferencias, la zona de re-
chazo está situada en ambos extremos de la distribución e incluye to-
dos aquellos valores cuya probabilidad sea ≤ 0,01.
6. Cálculo del estadístico: prueba estadística
Los datos recogidos por el profesor son los siguientes:

Nivel inicial 60 90 60 90 95 90 50 75 81 82 90 92
Nivel final 78 85 70 75 70 82 50 41 70 61 63 95

Para calcular el valor empírico de T, procedemos del siguiente modo:


• En primer lugar, hallamos la diferencia di entre la puntuación inicial
y la puntuación final para cada sujeto:

Nivel inicial 60 90 60 90 95 90 50 75 81 82 90 92
Nivel final 78 85 70 75 70 82 50 41 70 61 63 95
Diferencia di –18 5 –10 15 25 8 0 34 11 21 27 –3

• Después asignamos un número de orden a cada diferencia, tomando


en cuenta exclusivamente el valor absoluto. Observa que no se to-
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 392

392 Introducción a la estadística

man en consideración las diferencias nulas. Es así como obtenemos


la tabla siguiente:

Nivel inicial 60 90 60 90 95 90 50 75 81 82 90 92
Nivel final 78 85 70 75 70 82 50 41 70 61 63 95
Diferencia di –18 5 –10 15 25 8 0 34 11 21 27 –3
Rango 7º 2º 4º 6º 9º 3º — 11º 5º 8º 10º 1º

• Finalmente, hallamos las sumas de los rangos ordenados tanto para


los cambios positivos como para los cambios negativos: si observas
la tabla anterior verás que hay 8 cambios —negativos— es decir, aqué-
llos en los que el nivel de dificultad baja, 3 —positivos— en los que el
nivel de dificultad se incrementa y finalmente un empate, en el que
no se produce ningún cambio. La suma de los rangos de los cambios
negativos es de 2 + 6 + 9 + 3 + 11 + 5 + 8 + 10 = 54. La suma de los
rangos de los cambios positivos es de 7 + 4 + 1 = 12. Se toma como
valor empírico de T el valor más pequeño, en este caso 12.
7. Interpretación estadística y pedagógica
a) Interpretación estadística: para la interpretación estadística necesita-
mos determinar el valor crítico de T. Para ello recurrimos a la tabla
de probabilidades asociadas a valores de T obtenidos a partir de
muestras pequeñas, es decir, cuando N es igual o inferior a 25 suje-
tos. Si te fijas en la tabla 15.1 te darás cuenta de su gran parecido
con la tabla t de Student. Ambas tablas se parecen en cuanto a su
consulta, excepto que la tabla T no hace referencia a los grados de
libertad sino al número de sujetos del experimento (N). Ahora bien,
N es el número de sujetos para los que se produce algún cambio.
En nuestro caso, puesto que N = 11, α = 0,01 siendo H1 bilateral,
entonces el valor crítico de T es de 5.
Antes de proseguir te convendría revisar el razonamiento que sostu-
vimos con respecto a la relación entre la magnitud del estadístico U
y su probabilidad.
Como conclusión de todo lo anterior, podemos decir que la proba-
bilidad de obtener por azar una T = 12 es mayor que la de una T
crítica = 5 (α = 0,01). En consecuencia, tenemos que aceptar H0. Al
tomar esta decisión, podríamos cometer un error del Tipo II.
b) Interpretación pedagógica: teniendo en cuenta la conclusión esta-
dística, podríamos decir que por término medio el nivel de dificul-
tad final es similar al nivel de dificultad inicial en esta materia.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 393

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 393

TABLA 15.1
TABLA DE VALORES CRÍTICOS DE T EN LA PRUEBA
DE LOS RANGOS SEÑALADOS DE PARES IGUALADOS
DE WILCOXON

Nivel de significación para prueba de una cola

0,025 0,01 0,005


N
Nivel de significación para prueba de dos colas

0,05 0,02 0,01

6 0
7 2 0
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68

Tomada de Calvo, F. (1989): Estadística aplicada. Bilbao: Deusto, p. 552.

¿QUÉ OCURRE SI N ES MAYOR


QUE 25 SUJETOS? 15.3.

Cuando N es mayor que 25, los estudiosos han demostrado que T se distribu-
ye casi normalmente. En este caso, se considera que la media puede averi-
guarse aplicando la siguiente fórmula:

(Fórmula 15.1)
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 394

394 Introducción a la estadística

La desviación típica se calcula así:

(Fórmula 15.2)

Recuerda que para el cálculo de la media y de la desviación típica se ex-


cluye de N a los sujetos para los que no se produce ningún cambio.
Veamos cómo se procede. El enunciado del problema sigue siendo el
mismo. Pero esta vez el profesor decide utilizar los datos de 55 de los alum-
nos de los que dispone información sobre su nivel de dificultad inicial y fi-
nal. En la siguiente tabla se incorporan las puntuaciones asignadas por los
alumnos, la diferencia (di) entre éstas, el orden creciente original y ajustado
de las diferencias.

TABLA 15.2
DISTRIBUCIÓN DE LAS PUNTUACIONES DE NIVEL DE DIFICULTAD

Nivel Nivel Diferencia di Orden Orden


inicial final original ajustado

20 24 –4 6º 6,0
25 70 –45 48º 48,0
50 50 0 – –
50 90 –40 47º 47,0
50 35 15 34º 32,0
60 78 –18 35º 35,0
60 70 –10 22º 24,5
65 85 –20 37º 37,5
65 75 –10 23º 24,5
68 61 7 17º 17,0
70 80 –10 24º 24,5
70 61 9 20º 19,5
72 70 2 2º 3,0
75 90 –15 32º 32,0
75 81 –6 16º 16,0
75 41 34 46º 46,0
79 80 –1 1º 1,0
80 80 0 – –
80 80 0 – –
80 80 0 – –
80 80 0 – –
80 90 –10 28º 24,5
80 78 2 3º 3,0
80 75 5 12º 11,0
80 75 5 9º 11,0
80 70 10 25º 24,5
80 70 10 27º 24,5
80 65 15 33º 32,0
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 395

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 395

80 61 19 36º 36,0
81 70 11 29º 29,0
82 61 21 39º 39,0
85 90 –5 14º 11,0
85 80 5 8º 11,0
85 80 5 15º 11,0
85 62 23 40º 40,0
88 64 24 41º 41,0
89 60 29 45º 45,0
90 90 0 – –
90 90 0 – –
90 88 2 4º 3,0
90 85 5 13º 11,0
90 82 8 18º 18,0
90 81 9 19º 19,5
90 80 10 21º 24,5
90 80 10 26º 24,5
90 75 15 30º 32,0
90 75 15 31º 32,0
90 65 25 43º 42,5
90 63 27 44º 44,0
92 95 –3 5º 5,0
95 90 5 11º 11,0
95 90 5 10º 11,0
95 90 5 7º 11,0
95 70 25 42º 42,5
100 80 20 38º 37,5

Se observa que hay 7 empates. En cuanto al resto, el cálculo de la suma


de rangos negativos arroja 839,5 y la suma de rangos positivos, 336,5. Esto
significa que T = 336,5.
Nos conviene aplicar las fórmulas 15.1 y 15.2 para averiguar la media y la
desviación típica de esta distribución y así poder calcular la puntuación zi que
le corresponde a la T empírica. Obtenemos:

Conociendo la media y la desviación típica, podemos calcular la puntua-


ción típica zi que corresponde al valor empírico T:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 396

396 Introducción a la estadística

Ya sabemos cómo formular la conclusión dentro del modelo de distribu-


ción Z: la probabilidad de obtener por azar una zT = –2,58 es igual a la de
una z crítica de –2,58 (α = 0,01). En consecuencia, tenemos que rechazar H0.
Al tomar esta decisión podríamos cometer un error del Tipo I. Esta vez esta
conclusión nos sugiere que el nivel de dificultad de esta materia difiere entre
el inicio y el final del curso. Un análisis más detallado apunta a que por tér-
mino medio la impresión de que esta materia es difícil disminuye sensible-
mente a lo largo del curso.

15.4. OBJETIVO DE LA PRUEBA χ2r DE FRIEDMAN

Si, en lugar de tener dos, el experimento consta de tres o más grupos correla-
cionados, la prueba adecuada para el análisis de datos ordinales es el análisis
de varianza de dos clasificaciones por rangos de Friedman, conocida como
prueba χ2r de Friedman. Esta prueba es otra excelente alternativa a la prueba
F; está diseñada para evaluar las diferencias entre tres o más grupos correla-
cionados si los datos para analizar son ordinales.

15.5. PROCEDIMIENTO

El modo de calcular el estadístico χ2r de Friedman es similar al de los demás


estadísticos que ya hemos visto, salvo por el hecho de que los números de
orden se asignan horizontalmente. Es una operación lógica, dado que los su-
jetos están igualados por fila.
Veamos cómo se procede. Los datos del problema de investigación que
venimos comentando no son adecuados para formular hipótesis alguna. De
hecho, no se procedió a ningún tipo de equiparación de alumnos ni éstos
fueron asignados aleatoriamente a los tratamientos diseñados por el profesor.
Por cierto, tampoco los tratamientos fueron diseñados para comprobar su
efecto sobre el nivel de dificultad de esta materia. Por tanto, en este caso va-
mos a proponer una pregunta que no se relaciona con el marco general del
problema de investigación.
Supongamos que los alumnos son asignados aleatoriamente a cuatro trata-
mientos, una vez hecha la comprobación de que se asemejan entre sí en el
nivel de dificultad e interés en esta materia al inicio del curso. Al finalizar
el curso se les pide que califiquen el nivel de dificultad que realmente ha te-
nido esta materia para cada uno de ellos. De cada tratamiento se elige una
muestra de cuatro sujetos y se obtiene la siguiente tabla de datos:
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 397

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 397

TABLA 15.3
DISTRIBUCIÓN DE LAS PUNTUACIONES DE NIVEL DE DIFICULTAD
EN FUNCIÓN DE CADA TRATAMIENTO

Sólo clase Prácticas Campus virtual Prácticas y


Campus virtual

24 50 65 60
61 95 80 73
75 90 41 70
90 80 50 61

Para comprobar si los tratamientos han tenido algún efecto diferencial sobre
el nivel de dificultad el profesor, procede a su ya habitual contraste de hipótesis.
1. Formulación de H0 y de su correspondiente H1
H0: no hay diferencias estadísticamente significativas en el nivel de difi-
cultad de esta materia debidas al tipo de tareas de aprendizaje realiza-
das por los alumnos.
H1: sí hay diferencias estadísticamente significativas en el nivel de difi-
cultad de esta materia debidas al tipo de tareas de aprendizaje realiza-
das por los alumnos.
2. Elección justificada de la prueba estadística
Sabemos que la variable dependiente «Nivel de dificultad de la materia»
se considera ordinal; la variable independiente «Grupo de investigación»
define cuatro niveles: a) Sólo clase, b) Prácticas de solución de proble-
mas de investigación, c) Ejercicios del campus virtual y d) Prácticas de
solución de problemas de investigación y ejercicios del campus virtual.
Como se trata de hallar diferencias entre cuatro grupos correlacionados
respecto de una característica ordinal, la prueba más indicada es la
prueba χ2r de Friedman.
3. Especificación del nivel de error o de significación (α)
Nivel de error: 0,01.
4. Definición de la distribución muestral de χ2r
La distribución muestral es una distribución de probabilidad que se for-
ma con infinitos valores de χ2r obtenidos de infinitas muestras aleatorias
de la misma población, todas del mismo tamaño que la del problema de
investigación.
5. Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que
está formada por todos aquellos valores cuya probabilidad, si H0 es
verdadera, sea ≤ 0,01.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 398

398 Introducción a la estadística

6. Cálculo del estadístico: prueba estadística


Como se sugirió al inicio de este apartado, se calcula el valor empírico
de χ2r aplicando prácticamente el mismo procedimiento que para U o
H. Eso quiere decir:
• En primer lugar, combinar los datos de cada fila y al mismo tiempo
clasificar los valores combinados de menor a mayor2; así:

Sólo clase Prácticas Campus Prácticas y


virtual campus virtual

Puntuación Orden Puntuación Orden Puntuación Orden Puntuación Orden

24 1º 50 2º 65 4º 60 3º
61 1º 95 4º 80 3º 73 2º
75 3º 90 4º 41 1º 70 2º
90 4º 80 3º 50 1º 61 2º

• Calcular la suma de rangos de cada tratamiento.

Sólo Prácticas Campus Prácticas y


clase virtual campus virtual

1 2 4 3
1 4 3 2
3 4 1 2
4 3 1 2

Suma de rangos R 9 13 9 9
R2 81 169 81 81

• Calcular χ2r aplicando la siguiente fórmula:

(Fórmula 15.3)
Donde:
N = número de filas.
k = número de columnas.
R2j = cuadrado de los rangos sumados de cada columna.
= suma de los cuadrados de los rangos sumados de cada
columna.
Si aplicamos la fórmula 15.3 obtenemos:

2
No importa ordenar de menor a mayor o de mayor a menor.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 399

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 399

7. Interpretación estadística y pedagógica


a) Interpretación estadística: para la interpretación estadística necesita-
mos determinar el valor crítico de χ2r. En algunos libros de estadísti-
ca para las Ciencias Sociales aparecen dos tablas: una para k = 3 y
otra para k = 4. Dentro de la primera tabla aparecen valores de χ2r
con sus correspondientes probabilidades para N = 2 hasta N = 9.
Dentro de la segunda tabla están reflejados los valores críticos de χ2r
para N = 2, 3 y 4.
Teniendo en cuenta que en nuestro caso k = 4, consultaremos la ta-
bla 15.4.

TABLA 15.4
TABLA DE PROBABILIDADES ASOCIADAS CON VALORES
EMPÍRICOS DE χ2r Y k = 4 EN EL ANÁLISIS DE VARIANZA
DE DOS CLASIFICACIONES POR RANGOS DE FRIEDMAN
k=4

N=2 N=3 N=4

χ2r p χ2r p χ2r p χ2r p

0,0 1,000 0,2 1,000 0,0 1,000 5,7 0,141


0,6 0,958 0,6 0,958 0,3 0,992 6,0 0,105
1,2 0,834 1,0 0,910 0,6 0,928 6,3 0,094
1,8 0,792 1,8 0,727 0,9 0,900 6,6 0,077
2,4 0,625 2,2 0,608 1,2 0,800 6,9 0,068
3,0 0,542 2,6 0,524 1,5 0,754 7,2 0,054
3,6 0,458 3,4 0,446 1,8 0,677 7,5 0,052
4,2 0,375 3,8 0,342 2,1 0,649 7,8 0,036
4,8 0,208 4,2 0,300 2,4 0,524 8,1 0,033
5,4 0,167 5,0 0,207 2,7 0,508 8,4 0,019
6,0 0,042 5,4 0,175 3,0 0,432 8,7 0,014
5,8 0,148 3,3 0,389 9,3 0,012
6,6 0,075 3,6 0,355 9,6 0,0069
7,0 0,054 3,9 0,324 9,9 0,0062
7,4 0,033 4,5 0,242 10,2 0,0027
8,2 0,017 4,8 0,200 10,8 0,0016
9,0 0,0017 5,1 0,190 11,1 0,00094
5,4 0,158 12,0 0,000072

Extracto tomado de Siegel, S. (1986): Estadística no paramétrica. México: Trillas, p. 315.

Teniendo en cuenta que k = 4 y N = 4, entonces la probabilidad de


obtener un valor de χ2r de 1,8 es de 0,677. Como esta probabilidad es
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 400

400 Introducción a la estadística

mayor que α (0,01), podemos concluir que procede aceptar H0. Al to-
mar esta decisión, podríamos cometer un error del Tipo II.
b) Interpretación pedagógica: por tanto, por término medio las activi-
dades de aprendizaje no influyen en el nivel de dificultad que expe-
rimentan los alumnos en esta materia.

15.6. CONSIDERACIONES COMPLEMENTARIAS


Cuando k y/o N son mayores que 4, se considera que la distribución de χ2r se
aproxima lo bastante a χ2 con g.l.= k – 1. En consecuencia, se utiliza este es-
tadístico para el contraste de hipótesis.

CON LA AYUDA
15.7. DE PROGRAMAS INFORMÁTICOS

Caso 1. Comparación de dos grupos correlacionados (T de Wilcoxon)


Como de costumbre, abrimos el desplegable «Analizar». Como nuestra varia-
ble es ordinal, buscamos en el apartado de las «Pruebas no paramétricas» la
opción «Dos muestras relacionadas».

FIGURA 15.1
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS
«DOS MUESTRAS RELACIONADAS»
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 401

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 401

En la ventana «Pruebas para dos muestras relacionadas» aparecen dos es-


pacios. El primero se encuentra debajo de la lista de variables de la base de
datos y aparece con el rótulo de «Selecciones actuales». Es en este espacio
donde se insertan las variables que seleccionamos de dos en dos. En nuestro
caso aparecen las variables «Dificultad1» y «Dificultad2». Una vez selecciona-
do el par se pulsa la flecha que permite incorporarlo en el segundo espacio
rotulado «Contrastar pares». Se puede repetir este proceso tantas veces como
lo exija el problema que vamos a estudiar.

FIGURA 15.2
SELECCIÓN DE LAS VARIABLES QUE INCORPORAR EN EL ANÁLISIS

Una vez finalizada la operación de selección de los pares de variables que


contrastar, se pulsa «Aceptar».
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 402

402 Introducción a la estadística

FIGURA 15.3
DEFINICIÓN DE LOS PARES DE VARIABLES QUE CONTRASTAR

En «Tipo de prueba» está marcada por defecto la prueba T de «Wilcoxon».


El programa proporciona dos tablas:
a) Información sobre los rangos

TABLA 15.5
ESTADÍSTICOS DESCRIPTIVOS PARA CADA UNO DE LOS GRUPOS
Rangos

Rango Suma de
N promedio rangos

Nivel de dificultad Rangos negativos 34a 24,69 839,50


percibida II - Rangos positivos 14b 24,04 336,50
Nivel de dificultad Empates 7c
esperada I Total 55

a. Nivel de dificultad percibida II < Nivel dedificultad esperada I.


b. Nivel de dificultad percibida II > Nivel dedificultad esperada I.
c. Nivel de dificultad percibida II - Nivel dedificultad esperada I.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 403

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 403

b) Contraste con Z.

TABLA 15.6
ESTADÍSTICOS DE CONTRASTE

Nivel de dificultad
percibida II -
Nivel de dificultad
esperada I

Z –2,583a
Sig. asintót. (bilateral) ,010

a. Basado en los rangos postivos.


b. Prueba de los rangos con signo de Wilcoxon.

Sig. asintót. nos proporciona la información que necesitamos para proceder


a la interpretación estadística: la probabilidad de obtener por azar una Z
de –2,583 es de 0,010; como esta probabilidad es igual a 0,01, hay que rechazar
H0 y admitir a la vez la posibilidad de cometer un error del Tipo I.
El resto tuvimos ocasión de comentarlo anteriormente.

Caso 2. Comparación de más de dos grupos correlacionados (χ2r de Friedman)


De nuevo abrimos el desplegable «Analizar» y como nuestra variable es ordi-
nal, buscamos en el apartado de las «Pruebas no paramétricas» la opción «K
muestras relacionadas».

FIGURA 15.4
SELECCIÓN DE LA OPCIÓN DE ANÁLISIS
«K MUESTRAS RELACIONADAS»
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 404

404 Introducción a la estadística

Se abre la ventana «Pruebas para varias muestras relacionadas». En el único


espacio disponible, hemos de incorporar las variables que contrastar. En este ca-
so son «Sólo clase», «Prácticas», «Campus virtual» y «Prácticas y campus virtual».

FIGURA 15.5
PROCESO DE SELECCIÓN DE LAS VARIABLES QUE INCORPORAR
EN EL ANÁLISIS

En «Tipo de prueba» está marcada por defecto la prueba χ2r de «Friedman».


Si tienes algo de curiosidad, puedes abrir la ventana «Estadísticos…» para
ver qué otras opciones te ofrece el programa además del «Tipo de prueba».
Una vez terminada la selección de las variables, pulsa la orden de «Aceptar»
para ejecutar el análisis.
El programa proporciona los resultados:
a) Información sobre los estadísticos descriptivos y los rangos
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 405

¿Qué hacer cuando las variables son ordinales y los grupos son correlacionados? 405

TABLA 15.7
ESTADÍSTICOS DESCRIPTIVOS DE CADA UNO DE LOS GRUPOS
Estadísticos descriptivos

Desviación
N Media típica Mínimo Máximo

Sólo clase 4 62,5000 28,26659 24,00 90,00


Prácticas 4 78,7500 20,15564 50,00 95,00
Campus virtual 4 59,0000 17,14643 41,00 80,00
Prácticas y 4 66,0000 6,48074 60,00 73,00
campus virtual

TABLA 15.8
RANGOS

Rango
promedio

Sólo clase 2,25


Prácticas 3,235
Campus virtual 2,25
Prácticas y 2,25
campus virtual

b) Contraste con χ2

TABLA 15.9
ESTADÍSTICOS DE CONTRASTE

Estadísticos de contrastea

N 4
Chi-cuadrado 1,800
gl 3
Sig. asintót. ,615

a. Prueba de Friedman.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 406

406 Introducción a la estadística

De acuerdo con la información proporcionada por Sig. asintót. la probabi-


lidad de obtener por azar un χ2 de 1,800 es de 0,615; como esta probabilidad
es mayor que 0,01, hay que aceptar H0 y admitir a la vez la posibilidad de co-
meter un error del Tipo II.
El resto tuvimos ocasión de comentarlo anteriormente.

15.8. TU TURNO

1. ¿Cuál es el principal objetivo de las pruebas T de Wilcoxon y χ2r de Friedman?


2. Mira en la primera página del capítulo 3. Formula una pregunta de inves-
tigación que se relacione con la mayor o menor evolución del nivel de in-
terés en esta materia a lo largo del curso. Selecciona aleatoriamente a sie-
te alumnos de la base de datos y procede al correspondiente contraste de
hipótesis.
3. Formula una pregunta de investigación en la que hay cuatro tratamientos
y tres sujetos en cada tratamiento. Los sujetos son asignados a los trata-
mientos de manera que sean similares por fila. Inventa los datos y proce-
de al correspondiente contraste de hipótesis.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 407

Apéndice A

SOLUCIONES

CAPÍTULO 3:
Respuesta a la sexta pregunta: A medida que se incrementa la amplitud de los in-
tervalos, disminuye la calidad de la información sobre la distribución dentro de los
intervalos: no se puede saber qué puntuación tiene cada sujeto del intervalo.

CAPÍTULO 4:
5: b; 6: b; 7: b.

CAPÍTULO 5:
Sabiendo que en la variable «Conocimientos previos» se obtuvo una media 4,269 y
una desviación típica de 0,918, y suponiendo que las puntuaciones se distribuyen
normalmente, halla:
1. 0,8836
2. 0,0202
3. 0,7088
4. 0,7580
5. 0,0016
6. 0,6733
7. 0,0198
8. –2,17 y + 2,17
9. 4,627
10. 3,314
11. 3,792
12. 4,746
13. 3,654 y 4,627
14. 1
15. 2
16. 4

CAPÍTULO 6:

1: 1; 2: 2; 3: 3; 4: 3; 5: 2; 6: 4; 7: 4; 8: 3.

CAPÍTULO 7:
Los alumnos realizan el examen teórico del primer parcial y obtienen una media de
4,977 y una desviación típica de 1,618. Suponiendo que estos datos son poblacionales
y que se distribuyen normalmente, halla:
1. 0,7016
2. 0,0034
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 408

408 Introducción a la estadística

3. 0,7324
4. 0,7967
5. 0,0015
6. 0,5874
7. 0,0426
8. +1,04
9. –1,04

10. Calcula la probabilidad de acertar por azar la mitad de una prueba de 10 ítems, sa-
biendo que p = 0,20 de cada ítem.

11. Calcula la probabilidad de acertar por azar entre 7 y 9 ítems de una prueba de 15
ítems, sabiendo que p = 0,25.

p[7≥x≤9] = 0,03932047 + 0,01310682 + 0,00339806 = 0,05582535

12. El profesor sabe que la media de aciertos del examen teórico del primer parcial
suele estar en torno a 21 de un total de 40 ítems. Si para este curso el profesor no
hizo nada especial para mejorar la situación, ¿cuál es la probabilidad de que la
media de aciertos sea de 25?

13. ¿Cuál es la probabilidad de que el número de aciertos del examen anterior esté
entre 18 y 20?

p[18≥x≤20] = 0,0747174 + 0,0825824 + 0,0867115 = 0,2440113


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 409

Apéndice A. Soluciones 409

CAPÍTULO 8:
1: 1; 2: 3.
3. De una población cuyas características son desconocidas, se saca una muestra alea-
toria de 80 sujetos a los que se aplica una prueba. Se calcula la media y la desvia-
ción típica y se obtienen datos equivalentes a los de la 9ª muestra de la tabla 8.5. Si
se saca otra muestra de similares características y en iguales condiciones, ¿cuál es
la probabilidad de obtener una media igual o superior a 4,5?

→ p = 1 – 0,9991 = 0,0009

4. Calcula el intervalo confidencial de la media de la 9ª muestra de la tabla 8.5 a un ni-


vel de confianza del 99%.
Intervalo confidencial = 4,1969 ± (2,58 × 0,0968)
Límite superior = 4,6969 + 0,2497 = 4,4466
Límite inferior = 4,6969 - 0,2497 = 3,9472
5. Calcula el error muestral máximo de la 9ª muestra de la tabla 8.5 a un nivel de con-
fianza del 96%.
Error muestral máximo = 2,05 × 0,0968 = 0,19844
6. Calcula el intervalo confidencial de la media de la 9ª muestra de la tabla 8.3 a un ni-
vel de confianza del 99%. Fíjate en el valor de N.

Intervalo confidencial = 4,0900 ± (2,797 × 0,1494)


Límite superior = 4,0900 + 0,4179 = 4,5079
Límite inferior = 4,0900 - 0,4179 = 3,7621
7. Calcula el error muestral máximo de la 9ª muestra de la tabla 8.3 a un nivel de con-
fianza del 98%. Fíjate en el valor de N.
Error muestral máximo = 2,492 × 0,1494 = 0,3723
8. ¿Se puede aceptar que la media de la 10ª muestra de la tabla 8.4, 4,15, es equiva-
lente a μ, con un nivel de confianza del 98%? Demuéstralo.
Contraste de hipótesis:
a) Formulación de H0 y de H1
H0: μ = 4,15: el nivel medio de conocimientos previos de los alumnos es estadís-
ticamente igual a 4,15.
H1: μ ≠ 5: el nivel medio de conocimientos previos de los alumnos es estadística-
mente diferente a 4,15. Se trata de una H1 bilateral.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 410

410 Introducción a la estadística

b) Elección justificada de la prueba estadística


La variable «conocimientos previos» es una variable medida a nivel de intervalo.
Hay un grupo de 50 sujetos, es decir N≥30. Por tanto, se entiende que el modelo
de distribución de las medias se ajusta a la distribución normal, modelo Z o de la
Razón Crítica para una muestra grande.
c) Especificación del nivel de error o de significación μ = 0,05
Teniendo en cuenta que H1 es bilateral, la z crítica es 1,96.
d) Definición de la distribución muestral de la media
La distribución muestral de medias es una distribución de probabilidad, que se
forma con infinitas medias obtenidas de infinitas muestras aleatorias de la mis-
ma población, todas del mismo tamaño que la del problema de investigación.
e) Zona de rechazo de H0
La zona de rechazo de H0 es una parte de la distribución muestral que está for-
mada por todos los valores cuya probabilidad, si H0 es verdadera, sea ≤ 0,05.
Puesto que H1 no indica la dirección de las diferencias, la zona de rechazo está
situada en ambos extremos de la distribución que incluye todos los valores cuya
probabilidad sea ≤ 0,05.
f) Cálculo del estadístico: prueba estadística

Sabiendo que la media poblacional es 4,2688, la media muestral 4,15 y el error


típico de la media 0,09519, entonces:

g) Interpretación estadística y pedagógica


• Interpretación estadística: la probabilidad de obtener por azar una zi = –1,25
es mayor que la de una zi = 1,96 (α = 0,05); por tanto se acepta H0. Al tomar
esta decisión, podríamos estar cometiendo un error del Tipo II.
• Interpretación pedagógica: el nivel medio de conocimientos previos de los
alumnos es igual a 4,15 puntos.

CAPÍTULO 9:
1: 3; 2: 2.

CAPÍTULO 11:
1: 1; 2: 2; 3: 1; 4: 2.

CAPÍTULO 12:
1: 3; 3a = 5,333; 3b = 2; 3c = 0,056; 3d = 9; 4.2.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 411

Apéndice A. Soluciones 411

CAPÍTULO 13:

1. ¿Cuál es el principal objetivo de la prueba χ2?


Medir la discrepancia entre las frecuencias empíricas y las teóricas.
2. ¿Qué tipo de problemas de investigación se puede resolver mediante una prueba χ2?
Problemas que implican variables categóricas o para comprobar si una determinada
distribución de frecuencias se ajusta al modelo de la curva normal.
4. Repites una misma investigación en cuatro ocasiones bajo condiciones similares y
obtienes los siguientes valores de χ2: 0, 8, 16 y 24. Sabes que los grados de libertad
de tu investigación son 8 y en ninguna ocasión has tomado la precaución de fijar el
nivel de error. ¿En qué caso o casos crees que sería aconsejable rechazar H0 y por
qué? Observa la tabla 13.4 antes de contestar.
Teniendo en cuenta que a medida que aumentan los grados de libertad disminuye la
probabilidad de que el valor empírico de χ2 sea aleatorio, el valor menos probable
de los cuatro es 24. Si α fuera 0,01 habría que rechazar H0 en este caso. Y si fuera
0,05 habría rechazar H0 si χ2 fuera 16 ó 24.
5. Comprueba si las siguientes variables, están estadísticamente relacionadas entre sí
o no:

Nivel de interés

Debajo Encima Total


de la media de la media

Nivel de Debajo de la media 16 14 30


dificultad
Encima de la media 36 27 63

Total 52 41 93

Lleva a cabo el contraste de hipótesis completo.


a) Formulación de H0 y H1
H0: el nivel de interés no está estadísticamente relacionado con el nivel de difi-
cultad de esta materia.
H1: el nivel de interés está estadísticamente relacionado con el nivel de dificultad
de esta materia.
b) Nivel de significación: α = 0,05.
c) Elección de la prueba estadística
Son medidos a nivel nominal y agrupados en dos categorías exhaustivas y mu-
tuamente excluyentes. Por tanto, la prueba estadística adecuada es la prueba χ2
para muestras independientes.
d) Distribución muestral
La distribución muestral es una distribución de probabilidad, que se forma con
los valores de χ2 obtenidos de infinitas muestras aleatorias de la misma pobla-
ción, todas del mismo tamaño que la del problema de investigación.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 412

412 Introducción a la estadística

e) Zona de rechazo
Según el α señalado, la zona de rechazo de H0 de la distribución muestral de χ2
está formada por todos los valores de la distribución muestral cuya probabilidad
asociada, si H0 es verdadera, sea ≤ 0,05.
f) Cálculo de la prueba estadística χ2.

g) Interpretación estadística y pedagógica


• Interpretación estadística: la probabilidad de obtener por azar un χ2 = 0,0150
es mayor que la de un valor crítico de χ2 = 3,841. Por ello, se acepta H0. Al
tomar esta decisión, se podría estar cometiendo un error del Tipo II.
• Interpretación pedagógica: el nivel de interés no está relacionado con el ni-
vel de dificultad de esta materia.
5. La distribución de puntuaciones obtenidas por los alumnos en la prueba de co-
nocimientos previos son las siguientes:

Xi fi

2,50 1
2,75 4
3,00 6
3,25 5
3,50 9
3,75 6
4,00 10
4,25 13
4,50 7
4,75 10
5,00 7
5,25 5
5,50 2
5,75 4
6,00 2
6,75 1
7,00 1
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 413

Apéndice A. Soluciones 413

Comprueba si estas puntuaciones se distribuyen normalmente.

Xi fo L sup zi Área por Área en fe


debajo el intervalo

2,50 1 3,00 –1,38 0,0838 0,0838 7,7934


2,75 4 3,25 –1,11 0,1335 0,0497 4,6221
3,00 6 3,50 –0,84 0,2004 0,0669 6,2217
3,25 5 3,75 –0,56 0,2877 0,0873 8,1189
3,50 9 4,00 –0,29 0,3897 0,1020 9,4860
3,75 6 4,25 –0,02 0,4920 0,1023 9,5139
4,00 10 4,50 0,25 0,5987 0,1067 9,9231
4,25 13 4,75 0,52 0,6985 0,0998 9,2814
4,50 7 5,00 0,80 0,7881 0,0896 8,3328
4,75 10 5,25 1,07 0,8577 0,0696 6,4728
5,00 7 5,50 1,34 0,9099 0,0522 4,8546
5,25 5 5,75 1,61 0,9463 0,0364 3,3852
5,50 2 6,00 1,88 0,9699 0,0236 2,1948
5,75 4 6,25 2,16 0,9846 0,0147 1,3671
6,00 2 6,50 2,43 0,9925 0,0079 0,7347
6,75 1 7,25 3,25 0,9994 0,0069 0,6417
7,00 1 7,50 3,52 0,9998 0,0004 0,0372

Xi fo fe χ2

2,50 1 7,7934 5,9217


2,75 4 4,6221 0,1346
3,00 6 6,2217 0,0079
3,25 5 8,1189 1,1981
3,50 9 9,4860 0,0249
3,75 6 9,5139 1,2978
4,00 10 9,9231 0,0006
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 414

414 Introducción a la estadística

Xi fo fe χ2

4,25 13 9,2814 1,4898


4,50 7 8,3328 0,2132
4,75 10 6,4728 1,9221
5,00 7 4,8546 0,9481
5,25-7,00 15 8,3607 5,2723

χ2 = 18,4311

Teniendo en cuenta que los grados de libertad son 12 – 3 = 9, el valor crítico de χ2


para α = 0,05, es de 16,919. Por todo ello, puesto que la probabilidad de obtener un
χ2 = 18,4311 es menor que la de χ2 crítico, H0 ha de ser rechazada y hay que admitir
a la vez la posibilidad de cometer un error del Tipo I. En otras palabras, esta distri-
bución no se ajusta a la distribución normal.

CAPÍTULO 14:
1. ¿Cuál es el principal objetivo de las pruebas U de Mann-Whitney y H de Kruskal-
Wallis?
Probar si dos (U) o más (H) grupos independientes pertenecen a la misma población.
2. Un investigador repite un estudio cinco veces y obtiene los siguientes valores de U:
30, 20, 15, 5, 0. Como no proporciona datos sobre el tamaño de n1 y n2 y tampoco
sobre el nivel de error, ¿serías capaz de indicar en qué caso ese investigador debe
haber rechazado H0 y por qué?
Este investigador debería rechazar H0 al obtener U = 0, porque en este caso los dos
grupos están claramente separados o, dicho de otro modo, no pertenecen a la mis-
ma población.

CAPÍTULO 15:

1. ¿Cuál es el principal objetivo de las pruebas T de Wilcoxon y χ2r de Friedman?


Probar si dos (U) o más (H) grupos correlacionados pertenecen a la misma población.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 415

Apéndice B

TABLAS

TABLA I
ÁREA BAJO LA CURVA NORMAL (p > 0,5)

Z 0 1 2 3 4 5 6 7 8 9

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7516 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7703 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9430 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9648 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9700 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9762 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9874 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9986 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 416

416 Introducción a la estadística

TABLA II

DISTRIBUCIÓN BINOMIAL

PoQ

N 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

1 0 0,9900 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000
1 0,0100 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000

2 0 0,9800 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500
1 0,0200 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000
2 0,0000 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500

3 0 0,9700 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250
1 0,0290 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750
2 0,0000 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750
3 0,0000 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250

4 0 0,9610 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625
1 0,0390 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500
2 0,0010 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750
3 0,0000 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500
4 0,0000 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625

5 0 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0312
1 0,0480 0,2036 0,3280 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1562
2 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125
3 0,0000 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125
4 0,0000 0,0000 0,0004 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1562
5 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0312

6 0 0,9410 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156
1 0,0570 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938
2 0,0010 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344
3 0,0000 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125
4 0,0000 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344
5 0,0000 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0205 0,0369 0,0609 0,0938
6 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156

7 0 0,9320 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078
1 0,0660 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547
2 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641
3 0,0000 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734
4 0,0000 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734
5 0,0000 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641
6 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547
7 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078

8 0 0,9227 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039
1 0,0747 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0312
2 0,0026 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094
3 0,0000 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 417

Apéndice B. Tablas 417

4 0,0000 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734
5 0,0000 0,0000 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188
6 0,0000 0,0000 0,0000 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094
7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0312
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039

9 0 0,9135 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0277 0,0101 0,0046 0,0020
1 0,0830 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176
2 0,0033 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703
3 0,0000 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641
4 0,0000 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461
5 0,0000 0,0000 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461
6 0,0000 0,0000 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641
7 0,0000 0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0020

10 0 0,9044 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010
1 0,0914 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098
2 0,0042 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439
3 0,0001 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172
4 0,0000 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051
5 0,0000 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461
6 0,0000 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051
7 0,0000 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172
8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0016

11 0 0,8953 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005
1 0,0995 0,3293 0,3835 0,2348 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054
2 0,0050 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269
3 0,0002 0,0137 0,0710 0,1517 0,2215 0,2581 0,2568 2254 0,1774 0,1259 0,0806
4 0,0000 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611
5 0,0000 0,0001 0,0025 0,0132 0,0388 0,0803 0,1231 0,1830 0,2207 0,2360 0,2256
6 0,0000 0,0000 0,0003 0,0003 000097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256
7 0,0000 0,0000 0,0000 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611
8 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0021 0,0054
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0005

12 0 0,8864 0,0504 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002
1 0,1074 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029
2 0,0060 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161
3 0,0002 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537
4 0,000 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208
5 0,0000 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934
6 0,0000 0,0000 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256
7 0,0000 0,0000 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934
8 0,0000 0,0000 0,0000 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,2108
9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0025 0,0068 0,0161
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0029
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 418

418 Introducción a la estadística

13 0 0,8775 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
1 0,1152 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045 0,0016
2 0,0070 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 0,0095
3 0,0002 0,0214 0,0097 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349
4 0,0000 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873
5 0,0000 ,0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1980 0,1571
6 0,0000 0,0000 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095
7 0,0000 0,0000 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095
8 0,0000 0,0000 0,0000 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571
9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0008 0,0012 0,0036 0,0095
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001

14 0 0,8687 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 0,1223 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009
2 0,0081 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056
3 0,0003 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222
4 0,0000 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611
5 0,0000 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222
6 0,0000 0,0000 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833
7 0,0000 0,0000 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2095
8 0,0000 0,0000 0,0000 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833
9 0,0000 0,0000 0,0000 0,0000 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0033 0,0093 0,0222
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0019 0,0056
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0009
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001

15 0 0,8600 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000
1 0,1303 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005
2 0,0092 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032
3 0,0004 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139
4 0,0000 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417
5 0,0000 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916
6 0,0000 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527
7 0,0000 0,0000 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964
8 0,0000 0,0000 0,0000 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964
9 0,0000 0,0000 0,0000 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527
10 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0074 0,0191 0,0417
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052 0,0319
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0032
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

16 0 0,8514 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 0,0000
1 0,1376 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002
2 0,0104 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 0,0018
3 0,0005 0,3559 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085
4 0,0000 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 419

Apéndice B. Tablas 419

5 0,0000 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667
6 0,0000 0,0001 0,0028 0,0180 0,0550 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222
7 0,0000 0,0000 0,0004 0,0045 0,0917 0,0524 0,1010 0,1524 0,1889 0,1969 0,1746
8 0,0000 0,0000 0,0001 0,0009 0,0055 0,0197 0,0487 0,0923 0,1417 0,1812 0,1964
9 0,0000 0,0000 0,0000 0,0001 0,0012 0,0058 0,0185 0,0442 0,0840 0,1318 0,1746
10 0,0000 0,0000 0,0000 0,0000 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0013 0,0049 0,0142 0,0337 0,0667
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0040 0,0115 0,0278
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0029 0,0085
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

17 0 0,8429 0,4181 0,1668 0,0631 0,0225 0,0075 0,0023 0,0007 0,0002 0,0000 0,0000
1 0,1447 0,3741 0,3150 0,1893 0,0957 0,0426 0,0169 0,0060 0,0019 0,0005 0,0001
2 0,0117 0,1575 0,2800 0,2673 0,1914 0,1136 0,0581 0,0260 0,0102 0,0035 0,0010
3 0,0006 0,0415 0,1556 0,2359 0,2393 0,1893 0,1245 0,0701 0,0341 0,0144 0,0052
4 0,0000 0,0076 0,0605 0,1457 0,2093 0,2209 0,1868 0,1320 0,0796 0,0411 0,0182
5 0,0000 0,0010 0,0175 0,0668 0,1361 0,1914 0,2081 0,1849 0,1379 0,0875 0,0472
6 0,0000 0,0001 0,0039 0,0236 0,0680 0,1276 0,1784 0,1991 0,1839 0,1432 0,0944
7 0,0000 0,0000 0,0007 0,0065 0,0267 0,0668 0,1201 0,1685 0,1927 0,1841 0,1484
8 0,0000 0,0000 0,0001 0,0041 0,0084 0,0279 0,0644 0,1143 0,1606 0,1883 0,1855
9 0,0000 0,0000 0,0000 0,0003 0,0021 0,0093 0,0276 0,0611 0,1070 0,1540 0,1855
10 0,0000 0,0000 0,0000 0,0000 0,0004 0,0025 0,0095 0,0263 0,0571 0,1008 0,1484
11 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0026 0,0090 0,0242 0,0525 0,0944
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0081 0,0215 0,0472
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0021 0,0068 0,0182
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

18 0 0,8345 0,3972 0,1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 0,0000 0,0000
1 0,1517 0,3763 0,3002 0,1704 0,0811 0,0338 0,0126 0,0042 0,0012 0,0003 0,0001
2 0,0130 0,1683 0,2835 0,2556 0,1723 0,0958 0,0458 0,0190 0,0069 0,0022 0,0006
3 0,0007 0,0473 0,1680 0,2406 0,2297 0,1704 0,1046 0,0547 0,0246 0,0095 0,0031
4 0,0000 0,0093 0,0700 0,1592 0,2153 0,2130 0,1681 0,1104 0,0614 0,0291 0,0117
5 0,0000 0,0014 0,0218 0,0787 0,1507 0,1988 0,2017 0,1664 0,1146 0,0666 0,0327
6 0,0000 0,0002 0,0052 0,0310 0,0816 0,1436 0,1873 0,1941 0,1655 0,1181 0,0708
7 0,0000 0,0000 0,0010 0,0091 0,0350 0,0820 0,1376 0,1792 0,1892 0,1657 0,1214
8 0,0000 0,0000 0,0002 0,0022 0,0120 0,0376 0,0811 0,1327 0,1734 0,1864 0,1669
9 0,0000 0,0000 0,0000 0,0004 0,0033 0,0139 0,0386 0,0794 0,1284 0,1694 0,1855
10 0,0000 0,0000 0,0000 0,0001 0,0008 0,0042 0,0149 0,0385 0,0771 0,1248 0,1669
11 0,0000 0,0000 0,0000 0,0000 0,0001 0,0010 0,0046 0,0151 0,0374 0,0742 0,1214
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0047 0,0145 0,0354 0,0708
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0045 0,0134 0,0327
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0039 0,0117
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0031
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 420

420 Introducción a la estadística

19 0 0,8262 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0000 0,0000 0,0000
1 0,1586 0,3774 0,2852 0,1529 0,0658 0,0268 0,0093 0,0029 0,0008 0,0002 0,0000
2 0,0144 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003
3 0,0008 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018
4 0,0000 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074
5 0,0000 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222
6 0,0000 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0518
7 0,0000 0,0000 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961
8 0,0000 0,0000 0,0002 0,0032 0,0166 0,0487 0,0981 0,1489 0,1789 0,1771 0,1442
9 0,0000 0,0000 0,0000 0,0007 0,0051 0,0198 0,0154 0,0980 0,1464 0,1771 0,1762
10 0,0000 0,0000 0,0000 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1449 0,1762
11 0,0000 0,0000 0,0000 0,0000 0,0003 0,0018 0,0077 0,0233 0,0532 0,0970 0,1442
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0004 0,0022 0,0083 0,00237 0,0529 0,0961
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0024 0,0085 0,0233 0,0518
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0082 0,0222
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0022 0,0074
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

20 0 0,8179 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000
1 0,1652 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001 0,0000
2 0,0158 0,1887 0,2852 0,2293 0,1369 0,0669 0,0287 0,0100 0,0031 0,0008 0,0002
3 0,0010 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011
4 0,0000 0,0133 0,0898 0,1821 0,2182 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046
5 0,0000 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148
6 0,0000 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370
7 0,0000 0,0000 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739
8 0,0000 0,0000 0,0004 0,0046 0,0222 0,0609 0,1144 0,1614 0,1797 0,1623 0,2101
9 0,0000 0,0000 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1771 0,1602
10 0,0000 0,0000 0,0000 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762
11 0,0000 0,0000 0,0000 0,0000 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602
12 0,0000 0,0000 0,0000 0,0000 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0049 0,0150 0,0370
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 0,0148
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0046
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
20 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 421

Apéndice B. Tablas 421

TABLA III

DISTRIBUCIÓN DE PROBABILIDADES DE POISSON

p para valores de μ entre 0,1 y 1,0

x 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

0 0,9048 0,8187 0,7408 0,6703 0,6065 0,5488 0,4966 0,4493 0,4066 0,3679

1 0,0905 0,1637 0,2222 0,2681 0,3033 0,3293 0,3476 0,3595 0,3659 0,3679

2 0,0045 0,0164 0,0333 0,0536 0,0758 0,0988 0,1217 0,1438 0,1647 0,1839

3 0,0002 0,0011 0,0033 0,0072 0,0126 0,0198 0,0284 0,0383 0,0494 0,0613
4 0,0000 0,0001 0,0003 0,0007 0,0016 0,0030 0,0050 0,0077 0,0111 0,0153

5 0,0000 0,0000 0,0000 0,0001 0,0002 0,0004 0,0007 0,0012 0,0020 0,0031

6 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0003 0,0005

p para valores de μ entre 1,1 y 2,0

x 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0

0 0,3329 0,3012 0,2725 0,2466 0,2231 0,2019 0,1827 0,1653 0,1496 0,1353

1 0,3662 0,3614 0,3543 0,3452 0,3347 0,3230 0,3106 0,2975 0,2842 0,2707

2 0,2014 0,2169 0,2303 0,2417 0,2510 0,2584 0,2640 0,2678 0,2700 0,2707

3 0,0738 0,0867 0,0998 0,1128 0,1255 0,1378 0,1496 0,1607 0,1710 0,1804

4 0,0203 0,0260 0,0324 0,0395 0,0471 0,0551 0,0636 0,0723 0,0812 0,0902

5 0,0045 0,0062 0,0084 0,0111 0,0141 0,0176 0,0216 0,0260 0,0309 0,0361

6 0,0008 0,0012 0,0018 0,0026 0,0035 0,0047 0,0061 0,0078 0,0098 0,0120

7 0,0001 0,0002 0,0003 0,0005 0,0008 0,0011 0,0015 0,0020 0,0027 0,0034

8 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0003 0,0005 0,0006 0,0009

9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 422

422 Introducción a la estadística

p para valores de μ entre 2,1 y 3,0

x 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0

0 0,1225 0,1108 0,1003 0,0907 0,0821 0,0743 0,0672 0,0608 0,0550 0,0498
1 0,2572 0,2438 0,2306 0,2177 0,2052 0,1931 0,1815 0,1703 0,1596 0,1494
2 0,2700 0,2681 0,2652 0,2613 0,2565 0,2510 0,2450 0,2384 0,2314 0,2240
3 0,1890 0,1966 0,2033 0,2090 0,2138 0,2176 0,2205 0,2225 0,2237 0,2240
4 0,0992 0,1082 0,1169 0,1254 0,1336 0,1414 0,1488 0,1557 0,1622 0,1680
5 0,0417 0,0476 0,0538 0,0602 0,0668 0,0735 0,0804 0,0872 0,0940 0,1008
6 0,0146 0,0174 0,0206 0,0241 0,0278 0,0319 0,0362 0,0407 0,0455 0,0504
7 0,0044 0,0055 0,0068 0,0083 0,0099 0,0118 0,0139 0,0163 0,0188 0,0216
8 0,0011 0,0015 0,0019 0,0025 0,0031 0,0038 0,0047 0,0057 0,0068 0,0081
9 0,0003 0,0004 0,0005 0,0007 0,0009 0,0011 0,0014 0,0018 0,0022 0,0027
10 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0004 0,0005 0,0006 0,0008
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002

p para valores de μ entre 3,2 y 4,9

x 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 4,9

0 0,0408 0,0334 0,0273 0,0224 0,0183 0,0150 0,0123 0,0101 0,0082 0,0074
1 0,1304 0,1135 0,0984 0,0850 0,0733 0,0630 0,0540 0,0462 0,0395 0,0365
2 0,2087 0,1929 0,1771 0,1615 0,1465 0,1323 0,1188 0,1063 0,0948 0,0894
3 0,2226 0,2186 0,2125 0,2046 0,1954 0,1852 0,1743 0,1631 0,1517 0,1460
4 0,1781 0,1858 0,1912 0,1944 0,1954 0,1944 0,1917 0,1875 0,1820 0,1789
5 0,1140 0,1264 0,1377 0,1477 0,1563 0,1633 0,1687 0,1725 0,1747 0,1753
6 0,0608 0,0716 0,0826 0,0936 0,1042 0,1143 0,1237, 0,1323 0,1398 0,1432
7 0,0278 0,0348 0,0425 0,0508 0,0595 0,0686 0,0778 0,0869 0,0959 0,1002
8 0,0111 0,0148 0,0191 0,0241 0,0298 0,0360 0,0428 0,0500 0,0575 0,0614
9 0,0040 0,0056 0,0076 0,0102 0,0132 0,0168 0,0209 0,0255 0,0307 0,0334
10 0,0013 0,0019 0,0028 0,0039 0,0053 0,0071 0,0092 0,0118 0,0147 0,0164
11 0,0004 0,0006 0,0009 0,0013 0,0019 0,0027 0,0037 0,0049 0,0064 0,0073
12 0,0001 0,0002 0,0003 0,0004 0,0006 0,0009 0,0013 0,0019 0,0026 0,0030
13 0,0000 0,0000 0,0001 0,0001 0,0002 0,0003 0,0005 0,0007 0,0009 0,0011
14 0,0000 0,0000 0,0000 0,0000, 0,0001 0:0001 0,0001 0,0002 0,0003 0,0004
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 423

Apéndice B. Tablas 423

p para valores de μ entre 5,0 y 7,0

x 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0

0 0,0067 0,0055 0,0045 0,0037 0,0030 0,0025 0,0020 0,0017 0,0014 0,0011 0,0009
1 0,0337 0,0287 0,0244 0,0207 0,0176 0,0149 0,0126 0,0106 0,0090 0,0076 0,0064
2 0,0842 0,0746 0,0659 0,0580 0,0509 0,0446 0,0390 0,0340 0,0296 0,0258 0,0223
3 0,1404 0,1293 0,1185 0,1082 0,0985 0,0892 0,0806 0,0726 0,0652 0,0584 0,0521
4 0,1755 0,1681 0,1600 0,1515 0,1428 0,1339 0,1249 0,1162 0,1076 0,0992 0,0912
5 0,1755 0,1748 0,1728 0,1697 0,1656 0,1606 0,1549 0,1487 0,1420 0,1349 0,1277
6 0,1462 0,1515 0,1555 0,1584 0,1601 0,1606 0,1601 0,1586 0,1562 0,1529 0,1490
7 0,1044 0,1125 0,1200 0,1267 0,1326 0,1377 0,1418 0,1450 0,1472 0,1486 0,1490
8 0,0653 0,0731 0,0810 0,0887 0,0962 0,1033 0,1099 0,1160 0,1215 0,1263 0,1304
9 0,0363 0,0423 0,0486 0,0552 0,0620 0,0688 0,0757 0,0825 0,0891 0,0954 0,1014
10 0,0181 0,0220 0,0262 0,0309 0,0359 0,0413 0,0469 0:0528 0,0588 0,0649 0,0710
11 0,0082 0,0104 0,0129 0,0157 0,0190 0,0225 0,0265 0,0307 0,0353 0,0401 0,0452
12 0,0034 0,0045 0,0058 0,0073 0,0092 0,0113 0,0137 0,0164 0,0194 0,0227 0,0263
13 0,0013 0,0018 0,0024 0,0032 0,0041 0,0052 0,0065 0,0081 0,0099 0,0119 0,0142
14 0,0005 0,0007 0,0009 0,0013 0,0017 0,0022 0,0029 0,0037 0,0046 0,0058 0,0071
15 0,0002 0,0002 0,0003 0,0005 0,0007 0,0009 0,0012 0,0016 0,0020 0,0026 0,0033
16 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0005 0,0006 0,0008 0,0011 0,0014
17 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0004 0,0006
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002

p para valores de μ entre 7,2 y 9,1

x 7,2 7,4 7,6 7,8 8,0 8,2 8,4 8,6 8,8 9,0 9,1

0 0,0007 0,0006 0,0005 0,0004 0,0003 0,0003 0,0002 0,0002 0,0002 0,0001 0,0001
1 0,0054 0,0045 0,0038 0,0032 0,0027 0,0023 0,0019 0,0016 0,0013 0,0011 0,0010
2 0,0194 0,0167 0,0145 0,0125 0,0107 0,0092 0,0079 0,0068 0,0058 0,0050 0,0046
3 0,0464 0,0413 0,0366 0,0324 0,0286 0,0252 0,0222 0,0195 0,0171 0,0150 0,0140
4 0,0836 0,0764 0,0696 0,0632 0,0573 0,0517 0,0466 0,0420 0,0377 0,0337 0,0319
5 0,1204 0,1130 0,1057 0,0986 0,0916 0,0849 0,0784 0,0722 0,0663 0,0607 0,0581
6 0,1445 0,1394 0,1339 0,1282 0,1221 0,1160 0,1097 0,1034 0,0972 0,0911 0,0881
7 0,1486 0,1474 0,1454 0,1428 0,1396 0,1358 0,1317 0,1271 0,1222 0,1171 0,114
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 424

424 Introducción a la estadística

x 7,2 7,4 7,6 7,8 8,0 8,2 8,4 8,6 8,8 9,0 9,1

8 0,1337 0,1363 0,1381 0,1392 0,1396 0,1392 0,1382 0,1366 0,1344 0,1318 0,1302
9 0,1070 0,1121 0,1167 0,1207 0,1241 0,1269 0,1290 0,1306 0,1315 0,1318 0,1317
10 0,0770 0,0829 0,0887 0,0941 0,0993 0,1040 0,1084 0,1123 0,1157 0,1186 0,1198
11 0,0504 0,0558 0,0613 0,0667 0,0722 0,0776 0,0828 0,0878 0,0925 0,0970 0,0991
12 0,0303 0,0344 0,0388 0,0434 0,0481 0,0530 0,0579 0,0629 0,0679 0,0728 0,0752
13 0,0168 0,0196 0,0227 0,0260 0,0296 0,0334 0,0374 0,0416 0,0459 0,0504 0,0526
14 0,0086 0,0104 0,0123 0,0145 0,0169 0,0196 0,0225 0,0256 0,0289 0,0324 0,0342
15 0,0041 0,0051 0,0062 0,0075 0,0090 0,0107 0,0126 0,0147 0,0169 0,0194 0,0208
16 0,0019 0,0024 0,0030 0,0037 0,0045 0,0055 0,0066 0,0079 0,0093 0,0109 0,0118
17 0,0008 0,0010 0,0013 0,0017 0,0021 0,0026 0,0033 0,0040 0,0048 0,0058 0,0063
18 0,0003 0,0004 0,0006 0,0007 0,0009 0,0012 0,0015 0,0019 0,0024 0,0029 0,0032
19 0,0001 0,0002 0,0002 0,0003 0,0004 0,0005 0,0007 0,0009 0,0011 0,0014 0,0015
20 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0004 0,0005 0,0006 0,0007

p para valores de μ entre 9,2 y 11,0

x 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 10,0 10,5 11,0

0 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0000 0,0000 0,0000
1 0,0009 0,0009 0,0008 0,0007 0,0007 0,0006 0,0005 0,0005 0,0005 0,0003 0,0002
2 0,0043 0,0040 0,0037 0,0034 0,0031 0,0029 0,0027 0,0025 0,0023 0,0015 0,0010
3 0,0131 0,0123 0,0115 0,0107 0,0100 0,0093 0,0087 0,0081 0,0076 0,0053 0,0037
4 0,0302 0,0285 0,0269 0,0254 0,0240 0,0226 0,0213 0,0201 0,0189 0,0139 0,0102
5 0,0555 0,0530 0,0506 0,0483 0,0460 0,0439 0,0418 0,0398 0,0378 0,0293 0,0224
6 0,0851 0,0822 0,0793 0,0764 0,0736 0,0709 0,0682 0,0656 0,0631 0,0513 0,0411
7 0,1118 0,1091 0,1064 0,1037 0,1010 0,0982 0,0955 0,0928 0,0901 0,0769 0,0646
8 0,1286 0,1269 0,1251 0,1232 0,1212 0,1191 0,1170 0,1148 0,1126 0,1009 0,0888
9 0,1315 0,1311 0,1306 0,1300 0,1293 0,1284 0,1274 0,1263 0,1251 0,1177 0,1085
10 0,1210 0,1219 0,1228 0,1235 0,1241 0,1245 0,1249 0,1250 0,1251 0,1236 0,1194
11 0,1012 0,1031 0,1049 0,1067 0,1083 0,1098 0,1112 0,1125 0,1137 0,1180 0,1194
12 0,0776 0,0799 0,0822 0,0844 0,0866 0,0888 0,0908 0,0928 0,0948 0,1032 0,1094
13 0,0549 0,0572 0,0594 0,0617 0,0640 0,0662 0,0685 0,0707 0,0729 0,0834 0,0926
14 0,0361 0,0380 0,0399 0,0419 0,0439 0,0459 0,0479 0,0500 0,0521 0,0625 0,0728
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 425

Apéndice B. Tablas 425

x 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 10,0 10,5 11,0

15 0,0221 0,0235 0,0250 0,0265 0,0281 0,0297 0,0313 0,0330 0,0347 0,0438 0,0534
16 0,0127 0,0137 0,0147 0,0157 0,0168 0,0180 0,0192 0,0204 0,0217 0,0287 0,0367
17 0,0069 0,0075 0,0081 0,0088 0,0095 0,0103 0,0111 0,0119 0,0128 0,0177 0,0237
18 0,0035 0,0039 0,0042 0,0046 0,0051 0,0055 0,0060 0,0065 0,0071 0,0104 0,0145
19 0,0017 0,0019 0,0021 0,0023 0,0026 0,0028 0,0031 0,0034 0,0037 0,0057 0,0084
20 0,0008 0,0009 0,0010 0,0011 0,0012 0,0014 0,0015 0,0017 0,0019 0,0030 0,0046
21 0,0003 0,0004 0,0004 0,0005 0,0006 0,0006 0,0007 0,0008 0,0009 0,0015 0,0024
22 0,0001 0,0002 0,0002 0,0002 0,0002 0,0003 0,0003 0,0004 0,0004 0,0007 0,0012
23 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003 0,0006
24 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0001 0,0003
25 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001

TABLA IV
VALORES CRÍTICOS DE LA DISTRIBUCIÓN t DE STUDENT•

Nivel de significación para un contraste de una cola

0,05 0,025 0,01 0,005 0,0005

Nivel de significación para un contraste de dos colas

g.l. 0,10 0,05 0,02 0,01 0,001

1 6,314 12,706 31,821 63,657 636,619


2 2,920 4,303 6,965 9,925 31,598
3 2,353 3,182 4,541 5,841 12,924
4 2,132 2,776 3,747 4,604 8,610
5 2,015 2,571 3,365 4,032 6,869
6 1,943 2,447 3,143 3,707 5,959
7 1,895 2,365 2,998 3,499 5,408
8 1,860 2,306 2,896 3,355 5,041
9 1,833 2,262 2,821 3,250 4,781
10 1,812 2,228 2,764 3,169 4,587
11 1,796 2,201 2,718 3,106 4,437
12 1,782 2,179 2,681 3,055 4,318
13 1,771 2,160 2,650 3,012 4,221
14 1,761 2,145 2,624 2,977 4,140
15 1,753 2,131 2,602 2,947 4,073

• Extracto tomado de Calvo, F. (1989): Estadística aplicada. Bilbao: Deusto, p. 530.


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 426

426 Introducción a la estadística

g.l. 0,10 0,05 0,02 0,01 0,001

16 1,746 2,120 2,583 2,921 4,015


17 1,740 2,110 2,567 2,898 3,965
18 1,734 2,101 2,552 2,878 3,922
19 1,729 2,093 2,539 2,861 3,883
20 1,725 2,086 2,528 2,845 3,850
21 1,721 2,080 2,518 2,831 3,819
22 1,717 2,074 2,508 2,819 3,792
23 1,714 2,069 2,500 2,807 3,767
24 1,711 2,064 2,492 2,797 3,745
25 1,708 2,060 2,485 2,787 3,725
26 1,706 2,056 2,479 2,779 3,707
27 1,703 2,052 2,473 2,771 3,690
28 1,701 2,048 2,467 2,763 3,674
29 1,699 2,045 2,462 2,756 3,659
30 1,697 2,042 2,457 2,750 3,646
40 1,684 2,021 2,423 2,704 3,551
60 1,671 2,000 2,390 2,660 3,460
120 1,658 1,980 2,358 2,617 3,373
∞ 1,645 1,960 2,326 2,576 3,291

TABLA V
VALORES CRÍTICOS DE LA DISTRIBUCIÓN F
gl (N)•

gl (D) α 1 2 3 4 5 6 7 8 9 10

1 0,010 4052,00 4999,00 5403,00 5625,00 5764,00 5859,00 5928 5982 6022 6056
0,025 647,80 799,50 864,20 899,60 921,80 937,10 948,20 956,70 963,30 968,60
0,050 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88

2 0,010 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40
0,025 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40
0,050 18,51 19,00 19,17 19,25 19,30 19,33 19,35 19,37 19,38 19,40

3 0,010 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23
0,025 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42
0,050 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79

4 0,010 21,20 18,00 16,70 15,98 15,52 15,21 14,98 14,80 14,66 14,55
0,025 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84
0,050 7,71 6,95 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96

• gl (N): grados de libertad del numerador; gl (D): grados de libertad del denominador.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 427

Apéndice B. Tablas 427

5 0,010 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
0,025 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62
0,050 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74

6 0,010 13,75 10,93 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87
0,025 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46
0,050 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06

7 0,010 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62
0,025 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76
0,050 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64

8 0,010 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81
0,025 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30
0,050 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35

9 0,010 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26
0,025 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96
0,050 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14

10 0,010 10,05 7,56 6,55 6,00 5,64 5,39 5,20 5,06 4,94 4,85
0,025 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72
0,050 4,97 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98

11 0,010 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54
0,025 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53
0,050 4,85 3,98 3,59 3,36 3,20 3,10 3,01 2,95 2,90 2,85

12 0,010 9,33 6,93 5,95 5,41 5,07 4,82 4,64 4,50 4,39 4,30
0,025 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37
0,050 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,60 2,75

13 0,010 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10
0,025 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25
0,050 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67

14 0,010 8,86 6,52 5,56 5,04 4,70 4,46 4,28 4,14 4,03 3,94
0,025 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15
0,050 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60

15 0,010 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80
0,025 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06
0,050 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54

16 0,010 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69
0,025 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99
0,050 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49

17 0,010 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59
0,025 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92
0,050 4,45 3,59 3,20 2,97 2,81 2,70 2,61 2,55 2,49 2,45
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 428

428 Introducción a la estadística

18 0,010 8,29 6,01 5,09 4,58 4,25 4,02 3,84 3,71 3,60 3,54
0,025 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87
0,050 4,41 3,56 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41

19 0,010 8,19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43
0,025 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82
0,050 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38

20 0,010 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37
0,025 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77
0,050 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35

21 0,010 8,02 5,78 4,88 4,37 4,04 3,81 3,64 3,51 3,40 3,31
0,025 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73
0,050 4,33 3,47 3,07 2,84 2,69 2,57 2,49 2,42 2,37 2,32

22 0,010 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26
0,025 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70
0,050 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30

23 0,010 7,88 5,66 4,77 4,26 3,94 3,71 3,54 3,41 3,30 3,21
0,025 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67
0,050 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27

24 0,010 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17
0,025 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64
0,050 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25

25 0,010 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 3,22 3,13
0,025 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61
0,050 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24

26 0,010 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09
0,025 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59
0,050 4,23 3,37 2,98 2,74 2,59 2,48 2,39 2,32 2,27 2,22

27 0,010 7,68 5,49 4,60 4,11 3,79 3,56 3,39 3,26 3,15 3,06
0,025 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57
0,050 4,21 3,36 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20

28 0,010 7,64 5,45 4,57 4,08 3,75 3,53 3,36 3,23 3,12 3,03
0,025 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55
0,050 4,20 3,34 2,95 2,72 2,56 2,45 2,36 2,29 2,24 2,19

29 0,010 7,60 5,42 4,54 4,05 3,73 3,50 3,33 3,20 3,09 3,00
0,025 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53
0,050 4,18 3,33 2,94 2]0 2,55 2,43 2,35 2,28 2,22 2,18

30 0,010 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98
0,025 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51
0,050 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 429

Apéndice B. Tablas 429

40 0,010 7,32 5,18 4,31 3,91 3,51 3,29 3,12 2,99 2,89 2,80
0,025 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39
0,050 4,09 3,23 2,84 2,64 2,45 2,34 2,25 2,18 2,12 2,08

50 0,010 7,17 5,06 4,20 3,77 3,41 3,19 3,02 2,89 2,78 2,70
0,025 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32
0,050 4,04 3,18 2,79 2,58 2,40 2,29 2,20 2,13 2,07 2,03

60 0,010 7,08 4,98 4,13 3,68 3,34 3,12 2,95 2,82 2,72 2,43
0,025 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27
0,050 4,00 3,1,5 2,76 2,54 2,37 2,26 2,17 2,10 2,04 1,99

120 0,010 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47
0,025 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16
0,050 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91

∞ 0,010 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32
0,025 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05
0,050 3,84 3,00 2,61 2,37 2,22 2,10 2,01 1,94 1,88 1,83

TABLA VI
VALORES CRÍTICOS DE CHI-CUADRADO (χ2)•
α→
0,50 0,40 0,30 0,20 0,10 0,05 0,01 0,001
g.l. f

1 0,455 0,708 1,074 1,642 2,706 3,841 6,635 10,828


2 1,386 1,833 2,408 3,219 4,605 5,991 9,210 13,816
3 2,366 2,946 3,665 4,642 6,251 7,815 11,345 16,266
4 3,357 4,045 4,878 5,989 7,779 9,488 13,277 18,467
5 4,351 5,132 6,064 7,289 9,236 11,070 15,086 20,515
6 5,348 6,211 7,231 8,558 10,645 12,592 16,812 22,458
7 6,346 7,283 8,383 9,803 12,017 14,067 18,475 24,322
8 7,344 8,351 9,524 11,030 13,362 15,507 20,090 26,125
9 8,343 9,414 10,656 12,242 14,684 16,919 21,666 27,877
10 9,342 10,473 11,781 13,442 15,987 18,307 23,209 29,588
11 10,341 11,530 12,899 14,631 17,275 19,675 24,725 31,264
12 11,340 12,584 14,011 15,812 18,549 21,026 26,217 32,909
13 12,340 13,636 15,119 16,985 19,812 22,362 27,688 34,528
14 13,339 14,685 16,222 18,151 21,064 23,685 29,141 36,123
15 14,339 15,733 17,322 19,311 22,307 24,996 30,578 37,697
16 15,338 16,780 18,418 20,465 23,542 26,296 32,000 39,252
17 16,338 17,824 19,511 21,615 24,769 27,587 33,409 40,790
18 17,338 18,868 20,601 22,760 25,989 28,869 34,805 42,312
19 18,338 19,910 21,689 23,900 27,204 30,144 36,191 43,820
20 19,337 20,951 22,775 25,038 28,412 31,410 37,566 45,315

• Tomada de Seisdedos, N. (1977): El error en psicometría. Madrid: Marova, p. 323.


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 430

430 Introducción a la estadística

21 20,337 21,991 23,858 26,171 29,615 32,671 38,932 46,797


22 21,337 23,031 24,939 27,301 30,813 33,924 40,289 48,268
23 22,337 24,069 26,018 28,429 32,007 35,172 41,638 49,728
24 23,337 25,106 27,096 29,553 33,196 36,415 42,980 51,179
25 24,337 26,143 28,172 30,675 34,382 37,652 44,314 52,620
26 25,336 27,179 29,246 31,795 35,563 38,885 45,642 54,052
27 26,336 28,214 30,319 32,912 36,741 40,113 46,963 55,476
28 27,336 29,249 31,391 34,027 37,916 41,337 48,278 56,892
29 28,336 30,283 32,461 35,139 39,087 42,557 49,588 58,302
30 29,336 31,316 33,530 36,250 40,256 43,773 50,892 59,703
35 34,336 36,475 38,859 41,778 46,059 49,802 57,342 66,619
40 39,335 41,622 44,165 47,269 51,805 55,758 63,691 73,402
50 49,335 51,892 54,723 58,164 63,167 67,505 76,154 86,661
60 59,335 62,135 65,226 68,972 74,397 79,082 88,379 99,607
70 69,334 72,358 75,689 79,715 85,527 90,531 100,425 112,317
80 79,334 82,566 86,120 90,405 96,578 101,879 112,329 124,839
90 89,334 92,761 96,524 101,054 107,565 113,145 124,116 137,208
100 99,334 102,946 106,906 111,667 118,498 124,342 135,806 149,448
150 149,334 153,753 158,577 164,349 172,581 179,581 193,207 209,264
200 199,334 204,434 209,985 216,609 226,021 233,994 249,445 267,540

TABLA VIIa
VALORES CRÍTICOS DE U DE MANN-WHITNEY •

n2 = 3 n2 = 4

n1 r 1 2 3 n1 r 1 2 3 4
Uf Uf

0 0,250 0,100 0,050 0 0,200 0,067 0,028 0,014


1 0,500 0,200 0,100 1 0,400 0,133 0,057 0,029
2 0,750 0,400 0,200 2 0,600 0,267 0,114 0,057
3 0,600 0,350 3 0,400 0,200 0,100
5 0,500 4 0,600 0,314 0,171
0,650 5 0,429 0,243
6 0,571 0,343
7 0,443
8 0,557

• Tomada de Río Sadornil, D. del (2003): Métodos de investigación en educación. Volumen I. Proceso y diseños
no complejos. Madrid: UNED, pp. 727-733.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 431

Apéndice B. Tablas 431

n2 = 5 n2 = 6

n1 r 1 2 3 4 5 n1 r 1 2 3 4 5 6
Uf Uf

0 0,167 0,047 0,018 0,008 0,004 0 0,143 0,036 0,012 0,005 0,002 0,001
1 0,333 0,095 0,036 0,016 0,008 1 0,286 0,071 0,024 0,010 0,004 0,002
2 0,500 0,190 0,071 0,032 0,016 2 0,428 0,143 0,048 0,019 0,009 0,004
3 0,667 0,286 0,125 0,056 0,028 3 0,571 0,214 0,083 0,033 0,015 0,008
4 0,429 0,196 0,095 0,048 4 0,321 0,131 0,057 0,026 0,013
5 0,571 0,286 0,143 0,075 5 0,429 0,190 0,086 0,041 0,021
6 0,393 0,206 0,111 6 0,571 0,274 0,129 0,063 0,032
7 0,500 0,278 0,155 7 0,357 0,176 0,089 0,047
8 0,607 0,365 0,210 8 0,452 0,238 0,123 0,066
9 0,452 0,274 9 0,548 0,305 0,165 0,090
10 0,548 0,345 10 0,381 0,214 0,120
11 0,421 11 0,457 0,268 0,155
12 0,500 12 0,545 0,331 0,197
13 0,579 13 0,396 0,242
14 0,465 0,294
15 0,535 0,350
16 0,409
17 0,469
18 0,531

TABLA VIIb
VALORES CRÍTICOS DE U DE MANN-WHITNEY
n2 = 7

n1 r 1 2 3 4 5 6 7
Uf

0 0,125 0,028 0,008 0,003 0,001 0,001 0,000


1 0,250 0,056 0,017 0,006 0,003 0,001 0,001
2 0,375 0,111 0,033 0,012 0,005 0,002 0,001
3 0,500 0,167 0,058 0,021 0,009 0,004 0,002
4 0,625 0,250 0,092 0,036 0,015 0,007 0,003
5 0,333 0,133 0,055 0,024 0,011 0,006
6 0,444 0,192 0,082 0,037 0,017 0,009
7 0,556 0,258 0,115 0,053 0,026 0,013
8 0,333 0,158 0,074 0,037 0,019
9 0,417 0,206 0,101 0,051 0,027
10 0,500 0,264 0,134 0,069 0,036
11 0,583 0,324 0,172 0,090 0,049
12 0,394 0,216 0,117 0,064
13 0,464 0,265 0,147 0,082
14 0,538 0,319 0,183 0,104
15 0,378 0,223 0,130
16 0,438 0,267 0,159
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 432

432 Introducción a la estadística

17 0,500 0,314 0,191


18 0,562 0,365 0,228
19 0,418 0,267
20 0,473 0,310
21 0,527 0,355
22 0,402
23 0,451
24 0,500
25 0,549

TABLA VIIc
VALORES CRÍTICOS DE U DE MANN-WHITNEY
n2 = 8

n1 r 1 2 3 4 5 6 7 8 t Normal
Uf

0 0,111 0,022 0,006 0,002 0,001 0,000 0,000 0,000 30,308 0,001
1 0,222 0,044 0,012 0,000 0,002 0,001 0,000 0,000 30,203 0,001
2 0,333 0,089 0,024 0,008 0,003 0,001 0,001 0,000 30,098 0,001
3 0,444 0,133 0,042 0,014 0,005 0,002 0,001 0,001 20,993 0,001
4 0,556 0,200 0,067 0,024 0,009 0,004 0,002 0,001 20,888 0,002
5 0,267 0,097 0,036 0,015 0,006 0,003 0,001 20,783 0,003
6 0,356 0,139 0,055 0,023 0,010 0,005 0,002 20,678 0,004
7 0,444 0,188 0,077 0,033 0,015 0,007 0,003 20,573 0,005
8 0,556 0,248 0,107 0,047 0,021 0,010 0,005 20,468 0,007
9 0,315 0,141 0,064 0,030 0,014 0,007 20,363 0,009
10 0,387 0,184 0,085 0,041 0,020 0,010 20,258 0,012
11 0,461 0,230 0,111 0,054 0,027 0,014 20,153 0,016
12 0,539 0,285 0,142 0,071 0,036 0,019 20,048 0,020
13 0,341 0,177 0,091 0,047 0,025 10,943 0,026
14 0,404 0,217 0,114 0,060 0,032 10,838 0,033
15 0,467 0,262 0,141 0,076 0,041 10,733 0,041
16 0,533 0,311 0,172 0,095 0,052 10,628 0,052
17 0,362 0,207 0,116 0,065 10,523 0,064
18 0,416 0,245 0,140 0,080 10,418 0,078
19 0,472 0,286 0,168 0,097 10,313 0,094
20 0,528 0,331 0,198 0,117 10,208 0,113
21 0,377 0,232 0,139 10,102 0,135
22 0,426 0,268 0,164 0,998 0,159
23 0,475 0,306 0,191 0,893 0,185
24 0,525 0,347 0,221 0,788 0,215
25 0,389 0,253 0,683 0,247
26 0,433 0,287 0,578 0,282
27 0,478 0,323 0,473 0,318
28 0,522 0,360 0,368 0,356
29 0,399 0,263 0,396
30 0,439 0,158 0,437
31 0,480 0,052 0,481
32 0,520
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:33 Página 433

Apéndice B. Tablas 433

TABLA VIId
VALORES CRÍTICOS DE U PARA UNA PRUEBA DE UNA COLA EN EL α = 0,001
O PARA UNA PRUEBA DE DOS COLAS EN α = 0,002

n2 r 9 10 11 12 13 14 15 16 17 18 19 20
n1 f

1
2
3 0 0 0 0
4 0 0 0 1 1 1 2 2 3 3 3
5 1 1 2 2 3 3 4 5 5 6 7 7
6 2 3 4 4 5 6 7 8 9 10 11 12
7 3 5 6 7 8 9 10 11 13 14 15 16
8 5 6 8 9 11 12 14 15 17 18 20 21
9 7 8 10 12 14 15 17 19 21 23 25 26
10 8 10 12 14 17 19 21 23 25 27 29 32
11 10 12 15 17 20 22 24 27 29 32 34 37
12 12 14 17 20 23 25 28 31 34 37 40 42
13 14 17 20 23 26 29 32 35 38 42 45 48
14 15 19 22 25 29 32 36 39 43 46 50 54
15 17 21 24 28 32 36 40 43 47 51 55 59
16 19 23 27 31 35 39 43 48 52 56 60 65
17 21 25 29 34 38 43 47 52 57 61 66 70
18 23 27 32 37 42 46 51 56 61 66 71 76
19 25 29 34 40 45 50 55 60 66 71 77 82
20 26 32 37 42 48 54 59 65 70 76 82 88

TABLA VIIe
VALORES CRÍTICOS DE U PARA UNA PRUEBA DE UNA COLA EN α = 0,01
O PARA UNA PRUEBA DE DOS COLAS EN EL α = 0,02

n2 r 9 10 11 12 13 14 15 16 17 18 19 20
n1 f

1
2 0 0 0 0 0 0 1 1
3 1 1 1 2 2 2 3 3 4 4 4 5
4 3 3 4 5 5 6 7 7 8 9 9 10
5 5 6 7 8 9 10 11 12 13 14 15 16
6 7 8 9 11 12 13 15 16 18 19 20 22
7 9 11 12 14 16 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 16 18 21 23 26 28 31 33 36 38 40
10 16 19 22 24 27 30 33 36 38 41 44 47
11 18 22 25 28 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
16 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 434

434 Introducción a la estadística

TABLA VIIf
VALORES CRÍTICOS DE U PARA UNA PRUEBA DE UNA COLA EN α = 0,025
O PARA UNA PRUEBA DE DOS COLAS EN α = 0,05

n2 r 9 10 11 12 13 14 15 16 17 18 19 20
n1 f

1
2 0 0 0 1 1 1 1 1 2 2 2 2
3 2 3 3 4 4 5 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 65 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 69 76 83 90 98 105 112 119 127

TABLA VIIg
VALORES CRÍTICOS DE U PARA UNA PRUEBA DE UNA COLA EN α = 0,05
O PARA UNA PRUEBA DE DOS COLAS EN α = 0,10

n2 r 9 10 11 12 13 14 15 16 17 18 19 20
n1 f

1 0 0
2 1 1 1 2 2 2 3 3 3 4 4 4
3 3 4 5 5 6 7 7 8 9 9 10 11
4 6 7 8 9 10 11 12 14 15 16 17 18
5 9 11 12 13 15 16 18 19 20 22 23 25
6 12 14 16 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 83 88 94 100
16 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 435

Apéndice B. Tablas 435

TABLA VIIIa
VALORES CRÍTICOS DE H EN EL ANÁLISIS DE VARIANZA DE
UNA CLASIFICACIÓN POR RANGOS DE KRUSKAL-WALLIS•

Tamaño de muestras Tamaño de muestras

n1 n2 n3 H p n1 n2 n3 H p

2 1 1 2,7000 0,500 4 3 2 6,4444 0,008


6,3000 0,011
2 2 1 3,6000 0,200 5,4444 0,046
5,4000 0,051
2 2 2 4,5714 0,067 4,5111 0,098
3,7143 0,200 4,4444 0,102
3 1 1 3,2000 0,300
4 3 3 6,7455 0,010
3 2 1 4,2857 0,100 6,7091 0,013
3,8571 0,133 5,7909 0,046
5,7273 0,050
3 2 2 5,3572 0,029 4,7091 0,092
4,7143 0,048 4,7000 0,101
4,5000 0,067
4,4643 0,105 4 4 1 6,6667 0,010
6,1667 0,022
3 3 1 5,1429 0,043 4,9667 0,048
4,5714 0,100 4,8667 0,054
4,0000 0,129 4,1667 0,082
3 3 2 6,2500 0,011 4,0667 0,102
5,3611 0,032
5,1389 0,061 4 4 2 7,0364 0,006
4,5556 0,100 6,8727 0,011
4,2500 0,121 5,4545 0,046
5,2364 0,052
3 3 3 7,2000 0,004 4,5545 0,098
6,4889 0,011 4,4455 0,103
5,6889 0,029
5,6000 0,050 4 4 3 7,1439 0,010
5,0667 0,086 7,1364 0,011
4,6222 0,100 5,5985 0,049
5,5758 0,051
4 1 1 3,5714 0,200 4,5455 0,099
4,4773 0,102
4 2 1 4,8214 0,057
4,5000 0,076 4 4 4 7,6538 0,008
4,0179 0,114 7,5385 0,011
5,6923 0,049
4 2 2 6,0000 0,014 5,6538 0,054
5,3333 0,033 4,6539 0,097
5,1250 0,052 4,5001 0,104
4,4583 0,100
4,1667 0,105 5 1 1 3,8571 0,143
4 3 1 5,8333 0,021 5 2 1 5,2500 0,036
5,2083 0,050 5,0000 0,048

• Tomada de Río Sadornil, D. del (2003): Métodos de investigación en educación. Volumen I.


Proceso y diseños no complejos. Madrid: UNED, pp. 749-750.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 436

436 Introducción a la estadística

TABLA VIIIb
VALORES CRÍTICOS DE H EN EL ANÁLISIS DE VARIANZA DE
UNA CLASIFICACIÓN POR RANGOS DE KRUSKAL-WALLIS

Tamaño de muestras Tamaño de muestras

n1 n2 n3 H p n1 n2 n3 H p

5 2 2 6,5333 0,008 4,5487 0,099


6,1333 0,013 4,5231 0,103
5,1600 0,034
5,0400 0,056 5 4 4 7,7604 0,009
4,3733 0,090 7,7440 0,011
4,2933 0,122 5,6571 0,049
5,6176 0,050
5 3 1 6,4000 0,012 4,6187 0,100
4,9600 0,048 4,5527 0,102
4,8711 0,052
4,0178 0,095 5 5 1 7,3091 0,009
3,8400 0,123 6,8364 0,011
5,1273 0,046
5 3 2 6,9091 0,009 4,9091 0,053
6,8218 0,010 4,1091 0,086
5,2509 0,049 4,0364 0,105
5,1055 0,052
4,6509 0,091 5 5 2 7,3385 0,010
4,4945 0,101 7,2692 0,010
5,3385 0,047
5 3 3 7,0788 0,009 5,2462 0,051
6,9818 0,011 4,6231 0,097
5,6485 0,049 4,5077 0,100
5,5152 0,051
4,5333 0,097 5 5 3 7,5780 0,010
4,4121 0,109 7,5429 0,010
5,7055 0,046
5 4 1 6,9545 0,008 5,6264 0,051
6,8400 0,011 4,5451 0,100
4,9855 0,044 4,5363 0,102
4,8600 0,056
3,9873 0,098 5 5 4 7,8229 0,010
3,9600 0,102 7,7914 0,010
5,6657 0,049
5 4 2 7,2045 0,009 5,6429 0,050
7,1182 0,010 4,5529 0,099
5,2727 0,049 4,5200 0,101
5,2682 0,050
4,5409 0,098 5 5 5 8,0000 0,009
4,5182 0,101 7,9800 0,010
5 4 3 7,4449 0,010 5,7800 0,049
7,3949 0,011 5,6600 0,051
5,6564 0,049 4,5600 0,100
5,6308 0,050 4,5000 0,102
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 437

Apéndice B. Tablas 437

TABLA IXa
VALORES CRÍTICOS DE χ2r EN EL ANÁLISIS DE VARIANZA DE
DOS CLASIFICACIONES POR RANGOS DE FRIEDMAN k = 3 •

N=2 N=3 N=4 N=5

χ2r p χ2r p χ2r p χ2r p

0 1,000 0,000 1,000 0,0 1,000 0,0 1,000


1 0,833 0,667 0,944 0,5 0,931 0,4 0,954
3 0,500 2,000 0,528 1,5 0,653 1,2 0,691
4 0,167 2,667 0,361 2,0 0,431 1,6 0,522
4,667 0,194 3,5 0,273 2,8 0,367
6,000 0,028 4,5 0,125 3,6 0,182
6,0 0,069 4,8 0,124
6,5 0,042 5,2 0,093
8,0 0,0046 6,4 0,039
7,6 0,024
8,4 0,0085
10,0 0,00077

TABLA IXb
VALORES CRÍTICOS DE χ2r EN EL ANÁLISIS DE VARIANZA DE
DOS CLASIFICACIONES POR RANGOS DE FRIEDMAN k = 3 •

N=6 N=7 N=8 N=9

χ2r p χ2r p χ2r p χ2r p

0,00 1,000 0,000 1,000 0,00 0,000 0,000 10,000


0,33 0,956 0,286 0,964 0,25 0,967 0,222 0,971
1,00 0,740 0,857 0,768 0,75 0,794 0,667 0,814
1,33 0,570 1,143 0,620 1,00 0,654 0,889 0,865
2,33 0,430 2,000 0,486 1,75 0,531 1,556 0,569
3,00 0,252 2,571 0,305 2,25 0,355 2,000 0,398
4,00 0,184 3,429 0,237 3,00 0,285 2,667 0,328
4,33 0,142 3,714 0,192 3,25 0,236 2,889 0,278
5,33 0,072 4,571 0,112 4,00 0,149 3,556 0,187
6,33 0,052 5,429 0,085 4,75 0,120 4,222 0,154
7,00 0,029 6,000 0,052 5,25 0,079 4,667 0,107
8,33 0,012 7,143 0,027 6,25 0,047 5,556 0,069
9,00 0,0081 7,714 0,021 6,75 0,038 6,000 0,057
9,33 0,0055 8,000 0,016 7,00 0,030 6,222 0,048
10,33 0,0017 8,857 0,0084 7,75 0,018 6,889 0,031
12,00 0,00013 10,286 0,0036 9,00 0,0099 8,000 0,019
10,571 0,0027 9,25 0,0080 8,222 0,016

• Tomada de Siegel, S. (1986): Estadística no paramétrica. México: Trillas, pp. 314-315.


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 438

438 Introducción a la estadística

11,143 0,0012 9,75 0,0048 8,667 0,010


12,286 0,00032 10,75 0,0024 9,556 0,0060
14,000 0,000021 12,00 0,0011 10,667 0,0035
12,25 0,00086 10,889 0,0029
13,00 0,00026 11,556 0,0013
14,25 0,000061 12,667 0,00066
16,00 0,0000036 13,556 0,00035
14,000 0,00020
14,222 0,000097
14,889 0,000054
16,222 0,000011
18,000 0,0000006

TABLA IXc
VALORES CRÍTICOS DE χ2r EN EL ANÁLISIS DE VARIANZA DE
DOS CLASIFICACIONES POR RANGOS DE FRIEDMAN k = 4

N=2 N=3 N=4

χ2r p χ2r p χ2r p χ2r p

0,0 1,000 0,2 1,000 0,0 1,000 5,7 0,141


0,6 0,958 0,6 0,958 0,3 0,992 6,0 0,105
1,2 0,834 1,0 0,910 0,6 0,928 6,3 0,094
1,8 0,792 1,8 0,727 0,9 0,900 6,6 0,077
2,4 0,625 2,2 0,608 1,2 0,800 6,9 0,068
3,0 0,542 2,6 0,524 1,5 0,754 7,2 0,054
3,6 0,458 3,4 0,446 1,8 0,677 7,5 0,052
4,2 0,375 3,8 0,342 2,1 0,649 7,8 0,036
4,8 0,208 4,2 0,300 2,4 0,524 8,1 0,033
5,4 0,167 5,0 0,207 2,7 0,508 8,4 0,019
6,0 0,042 5,4 0,175 3,0 0,432 8,7 0,014
5,8 0,148 3,3 0,389 9,3 0,012
6,6 0,075 3,6 0,355 9,6 0,0069
7,0 0,054 3,9 0,324 9,9 0,0062
7,4 0,033 4,5 0,242 10,2 0,0027
8,2 0,017 4,8 0,200 10,8 0,0016
9,0 0,0017 5,1 0,190 11,1 0,00094
5,4 0,158 12,0 0,000072
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 439

Apéndice B. Tablas 439

TABLA X
VALORES CRÍTICOS DE T EN LA PRUEBA DE LOS RANGOS SENALADOS
DE PARES IGUALADOS DE WILCOXON •

Nivel de significación para prueba de una cola

0,025 0,01 0,005


N
Nivel de significación para prueba de dos colas

0,05 0,02 0,01

6 0
7 2 0
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68

• Tomada de Calvo, F. (1989): Estadística aplicada. Bilbao: Deusto, p. 552.


INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 440

440 Introducción a la estadística

Bibliografía
ABAD GONZALEZ, J. et al. (2007). Problemas de probabilidad e inferencia estadísti-
ca aplicadas a las Ciencias Sociales. León: Universidad de León.
AGRESTI, A. y FRANKLIN, C. A. (2007). Statistics: the art and science of learning
from data. Upper Saddle River, NJ: Pearson Prentice Hall.
ALEA, V. et al. (2002). Estadística para las Ciencias Sociales: cuestiones tipo test. Ma-
drid: AC, D.L.
AMON, J. (2004). Estadística para psicólogos. Vol. 2, Probabilidad, estadística inferen-
cial. Madrid: Pirámide, 9ª ed. reimp.
— (2006). Estadística para psicólogos. Vol. 1, Estadística descriptiva. Madrid: Pirámi-
de, 15ª ed., reimp.
AMOR PULIDO, R.; AGUILAR PENA, C. y MORALES LUQUE, A. (2005). Estadística
aplicada. Granada: Grupo Editorial Universitario.
ANGUERA, M. M.; ARNAU, J.; ATO, M.; MARTÍNEZ, R.; PASCUAL, J. y VALLEJO, G.
(1995). Métodos de investigación en psicología. Madrid: Síntesis.
ANGUERA, M. T. (ed.) (1993). Metodología observacional. Barcelona: PPU.
ARNAU GRASS, J. (1981). Diseños experimentales en psicología y educación. México:
Trillas.
— (1990). Diseños experimentales multivariables. Madrid: Alianza.
ASOCIACION DE HISTORIA DE LA ESTADISTICA Y DE LA PROBABILIDAD DE ESPA-
NA (AHEPE) (2002). Historia de la probabilidad y de la estadística. Madrid: AC, D.L.
BABBIE, E. (2000). Fundamentos de la investigación social. México: International
Thompson Editores.
BAILLE, A.; CAPERAA, P. y VAN CUTSEM, B. (1988). Méthodes et modèles en statistique
non paramétrique: exercices et compléments. Paris: Presses de l’Université de Laval.
BERICAT ALASTUEY, E. (1998). La integración de los métodos cuantitativo y cualita-
tivo en la investigación social: significado y forma. Barcelona: Ariel.
BISQUERRA, R. (1989). Métodos de investigación educativa. Barcelona: CEAC.
BONNET JEREZ, J. L. (2003). Lecciones de estadística: estadística descriptiva y proba-
bilidad. San Vicente (Alicante): Editorial Club Universitario, D. L.
CACERES HERNANDEZ, J. J. (2006). Conceptos básicos de estadística para ciencias
sociales. Las Rozas (Madrid): Delta.
CALVO, F. (1989). Estadística aplicada. Madrid: Universidad de Deusto.
CAMACHO ROSALES, J. (2005). Estadística con SPSS para Windows: versión 12. Ma-
drid: Ra-Ma, D. L.
CAMARA SANCHEZ, A. et al. (2007). Curso básico de matemáticas y estadística: del
Bachillerato al grado. Las Rozas: Delta.
CAMPBELL, D. y STANLEY, A. (1975). Diseños experimentales y cuasiexperimentales
en la investigación social. Buenos Aires: Amorrortu.
CARIDAD Y OCERIN, J. M. (1985). Métodos básicos de estadística no paramétrica pa-
ra investigadores. Córdoba: Universidad, D. L.
CASAS SANCHEZ, J. M. (2000). Estadística I: Probabilidad y Distribuciones. Madrid:
Centro de Estudios Ramón Areces.
CLAIRIN, R. y BRION, P. (1997). Manual de muestreo. Madrid: La Muralla.
CLEGG, F. (1984). Estadística fácil aplicada a las Ciencias Sociales. Crítica.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 441

Bibliografía 441

COLAS, M. P. y BUENDIA, L. (1992). Investigación Educativa. Sevilla: Alfar.


COLERA, J.; GARCIA, R. y OLIVEIRA, M. J. (2002). Estadística y probabilidad: Bachi-
llerato. Madrid: Anaya.
CRISTOBAL CRISTOBAL, J. A. (2003). Lecciones de Inferencia Estadística. Zaragoza:
Prensas Universitarias de Zaragoza, D. L.
CRISTOFOLI, M. E. (2007). Manual de estadística con Microsoft Excel. Buenos Aires:
Omicron System.
CUADRAS, C.; ECHEVERRIA, B.; MATEO, J. y SANCHEZ, P. (1988). Fundamentos de
estadística. Aplicación a las CC. Humanas, 2ª ed. Barcelona: PPU.
DONNELLY Jr., R. A. (2005). The complete idiot’s guide to statistics. Indianapolis: Alp-
ha Books.
ESTEBAN GARCIA, J. et al. (2005). Estadística Descriptiva y nociones de Probabili-
dad. Madrid: Thompson.
ETXEBERRIA, J.; GARCIA, E.; GIL, J. y RODRIGUEZ, G. (1995). Análisis de datos y
textos. Madrid: RA-MA.
FERGUSON, G. A. (1986). Análisis estadístico en Educación y Psicología. Madrid: Anaya.
FERNANDEZ DIAZ, M. J.; GARCIA RAMOS, J. M.; ASENSIO MUNOZ, I. y FUENTES
VICENTE, A. (1990). 225 problemas de estadística aplicada a las CC. Sociales.
Ejercicios prácticos para alumnos. Madrid: Síntesis.
FERNANDEZ DIAZ, M. J.; GARCIA RAMOS, J. M.; FUENTES VICENTE, A. y ASENSIO
MUNOZ, I. (1990). Resolución de problemas de estadística aplicada a las CC. So-
ciales. Guía práctica para profesores y alumnos. Madrid: Síntesis.
FERNANDEZ FERNANDEZ, S.; CORDERO SANCHEZ, J. M. y CORDOBA LARGO, A.
(2002). Estadística Descriptiva. Madrid: Esic Editorial.
FOX, D. J. (1981). El proceso de investigación en Educación. Pamplona: Eunsa.
FOX, W. (1999). Statistiques sociales. Paris: De Boeck-Université.
GALANTE, R.; MIRANDA PAEZ, J. y LOPEZ GONZALEZ, E. (1993). Colección de ejer-
cicios de autoevaluación sobre estadística aplicada a las Ciencias Humanas. Má-
laga: Universidad de Málaga.
GAMBARA, H. (1995). Diseño de investigaciones. Cuaderno de prácticas. Madrid: Mc-
Graw-Hill/interamericana.
GARCIA JIMENEZ, M. V. (2002). Métodos y diseños de investigación científica: cien-
cias humanas, sociales y de la salud. Madrid: EUB.
GARCIA JIMENEZ, V. (1994). Diseños experimentales básicos en psicología para su
análisis metodológico. Barcelona: PPU.
GARCIA PEREZ, A. (2005). Estadística aplicada: conceptos básicos. Madrid: Universi-
dad Nacional de Educación a Distancia.
GIBBONS, J. D. (1997). Nonparametric Methods for Quantitative Analysis. Columbus,
Ohio: American Sciences Press.
GIL IZQUIERDO, M. et al. (2006). Problemas de Estadística: Probabilidad e Inferen-
cia. Madrid: Universidad Autónoma de Madrid.
GLASS, G. y STANLEY, J. (1974). Métodos estadísticos aplicados a las CC. Sociales.
Madrid: Prentice/Hall.
GOOD, P. I. y HARDIN, J. W. (2006). Common Errors in Statistics (and How to Avoid
Them). Hoboken, New Jersey: John Wiley and Sons.
GUILFORD, P. (1956). Funtamental Statistics in Psychology and Eduation. New York:
McGraw-Hill Book Company.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 442

442 Introducción a la estadística

HANSON, N. R. (1985). Patrones de descubrimiento. Observación y explicación. Ma-


drid: Alianza Universidad.
HETTMANSPERGER, T. P. y MCKEAN, J. W. (1998). Robust nonparametric statistical
methods. London: Arnold.
HIGGINS, J. J. (2004). Introduction to Modern Nonparametric Statistics. Pacific Gro-
ve: Thomson-Brooks/Cole.
HOWELL, D. C. (1998). Méthodes statistiques en sciences humaines. Paris: ITP & De Boeck.
HUGH COOLICAN (2005). Métodos de investigación y estadística en psicología. Méxi-
co [etc.]: El Manual Moderno.
JACCARD, J. (1998). Interaction Effects in Factorial Analysis of Variance. Thousand
Oaks; London: Sage University Paper.
KERLINGER, F. N. (1985). Investigación del comportamiento. Técnicas y metodología.
México: Interamericana.
LEHMAN, E. (2006). Nonparametrics: statistical methods based on ranks. New York:
Springer.
LEON, O. G. y MONTERO, I. (1993). Diseño de investigaciones. Introducción a la ló-
gica de la investigación en Psicología y Educación. Madrid: McGraw-Hill.
LOPEZ DE LA MANZANARA BARBERO, J. (2007). Problemas de Estadística. Madrid:
Pirámide.
LOPEZ GONZALEZ, E.; MIRANDA PAEZ, J. y GALANTE, R. (1993). Análisis de datos
en ciencias del comportamiento y educación. Málaga: Universidad de Málaga.
LUENGO MERINO, I. (2006). Problemas resueltos de cálculo de probabilidades y estadís-
tica. Las Palmas de Gran Canaria: Servicio de Publicaciones de la Universidad.
MARTÍN MARTIN, Q. (2001). Contraste de hipótesis. Madrid: La Muralla.
MARTINEAU, G. (1990). Statistique non-paramétrique appliquée aux sciences humai-
nes. Montréal: Éditions Sciences et Culture.
MARTÍNEZ HERNANDEZ, M. (1994). Métodos y diseños de investigación en psicolo-
gía. Madrid: Ed. Complutense.
— (1995). Métodos y diseños de investigación en psicología y educación. Madrid:
Editorial Complutense, D. L.
MARTÍN-PLIEGO LOPEZ, F. J.; MONTERO LORENZO, J. M. y RUIZ-MAYA PEREZ, L.
(2005). Problemas de Inferencia Estadística. Madrid: Editorial AC: Thomson, D. L.
MCMILLAN, J. M. y SCHUMACHER, S. (2005). Investigación educativa. Madrid: Pear-
son, 5ª ed.
MCQUEEN, R. A. y KNUSSEN, C. (2006). Introduction to research methods and statis-
tics in psychology. Harlow, England: Pearson-Prentice-Hall.
MENDENHALL, W.; BEAVER, R. y BEAVER, B. M. (2002). Introducción a la probabili-
dad y estadística. Madrid: Thomson, 1ª ed.
MEOT, A. (2003). Introduction aux statistiques inférentielles. De la logique à la prati-
que. Paris: De Boeck.
MILES, P. J. (2007). Understanding and using statistics in psychology: a practical in-
troduction or, how I came to know and love the standard error. Los Ángeles
[etc.]: Sage.
MONTERO LORENZO, J. M. (2007). Estadística Descriptiva. Madrid: Thomson-Paraninfo.
MOORE, D. S. (2007). The basic practice of statistics. New York: W. H. Freeman.
MOORE, D. S. y NOTZ, W. I. (2006). Statistics: Concepts and controversies. New
York: W. H. Freeman.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 443

Bibliografía 443

MULLOR, R. y FAJARDO, M. D. (2000). Manual práctico de estadística aplicada a las


Ciencias Sociales. Barcelona: Ariel.
MURES QUINTANA, M. J. (coord.) (2003). Problemas de Estadística Descriptiva apli-
cada a las Ciencias Sociales. Madrid: Pearson- Prentice Hall, D.L.
NARVIAZA, J. L.; LAKA, J. P.; MADARIAGA, J. A. y UGARTE, J. V. (1998). Estadística
aplicada a la gestión y a las CC. Sociales. Estadística descriptiva y probabilidad.
Bilbao: Desclee de Brouwer.
ORDEN HOZ, A. DE LA (1985). Diccionario de investigación educativa. Madrid:
Anaya.
ORDEN HOZ, A. DE LA y MAFOKOZI, J. (1999). «La investigación educativa: natura-
leza, funciones y ambigüedad de sus relaciones con la práctica y la política edu-
cativas». Revista de Investigación Educativa, 17(1), 7-29.
PAGANO, R. R. (1999). Estadística para las ciencias del comportamiento. Madrid:
Thompson.
PENA SANCHEZ DE RIVERA, D. (2003). Introducción a la estadística para las Cien-
cias Sociales. Madrid: McGraw-Hill, D. L.
— (2005). Fundamentos de Estadística. Madrid: Alianza Editorial, 1ª ed., 1ª reimp.
PENA SANCHEZ, D. (1986). Estadística. Modelos y métodos. Madrid: Alianza.
PENA, D. y ROMO, J. (1997). Introducción a la estadística para las Ciencias Sociales.
Madrid: McGraw-Hill.
PERALTA ASTUDILLO, M. J. et al. (2007). Estadística: problemas resueltos. Madrid: Pi-
rámide, 2ª ed.
PEREDA, S. (1987). Psicología experimental. Madrid: Pirámide.
PEREZ LOPEZ, C. (2007). Estadística aplicada a través de Excel. Madrid: Pearson-
Prentice-Hall.
POLANSKY, A. M. (2008). Observed confidence levels: theory and application. Boca
Raton: Chapman & HAll/CRC Press.
PULIDO, A. y SANTOS, J. (1998). Estadística aplicada para ordenadores personales.
Madrid: Pirámide.
QUESADA PALOMA, V.; ISIDORO MARTIN, A. y LOPEZ MARTIN, L. A. (2005). Curso
y ejercicios de estadística: aplicación a las ciencias biológicas, médicas y sociales.
Madrid: Alhambra Longman.
RAMOS ÁLVAREZ, R. (coord.) (2005). Métodos y diseños de investigación en psicolo-
gía. Granada: Grupo Editorial Universitario.
REVUELTA, J. y PONSODA, V. (2005). Fundamentos de estadística. Madrid: Universi-
dad Nacional de Educación a Distancia, 2ª ed.
REY GRANA, C. y RAMIL DIAZ, M. (2006). Introducción a la Estadística Descriptiva.
Madrid: Netbiblo.
RINCON, D.; ARNAL, J.; LATORRE, A. y SANS, A. (1995). Técnicas de investigación
en Ciencias Sociales. Madrid: Dykinson.
RIO SADORNIL, D. DE (2003). Métodos de investigación en Educación. Volumen I:
Procesos y diseños no complejos. Madrid: UNED.
RITCHEY. F. J. (2002). Estadística para las Ciencias Sociales: el potencial de la imagi-
nación estadística. México: McGraw-Hill.
ROSS, S. M. (2007). Introducción a la Estadística. Barcelona: Reverté.
RUDE, N. y RETEL, O. (2000). Statistique en psychologie. Cours et exercices. Paris:
Press Editions.
INT ESTAD 04:ENSEÑANZA MATEMAT 09/03/11 10:34 Página 444

444 Introducción a la estadística

SALKIND, N. J. (2004). Statistics for people who (think they) hate statistics. Thousand
Oaks: Sage Publications (2th. ed.).
SAN MARTIN, R.; ESPINOSA, L. y FERNÁNDEZ, L. Psicoestadística. Madrid: Pirámide.
SCHEFFE, H. (1959). The Analysis of Variance. New York: Henry Holt.
SEISDEDOS BENITO, A. y GARCIA NAVARRO, I. (2002). Problemas de estadística
aplicada a las Ciencias Sociales. Salamanca: Amarú.
SERRET MORENO-GIL, J. (1995). Manual de estadística universitaria inductiva. Ma-
drid: Esic.
SHESKIN, D. J. (2007). Handbook of Parametric and Nonparametric Statistical Pro-
cedures. Boca Raton: Chapman and Hall/CRC (4th ed.).
SIEGEL, S. (1983). Estadística no paramétrica aplicada a las ciencias de la conducta.
México: Trillas.
SNEDECOR, G. W. (1957). Statistical methods. Ames: Iowa State University Press (5th ed.).
SOLANAS PEREZ, A. et al. (2004). Estadística descriptiva en ciencias del comporta-
miento. Madrid: Thomson.
TANUR, F.; MOSTELLER, F.; KRUSKAL, W.; LEHMAN, E.; LINK, R.; PIETERS, R. y RISING,
G. (1992). La estadística: una guía de lo desconocido. Madrid: Alianza Editorial.
TEJEDOR, J. (1981). «Validez interna y externa en los diseños experimentales». Revis-
ta española de Pedagogía, 151, 15-39.
— (1984). Análisis de varianza aplicado a la investigación en Pedagogía y Psicolo-
gía. Madrid: Anaya.
TOMEO PERUCHA, V. y UNA JUAREZ, I. (2003). Lecciones de Estadística descriptiva:
curso teórico-práctico. Madrid: Thomson.
TURNER, J. R. y THAYER, J. F. (2001). «Introduction to analysis of variance: Design,
analysis, & interpretation». Thousand Oaks, California, etc.: Sage Publications.
VILES DIEZ, E. (2001). Estadística básica para universitarios. Pamplona: EUNSA.
VISAUTA, B. (1989). Técnicas de investigación social, Barcelona. Promociones y Pu-
blicaciones Universitarias.
WAGNER, W. E. (2007). Using SPSS for Social Statistics and Research Methods. Thou-
sand Oaks: Pine Forge Press.
WALPOLE, R. E. y MYERS R. H. (2005). Probabilidad y estadística. México: McGraw-Hill.
WASSERMAN, L. (2006). All of nonparametric statistics. New York: Springer.
WILLIAMS, F. y MONGE, P. (2001). Reasoning with statistics. How to read quantitati-
ve research. Orlando: Harcourt College Publishers.
ZIMAN, J. (1986). Introducción al estudio de las ciencias. Barcelona: Ariel.

También podría gustarte