Estadística Básica para Educadores

ESTADÍSTICA BÁSICA PARA EDUCADORES
PROYECTO EDITORIAL
BIBLIOTECA DE EDUCACIÓN
PROYECTO EDITORIAL
PSICOLOGÍA. MANUALES
Director: PRÁCTICOS
Antonio Bolívar Botia
Directores:
Manuel Maceiras Fafián
Juan Manuel Navarro Cordón
Ramón Rodríguez García
ESTADÍSTICA BÁSICA PARA EDUCADORES
AITOR GÓMEZ GONZÁLEZ

JAVIER DÍEZ-PALOMAR
JAVIER ORMAZÁBAL UNZUÉ
RAMÓN FLECHA GARCÍA
RUTH VILÀ BAÑOS
Elena García Vega

José Guitiérrez Maldonado
Mireia Mora Bello
Susana Suarez González
Consulte nuestra página web: www.sintesis.com
En ella encontrará el catálogo completo y comentado
Reservados todos los derechos. Está prohibido, bajo las sanciones

penales y el resarcimiento civil previstos en las leyes, reproducir, registrar
o transmitir esta publicación, íntegra o parcialmente,
por cualquier sistema de recuperación y por cualquier medio,
sea mecánico, electrónico, magnético, electroóptico, por fotocopia
o por cualquier otro, sin la autorización previa por escrito
de Editorial Síntesis, S. A.
© Aitor Gómez González

Javier Díez-Palomar
Javier Ormazábal Unzué
Ramón Flecha García
Ruth Vilà Baños
© EDITORIAL SÍNTESIS, S. A.
Vallehermoso, 34. 28015 Madrid
Teléfono 91 593 20 98
http://www.sintesis.com
ISBN: 978-84-995891-4-5
ISBN: 978-84-995876-3-9
Depósito Legal: M. 27.816-2012
Impreso en España - Printed in Spain

“El único antídoto para esta posible manipulación y para
participar efectivamente en la argumentación pública basada
en cifras y datos, consustancial a la vida democrática, es un co-
nocimiento básico de los métodos estadísticos. En este sentido,
una formación en los conceptos estadísticos básicos es necesaria
para cualquier ciudadano” (Peña, 1986, p. 20)
“The secret language of statistics, so appealing in a fact min-

ded culture, is employed to sensationalize, inflate, confuse, and
oversimplify. Statistical methods and statistical terms are neces-
sary in reporting the mass data of social and economic trends,
business conditions, “opinion” polls, the census. But without
writers who use the words with honesty and understanding and
readers who know what they mean, the result can only be
semantic nonsense” (Huff, 1993, p. 8)
1
Índice
Introducción .......................................................................................................... 11
1. Orígenes y desarrollo de la estadística ......................................................... 15

1.1. Un poco de historia ............................................................................... 15
1.2. Los orígenes de la moderna teoría de la estadística ................................. 16
1.3. El azar y la astronomía: el cálculo del error ............................................ 19
1.4. El desarrollo de la estadística moderna .................................................. 20
1.5. La estadística actual ............................................................................... 22
Para la reflexión .............................................................................................. 24
2. La estadística: la ciencia de los datos .......................................................... 25

2.1. Algunos conceptos básicos .................................................................... 25
2.1.1. Las escalas de medida, 25. 2.1.2. Las variables, 29. 2.1.3. Individuo,
población y muestra, 30. 2.1.4. Parámetro y estadístico, 31.
2.2. Competencias para interpretar científica y críticamente las estadísticas .. 31
2.3. ¿Por qué necesitamos leer las estadísticas? .............................................. 32
2.4. ¿Qué estadísticas tenemos disponibles? .................................................. 35
2.5. Estadística: una ciencia para el tratamiento de los datos que tenemos
que usar sabiamente .............................................................................. 38
3. ¿Qué es esa cosa llamada “estadística descriptiva”? .................................... 41

3.1. La matriz de datos ................................................................................. 43
3.2. Primer paso: ¿cómo organizar los datos? Tabulación
y representación gráfica ......................................................................... 45
7
Estadística básica para educadores
3.2.1. Variables cualitativas, 49. 3.2.2. Variables cuantitativas, 49

3.3. Estadísticos descriptivos ........................................................................ 53
3.3.1. Medidas de posición no central, 53. 3.3.2. Medidas de tendencia cen-
tral, 55. 3.3.3. Calidad educativa, 59. 3.3.4. Medidas de dispersión, 62.
3.3.5. Medidas de forma, 65
3.4. El uso de la estadística descriptiva ......................................................... 68
4. La probabilidad ............................................................................................ 71
4.1. Noción intuitiva .................................................................................... 72
4.2. Noción clásica de probabilidad .............................................................. 73
4.3. Noción axiomática de probabilidad ....................................................... 74
4.4. La noción experimental de probabilidad ............................................... 75
4.5. Ley de probabilidad de variables aleatorias discretas .............................. 77
4.5.1. Función de probabilidad y función de distribución, 79. 4.5.2. Mode-
los de probabilidad de variables aleatorias discretas, 81
4.6. Ley de probabilidad de variables aleatorias continuas ............................ 82
4.6.1. La distribución normal y la distribución normal estándar, 83
5. Estadística inferencial o muestral. La muestra .......................................... 87

5.1. Introducción ......................................................................................... 87
5.2. Muestra representativa .......................................................................... 92
5.2.1. Muestra y población, 92
5.3. ¿Para qué sirve la muestra? ..................................................................... 94
5.4. Tamaño de la muestra ........................................................................... 95
5.5. Técnicas de muestreo ............................................................................ 100
5.5.1. Técnicas de muestreo aleatorias, 100. 5.5.2. Técnicas de muestreo no
aleatorias, 105. 5.5.3. ¿Qué tipo de muestreo es más recomendable?, 107.
5.6. La orientación comunicativa en las técnicas de muestreo ....................... 108
6. Estadística inferencial. Conceptos básicos .................................................. 111

6.1. Distribución muestral y error típico ...................................................... 111
6.2. Teorema del límite central ..................................................................... 113
8
Índice
6.3. Distribución muestral de medias (variables cuantitativas) ...................... 114

6.4. Distribución muestral de proporciones (variables cualitativas
con dos categorías, p, q) ........................................................................ 115
6.5. El diseño experimental .......................................................................... 116
7. Teoría de la estimación ................................................................................ 119

7.1. ¿Qué es la estimación de parámetros? .................................................... 119
7.1.1. Intervalo de probabilidad, 119. 7.1.2. Intervalo de confianza, 121
7.2. La estimación de una proporción .......................................................... 122
7.2.1. Estimadores centrados, 123
7.3. Estimación de una media ...................................................................... 124
8. Teoría de la decisión (contraste de hipótesis) .............................................. 125

8.1. Algunos conceptos básicos .................................................................... 125
8.2. Un ejemplo de la utilidad del contraste de hipótesis .............................. 126
8.3. ¿Cómo se hace un contraste de hipótesis? .............................................. 127
8.4. Errores y riesgos .................................................................................... 131
8.5. Potencia de un contraste (función de potencia) (1-b) ............................ 131
8.6. El grado de significación (p) .................................................................. 133
8.7. Tres estrategias para tomar la decisión ................................................... 134
9. Comparaciones o contrastes de medias ....................................................... 137

9.1. Comparación o contraste entre una media observada y una teórica ....... 137
9.2. Comparación o contraste entre dos medias observadas .......................... 139
9.2.1. Datos independientes o muestras independientes, 139. 9.2.2. Datos
apareados o muestras relacionadas, 142
10. Correlación y regresión ................................................................................. 145

10.1. Conceptos y elementos ......................................................................... 145
10.2. Correlación y regresión simple .............................................................. 148
9
10.2.1. Correlación y regresión lineal de Pearson, 149. 10.2.2. Otros coefi-

cientes de correlación simple, 154
10.3. Correlación para tres o más variables ..................................................... 157
10.4. Correlación parcial ................................................................................ 157
10.5. Correlación múltiple ............................................................................. 158
10.6. Caso práctico: análisis de regresión lineal simple y múltiple a través de
datos del PISA ....................................................................................... 159
10.6.1. Regresión lineal simple, 160. 10.6.2. Regresión múltiple: el caso de
la regresión en etapas (bloques), 163
Anexo 1. La explotación y el uso de los datos secundarios ................................. 173

¿Cómo buscar los datos que se requieren? ....................................................... 174
Los datos del estudio PISA .............................................................................. 174
Education at a glance: la base de datos de la OCDE ......................................... 179
La base de datos Eurostat ................................................................................ 180
El Instituto Nacional de Estadística (INE) ...................................................... 181
Otras fuentes de datos ..................................................................................... 182
La estructura y la organización de los datos ..................................................... 184
En conclusión ................................................................................................. 186
Anexo 2. Software estadístico en las ciencias sociales y educativas:

el caso del SPSS .................................................................................................... 191
Empezando a utilizar el programa: vista de variables ....................................... 192
Vista de datos .................................................................................................. 197
El uso de datos con el SPSS ............................................................................. 198
El editor de datos del SPSS ............................................................................. 199
Bibliografía ........................................................................................................... 201
10
Introducción
Este libro presenta de forma razonada y sencilla la estadística que necesitamos dominar quie-
nes somos profesionales de la educación. A lo largo de estas páginas ofrecemos conocimientos
básicos para el desarrollo de las competencias que nos permitan analizar críticamente las
recopilaciones de datos que, cada vez más, nos rodean. A través de los diferentes capítulos
se dan orientaciones para el desarrollo de las competencias estadísticas que nos permitan
realizar estudios cuantitativos tanto reelaborando datos ya existentes como construyendo
nuevos datos.
Mientras solo una minoría de profesionales de la educación realiza ocasionalmente tra-
bajos estadísticos, todos necesitamos saber leer críticamente y con criterios científicos los
que, cada vez con más frecuencia, nos conciernen. Por esta razón este libro está dedicado al
aprendizaje de la lectura rigurosa y crítica de los estudios estadísticos que nos afectan. Por
un lado, los medios de comunicación nos presentan con frecuencia, como realidades incues-
tionables, afirmaciones basadas en elaboraciones de datos que no han seguido los criterios
de la ciencia estadística; nuestra profesión mejorará su prestigio si sabemos explicar con un
razonamiento estadísticamente válido cuáles de esas afirmaciones son sostenibles y cuáles
no. Así evitaremos el típico recurso de quienes no tienen esas competencias a alabar toda
elaboración de datos como si fuera una ciencia absoluta o a cuestionarla como si siempre
fuera un engaño.
Por otro lado, a los centros educativos se les piden resultados; el dominio de las compe-
tencias básicas de estadística es imprescindible para saber deducir de los datos cuantitativos de
las evaluaciones externas qué tipo de actuaciones generan mejores resultados y cuáles peores.
La ausencia de estas competencias nos deja en manos de las interpretaciones guiadas por inte-
reses muy concretos y por manipulaciones diversas que desviarán nuestra energía y nuestro
esfuerzo en la dirección equivocada. Para analizar y después mejorar los resultados de nuestros
centros, tenemos que saber interpretar autónomamente y con conocimiento de causa (entre
otras cosas) también las evaluaciones externas de tipo cuantitativo.
11
Hace ya mucho tiempo que sabemos que el conocimiento científico de educación no

proviene solo de estudios cuantitativos de datos, sino de estudios tanto cuantitativos como
cualitativos. Aquí hemos abordado solo los primeros. Los segundos siguen una lógica dife-
rente, ni más ni menos científica que la que presentamos en este libro. Utilizando una metá-
fora deudora de nuestro maestro y amigo Robert Merton, podemos decir que se oponen
igual que el queso y el membrillo; se puede tomar cada uno por separado, pero también
saben muy bien juntos.
Hoy en día estamos rodeados de estadísticas. Por todas partes aparecen recopilaciones
de datos: de población, de rendimiento económico, de número de estudiantes, de asisten-
tes a un concierto de rock, de porcentajes de éxito en la aplicación de un nuevo fármaco y
de un sinfín de temas cotidianos. La estadística subyace en la mayoría de las decisiones que
tomamos en el día a día. En todo momento estamos sopesando posibilidades y a veces inclu-
so pensamos cuál es más probable para guiar nuestras decisiones. ¿Qué carrera voy a hacer?
¿A qué número de la lotería voy a jugar? ¿Cuántos caramelos tendré que comprar para el
resto de mis compañeros de clase, si quiero que a cada cual le toquen al menos tres cara-
melos? ¿Cuánto tiempo se tarda en atravesar Barcelona en coche?
La estadística trabaja con datos, muchos datos, de los que se sirven los estadísticos para
interpretar la realidad; para entenderla. De hecho, ésta es la tarea principal de quien se dedi-
ca a la estadística: recopilar (o crear) datos para poder analizarlos y sacar conclusiones que
permitan entender el mundo, en sus diversos aspectos.
La estadística, además, no solo es una herramienta de interpretación de lo que ocurre a
nuestro alrededor. También es un medio válido para tomar decisiones. Las decisiones se
toman a partir del conocimiento que proporciona el análisis de los datos; pero también en
función de otra cosa muy importante: la predicción de que suceda (o no suceda) un deter-
minado fenómeno. Esto se hace considerando la probabilidad de que ocurra (o no) y sobre
esa consideración se toma la decisión.
Sin embargo, la estadística también es una fuente enorme de engaño y mal uso. Una
mala práctica puede dar lugar a afirmaciones categóricas pero completamente erróneas. Exis-
te un libro que es totalmente recomendable leer, How to lie with statistics (Huff, 1993), don-
de se relatan abundantes ejemplos de malas prácticas usando la estadística para hacer afir-
maciones completamente inverosímiles. Este es el poder de la estadística y, también, su
peligro. Por eso es tan importante una buena formación de base en este ámbito, para poder
desarrollar un juicio crítico que nos permita considerar de manera apropiada las afirmacio-
nes que se realizan a partir de no se sabe qué estadísticas o análisis estadísticos. Algo que en
educación es tremendamente habitual y que tantos problemas ha llevado y tantos entuertos
ha producido, algunos con terribles consecuencias. Recuérdese, por ejemplo, la publicación
del Informe Coleman (Coleman et al., 1966) y el Informe Jencks (Jencks et al., 1972). En estos
informes se presentaban “datos irrefutables” que “demostraban” que la inversión en educa-
ción no producía incrementos evidentes en los resultados de los estudiantes. Por tanto, cual-
quier esfuerzo en educación no iba a mejorar los resultados, porque había “otras variables”
que explicaban la diferencia de resultados entre los estudiantes. A raíz de ese informe todas
las políticas educativas en Estados Unidos disminuyeron la asignación de dinero a la edu-
12
Introducción
cación. La consecuencia fue que los colegios de clase alta, donde las familias están habitua-
das a hacer donaciones al centro, no tuvieron problemas. Ni se enteraron del informe. En
cambio, las escuelas de barrios afroamericanos, por ejemplo, que dependían directamente
de las inversiones del distrito en educación, se hundieron directamente en la miseria. Robert
Merton (1977) llamaría a este tipo de actuaciones “Efecto Mateo”: se da más a quien más
tiene y menos a quien menos tiene. El mal uso de la estadística en este caso ocasionó un
incremento de las desigualdades educativas (y por ende sociales).
Por eso pensamos que es tan importante un libro como este; un libro donde no se pre-
tende entrar detalladamente en la ciencia de la estadística, porque eso ya lo han hecho
otros manuales con mucho más lujo de detalles y más profundidad de la que haremos
aquí. Eso ya existe. En cambio, lo que no existe es un libro dedicado a presentar la esta-
dística como una herramienta de trabajo: explicarla, exponerla y decir cómo funciona y
para qué se utiliza. En este libro eso es lo que vamos a hacer. Tomaremos la estadística y
explicaremos cómo es una herramienta para educadores (y cualquier persona que decida
dedicarse a trabajar en el ámbito educativo o de las ciencias sociales haciendo investiga-
ción). Pretende ser un libro intuitivo, orientado a la comprensión de los procesos, de los
conceptos, evitando los artefactos matemáticos, aunque a veces sea inevitable utilizar o
incluir alguna fórmula o alguna definición. Trataremos de que esta situación se produz-
ca lo menos posible. Esperamos que este libro sirva para construir ese conocimiento de
base que permita hacer lecturas críticas de cualquier estadística que salga luego en los
medios de comunicación o en otros ámbitos de nuestras vidas cotidianas.
13
1
Orígenes y desarrollo
de la estadística
1.1. Un poco de historia
La estadística es la “ciencia de los datos”. Los orígenes de esta disciplina se remontan, varios
siglos atrás, al uso de los datos que hacía el Estado para organizar y tomar sus propias decisio-
nes sobre el conjunto de la población, aunque hay autores que los sitúan incluso antes de la
aparición del Estado Moderno, en el momento que los reyes u otras formas de dominación
tenían que hacer recuento de sus efectivos para organizar las campañas militares y planificar la
estrategia a seguir. En cualquier caso, en lo que todos los autores coinciden es en que la esta-
dística, tal y como la conocemos, surge de la confluencia en el siglo XIX de dos tradiciones: la
estadística utilizada en la astronomía y la estadística usada en los recuentos demográficos. La
primera de ellas surge como la aplicación de la teoría de las probabilidades a la minimización
de los errores de observación (debidos a las limitaciones técnicas de los instrumentos de medi-
da de la época). La segunda aparece como resultado de técnicas para llevar la cuenta de fenó-
menos sociales como los nacimientos, las defunciones, los matrimonios y todo aquello que
afectara al conocimiento de la cantidad de población en un territorio.
Tal como afirma Piovani (2005), “la Political Arithmetic se definió como una ciencia de
la sociedad cuyas conclusiones dependían de números y medidas” (Piovani, 2005, p. 4). La
estadística aparece, por tanto, como una disciplina ligada directamente al uso de datos. La
mejora de estos se convirtió en un imperativo. Sin embargo, durante varias décadas la idea
no floreció y la recopilación de datos se quedó en el ámbito de lo que conocemos como
demografía. Aquí sí que iban apareciendo tablas de mortalidad, de nacimientos, de casa-
mientos, etc., que empezaron a formar parte del fondo documental que confeccionaban las
administraciones de los diferentes estados. Entre 1780 y 1830 este tipo de recopilaciones de
datos se generalizan.
De hecho, parece que hay un cierto acuerdo en considerar que fueron los alemanes los
pioneros en proponer la caracterización de su territorio en términos de recuentos de pobla-
15
ción. La tradición alemana remonta la estadística a lecciones impartidas en sus universida-

des (Notitia Rerum Publicarum y Notitia Statuum Germaniae), en la misma época en la que
Petty y Graunt escriben sus tratados.
Piovani (2005) referencia a un autor llamado Conring, profesor en la Universidad de
Göttingen, creada en 1737, donde se estableció una de las cátedras de estadística más famo-
sas del mundo. Las ideas y los cursos de Conring, debido a que eran en latín, no tuvieron
una gran difusión y aún hoy son bastante desconocidos en general. Sin embargo a él debe-
mos muchos de los constructos estadísticos que posteriormente serían refinados e incorpo-
rados a las herramientas estadísticas que estamos habituados a utilizar hoy en día.
Por otro lado, también está en el origen de la estadística el uso de los datos para recabar
información sobre las enfermedades, la mortalidad y la población en general. Leibniz propu-
so un sistema de 56 categorías referidas al Estado que incluían variables tales como sexo, esta-
tus social, mortalidad infantil, cantidad de mujeres en edad de contraer matrimonio, etc.
¿Cómo eran las estadísticas en aquella época? Una de las necesidades que se tenían en
aquellos tiempos era conseguir encontrar un medio para representar la información de cada
una de las regiones que formaban parte del Imperio Prusiano, para los diferentes indicado-
res que se pensaba que eran importantes. Con esa idea en mente es como nacen las tablas
de doble entrada: en las líneas horizontales se ponían las regiones y en las verticales las cate-
gorías (mortalidad, enfermedades, etc.). Los cruces al principio se llenaban con frases expli-
cativas, pero más adelante se cambiaron esas frases por números que permitían aprovechar
mejor el espacio y presentar la información más rápidamente. Eso es precisamente lo que
nos encontramos hoy en día en los informes estadísticos: tablas que resumen la información
que consideramos relevante.
Ya vemos, por tanto, que la estadística en realidad tiene que ver con datos y con cómo
se organizan para que sirvan luego para tomar decisiones. Sin embargo, cuando se piensa
en la estadística, seguro que vienen a la cabeza no solo series enormes de datos, sino que,
antes incluso de que se piense en el dato en sí, aparecen en la mente de cada cual palabras
ligadas a fórmulas y expresiones matemáticas de cálculos (de probabilidades, promedios,
varianzas, etc.). Ésta es la siguiente “fase” en el desarrollo de la estadística: cuando ya se hizo
“famosa”, los matemáticos la tomaron dentro de las fronteras de sus competencias y la esta-
dística adoptó la apariencia de la matemática.
1.2. Los orígenes de la moderna teoría de la estadística
Downie y Heath (1970) afirman que el origen de la estadística posiblemente se puede encon-
trar en el campo de batalla, cuando el jefe se para a contar de cuántas personas dispone y
calcula cuál debe de ser el número de efectivos del enemigo. Se trata, pues, de un origen
eminentemente práctico: era un instrumento usado para tener una idea aproximada de la
correlación de fuerzas.
Estadística etimológicamente significa “ciencia del Estado” y está inequívocamente rela-
cionada con el nacimiento del Estado Moderno durante finales del siglo XVII. Piovani (2005)
16
Capítulo 1: Orígenes y desarrollo de la estadística
documenta cómo uno de los antecedentes de lo que hoy llamamos “estadística” aparece en
una carta fechada el 17 de diciembre de 1672, escrita por William Petty, que utiliza el tér-
mino de political arithmetic. Tal como relata Porter (1986),
“el estudio sistemático de los números sociales en el espíritu de la filosofía natural se ori-
ginó durante el decenio de 1660, y se conoció por casi un siglo y medio como political
arithmetic. Su propósito [...] era la promoción de una política social sólida y bien infor-
mada” (Porter, 1986, p. 18).
Es bien sabido que el recuento de personas (habitantes de una región) es una práctica
mucho más antigua, que ya realizaban los reyes, jefes, nobles, etc. en sus respectivos terri-
torios, con fines fiscales de recaudación, de trabajo debido al noble o al señor feudal amo
de la tierra. El recuento de fuegos como unidad de medida está perfectamente documenta-
do en la Europa de la Edad Media. Y se sabe que en la Época Clásica del Imperio Romano
también Roma trataba de llevar un control sobre el territorio y sobre sus pobladores.
Sin embargo, lo que hoy conocemos como estadística, la “Estadística Moderna”, es un
conjunto de herramientas y técnicas que se basan en el cálculo de probabilidades (que es lo
que se denomina Estadística Matemática).
Históricamente la probabilidad aparece asociada al entorno de los juegos de azar. Pear-
son y Kendall (1970) afirman que durante el Renacimiento ya había un interés claro por
analizar las dinámicas que existen detrás de los juegos de azar, para averiguar cuáles son las
estrategias ganadoras. Peña (1986) cree que las primeras ideas en torno al cálculo de proba-
bilidades se las debemos a Luca Pacioli (1445-1514), Giordano Cardano (1501-1576) y a
Galileo Galilei (1564-1642), aunque fuera de una manera intuitiva. Simultáneamente, en
1526, Cardano y Tartaglia establecieron la equiprobabilidad de sucesos en la aparición de
caras de un dado, aplicando la simetría a sus razonamientos.
Piovani (2005) afirma que el origen de la probabilidad tratada como un cuerpo de cono-
cimiento teorizable se lo debemos a una disputa entre jugadores de dados. Antoine de Gom-
baud (también conocido como Caballero de Méré), un conocido jugador a los dados, envió
una carta a Pierre de Fermat, uno de los matemáticos con más reputación de la época. En
la carta le planteaba a Fermat la siguiente pregunta: en un juego con dos dados, ¿es venta-
joso apostar por la aparición de al menos un doble seis tirando los dados 24 veces? El Caba-
llero de Méré pensaba que era ventajoso apostar a la aparición de un doble seis basándose
en su experiencia. Sin embargo, si tenía que hacer caso de sus cálculos, el resultado era pre-
cisamente el contrario.
Fermat inició entonces un intercambio de cartas con otro de los grandes matemáticos
de la época, Blaise Pascal (1623-1662), con quien conjuntamente puso las bases para una
Teoría General de las Probabilidades. Entre ambos establecen los principios fundamentales
del cálculo de probabilidades.
Poco después, Christian Huygens (1629-1695), que estaba al corriente de la corres-
pondencia entre Fermat y Pascal, se interesó por esta disciplina y en 1657 publica el primer
tratado de probabilidad: De ratiociniis in ludo aleae.
17
En la misma época Graunt (1662) publica su Natural and political observations on the
bills of mortality, donde aparecen las tablas como herramienta para hacer recuentos de fenó-
menos sociales que afectan al conjunto de la población, base de lo que será luego la esta-
dística.
En el siglo XVII Pierre Remond de Montfort realiza algunas precisiones teóricas sobre el
cálculo de probabilidades en un libro publicado en 1708: Essay d’analyse sur le jeux du hazard.
Cinco años más tarde Jacok Bernouilli (1654-1705) publica Ars conjetandi, donde, además
de comentar el libro de Huygens, incluye el análisis combinatorio y lo que se conoce como
Teorema de Bernouilli o Ley de los grandes números.
La probabilidad en estos momentos ya es una disciplina científica que tiene reconoci-
miento y que es objeto de trabajo por los matemáticos. Abraham de Moivre (1667-1754)
escribe Doctrine of chance: or a method of calculating the probability (1718), Annuities upon
lives (1725) y Miscellanea analytica (1730). Bernouille se plantea, en 1738, en Specimen theo-
riae novae de mensura sortis uno de los problemas más famosos de su época: la conocida como
Paradoja de San Petersburgo. Según esta paradoja, si se tira una moneda y sale cara, gano
un céntimo. Si sale cara a la segunda tirada, gano el doble. Si sale la cara a la tercera tirada,
gano 4 céntimos (el doble del doble) y así sucesivamente. ¿Cuánto dinero estaría alguien
dispuesto a pagar para entrar en este juego? Como la suma de las tiradas favorables diverge
a infinito, eso quiere decir que no importa la suma que se pague para entrar en el juego,
porque a largo plazo siempre se ganará una cantidad mucho más grande de la que se pagó.
La esperanza matemática de ganar la tirada es infinita, si se juega un número infinito de
veces, debiendo ser equitativa la cantidad de dinero que deposita el jugador al número de
veces que se realice la jugada para que el juego sea equitativo. Pero, a pesar de ello, nadie
participaría en un juego como este, a no ser que se invierta una cantidad aceptable de dine-
ro. Esto obligó a Bernouilli a crear el concepto de “esperanza moral” para salvar las contra-
dicciones entre el cálculo de probabilidades y el sentido común.
Pierre Simon, Marqués de Laplace (1749-1827), también trabaja este problema en
Essai philosofique sur les probabilités. En este libro Laplace valora positivamente el trabajo
de Bernouilli, destacando tanto lo que ya se ha dicho como el uso de la fórmula del bino-
mio en el cálculo de la probabilidad y la definición del número de ensayos cuando tien-
de a infinito: “... y por la demostración del teorema que expresa que, multiplicando inde-
finidamente las observaciones y las experiencias, la relación de acontecimientos de diversa
naturaleza que han de ocurrir se aproxima a la de sus posibilidades respectivas dentro de
límites cuyo intervalo se va estrechando cada vez más, llegándose a hacer menor que cual-
quier cantidad asignable”.
Laplace también recogió el trabajo realizado por Thomas Bayes (1702-1761), bajo el
nombre de Teorema de Bayes. Hizo públicos sus trabajos en Transactions philosophiques (1763),
donde por primera vez se combina probabilidad total y compuesta.
Por otro lado, Laplace también es quien propone por primera vez aplicar la distribución
normal como modelo de variabilidad de los errores de medida. Peña (1986) afirma que
Laplace realizó el primer intento de proponer un modelo explicativo estadístico, al intentar
predecir los valores de una variable a partir de otras variables relacionadas con ella.
18
1.3. El azar y la astronomía: el cálculo del error
Durante los siglos XVII y XVIII la probabilidad se desarrolló como una herramienta que permi-
tía resolver un problema tradicional en la ciencia y, en concreto, en la astronomía: la inciden-
cia del error. El no disponer de métodos matemáticos efectivos que permitieran trabajar con
magnitudes que no se podían medir con una precisión aceptable suponía un problema a la hora
de buscar las leyes que explican la naturaleza. El descubrir métodos que permitían controlar esos
errores permitió un gran avance en el conocimiento del universo y, de paso, llamó la atención
de los matemáticos, que aportaron las bases del cálculo moderno de probabilidades.
La conexión entre astronomía y probabilidad ha sido destacada en diversas ocasiones
(Peña, 1986; Guardia, 1987; Sánchez, 1987). Según Stingler (1986), en el siglo XVIII exis-
tían tres problemas relacionados con la astronomía que estaban en el centro de las discu-
siones de la comunidad científica de la época:
– Representar y determinar matemáticamente el movimiento de la luna.

– Explicar las aparentemente no periódicas trayectorias de Júpiter y Saturno.
– Determinar la forma exacta de la Tierra.
El problema, en esencia, era encontrar algún método para determinar parámetros de

forma que minimizaran la discrepancia con las observaciones astronómicas disponibles.
Laplace ya había intuido que la aplicación de la Teoría de los errores en el cálculo de proba-
bilidades podía conducir a resolver este problema. De hecho, en aquella época ya se tenía
una idea bien definida del concepto de “error de medida”, debido a las limitaciones técni-
cas de los aparatos de medida del momento (Stingler, 1986). Sin embargo, la solución vino
del trabajo de Adrien Marie Legendre (1752-1833), que desarrolló el Método de mínimos
cuadrados. De esta manera, el problema de ajustar funciones a datos observados se reducía
a la minimización del término del error.
La astronomía se benefició mucho de este avance, pero no fue la única ciencia que lo
hizo. Destacan los trabajos de Auguste Bravais (1811-1863) y Benjamin Pierce. Pero el nom-
bre que despunta con fuerza entre todas las personas que trabajaron la probabilidad fue, sin
duda, Carl Friedrich Gauss (1777-1855), también llamado “el príncipe de las matemáticas”,
por la amplitud y profundidad de sus aportaciones a la ciencia matemática. Entre sus apor-
taciones de importancia, destaca la determinación de la distribución de los errores (la cono-
cida “Campana de Gauss”).
Carl Friedrich Gauss (1777-1855), más conocido como princeps mathemati-

corum, hizo innumerables aportaciones a la matemática. Entre ellas, elaboró más
detalladamente la ecuación de la distribución normal que había propuesto por pri-
mera vez Abraham de Moivre (1667-1754). Gauss determinó la distribución de
una variable a partir de dos parámetros: su media y su desviación estándar.
19
1.4. El desarrollo de la estadística moderna
A la vez que los matemáticos trabajaban en torno al cálculo de probabilidades, el uso de

tablas para hacer recuentos también se había ido desarrollando, sobre todo para cubrir las
necesidades de las administraciones y de los Estados modernos. Esto es lo que llevó a Achen-
wall (1719-1772) a acuñar el término “statistisch”, del latín “status” y el italiano “statista”.
Otras fuentes (Piovani, 2005) afirman que esta palabra fue empleada por primera vez por
un autor llamado Hooper, que tradujo la palabra alemana “statistik” por el neologismo “sta-
tistics”, que se definió como la ciencia que enseña el ordenamiento político de los Estados
modernos. Poco más de medio siglo después se funda la Royal Statistical Society en Londres,
en 1834, y la American Statistical Association, en 1839, lo cual representa una cierta oficia-
lidad del trabajo estadístico en el campo demográfico.
Uno de los primeros autores que se suelen citar desde el punto de vista de la estadística
es Adolphe Quetelet (1796-1874) y sus trabajos estadísticos y sociológicos. Quetelet traba-
jó en el Observatorio Real de Bruselas, donde ejercía de astrónomo y meteorólogo. Aplicó
el cálculo de probabilidades a las ciencias sociales y mostró que las distribuciones de fre-
cuencias no solo se pueden aplicar a los juegos de azar o a los fenómenos astronómicos, sino
que también se pueden utilizar con las poblaciones demográficas.
Quetelet hizo aportaciones tan importantes como la noción de “hombre promedio”,
concepto que introduce en Sur l’home et le development de ses facultés, ou essai de physique
sociale (1835). Quetelet usa este concepto como un “tipo ideal”. Para él no era más que una
simple ficción. Pero este término ha jugado un importante papel en política, permitiendo
la comparación de dos grupos claramente diferenciados de individuos, caracterizados por
sus respectivos “individuos tipo”.
El trabajo de Quetelet recorrió muchas facetas de la persona, incluyendo variables como
el peso y la altura de los individuos, además de desarrollar investigaciones sociológicas sobre
criminología. También realizó trabajos para ajustar las funciones de probabilidad en distri-
buciones empíricas, en concreto las distribuciones normal y binomial.
Durante el siglo XIX destaca Siméon Denis Poisson (1781-1840), de quien es conocida
su distribución de probabilidad. Poisson hizo diversas aportaciones al campo de la crimi-
nología, que publicó en Recherches sur la probabilité des jugements en matière criminelle et en
matière civile. En este libro Poisson también incluye la generalización de la Ley de los gran-
des números propuesta por Bernoulli.
Durante esta época otra rama cuyas necesidades analíticas contribuyeron al desarrollo
de la probabilidad (y a la inversa) fue la biología. Darwin (1809-1882) había propuesto su
Teoría de la evolución y muchos eran quienes trataban de contrastar esa teoría con las evi-
dencias recogidas hasta el momento. Para ello necesitaban encontrar herramientas mate-
máticas para encontrar regularidades consistentes que les permitieran confirmar la teoría de
Darwin y Wallace con un nivel de significación que fuera medible.
Galton (1822-1911) se interesó por las variables aleatorias, en el sentido de que, supuesto
un valor fijo de una variable, queda determinada la ley de probabilidad de otra variable aleato-
ria. Fue el primero que propuso el método de regresiones. También inventó un curioso arte-
20
facto para demostrar la distribución normal, que curiosamente coincide con el Triángulo de Pas-
cal, por lo que respecta a la serie de números que resulta en cada uno de los pisos del artefacto.
Galton introdujo otros conceptos estadísticos, como la idea de media condicionada o la
variabilidad de las medias condicionadas. Se le ha considerado como uno de los fundadores de
la Escuela Biométrica y ejerció una notable influencia sobre otros destacables estadísticos tales
como Karl Pearson (1857-1936) o Ronald A. Fisher (1890-1962). Uno de los méritos de su
trabajo fue el mostrar las diferencias individuales y la herencia. En su obra Hereditary genius
(1869) su centro de atención se dirige a trasladar los principios de la teoría de la evolución al
campo de la Psicología. En 1884 Galton abrió al público su Laboratorio Antropométrico en el
museo de South Kensington, donde se estudiaban las diferencias individuales a través de tests
psicométricos. Galton medía “desviaciones” con respecto al comportamiento “normal”.
Desde la sociología se busca en la estadística y la probabilidad herramientas metodoló-
gicas para tratar de entender los fenómenos sociales. Durkheim (1858-1917), en El suici-
dio, relata cómo el interés por temas poblacionales está en el origen de lo que más tarde se
ha dado en llamar sociología y de los métodos de trabajo que utiliza y, en concreto, de la
estadística (citando los trabajos de Quetelet). El concepto de población, como sociedad, sus-
ceptible de ser analizado y estudiado, aparece en este contexto. Lazarsfeld (1961) afirma que
la idea de que las cuestiones sociales pueden ser sometidas a estudio empírico aparece en
esta época. De hecho, ésta es la tesis principal de la obra de Durkheim.
Fue Francis Y. Edgeworht (1845-1926) quien comenzó a usar una notación más seme-
jante a la que utilizamos actualmente cuando empezó a estudiar las correlaciones. Pearson
destaca precisamente en el tema del cálculo de los coeficientes de correlación. Gran parte
de su trabajo se centró en el análisis de curvas gamma, que son asimétricas, así como índi-
ces para el estudio de la simetría / asimetría de las distribuciones. George U. Yule (1871-
1951) prosiguió en esta línea de trabajo, aunque acabó centrándose en la regresión lineal.
W.S. Gosset (1876-1937) hizo aportaciones de envergadura en el tema del trabajo con
datos muestrales. En concreto, a él debemos el desarrollo de la distribución t, que se cono-
ce también como Distribución t de student.
En el siglo XX unas de las contribuciones más importantes al desarrollo de la estadística
moderna fueron las aportaciones de Karl Pearson (1857-1936). Alumno de Galton, Pearson
desarrolló el estudio de las diferencias individuales. Formalizó el coeficiente de correlación múl-
tiple, sentando con ello las bases de la estadística multivariable. En su artículo On lines and planes
of closest fit to systems of points in space propone la teoría de Componentes principales.
Por lo que respecta a la probabilidad, también durante el siglo XX experimentó una trans-
formación profunda, especialmente debido a la aplicación de las aportaciones de la teoría de con-
juntos desarrollada por Cantor (1845-1918). Los trabajos de Andreï N. Kolmogorov (1903-
1988) supusieron una de las contribuciones más importantes. Kolmogorov desarrolló la axiomática
del Cálculo de probabilidades, estableciendo un concepto claro de probabilidad. Otros mate-
máticos que hicieron contribuciones al área incluyen: Tchebyshev, Markov, Lyapunov, entre otros.
Otro autor clave en la historia de la estadística y la probabilidad del siglo XX fue Roland
A. Fisher (1890-1962). A él le debemos la invención de distintas técnicas, tales como el aná-
lisis discriminante, y la resolución de diversos problemas planteados en la investigación agro-
21
nómica mediante técnicas estadísticas apropiadas. Su libro Statistical Methods for Research
Workers es la base teórica de la estadística actual. Entre otras, le debemos a Fisher el desarrollo
de la derivación de las distribuciones muestrales, la técnica del análisis de la variancia y los
diseños experimentales. Fisher mantuvo una discusión con Pearson y Von Neyman sobre
cómo verificar los modelos: mientras que aquellos defendían el uso de pruebas de hipóte-
sis, Fisher siempre mantuvo que se tenía que hacer a través de pruebas de significación.
Otro de los seguidores de Galton fue C.E. Spearman (1863-1945), quien se decantó por
la línea de trabajo propuesta por Galton. Son conocidas sus contribuciones sobre el estudio de
la inteligencia, empleando lo que se denominó Teoría y método factorial, basado en el estudio
de correlaciones. Su artículo General intelligence objectively determined and measured, publicado
en 1904, puede considerarse como el punto de arranque del análisis factorial. Sin embargo, esta
técnica, tal y como se aplica en la actualidad, tiene sus orígenes en el trabajo de L.L. Thursto-
ne (1887-1955) Multiple Factor Analysis, publicado en 1931. Thurstone observó que las tablas
correlacionales son, desde el punto de vista matemático, matrices, de manera que se pueden
aplicar las reglas del cálculo matricial para su análisis. Este método condujo al estudio de una
serie de factores en el campo de las aptitudes y la personalidad y supuso un acontecimiento his-
tórico para la metodología científica, porque representa el punto de partida del análisis multi-
variable, generalizado hoy en día a todos los campos de la ciencia.
1.5. La estadística actual
La estadística ha ido siguiendo su proceso lógico y “natural” de desarrollo. En las últimas

décadas hay que destacar que la informática se ha adoptado como herramienta de cálculo,
lo cual ha permitido un avance sin precedentes, al tener la posibilidad de realizar con pre-
cisión y rapidez cálculos que antes resultaban tediosos y fuente de múltiples errores.
Actualmente todo análisis de datos se realiza mediante paquetes estadísticos asistidos
informáticamente (por ejemplo: SAS, SPSS, Statgraphics...). Estos paquetes estadísticos
incorporan permanentemente innovaciones para el análisis de datos. La informática ha
supuesto que actualmente dispongamos de muchos más medios para cumplir sus objetivos,
centrados en el análisis y síntesis de hechos complejos y que generalmente conllevan el tra-
tamiento largo y complicado de gran cantidad de datos.
La informática ha revolucionado hasta tal punto el análisis de datos que inclu-

so es habitual que la recogida de datos se efectúe mediante aplicaciones de for-
mularios electrónicos de fácil creación y acceso a la información, simplificando
en gran medida la introducción de datos en los paquetes informáticos. Algunos
ejemplos son las aplicaciones disponibles de google formular accesibles en:
https://www.google.com. Para profundizar en cómo incorporar datos de hoja de
cálculo Excel a SPSS recomendamos consultar a Yepes (2006) accesible en
http://www.ub.edu/ice/recerca/pdf/ficha5-cast.pdf.
22
También tenemos que considerar la repercusión que ha tenido en el avance propiamente

estadístico la aparición de algoritmos computacionales para la resolución de complejas deri-
vaciones matemáticas como, por ejemplo, la técnica de estimación de verosimilitud máxi-
ma (Mulaik y Brett, 1982).
En la misma línea Hartley (1980) ya señaló que el impacto significativo de los ordena-
dores se produce en el área de la construcción de modelos matemáticos, al permitir las gene-
ralizaciones del modelo lineal a modelos no lineales. El ordenador, además, dice Hartley
(1980), implica una mejora sustancial de la velocidad y la exactitud en los cálculos. Así pues,
podemos afirmar que ha sido gracias a la informática que hemos podido desarrollar las téc-
nicas de análisis multivariable que permiten tratar adecuadamente muchos fenómenos plan-
teados en las ciencias humanas, tanto desde el punto de vista descriptivo como desde la esta-
dística inferencial.
La posibilidad de realizar cálculos muy complejos en pocos segundos ha hecho cambiar
los métodos de análisis y ha ampliado los tipos de planteamientos teóricos susceptibles de
ser contrastados a partir de observaciones empíricas. El cambio se expresa en la transición
desde hipótesis que proponen relaciones entre variables tomadas dos a dos (hipótesis frac-
cionarias para la mayor parte de los fenómenos) hasta planteamientos del análisis multiva-
riable que permiten descubrir estructuras, establecer relaciones o contrastar hipótesis mucho
más globales que, por lo mismo, permiten reflejar los mecanismos que intervienen en un
fenómeno y determinar dicho fenómeno de una forma mucho más adecuada o, al menos,
mucho más en consonancia con la realidad que se pretende representar.
Antes del desarrollo de la informática se investigaba generalmente con modelos unie-
cuacionales, debido a las limitaciones en las técnicas del cálculo. Esos modelos no pueden
ser considerados como suficientemente potentes para “explicar” las relaciones entre varia-
bles, ya que no distinguen los posibles efectos indirectos que pueden existir entre las varia-
bles ni dar cuenta de las posibles relaciones espurias entre ellas. Duncan (1966) propone la
técnica del Path analysis ideada por Wright (1921) en la biología, aplicada al ámbito de las
ciencias sociales. Los path diagrams son representaciones gráficas de la estructura que, según
las hipótesis, une las diferentes variables y que equivale al sistema de ecuaciones que repre-
senta matemáticamente el modelo. El Path analysis pide que tanto las variables exógenas
como las endógenas sean directamente observables y medibles. En cada una de las flechas
que señalan los diferentes paths podemos situar las “betas” que son coeficientes que se cal-
culan mediante la recta de regresión y nos dicen cuál es la parte de la relación que explica
cada una de las variables independientes.
A pesar de todos los avances, lo cierto es que hay una serie de variables que es muy difí-
cil observar, como todo aquello que tiene que ver con la motivación o la personalidad en
general. Golberger y Duncan (1973) en Structural equation models in the social sciences reco-
pilan las aportaciones de un seminario de expertos en diferentes áreas de conocimiento y
con esta recopilación dieron origen a modelos de ecuaciones estructurales también llama-
dos modelos causales, en los que las variables también pueden ser latentes.
Siguiendo esta línea de trabajo, autores como Jöreskog y Sorbom (2006), Hu, Bentler
y Kano (1992) o Bagozzi (1979) han desarrollado programas de ordenador para la estima-
23
ción de parámetros asociados a estos modelos, generalmente utilizando técnicas de verosi-

militud máxima, como LISREL.
Por otro lado, la informática también ha abierto la puerta de la simulación, campo en
el que destacan los trabajos de autores tales como Mantel, Tukey, Ciminera y Heyse (1982)
con su Jackknife o B. Efron (1979) con su Bootstrap.
El campo del análisis longitudinal se ha visto beneficiado de los avances tanto en infor-
mática como en estadística. Los modelos estadísticos de series temporales desarrollados por
Box y Jenkins (1976) son un ejemplo de ello. Este tipo de técnicas tiene una gran aplica-
ción en ciencias humanas en general y en educación en especial. El primero que planteó el
uso de datos secuenciales fue W. Lexis (1837-1914). A pesar de que las técnicas estadísticas
clásicas suelen partir del supuesto de independencia entre las observaciones, sí que es cier-
to que en el campo educativo (igual que en otros ámbitos, como la medicina, por ejemplo),
cuando se pretende estimar el efecto de un tratamiento determinado, los datos se suelen
registrar secuencialmente con referencia a un mismo individuo o colectivo. Cuando traba-
jamos con este tipo de datos, encontramos el problema del efecto que tiene la dependencia
serial. Sin embargo, por contra, los modelos de series temporales tienen en cuenta en su aná-
lisis dicha dependencia lineal, sin que ésta invalide las inferencias de los datos obtenidos
secuencialmente.
También hay que destacar otra línea de trabajo, cada vez más fructífera, que es el aná-
lisis exploratorio de datos (EDA) y que supone una nueva alternativa para las técnicas clá-
sicas.
Finalmente, en los últimos tiempos hay que destacar la proliferación de técnicas y herra-
mientas para la llamada minería de datos (Pérez y Santín, 2007), definida como complejos
procedimientos para el descubrimiento de nuevas y significativas relaciones, patrones y ten-
dencias al examinar grandes cantidades de datos. Efectivamente, estos procedimientos pue-
den descubrir patrones, perfiles y tendencias a través del análisis de datos utilizando tecno-
logías de reconocimiento de patrones, redes neuronales, lógica difusa, algoritmos genéticos
y otras técnicas avanzadas de análisis de datos, gracias a las aplicaciones informáticas.
En la actualidad la estadística se ha establecido como una estrategia de análisis en la tota-
lidad de las disciplinas científicas, además de ampliarse en gran medida el número de inves-
tigadores que recurren a ella. No cabe duda de que el avance de la informática, la difusión
de la misma y la cada vez más creciente facilidad de acceso a los paquetes estadísticos son
factores que han ayudado al desarrollo de muchas disciplinas científicas y a que la investi-
gación se convierta en una actividad más asequible a cada vez mayor número de personas.
Para la reflexión…
• ¿Qué sentido tiene la estadística aplicada a la educación?

• ¿Cómo ha afectado el desarrollo de la informática al análisis cuantitativo de datos en
educación?
24
2
La estadística: la ciencia de los datos
La estadística si algo tiene es que es la “ciencia de los datos”. En realidad, tiene que ver con
datos y con cómo se organizan, se sintetizan en unos índices y se analizan de modo que
podamos tomar decisiones y sacar conclusiones.
2.1. Algunos conceptos básicos
Ya hemos dicho que la estadística tiene como objeto el estudio cuantitativo de los colecti-
vos. Pero antes de continuar y presentar las primeras herramientas de trabajo que nos ofre-
ce la estadística, vamos a repasar algunos conceptos básicos.
En general, la estadística suele diferenciarse en dos grandes bloques:
1. la estadística descriptiva
2. la estadística inferencial
La estadística descriptiva es aquella que hace descripciones de conjuntos de datos, de

una muestra o de la población, mediante valores estadísticos, obteniendo información sobre
la frecuencia, la tendencia central, la posición y la variabilidad de los datos recogidos.
En cambio, la estadística inferencial permite hacer inferencias a partir de los datos reco-
gidos de la muestra y generalizar los resultados a la población de origen o poblaciones simi-
lares. A partir del análisis de la muestra se infieren propiedades de la población.
2.1.1. Las escalas de medida
La teoría de la medida, en general y de cada ámbito de aplicación en particular, no es un

problema que la estadística tenga que dilucidar ni resolver. Al contrario, es propio de otras
25
disciplinas como la metrología o la psicometría. No obstante, conviene recordar algunos

conceptos al respecto.
Aunque no sea por unanimidad, se reconoce y se acepta la clasificación de Stevens (1946)
sobre la existencia de cuatro escalas de medida: nominal, ordinal, de intervalo y de razón o
proporción. Para entender mejor qué quieren decir cada una de las cuatro escalas, vamos a
proponer un ejemplo que permita usarlas todas, para que se vean claramente las diferencias.
El ejemplo será la medida de la temperatura de un conjunto de 30 elementos.
La escala nominal es aquella que utiliza categorías de tipo cualitativo. Algunos ejem-
plos de variables medidas con esta escala serían: religión, partido político, sexo, color del
pelo, color favorito, etc. A cada una de estas categorías se le asignan atributos diferentes (por
ejemplo, nombres, colores, aspectos, etc.) sin afirmar que uno sea superior a otro, solo dife-
rentes. Decir que rojo es diferente de azul no significa que uno sea mayor o menor que el
otro, simplemente que son diferentes. Esta escala de medida permite clasificar los objetos o
individuos según sean iguales o no respecto de una característica. Por ejemplo, podemos
tener a todas las personas que son católicas, a las que son judías, a las que son musulmanas,
a los hinduistas, etc. Es el nivel más simple de medida y permite la clasificación de los indi-
viduos u objetos en categorías meramente cualitativas.
– Tienen que estar claramente definidas, sin equívocos ni interpretaciones diferentes.

– Tienen que ser mutuamente excluyentes, para evitar que alguien pueda estar clasifi-
cado en más de una categoría.
– La clasificación tiene que ser completa: todos los sujetos tienen que poder ser clasifi-
cados en alguna categoría.
Cuando no podemos establecer a priori una clasificación completa, porque desconoce-

mos todas las categorías que puede llegar a contener, entonces la podemos completar con la
categoría de otros o varios, siempre y cuando dicha categoría no suponga un porcentaje gran-
de de la distribución.
Es el único caso en el que el ejemplo de la temperatura no nos sirve. Podríamos medir uti-
lizando tres categorías: caliente, templado y frío, pero como veremos estaríamos construyen-
do, más que una escala nominal, una escala ordinal. La propia naturaleza cuantitativa de la
temperatura nos impide crear categorías que no tengan una relación de orden entre ellas. En
este caso, deberíamos buscar otras propiedades del objeto, como por ejemplo el color.
También puede ocurrir que utilicemos números (1, 2, 3, etc.) para designar las catego-
rías. En ese caso, los números no indican valores cuantitativos, sino que son signos o códi-
gos de identificación.
La escala ordinal es aquella que indica el mayor o menor grado en cuanto a la clasificación
de los individuos según un criterio creciente o decreciente de la característica que se quiere medir.
Ejemplos de variables que pueden medirse con esta escala pueden ser: nivel educativo, nivel eco-
nómico, orden de llegada a la escuela, clase social, orden de llegada en una carrera, etc. En nues-
tro ejemplo, como ya indicábamos, podemos dividir las temperaturas entre caliente, templado
y frío, o entre más divisiones si queremos más precisión en nuestra percepción del frío y del
26
Capítulo 2: La estadística: la ciencia de los datos
calor. Proporciona más información que la escala nominal, puesto que expresa la situación de
cada elemento dentro del conjunto; sin embargo, eso no implica que exista la misma diferen-
cia de temperatura entre dos elementos consecutivos, es decir, entre el primero y el segundo no
tiene por qué haber la misma diferencia que entre el séptimo y el octavo.
La escala de intervalo se caracteriza por la existencia de una unidad de medida cons-
tante que permite asignar un valor que nos sirve para interpretar la diferencia entre dos medi-
das. Este nivel no solo clasifica y ordena, sino que, además, especifica las distancias existen-
tes entre los diferentes valores. En esta escala tanto el cero como la unidad de medida son
arbitrarios, de manera que el valor cero no implica la ausencia de la característica medida.
Por otro lado, la diferencia entre los valores es constante, pero no es proporcional. Por ejem-
plo, la temperatura 0 ºC no es ausencia de temperatura, ni 20 ºC significa el doble de calor
que 10 ºC. Otros ejemplos pueden ser el rendimiento académico (0 no es ausencia de cono-
cimiento, ni quien obtiene un 8 quiere decir que sabe el doble que quien obtiene un 4).
Siguiendo con nuestro ejemplo sobre las temperaturas, la escala cegesimal constituye una
escala de intervalo e indica la cantidad de grados centígrados (70, 67, 65, 64, ..., 35, etc.) de
cada uno de los elementos. El cero no es absoluto, sino convencional (en el caso de la escala
cegesimal corresponde a la temperatura de fusión del agua). Eso quiere decir que podemos afir-
mar que entre 70 y 67 ºC existe la misma diferencia de temperatura que entre 38 y 35 ºC, pero
no que un elemento que tiene 70 ºC esté el doble de caliente que el que tiene 35 ºC.
La escala de razón es similar a la de intervalo, pero además se le puede asignar el valor
cero absoluto que representa la ausencia total de la característica que se mide. Por otro lado,
también supone la existencia de proporcionalidad entre los valores. En ciencias sociales es
muy difícil encontrar casos a los que se les pueda aplicar este tipo de escala de medida. Lo
más habitual es que sea en el ámbito de la física donde podamos aplicar más este tipo de
escala de medida. Ejemplos pueden ser la masa (0 kg es ausencia de masa y 20 kg es el doble
de masa que 10 kg), la edad, la longitud, etc.
En el ejemplo que venimos utilizando sobre la temperatura, la escala de razón se aplica
al caso de la escala Kelvin, donde el cero es absoluto y equivale a –273 grados en la escala
centígrada.
Distinguir y especificar claramente qué tipo de escala de medida estamos usando es vital,
porque las diferentes herramientas que nos proporciona la estadística dejan de tener senti-
do en uno u otro caso. Por ejemplo, la media aritmética no se puede utilizar cuando traba-
jamos con una escala ordinal. Sin embargo, si se la pedimos al programa de cálculo estadís-
tico (el SPSS por ejemplo), dicho programa hace los cálculos pertinentes y nos da como
resultado un número. Pero este número no tiene sentido.
Por eso, antes de comenzar a trabajar con el SPSS (o con cualquier otro programa esta-
dístico), es importante distinguir las escalas de medida de nuestras variables. En SPSS eso
se puede hacer cuando se define la matriz. Al introducir la variable nueva, aparece una colum-
na donde tenemos que especificar si nuestra variable es: nominal, ordinal o de escala.
La escala nominal también recibe el nombre de cualitativa y, utilizando esta nomencla-
tura, la ordinal equivaldría a cuasicuantitativa y la de intervalo y la de razón se denominan
cuantitativas.
27
Figura 2.1. ¿Qué tipo de escala utilizar?
Por lo tanto, hay que escoger la que nos proporciona más información (la que menos la
nominal y la que más la de razón), siempre que la podamos emplear (si la variable es cuali-
tativa no podemos utilizar una escala cuantitativa).
También hay que tener en cuenta que la información obtenida con una escala cualita-
tiva no la podemos convertir en ordinal, ni mucho menos en cuantitativa; tampoco la ordi-
nal en cuantitativa. En cambio siempre podemos pasar de unos datos cuantitativos a ordi-
nales o cualitativos y de ordinales a cualitativos.
Supongamos que la variable que estudiamos se pueda medir utilizando diversos tipos
de escala. Si la medimos con una escala nominal o cualitativa y necesitamos datos cuantita-
tivos para el análisis, como no podemos pasar de los datos cualitativos a cuantitativos, nos
veríamos obligados a volver a medir.
Figura 2.2. Opciones de escala de medida en SPSS.
En la columna “medida” del programa tenemos tres opciones: escala (que incluye inter-
valo y razón), ordinal y nominal. Por razones prácticas podemos asignar siempre la medida
28
escala (es más sencillo rápido y seguro poner 1, 2, 3 en vez de, por ejemplo, español, magre-
bí, alemán…). Pero, ojo, porque el ordenador las trata como si fuesen cuantitativas y, si le
pedimos que nos calcule la media del sexo (que hemos introducido, por ejemplo, como 0
(mujer) y 1 (hombre), nos dará la media entre los ceros y los unos. En este caso el fallo no
sería del ordenador sino nuestro.
2.1.2. Las variables
En estadística trabajamos con variables. Este concepto se refiere a las propiedades, fenó-
menos o características que varían, adoptando diferentes categorías, órdenes o valores
numéricos. En esencia, es cualquier cosa que se pueda medir directamente en un indivi-
duo, como el peso, la altura, el lugar de nacimiento, el nivel de estudios o la clase de pelí-
culas que le gustan.
Existen diferentes tipos de variables. Desde el punto de vista estadístico podemos dis-
tinguir según sean cuantitativas o cualitativas. Dentro de cada una de estas categorías aún
podemos diferenciar otros subtipos importantes:
– Las variables cualitativas (también llamadas atributos) son las que están medidas
con categorías de tipo cualitativo (escala nominal). Son resultado de la observación
de una cualidad y su naturaleza no es cuantificable (sexo, estado civil, etc.). Las varia-
ciones de la variable reciben el nombre de categorías. Según el número de categorí-
as se dividen en dicotómicas o no dicotómicas.
– Las variables cualitativas dicotómicas o dicotómicas puras son las que tienen dos
categorías ya sean naturales (femenino/masculino) o como resultado de una fronte-
ra arbitraria (autóctono/extranjero).
– Las variables cualitativas dicotomizadas son variables cuantitativas (por ejemplo el
nivel de un alumno en una materia) que artificialmente las hemos reducido a dos
categorías (apto/no apto).
– Las variables cualitativas no dicotómicas (o politómicas) son las que tienen más de
dos categorías (bien/regular/malo). Ejemplos de este tipo de variables serían las cate-
gorías profesionales, los estudios universitarios, etc.
– Las variables cuantitativas son el resultado de una medida de intervalo o de razón
(estatura, edad, tiempo de respuesta, etc.). Las diferentes variaciones de la variable
se llaman valores de la variable. Este tipo de variables las podemos distinguir según
sean discontinuas o continuas.
– Las variables cuantitativas discontinuas (también llamadas discretas), son variables que
solo pueden tomar un número concreto de valores entre los que están a su alcance. Por
su propia naturaleza, suelen tomar valores enteros, aunque no es necesariamente así.
Por ejemplo, si vendemos paquetes de medio kilo de arroz, la variable “kilos de arroz
vendidos”, tomará valores discretos: 0; 0,5; 1; 1,5, etc. Estos valores no son enteros,
pero hay que elegir entre uno de ellos, no pudiendo elegir, por ejemplo, el 0,75. Enton-
29
ces, la variable es discreta. Ejemplos de este tipo de variables podrían ser: número de
hijos, libros editados, número de coches en el núcleo familiar, etc.
– Las variables continuas son aquellas que pueden tomar cualquier valor dentro de un
intervalo de variación. Hablamos por tanto de un contínuum que se representa con
números reales y que, por tanto, puede tomar valores enteros, fracciones e incluso
números irracionales como el número pi. Ejemplos paradigmáticos de este tipo de
variables pueden ser el peso, la altura, el tiempo, etc. Por ejemplo, la talla humana
no puede tener un valor cualquiera (por ejemplo cuatro metros), pero, dentro de las
tallas posibles, sí podría adoptar cualquier valor. Entre 168 y 169 centímetros la talla
humana puede tener infinitos valores. Otra cosa es que podamos (o nos interese)
medir estos posibles valores.
Conviene tener en cuenta dos conceptos, valor medido (Xi) y valor exacto (Xe).
Si medimos la talla de una persona y nos da 172 cm ese es el valor medido, pero no
podemos asegurar que mida exactamente 172, sino que puede ser un número infi-
nito de valores comprendido entre 171,5 y 172,5. Por lo tanto, el valor exacto
(Xe ∈ Xi ± 0,5s) es un valor que está en el intervalo comprendido entre el valor medi-
do ± 0,5 de la sensibilidad (la cantidad más pequeña que nos discrimina el instru-
mento de medida). Eso quiere decir que cuando trabajamos con variables continuas
siempre estamos utilizando intervalos.
2.1.3. Individuo, población y muestra
En estadística a menudo utilizamos las palabras “individuo”, “población” o “muestra”. Estas

palabras tienen un significado muy preciso. Las personas, objetos, fenómenos a los que nos
referimos, son los “individuos”.
Un individuo es un elemento bien definido que tiene asociado un juicio, un orden o
una cantidad (según la escala) que presenta la característica que queremos estudiar. Indivi-
duos pueden ser personas, objetos, colectivos, etc. Podemos estar hablando de estudiantes
de un colegio, de escuelas, de países, de planetas, etc. Como se puede apreciar, el concepto
de “individuo” no se refiere al tamaño del colectivo, sino que considera todo el grupo como
una “unidad” de estudio. En estadística individuo no tiene ninguna connotación despecti-
va, como tampoco sujeto, otro término equivalente.
El conjunto de individuos conforman lo que denominamos universo, que es el con-
junto de individuos que presentan la característica que nos interesa estudiar. Por ejemplo,
podemos estar interesados en estudiar el éxito académico en matemáticas en la enseñanza
secundaria obligatoria. En ese caso, nuestro universo pueden ser todos los centros de ense-
ñanza secundaria o bien todos los estudiantes de secundaria. Como se ve, el universo se defi-
ne conforme a la unidad que adoptamos como individuo. Si nuestros individuos son los
estudiantes, entonces nuestro universo es el conjunto del número total de estudiantes. Aho-
ra bien, una cosa es el universo de estudio (alumnado de secundaria) y otra cosa es la pobla-
ción sobre la que queremos hacer nuestro estudio.
30
Por población entendemos el conjunto de individuos sobre los que queremos hacer
nuestro estudio. Por ejemplo, podemos querer estudiar los resultados de matemáticas de los
estudiantes de la ESO de Euskadi. En este caso, es necesario definir y acotar lo más exacta-
mente posible cuál es la población que queremos que sea objeto de nuestro estudio (estu-
diantes de secundaria de Euskadi, por ejemplo).
A menudo, trabajar con toda la población es imposible por varios motivos: o porque es
imposible llegar a todos los individuos que conforman la población o porque intentar hacer-
lo resulta excesivamente caro y no tenemos presupuesto suficiente para hacerlo, o porque
resulta excesivamente lento. Por eso lo más habitual es utilizar una muestra. La muestra es
un subconjunto de individuos de la población extraídos y seleccionados por algún método
de muestreo. Es donde realmente hacemos el estudio y obtenemos los datos para el análisis.
Trabajamos con la muestra para poder extrapolar los resultados a la población, siempre y
cuando la muestra sea representativa. Ésta es una condición sine qua non. Si la muestra no
es representativa (y para serlo tiene que cumplir unas condiciones que se tratarán más ade-
lante), entonces los resultados de nuestro estudio no se pueden extrapolar a la población.
En el caso de un análisis de sangre podemos extrapolar los resultados de una pequeña mues-
tra a toda la sangre, la cual no podemos extraer en su totalidad, porque esta pequeña mues-
tra es representativa del conjunto.
2.1.4. Parámetro y estadístico
Cuando hacemos algún estudio, los individuos que participan en el mismo están distribui-
dos de alguna manera concreta. Las herramientas estadísticas nos permiten describir la dis-
tribución desde el punto de vista de las medidas de tendencia central, las de dispersión o las
de posición. Ahora bien, podemos estar hablando de la distribución de una característica en
el conjunto de la población o bien en el conjunto de la muestra que hemos seleccionado
para hacer nuestro estudio. Según estemos refiriéndonos al total de la población o a la mues-
tra, utilizaremos parámetros o estadísticos.
Un parámetro es un valor que corresponde a la población. Normalmente los más impor-
tantes (media, desviación típica, varianza) se simbolizan con letras griegas (m, s, s2).
En cambio, un estadístico se refiere a un valor calculado para la muestra. En general se
simboliza con letras latinas (x–, S, S2, etc.).
2.2. Competencias para interpretar científica y críticamente las estadísticas
Una interpretación crítica y científica de las estadísticas sobre educación existentes en el

ámbito nacional e internacional nos proporciona una información muy valiosa para poder
ser contrastada con las aportaciones de los principales autores en ciencias de la educación y
sociales que nos permitan poder afirmar o refutar opiniones que se encuentran comúnmente
difundidas en nuestra sociedad.
31
Hoy en día, acceder a las principales estadísticas sobre educación es una cuestión senci-
lla, pero no así la interpretación de los datos que contienen y mucho menos su vinculación
con las aportaciones de la comunidad científica internacional.
Los datos que podemos encontrar en PISA, PIRLS o TIMSS vienen a ratificar lo que
previamente los principales autores en educación ya habían afirmado hace dos décadas,
como, por ejemplo, que las diferentes formas de segregación conducen al fracaso escolar. A
pesar de ello se sigue agrupando por niveles al alumnado y se fomentan las aulas de acogi-
da y las aulas externas.
Saber acceder a las fuentes de información estadísticas e interpretarlas ligando esta infor-
mación a lo que la comunidad científica internacional afirma nos posibilita replantear nues-
tra práctica educativa diaria. Al igual que la segregación conduce al fracaso, también se
demuestra en el ámbito internacional que la participación de los familiares dentro de las
dinámicas escolares incide positivamente en el rendimiento escolar de sus hijos.
En este capítulo vamos a profundizar en las competencias necesarias para interpretar de
manera crítica el creciente volumen de información estadístico existente sobre educación
para, de esta forma, poder abordar nuestra tarea educativa con mayor éxito. Nos centrare-
mos especialmente en estadísticas internacionales, ligándolas con ejemplos prácticos relati-
vos a las problemáticas educativas con las que nos encontramos los profesionales de la edu-
cación diariamente.
2.3. ¿Por qué necesitamos leer las estadísticas?
La estadística es una herramienta que utilizamos las personas que nos dedicamos a la inves-
tigación social o educativa para hacer nuestra labor. La teoría nos indica que el buen que-
hacer científico exige seguir un método de trabajo para evitar la elaboración de informes
basados en corazonadas, intuiciones, creencias, intereses o prejuicios. Así se ha llegado con
frecuencia a hacer afirmaciones contrarias a la verdad. Por ejemplo, se ha afirmado insis-
tentemente que la titulación universitaria era una vía hacia el paro, cuando es justo todo lo
contrario. El trabajo de investigación riguroso exige planificar, establecer claramente los obje-
tivos, diseñar las herramientas o instrumentos que se van a utilizar para recoger los datos,
verificarlos haciendo pruebas piloto para corregir las imperfecciones, realizar el trabajo de
campo, transcribir o recoger todos los datos, depurar los instrumentos de análisis, analizar
toda la información y ver si los resultados nos sirven para aceptar o refutar el modelo de
hipótesis que nos habíamos marcado al inicio de la investigación. Si lo refutamos, se vuel-
ve a comenzar, depurando el modelo y estableciendo nuevas hipótesis. Si no, se aceptan las
hipótesis. En ambos casos se produce un avance en el conocimiento.
La estadística, como decimos, es una de las herramientas (entre otras) que podemos utili-
zar para trabajar. La teoría de probabilidades, por ejemplo, nos puede ayudar a la hora de esta-
blecer cuáles son las relaciones más probables que podemos encontrar. También es una herra-
mienta de inestimable utilidad cuando trabajamos con muestras de una población, de la que
desconocemos todos o algunos de los datos. La probabilidad nos permite trabajar con ciertos
32
márgenes de confianza y controlar el error que podemos cometer. Las técnicas de muestreo
constituyen otra de las herramientas que nos ofrece la estadística para ayudarnos en nuestro
trabajo. Conocer cómo se construye una muestra, qué procedimientos existen para asegurar
que es representativa, controlar la incertidumbre de no saber si sus características centrales
corresponden o no con las de la población y garantizar la aleatoriedad en su selección son todos
ellos aspectos cruciales para la validez de las conclusiones a las que lleguemos al final de nues-
tro trabajo. A veces, una mala planificación, o una selección sesgada de la muestra, tiran a la
basura horas y horas de trabajo. Luego se tiene que volver a comenzar.
Por otro lado, la estadística también nos depara la teoría de la estimación, que utiliza-
mos para estimar los parámetros que nos van a resultar luego útiles para analizar los datos
recogidos. Saber si nuestros datos están o no dentro del intervalo de confianza nos da segu-
ridad para sostener luego las conclusiones que resulten del análisis, que es otra de las partes
del método de trabajo científico. En una palabra, todo el diseño, con la ayuda de la esta-
dística como herramienta de trabajo, nos sirve para sortear el sesgo, nuestro principal “ene-
migo” a la hora de hacer investigación. Todo aquello que pueda condicionar nuestra inves-
tigación puede “nublar” nuestra vista y suponer una barrera a nuestro criterio de decisión.
Conocer los entresijos de la estadística, junto con una actitud ética, es crucial para nuestro
trabajo. Chomsky (1967) afirma que la obligación de todo intelectual y toda persona decen-
te es buscar y decir la verdad. Existe un esquema muy conocido y ampliamente repetido en
diversos libros de estadística, que resume perfectamente todo lo que hemos dicho hasta el
momento. Tomamos uno de esos esquemas, de ejemplo, en figura 2.3.
Frecuentemente, en tertulias de café, se comenta que los resultados académicos depen-
den de la inversión en educación. Recurriendo a las estadísticas existentes podemos ver qué
parte de verdad existe en esa afirmación y qué parte no lo es, huyendo de fundamentalis-
mos y basándonos así en el proceder científico.
Afirmaciones como ésta pueden llegar a extenderse y llevarnos a pensar, de manera colec-
tiva, que a más inversión en educación mejores resultados académicos. Si tales afirmaciones
no las validamos o refutamos con los datos existentes, por ejemplo, a través de los informes
PISA, no podremos asegurarnos de lo que realmente sucede.
Analizando los datos que aporta PISA vemos que existe una relación entre gasto en edu-
cación y resultados obtenidos, pero no sucede de esta forma en todos los casos. Eslovaquia,
Polonia, República Checa y Corea son países que invierten menos que España y obtienen
mejores resultados, por encima de la media de la OCDE. Otros países como Italia o Esta-
dos Unidos invierten mucho más dinero que España y obtienen, respectivamente, peores o
iguales resultados. Por tanto, esa relación directamente proporcional entre invertir mucho
en educación para obtener mejores resultados no se da en todos los casos, quedando paten-
te que no se trata solo de recursos económicos.
Bourdieu es uno de los principales autores que ha realizado una explotación secundaria
de datos para fortalecer sus argumentaciones teóricas. Entre otras obras, en La distinción
(Bourdieu, 1979) utiliza datos estadísticos para argumentar que el “capital cultural” here-
dado de la familia genera el rendimiento escolar del alumnado.
33
Figura 2.3. Etapas de construcción de un modelo estadístico.

(Fuente: Peña, 1986, p. 29).
A través de estadísticas internacionales como PISA, TIMSS o PIRLS podemos consta-

tar que a mayor nivel de estudios de padres y madres (especialmente de las madres) mayor
rendimiento escolar de sus hijos. Una lectura crítica de los datos nos permitiría también
argumentar que el nivel de estudios de padres y madres tiene una gran influencia sobre el
futuro rendimiento de sus hijos, pero no es determinante; debemos tener en cuenta otra
serie de variables básicas que inciden en el rendimiento escolar.
Una de esas variables, por ejemplo, es la formación de familiares, ya que puede llegar a
reducir los efectos de la relación entre bagaje académico de las familias y los resultados aca-
34
démicos de los niños. Encontramos varios estudios que han incidido en esta cuestión (Bar-
nett, Young y Schweinhart, 1998; Bennett, Weigel y Martin, 2002; Brooks-Gunn, Berlin,
y Fuligni, 2000; Burchinal, Peisner-Feinberg, Pianta y Howes, 2002).
Algunos estudios muestran cómo los programas de formación que incluyen a las fami-
lias como uno de sus componentes contribuyen al éxito académico de los niños a corto y
largo plazo (Boethel, 2004; Campbell, Helms, Sparling y Ramey, 1998; Christian, Morri-
son y Bryant, 1998; Jordan, Snow y Porche, 2000; CREA, 2006-2011).
Habitualmente se culpabiliza a las familias de inmigrantes y minorías culturales del bajo
rendimiento del alumnado, es decir, que una mayor presencia de niños inmigrantes o per-
tenecientes a minorías en el aula genera peores resultados en los demás. Algunos estudios
han criticado esta visión y han aportado evidencias de que las actividades de participación
de familiares son más importantes para ayudar al alumnado a alcanzar el éxito escolar que
la estructura familiar, el estatus socioeconómico, la raza, el tamaño de la unidad familiar y
la edad de los niños (Hidalgo, Epstein y Siu, 2002; Becker y Epstein, 1982; Comer, 1980;
Epstein, 1986; INCLUD-ED Consortium, 2009).
Tal y como puntualiza Epstein y Dauber (1991) si las escuelas desarrollan programas
efectivos para los familiares, las familias valoran más participar y se implican más; y esto tie-
ne un impacto en el aprendizaje de los y las estudiantes.
En algunos casos podemos encontrar argumentaciones sobre diversas temáticas que no
se encuentran reforzadas por datos de las grandes estadísticas internacionales, puesto que
son muy caros de obtener y todavía no se les ha dado su debida importancia. El caso de la
incidencia de la formación de familiares sobre el resultado académico es un claro ejemplo.
Esas estadísticas demuestran la correlación entre el nivel de estudios de los padres y madres
con el de sus hijos, pero no así cómo un padre o una madre pueden ir formándose y parti-
cipando en la escuela donde asiste su hijo o hija y haciendo que mejore su rendimiento esco-
lar. En el siguiente apartado incidiremos en qué estadísticas tenemos disponibles y hasta qué
punto tenemos los datos estadísticos que necesitamos para nuestro quehacer diario.
2.4. ¿Qué estadísticas tenemos disponibles?
Disponemos de una enorme cantidad de información estadística tanto en el ámbito inter-

nacional como nacional y regional. En este libro nos vamos a centrar solo en las fuentes que
se consideran comúnmente como científicas o rigurosas desde el punto de vista de las cien-
cias sociales y de la educación. De hecho, la fiabilidad de las fuentes es uno de los elemen-
tos más importantes a tener en cuenta, antes de manejar datos en nuestros estudios e inves-
tigaciones. Lo que discutimos a continuación son las condiciones y las precauciones que
como investigadores debemos adoptar para evitar un mal uso de toda esa información (un
uso que sea tendencioso, sesgado, ya sea por activa o por pasiva).
Los recursos existentes en Internet nos permiten acceder a datos estadísticos que refuer-
zan nuestra labor diaria. Existen numerosas fuentes de datos secundarios. En el nivel inter-
nacional vamos a destacar tres organismos: OCDE, Eurostat y Unesco Statistics. En el nivel
35
nacional destacamos el INE, los servidores estadísticos de cada comunidad autónoma y las
secciones de estadística disponibles en los ayuntamientos de las capitales de provincia.
Dentro de la OCDE queremos destacar los Informes PISA 2009, Education at a Glan-
ce 2011 y las respectivas bases de datos de donde podemos extraer más información. De
Eurostat nos centramos en su base de datos, de donde podemos extraer datos relativos a edu-
cación. De Unesco Statistics nos interesa el Global Monitoring Report on Education for All
2011.
Todas estas fuentes de datos formalmente se llaman “datos secundarios”. Se trata de
fuentes de datos que no hemos elaborado nosotros directamente (a través de una encuesta,
por ejemplo). Son datos que ya existen, que agencias especializadas se encargan de elaborar
y que nos ofrecen un cúmulo de información que podemos utilizar para extraer conclusio-
nes sobre los fenómenos educativos que estemos estudiando.
Por ejemplo, en ciencias sociales y de la educación existen varios temas que son de nues-
tro interés, como el análisis de los elementos que llevan al fracaso escolar para tratar de
emprender actuaciones que lleven a la superación de ese fracaso, el rendimiento escolar de
los estudiantes, los motivos que explican el abandono escolar, la segregación que a veces se
produce, entre otros muchos temas. La estadística nos permite disponer de herramientas
metodológicas que ayudan a describir y entender, en la medida de lo posible, el porqué de
todos esos fenómenos (y otros similares).
Los resultados académicos que obtiene el alumnado en el ámbito europeo, por ejemplo,
podemos analizarlos utilizando tres indicadores: el fracaso escolar, el abandono escolar y el
éxito educativo. En la base de datos de PISA encontramos datos relativos a cada uno de estos
indicadores. El fracaso escolar podemos medirlo utilizando dos indicadores básicos: student
performance en matemáticas, ciencias y lectura (prestando atención a los datos educativos nega-
tivos) y abandono escolar prematuro. El éxito educativo lo mediríamos a través de dos indi-
cadores, student performance en matemáticas, ciencias y lectura (prestando atención a los datos
educativos positivos) y youth education attainment level. Los primeros indicadores los extrae-
mos de la base de datos de PISA o del informe PISA ya elaborado. El último indicador lo
encontramos en el Labour Force Survey de Eurostat.
Existe otra serie de indicadores que podrían ser de nuestro interés y que encontramos,
por ejemplo, en el Education at a Glance indicators, como, por ejemplo, la inversión en edu-
cación, labour force returns, acceso a la educación y participación (todos estos indicadores están
disponibles en Internet).
Por otro lado, el tema de las evaluaciones ha sido tradicionalmente uno de los aspectos
cuantitativos de más interés para las personas que trabajamos en ciencias sociales o de la
educación, como indicadores que nos permiten (a veces, no siempre) acercarnos a un cono-
cimiento de lo que está ocurriendo en términos de rendimiento escolar, etc. Ha habido
muchas evaluaciones, y sigue habiéndolas, sobre el rendimiento académico de los estudian-
tes. Algunas son de ámbito nacional y permiten rendir cuentas sobre las reformas realizadas
en estos países o servir como evaluación de cada escuela. Hay, sin embargo, otro tipo de eva-
luaciones: las evaluaciones internacionales. En ellas se evalúan las competencias y se rela-
36
cionan con ciertas características de los niños y las niñas, las escuelas y los sistemas educati-
vos, permitiendo la comparación de dichas características respecto al éxito escolar.
Desde los años 60, cuando la International Association for the Evaluation of Educational
Achievement (IEA) empezó a hacer sus primeros estudios, se han desarrollado varias evalua-
ciones internacionales, como el Consorcio de África Meridional para la Supervisión de la Cali-
dad de la Educación (SACMEQ) o el Laboratorio Latinoamericano de Evaluación de la Calidad
de la Educación (LLECE).
Sin embargo, las evaluaciones con más repercusión, y en las que centraremos nuestra aten-
ción, han sido la evaluación Programa para la Evaluación Internacional de Alumnos (PISA), de
la Organización para la Cooperación y el Desarrollo Económico (OCDE), y las dos evaluaciones
más importantes de la International Association for the Evaluation of Educational Achieve-
ment (IEA): el Progress in International Reading Literacy Study (PIRLS) y el Trends in Interna-
tional Mathematics and Science Study (TIMSS). Estos estudios evalúan los conocimientos de
los niños en lectura (PISA y PIRLS) y en ciencias y matemáticas (PISA y TIMSS). Así, en estos
estudios no se pretende evaluar ni la educación en valores ni los conocimientos en historia o
literatura, todas ellas áreas de gran interés, sino los conocimientos de aquellas áreas que se con-
sidera marcarán en gran medida la posterior marcha académica de los estudiantes.
Tanto las evaluaciones realizadas por la IEA (TIMSS y PIRLS) como las evaluaciones PISA
realizadas por la OCDE pretenden obtener datos que puedan ser comparables internacional-
mente. Existen, sin embargo, diferencias significativas entre las evaluaciones. La que puede sal-
tar más a la vista es la diferencia en los resultados obtenidos. Por ejemplo, Hungría, en la eva-
luación de matemáticas de octavo grado del TIMSS 2003, se contaba entre los mejores países,
significativamente por encima de la media internacional y muy por encima de países como
Noruega. Sin embargo, en la evaluación PISA en matemáticas del mismo año su puntuación
estaba significativamente por debajo de la media y, aunque su puntuación fuera inferior inclu-
so a la de Noruega, no había diferencias significativas entre las dos puntuaciones. O, por ejem-
plo, en la evaluación de PIRLS 2001, Suecia se situaba como el país con mejores resultados,
mientras que un año antes, en la evaluación de PISA 2000 en lectura, había sacado unos resul-
tados que estaban entre el noveno y el undécimo en el ránking de 32 países.
Uno de los factores causantes de estas diferencias es que las evaluaciones se dirigen a
poblaciones distintas. Estos detalles son importantes a la hora de usar fuentes secundarias
(y primarias también). Un número sobre un papel puede convertirse rápidamente en papel
mojado si no somos cuidadosos y ubicamos claramente el límite de los datos, de dónde han
salido, a qué población se refieren, qué tipo de muestreo se realizó, etc. Estos son aspectos
que vamos a ir destacando a lo largo del libro. En el caso de nuestro ejemplo, PISA se diri-
ge a los estudiantes de 15 años, sea cual sea el curso en el que estos estén. Las evaluaciones
PIRLS y TIMSS, en cambio, se dirigen a estudiantes de cursos concretos, siendo también
las edades medias distintas de las de los niños evaluados por PISA. Ese es uno de los moti-
vos que explican la discrepancia entre los resultados de estas evaluaciones.
Además, PISA está orientada a la evaluación de conocimientos como se usan en con-
textos reales, mientras que PIRLS y TIMSS se orientan a contenidos más académicos, aque-
llos que los estudiantes han aprendido directamente en el aula. Este es otro detalle a tener
37
en cuenta: la naturaleza de las cuestiones o preguntas que se realizan. Dos estudios son com-
parables cuando preguntamos sobre las mismas cosas. Si se habla de temas de naturaleza
diferente, entonces la comparabilidad de los estudios deja de ser posible.
Así, mientras PIRLS y TIMSS evalúan el contenido curricular que los niños han apren-
dido con preguntas como las que se pueden encontrar en los exámenes tradicionales, PISA
se centra en qué pueden hacer con los conocimientos que han adquirido, usando situacio-
nes de la vida real. Finalmente, la periodicidad de las evaluaciones es también distinta. Mien-
tras que en PISA las evaluaciones se realizan cada tres años, los estudios de TIMSS se hacen
cada 4 años y los de PIRLS cada 5. Las cohortes (los grupos de edad a los que se refieren o
que integran la muestra en el caso de PISA, y los grupos que están haciendo un determina-
do curso en PIRLS y TIMSS) son diferentes. Y eso también resta validez a cualquier inten-
to de comparación usando estas fuentes diferentes.
La evaluación PISA se dirige, en principio, a los países miembros de la OCDE. Sin
embargo, hay también países asociados que participan en la evaluación. Así, de los 43 paí-
ses que participaron en PISA 2000, se ha pasado a los 57 que lo hicieron en PISA 2006 y a
los 65 que lo han hecho en PISA 2009. La participación en PISA cubre bastantes regiones
del mundo, pero deja con poca representación a Asia y con una representación casi nula al
continente africano.
La evaluación PIRLS contaba, en su primera edición de 2001, con 35 países evaluados,
otra vez con una representación mucho mayor de países europeos y del continente nortea-
mericano y con una escasa representación del resto de continentes.
En cuanto a la evaluación TIMSS, en 1995 evaluó a 41 países y TIMSS 1999 a 38. En
su edición de 2003 participaron 49 países y cuatro que lo hicieron como “benchmarking
participants”, para comparar su rendimiento con los estándares internacionales. En la eva-
luación de octavo grado participaron 46 países y 4 regiones, mientras que la evaluación de
cuarto grado contó con 25 países y 3 regiones. En la edición de 2007, 58 fueron los países
participantes y cuatro lo hicieron como “benchmarking participants”. Participaron 48 paí-
ses en la evaluación de cuarto grado y 36 en la de cuarto grado. En la edición de 2011, se
han evaluado 63 países y 14 “benchmarking participants”. La distribución de países en
TIMSS es más diversa que en las otras evaluaciones e incluye algunos países, por ejemplo,
del continente africano.
Por todo lo expuesto, resulta difícil comparar los resultados de las distintas evaluacio-
nes entre sí y se debe ser muy cauto a la hora de interpretar datos comparativos entre ellas.
2.5. Estadística: una ciencia para el tratamiento de los datos que tenemos que usar
sabiamente
La estadística fue un gran invento. Ha servido para tener descripciones más o menos deta-
lladas de diversas variables relativas a la población. También se utiliza mucho en ciencias y
matemáticas para tratar de dominar la incertidumbre, lo desconocido, el caos, o buscar regu-
laridades que expliquen fenómenos físicos de nuestro entorno.
38
Sin embargo, por lo menos en nuestro caso (las ciencias sociales y de la educación), la
estadística, mal usada, puede ser muy engañosa. Huff (1993) escribió un libro lleno de ejem-
plos de malos usos de la estadística. Los engaños pueden residir en la elección de una mues-
tra sesgada, que falsea los resultados, o la selección de una medida de tendencia central inade-
cuada para aquello que se quiere defender (y no de las demás, ni tampoco de las medidas
de dispersión, porque seguro que van a “destapar” el engaño) o el uso de gráficos que jue-
gan con las proporciones y las escalas.
La estadística bien usada es una herramienta estupenda que nos permite conocer lo que
está ocurriendo en nuestras escuelas, en nuestros barrios, en las familias, en todos aquellos
aspectos y elementos de la sociedad que estén relacionados o intervengan en el éxito de la
práctica pedagógica. Pero para ello nos debemos mantener alerta, conocer qué podemos
hacer, cuáles son las limitaciones de la estadística y el tipo de conocimiento e información
que nos ofrece. El conocimiento es la clave en nuestra sociedad de la información. Saber es
lo que permite a la clase política tomar decisiones que lleven a la superación de las situa-
ciones de exclusión. Para ello necesitamos leer estadísticas, usarlas, crearlas y aprender a ver-
las como una herramienta más de nuestro trabajo. Igual que el fontanero sabe que no pue-
de desmontar un sifón con un destornillador y buscará la llave de grifo o quizás una llave
inglesa suficientemente grande, nosotros debemos conocer las potencialidades de nuestras
herramientas y saberlas usar con sabiduría y conocimiento de la experiencia.
• ¿Cuáles son las características diferenciadoras básicas entre la estadística descriptiva y

la estadística inferencial?
• ¿Qué escalas de medida distingue Stevens y en qué se diferencian cada una de ellas?
• ¿Qué utilidad tiene la estadística en el ámbito de la educación?
• Crea un instrumento de medida con distintos tipos de variables. Puedes diseñarlo
para ser aplicado por vía telemática.
39
3
¿Qué es esa cosa llamada
“estadística descriptiva”?
No se sabe a ciencia cierta dónde está el origen de la estadística. Como hemos visto en el
primer capítulo, la estadística, como tal, se acuña durante la aparición de los Estados moder-
nos. Sin embargo, mucho antes ya se encuentran recuentos de población (aunque no exis-
tiera ninguna “ciencia” ni disciplina alguna del saber que se encargara de su estudio). Duran-
te muchos años la unidad censal eran los “fuegos”, en referencia al hogar de lumbre en torno
al que se agrupaba un núcleo familiar. Los “fuegos” era la unidad con la que la administra-
ción conocía el número de personas que vivían en una población.
Parece ser que los datos más antiguos de que se dispone son los censos chinos que se reali-
zaron bajo el reinado de la dinastía del emperador Tao, aproximadamente hacia el año 2200 a.C.
En el antiguo Egipto existen documentos (papiros y otros vestigios) que describen la
labor de los escribas, en muchas ocasiones responsables de realizar los recuentos de la pobla-
ción, con fines administrativos (fiscales) y como mano de obra para construir las grandes
obras arquitectónicas egipcias.
También en la Roma clásica se tienen restos que indican que existieron registros censa-
les. Hacia el año 555 a.C. se realizaron censos en Roma para conocer la población existen-
te en aquel entonces. En todos los casos los recuentos de población siempre vienen relacio-
nados con la existencia de un aparato administrativo potente, capaz de recoger tal cantidad
de datos, organizarlos y gestionarlos.
Hasta que Galton (1822-1911) y Pearson (1857-1936) no realizaron la sistematización
de la estadística de su época y aplicaron los conceptos de probabilidades para crear lo que
se conoce como “estadística inferencial”, explorando diversas submuestras de la población
y haciendo predicciones a partir de ellas sobre una hipotética población total, todos los
desarrollos de esta disciplina se encontraban en lo que se acostumbra llamar como “estadís-
tica descriptiva”.
Ya vimos en el capítulo anterior cómo la estadística, desde este punto de vista, se defi-
ne como una ciencia que trata datos. La estadística descriptiva trata tan solo de describir
41
(ordenar en tablas, estadísticos descriptivos de tendencia central, dispersión, etc.) conjun-

tos de datos sin plantearse si estos datos se han obtenido en la población o en una o varias
muestras. La estadística inferencial o muestral trata de la inferencia estadística (a partir de
los datos obtenidos en una o varias muestras generalizar a la población o poblaciones).
Cuando vemos un conjunto de valores sobre un aspecto determinado, por ejemplo, las
notas que han sacado los estudiantes de un país, podemos tener la información presentada
de varias maneras. La información primaria son los datos individuales que corresponden a
todas y cada una de las personas (individuos) que participaron en el recuento de datos. En
este caso, imagínese una matriz de datos donde aparezcan las notas de todos y cada uno de
los estudiantes del país. Sería imposible de leer. Por ese motivo, aparte del dato primario,
en estadística descriptiva se manejan otra serie de conceptos, que siempre son resúmenes de
datos (utilizando diferentes procedimientos).
Veremos que existen tablas que sirven para ordenar (y sintetizar) la distribución; esta-
dísticos de tendencia central (como la media, la moda, la mediana); estadísticos que miden
la dispersión (varianza y desviación típica, entre otros); y representaciones gráficas que nos
permiten de un golpe de vista visualizar e interpretar los datos que están recogidos en la
matriz.
Un estadístico es un valor numérico que resume los datos de una muestra.

Son estadísticos la media aritmética, la mediana, la moda, la varianza, la des-
viación típica, el rango intercuartílico, etc.
En cualquier libro de estadística se pueden encontrar aproximaciones más o menos deta-

lladas de todos estos conceptos. Aquí nos vamos a centrar en su interpretación y uso, des-
tacando sobre todo aquellos aspectos que son clave para no cometer errores y desarrollar de
esa manera un espíritu crítico ante la lectura del dato.
Como ya se irá viendo más en profundidad a lo largo de este libro, las personas que nos
dedicamos a las ciencias de la educación no siempre tenemos la suerte de trabajar con datos
primarios. Al contrario, la mayor parte del tiempo lo que hacemos es utilizar fuentes secun-
darias y las reelaboramos de acuerdo a los propósitos que nos marcamos en nuestras inves-
tigaciones. Esta práctica es muy habitual y educadores y sociólogos tan conocidos como
Bourdieu, por ejemplo, han hecho de ella la base de sus aportaciones teóricas.
Usar fuentes secundarias tampoco está exento de dificultades, por lo que respecta a cómo
organizar la información. Las tablas, de nuevo, se convierten en el primer recurso para pre-
sentar la información. Igual que en el caso de las fuentes primarias, las estadísticas existen-
tes también se pueden sistematizar utilizando tablas. Ahora bien, las fuentes secundarias pre-
sentan un buen número de dificultades que es preciso tener en cuenta. Por ejemplo, hay que
conocer perfectamente cómo han sido construidas para saber hasta qué punto pueden ser
usadas, o no, y qué precauciones se deben tomar. Si bien cada una de las estadísticas inter-
42
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
nacionales tiene sus propias características (y dichas estadísticas deben interpretarse confor-
me a ellas), hay ciertos puntos y ciertas bases que todas ellas comparten. En este apartado
se exponen y se explican aquellos conceptos que resultan imprescindibles para una correc-
ta interpretación de los datos de cualquier base estadística existente. Para ello se ejemplifi-
ca la discusión con los datos que proceden de las fuentes estadísticas sobre educación que
se han seleccionado para este libro.
3.1. La matriz de datos
Las personas que nos dedicamos a las ciencias de la educación y a las ciencias sociales nos
solemos encontrar ante (por lo menos) dos situaciones posibles: o bien disponemos de una
fuente de datos (estadísticas internacionales, estatales, etc., que ya recogen las respuestas de
la gente sobre un tema determinado y, por lo tanto, constituyen lo que se llama “fuentes de
datos secundarios”); o bien tenemos que construir nuestra propia fuente de datos (que en
este caso se llamarían “datos primarios”), utilizando encuestas, cuestionarios y otras técni-
cas de recogida, que más adelante comentaremos.
En ambos casos, previo al análisis propiamente dicho, es necesaria la organización de
los datos en una estructura en forma de tabla que contenga los valores de cada caso (o suje-
to) en las distintas variables del estudio (Vilà y Bisquerra, 2004). Esta estructura se deno-
mina matriz de datos. Para este capítulo utilizaremos una matriz sencilla, ya hecha, que nos
sirva para los ejemplos con los que concretar la teoría. Cada fila representa un sujeto y cada
columna una variable. En este caso tenemos 25 sujetos y 3 variables: sexo (variable cualita-
tiva dicotómica), número de hijos (variable cuantitativa discontinua o discreta) y resultados
de un examen de Estadística (variable cuantitativa continua).
Cuadro 3.1. Matriz de datos
Caso Sexo N.° de hijos Examen

1 0 1 5
2 0 2 4
3 1 1 7
4 0 3 5
5 1 2 4
6 0 1 6
7 0 1 5
8 1 2 6
9 0 1 3
[.../...]
43
Cuadro 3.1. (continuación)

10 0 3 5
11 0 1 5
12 1 2 2
13 1 2 5
14 0 3 4
15 1 1 6
16 0 2 8
17 0 2 5
18 1 4 4
19 0 3 7
20 0 2 3
21 1 2 5
22 1 1 7
23 0 2 3
24 1 4 6
25 0 1 8
Actualmente disponemos de programas informáticos que nos permiten organizar los

datos con prontitud y eficacia. EXCEL, SPSS, SAS, entre otros, son potentes hojas de cál-
culo y paquetes estadísticos que permiten dar respuestas rápidas y fiables. Los problemas
aquí son varios: cómo utilizarlos para encontrar las soluciones, cómo escribir los datos, para
que se entiendan y se sepa dónde buscarlos o cómo construir una presentación de los resul-
tados (informes) que sea clara y no complique más las cosas a la hora de entender la infor-
mación que se está dando. En este capítulo explicaremos los pasos a realizar para el trata-
miento de la información, primeramente de manera teórica y al final del mismo de manera
práctica, utilizando para ello el paquete estadístico SPSS. Para una introducción más exten-
sa de los primeros pasos con SPSS sugerimos revisar el anexo 2 de este manual. Tanto en el
anexo, como en los siguientes capítulos haremos referencia a los procesos con la versión 18
del programa (PASW statistics 18).
Si la matriz ha sido fruto de elaboración propia, es posible que se cometan errores, por
ejemplo en el proceso de introducción mecánica de los datos. Ante la variable rendimiento
académico en una determinada competencia que un sujeto ha puntuado 6,2 podemos equi-
vocarnos al introducir 62 o 260 o infinidad de posibles errores que podrían alterar en gran
medida todo el análisis posterior.
También es posible que los datos se recuperen mediante un formulario electrónico con
escasos mecanismos de seguridad y la matriz contenga duplicados, errores, etc. En ambas
situaciones es necesario un proceso de depuración de la matriz de datos, que consiste en cal-
cular algunos descriptivos para todas las variables, pudiendo identificar si alguna de las res-
puestas obtenidas se encuentra fuera del rango de posibles puntuaciones, para cada una de
44
las variables. Para ello, con SPSS ejecutamos el comando ANALIZAR/ESTADÍSTICOS

DESCRIPTIVOS/FRECUENCIAS. En la figura 3.1 se representa el cuadro de diálogo
donde seleccionamos todas las variables para visualizar las opciones de respuesta y posibles
valores perdidos.
Los valores perdidos pueden ser de dos tipos: perdidos por el sistema hacien-
do referencia a valores sin respuesta que se identifican en la matriz con una coma
o un punto; y los perdidos por el usuario que hacen referencia a aquellos valo-
res que se incluyen en los intervalos que el usuario define en la variable como
valores perdidos.
Figura 3.1. Depuración de la matriz de datos.
3.2. Primer paso: ¿cómo organizar los datos? Tabulación y representación gráfica
Una vez tenemos la matriz de datos depurada y nos proponemos iniciar su explotación, apa-
recen los primeros interrogantes: ¿Es adecuado tal como tenemos los datos en la matriz?
¿Nos faltan datos? ¿Sería conveniente modificar alguna de las variables existentes de forma
más operativa para nuestros intereses?… Por ejemplo, podríamos tener la variable lugar de
nacimiento e infinidad de ciudades de origen de todo el mundo; es posible que nos intere-
se crear una nueva variable que nos identifique el país de origen de los participantes. Otra
posibilidad es que tengamos las puntuaciones de un test, ítem a ítem, y necesitemos la pun-
tuación total en el instrumento de medida.
45
En estas y otras circunstancias es muy posible que necesitemos crear nuevas variables a
partir de otras variables existentes, mediante procesos de recodificación o cálculo que nos
puede efectuar el mismo paquete estadístico informatizado. Concretamente, se distingue
entre procesos de cálculo y recodificación de variables.
Un cálculo habitual es obtener la puntuación total en un instrumento de medida, don-
de se tienen puntuaciones de ítem a ítem. De esta forma, hacemos el cálculo de la nueva
variable con el sumatorio de dichos ítems. Para ello, ejecutamos la opción TRANSFOR-
MAR/CALCULAR VARIABLE y obtenemos el cuadro de diálogo representado en la siguien-
te figura:
Figura 3.2. Crear una nueva variable.
Un ejemplo de recodificación de variable es agrupar la variable ciudad natal en provin-

cias o países, según los intereses del estudio. Para ello, ejecutamos el comando TRANS-
FORMAR/RECODIFICAR y obtenemos el siguiente cuadro de diálogo (figura 3.3) don-
de expresar los VALORES ANTIGUOS Y NUEVOS, correspondientes a los códigos
numéricos de las diferentes ciudades y los nuevos códigos para las provincias o países.
46
Figura 3.3. Recodificar una variable.
Cuando tenemos preparada la matriz de datos, la dificultad ante la que nos encontramos
es cómo organizar los datos de una manera que sea eficiente y que nos permita luego realizar
operaciones con más o menos facilidad y agilidad. Piénsese, por ejemplo, en un estudio sobre
los efectos de un programa educativo en el conjunto total de la población estudiantil de varios
millones de sujetos. ¿Cómo organizar esta cantidad tan ingente de información?
La manera más corriente es proceder a la tabulación, que consiste en disponer ordena-
damente los datos en forma de tablas apropiadas. Esto es lo que se suele hacer con las deno-
minadas tablas de frecuencias. En la primera columna figura la variable (con su nombre o,
en su defecto, con una x), con sus respectivas categorías (si la variable es cualitativa) o valo-
res (si es cuantitativa). En las restantes figuran las frecuencias.
El concepto estadístico de frecuencia es el mismo que el que tenemos en la vida nor-
mal: número de veces que se produce o número de casos que tenemos en una categoría o
un valor de la variable. Decir el número de veces que vas al cine en un determinado perío-
do de tiempo equivale a decir con qué frecuencia vas al cine.
Entre las frecuencias podemos distinguir la frecuencia absoluta o simplemente fre-
cuencia, que expresa el número de casos. Es una información básica, pero no sirve para com-
parar dos distribuciones, a menos que sean del mismo tamaño. Por ejemplo: supongamos
que en dos grupos diferentes, A y B, tenemos 10 suspensos en cada uno. Si los dos grupos
tienen el mismo tamaño (por ejemplo 40 alumnos), el resultado es el mismo. Pero, si el gru-
po A tiene 20 alumnos y el B 40, el número mismo de (o frecuencia absoluta de) suspen-
sos, 10, en el grupo A es la mitad y en el grupo B solo la cuarta parte.
Por eso en las tablas también figuran las frecuencias relativas que siempre son compa-
rables. Éstas son las proporciones (el número de casos expresado en tanto por uno) y los
47
porcentajes (el número de casos en tanto por ciento). Las proporciones, al oscilar entre 0 y
1, son cifras pequeñas y con decimales, por lo que su manejo resulta engorroso. En cambio,
los porcentajes o tantos por ciento son mucho más intuitivos y de uso incluso en la vida
cotidiana. En las rebajas, por ejemplo, el 50% siempre es la mitad y el 25% la cuarta parte
del precio original. El ordenador da las tablas por defecto, es decir, que las refleja en los “out-
puts”, a no ser que desactivemos la pestaña correspondiente.
Un ejemplo de tabla de frecuencia que se obtiene con SPSS es el siguiente. Para obte-
nerla, se ejecuta el comando ANALIZAR/ESTADÍSTICOS DECRIPTIVOS/FRE-
CUENCIAS.
Cuadro 3.2. Ejemplo de tabla de frecuencia obtenida con SPSS
Edad
Frecuencia Porcentaje Porcentaje Porcentaje

válido acumulado
Válido 15 125 25 25 25
16 175 35 35 60
17 100 20 20 80
18 100 20 20 100
Total 500 100 100
Además de estas tablas existen otras más elaboradas en las que se puede cruzar más de
un variable, obteniendo una mayor profundización en el análisis. Entre este tipo de tablas
destacan las tablas de contingencia donde se representan las frecuencias (observadas o por-
centuales) en tablas donde se pueden cruzar dos o más variables.
Las tablas personalizadas son de gran utilidad para resumir la media aritmética de una
determinada variable, en función de otra categórica. Por ejemplo, las medias en un instru-
mento de medida, según el sexo de los participantes. Para ello, ejecutamos el comando ANA-
LIZAR/TABLAS PERSONALIZADAS y obtenemos el cuadro de diálogo que muestra la
figura 3.4.
Las gráficas no son más que transcripciones visuales de la información contenida en las
tablas. Lejos de ser “información para tontos”, como dicen algunos, la verdad es que per-
miten una idea de los datos con una sencilla ojeada y que son, en muchas ocasiones, una
pista visual que nos permite perfilar hipótesis que luego contrastaremos o refutaremos con
estadísticos.
48
Figura 3.4. Crear tablas personalizadas con SPSS.
3.2.1. Variables cualitativas
En el caso de la matriz de datos del ejemplo del capítulo anterior, una variable cualitativa
sería la de sexo. Como hemos dicho antes, en la primera columna figura la variable y deba-
jo las categorías, mujer y hombre (en el orden que queramos porque las categorías no impli-
can más o menos cantidad ni orden) y en las siguientes las frecuencias absolutas y relativas.
En cuanto a los gráficos tenemos dos opciones: barras y sectores. Por ejemplo, en SPSS pue-
den pedirse en las siguientes opciones: Analizar/ Estadísticos descriptivos / frecuencias (selec-
cionar variable sexo) / Gráficos: barras o sectores. O en la opción Gráficos del menú prin-
cipal. Podemos elegir una de las dos, por separado, pero no a la vez (ver cuadro 3.3).
3.2.2. Variables cuantitativas
A) Variables cuantitativas discontinuas o discretas
Como sabemos, son aquellas que, siendo cuantitativas, no pueden tomar cualquier valor
sino solo unos valores determinados, normalmente enteros. Por ejemplo, el número de hijos.
En una familia puede haber uno, dos, tres, cuatro, más o ninguno, pero no 1,74 hijos.
49
Cuadro 3.3. Tabla y gráfico de frecuencias para variables cualitativas
Sexo

válido acumulado
Válidos mujer 15 60,0 60,0 60,0
hombre 10 40,0 40,0 100,0
Total 25 100,0 100,0
50
Cuadro 3.4. Tabla y gráfico de frecuencias para variables

cuantitativas discontinuas
N.° de hijos

válido acumulado
Válidos 1 9 36,0 36,0 36,0
2 10 40,0 40,0 76,0
3 4 16,0 16,0 92,0
4 2 8,0 8,0 100,0
Total 25 100,0 100,0
Teóricamente, este gráfico consistiría en una línea más o menos alta según la frecuen-
cia. Pero, si las barras tuviesen solo una dimensión apenas se verían. ¿Qué utilidad tendría
un gráfico que no se ve, o que cueste verlo a simple vista? Por esta razón las barras no son
líneas, sino que tienen anchura. Pero eso no significa que para el valor 2, por ejemplo, de la
variable ésta pueda valer algo más o algo menos de 2.
51
B) Variables cuantitativas continuas
Ya vimos que son las que pueden tomar cualquier valor (dentro de un intervalo de varia-
ción). En nuestro ejemplo sería el resultado obtenido por los 25 sujetos en un examen de
estadística. En la tabla figuran valores enteros entre 2 y 8. Pero, a diferencia de la variable
anterior (n.º de hijos) la variable puede tomar cualquier valor. Por ejemplo, entre 6 y 7 podría
tener infinitos valores, aunque la tengamos expresada en números enteros que, como vere-
mos, representan intervalos.
Cuadro 3.5. Tabla de frecuencias para variables cuantitativas

continuas
Examen
Frecuencia Porcentaje Porcenta- Porcentaje

je válido acumulado
Válidos 2 1 4,0 4,0 4,0
3 3 12,0 12,0 16,0
4 4 16,0 16,0 32,0
5 8 32,0 32,0 64,0
6 4 16,0 16,0 80,0
7 3 12,0 12,0 92,0
8 2 8,0 8,0 100,0
Total 25 100,0 100,0
Los valores que figuran en la tabla son valores centrales de intervalos. La puntuación 4
no tiene por qué ser exactamente 4, sino que puede oscilar entre un mínimo de 3,5 hasta
un máximo de 4,5 (si no llega a 3,5 le asignamos un valor de 3 y si pasa de 4,5, le asigna-
mos un 5). En este caso los intervalos tienen una amplitud de un punto, pero podemos tra-
bajar con intervalos de más amplitud.
52
3.3. Estadísticos descriptivos
3.3.1. Medidas de posición no central
Los indicadores de posición no central nos muestran el lugar que ocupa un valor de la varia-
ble en la distribución. Dividen la distribución en diversas partes iguales (por ejemplo en 100
partes) e indican qué valores marcan el paso de una parte a la otra y, por lo tanto, determi-
nan en cuál de estas particiones se encuentra un dato determinado.
Según el número de partes en que dividimos una distribución ordenada, podemos encon-
trarnos con los siguientes indicadores:
Percentiles o centiles (P): se divide en 100 partes iguales y determinan la situación del
individuo dentro del grupo en %. Indican los valores que dejan por debajo de él un cierto
porcentaje de individuos.
Nos ayudan a responder a cuestiones como las siguientes:
¿Qué nota es la que supera el 50% del alumnado?

¿Si queremos estar entre el 10% de los mejores estudiantes, qué nota debemos sacar?
Se debe tener cuidado al interpretarlos (muchas personas lo harán mal). Hay que tener en
cuenta que los centiles o percentiles son una escala ordinal y no tienen la misma interpreta-
ción a lo largo de toda la escala. Las diferencias absolutas en la variable (capacidad, talla, peso...)
suelen ser más pequeñas en el centro de la distribución que en los extremos. Como en el cen-
tro de la distribución hay más parte proporcional de la población, un intervalo de centiles de
5 nos da para recorrer mucha menos distancia de intervalo que en los extremos, en los que los
valores están mucho más dispersos. Así entre los percentiles 50 y 55 hay una diferencia en la
variable, pongamos, la tercera parte que entre los percentiles 90 y 95.
Si en una clase de 100 estudiantes mides 5 cm menos que el más alto es posible que seas
el segundo, que no haya nadie en medio. Si mides 5 cm menos que el 50 es posible que seas
el 80, que haya 30 en medio, porque en el centro se agrupan las alturas de muchos más indi-
viduos.
Los deciles (D) expresan el mismo concepto (situación relativa) pero en este caso, en vez
de dividir la distribución en 100 partes iguales, la hemos dividido en 10 partes.
Los cuartiles (Q). Si dividiésemos la distribución en cuatro partes iguales, cada una de
estas cuatro partes (que equivale a 25% cada una) en estadística se llama cuarto (como cada
uno de los trozos de una manzana cortada en cuatro partes). Los cuartiles son los valores
que delimitan estas cuatro partes iguales.
El cuartil 1 (Q1) deja por debajo el 25% (por lo tanto equivale al percentil 25), el cuar-
til 2 (Q2) deja el 50% (lo que es lo mismo, al percentil 50, al cual también llamamos media-
na) y el cuartil 3 (Q3) deja el 75% por debajo (percentil 75).
Los cuartiles son muy utilizados en los ránkings de las revistas científicas internaciona-
les. Por ejemplo, es muy importante en un currículum vítae académico haber publicado en
53
una revista del cuartil 3 (Q3) de un ránking competitivo como Journal Citation Reports (JCR),
pero es más importante hacerlo en otra revista de Q1 en ese mismo ránking.
El programa SPSS calcula cualquier percentil que le pidamos y también los cuartiles,
pero en el “output” no los especifica. Sin embargo, sí da los percentiles 25 (Q1), 50 (Q2 o
mediana) y 75 (Q3).
En la figura 3.5 podemos ver una distribución normal, o campana de Gauss, con la
mayoría de los valores concentrados en la zona media. En ella están marcados los cuartiles,
y podemos ver como las áreas comprendidas entre dos cuartiles son las mismas. Esto signi-
fica que el porcentaje de individuos desde el inicio de la distribución hasta el primer cuar-
til es del 25%, y lo mismo puede decirse del porcentaje de individuos comprendidos en cual-
quier otro intervalo entre dos cuartiles consecutivos.
Figura 3.5. Campana de Gauss.
En la siguiente figura podemos ver las equivalencias entre los diferentes indicadores de
posición antes comentados.
Figura 3.6. Equivalencias entre algunos indicadores estadísticos.
54
3.3.2. Medidas de tendencia central
Las medidas que nos dan una primera aproximación al análisis y la interpretación de los
datos estadísticos de una fuente de datos son las medidas de tendencia central. Este tipo de
medidas se llaman así porque, por lo general, la mayoría de los datos tienden a agruparse en
torno a los valores centrales de la distribución y lo que nos indican es dónde está el centro
de los valores de los datos. En este sentido, hablamos con expresiones tales como “la media”,
la “mediana”, la “moda” entre otras. Por ejemplo, si tenemos las respuestas de una clase a un
examen de inglés y miramos las notas que han obtenido los estudiantes, podemos decir que
“la media de la clase ha sido un 5”. Hacer esta afirmación significa que “las notas de los estu-
diantes están alrededor del 5”. Pero eso no quiere decir que esos estudiantes hayan sacado
todos un 5 (o cerca de un 5). Piénsese en el caso de un grupo de 4 estudiantes, donde 2
hayan sacado un 10 y los otros 2 un cero. La media en este caso sería un 5; ¡pero ninguno
de los cuatro ha sacado un 5! (ni cerca tampoco).
Desde el punto de vista estadístico existen varias formas de examinar el concepto de
“medida de tendencia central”. En general disponemos de tres medidas para hacerlo: la
media, la moda y la mediana. A continuación se describe cada una de ellas y se ponen ejem-
plos para ilustrarlas.
A) La media aritmética
Cuando utilizamos en estadística el término media nos referimos a la media aritmética

(en matemáticas también se estudian la media cuadrática, la media geométrica y la media
armónica, entre otras). La media aritmética es lo que entendemos por promedio. Si un estu-
diante ha obtenido en 3 asignaturas, 6, 7 y 8 puntos respectivamente y preguntamos cuál
es su nota promedio, sumamos las tres puntuaciones y el total (6 + 7 + 8 + = 21) lo dividi-
mos entre 3 (que es el número de notas) y nos da 7. De esta forma, se trata de un estadísti-
co que mide la suma de los valores que toma la distribución de frecuencias dividida entre el
total del número de casos.
La fórmula habitual para la media es la siguiente: x = ∑x i
n
Donde ni es la frecuencia absoluta del valor xi, es decir, cuásntas veces se ha repetido ese
valor en la muestra. En esta fórmula, la x– es el símbolo que representa la “media aritméti-
ca”. La letra xi indica cada uno de los valores de la tabla de frecuencias. La letra “n” es el total
de los individuos.
Sigamos con el ejemplo de las notas obtenidas por los estudiantes en un examen (ver
matriz de datos en el apartado 3.1). Son 25 en total. Las calificaciones que han obtenido en
el examen son las siguientes: 5, 4, 7, 5, 4, 6, 5, 6, 3, 5, 5, 2, 5, 4, 6, 8, 5, 4, 7, 3, 5, 7, 3, 6,
8. Al representar estas notas en un cuadro obtenemos lo siguiente:
55
Cuadro 3.6. Ejemplo de notas obtenidas por los estudiantes
Nota (x i) Número de estudiantes (ni) (x i) * (ni)
2 1 2
3 3 9
4 4 16
5 8 40
6 4 24
7 3 21
8 2 16
Total 25 128
Para aplicar la fórmula lo que se tiene que hacer primero es sumar todas las calificacio-
nes que han obtenido los estudiantes. Esto se puede hacer de dos formas: bien (1) cogien-
do la calculadora y sumando una a una todas las calificaciones obtenidas, o bien (2) cogien-
do la tabla y multiplicando las notas por el número de estudiantes. El resultado es el mismo.
1. 5 + 4 + 7 + 5 + 4 + 6 + 5 + 6 + 3 + 5 + 5 + 2 + 5 + 4 + 6 + 8 + 5 + 4 + 7 + 3 + 5 + 7
+ 3 + 6 + 8= 128
2. 2 + 9 + 15 + 40 + 24 + 21 + 16 = 128
Entonces, una vez tenemos el resultado de todas las notas obtenidas por los estudian-
tes, lo dividimos entre el total del estudiantes (25). El resultado es la media aritmética.
x =
∑x n
i i
=
128
= 5,12
N 25
Por tanto, en nuestro ejemplo, la media aritmética de la distribución de las notas del
examen es igual a 5,12.
Sin embargo, ningún estudiante ha sacado 5,12 pues la mayoría han sacado 4 puntos
(4 alumnos), 5 puntos (8 alumnos) o 6 (4 alumnos); en total 16 de los 25. La media arit-
mética es un valor alrededor del cual tienden a agruparse las puntuaciones de los sujetos.
B) La mediana
La mediana corresponde al valor que toma la variable que estamos analizando cuando
se deja exactamente la mitad de la distribución a un lado y otro de dicho valor. Puesto que
56
deja por debajo al 50% de la distribución, la mediana coincide con el centil o percentil 50,
con el quinto decil y con el segundo cuartil. Para hallar la mediana es necesario hacer dos
pasos. En primer lugar, hay que ordenar los datos de menor a mayor. Luego, se busca el dato
que está justo en medio de la muestra. Ese es el dato que corresponde con la mediana.
Si hay un número impar de observaciones, entonces el dato que ocupa el centro de la
muestra deja a ambos lados la misma cantidad de observaciones. Por ejemplo, volvamos a
los datos del cuadro 3.6. Vemos que hay un total de 25 observaciones. En el cuadro ya apa-
recen ordenados los datos de la calificación más baja, a la más alta. Si dividimos los datos
por la mitad, vemos que en el centro se encuentra la observación que ocupa el décimo ter-
cer lugar (marcado en negrilla en el ejemplo). Esa observación deja doce datos a la izquier-
da, y doce más a la derecha, tal como se muestra a continuación:
2–3–3–3–4–4–4–4–5–5–5–5–5–5–5–5–6–6–6–6–
7–7–7–8–8
Por tanto, en este caso, la mediana corresponde con el valor “5”.

En el caso de que haya un número par de observaciones, entonces no hay un único
número que ocupe el centro de la distribución de valores observados. En este caso son dos
los números que ocupan el centro, y dejan el mismo número de observaciones a ambos lados.
Por ejemplo, si estudiamos la variable “número de hijos”, en una muestra de 10 personas,
podemos tener los datos siguientes: 0, 2, 0, 1, 1, 0, 0, 0, 2, 3. Tal y como hemos dicho, hay
que ordenar primero la muestra de menor a mayor: 0, 0, 0, 0, 0, 1, 1, 2, 2, 3. Una vez que
lo hemos hecho, vemos que en el centro se quedan las observaciones “quinta” y “sexta”. A
ambos lados de estas dos observaciones quedan cuatro más, tal como se ve en el ejemplo (se
marca en negrilla los valores centrales):
0–0–0–0–0–1–1–2–2–3
En este caso, la mediana se calcula como la semisuma de los valores que toman las obser-
vaciones centrales:
x i  + x i 
   +1
2 2 
med x = , es decir, para el ejemplo usado, x i  es el valor de la quinta obser-
2  
 2
vación, y x i  es el valor de la sexta observación, de manera que: med x = 0 + 1 = 0, 5 .
 +1 2
2 
C) La moda
Es el valor que más veces se repite; por lo tanto, el que tiene la frecuencia más alta. La
calcula el ordenador y la podemos ver observando la tabla (matriz de datos). En la variable
sexo es mujer (frecuencia 15), en número de hijos 2 (frecuencia 10) y en el examen 5 (fre-
57
cuencia 8). La moda es la categoría (mujer) o un valor de la variable (2 en número de hijos,

5 en el examen). El concepto estadístico de moda es el mismo o parecido al de la vida nor-
mal. Pongamos que la moda en pantalones sean los tejanos porque son los que más se lle-
van. Evidentemente en este caso la moda no es los equis millones de pantalones (que sería
la frecuencia) sino los pantalones tejanos (que sería la categoría). Para las variables cualita-
tivas es el mismo estadístico que podemos calcular y pedir al ordenador. Si le pedimos más
estadísticos al programa los calcula, pero sería un error, no del ordenador (que no deja de
ser una máquina muy eficiente), sino nuestro (por pedirle algo que no tiene ningún senti-
do). Hay también que aclarar que puede haber distribuciones con más de una moda, y que
en estos casos bien se procede promediando las modas si éstas son cuantitativas y consecu-
tivas, o bien tenemos una distribución multimodal. En el caso extremo, en el que todas las
categorías tengan la misma frecuencia y ninguna destaque por encima de las otras, diremos
que no hay moda. Finalmente, en variables continuas usamos aproximaciones a la moda,
teniendo en cuenta que puede no haber ningún valor repetido más de una vez.
¿Cuál de los tres estadísticos es el más importante?
La media por tres razones:
1. Es el mejor indicador de la tendencia central de la distribución. Es la esperanza mate-

mática, en términos de probabilidad y el centro de gravedad (la mediana no) por-
que tiene en cuenta no solo el número de datos sino también su peso.
2. Es el mejor estimador de la tendencia central de la población a partir de la muestra.
3. Es imprescindible para posteriores cálculos estadísticos.
La mediana es más importante solo si la distribución es muy asimétrica o tiene valores

muy extremos (porque estos valores le afectan mucho menos que a la media).
La moda solo suele usarse para una primera aproximación.
Ámbitos de aplicación
¿Cómo aplicar todos estos conceptos a las ciencias sociales y de la educación? La eficien-
cia y la equidad son dos términos que se utilizan con frecuencia en el mundo de la educación.
Como personas que trabajamos en este ámbito a menudo se nos pide que analicemos las actua-
ciones educativas para valorar su éxito en función de la eficiencia que tienen y la equidad que
promueven. Para responder a este tipo de preguntas necesitamos indicadores, medidas, etc.,
que nos permitan ofrecer respuestas con una cierta base fiable. De esa manera las decisiones
que tomemos estarán tomadas sobre la base de criterios científicos. ¿Cuándo podemos decir
que una actuación educativa ha tenido éxito? ¿Cómo podemos utilizar los estadísticos que aca-
bamos de explicar como indicadores para saber si una actuación es (o no) adecuada?
El uso tanto de las medidas de tendencia central, como de las de dispersión, nos per-
mite dar respuestas a estas preguntas. Sin embargo, es importante hacer una correcta inter-
58
pretación de las mismas. En caso contrario, podemos incluso cometer errores (o inducir a
ellos) al utilizar de manera sesgada la información que nos ofrecen.
Huff (1993) en su libro explica que en su barrio la gente gana 15.000 dólares de media.
Un año después, y con motivo de una discusión entre barrios para ver en cuál de ellos se lle-
va la línea de autobuses, Huff afirma que la media de ingresos en su barrio es de 3.500 dóla-
res. ¿Se trata de un engaño? No. Huff muestra que la media aritmética de los ingresos en su
barrio es de 15.000 dólares, pero que la mediana es de 3.500 dólares (es decir, la mitad de
la población gana menos de 3.500 dólares, y la otra mitad más). Y resulta que la moda se
sitúa en 5.000 dólares. Por tanto, dependiendo de qué quieran las personas del barrio, les
irá mejor usar una medida de tendencia central que otra.
En otro ejemplo Huff (1993) relata el caso de una empresa donde la media de los salarios
está en 5.700 dólares, la mediana en 3.000 y la moda en 2.000. El dueño de la empresa está
muy contento porque dice que sus trabajadores ganan de media 5.700 dólares. En cambio, los
trabajadores no están tan contentos, porque saben que la mayoría de ellos gana 2.000 dólares,
y pocos llegan a alcanzar los 5.700 que afirma el dueño que se ganan de media en su empresa.
De hecho, es habitual que, por ejemplo, se resalte la media aritmética, como un indi-
cador que resume cuáles son las tendencias centrales. A menudo en la prensa aparecen comen-
tarios tales como “la población opina”, “el interés medio”, “las diferencias medias” y otras
muchas del mismo estilo, que se están basando en la idea de promedio. Sin embargo, como
hemos avisado ya antes, la media aritmética es una medida que puede estar afectada por los
valores extremos. Eso significa que, si existe una gran dispersión en los datos, la media debe-
rá ser acompañada por otros estadísticos para una mejor descripción de los datos.
Si no damos esta información complementaria, la media nos dará una información no
ajustada a la realidad y hará que las decisiones se tomen sobre una base que no es correcta.
Una valoración rigurosa, por tanto, implica también el uso de las medidas de dispersión,
para tener una idea más fidedigna de cómo es la distribución. Esto está muy relacionado
con el tema de la calidad y el éxito educativo.
3.3.3. Calidad educativa
La idea de “calidad educativa” suele asociarse con los resultados obtenidos por los estudian-
tes. Cuanto mejores sean los resultados globales de un conjunto, más calidad suele atribuirse
a la educación. En ocasiones la calidad educativa también se define en función de la inver-
sión realizada en educación y los resultados obtenidos por los estudiantes. En el informe de
la EENEE (Woessmann y Schütz, 2006) se habla de eficiencia en este sentido: relación entre
los beneficios/resultados educativos y el coste económico. Cuanto mejores resultados se
obtienen con menores cotas de inversión, más eficiencia.
Veámoslo con un ejemplo. Resulta que estamos analizando la calidad de la educación
que se realiza en varios estados. Para ello usamos datos de algún estudio internacional que
nos permita comparar unos países con otros: por ejemplo el PISA. En el siguiente cuadro
se reproducen los resultados que obtuvieron estudiantes de diversos países de todo el mun-
59
do en el ámbito de ciencias. ¿De qué nos sirven los conceptos que acabamos de explicar?
¿Para qué podemos usar las ideas de media aritmética, mediana, moda, máximos, mínimos
o desviaciones? Para averiguar cuál es el país que mejores resultados está obteniendo en tér-
minos de educación, lo que nos interesa es quién obtiene la puntuación más alta. Lo que
nos interesa aquí es identificar cuál es el valor máximo que toma la distribución de las pun-
tuaciones. En este caso es Finlandia el país que ocupa la primera posición: por tanto, don-
de la educación llega a cotas más altas es en Finlandia. ¿Es eso cierto?
Cuadro 3.7. Rendimientos en ciencias en diversos países del mundo (PISA 2006)
País Puntuaciones País Puntuaciones

Finlandia 563 Polonia 498
Canadá 534 Dinamarca 496
Estonia 531 Francia 495
Japón 531 Islandia 491
Nueva Zelanda 530 Estados Unidos 489
Australia 527 España 488
Países Bajos 525 Noruega 487
Eslovenia 519 Luxemburgo 486
Alemania 516 Rusia 479
Reino Unido 515 Italia 475
República Checa 513 Portugal 474
Suiza 512 Grecia 473
Austria 511 Israel 454
Bélgica 510 Chile 438
Irlanda 508 México 410
Hungría 504 Brasil 390
Suecia 503
Fuente: elaboración propia a partir de: Informe PISA 2006. Programa para la evaluación internacional
de alumnos de la OCDE. Informe español.
Finlandia es el país donde se obtienen mejores resultados académicos, porque el resto de

países tienen menos puntos que Finlandia. Ahora bien, ¿podemos quedarnos con esta afirma-
ción? Para juzgar una afirmación en estadística siempre necesitamos comparar. Un indicador
que nos puede dar algo más de información sobre la calidad del sistema educativo en todos y
cada uno de los países que aparecen en nuestro ejemplo es la comparación de los resultados con
60
la inversión en educación que realiza cada país. Se suele decir que una mayor inversión en edu-
cación sirve para aumentar el nivel educativo de la población de un país. Veámoslo. Para que la
comparación sea justa, tenemos que buscar algún sistema que nos permita tener un criterio que
sea el mismo para todos los países. Utilizar, por ejemplo, el porcentaje que gasta cada país en
educación en relación con su PIB puede ser una buena forma de hacerlo.
En el siguiente cuadro se presentan los datos correspondientes a los resultados en edu-
cación y lo que se gasta cada país en su sistema educativo. Ahora es cuando necesitamos
recuperar todos esos conceptos que hemos venido estudiando hasta ahora.
Cuadro 3.8. Rendimientos en ciencias en diversos países del mundo y porcentaje

del gasto anual en instituciones educativas por estudiante sobre el producto
interior bruto (PIB)
Ratio Ratio
País Gasto Puntuaciones puntuación/ País Gasto Puntuaciones puntuación/
gasto gasto
Finlandia 3,9 563 144,36 Polonia 3,7 498 134,59
Canadá 3,6 534 148,33 Dinamarca 4,5 496 110,22
Estonia 3,5 531 151,71 Francia 4,0 495 123,75
Japón 2,9 531 183,10 Islandia 5,4 491 90,93
Nueva Estados
4,7 530 112,77 3,8 489 128,68
Zelanda Unidos
Australia 4,1 527 128,54 España 2,9 488 168,28
Países Bajos 3,4 525 154,41 Noruega 3,8 487 128,16
Eslovenia 4,3 519 120,70 Luxemburgo 3,7 486 131,35
Alemania 3,4 516 151,76 Rusia 1,9 479 252,11
Reino Unido 4,6 515 111,96 Italia 3,3 475 143,94
República
3,0 513 171,00 Portugal 3,8 474 124,74
Checa
Suiza 4,4 512 116,36 Grecia 2,7 473 175,19
Austria 3,7 511 138,11 Israel 4,5 454 100,89
Bélgica 4,1 510 124,39 Chile 3,4 438 128,82
Irlanda 3,4 508 149,41 México 4,4 410 93,18
Hungría 3,4 504 148,24 Brasil 3,2 390 121,86
Suecia 4,2 503 119,76
Fuente: Elaboración propia a partir de Informe PISA 2006. Programa para la evaluación internacional de alumnos de la
OCDE. Informe español; y OCDE (2008) Education at a Glance (datos correspondientes a 2005). Los porcentajes de
gasto en educación por estudiante con relación al PIB corresponden a primaria, secundaria y bachillerato.
61
A primera vista parece que la afirmación que habíamos hecho anteriormente de que Fin-
landia es el país donde la educación tiene más calidad es cierta. Con una inversión sustan-
cial (3,9% del PIB) los estudiantes finlandeses obtienen la mejor puntuación en las pruebas
del PISA. Otros países, sin embargo, invierten mucho más (hasta un 4,9% o un 5,4% del
PIB) y obtienen resultados significativamente peores. Eso obliga a cuestionar la afirmación
de que existe una relación directa entre gasto en educación y resultados (a mayor gasto mejo-
res resultados). La media de la inversión en educación de los países que aparecen en el cua-
dro está en 3,7%. Salvo Finlandia y Nueva Zelanda, la mayoría de los primeros cinco paí-
ses que mejores resultados tienen en el cuadro gastan mucho menos de su PIB en educación.
La moda está en 3,4%, pero, si analizamos los datos, vemos que la variabilidad de los resul-
tados obtenidos por los países que invierten el 3,4% de su PIB en educación es enorme (van
desde 525 puntos a 438; casi 100 puntos de diferencia). Por tanto, estos estadísticos ayu-
dan a ver que si Finlandia obtiene mejores resultados en los exámenes del PISA no es solo
por el gasto que realiza en educación; es necesario buscar otros motivos (es decir, otras varia-
bles) que, junto con el gasto, expliquen la posición que ocupa.
La estadística, por tanto, es una herramienta que nos permite descartar explicaciones exce-
sivamente simples a los sucesos. Las medidas de tendencia central son muy útiles usadas con
mesura y con criterio para juzgar críticamente afirmaciones causales, tales como la que hemos
examinado, sobre la supuesta relación entre inversión pública y calidad educativa.
3.3.4. Medidas de dispersión
A veces las medidas de tendencia central no sirven para poder “ver” el sentido de la distri-
bución que tenemos delante. Puede ocurrir que esa distribución esté afectada por valores
muy extremos. En ese caso, las medidas de tendencia central no ilustran lo que en realidad
ocurre. Como la historia de las dos personas que se comen dos pollos; puede ser que ambas
ingieran un pollo, respectivamente, o que una coma los dos pollos, mientras la otra mira.
En ambos casos, la media aritmética va a ser la misma: uno. Las medidas de dispersión nos
muestran la variabilidad que se da entre los datos: datos muy agrupados tendrán una dis-
persión baja y viceversa. Las más utilizadas son el rango, la varianza, la desviación típica y
el coeficiente de variación (Peña, 1986; Peña y Romo, 1997; Sierra Bravo, 1981, 1985). A
continuación se explican de manera sucinta estas medidas.
A) El rango, amplitud o recorrido
El rango se trata de la medida de dispersión más simple; es la diferencia entre el mayor

y menor valor de los datos representados en el muestra. En otras palabras, el rango lo que
nos indica es la amplitud que existe entre el valor más pequeño que toma la distribución y
el valor más alto que alcanza.
RANGO = mayor valor – menor valor
62
En la matriz de datos que venimos utilizando, podemos ejemplificar el rango de la

siguiente forma:
Rango o amplitud de número de hijos Æ (R = 4 – 1 = 3)

Rango o amplitud del examen Æ (R = 8 – 2 = 6)
El inconveniente que surge con el rango es que se basa solo en dos datos (dos extremos).
Si uno de ellos (o ambos) es anormalmente alto o bajo este índice no es un buen descripti-
vo de la desviación. Y, aunque no fuera este el caso, el rango no tiene en cuenta si el “grue-
so” de los valores está en los extremos, o en el centro, u otras cuestiones referentes a la dis-
tribución interna de los datos. Necesitamos algún índice que tenga en cuenta todos los datos.
B) La varianza
El rango es un buen índice para intuir si existe o no desviación, pero no la mide. Si toma-
mos un valor al azar de la distribución, no podemos saber a ciencia cierta cuál es su desviación
del centro teórico (la media) de la distribución. Sin embargo, eso sí puede calcularse a través de
estadísticos como la varianza. Se trata de la desviación de cada dato en relación con la media de
la muestra. Para obtenerla necesitamos calcular la diferencia de cada dato con la media de la
muestra y sumarlas en conjunto. El problema que surge al llevar a cabo estas diferencias es que
los valores positivos y negativos se anulan entre sí (problema de la anulación). Para resolverlo
los matemáticos idearon la estrategia de usar el cuadrado de todas las diferencias (de esta forma
todos los resultados son positivos). Al resultado se le llamó varianza.
Los valores de la varianza que da el ordenador (utilizando el SPSS) para número de hijos
y examen son los siguientes:
Número de hijos Examen
0,8733 2,443
El problema ahora es que el resultado no nos permite tener una idea exacta del valor de
la dispersión, ya que las unidades en que se expresa son contraintuitivas. Para resolver este
dilema, los matemáticos tenían otro as guardado en la manga: lo que denominaron “des-
viación típica”.
C) La desviación típica
Como trabajamos con datos al cuadrado este índice está sobredimensionado. La des-
viación típica o estándar (que es la raíz cuadrada de la varianza) es un índice de dispersión
más acorde con los datos.
63
¿Cuál es el contrario de una suma? Una resta. ¿Cuál el de una división? Una multipli-
cación. Por tanto, la genialidad del método que se esbozaba en el apartado anterior (la varian-
za) para resolver el problema de la anulación (elevar al cuadrado), la desviación típica apli-
ca el contrario de lo que se había hecho para superar dicho problema. Como se habían usado
potencias de base dos, la manera de recorrer el camino inverso es la raíz cuadrada. Y, lo más
bello del artificio, al calcular una raíz cuadrada, el resultado que arroja siempre es positivo
(en realidad, lo que se hace es coger la solución positiva de la raíz). Al hacer la raíz cuadra-
da de la varianza, se eliminan dos cosas: el efecto de la anulación entre valores iguales, posi-
tivos y negativos, y la sobredimensión debida al uso de las potencias cuadradas. La desvia-
ción típica, que es como se llamó al índice resultante, es la raíz cuadrada de la varianza. Otro
índice, la desviación media, calcula exactamente la media de las desviaciones en valor abso-
luto de cada dato respecto a la media aritmética, y las promedia. Sin embargo, la desviación
típica tiene ventajas, entre las cuales se cuenta una mayor facilidad de cálculo.
En el caso del número de hijos y examen la desviación típica es:
Número de hijos Examen
0,935 1,563
Hay que pensar que la desviación típica tiene un significado aproximado de “cuánto me
puedo esperar que los datos reales difieran de la media aritmética”. Por lo tanto, las unida-
des de la desviación son las mismas que lo que estamos estudiando. El 0,935 tiene unidad
de “hijos” y el 1,563 tiene unidad de “puntos de examen” (“en cuántos puntos de examen
puedo esperar que los datos reales difieran de la media aritmética de notas”).
D) Coeficiente de variación de Pearson
La desviación típica es un buen índice de dispersión, pero indica la dispersión en valor

absoluto. Por ello mismo a la hora de comparar e interpretar la dispersión de dos o más dis-
tribuciones habrá que matizar. Una desviación típica de 4 puede representar mucha disper-
sión en una distribución con datos pequeños y muy poca si los datos son grandes. Por ejem-
plo, pongamos que queremos comparar la dispersión de notas de dos exámenes: uno que
puntúa sobre 10, y el otro que puntúa sobre 50. Una desviación típica de 1 punto en el pri-
mero será mucho más grande relativamente que una desviación de 1,5 puntos en la segun-
da, de modo que no podemos comparar directamente en qué examen ha habido una mayor
homogeneidad de resultados.
Dicho de otro modo, necesitamos un índice de dispersión relativo. El coeficiente de
variación de Pearson da una dispersión relativa, concretamente con relación a la media, ya
que se calcula dividiendo la desviación típica (S ) entre la media.
64
S
Fórmula de coeficiente de Pearson: CU = 100
Χ
Indica el tanto por ciento de variación con relación a la media. Si, por ejemplo, tene-
mos dos distribuciones, A (con una media de 10 y una desviación típica de 4) y B (con una
media de 20 y una desviación típica también de 4), la variación absoluta es la mínima, 4.
Pero la variación relativa es mayor en la distribución A.
4 4
CU A = 100 = 40% CU B = 100 = 20%
10 20
Además de estas medidas que nos informan de la posición, tendencia central y disper-
sión de los datos es importante también disponer de su forma. Para ello contamos con dos
coeficientes, el de asimetría y el de curtosis.
3.3.5. Medidas de forma
A) El coeficiente de asimetría
Los conceptos estadísticos de simetría/asimetría son iguales a los que tenemos en la vida
normal. Una figura o un objeto son más simétricos cuanto más parecidas son las mitades
que quedan a uno y otro lado de un eje o plano central.
Básicamente tenemos tres casos (como se puede observar en la figura 3.7):
– Asimetría positiva: los datos se acumulan a la izquierda de la media o la distribución

carga hacia la izquierda. La media es mayor que la mediana (y la moda), y el índice
de asimetría da un valor positivo (tanto más cuanto mayor sea la diferencia entre la
media y la mediana).
– Asimetría negativa: lo contrario del caso anterior. Carga a la derecha. La media es
menor que la mediana y el índice de asimetría es negativo.
– Simetría: cuando los lados de la distribución son iguales a ambos lados de un eje en
el que coincidirían media, mediana y moda. En este tendríamos una distribución
simétrica (o de asimetría cero).
Es muy difícil, casi imposible, que nos encontremos casos con índices de asimetría exacta-
mente cero. Se suele aceptar que una distribución es simétrica (o aceptablemente simétrica cuan-
do el índice es aproximadamente cero: no está por debajo de –0,5 ni por encima de +0,5).
0,5 < As As = 0 As < –0,5
Asimetría positiva Simétrica Asimetría negativa
65
En la siguiente figura se observa de forma comparada la distribución asimétrica positi-

va, negativa y la simétrica.
Figura 3.7. Indicador de forma de Asimetría.
El SPSS utiliza una fórmula exacta (coeficiente de asimetría de Pearson), manteniendo la

misma interpretación de los resultados.
B) El índice de curtosis o apuntamiento
Un gráfico de una distribución nos puede ofrecer mucha información. Como hemos
visto, que las personas estén a un lado u otro del valor medio nos ofrece una información
interesante a la hora de interpretar los datos que tenemos. Pero también podemos analizar
el gráfico según la “altura” que tenga la campana que forman los datos, o, mejor dicho, y
para ser más exactos, el “apuntamiento” que presenta la curva. Si es una curva fina, que se
distingue claramente, como una montaña sobre el horizonte, entonces estamos ante una
distribución que concentra a la mayoría de las personas en torno al valor central. En cam-
bio, cuando la “montaña” se convierte en un “monte”, con una base mucho más amplia, y
pendientes más suaves, entonces eso quiere decir que las personas se distribuyen de mane-
ra más distendida, alrededor del valor medio de la distribución. Esta característica de la dis-
tribución, que podemos ver según si la gráfica presenta pendientes muy severas o suaves,
con gran apuntamiento o poco, es lo que se llama “curtosis”. El índice de curtosis permite
medir el nivel de “apuntamiento” en la distribución de los datos.
Veamos un ejemplo. Supongamos que estamos haciendo un estudio de un grupo de
estudiantes que se están preparando para aprobar las pruebas de acceso a la universidad para
mayores de 25 años. Son un grupo de diez estudiantes, y en un examen preparatorio, han
obtenido las siguientes calificaciones: 6, 7, 7, 6, 7, 5, 4, 6, 7 y 8. Para calcular el índice de
curtosis necesitaremos utilizar la siguiente fórmula:
66
Cr =
∑(x i
− x )4
−3
n ⋅ S x4
Al realizar los cálculos pertinentes, obtenemos un índice de curtosis del 0,512.

La interpretación del resultado es la siguiente:
• Cuando el índice de curtosis es positivo Æ Leptocúrtica (levantada)
• Cuando el índice de curtosis es negativo Æ Platicúrtica (plana)
• Cuando el índice de curtosis es aproximadamente 0 Æ Mesocúrtica (normal)
Tal y como vemos en el ejemplo, el valor del índice es positivo, lo que indica que la dis-
tribución es leptocúrtica, es decir, que los valores tienden a estar agrupados en torno a unas
categorías (en este caso, alrededor del 6 y del 7).
Vamos a cambiar ahora un poco los datos observados. En lugar de las anteriores, supon-
gamos que los estudiantes han obtenido las siguientes puntuaciones: 1, 5, 5, 9, 1, 1, 9, 9,
9. ¿Cuál será ahora el índice de curtosis? ¿Cómo será la distribución?
Si calculamos el índice de curtosis usando la fórmula anterior, obtenemos un valor de
–2,13. En este caso, el resultado obtenido es negativo. Eso indica que la distribución tien-
de a ser plana (platicúrtica). Las observaciones no están concentradas en torno a unos valo-
res centrales, sino que se distribuyen entre los extremos de manera que forman una línea
más o menos plana en el eje de coordenadas.
Con el SPSS se interpreta de la siguiente manera: es mesocúrtica cuando el coeficiente es 0.

Leptocúrtica más grande de 0 y platicúrtica menor de 0. Pero puede aceptarse con los si-
guientes márgenes de flexibilidad:
• Platicúrtica < –0,5

• –0,5 < Mesocúrtica < 0,5
• Leptocúrtica > 0,5
Figura 3.8. Indicador de forma de curtosis.
67
Como podemos observar, la curtosis nos resulta útil para saber cómo de concentrada se
encuentra la distribución de la variable, en torno a un valor medio. Sin necesidad de dibu-
jar el gráfico, aplicando las fórmulas que se indican, el índice de curtosis nos da pistas para
saber si estamos ante una distribución con mucha dispersión (platicúrtica) o, por el con-
trario, nos encontramos ante una distribución con poca dispersión (leptocúrtica).
Para pedir indicadores estadísticos con SPSS ejecutamos el comando ANALIZAR/ ESTA-
DÍSTICOS DESCRIPTIVOS/FRECUENCIAS y en el cuadro de diálogo ejecutamos la
opción ESTADÍSTICOS, y obtenemos el siguiente cuadro de diálogo.
Figura 3.9. Consulta de indicadores en SPSS.
3.4. El uso de la estadística descriptiva
La estadística descriptiva nos permite conocer de manera más o menos detallada la distri-
bución de la variable o variables que estamos estudiando. Como profesionales de las cien-
cias sociales y de la educación, debemos conocer las diferentes herramientas técnicas que
tenemos a nuestra disposición, para caracterizar y conocer las características de las personas
sobre las que estamos haciendo nuestra investigación. Para ello, pueden utilizarse recursos
informatizados de aprendizaje de estadística descriptiva como el que propone Torrado (2001).
De todas maneras, una investigación nunca es un proceso unívoco que va desde la per-
sona que investiga a las personas investigadas. Las técnicas que hemos visto en este capítu-
lo son en realidad herramientas. Tenemos que usarlas para conocer, pero la tarea importan-
te de la interpretación de los datos es algo que va más allá del uso de las técnicas y que emerge
del diálogo entre todas las personas que están implicadas en la investigación (Gómez, Lato-
rre, Sánchez, Flecha, 2006; Gómez, Puigvert y Flecha, 2011).
Igual que un ordenador, en sí, no supone una puerta al conocimiento, sino que es su
uso lo que nos permite aprender más, llegar a más información, procesarla mejor, de la mis-
68
ma manera las técnicas estadísticas descriptivas no crean conocimiento. El conocimiento es

fruto de la interpretación que hacemos de los datos.
Por otro lado, la experiencia previa y el trabajo de muchos investigadores anteriores
sugieren que la creación de conocimiento es un proceso colectivo que pasa por el diálogo
sujeto al intercambio de argumentos basados en pretensiones de validez (Habermas, 1988).
Por tanto, conocer estas técnicas es solo un paso en nuestro trabajo. Tenemos que saber uti-
lizarlas para que su uso sea algo realmente crítico y útil.
Actualmente existen programas informáticos como el SPSS que nos facilitan los resul-
tados de todas las técnicas que hemos expuesto aquí, con solo dos o tres clics de “ratón” en
las diferentes opciones del menú que aparece en pantalla. Calcular una media aritmética,
una varianza o dibujar un gráfico de una distribución no son ya tareas ni difíciles, ni arduas,
ni pesadas. Eso lo hace la propia máquina. Lo importante es, por una parte, saber qué pedi-
mos al ordenador, por qué se lo pedimos y para qué y, por otra, interpretar adecuadamen-
te los resultados. Y aquí es donde entra nuestra capacidad crítica para usar la estadística des-
criptiva. Leer “entre líneas” de una serie de resultados y valorar críticamente si tienen o no
coherencia (según lo que teóricamente tendrían que dar los diferentes estadísticos) es tam-
bién parte de la tarea que tenemos que aprender a desarrollar si usamos las estadísticas.
Si una distribución tiene una desviación típica poco elevada y presenta un índice de cur-
tosis superior a cero, podemos estar seguros de que la mayor parte de la gente estará en tor-
no al valor central de la distribución, menos algunos pocos casos, que ocuparán valores extre-
mos (“outsiders”). Si alguien en un informe utiliza la moda como medida de tendencia
central, para caracterizar la muestra, pero no habla de ninguna medida de dispersión, enton-
ces tenemos que hacer una mirada crítica y preguntarnos quién es la persona que escribe ese
informe y qué intereses tiene al hacerlo. La estadística descriptiva nos da herramientas poten-
tes para conocer lo que ocurre a nuestro alrededor. Pero también conlleva la responsabili-
dad de interpretar los índices de manera crítica y responsable.
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes descar-
gar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/)
• Crea una nueva variable para la media obtenida de los 4 parciales.

• Transforma la variable examen final en una nueva variable cualitativa que identifique las
notas según: suspenso (0-4,9), aprobado (5-6,9), notable (7-8,9) y excelente (9-10).
• Mediante SPSS crea una tabla de contingencia entre las variables sexo y opción de bachi-
llerato, para desarrollar un estudio de género y elección de bachillerato. Interpreta los
resultados.
• Crea una tabla personalizada de SPSS donde representar la media aritmética de la
variable nota de selectividad en función de la opción de bachillerato y el tipo de centro.
69
Puedes utilizar los datos provenientes del instrumento de medida que se sugería reali-
zar en el capítulo anterior o la matriz indicada antes:
• Mediante SPSS crea las tablas de frecuencia de las variables e interprétalas. Según el
tipo de variable, crea la representación gráfica más adecuada para cada variable.
• Pide los indicadores estadísticos de posición, tendencia central, dispersión y forma de
las variables cuantitativas e interpreta el “output”.
70
4
La probabilidad
“En adelante, estos sucesos hasta ahora rebeldes a la experien-

cia no pueden ya escapar al imperio de la razón” (Pascal, en una
de sus cartas a Fermat).
Antes de pasar a la estadística inferencial es necesario hacer un alto en el camino, para hablar
de algunos aspectos de la probabilidad. La teoría moderna de la probabilidad es la base nece-
saria para superar las limitaciones de la estadística simplemente descriptiva y adentrarnos en
la estadística inferencial. El origen de la teoría moderna de la probabilidad suele situarse en
la correspondencia que mantuvieron Blaise Pascal (1623-1662) y Pierre de Fermat (1601-
1665) a propósito de varios “retos” que planteó Chevalier de Mére (1610-1685) a Pascal
(Campos, 2004).
De hecho, es muy complicado situar el origen del cálculo de probabilidades. En el siglo
XVI ya se cuenta con evidencias de que el matemático italiano Cardano (1501-1576) hizo
un estudio de las combinaciones, al mismo tiempo que un compatriota suyo: Nicolás Fon-
tana, conocido como Tartaglia. Cardano fue autor del Liber de ludo aleae, donde expone su
teoría de la combinatoria. Un poco más tarde, Galileo Galilei (1564-1642) también dedi-
ca algunos de sus estudios al cálculo de probabilidades, observando que, al tirar 3 dados, se
tenía más probabilidades de ganar a la suma 10 que a la suma 9. Escribió sus reflexiones en
un manuscrito titulado Sopra le scoperte dei dadi.
De Mére era un conocido noble francés muy aficionado a los juegos de azar, con gran
experiencia y habilidad en ellos, que propuso a Pascal varios problemas relacionados con el
cálculo de probabilidades. Pascal, amigo de Fermat, intercambió con él correspondencia
sobre las resoluciones de los problemas propuestos por De Mére, poniendo las bases de lo
que hoy en día conocemos como cálculo de probabilidades. Mientras Pascal encontró la
71
solución al problema planteado utilizando su conocido “triángulo numérico”, Fermat solu-

cionó el problema usando combinaciones, para un número cualquiera de jugadores. En sus
cartas, Pascal muestra cómo ambas soluciones concuerdan. Él mismo fue muy consciente
de que estaban iniciando algo totalmente distinto a lo que se había hecho hasta el momen-
to en matemáticas:
“... para reducir a un arte exacto, con el rigor de las demostraciones matemáticas, la
incertidumbre del azar, esto es creando una nueva ciencia que podemos llamar justifica-
damente con el título de: matemáticas del azar” (Pascal, citado en Kline, 1968: 522).
En 1657, otro matemático llamado Christian Huygens (1629-1695) publicó una obra
titulada De ratiociniis in ludo alae, considerada actualmente como el primer compendio de
probabilidades aplicado a los juegos, que fue un recopilatorio de la correspondencia que
habían mantenido Pascal y Fermat. Más tarde, en 1669, publica Application of mathemati-
cal probability to expectation of human life, con gran profusión del uso de tablas de mortali-
dad, rentas, etc. y que dio lugar a los cálculos que se llevan a cabo hoy en día en las com-
pañías de seguros.
La probabilidad es un tema fácil, que no tiene grandes complicaciones de entender. Sin
embargo, a veces una mala aproximación da lugar a errores e ideas equivocadas, que pue-
den llegar a provocar decisiones erróneas. La probabilidad nos permite predecir, con un cier-
to margen de certeza, el acontecimiento de sucesos más o menos seguros o probables. Es
una herramienta muy potente que, si se sabe aplicar correctamente, permite grandes “mala-
barismos” como es el caso de conocer la totalidad de un fenómeno viendo solo una parte de
él e infiriendo el resto a partir de una cierta probabilidad, con un cierto margen de error.
En este capítulo vamos a explorar los conceptos más importantes de esta disciplina y qué
impacto tienen sobre nuestra tarea profesional como educadores.
4.1. Noción intuitiva
En nuestra vida diaria todos utilizamos en mayor o menor medida el concepto de probabi-
lidad. El médico receta una medicina al enfermo y le dice que dentro de un par de días se
encontrará mejor; casi todo el mundo sabe que cuantas más columnas rellena uno en las
quinielas existen mayores posibilidades de acertar una de catorce o, al menos, una de doce;
también que cuantos más números se juegan en la lotería es más probable que toque algún
premio; que se tienen más probabilidades de aprobar un examen si se ha preparado el 80%
de los temas que si solo se ha estudiado la mitad de ellos, etc.
Pero pocas veces nos paramos a pensar cómo podemos formular matemáticamente estas
probabilidades y calcular su valor. Así, el médico no suele decir: «Si se toma esta medicina,
tiene un 90% de probabilidades de sanar»; también es verdad que pocos jugadores de qui-
nielas saben siquiera que, combinando los resultados (1, X, 2), se pueden obtener 314 colum-
nas diferentes, etc.
72
Capítulo 4: La probabilidad
En cualquier caso podemos afirmar que la mayoría de la gente tiene una noción intui-
tiva de la probabilidad, noción que utiliza frecuentemente en su vida, aunque de hecho casi
nadie llega a formularla matemáticamente.
En las ciencias de la educación, debido precisamente a su complejidad, a causa de la
cantidad de variables que están afectando a un fenómeno educativo en concreto, la proba-
bilidad es la herramienta que mejor nos permite tomar decisiones correctas. Como tenemos
experiencia limitada sobre qué es lo que tiene éxito educativo y qué conduce al fracaso más
estrepitoso, nuestra decisión siempre se tiene que hacer sobre un marco de observaciones
previas, con la confianza que nos dan las evidencias de todo lo que ha sucedido en el pasa-
do. La verdad es que esto tendría que ser un principio de nuestras actuaciones, que desgra-
ciadamente muchas veces incluso huyen de la pseudo-certidumbre de la probabilidad para
asentarse en la “certidumbre” de una serie de creencias o de opiniones. Hay actuaciones que
siempre o casi siempre en el pasado generaron éxito y que no se aplican en muchos centros
donde se realizan actuaciones que siempre fracasaron.
4.2. Noción clásica de probabilidad
La definición clásica de probabilidad la encontramos en la obra de Laplace (1749-1847).

En cualquier manual se encontrará su clásica definición. Este matemático francés escribió
multitud de libros y tratados sobre el cálculo de probabilidades. En 1812 publicó un com-
pendio de todos ellos, titulado Theorie analytique des probabilités, seguido por Essai philoso-
phique des probabilités (1814), un ensayo donde trataba de explicar el concepto de probabi-
lidad a las personas no iniciadas en la matemática.
Sin ánimo de entrar en la discusión que puede originar la teoría clásica, podemos afir-
mar en principio que, por definición, «la probabilidad a priori de que ocurra un suceso x es
igual al cociente entre el número de casos favorables y el número de casos posibles, siendo todos
ellos igualmente posibles».
pr(x) = f/n
siendo «f» el número de casos favorables y «n» el número de casos posibles.
Ejemplo: si tenemos una urna con 10 bolas exactamente iguales en todo menos en el
color, de las cuales:
– 5 son blancas
– 3 son negras
– 2 son rojas
y sacamos una bola al azar, cuál es:
73
a) ¿La probabilidad de extraer una bola blanca (B)?
– casos posibles: n = 10
– casos favorables: f(B) = 5
pr(B) = f(B)/n = 5/10 = 0,5
La probabilidad de extraer una bola blanca es 0,5. Realmente podemos com-

probar que, si realizamos un gran número de extracciones, reponiendo cada vez la
bola extraída (muestreo no exhaustivo), aproximadamente el 50% de las veces habre-
mos extraído una bola blanca (cuantas más extracciones realicemos, más se acercará
esta proporción al 50%).
b) ¿la probabilidad de extraer una bola negra (N)?
– casos posibles: n = 10
– casos favorables: f(N) = 3
pr(N) = f(N)/n = 3/10 = 0,3
La probabilidad de extraer una bola negra es, pues, 0,3. También lo podríamos com-
probar de modo parecido a como lo indicamos en el caso anterior.
4.3. Noción axiomática de probabilidad
Podemos definir de alguna manera la probabilidad de un suceso en función de unos axio-

mas o principios que se cumplen en todos los casos.
Axiomas
1. La probabilidad de un suceso x es un número real comprendido entre cero y uno.

0 ≤ pr( x ) ≤ 1
2. La probabilidad de un suceso seguro (Ω, o sea el que contiene todos los casos posibles) es
igual a uno y la probabilidad de un suceso imposible (Ø, o sea el que no contiene nin-
gún caso posible) es igual a cero.
pr(Ω) = 1
pr(Ø) = 0
74
3. La probabilidad de un suceso cualquiera (x) es igual a la suma de las probabilidades de

los sucesos elementales que lo componen (los sucesos elementales son siempre incom-
patibles entre sí).
Si x = {x1, x2} pr(x) = pr(x1) + pr(x2)
Consiguientemente, para llegar a definir la probabilidad de un suceso cualquiera es nece-

sario definir la probabilidad de cada uno de los sucesos elementales del conjunto Ω, cum-
pliendo los postulados o axiomas anteriores.
Para ello debemos repartir el valor 1 entre todos los sucesos elementales posibles, de
acuerdo con ciertas hipótesis que no son siempre las mismas, sino que dependen de la expe-
riencia aleatoria o del fenómeno estudiado.
Cuando se trata de problemas de juegos de azar se suele dar por supuesto que todos los
sucesos elementales tienen la misma probabilidad, es decir, son equiprobables. Tal es el caso
de la experiencia de lanzar un dado equilibrado:
– de la simetría perfecta deducimos la hipótesis de la equiprobabilidad de las caras.

– por lo tanto, repartimos el valor 1 en seis partes iguales. La probabilidad de aparición
de cada cara es, pues, igual a 1/6.
Supongamos que el dado tiene 4 caras azules y 2 rojas y preguntémonos por la proba-
bilidad de obtener una cara roja. El suceso «roja» está compuesto por las dos caras rojas, cada
una de las cuales, al ser sucesos elementales, tiene una probabilidad igual a 1/6. Según el
axioma 3:
pr(R) = pr(r1) + pr(r2) = 1/6 + 1/6 = 2/6 = 1/3 = 0,33
La definición axiomática de probabilidad solo da los mismos resultados que la defini-
ción clásica cuando todos los sucesos elementales de la experiencia tienen idéntica probabi-
lidad (dado equilibrado, moneda perfecta, urna con bolas que solo se diferencian en el color,
etc.). La teoría axiomática de probabilidad solo impone que se cumplan los tres postulados
o axiomas anteriormente dichos.
El valor de la probabilidad de un suceso elemental no lo asigna la teoría de probabili-
dad, sino que se atribuye de acuerdo con ciertas hipótesis referidas a la experiencia aleato-
ria de que se trate en cada caso (juegos de azar, experiencias educativas, psicológicas, socio-
lógicas, biológicas, etc.).
4.4. La noción experimental de probabilidad
Independientemente de la teoría de probabilidad, necesitamos apoyarnos en ciertas hipóte-

sis para poder atribuir probabilidades a cada uno de los sucesos elementales asociados a una
experiencia aleatoria. En este sentido nos podemos encontrar con tres situaciones:
75
– Unas veces disponemos de dichas hipótesis.

– Otras veces estas hipótesis son más o menos arbitrarias.
– Otras, por fin, carecemos totalmente de ellas.
En estos dos últimos casos podemos estimar la probabilidad de un suceso x a partir de

un estudio estadístico de observación sobre la frecuencia relativa del suceso, siempre que la
experiencia aleatoria se repita varias veces en las mismas condiciones.
Si realizamos la experiencia n veces y de ellas hx veces observamos el suceso x, la fre-
cuencia relativa (o proporción) de x vale:
fr (x) = h x
n
Esta frecuencia relativa de x se puede considerar como una estimación de la probabili-
dad de x:
p̂r (x) = fr (x) = h x

n
Se demuestra experimentalmente que, cuantas más veces se repite la experiencia (mayor
es n), más tiende la frecuencia relativa del suceso x hacia la probabilidad real de x. De tal
manera que se puede afirmar que la probabilidad de un suceso x sería el límite de su fre-
cuencia relativa cuando n (número de pruebas) tiende a infinito:
pr (x) = lim⋅ h x (n → ∞)
n
Así, pues, la noción experimental de probabilidad de un suceso se apoya, por una par-
te, en la noción estadístico-experimental de frecuencia relativa (proporción) de este suceso
en una serie n de pruebas y, por otro, en el fenómeno experimental de regularidad estadís-
tica o ley de los grandes números.
a) Frecuencia relativa de un suceso.

Consideremos una experiencia aleatoria e interesémonos por un determinado
suceso (x) relacionado con esta experiencia, por ejemplo la experiencia aleatoria de
tirar una moneda al aire y mirar si el resultado es cara o cruz, y el suceso “ha salido
cara”. La frecuencia observada h(x) de dicho suceso a lo largo de un número n de
pruebas es el número de veces que este suceso se ha presentado en estas n pruebas y
su frecuencia relativa (proporción) vale:
h (x)
fr (x) =
n
76
b) Regularidad estadística o ley de los grandes números.

Jackob Bernouilli (1654-1705) fue quien propuso el teorema: ley de los grandes
números. La frecuencia relativa de un suceso tiende a estabilizarse en torno a un cier-
to valor cuando el número aumenta de manera indefinida.
Las frecuencias relativas de cualquier suceso no son siempre las mismas y, cuan-
do el número de pruebas (n) es pequeño, pueden presentar grandes oscilaciones.
Pero, si aumentamos el número de pruebas y en la medida en que lo hagamos, las
frecuencias relativas tienden a estabilizarse alrededor de un valor fijo que es la pro-
babilidad de tal suceso.
Así, pues, cuando carezcamos de hipótesis que nos permitan saber con exacti-
tud la probabilidad de cada suceso elemental o cuando las hipótesis no son seguras,
es más correcto utilizar la noción experimental de probabilidad. Esto se puede ilus-
trar de la siguiente manera:
Si nos preguntamos por la probabilidad de nacer varón en España, tendremos la ten-
tación de basarnos en la hipótesis de equiprobabilidad de los dos sexos, según la cual:
1
pr(V ) = = 0,5
2
pero esta hipótesis no es exacta, porque realmente nacen más varones que mujeres,
al menos eso es lo que nos dicen las cifras del Anuario Estadístico de España, según
el cual hubo 73.064 nacimientos en un determinado año, de los cuales 37.289 fue-
ron varones. De estos datos podemos estimar la probabilidad (experimental) de nacer
varón, que será:
ˆ (V ) = 37289 = 0,51
pr
73064
Esta estimación se acerca más a la probabilidad real que la que deducíamos de la

hipótesis primera de equiprobabilidad de ambos sexos.
4.5. Ley de probabilidad de variables aleatorias discretas
Cuando hablamos de probabilidad tenemos que introducir ciertos conceptos para referir-
nos al tipo de variables de las que estamos tratando. Existen diferentes tipos de variables. En
cualquier caso, podemos distinguir entre variables aleatorias y variables no aleatorias. Por
supuesto, el tipo que nos interesa son las variables aleatorias.
Variable aleatoria: Una variable aleatoria se define al asociar a cada suceso ele-
mental de una experiencia aleatoria un número real según una determinada ley.
77
Dentro de las variables aleatorias, podemos encontrar de varios tipos, según sean dis-
cretas o continuas. Empecemos por las primeras.
Variable aleatoria discreta: Una variable aleatoria es discreta si, al asociar a

cada suceso elemental un número real, la variable aleatoria solo puede tomar
determinados valores dentro de ciertos límites.
Veamos un ejemplo. Sea una población compuesta por 200 bolas, que solo se diferen-
cian en el número, que se distribuyen así:
30 bolas con el número 1

50 ” ” ” ” 2
20 ” ” ” ” 3
60 ” ” ” ” 4
40 ” ” ” ” 5
Como es obvio, se trata de una variable aleatoria discreta, puesto que solo puede
tomar los valores 1, 2, 3, 4, 5. A cada extracción al azar la variable tomará uno de estos
cinco valores.
Se define una ley de probabilidad de una variable aleatoria cuando asociamos a cada
valor su probabilidad correspondiente. En este caso, suponiendo que todas las bolas tienen
la misma probabilidad de salir (equiprobabilidad) y aplicando la fórmula general de proba-
bilidad:
pr (x) = h x
n
– la probabilidad de obtener el valor 1 será: pr(x = 1) = 30/200 = 0,15

Con estas probabilidades hemos definido la ley de probabilidad de la variable aleatoria

discreta x:
78
Cuadro 4.1. Ley de probabilidad de la variable aleatoria discreta x
X Pr(x)
1 0,15
2 0,25
3 0,10
4 0,30
5 0,20
1,00
La suma de las probabilidades asociadas a todos los posibles valores de la variable x vale
siempre 1.
El conjunto de todos los posibles valores de una variable aleatoria x (discreta en este
caso) y de las probabilidades asociadas a cada uno de los posibles valores recibe el nombre
de ley de probabilidad de la variable x.
4.5.1. Función de probabilidad y función de distribución
Cuando estamos trabajando con una variable aleatoria discreta, podemos hablar de la fun-
ción de probabilidad de la distribución de dicha variable, o bien de la función distribución.
Función de probabilidad (pr(Xi)). Es la función que indica la probabilidad de

que la variable aleatoria x tome un valor igual a xi.
– Es decir: pr(Xi) = pr(X=Xi)

– Se expresa generalmente en forma de tabla
Cuadro 4.2. Función de probabilidad
xi pr(Xi) xi pr(xi)
x1 pr(1) Para el ejemplo propuesto sería: 1 0,15

x2 pr(2) 2 0,25
. . 3 0,10
. . 4 0,30
xn pr(n) 5 0,20
79
– Y se representa gráficamente así:
Figura 4.1. Función de probabilidad.
Función distribución (F(Xi)). Es la función que indica la probabilidad de que

la variable aleatoria x tome un valor igual o menor que xi.
– Es decir
F(Xi) = pr(X≤Xi)
– La tabla, para nuestro ejemplo, es como sigue:
Cuadro 4.3. Función distribución

xi F(Xi)
1 0,15
2 0,40
3 0,50
4 0,80
5 1,00
80
– y se representa gráficamente así:
Figura 4.2. Función distribución.
También podemos expresar las dos funciones en una misma tabla:
Cuadro 4.4. Funciones de probabilidad y distribución
xi pr(Xi) F(Xi)
1 0,15 0,15
2 0,25 0,40
3 0,10 0,50
4 0,30 0,80
5 0,20 1,00
4.5.2. Modelos de probabilidad de variables aleatorias discretas
Existen varios modelos de probabilidad de variables aleatorias discretas. En investigación

educativa (en general en ciencias humanas o sociales) las más frecuentes son la distribución
binomial (basado en la repetición de n experimentos de Bernouilli) y la de Poisson (un caso
particular de la binomial, aplicable a sucesos “raros”, que tienen una probabilidad muy baja).
La distribución binomial converge muy rápidamente en la distribución normal, tanto más
rápidamente cuanto más simétrica.
81
4.6. Ley de probabilidad de variables aleatorias continuas
Como decíamos, además de las variables discretas, también podemos hablar de variables de
tipo continuo.
Variable aleatoria continua: Una variable aleatoria es continua si, al asociar

a cada suceso elemental un número real, la variable aleatoria puede tomar cual-
quier valor dentro de ciertos límites.
Por ejemplo, la variable talla, incluso dentro de un intervalo pequeño como es un cen-
tímetro, puede tomar cualquier valor. Entre 173 cm y 174 cm la variable talla puede tener
infinitos valores.
Ello implica que debemos matizar el concepto de función densidad o densidad de pro-
babilidad: no es la probabilidad de que la variable adopte un determinado valor (pr (x = xi)),
porque el cociente entre casos favorables y posibles (como hay infinitos valores posibles) nos
daría siempre cero. Por eso la función densidad se define como la probabilidad de que la
variable adopte un valor comprendido dentro de un intervalo (pr (x1 ≥ x ≤ x2) ).
El concepto de función distribución es el mismo: la probabilidad de que la variable ten-
ga un determinado valor o inferior (F (xi) = pr (x ≤ xi)).
En la figura 4.3 podemos ver una función de densidad. El área comprendida entre x1 y
x2, que vemos rayada en horizontal, representa la probabilidad de obtener un valor entre x1
y x2. En cambio la zona que vemos rayada en diagonal representa el valor de la función de
distribución para el valor x0. Observamos que si buscáramos el valor de la función de dis-
tribución para x1 o para x2, tendríamos áreas más grandes, por tanto valores de la función
de distribución más grandes. Por lo tanto, la función de distribución será una función cre-
ciente, donde para valores más grandes de x tenemos valores más grandes de la función.
Figura 4.3. Función de densidad.
Existen multitud de modelos de probabilidad de variables aleatorias continuas. Las más

frecuentemente utilizadas son la distribución normal, la distribución c2, la distribución de
82
Student-Fisher y la distribución F de Snedecor. De ellas la más conocida y más ampliamente

utilizada es la distribución normal.
4.6.1. La distribución normal y distribución normal estándar
Se llama así porque se observó desde hace mucho tiempo que la representación gráfica de
las variables continuas, cuando la n era suficientemente grande, normalmente tendía a adop-
tar una determinada figura en forma de campana (por eso se llama también campana de
Gauss), tal como muestra la figura siguiente:
Figura 4.4. Ley normal.
En ciencias sociales y educativas por lo general todas las cosas que estudiamos solemos mode-
lizarlas como curvas normales (la mayoría de la población suele comportarse de la misma mane-
ra, mientras que pocas personas actuarán de manera imprevisible o fuera de la pauta). Pero hay
que tener cuidado con esto: a veces las personas no actuamos tal y como lo hace la curva nor-
mal. Por ejemplo, Robert Merton teorizó sobre el “efecto Mateo”. En pocas palabras, el efecto
Mateo se refiere a aquellas situaciones en las que el comportamiento de la población es tal que
una persona, cuanto menos tiene, menos recibe, y cuanto más tiene, más recibe.
En situaciones de libre mercado, un estudiante que provenga de una familia sin recursos,
en un barrio marginal, con una escuela donde se aplica currículo de la “felicidad”, va a obtener
peores resultados académicos que un estudiante procedente de una familia acomodada, con
libre disposición de acceso a libros de todo tipo, un barrio con varias bibliotecas abiertas al públi-
co y de fácil acceso, y una escuela donde se implementa un currículo de altas expectativas. El
resultado que obtendrá el estudiante será muy diferente al que procede del primer barrio que
hemos comentado. En estos casos, la curva normal no explica nada.
Un primer paso es, pues, decidir cómo se comporta la población en referencia a aque-
lla variable que estamos estudiando, y eso desde una orientación comunicativa hay que hacer-
lo siempre en función de criterios de validez, no de poder; es decir: no vale decir que la
población se comporta siguiendo una distribución gamma porque lo digo yo, sino porque
83
hay una buena colección de estudios previos, contrastados científicamente, que sugieren que
la población en esa variable en concreto se comporta como una distribución gamma. Fue-
ron los matemáticos Laplace y Gauss quienes, ya en el siglo XIX, formularon, independien-
temente, la función matemática de esta gráfica.
¿Cuáles son las características de la distribución normal?:
a) Es una curva simétrica respecto a un eje en el que están la media, la mediana y la moda.
b) La curva normal tiene dos puntos de inflexión (donde hay un cambio de curvatura):
1) x = μ – σx, 2) x = μ + σx.
c) La curva normal es asintótica con respecto al eje de abcisas (va hasta el infinito, casi
tangente, pero sin cortarlo).
d) Queda definida por dos parámetros: media (μ) y varianza (σ2).
e) En términos de probabilidad el área total bajo la curva es igual a 1.
A partir de la fórmula se puede resolver cualquier cuestión de probabilidad que se plan-

tee, calculando en cada caso la integral o confeccionando la tabla correspondiente. Dicha
tabla solo servirá para una media y varianza determinadas, porque existen tantas leyes nor-
males como posibles valores de la media y la varianza. Pero si utilizamos las puntuaciones
estándar o típicas, cualquier variable, sea cual sea su media y su varianza, que siga la ley nor-
mal se convierte en una única variable, que siempre tiene por media 0 y por varianza 1, lla-
mada distribución normal estándar.
A) Distribución normal estándar
La distribución normal estándar, también conocida como “distribución normal tipificada”,

siempre tiene una media igual a 0 y una varianza (también la desviación típica) igual a 1.
Tiene las mismas características que cualquier distribución normal, salvo que oscila alrede-
dor de 0 y tiene una desviación típica de 1:
Figura 4.5. Distribución normal estándar.
84
B) La prueba de Kolmogorov-Smirnov
Para poder realizar las aplicaciones anteriores (y para aplicar diversas pruebas estadísticas) la
condición es que la distribución siga la ley normal (en realidad que provenga de una pobla-
ción en la cual la variable sigue la ley normal). Para ello debemos realizar una prueba de nor-
malidad.
Existen varias pruebas y la de uso más frecuente es la prueba de Kolmogorov. Estudia,
por una parte, la distribución empírica u observada y, por otra, la distribución teórica normal.
Pueden ser más o menos parecidas, pero difícilmente una distribución en una muestra será
igual que la distribución teórica normal. Cuanto menores sean las diferencias más se ase-
mejará la distribución empírica a la teórica. Lo que hace es analizar las diferencias entre la
distribución empírica u observada y la distribución teórica (normal).
Por ejemplo, con el SPSS también podemos verificar la normalidad de una determina-
da distribución, seleccionando las opciones ANALIZAR/PRUEBAS NO PARAMÉTRI-
CAS/K-S de 1 muestra.
Como podemos observar, cuando accedemos al cuadro de diálogo de la prueba de
Kolmogorov-Smirnov hemos de seleccionar aquellas variables a las que queremos some-
ter a dicha prueba, así como debemos escoger el tipo de distribución con la que quere-
mos contrastar las variables, siendo en el caso que nos ocupa la distribución Normal, ya
que nuestro objetivo, tal como hemos comentado anteriormente, es verificar la normali-
dad de la distribución.
Cuadro 4.5. Prueba de Kolmogorov-Smirnov para una muestra
Puntuación
N 48
Parámetros normalesa,b Media 10,00
Desviación típica 5,174
Difrencias más extremas Absoluta ,106

Positiva ,088
Negativa –,106
Z de Kolmogorov-Smirnov ,735
Sig. asintót. (bilateral) ,652
a La distribución de contraste es la Normal.

b Se han calculado a partir de los datos.
Interpretando el valor de significación que aparece en el resultado (concepto que se intro-

duce en el apartado 8.6), vemos que esta variable sigue la ley normal.
85
En general, si la significación es mayor o igual al margen de error alfa (0,05 o

0,01) se acepta que sigue la ley normal, en cambio si p es menor, no se acepta.
• ¿Qué aplicaciones puede tener el estudio de la probabilidad para la investigación edu-

cativa?
• ¿Cuáles son las características de una distribución normal?
• ¿Qué proceso realizarías para verificar la normalidad de una distribución?
• Mediante la ayuda del SPSS, verifica la normalidad de las variables cuantitativas de
la matriz que puedes descargar en www.sintesis.com, con un margen de error alfa de
0,05.
86
5
Estadística inferencial o muestral.
La muestra
5.1. Introducción
La estadística sirve para describir fenómenos que están ocurriendo en nuestro mundo. Pero
también sirve para realizar predicciones. Ya hemos visto que la estadística trabaja siempre a
partir de observaciones. Muchas variables, tanto sociales como físicas, tienden a funcionar
como si siguieran un cierto patrón de comportamiento. Si conocemos la tendencia, enton-
ces seremos capaces de predecir lo que ocurrirá en el futuro, aunque todavía no haya teni-
do lugar. Ese es el secreto que se oculta tras la estadística inferencial: una base de datos robus-
ta, con suficientes observaciones como para poder “ver” regularidades que nos sugieran cómo
funciona la variable que estamos observando, unos buenos métodos para depurar los datos
y evitar (o minimizar en la medida de lo posible) los errores que puedan derivarse de equi-
vocaciones en la recogida de datos y un proceso correcto de estimación de los parámetros
que nos permita realizar con garantías el contraste de hipótesis. Todo eso nos dará una base
científica y razonablemente fiable para aceptar las predicciones que hagamos sobre el fenó-
meno que estamos investigando.
Al usar datos secundarios es preciso ser cauto. El primer paso para usar un dato procedente
de una base de datos es mirar cómo está construida. No es lo mismo estar trabajando con los
resultados de una encuesta que se ha realizado sobre 20 estudiantes (siendo la población total
todas las personas en edad escolar de un país), que una encuesta que ha incluido una muestra
de dos mil estudiantes, por ejemplo. ¿Cuáles son los elementos que debemos tener en cuenta?
¿Qué es lo que nos dice si podemos (o no) usar ese dato, cruzarlo, compararlo, etc.? Las pala-
bras clave aquí son: muestra, margen de error, intervalo de confianza. Todos estos conceptos
nos llevan a una rama de la estadística que se denomina “estadística inferencial”. En pocas pala-
bras, y haciendo un reduccionismo quizás excesivo, la estadística inferencial es la rama de la
estadística que se encarga de adivinar (con un cierto margen de error) si los estadísticos de la
muestra que estamos usando corresponden (o no) a la distribución que toman los parámetros
87
en la población real y deducir con ello ciertas propiedades de la población a partir de la mues-
tra. Vamos a explicarlo un poco más. Cuando tomamos información de una base de datos
secundarios, por lo general están obtenidos en una muestra. Es decir, la OCDE, EUROSTAT,
el INE o la entidad que utilicemos para tomar los datos han realizado encuestas con amplias
muestras de población. Pero (y esto es lo importante) no han preguntado a todas las personas
de la población. No se ha ido casa por casa haciendo las preguntas del cuestionario por toda
España o el país del que se trate. Por tanto, han tenido que seleccionar una muestra (más ade-
lante veremos cómo se hace eso). En todo caso, ¿quién nos puede asegurar que las personas a
las que hemos preguntado tienen una opinión o una característica que corresponde con la
media de todas las personas que viven en el país? Como se puede ver, existe por un lado la
media de la población y, por otro lado, la media muestral.
Piénsese por ejemplo en la altura de las personas. Puede ocurrir que la altura media de
la población esté en 1,75 m. Ahora bien: ¿qué ocurre si por designios del azar hemos selec-
cionado una muestra de 50 personas que da la casualidad que miden todas más de 1,90 m?
Por supuesto, la media no va a ser 1,75 m (puesto que ese valor ni siquiera está representa-
do). Entonces, nuestra suerte nos ha conducido a elegir una muestra que seguramente esta-
rá situada en algún punto extremo de la distribución de alturas de la población.
En el ejemplo sobre la distribución de la altura, si suponemos que la población sigue
una distribución “normal” (una campana de Gauss), eso quiere decir que la mayor parte de
la gente estará sobre valores “medios”, mientras que habrá pocas personas que midan menos
de 1,50 m o más de 2,00 m. Esos dos números son “valores extremos”. Si cogemos una
muestra, lo lógico es que las alturas de las personas de esa muestra oscilen entre valores seme-
jantes a los “normales” de la distribución de altura de la población. Pero el azar nos puede
llevar a coger un grupo de personas (como en el caso de nuestra muestra de 50 personas),
que está en uno de los extremos de la campana de Gauss.
Por tanto, si decimos que la media de la altura de la población es de 1,95 m (por ejem-
plo) estaremos incurriendo en un error muy grave, porque ese dato no se corresponde con
la realidad. Para evitarlo (en la medida de lo posible) es necesario utilizar esos dos concep-
tos de los que hablábamos antes: intervalo de confianza y margen de error (que es la pro-
babilidad de cometer un error al escoger nuestra muestra). Veámoslo gráficamente:
Figura 5.1. Intervalo de confianza.
88
Capítulo 5: Estadística inferencial o muestral. La muestra
Si realizamos varias muestras de una población y calculamos, por ejemplo, la media de

la altura para cada muestra, obtendremos, probablemente, tantas medias como muestras
hayamos hecho. Cada uno de estos valores de medias tiene una probabilidad de aparecer.
En el ejemplo anterior, una media que esté entre los 1,7 y los 1,8 metros tiene muchas pro-
babilidades de obtenerse, mientras que una media entre los 2 y los 2,1 metros será muy poco
probable. En concreto, las diferentes medias tendrán unas probabilidades que siguen, prác-
ticamente, una distribución normal que tiene como media la media real de la población (en
nuestro caso, 1,75 metros). El gráfico nos representa esta distribución. Los valores centra-
les son los que probablemente encontremos al calcular la media de una muestra. En con-
creto, el intervalo de confianza nos da entre qué valores podemos esperar, con una proba-
bilidad 1 – �, que nos dé nuestra media. En cambio, las dos “colas” que quedan a uno y otro
lado de la campana de Gauss, corresponden a esas muestras “extrañas” o “raras”, que no nos
interesa tomar como referencia. Lo lógico es que la muestra que tomemos esté donde está
la mayor parte de la población (hacia la parte central de la distribución, donde la campana
se hace más “elevada”).
Para tener valores lo más exactos posible queremos que, con la probabilidad 1 – a, las
líneas del intervalo de confianza sean lo más estrechas posible. Es decir, queremos que los
valores que nos vayan a salir como media en nuestras distintas muestras estén lo más cerca-
nas posibles a la media real, que es el valor central de la distribución normal de la figura.
Evidentemente cuanto menos queramos asegurar que realmente los valores están en ese inter-
valo, más conseguiremos estrechar el intervalo de confianza. Por ejemplo, si queremos ase-
gurar que en un 99% de las muestras la media saldrá en ese intervalo, ese intervalo deberá
ser más grande que si imponemos un criterio menos restrictivo, por ejemplo si nos basta
con que el 50% de mis muestras acaben estando realmente en ese intervalo. Por lo tanto, si
queremos tener un intervalo muy estrecho de valores, debemos rebajar nuestras exigencias
de “seguridad” (o, lo que es lo mismo, aumentar nuestro margen de error) y si queremos
una “seguridad” más grande (un margen de error más pequeño), deberemos aceptar inter-
valos más grandes en los que puede estar nuestra media. Por ejemplo, al analizar una mues-
tra cuya media ha dado una altura de 1,7, quizás haya una probabilidad del 0,9 (un mar-
gen de error del 10%) de que las alturas del ejemplo anterior estén entre 1,6 y 1,8, pero si
solo exigimos una probabilidad del 0,6 de estar en este intervalo (un margen de error del
40%), podríamos tener, por ejemplo, un intervalo de confianza de entre el 1,65 y el 1,75.
Para mantener nuestras exigencias y, al mismo tiempo, estrechar el intervalo de con-
fianza, la única solución, como ya veremos, será la de aumentar el tamaño de la muestra.
En concreto, si este tamaño abarcara toda la población, la media obtenida sería, obviamen-
te, la de la misma población. Pero esto es costoso en tiempo y en dinero (imagínese tener
que hacer un cuestionario a todas y cada una de las personas que forman parte de la “pobla-
ción”; si por cada encuesta el encuestador cobra 1 euro..., necesitaríamos una fortuna para
pasar esa encuesta). Por eso se acota, se selecciona una muestra y ahí es donde vienen los
problemas, que pueden darse al tener la mala suerte de coger a unos individuos que no sean
representativos (por ejemplo, es el caso de nuestra muestra de 50 “gigantes”). Así, al dismi-
nuir el tamaño de la muestra, debemos encontrar en qué punto tenemos una probabilidad
89
y un intervalo de confianza “razonables”, que nos evite, con cierta probabilidad, pensarnos
que estamos en un país de gigantes cuando en realidad las estaturas de la población tienen
valores mucho más comunes.
Así, el margen de error y el intervalo de confianza son dos medidas estadísticas que nos
permiten medir (con un cierto margen de probabilidad) tanto el error como la confianza de
los datos que tenemos en nuestra muestra dentro de ciertos intervalos. Como hemos apun-
tado, y eso lo veremos en otro capítulo más adelante, el tamaño de la muestra va a depen-
der claramente de estos dos números: cuanto menor sea el error que estamos dispuestos a
aceptar y menor queremos que sea nuestro intervalo de confianza, más encuestas vamos a
necesitar. En otras palabras, cuanto más queramos correr las líneas verticales hacia el centro
de la campana manteniendo la probabilidad (el nivel de confianza en los resultados), más
casos vamos a coger en medio. Y si los cogemos todos, el 100%, entonces la confianza es del
100% y el error es nulo.
La mayor parte de los libros destacan que la estadística inferencial se refiere a los méto-
dos de muestreo, la estimación de parámetros, el contraste de hipótesis y la comparación de
poblaciones. Estos son los elementos que forman parte de esta rama de la estadística. Habi-
tualmente, cuando usamos las estadísticas más allá de su capacidad como herramientas des-
criptoras, nos adentramos en un terreno donde la falta de información se convierte en pro-
tagonista. Ésta es la situación más habitual que nos podemos encontrar cuando hacemos
investigación.
Es muy difícil (y costoso, como hemos visto) recabar información de toda la población.
Por ese motivo recurrimos a las muestras. Pero, al hacerlo, renunciamos a tener información
de todos y cada uno de los individuos. Aun así, se espera que digamos cosas coherentes y
fiables sobre la población. Ese es el campo de la estadística inferencial y ahí es donde entra
el ámbito de la estimación de parámetros. Al no disponer de toda la información, no pode-
mos hablar con total certidumbre de cuál es la media aritmética de una población.
Sin embargo, sí que podemos inferir, a partir de una muestra y dadas unas condiciones
concretas, cuál podría ser la media de dicha población. Lo mismo ocurre para el resto de
medidas de tendencia central y de dispersión que hemos venido estudiando a lo largo de
este libro. La clave aquí, como vimos anteriormente, es que la distribución de las variables
y la muestra sean aleatorias, para impedir que el sesgo influya en nuestros datos y, por tan-
to, invalide la interpretación que hagamos de los mismos.
La aleatoriedad es lo único que nos permite poder afirmar con un cierto riesgo de equi-
vocarnos (que es perfectamente cuantificable) si lo que decimos es cierto o no. Tener cuidado
de que nuestros datos sean aleatorios es una de nuestras tareas más difíciles y arduas. Huff
(1993) afirma que es realmente complicado y que nunca podemos estar del todo seguros de
haberlo conseguido (¿cómo voy a saber que, si hago una encuesta a la salida del metro, en
Madrid, por ejemplo, de 9 h a 12 h, toda la población de Madrid va a quedar representada?
A lo mejor los estudiantes no salen en la muestra, porque están en el colegio a esas horas).
Por tanto, y desde el punto de vista crítico que tratamos de despertar con este libro, juz-
gar un estudio que ha usado métodos de estadística inferencial siempre tiene que estar enmar-
cado por la discreción de los resultados: las personas autoras del estudio nunca pueden pre-
90
tender ir “más allá” de lo que sus datos dicen. Eso quiere decir que hay que ser cauteloso y
circunscribir lo que ha salido de los cálculos a la población de la que extrajimos la muestra.
Afirmaciones del tipo “todos los españoles dicen...”, “los catalanes piensan...”, “los jóvenes
creen...”, son, en sí, cuestionables, porque sabemos que el equipo investigador no pudo
entrevistar a todos los españoles, catalanes o jóvenes censados en una determinada región
geográfica.
Por otro lado, otra de las tareas para las que sirve la estadística inferencial es para cuan-
do tenemos una idea y queremos ver si realmente es aplicable a la realidad. Nos explicamos.
Piénsese que suponemos que la población actúa según una determinada tendencia. Por ejem-
plo, pensamos que el tener acceso a una vivienda digna está relacionado con el nivel de estu-
dios. Eso es una hipótesis, que puede ser planteada como tal.
La estadística inferencial es una herramienta que nos permite construir modelos de hipó-
tesis, para después contrastarlos con lo que sucede en el mundo real. Mediante una serie de
técnicas, que más adelante veremos, podemos llegar a confirmar la hipótesis o rechazarla.
Igual que antes, la piedra angular sobre la que construimos nuestras interpretaciones es la
muestra. Si no está bien hecha (si tiene algún tipo de sesgo), cualquier conclusión es, por lo
menos, discutible. Por otro lado, también tenemos que tener en cuenta que siempre hay que
referirse a los límites que establece nuestra muestra. Traspasarlos es inducir a engaño.
Además, en nuestro trabajo a veces también nos interesa comparar dos poblaciones.
¿Qué ocurre en los resultados de matemáticas en los diferentes niveles educativos de dos
países concretos? PISA, por ejemplo, ilustra un caso donde se comparan los resultados de
pruebas de comprensión lectora, ciencias y matemáticas, a nivel mundial. Más tarde vere-
mos los casos específicos de la comparación tanto de proporciones como de medias. Aho-
ra bien, cada vez que comparemos, tenemos primero que preguntarnos si es posible hacer
esa comparación. ¿Son iguales las unidades de medida? Por ejemplo, si comparamos los
resultados en comprensión lectora de Estados Unidos y de España, por niveles educati-
vos, decir “educación primaria” ¿significa lo mismo en ambos países? ¿Las edades inclui-
das son las mismas? De nuevo la estadística inferencial es una gran herramienta, pero cuan-
do se aplica con sabiduría.
Por tanto, como vemos, la estadística inferencial presenta un gran potencial como herra-
mienta de análisis. En los próximos capítulos nos vamos a centrar en las cosas que se pue-
den hacer con ella. Sin embargo, también queremos dejar claro que los datos numéricos no
tienen sentido si se sacan de contexto, si se usan de manera incorrecta o malintencionada-
mente. Como dice Huff en la introducción de su libro, hablando de la estadística:
“The crooks already know these tricks; honest men must learn them in self-defense
(Los sinvergüenzas ya saben estos trucos, los trucos que usan los estadísticos; los hombres
honestos deben aprenderlos en defensa propia).” (Huff, 1993, p. 9).
La estadística inferencial o muestral se basa en la inferencia estadística. A partir de una

serie de datos observados en una muestra (de donde sacamos los estadísticos) se infiere el
estudio a la población origen de dicha muestra (parámetros). De alguna manera, inferir quie-
91
re decir aplicar lo que observamos en la muestra a la población en general (con un cierto

margen de error, por supuesto).
Figura 5.2. La inferencia estadística.
La inferencia estadística es correcta siempre y cuando la muestra sea representativa.
5.2. Muestra representativa
Una muestra es representativa si cumple con estas tres condiciones:
– Es un subconjunto de la población.
– Tiene un tamaño suficiente (depende de la precisión que se desee y del riesgo de error).
– La técnica de selección de la muestra (muestreo) es correcta para garantizar la alea-
toriedad de los datos recabados.
Trataremos a continuación estas tres cuestiones: muestra y población; tamaño de la

muestra; técnicas de muestreo.
5.2.1. Muestra y población
A veces (la mayor parte de las veces, para ser realistas) tenemos que trabajar con poblaciones
que son tan grandes que tomar la información de todos y cada uno de los miembros de dicha
población sería enormemente largo y costoso. Por ejemplo, imagínese que estamos tratando
de averiguar la tendencia de voto en unas elecciones (ejemplo paradigmático). ¿Cómo hacer
para conseguir entrevistar a todas y cada una de las personas registradas en el censo electoral,
para tener una información exacta? O, ¿qué hay del caso de testear todas y cada una de las
92
bombillas que salen de la cadena de producción de una fábrica de bombillas? ¿Tenemos que
medir las alturas de todas las niñas de 12 años del mundo para saber si la altura de nuestra hija
está en la media, o no? Como se ve, el problema de utilizar la estadística en la vida real es un
problema de tiempo y de dinero. Nunca habrá tiempo (ni dinero) suficiente como para ana-
lizar las notas de matemáticas conseguidas por todos y cada uno de los niños de 8 años esco-
larizados en todo el mundo. Por ese motivo, las personas que trabajamos con los datos nece-
sitamos una herramienta que nos sirva para vencer esta dificultad. Esta herramienta es la
muestra.
La estadística no es la única ciencia que se encuentra con ese problema. Si miramos, por
ejemplo, en la geografía, vemos que la utilidad de los mapas se basa precisamente en que no
son iguales a la realidad, sino una adecuada representación de la misma. Imaginemos que
viajamos por Río de Janeiro en coche guiados por algún mapa que fuera del mismo tama-
ño que la ciudad; indudablemente no cabría en el coche y no serviría de nada. Lo mismo
ocurre en otras ciencias. Toda muestra, mapa, esquema o concepto es una simplificación de
la realidad que, sin embargo, nos ayuda a conocerla. Por tanto, criticar un esquema o con-
cepto porque simplifica la realidad y no tiene en cuenta algunos matices es mostrar una atre-
vida ignorancia, porque todo esquema o concepto es una simplificación que puede, o no,
ser adecuada según ciertos criterios científicamente establecidos.
La muestra es un subconjunto de la población. Por ejemplo, en el caso de las bombi-
llas, si queremos saber cuál es la tasa de bombillas defectuosas que salen de la cadena de
montaje, entonces podemos tomar al azar una o dos bombillas cada 5 minutos, para exa-
minarlas. Las bombillas que hemos examinado son menos que las que han salido de la cade-
na de montaje. Por tanto, es una muestra de ellas. En el caso de los niños de 8 años que
están haciendo un examen de matemáticas, podemos establecer que tomaremos un sub-
conjunto de la población, repartido entre diversos países del mundo. De nuevo, en la mues-
tra hay menos individuos que en la población total.
Cuando el tamaño de la muestra es igual al tamaño de la población, enton-

ces eso quiere decir que la muestra y la población son lo mismo (es decir, no
podemos hablar de muestra, sino de población).
Ahora bien, en estos dos ejemplos aparentemente inocentes, hay un elemento impor-
tante a destacar. En el caso de las bombillas, sabemos que el número total de bombillas que
salen de la cadena de montaje al día es de (pongamos por caso) un millón. En el caso de los
niños de 8 años que estudian matemáticas en el mundo, no tenemos ni idea de cuántos son
en total. El tamaño de la población es un dato importante, igual que si se trata de una pobla-
ción cuyo tamaño es conocido, o no. En cada uno de los casos, tendremos que tenerlo muy
en cuenta a la hora de establecer el tamaño de nuestra muestra. De la misma manera, cuan-
93
do veamos un dato, una de las primeras cosas a preguntarse siempre es ¿de dónde viene dicho
dato? ¿A qué población se refiere? Y, teniendo en cuenta eso, ¿cómo está construido dicho
dato? Vamos a verlo.
5.3. ¿Para qué sirve la muestra?
Si usar muestras que sean representativas resulta tan costoso, entonces, ¿por qué tenemos
que gastar el dinero para elaborar una muestra que sea fiable? ¿Qué cosa aporta una mues-
tra bien hecha que no se pueda eludir o encontrar por otra vía? Veamos un ejemplo didác-
tico. Tome una bolsa y ponga en ella 1.000 alubias de color negro, 500 de color rojo y 750
de color blanco. Mézclelas bien. Ahora, diríjase a una persona que no sepa cuál es el núme-
ro de alubias de cada color que usted puso en la bolsa. Dígale que en total hay 2.250 y que
sacando un puñado de ellas tiene que averiguar cuántas hay de cada color.
Una tarea bastante complicada, ciertamente. Para saber exactamente cuántas alubias hay
de cada color tenemos que contarlas una a una, ¿o no? Dígale ahora a esa persona que anote
el resultado que le ha salido al coger el primer puñado de alubias, que las retorne a la bolsa,
mezcle de nuevo y que vuelva a coger otro puñado. De nuevo que apunte cuántas de cada
color le han salido. Si hace esa operación, digamos, diez veces, los promedios de alubias rojas,
negras y blancas se acercarán bastante a la proporción real de la distribución por colores de la
bolsa de alubias. Sabiendo que el total son 2.250, con una multiplicación y una división pode-
mos estar bastante seguros de haber acertado el número exacto de alubias de cada color. Nóte-
se que para ello no hemos tenido que contar una a una, las 2.250 alubias de la bolsa. Basta con
tomar un número razonable de muestras (o una lo suficientemente grande) para poder infe-
rir con bastante acierto la distribución de una cierta variable en el total de la población.
La muestra tiene ese valor: es un “atajo” que nos permite conocer el comportamiento
de la población en general. Ahora bien, este “atajo” tiene que estar bien construido. La mues-
tra está sujeta a muchos peligros que pueden invalidar las conclusiones a las que lleguemos
de los cálculos estadísticos que hagamos sobre ella.
Una buena muestra tiene que ser aleatoria. Huff (1993) cita ejemplos históricos en los
que eso no fue así, de manera que se llegó a conclusiones erróneas, que luego se desmintie-
ron por los hechos. Por otro lado, también tenemos que tener en cuenta que existen muchí-
simos más elementos que pueden invalidar los resultados que salgan de la muestra. Si tra-
bajamos con alubias, o cualquier otra entidad física, seguramente no estaremos sujetos al
sesgo que pueda producir una respuesta tendenciosa. Pero al trabajar con seres humanos,
los estudios de ciencias sociales y de la educación tienen que tener en cuenta también que
a lo mejor las personas a las que entrevistamos dicen aquello que queremos oír; o que las
personas que hacen la encuesta, por alguna razón, solo escogen la muestra sobre un seg-
mento de la población y no toda (por ejemplo, si se hace la encuesta telefónica, solo se pre-
gunta a aquellas familias que tienen teléfono; si se hace la encuesta a todas las personas que
pasan por la calle, de 10 a 14, seguramente no entrarán en la muestra la mayor parte de tra-
bajadores, que a esa hora están en la oficina, etc.).
94
La muestra es la ventana que nos permite ver el horizonte: si la ventana es pequeña, a

lo mejor no podemos ver esa montaña que aparece a la izquierda del horizonte; si hacemos
la ventana más grande, entonces acertaremos a divisar la montaña. Si en vez de una venta-
na, hacemos más de una, tendremos más posibilidades de atinar a ver “todo” el horizonte.
Ahora bien, como a priori no podemos saber dónde está la montaña, tenemos que garanti-
zar que la disposición de las ventanas sea aleatoria, para tener más probabilidad de acertar
al inferir cuál es la línea del horizonte real.
A continuación se explican las principales herramientas de las que dispone la estadísti-
ca para garantizar en la medida de lo posible que disponemos de una buena muestra para
ver las características de la población. En todo caso, siempre tendremos que tener muy pre-
sente que lo que digamos en los estudios que realicemos (o que utilicemos si es el caso que
estamos usando fuentes secundarias) es solo aquello que queda dentro de los límites de la
“ventana-muestra”.
En otras palabras, no se pueden hacer generalizaciones sin más al conjunto de la pobla-
ción del tipo “todos los catalanes piensan que...”, porque seguramente la persona que diga
eso no habrá preguntado a los más de siete millones de personas catalanas que están regis-
tradas según el Idescat (Institut d’Estadística de Catalunya). Siempre hay que matizar las
conclusiones al conjunto de la población que ha formado parte de la muestra y ser muy cau-
tos con las generalizaciones.
5.4. Tamaño de la muestra
Decidir qué muestra tenemos que tomar para estudiar un determinado fenómeno no es cosa
fácil. ¿Cuántas encuestas tenemos que hacer para averiguar si existe relación (o no) entre el
nivel de estudios y la posición socioeconómica que se ha alcanzado entre los cuarenta y los
cincuenta años de edad? ¿A cuántas personas tendremos que preguntar para saber si la nota
que sacaron en matemáticas al final de la enseñanza secundaria obligatoria tuvo alguna rela-
ción con la carrera universitaria que han cursado? ¿A partir de qué momento el valor que
arroja un estadístico como la media aritmética es (o no) representativo? El tamaño de la
muestra tiene mucho que ver con todas estas preguntas.
Este es, quizás, uno de los conocimientos básicos más importantes para todas las per-
sonas que nos dedicamos a las ciencias sociales y de la educación. Saber calcular el tamaño
de la muestra es un conocimiento que siempre hay que tener en mente. Todas las estadísti-
cas que se utilicen en un estudio van a estar condicionadas por el tamaño de la muestra.
Como hemos visto, el tamaño de la muestra nos permite acercarnos más o menos a la
población total. Si la muestra es igual en número que la población, entonces ya conocemos
exactamente la distribución de las características de esa población (ya no hablamos de mues-
tra, hablamos de población). Pero cuando reducimos el tamaño (porque no tenemos recur-
sos suficientes para preguntar a todo el mundo), entonces estamos reduciendo nuestra infor-
mación para conocer exactamente la distribución real de las características de la población.
Ahí ya dependemos de la probabilidad de haber acertado con nuestra muestra, o no.
95
La fiabilidad de nuestros números (y por tanto, de las interpretaciones que construya-

mos sobre ellos) se asienta sobre la muestra. Una muestra mal construida es un gigante con
pies de barro. A su vez, siempre que veamos un estudio, lo primero que tenemos que mirar
es en la hoja de datos técnicos, cuál fue la muestra. Eso nos dará información suficiente para
valorar la seriedad o gratuidad de los datos expuestos en el estudio.
Ya hemos visto que la muestra es un subconjunto de la población. El tamaño de la
muestra, por tanto, siempre es más pequeño que el tamaño de la población. ¿Qué conse-
cuencias tiene eso? La población tiene una media poblacional, una desviación típica pobla-
cional, una moda poblacional, etc. Si mapeamos los valores que toman dos determinadas
variables del conjunto de la población, sobre un eje de coordenadas cartesiano, obten-
dremos una nube de puntos que nos indicará la posición de todas y cada una de las per-
sonas de dicha población.
Por ejemplo, si estamos estudiando la relación entre el peso y la altura, podemos hacer
dos ejes de coordenadas (en uno situaremos los pesos y en el otro las alturas) y entonces
situaremos a cada persona en un punto concreto del gráfico, acorde con su peso y su altu-
ra. Si hacemos eso con todas las personas de la población, obtendremos un gráfico lleno de
puntos (uno por cada persona). Pero imagínese que la población son “todas las personas del
mundo”. Seguramente no haya una hoja de papel suficientemente grande como para poder
dibujar encima los más de siete mil millones de puntos que se supone que corresponden con
el total de la población mundial. Por otro lado, un gráfico así tampoco sería de gran ayuda.
En este caso tendremos que tomar un subconjunto de la población.
Pongamos, por ejemplo, que decidimos tomar a diez mil personas y ubicarlas en el grá-
fico. ¿Qué puede ocurrir? Podemos tener suerte y resultar que tanto las medidas de disper-
sión, como las de tendencia central, de nuestra muestra, coincidan exactamente con las de
la población total. Pero eso (ya se intuye) es altamente improbable. No sabemos si la mues-
tra que hemos tomado tiene una composición similar o no a la población total.
Por supuesto, si el tamaño de la muestra es igual al de la población, entonces todos los
parámetros serán coincidentes. Pero en cuanto empieza a haber diferencia (a medida que el
tamaño de la muestra es más pequeño), la probabilidad de que existan menos coincidencias
entre los parámetros de la población y los estadísticos de la muestra aumenta considerable-
mente. Ahí ya depende: puede ser que tomemos una muestra altamente representativa (es
decir, que sus valores coincidan bastante con los de la población total) o poco representati-
va (que no haya prácticamente ninguna coincidencia). Como se ve, el tamaño de la mues-
tra no es un concepto nada irrelevante; es un concepto crucial.
Para calcular el tamaño de la muestra debemos saber qué queremos medir. Por ejemplo,
si queremos saber la proporción de la población que tiene cierta característica (por ejemplo,
la proporción de alumnado con éxito académico o con buenos resultados en una prueba),
y suponiendo que la variable toma una forma gaussiana, utilizaremos la siguiente fórmula:
zα 2
⋅ p⋅q
n= 2
e2
96
n = tamaño de la muestra
2
zα = el valor tipificado en la curva de Gauss para un cierto nivel de confianza (si a
2
es 0,05, z ± 1,96; si a es 0,01, z ± 2,58)
p = proporción de los individuos que tienen la característica que tenemos, por ejem-
plo, que han sacado “buenos resultados” en una prueba
q = proporción de los individuos que no tienen la característica que tenemos, por
ejemplo, que no han sacado “buenos resultados” en una prueba (q = 1 – p)
e2 = nivel de precisión al cuadrado (es decir, el intervalo de confianza que asumimos,
en % respecto a la p estimada. A más e, menos precisión)
(*) Para usar esta fórmula se supone que la población es infinita, es decir, que es mayor
a cien mil personas (Sierra Bravo, 1992).
En el caso de que conozcamos el número de personas o de individuos que hay en la

población, entonces la fórmula para calcular el tamaño de la muestra es la siguiente:
Nzα 2 pq
n= 2
e 2 ⋅ ( N − 1) + zα 2
⋅ p⋅q
2
(*) N en este caso es el tamaño de la población.
En la práctica esta segunda fórmula es la que menos se aplica, porque implica no solo
que el tamaño de la población sea finito, sino también que sepamos su magnitud exacta.
Tal y como dice Sierra Bravo (1992), tanto el tamaño de la muestra, como su cálculo,
depende de cuatro factores:
– La amplitud de la población infinita o no.

– El nivel de confianza que se toma.
– El error de la estimación.
– La desviación típica.
¿Qué quiere decir todo esto? Veamos. Decir que para determinar el tamaño de la mues-
tra tenemos que considerar la amplitud de la población, significa que no es lo mismo tomar
una muestra de cien personas sobre una población de 101 personas, que sobre una pobla-
ción de diez mil personas. Las cosas que podamos decir en uno u otro caso tendrán una fia-
bilidad muy diferente, como se puede adivinar. Si decimos que la media de altura de las per-
sonas de una población de 101 individuos, de los que hemos tomado una muestra de 100,
es de 1,83 cm, seguramente nos estamos acercando mucho a la verdad.
En cambio, si la población son diez mil personas y tomamos una muestra de 100, de la
que inferimos que la altura media es de 1,83 cm, entonces la probabilidad de haber acerta-
97
do con la altura media real salta a la vista que es mucho menor. Por tanto, la amplitud de la
población importa. Por otro lado, puede ser que conozcamos el número total de toda la
población, o no. Si no lo conocemos, es preciso tener algún tipo de referente, para decidir
si su tamaño (el de la población) afecta significativamente a nuestros cálculos del tamaño
de la muestra o no.
Es decir, que, cuando la población es muy grande, aumentar un poco la muestra no nos
da mucha más fiabilidad que si no lo hiciéramos. Hay un “valor crítico” de población a par-
tir del cual, por más que aumentemos la muestra, no vamos a obtener mejores resultados (o
por lo menos, no sustancialmente). La experiencia nos dice que ese “valor crítico” es cien
mil unidades. Por debajo de esa cantidad, la población se considera “finita”. Por encima, se
la considera “infinita”. Como dice Sierra Bravo (1992) “el hecho de que se estime el uni-
verso [población] como infinito supone que su amplitud no influye para nada en la fórmula
a aplicar, al contrario de lo que ocurre en los finitos” (Sierra Bravo, 1992, p. 209).
Por lo que respecta al nivel de confianza, formalmente y como hemos apuntado previa-
mente en la explicación relativa al intervalo de confianza, se trata de la proporción total de las
medias muestrales que forman parte del área que existe por debajo de una distribución nor-
mal o de Gauss de la población. Veamos, se supone que si tenemos a todas las personas de una
población y las podemos ordenar encima de un eje de coordenadas, podemos organizarlas de
manera que podemos dejar a la izquierda del eje la mitad de la población y a la derecha la otra
mitad. Esa “mitad” será la mediana de la población (el valor que deja el 50% de la distribu-
ción a ambos lados). Ahí también encontraremos la media. Si tomamos una muestra, y situa-
mos su media sobre el mismo eje, puede ser que por suerte (por azar) coincida con la media
de la población, o que no. Si tomamos varias muestras y hacemos lo mismo, sus respectivas
medias tenderán lógicamente a aproximarse a la media de la población. Si tomamos muchas
muestras, tenderán a concentrarse hacia el medio donde está la media de la población, más
que hacia los extremos (que serían los casos de escoger una muestra muy poco representativa).
Al dibujarlo, podemos adivinar que el comportamiento da como resultado una curva de Gauss.
Figura 5.3. La campana de Gauss
98
El nivel de confianza es el intervalo que tomamos para hacer nuestros cálculos. Puede
ser que lo establezcamos dejando “fuera” el 10% de los casos (nivel de confianza del 90%).
Podemos decidir dejarlo a “una cola” o a “dos colas”. Eso quiere decir que podemos “hacer
la raya” bien poniendo el 10% a la derecha o a la izquierda, o bien 5% a ambos lados (por-
que 5 y 5 hacen 10%).
En cualquier caso, la experiencia empírica acumulada de múltiples investigaciones cuan-
titativas previas aconseja que el nivel de confianza oscile entre el 95% y el 99%. Asumir un
error mayor del 5% (nivel de confianza menor del 95%) se considera poco fiable.
Finalmente, otro de los elementos que Sierra Bravo (1992) nos dice que tenemos que
tener en cuenta para calcular el tamaño de la muestra es la desviación típica. Es decir, la
muestra que escojamos ¿cuán cerca se va a encontrar de la población a la que pertenece o
cuánto se va a desviar de ella? Dice Sierra Bravo (1992) que:
“Respecto de la desviación típica hay que distinguir las muestras referentes a variables
cuantitativas con escalas de intervalo o de razón, de las que se refieren a variables cualitativas
con escala nominal u ordinal, de las que son tipo las variables dicotómicas, con una escala
que tienen solo dos categorías la afirmativa y la negativa” (Sierra Bravo, 1992, p. 211).
Teniendo en cuenta eso y sabiendo que podemos “cuantificar” las variables dicotómicas
utilizando el álgebra de Boole (asignando un valor binario de 0 y 1 según sean negativas o posi-
tivas, respectivamente), lo que puede ocurrir es que sepamos cuál es la desviación típica de la
población o (lo que es más habitual) que no la sepamos. En el caso de no saberla, entonces se
asume el caso más extremo (más desfavorable) que es que tanto la probabilidad de acertar,
como de equivocarse, esté al 50% (0,5 y 1 – 0,5). La idea es que la desviación más grande que
puede haber en una proporción es que la mitad de las veces pase una cosa y la otra mitad pase
la otra, de forma que no haya una “mayoría” para ninguno de los dos valores posibles. Este es
el caso para el que corresponde el mayor tamaño de la muestra posible, según el nivel de con-
fianza asumido. En otras palabras, si conocemos la desviación típica de nuestra población, no
necesitaremos tantos casos en la muestra para acertar “al blanco”.
El error que podemos (vamos a) cometer al seleccionar la muestra al utilizar intervalos
depende de lo grande que sea el intervalo que hemos tomado. Como hemos visto, cuanto
mayor sea el intervalo de donde seleccionamos la muestra, menos error vamos a cometer (y,
por tanto, nuestra muestra va a ser más precisa). Para eso también hay otra fórmula que es
necesario recordar o deducir de la anterior:
p⋅q
e = zα 2
⋅
2 n
e = precisión (probabilidad de cometer un error al seleccionar la muestra)

zα = el valor tipificado en la curva de Gauss para un cierto nivel de confianza (para
2
el 95% 1,96 y para el 99% 2,58)
99
p = proporción estimada de los individuos que tienen la característica que tenemos,

por ejemplo, que han sacado “buenos resultados” en una prueba
q = proporción de los individuos que no tienen la característica que tenemos, por
ejemplo, que no han sacado “buenos resultados” en una prueba (q = 1 – p)
n = tamaño de la muestra
5.5. Técnicas de muestreo
Para que una muestra sea representativa debe tener, como hemos visto, un tamaño mínimo
suficiente. Pero eso no basta. Pongamos que nos interesa hacer un sondeo sobre la inten-
ción de voto para las próximas elecciones y que una muestra de 4.000 sujetos es suficiente.
Si elegimos para la muestra a todos de un barrio rico de la capital o a todos de un barrio
pobre o a todos de una población rural, podemos imaginar que los resultados en cada uno
de los tres casos pueden ser muy diferentes. Esto quiere decir que, además de que la mues-
tra ha de tener un tamaño suficiente, se requiere otra condición: que la forma de extraer la
muestra o, dicho de otro modo, la técnica de muestreo sea adecuada. Existen múltiples téc-
nicas de muestreo. Aquí trataremos algunas de las más conocidas.
5.5.1. Técnicas de muestreo aleatorias
Para que una muestra esté bien escogida tiene que ser una muestra aleatoria, porque, si no,
lo que estaríamos haciendo es sesgar nuestros datos. Por ejemplo, si queremos conocer los
resultados en comprensión lectora de los estudiantes de ciclo medio de primaria, en Espa-
ña, no podemos tomar una muestra de entre los 20 mejores colegios del Estado. Tenemos
que poner a todos los estudiantes de tercero y cuarto de primaria en el “bombo”, de mane-
ra que todos tengan la misma probabilidad de ser elegidos para formar parte de la muestra.
En caso contrario, cualquier resultado que obtengamos estará sesgado. Sería como si qui-
siéramos averiguar la estatura media de los chicos de veinte años de una ciudad y nos fué-
ramos a tomar una muestra a la peña de básquet local. Es evidente que, cuando calculáse-
mos la altura media, seguramente rondaría los 2 metros de altura. ¿Es un dato representativo?
En educación estas cosas ocurren. A veces, por falta de presupuesto, por una mala prácti-
ca o simplemente por desconocimiento, lo cierto es que se nos presentan estudios con aires de
cientificidad, pero que no están avalados por un proceso correcto de toma de datos. Por eso,
antes de creernos un dato, primero nos tenemos que preguntar sobre qué muestra se ha dicho.
A) Muestreo aleatorio simple
El muestreo aleatorio simple lo aplicamos cuando aseguramos que todos los elementos de
la población que estamos estudiando cumplen con este requisito básico: que tengan la mis-
ma probabilidad (equiprobabilidad) de ser escogidos para formar parte de la muestra.
100
¿Cómo se realiza? Se hace una tabla que recoja todos los elementos de la población.
Entonces, se asigna a cada elemento un número. La mejor manera de hacerlo sería tener un
bombo con todos los individuos de la población. Si queremos una muestra de un número
determinado de casos, giramos el bombo y sacamos tantas bolas como casos queramos tener
en nuestra muestra. Como no es muy habitual tener un bombo en casa, podemos usar otras
tecnologías para hacer el mismo papel.
Actualmente las calculadoras científicas, o programas de ordenador como el EXCEL,
tienen teclas o fórmulas para calcular números aleatorios. En realidad son pseudoaleatorios
(porque están generados por un algoritmo), pero por lo general se pueden considerar correc-
tos para el caso que nos ocupa.
Si apretamos en el botón que genera estos números, nos van saliendo valores que en
principio cumplen con la condición matemática para que sean aleatorios. Lo único que tene-
mos que hacer es volver a la distribución de la población original y ver qué número de la
población corresponde al que nos ha salido en la calculadora (o en el EXCEL). Elegimos
para nuestra muestra esos números y ya tenemos una muestra aleatoria. Por ejemplo, ima-
gínese que tenemos una población que son los jóvenes de primero de bachillerato de nues-
tro municipio. En total son 3.443 estudiantes. Queremos tomar una muestra aleatoria de
364 casos. ¿Cómo lo hacemos? Podemos hacer una tabla con los 3.443 estudiantes (el cen-
so escolar, por ejemplo). Los ordenamos numéricamente, del 1 al 3.443. Entonces, toma-
mos el EXCEL y le pedimos que nos dé 364 números aleatorios del 1 al 3.443. Los indivi-
duos a quienes corresponden estos números compondrán nuestra muestra aleatoria.
El muestreo aleatorio simple puede ser con reemplazo (muestreo no exhaustivo) o sin
reemplazo (muestreo exhaustivo). ¿Qué quiere decir esto? Pues que podemos escoger “bolas”
del “bombo” y no devolverlas al bombo, o podemos coger una bola, mirarla, apuntar el
número que ha salido y devolverla al bombo, antes de seguir seleccionando bolas. Por ejem-
plo, es muy diferente seleccionar una muestra de 10 casos, entre una población de 100 per-
sonas, utilizando el reemplazo, que no usándolo.
Si reemplazamos, eso quiere decir que cada vez que cojamos una bola, dentro del bom-
bo habrá 100 bolas (o sea, que la probabilidad es de 1 bola sobre 100). Cuando miramos el
número, devolvemos la bola al bombo, con lo cual vuelve a haber 100 bolas.
Si no reemplazamos, cada vez que cogemos una bola queda una menos en el bombo. La
primera bola tiene una probabilidad de 1 sobre 100. La segunda, ya es de 1 sobre 99 (porque
ahora quedan 99 bolas en el bombo). La tercera, de 1 sobre 98. Y así sucesivamente. Por tan-
to, el muestreo es aleatorio, pero cada vez que seleccionamos un caso, eso condiciona a los que
quedan en el resto de la población, porque el resto tiene una probabilidad diferente de salir.
B) El muestreo sistemático
El muestreo sistemático se usa cuando los individuos de la población que estamos estudiando
están ordenados. Igual que los métodos precedentes, el muestreo sistemático supone que
hay un componente de aleatoriedad en la selección de los casos.
101
Para hacer una selección de la muestra aplicando el método del muestreo sistemático,
primero tenemos que calcular las particiones, para coger los casos de manera sistemática.
Cuando los elementos de la población que están más cercanos tienden a ser más parecidos
entre sí, entonces el muestreo sistemático es más preciso que el aleatorio, porque cubre más
homogéneamente toda la población (Peña, 1986).
Cuadro 5.1. Ejemplo de muestreo sistemático
Por ejemplo, supongamos que vamos al departamento de educación para pedir un listado
con todos los estudiantes de secundaria de Cataluña. Tras explicar los motivos de nuestra
demanda, nos dan dado el listado con todos los estudiantes que hay matriculados.
Al calcular de qué tamaño necesitamos nuestra muestra, vemos que necesitamos una mues-
tra de 384 casos. El total de los estudiantes de secundaria de Cataluña, según el departamento
de educación, es de 11.534 estudiantes. Tenemos que coger este número y dividirlo entre
384 (que es nuestra n). El resultado es 30,0364. Redondeamos el resultado: 30 estudiantes.
Eso quiere decir que tenemos 384 grupos de 30 estudiantes. El total (aproximadamente) es
de 11.534. Ahora, del primer intervalo, tomamos un número al azar (lo podemos hacer con
la tecla RAN de la calculadora). Sale 11. El primer número de nuestra muestra será 11. Los
números siguientes se calculan de la siguiente manera:
11
11 + (30 · 1) = 41
11 + (30 · 2) = 71
11 + (30 · 3) = 101
11 + (30 · 4) = 131 (…)
11 + (30 · 383) =11.501
El estudiante 11.501 será la última persona en entrar en la encuesta.
C) El muestreo estratificado
El muestreo aleatorio simple se utiliza cuando tenemos poblaciones que son homogéneas.
Sin embargo, en el caso de las ciencias sociales y educativas, esas situaciones son poco habi-
tuales. Lo normal es que tengamos poblaciones con mucha diversidad. En ese caso, pode-
mos aplicar el muestreo estratificado. Se trata de una técnica que consiste en organizar los
individuos de la población por clases o estratos, según la población. Dentro de cada estra-
to se toma la muestra, utilizando entonces el muestreo aleatorio simple.
La idea, por tanto, es dividir la población según clases o estratos. En cada una de ellas
escogeremos una submuestra. El total de las submuestras constituirán la muestra total. ¿Cómo
se puede hacer esto? Existen varias formas.
– Asignación (afijación) simple: se toma el número de la muestra que queremos esco-

ger y se divide entre el número de estratos que hay. El resultado es el número de per-
sonas que deberemos seleccionar en cada estrato. El problema de este método es que
no respeta las proporciones que hay en la distribución de la población.
102
– Asignación (afijación) proporcional al tamaño de los estratos: la submuestra que se

toma en cada estrato es proporcional al tamaño que tiene ese estrato sobre el total de
la población. Por ejemplo, si estamos haciendo un estudio sobre las notas en historia
de los estudiantes de primaria de Cataluña, podemos establecer seis estratos (uno por
cada uno de los cursos de primaria). Como tenemos disponible el censo de estudiantes,
sabemos que siguen la siguiente distribución:
Cuadro 5.2.
Curso Porcentaje del número de estudiantes
Primero 30%
Segundo 16%
Tercero 19%
Cuarto 15%
Quinto 9%
Sexto 11%
– Por tanto, si queremos tomar una muestra de 100 estudiantes y seguimos este méto-
do de muestreo (estratificación estratificada por asignación proporcional), entonces
tomaremos 30 estudiantes de primero, 16 de segundo, 19 de tercero, 15 de cuarto,
9 de quinto y 11 de sexto.
– Asignación (afijación) óptima: en este caso necesitamos conocer tanto la proporción que
tienen los estratos en la distribución de la población como sus desviaciones. Es menos
habitual que el método anterior, porque normalmente no tenemos información sobre
cómo están distribuidas las desviaciones. Por ejemplo, considérense estos datos:
Cuadro 5.3.
Curso Número Porcentaje del número Desviación

de estudiantes de estudiantes típica
Primero 360 30% 2,58
Segundo 192 16% 3,18
Tercero 228 19% 1,68
Cuarto 180 15% 2,24
Quinto 108 9% 1,23
Sexto 132 11% 1,32
Total 1200
103
De nuevo queremos tomar una muestra de 100 estudiantes. ¿Cómo deben estar repar-
tidos entre los diferentes cursos? Siguiendo el método de asignación óptima, haremos:
Cuadro 5.4.
Curso Muestra
100 ⋅ 360 ⋅ 2,58 92880

Primero n1= = = 35
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
100 ⋅ 192 ⋅ 3,18 61056

Segundo n2= = = 23
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
100 ⋅ 228 ⋅ 168

, 38304
Tercero n3= = = 14
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
100 ⋅ 180 ⋅ 2,24 40320

Cuarto n4= = = 16
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
100 ⋅ 108 ⋅ 1,23 13284

Quinto n5= = =5
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
100 ⋅ 132 ⋅ 132

, 17424
Sexto n6= = =7
, + 180 ⋅ 2,24 + 108 ⋅ 1,23 + 132 ⋅ 132
360 ⋅ 2,58 + 192 ⋅ 3,18 + 228 ⋅ 168 , 2632,68
Total 100
D) Muestreo por conglomerados o polietápico
La muestra es una herramienta para ahorrar dinero y poder hacer afirmaciones científicas
sobre una población. A veces, como hemos dicho ya, la población es tan grande que pensar
ni siquiera en hacer un breve cuestionario a toda la población es una quimera. La muestra
nos permite poder hacerlo. Sin embargo, a veces la población está distribuida de manera tan
heterogénea, que incluso una muestra escogida tal y como hemos explicado hasta ahora pue-
de no dar demasiada luz al asunto. Puede dar la casualidad que tomemos datos justo de un
sector de la población y, a pesar de nuestros esfuerzos para que sea una muestra representa-
tiva (teniendo en cuenta que esté estratificada, que sea aleatoria, etc.), puede no servirnos
de nada. El muestreo polietápico o por conglomerados es una solución a este problema.
Imagínese que queremos hacer una encuesta a estudiantes de primaria en Tarragona.
Sabemos que no es lo mismo que hagamos la encuesta en una escuela pública que privada.
También sabemos que el barrio es relevante, porque hay barrios donde se concentra más la
104
inmigración y otros donde no. Lo que podemos hacer es crear conglomerados: primero selec-
cionamos escuelas, dentro de barrios, usando el muestreo aleatorio simple. Luego, dentro
de esos barrios, escogemos escuelas públicas y luego escuelas privadas (también por mues-
treo aleatorio simple). Incluso podemos decidir que el curso es relevante y hacer estratos por
cursos, para luego, dentro de cada estrato, seleccionar un conglomerado de escuelas según
sean de tal o cual barrio y según sean públicas o privadas. El resto del proceso es igual que
lo que hemos estado explicando hasta ahora.
5.5.2. Técnicas de muestreo no aleatorias
La muestra también puede ser seleccionada de manera no aleatoria. Aquí el criterio es otro:
la significatividad. El muestreo no aleatorio es un muestreo en el que los casos se seleccio-
nan porque hay una intencionalidad detrás. En el caso de hacer un estudio sobre una pobla-
ción de la que ya se tiene un gran conocimiento previo, igual ya se sabe quiénes son las per-
sonas que más información nos pueden ofrecer, sea por su conocimiento del tema que estamos
trabajando, por su experiencia o por cualquier otra razón.
Por ejemplo, imagínese que estamos haciendo un estudio del impacto de los programas
extraescolares en mi barrio. Se van a montar dos aulas, una de informática y otra de inglés.
Además, el equipo del polideportivo del barrio va a montar cursos de atletismo y gimnasia.
Como es mi barrio, conozco a las personas que están organizando todas estas actividades y,
por tanto, sé que, si voy a verlas para entrevistarlas, en principio me van a dar una infor-
mación más interesante que si hago una encuesta telefónica a los hogares del barrio.
En este caso la muestra no aleatoria es más indicada, porque nos da acceso a las personas
que están llevando a cabo la experiencia de actividades extraescolares. Quizás sea más indica-
do aplicar una metodología más exhaustiva que un cuestionario (se pueden hacer entrevistas,
observaciones, relatos, grupos de discusión, etc.). También podemos decidir que es mejor hacer
una encuesta a las primeras cuarenta personas del barrio que nos encontremos por la calle. En
cualquier caso, tendremos que escoger una muestra. Igual que en el caso del muestreo aleato-
rio, también hay diferentes maneras de seleccionar una muestra no aleatoria.
A) Muestreo por cuotas
Tiene una cierta relación con el muestreo estratificado. Consiste en establecer una serie de
cuotas entre individuos que tienen una serie de características en común. Guarda relación
con el método de muestreo estatificado porque, conociendo la distribución de la población,
podemos decidir el número de personas en cada cuota de manera proporcional al peso que
tienen sobre la población total.
En el caso del muestreo por cuotas, la decisión de a quién se le hace la entrevista (o la
encuesta, etc.) es arbitraria. Una manera de proceder muy habitual es seleccionar a las pri-
meras n personas con las que nos cruzamos por la calle. Al seleccionar a cualquier persona
105
que en ese momento esté caminando por la calle, puede parecer aleatorio. Pero no es así,
porque las personas que ya no estén caminando por esa zona de la calle no tienen posibili-
dad de participar en el estudio. En ese sentido, esta técnica de muestreo no es aleatoria.
B) Muestreo opinático o intencional
En este caso las personas que hacen la investigación deciden incluir en la muestra a una serie
de individuos que consideran necesarios para que la muestra sea representativa. Por tanto,
la muestra depende del criterio del equipo de investigación. No es en ningún caso aleato-
ria. Un ejemplo clásico serían las encuestas de opinión en las que se incluye (o van dirigi-
das) a un determinado sector de la población, según el criterio de las personas que hacen el
estudio. Por ejemplo, en el caso de una encuesta de opinión sobre videojuegos, el equipo de
investigación puede decidir hacer un estudio en el que por un lado tengan en cuenta a las
familias, pero por el otro a niños de una determinada edad y de unos barrios concretos.
C) Muestreo casual o incidental
Se trata de un tipo de muestreo en el que el criterio de selección es sencillamente aquellas

personas que decide el equipo de investigación. Un ejemplo claro sería el caso de una estu-
diante de máster en ciencias de la educación, por ejemplo, que decide hacer una encuesta
utilizando a sus compañeros de clase como parte de la muestra. Los resultados del estudio
no son ni representativos, ni extrapolables a otras situaciones o contextos.
Otro ejemplo es el caso de un equipo de investigación que, por ejemplo, decide hacer
una encuesta telefónica. Calculan que tienen que hacer 1.004 encuestas. Para hacerlas, cogen
un listín telefónico y deciden empezar al azar por cualquier página y, si la página es par,
entonces llaman a todos los números impares que salgan en la página. Si la página es impar,
entonces llaman a los números pares. Otra variante habitual es el muestreo por “rutas”: las
personas que pasan la encuesta tienen unos criterios tales como: en la parte derecha de la
calle, llamar solo a pisos de numeración impar; en la parte izquierda, llamar a los de nume-
ración par. Empezar con los primeros y al cambiar de calle subir a los segundos, y así suce-
sivamente, hasta el décimo piso. Luego volver a empezar. Las variantes de este tipo de mues-
treo dependen de la imaginación del equipo investigador.
D) Muestreo por bola de nieve
En este caso la muestra comienza con una serie de individuos a los que se les hace la encues-
ta. Estas personas llevan (a los investigadores) a otras y esas otras a otras más y así sucesiva-
mente, hasta completar el número total de encuestas que se había decidido hacer. Por supues-
to, no se trata de un muestreo aleatorio. Hay una intencionalidad clara en las decisiones. El
106
rasgo importante es que la muestra al final la decide la propia población; el equipo de inves-
tigación lo único que hace es seguir las indicaciones de las personas que va entrevistando a lo
largo del estudio. Este tipo de muestreo es muy indicado cuando no se conoce bien la reali-
dad que se está estudiando, ni, por lo tanto, quiénes pueden ser los mejores informantes.
5.5.3. ¿Qué tipo de muestreo es más recomendable?
Cuando utilizamos una técnica aleatoria el error que cometemos (llamado error muestral)
es también aleatorio, es decir, debido a la influencia del azar en el muestreo. Si conocemos
la ley de probabilidad que sigue, podemos calcular y controlar la incidencia de dicho error.
Por el contrario, cuando utilizamos una técnica no aleatoria el error es de sesgo. El pro-
blema del error de sesgo no es que sea grande o pequeño, sino que es desconocido y, por lo
tanto, no lo podemos cuantificar.
Es por ello por lo que, en principio, es recomendable utilizar técnicas aleatorias de mues-
treo. Sin embargo hay casos en los que existe mucha experiencia empírica y, si en función
de dicha experiencia, sabemos que un tipo de muestreo no aleatorio da buenos resultados
(por ejemplo en estudios de mercado), lo podemos utilizar.
Si en un estudio o investigación no se ha hecho un muestreo aleatorio (como sucede en
demasiadas ocasiones) todo el aparato de pruebas estadísticas basadas en leyes de probabilidad
no tiene mucho sentido. Ello no quiere decir que las conclusiones a las que se llega sean nece-
sariamente erróneas, ni mucho menos. Pero sí que hay que aceptarlas con precaución y cau-
tela y no como verdades demostradas y dogmas de fe, como con frecuencia se hace.
Figura 5.4. Esquema resumen de las diferentes técnicas de muestreo.
107
5.6. La orientación comunicativa en las técnicas de muestreo
La selección de la muestra es un tema que muchas veces ya viene determinada por el tipo
de estudio que queremos realizar. Aspectos tales como el tamaño de la muestra, o la aleato-
riedad, no dependen de la persona que investiga, sino que siguen una serie de criterios esta-
dísticos y probabilísticos para asegurar que la muestra que seleccionemos sea la mejor mues-
tra posible. No obstante, lo mejor no es lograr la mayor representatividad de la muestra a
cualquier precio, sino que tiene que tener en cuenta los recursos empleados. Por ejemplo,
si un ayuntamiento decide destinar x euros a la superación de la pobreza y, como uno de los
elementos del diagnóstico previo, se decide hacer una encuesta, lograríamos más represen-
tatividad de la muestra, pero sería totalmente inadecuado emplear todo el presupuesto en
esa encuesta. La orientación comunicativa, que tiene cada vez más importancia en la inves-
tigación internacional y es exigida por un número creciente de organizaciones, plantea que
esas decisiones tienen que tomarse previo diálogo entre todas las personas implicadas. Las
personas investigadoras tienen que explicar clara y verazmente los pros y contras de cada
opción de muestra y los sujetos implicados tienen que poder dar sus valoraciones.
En ocasiones, debido a nuestro conocimiento sobre el tema, o que sabemos de perso-
nas que conocen lo que queremos estudiar, es aconsejable decidir hacer una muestra signi-
ficativa, antes que representativa. Esa experiencia previa sirve para suplir los “errores” que
puedan derivarse de escoger una muestra que no sea representativa de la población, porque
lo que “perdemos” en representatividad lo “ganamos” en el conocimiento que ya tenemos
de la población.
El criterio de significatividad es indicado cuando ya existe un gran número de estudios
previos que presentan datos fiables sobre una determinada población y de lo que se trata es
de estudiar a fondo (más allá de la mera descripción) los motivos que subyacen al tema obje-
to de estudio. Si decidimos que nuestra muestra no sea representativa, ni queremos tomar-
la al azar (porque ya sabemos de qué va el tema y, por tanto, queremos incluir en la mues-
tra a aquellas personas que sabemos previamente que van a aportarnos más información),
entonces el criterio de las personas que investigan tiene que estar presente a la hora de esco-
ger la muestra.
Desde una orientación comunicativa crítica no solo son las personas que forman parte
del equipo investigador quienes deciden quién tiene que estar en la muestra. También son
las personas objeto de investigación quienes participan en la selección de la muestra, por-
que ¿quiénes mejor que ellos (conocedores directos de la realidad que estamos estudiando)
para participar en la decisión de a quién es significativo encuestar y a quién no? En este sen-
tido, la decisión de las cuotas (muestreo por cuotas) o dónde hacer la encuesta y cómo (si
mejor por teléfono, si mejor en la sinagoga, si en el mercado) o a qué personas ir a llamar
primero, para que sean ellas las que nos redirijan a otros informantes, es algo que se hace
conjuntamente entre todas las personas implicadas en la investigación. Las decisiones siem-
pre están regidas por pretensiones de validez, nunca por la posición de poder que ocupe en
ese determinado momento alguna de las personas implicadas en la investigación. De hecho,
el poner en el centro los argumentos basados en esta serie de principios es una forma de evi-
108
tar el sesgo que pueda derivarse de una posición partidista o tendenciosa de una persona (o
grupo de personas) que piensen que “saben” mucho, pero que justifiquen ese conocimien-
to por la posición que ocupan, no por el conocimiento en sí.
• ¿En qué se diferencia la muestra de la población? ¿Qué sentido tiene trabajar con la
muestra?
• Si asumimos un error del 0,7 y queremos hacer un estudio sobre los posibles votos de
un partido político, ¿qué tamaño deberá tener la muestra para garantizar este margen
de error (a = 0,05)?
• Describe las diferentes técnicas de muestreo aleatorias y no aleatorias.
• ¿Qué aportaciones ofrece la orientación comunicativa en las técnicas de muestreo?
109
6
Estadística inferencial.
Conceptos básicos
6.1. Distribución muestral y error típico
Cuando estábamos trabajando con la estadística descriptiva, vimos que un conjunto de datos
pueden ser descritos mediante las medidas de tendencia central, las de dispersión y final-
mente las de posición. Este tipo de medidas se puede aplicar tanto a la muestra como a la
población. Si hablamos de la muestra, por lo general tenemos todos los datos que hemos
recabado y salvo errores debidos a alguna codificación que no sea correcta, podemos saber
con todo grado de precisión los valores tanto de la media aritmética, como de la varianza y
desviación típica. Ahora bien, conocer exactamente estos valores en el caso de la población
es mucho más difícil, porque habitualmente no tenemos información de toda la población.
En ese caso, los datos de la muestra nos tienen que servir para averiguar la distribución de
los valores de tendencia central y de dispersión en el conjunto de la población.
Pongamos que tenemos una variable x. Podemos estudiar esta variable en la población
en la que tenemos un determinado tamaño (N) y en la que podemos calcular unos deter-
minados índices, que genéricamente reciben el nombre de parámetros: media (m), varianza
(s2), desviación típica (s) o, si la variable fuese cualitativa con dos categorías, los valores de
p y q. Incluso podemos interesarnos por el tipo de distribución que sigue esta variable (pon-
gamos que la normal). Todo este estudio se refiere a la distribución de la variable x en la
población.
También podríamos extraer de esta población un número indefinido de muestras al azar
de un determinado tamaño (n) y calcular en cada muestra los mismos índices que había-
mos calculado en la población: media (x–), varianza (S2), desviación típica (S), proporciones
observadas (p0, q0).
Estos índices obtenidos en las muestras reciben el nombre genérico de estadísticos. Esta-
ríamos haciendo el estudio de la distribución de la variable x en la muestra. Otra cosa
importante sería si nos interesase estudiar la distribución de un determinado estadístico en
111
las muestras extraídas al azar de la población. En este caso lo que nos interesa no son los
valores de la variable x, sino los del estadístico en cuestión, de su distribución. Esto es lo que
se llama distribución muestral de dicho estadístico.
DISTRIBUCIÓN DE X EN LA POBLACIÓN: (DISTRIBUCIÓN POBLACIONAL)
N
µ
2
p
q
µ X
DISTRIBUCIÓN DE X
EN LAS MUESTRAS: n1 n2 n3 n4 n5 ni
(DISTRIBUCIÓN EN UNA O X1 X2 X3 X4 X5 Xi
VARIAS MUESTRAS) S21 S22 S 23 S24 S 25 S2i
S1 S2 S3 S4 S5 Si
po1 po2 po3 po4 po5 poi
qo1 qo2 qo3 qo4 qo5 qoi E
R
R
O
R
DISTRIBUCIÓN MUESTRAL T
Í
P
DE ESTADÍSTICOS : I
C
O
DISTRIBUCIÓN M UESTRAL DE MEDIAS:

DISTRIBUCIÓN MUESTRAL DE PROPORCIONES:
Figura 6.1. Distribución muestral.
Pongamos que la variable sea cuantitativa y nos interesa estudiar las medias observadas
en muestras extraídas al azar de la población. Estaríamos ante la distribución muestral de
medias de la que podemos calcular la media (sería la media de las medias observadas, cuyo
σ
valor es x–x– = m) y la desviación típica (de las medias observadas, cuyo valor es σ x = ).
n
112
Capítulo 6: Estadística inferencial. Conceptos básicos
A esta desviación típica del estadístico se la llama error típico (en este caso error típico de
la media).
Si la variable fuese cualitativa con dos categorías que tengan proporciones p y q, podría-
mos estudiar la distribución muestral de proporciones que tendría también una media
(x–xpo = p) y una distribución típica (en este caso sería el error típico de proporciones cuyo
pq
valor es σ po = ).
n
De modo similar se podrían estudiar las distribuciones muestrales de otros estadísticos
(varianza, etc.), igual que hablamos de errores típicos de la media y de las proporciones, tam-
bién podemos hablar de errores típicos de otros tipos de distribuciones muestrales, tales
como la mediana, los cuartiles, la desviación semiintercuartil, los deciles, etc. (Visauta y
Batallé, 1986).
6.2. Teorema del límite central
La tendencia que tienen los estadísticos obtenidos en las muestras a agruparse en torno al
valor del parámetro y la forma de su distribución se explica con el teorema del límite cen-
tral. La primera versión de este teorema fue propuesta por De Moivre en su libro The doc-
trine of chances, de 1733 (De Moivre, 1967). Sin embargo, la generalización de este teore-
ma se la debemos tanto a Laplace como a Gauss. El teorema del límite central (para cuya
comprensión se precisa saber matemáticas superiores) demuestra que:
a) Los estadísticos observados en las muestras tienden a agruparse en torno al paráme-

tro. O sea que la media de las medias observadas ( x–x– ) es la media de la población
origen (m) y la media de las proporciones observadas (po) es el valor de la proporción
de la población (p) de donde provienen las muestras.
Sin necesidad de saber matemáticas superiores parece de sentido común que los
estadísticos observados, si no exactamente iguales, sean similares al parámetro de la
población de la que proceden. Así, si en la población origen la talla media es 175, lo
lógico y normal es que las medias observadas tengan valores alrededor de 175 (y no
alrededor de 121 o 197). De modo similar, si una asignatura es aprobada por el 65%
(el valor del parámetro en la población de alumnos que cursan la asignatura), si extrae-
mos grupos o muestras de alumnos es también lógico y normal que la proporción
de aprobados en dichas muestras esté alrededor de 0,65 y no de 0,9 o 0,2.
b) Los estadísticos están tanto más agrupados en torno al parámetro cuanto mayor es
el tamaño de la muestra. Es decir, que cuanto mayor es n menor dispersión, menor
error típico (sx– es inversamente proporcional al valor de n y spo es inversamente
proporcional a la raíz cuadrada de n). Dicho de otra manera, ¿a qué se debe que los
estadísticos no sean iguales al parámetro, sino que estén más o menos dispersos en
torno al parámetro? A la influencia del azar en el muestreo. Como la influencia del
113
azar disminuye a medida que aumenta n eso hace que los estadísticos también estén
más agrupados alrededor del parámetro.
c) Si las muestras son grandes (aproximadamente alrededor de 30 o más) la distribu-
ción muestral tiende a ser simétrica, en forma de campana..., es decir, a seguir una
distribución normal. También ocurre, aunque la muestra sea pequeña, siempre y
cuando la variable siga una ley normal en la población origen. Pero no siempre ocu-
rre así; la distribución muestral puede seguir otras leyes de probabilidad, tales como
la t de Student-Fisher, la c2 de Pearson o la F de Snedecor.
d) Se pueden considerar distribuciones muestrales no solo de estadísticos sino también
de diferencias, razones, etc. entre estadísticos.
6.3. Distribución muestral de medias (variables cuantitativas)
La distribución muestral de medias para muestras grandes sigue la ley normal. Como hemos
visto más arriba, al extraer al azar una muestra de tamaño “n”, de una población con media
“m” y varianza “s2”, las observaciones de la muestra son variables aleatorias. Si hacemos la
media de las medias ( x–x– ) eso nos da como resultado el parámetro (m) y cuanto mayor sea
el tamaño de las muestras más agrupadas estarán las medias observadas ( x–) alrededor del
parámetro (m).
Como ya sabemos, la distribución muestral de medias sigue una ley normal cuya media
es el parámetro ( x–x– = m) y su desviación o error típico es: σ x = σ .
n
¿Qué ocurriría si cambiamos el tamaño de la muestra? ¿Tiene alguna incidencia sobre el
error típico de muestras? ¿Ese error va a variar? Ya hemos visto que sí, que, teóricamente, cuan-
to más grande es el tamaño de la muestra, menor es el error. Veamos un ejemplo. Supongamos
que tenemos una población con media aritmética igual a 10 y una desviación típica igual a 2.
m = 10 y s = 2
Si seleccionamos una muestra de 25 individuos, entonces, al calcular el error típico de

la muestra, obtenemos lo siguiente:

 X x = µ = 10
Si n = 25 
 →
σ x = 2 = 0, 4
 25
Como se puede ver, el error típico aquí es de 0,4. Pero, ¿qué pasa si seleccionamos una
muestra de 100 individuos? ¿Se produce algún tipo de cambio? Según hemos dicho, debe-
ríamos esperar que el error fuera más pequeño. Veamos:
114

 X x = µ = 10
Si n = 100 
→
σ x = 2 = 0, 2
 100
Efectivamente, al hacer los cálculos pertinentes, vemos que el error típico en este caso
es de 0,2. Ha disminuido sensiblemente. Si continuamos aumentando el tamaño de la mues-
tra, el error todavía disminuye más.

 X x = µ = 10
Si n = 400 
 →
σ x = 2 = 0,1
 4 100
Sin embargo, hay que tener en cuenta que a partir de un cierto número de individuos,
aumentar la muestra no proporciona grandes disminuciones del error típico. Es decir, que
siempre hay una especie de “techo” a partir del cual el error va disminuyendo muy lenta-
mente y se necesitan cada vez más individuos para lograrlo (recordar la regularidad estadís-
tica o ley de los grandes números).
El error típico disminuye porque, a medida que aumenta “n”, la influencia del azar es
menor y, por tanto, hay menos parte de la variabilidad que estamos observando debida al
azar. En cambio, cuanto menor sea el tamaño de la muestra la influencia del azar es mayor.
6.4. Distribución muestral de proporciones

(variables cualitativas con dos categorías, p, q)
Igual que en el caso de las medias podemos hablar de una distribución muestral, lo mismo ocu-
rre cuando se trata de proporciones. De la misma manera que antes, también podemos decir que
sigue la ley normal. La media de las proporciones observadas es el parámetro ( –x po = p).
La desviación típica, el error típico, vale σ po = pq . Igual que en el caso de la dis-
n
tribución de las medias, aquí también ocurre que el tamaño de la muestra tiene una rela-
ción inversa con el error típico: a muestras más grandes, menor es el error; a muestras más
pequeñas, el error aumenta, porque dejamos más cabos sueltos al azar. El siguiente ejemplo
ilustra perfectamente esta característica.
p = 0,6  X = p = 0,6
n = 25 
po
 → 0,6 ⋅ 0,4

 σ po = = 0,0979
 25
115
 X = p = 0,6
n = 100 
po
→  0,6 ⋅ 0,4

 σ po = = 0,0490
 100
 X = p = 0,6
n = 400 
po
→  0,6 ⋅ 0,4

 σ po = 4 = 0,0245
 100
6.5. El diseño experimental
El avance del conocimiento muchas veces viene regido por la realización de experimentos.
Tradicionalmente la ciencia se ha nutrido de los aprendizajes que se han realizado a partir
de situaciones experimentales. Arquímedes, Eratóstenes, Copérnico, Galileo, Newton, Caven-
dish, Maxwell, Darwin, Millikan, Einstein, Bohr, Heisenberg y tantos otros que no cabrían
aquí han sido científicos de renombre que han realizado grandes aportaciones al conoci-
miento y han usado la experimentación, o se han basado en experimentos hechos por otras
personas, como herramienta para lograr desentrañar y comprender los recovecos de la natu-
raleza. La experimentación también es una herramienta en estadística. O, dicho más correc-
tamente, la estadística también tiene técnicas que permiten realizar experimentación.
El diseño experimental es propio del método científico. Como tal, en el método cien-
tífico se producen observaciones que nos llevan al planteamiento de un problema de inves-
tigación. Este problema se concreta en una serie de hipótesis (hipótesis nula y alternativa)
que resumen cuál es nuestra idea de cómo funcionan las cosas. Una vez que se tienen las
hipótesis, existen métodos científicos que nos permiten contrastarlas y ver si eran o no correc-
tas (podemos aceptar la hipótesis nula y rechazar la alternativa, o al revés). La interpretación
de ese análisis es lo que puede permitir un avance, o no, del conocimiento.
No obstante, los criterios éticos de la comunidad científica internacional plantean que
no es lo mismo investigar cosas, animales y personas. Estos criterios son muy tenidos en
cuenta en las evaluaciones éticas de los proyectos presentados a los Programas Marco de
Investigación Científica Europea, aunque desgraciadamente hay países en que todavía se
obvian. Uno de esos criterios es el acuerdo claramente informado y voluntario de los suje-
tos investigados, si son menores, también de sus familiares. La orientación comunicativa tie-
ne muy en cuenta esos criterios y esa es una de las razones por las que es tan valorada inter-
nacionalmente. Por suerte, cada vez más familiares, estudiantes y organizaciones rechazan
las metodologías de investigación que vienen a pedirles información (incluso siendo meno-
res) y desaparecen.
116
La historia de la ciencia muestra que el avance del conocimiento no ha sido una tarea
individual. Es la obra colectiva de cientos de personas que han realizado contribuciones (y
contribuciones sobre contribuciones) al conocimiento, en un proceso de acumulación e inte-
gración. La experiencia empírica de generaciones y generaciones de personas, transmitida
de unas a otras, nos ha traído hasta donde estamos. Por tanto, se trata de un proceso que
podríamos calificar como dialógico, en el sentido de que el conocimiento es la consecuen-
cia del intercambio entre cientos y cientos de personas, a lo largo del tiempo. Teniendo en
cuenta este punto de vista epistemológico, si volvemos al campo de la estadística inferen-
cial, el proceso de generación de conocimiento también debería ser dialógico.
Habitualmente, en los manuales de estadística se nos presentan las diferentes técnicas y
procedimientos inferenciales de la estadística. En este libro queremos llamar la atención
sobre las técnicas (que vamos a introducir en los capítulos siguientes); las queremos enten-
der en el marco de un enfoque comunicativo crítico basado en el diálogo. A diferencia de
la investigación objetivista (o positivista), desde el enfoque que defendemos aquí, procedi-
mientos como el diseño experimental implican la inclusión de la voz de todas las personas
implicadas en el estudio, no solo de aquellas personas que consideramos “expertas” porque
tienen una serie de conocimientos de estadística.
La propuesta de hipótesis, la construcción del modelo explicativo y la interpretación de
los datos de una manera coherente es tarea de todas las personas involucradas en la investiga-
ción. ¿Quiénes mejor que las personas que viven en La Mina (un barrio barcelonés conocido
por la exclusión social y laboral que padece) para participar en la propuesta de modelos que
expliquen por qué La Mina se encuentra en la situación en la que está? ¿Quiénes mejor que
ellos para aportar conocimiento sobre el significado de los números que arroja el SPSS?
Las personas que sabemos cómo usar el SPSS tenemos la responsabilidad ética y moral
(como dice Chomsky) de usar esos conocimientos para entrar en diálogo con la sociedad y
contribuir a la superación de las situaciones de exclusión y desigualdad o generar conoci-
miento sobre nuestro mundo. Un ejemplo concreto de esto es la investigación I+D titula-
da AMAL: inmigración y mercado laboral (CREA 2001-2005). Este estudio estaba dirigido
a averiguar la situación laboral de las personas inmigrantes musulmanas o árabes. A lo lar-
go de la investigación, siempre hubo comités asesores formados por personas inmigrantes
árabes y/o musulmanas que leían y discutían los resultados preliminares de la investigación,
para ver si tenían coherencia con su propia experiencia.
Desde el punto de vista cuantitativo, y en concreto de la estadística, personas árabes o
musulmanas, representativas del colectivo (no por el nivel de estudios, sino por su posición
en la comunidad), participaron tanto en la selección de la muestra (dando entrada a espa-
cios a los que de otra manera hubiera sido imposible acceder y, por tanto, su omisión hubie-
ra causado un sesgo profundo en la muestra), como en el diseño de los instrumentos de reco-
gida de datos (cuestionarios) y la validación del modelo de hipótesis. La inclusión crítica de
todas las personas involucradas en la investigación es clave para llegar a resultados coheren-
tes (especialmente en el ámbito de las ciencias sociales y de la educación, donde se trabaja
con personas, no con entidades físicas que son susceptibles de manipulación y control ad
eternum).
117
• ¿Qué utilidades tiene la estadística inferencial en la investigación educativa?

• Define los siguientes conceptos: estadístico, parámetro, distribución muestral, error
típico,
• ¿Según el teorema del límite central qué características tiene la distribución muestral?
• Calcula el error típico en una muestra de 50 estudiantes procedentes de una pobla-
ción con media aritmética en sus expedientes académicos igual a 6,5 y una desviación
típica igual a 0,75. ¿Y en una muestra de 250? ¿Qué sucede con el error típico?
• Calcula el error típico en una muestra de 35 estudiantes procedentes de una pobla-
ción donde el 68% responde afirmativamente a una cuestión.
• ¿Qué podemos hacer para disminuir el error típico?
118
7
Teoría de la estimación
7.1. ¿Qué es la estimación de parámetros?
Cuando hacemos investigación, trabajamos con poblaciones de las que no tenemos una
información completa. Siempre hay algún parámetro que desconocemos. Pero esto no tie-
ne por qué ser un problema, porque la estadística nos da herramientas para poder suponer
cuál es el valor de esos parámetros. A eso es a lo que se le llama estimación.
Un estimador es un valor que se calcula a partir de los datos de la muestra

y que nos da información sobre el valor del parámetro.
La Teoría de la estimación estadística trata de la estimación de parámetros a partir de

los estadísticos. Se basa en los conceptos de distribución muestral y error típico o error están-
dar. Como muchas de las distribuciones muestrales siguen una Ley Normal, de la que cono-
cemos la media (el parámetro) y la desviación típica (error típico o estándar), podemos resol-
ver cualquier problema de probabilidad sin necesidad de resolver integrales, simplemente
utilizando la tabla de la Ley Normal Estándar (centrada y reducida: mZ = 0, sZ =1).
7.1.1. Intervalo de probabilidad
Es un intervalo (simétrico) alrededor de un parámetro que contiene una proporción 1 – a

de los estadísticos de la distribución muestral.
119
Figura 7.1. Intervalo de probabilidad.
Por convenio en ciencias humanas y sociales el valor de a suele ser:
a = 0,05 (5%)
a = 0,01 (1%)


Por lo que: 1 – α Si α = 0, 05 1 – α = 0, 95 (95%)
Si α = 0, 01 1 – α = 0, 99 (95%)
El intervalo de probabilidad permite predecir con un riesgo a (0,05 o 0,01) de equivo-
carse, los límites dentro de los cuales se encontrarán, partiendo de un parámetro poblacio-
nal, los 1 – a (0,95 o 0,99, 95% o 99%) de los estadísticos observados en muestras de tama-
ño n extraídas al azar de la población.
Dicho en otras palabras, el intervalo de probabilidad contiene dentro de sus límites
1 – a (0,95 o 0,99, 95% o 99%) de la distribución muestral.
Para hacer una estimación (es decir, para ver si el valor que nosotros tenemos en la mues-
tra es el mismo que aparecería en la población total) podemos actuar de diferentes mane-
ras. Se puede hacer lo que se llama estimación puntual. Tomamos un valor de la muestra y
proponemos el valor del parámetro poblacional. Se demuestra matemáticamente que, en
general, la mejor 2
– 2 estimación puntual de un parámetro (m, s , s, p) es su estadístico corres-
pondiente (X, S , S, po), especialmente si trabajamos con muestras grandes (n ≥ 30).
Tenemos que tener mucha suerte de que ambos valores coincidan, porque lo más nor-
mal es que eso no ocurra. Siempre habrá una variación entre el estadístico que tenemos en
nuestra muestra y el valor de la población (parámetro). Desde luego, cuanto mayor sea la
muestra, mayor será la probabilidad de que hayamos acertado. Sin necesidad de recurrir a
matemáticas superiores es de sentido común que el mejor estimador de un parámetro (m,
s2, s, p) sea su correspondiente estadístico (x–, S2, S, po). Si, por ejemplo, la media que hemos
calculado en la muestra con la que trabajamos tiene un valor de 27 y nos preguntasen cuál
es la media de la población origen, lo lógico es que digamos que es 27 porque la muestra la
hemos extraído de la población y lo normal es que se parecieran. Además, porque es el úni-
co valor que tenemos. A nadie se le ocurriría afirmar que la media de la población es 67; lo
120
Capítulo 7: Teoría de la estimación
tomarían por loco. El problema es que si nos preguntan ¿con qué seguridad afirmamos que
la media de la población sigue el 27?, no tengamos una respuesta adecuada.
Otra opción es hacer una estimación por intervalos. En vez de coger un único punto,
vamos al gráfico y tomamos un intervalo y, a partir de ese intervalo, decimos que, con tal o
cual probabilidad, pensamos que el valor que estamos buscando está dentro de sus límites.
Al tomar un intervalo, en vez de una estimación puntual, es bastante más fiable acertar. Es
más fiable decir “el número que busco está entre el diez y el veinte” que decir “el número
que busco es el trece”. Cuando decimos “trece” estamos apostando todas nuestras cartas a
un único valor. En cambio, si decimos “entre diez y veinte” tenemos diez posibilidades de
acertarla. Además, en el caso de variables continuas, como podría ser la altura, es una mane-
ra de asegurar que no nos equivocamos, puesto que, como hemos visto, la probabilidad de
tener exactamente una medida es prácticamente nula. El intervalo que utilizamos para hacer
esta estimación por intervalo se llama intervalo de confianza.
7.1.2. Intervalo de confianza
Se trata de un intervalo (simétrico) alrededor de un estadístico que tiene una probabilidad

1 – a (generalmente 0,95 o 0,99) de contener el parámetro.
Figura 7.2. Intervalo de confianza
Un intervalo es un valor lineal que queda definido por sus dos límites (superior e infe-
rior). Los límites del intervalo de confianza fueron denominados por R. A. Fisher, límites
de confianza o límites fiduciales.
También se basa en los conceptos de distribución muestral y error típico. Como ésta
sigue la ley normal (para muestras grandes) el:
123
95% = (1 – a = 0,95) está comprendido entre + 1,96 Z

99% = (1 – a = 0,99) está comprendido entre + 2,58 Z En general, ± Za/2
121
Cuanto más movamos los extremos de los intervalos hacia los extremos (es decir, cuan-
to más grande sea el intervalo), mayor será la probabilidad de que el parámetro esté dentro
de dicho intervalo. De la misma manera, cuanto más estrechemos el intervalo, menor es
dicha probabilidad. De nuevo, la decisión es un tema de tiempo y presupuesto. El concep-
to que subyace es el de potencia de un contraste que se tratará más adelante.
7.2. La estimación de una proporción
Una aplicación habitual de la teoría de la estimación es utilizarla para establecer la propor-

ción de la población que tiene una determinada característica. Por ejemplo, podemos estar
trabajando en una empresa de sondeos, y nos encargan hacer una estimación de qué pro-
porción de los socios del Barça votará por Rosell, cuántas personas en cambio votarán por
Ingla, cuántas dejarán su voto a Ferrer o cuántas se decantarán por la candidatura de Bene-
dito. En este caso, lo que tenemos que hacer es estimar las proporciones de la tendencia de
voto de las personas socias del Barça.
Para hacerlo, el procedimiento consiste en tomar una muestra de los socios del Barça y
ver cómo están distribuidas las tendencias de voto entre las personas que forman parte de
la muestra. Ahora bien, la pregunta es ¿a cuántas personas les tenemos que preguntar? Es
decir, ¿de cuántas personas tiene que ser la muestra?
Peña y Romo (2003) comentan que el principio fundamental de cualquier estimación es:
“Un estimador debe ir siempre acompañado de una medida de su precisión” (Peña y

Romo, 2003, p. 280).
Tal y como explican ambos autores, no es lo mismo tomar una muestra reducida de per-
sonas, y hacer una estimación sobre esa muestra, que tomar prácticamente toda la pobla-
ción. Ellos lo ilustran con tres ejemplos: el caso de estimar la probabilidad de sacar cara al
tirar una moneda que se lanza 10 veces, el caso de estimar la proporción de votantes al par-
tido A en una muestra aleatoria de 2.000 personas y el caso de conocer la proporción de
estudiantes a los que les gusta el teatro, en una clase de 90 estudiantes, de donde se extrae
una muestra de 60 de ellos. Los resultados hipotéticos que ofrecen en su ejemplo (supon-
gamos que en el primer caso, salen 3 caras de 10 lanzamientos; que en el segundo 600 per-
sonas afirman que votarán al partido A; y que en el tercero 18 estudiantes afirman que les
gusta el teatro) coinciden en suponer todos ellos un 30% del total de la muestra.
Sin embargo, advierten Peña y Romo (2003), no es lo mismo un 30% sobre un total
de 10 veces que tiras la moneda, que un 30% en el caso de los estudiantes a los que les gus-
ta (o no) el teatro. En este último caso, tenemos prácticamente a toda la población, con lo
cual, el porcentaje estimado del 30% seguramente coincide mucho más con el porcentaje
real de estudiantes a quienes les gusta el teatro. En otras palabras, es un dato mucho más
preciso. Por tanto, siempre que trabajemos con estimaciones, tenemos que pensar también
en dar una medida de precisión para juzgar lo fiable que sea el dato (o no).
122
Capítulo 7: Teoría de la estimación
7.2.1. Estimadores centrados
Tal y como decíamos en el capítulo anterior cuando hablábamos de la distribución muestral

de la proporción, si repetimos el mismo experimento el número suficiente de veces, al final
llegaremos a obtener la distribución muestral de dicho experimento. Por ejemplo, si queremos
averiguar cuál es la proporción de caras que salen al tirar una moneda al aire 10 veces, si repe-
timos ese experimento varias veces, nos van a salir resultados diferentes: 3 caras y 7 cruces, 4
caras y 6 cruces, 5 caras y 5 cruces, 8 caras y 2 cruces, etc. Si repetimos un número suficiente
de veces este experimento (por ejemplo, 100 veces, o 1.000 veces, etc.), al final obtendremos
una distribución que seguramente tenderá a corresponder a una curva parecida a ésta:
Figura 7.3. Estimadores centrados
A medida que fuéramos repitiendo el experimento, la curva se iría pareciendo más y

más a una normal.
Así las cosas, lo que nos interesa averiguar es si la proporción que hemos encontrado en
nuestra muestra (escogida al azar) se corresponde o no con los valores promedio que toman
las proporciones en la población. Para hacerlo usamos lo que se llama error típico de la esti-
mación, que es la desviación que en promedio esperamos obtener entre la proporción en la
población de aquello que estamos intentando estimar (por ejemplo, el número de caras al
lanzar una moneda 10 veces) y el valor del estimador (lo que nos ha salido al hacer el expe-
rimento 100 veces, pongamos por caso).
Por tanto, para variables cualitativas:
pq
σ po =
n
Donde spo es el error típico de la estimación.
p, q son los valores de las proporciones en la población.
n es el tamaño de la muestra.
123
7.3. Estimación de una media
Todo lo que venimos explicando se puede aplicar al caso de que queramos estimar el valor
medio de algún fenómeno que estemos estudiando. Por ejemplo, puede resultar que nos
interese saber cuál es el sueldo medio de los funcionarios, para compararlo con los sueldos
medios de otras categorías profesionales y así saber si una rebaja del gasto público en sala-
rios es una medida de contención presupuestaria adecuada o no. Nos puede interesar ave-
riguar cuál es la edad media en la que las mujeres tienen su primer hijo, para pensar en apli-
car una determinada política social. O incluso también podemos aplicar estos razonamientos
para el caso de que estemos analizando las notas medias que sacan los estudiantes en escue-
las situadas en barrios con unas determinadas características.
En cualquier caso, los cálculos son semejantes a lo que venimos explicando hasta aho-
ra: se toma una muestra al azar y se usa para hacer una estimación de la media. Esa estima-
ción siempre tiene que venir acompañada de una medida de precisión, para saber cuán fia-
ble sea.
Igual que en el caso de la proporción, en este caso nos interesa saber si nuestra media corres-
ponde o no con la media poblacional. Para ello, mediremos la variabilidad (las diferencias)
entre lo que hemos observado en nuestra muestra y la desviación que tiene la población.
Por tanto, para variables cuantitativas:
σ
σ =
x n
Donde sx– es error típico de la estimación.
s es desviación típica de la población.
n es el tamaño de la muestra.
• ¿En qué consiste la teoría de la estimación estadística y qué aportaciones supone para
la investigación educativa?
• ¿En qué difieren la estimación puntual y la estimación por intervalo?
• ¿Qué es el error típico de la estimación y cómo puede calcularse?
124
8
Teoría de la decisión
(contraste de hipótesis)
Una de las aplicaciones más interesantes de la estadística inferencial es que nos ofrece herra-
mientas que sirven para decidir si algo que estamos suponiendo es o no es cierto. Esto es lo
que se conoce como contraste de hipótesis. Trata de la toma de decisiones en Estadística. Se
basa en los conceptos de distribución muestral y error típico. Cuando realizamos una inves-
tigación, una de las formas de avanzar en el conocimiento es establecer una afirmación sobre
una determinada relación (hipótesis) y luego comprobar, a partir del análisis de nuestras
observaciones, si dicha hipótesis es cierta o no lo es. Contrastar una hipótesis es comparar
las predicciones que salen de aplicar dicha hipótesis con los datos reales observados. Si cuan-
do hacemos esta comparación existe coincidencia, entonces eso significa que nuestra hipó-
tesis es correcta (y por tanto, la aceptamos). En cambio, cuando las diferencias son sufi-
cientemente grandes, entonces no aceptamos nuestra hipótesis de partida.
8.1. Algunos conceptos básicos
Una hipótesis es una proposición o afirmación, que relaciona de forma concreta variables,
cuya naturaleza no conocemos con absoluta certeza y que, justamente por ello, se plantea
en términos de conjetura, algo que posiblemente es cierto, algo a verificar. Tal y como dice
Peña (1986), “llamaremos hipótesis estadística a una suposición que determina, parcial o
totalmente, la distribución de probabilidad de una variable aleatoria” (p. 196). Eso quiere
decir que una hipótesis es una afirmación que decimos sobre la variable que estamos estu-
diando.
Por ejemplo, si estamos estudiando los resultados de matemáticas de esos estudiantes de
quinto de primaria, podemos hacer la hipótesis de que cierto grupo de alumnado tiene unos
resultados peores que el resto de la población. También podemos plantear la hipótesis de
125
que las diferencias entre los datos que hemos recogido de este grupo y el de la población en
general son debidas al azar y no son significativas. Muchas veces en la prensa, por ejemplo,
vemos afirmaciones del tipo: “los estudiantes españoles obtienen peores resultados en com-
prensión lectora que la media de la OCDE”. Y aquí nos quedamos (o aquí se queda la pren-
sa), porque pocas veces se añade “con un tanto por ciento de probabilidad de ser cierto y
tanta otra probabilidad de equivocarnos al hacer esta afirmación”. El contraste de hipótesis
sirve para establecer los intervalos en los que nuestras afirmaciones tienen una cierta pro-
babilidad de ser correctas.
Para ello necesitamos un sistema muy sencillo de hipótesis, las llamadas hipótesis nula e
hipótesis alternativa.
• Hipótesis nula (H0): la que nos planteamos a priori a verificar y que “aceptamos” o
rechazamos tras el análisis estadístico de los datos. Suele ser la hipótesis de que las
cosas son según se pensaba y que, por tanto, no se aporta un cambio significativo en
nuestra forma de verlo (diferencia estadísticamente nula o no significativa, suficien-
temente pequeña como para poder ser explicada por el azar)
• Hipótesis alternativa (H1): es la complementaria (no solo la contraria) de la H0 (dife-
rencia estadísticamente distinta de cero o significativa: lo bastante grande o diferen-
te de cero como para que no se pueda explicar solo por el azar).
El contraste de hipótesis construye con herramientas matemáticas un modelo de com-

portamiento de la variable (o variables) que estamos estudiando y verificar los intervalos de
confianza para determinados niveles de probabilidad de acertar en nuestra predicción, o de
equivocarnos.
8.2. Un ejemplo de la utilidad del contraste de hipótesis
Gonick y Smith (1993), en un conocido libro divulgativo sobre estadística, explican la impor-
tancia del contraste de hipótesis mediante un ejemplo: la selección de los miembros del jura-
do que se realizaba en el Sur de Estados Unidos entre los años 1960 y 1980. Los autores
relatan cómo, a pesar de que en teoría la selección de personas para formar parte de los
miembros del jurado era algo aleatorio (en principio), a partir de una lista de ciudadanos
que podían ser elegidos, la realidad era que en las listas de miembros del jurado en los esta-
dos del Sur de Estados Unidos había muy pocos ciudadanos afroamericanos. ¿Cómo era eso
posible?
Según Gonick y Smith (1993) algunos abogados cuestionaron el sistema y lo acusaron
de racista. La realidad era que la mitad de la población susceptible de formar parte de los
jurados eran ciudadanos afroamericanos. Pero, a pesar de eso, solo 4 de cada 80 miembros
de jurados pertenecían a este colectivo. Ante esta situación, la pregunta que se hacían los
abogados críticos es si eso podía ser posible.
126
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
En un caso como este, se supone que la selección para ser miembro del jurado debería
ser aleatoria. Si eso es cierto, dadas las circunstancias, la variable que nos interesa (“ser ele-
gido como miembro del jurado”) es una variable aleatoria binomial, con n = 80, y una pro-
babilidad de “ser ciudadano afroamericano” de p = 0,5 (es decir, la mitad de los ciudadanos
susceptibles de entrar en el proceso de selección). Si esto es cierto, entonces la probabilidad
de seleccionar solo 4 miembros que sean afroamericanos [p(x ≤ 4)]) es algo así como
0,000000000000000014 (Gonick y Smith, 1993: 139).
Algo imposible de aceptar, dadas las circunstancias. Por tanto, la conclusión aquí es
rechazar la hipótesis de la selección aleatoria: la selección en este caso no era aleatoria.
Por lo tanto, se debía rechazar la hipótesis nula (la selección era aleatoria) y considerar la
hipótesis alternativa como cierta (la selección no provenía de métodos aleatorios). La esta-
dística (el contraste de hipótesis, más bien) fue una prueba de peso contra la supuesta
democracia del proceso de selección y demostró el racismo imperante en el Sur de Esta-
dos Unidos.
8.3. ¿Cómo se hace un contraste de hipótesis?
El contraste de hipótesis sirve para tomar decisiones. Es un procedimiento que nos sirve
para decidir cuándo un dato es creíble o no lo es. Por ejemplo, supongamos que somos soció-
logos y nos han encargado un estudio en una clase de una escuela donde sabemos que la
desviación típica de las notas que obtienen los estudiantes en los exámenes de inglés es de
2,4. Tomamos una muestra de 23 estudiantes del total de alumnos, los cuales han sacado
una nota media en inglés de 5,6 puntos. ¿Nos sirven estos datos para afirmar que la nota
media del total de alumnos fue diferente de 6? El contraste de hipótesis nos da herramien-
tas estadísticas para tomar una decisión en situaciones como ésta. ¿Cómo?
Lo primero que tenemos que hacer es establecer nuestras hipótesis de trabajo. En este
caso, como lo que queremos saber es si la media de las notas obtenidas por el conjunto de
la clase fue diferente de 6. Para saberlo, tenemos que plantear el modelo de hipótesis:
H0 es: m = 6. Esto significa que la nota media no ha variado (respecto a una nota media
teórica de 6).
H1 es: m ≠ 6. La nota media sí ha variado (en más o en menos).
Supongamos que la distribución que siguen los resultados académicos de los estudian-
tes de esta materia es una curva normal: es decir, que la mayor parte tenderán a sacar notas
parecidas, que algunos sacarán muy buenas notas y que otros pocos sacarán notas pésimas.
Entonces, nos encontramos con una representación gráfica como la que sigue:
127
Figura 8.1. Test de hipótesis.
Se trata de una representación gráfica que corresponde a un contraste de hipótesis bila-

teral. Eso significa que la “zona de rechazo de la hipótesis nula” se reparte entre los dos extre-
mos de la curva de Gauss (es lo que se llama una probabilidad a “dos colas”).
En esta representación gráfica podemos distinguir diferentes elementos. Por un lado, la
parte central del intervalo que delimita la zona de la curva (llamada 1 – a), que es la zona de
“aceptación de la hipótesis nula”. Es el intervalo dentro del cual aceptamos dicha hipótesis.
En cambio, cuando salimos de ese intervalo hacia cualquiera de los dos extremos, entra-
mos en la zona de rechazo de la hipótesis nula. Es en ese caso cuando aceptamos la hipóte-
sis alternativa.
La zona de aceptación viene marcada por un intervalo, que son los valores máximo y
mínimo que delimitan la “región de aceptación”. Si cuando hacemos los cálculos pertinen-
tes, resulta que la solución nos da un valor que cae fuera de la “región de aceptación”, enton-
ces la consecuencia que se sigue es que rechazamos la hipótesis nula (y aceptamos la alter-
nativa), tal y como está señalado en la figura.
Para calcular la región de aceptación usamos el siguiente intervalo:
 σ σ 
 x − z a /2 ⋅ , x + z a /2 ⋅  (Para el caso de que tengamos la media)
n n
 pq pq 
 p − z a /2 ⋅ n
, p + z a /2 ⋅
n 
(Para el caso de tener proporciones)
Si volvemos a nuestro ejemplo sobre las notas de inglés obtenidas por los estudiantes, la
pregunta que se nos hacía era si podíamos decir que la media del conjunto de alumnos es de un
128
6, con un intervalo de confianza del 95%. El valor de “z” lo tenemos que buscar teniendo en
cuenta que, al ser un caso de contraste de hipótesis bilateral, ese 5% estará distribuido entre los
dos extremos de la curva (es decir, 2,5% a cada extremo). Si buscamos en la tabla de probabi-
lidades tipificada el valor que le corresponde a este valor de “z”, entonces obtendremos que para
a = 0,05, los valores críticos de za/2 son ±1,96. Apliquemos ahora la fórmula para calcular la
región de aceptación (es decir, el intervalo dentro del cual vamos a aceptar la hipótesis nula):
 2,4 2,4 
 6 − 1,96 ⋅ 36 , 6 + 1,96 ⋅ 36 
(5,22; 6,78)
Puesto que el valor de la media de nuestra muestra es de 5,6 y dicho valor se encuentra
dentro de la horquilla delimitada por los valores 5,22 por un lado y 6,78 por el otro, eso sig-
nifica que “aceptamos” (o mejor, no rechazamos) la hipótesis nula, es decir, no podemos afir-
mar que la nota media del grupo sea diferente de 6 puntos. Dicho de otra manera, como no
estamos en la región de aceptación de la hipótesis alternativa (la nota media será distinta de
6), no podemos aceptar dicha hipótesis. No afirmamos, pues, que la nota media vaya a ser de 6,
sino que con los datos que tenemos no podemos inferir que esta nota media sea distinta a 6. Es
decir, la carga de la prueba está en la hipótesis alternativa: ella tiene que demostrar que es cier-
ta, y si no lo hace, no hay ninguna razón para rechazar la hipótesis nula.
Puede darse el caso de que nos pidan hacer un contraste de hipótesis pero, que en lugar
de bilateral, sea unilateral (por ejemplo, en el caso anterior, nos podían preguntar si pode-
mos aceptar la hipótesis de que la media de toda la clase esté aprobada). Entonces, el gráfi-
co correspondiente que ilustraría la pregunta sería el siguiente:
Figura 8.2. Aceptación o rechazo de las hipótesis.
129
La lógica es la misma que en el caso anterior. Lo único que varía, es el cálculo de la región
de aceptación. Veamos un ejemplo para aclarar la idea. Supongamos que son las elecciones
municipales y que el diario local de una ciudad ha sacado un titular en el que se afirma que
el nivel de abstención no será menor del 40%. Trabajamos en el diario de la competencia y
queremos saber si podemos admitir dicho pronóstico, o no. Para ello tomamos una mues-
tra al azar de 200 personas, con derecho a voto, 75 de las cuales estarían dispuestas a votar.
La pregunta entonces sería si el pronóstico publicado por el primer diario en sus titulares es
válido, o no lo es. Lo queremos asegurar con un 1% de nivel de significación.
Dados estos datos, parece claro que en la muestra que hemos tomado hay 125 personas
que van a abstenerse de votar en las próximas elecciones. Planteemos las hipótesis.
La hipótesis nula sería: p ≥ 0,40 (es decir, que la abstención será, como mínimo, del 40%).
En cambio, la hipótesis alternativa sería: p < 0,40.
Si queremos validar el pronóstico con un nivel de significación del 1%, entonces a = 0,01
(que le corresponde un valor crítico za = 2,33). Para calcular el intervalo de confianza, tene-
mos que mirar si el valor que andamos buscando está a la izquierda o a la derecha de la línea
que delimita la curva de Gauss en dos. En nuestro caso, como lo que queremos aceptar es
que la abstención va a ser como mínimo del 40%, entonces eso significa que nos interesa
que el valor esté a la derecha de la línea vertical que divide la curva de Gauss (los valores que
van hacia el infinito positivo), porque decir “mínimo del 40%” significa 40% o más (hasta
el límite marcado por el infinito positivo).
A diferencia del contraste bilateral, en el caso del contraste unilateral, las fórmulas no
son “a dos colas”. Al contrario, como se puede observar:
 σ 
 x − z α ⋅ , ∞  (Para el caso de las medias)

n
 pq 
 p − zα ⋅ n
, ∞  (Para el caso de las proporciones)

Volviendo a nuestro ejemplo, si aplicamos la fórmula de las proporciones, tenemos que:
 0,4 ⋅ 0,6 
 0,4 − 2,33 ⋅ , ∞  = ( 0,3192; ∞ )
200 
¿Qué significa este resultado? Pues, si tomamos la proporción de personas que van a abs-
tenerse de votar en nuestra muestra (p = 125/200 = 0,625) y la comparamos con el inter-
valo que nos ha salido, vemos rápidamente que 0,625 se encuentra dentro del intervalo mar-
cado por 0,3192 por un lado e infinito positivo por el otro. Por tanto, aceptamos la hipótesis
nula, es decir, no podemos afirmar con un nivel de significación del 1% que la abstención
en las próximas elecciones municipales será menor que un 40%. No podemos contradecir
la afirmación que habíamos leído en el diario de la competencia.
130
8.4. Errores y riesgos
Al realizar un contraste de hipótesis, podemos incurrir en una serie de riesgos. Estos riesgos
están categorizados en dos tipos, según sean errores de tipo I o de tipo II.
a: De primera especie o error típico I

b: De segunda especie o error típico II
Cuadro 8.1. Tipo de errores posibles
Realidad
Decisión
H0 Verdadera H0 Falsa
Rechazar la H0 a: error típico I Decisión correcta (potencia

o de 1.a especie de un contraste 1 – b)
Probabilidad = a
No rechazar la H0 Decisión correcta b: Error típico II

(aceptar) Probabilidad = 1 – a o de 2.a especie
a: Riesgo de error conocido (fijado a priori) y pequeño, habitualmente 0,05 (5%) o 0,01
(1%).
b: Riesgo de error desconocido, porque depende de la diferencia entre el parámetro real
(m‘) y el parámetro teórico (m) y generalmente el parámetro real lo desconocemos.
La probabilidad de cometer el error típico I es el nivel de significación a. En cambio,

la probabilidad de cometer un error típico II es desconocida porque depende del valor del
parámetro real (que desconocemos). Por esto, lo que interesa confirmar lo planteamos
como H1.
8.5. Potencia de un contraste (función de potencia) (1 – b)
La potencia de un contraste es la capacidad que tiene un contraste para detectar que la hipó-
tesis nula es falsa y rechazarla. ¿Cómo podemos hacer para aumentar la potencia (1 – b) de
un contraste? Lo que nos interesa para lograrlo es disminuir el valor de b. Para lograrlo pode-
mos optar por diversos métodos:
– Aumentar el nivel de significación a.

– Aumentar el tamaño de la muestra: al hacerlo la distribución muestral tiene menos
desviación y entonces el intervalo de probabilidad se reduce y también lo hace b (sin
aumentar a).
131
Veamos un ejemplo:
m = 400
m’ = 403
s = s’= 6
a = 0,05
Si tenemos una media teórica de 400 y una media real de 403 y la sigma tanto real como
teórica es de 6.
Para una n de 36 el error típico sería 6/ 36 y la precisión:
6
e = 1, 96 = 1, 96
36
Para una n de 64 el error típico sería 6/ 64 y la precisión:

6
e = 1, 96 = 1, 47
64
Figura 8.3. Potencia de un contraste.
132
Al aumentar n (de 36 a 64) los intervalos son más estrechos y, por lo tanto, el riesgo b
(intersección) disminuye. Por lo tanto, hemos aumentado la potencia del contraste (1 – b).
8.6. El grado de significación (p)
Finalmente otro de los elementos que nos puede interesar del contraste de hipótesis es el
grado de significación (p). Se define como la probabilidad de error que obtendremos si recha-
zamos la hipótesis nula. Por lo general, en los outputs de los programas informáticos apa-
rece el dato p que sirve para la toma de decisión estadística. Si p es mayor o igual que a (el
máximo error que estamos dispuestos a asumir al rechazar la hipótesis nula), no podemos
rechazar la hipótesis nula y, por lo tanto, la aceptamos. Si p es menor que a rechazamos la
hipótesis nula y aceptamos la alternativa. Veamos un par de ejemplos de ello:
Ejemplo A:
La –x está en la zona crítica, el valor p (p/2) es menor que 1 – a (a/2), por lo tanto, la
decisión es rechazar la hipótesis nula (H0) y aceptar H1
Figura 8.4. El grado de significación (a)
Ejemplo B:
–
La x está en la zona no crítica, el valor p es mayor que a, por lo tanto, la decisión es que
nada se opone a aceptar la hipótesis nula (H0).
133
Figura 8.5. El grado de significación (b)
En general, si p es mayor o igual a a, no se rechaza la H0; y en cambio, si p es menor

que 1 – a, se acepta la H1.
8.7. Tres estrategias para tomar la decisión
Las tres estrategias posibles para tomar la decisión son: el intervalo de probabilidad, esta-
dístico de contraste, y el grado de significación. Veámoslas por partes:
1. Intervalo de probabilidad
Respecto de la primera estrategia, los pasos son:
– Calcular el intervalo
– Si estamos dentro del intervalo, entonces H0 y, si estamos fuera del intervalo, enton-
ces H1.
Esta estrategia es bastante laboriosa porque hay que calcular los límites del intervalo.
Además, si la distribución muestral no es simétrica (t de Student y F de Snedecor, por ejem-
plo) el cálculo es más complicado.
2. Estadístico de contraste
Respecto de la segunda estrategia, los pasos son:
134
– Calcular el estadístico de contraste (z, t, c2, F) con la fórmula adecuada para cada
caso.
– Buscar el valor crítico (z, t, c2, F) en la tabla.
– Si z, t, c2, F (en valor absoluto) ≤ z, t, c2, F de la tabla correspondiente, H0.
– Si z, t, c2, F (en valor absoluto) > z, t, c2, F de la tabla correspondiente, H1.
Tiene el inconveniente de que necesitamos disponer de las fórmulas (y hacer los cálcu-
los) y las tablas en las que, por más completas que sean, muchas veces no encontramos el
valor exacto que necesitamos.
3. El grado de significación
El grado de significación o significación es un concepto muy importante cuando trabaja-

mos con el SPSS. No necesitamos ni fórmulas ni cálculos porque los hace el ordenador. Ade-
más, en los outputs, nos da siempre este dato (p o “significación”). Con este dato podemos
tomar la decisión sin siquiera consultar ninguna tabla.
Si p < a, H1 (rechazamos la H0 con un riesgo a y aceptamos H1 o diferencia significa-
tiva o suficientemente grande para que no se pueda explicar solo por el azar).
Si p ≥ a, H0 (nada se opone a aceptar la H0 o diferencia no significativa, o tan peque-
ña que se puede explicar simplemente por el azar).
• ¿En qué consiste la teoría de la decisión estadística y qué aportaciones supone para la
investigación educativa?
• Define la hipótesis nula y alternativa en relación con un contraste estadístico.
• Un grupo de 150 sujetos ha obtenido en un test una media de 47 puntos con una
desviación típica de 2,5. Calcula la región de aceptación para un contraste bilateral y
unilateral (a = 0,05).
• En un sondeo de opinión sobre la credibilidad de algunos políticos, en una muestra
al azar de 1.500 sujetos, el 15% se mostraron favorables. Calcula la región de acep-
tación para un contraste bilateral y unilateral (a = 0,01).
• Describe los posibles errores y riesgos presentes en un contraste de hipótesis.
• ¿Qué es la potencia de un contraste y cómo podemos aumentarla?
• Mediante la ayuda del SPSS, verifica la normalidad de las variables cuantitativas de la
matriz que puedes descargar en www.sintesis.com, con un margen de error a de 0,05.
135
9
Comparaciones o contrastes
de medias
La teoría de la estimación y la teoría de la decisión son los pilares de la estadística inferen-

cial. Si los conceptos los tenemos claros, todo lo demás no son más que aplicaciones más o
menos complejas. Lo importante es tener las ideas claras para saber en cada caso qué prue-
ba aplicar (y pedir al ordenador que la realice) y tomar la decisión adecuada a partir de los
“outputs” que nos facilita el ordenador.
Las posibilidades de los paquetes estadísticos son inmensas. Aquí solo trataremos algu-
nas pruebas sencillas para variables cuantitativas, en concreto tres casos.
9.1. Comparación o contraste entre una media observada y una teórica
Las hipótesis estadísticas son:
– Hipótesis nula (H0): la media observada y la teórica son estadísticamente iguales.

– Hipótesis alternativa (H1): la media observada y la teórica son estadísticamente dife-
rentes.
Las decisiones:
– Si p ≥ a H0 (nada se opone a aceptar la H0)

– Si p < a H1 (rechazamos la H0 con un riesgo a y aceptamos la H1)
Veamos un ejemplo. Supongamos que en un grupo de 16 estudiantes de primero de

ESO se ha obtenido en una prueba de memoria a corto plazo las siguientes puntuaciones:
34, 32, 29, 38, 32, 31, 30, 29, 29, 28, 27, 37, 34, 28 y 33. Estos datos arrojan una media
de 31,256 y una desviación típica de 3,256.
137
Nos podemos plantear si podemos afirmar que la media de este grupo de primero de la
ESO es diferente de 30 (que sería la media teórica, por ejemplo, la que consideramos que
los estudiantes de su curso deberían sacar, y con la que queremos establecer comparaciones
para saber si esta clase está por encima, por debajo o sin diferencias con respecto a ella) con
un riesgo de error a = 0,01.
En este caso la hipótesis nula es que son estadísticamente iguales y la hipótesis alterna-
tiva es que son diferentes.
Le pedimos al ordenador: Analizar/Comparar medias/ Prueba T para una muestra y
en el “output” aparecen todo tipo de datos (media, desviación típica, valor de la t, los gra-
dos de libertad…) y la significación o p, que en este caso tiene un valor de 0,145. ¿Qué
decisión tomaremos? Como p = 0,145 es mayor que a = 0,01 no tenemos suficientes
motivos para rechazar la hipótesis nula, o sea que la diferencia no es significativa (es sufi-
cientemente pequeña como para que no podamos descartar que la diferencia se pueda
explicar simplemente por influencia del azar). Al decir “no tenemos suficientes motivos
para rechazar la H0” no afirmamos que ésta sea cierta (porque el riesgo de error que tene-
mos es el riesgo b, que desconocemos) simplemente que los datos que poseemos no des-
cartan la hipótesis nula.
Un ejemplo con SPSS sería comparar la media observada en Coeficiente Intelectual obte-
nida en un grupo, con la media teórica de 100. Para ello, ejecutamos el comando ANALI-
ZAR/COMPARAR MEDIAS/PRUEBA T PARA UNA MUESTRA y obtenemos el siguien-
te cuadro de diálogo.
Figura 9.1. Consulta de tests estadísticos en SPSS (1).
El output del ejemplo sería el siguiente, cuya interpretación del nivel de significación
arroja diferencias estadísticamente significativas (a = 0,05), evidenciando que la muestra
tiene un CI superior a la media.
138
Capítulo 9: Comparaciones o contrastes de medias
Cuadro 9.1. Consulta de tests en SPSS
One-Sample Statistics
Std. Std. Error

N Mean
Deviation Mean
Total 579 136,47 12,740 ,529
One-Sample Test
Test Value = 100
95% Confidence Interval

Sig. Mean of the Difference
t df
(2-tailed) Difference
Lower Upper
Total 68,891 578 ,000 36,475 35,44 37,51
9.2. Comparación o contraste entre dos medias observadas
Se nos pueden presentar dos casos diferentes.
9.2.1. Datos independientes o muestras independientes
Comparamos las medias de los grupos 1 y 2 (el orden es indiferente) con sujetos diferentes
de uno y otro grupo.
Las hipótesis estadísticas son:
– Hipótesis nula (H0): las medias observadas de ambos grupos son estadísticamente
iguales.
– Hipótesis alternativa (H1): las medias observadas son estadísticamente diferentes.
Condición de aplicación: las varianzas de ambos grupos tienen que ser homogéneas o
estadísticamente iguales. El ordenador hace la prueba F de Levene, de tal manera que:
– Si la significación (p) de la prueba F de Levene ≥ a se cumple la condición.

– Si la significación (p) < a no se cumple la condición.
En este segundo caso en principio no se podría aplicar la prueba, pero el programa cal-
cula los valores de F y p tanto para el caso de que se hayan asumido varianzas iguales y para
139
el caso de que no se hayan asumido varianzas iguales (en este segundo caso lo que hace es
recalcular los grados de libertad).
Grados de libertad n = g.l. = (n1 – 1) + (n2 – 1)= n1 + n2 – 2
Donde n1 es el tamaño de la muestra 1 y n2 es el tamaño de la muestra 2.

Decisión:
– Si (p) ≥ a, nada se opone a aceptar la H0. Diferencia no significativa.

– Si p < a, rechazamos la H0 con un riesgo a y aceptamos la H1. Diferencia significa-
tiva.
Por ejemplo, pensemos en dos grupos de 8 estudiantes de sendos centros educativos que
han obtenido la siguiente puntuación en una prueba de conocimientos de informática.
– Centro A: 23, 26, 20, 21, 24, 22, 23, 25

– Centro B: 26, 29, 28, 30, 31, 28, 29, 27
x–A = 23 SA = 2
x–B = 28,5 SB = 1,6
¿Podemos afirmar que ambos centros tienen diferente nivel de conocimiento de infor-
mática? (a = 0,05).
Le pedimos al ordenador Analizar/Comparar medias/prueba T para muestras indepen-
dientes. El ordenador nos ofrece en el “output” todo tipo de datos: medias y desviaciones
típicas de ambos grupos, el test de homogeneidad de varianzas (en este caso se cumple la
condición porque la p de la prueba F es 0,200 > 0,05), el valor del contraste t (–6,089) y su
significación. Este último dato es el más importante porque nos permite tomar la decisión:
como p = 0,000 es menor que a (0,05) rechazamos la H0 con un riesgo del 5% y acepta-
mos la H1: diferencia significativa. No obstante, que p sea 0,000 no quiere decir que sea
cero (que nunca lo es) sino que es un valor que no llega al uno por mil.
Un ejemplo con SPSS sería comparar la media obtenida de Coeficiente Intelectual del ejem-
plo anterior, entre chicos y chicas. Para ello, ejecutamos el comando ANALIZAR/COM-
PARAR MEDIAS/PRUEBA T PARA MUESTRAS INDEPENDIENTES y obtenemos el
siguiente cuadro de diálogo.
140
Figura 9.2. Consulta de tests estadísticos en SPSS (2).
El output del ejemplo sería el siguiente. Como la significación (p = 0,881) es mayor que
0,05 la conclusión sería que nada se opone a aceptar la hipótesis nula, es decir, diferencia
no significativa.
Cuadro 9.2. Consulta de tests estadísticos en SPSS

Group Statistics
Std. Std. Error
Sexo N Mean
Deviation Mean
total Femenino 496 136,52 12,783 ,574
Masculino 82 136,16 12,629 1,395
Independent Samples Test
Levene’s Test
for Equality of t-test for Equality of Means
Variances
95% Confidence
Std.
Mean Interval of the
Sig. (2- Error
F Sig. t df Diffe- Difference
tailed) Diffe-
rence
rence
Lower Upper
Total Equal variances ,046 ,830 ,239 576 ,811 ,364 1,521 –2,624 3,352
assumed
Equal variances ,241 110,243 ,810 ,364 1,508 –2,625 3,352

not assumed
141
9.2.2. Datos apareados o muestras relacionadas
Se trata de comparar las medias obtenidas por los mismos individuos en dos situaciones dife-
rentes, lo más habitual antes (x–1) y después (x–2) en el tiempo. Esta prueba es interesante para
verificar si una intervención (curso, incentivo, charla…) que ha tenido lugar entre los dos
momentos ha tenido influencia o no. De modo similar a los apartados anteriores, las hipó-
tesis estadísticas son:
– Hipótesis nula (H0): las medias del grupo antes y después son estadísticamente iguales.
– Hipótesis alternativa (H1): las medias del grupo antes y después son estadísticamen-
te diferentes.
La condición de aplicación de homogeneidad de varianzas no es necesaria porque, al ser

los mismos sujetos, se acepta que no ha cambiado su variabilidad. De hecho, el ordenador
en estos casos no verifica si se cumple o no dicha condición.
Grados de libertad (n = g.l. = n – 1)
Decisión, como siempre
– Si (p) ≥ a, nada se opone a aceptar la H0. Diferencia no significativa.

– Si p < a, rechazamos la H0 con un riesgo a y aceptamos la H1. Diferencia significa-
tiva.
Veamos un ejemplo. Supongamos que se ha medido el nivel de motivación laboral de

9 estudiantes en programas de Grado Medio al principio y a mitad del curso. Las puntua-
ciones son las siguientes:
– Inicio de curso: 12, 11, 14, 13, 10, 16, 13, 15, 14
– Final de curso: 18, 16, 18, 17, 12, 19, 18, 19, 17
¿Podemos afirmar que el curso está siendo positivo? (a = 0,05).

Para que el ordenador realice esta prueba con el SPSS tenemos que clicar: Analizar/
Comparar medias/ Prueba T para muestras relacionadas.
Una vez más en el “output” aparece una serie de datos estadísticos: medias y desviacio-
nes típicas antes y después (x–1 = 13,11, S1 = 1,900, x–2 = 17,11, S2 = 2,147) los grados de
libertad (g. l. = 8), el valor del contraste t (–9,798) y la significación (p = 0,000) que utili-
zamos para tomar la decisión: como p (0,000) es menor que a (0,05) rechazamos la H0 con
un riesgo del 5% y aceptamos la H1 (diferencia significativa). Como la media ha subido de
13,11 a 17,11, podemos afirmar que el curso está siendo eficaz para mejorar la motivación
del alumnado.
De modo similar
– Para analizar datos cualitativos (prueba c2).
142
– Para contrastar más de 2 medias observadas, tanto para datos o muestras indepen-
dientes como para datos relacionados (ANOVA o análisis de la varianza).
Un ejemplo con SPSS sería comparar la media obtenida en las puntuaciones de Coefi-
ciente Intelectual antes y después de la aplicación de un programa de desarrollo cognitivo.
Para ello, ejecutamos el comando ANALIZAR / COMPARAR MEDIAS / PRUEBA T
PARA MUESTRAS RELACIONADAS, y obtenemos el siguiente cuadro de diálogo.
Figura 9.3. Consulta del t test para muestras relacionadas en SPSS.
El output del ejemplo sería el siguiente. Como la significación (p = 0,000) es inferior a

0,05 la conclusión es que rechazamos la hipótesis nula con un riesgo del 5% y aceptamos
la hipótesis alternativa, es decir, la diferencia es significativa.
Cuadro 9.3. Consulta del t test para muestras relacionadas en SPSS

Paired Samples Statistics
Std. Std. Error
Mean N
Deviation Mean
Pair 1 Dimension 1 45,74 580 5,076 ,211
Dimension 2 49,54 580 5,088 ,211
Paired Samples Test
Paired Differences
95% Confidence Sig.

Interval of the T df
Std. Std. Error (2-tailed)
Mean Difference
Deviation Mean
Lower Upper
Pair 1 -3,793 4,494 ,187 -4,160 -3,427 -20,326 579 ,000
143
Si las variables de las que disponemos no cumplen los supuestos paramétricos, en SPSS
tenemos también opciones similares a las que hemos visto en este capítulo, para pruebas no
paramétricas. En este caso, ejecutaríamos los comandos ANALIZAR/PRUEBAS NO PARA-
MÉTRICAS para UNA MUESTRA, MUESTRAS INDEPENDIENTES O MUESTRAS
RELACIONADAS, respectivamente.
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes encon-
trar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/).
• Analiza si la altura del grupo es similar a la media teórica recogida en estadísticas ofi-
ciales sobre la altura de los jóvenes españoles de 175 centímetros.
• Analiza si existen diferencias estadísticamente significativas entre las notas de selecti-
vidad obtenidas por el alumnado de centros públicos y privados.
• Analiza si existe mejora en el rendimiento del alumnado desde el parcial 1 al parcial 3.
144
10
Correlación y regresión
Hasta aquí hemos visto cómo la estadística nos permite tratar conjuntos de datos. La estadís-
tica descriptiva se ocupa de describir dichos datos por medio de unos índices (de posición, ten-
dencia central, variabilidad y forma) sin plantearse si tales datos pertenecen a la población o a
una muestra. La estadística inferencial, que se basa en la probabilidad, nos permite generali-
zar o inferir la información que obtenemos en la muestra a la población origen.
Sabemos que gracias a la estadística inferencial podemos estimar, a partir de los estadísti-
cos observados en la muestra, los parámetros poblaciones (teoría de la estimación) y realizar
contrastes de hipótesis (teoría de la decisión o comparaciones de medias, proporciones, etc).
Pero además la estadística nos permite estudiar dos o más variables a la vez, describir las
posibles relaciones entre las mismas y tomar decisiones al respecto. Esto es muy interesan-
te en el campo de la educación donde nos interesa encontrar explicaciones de tipo causa-
efecto a fenómenos que de por sí son bastante complejos.
10.1. Conceptos y elementos
La distribución unidimensional se refiere a la distribución de una variable referida a un grupo

de individuos. Pero podemos considerar dos, tres, cuatro… k variables, en cuyo caso tendría-
mos una distribución bidimensional, tridimensional, tetradimensional… k dimensional.
En cuanto a las representaciones gráficas vimos que para una variable teníamos varias
opciones (barras, sectores, histograma, etc.). Para dos dimensiones (x, y) la representación
se hace en un espacio plano de dos dimensiones en el que cada punto representa un indivi-
duo y viene determinado por sus valores en x (abscisa) e y (ordenada). Para tres variables en
un espacio tridimensional. Para k variables en un espacio k dimensional.
En el caso de que tengamos más de tres variables, la representación gráfica es imposi-
ble, pero matemáticamente estamos en un espacio de tantas dimensiones como variables.
145
La gráfica para dos variables se denomina diagrama de dispersión (que lo da el ordenador) o

superficie de regresión o nube de puntos. Para obtener esta gráfica tenemos que ir, dentro del
programa SPSS, a la ventana del menú gráficos/dispersión/simple/definir.
La correlación nos indica si hay relación entre dos o más variables, es decir la variación
conjunta, mutua o concomitante (covariación) entre estas.
La relación o variación conjunta puede ser:
• Positiva. Cuando aumentan los valores de una de las variables aumentan también los
de la otra (u otras variables) y viceversa.
Ejemplo: La temperatura (X) y el consumo de bebidas refrescantes (Y).
X Y
15 3
20 5
25 7
30 9
35 11
Figura 10.1. Diagrama de dispersión.
Cuando aumenta la temperatura aumenta también el consumo de bebidas refrescantes.
• Negativa. Cuando aumentan los valores de una de las variables disminuyen los de la
otra (u otras variables) y viceversa.
146
Capítulo 10: Correlación y regresión
Por ejemplo: la temperatura (X) y el consumo de gas natural (Y)
X Y
–5 474
0 400
5 350
10 278
15 270
20 125
25 50
Figura 10.2. Diagrama de dispersión (relación negativa).
Cuando aumenta la temperatura disminuye el consumo de gas natural.
El coeficiente de correlación indica el grado de relación entre las variables y el sentido de

esta relación (positiva o negativa):
• Si el coeficiente de correlación es 0 (correlación nula) indica que las variables son inde-
pendientes entre sí.
• Si el coeficiente es 1 significa que la correlación es perfecta positiva.
• Si el coeficiente es –1 significa que la correlación es perfecta negativa.
147
En la práctica, no observaremos valores como 0, 1 o –1, sino valores intermedios. Así,

los valores de correlación muy cercanos a 0 indican una relación casi nula de las dos varia-
bles. Cuanto más se acerque la correlación a 1, más relación positiva indicará entre las dos
variables (cuando una variable aumenta, la otra también) y cuanto más se acerque este valor
a –1, más relación negativa indicará entre las dos variables (cuando una aumenta, la otra
disminuye). La regresión indica la forma como se produce la variación conjunta y esto per-
mite predecir los valores de una variable en función de las de la otra. Solo obtendremos pre-
dicciones fiables cuando exista correlación o dependencia entre las variables.
10.2. Correlación y regresión simple
La correlación y regresión simple hacen referencia al estudio únicamente entre dos varia-
bles. Existen diferentes coeficientes de correlación en función del tipo de variables con el
que nos encontramos (ver el siguiente cuadro).
Cuado 10.1. Coeficientes de correlación en función del tipo de variable
Coeficiente Variable X Variable Y SPSS

de correlación
Pearson (rxy) Cuantitativa continua Cuantitativa continua Analizar >

(o discreta) (o discreta) Correlaciones >
Bivariadas... > Pearson
Spearman (rs o ρxy) Medida con una escala Medida con una escala Analizar >
ordinal ordinal Correlaciones >
Bivariadas... >
Spearman
Chi-cuadrado (c2) Cualitativa Cualitativa Analizar >

Estadísticos
descriptivos >
Tablas de
contingencia... >
Estadísticos... > c2
Biserial (rb) Cuantitativa continua Dicotomizada –

(o discreta) (cualitativa artificial)
Biserial puntual (rbp) Cuantitativa continua Cualitativa dicotómica –

(o discreta)
Tetracórica (rt) Dicotomizada Dicotomizada –

(cualitativa artificial) (cualitativa artificial)
148
10.2.1. Correlación y regresión lineal de Pearson
Es la correlación por antonomasia y la única que permite la regresión (también la múltiple

que es una generalización de la lineal simple). Hay que tener en cuenta que se trata de una
correlación lineal. Así, si tenemos dos variables que mantienen otro tipo de relación, por
ejemplo cuadrática, aunque esa relación sea muy fuerte, nuestra correlación de Pearson la
obviará e intentará ver si entre ellas existe una correlación lineal. Como no va a encontrar
una correlación lineal fuerte, arrojará resultados que indicarán baja relación entre las varia-
bles. Esto no querrá decir que las dos variables no estén relacionadas entre sí, simplemente
querrá decir que no se correlacionan linealmente.
Proceso
1. Plantear las hipótesis
En los estudios correlacionales las hipótesis estadísticas son:
– H0 (hipótesis nula): independencia o correlación no significativa (variación conjun-
ta suficientemente pequeña como para ser explicada por la influencia del azar).
– H1 (hipótesis alternativa): correlación significativa (variación conjunta suficien-
temente grande como para no ser explicada solo por la influencia del azar).
2. Decidir el valor a (riesgo de error con el que vamos a trabajar): 5% o 1%.
3. Verificar las condiciones de aplicación.
4. Obtener mediante el programa SPSS la gráfica de dispersión, los estadísticos de las
variables (medias y varianzas) y el coeficiente de correlación. Los pasos serían anali-
zar/ correlación/ bivariada/ Pearson.
5. Interpretación del coeficiente de correlación (estudio de la significación). Lo hacemos,
como siempre, con el valor (p) o significación que nos proporciona el ordenador.
Si p ≥ a H0: nada se opone a aceptar la hipótesis nula (independencia) o correlación
no significativa.
Si p < a H1: rechazamos la hipótesis nula (independencia) con un riesgo a y acep-
tamos la hipótesis alternativa (dependencia) o correlación significativa.
Si la correlación es no significativa, fin del proceso (si son independientes no tiene
sentido predecir una variable en función de la otra).
Si la correlación es significativa procedemos al estudio de la regresión, que tiene dos
pasos: cálculo del valor más probable (“regresión puntual”) y cálculo del intervalo
de regresión (“regresión por intervalo”).
6. Cálculo de las rectas de regresión: predicción del valor más probable (“regresión pun-
tual”). En la correlación lineal simple, teóricamente, hay dos rectas de regresión:
– Recta de regresión de Y en función de X (Ry/x). Expresa la variación de la variable
Y en función de la variable X. Permite predecir el valor más probable (Y’) de la
variable Y, en función de un determinado valor de X.
149
– Recta de regresión de X en función de Y (Rx/y). Expresa la variación de la variable

X en función de la variable Y. Permite predecir el valor más probable (x’) de la
variable X, en función de un determinado valor de Y.
En la práctica solo utilizamos una de ellas, la de y (variable dependiente) en función
de x (variable independiente).
Y ′ = a yx + b yx · X
Donde ayx es el punto donde la recta corta al eje de ordenadas y byx es la pendiente
de dicha recta.
7. Cálculo del intervalo de regresión (con un determinado margen de error):
A no ser que la correlación sea perfecta, cosa que en educación es prácticamente
imposible, la regresión o predicción de y en función de x no será perfecta. Es decir,
la regresión o predicción la hacemos con un margen de error.
Y ′ = a yx + b yx · X ± e
Como e = Z α /2 ·S yx
Y ∈Y ′ ± Z α /2 ⋅ S yx
con una probabilidad de 1 – a
Ejemplo:
A continuación desarrollaremos los pasos anteriores en un ejercicio.

Se quiere hacer un estudio de correlación y regresión entre los resultados obtenidos en
un test verbal (V) y en un examen de lengua (L). Para hacer esto disponemos de los resul-
tados de un grupo de alumnos de bachillerato escogidos al azar:
Sujeto V(x) L(y)
1 21 13
2 23 12
3 21 12
4 17 10
5 19 8
6 19 6
7 14 5
8 17 3
9 16 3
10 11 2
150
1. Hipótesis: H0 las dos variables son independientes y H1 la capacidad verbal medida

con el test (x) está relacionada con el rendimiento en el examen de lengua (y).
2. Decisión del valor a: decidimos trabajar con un riesgo de error del 5%.
3. Verificar las condiciones de aplicación:
• Escala de medida: intervalo o de razón (cuantitativa).

• Tipos de variables: cuantitativas continuas (en muchas ocasiones también dis-
continuas).
• Tipos de distribución: Normal (verificar con la prueba de Kolmogorov). Con el
programa SPSS es ir a analizar/pruebas no paramétricas/K-S una muestra.
• Función lineal: se puede pedir un test de linealidad, pero también se puede obser-
var en la gráfica de dispersión.
• Homogeneidad de varianzas (homocedasticidad): podemos aceptar que se cum-
ple si las dos variables son normales.
4. Gráfica de dispersión y cálculo de los estadísticos de las variables y del coeficiente de

correlación.
Figura 10.3. Gráfica de dispersión.
151
Cuadro 10.2. Coeficiente de correlación
Examen de
Test verbal (x)
lengua (y)
Test verbal (x) Correlación de Pearson 1 ,824**
Sig. (bilateral) – ,003
N 10 10
Examen de lengua (y) Correlación de Pearson ,824** 1
Sig. (bilateral) ,003 –
N 10 10
** La correlación es significativa al nivel 0,01 (bilateral)
5. Interpretación del coeficiente de correlación (estudio de la significación).

Como la significación (,003) es menor que 0,05 entonces rechazamos la H0 con
un riesgo a de 0,05 y aceptamos la H1 y podemos concluir que la correlación (0,824)
es significativa (no puede ser explicada solo por la influencia del azar). Como la corre-
lación es significativa tiene sentido hacer la regresión.
6. Cálculo de la recta de regresión (valor más probable).
Suponemos que para nuestro estudio nos interesa poder hacer una estimación
de la nota que se podrá sacar en el examen de lengua sabiendo la puntuación que
tiene una persona en el test verbal; por tanto necesitamos calcular la recta de regre-
sión de Y en función de X.
El cálculo en el SPSS se pide a través del menú Analizar / Regresión / Lineal... donde hemos
de poner como “Dependiente” la variable del examen de lengua (Y) y como “Independien-
te” la variable test verbal (X).
152
Cuadro 10.3. Regresión lineal
Resumen del modelo
R cuadrado Error típ. de la

Modelo R R cuadrado
corregida estimación
1 ,824a ,679 ,639 2,505

a Variables predictoras: (Constante), Test verbal (x)
Coeficientesa
Coeficientes no Coeficientes
estandarizados estandarizados
Modelo t Sig.
B Error típ. Beta
1 (Constante) –9,661 4,222 –2,288 0,51
Test verbal (x) ,958 ,233 ,824 4,114 ,003
a Variable dependiente: Examen de lengua (y)
Y ′ = a yx + b yx ⋅ X
Los coeficientes no estandarizados nos dan los valores ayx (–9,661) y byx (0,958) de la
recta de regresión que necesitamos. Por tanto tenemos que Y ′ = −9,661 + 0,958 ⋅ X .
Suponiendo que una persona tiene una puntuación de 20 en el test verbal, el
valor más probable en el examen de lengua es Y’ = –9,66 + 0,958 · 20 = 9,51.
7. Cálculo del intervalo de regresión (con un determinado margen de error)
14,42
9,51 ± 1,96 ⋅ 2,505 = 9,51 ± 4,91 
4,6
Observaciones: para la correcta interpretación de la correlación y de la regresión hay

que saber distinguir entre dependencia y causalidad filosófica (la variable independiente es
la causa de la variabilidad de la variable dependiente) y dependencia y causalidad simple-
mente estadística. En esta línea conviene recordar varios conceptos:
– Coeficiente de covariación o de determinación: es el cuadrado del coeficiente de corre-

lación e indica la proporción de variación común entre las variables. En nuestro ejem-
plo 0,824 al cuadrado es 0,68.
153
– Coeficiente de alienación: es el complemento del coeficiente de covariación e indica la

varianza no explicada. En nuestro caso 1 – 0,68 = 0,32.
– Correlación espuria: es una correlación alta entre dos variables que no tienen cone-
xión lógica. Pongamos por caso que estudiamos la correlación entre el número de
accidentes de coche y el número de abonados telefónicos. Seguramente nos daría una
correlación de más de 0,90. Pero esto no indica que el número de accidentes de coche
sea causa del número de abonados telefónicos o viceversa. Puede ser, por ejemplo,
que una tercera variable (por ejemplo, el nivel de vida) sea la que cause indepen-
dientemente las variaciones en nuestras dos variables.
Por lo tanto, una alta correlación entre dos variables, por sí sola, no indicará nunca cau-
salidad. Al ver estas altas correlaciones entre dos variables, debemos preguntarnos el porqué
de esta variación conjunta. Una posible explicación es la de causa-efecto: que la variación
de una de las dos variables sea la causa de la variación de la otra. Pero debemos plantearnos
otras hipótesis y contrastarlas, descartar o explorar otras posibilidades que no sean la causa-
lidad con ayuda de otras estadísticas o de estudios cualitativos. Solo en la medida en que
hayamos descartado todas las demás posibles explicaciones de una alta correlación, podre-
mos afirmar que se trata de una relación de causalidad.
10.2.2. Otros coeficientes de correlación simple
A) Correlación ordinal (ρ de Spearman)
Si una o las dos variables están medidas con una escala ordinal o no se cumple alguna de las
condiciones de aplicación tenemos la alternativa de utilizar la correlación ordinal de Spear-
man. En este caso no es posible estudiar la regresión (para ello necesitaríamos que las varia-
bles fuesen cuantitativas).
La interpretación de este coeficiente es igual que en el caso del coeficiente de Pearson y su

cálculo en el SPSS también se hace a través del menú principal Analizar / Correlaciones /
Bivariadas... y seleccionando el coeficiente de Spearman.
B) Chi-cuadrado (c2)
Se puede aplicar con cualquier tipo de variables (cualitativas). No tiene ningún tipo de res-
tricciones como la correlación lineal simple de Pearson (no hace falta una n mínima, no es
necesario que las distribuciones se ajusten a la curva normal...).
Cabe tener presente que, a diferencia de los coeficientes de Pearson y de Spearman, que
la chi-cuadrado indica si hay o no correlación, pero no el sentido ni la intensidad de la mis-
ma. Por ello algunos lo llaman simplemente coeficiente de asociación.
154
Coeficientes (F y C) que convierten el valor de c2, que oscila entre 0 e infi-

nito, en otros coeficientes que oscilan entre 0 y 1 e indican la intensidad de la
correlación.
χ2
2 × 1→ Φ =
n
χ2
k × 1→ C =
χ +n
2
El cálculo de chi-cuadrado tiene una condición de aplicación que consiste en que como
máximo un 20% de las frecuencias teóricas (o esperadas) puede ser inferior a 5. Si esta con-
dición no se cumple, entonces se ha de reagrupar alguna categoría y volver a hacer el cálcu-
lo de la chi-cuadrado desde el principio.
Si la tabla de contingencia es de 2x2 y hay alguna frecuencia esperada infe-

rior a 5, entonces, como ya no se puede reagrupar ninguna categoría, en vez de
consultar la “Chi-cuadrado” que aparece en el output se ha de consultar la “Correc-
ción por continuidad”.
Un ejemplo de un grupo de 80 alumnos que ha hecho dos exámenes parciales de la asigna-

tura de estadística ha obtenido las calificaciones que figuran en el siguiente cuadro. ¿Hay
correlación entre los dos parciales (a = 0,05)?
Cuadro 10.4. Tabla de contingencia, prueba de chi-cuadrado y medidas asimétricas
Tabla de contingencia PARCIAL 1 * PARCIAL 2
PARCIAL 2 Total
aprobado suspenso
PARCIAL 1 aprobado recuento 40 20 60
Frecuencia esperada 37,5 22,5 60,0
suspenso recuento 10 10 20
Total recuento 50 30 80
155
Mediante SPSS ejecutamos el comando ANALIZAR/ESTADÍSTICA DESCRIPTI-

VA/TABLAS DE CONTINGENCIA y obtenemos el siguiente cuadro de diálogo:
Figura 10.4. Prueba del chi-cuadrado en SPSS.
Estos son los outputs obtenidos:
Cuadro 10.5. Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta

(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 1,778b 1 ,182

Corrección por continuidada 1,138 1 ,286
Razón de verosimilitud 1,743 1 ,187
Estadístico exacto de Fisher ,195 ,143
Asociación lineal por lineal 1,756 1 ,185
N.° de casos válidos 80
a Calculado sólo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 7,50.
Medidas simétricas
Valor Sig.
aproximada
Nominal por nominal Phi ,149 ,182

V de Cramer ,149 ,182
N.° de casos válidos 80
a Asumiendo la hipótesis alternativa.
b Empleando el error típico asintótico basado en la hipótesis nula.
156
Se cumple la condición de aplicación de las frecuencias esperadas.

La chi-cuadrado da 1,778 y su significación es 0,182. Dado que la significación es más
grande que a (0,05) se puede concluir que no hay relación entre los dos parciales.
La intensidad de la relación hallada (Phi) es de 0,149 (no significativa).
10.3. Correlación para tres o más variables
En investigación educativa, dada la complejidad de los fenómenos que se estudian, es muy

probable que se consideren más de dos variables al mismo tiempo para intentar explicar los
problemas.
Supongamos, por ejemplo, que en una muestra de 200 alumnos hemos medido las varia-
bles inteligencia general (G), talla (T) y edad (E). Hemos calculado los estadísticos de las
tres variables y los coeficientes de correlación lineal simple entre estas.
Estos datos están recogidos en el siguiente cuadro:
Cuadro 10.6. Correlación para tres o más variables
G (x 1) T (x 2) E (x 3) X– Sx
G (x 1) (r11) 1 (r12) ,6 (r13) ,8 100 20
T (x 2) (r21) ,6 (r22) 1 (r23) ,7 150 10
E (x 3) (r31) ,8 (r32) ,7 (r33) 1 12 2
Las correlaciones simples halladas en realidad no son exactamente así, porque en cual-
quier caso cada una de las variables que forman una pareja está relacionada también con la
otra. Las tres están intercorrelacionadas.
10.4. Correlación parcial
La correlación parcial permite estudiar la relación entre dos variables, eliminando la influen-
cia de una tercera variable. En general, en un conjunto de m variables, la relación entre dos
de ellas, eliminando la influencia de las restantes. También se podría conseguir lo mismo
con un diseño en el que se controlase el posible efecto de las variables “restantes”, es decir,
las que no se plantean ni como independientes ni como dependientes.
Estudio de la relación entre las variables 1 y 2, eliminando la influencia de la variable 3:
157
La correlación simple entre la inteligencia general y la talla es 0,6. Esta es una correla-
ción aparente o espuria y en parte es debido a que la talla está correlacionada con la edad.
Una solución sería estudiar la correlación entre la inteligencia general y la talla eliminando
la influencia de la edad (correlación parcial inteligencia general y talla, eliminando la influen-
cia de la edad).
RGT.E = 0,09
Al eliminar la influencia de la edad la correlación entre la inteligencia general y la talla

queda reducida a prácticamente nada.
Limitaciones: Solo se puede utilizar cuando las variables de las cuales se elimina la influen-
cia sean muy precisas y objetivas (altura, peso, edad, presión sanguínea... en general varia-
bles biométricas o fisiológicas). En educación, como en ciencias humanas y sociales, la mayo-
ría de las variables no cumplen esta condición, por ello la correlación parcial tiene poca
aplicación.
Con SPSS se ejecuta el comando ANALIZAR/CORRELACIÓN/PARCIAL y obtenemos

el siguiente cuadro de diálogo:
Figura 10.5. Correlaciones con SPSS: correlación parcial.
10.5. Correlación múltiple
La correlación múltiple permite estudiar la relación entre una de las variables y las otras dos. En
general, en un conjunto de m variables, la relación de una de ellas con todas las otras. Es decir,
nos da una idea de cómo varía la primera variable con relación al conjunto de todas las otras.
158
En nuestro caso nos podría interesar el estudio de la inteligencia general (variable depen-
diente) en función de la talla y de la edad (variables independientes).
RG.TE = 0,83
Con SPSS se ejecuta el comando ANALIZAR/REGRESIÓN/LINEAL y obtenemos el

siguiente cuadro de diálogo:
Figura 10.6. Correlaciones con SPSS: correlación múltiple
10.6. Caso práctico: análisis de regresión lineal simple y múltiple

a través de datos del PISA
En términos técnicos, el análisis de regresiones empieza con la distribución conjunta de los

datos p(y,x) y la descompone como sigue:
Distribución Distribución
conjunta marginal
Distribución
condicional
159
La expectativa condicional E(y|x) se refiere a la función de regresión y se modela con

relación a alguna función de x.
Intersección Pendiente
Para simplificarlo, podemos considerar dos variables que se distribuyen normalmente,

como podrían ser la edad y la altura. La idea general es encontrar una línea que se ajuste a
los puntos distribuidos de forma que la distancia de los puntos a la línea sea la mínima.
Como se puede apreciar en el gráfico, la línea pasa por la media de y y x. Pero este mode-
lo puede ser erróneo según los datos, como cuando las variables dependientes son binarias
(por ejemplo: persistencia escolar / abandono escolar). En este caso, la función es inheren-
temente no lineal porque los valores sólo pueden ser 0 (persistencia) y 1 (abandono) y, por
lo tanto, el modelo lineal no es apropiado.
160
Muestra: PISA 2003
Para explicar los dos tipos de regresiones que creemos más útiles, la regresión lineal sim-
ple y la regresión múltiple, vamos a utilizar datos que nos resultan conocidos y a los cuales
se puede acceder en abierto a través de la web de la OCDE (Organización para la Coope-
ración y el Desarrollo Económico).
En concreto, vamos a utilizar datos del programa PISA. PISA es el Programa para la
Evaluación Internacional de Estudiantes de la OCDE, una evaluación internacional estan-
darizada que evalúa, en los países de la OCDE y países asociados, hasta qué punto el alum-
nado que está acabando la educación secundaria obligatoria ha adquirido conocimientos y
habilidades que son esenciales para la plena participación en la sociedad. El alumnado que
participa en el Programa PISA tiene 15 años, y los tests se administran habitualmente entre
4.500 y 10.000 alumnos en cada país participante. Hasta el momento se han realizado cin-
co de estas evaluaciones en los años 2000, 2003, 2006, 2009 y 2012.
Para ilustrar los ejemplos de regresiones lineales simples y múltiples utilizamos datos de
PISA 2003. Específicamente, utilizamos los datos relativos al alumnado español. La mues-
tra final consistió en 9.317 alumnos.
Medidas
En particular, hemos utilizado los datos relativos a los resultados de rendimiento en la

prueba de lectura y las respuestas de los alumnos españoles a diez preguntas del cuestionario
del alumnado.
En este análisis, la variable dependiente o resultado son las puntuaciones de rendimien-
to del alumnado en la escala de lectura del PISA 2003.
A) Variable dependiente/Resultado: Rendimiento en lectura
El rendimiento en lectura se mide a través de las puntuaciones de los estudiantes en la escala

de rendimiento en lectura del PISA 2003. Esta escala toma valores entre 0 y 800, que es el
rango de calificaciones posibles en esta prueba de lectura. La prueba mide la aptitud de lec-
tura en términos de capacidad de los estudiantes para utilizar la información escrita en las
situaciones a las que se enfrentan en su vida cotidiana, lo que va más allá de la noción tradi-
cional de lectura como decodificar información e interpretación literal. En la prueba, se les
muestra a los alumnos una gama de diferentes tipos de texto escrito. Para cada texto, se
establecieron una serie de tareas, requiriendo los estudiantes obtener información específi-
ca para interpretar el texto, reflexionar y evaluar lo que leen.
161
10.6.1. Regresión lineal simple
Las regresiones lineales simples sirven para examinar cómo una variable influye en otra,
en el sentido de en qué grado una de ellas predice la otra. Empecemos con el modelo
simple de dos variables. Por ejemplo, con relación a los datos de PISA podemos estar
interesados en estudiar el grado en el que el nivel educativo de la madre (variable pre-
dictiva) influye en el rendimiento académico en lectura de los hijos. En otras palabras,
la regresión lineal simple se puede utilizar para explorar la capacidad del nivel educati-
vo de la madre de explicar los resultados académicos de los estudiantes en el área de lec-
tura.
A) Variable predictora 1: Nivel de estudios de la madre
La medición del nivel de estudios de la madre se coge de las respuestas del alumnado a la
siguiente pregunta: ¿Cuál es el nivel de estudios alcanzado por tu madre? El alumnado
responde en una escala que va del 1 al 5 en un continuo que va de “sin estudios” a “ISCED
3A”. Cada nivel de educación se codifica de la siguiente manera: 1. sin estudios, 2. ISCED 1,
3. ISCED 2, 4. ISCED 3B o 3C y 5. ISCED 3A.
ISED es la Clasificación Internacional Normalizada de la Educación elaborada por la
Unesco. El nivel 1 corresponde a la educación primaria o el primer ciclo de la educación
básica. El nivel 2 corresponde a la educación secundaria o la segunda etapa de educación bá-
sica. Los niveles ISCED 3B o 3C corresponden a la educación secundaria superior con acce-
so directo al mercado de trabajo o a programas de ISCED 5B. El nivel ISCED 3A corres-
ponde a la enseñanza secundaria superior, que proporciona acceso a los niveles 5A y 5B
(programas de formación académica superior).
Al realizar la regresión lineal simple con estas variables, encontramos que el nivel edu-
cativo de la madre se relaciona de forma significativa con los resultados de rendimiento en
lectura de las y los estudiantes (B = 11,24, t =17,42, p < 0,001), de forma que para cada
unidad de incremento en el nivel educativo de la madre podemos esperar un aumento de
11,24 puntos en el rendimiento en lectura del alumnado.
El análisis de regresión simple también muestra que el nivel educativo de la madre expli-
ca el 3,16% de la variación en los resultados de los estudiantes en la escala de lectura del
PISA 2003 (R = 0,18, F = 303,6, p < 0,001). Los coeficientes de regresión estandarizados
y no estandarizados y sus valores de significatividad asociados se presentan en el siguiente
cuadro:
162
Cuadro 10.7. Resumen del análisis de regresión lineal simple de las puntuaciones
de rendimiento del alumnado en la escala de lectura del PISA 2003 (N = 9,317)
Predictor Coeficiente de Coeficiente de T P

regresión no regresión
estandarizado (B) estandarizado
(beta)
Nivel de estudios 11,24 0,18 17,42 < ,001

de la madre
Nota. R2 = ,03
Discusión
El primer análisis de regresiones llevado a cabo con datos del PISA 2003 relativos a resulta-
dos en lectura para España muestra que el nivel educativo de la madre afecta significativa-
mente los resultados en el rendimiento académico en lectura de los estudiantes. A mayor
nivel educativo de la madre, mejor resultado en la escala de lectura del PISA 2003. Especí-
ficamente, por cada unidad de incremento en el nivel educativo de la madre, los resultados
en rendimiento en lectura aumentan una media de 11,24 puntos. Sin embargo, es impor-
tante señalar que aunque el coeficiente de regresión (B) es significativo, el nivel educativo
de la madre sólo puede explicar el 3,16% de la variación en la escala de rendimiento en lectu-
ra del PISA 2003. Esto tiene implicaciones importantes, tanto a nivel analítico como socioedu-
cativo. Por un lado, significa que aunque el coeficiente de regresión es significativo estadís-
ticamente, podría no tener demasiada significatividad práctica, especialmente si consideramos
que la muestra es muy amplia. Por otro lado, este resultado del análisis de regresión simple
implica que es necesario tener en cuenta otros predictores con el objetivo de explorar otros
factores, más allá de los socioeconómicos, que están contribuyendo de forma significativa a
los resultados en lectura de las y los estudiantes.
La poca cantidad de variación en el rendimiento académico de las y los estudiantes en
la escala de lectura del PISA 2003 explicada por el nivel educativo de la madre deja un espa-
cio importante a otros factores para influir el rendimiento en lectura. Es aquí donde adquie-
re sentido llevar a cabo un análisis dirigido a explorar, precisamente, la influencia de otro
tipo de predictores del rendimiento académico en lectura, como podrían ser los factores rela-
cionados con las prácticas implementadas en los centros educativos.
10.6.2. Regresión múltiple: el caso de la regresión en etapas (bloques)
En el análisis de regresión múltiple podemos medir la proporción de varianza en la variable

dependiente cuando las variables independientes se consideran en grupo. En las regresiones
múltiples se utiliza la correlación múltiple al cuadrado: R2.
163
Un problema con R2 es que puede aumentar (o permanecer igual) con la adición de otras
variables. Esto sucede a coste de “grados de libertad”. Para remediar este problema, necesi-
tamos un enfoque que reduzca R2 cuando se añaden variables que no producen una varian-
za significativa en la variable dependiente. Esto es lo que se consigue con el R2 ajustado.
Para explicar la regresión múltiple, nos centraremos en un tipo de la misma que es espe-
cialmente útil para entender su aplicación práctica. Se trata de la regresión en etapas o por
bloques (en inglés, “block entry regression”).
En la regresión por etapas un grupo de variables o variables sueltas se introducen por
etapas en la ecuación de regresión. Posteriormente, se examinan cambios en los coeficien-
tes de regresión a medida que se introduce cada bloque o etapa. Concretamente, se anali-
zan los cambios en R2 a medida que se introduce cada bloque.
Volviendo a nuestro caso de análisis, puesto que la variable predictiva de tipo socioeco-
nómico “nivel educativo de la madre” explica muy poco de la varianza en rendimiento aca-
démico en la escala de lectura del PISA 2003, podemos llevar a cabo un análisis de regre-
sión múltiple para examinar la contribución de otro tipo de factores (variables predictoras)
en el rendimiento en lectura.
En concreto, en base a los datos disponibles del PISA 2003, creamos tres grupos de pre-
dictores. Un grupo de variables predictoras está relacionado con la familia, otro con las escue-
las, y un tercero con los estudiantes. A nivel familiar diferenciamos entre los factores rela-
cionados con el nivel socioeconómico y los factores relacionados con trasfondo migratorio,
cultural y lingüístico. En el primer grupo de factores socioeconómicos incluimos el nivel
educativo de la madre y el número de libros en el hogar. En el segundo grupo de factores
relativos a inmigración, cultura y lengua, consideramos el país de nacimiento de la madre,
el país de nacimiento del estudiante y el idioma hablado en el hogar. Estos dos grupos de
variables predictoras relacionados con los antecedentes de la familia podrían ser considera-
dos de forma conjunta, como hace PISA 2003, e interpretarse como las características de
los estudiantes con relación al origen socioeconómico. Sin embargo, aquí no asumimos la
condición de inmigrante y el bagaje lingüístico como indicadores de nivel socioeconómico,
sino como factores culturales, tratados como “fondos de conocimiento” (González, Moll y
Amanti, 2005). En cuanto a los estudiantes, se contempla su grado de placer con la lectura.
A nivel de escuela, consideramos los sentimientos de pertenencia a la escuela de los estudi-
antes, la percepción de ser tratados de manera justa por los profesores, la opinión de los estu-
diantes acerca de la ayuda prestada por el centro educativo y también su opinión sobre la
utilidad del aprendizaje escolar.
A) Variable dependiente/Resultado. Rendimiento en lectura
Como antes, el rendimiento en lectura se mide a través de las puntuaciones de rendi-

miento en la escala de lectura. Como se ha explicado anteriormente, esta escala continua
toma valores desde 0 hasta 800, que es el rango de posibles calificaciones en la prueba.
164
B) Variables predictoras
Predictores relativos al nivel socioeconómico
– Nivel de estudios de la madre. Como hemos explicado con anterioridad, la medición

del nivel de estudios de la madre se analiza a partir de la siguiente pregunta: ¿Cuál es
el nivel de estudios alcanzado por tu madre? Para la codificación de las respuestas se uti-
liza la escala ISCED, también explicada anteriormente.
– Número de libros en casa. El número de libros en el hogar se mide a través de las
respuestas de los estudiantes a la siguiente pregunta: ¿Cuántos libros hay en tu casa?
Los estudiantes responden en una escala de valores entre 1 y 6 en un continuo que
va desde “0-10 libros” a “más de 500 libros”. Cada nivel de esta variable se codifica
de la siguiente manera: 1. 0-10 libros, 2. 11-25 libros, 3. 26-100 libros, 4. 101-200
libros, 5. 201-500 libros, y 6. más de 500 libros.
Predictores relativos al trasfondo migratorio, cultural y lingüístico
– Estudiante nativo / inmigrante. En el cuestionario del estudiante, los estudiantes respon-

den a la pregunta ¿En qué país naciste? Las respuestas se utilizan como medida de la
condición de inmigración de los estudiantes. Esta variable categórica tiene dos niveles:
“país donde se pasa el test” y “otro país”, con el primer nivel se informa de si el estudian-
te es de España y el segundo nivel informa sobre si el estudiante es inmigrante. En este
estudio, cada nivel se codifica de la siguiente manera: 0. España y 1. Otro país.
– País de nacimiento de la madre. En el cuestionario, a los estudiantes se les pregunta
sobre el país de nacimiento de sus madres: ¿En qué país nació tu madre? Esta variable
categórica tiene dos niveles: país donde se pasa el test y otro país, con el primer nivel se
informa sobre si la madre del estudiante es española y el segundo nivel informa si la
madre del alumno es inmigrante, lo que parcialmente informa acerca de si el estu-
diante es un inmigrante de segunda generación. En este estudio, cada nivel se ha codi-
ficado de esta manera: 0. España y 1. Otro país.
– Lengua hablada en el domicilio. El bagaje lingüístico de los estudiantes se mide a través
de la respuesta de los estudiantes a la siguiente pregunta: ¿Qué idioma hablas en tu
casa la mayor parte del tiempo? Esta variable tiene cuatro valores categóricos: 1. Idioma
oficial del país, 2. Otro idioma nacional, 3. Otros dialectos nacionales, y 4. Otros
idiomas. Dado que en este estudio nunca esta variable tomó el valor 3, y el interés se
centra en cuál es el idioma que los estudiantes hablan en casa, esta variable fue recodi-
ficada de la siguiente manera: 1. Cualquier idioma nacional, y 2. en otros idiomas.
Predictores relativos a la actitud de los estudiantes: “placer por la lectura”
– Placer por la lectura. La medida del “placer por la lectura” del estudiante se toma de
la respuesta a la siguiente pregunta: ¿En qué medida estás de acuerdo con la siguiente
165
afirmación? Me gusta leer. Los estudiantes responden en una escala Likert de cuatro
puntos. Cada punto de la escala se ha codificado de la siguiente manera: 1. Total-
mente de acuerdo, 2. De acuerdo, 3. En desacuerdo y 4. Muy en desacuerdo.
Predictores relativos al centro educativo
– Sentimiento de pertenencia. El sentimiento de los estudiantes de pertenencia a la escuela

se mide a través del grado de acuerdo de los estudiantes con la siguiente declaración:
Mi escuela es un lugar donde me siento como un extraño. Los estudiantes respondieron
en una escala Likert de 4 puntos. Cada punto de la escala se ha codificado de la siguiente
manera: 1. Totalmente de acuerdo, 2. De acuerdo, 3. En desacuerdo y 4. Muy en
desacuerdo.
– Trato justo. El trato justo por parte del profesorado a los estudiantes se mide a través
de la respuesta de los estudiantes a la pregunta: Pensando en los maestros de tu escuela,
¿en qué medida estás de acuerdo con la siguiente afirmación? La mayoría de mis profe-
sores me tratan de manera justa. De nuevo, los estudiantes responden mediante una
escala Likert de 4 puntos. Cada punto de la escala se ha codificado de la siguiente
manera: 1. Totalmente de acuerdo, 2. De acuerdo, 3. En desacuerdo y 4. Muy en
desacuerdo.
– Respuesta a las necesidades del alumnado. La atención de la escuela a las necesidades
de los estudiantes se mide a través de la opinión de los estudiantes sobre la ayuda pres-
tada por sus profesores. La pregunta formulada es la siguiente: ¿En qué medida estás
de acuerdo con las siguientes afirmaciones? Si necesito ayuda adicional, la recibo de mis
maestros. Los cuatro puntos de la escala Likert se codificaron así: 1. Totalmente de
acuerdo, 2. De acuerdo, 3. En desacuerdo y 4. Muy en desacuerdo.
– Utilidad de los aprendizajes escolares. La utilidad de los aprendizajes escolares se mide
respondiendo a la siguiente pregunta: Pensando en lo que has aprendido en la escuela:
¿En qué medida estás de acuerdo con la siguiente afirmación? La escuela ha sido una pér-
dida de tiempo. Los estudiantes responden en una escala Likert de 4 puntos, cada pun-
to es codificado como: 1. Totalmente de acuerdo, 2. De acuerdo, 3. En desacuerdo
y 4. Muy en desacuerdo.
C) Análisis: Regresión lineal múltiple por etapas
Como nuestros predictores constituyen distintos conjuntos de significado conceptual y

nuestra pregunta se refiere a qué grupo de factores tiene más poder de predicción en el
rendimiento en lectura, la entrada de cada grupo de predictores es la forma más apropiada
de regresión múltiple. Se han creado cuatro bloques. El análisis se lleva a cabo con el SPSS
a través de las opciones disponibles para regresiones, como se ha explicado en el primer apar-
tado de este capítulo. Los resultados del análisis se presentan en el siguiente cuadro:
166
Cuadro 10.8. Resultados de la regresión por etapas: coeficientes de regresión y varianza

explicados por cada bloque de variables
Coeficiente B b Valor t Valor p
Modelo 1
Nivel de educación de la madre 5,91 9,13 0,00***
Número de libros en el hogar 19,79 28,01 0,00***
Modelo 2
País de nacimiento del estudiante –5,98 –0,89 0,37
País de nacimiento de la madre –13,46 –2,41 0,02*
Idiomas hablados en casa –19,87 –2,16 0,03*
Modelo 3
País de nacimiento del estudiante –8,78 –1,32 0,19
País de nacimiento de la madre –13,62 –2,45 0,01*
Idiomas hablados en casa –19,59 –2,14 0,03*
Placer por la lectura –10,22 –10,11 0,00***
Modelo 4
Nivel de educación de la madre 5,76 0,01 9,08 0,00***
Número de libros en el hogar 17,79 0,39 25,47 0,00***
País de nacimiento del estudiante –11,33 –0,22 –1,73 0,08
País de nacimiento de la madre –14,32 –0,09 –2,63 0,01**
Idiomas hablados en casa –13,47 –0,44 –1,50 0,13
Placer por la lectura –6,99 –0,02 –6,88 0,00***
La escuela me proporciona ayuda extra –0,70 –0,00 –0,57 0,57
La escuela me trata de forma justa –6,59 –0,04 –4,84 0,00***
Sentimiento de pertenencia 6,75 0,05 4,53 0,00***
Utilidad del aprendizaje escolar 20,68 0,64 15,60 0,00***
Modelo R2 Cambio en R2 Cambio en F df 1 df 2
1 0,1068 586,82 *** 2 9314

2 0,1093 0,0025 9,11 *** 3 9311
3 0,1190 0,0097 106,19 *** 1 9310
4 0,1531 0,0341 93,75 *** 4 9306
* p < 0,05
** p < 0,01
*** p < 0,001
167
Las variables predictoras relacionadas con el “nivel socioeconómico” se introducen en

el primer bloque o etapa (Modelo 1), las variables relativas al “trasfondo migratorio, cultu-
ral y lingüístico” se añaden en el segundo bloque (Modelo 2), la variable predictora “placer
de las y los estudiantes por la lectura” se introduce en el tercer bloque (Modelo 3) y, final-
mente, los “factores relativos al centro educativo” se incluyeron en el cuarto bloque (Mode-
lo 4). Nuestro interés es ver si cada grupo de variables que se añade contribuye de forma
única al rendimiento de los estudiantes en lectura, por encima de lo que lo hacen las varia-
bles predictivas del bloque o etapa anterior. En este análisis de regresión múltiple, estamos
especialmente interesados en identificar la contribución de los “factores relativos al centro
educativo” al rendimiento académico en lectura por encima de las variables predictivas intro-
ducidas en las tres etapas anteriores.
En el primer bloque o etapa (Modelo 1), se introducen dos variables predictoras rela-
cionadas con el “nivel socioeconómico”: “nivel educativo de la madre” (x– = 3,75, S = 1,40,
r = 0,18, p < 0,01) y “número de libros en casa” (x– = 3,80, S = 1,29, r = 0,31, p < 0,01).
Tres variables predictoras relacionadas con el “bagaje de inmigración, cultural y lin-
güístico” se incluyeron en el segundo bloque o etapa (Modelo 2): “condición de inmigra-
ción del estudiante” (x– = 0,03, S= 0,17, r = –0,06, p < 0,01), “condición de inmigración de
la madre” (x– = 0,04, S= 1,40, r = –0,06, p < 0,01), y “lengua que se habla en casa” (x– =
= 0,001, S = 1,29, r = –0,04, p < 0,01).
En el tercer bloque o etapa (Modelo 3) añadimos la variable predictora “placer por la
lectura” (x– = 2,92, S= 0,86, r = –0,13, p < 0,01).
Finalmente, en el cuarto bloque o etapa (Modelo 4) se introduce el grupo de “factores
relativos al centro educativo”: “sentimiento de pertinencia” (x– = 3,65, S = 0,58, r = 0,09, p
< 0,01), “trato justo” (x– = 2,17, S = 0,68, r = –0,11, p < 0,01), “respuesta a las necesidades
de las y los estudiantes” (x– = 2,29, S = 0,74, r = –0,08, p < 0,01) y “utilidad del aprendiza-
je escolar” (x– = 3,42 S= 0,67, r = 0,21, p < 0,01).
El cuadro 10.8 presenta la varianza explicada por cada uno de los bloques de predicto-
res. El Modelo 1 (nivel socioeconómico) explica un 10,68% de la varianza en los resultados
de los estudiantes en la escala de lectura del PISA 2003. El Modelo 2 (incluye los predicto-
res del Modelo 1 con la adición de variables relacionadas con el trasfondo migratorio, cul-
tural y lingüístico) explica el 10,93% de la varianza en el rendimiento en lectura. Con las
variables relacionadas con el trasfondo migratorio y lingüístico incluidas en el modelo, y
habiendo controlado las variables de nivel socioeconómico, la cultura se convierte en un
predictor significativo del rendimiento en lectura (p < 0,001). El Modelo 3 (incluye las varia-
bles predictoras del Modelo 1 y del Modelo 2 con el añadido del placer por la lectura) expli-
ca el 11,9% de la varianza en los resultados en rendimiento en lectura. Esto significa que
cuando se controlan las variables de nivel socioeconómico y cultural, entonces, el “placer
por la lectura” se convierte en un predictor significativo de los resultados de rendimiento en
lectura (p < 0,001). El Modelo 4 (incluye las variables predictoras de los Modelos 1, 2 y 3
y añade los factores relativos al centro educativo) explica un 15,31% de la varianza en los
resultados de rendimiento en la escala de lectura del PISA 2003. Así, teniendo en cuenta las
variables relativas al sentimiento de pertenencia al centro, el trato justo, la respuesta del cen-
168
tro a las necesidades de los estudiantes y la utilidad del aprendizaje escolar, y habiendo con-
trolado las variables relativas al nivel socioeconómico, la cultura y el placer por la lectura,
los factores relativos al centro educativo son un predictor significativo del rendimiento de
las y los estudiantes en lectura (p < 0,001).
El efecto de cada nuevo grupo de variables añadidas en los bloques 2, 3 y 4 puede eva-
luarse a través del cambio en la varianza total (R2) del Modelo 1 al Modelo 2, del Modelo
2 al Modelo 3, y del Modelo 3 al Modelo 4. El cambio mayor en varianza explicada ocurre
en el paso del Modelo 3 al Modelo 4 (con un incremento en R2 de 3,41%), al añadir los
factores relativos al centro educativo y habiendo controlado las medidas relativas al “nivel
socioeconómico”, “el trasfondo migratorio, cultural y lingüístico” y “el placer de las y los
estudiantes por la lectura”.
En el cuadro 10.8, el bloque 4 indica cuáles son los predictores significativos del rendi-
miento de los estudiantes en lectura cuando se consideran las diez variables predictoras. Tan-
to el nivel educativo de la madre (B = 5,76, t = 9,08, p < 0,001) como el número de libros
en casa (B = 17,79, t = 25,47, p < 0,001) son predictores significativos del rendimiento en
lectura. Específicamente, por cada unidad que incrementa en el nivel educativo de la madre,
esperamos que el rendimiento de los estudiantes en lectura aumente 5,76 puntos. Para el
caso de número de libros en casa, por cada unidad que aumenta en la escala, se espera que
los resultados de los estudiantes aumenten 17,79 puntos.
El Modelo 4 también muestra que los estudiantes cuyas madres son de España puntúan
más alto (14,32 puntos de media, B = –14,32) que los estudiantes cuyas madres son inmi-
grantes, dejando constantes otras comparaciones y variables. Así mismo, los estudiantes cuyo
país de origen es España puntúan más alto (11,33 puntos de media, B = –11,33) que los
estudiantes que son inmigrantes, dejando constantes otras comparaciones y variables. Los estu-
diantes que hablan español o cualquier otra lengua nacional en casa tienen mejores resulta-
dos en la escala de lectura del PISA 2003 (13,47 puntos de media, B = –13,47) que los estu-
diantes que hablan cualquier otra lengua en casa, dejando constantes otras comparaciones
y variables.
El predictor placer por la lectura es también significativo (B = –6,99, t = –6,88,
p < 0,001). Específicamente, para cada unidad que aumenta en la escala que mide el acuer-
do de los estudiantes con la afirmación “Disfruto con la lectura” se espera una disminución
de 6,99 puntos (B = –6,99, t = –6,88, p < 0,001). Eso indica que cuanto menos placer por
la lectura, peores son los resultados en la escala de lectura del PISA 2003.
Entre los factores relativos al centro educativo, el trato justo por parte del profesorado
(B = –6,59, t = –4,84, p < 0,001), la utilidad del aprendizaje escolar (B = 20,68, t = 15,60,
p < 0,001) y el sentimiento de pertinencia de los estudiantes (B = 6,75, t = 1,49, p < 0,001)
son predictores significativos de los resultados de los estudiantes en lectura. Concretamen-
te, con relación a la variable “trato justo por parte del profesorado”, por cada unidad que
incrementa en la escala que mide el acuerdo de los estudiantes con la afirmación de que el
profesorado les trata justamente, se produce un declive de 6,59 puntos en los resultados de
lectura (B = –6,59, t = –4,84, p < 0,001). Teniendo en cuenta que esta escala va de más a
menos acuerdo, esto muestra que a más trato injusto por parte del profesorado, peores son
169
los resultados en lectura. Para el caso de la utilidad del aprendizaje escolar, por cada unidad
que aumenta en la escala que mide el grado de acuerdo de los estudiantes con la afirmación
“el aprendizaje escolar es una pérdida de tiempo”, se espera que los resultados de los estu-
diantes en lectura disminuyan 20,68 puntos.
De esta forma, cuanto mayor es la percepción de la utilidad del aprendizaje escolar,
mejor son los resultados en lectura. En relación con el sentimiento de pertenencia a la escue-
la, por cada unidad que aumenta en la escala que mide el acuerdo de los estudiantes con la
afirmación “me siento un extraño en la escuela”, se espera un aumento de 6,75 puntos en
la escala de lectura (B = 6,75, t = 4,53, p < 0,001). Esto indica que a mayor sentimiento de
pertenencia a la escuela, mejores son los resultados de los estudiantes en lectura. Entre el
placer de los estudiantes por la lectura y los tres predictores relacionados con el centro edu-
cativo, la variable que muestra más capacidad de predecir el rendimiento de los estudiantes
en la escala de lectura del PISA 2003 es la utilidad del aprendizaje escolar (percibida por los
estudiantes) (B = 20,68, t = 15,60, p < 0,001).
La comparación entre el bloque 3 y el bloque 4 indica que cuando se añaden los facto-
res relativos al centro educativo, la diferencia en la media de resultados entre los estudian-
tes españoles y los inmigrantes aumenta 2,56 puntos, y la diferencia en la media de resul-
tados entre los estudiantes que hablan español u otras lenguas nacionales en casa y los
estudiantes que hablan otra lengua disminuye 6,13 puntos. La comparación entre los blo-
ques 3 y 4 también muestra que la habilidad de la variable predictora “placer por la lectu-
ra” de predecir el rendimiento en lectura disminuye 3,23 puntos cuando los factores relati-
vos al centro educativo se tienen en cuenta y el resto de predictores se controlan.
D) Discusión
En relación con la literatura, los resultados del análisis de regresión lineal simple confirman
lo que ha sido repetidamente mostrado desde inicios de los setenta: el estatus socioeconó-
mico, a menudo medido a través de la educación de los padres, es un factor que incide en
los resultados académicos de los hijos (Baudelot y Establet, 1976; Bourdieu y Passeron, 1977;
Bowles y Gintis, 1976). Esto ha servido a los autores reproduccionistas para explicar cómo el
capital cultural heredado de la familia y el contexto social influye en el rendimiento acadé-
mico y posteriormente en las oportunidades de inclusión laboral y social. Sin embargo,
Europa tiene que mirar más allá del modelo de la reproducción. Hoy, los políticos, admi-
nistradores, profesores, familias y comunidades necesitan saber especialmente, no qué fac-
tores socioeconómicos y prácticas educativas incrementan la exclusión social, sino que están
pidiendo a los investigadores conocer las prácticas educativas que contribuyen al éxito esco-
lar de todos. Eso es lo que es útil en la práctica educativa diaria y los científicos sociales con-
temporáneos tienen muchos elementos que nos ayudan a aclarar estas cuestiones (CREA,
2006-2011).
Teorías e investigaciones previas ya han demostrado que la promoción de interacciones
culturales y educativas entre estudiantes y agentes sociales y, más específicamente, con miem-
170
bros de la familia, aumenta el rendimiento académico (Vygotski, 1978). Pero lo que ha ocu-
rrido es que los cuestionarios internacionales han traducido esta contribución en indicadores
como el nivel de titulación de los padres o el número de libros en casa. Esta reducción ha con-
ducido al error de tomar estos indicadores como los únicos, despreciando de esta forma otros
importantes como si las familias participan en algún tipo de actividad educativa o no. Desde
esta perspectiva, se ha argumentado que deberíamos esperar hasta que haya padres con titula-
ción superior para que sus hijos tengan éxito en la escuela. Pero existen muchas evidencias que
nos mueven más allá de ese determinismo (Hidalgo, Epstein, Siu, 2002; INCLUD-ED Con-
sortium, 2009). Por ejemplo, algunos programas de participación y formación de familiares
promueven interacciones educativas y culturales y han conducido a estudiantes cuyas familias
tienen pocos libros en casa o bajo nivel educativo a conseguir resultados académicos excelen-
tes en su rendimiento académico. Sobre la base de estas evidencias, se han desarrollado políti-
cas educativas que aumentan el éxito académico de todos los niños a través de la promoción
de este tipo de formación de familiares y de la comunidad.
De hecho, la poca variación en las puntuaciones de rendimiento de los estudiantes en la
escala de lectura del PISA 2003 explicada por el nivel educativo de la madre refuerza esta
idea, ya que indica que se necesitan muchos otros factores, tales como los relacionados con las
actuaciones llevadas a cabo en las escuelas, para predecir el rendimiento de los estudiantes
en lectura.
Por esta razón, después de los resultados de la regresión lineal simple, el siguiente paso
fue explorar la capacidad de otro tipo de factores de predecir el rendimiento de los estu-
diantes en lectura. La regresión múltiple por etapas ha mostrado que las variables cultura-
les influyen en el rendimiento en lectura más allá de los dos predictores relativos al nivel
socioeconómico. Además, la regresión por etapas ha indicado que el placer de los estudian-
tes por la lectura influye en el rendimiento en lectura por encima de las variables predicto-
ras relativas al nivel socioeconómico y a la cultura. Los factores relacionados con el centro
educativo contribuyen a predecir los resultados en lectura por encima de lo que lo hacen los
predictores referentes al nivel socioeconómico, la cultura y el placer por la lectura. Concre-
tamente, es el grupo de factores relacionados con el centro educativo el que explica la mayor
variación en los resultados en lectura, habiendo controlado las variables relativas al nivel
socioeconómico, la cultura y el placer por la lectura. Este resultado está en la línea de lo que
explica mucha investigación en ciencias de la educación: que las escuelas deben y pueden
compensar las desigualdades a través de implementar actuaciones educativas de éxito que
aseguren los mejores resultados para todos, independientemente de cualquier diferencia
socioeconómica o cultural del alumnado (Elboj et al., 2002; Flecha, 2000; Freire, 2003;
Giroux, 1988; Ladson-Billings, 1994).
El placer por la lectura, que era un predictor significativo del rendimiento de los estu-
diantes en lectura en los modelos tercero y cuarto, queda afectado por la incorporación de
variables relativas al centro educativo. Es decir, el placer por la lectura pierde fuerza predic-
tiva cuando se tienen en cuenta las variables relacionadas con el sentimiento de pertenen-
cia, el trato justo por parte del profesorado, recibir ayuda extra, y la utilidad del aprendiza-
je escolar.
171
Finalmente, debemos tener en cuenta que nuestro último modelo, el Modelo 4, deja
sin explicar un 80% de la varianza en el rendimiento en lectura. Se trata de un porcentaje
elevado. Este resultado revela, por una parte, que es necesario introducir otros factores den-
tro de cada uno de los cuatro grupos de predictores que hemos creado y, por otra parte, que
otros grupos de factores deberían ser explorados como predictores del rendimiento en lec-
tura. Además, la poca significatividad de las etapas o bloques 2 y 3, que explican muy poco
de la varianza del rendimiento en lectura, podría ser resultado de una muestra muy amplia.
También, en la interpretación de los resultados de esta regresión múltiple tiene que tenerse
en cuenta que PISA 2003 no escogió la muestra de estudiantes de forma aleatoria y que
podrían estarse dando efectos de interacción entre las variables estudiadas.
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes encon-
trar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/).
• Analiza si existe correlación entre el examen final y cada uno de los parciales.
• Realiza un estudio de regresión sobre el examen final para un alumno que tiene una pun-
tuación de 9 en el primer parcial. Ilustra las conclusiones con gráficos de dispersión.
• Haz un estudio de correlación entre el número de asignaturas aprobadas y la nota
obtenida en selectividad. Utiliza el coeficiente de correlación que consideres más ade-
cuado.
• Realiza un estudio para ver la relación entre las variables sexo y opción de bachillerato
elegida por los jóvenes. Utiliza la prueba que consideres más adecuada.
• Realiza un estudio de correlación entre el examen final y los tres primeros parciales
(no incluimos el cuarto porque no seguía la ley normal).
172
ANEXO 1
La explotación y el uso
de los datos secundarios
Uno de los aspectos más importantes de utilizar la estadística como herramienta en las inves-
tigaciones sociales y educativas es el uso de los llamados datos secundarios. ¿Qué es un dato
secundario? ¿De dónde sacarlos? ¿A dónde hay que ir para encontrarlos? ¿Cómo seleccio-
narlos? ¿Existen criterios a tener en cuenta a la hora de utilizarlos? Todas estas preguntas, y
otras muchas son cruciales para un buen uso de la información que tenemos a disposición.
Hoy en día las tecnologías de la información y de la comunicación nos permiten el acceso
a miles y miles de datos, disponibles en la Red. Pero, antes de poder usarlos, o para poder
usarlos correctamente, primero tenemos que tener claros ciertos criterios de uso. En este
capítulo vamos a hacer un repaso de los datos que se suelen utilizar en las investigaciones
educativas y sociales, cómo encontrarlos, cómo mirar cómo están construidos y, por tanto,
qué tener en cuenta a la hora de usarlos en nuestros estudios.
Un dato secundario es todo aquel que no hemos construido nosotros mismos, sino que
ya ha sido elaborado por alguien (normalmente una empresa o una organización que se
dedica a ello, por ejemplo el Instituto Nacional de Estadística (INE), el Instituto de Esta-
dística Europeo (Eurostat), la Organización para la Cooperación y el Desarrollo Económico
(OCDE), entre otros muchos). Como nosotros no hemos sido quienes hemos elaborado
los datos, tenemos que conocer perfectamente cómo esas organizaciones y empresas han
construido los datos, cómo organizaron la matriz, definieron los códigos y construyeron
los diferentes ítems que podemos luego consultar a través de Internet. En varios casos
(como en el caso de la OCDE, o en el caso de Eurostat, por poner solo dos ejemplos),
podemos incluso obtener ficheros de microdatos a través de la red. Esos microdatos siem-
pre vienen acompañados de un fichero donde se especifica cómo se codificaron los datos,
para saber cómo importarlos en programas de software (como el SPSS) y poder usarlos
luego correctamente.
173
¿Cómo buscar los datos que se requieren?
Cuando se hace un estudio el marco teórico que hemos escogido es el que orienta los pasos
que vamos dando a la hora de hacer la investigación. Cuando llegamos al apartado del tra-
bajo de campo, tenemos que decidir si usar datos cuantitativos, cualitativos o una combi-
nación de ambos. La decisión depende de los objetivos del estudio, de qué información que-
remos encontrar y si queremos hacer una descripción del fenómeno que estamos estudiando,
si buscamos relaciones estadísticas causales, si queremos analizar la opinión de las personas
implicadas en la realidad que estamos estudiando, etc.
Si decidimos usar datos cuantitativos, entonces bien podemos optar por hacer una encues-
ta y construir nosotros mismos el cuestionario, recoger los datos, construir la matriz, depu-
rarla y usarla para sacar frecuencias, cruces de variables y realizar pruebas estadísticas como
las que se han descrito en las páginas anteriores; o bien podemos decidir usar datos ya exis-
tentes (datos secundarios). Con estos datos se pueden aplicar las mismas técnicas estadísti-
cas que se han comentando hasta aquí. Sin embargo, como se puede adivinar, hay que tener
en cuenta la naturaleza de las variables que nos dan (si son categóricas, ordinales, nomina-
les), si los datos están agrupados o no (y si es que sí, de qué tamaño son los intervalos), si
las variables siguen la ley normal, o bien siguen una t de Student, o una F de Snedecor, o
cómo están construidos los índices que nos dan (qué conjuntos de variables los forman
y cómo están construidos). Si conocemos toda esa información, entonces podemos estar
seguros de usar los datos secundarios con toda confianza, aplicando correctamente las dife-
rentes técnicas estadísticas. Ahora bien, ¿dónde buscar esos datos?
Los datos del estudio PISA
Si necesitamos datos de ámbito europeo tenemos dos fuentes básicas de información que
deberíamos explotar: Eurostat y OCDE. En la OCDE disponemos de los Informes PISA (de
periodicidad trianual) y también de un informe muy utilizado en educación, Education at
a Glance (de periodicidad anual). En Eurostat disponemos de una serie de indicadores que
se plasman en tablas estadísticas ya elaboradas y también en informes y publicaciones que
nos pueden resultar de mucho interés, así como una base datos a través de la cual podemos
trabajar los datos estadísticos. Destacaremos solo las principales fuentes de datos relativas a
educación.
El programa PISA, desde su creación en 2000, ha tenido y sigue teniendo mucho peso
dentro de los debates en torno a los resultados académicos del alumnado. Su impacto se deja
notar en ámbitos como la investigación educativa, donde se utiliza muy habitualmente para
reforzar o rebatir argumentaciones teóricas. Se trata de un programa de la OCDE a través
del cual se evalúan los resultados académicos del alumnado de 15 años de los países de la
OCDE y otros países socios.
En el informe PISA 2009 participaron 65 países. Por un lado, los países de la OCDE:
Alemania, Australia, Austria, Bélgica, Canadá, Chile, Dinamarca, Dubái, Eslovenia, Espa-
174
Anexo 1: La explotación y el uso de los datos secundarios
ña, Estados Unidos, Estonia, Finlandia, Francia, Grecia, Holanda, Hungría, Irlanda, Islan-
dia, Israel, Italia, Japón, Korea, Luxemburgo, Méjico, Noruega, Nueva Zelanda, Polonia,
Portugal, Reino Unido, República Checa, República de Eslovaquia, Suecia, Suiza, Turquía.
Y además, también contó con la colaboración de los siguientes países: Albania, Argentina,
Azerbayán, Bulgaria, Brasil, Colombia, Croacia, Hong-Kong, Indonesia, Jordania, Kazajis-
tán, Letonia, Liechtenstein, Lituania, Macao, Panamá, Perú, Qatar, República de Kirguis-
tán, República de Montenegro, República de Serbia, Rumanía, Rusia, Shanghái, Singapur,
Tailandia, Taipei, Trinidad y Tobago, Túnez, Uruguay.
Figura A1.1. Página web de PISA.
Este programa se encuentra disponible en Internet y es posible bajar directamente los

datos que contiene, tanto en forma de informe como en formato de archivo de microdatos.
Se orienta hacia las políticas educativas y tiene una concepción del conocimiento amplia,
de aplicación a problemas que se resuelven en la vida diaria y no solo de afrontar problemas
de tipo académico. Se centra en la evaluación de matemáticas, ciencia y lectura. Cada tres
años el tema central del informe es una de estas áreas: en el informe publicado en el año 2000
el tema central fue la lectura. En el informe de 2003 el tema central fueron las matemáticas.
En 2006, el foco fue la ciencia. En 2009, la lectura volvió a centrar la temática del informe
PISA.
PISA trabaja con variables contextuales (características de los sistemas educativos de los
países participantes, niveles socioeconómicos del alumnado o características de las escuelas),
que se relacionan con los resultados que obtiene el alumnado en los diferentes tests. A tra-
175
vés de los cuestionarios que responden tanto directores de escuelas como alumnado, PISA
extrae los datos necesarios para poder establecer esas relaciones. También ha generado otro
tipo de cuestionarios para obtener más información y que, dependiendo de la edición del
Informe PISA, se ha puesto en marcha de manera optativa en los países participantes.
A través de los cuestionarios se consigue información relativa, por ejemplo, a los recur-
sos que posee el centro escolar, las prácticas educativas que se utilizan en la escuela o el con-
texto socioeconómico del alumnado y los procesos de aprendizaje.
La muestra del alumnado de cada país se confecciona por conglomerados (ver capítulo
5). Primero se eligen las escuelas y dentro de cada una de ellas se elige al alumnado que for-
ma parte de la muestra final. La selección por conglomerados facilita la comparación de
resultados entre escuelas que separan al alumnado por niveles de habilidad y las que no lo
hacen, ya que se dispone de datos de diversos estudiantes de cada escuela y no del alumna-
do que no tiene ninguna relación entre sí.
Las escuelas se seleccionan de manera aleatoria, dependiendo su probabilidad de ser ele-
gidas del número de alumnado de 15 años que posean. Una vez seleccionadas las escuelas
se escoge al azar el alumnado de 15 años que formará parte de la muestra. Existen algunos
motivos de exclusión, como por ejemplo que la escuela se ubique en un lugar remoto o que
la persona seleccionada tenga alguna discapacidad.
El cómo está construida la muestra es un criterio relevante a tener en cuenta. No es
lo mismo que la muestra se haya elegido de manera aleatoria, que el que sea una mues-
tra intencional. En el primer caso las técnicas estadísticas explicadas en este libro se pue-
den usar sin problemas. En el segundo caso, hay que ser muy cautos porque los resulta-
dos no se van a poder generalizar en ningún caso (sí que se puede, en cambio, aplicar la
estadística descriptiva). Por otro lado, usar el método de conglomerados o un muestreo
aleatorio simple también es crucial a la hora de usar los datos y buscar si son o no repre-
sentativos. No es lo mismo que la muestra mantenga las proporciones (de género, de
etnia, de país de procedencia, etc.) que tienen los diferentes grupos que forman parte de
la población o que esos grupos estén sobrerrepresentados (o infrarrepresentados) según
los azares de la selección de la muestra (ver capítulo 5). Saber que PISA sigue un método
de selección de la muestra, por tanto, es un dato relevante a la hora de usar su matriz de
datos.
Partiendo del informe PISA 2009 vamos a ver cómo explorar su página web para encon-
trar los datos que necesitamos.
En la web podemos encontrar varias páginas con información general del programa de
evaluación PISA. Los datos útiles para la investigación social y educativa los tenemos en el
apartado “What PISA produces?”. Dentro de esta sección podemos encontrar: informes, bases
de datos, descripción de los instrumentos (cuestionarios, etc.), entre otra serie de informa-
ciones.
176
Figura A1.2. PISA 2009.
La figura anterior muestra el contenido de PISA 2009, donde destacan los informes rela-
tivos a resultados y al marco conceptual, la base de datos que puede descargarse para traba-
jar, perfiles interactivos, informes técnicos y manuales.
En los informes se recogen los datos que la OCDE ha considerado más relevantes,
elaborados de la forma que han creído más conveniente. Por lo tanto, no consta en ellos
toda la información que puede obtenerse de los datos de PISA, sino solo lo que se ha cre-
ído más importante. De todas maneras, si queremos obtener los datos “brutos” para con-
feccionar nosotros mismos nuestras variables e índices, entonces tenemos que ir no a infor-
mes sino a la base de datos, para conseguir los ficheros de microdatos, como se verá más
adelante.
Los informes de PISA, al estar este programa orientado al diseño de políticas, no con-
sisten solo en tablas de datos, sino que contienen un análisis de la situación de los diferen-
tes países, de características de las escuelas que tienen relación estadística con los resultados,
tanto a nivel de calidad como de equidad, y posibles explicaciones que sitúan los datos en
un marco que permite un análisis de los mismos. Junto con los informes, hay tablas de datos
descargables en formato Excel. Estas tablas en Excel son susceptibles de poder ser trabaja-
das para nuestros estudios. Por ejemplo, a partir de una tabla Excel, se pueden obtener grá-
ficos adecuados a aquello que queramos estudiar; o bien podemos hacer cálculos con el pro-
grama Excel, como encontrar medidas de dispersión y de tendencia central, que nos permitan
sintetizar la información y presentarla de una manera más rápida o más comprensible para
la audiencia de nuestro trabajo. En estos casos, cuando usemos el programa Excel, debemos
177
tener en cuenta cómo funcionan las fórmulas estadísticas para hacer los cálculos de mane-
ra correcta.
También tenemos que considerar la naturaleza de los datos (no se puede calcular una
media aritmética de datos nominales, por ejemplo, puesto que no tiene sentido; en cambio
de una ordinal o una de intervalo, sí que se puede calcular). Por otro lado, si queremos “mez-
clar” datos (como por ejemplo generar una tabla con resultados académicos por niveles edu-
cativos en varios países), es preciso recordar que a veces los intervalos no tienen la misma
amplitud.
En la web de PISA también encontramos las bases de datos de los diversos estudios
realizados. Si entramos, por ejemplo, en “PISA 2009 Database”, nos encontramos con
tres secciones que nos permiten explorar los datos de PISA 2009 más allá de lo que apa-
rece en los informes. Estos datos adicionales están orientados sobre todo a las personas
interesadas en la investigación educativa. En la sección “Download the PISA 2009 dat
set” encontramos los datos de más bajo nivel de elaboración, esto es, los resultados de los
cuestionarios y los tests que se han aplicado a estudiantes, por países. Los cuestionarios y
sus correspondientes libros de codificación se encuentran en formato pdf. Los datos reca-
bados se ofrecen en archivos de texto plano (.txt), que son importables desde múltiples pla-
taformas diferentes (SPSS, SAS, Excel, etc.). De esta manera, si alguien quiere usar dichos
datos, únicamente tiene que bajarse los archivos de control con SAS o SPSS y luego impor-
tar los datos en .txt. Una vez abiertos los ficheros .txt, se ejecutan los archivos de control (se
pueden encontrar instrucciones más precisas en el “PISA 2003 Data Analysis Manuals for
SPSS and SAS users”.
Finalmente, los datos por países de cada pregunta de test y de cuestionarios se pueden
encontrar en los llamados compendia, en formatos tanto .doc como .xls (Word y Excel, res-
pectivamente).
De todas maneras, la web de PISA (igual que otras webs que ofrecen datos de libre dis-
posición) cuenta con una interfaz que permite la consulta de datos de manera sencilla e
intuitiva. Por ejemplo, si en aras de los requerimientos del estudio que estamos haciendo
necesitamos mirar por países qué porcentajes del alumnado tienen determinadas caracterís-
ticas o están en escuelas con determinadas características y qué resultados obtienen estas dis-
tintas tipologías de alumnado, podemos usar la herramienta “Interactive data selection” que
genera tablas exportables a Excel.
En cambio, si lo que necesitamos es el mismo grupo de datos del ejemplo anterior, pero
desde una perspectiva multidimensional (por ejemplo, resultados de países por sexo de los
estudiantes, y por si la escuela donde se escolariza es pública o privada), entonces usamos la
herramienta “Multi-dimensional Data Request”. Esta herramienta nos envía por email un
archivo Excel con tablas en las que se indican los porcentajes de estudiantes y sus resultados
conforme a la petición que hemos realizado, y seleccionando los casos de la matriz según las
dimensiones que hemos escogido (en total se pueden establecer hasta cuatro dimensiones
simultáneamente).
Además de lo comentado anteriormente, PISA también nos da la oportunidad de con-
sultar las preguntas de los tests. PISA usa preguntas que son comunes en distintas ediciones
178
de diferentes tests, que son preguntas ancla que sirven para poder comparar los resultados
en los estudios longitudinales. Estas preguntas, como es obvio, no pueden hacerse públicas,
pues de este modo estarían disponibles por si algún país o escuela quisiera prepararlas, adul-
terando así los resultados. Sin embargo, para que el público en general y las personas inves-
tigadoras puedan conocer el tipo de preguntas que se hace en PISA, hay algunas de estas
preguntas que están abiertas y disponibles para el público. Las preguntas que se hacen públi-
cas se sustituyen en las ediciones siguientes, para evitar el efecto de sesgo que se menciona-
ba anteriormente.
Education at a glance: la base de datos de la OCDE
Otra fuente de datos que se utiliza de forma muy habitual en educación es Education at
a Glance (disponible en Internet). Dentro de esta página encontramos una serie de valio-
sas estadísticas que podemos consultar, como por ejemplo los indicadores de la OCDE
relativos a educación de diferentes años o bases de datos relativas exclusivamente a edu-
cación.
Figura A1.3. Página web de Education at a glance, 2011.
Education at a glance es una publicación anual que presenta información incluida en la

base de datos de educación. Si necesitamos datos que ya están tratados dentro de este infor-
179
me y además sistematizados y que podemos comparar con años anteriores, no es necesario

invertir tiempo en realizar búsquedas dentro de la base de datos. Existe la posibilidad de des-
cargar el informe completo o de entrar en los diferentes apartados para ver las tablas de datos.
También es posible obtener en formato de texto plano (.txt) o Excel los datos de las dife-
rentes variables de las que recoge información la encuesta que pasa la OCDE. La página
web provee de una herramienta que permite escoger las variables y, como resultado, ofrece
en pantalla la tabla que puede ser exportada en los formatos apuntados más arriba.
La base de datos Eurostat
La agencia europea encargada de producir / recopilar datos estadísticos en Europa es Eurostat.

La base de datos de Eurostat se encuentra disponible en Internet. Esta base de datos ofrece una
serie de datos organizados ya en tablas. Pero, si en aras del estudio que estamos realizando
no encontramos los datos que necesitamos, también podemos recurrir a la base de datos de
Eurostat y pedir los cruces pertinentes.
Figura A1.4. Base de datos de Eurostat.
En ambos casos (tanto si consultamos las tablas predeterminadas, como si construimos

nosotros mismos los cruces) contamos con información relativa, por ejemplo, a diversos
indicadores incluidos en la nueva estrategia “Europe 2020” (a través de la cual podemos
acceder al seguimiento de la estrategia de Lisboa 2010).
Eurostat posee datos de gran interés por su rigor y valor comparativo, que son utiliza-
dos por organismos como el Ministerio de educación, política social y deporte para elaborar
180
sus estudios e informes. Algunos de estos nos son de gran valor, ya que nos aportan datos a
nivel nacional desglosados por Comunidades Autónomas y a nivel internacional viéndose
el lugar que ocupamos en comparación con otros países europeos.
El Instituto Nacional de Estadística (INE)
A nivel nacional, las principales estadísticas las encontraremos en el Instituto Nacional de

Estadística. El INE ofrece datos estadísticos de una gran variedad de temas diferentes (empleo,
consumo, inmigración, educación, tecnología, inversión, PIV, renta per cápita, etc.). En su
página web hay disponibles informes, estudios y bases de datos. Dentro de la página prin-
cipal del INE los recursos útiles para el trabajo de investigación en nuestros ámbitos están
en INEbase dentro de los datos relativos a Sociedad. Dentro de este último apartado se encuen-
tran las estadísticas relativas a educación que más nos pueden interesar.
Figura A1.5. Página web del INE.
Algunas temáticas interesantes que podemos trabajar con los datos que nos ofrece el
INE son, por ejemplo, la participación de personas adultas en educación formal y no for-
mal, el gasto público en educación o la vinculación entre el nivel de estudios y el mercado
de trabajo. Para acceder a ellos, el INE dispone de una herramienta que muestra las dife-
rentes variables existentes en la base de datos. En esta herramienta seleccionamos las varia-
181
bles de las que queremos extraer las tablas de frecuencias, o bien cruzarlas con otras varia-
bles, y el propio sistema nos ofrece los datos, que podemos importar en Excel o en fichero
de datos de texto plano (.txt).
Otras fuentes de datos
Otra importante fuente de información estadística a nivel nacional la encontramos en la

web del Ministerio de educación, cultura y deporte. De hecho, algunos datos estadísticos que
aparecen en el INE necesitan ser actualizados y por ello deberíamos consultar directamen-
te la web del citado ministerio.
Una vez dentro de la web del ministerio debemos ir a la sección de Información y den-
tro de ésta seleccionar estadísticas. A partir de este punto accedemos a “estadística de la edu-
cación” y ya entraríamos a seleccionar las estadísticas que nos interesasen.
Figura A1.6. Base de datos del Ministerio de Educación, Cultura y Deporte.
Además de las tablas estadísticas, en el apartado de “estadística de la educación” tam-

bién encontramos una sección llamada Indicadores y publicaciones de síntesis, y dentro de ésta
una publicación que se lleva a cabo anualmente, Las cifras de la educación en España.
La utilización de informes y publicaciones que contienen información estadística que
puede ser relevante para nuestros intereses es otra de las formas de explotar datos estadísti-
182
cos. En este caso ya dispondríamos de las tablas elaboradas y simplemente se trataría de

conectar la información que se plasma con las explicaciones que nos interesan desarrollar.
El siguiente cuadro está extraído del informe correspondiente al curso 2009-2010 (edi-
ción 2012), del apartado E4, relativo al alumnado extranjero.
Cuadro A1.1. Variación del alumnado extranjero por comunidad autónoma.

Enseñanzas no universitarias.
1999-2000 2004-05 Var. % 2009-10 Var. % Var. %
2004-05/ 2009-10/ 2009-10/
1999-2000 2004-05 1999-2000
TOTAL 107.303 460.518 329,2 762.420 65,6 610,5
Andalucía 14.673 51.340 249,9 89.180 73,7 507,8
Aragón 1.820 13.815 659,1 26.694 93,2 1.366,7
Asturias (Principado) 826 3.738 352,5 6.838 82,9 727,8
Balears (Illes) 4.740 17.197 262,8 27.655 60,8 483,4

Canarias 8.749 25.075 186,6 33.250 32,6 280,0
Cantabria 561 3.088 450,4 6.362 106,0 1.034,0
Castilla y León 3.379 15.384 355,3 29.472 91,6 772,2
Castilla-La Mancha 2.268 16.963 647,9 33.799 99,3 1.390,3
Cataluña 19.821 92.313 365,7 160.468 73,8 709,6

Comunitat Valenciana 9.461 62.137 556,8 97.272 56,5 928,1
Extremadura 1.127 3.507 211,2 6.221 77,4 452,0

Galicia 1.929 7.121 269,2 15.303 114,9 693,3
Madrid (Comunidad) 30.519 102.958 237,4 150.081 45,8 391,8
Murcia (Región de) 2.922 21.893 649,2 35.326 61,4 1.109,0
Navarra (Comunidad 1.011 7.930 684,4 11.127 40,3 1.000,6

Foral de)
País Vasco 2.413 10.922 352,6 23.612 116,2 878,5
Rioja (La) 507 4.137 716,0 7.785 88,2 1.435,5
Ceuta 39 228 484,6 444 94,7 1.038,5
Melilla 538 772 43,5 1.531 98,3 184,6
Si nos movemos en el ámbito autonómico debemos consultar los datos disponibles en

los servidores estadísticos de cada comunidad y contrastar, en la medida de lo posible, estos
datos con los del Instituto Nacional de Estadística.
183
La estructura y la organización de los datos
Vamos a retomar algunos de los ejemplos utilizados en el apartado anterior para profundi-
zar en cómo se encuentran estructurados los datos que necesitamos utilizar para las investi-
gaciones o actividades formativas que nos propongamos. En algunas de las páginas web
comentadas existen apartados de metodología donde se explica de forma detallada el pro-
ceso que se ha seguido para la obtención de los datos. En otros casos contamos tan solo con
la definición de los indicadores, sin poder disponer de informaciones complementarias sobre
la muestra o los márgenes de error.
Es importante siempre acudir a las fuentes más reconocidas e ir directamente a los datos
que necesitamos. Si queremos datos estadísticos que constan en el informe PISA 2009 debe-
mos ir a la OCDE y buscarlos. Puede resultar contraproducente consultar otras fuentes que
han explotado esos datos, ya que han podido incurrir en algún tipo de error, especialmen-
te si los han reelaborado.
Si el profesorado de un centro escolar se encuentra realizando un estudio sobre el éxito
escolar de su alumnado en comparación con otros centros educativos de su comunidad autó-
noma, es necesario que tenga muy presente el cómo, desde los órganos educativos autonó-
micos, llevan a cabo los informes sobre evaluación de competencias que le podrían servir
para evaluar esta cuestión. Se deberían tener en cuenta, por ejemplo, la muestra, los erro-
res, los cuestionarios que se han aplicado, quiénes han participado en el estudio, cómo se
ha seleccionado la muestra, cómo se han recogido los datos, cómo se ha realizado su poste-
rior explotación, etc. En el caso del INE, por ejemplo, se utilizan diversas formas para reco-
ger los datos existentes. Entre otras, las siguientes son ejemplo de ello: por censo, enumera-
ción por muestreo, combinación de censo y muestreo, por enumeración completa de datos
administrativos originales y por formulario estadístico individual. Además de conocer la
metodología de recogida de datos es básico también saber cómo han sido recogidos. En este
caso, el INE utiliza la entrevista personal directa, la conversación por teléfono, la transcrip-
ción de documentos administrativos, la autoenumeración por correo o de cualquier otra
forma, la observación directa de los hechos y las formas mixtas.
A veces comparamos datos de manera indiscriminada, como si fueran de la misma natu-
raleza, o se hubieran construido de la misma manera. Sin embargo, no siempre es así y hay
que tener mucho cuidado en cómo se usan los datos, porque, al hacerlo, podemos juntar
muestras de poblaciones diferentes, lo cual es un error estadístico grave que nos lleva a con-
clusiones incorrectas. Volviendo al ejemplo del INE, si estamos utilizando sus datos esta-
dísticos, es importante entrar en el apartado del Inventario de Operaciones Estadísticas de
la Administración General del Estado (IOE) y constatar la metodología empleada para la
obtención de los datos. La metodología de recogida de datos que utilizan establece tres gran-
des grupos: la obtención directa de datos estadísticos; utilización de fuentes administrati-
vas; obtención de estadísticas derivadas de otros resultados estadísticos y recopilaciones.
Si queremos, por ejemplo, consultar los datos relativos a la Encuesta sobre la Participa-
ción de la Población Adulta en las Actividades de Aprendizaje (EADA), debemos leer deteni-
damente toda la información relativa a cómo ha sido diseñada y puesta en marcha (en este
184
caso podremos consultar el cuestionario que se encuentra accesible en la web). En el caso

de la Encuesta de Población Activa encontramos mucha información, desde el cuestionario
utilizado para obtener los datos hasta una extensa explicación del diseño de la encuesta y un
resumen metodológico.
En ambos casos es importante disponer del cuestionario, ya que nos proporciona las
preguntas que han sido realizadas y de esta forma podemos valorar si son adecuadas a nues-
tros intereses o, tal y como están planteadas, no cumplen nuestras expectativas. En el caso
de la EPA sabemos su objetivo, unidades que utiliza la encuesta, el ámbito geográfico que
cubre, el ámbito poblacional, el periodo de referencia y las definiciones de los conceptos que
utiliza y el cálculo de diferentes tasas.
Este proceso de análisis también es crucial hacerlo cuando trabajamos con datos de fuen-
tes internacionales. Por ejemplo, en el caso de datos extraídos de organismos internacionales
como OCDE y Eurostat disponemos de extensa información relativa a cómo se encuentran
estructurados y organizados los datos. Como ya hemos explicado, la OCDE dispone de un por-
tal específico de estadística y en su sección de educación incluye una base de datos de libre acce-
so, los diversos informes PISA y una base de datos solo con los datos relativos a PISA e infor-
mes como el Education at a Glance. En el caso concreto de PISA, por ejemplo, podemos acceder
a la base de datos de PISA 2009 a través de la cual tenemos tres posibilidades, la base de datos
PISA 2009 para investigadores profesionales, la selección interactiva de datos y la opción de
pedir datos multidimensionales. Si no disponemos de los conocimientos necesarios para poder
explotar la base de datos de manera profesional, es mejor optar por la selección interactiva de
datos. Al acceder a la selección interactiva de datos se nos abre la siguiente pantalla:
Figura A1.7. Selección interactiva de datos: PISA 2009.
185
Podemos obtener los cuestionarios del alumnado y de las escuelas. De esta forma, dis-
ponemos de las preguntas que han sido realizadas y nos hacemos una idea de las variables
con las que podremos trabajar. Una vez hemos examinado los cuestionarios pasaríamos a
elegir los países que nos interesan para extraer las tablas y las variables de alumnado y de
escuelas.
En conclusión...
Como hemos podido comprobar, usar datos estadísticos ya elaborados no es tarea fácil. No
solo hay que saber dónde buscarlos. También tienen que estar dentro de un marco teórico
y responder a las preguntas de investigación que guían nuestro trabajo. Además, cuando usa-
mos datos que han hecho otras personas, tenemos que ser extremadamente cautelosos por-
que no sabemos las condiciones en las que los han elaborado, cómo se ha seleccionado la
muestra, a qué poblaciones se refieren y si son comparables con otras fuentes de datos, o no.
Cuando vemos una tabla de datos, tenemos que desarrollar un espíritu crítico: no creernos
de entrada nada de lo que veamos; preguntar siempre de dónde salieron los datos, quién los
elaboró, cómo, cómo se agruparon, etc. Estas son preguntas fundamentales que, si las tene-
mos en cuenta, evitarán en muchos casos malas prácticas y que hagamos afirmaciones que
no son correctas y que pueden generar visiones sesgadas de la realidad. Nuestra responsabi-
lidad como investigadores está en juego.
Para la reflexión...
1. Existe la idea comúnmente extendida de que los malos resultados académicos

registrados en educación primaria y secundaria son debidos, entre otras cuestio-
nes, a la inversión realizada en educación. El siguiente cuadro se ha construido
con datos procedentes de Eurostat y denota que en ciertos países se obtienen mejo-
res resultados en PISA 2009 invirtiendo menos que otros países que sacan peo-
res resultados.
Cuadro A1.2. Gasto público total en educación en relación con el PIB
2003 2008
UE (27 países) 5,14(1) 5,07(1)
Alemania 4,70 4,55
Austria 5,57 5,46
[.../...]
186
Cuadro A1.2. (continuación)
Bélgica 6,03 6,46

Bulgaria 4,23 4,61
Chipre 7,29 7,41
Dinamarca 8,33 7,75
Eslovaquia 4,30 3,59
Eslovenia 5,82 5,22
España 4,28 4,62
Estonia 5,29 5,67
Finlandia 6,44 6,13
Francia 5,90 5,58
Grecia 3,56 ..
Hungría 5,89 5,10
Irlanda 4,38 5,62
Italia 4,74 4,58
Letonia 5,32 5,71
Lituania 5,16 4,91
Luxemburgo 3,77 ..
Malta 4,70 6,01
Países Bajos 5,42 5,46
Polonia 5,35 5,09
Portugal 5,57 4,89
Reino Unido 5,24 5,36
República Checa 4,51 4,08
Rumanía 3,45 ..
Suecia 7,30 6,74
(1) Estimación de Eurostat.
Fuente:
http://www.educacion.gob.es/horizontales/estadisticas/indicadores-publicaciones-sinte-
sis/cifras-educacion-espana/2012.html (indicadores estadísticos internacionales)
187
Cuadro A1.3. Número medio de alumnos por profesor.

Curso 2008-2009
E. Infantil E. Primaria E. Secundaria
Alemania 13,6 17,4 14,8
Austria 15,2 12,6 9,9
Bélgica (2) 15,8 12,5 9,5
Dinamarca 5,5 x ..
Eslovaquia 12,8 17,7 14,5
Eslovenia 9,4 16,7 11,0
España 12,1 13,3 9,8
Estonia .. 16,2 16,3
Finlandia 11,2 13,6 13,6
Francia (2) 19,7 19,7 12,2
Grecia .. .. ..
Hungría 11,0 10,7 11,8
Irlanda (3) 10,4 15,9 12,6
Italia (3) 11,0 10,7 11,0
Luxemburgo (3) 13,0 11,6 9,1
Países Bajos (3) x 15,8 16,1
Polonia 18,6 10,2 12,4
Portugal 15,7 11,3 7,7
Reino Unido 16,4 19,9 13,7
República Checa 13,8 18,4 11,8
Suecia 6,3 12,1 12,3
Unión Europea (1) 12,9 14,5 12,1
(1) Se incluyen los 21 países de la UE, diecinueve que forman parte de la OCDE y 2 aso-
ciados (Eslovenia y Estonia).
(2) Solo instituciones financiadas con fondos públicos.
(3) Solo instituciones públicas (para Irlanda en E. Secundaria; para Italia en E. Infantil, E. Pri-
maria y E. Secundaria; para Australia en E. Superior 5 A y 6 y para la Federación Rusa en E.
Primaria).
Fuente: Panorama de la educación 2011. Proyecto de Indicadores de la OCDE.
Fuente:
http://www.educacion.gob.es/horizontales/estadisticas/indicadores-publicaciones-sinte-
sis/cifras-educacion-espana/2012.html (indicadores estadísticos internacionales)
Con base en estos datos, juzga la afirmación que se ha hecho al inicio.
188
2. Analizando los datos que nos aporta la sección de participación de personas adultas
en actividades educativas formales y no formales en la web del INE, podríamos lle-
gar a concluir que, a mayor nivel de estudios, mayor es la participación de las per-
sonas adultas. Ese dato nos podría inducir a afirmar que las personas más formadas
son las que más se interesan por seguir formándose y que aquellos y aquellas que no
poseen un cierto nivel de estudios no participan por falta de interés, porque no les
motiva formarse. Fíjate en el siguiente cuadro:
Cuadro A1.4. Participación en actividades de educación según máximo nivel

de estudios terminados. 2007. Unidades: porcentajes
Participan en actividades educativas
Total 27,98
Primera etapa de secundaria y niveles inferiores 14,89
Estudios de grado medio 34,52
Estudios de grado superior y universitarios 49,62
Notas: 1) La categoría ‘Estudios de grado medio’ comprende: bachillerato, enseñanzas técnico-pro-
fesionales de grado medio y equivalentes. 2) Datos referidos a los 12 meses anteriores a la fecha de
la encuesta. El símbolo ‘.’ debe interpretarse como dato que no puede darse por poder estar afecta-
do de errores de muestreo.
Fuente: Instituto Nacional de Estadística.
¿Estás de acuerdo con esa interpretación? Justifica tu respuesta.
4. En ocasiones disponemos de una buena elaboración teórica, construida con base

en las mejores aportaciones de la comunidad científica internacional y lo que no
somos capaces de encontrar son los datos estadísticos que puedan reforzarla. Pue-
de tratarse de una falta de datos o que tal y como están siendo explotados no res-
ponden a nuestro trabajo previo de investigación teórico. El éxito educativo, por
ejemplo, depende de muchas variables, siendo fundamental una de ellas si se sepa-
ra al alumnado por nivel de habilidad. A nivel teórico ya ha sido ampliamente
demostrado que las clases que se llevan a cabo en grupos homogéneos fomentan
que una buena parte del alumnado se quede en el camino. ¿Qué fuentes estadísti-
cas usarías para justificar con datos esta conclusión que ya se ha alcanzado desde
la teoría? ¿Qué variables crees que sería necesario cruzar? ¿Dónde las buscarías? Jus-
tifica tu respuesta.
5. A continuación apuntamos un ejemplo de construcción de tabla. En este caso hemos
seleccionado España como país y hemos escogido dentro de las variables de escuela
la relativa a “streaming” entre clases. La tabla nos proporciona la información rela-
tiva a España y la media y total de la OCDE. De esta forma, podemos comparar los
resultados obtenidos en nuestro país con los obtenidos en la media de la OCDE.
189
Cuadro A1.5. Ejemplo de tabla extraída de la base de datos de la OCDE
Variable: SC08Q01 Streaming between classes Q8a

Some schools organise instruction differently for students with different abili-
Full
ties. What is your school policy about this for students in <national modal gra-
question:
de for 15-year-old> Students are grouped by ability into different classes
Category: 1 For all subjects
2 For some subjects
3 Not for any subject
Reading Mathematics Science
Country Variable Category % (%SE) Mean (SE) Mean (SE) Mean (SE)
Spain SC08Q01 1 6.87 (1.22) 460 (5.58) 474 (7.16) 486 (7.74)
Spain SC08Q01 2 38.67 (3.39) 458 (4.53) 475 (4.52) 484 (4.77)
Spain SC08Q01 3 45.28 (3.58) 461 (3.96) 483 (3.59) 490 (3.83)
Spain SC08Q01 m 9.18 (1.73) 474 (10.46) 489 (9.20) 501 (9.80)
OCDE Total SC08Q01 1 7.60 (0.75) 475 (3.92) 484 (4.17) 491 (5.27)
OCDE Total SC08Q01 2 46.39 (1.19) 494 (2.43) 487 (2.11) 496 (2.10)
OCDE Total SC08Q01 3 37.87 (1.08) 485 (1.82) 489 (1.83) 495 (1.81)
OCDE Total SC08Q01 m 8.14 (0.66) 449 (4.54) 437 (7.65) 443 (7.56)
OCDE Average SC08Q01 1 10.35 (0.36) 482 (3.97) 492 (3.69) 495 (3.34)
OCDE Average SC08Q01 2 33.30 (0.50) 485 (2.19) 491 (1.87) 493 (1.82)
OCDE Average SC08Q01 3 48.21 (0.57) 501 (1.37) 506 (1.29) 509 (1.33)
OCDE Average SC08Q01 m 8.86 (0.37) 488 (2.66) 490 (2.73) 492 (2.70)
a - The category does not apply in the country concerned. Data therefore missing
c - There are too few observations to provide reliable estimates
m - Missing or invalid response category
OCDE Average - the average of the valid percentages and mean performance of OCDE countries.
OCDE Total - (OCDE as single entity) - each country contributes in proportion to the number of 15-year-olds
enrolled in its schools.
Interpreta correctamente este cuadro en función de la información metodológica que

se facilita.
190
ANEXO 2
Software estadístico en las ciencias
sociales y educativas: el caso del SPSS
Las personas que nos dedicamos actualmente a la investigación en ciencias sociales y edu-
cativas no necesitamos muchas veces hacer complejos y tediosos cálculos matemáticos para
llegar a los resultados numéricos que andamos buscando. Ese tipo de procesos ya están sis-
tematizados y se pueden realizar utilizando programas informáticos especializados. Lo impor-
tante, en nuestro trabajo, es saber, por un lado, interpretar qué dicen los resultados que arro-
jan los programas informáticos y, por otro, qué operaciones podemos pedirles a dichos
programas que hagan.
El software estadístico está preparado para calcular virtualmente cualquier cosa que le pida-
mos (si tiene una base numérica). Pero no todo lo que podemos pedirle al programa es váli-
do, matemática y estadísticamente hablando. En este anexo explicaremos cómo utilizar el pro-
grama más usado en ciencias sociales y educativas para hacer cálculos estadísticos, el SPSS
(Statistics Package for Social Sciences) y qué nos dicen las herramientas que contiene. Para la
confección de este anexo hemos utilizado la versión 18, que se denomina PASW statistics 18
(http://support.spss.com/productsext/statistics/documentation/18/clientindex.html).
En cualquier manual de SPSS podemos ver cómo funcionan los diferentes menús. No
vamos a detenernos en ese punto; ya existen muchos manuales donde puede encontrarse
esta información y nuestro interés se centra en resaltar los elementos básicos para trabajar
con datos cuantitativos o cualitativos en una investigación (Green y Salking, 2005). Para
llevar a cabo análisis estadístico con el programa SPSS es necesario seguir una serie de pasos
que podríamos concretar de la siguiente manera:
1. Introducir los datos en el programa. Para ello es necesario definir primeramente las
variables y posteriormente introducir los datos obtenidos con cada instrumento de
medida. Una vez introducidos, los guardaremos con la extensión .sav.
191
2. Depurar la matriz minimizando algunos posibles errores y adecuar los datos a los
análisis que pretendemos realizar, transformando o creando nuevas variables a par-
tir de las existentes, si procede.
3. Seleccionar el procedimiento a seguir. Habitualmente, dentro de las posibilidades
existentes con el programa, desplegaremos el menú “analizar”, donde dispondremos
de las opciones de análisis de datos más utilizadas.
4. Realizar el análisis. Pediremos al ordenador todas las pruebas que nos interesen den-
tro de la ventana ANALIZAR.
Empezando a utilizar el programa: vista de variables
Cuando encendemos el programa SPSS, aparece una pantalla que es una hoja con celdas
dispuestas en filas y columnas, a lo largo y ancho de la pantalla (algo así como una hoja de
cálculo de Excel). En esta pantalla es donde se introducen los datos numéricos que hemos
recogido durante el trabajo de campo. Más adelante ya veremos que los datos pueden pro-
ceder de fuentes primarias (los podemos haber elaborado/obtenido nosotros mismos) o bien
pueden proceder de fuentes secundarias (bases de datos ya existentes, que bien se pueden
importar o bien se pueden reelaborar teniendo en cuenta la manera como han sido elabo-
rados, para no desvirtuarlos ni usarlos de manera incorrecta).
Figura A2.1. PASW Statistics.
Al abrirse el programa aparece la pantalla superior en la que podemos seleccionar una

de las siguientes acciones: ejecutar el tutorial, introducir los datos, ejecutar una consulta
192
Anexo 2: Software estadístico en las ciencias sociales y educativas: el caso del SPSS
existente, crear una consulta mediante el asistente para bases de datos, abrir un origen de
datos existente o abrir otro tipo de archivo. Si es la primera vez que entramos debemos bien
ir a la opción de introducir datos y aceptar o bien cancelar y aparecerá igualmente la pan-
talla de vista de datos y vista de variables (figura inferior).
Figura A2.2. Visor de datos.
En la parte superior de la pantalla podemos leer las diferentes opciones de menús

que nos ofrece el programa, archivo, edición, vista, datos, transformar, análisis, gráficos,
utilidades, ventana y ayuda. En la parte inferior disponemos de vista de datos y vista de
variables.
Lo primero que debemos hacer es ir a vista de variables y definir todas y cada una de
ellas. Cada fila horizontal representa una variable, reservándose las primeras, habitualmen-
te, para el sexo, la edad, nivel de estudio, etc. En vertical disponemos de nombre, tipo, anchu-
ra, decimales, etiqueta, valores, perdidos, columnas, alineación y medida.
Por defecto, al darle nombre a la primera variable, aparecen todos los datos relativos a
esa variable, pero que deben ser adaptados a nuestra realidad. En la siguiente figura hemos
introducido tres variables (sexo, edad y nivel de estudios) y por defecto salen los valores que
se pueden ver en la misma.
193
Figura A2.3. Vista de variables.
En la columna correspondiente al nombre ponemos el nombre de la variable que esta-

mos trabajando. Si tomamos un cuestionario, donde la primera pregunta es sobre el sexo de
la persona entrevistada, aquí es donde tenemos que escribir el nombre que le damos a esa
variable, por ejemplo: “SEXO”. Una vez que hayamos hecho eso, la siguiente columna es
“tipo”. Aquí es donde le decimos al programa si la variable que estamos usando es numéri-
ca o alfanumérica (es decir, contiene letras aparte –o en vez– de números).
Si disponemos de preguntas como por ejemplo “¿Cuántos años tienes?” se trataría cla-
ramente de una variable de tipo numérico. Si por el contrario hemos realizado una pregunta
abierta, sobre por ejemplo “¿qué haces para resolver tus dudas de matemáticas?”. Entre las
respuestas podemos encontrar a quienes digan: “pregunto al profesor”, “consulto libros”,
“miro la respuesta en Internet”, “pido ayuda a mis padres”, etc. Como tenemos tanta varia-
bilidad, hemos decidido dejar la pregunta abierta. A la hora de introducir la información
en SPSS nos puede interesar hacer una primera aproximación escribiendo literalmente lo
que nos dijeron las personas que entrevistamos. Esta variable, por tanto, es alfanumérica.
Después tenemos algunas opciones más relacionadas con el formato, como la columna de
la longitud (donde decimos qué longitud tienen las respuestas, si son números de una cifra o
dos, o cadenas de valores ilimitadas), los decimales (si queremos que los marque con una exac-
titud de dos cifras, tres, etc.) y la etiqueta (es el nombre con el que se codificará en los resulta-
dos la variable). La etiqueta es importante, porque luego el programa va a usarla a la hora de
hacer los cruces de variables, para identificarlas en las tablas de resultados que nos presente.
Llegamos así a una nueva columna, “valores”, muy importante. Aquí es donde le deci-
mos al programa cómo hemos codificado la variable. Por ejemplo, en el caso de la variable
194
“SEXO”, podemos decidir que esté codificada de la siguiente manera: 1 = “hombre”,

2 = “mujer”. Estos códigos (1, 2) corresponden a las respuestas que aparecen en el cuestiona-
rio. Por tanto, si en la matriz de datos escribimos un 2, eso corresponde a una persona que dijo
que era “mujer”. Si introducimos esta información codificada de esta manera en SPSS, el pro-
grama, cuando “vea” un dos en esa columna, en la matriz de datos, interpretará que se trata
de una “mujer”, porque 2 es igual a “mujer”, tal y como lo hemos definido en la lista de varia-
bles. De la misma forma, el resto de variables de la matriz también las tenemos que codificar,
de manera que cuando SPSS “vea” un valor en la matriz sepa a qué corresponde.
Para añadir los diferentes valores es necesario presionar dentro de la casilla y se abrirá una
imagen como la que aparece en la figura A2.4. Si queremos introducir los valores relativos a
sexo deberemos hacer lo siguiente: poner 1 en valor y hombre en etiqueta, pulsar añadir; poner
2 en valor y mujer en etiqueta y pulsar de nuevo añadir. Para finalizar le damos a aceptar.
Figura A2.4. Etiquetas de las variables.
Después de la columna de los “valores”, aparece la columna de “perdidos”. De nuevo,

se trata de una columna importante. Aquí es donde le decimos al programa qué valores con-
sideramos que son correctos absolutamente y cuáles, por los motivos que sean, considera-
mos “valores perdidos”. Por ejemplo, puede ser que hayamos pasado un cuestionario don-
de en una pregunta hayamos dado la opción de “no sabe/no contesta”. Si consideramos que
las personas que hayan elegido esa respuesta no aportan ninguna información relevante a
nuestro estudio, entonces podemos considerar que quien dijo “no sabe/no contesta” es una
persona “perdida” para el objetivo de nuestro estudio. Para evitar sesgos debidos al tamaño
195
relativo de la cantidad de respuestas, podemos directamente “eliminar” el efecto que tienen

esas respuestas sobre el conjunto de los datos. De esta manera, cuando pidamos al SPSS una
media aritmética, no estará influida por los valores “perdidos”. Tampoco lo harán las fre-
cuencias corregidas (porque son números de donde SPSS descuenta los valores perdidos).
Por tanto, el efecto de la “pérdida” se puede minimizar.
Luego vienen un par de opciones de formato (columnas, alineación), donde decimos al
programa cómo queremos alinear los datos (si a la izquierda de la celda, o a la derecha, o en
el centro, etc.). Y la opción final es “medida”. Aquí es donde decimos al programa de qué
variable estamos hablando. Recuérdese que las variables pueden ser nominales, ordinales,
de intervalo o de razón. Que una variable sea de un tipo o de otro no es un aspecto irrele-
vante: si es una variable de escala, podremos hacer operaciones matemáticas con ella; si es
una variable nominal, ciertas operaciones matemáticas (a pesar de que el SPSS nos va a dar
un resultado numérico) no van a tener sentido. En la columna “medida” el programa nos
da opción a declarar de qué tipo es la variable, nominal, ordinal o de escala (esta última
incluye las de intervalo y de razón). Finalmente, en la opción “rol” podemos identificar el
papel de cada variable en nuestro análisis.
Figura A2.5. Rol de la variable.
En la figura anterior vemos cómo han sido definidas las variables de sexo, edad y nivel
de estudios. En estos casos, se trata de variables numéricas y el formato no ha sido alterado.
En la columna de “valores” han sido introducidos todos los valores necesarios para que el
programa identifique las diferentes opciones que las personas encuestadas tenían a la hora
196
de responder. Finalmente, en la columna “medida” se ha definido el sexo como nominal, la

edad como de escala y el nivel de estudios como ordinal.
Vista de datos
En segundo lugar, introduciremos los datos relativos a cada caso. Para ello, iremos a vista de
datos y añadiremos la información. Si se trata de un cuestionario, deberíamos primeramente
codificar todas las posibles respuestas que las personas encuestadas puedan proporcionar-
nos. Esta información es la que hemos debido introducir previamente al darle “valores” a
cada variable.
En la matriz cada fila corresponde con un caso (una persona que haya respondido un
cuestionario, por ejemplo) y cada columna es una variable (que puede corresponder, o no,
con una pregunta del cuestionario). A veces las preguntas de los cuestionarios son de múl-
tiple respuesta, de manera que en cada pregunta encontramos más de una variable. La codi-
ficación del cuestionario tiene que ser una tarea previa para asegurarnos después que vamos
a ser capaces de organizar la información de manera correcta (es decir, eficiente). Se reco-
mienda siempre hacer una prueba piloto, para ver si el cuestionario funciona y si está bien
estructurado, para ser luego vaciado en una matriz de datos coherente.
Cuando encendemos SPSS, la pantalla que aparece por defecto suele ser la pantalla de
entrada de los datos: es una tabla, donde en cada celda apuntamos el dato correspondiente.
Figura A2.6. Vista de variables.
197
El vaciado de los cuestionarios dentro de la matriz de datos se lleva a cabo de manera

mecánica. Se trata de introducir cada respuesta, a la cual ya le hemos dado un código al dar-
le valores a la variable, sin cometer errores. El resultado final será una pantalla repleta de
números (si se trata de variables numéricas) y letras (si alguna de ellas es alfanumérica). Lo
importante no es el vaciado, sino el cuestionario y la codificación de todas y cada una de las
variables. Si las variables están bien definidas no tendremos problemas a la hora de crear la
matriz y posteriormente pedirle cálculos al programa.
La definición de la matriz, conforme a los criterios que hemos comentado más arriba,
es un aspecto crucial para garantizar la fiabilidad y la validez tanto de los resultados, como
del análisis que hagamos.
El uso de datos con el SPSS
En el capítulo 2 hemos hablado de la estadística como una herramienta de análisis descrip-

tivo. Como se recordará, cuando hablábamos de cómo organizar los datos, había dos opcio-
nes: bien utilizar fuentes primarias de datos (elaborar nosotros mismos el dato, a través de
encuestas, cuestionarios, etc.) o bien usar datos procedentes de fuentes secundarias.
El caso es que, como científicos sociales, muchas veces tenemos que utilizar datos cuanti-
tativos en nuestro trabajo de investigación para argumentar ideas o conceptos. El SPSS nos
permite simplificar mucho el trabajo, porque tiene una serie de herramientas que nos permi-
ten cargar rápidamente archivos de microdatos en el sistema, para poderlos utilizar en nues-
tro trabajo. En este apartado nos vamos a centrar en explicar cómo se pueden usar esos datos.
Supongamos que queremos utilizar los datos de la encuesta PISA en varios países; vamos
para ello a la web de la OCDE y obtenemos los datos “brutos” del microfichero de datos (la
OCDE nos da acceso a la matriz de datos original). Para cargar los datos en el programa,
debemos ir a la opción “Abrir datos” que está situada en el menú de “Archivo”. Esta opción
nos permitirá pasar los datos de nuestro archivo al sistema del SPSS, para poder usarlos sin
problemas. El SPSS viene preparado para abrir/importar datos tanto en formato SPSS, como
archivos de Excel, SAS, Stat y archivos de texto plano (.txt) delimitados por tabuladores.
Cuando abrimos el archivo, por lo general lo que tenemos es una matriz de datos. Las
columnas de esa matriz suelen corresponder a las variables, mientras que las filas son cada
uno de los casos o individuos que respondieron al cuestionario. En Excel, por ejemplo, pode-
mos tener nombres en cada una de las columnas, que indican cómo se llama la matriz. Esta
información también la podemos pasar a SPSS, al abrir el fichero desde el programa. El pro-
pio SPSS convertirá los nombres de las columnas de Excel en variables con nombres váli-
dos (para lenguaje de SPSS).
Algunos detalles a tener en cuenta son que, cuando se abre un archivo en SPSS, el pro-
grama considera cada columna de la matriz como una variable. El tipo de datos y el ancho
de cada variable están determinados por el tipo de datos y el ancho que se le da a la colum-
na en el programa original. Por otro lado, si en nuestra matriz existen datos en blanco (casi-
llas vacías) entonces el SPSS, cuando interpreta esos datos, considera las casillas vacías como
198
datos perdidos (que el SPSS indica con una coma o un punto en el visor de la matriz
de datos).
Supongamos que queremos analizar la relación existente entre el tipo de agrupamiento
en el aula y los resultados académicos obtenidos por países, en los diferentes niveles educa-
tivos. Vamos a la matriz, localizamos las columnas correspondientes a: “tipo de agrupación”,
“país”, “nivel de estudios” y “resultados obtenidos en PISA”, y las cruzamos. El programa
nos construye una tabla de frecuencias cruzadas (CROSSTABS), donde nos dice, del país
A, los que están “dentro del aula”, en el “nivel educativo de secundaria”, obtienen tal o cual
nota en PISA. De ahí deducimos que en secundaria, si los estudiantes están juntos, enton-
ces sacan mejor (o peor nota) que si están separados en clases diferentes. Pero surge un pro-
blema, la variable “nivel educativo” no es homogénea (cada país tiene su propio sistema edu-
cativo, y lo que aquí es primer curso de secundaria, en otro país puede ser séptimo curso de
primaria, por ejemplo); por tanto, no son datos comparables, porque estamos hablando de
cosas diferentes. Sin embargo, el SPSS construirá una tabla, con números, y nos la mostra-
rá cuando le pidamos los resultados. Por eso hay que estar tan alerta a la hora de usar datos
secundarios y siempre preguntarse qué tipo de datos tenemos y si son (o no) equiparables
entre sí (por ello, es fundamental ir al documento explicativo de cómo usar los datos de
SPSS disponible en la web de PISA).
Al usar datos de fuentes primarias este tipo de problemas desaparece, pero entonces apa-
recen otra serie de amenazas que debemos tener en cuenta para no cometer errores. Lo fun-
damental radica en definir de manera correcta todas las variables y no mezclar datos. Por
ejemplo, si estamos llevando a cabo un estudio longitudinal y cambiamos un poco una de
las preguntas (porque nos hayamos percatado de que las categorías de respuesta no estaban
del todo bien orientadas), no la podríamos analizar de manera conjunta, al menos sin rea-
lizar una serie de operaciones que puedan permitirlo.
Hay que tener en cuenta una serie de consideraciones. Si los datos nuevos son más agre-
gados que los datos previos, entonces la unidad de agregación que debe prevalecer es la nue-
va. En otras palabras, si en un primer momento pedimos a cada persona entrevistada su edad
y luego nos damos cuenta de que con pedirles que se sitúen en una escala agrupada de 10
en 10 años es suficiente, a la hora de analizar la variable “edad”, en los cuestionarios origi-
nales tendremos que reagrupar la variable edad en grupos de 10 en 10, para que sean com-
parables. En SPSS eso es fácil: simplemente tenemos que crear una variable nueva “edad_2”,
recodificada (Green y Salking, 2005).
El editor de datos del SPSS
Cuando abrimos el SPSS y entramos en un archivo nuevo o bien abrimos uno existente,
estamos entrando en lo que se llama “editor de datos”. Hay dos componentes esenciales del
editor de datos: el modo de vista de datos, que es donde aparece la matriz (es decir, toda la
información que hemos recogido con las encuestas); y el modo de vista de variables, que es
la pantalla donde aparecen todas las variables que tenemos, definidas de acuerdo al tipo, a
199
la anchura de la columna, a la posición en la matriz de datos, a los códigos de las diferentes

categorías de respuesta, etc.
Igual que en el caso de un programa de cálculo como el Excel, en SPSS (en el modo de
vista de datos) la información aparece organizada por filas y columnas. Las filas correspon-
den a cada una de las personas (individuos) que han participado en la encuesta.
En cambio, en las columnas ponemos los valores correspondientes a las diferentes varia-
bles. Pero, para definir estas variables, tenemos que activar el modo de vista de las variables.
Si lo hacemos, aparece una pantalla en donde podemos especificar el nombre de la variable,
de qué tipo es (si es numérica, alfanumérica, etc.), la anchura de la columna que le asigna-
mos, si admite el uso de decimales o no, cuál es la etiqueta (que aparecerá luego en el fiche-
ro de resultados, cuando pidamos al SPSS que nos construya tablas, por ejemplo) y los valo-
res de los códigos (por ejemplo, si estamos mirando el género, habitualmente 1 suele utilizarse
como código para hombre y 2 como código para mujer; por tanto, cuando en esta colum-
na en la matriz veamos tres doses y luego un uno, sabremos que respondieron tres mujeres
y un hombre). La etiqueta del código luego aparece también en las tablas de frecuencias,
correlaciones, etc., cuando se las pedimos al programa.
Finalmente, otro elemento crucial es el nivel de medida: todas las variables tienen que
ser nominales, de intervalo (ordinal) o de razón (escala). Definir la naturaleza de la variable
es crucial para que el SPSS sepa qué operaciones puede realizar y cuáles no es lícito que lo
haga.
El SPSS es un programa cada vez más intuitivo. Por eso, cuando tenemos que añadir
una variable, nos van apareciendo cuadros de diálogo que, de manera protocolaria, ya nos
van preguntando los diferentes tipos de información que necesita el programa para crear la
variable de manera correcta.
Una vez que hemos definido las variables, ya estamos preparados para introducir nues-
tros datos. En este caso, tenemos que ir a la ventana donde se ve la matriz de datos (vista de
datos). Ahí es donde podemos ir rellenando las diferentes columnas con la información de
nuestros cuestionarios, teniendo cuidado de no confundirnos de columna, porque, si no, la
información de las diferentes variables se traspapelaría. Para introducir datos no numéricos
hay que especificar en la variable que es del tipo cadena (o alfanumérica). En otro caso, solo
nos dejará introducir números.
200
Bibliografía
Bagozzi, R.P. (1979). Causal models in marketing. New York: Wiley.

Barnett, W.S., Young, J.W. & Schweinhart, L.J. (1998). How preschool education influences long-
term cognitive development and school success: A causal model. In W.S. Barnett & S.S. Boocock
(Eds.), Early care and education for children in poverty: Promises, programs and long-term results
(pp. 167-184). Albany, NY: SUNY Press.
Baudelot, Ch., & Establet, R. (1976). La educación capitalista en Francia. Madrid: Siglo XXI.
Bayes, Th. en AAVV. (1787-1791). Abrégé des transactions philosophiques de la société Royale de Lon-
dres. París: Chez Buisson.
Becker, H.J., Epstein, J.L. (1982). Parent involvement: A survey of teacher practices. Elementary
School Journal, 83(2), 85-102.
Benet, K.K., Weigel, D.J., & Martin, S.S. (2002). Children’s acqusition of early literacy skills: Exam-
ining family contributions. Early Childhood Research Quarterly, 17, 295-317.
Bernouilli, D. (1954). Exposition of a New Theory on the Measurement of Risk. Econometrica, Vol.
22, No. 1, pp. 23-36.
Bernoulli, J. (1713). Ars conjectandi. Basileae, Impensis Thurnisiorum, Fratrum.
Boethel, M. (2004). Readiness: School, family and community connections. Annual synthesis. Austin:
National Center for Family and Community Connections with Schools.
Bourdieu, P. (1979). La distinction: critique social du jugement. Paris: Editions Le Minuit.
Bourdieu, P., & Passeron, J. (1977). Reproduction in education, society and culture. London: Sage.
Bowles, S., & Gintis, H. (1976). Schooling in Capitalist America. London: Routledge and Kegan Paul.
Box, G.E., Jenkins, G.M. (1976). Time series analysis: Forecasting and control. New Jersey: Prentice
Hall.
Brooks-Gun, J., Berlin, L.J., Leventhal, T. & Fuligni, A. (2000). Depending on the kidness of strangers:
Current national data initiatives and developmental research. Child development, 71, 257-267.
Burchinal, M., Peisner-Feinberg, E., Pianta, R., & Howes, C. (2002). Development of academic
skills from preschool through second grade: Family and classroom predictors of developmental
tajectories. Journal of school psychology, 40, 415-436.
Campbell, F.A., Helms, R., Sparling, J.J., & Ramey, C.T. (1998). Early childhood progams and suc-
cess in school. In S. Barnett & S. Boocock (Eds.), Early childhood care and education for children
in poverty. Albany, NY: State University of New York Press.
201
Campos, A. (2004). Laplace: Ensayo filosófico sobre las probabilidades. Revista Colombiana de Esta-
dística, 27(2), 153-177.
Cardano, G. (1998). Llibre dels jocs d’atzar. Antologia mínima. Santa Coloma de Gramanet: Casa del
mestre.
Chomsky, N. (1967). The responsibility of intellectuals. The New York Review of Books.
Christian, K., Morrison, F.J., & Briant, F.B. (1998). Predicting kindergarten academic skills: Inter-
actions among child care, maternal education and family literacy environments. Early Childho-
od Research Quarterly, 13(3), 501-521.
Cochran, W. G. (1971/ 1980). Técnicas de muestreo. México: C.E.C.S.A.
Coleman, J.S., Campbell, E.Q., Hobson, C.J., McPartland, J., Mood, A.M., Weinfeld, F.D. et al.
(1966). Equality of educational opportunity. Washington, D.C.: National Center for Education-
al Statistics.
Comer, J. (1980). School power. New York: The free press.
CREA (2006-2011). INCLUD-ED. Strategies for inclusion and social cohesion from education in Europe.
INTEGRATED PROJECT, Priority 7, Sixth Framework Programme of the European Com-
mission.
CREA (2001-2005). AMAL: Inmigración y mercado laboral. Plan Nacional de Investigación Cientí-
fica, Desarrollo e Innovación Tecnológica. Ministerio de Ciencia y Tecnología.
Darwin, Ch. (1998). L’origen de les espècies. Barcelona: Edicions 62.
De Moivre, A. (1967). The doctrine of chances: A method of calculating the probabilities of events in
play. New York: Chelsea.
Downie, N.M. & Heath, R.W. (1970). Basic Statistical Methods. New York: Harper & Row.
Duncan, O.D. (1966). Path analysis: sociological examples. American Journal of Sociology, 72, 1-16.
Durkheim, E. (1998). El suicidio. Madrid: AKAL.
Edgeworth, F.Y. (1923). Statistics of examinations. Journal of the Royal Statistical Society, 86(1), 59-
60.
Efron, B. (1979). Bootstrap Methods: Another look at the Jackknife. The Annals of Statistics, 7(1),
1-26.
Elboj, C.; Puigdellívol, I.; Soler, M.; Valls, R. (2002). Comunidades de aprendizaje. Transformar la
educación. Barcelona: Graó.
Epstein, J. & Dauber, S. (1991). School programs and teacher practices of parent involvement in inner-
city elementary and middle schools. Elementary School Journal, 91, 291-305.
Epstein, J.L. (1986). Parent involvement: Implications for limited-English-proficient parents. In C.
Simich-Dudgeon (Ed.), Issues of parent involvement and literacy. Washintong DC: Trinity col-
lege.
EUROSTAT. Education at a glance. http://www.oecd.org/document/54/0,3746,en_2649_
37455_38082166_1_1_1_37455,00.html
EUROSTAT. European Office of statistics. http://epp.eurostat.ec.europa.eu/portal/page/portal/euro-
stat/home/
EUROSTAT. Labour force survey. http://epp.eurostat.ec.europa.eu/portal/page/portal/ labour_mar-
ket/introduction
Fermat, P. (1894-1912). Oeuvres de Fermat. Publiées par Paul Tannery et Charles Henry. Paris: Gau-
thier-Villars.
Fermat, P. (1989). Precís des ouvres mathématiques. Sceaux: Gabay.
Fisher, R. A. (1949). Métodos estadísticos para investigadores. Madrid: Aguilar.
202
Bibliografía
Flecha, R. (2000). Sharing Words. Lanham, M.D: Rowman & Littlefield.

Freire, P. (2003). Pedagogy of the oppressed. NY: Continuum
Galileo, G. (1967). Antologia. Firenze: La Nouva Italia.
Galton, F. (1889) Natural Inheritance. London: Macmillan.
Gauss, C.F. (2002). Investigaciones sobre temas de geodesia superior y método de los mínimos cuadrados.
Madrid: Dirección general del Instituto Geográfico Nacional.
Giroux, H. A. (1988). Teachers as Intellectuals: Toward a Critical Pedagogy of Learning. Granby, Mass-
achusetts: Bergin and Garvey.
Goldberger, A.S., Duncan, O.D. (Eds.). (1973). Structural Equation Models in the Social Sciences.
New York: Seminar Press.
Gómez, A., Puigvert, L. & Flecha, R. (2011). Critical Communicative Methodology: Informing Real
Social Transformation Through Research, Qualitative Inquiry, 2011 17, 235-245.
Gómez, J., Latorre, A., Sánchez, M., Flecha, R. (2006). Metodología Comunicativa Crítica. Barcelo-
na: El roure.
Gonick, L. & Smith, W. (1993). The cartoon guide to statistics. Harper Collins Publishers, Inc.
González, N., Moll, L., & Amanti, C. (2005). Funds of Knowledge: Theorizing Practices in households,
communities and classrooms. Mahwah, NJ: Lawrence Erlbaum Associates.
Graunt, J. (1662). Natural and political observation on the bills of mortality. London.
Green, S.B., & Salking, N.J. (2005). Using SPSS for Windows and Macintosh. Analyzing and under-
standing data. Upper Saddle River, New Jersey: Pearson Prentice Hall.
Guardia, J. (1987). Los sistemas de ecuaciones estructurales en el ámbito de la psicología. Tesis doctoral
no publicada. Universidad de Barcelona.
Habermas, J. (1988). Teoría de la acción comunicativa. Madrid: Taurus.
Hartley, H.O. (1980). Statistics as a science and a profession. Journal of the American Statistical Asso-
ciation, 75, 1-6.
Hidalgo, N., Epstein, J., & Siu, S.F. (2002). Research on families, schools and communities: A mul-
ticultural perspective. In J.A. Banks (Ed.), Handbook of research on multicultural education (pp.
631-655). New York: Macmillan.
Hu, L., Bentler, P.M., & Kano, Y. (1992). Can tests statistics in covariance structure analysis be trust-
ed? Psychological Bulletin, 112, 351-362.
Huff, D. (1993). How to lie with statistics. New York: W.W. Norton.
Huygens, C. (1888-1950). Oeuvres complètes. La Haye: Martinus Nijhoff.
Huygens, Ch. (1920). Calcul des probabilites: Travaux de mathèmatiques pures: 1655-1666. La Haye:
Martinus Nijhoff.
IEA. Educational Association for the Evaluation of Educational Achievement. http://www.iea.nl/.
IEA. International Association for the Evaluation of Educational Achievement. TIMSS and PIRLS.
http://timss.bc.edu/.
IES National Center for Education Statistics. Trends in International Mathematics and Science Study.
http://nces.ed.gov/timss/.
INCLUD-ED Consortium (2009). Actions for success in schools of Europe. Brussels: European
Commission.
INE. Instituto Nacional de Estadística. http://www.ine.es/welcoing.htm.
Jencks, C.S., Smith, M., Acland, H., Bane, M.J., Cohen, D., Gintis, H., Heynes, B. & Michelson,
S. (1972). Inequality: a reassessment of the effect of family and schooling in America. New York:
Basic Books.
203
Jordan, G.E., Snow, C.E. & Porche, M.V. (2000). Project EASE: The effect of a family literacy pro-
ject on kindergarten students’ early literacy skills. Reading Research Quarterly, 35, 524-546.
Jöreskog, K.G., Sorbom, D. (2006). LISREL 8.8 for Windows. Lincolnwood, IL: Scientific Software
International Inc.
Kendall, M. (1956). The beginnings of probability calculus. Miometrika, 43, 1-14.
Kendall, M. (1961). The book of fates. Biometrika 48, 220-222.
Kline, M. (1968). Mathematics for the nonmathematician. New York: Dover.
Kolmogorov, A. (1956). Foundations of the theory of probability. New York: Chelsea Pub. Co.
Ladson-Billings, G. (1994). The dreamkeepers: Successful teachers of African American children. San
Francisco: Jossey-Bass.
Laplace, P. S. (1774) Mémoire sur la probabilité des causes par les événements, en «Memoires de mathé-
matique et de physique, presentés à l’Académie Royale des Sciences, par divers savans» 6.
Laplace, P.S. (1985). Ensayo filosófico sobre las probabilidades. Bilbao: Instituto Técnico de Materia-
les y Construcciones.
Lazarsfeld, P.F. (1961). Notes on the history of quantification in sociology. Trends, sources and pro-
blems. Isis, 52(2).
Legendre, A. M. (1811-1817). Exercices de calcul intégral sur divers ordres de trascendantes et sur les
quadratures. Paris: Ve. Courcier.
Legendre, A.M. (1805). Nouvelles methodes pour la détermination des orbites des comètes. Paris: Courcier.
LLECE. Latin American Laboratory for Assessment of the Quality of Education. http://portal.unesco.org/geog-
raphy/en/ev.php-URL_ID=7919&URL_DO=DO_TOPIC&URL_SECTION=201.html.
Mantel, N., Tukey, J., Ciminera, J.L., Heyse, J.F. (1982). Tumorigenicity assays, including use of the
Jackknife. Biometrical Journal, 24(6), 579-596.
Merton, R. (1977). La sociología de la ciencia: Investigaciones teóricas y empíricas. Madrid: Alianza.
Ministerio de Educación y Ciencia. (2007). PISA 2006. Programa para la Evaluación Internacional
de alumnos de la OCDE. Informe español. Madrid: Secretaría General Técnica.
Montfort, R. (2006). Essay d’analyse sur les jeux de hazard. AMS: Chelsea Publishing (v.o. 1708).
Mulaik, S.A. and Brett, J.M. (1982). Causal analysis: assumptions, models, and data. Beverly Hills:
Sage Publications.
OCDE. Programme for International Student Assessment (PISA). http://www.pisa.oecd.org/
pages/0,2987,en_32252351_32235731_1_1_1_1_1,00.html.
OCDE. (2008). Education at a Glance 2008: OECD Indicators. Documento disponible en:
http://www.oecd.org/dataoecd/23/46/41284038.pdf.
Pacioli, L. (1994). Summa de arithmetica, geometria, proportioni et proportionalita. Madrid: Asocia-
ción española de Contabilidad y Administración de Empresas.
Pascal, B. (1998). Oeuvres complètes. Paris: Gallimart.
Pearson, E. S. (1938) Karl Pearson: An Appreciation of some Aspects of his Life and Work. Cambridge:
University Press. [citas de la trad. esp.: Pearson, creador de la estadística aplicada. Buenos Aires:
Espasa-Calpe, 1948].
Pearson, E.S.; Kendall, M. (Eds.) (1970). Studies in the History of Statistics and Probability. Charles
Griffin & Company Limited: London.
Pearson, K. (1914-1930). Life and letters of Francis Galton. Cambridge: University Press.
Peña, D. (1986). Estadística y métodos I. Fundamentos. Madrid: Alianza Universidad Textos.
Peña, D. y Romo, J. (1997). Introducción a la estadística para las Ciencias Sociales. Madrid: McGraw-
Hill.
204
Bibliografía
Pérez, C., Santín C. (2007). Minería de datos: técnicas y herramientas. Madrid: Thomson Editores.
Petty, W. (1691). The political anatomy of Ireland. Economic Writtings. Vol. 1.
Piovani, J.I. (2005). Los orígenes de la estadística: de investigación sociopolítica empírica a conjun-
to de técnicas para el análisis de datos. Reflexiones. Revista de ciencias sociales de la Universidad de
Palermo, 1(1), 1-20.
Poison, S.D. (2005). Recherches sur la probabilité des jugements en matière criminelle et en matière civi-
le. Elibron Classics.
Poisson, D. (1837). Recherches sur la probabilité des jugements en matière criminelle et en matière civi-
le. París: Bachelier, Imprimeur-libraire.
Porter, Th. (1986). The rise of statistical thinking, 1820-1900. Princeton: University Press.
Quetelet, A. (1844). Recherches statistiques. Bruxels: Hayez.
SACMEQ. Southern and Eastern Africa consortium for monitoring educational quality.
http://www.sacmeq.org/
Sánchez, J. (1987). Proyecto docente e investigador para Estadística. Universidad de Murcia.
Sierra Bravo, R. (1981). Ciencias sociales: análisis estadístico y modelos matemáticos: teoría y ejercicios.
Madrid: Paraninfo.
Sierra Bravo, R. (1985). Técnicas de investigación social: teoría y ejercicios. Madrid: Paraninfo.
Sierra Bravo, R. (1992). Análisis estadístico multivariable: teoría y ejercicios. Madrid: Paraninfo.
Snedecor, G. W y Cochran, W G. (1971). Métodos Estadísticos. México: C.E.C.S.A.
Spearman, C.E. (1927). The abilities of man: their nature and measurement. London: Macmillan.
Stevens, S.S. (1946). On the theory of scales measurement. Science, 103, 677-680.
Stingler, S.M. (1986). The history of statistics. The measurement of uncertainity before 1900. Cam-
bridge, MA: Harvard University Press.
Thurstone, L.L. (1925). The fundamentals of statistics. New York: The Macmillan company.
Torrado, M. (2001). Estadística descriptiva básica. Barcelona: Ediciones UB.
UNESCO. Institute for Statistics. Global monitoring report on education. http://www.unesco.org/
new/en/education/themes/leading-the-international-agenda/efareport/
Vilà, R. y Bisquerra, R. (2004). El análisis cuantitativo de los datos. En Bisquerra, R. (Ed.) Metodo-
logía de la investigación educativa (pp. 259-271). Madrid: Editorial La Muralla.
Visauta, B., & Batallé, P. (1986). Métodos estadísticos aplicados. Tomo II: Estadística inferencial. Bar-
celona: PPU.
Woessmann, L. & Schutz, G. (2006). Efficiency and equity in European Education and Training Sys-
tems. Analytical report for the European Commission prepared by the European Expert Net-
work on Economics of Education. http://e-demos.iacm.forth.gr/index.php/europefocus/332-
eenee-2006.
Wright, S. (1921). Correlation and causation. Journal of Agricultural Research, 20, 557-585.
Yepes, M. (2006). ¿Cómo puedo pasar una base de datos de EXCEL a SPSS? Butlletí La recerca, 5.
Documento disponible en: http://www.ub.edu/ice/recerca/pdf/ficha5-cast.pdf
Yule, G. U. (1954). Introducción a la estadística matemática. Madrid: Aguilar.
205

Estadística Básica para Educadores

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Básica para Educadores

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA BÁSICA PARA EDUCADORES

AITOR GÓMEZ GONZÁLEZ

Elena García Vega

Reservados todos los derechos. Está prohibido, bajo las sanciones

© Aitor Gómez González

Impreso en España - Printed in Spain

“The secret language of statistics, so appealing in a fact min-

1. Orígenes y desarrollo de la estadística ......................................................... 15

2. La estadística: la ciencia de los datos .......................................................... 25

3. ¿Qué es esa cosa llamada “estadística descriptiva”? .................................... 41

3.2.1. Variables cualitativas, 49. 3.2.2. Variables cuantitativas, 49

5. Estadística inferencial o muestral. La muestra .......................................... 87

6. Estadística inferencial. Conceptos básicos .................................................. 111

6.3. Distribución muestral de medias (variables cuantitativas) ...................... 114

7. Teoría de la estimación ................................................................................ 119

8. Teoría de la decisión (contraste de hipótesis) .............................................. 125

9. Comparaciones o contrastes de medias ....................................................... 137

10. Correlación y regresión ................................................................................. 145

10.2.1. Correlación y regresión lineal de Pearson, 149. 10.2.2. Otros coefi-

Anexo 1. La explotación y el uso de los datos secundarios ................................. 173

Anexo 2. Software estadístico en las ciencias sociales y educativas:

Bibliografía ........................................................................................................... 201

Hace ya mucho tiempo que sabemos que el conocimiento científico de educación no

1.1. Un poco de historia

ción. La tradición alemana remonta la estadística a lecciones impartidas en sus universida-

1.2. Los orígenes de la moderna teoría de la estadística

1.3. El azar y la astronomía: el cálculo del error

– Representar y determinar matemáticamente el movimiento de la luna.

El problema, en esencia, era encontrar algún método para determinar parámetros de

Carl Friedrich Gauss (1777-1855), más conocido como princeps mathemati-

1.4. El desarrollo de la estadística moderna

A la vez que los matemáticos trabajaban en torno al cálculo de probabilidades, el uso de

1.5. La estadística actual

La estadística ha ido siguiendo su proceso lógico y “natural” de desarrollo. En las últimas

La informática ha revolucionado hasta tal punto el análisis de datos que inclu-

También tenemos que considerar la repercusión que ha tenido en el avance propiamente

ción de parámetros asociados a estos modelos, generalmente utilizando técnicas de verosi-

• ¿Qué sentido tiene la estadística aplicada a la educación?

2.1. Algunos conceptos básicos

La estadística descriptiva es aquella que hace descripciones de conjuntos de datos, de

2.1.1. Las escalas de medida

La teoría de la medida, en general y de cada ámbito de aplicación en particular, no es un

disciplinas como la metrología o la psicometría. No obstante, conviene recordar algunos

– Tienen que estar claramente definidas, sin equívocos ni interpretaciones diferentes.

Cuando no podemos establecer a priori una clasificación completa, porque desconoce-

Figura 2.1. ¿Qué tipo de escala utilizar?

Figura 2.2. Opciones de escala de medida en SPSS.

2.1.2. Las variables

2.1.3. Individuo, población y muestra

En estadística a menudo utilizamos las palabras “individuo”, “población” o “muestra”. Estas

2.1.4. Parámetro y estadístico

2.2. Competencias para interpretar científica y críticamente las estadísticas

Una interpretación crítica y científica de las estadísticas sobre educación existentes en el

2.3. ¿Por qué necesitamos leer las estadísticas?

Figura 2.3. Etapas de construcción de un modelo estadístico.

A través de estadísticas internacionales como PISA, TIMSS o PIRLS podemos consta-

2.4. ¿Qué estadísticas tenemos disponibles?

Disponemos de una enorme cantidad de información estadística tanto en el ámbito inter-

• ¿Cuáles son las características diferenciadoras básicas entre la estadística descriptiva y

(ordenar en tablas, estadísticos descriptivos de tendencia central, dispersión, etc.) conjun-

Un estadístico es un valor numérico que resume los datos de una muestra.

En cualquier libro de estadística se pueden encontrar aproximaciones más o menos deta-

3.1. La matriz de datos