Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROYECTO EDITORIAL
BIBLIOTECA DE EDUCACIÓN
PROYECTO EDITORIAL
PSICOLOGÍA. MANUALES
Director: PRÁCTICOS
Antonio Bolívar Botia
Directores:
Manuel Maceiras Fafián
Juan Manuel Navarro Cordón
Ramón Rodríguez García
ESTADÍSTICA BÁSICA PARA EDUCADORES
© EDITORIAL SÍNTESIS, S. A.
Vallehermoso, 34. 28015 Madrid
Teléfono 91 593 20 98
http://www.sintesis.com
ISBN: 978-84-995891-4-5
ISBN: 978-84-995876-3-9
Depósito Legal: M. 27.816-2012
Introducción .......................................................................................................... 11
7
Estadística básica para educadores
4. La probabilidad ............................................................................................ 71
4.1. Noción intuitiva .................................................................................... 72
4.2. Noción clásica de probabilidad .............................................................. 73
4.3. Noción axiomática de probabilidad ....................................................... 74
4.4. La noción experimental de probabilidad ............................................... 75
4.5. Ley de probabilidad de variables aleatorias discretas .............................. 77
4.5.1. Función de probabilidad y función de distribución, 79. 4.5.2. Mode-
los de probabilidad de variables aleatorias discretas, 81
4.6. Ley de probabilidad de variables aleatorias continuas ............................ 82
4.6.1. La distribución normal y la distribución normal estándar, 83
Para la reflexión .............................................................................................. 86
8
Índice
9
Estadística básica para educadores
10
Introducción
Este libro presenta de forma razonada y sencilla la estadística que necesitamos dominar quie-
nes somos profesionales de la educación. A lo largo de estas páginas ofrecemos conocimientos
básicos para el desarrollo de las competencias que nos permitan analizar críticamente las
recopilaciones de datos que, cada vez más, nos rodean. A través de los diferentes capítulos
se dan orientaciones para el desarrollo de las competencias estadísticas que nos permitan
realizar estudios cuantitativos tanto reelaborando datos ya existentes como construyendo
nuevos datos.
Mientras solo una minoría de profesionales de la educación realiza ocasionalmente tra-
bajos estadísticos, todos necesitamos saber leer críticamente y con criterios científicos los
que, cada vez con más frecuencia, nos conciernen. Por esta razón este libro está dedicado al
aprendizaje de la lectura rigurosa y crítica de los estudios estadísticos que nos afectan. Por
un lado, los medios de comunicación nos presentan con frecuencia, como realidades incues-
tionables, afirmaciones basadas en elaboraciones de datos que no han seguido los criterios
de la ciencia estadística; nuestra profesión mejorará su prestigio si sabemos explicar con un
razonamiento estadísticamente válido cuáles de esas afirmaciones son sostenibles y cuáles
no. Así evitaremos el típico recurso de quienes no tienen esas competencias a alabar toda
elaboración de datos como si fuera una ciencia absoluta o a cuestionarla como si siempre
fuera un engaño.
Por otro lado, a los centros educativos se les piden resultados; el dominio de las compe-
tencias básicas de estadística es imprescindible para saber deducir de los datos cuantitativos de
las evaluaciones externas qué tipo de actuaciones generan mejores resultados y cuáles peores.
La ausencia de estas competencias nos deja en manos de las interpretaciones guiadas por inte-
reses muy concretos y por manipulaciones diversas que desviarán nuestra energía y nuestro
esfuerzo en la dirección equivocada. Para analizar y después mejorar los resultados de nuestros
centros, tenemos que saber interpretar autónomamente y con conocimiento de causa (entre
otras cosas) también las evaluaciones externas de tipo cuantitativo.
11
Estadística básica para educadores
12
Introducción
cación. La consecuencia fue que los colegios de clase alta, donde las familias están habitua-
das a hacer donaciones al centro, no tuvieron problemas. Ni se enteraron del informe. En
cambio, las escuelas de barrios afroamericanos, por ejemplo, que dependían directamente
de las inversiones del distrito en educación, se hundieron directamente en la miseria. Robert
Merton (1977) llamaría a este tipo de actuaciones “Efecto Mateo”: se da más a quien más
tiene y menos a quien menos tiene. El mal uso de la estadística en este caso ocasionó un
incremento de las desigualdades educativas (y por ende sociales).
Por eso pensamos que es tan importante un libro como este; un libro donde no se pre-
tende entrar detalladamente en la ciencia de la estadística, porque eso ya lo han hecho
otros manuales con mucho más lujo de detalles y más profundidad de la que haremos
aquí. Eso ya existe. En cambio, lo que no existe es un libro dedicado a presentar la esta-
dística como una herramienta de trabajo: explicarla, exponerla y decir cómo funciona y
para qué se utiliza. En este libro eso es lo que vamos a hacer. Tomaremos la estadística y
explicaremos cómo es una herramienta para educadores (y cualquier persona que decida
dedicarse a trabajar en el ámbito educativo o de las ciencias sociales haciendo investiga-
ción). Pretende ser un libro intuitivo, orientado a la comprensión de los procesos, de los
conceptos, evitando los artefactos matemáticos, aunque a veces sea inevitable utilizar o
incluir alguna fórmula o alguna definición. Trataremos de que esta situación se produz-
ca lo menos posible. Esperamos que este libro sirva para construir ese conocimiento de
base que permita hacer lecturas críticas de cualquier estadística que salga luego en los
medios de comunicación o en otros ámbitos de nuestras vidas cotidianas.
13
1
Orígenes y desarrollo
de la estadística
La estadística es la “ciencia de los datos”. Los orígenes de esta disciplina se remontan, varios
siglos atrás, al uso de los datos que hacía el Estado para organizar y tomar sus propias decisio-
nes sobre el conjunto de la población, aunque hay autores que los sitúan incluso antes de la
aparición del Estado Moderno, en el momento que los reyes u otras formas de dominación
tenían que hacer recuento de sus efectivos para organizar las campañas militares y planificar la
estrategia a seguir. En cualquier caso, en lo que todos los autores coinciden es en que la esta-
dística, tal y como la conocemos, surge de la confluencia en el siglo XIX de dos tradiciones: la
estadística utilizada en la astronomía y la estadística usada en los recuentos demográficos. La
primera de ellas surge como la aplicación de la teoría de las probabilidades a la minimización
de los errores de observación (debidos a las limitaciones técnicas de los instrumentos de medi-
da de la época). La segunda aparece como resultado de técnicas para llevar la cuenta de fenó-
menos sociales como los nacimientos, las defunciones, los matrimonios y todo aquello que
afectara al conocimiento de la cantidad de población en un territorio.
Tal como afirma Piovani (2005), “la Political Arithmetic se definió como una ciencia de
la sociedad cuyas conclusiones dependían de números y medidas” (Piovani, 2005, p. 4). La
estadística aparece, por tanto, como una disciplina ligada directamente al uso de datos. La
mejora de estos se convirtió en un imperativo. Sin embargo, durante varias décadas la idea
no floreció y la recopilación de datos se quedó en el ámbito de lo que conocemos como
demografía. Aquí sí que iban apareciendo tablas de mortalidad, de nacimientos, de casa-
mientos, etc., que empezaron a formar parte del fondo documental que confeccionaban las
administraciones de los diferentes estados. Entre 1780 y 1830 este tipo de recopilaciones de
datos se generalizan.
De hecho, parece que hay un cierto acuerdo en considerar que fueron los alemanes los
pioneros en proponer la caracterización de su territorio en términos de recuentos de pobla-
15
Estadística básica para educadores
Downie y Heath (1970) afirman que el origen de la estadística posiblemente se puede encon-
trar en el campo de batalla, cuando el jefe se para a contar de cuántas personas dispone y
calcula cuál debe de ser el número de efectivos del enemigo. Se trata, pues, de un origen
eminentemente práctico: era un instrumento usado para tener una idea aproximada de la
correlación de fuerzas.
Estadística etimológicamente significa “ciencia del Estado” y está inequívocamente rela-
cionada con el nacimiento del Estado Moderno durante finales del siglo XVII. Piovani (2005)
16
Capítulo 1: Orígenes y desarrollo de la estadística
documenta cómo uno de los antecedentes de lo que hoy llamamos “estadística” aparece en
una carta fechada el 17 de diciembre de 1672, escrita por William Petty, que utiliza el tér-
mino de political arithmetic. Tal como relata Porter (1986),
“el estudio sistemático de los números sociales en el espíritu de la filosofía natural se ori-
ginó durante el decenio de 1660, y se conoció por casi un siglo y medio como political
arithmetic. Su propósito [...] era la promoción de una política social sólida y bien infor-
mada” (Porter, 1986, p. 18).
Es bien sabido que el recuento de personas (habitantes de una región) es una práctica
mucho más antigua, que ya realizaban los reyes, jefes, nobles, etc. en sus respectivos terri-
torios, con fines fiscales de recaudación, de trabajo debido al noble o al señor feudal amo
de la tierra. El recuento de fuegos como unidad de medida está perfectamente documenta-
do en la Europa de la Edad Media. Y se sabe que en la Época Clásica del Imperio Romano
también Roma trataba de llevar un control sobre el territorio y sobre sus pobladores.
Sin embargo, lo que hoy conocemos como estadística, la “Estadística Moderna”, es un
conjunto de herramientas y técnicas que se basan en el cálculo de probabilidades (que es lo
que se denomina Estadística Matemática).
Históricamente la probabilidad aparece asociada al entorno de los juegos de azar. Pear-
son y Kendall (1970) afirman que durante el Renacimiento ya había un interés claro por
analizar las dinámicas que existen detrás de los juegos de azar, para averiguar cuáles son las
estrategias ganadoras. Peña (1986) cree que las primeras ideas en torno al cálculo de proba-
bilidades se las debemos a Luca Pacioli (1445-1514), Giordano Cardano (1501-1576) y a
Galileo Galilei (1564-1642), aunque fuera de una manera intuitiva. Simultáneamente, en
1526, Cardano y Tartaglia establecieron la equiprobabilidad de sucesos en la aparición de
caras de un dado, aplicando la simetría a sus razonamientos.
Piovani (2005) afirma que el origen de la probabilidad tratada como un cuerpo de cono-
cimiento teorizable se lo debemos a una disputa entre jugadores de dados. Antoine de Gom-
baud (también conocido como Caballero de Méré), un conocido jugador a los dados, envió
una carta a Pierre de Fermat, uno de los matemáticos con más reputación de la época. En
la carta le planteaba a Fermat la siguiente pregunta: en un juego con dos dados, ¿es venta-
joso apostar por la aparición de al menos un doble seis tirando los dados 24 veces? El Caba-
llero de Méré pensaba que era ventajoso apostar a la aparición de un doble seis basándose
en su experiencia. Sin embargo, si tenía que hacer caso de sus cálculos, el resultado era pre-
cisamente el contrario.
Fermat inició entonces un intercambio de cartas con otro de los grandes matemáticos
de la época, Blaise Pascal (1623-1662), con quien conjuntamente puso las bases para una
Teoría General de las Probabilidades. Entre ambos establecen los principios fundamentales
del cálculo de probabilidades.
Poco después, Christian Huygens (1629-1695), que estaba al corriente de la corres-
pondencia entre Fermat y Pascal, se interesó por esta disciplina y en 1657 publica el primer
tratado de probabilidad: De ratiociniis in ludo aleae.
17
Estadística básica para educadores
En la misma época Graunt (1662) publica su Natural and political observations on the
bills of mortality, donde aparecen las tablas como herramienta para hacer recuentos de fenó-
menos sociales que afectan al conjunto de la población, base de lo que será luego la esta-
dística.
En el siglo XVII Pierre Remond de Montfort realiza algunas precisiones teóricas sobre el
cálculo de probabilidades en un libro publicado en 1708: Essay d’analyse sur le jeux du hazard.
Cinco años más tarde Jacok Bernouilli (1654-1705) publica Ars conjetandi, donde, además
de comentar el libro de Huygens, incluye el análisis combinatorio y lo que se conoce como
Teorema de Bernouilli o Ley de los grandes números.
La probabilidad en estos momentos ya es una disciplina científica que tiene reconoci-
miento y que es objeto de trabajo por los matemáticos. Abraham de Moivre (1667-1754)
escribe Doctrine of chance: or a method of calculating the probability (1718), Annuities upon
lives (1725) y Miscellanea analytica (1730). Bernouille se plantea, en 1738, en Specimen theo-
riae novae de mensura sortis uno de los problemas más famosos de su época: la conocida como
Paradoja de San Petersburgo. Según esta paradoja, si se tira una moneda y sale cara, gano
un céntimo. Si sale cara a la segunda tirada, gano el doble. Si sale la cara a la tercera tirada,
gano 4 céntimos (el doble del doble) y así sucesivamente. ¿Cuánto dinero estaría alguien
dispuesto a pagar para entrar en este juego? Como la suma de las tiradas favorables diverge
a infinito, eso quiere decir que no importa la suma que se pague para entrar en el juego,
porque a largo plazo siempre se ganará una cantidad mucho más grande de la que se pagó.
La esperanza matemática de ganar la tirada es infinita, si se juega un número infinito de
veces, debiendo ser equitativa la cantidad de dinero que deposita el jugador al número de
veces que se realice la jugada para que el juego sea equitativo. Pero, a pesar de ello, nadie
participaría en un juego como este, a no ser que se invierta una cantidad aceptable de dine-
ro. Esto obligó a Bernouilli a crear el concepto de “esperanza moral” para salvar las contra-
dicciones entre el cálculo de probabilidades y el sentido común.
Pierre Simon, Marqués de Laplace (1749-1827), también trabaja este problema en
Essai philosofique sur les probabilités. En este libro Laplace valora positivamente el trabajo
de Bernouilli, destacando tanto lo que ya se ha dicho como el uso de la fórmula del bino-
mio en el cálculo de la probabilidad y la definición del número de ensayos cuando tien-
de a infinito: “... y por la demostración del teorema que expresa que, multiplicando inde-
finidamente las observaciones y las experiencias, la relación de acontecimientos de diversa
naturaleza que han de ocurrir se aproxima a la de sus posibilidades respectivas dentro de
límites cuyo intervalo se va estrechando cada vez más, llegándose a hacer menor que cual-
quier cantidad asignable”.
Laplace también recogió el trabajo realizado por Thomas Bayes (1702-1761), bajo el
nombre de Teorema de Bayes. Hizo públicos sus trabajos en Transactions philosophiques (1763),
donde por primera vez se combina probabilidad total y compuesta.
Por otro lado, Laplace también es quien propone por primera vez aplicar la distribución
normal como modelo de variabilidad de los errores de medida. Peña (1986) afirma que
Laplace realizó el primer intento de proponer un modelo explicativo estadístico, al intentar
predecir los valores de una variable a partir de otras variables relacionadas con ella.
18
Capítulo 1: Orígenes y desarrollo de la estadística
Durante los siglos XVII y XVIII la probabilidad se desarrolló como una herramienta que permi-
tía resolver un problema tradicional en la ciencia y, en concreto, en la astronomía: la inciden-
cia del error. El no disponer de métodos matemáticos efectivos que permitieran trabajar con
magnitudes que no se podían medir con una precisión aceptable suponía un problema a la hora
de buscar las leyes que explican la naturaleza. El descubrir métodos que permitían controlar esos
errores permitió un gran avance en el conocimiento del universo y, de paso, llamó la atención
de los matemáticos, que aportaron las bases del cálculo moderno de probabilidades.
La conexión entre astronomía y probabilidad ha sido destacada en diversas ocasiones
(Peña, 1986; Guardia, 1987; Sánchez, 1987). Según Stingler (1986), en el siglo XVIII exis-
tían tres problemas relacionados con la astronomía que estaban en el centro de las discu-
siones de la comunidad científica de la época:
19
Estadística básica para educadores
20
Capítulo 1: Orígenes y desarrollo de la estadística
facto para demostrar la distribución normal, que curiosamente coincide con el Triángulo de Pas-
cal, por lo que respecta a la serie de números que resulta en cada uno de los pisos del artefacto.
Galton introdujo otros conceptos estadísticos, como la idea de media condicionada o la
variabilidad de las medias condicionadas. Se le ha considerado como uno de los fundadores de
la Escuela Biométrica y ejerció una notable influencia sobre otros destacables estadísticos tales
como Karl Pearson (1857-1936) o Ronald A. Fisher (1890-1962). Uno de los méritos de su
trabajo fue el mostrar las diferencias individuales y la herencia. En su obra Hereditary genius
(1869) su centro de atención se dirige a trasladar los principios de la teoría de la evolución al
campo de la Psicología. En 1884 Galton abrió al público su Laboratorio Antropométrico en el
museo de South Kensington, donde se estudiaban las diferencias individuales a través de tests
psicométricos. Galton medía “desviaciones” con respecto al comportamiento “normal”.
Desde la sociología se busca en la estadística y la probabilidad herramientas metodoló-
gicas para tratar de entender los fenómenos sociales. Durkheim (1858-1917), en El suici-
dio, relata cómo el interés por temas poblacionales está en el origen de lo que más tarde se
ha dado en llamar sociología y de los métodos de trabajo que utiliza y, en concreto, de la
estadística (citando los trabajos de Quetelet). El concepto de población, como sociedad, sus-
ceptible de ser analizado y estudiado, aparece en este contexto. Lazarsfeld (1961) afirma que
la idea de que las cuestiones sociales pueden ser sometidas a estudio empírico aparece en
esta época. De hecho, ésta es la tesis principal de la obra de Durkheim.
Fue Francis Y. Edgeworht (1845-1926) quien comenzó a usar una notación más seme-
jante a la que utilizamos actualmente cuando empezó a estudiar las correlaciones. Pearson
destaca precisamente en el tema del cálculo de los coeficientes de correlación. Gran parte
de su trabajo se centró en el análisis de curvas gamma, que son asimétricas, así como índi-
ces para el estudio de la simetría / asimetría de las distribuciones. George U. Yule (1871-
1951) prosiguió en esta línea de trabajo, aunque acabó centrándose en la regresión lineal.
W.S. Gosset (1876-1937) hizo aportaciones de envergadura en el tema del trabajo con
datos muestrales. En concreto, a él debemos el desarrollo de la distribución t, que se cono-
ce también como Distribución t de student.
En el siglo XX unas de las contribuciones más importantes al desarrollo de la estadística
moderna fueron las aportaciones de Karl Pearson (1857-1936). Alumno de Galton, Pearson
desarrolló el estudio de las diferencias individuales. Formalizó el coeficiente de correlación múl-
tiple, sentando con ello las bases de la estadística multivariable. En su artículo On lines and planes
of closest fit to systems of points in space propone la teoría de Componentes principales.
Por lo que respecta a la probabilidad, también durante el siglo XX experimentó una trans-
formación profunda, especialmente debido a la aplicación de las aportaciones de la teoría de con-
juntos desarrollada por Cantor (1845-1918). Los trabajos de Andreï N. Kolmogorov (1903-
1988) supusieron una de las contribuciones más importantes. Kolmogorov desarrolló la axiomática
del Cálculo de probabilidades, estableciendo un concepto claro de probabilidad. Otros mate-
máticos que hicieron contribuciones al área incluyen: Tchebyshev, Markov, Lyapunov, entre otros.
Otro autor clave en la historia de la estadística y la probabilidad del siglo XX fue Roland
A. Fisher (1890-1962). A él le debemos la invención de distintas técnicas, tales como el aná-
lisis discriminante, y la resolución de diversos problemas planteados en la investigación agro-
21
Estadística básica para educadores
nómica mediante técnicas estadísticas apropiadas. Su libro Statistical Methods for Research
Workers es la base teórica de la estadística actual. Entre otras, le debemos a Fisher el desarrollo
de la derivación de las distribuciones muestrales, la técnica del análisis de la variancia y los
diseños experimentales. Fisher mantuvo una discusión con Pearson y Von Neyman sobre
cómo verificar los modelos: mientras que aquellos defendían el uso de pruebas de hipóte-
sis, Fisher siempre mantuvo que se tenía que hacer a través de pruebas de significación.
Otro de los seguidores de Galton fue C.E. Spearman (1863-1945), quien se decantó por
la línea de trabajo propuesta por Galton. Son conocidas sus contribuciones sobre el estudio de
la inteligencia, empleando lo que se denominó Teoría y método factorial, basado en el estudio
de correlaciones. Su artículo General intelligence objectively determined and measured, publicado
en 1904, puede considerarse como el punto de arranque del análisis factorial. Sin embargo, esta
técnica, tal y como se aplica en la actualidad, tiene sus orígenes en el trabajo de L.L. Thursto-
ne (1887-1955) Multiple Factor Analysis, publicado en 1931. Thurstone observó que las tablas
correlacionales son, desde el punto de vista matemático, matrices, de manera que se pueden
aplicar las reglas del cálculo matricial para su análisis. Este método condujo al estudio de una
serie de factores en el campo de las aptitudes y la personalidad y supuso un acontecimiento his-
tórico para la metodología científica, porque representa el punto de partida del análisis multi-
variable, generalizado hoy en día a todos los campos de la ciencia.
22
Capítulo 1: Orígenes y desarrollo de la estadística
23
Estadística básica para educadores
Para la reflexión…
24
2
La estadística: la ciencia de los datos
La estadística si algo tiene es que es la “ciencia de los datos”. En realidad, tiene que ver con
datos y con cómo se organizan, se sintetizan en unos índices y se analizan de modo que
podamos tomar decisiones y sacar conclusiones.
Ya hemos dicho que la estadística tiene como objeto el estudio cuantitativo de los colecti-
vos. Pero antes de continuar y presentar las primeras herramientas de trabajo que nos ofre-
ce la estadística, vamos a repasar algunos conceptos básicos.
En general, la estadística suele diferenciarse en dos grandes bloques:
1. la estadística descriptiva
2. la estadística inferencial
25
Estadística básica para educadores
26
Capítulo 2: La estadística: la ciencia de los datos
calor. Proporciona más información que la escala nominal, puesto que expresa la situación de
cada elemento dentro del conjunto; sin embargo, eso no implica que exista la misma diferen-
cia de temperatura entre dos elementos consecutivos, es decir, entre el primero y el segundo no
tiene por qué haber la misma diferencia que entre el séptimo y el octavo.
La escala de intervalo se caracteriza por la existencia de una unidad de medida cons-
tante que permite asignar un valor que nos sirve para interpretar la diferencia entre dos medi-
das. Este nivel no solo clasifica y ordena, sino que, además, especifica las distancias existen-
tes entre los diferentes valores. En esta escala tanto el cero como la unidad de medida son
arbitrarios, de manera que el valor cero no implica la ausencia de la característica medida.
Por otro lado, la diferencia entre los valores es constante, pero no es proporcional. Por ejem-
plo, la temperatura 0 ºC no es ausencia de temperatura, ni 20 ºC significa el doble de calor
que 10 ºC. Otros ejemplos pueden ser el rendimiento académico (0 no es ausencia de cono-
cimiento, ni quien obtiene un 8 quiere decir que sabe el doble que quien obtiene un 4).
Siguiendo con nuestro ejemplo sobre las temperaturas, la escala cegesimal constituye una
escala de intervalo e indica la cantidad de grados centígrados (70, 67, 65, 64, ..., 35, etc.) de
cada uno de los elementos. El cero no es absoluto, sino convencional (en el caso de la escala
cegesimal corresponde a la temperatura de fusión del agua). Eso quiere decir que podemos afir-
mar que entre 70 y 67 ºC existe la misma diferencia de temperatura que entre 38 y 35 ºC, pero
no que un elemento que tiene 70 ºC esté el doble de caliente que el que tiene 35 ºC.
La escala de razón es similar a la de intervalo, pero además se le puede asignar el valor
cero absoluto que representa la ausencia total de la característica que se mide. Por otro lado,
también supone la existencia de proporcionalidad entre los valores. En ciencias sociales es
muy difícil encontrar casos a los que se les pueda aplicar este tipo de escala de medida. Lo
más habitual es que sea en el ámbito de la física donde podamos aplicar más este tipo de
escala de medida. Ejemplos pueden ser la masa (0 kg es ausencia de masa y 20 kg es el doble
de masa que 10 kg), la edad, la longitud, etc.
En el ejemplo que venimos utilizando sobre la temperatura, la escala de razón se aplica
al caso de la escala Kelvin, donde el cero es absoluto y equivale a –273 grados en la escala
centígrada.
Distinguir y especificar claramente qué tipo de escala de medida estamos usando es vital,
porque las diferentes herramientas que nos proporciona la estadística dejan de tener senti-
do en uno u otro caso. Por ejemplo, la media aritmética no se puede utilizar cuando traba-
jamos con una escala ordinal. Sin embargo, si se la pedimos al programa de cálculo estadís-
tico (el SPSS por ejemplo), dicho programa hace los cálculos pertinentes y nos da como
resultado un número. Pero este número no tiene sentido.
Por eso, antes de comenzar a trabajar con el SPSS (o con cualquier otro programa esta-
dístico), es importante distinguir las escalas de medida de nuestras variables. En SPSS eso
se puede hacer cuando se define la matriz. Al introducir la variable nueva, aparece una colum-
na donde tenemos que especificar si nuestra variable es: nominal, ordinal o de escala.
La escala nominal también recibe el nombre de cualitativa y, utilizando esta nomencla-
tura, la ordinal equivaldría a cuasicuantitativa y la de intervalo y la de razón se denominan
cuantitativas.
27
Estadística básica para educadores
Por lo tanto, hay que escoger la que nos proporciona más información (la que menos la
nominal y la que más la de razón), siempre que la podamos emplear (si la variable es cuali-
tativa no podemos utilizar una escala cuantitativa).
También hay que tener en cuenta que la información obtenida con una escala cualita-
tiva no la podemos convertir en ordinal, ni mucho menos en cuantitativa; tampoco la ordi-
nal en cuantitativa. En cambio siempre podemos pasar de unos datos cuantitativos a ordi-
nales o cualitativos y de ordinales a cualitativos.
Supongamos que la variable que estudiamos se pueda medir utilizando diversos tipos
de escala. Si la medimos con una escala nominal o cualitativa y necesitamos datos cuantita-
tivos para el análisis, como no podemos pasar de los datos cualitativos a cuantitativos, nos
veríamos obligados a volver a medir.
En la columna “medida” del programa tenemos tres opciones: escala (que incluye inter-
valo y razón), ordinal y nominal. Por razones prácticas podemos asignar siempre la medida
28
Capítulo 2: La estadística: la ciencia de los datos
escala (es más sencillo rápido y seguro poner 1, 2, 3 en vez de, por ejemplo, español, magre-
bí, alemán…). Pero, ojo, porque el ordenador las trata como si fuesen cuantitativas y, si le
pedimos que nos calcule la media del sexo (que hemos introducido, por ejemplo, como 0
(mujer) y 1 (hombre), nos dará la media entre los ceros y los unos. En este caso el fallo no
sería del ordenador sino nuestro.
En estadística trabajamos con variables. Este concepto se refiere a las propiedades, fenó-
menos o características que varían, adoptando diferentes categorías, órdenes o valores
numéricos. En esencia, es cualquier cosa que se pueda medir directamente en un indivi-
duo, como el peso, la altura, el lugar de nacimiento, el nivel de estudios o la clase de pelí-
culas que le gustan.
Existen diferentes tipos de variables. Desde el punto de vista estadístico podemos dis-
tinguir según sean cuantitativas o cualitativas. Dentro de cada una de estas categorías aún
podemos diferenciar otros subtipos importantes:
– Las variables cualitativas (también llamadas atributos) son las que están medidas
con categorías de tipo cualitativo (escala nominal). Son resultado de la observación
de una cualidad y su naturaleza no es cuantificable (sexo, estado civil, etc.). Las varia-
ciones de la variable reciben el nombre de categorías. Según el número de categorí-
as se dividen en dicotómicas o no dicotómicas.
– Las variables cualitativas dicotómicas o dicotómicas puras son las que tienen dos
categorías ya sean naturales (femenino/masculino) o como resultado de una fronte-
ra arbitraria (autóctono/extranjero).
– Las variables cualitativas dicotomizadas son variables cuantitativas (por ejemplo el
nivel de un alumno en una materia) que artificialmente las hemos reducido a dos
categorías (apto/no apto).
– Las variables cualitativas no dicotómicas (o politómicas) son las que tienen más de
dos categorías (bien/regular/malo). Ejemplos de este tipo de variables serían las cate-
gorías profesionales, los estudios universitarios, etc.
– Las variables cuantitativas son el resultado de una medida de intervalo o de razón
(estatura, edad, tiempo de respuesta, etc.). Las diferentes variaciones de la variable
se llaman valores de la variable. Este tipo de variables las podemos distinguir según
sean discontinuas o continuas.
– Las variables cuantitativas discontinuas (también llamadas discretas), son variables que
solo pueden tomar un número concreto de valores entre los que están a su alcance. Por
su propia naturaleza, suelen tomar valores enteros, aunque no es necesariamente así.
Por ejemplo, si vendemos paquetes de medio kilo de arroz, la variable “kilos de arroz
vendidos”, tomará valores discretos: 0; 0,5; 1; 1,5, etc. Estos valores no son enteros,
pero hay que elegir entre uno de ellos, no pudiendo elegir, por ejemplo, el 0,75. Enton-
29
Estadística básica para educadores
ces, la variable es discreta. Ejemplos de este tipo de variables podrían ser: número de
hijos, libros editados, número de coches en el núcleo familiar, etc.
– Las variables continuas son aquellas que pueden tomar cualquier valor dentro de un
intervalo de variación. Hablamos por tanto de un contínuum que se representa con
números reales y que, por tanto, puede tomar valores enteros, fracciones e incluso
números irracionales como el número pi. Ejemplos paradigmáticos de este tipo de
variables pueden ser el peso, la altura, el tiempo, etc. Por ejemplo, la talla humana
no puede tener un valor cualquiera (por ejemplo cuatro metros), pero, dentro de las
tallas posibles, sí podría adoptar cualquier valor. Entre 168 y 169 centímetros la talla
humana puede tener infinitos valores. Otra cosa es que podamos (o nos interese)
medir estos posibles valores.
Conviene tener en cuenta dos conceptos, valor medido (Xi) y valor exacto (Xe).
Si medimos la talla de una persona y nos da 172 cm ese es el valor medido, pero no
podemos asegurar que mida exactamente 172, sino que puede ser un número infi-
nito de valores comprendido entre 171,5 y 172,5. Por lo tanto, el valor exacto
(Xe ∈ Xi ± 0,5s) es un valor que está en el intervalo comprendido entre el valor medi-
do ± 0,5 de la sensibilidad (la cantidad más pequeña que nos discrimina el instru-
mento de medida). Eso quiere decir que cuando trabajamos con variables continuas
siempre estamos utilizando intervalos.
30
Capítulo 2: La estadística: la ciencia de los datos
Por población entendemos el conjunto de individuos sobre los que queremos hacer
nuestro estudio. Por ejemplo, podemos querer estudiar los resultados de matemáticas de los
estudiantes de la ESO de Euskadi. En este caso, es necesario definir y acotar lo más exacta-
mente posible cuál es la población que queremos que sea objeto de nuestro estudio (estu-
diantes de secundaria de Euskadi, por ejemplo).
A menudo, trabajar con toda la población es imposible por varios motivos: o porque es
imposible llegar a todos los individuos que conforman la población o porque intentar hacer-
lo resulta excesivamente caro y no tenemos presupuesto suficiente para hacerlo, o porque
resulta excesivamente lento. Por eso lo más habitual es utilizar una muestra. La muestra es
un subconjunto de individuos de la población extraídos y seleccionados por algún método
de muestreo. Es donde realmente hacemos el estudio y obtenemos los datos para el análisis.
Trabajamos con la muestra para poder extrapolar los resultados a la población, siempre y
cuando la muestra sea representativa. Ésta es una condición sine qua non. Si la muestra no
es representativa (y para serlo tiene que cumplir unas condiciones que se tratarán más ade-
lante), entonces los resultados de nuestro estudio no se pueden extrapolar a la población.
En el caso de un análisis de sangre podemos extrapolar los resultados de una pequeña mues-
tra a toda la sangre, la cual no podemos extraer en su totalidad, porque esta pequeña mues-
tra es representativa del conjunto.
Cuando hacemos algún estudio, los individuos que participan en el mismo están distribui-
dos de alguna manera concreta. Las herramientas estadísticas nos permiten describir la dis-
tribución desde el punto de vista de las medidas de tendencia central, las de dispersión o las
de posición. Ahora bien, podemos estar hablando de la distribución de una característica en
el conjunto de la población o bien en el conjunto de la muestra que hemos seleccionado
para hacer nuestro estudio. Según estemos refiriéndonos al total de la población o a la mues-
tra, utilizaremos parámetros o estadísticos.
Un parámetro es un valor que corresponde a la población. Normalmente los más impor-
tantes (media, desviación típica, varianza) se simbolizan con letras griegas (m, s, s2).
En cambio, un estadístico se refiere a un valor calculado para la muestra. En general se
simboliza con letras latinas (x–, S, S2, etc.).
31
Estadística básica para educadores
Hoy en día, acceder a las principales estadísticas sobre educación es una cuestión senci-
lla, pero no así la interpretación de los datos que contienen y mucho menos su vinculación
con las aportaciones de la comunidad científica internacional.
Los datos que podemos encontrar en PISA, PIRLS o TIMSS vienen a ratificar lo que
previamente los principales autores en educación ya habían afirmado hace dos décadas,
como, por ejemplo, que las diferentes formas de segregación conducen al fracaso escolar. A
pesar de ello se sigue agrupando por niveles al alumnado y se fomentan las aulas de acogi-
da y las aulas externas.
Saber acceder a las fuentes de información estadísticas e interpretarlas ligando esta infor-
mación a lo que la comunidad científica internacional afirma nos posibilita replantear nues-
tra práctica educativa diaria. Al igual que la segregación conduce al fracaso, también se
demuestra en el ámbito internacional que la participación de los familiares dentro de las
dinámicas escolares incide positivamente en el rendimiento escolar de sus hijos.
En este capítulo vamos a profundizar en las competencias necesarias para interpretar de
manera crítica el creciente volumen de información estadístico existente sobre educación
para, de esta forma, poder abordar nuestra tarea educativa con mayor éxito. Nos centrare-
mos especialmente en estadísticas internacionales, ligándolas con ejemplos prácticos relati-
vos a las problemáticas educativas con las que nos encontramos los profesionales de la edu-
cación diariamente.
La estadística es una herramienta que utilizamos las personas que nos dedicamos a la inves-
tigación social o educativa para hacer nuestra labor. La teoría nos indica que el buen que-
hacer científico exige seguir un método de trabajo para evitar la elaboración de informes
basados en corazonadas, intuiciones, creencias, intereses o prejuicios. Así se ha llegado con
frecuencia a hacer afirmaciones contrarias a la verdad. Por ejemplo, se ha afirmado insis-
tentemente que la titulación universitaria era una vía hacia el paro, cuando es justo todo lo
contrario. El trabajo de investigación riguroso exige planificar, establecer claramente los obje-
tivos, diseñar las herramientas o instrumentos que se van a utilizar para recoger los datos,
verificarlos haciendo pruebas piloto para corregir las imperfecciones, realizar el trabajo de
campo, transcribir o recoger todos los datos, depurar los instrumentos de análisis, analizar
toda la información y ver si los resultados nos sirven para aceptar o refutar el modelo de
hipótesis que nos habíamos marcado al inicio de la investigación. Si lo refutamos, se vuel-
ve a comenzar, depurando el modelo y estableciendo nuevas hipótesis. Si no, se aceptan las
hipótesis. En ambos casos se produce un avance en el conocimiento.
La estadística, como decimos, es una de las herramientas (entre otras) que podemos utili-
zar para trabajar. La teoría de probabilidades, por ejemplo, nos puede ayudar a la hora de esta-
blecer cuáles son las relaciones más probables que podemos encontrar. También es una herra-
mienta de inestimable utilidad cuando trabajamos con muestras de una población, de la que
desconocemos todos o algunos de los datos. La probabilidad nos permite trabajar con ciertos
32
Capítulo 2: La estadística: la ciencia de los datos
márgenes de confianza y controlar el error que podemos cometer. Las técnicas de muestreo
constituyen otra de las herramientas que nos ofrece la estadística para ayudarnos en nuestro
trabajo. Conocer cómo se construye una muestra, qué procedimientos existen para asegurar
que es representativa, controlar la incertidumbre de no saber si sus características centrales
corresponden o no con las de la población y garantizar la aleatoriedad en su selección son todos
ellos aspectos cruciales para la validez de las conclusiones a las que lleguemos al final de nues-
tro trabajo. A veces, una mala planificación, o una selección sesgada de la muestra, tiran a la
basura horas y horas de trabajo. Luego se tiene que volver a comenzar.
Por otro lado, la estadística también nos depara la teoría de la estimación, que utiliza-
mos para estimar los parámetros que nos van a resultar luego útiles para analizar los datos
recogidos. Saber si nuestros datos están o no dentro del intervalo de confianza nos da segu-
ridad para sostener luego las conclusiones que resulten del análisis, que es otra de las partes
del método de trabajo científico. En una palabra, todo el diseño, con la ayuda de la esta-
dística como herramienta de trabajo, nos sirve para sortear el sesgo, nuestro principal “ene-
migo” a la hora de hacer investigación. Todo aquello que pueda condicionar nuestra inves-
tigación puede “nublar” nuestra vista y suponer una barrera a nuestro criterio de decisión.
Conocer los entresijos de la estadística, junto con una actitud ética, es crucial para nuestro
trabajo. Chomsky (1967) afirma que la obligación de todo intelectual y toda persona decen-
te es buscar y decir la verdad. Existe un esquema muy conocido y ampliamente repetido en
diversos libros de estadística, que resume perfectamente todo lo que hemos dicho hasta el
momento. Tomamos uno de esos esquemas, de ejemplo, en figura 2.3.
Frecuentemente, en tertulias de café, se comenta que los resultados académicos depen-
den de la inversión en educación. Recurriendo a las estadísticas existentes podemos ver qué
parte de verdad existe en esa afirmación y qué parte no lo es, huyendo de fundamentalis-
mos y basándonos así en el proceder científico.
Afirmaciones como ésta pueden llegar a extenderse y llevarnos a pensar, de manera colec-
tiva, que a más inversión en educación mejores resultados académicos. Si tales afirmaciones
no las validamos o refutamos con los datos existentes, por ejemplo, a través de los informes
PISA, no podremos asegurarnos de lo que realmente sucede.
Analizando los datos que aporta PISA vemos que existe una relación entre gasto en edu-
cación y resultados obtenidos, pero no sucede de esta forma en todos los casos. Eslovaquia,
Polonia, República Checa y Corea son países que invierten menos que España y obtienen
mejores resultados, por encima de la media de la OCDE. Otros países como Italia o Esta-
dos Unidos invierten mucho más dinero que España y obtienen, respectivamente, peores o
iguales resultados. Por tanto, esa relación directamente proporcional entre invertir mucho
en educación para obtener mejores resultados no se da en todos los casos, quedando paten-
te que no se trata solo de recursos económicos.
Bourdieu es uno de los principales autores que ha realizado una explotación secundaria
de datos para fortalecer sus argumentaciones teóricas. Entre otras obras, en La distinción
(Bourdieu, 1979) utiliza datos estadísticos para argumentar que el “capital cultural” here-
dado de la familia genera el rendimiento escolar del alumnado.
33
Estadística básica para educadores
34
Capítulo 2: La estadística: la ciencia de los datos
démicos de los niños. Encontramos varios estudios que han incidido en esta cuestión (Bar-
nett, Young y Schweinhart, 1998; Bennett, Weigel y Martin, 2002; Brooks-Gunn, Berlin,
y Fuligni, 2000; Burchinal, Peisner-Feinberg, Pianta y Howes, 2002).
Algunos estudios muestran cómo los programas de formación que incluyen a las fami-
lias como uno de sus componentes contribuyen al éxito académico de los niños a corto y
largo plazo (Boethel, 2004; Campbell, Helms, Sparling y Ramey, 1998; Christian, Morri-
son y Bryant, 1998; Jordan, Snow y Porche, 2000; CREA, 2006-2011).
Habitualmente se culpabiliza a las familias de inmigrantes y minorías culturales del bajo
rendimiento del alumnado, es decir, que una mayor presencia de niños inmigrantes o per-
tenecientes a minorías en el aula genera peores resultados en los demás. Algunos estudios
han criticado esta visión y han aportado evidencias de que las actividades de participación
de familiares son más importantes para ayudar al alumnado a alcanzar el éxito escolar que
la estructura familiar, el estatus socioeconómico, la raza, el tamaño de la unidad familiar y
la edad de los niños (Hidalgo, Epstein y Siu, 2002; Becker y Epstein, 1982; Comer, 1980;
Epstein, 1986; INCLUD-ED Consortium, 2009).
Tal y como puntualiza Epstein y Dauber (1991) si las escuelas desarrollan programas
efectivos para los familiares, las familias valoran más participar y se implican más; y esto tie-
ne un impacto en el aprendizaje de los y las estudiantes.
En algunos casos podemos encontrar argumentaciones sobre diversas temáticas que no
se encuentran reforzadas por datos de las grandes estadísticas internacionales, puesto que
son muy caros de obtener y todavía no se les ha dado su debida importancia. El caso de la
incidencia de la formación de familiares sobre el resultado académico es un claro ejemplo.
Esas estadísticas demuestran la correlación entre el nivel de estudios de los padres y madres
con el de sus hijos, pero no así cómo un padre o una madre pueden ir formándose y parti-
cipando en la escuela donde asiste su hijo o hija y haciendo que mejore su rendimiento esco-
lar. En el siguiente apartado incidiremos en qué estadísticas tenemos disponibles y hasta qué
punto tenemos los datos estadísticos que necesitamos para nuestro quehacer diario.
35
Estadística básica para educadores
nacional destacamos el INE, los servidores estadísticos de cada comunidad autónoma y las
secciones de estadística disponibles en los ayuntamientos de las capitales de provincia.
Dentro de la OCDE queremos destacar los Informes PISA 2009, Education at a Glan-
ce 2011 y las respectivas bases de datos de donde podemos extraer más información. De
Eurostat nos centramos en su base de datos, de donde podemos extraer datos relativos a edu-
cación. De Unesco Statistics nos interesa el Global Monitoring Report on Education for All
2011.
Todas estas fuentes de datos formalmente se llaman “datos secundarios”. Se trata de
fuentes de datos que no hemos elaborado nosotros directamente (a través de una encuesta,
por ejemplo). Son datos que ya existen, que agencias especializadas se encargan de elaborar
y que nos ofrecen un cúmulo de información que podemos utilizar para extraer conclusio-
nes sobre los fenómenos educativos que estemos estudiando.
Por ejemplo, en ciencias sociales y de la educación existen varios temas que son de nues-
tro interés, como el análisis de los elementos que llevan al fracaso escolar para tratar de
emprender actuaciones que lleven a la superación de ese fracaso, el rendimiento escolar de
los estudiantes, los motivos que explican el abandono escolar, la segregación que a veces se
produce, entre otros muchos temas. La estadística nos permite disponer de herramientas
metodológicas que ayudan a describir y entender, en la medida de lo posible, el porqué de
todos esos fenómenos (y otros similares).
Los resultados académicos que obtiene el alumnado en el ámbito europeo, por ejemplo,
podemos analizarlos utilizando tres indicadores: el fracaso escolar, el abandono escolar y el
éxito educativo. En la base de datos de PISA encontramos datos relativos a cada uno de estos
indicadores. El fracaso escolar podemos medirlo utilizando dos indicadores básicos: student
performance en matemáticas, ciencias y lectura (prestando atención a los datos educativos nega-
tivos) y abandono escolar prematuro. El éxito educativo lo mediríamos a través de dos indi-
cadores, student performance en matemáticas, ciencias y lectura (prestando atención a los datos
educativos positivos) y youth education attainment level. Los primeros indicadores los extrae-
mos de la base de datos de PISA o del informe PISA ya elaborado. El último indicador lo
encontramos en el Labour Force Survey de Eurostat.
Existe otra serie de indicadores que podrían ser de nuestro interés y que encontramos,
por ejemplo, en el Education at a Glance indicators, como, por ejemplo, la inversión en edu-
cación, labour force returns, acceso a la educación y participación (todos estos indicadores están
disponibles en Internet).
Por otro lado, el tema de las evaluaciones ha sido tradicionalmente uno de los aspectos
cuantitativos de más interés para las personas que trabajamos en ciencias sociales o de la
educación, como indicadores que nos permiten (a veces, no siempre) acercarnos a un cono-
cimiento de lo que está ocurriendo en términos de rendimiento escolar, etc. Ha habido
muchas evaluaciones, y sigue habiéndolas, sobre el rendimiento académico de los estudian-
tes. Algunas son de ámbito nacional y permiten rendir cuentas sobre las reformas realizadas
en estos países o servir como evaluación de cada escuela. Hay, sin embargo, otro tipo de eva-
luaciones: las evaluaciones internacionales. En ellas se evalúan las competencias y se rela-
36
Capítulo 2: La estadística: la ciencia de los datos
cionan con ciertas características de los niños y las niñas, las escuelas y los sistemas educati-
vos, permitiendo la comparación de dichas características respecto al éxito escolar.
Desde los años 60, cuando la International Association for the Evaluation of Educational
Achievement (IEA) empezó a hacer sus primeros estudios, se han desarrollado varias evalua-
ciones internacionales, como el Consorcio de África Meridional para la Supervisión de la Cali-
dad de la Educación (SACMEQ) o el Laboratorio Latinoamericano de Evaluación de la Calidad
de la Educación (LLECE).
Sin embargo, las evaluaciones con más repercusión, y en las que centraremos nuestra aten-
ción, han sido la evaluación Programa para la Evaluación Internacional de Alumnos (PISA), de
la Organización para la Cooperación y el Desarrollo Económico (OCDE), y las dos evaluaciones
más importantes de la International Association for the Evaluation of Educational Achieve-
ment (IEA): el Progress in International Reading Literacy Study (PIRLS) y el Trends in Interna-
tional Mathematics and Science Study (TIMSS). Estos estudios evalúan los conocimientos de
los niños en lectura (PISA y PIRLS) y en ciencias y matemáticas (PISA y TIMSS). Así, en estos
estudios no se pretende evaluar ni la educación en valores ni los conocimientos en historia o
literatura, todas ellas áreas de gran interés, sino los conocimientos de aquellas áreas que se con-
sidera marcarán en gran medida la posterior marcha académica de los estudiantes.
Tanto las evaluaciones realizadas por la IEA (TIMSS y PIRLS) como las evaluaciones PISA
realizadas por la OCDE pretenden obtener datos que puedan ser comparables internacional-
mente. Existen, sin embargo, diferencias significativas entre las evaluaciones. La que puede sal-
tar más a la vista es la diferencia en los resultados obtenidos. Por ejemplo, Hungría, en la eva-
luación de matemáticas de octavo grado del TIMSS 2003, se contaba entre los mejores países,
significativamente por encima de la media internacional y muy por encima de países como
Noruega. Sin embargo, en la evaluación PISA en matemáticas del mismo año su puntuación
estaba significativamente por debajo de la media y, aunque su puntuación fuera inferior inclu-
so a la de Noruega, no había diferencias significativas entre las dos puntuaciones. O, por ejem-
plo, en la evaluación de PIRLS 2001, Suecia se situaba como el país con mejores resultados,
mientras que un año antes, en la evaluación de PISA 2000 en lectura, había sacado unos resul-
tados que estaban entre el noveno y el undécimo en el ránking de 32 países.
Uno de los factores causantes de estas diferencias es que las evaluaciones se dirigen a
poblaciones distintas. Estos detalles son importantes a la hora de usar fuentes secundarias
(y primarias también). Un número sobre un papel puede convertirse rápidamente en papel
mojado si no somos cuidadosos y ubicamos claramente el límite de los datos, de dónde han
salido, a qué población se refieren, qué tipo de muestreo se realizó, etc. Estos son aspectos
que vamos a ir destacando a lo largo del libro. En el caso de nuestro ejemplo, PISA se diri-
ge a los estudiantes de 15 años, sea cual sea el curso en el que estos estén. Las evaluaciones
PIRLS y TIMSS, en cambio, se dirigen a estudiantes de cursos concretos, siendo también
las edades medias distintas de las de los niños evaluados por PISA. Ese es uno de los moti-
vos que explican la discrepancia entre los resultados de estas evaluaciones.
Además, PISA está orientada a la evaluación de conocimientos como se usan en con-
textos reales, mientras que PIRLS y TIMSS se orientan a contenidos más académicos, aque-
llos que los estudiantes han aprendido directamente en el aula. Este es otro detalle a tener
37
Estadística básica para educadores
en cuenta: la naturaleza de las cuestiones o preguntas que se realizan. Dos estudios son com-
parables cuando preguntamos sobre las mismas cosas. Si se habla de temas de naturaleza
diferente, entonces la comparabilidad de los estudios deja de ser posible.
Así, mientras PIRLS y TIMSS evalúan el contenido curricular que los niños han apren-
dido con preguntas como las que se pueden encontrar en los exámenes tradicionales, PISA
se centra en qué pueden hacer con los conocimientos que han adquirido, usando situacio-
nes de la vida real. Finalmente, la periodicidad de las evaluaciones es también distinta. Mien-
tras que en PISA las evaluaciones se realizan cada tres años, los estudios de TIMSS se hacen
cada 4 años y los de PIRLS cada 5. Las cohortes (los grupos de edad a los que se refieren o
que integran la muestra en el caso de PISA, y los grupos que están haciendo un determina-
do curso en PIRLS y TIMSS) son diferentes. Y eso también resta validez a cualquier inten-
to de comparación usando estas fuentes diferentes.
La evaluación PISA se dirige, en principio, a los países miembros de la OCDE. Sin
embargo, hay también países asociados que participan en la evaluación. Así, de los 43 paí-
ses que participaron en PISA 2000, se ha pasado a los 57 que lo hicieron en PISA 2006 y a
los 65 que lo han hecho en PISA 2009. La participación en PISA cubre bastantes regiones
del mundo, pero deja con poca representación a Asia y con una representación casi nula al
continente africano.
La evaluación PIRLS contaba, en su primera edición de 2001, con 35 países evaluados,
otra vez con una representación mucho mayor de países europeos y del continente nortea-
mericano y con una escasa representación del resto de continentes.
En cuanto a la evaluación TIMSS, en 1995 evaluó a 41 países y TIMSS 1999 a 38. En
su edición de 2003 participaron 49 países y cuatro que lo hicieron como “benchmarking
participants”, para comparar su rendimiento con los estándares internacionales. En la eva-
luación de octavo grado participaron 46 países y 4 regiones, mientras que la evaluación de
cuarto grado contó con 25 países y 3 regiones. En la edición de 2007, 58 fueron los países
participantes y cuatro lo hicieron como “benchmarking participants”. Participaron 48 paí-
ses en la evaluación de cuarto grado y 36 en la de cuarto grado. En la edición de 2011, se
han evaluado 63 países y 14 “benchmarking participants”. La distribución de países en
TIMSS es más diversa que en las otras evaluaciones e incluye algunos países, por ejemplo,
del continente africano.
Por todo lo expuesto, resulta difícil comparar los resultados de las distintas evaluacio-
nes entre sí y se debe ser muy cauto a la hora de interpretar datos comparativos entre ellas.
2.5. Estadística: una ciencia para el tratamiento de los datos que tenemos que usar
sabiamente
La estadística fue un gran invento. Ha servido para tener descripciones más o menos deta-
lladas de diversas variables relativas a la población. También se utiliza mucho en ciencias y
matemáticas para tratar de dominar la incertidumbre, lo desconocido, el caos, o buscar regu-
laridades que expliquen fenómenos físicos de nuestro entorno.
38
Capítulo 2: La estadística: la ciencia de los datos
Sin embargo, por lo menos en nuestro caso (las ciencias sociales y de la educación), la
estadística, mal usada, puede ser muy engañosa. Huff (1993) escribió un libro lleno de ejem-
plos de malos usos de la estadística. Los engaños pueden residir en la elección de una mues-
tra sesgada, que falsea los resultados, o la selección de una medida de tendencia central inade-
cuada para aquello que se quiere defender (y no de las demás, ni tampoco de las medidas
de dispersión, porque seguro que van a “destapar” el engaño) o el uso de gráficos que jue-
gan con las proporciones y las escalas.
La estadística bien usada es una herramienta estupenda que nos permite conocer lo que
está ocurriendo en nuestras escuelas, en nuestros barrios, en las familias, en todos aquellos
aspectos y elementos de la sociedad que estén relacionados o intervengan en el éxito de la
práctica pedagógica. Pero para ello nos debemos mantener alerta, conocer qué podemos
hacer, cuáles son las limitaciones de la estadística y el tipo de conocimiento e información
que nos ofrece. El conocimiento es la clave en nuestra sociedad de la información. Saber es
lo que permite a la clase política tomar decisiones que lleven a la superación de las situa-
ciones de exclusión. Para ello necesitamos leer estadísticas, usarlas, crearlas y aprender a ver-
las como una herramienta más de nuestro trabajo. Igual que el fontanero sabe que no pue-
de desmontar un sifón con un destornillador y buscará la llave de grifo o quizás una llave
inglesa suficientemente grande, nosotros debemos conocer las potencialidades de nuestras
herramientas y saberlas usar con sabiduría y conocimiento de la experiencia.
Para la reflexión…
39
3
¿Qué es esa cosa llamada
“estadística descriptiva”?
No se sabe a ciencia cierta dónde está el origen de la estadística. Como hemos visto en el
primer capítulo, la estadística, como tal, se acuña durante la aparición de los Estados moder-
nos. Sin embargo, mucho antes ya se encuentran recuentos de población (aunque no exis-
tiera ninguna “ciencia” ni disciplina alguna del saber que se encargara de su estudio). Duran-
te muchos años la unidad censal eran los “fuegos”, en referencia al hogar de lumbre en torno
al que se agrupaba un núcleo familiar. Los “fuegos” era la unidad con la que la administra-
ción conocía el número de personas que vivían en una población.
Parece ser que los datos más antiguos de que se dispone son los censos chinos que se reali-
zaron bajo el reinado de la dinastía del emperador Tao, aproximadamente hacia el año 2200 a.C.
En el antiguo Egipto existen documentos (papiros y otros vestigios) que describen la
labor de los escribas, en muchas ocasiones responsables de realizar los recuentos de la pobla-
ción, con fines administrativos (fiscales) y como mano de obra para construir las grandes
obras arquitectónicas egipcias.
También en la Roma clásica se tienen restos que indican que existieron registros censa-
les. Hacia el año 555 a.C. se realizaron censos en Roma para conocer la población existen-
te en aquel entonces. En todos los casos los recuentos de población siempre vienen relacio-
nados con la existencia de un aparato administrativo potente, capaz de recoger tal cantidad
de datos, organizarlos y gestionarlos.
Hasta que Galton (1822-1911) y Pearson (1857-1936) no realizaron la sistematización
de la estadística de su época y aplicaron los conceptos de probabilidades para crear lo que
se conoce como “estadística inferencial”, explorando diversas submuestras de la población
y haciendo predicciones a partir de ellas sobre una hipotética población total, todos los
desarrollos de esta disciplina se encontraban en lo que se acostumbra llamar como “estadís-
tica descriptiva”.
Ya vimos en el capítulo anterior cómo la estadística, desde este punto de vista, se defi-
ne como una ciencia que trata datos. La estadística descriptiva trata tan solo de describir
41
Estadística básica para educadores
42
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
nacionales tiene sus propias características (y dichas estadísticas deben interpretarse confor-
me a ellas), hay ciertos puntos y ciertas bases que todas ellas comparten. En este apartado
se exponen y se explican aquellos conceptos que resultan imprescindibles para una correc-
ta interpretación de los datos de cualquier base estadística existente. Para ello se ejemplifi-
ca la discusión con los datos que proceden de las fuentes estadísticas sobre educación que
se han seleccionado para este libro.
Las personas que nos dedicamos a las ciencias de la educación y a las ciencias sociales nos
solemos encontrar ante (por lo menos) dos situaciones posibles: o bien disponemos de una
fuente de datos (estadísticas internacionales, estatales, etc., que ya recogen las respuestas de
la gente sobre un tema determinado y, por lo tanto, constituyen lo que se llama “fuentes de
datos secundarios”); o bien tenemos que construir nuestra propia fuente de datos (que en
este caso se llamarían “datos primarios”), utilizando encuestas, cuestionarios y otras técni-
cas de recogida, que más adelante comentaremos.
En ambos casos, previo al análisis propiamente dicho, es necesaria la organización de
los datos en una estructura en forma de tabla que contenga los valores de cada caso (o suje-
to) en las distintas variables del estudio (Vilà y Bisquerra, 2004). Esta estructura se deno-
mina matriz de datos. Para este capítulo utilizaremos una matriz sencilla, ya hecha, que nos
sirva para los ejemplos con los que concretar la teoría. Cada fila representa un sujeto y cada
columna una variable. En este caso tenemos 25 sujetos y 3 variables: sexo (variable cualita-
tiva dicotómica), número de hijos (variable cuantitativa discontinua o discreta) y resultados
de un examen de Estadística (variable cuantitativa continua).
43
Estadística básica para educadores
44
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Los valores perdidos pueden ser de dos tipos: perdidos por el sistema hacien-
do referencia a valores sin respuesta que se identifican en la matriz con una coma
o un punto; y los perdidos por el usuario que hacen referencia a aquellos valo-
res que se incluyen en los intervalos que el usuario define en la variable como
valores perdidos.
3.2. Primer paso: ¿cómo organizar los datos? Tabulación y representación gráfica
Una vez tenemos la matriz de datos depurada y nos proponemos iniciar su explotación, apa-
recen los primeros interrogantes: ¿Es adecuado tal como tenemos los datos en la matriz?
¿Nos faltan datos? ¿Sería conveniente modificar alguna de las variables existentes de forma
más operativa para nuestros intereses?… Por ejemplo, podríamos tener la variable lugar de
nacimiento e infinidad de ciudades de origen de todo el mundo; es posible que nos intere-
se crear una nueva variable que nos identifique el país de origen de los participantes. Otra
posibilidad es que tengamos las puntuaciones de un test, ítem a ítem, y necesitemos la pun-
tuación total en el instrumento de medida.
45
Estadística básica para educadores
En estas y otras circunstancias es muy posible que necesitemos crear nuevas variables a
partir de otras variables existentes, mediante procesos de recodificación o cálculo que nos
puede efectuar el mismo paquete estadístico informatizado. Concretamente, se distingue
entre procesos de cálculo y recodificación de variables.
Un cálculo habitual es obtener la puntuación total en un instrumento de medida, don-
de se tienen puntuaciones de ítem a ítem. De esta forma, hacemos el cálculo de la nueva
variable con el sumatorio de dichos ítems. Para ello, ejecutamos la opción TRANSFOR-
MAR/CALCULAR VARIABLE y obtenemos el cuadro de diálogo representado en la siguien-
te figura:
46
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Cuando tenemos preparada la matriz de datos, la dificultad ante la que nos encontramos
es cómo organizar los datos de una manera que sea eficiente y que nos permita luego realizar
operaciones con más o menos facilidad y agilidad. Piénsese, por ejemplo, en un estudio sobre
los efectos de un programa educativo en el conjunto total de la población estudiantil de varios
millones de sujetos. ¿Cómo organizar esta cantidad tan ingente de información?
La manera más corriente es proceder a la tabulación, que consiste en disponer ordena-
damente los datos en forma de tablas apropiadas. Esto es lo que se suele hacer con las deno-
minadas tablas de frecuencias. En la primera columna figura la variable (con su nombre o,
en su defecto, con una x), con sus respectivas categorías (si la variable es cualitativa) o valo-
res (si es cuantitativa). En las restantes figuran las frecuencias.
El concepto estadístico de frecuencia es el mismo que el que tenemos en la vida nor-
mal: número de veces que se produce o número de casos que tenemos en una categoría o
un valor de la variable. Decir el número de veces que vas al cine en un determinado perío-
do de tiempo equivale a decir con qué frecuencia vas al cine.
Entre las frecuencias podemos distinguir la frecuencia absoluta o simplemente fre-
cuencia, que expresa el número de casos. Es una información básica, pero no sirve para com-
parar dos distribuciones, a menos que sean del mismo tamaño. Por ejemplo: supongamos
que en dos grupos diferentes, A y B, tenemos 10 suspensos en cada uno. Si los dos grupos
tienen el mismo tamaño (por ejemplo 40 alumnos), el resultado es el mismo. Pero, si el gru-
po A tiene 20 alumnos y el B 40, el número mismo de (o frecuencia absoluta de) suspen-
sos, 10, en el grupo A es la mitad y en el grupo B solo la cuarta parte.
Por eso en las tablas también figuran las frecuencias relativas que siempre son compa-
rables. Éstas son las proporciones (el número de casos expresado en tanto por uno) y los
47
Estadística básica para educadores
porcentajes (el número de casos en tanto por ciento). Las proporciones, al oscilar entre 0 y
1, son cifras pequeñas y con decimales, por lo que su manejo resulta engorroso. En cambio,
los porcentajes o tantos por ciento son mucho más intuitivos y de uso incluso en la vida
cotidiana. En las rebajas, por ejemplo, el 50% siempre es la mitad y el 25% la cuarta parte
del precio original. El ordenador da las tablas por defecto, es decir, que las refleja en los “out-
puts”, a no ser que desactivemos la pestaña correspondiente.
Un ejemplo de tabla de frecuencia que se obtiene con SPSS es el siguiente. Para obte-
nerla, se ejecuta el comando ANALIZAR/ESTADÍSTICOS DECRIPTIVOS/FRE-
CUENCIAS.
Edad
Válido 15 125 25 25 25
16 175 35 35 60
17 100 20 20 80
18 100 20 20 100
Además de estas tablas existen otras más elaboradas en las que se puede cruzar más de
un variable, obteniendo una mayor profundización en el análisis. Entre este tipo de tablas
destacan las tablas de contingencia donde se representan las frecuencias (observadas o por-
centuales) en tablas donde se pueden cruzar dos o más variables.
Las tablas personalizadas son de gran utilidad para resumir la media aritmética de una
determinada variable, en función de otra categórica. Por ejemplo, las medias en un instru-
mento de medida, según el sexo de los participantes. Para ello, ejecutamos el comando ANA-
LIZAR/TABLAS PERSONALIZADAS y obtenemos el cuadro de diálogo que muestra la
figura 3.4.
Las gráficas no son más que transcripciones visuales de la información contenida en las
tablas. Lejos de ser “información para tontos”, como dicen algunos, la verdad es que per-
miten una idea de los datos con una sencilla ojeada y que son, en muchas ocasiones, una
pista visual que nos permite perfilar hipótesis que luego contrastaremos o refutaremos con
estadísticos.
48
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
En el caso de la matriz de datos del ejemplo del capítulo anterior, una variable cualitativa
sería la de sexo. Como hemos dicho antes, en la primera columna figura la variable y deba-
jo las categorías, mujer y hombre (en el orden que queramos porque las categorías no impli-
can más o menos cantidad ni orden) y en las siguientes las frecuencias absolutas y relativas.
En cuanto a los gráficos tenemos dos opciones: barras y sectores. Por ejemplo, en SPSS pue-
den pedirse en las siguientes opciones: Analizar/ Estadísticos descriptivos / frecuencias (selec-
cionar variable sexo) / Gráficos: barras o sectores. O en la opción Gráficos del menú prin-
cipal. Podemos elegir una de las dos, por separado, pero no a la vez (ver cuadro 3.3).
Como sabemos, son aquellas que, siendo cuantitativas, no pueden tomar cualquier valor
sino solo unos valores determinados, normalmente enteros. Por ejemplo, el número de hijos.
En una familia puede haber uno, dos, tres, cuatro, más o ninguno, pero no 1,74 hijos.
49
Estadística básica para educadores
Sexo
50
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
N.° de hijos
Teóricamente, este gráfico consistiría en una línea más o menos alta según la frecuen-
cia. Pero, si las barras tuviesen solo una dimensión apenas se verían. ¿Qué utilidad tendría
un gráfico que no se ve, o que cueste verlo a simple vista? Por esta razón las barras no son
líneas, sino que tienen anchura. Pero eso no significa que para el valor 2, por ejemplo, de la
variable ésta pueda valer algo más o algo menos de 2.
51
Estadística básica para educadores
Ya vimos que son las que pueden tomar cualquier valor (dentro de un intervalo de varia-
ción). En nuestro ejemplo sería el resultado obtenido por los 25 sujetos en un examen de
estadística. En la tabla figuran valores enteros entre 2 y 8. Pero, a diferencia de la variable
anterior (n.º de hijos) la variable puede tomar cualquier valor. Por ejemplo, entre 6 y 7 podría
tener infinitos valores, aunque la tengamos expresada en números enteros que, como vere-
mos, representan intervalos.
Examen
Los valores que figuran en la tabla son valores centrales de intervalos. La puntuación 4
no tiene por qué ser exactamente 4, sino que puede oscilar entre un mínimo de 3,5 hasta
un máximo de 4,5 (si no llega a 3,5 le asignamos un valor de 3 y si pasa de 4,5, le asigna-
mos un 5). En este caso los intervalos tienen una amplitud de un punto, pero podemos tra-
bajar con intervalos de más amplitud.
52
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Los indicadores de posición no central nos muestran el lugar que ocupa un valor de la varia-
ble en la distribución. Dividen la distribución en diversas partes iguales (por ejemplo en 100
partes) e indican qué valores marcan el paso de una parte a la otra y, por lo tanto, determi-
nan en cuál de estas particiones se encuentra un dato determinado.
Según el número de partes en que dividimos una distribución ordenada, podemos encon-
trarnos con los siguientes indicadores:
Percentiles o centiles (P): se divide en 100 partes iguales y determinan la situación del
individuo dentro del grupo en %. Indican los valores que dejan por debajo de él un cierto
porcentaje de individuos.
Nos ayudan a responder a cuestiones como las siguientes:
Se debe tener cuidado al interpretarlos (muchas personas lo harán mal). Hay que tener en
cuenta que los centiles o percentiles son una escala ordinal y no tienen la misma interpreta-
ción a lo largo de toda la escala. Las diferencias absolutas en la variable (capacidad, talla, peso...)
suelen ser más pequeñas en el centro de la distribución que en los extremos. Como en el cen-
tro de la distribución hay más parte proporcional de la población, un intervalo de centiles de
5 nos da para recorrer mucha menos distancia de intervalo que en los extremos, en los que los
valores están mucho más dispersos. Así entre los percentiles 50 y 55 hay una diferencia en la
variable, pongamos, la tercera parte que entre los percentiles 90 y 95.
Si en una clase de 100 estudiantes mides 5 cm menos que el más alto es posible que seas
el segundo, que no haya nadie en medio. Si mides 5 cm menos que el 50 es posible que seas
el 80, que haya 30 en medio, porque en el centro se agrupan las alturas de muchos más indi-
viduos.
Los deciles (D) expresan el mismo concepto (situación relativa) pero en este caso, en vez
de dividir la distribución en 100 partes iguales, la hemos dividido en 10 partes.
Los cuartiles (Q). Si dividiésemos la distribución en cuatro partes iguales, cada una de
estas cuatro partes (que equivale a 25% cada una) en estadística se llama cuarto (como cada
uno de los trozos de una manzana cortada en cuatro partes). Los cuartiles son los valores
que delimitan estas cuatro partes iguales.
El cuartil 1 (Q1) deja por debajo el 25% (por lo tanto equivale al percentil 25), el cuar-
til 2 (Q2) deja el 50% (lo que es lo mismo, al percentil 50, al cual también llamamos media-
na) y el cuartil 3 (Q3) deja el 75% por debajo (percentil 75).
Los cuartiles son muy utilizados en los ránkings de las revistas científicas internaciona-
les. Por ejemplo, es muy importante en un currículum vítae académico haber publicado en
53
Estadística básica para educadores
una revista del cuartil 3 (Q3) de un ránking competitivo como Journal Citation Reports (JCR),
pero es más importante hacerlo en otra revista de Q1 en ese mismo ránking.
El programa SPSS calcula cualquier percentil que le pidamos y también los cuartiles,
pero en el “output” no los especifica. Sin embargo, sí da los percentiles 25 (Q1), 50 (Q2 o
mediana) y 75 (Q3).
En la figura 3.5 podemos ver una distribución normal, o campana de Gauss, con la
mayoría de los valores concentrados en la zona media. En ella están marcados los cuartiles,
y podemos ver como las áreas comprendidas entre dos cuartiles son las mismas. Esto signi-
fica que el porcentaje de individuos desde el inicio de la distribución hasta el primer cuar-
til es del 25%, y lo mismo puede decirse del porcentaje de individuos comprendidos en cual-
quier otro intervalo entre dos cuartiles consecutivos.
En la siguiente figura podemos ver las equivalencias entre los diferentes indicadores de
posición antes comentados.
54
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Las medidas que nos dan una primera aproximación al análisis y la interpretación de los
datos estadísticos de una fuente de datos son las medidas de tendencia central. Este tipo de
medidas se llaman así porque, por lo general, la mayoría de los datos tienden a agruparse en
torno a los valores centrales de la distribución y lo que nos indican es dónde está el centro
de los valores de los datos. En este sentido, hablamos con expresiones tales como “la media”,
la “mediana”, la “moda” entre otras. Por ejemplo, si tenemos las respuestas de una clase a un
examen de inglés y miramos las notas que han obtenido los estudiantes, podemos decir que
“la media de la clase ha sido un 5”. Hacer esta afirmación significa que “las notas de los estu-
diantes están alrededor del 5”. Pero eso no quiere decir que esos estudiantes hayan sacado
todos un 5 (o cerca de un 5). Piénsese en el caso de un grupo de 4 estudiantes, donde 2
hayan sacado un 10 y los otros 2 un cero. La media en este caso sería un 5; ¡pero ninguno
de los cuatro ha sacado un 5! (ni cerca tampoco).
Desde el punto de vista estadístico existen varias formas de examinar el concepto de
“medida de tendencia central”. En general disponemos de tres medidas para hacerlo: la
media, la moda y la mediana. A continuación se describe cada una de ellas y se ponen ejem-
plos para ilustrarlas.
A) La media aritmética
n
Donde ni es la frecuencia absoluta del valor xi, es decir, cuásntas veces se ha repetido ese
valor en la muestra. En esta fórmula, la x– es el símbolo que representa la “media aritméti-
ca”. La letra xi indica cada uno de los valores de la tabla de frecuencias. La letra “n” es el total
de los individuos.
Sigamos con el ejemplo de las notas obtenidas por los estudiantes en un examen (ver
matriz de datos en el apartado 3.1). Son 25 en total. Las calificaciones que han obtenido en
el examen son las siguientes: 5, 4, 7, 5, 4, 6, 5, 6, 3, 5, 5, 2, 5, 4, 6, 8, 5, 4, 7, 3, 5, 7, 3, 6,
8. Al representar estas notas en un cuadro obtenemos lo siguiente:
55
Estadística básica para educadores
2 1 2
3 3 9
4 4 16
5 8 40
6 4 24
7 3 21
8 2 16
Total 25 128
Para aplicar la fórmula lo que se tiene que hacer primero es sumar todas las calificacio-
nes que han obtenido los estudiantes. Esto se puede hacer de dos formas: bien (1) cogien-
do la calculadora y sumando una a una todas las calificaciones obtenidas, o bien (2) cogien-
do la tabla y multiplicando las notas por el número de estudiantes. El resultado es el mismo.
1. 5 + 4 + 7 + 5 + 4 + 6 + 5 + 6 + 3 + 5 + 5 + 2 + 5 + 4 + 6 + 8 + 5 + 4 + 7 + 3 + 5 + 7
+ 3 + 6 + 8= 128
2. 2 + 9 + 15 + 40 + 24 + 21 + 16 = 128
Entonces, una vez tenemos el resultado de todas las notas obtenidas por los estudian-
tes, lo dividimos entre el total del estudiantes (25). El resultado es la media aritmética.
x =
∑x n
i i
=
128
= 5,12
N 25
Por tanto, en nuestro ejemplo, la media aritmética de la distribución de las notas del
examen es igual a 5,12.
Sin embargo, ningún estudiante ha sacado 5,12 pues la mayoría han sacado 4 puntos
(4 alumnos), 5 puntos (8 alumnos) o 6 (4 alumnos); en total 16 de los 25. La media arit-
mética es un valor alrededor del cual tienden a agruparse las puntuaciones de los sujetos.
B) La mediana
La mediana corresponde al valor que toma la variable que estamos analizando cuando
se deja exactamente la mitad de la distribución a un lado y otro de dicho valor. Puesto que
56
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
deja por debajo al 50% de la distribución, la mediana coincide con el centil o percentil 50,
con el quinto decil y con el segundo cuartil. Para hallar la mediana es necesario hacer dos
pasos. En primer lugar, hay que ordenar los datos de menor a mayor. Luego, se busca el dato
que está justo en medio de la muestra. Ese es el dato que corresponde con la mediana.
Si hay un número impar de observaciones, entonces el dato que ocupa el centro de la
muestra deja a ambos lados la misma cantidad de observaciones. Por ejemplo, volvamos a
los datos del cuadro 3.6. Vemos que hay un total de 25 observaciones. En el cuadro ya apa-
recen ordenados los datos de la calificación más baja, a la más alta. Si dividimos los datos
por la mitad, vemos que en el centro se encuentra la observación que ocupa el décimo ter-
cer lugar (marcado en negrilla en el ejemplo). Esa observación deja doce datos a la izquier-
da, y doce más a la derecha, tal como se muestra a continuación:
2–3–3–3–4–4–4–4–5–5–5–5–5–5–5–5–6–6–6–6–
7–7–7–8–8
0–0–0–0–0–1–1–2–2–3
En este caso, la mediana se calcula como la semisuma de los valores que toman las obser-
vaciones centrales:
x i + x i
+1
2 2
med x = , es decir, para el ejemplo usado, x i es el valor de la quinta obser-
2
2
vación, y x i es el valor de la sexta observación, de manera que: med x = 0 + 1 = 0, 5 .
+1 2
2
C) La moda
Es el valor que más veces se repite; por lo tanto, el que tiene la frecuencia más alta. La
calcula el ordenador y la podemos ver observando la tabla (matriz de datos). En la variable
sexo es mujer (frecuencia 15), en número de hijos 2 (frecuencia 10) y en el examen 5 (fre-
57
Estadística básica para educadores
Ámbitos de aplicación
¿Cómo aplicar todos estos conceptos a las ciencias sociales y de la educación? La eficien-
cia y la equidad son dos términos que se utilizan con frecuencia en el mundo de la educación.
Como personas que trabajamos en este ámbito a menudo se nos pide que analicemos las actua-
ciones educativas para valorar su éxito en función de la eficiencia que tienen y la equidad que
promueven. Para responder a este tipo de preguntas necesitamos indicadores, medidas, etc.,
que nos permitan ofrecer respuestas con una cierta base fiable. De esa manera las decisiones
que tomemos estarán tomadas sobre la base de criterios científicos. ¿Cuándo podemos decir
que una actuación educativa ha tenido éxito? ¿Cómo podemos utilizar los estadísticos que aca-
bamos de explicar como indicadores para saber si una actuación es (o no) adecuada?
El uso tanto de las medidas de tendencia central, como de las de dispersión, nos per-
mite dar respuestas a estas preguntas. Sin embargo, es importante hacer una correcta inter-
58
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
pretación de las mismas. En caso contrario, podemos incluso cometer errores (o inducir a
ellos) al utilizar de manera sesgada la información que nos ofrecen.
Huff (1993) en su libro explica que en su barrio la gente gana 15.000 dólares de media.
Un año después, y con motivo de una discusión entre barrios para ver en cuál de ellos se lle-
va la línea de autobuses, Huff afirma que la media de ingresos en su barrio es de 3.500 dóla-
res. ¿Se trata de un engaño? No. Huff muestra que la media aritmética de los ingresos en su
barrio es de 15.000 dólares, pero que la mediana es de 3.500 dólares (es decir, la mitad de
la población gana menos de 3.500 dólares, y la otra mitad más). Y resulta que la moda se
sitúa en 5.000 dólares. Por tanto, dependiendo de qué quieran las personas del barrio, les
irá mejor usar una medida de tendencia central que otra.
En otro ejemplo Huff (1993) relata el caso de una empresa donde la media de los salarios
está en 5.700 dólares, la mediana en 3.000 y la moda en 2.000. El dueño de la empresa está
muy contento porque dice que sus trabajadores ganan de media 5.700 dólares. En cambio, los
trabajadores no están tan contentos, porque saben que la mayoría de ellos gana 2.000 dólares,
y pocos llegan a alcanzar los 5.700 que afirma el dueño que se ganan de media en su empresa.
De hecho, es habitual que, por ejemplo, se resalte la media aritmética, como un indi-
cador que resume cuáles son las tendencias centrales. A menudo en la prensa aparecen comen-
tarios tales como “la población opina”, “el interés medio”, “las diferencias medias” y otras
muchas del mismo estilo, que se están basando en la idea de promedio. Sin embargo, como
hemos avisado ya antes, la media aritmética es una medida que puede estar afectada por los
valores extremos. Eso significa que, si existe una gran dispersión en los datos, la media debe-
rá ser acompañada por otros estadísticos para una mejor descripción de los datos.
Si no damos esta información complementaria, la media nos dará una información no
ajustada a la realidad y hará que las decisiones se tomen sobre una base que no es correcta.
Una valoración rigurosa, por tanto, implica también el uso de las medidas de dispersión,
para tener una idea más fidedigna de cómo es la distribución. Esto está muy relacionado
con el tema de la calidad y el éxito educativo.
La idea de “calidad educativa” suele asociarse con los resultados obtenidos por los estudian-
tes. Cuanto mejores sean los resultados globales de un conjunto, más calidad suele atribuirse
a la educación. En ocasiones la calidad educativa también se define en función de la inver-
sión realizada en educación y los resultados obtenidos por los estudiantes. En el informe de
la EENEE (Woessmann y Schütz, 2006) se habla de eficiencia en este sentido: relación entre
los beneficios/resultados educativos y el coste económico. Cuanto mejores resultados se
obtienen con menores cotas de inversión, más eficiencia.
Veámoslo con un ejemplo. Resulta que estamos analizando la calidad de la educación
que se realiza en varios estados. Para ello usamos datos de algún estudio internacional que
nos permita comparar unos países con otros: por ejemplo el PISA. En el siguiente cuadro
se reproducen los resultados que obtuvieron estudiantes de diversos países de todo el mun-
59
Estadística básica para educadores
do en el ámbito de ciencias. ¿De qué nos sirven los conceptos que acabamos de explicar?
¿Para qué podemos usar las ideas de media aritmética, mediana, moda, máximos, mínimos
o desviaciones? Para averiguar cuál es el país que mejores resultados está obteniendo en tér-
minos de educación, lo que nos interesa es quién obtiene la puntuación más alta. Lo que
nos interesa aquí es identificar cuál es el valor máximo que toma la distribución de las pun-
tuaciones. En este caso es Finlandia el país que ocupa la primera posición: por tanto, don-
de la educación llega a cotas más altas es en Finlandia. ¿Es eso cierto?
Cuadro 3.7. Rendimientos en ciencias en diversos países del mundo (PISA 2006)
60
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
la inversión en educación que realiza cada país. Se suele decir que una mayor inversión en edu-
cación sirve para aumentar el nivel educativo de la población de un país. Veámoslo. Para que la
comparación sea justa, tenemos que buscar algún sistema que nos permita tener un criterio que
sea el mismo para todos los países. Utilizar, por ejemplo, el porcentaje que gasta cada país en
educación en relación con su PIB puede ser una buena forma de hacerlo.
En el siguiente cuadro se presentan los datos correspondientes a los resultados en edu-
cación y lo que se gasta cada país en su sistema educativo. Ahora es cuando necesitamos
recuperar todos esos conceptos que hemos venido estudiando hasta ahora.
Ratio Ratio
País Gasto Puntuaciones puntuación/ País Gasto Puntuaciones puntuación/
gasto gasto
Finlandia 3,9 563 144,36 Polonia 3,7 498 134,59
Canadá 3,6 534 148,33 Dinamarca 4,5 496 110,22
Estonia 3,5 531 151,71 Francia 4,0 495 123,75
Japón 2,9 531 183,10 Islandia 5,4 491 90,93
Nueva Estados
4,7 530 112,77 3,8 489 128,68
Zelanda Unidos
Australia 4,1 527 128,54 España 2,9 488 168,28
Países Bajos 3,4 525 154,41 Noruega 3,8 487 128,16
Eslovenia 4,3 519 120,70 Luxemburgo 3,7 486 131,35
Alemania 3,4 516 151,76 Rusia 1,9 479 252,11
Reino Unido 4,6 515 111,96 Italia 3,3 475 143,94
República
3,0 513 171,00 Portugal 3,8 474 124,74
Checa
Suiza 4,4 512 116,36 Grecia 2,7 473 175,19
Austria 3,7 511 138,11 Israel 4,5 454 100,89
Bélgica 4,1 510 124,39 Chile 3,4 438 128,82
Irlanda 3,4 508 149,41 México 4,4 410 93,18
Hungría 3,4 504 148,24 Brasil 3,2 390 121,86
Suecia 4,2 503 119,76
Fuente: Elaboración propia a partir de Informe PISA 2006. Programa para la evaluación internacional de alumnos de la
OCDE. Informe español; y OCDE (2008) Education at a Glance (datos correspondientes a 2005). Los porcentajes de
gasto en educación por estudiante con relación al PIB corresponden a primaria, secundaria y bachillerato.
61
Estadística básica para educadores
A primera vista parece que la afirmación que habíamos hecho anteriormente de que Fin-
landia es el país donde la educación tiene más calidad es cierta. Con una inversión sustan-
cial (3,9% del PIB) los estudiantes finlandeses obtienen la mejor puntuación en las pruebas
del PISA. Otros países, sin embargo, invierten mucho más (hasta un 4,9% o un 5,4% del
PIB) y obtienen resultados significativamente peores. Eso obliga a cuestionar la afirmación
de que existe una relación directa entre gasto en educación y resultados (a mayor gasto mejo-
res resultados). La media de la inversión en educación de los países que aparecen en el cua-
dro está en 3,7%. Salvo Finlandia y Nueva Zelanda, la mayoría de los primeros cinco paí-
ses que mejores resultados tienen en el cuadro gastan mucho menos de su PIB en educación.
La moda está en 3,4%, pero, si analizamos los datos, vemos que la variabilidad de los resul-
tados obtenidos por los países que invierten el 3,4% de su PIB en educación es enorme (van
desde 525 puntos a 438; casi 100 puntos de diferencia). Por tanto, estos estadísticos ayu-
dan a ver que si Finlandia obtiene mejores resultados en los exámenes del PISA no es solo
por el gasto que realiza en educación; es necesario buscar otros motivos (es decir, otras varia-
bles) que, junto con el gasto, expliquen la posición que ocupa.
La estadística, por tanto, es una herramienta que nos permite descartar explicaciones exce-
sivamente simples a los sucesos. Las medidas de tendencia central son muy útiles usadas con
mesura y con criterio para juzgar críticamente afirmaciones causales, tales como la que hemos
examinado, sobre la supuesta relación entre inversión pública y calidad educativa.
A veces las medidas de tendencia central no sirven para poder “ver” el sentido de la distri-
bución que tenemos delante. Puede ocurrir que esa distribución esté afectada por valores
muy extremos. En ese caso, las medidas de tendencia central no ilustran lo que en realidad
ocurre. Como la historia de las dos personas que se comen dos pollos; puede ser que ambas
ingieran un pollo, respectivamente, o que una coma los dos pollos, mientras la otra mira.
En ambos casos, la media aritmética va a ser la misma: uno. Las medidas de dispersión nos
muestran la variabilidad que se da entre los datos: datos muy agrupados tendrán una dis-
persión baja y viceversa. Las más utilizadas son el rango, la varianza, la desviación típica y
el coeficiente de variación (Peña, 1986; Peña y Romo, 1997; Sierra Bravo, 1981, 1985). A
continuación se explican de manera sucinta estas medidas.
62
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
El inconveniente que surge con el rango es que se basa solo en dos datos (dos extremos).
Si uno de ellos (o ambos) es anormalmente alto o bajo este índice no es un buen descripti-
vo de la desviación. Y, aunque no fuera este el caso, el rango no tiene en cuenta si el “grue-
so” de los valores está en los extremos, o en el centro, u otras cuestiones referentes a la dis-
tribución interna de los datos. Necesitamos algún índice que tenga en cuenta todos los datos.
B) La varianza
El rango es un buen índice para intuir si existe o no desviación, pero no la mide. Si toma-
mos un valor al azar de la distribución, no podemos saber a ciencia cierta cuál es su desviación
del centro teórico (la media) de la distribución. Sin embargo, eso sí puede calcularse a través de
estadísticos como la varianza. Se trata de la desviación de cada dato en relación con la media de
la muestra. Para obtenerla necesitamos calcular la diferencia de cada dato con la media de la
muestra y sumarlas en conjunto. El problema que surge al llevar a cabo estas diferencias es que
los valores positivos y negativos se anulan entre sí (problema de la anulación). Para resolverlo
los matemáticos idearon la estrategia de usar el cuadrado de todas las diferencias (de esta forma
todos los resultados son positivos). Al resultado se le llamó varianza.
Los valores de la varianza que da el ordenador (utilizando el SPSS) para número de hijos
y examen son los siguientes:
0,8733 2,443
El problema ahora es que el resultado no nos permite tener una idea exacta del valor de
la dispersión, ya que las unidades en que se expresa son contraintuitivas. Para resolver este
dilema, los matemáticos tenían otro as guardado en la manga: lo que denominaron “des-
viación típica”.
C) La desviación típica
Como trabajamos con datos al cuadrado este índice está sobredimensionado. La des-
viación típica o estándar (que es la raíz cuadrada de la varianza) es un índice de dispersión
más acorde con los datos.
63
Estadística básica para educadores
¿Cuál es el contrario de una suma? Una resta. ¿Cuál el de una división? Una multipli-
cación. Por tanto, la genialidad del método que se esbozaba en el apartado anterior (la varian-
za) para resolver el problema de la anulación (elevar al cuadrado), la desviación típica apli-
ca el contrario de lo que se había hecho para superar dicho problema. Como se habían usado
potencias de base dos, la manera de recorrer el camino inverso es la raíz cuadrada. Y, lo más
bello del artificio, al calcular una raíz cuadrada, el resultado que arroja siempre es positivo
(en realidad, lo que se hace es coger la solución positiva de la raíz). Al hacer la raíz cuadra-
da de la varianza, se eliminan dos cosas: el efecto de la anulación entre valores iguales, posi-
tivos y negativos, y la sobredimensión debida al uso de las potencias cuadradas. La desvia-
ción típica, que es como se llamó al índice resultante, es la raíz cuadrada de la varianza. Otro
índice, la desviación media, calcula exactamente la media de las desviaciones en valor abso-
luto de cada dato respecto a la media aritmética, y las promedia. Sin embargo, la desviación
típica tiene ventajas, entre las cuales se cuenta una mayor facilidad de cálculo.
En el caso del número de hijos y examen la desviación típica es:
0,935 1,563
Hay que pensar que la desviación típica tiene un significado aproximado de “cuánto me
puedo esperar que los datos reales difieran de la media aritmética”. Por lo tanto, las unida-
des de la desviación son las mismas que lo que estamos estudiando. El 0,935 tiene unidad
de “hijos” y el 1,563 tiene unidad de “puntos de examen” (“en cuántos puntos de examen
puedo esperar que los datos reales difieran de la media aritmética de notas”).
64
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
S
Fórmula de coeficiente de Pearson: CU = 100
Χ
Indica el tanto por ciento de variación con relación a la media. Si, por ejemplo, tene-
mos dos distribuciones, A (con una media de 10 y una desviación típica de 4) y B (con una
media de 20 y una desviación típica también de 4), la variación absoluta es la mínima, 4.
Pero la variación relativa es mayor en la distribución A.
4 4
CU A = 100 = 40% CU B = 100 = 20%
10 20
Además de estas medidas que nos informan de la posición, tendencia central y disper-
sión de los datos es importante también disponer de su forma. Para ello contamos con dos
coeficientes, el de asimetría y el de curtosis.
A) El coeficiente de asimetría
Los conceptos estadísticos de simetría/asimetría son iguales a los que tenemos en la vida
normal. Una figura o un objeto son más simétricos cuanto más parecidas son las mitades
que quedan a uno y otro lado de un eje o plano central.
Básicamente tenemos tres casos (como se puede observar en la figura 3.7):
Es muy difícil, casi imposible, que nos encontremos casos con índices de asimetría exacta-
mente cero. Se suele aceptar que una distribución es simétrica (o aceptablemente simétrica cuan-
do el índice es aproximadamente cero: no está por debajo de –0,5 ni por encima de +0,5).
0,5 < As As = 0 As < –0,5
Asimetría positiva Simétrica Asimetría negativa
65
Estadística básica para educadores
Un gráfico de una distribución nos puede ofrecer mucha información. Como hemos
visto, que las personas estén a un lado u otro del valor medio nos ofrece una información
interesante a la hora de interpretar los datos que tenemos. Pero también podemos analizar
el gráfico según la “altura” que tenga la campana que forman los datos, o, mejor dicho, y
para ser más exactos, el “apuntamiento” que presenta la curva. Si es una curva fina, que se
distingue claramente, como una montaña sobre el horizonte, entonces estamos ante una
distribución que concentra a la mayoría de las personas en torno al valor central. En cam-
bio, cuando la “montaña” se convierte en un “monte”, con una base mucho más amplia, y
pendientes más suaves, entonces eso quiere decir que las personas se distribuyen de mane-
ra más distendida, alrededor del valor medio de la distribución. Esta característica de la dis-
tribución, que podemos ver según si la gráfica presenta pendientes muy severas o suaves,
con gran apuntamiento o poco, es lo que se llama “curtosis”. El índice de curtosis permite
medir el nivel de “apuntamiento” en la distribución de los datos.
Veamos un ejemplo. Supongamos que estamos haciendo un estudio de un grupo de
estudiantes que se están preparando para aprobar las pruebas de acceso a la universidad para
mayores de 25 años. Son un grupo de diez estudiantes, y en un examen preparatorio, han
obtenido las siguientes calificaciones: 6, 7, 7, 6, 7, 5, 4, 6, 7 y 8. Para calcular el índice de
curtosis necesitaremos utilizar la siguiente fórmula:
66
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Cr =
∑(x i
− x )4
−3
n ⋅ S x4
67
Estadística básica para educadores
Como podemos observar, la curtosis nos resulta útil para saber cómo de concentrada se
encuentra la distribución de la variable, en torno a un valor medio. Sin necesidad de dibu-
jar el gráfico, aplicando las fórmulas que se indican, el índice de curtosis nos da pistas para
saber si estamos ante una distribución con mucha dispersión (platicúrtica) o, por el con-
trario, nos encontramos ante una distribución con poca dispersión (leptocúrtica).
Para pedir indicadores estadísticos con SPSS ejecutamos el comando ANALIZAR/ ESTA-
DÍSTICOS DESCRIPTIVOS/FRECUENCIAS y en el cuadro de diálogo ejecutamos la
opción ESTADÍSTICOS, y obtenemos el siguiente cuadro de diálogo.
La estadística descriptiva nos permite conocer de manera más o menos detallada la distri-
bución de la variable o variables que estamos estudiando. Como profesionales de las cien-
cias sociales y de la educación, debemos conocer las diferentes herramientas técnicas que
tenemos a nuestra disposición, para caracterizar y conocer las características de las personas
sobre las que estamos haciendo nuestra investigación. Para ello, pueden utilizarse recursos
informatizados de aprendizaje de estadística descriptiva como el que propone Torrado (2001).
De todas maneras, una investigación nunca es un proceso unívoco que va desde la per-
sona que investiga a las personas investigadas. Las técnicas que hemos visto en este capítu-
lo son en realidad herramientas. Tenemos que usarlas para conocer, pero la tarea importan-
te de la interpretación de los datos es algo que va más allá del uso de las técnicas y que emerge
del diálogo entre todas las personas que están implicadas en la investigación (Gómez, Lato-
rre, Sánchez, Flecha, 2006; Gómez, Puigvert y Flecha, 2011).
Igual que un ordenador, en sí, no supone una puerta al conocimiento, sino que es su
uso lo que nos permite aprender más, llegar a más información, procesarla mejor, de la mis-
68
Capítulo 3: ¿Qué es esa cosa llamada “estadística descriptiva”?
Para la reflexión…
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes descar-
gar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/)
69
Estadística básica para educadores
Puedes utilizar los datos provenientes del instrumento de medida que se sugería reali-
zar en el capítulo anterior o la matriz indicada antes:
• Mediante SPSS crea las tablas de frecuencia de las variables e interprétalas. Según el
tipo de variable, crea la representación gráfica más adecuada para cada variable.
• Pide los indicadores estadísticos de posición, tendencia central, dispersión y forma de
las variables cuantitativas e interpreta el “output”.
70
4
La probabilidad
Antes de pasar a la estadística inferencial es necesario hacer un alto en el camino, para hablar
de algunos aspectos de la probabilidad. La teoría moderna de la probabilidad es la base nece-
saria para superar las limitaciones de la estadística simplemente descriptiva y adentrarnos en
la estadística inferencial. El origen de la teoría moderna de la probabilidad suele situarse en
la correspondencia que mantuvieron Blaise Pascal (1623-1662) y Pierre de Fermat (1601-
1665) a propósito de varios “retos” que planteó Chevalier de Mére (1610-1685) a Pascal
(Campos, 2004).
De hecho, es muy complicado situar el origen del cálculo de probabilidades. En el siglo
XVI ya se cuenta con evidencias de que el matemático italiano Cardano (1501-1576) hizo
un estudio de las combinaciones, al mismo tiempo que un compatriota suyo: Nicolás Fon-
tana, conocido como Tartaglia. Cardano fue autor del Liber de ludo aleae, donde expone su
teoría de la combinatoria. Un poco más tarde, Galileo Galilei (1564-1642) también dedi-
ca algunos de sus estudios al cálculo de probabilidades, observando que, al tirar 3 dados, se
tenía más probabilidades de ganar a la suma 10 que a la suma 9. Escribió sus reflexiones en
un manuscrito titulado Sopra le scoperte dei dadi.
De Mére era un conocido noble francés muy aficionado a los juegos de azar, con gran
experiencia y habilidad en ellos, que propuso a Pascal varios problemas relacionados con el
cálculo de probabilidades. Pascal, amigo de Fermat, intercambió con él correspondencia
sobre las resoluciones de los problemas propuestos por De Mére, poniendo las bases de lo
que hoy en día conocemos como cálculo de probabilidades. Mientras Pascal encontró la
71
Estadística básica para educadores
“... para reducir a un arte exacto, con el rigor de las demostraciones matemáticas, la
incertidumbre del azar, esto es creando una nueva ciencia que podemos llamar justifica-
damente con el título de: matemáticas del azar” (Pascal, citado en Kline, 1968: 522).
En 1657, otro matemático llamado Christian Huygens (1629-1695) publicó una obra
titulada De ratiociniis in ludo alae, considerada actualmente como el primer compendio de
probabilidades aplicado a los juegos, que fue un recopilatorio de la correspondencia que
habían mantenido Pascal y Fermat. Más tarde, en 1669, publica Application of mathemati-
cal probability to expectation of human life, con gran profusión del uso de tablas de mortali-
dad, rentas, etc. y que dio lugar a los cálculos que se llevan a cabo hoy en día en las com-
pañías de seguros.
La probabilidad es un tema fácil, que no tiene grandes complicaciones de entender. Sin
embargo, a veces una mala aproximación da lugar a errores e ideas equivocadas, que pue-
den llegar a provocar decisiones erróneas. La probabilidad nos permite predecir, con un cier-
to margen de certeza, el acontecimiento de sucesos más o menos seguros o probables. Es
una herramienta muy potente que, si se sabe aplicar correctamente, permite grandes “mala-
barismos” como es el caso de conocer la totalidad de un fenómeno viendo solo una parte de
él e infiriendo el resto a partir de una cierta probabilidad, con un cierto margen de error.
En este capítulo vamos a explorar los conceptos más importantes de esta disciplina y qué
impacto tienen sobre nuestra tarea profesional como educadores.
En nuestra vida diaria todos utilizamos en mayor o menor medida el concepto de probabi-
lidad. El médico receta una medicina al enfermo y le dice que dentro de un par de días se
encontrará mejor; casi todo el mundo sabe que cuantas más columnas rellena uno en las
quinielas existen mayores posibilidades de acertar una de catorce o, al menos, una de doce;
también que cuantos más números se juegan en la lotería es más probable que toque algún
premio; que se tienen más probabilidades de aprobar un examen si se ha preparado el 80%
de los temas que si solo se ha estudiado la mitad de ellos, etc.
Pero pocas veces nos paramos a pensar cómo podemos formular matemáticamente estas
probabilidades y calcular su valor. Así, el médico no suele decir: «Si se toma esta medicina,
tiene un 90% de probabilidades de sanar»; también es verdad que pocos jugadores de qui-
nielas saben siquiera que, combinando los resultados (1, X, 2), se pueden obtener 314 colum-
nas diferentes, etc.
72
Capítulo 4: La probabilidad
En cualquier caso podemos afirmar que la mayoría de la gente tiene una noción intui-
tiva de la probabilidad, noción que utiliza frecuentemente en su vida, aunque de hecho casi
nadie llega a formularla matemáticamente.
En las ciencias de la educación, debido precisamente a su complejidad, a causa de la
cantidad de variables que están afectando a un fenómeno educativo en concreto, la proba-
bilidad es la herramienta que mejor nos permite tomar decisiones correctas. Como tenemos
experiencia limitada sobre qué es lo que tiene éxito educativo y qué conduce al fracaso más
estrepitoso, nuestra decisión siempre se tiene que hacer sobre un marco de observaciones
previas, con la confianza que nos dan las evidencias de todo lo que ha sucedido en el pasa-
do. La verdad es que esto tendría que ser un principio de nuestras actuaciones, que desgra-
ciadamente muchas veces incluso huyen de la pseudo-certidumbre de la probabilidad para
asentarse en la “certidumbre” de una serie de creencias o de opiniones. Hay actuaciones que
siempre o casi siempre en el pasado generaron éxito y que no se aplican en muchos centros
donde se realizan actuaciones que siempre fracasaron.
pr(x) = f/n
Ejemplo: si tenemos una urna con 10 bolas exactamente iguales en todo menos en el
color, de las cuales:
– 5 son blancas
– 3 son negras
– 2 son rojas
73
Estadística básica para educadores
– casos posibles: n = 10
– casos favorables: f(B) = 5
– casos posibles: n = 10
– casos favorables: f(N) = 3
La probabilidad de extraer una bola negra es, pues, 0,3. También lo podríamos com-
probar de modo parecido a como lo indicamos en el caso anterior.
Axiomas
2. La probabilidad de un suceso seguro (Ω, o sea el que contiene todos los casos posibles) es
igual a uno y la probabilidad de un suceso imposible (Ø, o sea el que no contiene nin-
gún caso posible) es igual a cero.
pr(Ω) = 1
pr(Ø) = 0
74
Capítulo 4: La probabilidad
Supongamos que el dado tiene 4 caras azules y 2 rojas y preguntémonos por la proba-
bilidad de obtener una cara roja. El suceso «roja» está compuesto por las dos caras rojas, cada
una de las cuales, al ser sucesos elementales, tiene una probabilidad igual a 1/6. Según el
axioma 3:
pr(R) = pr(r1) + pr(r2) = 1/6 + 1/6 = 2/6 = 1/3 = 0,33
La definición axiomática de probabilidad solo da los mismos resultados que la defini-
ción clásica cuando todos los sucesos elementales de la experiencia tienen idéntica probabi-
lidad (dado equilibrado, moneda perfecta, urna con bolas que solo se diferencian en el color,
etc.). La teoría axiomática de probabilidad solo impone que se cumplan los tres postulados
o axiomas anteriormente dichos.
El valor de la probabilidad de un suceso elemental no lo asigna la teoría de probabili-
dad, sino que se atribuye de acuerdo con ciertas hipótesis referidas a la experiencia aleato-
ria de que se trate en cada caso (juegos de azar, experiencias educativas, psicológicas, socio-
lógicas, biológicas, etc.).
75
Estadística básica para educadores
fr (x) = h x
n
Esta frecuencia relativa de x se puede considerar como una estimación de la probabili-
dad de x:
pr (x) = lim⋅ h x (n → ∞)
n
Así, pues, la noción experimental de probabilidad de un suceso se apoya, por una par-
te, en la noción estadístico-experimental de frecuencia relativa (proporción) de este suceso
en una serie n de pruebas y, por otro, en el fenómeno experimental de regularidad estadís-
tica o ley de los grandes números.
h (x)
fr (x) =
n
76
Capítulo 4: La probabilidad
pero esta hipótesis no es exacta, porque realmente nacen más varones que mujeres,
al menos eso es lo que nos dicen las cifras del Anuario Estadístico de España, según
el cual hubo 73.064 nacimientos en un determinado año, de los cuales 37.289 fue-
ron varones. De estos datos podemos estimar la probabilidad (experimental) de nacer
varón, que será:
ˆ (V ) = 37289 = 0,51
pr
73064
Cuando hablamos de probabilidad tenemos que introducir ciertos conceptos para referir-
nos al tipo de variables de las que estamos tratando. Existen diferentes tipos de variables. En
cualquier caso, podemos distinguir entre variables aleatorias y variables no aleatorias. Por
supuesto, el tipo que nos interesa son las variables aleatorias.
Variable aleatoria: Una variable aleatoria se define al asociar a cada suceso ele-
mental de una experiencia aleatoria un número real según una determinada ley.
77
Estadística básica para educadores
Dentro de las variables aleatorias, podemos encontrar de varios tipos, según sean dis-
cretas o continuas. Empecemos por las primeras.
Veamos un ejemplo. Sea una población compuesta por 200 bolas, que solo se diferen-
cian en el número, que se distribuyen así:
Como es obvio, se trata de una variable aleatoria discreta, puesto que solo puede
tomar los valores 1, 2, 3, 4, 5. A cada extracción al azar la variable tomará uno de estos
cinco valores.
Se define una ley de probabilidad de una variable aleatoria cuando asociamos a cada
valor su probabilidad correspondiente. En este caso, suponiendo que todas las bolas tienen
la misma probabilidad de salir (equiprobabilidad) y aplicando la fórmula general de proba-
bilidad:
pr (x) = h x
n
78
Capítulo 4: La probabilidad
X Pr(x)
1 0,15
2 0,25
3 0,10
4 0,30
5 0,20
1,00
La suma de las probabilidades asociadas a todos los posibles valores de la variable x vale
siempre 1.
El conjunto de todos los posibles valores de una variable aleatoria x (discreta en este
caso) y de las probabilidades asociadas a cada uno de los posibles valores recibe el nombre
de ley de probabilidad de la variable x.
Cuando estamos trabajando con una variable aleatoria discreta, podemos hablar de la fun-
ción de probabilidad de la distribución de dicha variable, o bien de la función distribución.
xi pr(Xi) xi pr(xi)
79
Estadística básica para educadores
– Es decir
F(Xi) = pr(X≤Xi)
80
Capítulo 4: La probabilidad
xi pr(Xi) F(Xi)
1 0,15 0,15
2 0,25 0,40
3 0,10 0,50
4 0,30 0,80
5 0,20 1,00
81
Estadística básica para educadores
Como decíamos, además de las variables discretas, también podemos hablar de variables de
tipo continuo.
Por ejemplo, la variable talla, incluso dentro de un intervalo pequeño como es un cen-
tímetro, puede tomar cualquier valor. Entre 173 cm y 174 cm la variable talla puede tener
infinitos valores.
Ello implica que debemos matizar el concepto de función densidad o densidad de pro-
babilidad: no es la probabilidad de que la variable adopte un determinado valor (pr (x = xi)),
porque el cociente entre casos favorables y posibles (como hay infinitos valores posibles) nos
daría siempre cero. Por eso la función densidad se define como la probabilidad de que la
variable adopte un valor comprendido dentro de un intervalo (pr (x1 ≥ x ≤ x2) ).
El concepto de función distribución es el mismo: la probabilidad de que la variable ten-
ga un determinado valor o inferior (F (xi) = pr (x ≤ xi)).
En la figura 4.3 podemos ver una función de densidad. El área comprendida entre x1 y
x2, que vemos rayada en horizontal, representa la probabilidad de obtener un valor entre x1
y x2. En cambio la zona que vemos rayada en diagonal representa el valor de la función de
distribución para el valor x0. Observamos que si buscáramos el valor de la función de dis-
tribución para x1 o para x2, tendríamos áreas más grandes, por tanto valores de la función
de distribución más grandes. Por lo tanto, la función de distribución será una función cre-
ciente, donde para valores más grandes de x tenemos valores más grandes de la función.
82
Capítulo 4: La probabilidad
Se llama así porque se observó desde hace mucho tiempo que la representación gráfica de
las variables continuas, cuando la n era suficientemente grande, normalmente tendía a adop-
tar una determinada figura en forma de campana (por eso se llama también campana de
Gauss), tal como muestra la figura siguiente:
En ciencias sociales y educativas por lo general todas las cosas que estudiamos solemos mode-
lizarlas como curvas normales (la mayoría de la población suele comportarse de la misma mane-
ra, mientras que pocas personas actuarán de manera imprevisible o fuera de la pauta). Pero hay
que tener cuidado con esto: a veces las personas no actuamos tal y como lo hace la curva nor-
mal. Por ejemplo, Robert Merton teorizó sobre el “efecto Mateo”. En pocas palabras, el efecto
Mateo se refiere a aquellas situaciones en las que el comportamiento de la población es tal que
una persona, cuanto menos tiene, menos recibe, y cuanto más tiene, más recibe.
En situaciones de libre mercado, un estudiante que provenga de una familia sin recursos,
en un barrio marginal, con una escuela donde se aplica currículo de la “felicidad”, va a obtener
peores resultados académicos que un estudiante procedente de una familia acomodada, con
libre disposición de acceso a libros de todo tipo, un barrio con varias bibliotecas abiertas al públi-
co y de fácil acceso, y una escuela donde se implementa un currículo de altas expectativas. El
resultado que obtendrá el estudiante será muy diferente al que procede del primer barrio que
hemos comentado. En estos casos, la curva normal no explica nada.
Un primer paso es, pues, decidir cómo se comporta la población en referencia a aque-
lla variable que estamos estudiando, y eso desde una orientación comunicativa hay que hacer-
lo siempre en función de criterios de validez, no de poder; es decir: no vale decir que la
población se comporta siguiendo una distribución gamma porque lo digo yo, sino porque
83
Estadística básica para educadores
hay una buena colección de estudios previos, contrastados científicamente, que sugieren que
la población en esa variable en concreto se comporta como una distribución gamma. Fue-
ron los matemáticos Laplace y Gauss quienes, ya en el siglo XIX, formularon, independien-
temente, la función matemática de esta gráfica.
¿Cuáles son las características de la distribución normal?:
a) Es una curva simétrica respecto a un eje en el que están la media, la mediana y la moda.
b) La curva normal tiene dos puntos de inflexión (donde hay un cambio de curvatura):
1) x = μ – σx, 2) x = μ + σx.
c) La curva normal es asintótica con respecto al eje de abcisas (va hasta el infinito, casi
tangente, pero sin cortarlo).
d) Queda definida por dos parámetros: media (μ) y varianza (σ2).
e) En términos de probabilidad el área total bajo la curva es igual a 1.
84
Capítulo 4: La probabilidad
B) La prueba de Kolmogorov-Smirnov
Para poder realizar las aplicaciones anteriores (y para aplicar diversas pruebas estadísticas) la
condición es que la distribución siga la ley normal (en realidad que provenga de una pobla-
ción en la cual la variable sigue la ley normal). Para ello debemos realizar una prueba de nor-
malidad.
Existen varias pruebas y la de uso más frecuente es la prueba de Kolmogorov. Estudia,
por una parte, la distribución empírica u observada y, por otra, la distribución teórica normal.
Pueden ser más o menos parecidas, pero difícilmente una distribución en una muestra será
igual que la distribución teórica normal. Cuanto menores sean las diferencias más se ase-
mejará la distribución empírica a la teórica. Lo que hace es analizar las diferencias entre la
distribución empírica u observada y la distribución teórica (normal).
Por ejemplo, con el SPSS también podemos verificar la normalidad de una determina-
da distribución, seleccionando las opciones ANALIZAR/PRUEBAS NO PARAMÉTRI-
CAS/K-S de 1 muestra.
Como podemos observar, cuando accedemos al cuadro de diálogo de la prueba de
Kolmogorov-Smirnov hemos de seleccionar aquellas variables a las que queremos some-
ter a dicha prueba, así como debemos escoger el tipo de distribución con la que quere-
mos contrastar las variables, siendo en el caso que nos ocupa la distribución Normal, ya
que nuestro objetivo, tal como hemos comentado anteriormente, es verificar la normali-
dad de la distribución.
Puntuación
N 48
Parámetros normalesa,b Media 10,00
Desviación típica 5,174
85
Estadística básica para educadores
Para la reflexión…
86
5
Estadística inferencial o muestral.
La muestra
5.1. Introducción
La estadística sirve para describir fenómenos que están ocurriendo en nuestro mundo. Pero
también sirve para realizar predicciones. Ya hemos visto que la estadística trabaja siempre a
partir de observaciones. Muchas variables, tanto sociales como físicas, tienden a funcionar
como si siguieran un cierto patrón de comportamiento. Si conocemos la tendencia, enton-
ces seremos capaces de predecir lo que ocurrirá en el futuro, aunque todavía no haya teni-
do lugar. Ese es el secreto que se oculta tras la estadística inferencial: una base de datos robus-
ta, con suficientes observaciones como para poder “ver” regularidades que nos sugieran cómo
funciona la variable que estamos observando, unos buenos métodos para depurar los datos
y evitar (o minimizar en la medida de lo posible) los errores que puedan derivarse de equi-
vocaciones en la recogida de datos y un proceso correcto de estimación de los parámetros
que nos permita realizar con garantías el contraste de hipótesis. Todo eso nos dará una base
científica y razonablemente fiable para aceptar las predicciones que hagamos sobre el fenó-
meno que estamos investigando.
Al usar datos secundarios es preciso ser cauto. El primer paso para usar un dato procedente
de una base de datos es mirar cómo está construida. No es lo mismo estar trabajando con los
resultados de una encuesta que se ha realizado sobre 20 estudiantes (siendo la población total
todas las personas en edad escolar de un país), que una encuesta que ha incluido una muestra
de dos mil estudiantes, por ejemplo. ¿Cuáles son los elementos que debemos tener en cuenta?
¿Qué es lo que nos dice si podemos (o no) usar ese dato, cruzarlo, compararlo, etc.? Las pala-
bras clave aquí son: muestra, margen de error, intervalo de confianza. Todos estos conceptos
nos llevan a una rama de la estadística que se denomina “estadística inferencial”. En pocas pala-
bras, y haciendo un reduccionismo quizás excesivo, la estadística inferencial es la rama de la
estadística que se encarga de adivinar (con un cierto margen de error) si los estadísticos de la
muestra que estamos usando corresponden (o no) a la distribución que toman los parámetros
87
Estadística básica para educadores
en la población real y deducir con ello ciertas propiedades de la población a partir de la mues-
tra. Vamos a explicarlo un poco más. Cuando tomamos información de una base de datos
secundarios, por lo general están obtenidos en una muestra. Es decir, la OCDE, EUROSTAT,
el INE o la entidad que utilicemos para tomar los datos han realizado encuestas con amplias
muestras de población. Pero (y esto es lo importante) no han preguntado a todas las personas
de la población. No se ha ido casa por casa haciendo las preguntas del cuestionario por toda
España o el país del que se trate. Por tanto, han tenido que seleccionar una muestra (más ade-
lante veremos cómo se hace eso). En todo caso, ¿quién nos puede asegurar que las personas a
las que hemos preguntado tienen una opinión o una característica que corresponde con la
media de todas las personas que viven en el país? Como se puede ver, existe por un lado la
media de la población y, por otro lado, la media muestral.
Piénsese por ejemplo en la altura de las personas. Puede ocurrir que la altura media de
la población esté en 1,75 m. Ahora bien: ¿qué ocurre si por designios del azar hemos selec-
cionado una muestra de 50 personas que da la casualidad que miden todas más de 1,90 m?
Por supuesto, la media no va a ser 1,75 m (puesto que ese valor ni siquiera está representa-
do). Entonces, nuestra suerte nos ha conducido a elegir una muestra que seguramente esta-
rá situada en algún punto extremo de la distribución de alturas de la población.
En el ejemplo sobre la distribución de la altura, si suponemos que la población sigue
una distribución “normal” (una campana de Gauss), eso quiere decir que la mayor parte de
la gente estará sobre valores “medios”, mientras que habrá pocas personas que midan menos
de 1,50 m o más de 2,00 m. Esos dos números son “valores extremos”. Si cogemos una
muestra, lo lógico es que las alturas de las personas de esa muestra oscilen entre valores seme-
jantes a los “normales” de la distribución de altura de la población. Pero el azar nos puede
llevar a coger un grupo de personas (como en el caso de nuestra muestra de 50 personas),
que está en uno de los extremos de la campana de Gauss.
Por tanto, si decimos que la media de la altura de la población es de 1,95 m (por ejem-
plo) estaremos incurriendo en un error muy grave, porque ese dato no se corresponde con
la realidad. Para evitarlo (en la medida de lo posible) es necesario utilizar esos dos concep-
tos de los que hablábamos antes: intervalo de confianza y margen de error (que es la pro-
babilidad de cometer un error al escoger nuestra muestra). Veámoslo gráficamente:
88
Capítulo 5: Estadística inferencial o muestral. La muestra
89
Estadística básica para educadores
y un intervalo de confianza “razonables”, que nos evite, con cierta probabilidad, pensarnos
que estamos en un país de gigantes cuando en realidad las estaturas de la población tienen
valores mucho más comunes.
Así, el margen de error y el intervalo de confianza son dos medidas estadísticas que nos
permiten medir (con un cierto margen de probabilidad) tanto el error como la confianza de
los datos que tenemos en nuestra muestra dentro de ciertos intervalos. Como hemos apun-
tado, y eso lo veremos en otro capítulo más adelante, el tamaño de la muestra va a depen-
der claramente de estos dos números: cuanto menor sea el error que estamos dispuestos a
aceptar y menor queremos que sea nuestro intervalo de confianza, más encuestas vamos a
necesitar. En otras palabras, cuanto más queramos correr las líneas verticales hacia el centro
de la campana manteniendo la probabilidad (el nivel de confianza en los resultados), más
casos vamos a coger en medio. Y si los cogemos todos, el 100%, entonces la confianza es del
100% y el error es nulo.
La mayor parte de los libros destacan que la estadística inferencial se refiere a los méto-
dos de muestreo, la estimación de parámetros, el contraste de hipótesis y la comparación de
poblaciones. Estos son los elementos que forman parte de esta rama de la estadística. Habi-
tualmente, cuando usamos las estadísticas más allá de su capacidad como herramientas des-
criptoras, nos adentramos en un terreno donde la falta de información se convierte en pro-
tagonista. Ésta es la situación más habitual que nos podemos encontrar cuando hacemos
investigación.
Es muy difícil (y costoso, como hemos visto) recabar información de toda la población.
Por ese motivo recurrimos a las muestras. Pero, al hacerlo, renunciamos a tener información
de todos y cada uno de los individuos. Aun así, se espera que digamos cosas coherentes y
fiables sobre la población. Ese es el campo de la estadística inferencial y ahí es donde entra
el ámbito de la estimación de parámetros. Al no disponer de toda la información, no pode-
mos hablar con total certidumbre de cuál es la media aritmética de una población.
Sin embargo, sí que podemos inferir, a partir de una muestra y dadas unas condiciones
concretas, cuál podría ser la media de dicha población. Lo mismo ocurre para el resto de
medidas de tendencia central y de dispersión que hemos venido estudiando a lo largo de
este libro. La clave aquí, como vimos anteriormente, es que la distribución de las variables
y la muestra sean aleatorias, para impedir que el sesgo influya en nuestros datos y, por tan-
to, invalide la interpretación que hagamos de los mismos.
La aleatoriedad es lo único que nos permite poder afirmar con un cierto riesgo de equi-
vocarnos (que es perfectamente cuantificable) si lo que decimos es cierto o no. Tener cuidado
de que nuestros datos sean aleatorios es una de nuestras tareas más difíciles y arduas. Huff
(1993) afirma que es realmente complicado y que nunca podemos estar del todo seguros de
haberlo conseguido (¿cómo voy a saber que, si hago una encuesta a la salida del metro, en
Madrid, por ejemplo, de 9 h a 12 h, toda la población de Madrid va a quedar representada?
A lo mejor los estudiantes no salen en la muestra, porque están en el colegio a esas horas).
Por tanto, y desde el punto de vista crítico que tratamos de despertar con este libro, juz-
gar un estudio que ha usado métodos de estadística inferencial siempre tiene que estar enmar-
cado por la discreción de los resultados: las personas autoras del estudio nunca pueden pre-
90
Capítulo 5: Estadística inferencial o muestral. La muestra
tender ir “más allá” de lo que sus datos dicen. Eso quiere decir que hay que ser cauteloso y
circunscribir lo que ha salido de los cálculos a la población de la que extrajimos la muestra.
Afirmaciones del tipo “todos los españoles dicen...”, “los catalanes piensan...”, “los jóvenes
creen...”, son, en sí, cuestionables, porque sabemos que el equipo investigador no pudo
entrevistar a todos los españoles, catalanes o jóvenes censados en una determinada región
geográfica.
Por otro lado, otra de las tareas para las que sirve la estadística inferencial es para cuan-
do tenemos una idea y queremos ver si realmente es aplicable a la realidad. Nos explicamos.
Piénsese que suponemos que la población actúa según una determinada tendencia. Por ejem-
plo, pensamos que el tener acceso a una vivienda digna está relacionado con el nivel de estu-
dios. Eso es una hipótesis, que puede ser planteada como tal.
La estadística inferencial es una herramienta que nos permite construir modelos de hipó-
tesis, para después contrastarlos con lo que sucede en el mundo real. Mediante una serie de
técnicas, que más adelante veremos, podemos llegar a confirmar la hipótesis o rechazarla.
Igual que antes, la piedra angular sobre la que construimos nuestras interpretaciones es la
muestra. Si no está bien hecha (si tiene algún tipo de sesgo), cualquier conclusión es, por lo
menos, discutible. Por otro lado, también tenemos que tener en cuenta que siempre hay que
referirse a los límites que establece nuestra muestra. Traspasarlos es inducir a engaño.
Además, en nuestro trabajo a veces también nos interesa comparar dos poblaciones.
¿Qué ocurre en los resultados de matemáticas en los diferentes niveles educativos de dos
países concretos? PISA, por ejemplo, ilustra un caso donde se comparan los resultados de
pruebas de comprensión lectora, ciencias y matemáticas, a nivel mundial. Más tarde vere-
mos los casos específicos de la comparación tanto de proporciones como de medias. Aho-
ra bien, cada vez que comparemos, tenemos primero que preguntarnos si es posible hacer
esa comparación. ¿Son iguales las unidades de medida? Por ejemplo, si comparamos los
resultados en comprensión lectora de Estados Unidos y de España, por niveles educati-
vos, decir “educación primaria” ¿significa lo mismo en ambos países? ¿Las edades inclui-
das son las mismas? De nuevo la estadística inferencial es una gran herramienta, pero cuan-
do se aplica con sabiduría.
Por tanto, como vemos, la estadística inferencial presenta un gran potencial como herra-
mienta de análisis. En los próximos capítulos nos vamos a centrar en las cosas que se pue-
den hacer con ella. Sin embargo, también queremos dejar claro que los datos numéricos no
tienen sentido si se sacan de contexto, si se usan de manera incorrecta o malintencionada-
mente. Como dice Huff en la introducción de su libro, hablando de la estadística:
“The crooks already know these tricks; honest men must learn them in self-defense
(Los sinvergüenzas ya saben estos trucos, los trucos que usan los estadísticos; los hombres
honestos deben aprenderlos en defensa propia).” (Huff, 1993, p. 9).
91
Estadística básica para educadores
– Es un subconjunto de la población.
– Tiene un tamaño suficiente (depende de la precisión que se desee y del riesgo de error).
– La técnica de selección de la muestra (muestreo) es correcta para garantizar la alea-
toriedad de los datos recabados.
A veces (la mayor parte de las veces, para ser realistas) tenemos que trabajar con poblaciones
que son tan grandes que tomar la información de todos y cada uno de los miembros de dicha
población sería enormemente largo y costoso. Por ejemplo, imagínese que estamos tratando
de averiguar la tendencia de voto en unas elecciones (ejemplo paradigmático). ¿Cómo hacer
para conseguir entrevistar a todas y cada una de las personas registradas en el censo electoral,
para tener una información exacta? O, ¿qué hay del caso de testear todas y cada una de las
92
Capítulo 5: Estadística inferencial o muestral. La muestra
bombillas que salen de la cadena de producción de una fábrica de bombillas? ¿Tenemos que
medir las alturas de todas las niñas de 12 años del mundo para saber si la altura de nuestra hija
está en la media, o no? Como se ve, el problema de utilizar la estadística en la vida real es un
problema de tiempo y de dinero. Nunca habrá tiempo (ni dinero) suficiente como para ana-
lizar las notas de matemáticas conseguidas por todos y cada uno de los niños de 8 años esco-
larizados en todo el mundo. Por ese motivo, las personas que trabajamos con los datos nece-
sitamos una herramienta que nos sirva para vencer esta dificultad. Esta herramienta es la
muestra.
La estadística no es la única ciencia que se encuentra con ese problema. Si miramos, por
ejemplo, en la geografía, vemos que la utilidad de los mapas se basa precisamente en que no
son iguales a la realidad, sino una adecuada representación de la misma. Imaginemos que
viajamos por Río de Janeiro en coche guiados por algún mapa que fuera del mismo tama-
ño que la ciudad; indudablemente no cabría en el coche y no serviría de nada. Lo mismo
ocurre en otras ciencias. Toda muestra, mapa, esquema o concepto es una simplificación de
la realidad que, sin embargo, nos ayuda a conocerla. Por tanto, criticar un esquema o con-
cepto porque simplifica la realidad y no tiene en cuenta algunos matices es mostrar una atre-
vida ignorancia, porque todo esquema o concepto es una simplificación que puede, o no,
ser adecuada según ciertos criterios científicamente establecidos.
La muestra es un subconjunto de la población. Por ejemplo, en el caso de las bombi-
llas, si queremos saber cuál es la tasa de bombillas defectuosas que salen de la cadena de
montaje, entonces podemos tomar al azar una o dos bombillas cada 5 minutos, para exa-
minarlas. Las bombillas que hemos examinado son menos que las que han salido de la cade-
na de montaje. Por tanto, es una muestra de ellas. En el caso de los niños de 8 años que
están haciendo un examen de matemáticas, podemos establecer que tomaremos un sub-
conjunto de la población, repartido entre diversos países del mundo. De nuevo, en la mues-
tra hay menos individuos que en la población total.
Ahora bien, en estos dos ejemplos aparentemente inocentes, hay un elemento impor-
tante a destacar. En el caso de las bombillas, sabemos que el número total de bombillas que
salen de la cadena de montaje al día es de (pongamos por caso) un millón. En el caso de los
niños de 8 años que estudian matemáticas en el mundo, no tenemos ni idea de cuántos son
en total. El tamaño de la población es un dato importante, igual que si se trata de una pobla-
ción cuyo tamaño es conocido, o no. En cada uno de los casos, tendremos que tenerlo muy
en cuenta a la hora de establecer el tamaño de nuestra muestra. De la misma manera, cuan-
93
Estadística básica para educadores
do veamos un dato, una de las primeras cosas a preguntarse siempre es ¿de dónde viene dicho
dato? ¿A qué población se refiere? Y, teniendo en cuenta eso, ¿cómo está construido dicho
dato? Vamos a verlo.
Si usar muestras que sean representativas resulta tan costoso, entonces, ¿por qué tenemos
que gastar el dinero para elaborar una muestra que sea fiable? ¿Qué cosa aporta una mues-
tra bien hecha que no se pueda eludir o encontrar por otra vía? Veamos un ejemplo didác-
tico. Tome una bolsa y ponga en ella 1.000 alubias de color negro, 500 de color rojo y 750
de color blanco. Mézclelas bien. Ahora, diríjase a una persona que no sepa cuál es el núme-
ro de alubias de cada color que usted puso en la bolsa. Dígale que en total hay 2.250 y que
sacando un puñado de ellas tiene que averiguar cuántas hay de cada color.
Una tarea bastante complicada, ciertamente. Para saber exactamente cuántas alubias hay
de cada color tenemos que contarlas una a una, ¿o no? Dígale ahora a esa persona que anote
el resultado que le ha salido al coger el primer puñado de alubias, que las retorne a la bolsa,
mezcle de nuevo y que vuelva a coger otro puñado. De nuevo que apunte cuántas de cada
color le han salido. Si hace esa operación, digamos, diez veces, los promedios de alubias rojas,
negras y blancas se acercarán bastante a la proporción real de la distribución por colores de la
bolsa de alubias. Sabiendo que el total son 2.250, con una multiplicación y una división pode-
mos estar bastante seguros de haber acertado el número exacto de alubias de cada color. Nóte-
se que para ello no hemos tenido que contar una a una, las 2.250 alubias de la bolsa. Basta con
tomar un número razonable de muestras (o una lo suficientemente grande) para poder infe-
rir con bastante acierto la distribución de una cierta variable en el total de la población.
La muestra tiene ese valor: es un “atajo” que nos permite conocer el comportamiento
de la población en general. Ahora bien, este “atajo” tiene que estar bien construido. La mues-
tra está sujeta a muchos peligros que pueden invalidar las conclusiones a las que lleguemos
de los cálculos estadísticos que hagamos sobre ella.
Una buena muestra tiene que ser aleatoria. Huff (1993) cita ejemplos históricos en los
que eso no fue así, de manera que se llegó a conclusiones erróneas, que luego se desmintie-
ron por los hechos. Por otro lado, también tenemos que tener en cuenta que existen muchí-
simos más elementos que pueden invalidar los resultados que salgan de la muestra. Si tra-
bajamos con alubias, o cualquier otra entidad física, seguramente no estaremos sujetos al
sesgo que pueda producir una respuesta tendenciosa. Pero al trabajar con seres humanos,
los estudios de ciencias sociales y de la educación tienen que tener en cuenta también que
a lo mejor las personas a las que entrevistamos dicen aquello que queremos oír; o que las
personas que hacen la encuesta, por alguna razón, solo escogen la muestra sobre un seg-
mento de la población y no toda (por ejemplo, si se hace la encuesta telefónica, solo se pre-
gunta a aquellas familias que tienen teléfono; si se hace la encuesta a todas las personas que
pasan por la calle, de 10 a 14, seguramente no entrarán en la muestra la mayor parte de tra-
bajadores, que a esa hora están en la oficina, etc.).
94
Capítulo 5: Estadística inferencial o muestral. La muestra
Decidir qué muestra tenemos que tomar para estudiar un determinado fenómeno no es cosa
fácil. ¿Cuántas encuestas tenemos que hacer para averiguar si existe relación (o no) entre el
nivel de estudios y la posición socioeconómica que se ha alcanzado entre los cuarenta y los
cincuenta años de edad? ¿A cuántas personas tendremos que preguntar para saber si la nota
que sacaron en matemáticas al final de la enseñanza secundaria obligatoria tuvo alguna rela-
ción con la carrera universitaria que han cursado? ¿A partir de qué momento el valor que
arroja un estadístico como la media aritmética es (o no) representativo? El tamaño de la
muestra tiene mucho que ver con todas estas preguntas.
Este es, quizás, uno de los conocimientos básicos más importantes para todas las per-
sonas que nos dedicamos a las ciencias sociales y de la educación. Saber calcular el tamaño
de la muestra es un conocimiento que siempre hay que tener en mente. Todas las estadísti-
cas que se utilicen en un estudio van a estar condicionadas por el tamaño de la muestra.
Como hemos visto, el tamaño de la muestra nos permite acercarnos más o menos a la
población total. Si la muestra es igual en número que la población, entonces ya conocemos
exactamente la distribución de las características de esa población (ya no hablamos de mues-
tra, hablamos de población). Pero cuando reducimos el tamaño (porque no tenemos recur-
sos suficientes para preguntar a todo el mundo), entonces estamos reduciendo nuestra infor-
mación para conocer exactamente la distribución real de las características de la población.
Ahí ya dependemos de la probabilidad de haber acertado con nuestra muestra, o no.
95
Estadística básica para educadores
zα 2
⋅ p⋅q
n= 2
e2
96
Capítulo 5: Estadística inferencial o muestral. La muestra
n = tamaño de la muestra
2
zα = el valor tipificado en la curva de Gauss para un cierto nivel de confianza (si a
2
es 0,05, z ± 1,96; si a es 0,01, z ± 2,58)
p = proporción de los individuos que tienen la característica que tenemos, por ejem-
plo, que han sacado “buenos resultados” en una prueba
q = proporción de los individuos que no tienen la característica que tenemos, por
ejemplo, que no han sacado “buenos resultados” en una prueba (q = 1 – p)
e2 = nivel de precisión al cuadrado (es decir, el intervalo de confianza que asumimos,
en % respecto a la p estimada. A más e, menos precisión)
(*) Para usar esta fórmula se supone que la población es infinita, es decir, que es mayor
a cien mil personas (Sierra Bravo, 1992).
Nzα 2 pq
n= 2
e 2 ⋅ ( N − 1) + zα 2
⋅ p⋅q
2
En la práctica esta segunda fórmula es la que menos se aplica, porque implica no solo
que el tamaño de la población sea finito, sino también que sepamos su magnitud exacta.
Tal y como dice Sierra Bravo (1992), tanto el tamaño de la muestra, como su cálculo,
depende de cuatro factores:
¿Qué quiere decir todo esto? Veamos. Decir que para determinar el tamaño de la mues-
tra tenemos que considerar la amplitud de la población, significa que no es lo mismo tomar
una muestra de cien personas sobre una población de 101 personas, que sobre una pobla-
ción de diez mil personas. Las cosas que podamos decir en uno u otro caso tendrán una fia-
bilidad muy diferente, como se puede adivinar. Si decimos que la media de altura de las per-
sonas de una población de 101 individuos, de los que hemos tomado una muestra de 100,
es de 1,83 cm, seguramente nos estamos acercando mucho a la verdad.
En cambio, si la población son diez mil personas y tomamos una muestra de 100, de la
que inferimos que la altura media es de 1,83 cm, entonces la probabilidad de haber acerta-
97
Estadística básica para educadores
do con la altura media real salta a la vista que es mucho menor. Por tanto, la amplitud de la
población importa. Por otro lado, puede ser que conozcamos el número total de toda la
población, o no. Si no lo conocemos, es preciso tener algún tipo de referente, para decidir
si su tamaño (el de la población) afecta significativamente a nuestros cálculos del tamaño
de la muestra o no.
Es decir, que, cuando la población es muy grande, aumentar un poco la muestra no nos
da mucha más fiabilidad que si no lo hiciéramos. Hay un “valor crítico” de población a par-
tir del cual, por más que aumentemos la muestra, no vamos a obtener mejores resultados (o
por lo menos, no sustancialmente). La experiencia nos dice que ese “valor crítico” es cien
mil unidades. Por debajo de esa cantidad, la población se considera “finita”. Por encima, se
la considera “infinita”. Como dice Sierra Bravo (1992) “el hecho de que se estime el uni-
verso [población] como infinito supone que su amplitud no influye para nada en la fórmula
a aplicar, al contrario de lo que ocurre en los finitos” (Sierra Bravo, 1992, p. 209).
Por lo que respecta al nivel de confianza, formalmente y como hemos apuntado previa-
mente en la explicación relativa al intervalo de confianza, se trata de la proporción total de las
medias muestrales que forman parte del área que existe por debajo de una distribución nor-
mal o de Gauss de la población. Veamos, se supone que si tenemos a todas las personas de una
población y las podemos ordenar encima de un eje de coordenadas, podemos organizarlas de
manera que podemos dejar a la izquierda del eje la mitad de la población y a la derecha la otra
mitad. Esa “mitad” será la mediana de la población (el valor que deja el 50% de la distribu-
ción a ambos lados). Ahí también encontraremos la media. Si tomamos una muestra, y situa-
mos su media sobre el mismo eje, puede ser que por suerte (por azar) coincida con la media
de la población, o que no. Si tomamos varias muestras y hacemos lo mismo, sus respectivas
medias tenderán lógicamente a aproximarse a la media de la población. Si tomamos muchas
muestras, tenderán a concentrarse hacia el medio donde está la media de la población, más
que hacia los extremos (que serían los casos de escoger una muestra muy poco representativa).
Al dibujarlo, podemos adivinar que el comportamiento da como resultado una curva de Gauss.
98
Capítulo 5: Estadística inferencial o muestral. La muestra
El nivel de confianza es el intervalo que tomamos para hacer nuestros cálculos. Puede
ser que lo establezcamos dejando “fuera” el 10% de los casos (nivel de confianza del 90%).
Podemos decidir dejarlo a “una cola” o a “dos colas”. Eso quiere decir que podemos “hacer
la raya” bien poniendo el 10% a la derecha o a la izquierda, o bien 5% a ambos lados (por-
que 5 y 5 hacen 10%).
En cualquier caso, la experiencia empírica acumulada de múltiples investigaciones cuan-
titativas previas aconseja que el nivel de confianza oscile entre el 95% y el 99%. Asumir un
error mayor del 5% (nivel de confianza menor del 95%) se considera poco fiable.
Finalmente, otro de los elementos que Sierra Bravo (1992) nos dice que tenemos que
tener en cuenta para calcular el tamaño de la muestra es la desviación típica. Es decir, la
muestra que escojamos ¿cuán cerca se va a encontrar de la población a la que pertenece o
cuánto se va a desviar de ella? Dice Sierra Bravo (1992) que:
“Respecto de la desviación típica hay que distinguir las muestras referentes a variables
cuantitativas con escalas de intervalo o de razón, de las que se refieren a variables cualitativas
con escala nominal u ordinal, de las que son tipo las variables dicotómicas, con una escala
que tienen solo dos categorías la afirmativa y la negativa” (Sierra Bravo, 1992, p. 211).
Teniendo en cuenta eso y sabiendo que podemos “cuantificar” las variables dicotómicas
utilizando el álgebra de Boole (asignando un valor binario de 0 y 1 según sean negativas o posi-
tivas, respectivamente), lo que puede ocurrir es que sepamos cuál es la desviación típica de la
población o (lo que es más habitual) que no la sepamos. En el caso de no saberla, entonces se
asume el caso más extremo (más desfavorable) que es que tanto la probabilidad de acertar,
como de equivocarse, esté al 50% (0,5 y 1 – 0,5). La idea es que la desviación más grande que
puede haber en una proporción es que la mitad de las veces pase una cosa y la otra mitad pase
la otra, de forma que no haya una “mayoría” para ninguno de los dos valores posibles. Este es
el caso para el que corresponde el mayor tamaño de la muestra posible, según el nivel de con-
fianza asumido. En otras palabras, si conocemos la desviación típica de nuestra población, no
necesitaremos tantos casos en la muestra para acertar “al blanco”.
El error que podemos (vamos a) cometer al seleccionar la muestra al utilizar intervalos
depende de lo grande que sea el intervalo que hemos tomado. Como hemos visto, cuanto
mayor sea el intervalo de donde seleccionamos la muestra, menos error vamos a cometer (y,
por tanto, nuestra muestra va a ser más precisa). Para eso también hay otra fórmula que es
necesario recordar o deducir de la anterior:
p⋅q
e = zα 2
⋅
2 n
99
Estadística básica para educadores
Para que una muestra sea representativa debe tener, como hemos visto, un tamaño mínimo
suficiente. Pero eso no basta. Pongamos que nos interesa hacer un sondeo sobre la inten-
ción de voto para las próximas elecciones y que una muestra de 4.000 sujetos es suficiente.
Si elegimos para la muestra a todos de un barrio rico de la capital o a todos de un barrio
pobre o a todos de una población rural, podemos imaginar que los resultados en cada uno
de los tres casos pueden ser muy diferentes. Esto quiere decir que, además de que la mues-
tra ha de tener un tamaño suficiente, se requiere otra condición: que la forma de extraer la
muestra o, dicho de otro modo, la técnica de muestreo sea adecuada. Existen múltiples téc-
nicas de muestreo. Aquí trataremos algunas de las más conocidas.
Para que una muestra esté bien escogida tiene que ser una muestra aleatoria, porque, si no,
lo que estaríamos haciendo es sesgar nuestros datos. Por ejemplo, si queremos conocer los
resultados en comprensión lectora de los estudiantes de ciclo medio de primaria, en Espa-
ña, no podemos tomar una muestra de entre los 20 mejores colegios del Estado. Tenemos
que poner a todos los estudiantes de tercero y cuarto de primaria en el “bombo”, de mane-
ra que todos tengan la misma probabilidad de ser elegidos para formar parte de la muestra.
En caso contrario, cualquier resultado que obtengamos estará sesgado. Sería como si qui-
siéramos averiguar la estatura media de los chicos de veinte años de una ciudad y nos fué-
ramos a tomar una muestra a la peña de básquet local. Es evidente que, cuando calculáse-
mos la altura media, seguramente rondaría los 2 metros de altura. ¿Es un dato representativo?
En educación estas cosas ocurren. A veces, por falta de presupuesto, por una mala prácti-
ca o simplemente por desconocimiento, lo cierto es que se nos presentan estudios con aires de
cientificidad, pero que no están avalados por un proceso correcto de toma de datos. Por eso,
antes de creernos un dato, primero nos tenemos que preguntar sobre qué muestra se ha dicho.
El muestreo aleatorio simple lo aplicamos cuando aseguramos que todos los elementos de
la población que estamos estudiando cumplen con este requisito básico: que tengan la mis-
ma probabilidad (equiprobabilidad) de ser escogidos para formar parte de la muestra.
100
Capítulo 5: Estadística inferencial o muestral. La muestra
¿Cómo se realiza? Se hace una tabla que recoja todos los elementos de la población.
Entonces, se asigna a cada elemento un número. La mejor manera de hacerlo sería tener un
bombo con todos los individuos de la población. Si queremos una muestra de un número
determinado de casos, giramos el bombo y sacamos tantas bolas como casos queramos tener
en nuestra muestra. Como no es muy habitual tener un bombo en casa, podemos usar otras
tecnologías para hacer el mismo papel.
Actualmente las calculadoras científicas, o programas de ordenador como el EXCEL,
tienen teclas o fórmulas para calcular números aleatorios. En realidad son pseudoaleatorios
(porque están generados por un algoritmo), pero por lo general se pueden considerar correc-
tos para el caso que nos ocupa.
Si apretamos en el botón que genera estos números, nos van saliendo valores que en
principio cumplen con la condición matemática para que sean aleatorios. Lo único que tene-
mos que hacer es volver a la distribución de la población original y ver qué número de la
población corresponde al que nos ha salido en la calculadora (o en el EXCEL). Elegimos
para nuestra muestra esos números y ya tenemos una muestra aleatoria. Por ejemplo, ima-
gínese que tenemos una población que son los jóvenes de primero de bachillerato de nues-
tro municipio. En total son 3.443 estudiantes. Queremos tomar una muestra aleatoria de
364 casos. ¿Cómo lo hacemos? Podemos hacer una tabla con los 3.443 estudiantes (el cen-
so escolar, por ejemplo). Los ordenamos numéricamente, del 1 al 3.443. Entonces, toma-
mos el EXCEL y le pedimos que nos dé 364 números aleatorios del 1 al 3.443. Los indivi-
duos a quienes corresponden estos números compondrán nuestra muestra aleatoria.
El muestreo aleatorio simple puede ser con reemplazo (muestreo no exhaustivo) o sin
reemplazo (muestreo exhaustivo). ¿Qué quiere decir esto? Pues que podemos escoger “bolas”
del “bombo” y no devolverlas al bombo, o podemos coger una bola, mirarla, apuntar el
número que ha salido y devolverla al bombo, antes de seguir seleccionando bolas. Por ejem-
plo, es muy diferente seleccionar una muestra de 10 casos, entre una población de 100 per-
sonas, utilizando el reemplazo, que no usándolo.
Si reemplazamos, eso quiere decir que cada vez que cojamos una bola, dentro del bom-
bo habrá 100 bolas (o sea, que la probabilidad es de 1 bola sobre 100). Cuando miramos el
número, devolvemos la bola al bombo, con lo cual vuelve a haber 100 bolas.
Si no reemplazamos, cada vez que cogemos una bola queda una menos en el bombo. La
primera bola tiene una probabilidad de 1 sobre 100. La segunda, ya es de 1 sobre 99 (porque
ahora quedan 99 bolas en el bombo). La tercera, de 1 sobre 98. Y así sucesivamente. Por tan-
to, el muestreo es aleatorio, pero cada vez que seleccionamos un caso, eso condiciona a los que
quedan en el resto de la población, porque el resto tiene una probabilidad diferente de salir.
B) El muestreo sistemático
El muestreo sistemático se usa cuando los individuos de la población que estamos estudiando
están ordenados. Igual que los métodos precedentes, el muestreo sistemático supone que
hay un componente de aleatoriedad en la selección de los casos.
101
Estadística básica para educadores
Para hacer una selección de la muestra aplicando el método del muestreo sistemático,
primero tenemos que calcular las particiones, para coger los casos de manera sistemática.
Cuando los elementos de la población que están más cercanos tienden a ser más parecidos
entre sí, entonces el muestreo sistemático es más preciso que el aleatorio, porque cubre más
homogéneamente toda la población (Peña, 1986).
Por ejemplo, supongamos que vamos al departamento de educación para pedir un listado
con todos los estudiantes de secundaria de Cataluña. Tras explicar los motivos de nuestra
demanda, nos dan dado el listado con todos los estudiantes que hay matriculados.
Al calcular de qué tamaño necesitamos nuestra muestra, vemos que necesitamos una mues-
tra de 384 casos. El total de los estudiantes de secundaria de Cataluña, según el departamento
de educación, es de 11.534 estudiantes. Tenemos que coger este número y dividirlo entre
384 (que es nuestra n). El resultado es 30,0364. Redondeamos el resultado: 30 estudiantes.
Eso quiere decir que tenemos 384 grupos de 30 estudiantes. El total (aproximadamente) es
de 11.534. Ahora, del primer intervalo, tomamos un número al azar (lo podemos hacer con
la tecla RAN de la calculadora). Sale 11. El primer número de nuestra muestra será 11. Los
números siguientes se calculan de la siguiente manera:
11
11 + (30 · 1) = 41
11 + (30 · 2) = 71
11 + (30 · 3) = 101
11 + (30 · 4) = 131 (…)
11 + (30 · 383) =11.501
C) El muestreo estratificado
El muestreo aleatorio simple se utiliza cuando tenemos poblaciones que son homogéneas.
Sin embargo, en el caso de las ciencias sociales y educativas, esas situaciones son poco habi-
tuales. Lo normal es que tengamos poblaciones con mucha diversidad. En ese caso, pode-
mos aplicar el muestreo estratificado. Se trata de una técnica que consiste en organizar los
individuos de la población por clases o estratos, según la población. Dentro de cada estra-
to se toma la muestra, utilizando entonces el muestreo aleatorio simple.
La idea, por tanto, es dividir la población según clases o estratos. En cada una de ellas
escogeremos una submuestra. El total de las submuestras constituirán la muestra total. ¿Cómo
se puede hacer esto? Existen varias formas.
102
Capítulo 5: Estadística inferencial o muestral. La muestra
Cuadro 5.2.
Primero 30%
Segundo 16%
Tercero 19%
Cuarto 15%
Quinto 9%
Sexto 11%
– Por tanto, si queremos tomar una muestra de 100 estudiantes y seguimos este méto-
do de muestreo (estratificación estratificada por asignación proporcional), entonces
tomaremos 30 estudiantes de primero, 16 de segundo, 19 de tercero, 15 de cuarto,
9 de quinto y 11 de sexto.
– Asignación (afijación) óptima: en este caso necesitamos conocer tanto la proporción que
tienen los estratos en la distribución de la población como sus desviaciones. Es menos
habitual que el método anterior, porque normalmente no tenemos información sobre
cómo están distribuidas las desviaciones. Por ejemplo, considérense estos datos:
Cuadro 5.3.
103
Estadística básica para educadores
De nuevo queremos tomar una muestra de 100 estudiantes. ¿Cómo deben estar repar-
tidos entre los diferentes cursos? Siguiendo el método de asignación óptima, haremos:
Cuadro 5.4.
Curso Muestra
Total 100
La muestra es una herramienta para ahorrar dinero y poder hacer afirmaciones científicas
sobre una población. A veces, como hemos dicho ya, la población es tan grande que pensar
ni siquiera en hacer un breve cuestionario a toda la población es una quimera. La muestra
nos permite poder hacerlo. Sin embargo, a veces la población está distribuida de manera tan
heterogénea, que incluso una muestra escogida tal y como hemos explicado hasta ahora pue-
de no dar demasiada luz al asunto. Puede dar la casualidad que tomemos datos justo de un
sector de la población y, a pesar de nuestros esfuerzos para que sea una muestra representa-
tiva (teniendo en cuenta que esté estratificada, que sea aleatoria, etc.), puede no servirnos
de nada. El muestreo polietápico o por conglomerados es una solución a este problema.
Imagínese que queremos hacer una encuesta a estudiantes de primaria en Tarragona.
Sabemos que no es lo mismo que hagamos la encuesta en una escuela pública que privada.
También sabemos que el barrio es relevante, porque hay barrios donde se concentra más la
104
Capítulo 5: Estadística inferencial o muestral. La muestra
inmigración y otros donde no. Lo que podemos hacer es crear conglomerados: primero selec-
cionamos escuelas, dentro de barrios, usando el muestreo aleatorio simple. Luego, dentro
de esos barrios, escogemos escuelas públicas y luego escuelas privadas (también por mues-
treo aleatorio simple). Incluso podemos decidir que el curso es relevante y hacer estratos por
cursos, para luego, dentro de cada estrato, seleccionar un conglomerado de escuelas según
sean de tal o cual barrio y según sean públicas o privadas. El resto del proceso es igual que
lo que hemos estado explicando hasta ahora.
La muestra también puede ser seleccionada de manera no aleatoria. Aquí el criterio es otro:
la significatividad. El muestreo no aleatorio es un muestreo en el que los casos se seleccio-
nan porque hay una intencionalidad detrás. En el caso de hacer un estudio sobre una pobla-
ción de la que ya se tiene un gran conocimiento previo, igual ya se sabe quiénes son las per-
sonas que más información nos pueden ofrecer, sea por su conocimiento del tema que estamos
trabajando, por su experiencia o por cualquier otra razón.
Por ejemplo, imagínese que estamos haciendo un estudio del impacto de los programas
extraescolares en mi barrio. Se van a montar dos aulas, una de informática y otra de inglés.
Además, el equipo del polideportivo del barrio va a montar cursos de atletismo y gimnasia.
Como es mi barrio, conozco a las personas que están organizando todas estas actividades y,
por tanto, sé que, si voy a verlas para entrevistarlas, en principio me van a dar una infor-
mación más interesante que si hago una encuesta telefónica a los hogares del barrio.
En este caso la muestra no aleatoria es más indicada, porque nos da acceso a las personas
que están llevando a cabo la experiencia de actividades extraescolares. Quizás sea más indica-
do aplicar una metodología más exhaustiva que un cuestionario (se pueden hacer entrevistas,
observaciones, relatos, grupos de discusión, etc.). También podemos decidir que es mejor hacer
una encuesta a las primeras cuarenta personas del barrio que nos encontremos por la calle. En
cualquier caso, tendremos que escoger una muestra. Igual que en el caso del muestreo aleato-
rio, también hay diferentes maneras de seleccionar una muestra no aleatoria.
Tiene una cierta relación con el muestreo estratificado. Consiste en establecer una serie de
cuotas entre individuos que tienen una serie de características en común. Guarda relación
con el método de muestreo estatificado porque, conociendo la distribución de la población,
podemos decidir el número de personas en cada cuota de manera proporcional al peso que
tienen sobre la población total.
En el caso del muestreo por cuotas, la decisión de a quién se le hace la entrevista (o la
encuesta, etc.) es arbitraria. Una manera de proceder muy habitual es seleccionar a las pri-
meras n personas con las que nos cruzamos por la calle. Al seleccionar a cualquier persona
105
Estadística básica para educadores
que en ese momento esté caminando por la calle, puede parecer aleatorio. Pero no es así,
porque las personas que ya no estén caminando por esa zona de la calle no tienen posibili-
dad de participar en el estudio. En ese sentido, esta técnica de muestreo no es aleatoria.
En este caso las personas que hacen la investigación deciden incluir en la muestra a una serie
de individuos que consideran necesarios para que la muestra sea representativa. Por tanto,
la muestra depende del criterio del equipo de investigación. No es en ningún caso aleato-
ria. Un ejemplo clásico serían las encuestas de opinión en las que se incluye (o van dirigi-
das) a un determinado sector de la población, según el criterio de las personas que hacen el
estudio. Por ejemplo, en el caso de una encuesta de opinión sobre videojuegos, el equipo de
investigación puede decidir hacer un estudio en el que por un lado tengan en cuenta a las
familias, pero por el otro a niños de una determinada edad y de unos barrios concretos.
En este caso la muestra comienza con una serie de individuos a los que se les hace la encues-
ta. Estas personas llevan (a los investigadores) a otras y esas otras a otras más y así sucesiva-
mente, hasta completar el número total de encuestas que se había decidido hacer. Por supues-
to, no se trata de un muestreo aleatorio. Hay una intencionalidad clara en las decisiones. El
106
Capítulo 5: Estadística inferencial o muestral. La muestra
rasgo importante es que la muestra al final la decide la propia población; el equipo de inves-
tigación lo único que hace es seguir las indicaciones de las personas que va entrevistando a lo
largo del estudio. Este tipo de muestreo es muy indicado cuando no se conoce bien la reali-
dad que se está estudiando, ni, por lo tanto, quiénes pueden ser los mejores informantes.
Cuando utilizamos una técnica aleatoria el error que cometemos (llamado error muestral)
es también aleatorio, es decir, debido a la influencia del azar en el muestreo. Si conocemos
la ley de probabilidad que sigue, podemos calcular y controlar la incidencia de dicho error.
Por el contrario, cuando utilizamos una técnica no aleatoria el error es de sesgo. El pro-
blema del error de sesgo no es que sea grande o pequeño, sino que es desconocido y, por lo
tanto, no lo podemos cuantificar.
Es por ello por lo que, en principio, es recomendable utilizar técnicas aleatorias de mues-
treo. Sin embargo hay casos en los que existe mucha experiencia empírica y, si en función
de dicha experiencia, sabemos que un tipo de muestreo no aleatorio da buenos resultados
(por ejemplo en estudios de mercado), lo podemos utilizar.
Si en un estudio o investigación no se ha hecho un muestreo aleatorio (como sucede en
demasiadas ocasiones) todo el aparato de pruebas estadísticas basadas en leyes de probabilidad
no tiene mucho sentido. Ello no quiere decir que las conclusiones a las que se llega sean nece-
sariamente erróneas, ni mucho menos. Pero sí que hay que aceptarlas con precaución y cau-
tela y no como verdades demostradas y dogmas de fe, como con frecuencia se hace.
107
Estadística básica para educadores
La selección de la muestra es un tema que muchas veces ya viene determinada por el tipo
de estudio que queremos realizar. Aspectos tales como el tamaño de la muestra, o la aleato-
riedad, no dependen de la persona que investiga, sino que siguen una serie de criterios esta-
dísticos y probabilísticos para asegurar que la muestra que seleccionemos sea la mejor mues-
tra posible. No obstante, lo mejor no es lograr la mayor representatividad de la muestra a
cualquier precio, sino que tiene que tener en cuenta los recursos empleados. Por ejemplo,
si un ayuntamiento decide destinar x euros a la superación de la pobreza y, como uno de los
elementos del diagnóstico previo, se decide hacer una encuesta, lograríamos más represen-
tatividad de la muestra, pero sería totalmente inadecuado emplear todo el presupuesto en
esa encuesta. La orientación comunicativa, que tiene cada vez más importancia en la inves-
tigación internacional y es exigida por un número creciente de organizaciones, plantea que
esas decisiones tienen que tomarse previo diálogo entre todas las personas implicadas. Las
personas investigadoras tienen que explicar clara y verazmente los pros y contras de cada
opción de muestra y los sujetos implicados tienen que poder dar sus valoraciones.
En ocasiones, debido a nuestro conocimiento sobre el tema, o que sabemos de perso-
nas que conocen lo que queremos estudiar, es aconsejable decidir hacer una muestra signi-
ficativa, antes que representativa. Esa experiencia previa sirve para suplir los “errores” que
puedan derivarse de escoger una muestra que no sea representativa de la población, porque
lo que “perdemos” en representatividad lo “ganamos” en el conocimiento que ya tenemos
de la población.
El criterio de significatividad es indicado cuando ya existe un gran número de estudios
previos que presentan datos fiables sobre una determinada población y de lo que se trata es
de estudiar a fondo (más allá de la mera descripción) los motivos que subyacen al tema obje-
to de estudio. Si decidimos que nuestra muestra no sea representativa, ni queremos tomar-
la al azar (porque ya sabemos de qué va el tema y, por tanto, queremos incluir en la mues-
tra a aquellas personas que sabemos previamente que van a aportarnos más información),
entonces el criterio de las personas que investigan tiene que estar presente a la hora de esco-
ger la muestra.
Desde una orientación comunicativa crítica no solo son las personas que forman parte
del equipo investigador quienes deciden quién tiene que estar en la muestra. También son
las personas objeto de investigación quienes participan en la selección de la muestra, por-
que ¿quiénes mejor que ellos (conocedores directos de la realidad que estamos estudiando)
para participar en la decisión de a quién es significativo encuestar y a quién no? En este sen-
tido, la decisión de las cuotas (muestreo por cuotas) o dónde hacer la encuesta y cómo (si
mejor por teléfono, si mejor en la sinagoga, si en el mercado) o a qué personas ir a llamar
primero, para que sean ellas las que nos redirijan a otros informantes, es algo que se hace
conjuntamente entre todas las personas implicadas en la investigación. Las decisiones siem-
pre están regidas por pretensiones de validez, nunca por la posición de poder que ocupe en
ese determinado momento alguna de las personas implicadas en la investigación. De hecho,
el poner en el centro los argumentos basados en esta serie de principios es una forma de evi-
108
Capítulo 5: Estadística inferencial o muestral. La muestra
tar el sesgo que pueda derivarse de una posición partidista o tendenciosa de una persona (o
grupo de personas) que piensen que “saben” mucho, pero que justifiquen ese conocimien-
to por la posición que ocupan, no por el conocimiento en sí.
Para la reflexión…
• ¿En qué se diferencia la muestra de la población? ¿Qué sentido tiene trabajar con la
muestra?
• Si asumimos un error del 0,7 y queremos hacer un estudio sobre los posibles votos de
un partido político, ¿qué tamaño deberá tener la muestra para garantizar este margen
de error (a = 0,05)?
• Describe las diferentes técnicas de muestreo aleatorias y no aleatorias.
• ¿Qué aportaciones ofrece la orientación comunicativa en las técnicas de muestreo?
109
6
Estadística inferencial.
Conceptos básicos
Cuando estábamos trabajando con la estadística descriptiva, vimos que un conjunto de datos
pueden ser descritos mediante las medidas de tendencia central, las de dispersión y final-
mente las de posición. Este tipo de medidas se puede aplicar tanto a la muestra como a la
población. Si hablamos de la muestra, por lo general tenemos todos los datos que hemos
recabado y salvo errores debidos a alguna codificación que no sea correcta, podemos saber
con todo grado de precisión los valores tanto de la media aritmética, como de la varianza y
desviación típica. Ahora bien, conocer exactamente estos valores en el caso de la población
es mucho más difícil, porque habitualmente no tenemos información de toda la población.
En ese caso, los datos de la muestra nos tienen que servir para averiguar la distribución de
los valores de tendencia central y de dispersión en el conjunto de la población.
Pongamos que tenemos una variable x. Podemos estudiar esta variable en la población
en la que tenemos un determinado tamaño (N) y en la que podemos calcular unos deter-
minados índices, que genéricamente reciben el nombre de parámetros: media (m), varianza
(s2), desviación típica (s) o, si la variable fuese cualitativa con dos categorías, los valores de
p y q. Incluso podemos interesarnos por el tipo de distribución que sigue esta variable (pon-
gamos que la normal). Todo este estudio se refiere a la distribución de la variable x en la
población.
También podríamos extraer de esta población un número indefinido de muestras al azar
de un determinado tamaño (n) y calcular en cada muestra los mismos índices que había-
mos calculado en la población: media (x–), varianza (S2), desviación típica (S), proporciones
observadas (p0, q0).
Estos índices obtenidos en las muestras reciben el nombre genérico de estadísticos. Esta-
ríamos haciendo el estudio de la distribución de la variable x en la muestra. Otra cosa
importante sería si nos interesase estudiar la distribución de un determinado estadístico en
111
Estadística básica para educadores
las muestras extraídas al azar de la población. En este caso lo que nos interesa no son los
valores de la variable x, sino los del estadístico en cuestión, de su distribución. Esto es lo que
se llama distribución muestral de dicho estadístico.
N
µ
2
p
q
µ X
DISTRIBUCIÓN DE X
EN LAS MUESTRAS: n1 n2 n3 n4 n5 ni
(DISTRIBUCIÓN EN UNA O X1 X2 X3 X4 X5 Xi
VARIAS MUESTRAS) S21 S22 S 23 S24 S 25 S2i
S1 S2 S3 S4 S5 Si
po1 po2 po3 po4 po5 poi
qo1 qo2 qo3 qo4 qo5 qoi E
R
R
O
R
DISTRIBUCIÓN MUESTRAL T
Í
P
DE ESTADÍSTICOS : I
C
O
Pongamos que la variable sea cuantitativa y nos interesa estudiar las medias observadas
en muestras extraídas al azar de la población. Estaríamos ante la distribución muestral de
medias de la que podemos calcular la media (sería la media de las medias observadas, cuyo
σ
valor es x–x– = m) y la desviación típica (de las medias observadas, cuyo valor es σ x = ).
n
112
Capítulo 6: Estadística inferencial. Conceptos básicos
A esta desviación típica del estadístico se la llama error típico (en este caso error típico de
la media).
Si la variable fuese cualitativa con dos categorías que tengan proporciones p y q, podría-
mos estudiar la distribución muestral de proporciones que tendría también una media
(x–xpo = p) y una distribución típica (en este caso sería el error típico de proporciones cuyo
pq
valor es σ po = ).
n
De modo similar se podrían estudiar las distribuciones muestrales de otros estadísticos
(varianza, etc.), igual que hablamos de errores típicos de la media y de las proporciones, tam-
bién podemos hablar de errores típicos de otros tipos de distribuciones muestrales, tales
como la mediana, los cuartiles, la desviación semiintercuartil, los deciles, etc. (Visauta y
Batallé, 1986).
La tendencia que tienen los estadísticos obtenidos en las muestras a agruparse en torno al
valor del parámetro y la forma de su distribución se explica con el teorema del límite cen-
tral. La primera versión de este teorema fue propuesta por De Moivre en su libro The doc-
trine of chances, de 1733 (De Moivre, 1967). Sin embargo, la generalización de este teore-
ma se la debemos tanto a Laplace como a Gauss. El teorema del límite central (para cuya
comprensión se precisa saber matemáticas superiores) demuestra que:
113
Estadística básica para educadores
azar disminuye a medida que aumenta n eso hace que los estadísticos también estén
más agrupados alrededor del parámetro.
c) Si las muestras son grandes (aproximadamente alrededor de 30 o más) la distribu-
ción muestral tiende a ser simétrica, en forma de campana..., es decir, a seguir una
distribución normal. También ocurre, aunque la muestra sea pequeña, siempre y
cuando la variable siga una ley normal en la población origen. Pero no siempre ocu-
rre así; la distribución muestral puede seguir otras leyes de probabilidad, tales como
la t de Student-Fisher, la c2 de Pearson o la F de Snedecor.
d) Se pueden considerar distribuciones muestrales no solo de estadísticos sino también
de diferencias, razones, etc. entre estadísticos.
La distribución muestral de medias para muestras grandes sigue la ley normal. Como hemos
visto más arriba, al extraer al azar una muestra de tamaño “n”, de una población con media
“m” y varianza “s2”, las observaciones de la muestra son variables aleatorias. Si hacemos la
media de las medias ( x–x– ) eso nos da como resultado el parámetro (m) y cuanto mayor sea
el tamaño de las muestras más agrupadas estarán las medias observadas ( x–) alrededor del
parámetro (m).
Como ya sabemos, la distribución muestral de medias sigue una ley normal cuya media
es el parámetro ( x–x– = m) y su desviación o error típico es: σ x = σ .
n
¿Qué ocurriría si cambiamos el tamaño de la muestra? ¿Tiene alguna incidencia sobre el
error típico de muestras? ¿Ese error va a variar? Ya hemos visto que sí, que, teóricamente, cuan-
to más grande es el tamaño de la muestra, menor es el error. Veamos un ejemplo. Supongamos
que tenemos una población con media aritmética igual a 10 y una desviación típica igual a 2.
m = 10 y s = 2
Como se puede ver, el error típico aquí es de 0,4. Pero, ¿qué pasa si seleccionamos una
muestra de 100 individuos? ¿Se produce algún tipo de cambio? Según hemos dicho, debe-
ríamos esperar que el error fuera más pequeño. Veamos:
114
Capítulo 6: Estadística inferencial. Conceptos básicos
X x = µ = 10
Si n = 100
→
σ x = 2 = 0, 2
100
Efectivamente, al hacer los cálculos pertinentes, vemos que el error típico en este caso
es de 0,2. Ha disminuido sensiblemente. Si continuamos aumentando el tamaño de la mues-
tra, el error todavía disminuye más.
X x = µ = 10
Si n = 400
→
σ x = 2 = 0,1
4 100
Sin embargo, hay que tener en cuenta que a partir de un cierto número de individuos,
aumentar la muestra no proporciona grandes disminuciones del error típico. Es decir, que
siempre hay una especie de “techo” a partir del cual el error va disminuyendo muy lenta-
mente y se necesitan cada vez más individuos para lograrlo (recordar la regularidad estadís-
tica o ley de los grandes números).
El error típico disminuye porque, a medida que aumenta “n”, la influencia del azar es
menor y, por tanto, hay menos parte de la variabilidad que estamos observando debida al
azar. En cambio, cuanto menor sea el tamaño de la muestra la influencia del azar es mayor.
Igual que en el caso de las medias podemos hablar de una distribución muestral, lo mismo ocu-
rre cuando se trata de proporciones. De la misma manera que antes, también podemos decir que
sigue la ley normal. La media de las proporciones observadas es el parámetro ( –x po = p).
La desviación típica, el error típico, vale σ po = pq . Igual que en el caso de la dis-
n
tribución de las medias, aquí también ocurre que el tamaño de la muestra tiene una rela-
ción inversa con el error típico: a muestras más grandes, menor es el error; a muestras más
pequeñas, el error aumenta, porque dejamos más cabos sueltos al azar. El siguiente ejemplo
ilustra perfectamente esta característica.
p = 0,6 X = p = 0,6
n = 25
po
115
Estadística básica para educadores
X = p = 0,6
n = 100
po
X = p = 0,6
n = 400
po
El avance del conocimiento muchas veces viene regido por la realización de experimentos.
Tradicionalmente la ciencia se ha nutrido de los aprendizajes que se han realizado a partir
de situaciones experimentales. Arquímedes, Eratóstenes, Copérnico, Galileo, Newton, Caven-
dish, Maxwell, Darwin, Millikan, Einstein, Bohr, Heisenberg y tantos otros que no cabrían
aquí han sido científicos de renombre que han realizado grandes aportaciones al conoci-
miento y han usado la experimentación, o se han basado en experimentos hechos por otras
personas, como herramienta para lograr desentrañar y comprender los recovecos de la natu-
raleza. La experimentación también es una herramienta en estadística. O, dicho más correc-
tamente, la estadística también tiene técnicas que permiten realizar experimentación.
El diseño experimental es propio del método científico. Como tal, en el método cien-
tífico se producen observaciones que nos llevan al planteamiento de un problema de inves-
tigación. Este problema se concreta en una serie de hipótesis (hipótesis nula y alternativa)
que resumen cuál es nuestra idea de cómo funcionan las cosas. Una vez que se tienen las
hipótesis, existen métodos científicos que nos permiten contrastarlas y ver si eran o no correc-
tas (podemos aceptar la hipótesis nula y rechazar la alternativa, o al revés). La interpretación
de ese análisis es lo que puede permitir un avance, o no, del conocimiento.
No obstante, los criterios éticos de la comunidad científica internacional plantean que
no es lo mismo investigar cosas, animales y personas. Estos criterios son muy tenidos en
cuenta en las evaluaciones éticas de los proyectos presentados a los Programas Marco de
Investigación Científica Europea, aunque desgraciadamente hay países en que todavía se
obvian. Uno de esos criterios es el acuerdo claramente informado y voluntario de los suje-
tos investigados, si son menores, también de sus familiares. La orientación comunicativa tie-
ne muy en cuenta esos criterios y esa es una de las razones por las que es tan valorada inter-
nacionalmente. Por suerte, cada vez más familiares, estudiantes y organizaciones rechazan
las metodologías de investigación que vienen a pedirles información (incluso siendo meno-
res) y desaparecen.
116
Capítulo 6: Estadística inferencial. Conceptos básicos
La historia de la ciencia muestra que el avance del conocimiento no ha sido una tarea
individual. Es la obra colectiva de cientos de personas que han realizado contribuciones (y
contribuciones sobre contribuciones) al conocimiento, en un proceso de acumulación e inte-
gración. La experiencia empírica de generaciones y generaciones de personas, transmitida
de unas a otras, nos ha traído hasta donde estamos. Por tanto, se trata de un proceso que
podríamos calificar como dialógico, en el sentido de que el conocimiento es la consecuen-
cia del intercambio entre cientos y cientos de personas, a lo largo del tiempo. Teniendo en
cuenta este punto de vista epistemológico, si volvemos al campo de la estadística inferen-
cial, el proceso de generación de conocimiento también debería ser dialógico.
Habitualmente, en los manuales de estadística se nos presentan las diferentes técnicas y
procedimientos inferenciales de la estadística. En este libro queremos llamar la atención
sobre las técnicas (que vamos a introducir en los capítulos siguientes); las queremos enten-
der en el marco de un enfoque comunicativo crítico basado en el diálogo. A diferencia de
la investigación objetivista (o positivista), desde el enfoque que defendemos aquí, procedi-
mientos como el diseño experimental implican la inclusión de la voz de todas las personas
implicadas en el estudio, no solo de aquellas personas que consideramos “expertas” porque
tienen una serie de conocimientos de estadística.
La propuesta de hipótesis, la construcción del modelo explicativo y la interpretación de
los datos de una manera coherente es tarea de todas las personas involucradas en la investiga-
ción. ¿Quiénes mejor que las personas que viven en La Mina (un barrio barcelonés conocido
por la exclusión social y laboral que padece) para participar en la propuesta de modelos que
expliquen por qué La Mina se encuentra en la situación en la que está? ¿Quiénes mejor que
ellos para aportar conocimiento sobre el significado de los números que arroja el SPSS?
Las personas que sabemos cómo usar el SPSS tenemos la responsabilidad ética y moral
(como dice Chomsky) de usar esos conocimientos para entrar en diálogo con la sociedad y
contribuir a la superación de las situaciones de exclusión y desigualdad o generar conoci-
miento sobre nuestro mundo. Un ejemplo concreto de esto es la investigación I+D titula-
da AMAL: inmigración y mercado laboral (CREA 2001-2005). Este estudio estaba dirigido
a averiguar la situación laboral de las personas inmigrantes musulmanas o árabes. A lo lar-
go de la investigación, siempre hubo comités asesores formados por personas inmigrantes
árabes y/o musulmanas que leían y discutían los resultados preliminares de la investigación,
para ver si tenían coherencia con su propia experiencia.
Desde el punto de vista cuantitativo, y en concreto de la estadística, personas árabes o
musulmanas, representativas del colectivo (no por el nivel de estudios, sino por su posición
en la comunidad), participaron tanto en la selección de la muestra (dando entrada a espa-
cios a los que de otra manera hubiera sido imposible acceder y, por tanto, su omisión hubie-
ra causado un sesgo profundo en la muestra), como en el diseño de los instrumentos de reco-
gida de datos (cuestionarios) y la validación del modelo de hipótesis. La inclusión crítica de
todas las personas involucradas en la investigación es clave para llegar a resultados coheren-
tes (especialmente en el ámbito de las ciencias sociales y de la educación, donde se trabaja
con personas, no con entidades físicas que son susceptibles de manipulación y control ad
eternum).
117
Estadística básica para educadores
Para la reflexión…
118
7
Teoría de la estimación
Cuando hacemos investigación, trabajamos con poblaciones de las que no tenemos una
información completa. Siempre hay algún parámetro que desconocemos. Pero esto no tie-
ne por qué ser un problema, porque la estadística nos da herramientas para poder suponer
cuál es el valor de esos parámetros. A eso es a lo que se le llama estimación.
119
Estadística básica para educadores
a = 0,05 (5%)
a = 0,01 (1%)
Por lo que: 1 – α Si α = 0, 05 1 – α = 0, 95 (95%)
Si α = 0, 01 1 – α = 0, 99 (95%)
El intervalo de probabilidad permite predecir con un riesgo a (0,05 o 0,01) de equivo-
carse, los límites dentro de los cuales se encontrarán, partiendo de un parámetro poblacio-
nal, los 1 – a (0,95 o 0,99, 95% o 99%) de los estadísticos observados en muestras de tama-
ño n extraídas al azar de la población.
Dicho en otras palabras, el intervalo de probabilidad contiene dentro de sus límites
1 – a (0,95 o 0,99, 95% o 99%) de la distribución muestral.
Para hacer una estimación (es decir, para ver si el valor que nosotros tenemos en la mues-
tra es el mismo que aparecería en la población total) podemos actuar de diferentes mane-
ras. Se puede hacer lo que se llama estimación puntual. Tomamos un valor de la muestra y
proponemos el valor del parámetro poblacional. Se demuestra matemáticamente que, en
general, la mejor 2
– 2 estimación puntual de un parámetro (m, s , s, p) es su estadístico corres-
pondiente (X, S , S, po), especialmente si trabajamos con muestras grandes (n ≥ 30).
Tenemos que tener mucha suerte de que ambos valores coincidan, porque lo más nor-
mal es que eso no ocurra. Siempre habrá una variación entre el estadístico que tenemos en
nuestra muestra y el valor de la población (parámetro). Desde luego, cuanto mayor sea la
muestra, mayor será la probabilidad de que hayamos acertado. Sin necesidad de recurrir a
matemáticas superiores es de sentido común que el mejor estimador de un parámetro (m,
s2, s, p) sea su correspondiente estadístico (x–, S2, S, po). Si, por ejemplo, la media que hemos
calculado en la muestra con la que trabajamos tiene un valor de 27 y nos preguntasen cuál
es la media de la población origen, lo lógico es que digamos que es 27 porque la muestra la
hemos extraído de la población y lo normal es que se parecieran. Además, porque es el úni-
co valor que tenemos. A nadie se le ocurriría afirmar que la media de la población es 67; lo
120
Capítulo 7: Teoría de la estimación
tomarían por loco. El problema es que si nos preguntan ¿con qué seguridad afirmamos que
la media de la población sigue el 27?, no tengamos una respuesta adecuada.
Otra opción es hacer una estimación por intervalos. En vez de coger un único punto,
vamos al gráfico y tomamos un intervalo y, a partir de ese intervalo, decimos que, con tal o
cual probabilidad, pensamos que el valor que estamos buscando está dentro de sus límites.
Al tomar un intervalo, en vez de una estimación puntual, es bastante más fiable acertar. Es
más fiable decir “el número que busco está entre el diez y el veinte” que decir “el número
que busco es el trece”. Cuando decimos “trece” estamos apostando todas nuestras cartas a
un único valor. En cambio, si decimos “entre diez y veinte” tenemos diez posibilidades de
acertarla. Además, en el caso de variables continuas, como podría ser la altura, es una mane-
ra de asegurar que no nos equivocamos, puesto que, como hemos visto, la probabilidad de
tener exactamente una medida es prácticamente nula. El intervalo que utilizamos para hacer
esta estimación por intervalo se llama intervalo de confianza.
Un intervalo es un valor lineal que queda definido por sus dos límites (superior e infe-
rior). Los límites del intervalo de confianza fueron denominados por R. A. Fisher, límites
de confianza o límites fiduciales.
También se basa en los conceptos de distribución muestral y error típico. Como ésta
sigue la ley normal (para muestras grandes) el:
123
121
Estadística básica para educadores
Cuanto más movamos los extremos de los intervalos hacia los extremos (es decir, cuan-
to más grande sea el intervalo), mayor será la probabilidad de que el parámetro esté dentro
de dicho intervalo. De la misma manera, cuanto más estrechemos el intervalo, menor es
dicha probabilidad. De nuevo, la decisión es un tema de tiempo y presupuesto. El concep-
to que subyace es el de potencia de un contraste que se tratará más adelante.
Tal y como explican ambos autores, no es lo mismo tomar una muestra reducida de per-
sonas, y hacer una estimación sobre esa muestra, que tomar prácticamente toda la pobla-
ción. Ellos lo ilustran con tres ejemplos: el caso de estimar la probabilidad de sacar cara al
tirar una moneda que se lanza 10 veces, el caso de estimar la proporción de votantes al par-
tido A en una muestra aleatoria de 2.000 personas y el caso de conocer la proporción de
estudiantes a los que les gusta el teatro, en una clase de 90 estudiantes, de donde se extrae
una muestra de 60 de ellos. Los resultados hipotéticos que ofrecen en su ejemplo (supon-
gamos que en el primer caso, salen 3 caras de 10 lanzamientos; que en el segundo 600 per-
sonas afirman que votarán al partido A; y que en el tercero 18 estudiantes afirman que les
gusta el teatro) coinciden en suponer todos ellos un 30% del total de la muestra.
Sin embargo, advierten Peña y Romo (2003), no es lo mismo un 30% sobre un total
de 10 veces que tiras la moneda, que un 30% en el caso de los estudiantes a los que les gus-
ta (o no) el teatro. En este último caso, tenemos prácticamente a toda la población, con lo
cual, el porcentaje estimado del 30% seguramente coincide mucho más con el porcentaje
real de estudiantes a quienes les gusta el teatro. En otras palabras, es un dato mucho más
preciso. Por tanto, siempre que trabajemos con estimaciones, tenemos que pensar también
en dar una medida de precisión para juzgar lo fiable que sea el dato (o no).
122
Capítulo 7: Teoría de la estimación
pq
σ po =
n
Donde spo es el error típico de la estimación.
p, q son los valores de las proporciones en la población.
n es el tamaño de la muestra.
123
Estadística básica para educadores
Todo lo que venimos explicando se puede aplicar al caso de que queramos estimar el valor
medio de algún fenómeno que estemos estudiando. Por ejemplo, puede resultar que nos
interese saber cuál es el sueldo medio de los funcionarios, para compararlo con los sueldos
medios de otras categorías profesionales y así saber si una rebaja del gasto público en sala-
rios es una medida de contención presupuestaria adecuada o no. Nos puede interesar ave-
riguar cuál es la edad media en la que las mujeres tienen su primer hijo, para pensar en apli-
car una determinada política social. O incluso también podemos aplicar estos razonamientos
para el caso de que estemos analizando las notas medias que sacan los estudiantes en escue-
las situadas en barrios con unas determinadas características.
En cualquier caso, los cálculos son semejantes a lo que venimos explicando hasta aho-
ra: se toma una muestra al azar y se usa para hacer una estimación de la media. Esa estima-
ción siempre tiene que venir acompañada de una medida de precisión, para saber cuán fia-
ble sea.
Igual que en el caso de la proporción, en este caso nos interesa saber si nuestra media corres-
ponde o no con la media poblacional. Para ello, mediremos la variabilidad (las diferencias)
entre lo que hemos observado en nuestra muestra y la desviación que tiene la población.
Por tanto, para variables cuantitativas:
σ
σ =
x n
Donde sx– es error típico de la estimación.
s es desviación típica de la población.
n es el tamaño de la muestra.
Para la reflexión…
• ¿En qué consiste la teoría de la estimación estadística y qué aportaciones supone para
la investigación educativa?
• ¿En qué difieren la estimación puntual y la estimación por intervalo?
• ¿Qué es el error típico de la estimación y cómo puede calcularse?
124
8
Teoría de la decisión
(contraste de hipótesis)
Una de las aplicaciones más interesantes de la estadística inferencial es que nos ofrece herra-
mientas que sirven para decidir si algo que estamos suponiendo es o no es cierto. Esto es lo
que se conoce como contraste de hipótesis. Trata de la toma de decisiones en Estadística. Se
basa en los conceptos de distribución muestral y error típico. Cuando realizamos una inves-
tigación, una de las formas de avanzar en el conocimiento es establecer una afirmación sobre
una determinada relación (hipótesis) y luego comprobar, a partir del análisis de nuestras
observaciones, si dicha hipótesis es cierta o no lo es. Contrastar una hipótesis es comparar
las predicciones que salen de aplicar dicha hipótesis con los datos reales observados. Si cuan-
do hacemos esta comparación existe coincidencia, entonces eso significa que nuestra hipó-
tesis es correcta (y por tanto, la aceptamos). En cambio, cuando las diferencias son sufi-
cientemente grandes, entonces no aceptamos nuestra hipótesis de partida.
Una hipótesis es una proposición o afirmación, que relaciona de forma concreta variables,
cuya naturaleza no conocemos con absoluta certeza y que, justamente por ello, se plantea
en términos de conjetura, algo que posiblemente es cierto, algo a verificar. Tal y como dice
Peña (1986), “llamaremos hipótesis estadística a una suposición que determina, parcial o
totalmente, la distribución de probabilidad de una variable aleatoria” (p. 196). Eso quiere
decir que una hipótesis es una afirmación que decimos sobre la variable que estamos estu-
diando.
Por ejemplo, si estamos estudiando los resultados de matemáticas de esos estudiantes de
quinto de primaria, podemos hacer la hipótesis de que cierto grupo de alumnado tiene unos
resultados peores que el resto de la población. También podemos plantear la hipótesis de
125
Estadística básica para educadores
que las diferencias entre los datos que hemos recogido de este grupo y el de la población en
general son debidas al azar y no son significativas. Muchas veces en la prensa, por ejemplo,
vemos afirmaciones del tipo: “los estudiantes españoles obtienen peores resultados en com-
prensión lectora que la media de la OCDE”. Y aquí nos quedamos (o aquí se queda la pren-
sa), porque pocas veces se añade “con un tanto por ciento de probabilidad de ser cierto y
tanta otra probabilidad de equivocarnos al hacer esta afirmación”. El contraste de hipótesis
sirve para establecer los intervalos en los que nuestras afirmaciones tienen una cierta pro-
babilidad de ser correctas.
Para ello necesitamos un sistema muy sencillo de hipótesis, las llamadas hipótesis nula e
hipótesis alternativa.
• Hipótesis nula (H0): la que nos planteamos a priori a verificar y que “aceptamos” o
rechazamos tras el análisis estadístico de los datos. Suele ser la hipótesis de que las
cosas son según se pensaba y que, por tanto, no se aporta un cambio significativo en
nuestra forma de verlo (diferencia estadísticamente nula o no significativa, suficien-
temente pequeña como para poder ser explicada por el azar)
• Hipótesis alternativa (H1): es la complementaria (no solo la contraria) de la H0 (dife-
rencia estadísticamente distinta de cero o significativa: lo bastante grande o diferen-
te de cero como para que no se pueda explicar solo por el azar).
Gonick y Smith (1993), en un conocido libro divulgativo sobre estadística, explican la impor-
tancia del contraste de hipótesis mediante un ejemplo: la selección de los miembros del jura-
do que se realizaba en el Sur de Estados Unidos entre los años 1960 y 1980. Los autores
relatan cómo, a pesar de que en teoría la selección de personas para formar parte de los
miembros del jurado era algo aleatorio (en principio), a partir de una lista de ciudadanos
que podían ser elegidos, la realidad era que en las listas de miembros del jurado en los esta-
dos del Sur de Estados Unidos había muy pocos ciudadanos afroamericanos. ¿Cómo era eso
posible?
Según Gonick y Smith (1993) algunos abogados cuestionaron el sistema y lo acusaron
de racista. La realidad era que la mitad de la población susceptible de formar parte de los
jurados eran ciudadanos afroamericanos. Pero, a pesar de eso, solo 4 de cada 80 miembros
de jurados pertenecían a este colectivo. Ante esta situación, la pregunta que se hacían los
abogados críticos es si eso podía ser posible.
126
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
En un caso como este, se supone que la selección para ser miembro del jurado debería
ser aleatoria. Si eso es cierto, dadas las circunstancias, la variable que nos interesa (“ser ele-
gido como miembro del jurado”) es una variable aleatoria binomial, con n = 80, y una pro-
babilidad de “ser ciudadano afroamericano” de p = 0,5 (es decir, la mitad de los ciudadanos
susceptibles de entrar en el proceso de selección). Si esto es cierto, entonces la probabilidad
de seleccionar solo 4 miembros que sean afroamericanos [p(x ≤ 4)]) es algo así como
0,000000000000000014 (Gonick y Smith, 1993: 139).
Algo imposible de aceptar, dadas las circunstancias. Por tanto, la conclusión aquí es
rechazar la hipótesis de la selección aleatoria: la selección en este caso no era aleatoria.
Por lo tanto, se debía rechazar la hipótesis nula (la selección era aleatoria) y considerar la
hipótesis alternativa como cierta (la selección no provenía de métodos aleatorios). La esta-
dística (el contraste de hipótesis, más bien) fue una prueba de peso contra la supuesta
democracia del proceso de selección y demostró el racismo imperante en el Sur de Esta-
dos Unidos.
El contraste de hipótesis sirve para tomar decisiones. Es un procedimiento que nos sirve
para decidir cuándo un dato es creíble o no lo es. Por ejemplo, supongamos que somos soció-
logos y nos han encargado un estudio en una clase de una escuela donde sabemos que la
desviación típica de las notas que obtienen los estudiantes en los exámenes de inglés es de
2,4. Tomamos una muestra de 23 estudiantes del total de alumnos, los cuales han sacado
una nota media en inglés de 5,6 puntos. ¿Nos sirven estos datos para afirmar que la nota
media del total de alumnos fue diferente de 6? El contraste de hipótesis nos da herramien-
tas estadísticas para tomar una decisión en situaciones como ésta. ¿Cómo?
Lo primero que tenemos que hacer es establecer nuestras hipótesis de trabajo. En este
caso, como lo que queremos saber es si la media de las notas obtenidas por el conjunto de
la clase fue diferente de 6. Para saberlo, tenemos que plantear el modelo de hipótesis:
H0 es: m = 6. Esto significa que la nota media no ha variado (respecto a una nota media
teórica de 6).
H1 es: m ≠ 6. La nota media sí ha variado (en más o en menos).
Supongamos que la distribución que siguen los resultados académicos de los estudian-
tes de esta materia es una curva normal: es decir, que la mayor parte tenderán a sacar notas
parecidas, que algunos sacarán muy buenas notas y que otros pocos sacarán notas pésimas.
Entonces, nos encontramos con una representación gráfica como la que sigue:
127
Estadística básica para educadores
Si volvemos a nuestro ejemplo sobre las notas de inglés obtenidas por los estudiantes, la
pregunta que se nos hacía era si podíamos decir que la media del conjunto de alumnos es de un
128
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
6, con un intervalo de confianza del 95%. El valor de “z” lo tenemos que buscar teniendo en
cuenta que, al ser un caso de contraste de hipótesis bilateral, ese 5% estará distribuido entre los
dos extremos de la curva (es decir, 2,5% a cada extremo). Si buscamos en la tabla de probabi-
lidades tipificada el valor que le corresponde a este valor de “z”, entonces obtendremos que para
a = 0,05, los valores críticos de za/2 son ±1,96. Apliquemos ahora la fórmula para calcular la
región de aceptación (es decir, el intervalo dentro del cual vamos a aceptar la hipótesis nula):
2,4 2,4
6 − 1,96 ⋅ 36 , 6 + 1,96 ⋅ 36
(5,22; 6,78)
Puesto que el valor de la media de nuestra muestra es de 5,6 y dicho valor se encuentra
dentro de la horquilla delimitada por los valores 5,22 por un lado y 6,78 por el otro, eso sig-
nifica que “aceptamos” (o mejor, no rechazamos) la hipótesis nula, es decir, no podemos afir-
mar que la nota media del grupo sea diferente de 6 puntos. Dicho de otra manera, como no
estamos en la región de aceptación de la hipótesis alternativa (la nota media será distinta de
6), no podemos aceptar dicha hipótesis. No afirmamos, pues, que la nota media vaya a ser de 6,
sino que con los datos que tenemos no podemos inferir que esta nota media sea distinta a 6. Es
decir, la carga de la prueba está en la hipótesis alternativa: ella tiene que demostrar que es cier-
ta, y si no lo hace, no hay ninguna razón para rechazar la hipótesis nula.
Puede darse el caso de que nos pidan hacer un contraste de hipótesis pero, que en lugar
de bilateral, sea unilateral (por ejemplo, en el caso anterior, nos podían preguntar si pode-
mos aceptar la hipótesis de que la media de toda la clase esté aprobada). Entonces, el gráfi-
co correspondiente que ilustraría la pregunta sería el siguiente:
129
Estadística básica para educadores
La lógica es la misma que en el caso anterior. Lo único que varía, es el cálculo de la región
de aceptación. Veamos un ejemplo para aclarar la idea. Supongamos que son las elecciones
municipales y que el diario local de una ciudad ha sacado un titular en el que se afirma que
el nivel de abstención no será menor del 40%. Trabajamos en el diario de la competencia y
queremos saber si podemos admitir dicho pronóstico, o no. Para ello tomamos una mues-
tra al azar de 200 personas, con derecho a voto, 75 de las cuales estarían dispuestas a votar.
La pregunta entonces sería si el pronóstico publicado por el primer diario en sus titulares es
válido, o no lo es. Lo queremos asegurar con un 1% de nivel de significación.
Dados estos datos, parece claro que en la muestra que hemos tomado hay 125 personas
que van a abstenerse de votar en las próximas elecciones. Planteemos las hipótesis.
La hipótesis nula sería: p ≥ 0,40 (es decir, que la abstención será, como mínimo, del 40%).
En cambio, la hipótesis alternativa sería: p < 0,40.
Si queremos validar el pronóstico con un nivel de significación del 1%, entonces a = 0,01
(que le corresponde un valor crítico za = 2,33). Para calcular el intervalo de confianza, tene-
mos que mirar si el valor que andamos buscando está a la izquierda o a la derecha de la línea
que delimita la curva de Gauss en dos. En nuestro caso, como lo que queremos aceptar es
que la abstención va a ser como mínimo del 40%, entonces eso significa que nos interesa
que el valor esté a la derecha de la línea vertical que divide la curva de Gauss (los valores que
van hacia el infinito positivo), porque decir “mínimo del 40%” significa 40% o más (hasta
el límite marcado por el infinito positivo).
A diferencia del contraste bilateral, en el caso del contraste unilateral, las fórmulas no
son “a dos colas”. Al contrario, como se puede observar:
σ
x − z α ⋅ , ∞ (Para el caso de las medias)
n
pq
p − zα ⋅ n
, ∞ (Para el caso de las proporciones)
0,4 ⋅ 0,6
0,4 − 2,33 ⋅ , ∞ = ( 0,3192; ∞ )
200
¿Qué significa este resultado? Pues, si tomamos la proporción de personas que van a abs-
tenerse de votar en nuestra muestra (p = 125/200 = 0,625) y la comparamos con el inter-
valo que nos ha salido, vemos rápidamente que 0,625 se encuentra dentro del intervalo mar-
cado por 0,3192 por un lado e infinito positivo por el otro. Por tanto, aceptamos la hipótesis
nula, es decir, no podemos afirmar con un nivel de significación del 1% que la abstención
en las próximas elecciones municipales será menor que un 40%. No podemos contradecir
la afirmación que habíamos leído en el diario de la competencia.
130
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
Al realizar un contraste de hipótesis, podemos incurrir en una serie de riesgos. Estos riesgos
están categorizados en dos tipos, según sean errores de tipo I o de tipo II.
Realidad
Decisión
H0 Verdadera H0 Falsa
a: Riesgo de error conocido (fijado a priori) y pequeño, habitualmente 0,05 (5%) o 0,01
(1%).
b: Riesgo de error desconocido, porque depende de la diferencia entre el parámetro real
(m‘) y el parámetro teórico (m) y generalmente el parámetro real lo desconocemos.
La potencia de un contraste es la capacidad que tiene un contraste para detectar que la hipó-
tesis nula es falsa y rechazarla. ¿Cómo podemos hacer para aumentar la potencia (1 – b) de
un contraste? Lo que nos interesa para lograrlo es disminuir el valor de b. Para lograrlo pode-
mos optar por diversos métodos:
131
Estadística básica para educadores
Veamos un ejemplo:
m = 400
m’ = 403
s = s’= 6
a = 0,05
Si tenemos una media teórica de 400 y una media real de 403 y la sigma tanto real como
teórica es de 6.
Para una n de 36 el error típico sería 6/ 36 y la precisión:
6
e = 1, 96 = 1, 96
36
132
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
Al aumentar n (de 36 a 64) los intervalos son más estrechos y, por lo tanto, el riesgo b
(intersección) disminuye. Por lo tanto, hemos aumentado la potencia del contraste (1 – b).
Finalmente otro de los elementos que nos puede interesar del contraste de hipótesis es el
grado de significación (p). Se define como la probabilidad de error que obtendremos si recha-
zamos la hipótesis nula. Por lo general, en los outputs de los programas informáticos apa-
rece el dato p que sirve para la toma de decisión estadística. Si p es mayor o igual que a (el
máximo error que estamos dispuestos a asumir al rechazar la hipótesis nula), no podemos
rechazar la hipótesis nula y, por lo tanto, la aceptamos. Si p es menor que a rechazamos la
hipótesis nula y aceptamos la alternativa. Veamos un par de ejemplos de ello:
Ejemplo A:
La –x está en la zona crítica, el valor p (p/2) es menor que 1 – a (a/2), por lo tanto, la
decisión es rechazar la hipótesis nula (H0) y aceptar H1
Ejemplo B:
–
La x está en la zona no crítica, el valor p es mayor que a, por lo tanto, la decisión es que
nada se opone a aceptar la hipótesis nula (H0).
133
Estadística básica para educadores
Las tres estrategias posibles para tomar la decisión son: el intervalo de probabilidad, esta-
dístico de contraste, y el grado de significación. Veámoslas por partes:
1. Intervalo de probabilidad
– Calcular el intervalo
– Si estamos dentro del intervalo, entonces H0 y, si estamos fuera del intervalo, enton-
ces H1.
Esta estrategia es bastante laboriosa porque hay que calcular los límites del intervalo.
Además, si la distribución muestral no es simétrica (t de Student y F de Snedecor, por ejem-
plo) el cálculo es más complicado.
2. Estadístico de contraste
134
Capítulo 8: Teoría de la decisión (contraste de hipótesis)
– Calcular el estadístico de contraste (z, t, c2, F) con la fórmula adecuada para cada
caso.
– Buscar el valor crítico (z, t, c2, F) en la tabla.
– Si z, t, c2, F (en valor absoluto) ≤ z, t, c2, F de la tabla correspondiente, H0.
– Si z, t, c2, F (en valor absoluto) > z, t, c2, F de la tabla correspondiente, H1.
Tiene el inconveniente de que necesitamos disponer de las fórmulas (y hacer los cálcu-
los) y las tablas en las que, por más completas que sean, muchas veces no encontramos el
valor exacto que necesitamos.
3. El grado de significación
Para la reflexión…
• ¿En qué consiste la teoría de la decisión estadística y qué aportaciones supone para la
investigación educativa?
• Define la hipótesis nula y alternativa en relación con un contraste estadístico.
• Un grupo de 150 sujetos ha obtenido en un test una media de 47 puntos con una
desviación típica de 2,5. Calcula la región de aceptación para un contraste bilateral y
unilateral (a = 0,05).
• En un sondeo de opinión sobre la credibilidad de algunos políticos, en una muestra
al azar de 1.500 sujetos, el 15% se mostraron favorables. Calcula la región de acep-
tación para un contraste bilateral y unilateral (a = 0,01).
• Describe los posibles errores y riesgos presentes en un contraste de hipótesis.
• ¿Qué es la potencia de un contraste y cómo podemos aumentarla?
• Mediante la ayuda del SPSS, verifica la normalidad de las variables cuantitativas de la
matriz que puedes descargar en www.sintesis.com, con un margen de error a de 0,05.
135
9
Comparaciones o contrastes
de medias
Las decisiones:
137
Estadística básica para educadores
Nos podemos plantear si podemos afirmar que la media de este grupo de primero de la
ESO es diferente de 30 (que sería la media teórica, por ejemplo, la que consideramos que
los estudiantes de su curso deberían sacar, y con la que queremos establecer comparaciones
para saber si esta clase está por encima, por debajo o sin diferencias con respecto a ella) con
un riesgo de error a = 0,01.
En este caso la hipótesis nula es que son estadísticamente iguales y la hipótesis alterna-
tiva es que son diferentes.
Le pedimos al ordenador: Analizar/Comparar medias/ Prueba T para una muestra y
en el “output” aparecen todo tipo de datos (media, desviación típica, valor de la t, los gra-
dos de libertad…) y la significación o p, que en este caso tiene un valor de 0,145. ¿Qué
decisión tomaremos? Como p = 0,145 es mayor que a = 0,01 no tenemos suficientes
motivos para rechazar la hipótesis nula, o sea que la diferencia no es significativa (es sufi-
cientemente pequeña como para que no podamos descartar que la diferencia se pueda
explicar simplemente por influencia del azar). Al decir “no tenemos suficientes motivos
para rechazar la H0” no afirmamos que ésta sea cierta (porque el riesgo de error que tene-
mos es el riesgo b, que desconocemos) simplemente que los datos que poseemos no des-
cartan la hipótesis nula.
Un ejemplo con SPSS sería comparar la media observada en Coeficiente Intelectual obte-
nida en un grupo, con la media teórica de 100. Para ello, ejecutamos el comando ANALI-
ZAR/COMPARAR MEDIAS/PRUEBA T PARA UNA MUESTRA y obtenemos el siguien-
te cuadro de diálogo.
El output del ejemplo sería el siguiente, cuya interpretación del nivel de significación
arroja diferencias estadísticamente significativas (a = 0,05), evidenciando que la muestra
tiene un CI superior a la media.
138
Capítulo 9: Comparaciones o contrastes de medias
One-Sample Statistics
One-Sample Test
Comparamos las medias de los grupos 1 y 2 (el orden es indiferente) con sujetos diferentes
de uno y otro grupo.
Las hipótesis estadísticas son:
– Hipótesis nula (H0): las medias observadas de ambos grupos son estadísticamente
iguales.
– Hipótesis alternativa (H1): las medias observadas son estadísticamente diferentes.
Condición de aplicación: las varianzas de ambos grupos tienen que ser homogéneas o
estadísticamente iguales. El ordenador hace la prueba F de Levene, de tal manera que:
En este segundo caso en principio no se podría aplicar la prueba, pero el programa cal-
cula los valores de F y p tanto para el caso de que se hayan asumido varianzas iguales y para
139
Estadística básica para educadores
el caso de que no se hayan asumido varianzas iguales (en este segundo caso lo que hace es
recalcular los grados de libertad).
Por ejemplo, pensemos en dos grupos de 8 estudiantes de sendos centros educativos que
han obtenido la siguiente puntuación en una prueba de conocimientos de informática.
x–A = 23 SA = 2
x–B = 28,5 SB = 1,6
¿Podemos afirmar que ambos centros tienen diferente nivel de conocimiento de infor-
mática? (a = 0,05).
Le pedimos al ordenador Analizar/Comparar medias/prueba T para muestras indepen-
dientes. El ordenador nos ofrece en el “output” todo tipo de datos: medias y desviaciones
típicas de ambos grupos, el test de homogeneidad de varianzas (en este caso se cumple la
condición porque la p de la prueba F es 0,200 > 0,05), el valor del contraste t (–6,089) y su
significación. Este último dato es el más importante porque nos permite tomar la decisión:
como p = 0,000 es menor que a (0,05) rechazamos la H0 con un riesgo del 5% y acepta-
mos la H1: diferencia significativa. No obstante, que p sea 0,000 no quiere decir que sea
cero (que nunca lo es) sino que es un valor que no llega al uno por mil.
Un ejemplo con SPSS sería comparar la media obtenida de Coeficiente Intelectual del ejem-
plo anterior, entre chicos y chicas. Para ello, ejecutamos el comando ANALIZAR/COM-
PARAR MEDIAS/PRUEBA T PARA MUESTRAS INDEPENDIENTES y obtenemos el
siguiente cuadro de diálogo.
140
Capítulo 9: Comparaciones o contrastes de medias
El output del ejemplo sería el siguiente. Como la significación (p = 0,881) es mayor que
0,05 la conclusión sería que nada se opone a aceptar la hipótesis nula, es decir, diferencia
no significativa.
Levene’s Test
for Equality of t-test for Equality of Means
Variances
95% Confidence
Std.
Mean Interval of the
Sig. (2- Error
F Sig. t df Diffe- Difference
tailed) Diffe-
rence
rence
Lower Upper
Total Equal variances ,046 ,830 ,239 576 ,811 ,364 1,521 –2,624 3,352
assumed
141
Estadística básica para educadores
Se trata de comparar las medias obtenidas por los mismos individuos en dos situaciones dife-
rentes, lo más habitual antes (x–1) y después (x–2) en el tiempo. Esta prueba es interesante para
verificar si una intervención (curso, incentivo, charla…) que ha tenido lugar entre los dos
momentos ha tenido influencia o no. De modo similar a los apartados anteriores, las hipó-
tesis estadísticas son:
– Hipótesis nula (H0): las medias del grupo antes y después son estadísticamente iguales.
– Hipótesis alternativa (H1): las medias del grupo antes y después son estadísticamen-
te diferentes.
– Inicio de curso: 12, 11, 14, 13, 10, 16, 13, 15, 14
– Final de curso: 18, 16, 18, 17, 12, 19, 18, 19, 17
142
Capítulo 9: Comparaciones o contrastes de medias
– Para contrastar más de 2 medias observadas, tanto para datos o muestras indepen-
dientes como para datos relacionados (ANOVA o análisis de la varianza).
Un ejemplo con SPSS sería comparar la media obtenida en las puntuaciones de Coefi-
ciente Intelectual antes y después de la aplicación de un programa de desarrollo cognitivo.
Para ello, ejecutamos el comando ANALIZAR / COMPARAR MEDIAS / PRUEBA T
PARA MUESTRAS RELACIONADAS, y obtenemos el siguiente cuadro de diálogo.
Paired Differences
143
Estadística básica para educadores
Si las variables de las que disponemos no cumplen los supuestos paramétricos, en SPSS
tenemos también opciones similares a las que hemos visto en este capítulo, para pruebas no
paramétricas. En este caso, ejecutaríamos los comandos ANALIZAR/PRUEBAS NO PARA-
MÉTRICAS para UNA MUESTRA, MUESTRAS INDEPENDIENTES O MUESTRAS
RELACIONADAS, respectivamente.
Para la reflexión…
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes encon-
trar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/).
• Analiza si la altura del grupo es similar a la media teórica recogida en estadísticas ofi-
ciales sobre la altura de los jóvenes españoles de 175 centímetros.
• Analiza si existen diferencias estadísticamente significativas entre las notas de selecti-
vidad obtenidas por el alumnado de centros públicos y privados.
• Analiza si existe mejora en el rendimiento del alumnado desde el parcial 1 al parcial 3.
144
10
Correlación y regresión
Hasta aquí hemos visto cómo la estadística nos permite tratar conjuntos de datos. La estadís-
tica descriptiva se ocupa de describir dichos datos por medio de unos índices (de posición, ten-
dencia central, variabilidad y forma) sin plantearse si tales datos pertenecen a la población o a
una muestra. La estadística inferencial, que se basa en la probabilidad, nos permite generali-
zar o inferir la información que obtenemos en la muestra a la población origen.
Sabemos que gracias a la estadística inferencial podemos estimar, a partir de los estadísti-
cos observados en la muestra, los parámetros poblaciones (teoría de la estimación) y realizar
contrastes de hipótesis (teoría de la decisión o comparaciones de medias, proporciones, etc).
Pero además la estadística nos permite estudiar dos o más variables a la vez, describir las
posibles relaciones entre las mismas y tomar decisiones al respecto. Esto es muy interesan-
te en el campo de la educación donde nos interesa encontrar explicaciones de tipo causa-
efecto a fenómenos que de por sí son bastante complejos.
145
Estadística básica para educadores
X Y
15 3
20 5
25 7
30 9
35 11
• Negativa. Cuando aumentan los valores de una de las variables disminuyen los de la
otra (u otras variables) y viceversa.
146
Capítulo 10: Correlación y regresión
X Y
–5 474
0 400
5 350
10 278
15 270
20 125
25 50
• Si el coeficiente de correlación es 0 (correlación nula) indica que las variables son inde-
pendientes entre sí.
• Si el coeficiente es 1 significa que la correlación es perfecta positiva.
• Si el coeficiente es –1 significa que la correlación es perfecta negativa.
147
Estadística básica para educadores
La correlación y regresión simple hacen referencia al estudio únicamente entre dos varia-
bles. Existen diferentes coeficientes de correlación en función del tipo de variables con el
que nos encontramos (ver el siguiente cuadro).
Spearman (rs o ρxy) Medida con una escala Medida con una escala Analizar >
ordinal ordinal Correlaciones >
Bivariadas... >
Spearman
148
Capítulo 10: Correlación y regresión
Proceso
1. Plantear las hipótesis
En los estudios correlacionales las hipótesis estadísticas son:
– H0 (hipótesis nula): independencia o correlación no significativa (variación conjun-
ta suficientemente pequeña como para ser explicada por la influencia del azar).
– H1 (hipótesis alternativa): correlación significativa (variación conjunta suficien-
temente grande como para no ser explicada solo por la influencia del azar).
2. Decidir el valor a (riesgo de error con el que vamos a trabajar): 5% o 1%.
3. Verificar las condiciones de aplicación.
4. Obtener mediante el programa SPSS la gráfica de dispersión, los estadísticos de las
variables (medias y varianzas) y el coeficiente de correlación. Los pasos serían anali-
zar/ correlación/ bivariada/ Pearson.
5. Interpretación del coeficiente de correlación (estudio de la significación). Lo hacemos,
como siempre, con el valor (p) o significación que nos proporciona el ordenador.
Si p ≥ a H0: nada se opone a aceptar la hipótesis nula (independencia) o correlación
no significativa.
Si p < a H1: rechazamos la hipótesis nula (independencia) con un riesgo a y acep-
tamos la hipótesis alternativa (dependencia) o correlación significativa.
Si la correlación es no significativa, fin del proceso (si son independientes no tiene
sentido predecir una variable en función de la otra).
Si la correlación es significativa procedemos al estudio de la regresión, que tiene dos
pasos: cálculo del valor más probable (“regresión puntual”) y cálculo del intervalo
de regresión (“regresión por intervalo”).
6. Cálculo de las rectas de regresión: predicción del valor más probable (“regresión pun-
tual”). En la correlación lineal simple, teóricamente, hay dos rectas de regresión:
– Recta de regresión de Y en función de X (Ry/x). Expresa la variación de la variable
Y en función de la variable X. Permite predecir el valor más probable (Y’) de la
variable Y, en función de un determinado valor de X.
149
Estadística básica para educadores
Y ′ = a yx + b yx · X
Donde ayx es el punto donde la recta corta al eje de ordenadas y byx es la pendiente
de dicha recta.
7. Cálculo del intervalo de regresión (con un determinado margen de error):
A no ser que la correlación sea perfecta, cosa que en educación es prácticamente
imposible, la regresión o predicción de y en función de x no será perfecta. Es decir,
la regresión o predicción la hacemos con un margen de error.
Y ′ = a yx + b yx · X ± e
Como e = Z α /2 ·S yx
Y ∈Y ′ ± Z α /2 ⋅ S yx
con una probabilidad de 1 – a
Ejemplo:
1 21 13
2 23 12
3 21 12
4 17 10
5 19 8
6 19 6
7 14 5
8 17 3
9 16 3
10 11 2
150
Capítulo 10: Correlación y regresión
151
Estadística básica para educadores
Examen de
Test verbal (x)
lengua (y)
N 10 10
N 10 10
El cálculo en el SPSS se pide a través del menú Analizar / Regresión / Lineal... donde hemos
de poner como “Dependiente” la variable del examen de lengua (Y) y como “Independien-
te” la variable test verbal (X).
152
Capítulo 10: Correlación y regresión
Coeficientesa
Coeficientes no Coeficientes
estandarizados estandarizados
Modelo t Sig.
B Error típ. Beta
Y ′ = a yx + b yx ⋅ X
Los coeficientes no estandarizados nos dan los valores ayx (–9,661) y byx (0,958) de la
recta de regresión que necesitamos. Por tanto tenemos que Y ′ = −9,661 + 0,958 ⋅ X .
Suponiendo que una persona tiene una puntuación de 20 en el test verbal, el
valor más probable en el examen de lengua es Y’ = –9,66 + 0,958 · 20 = 9,51.
7. Cálculo del intervalo de regresión (con un determinado margen de error)
14,42
9,51 ± 1,96 ⋅ 2,505 = 9,51 ± 4,91
4,6
153
Estadística básica para educadores
Por lo tanto, una alta correlación entre dos variables, por sí sola, no indicará nunca cau-
salidad. Al ver estas altas correlaciones entre dos variables, debemos preguntarnos el porqué
de esta variación conjunta. Una posible explicación es la de causa-efecto: que la variación
de una de las dos variables sea la causa de la variación de la otra. Pero debemos plantearnos
otras hipótesis y contrastarlas, descartar o explorar otras posibilidades que no sean la causa-
lidad con ayuda de otras estadísticas o de estudios cualitativos. Solo en la medida en que
hayamos descartado todas las demás posibles explicaciones de una alta correlación, podre-
mos afirmar que se trata de una relación de causalidad.
Si una o las dos variables están medidas con una escala ordinal o no se cumple alguna de las
condiciones de aplicación tenemos la alternativa de utilizar la correlación ordinal de Spear-
man. En este caso no es posible estudiar la regresión (para ello necesitaríamos que las varia-
bles fuesen cuantitativas).
B) Chi-cuadrado (c2)
Se puede aplicar con cualquier tipo de variables (cualitativas). No tiene ningún tipo de res-
tricciones como la correlación lineal simple de Pearson (no hace falta una n mínima, no es
necesario que las distribuciones se ajusten a la curva normal...).
Cabe tener presente que, a diferencia de los coeficientes de Pearson y de Spearman, que
la chi-cuadrado indica si hay o no correlación, pero no el sentido ni la intensidad de la mis-
ma. Por ello algunos lo llaman simplemente coeficiente de asociación.
154
Capítulo 10: Correlación y regresión
χ2
2 × 1→ Φ =
n
χ2
k × 1→ C =
χ +n
2
El cálculo de chi-cuadrado tiene una condición de aplicación que consiste en que como
máximo un 20% de las frecuencias teóricas (o esperadas) puede ser inferior a 5. Si esta con-
dición no se cumple, entonces se ha de reagrupar alguna categoría y volver a hacer el cálcu-
lo de la chi-cuadrado desde el principio.
PARCIAL 2 Total
aprobado suspenso
suspenso recuento 10 10 20
Total recuento 50 30 80
155
Estadística básica para educadores
Medidas simétricas
Valor Sig.
aproximada
156
Capítulo 10: Correlación y regresión
G (x 1) T (x 2) E (x 3) X– Sx
Las correlaciones simples halladas en realidad no son exactamente así, porque en cual-
quier caso cada una de las variables que forman una pareja está relacionada también con la
otra. Las tres están intercorrelacionadas.
La correlación parcial permite estudiar la relación entre dos variables, eliminando la influen-
cia de una tercera variable. En general, en un conjunto de m variables, la relación entre dos
de ellas, eliminando la influencia de las restantes. También se podría conseguir lo mismo
con un diseño en el que se controlase el posible efecto de las variables “restantes”, es decir,
las que no se plantean ni como independientes ni como dependientes.
Estudio de la relación entre las variables 1 y 2, eliminando la influencia de la variable 3:
157
Estadística básica para educadores
La correlación simple entre la inteligencia general y la talla es 0,6. Esta es una correla-
ción aparente o espuria y en parte es debido a que la talla está correlacionada con la edad.
Una solución sería estudiar la correlación entre la inteligencia general y la talla eliminando
la influencia de la edad (correlación parcial inteligencia general y talla, eliminando la influen-
cia de la edad).
RGT.E = 0,09
La correlación múltiple permite estudiar la relación entre una de las variables y las otras dos. En
general, en un conjunto de m variables, la relación de una de ellas con todas las otras. Es decir,
nos da una idea de cómo varía la primera variable con relación al conjunto de todas las otras.
158
Capítulo 10: Correlación y regresión
En nuestro caso nos podría interesar el estudio de la inteligencia general (variable depen-
diente) en función de la talla y de la edad (variables independientes).
RG.TE = 0,83
Distribución Distribución
conjunta marginal
Distribución
condicional
159
Estadística básica para educadores
Intersección Pendiente
Como se puede apreciar en el gráfico, la línea pasa por la media de y y x. Pero este mode-
lo puede ser erróneo según los datos, como cuando las variables dependientes son binarias
(por ejemplo: persistencia escolar / abandono escolar). En este caso, la función es inheren-
temente no lineal porque los valores sólo pueden ser 0 (persistencia) y 1 (abandono) y, por
lo tanto, el modelo lineal no es apropiado.
160
Capítulo 10: Correlación y regresión
Para explicar los dos tipos de regresiones que creemos más útiles, la regresión lineal sim-
ple y la regresión múltiple, vamos a utilizar datos que nos resultan conocidos y a los cuales
se puede acceder en abierto a través de la web de la OCDE (Organización para la Coope-
ración y el Desarrollo Económico).
En concreto, vamos a utilizar datos del programa PISA. PISA es el Programa para la
Evaluación Internacional de Estudiantes de la OCDE, una evaluación internacional estan-
darizada que evalúa, en los países de la OCDE y países asociados, hasta qué punto el alum-
nado que está acabando la educación secundaria obligatoria ha adquirido conocimientos y
habilidades que son esenciales para la plena participación en la sociedad. El alumnado que
participa en el Programa PISA tiene 15 años, y los tests se administran habitualmente entre
4.500 y 10.000 alumnos en cada país participante. Hasta el momento se han realizado cin-
co de estas evaluaciones en los años 2000, 2003, 2006, 2009 y 2012.
Para ilustrar los ejemplos de regresiones lineales simples y múltiples utilizamos datos de
PISA 2003. Específicamente, utilizamos los datos relativos al alumnado español. La mues-
tra final consistió en 9.317 alumnos.
Medidas
161
Estadística básica para educadores
Las regresiones lineales simples sirven para examinar cómo una variable influye en otra,
en el sentido de en qué grado una de ellas predice la otra. Empecemos con el modelo
simple de dos variables. Por ejemplo, con relación a los datos de PISA podemos estar
interesados en estudiar el grado en el que el nivel educativo de la madre (variable pre-
dictiva) influye en el rendimiento académico en lectura de los hijos. En otras palabras,
la regresión lineal simple se puede utilizar para explorar la capacidad del nivel educati-
vo de la madre de explicar los resultados académicos de los estudiantes en el área de lec-
tura.
La medición del nivel de estudios de la madre se coge de las respuestas del alumnado a la
siguiente pregunta: ¿Cuál es el nivel de estudios alcanzado por tu madre? El alumnado
responde en una escala que va del 1 al 5 en un continuo que va de “sin estudios” a “ISCED
3A”. Cada nivel de educación se codifica de la siguiente manera: 1. sin estudios, 2. ISCED 1,
3. ISCED 2, 4. ISCED 3B o 3C y 5. ISCED 3A.
ISED es la Clasificación Internacional Normalizada de la Educación elaborada por la
Unesco. El nivel 1 corresponde a la educación primaria o el primer ciclo de la educación
básica. El nivel 2 corresponde a la educación secundaria o la segunda etapa de educación bá-
sica. Los niveles ISCED 3B o 3C corresponden a la educación secundaria superior con acce-
so directo al mercado de trabajo o a programas de ISCED 5B. El nivel ISCED 3A corres-
ponde a la enseñanza secundaria superior, que proporciona acceso a los niveles 5A y 5B
(programas de formación académica superior).
Al realizar la regresión lineal simple con estas variables, encontramos que el nivel edu-
cativo de la madre se relaciona de forma significativa con los resultados de rendimiento en
lectura de las y los estudiantes (B = 11,24, t =17,42, p < 0,001), de forma que para cada
unidad de incremento en el nivel educativo de la madre podemos esperar un aumento de
11,24 puntos en el rendimiento en lectura del alumnado.
El análisis de regresión simple también muestra que el nivel educativo de la madre expli-
ca el 3,16% de la variación en los resultados de los estudiantes en la escala de lectura del
PISA 2003 (R = 0,18, F = 303,6, p < 0,001). Los coeficientes de regresión estandarizados
y no estandarizados y sus valores de significatividad asociados se presentan en el siguiente
cuadro:
162
Capítulo 10: Correlación y regresión
Cuadro 10.7. Resumen del análisis de regresión lineal simple de las puntuaciones
de rendimiento del alumnado en la escala de lectura del PISA 2003 (N = 9,317)
Nota. R2 = ,03
Discusión
El primer análisis de regresiones llevado a cabo con datos del PISA 2003 relativos a resulta-
dos en lectura para España muestra que el nivel educativo de la madre afecta significativa-
mente los resultados en el rendimiento académico en lectura de los estudiantes. A mayor
nivel educativo de la madre, mejor resultado en la escala de lectura del PISA 2003. Especí-
ficamente, por cada unidad de incremento en el nivel educativo de la madre, los resultados
en rendimiento en lectura aumentan una media de 11,24 puntos. Sin embargo, es impor-
tante señalar que aunque el coeficiente de regresión (B) es significativo, el nivel educativo
de la madre sólo puede explicar el 3,16% de la variación en la escala de rendimiento en lectu-
ra del PISA 2003. Esto tiene implicaciones importantes, tanto a nivel analítico como socioedu-
cativo. Por un lado, significa que aunque el coeficiente de regresión es significativo estadís-
ticamente, podría no tener demasiada significatividad práctica, especialmente si consideramos
que la muestra es muy amplia. Por otro lado, este resultado del análisis de regresión simple
implica que es necesario tener en cuenta otros predictores con el objetivo de explorar otros
factores, más allá de los socioeconómicos, que están contribuyendo de forma significativa a
los resultados en lectura de las y los estudiantes.
La poca cantidad de variación en el rendimiento académico de las y los estudiantes en
la escala de lectura del PISA 2003 explicada por el nivel educativo de la madre deja un espa-
cio importante a otros factores para influir el rendimiento en lectura. Es aquí donde adquie-
re sentido llevar a cabo un análisis dirigido a explorar, precisamente, la influencia de otro
tipo de predictores del rendimiento académico en lectura, como podrían ser los factores rela-
cionados con las prácticas implementadas en los centros educativos.
163
Estadística básica para educadores
Un problema con R2 es que puede aumentar (o permanecer igual) con la adición de otras
variables. Esto sucede a coste de “grados de libertad”. Para remediar este problema, necesi-
tamos un enfoque que reduzca R2 cuando se añaden variables que no producen una varian-
za significativa en la variable dependiente. Esto es lo que se consigue con el R2 ajustado.
Para explicar la regresión múltiple, nos centraremos en un tipo de la misma que es espe-
cialmente útil para entender su aplicación práctica. Se trata de la regresión en etapas o por
bloques (en inglés, “block entry regression”).
En la regresión por etapas un grupo de variables o variables sueltas se introducen por
etapas en la ecuación de regresión. Posteriormente, se examinan cambios en los coeficien-
tes de regresión a medida que se introduce cada bloque o etapa. Concretamente, se anali-
zan los cambios en R2 a medida que se introduce cada bloque.
Volviendo a nuestro caso de análisis, puesto que la variable predictiva de tipo socioeco-
nómico “nivel educativo de la madre” explica muy poco de la varianza en rendimiento aca-
démico en la escala de lectura del PISA 2003, podemos llevar a cabo un análisis de regre-
sión múltiple para examinar la contribución de otro tipo de factores (variables predictoras)
en el rendimiento en lectura.
En concreto, en base a los datos disponibles del PISA 2003, creamos tres grupos de pre-
dictores. Un grupo de variables predictoras está relacionado con la familia, otro con las escue-
las, y un tercero con los estudiantes. A nivel familiar diferenciamos entre los factores rela-
cionados con el nivel socioeconómico y los factores relacionados con trasfondo migratorio,
cultural y lingüístico. En el primer grupo de factores socioeconómicos incluimos el nivel
educativo de la madre y el número de libros en el hogar. En el segundo grupo de factores
relativos a inmigración, cultura y lengua, consideramos el país de nacimiento de la madre,
el país de nacimiento del estudiante y el idioma hablado en el hogar. Estos dos grupos de
variables predictoras relacionados con los antecedentes de la familia podrían ser considera-
dos de forma conjunta, como hace PISA 2003, e interpretarse como las características de
los estudiantes con relación al origen socioeconómico. Sin embargo, aquí no asumimos la
condición de inmigrante y el bagaje lingüístico como indicadores de nivel socioeconómico,
sino como factores culturales, tratados como “fondos de conocimiento” (González, Moll y
Amanti, 2005). En cuanto a los estudiantes, se contempla su grado de placer con la lectura.
A nivel de escuela, consideramos los sentimientos de pertenencia a la escuela de los estudi-
antes, la percepción de ser tratados de manera justa por los profesores, la opinión de los estu-
diantes acerca de la ayuda prestada por el centro educativo y también su opinión sobre la
utilidad del aprendizaje escolar.
164
Capítulo 10: Correlación y regresión
B) Variables predictoras
– Placer por la lectura. La medida del “placer por la lectura” del estudiante se toma de
la respuesta a la siguiente pregunta: ¿En qué medida estás de acuerdo con la siguiente
165
Estadística básica para educadores
afirmación? Me gusta leer. Los estudiantes responden en una escala Likert de cuatro
puntos. Cada punto de la escala se ha codificado de la siguiente manera: 1. Total-
mente de acuerdo, 2. De acuerdo, 3. En desacuerdo y 4. Muy en desacuerdo.
166
Capítulo 10: Correlación y regresión
Modelo 1
Nivel de educación de la madre 5,91 9,13 0,00***
Número de libros en el hogar 19,79 28,01 0,00***
Modelo 2
Nivel de educación de la madre 6,15 9,47 0,00***
Número de libros en el hogar 19,40 27,29 0,00***
País de nacimiento del estudiante –5,98 –0,89 0,37
País de nacimiento de la madre –13,46 –2,41 0,02*
Idiomas hablados en casa –19,87 –2,16 0,03*
Modelo 3
Nivel de educación de la madre 5,95 9,21 0,00***
Número de libros en el hogar 18,85 26,57 0,00***
País de nacimiento del estudiante –8,78 –1,32 0,19
País de nacimiento de la madre –13,62 –2,45 0,01*
Idiomas hablados en casa –19,59 –2,14 0,03*
Placer por la lectura –10,22 –10,11 0,00***
Modelo 4
Nivel de educación de la madre 5,76 0,01 9,08 0,00***
Número de libros en el hogar 17,79 0,39 25,47 0,00***
País de nacimiento del estudiante –11,33 –0,22 –1,73 0,08
País de nacimiento de la madre –14,32 –0,09 –2,63 0,01**
Idiomas hablados en casa –13,47 –0,44 –1,50 0,13
Placer por la lectura –6,99 –0,02 –6,88 0,00***
La escuela me proporciona ayuda extra –0,70 –0,00 –0,57 0,57
La escuela me trata de forma justa –6,59 –0,04 –4,84 0,00***
Sentimiento de pertenencia 6,75 0,05 4,53 0,00***
Utilidad del aprendizaje escolar 20,68 0,64 15,60 0,00***
* p < 0,05
** p < 0,01
*** p < 0,001
167
Estadística básica para educadores
168
Capítulo 10: Correlación y regresión
tro a las necesidades de los estudiantes y la utilidad del aprendizaje escolar, y habiendo con-
trolado las variables relativas al nivel socioeconómico, la cultura y el placer por la lectura,
los factores relativos al centro educativo son un predictor significativo del rendimiento de
las y los estudiantes en lectura (p < 0,001).
El efecto de cada nuevo grupo de variables añadidas en los bloques 2, 3 y 4 puede eva-
luarse a través del cambio en la varianza total (R2) del Modelo 1 al Modelo 2, del Modelo
2 al Modelo 3, y del Modelo 3 al Modelo 4. El cambio mayor en varianza explicada ocurre
en el paso del Modelo 3 al Modelo 4 (con un incremento en R2 de 3,41%), al añadir los
factores relativos al centro educativo y habiendo controlado las medidas relativas al “nivel
socioeconómico”, “el trasfondo migratorio, cultural y lingüístico” y “el placer de las y los
estudiantes por la lectura”.
En el cuadro 10.8, el bloque 4 indica cuáles son los predictores significativos del rendi-
miento de los estudiantes en lectura cuando se consideran las diez variables predictoras. Tan-
to el nivel educativo de la madre (B = 5,76, t = 9,08, p < 0,001) como el número de libros
en casa (B = 17,79, t = 25,47, p < 0,001) son predictores significativos del rendimiento en
lectura. Específicamente, por cada unidad que incrementa en el nivel educativo de la madre,
esperamos que el rendimiento de los estudiantes en lectura aumente 5,76 puntos. Para el
caso de número de libros en casa, por cada unidad que aumenta en la escala, se espera que
los resultados de los estudiantes aumenten 17,79 puntos.
El Modelo 4 también muestra que los estudiantes cuyas madres son de España puntúan
más alto (14,32 puntos de media, B = –14,32) que los estudiantes cuyas madres son inmi-
grantes, dejando constantes otras comparaciones y variables. Así mismo, los estudiantes cuyo
país de origen es España puntúan más alto (11,33 puntos de media, B = –11,33) que los
estudiantes que son inmigrantes, dejando constantes otras comparaciones y variables. Los estu-
diantes que hablan español o cualquier otra lengua nacional en casa tienen mejores resulta-
dos en la escala de lectura del PISA 2003 (13,47 puntos de media, B = –13,47) que los estu-
diantes que hablan cualquier otra lengua en casa, dejando constantes otras comparaciones
y variables.
El predictor placer por la lectura es también significativo (B = –6,99, t = –6,88,
p < 0,001). Específicamente, para cada unidad que aumenta en la escala que mide el acuer-
do de los estudiantes con la afirmación “Disfruto con la lectura” se espera una disminución
de 6,99 puntos (B = –6,99, t = –6,88, p < 0,001). Eso indica que cuanto menos placer por
la lectura, peores son los resultados en la escala de lectura del PISA 2003.
Entre los factores relativos al centro educativo, el trato justo por parte del profesorado
(B = –6,59, t = –4,84, p < 0,001), la utilidad del aprendizaje escolar (B = 20,68, t = 15,60,
p < 0,001) y el sentimiento de pertinencia de los estudiantes (B = 6,75, t = 1,49, p < 0,001)
son predictores significativos de los resultados de los estudiantes en lectura. Concretamen-
te, con relación a la variable “trato justo por parte del profesorado”, por cada unidad que
incrementa en la escala que mide el acuerdo de los estudiantes con la afirmación de que el
profesorado les trata justamente, se produce un declive de 6,59 puntos en los resultados de
lectura (B = –6,59, t = –4,84, p < 0,001). Teniendo en cuenta que esta escala va de más a
menos acuerdo, esto muestra que a más trato injusto por parte del profesorado, peores son
169
Estadística básica para educadores
los resultados en lectura. Para el caso de la utilidad del aprendizaje escolar, por cada unidad
que aumenta en la escala que mide el grado de acuerdo de los estudiantes con la afirmación
“el aprendizaje escolar es una pérdida de tiempo”, se espera que los resultados de los estu-
diantes en lectura disminuyan 20,68 puntos.
De esta forma, cuanto mayor es la percepción de la utilidad del aprendizaje escolar,
mejor son los resultados en lectura. En relación con el sentimiento de pertenencia a la escue-
la, por cada unidad que aumenta en la escala que mide el acuerdo de los estudiantes con la
afirmación “me siento un extraño en la escuela”, se espera un aumento de 6,75 puntos en
la escala de lectura (B = 6,75, t = 4,53, p < 0,001). Esto indica que a mayor sentimiento de
pertenencia a la escuela, mejores son los resultados de los estudiantes en lectura. Entre el
placer de los estudiantes por la lectura y los tres predictores relacionados con el centro edu-
cativo, la variable que muestra más capacidad de predecir el rendimiento de los estudiantes
en la escala de lectura del PISA 2003 es la utilidad del aprendizaje escolar (percibida por los
estudiantes) (B = 20,68, t = 15,60, p < 0,001).
La comparación entre el bloque 3 y el bloque 4 indica que cuando se añaden los facto-
res relativos al centro educativo, la diferencia en la media de resultados entre los estudian-
tes españoles y los inmigrantes aumenta 2,56 puntos, y la diferencia en la media de resul-
tados entre los estudiantes que hablan español u otras lenguas nacionales en casa y los
estudiantes que hablan otra lengua disminuye 6,13 puntos. La comparación entre los blo-
ques 3 y 4 también muestra que la habilidad de la variable predictora “placer por la lectu-
ra” de predecir el rendimiento en lectura disminuye 3,23 puntos cuando los factores relati-
vos al centro educativo se tienen en cuenta y el resto de predictores se controlan.
D) Discusión
En relación con la literatura, los resultados del análisis de regresión lineal simple confirman
lo que ha sido repetidamente mostrado desde inicios de los setenta: el estatus socioeconó-
mico, a menudo medido a través de la educación de los padres, es un factor que incide en
los resultados académicos de los hijos (Baudelot y Establet, 1976; Bourdieu y Passeron, 1977;
Bowles y Gintis, 1976). Esto ha servido a los autores reproduccionistas para explicar cómo el
capital cultural heredado de la familia y el contexto social influye en el rendimiento acadé-
mico y posteriormente en las oportunidades de inclusión laboral y social. Sin embargo,
Europa tiene que mirar más allá del modelo de la reproducción. Hoy, los políticos, admi-
nistradores, profesores, familias y comunidades necesitan saber especialmente, no qué fac-
tores socioeconómicos y prácticas educativas incrementan la exclusión social, sino que están
pidiendo a los investigadores conocer las prácticas educativas que contribuyen al éxito esco-
lar de todos. Eso es lo que es útil en la práctica educativa diaria y los científicos sociales con-
temporáneos tienen muchos elementos que nos ayudan a aclarar estas cuestiones (CREA,
2006-2011).
Teorías e investigaciones previas ya han demostrado que la promoción de interacciones
culturales y educativas entre estudiantes y agentes sociales y, más específicamente, con miem-
170
Capítulo 10: Correlación y regresión
bros de la familia, aumenta el rendimiento académico (Vygotski, 1978). Pero lo que ha ocu-
rrido es que los cuestionarios internacionales han traducido esta contribución en indicadores
como el nivel de titulación de los padres o el número de libros en casa. Esta reducción ha con-
ducido al error de tomar estos indicadores como los únicos, despreciando de esta forma otros
importantes como si las familias participan en algún tipo de actividad educativa o no. Desde
esta perspectiva, se ha argumentado que deberíamos esperar hasta que haya padres con titula-
ción superior para que sus hijos tengan éxito en la escuela. Pero existen muchas evidencias que
nos mueven más allá de ese determinismo (Hidalgo, Epstein, Siu, 2002; INCLUD-ED Con-
sortium, 2009). Por ejemplo, algunos programas de participación y formación de familiares
promueven interacciones educativas y culturales y han conducido a estudiantes cuyas familias
tienen pocos libros en casa o bajo nivel educativo a conseguir resultados académicos excelen-
tes en su rendimiento académico. Sobre la base de estas evidencias, se han desarrollado políti-
cas educativas que aumentan el éxito académico de todos los niños a través de la promoción
de este tipo de formación de familiares y de la comunidad.
De hecho, la poca variación en las puntuaciones de rendimiento de los estudiantes en la
escala de lectura del PISA 2003 explicada por el nivel educativo de la madre refuerza esta
idea, ya que indica que se necesitan muchos otros factores, tales como los relacionados con las
actuaciones llevadas a cabo en las escuelas, para predecir el rendimiento de los estudiantes
en lectura.
Por esta razón, después de los resultados de la regresión lineal simple, el siguiente paso
fue explorar la capacidad de otro tipo de factores de predecir el rendimiento de los estu-
diantes en lectura. La regresión múltiple por etapas ha mostrado que las variables cultura-
les influyen en el rendimiento en lectura más allá de los dos predictores relativos al nivel
socioeconómico. Además, la regresión por etapas ha indicado que el placer de los estudian-
tes por la lectura influye en el rendimiento en lectura por encima de las variables predicto-
ras relativas al nivel socioeconómico y a la cultura. Los factores relacionados con el centro
educativo contribuyen a predecir los resultados en lectura por encima de lo que lo hacen los
predictores referentes al nivel socioeconómico, la cultura y el placer por la lectura. Concre-
tamente, es el grupo de factores relacionados con el centro educativo el que explica la mayor
variación en los resultados en lectura, habiendo controlado las variables relativas al nivel
socioeconómico, la cultura y el placer por la lectura. Este resultado está en la línea de lo que
explica mucha investigación en ciencias de la educación: que las escuelas deben y pueden
compensar las desigualdades a través de implementar actuaciones educativas de éxito que
aseguren los mejores resultados para todos, independientemente de cualquier diferencia
socioeconómica o cultural del alumnado (Elboj et al., 2002; Flecha, 2000; Freire, 2003;
Giroux, 1988; Ladson-Billings, 1994).
El placer por la lectura, que era un predictor significativo del rendimiento de los estu-
diantes en lectura en los modelos tercero y cuarto, queda afectado por la incorporación de
variables relativas al centro educativo. Es decir, el placer por la lectura pierde fuerza predic-
tiva cuando se tienen en cuenta las variables relacionadas con el sentimiento de pertenen-
cia, el trato justo por parte del profesorado, recibir ayuda extra, y la utilidad del aprendiza-
je escolar.
171
Estadística básica para educadores
Finalmente, debemos tener en cuenta que nuestro último modelo, el Modelo 4, deja
sin explicar un 80% de la varianza en el rendimiento en lectura. Se trata de un porcentaje
elevado. Este resultado revela, por una parte, que es necesario introducir otros factores den-
tro de cada uno de los cuatro grupos de predictores que hemos creado y, por otra parte, que
otros grupos de factores deberían ser explorados como predictores del rendimiento en lec-
tura. Además, la poca significatividad de las etapas o bloques 2 y 3, que explican muy poco
de la varianza del rendimiento en lectura, podría ser resultado de una muestra muy amplia.
También, en la interpretación de los resultados de esta regresión múltiple tiene que tenerse
en cuenta que PISA 2003 no escogió la muestra de estudiantes de forma aleatoria y que
podrían estarse dando efectos de interacción entre las variables estudiadas.
Para la reflexión…
Para la realización de los siguientes ejercicios de reflexión abre la matriz que puedes encon-
trar en www.sintesis.com. Asegúrate de que tienes instalado en el ordenador el paquete esta-
dístico SPSS (una versión de prueba es accesible en: http://www.spss.com/downloads/).
• Analiza si existe correlación entre el examen final y cada uno de los parciales.
• Realiza un estudio de regresión sobre el examen final para un alumno que tiene una pun-
tuación de 9 en el primer parcial. Ilustra las conclusiones con gráficos de dispersión.
• Haz un estudio de correlación entre el número de asignaturas aprobadas y la nota
obtenida en selectividad. Utiliza el coeficiente de correlación que consideres más ade-
cuado.
• Realiza un estudio para ver la relación entre las variables sexo y opción de bachillerato
elegida por los jóvenes. Utiliza la prueba que consideres más adecuada.
• Realiza un estudio de correlación entre el examen final y los tres primeros parciales
(no incluimos el cuarto porque no seguía la ley normal).
172
ANEXO 1
La explotación y el uso
de los datos secundarios
Uno de los aspectos más importantes de utilizar la estadística como herramienta en las inves-
tigaciones sociales y educativas es el uso de los llamados datos secundarios. ¿Qué es un dato
secundario? ¿De dónde sacarlos? ¿A dónde hay que ir para encontrarlos? ¿Cómo seleccio-
narlos? ¿Existen criterios a tener en cuenta a la hora de utilizarlos? Todas estas preguntas, y
otras muchas son cruciales para un buen uso de la información que tenemos a disposición.
Hoy en día las tecnologías de la información y de la comunicación nos permiten el acceso
a miles y miles de datos, disponibles en la Red. Pero, antes de poder usarlos, o para poder
usarlos correctamente, primero tenemos que tener claros ciertos criterios de uso. En este
capítulo vamos a hacer un repaso de los datos que se suelen utilizar en las investigaciones
educativas y sociales, cómo encontrarlos, cómo mirar cómo están construidos y, por tanto,
qué tener en cuenta a la hora de usarlos en nuestros estudios.
Un dato secundario es todo aquel que no hemos construido nosotros mismos, sino que
ya ha sido elaborado por alguien (normalmente una empresa o una organización que se
dedica a ello, por ejemplo el Instituto Nacional de Estadística (INE), el Instituto de Esta-
dística Europeo (Eurostat), la Organización para la Cooperación y el Desarrollo Económico
(OCDE), entre otros muchos). Como nosotros no hemos sido quienes hemos elaborado
los datos, tenemos que conocer perfectamente cómo esas organizaciones y empresas han
construido los datos, cómo organizaron la matriz, definieron los códigos y construyeron
los diferentes ítems que podemos luego consultar a través de Internet. En varios casos
(como en el caso de la OCDE, o en el caso de Eurostat, por poner solo dos ejemplos),
podemos incluso obtener ficheros de microdatos a través de la red. Esos microdatos siem-
pre vienen acompañados de un fichero donde se especifica cómo se codificaron los datos,
para saber cómo importarlos en programas de software (como el SPSS) y poder usarlos
luego correctamente.
173
Estadística básica para educadores
Cuando se hace un estudio el marco teórico que hemos escogido es el que orienta los pasos
que vamos dando a la hora de hacer la investigación. Cuando llegamos al apartado del tra-
bajo de campo, tenemos que decidir si usar datos cuantitativos, cualitativos o una combi-
nación de ambos. La decisión depende de los objetivos del estudio, de qué información que-
remos encontrar y si queremos hacer una descripción del fenómeno que estamos estudiando,
si buscamos relaciones estadísticas causales, si queremos analizar la opinión de las personas
implicadas en la realidad que estamos estudiando, etc.
Si decidimos usar datos cuantitativos, entonces bien podemos optar por hacer una encues-
ta y construir nosotros mismos el cuestionario, recoger los datos, construir la matriz, depu-
rarla y usarla para sacar frecuencias, cruces de variables y realizar pruebas estadísticas como
las que se han descrito en las páginas anteriores; o bien podemos decidir usar datos ya exis-
tentes (datos secundarios). Con estos datos se pueden aplicar las mismas técnicas estadísti-
cas que se han comentando hasta aquí. Sin embargo, como se puede adivinar, hay que tener
en cuenta la naturaleza de las variables que nos dan (si son categóricas, ordinales, nomina-
les), si los datos están agrupados o no (y si es que sí, de qué tamaño son los intervalos), si
las variables siguen la ley normal, o bien siguen una t de Student, o una F de Snedecor, o
cómo están construidos los índices que nos dan (qué conjuntos de variables los forman
y cómo están construidos). Si conocemos toda esa información, entonces podemos estar
seguros de usar los datos secundarios con toda confianza, aplicando correctamente las dife-
rentes técnicas estadísticas. Ahora bien, ¿dónde buscar esos datos?
Si necesitamos datos de ámbito europeo tenemos dos fuentes básicas de información que
deberíamos explotar: Eurostat y OCDE. En la OCDE disponemos de los Informes PISA (de
periodicidad trianual) y también de un informe muy utilizado en educación, Education at
a Glance (de periodicidad anual). En Eurostat disponemos de una serie de indicadores que
se plasman en tablas estadísticas ya elaboradas y también en informes y publicaciones que
nos pueden resultar de mucho interés, así como una base datos a través de la cual podemos
trabajar los datos estadísticos. Destacaremos solo las principales fuentes de datos relativas a
educación.
El programa PISA, desde su creación en 2000, ha tenido y sigue teniendo mucho peso
dentro de los debates en torno a los resultados académicos del alumnado. Su impacto se deja
notar en ámbitos como la investigación educativa, donde se utiliza muy habitualmente para
reforzar o rebatir argumentaciones teóricas. Se trata de un programa de la OCDE a través
del cual se evalúan los resultados académicos del alumnado de 15 años de los países de la
OCDE y otros países socios.
En el informe PISA 2009 participaron 65 países. Por un lado, los países de la OCDE:
Alemania, Australia, Austria, Bélgica, Canadá, Chile, Dinamarca, Dubái, Eslovenia, Espa-
174
Anexo 1: La explotación y el uso de los datos secundarios
ña, Estados Unidos, Estonia, Finlandia, Francia, Grecia, Holanda, Hungría, Irlanda, Islan-
dia, Israel, Italia, Japón, Korea, Luxemburgo, Méjico, Noruega, Nueva Zelanda, Polonia,
Portugal, Reino Unido, República Checa, República de Eslovaquia, Suecia, Suiza, Turquía.
Y además, también contó con la colaboración de los siguientes países: Albania, Argentina,
Azerbayán, Bulgaria, Brasil, Colombia, Croacia, Hong-Kong, Indonesia, Jordania, Kazajis-
tán, Letonia, Liechtenstein, Lituania, Macao, Panamá, Perú, Qatar, República de Kirguis-
tán, República de Montenegro, República de Serbia, Rumanía, Rusia, Shanghái, Singapur,
Tailandia, Taipei, Trinidad y Tobago, Túnez, Uruguay.
175
Estadística básica para educadores
vés de los cuestionarios que responden tanto directores de escuelas como alumnado, PISA
extrae los datos necesarios para poder establecer esas relaciones. También ha generado otro
tipo de cuestionarios para obtener más información y que, dependiendo de la edición del
Informe PISA, se ha puesto en marcha de manera optativa en los países participantes.
A través de los cuestionarios se consigue información relativa, por ejemplo, a los recur-
sos que posee el centro escolar, las prácticas educativas que se utilizan en la escuela o el con-
texto socioeconómico del alumnado y los procesos de aprendizaje.
La muestra del alumnado de cada país se confecciona por conglomerados (ver capítulo
5). Primero se eligen las escuelas y dentro de cada una de ellas se elige al alumnado que for-
ma parte de la muestra final. La selección por conglomerados facilita la comparación de
resultados entre escuelas que separan al alumnado por niveles de habilidad y las que no lo
hacen, ya que se dispone de datos de diversos estudiantes de cada escuela y no del alumna-
do que no tiene ninguna relación entre sí.
Las escuelas se seleccionan de manera aleatoria, dependiendo su probabilidad de ser ele-
gidas del número de alumnado de 15 años que posean. Una vez seleccionadas las escuelas
se escoge al azar el alumnado de 15 años que formará parte de la muestra. Existen algunos
motivos de exclusión, como por ejemplo que la escuela se ubique en un lugar remoto o que
la persona seleccionada tenga alguna discapacidad.
El cómo está construida la muestra es un criterio relevante a tener en cuenta. No es
lo mismo que la muestra se haya elegido de manera aleatoria, que el que sea una mues-
tra intencional. En el primer caso las técnicas estadísticas explicadas en este libro se pue-
den usar sin problemas. En el segundo caso, hay que ser muy cautos porque los resulta-
dos no se van a poder generalizar en ningún caso (sí que se puede, en cambio, aplicar la
estadística descriptiva). Por otro lado, usar el método de conglomerados o un muestreo
aleatorio simple también es crucial a la hora de usar los datos y buscar si son o no repre-
sentativos. No es lo mismo que la muestra mantenga las proporciones (de género, de
etnia, de país de procedencia, etc.) que tienen los diferentes grupos que forman parte de
la población o que esos grupos estén sobrerrepresentados (o infrarrepresentados) según
los azares de la selección de la muestra (ver capítulo 5). Saber que PISA sigue un método
de selección de la muestra, por tanto, es un dato relevante a la hora de usar su matriz de
datos.
Partiendo del informe PISA 2009 vamos a ver cómo explorar su página web para encon-
trar los datos que necesitamos.
En la web podemos encontrar varias páginas con información general del programa de
evaluación PISA. Los datos útiles para la investigación social y educativa los tenemos en el
apartado “What PISA produces?”. Dentro de esta sección podemos encontrar: informes, bases
de datos, descripción de los instrumentos (cuestionarios, etc.), entre otra serie de informa-
ciones.
176
Anexo 1: La explotación y el uso de los datos secundarios
La figura anterior muestra el contenido de PISA 2009, donde destacan los informes rela-
tivos a resultados y al marco conceptual, la base de datos que puede descargarse para traba-
jar, perfiles interactivos, informes técnicos y manuales.
En los informes se recogen los datos que la OCDE ha considerado más relevantes,
elaborados de la forma que han creído más conveniente. Por lo tanto, no consta en ellos
toda la información que puede obtenerse de los datos de PISA, sino solo lo que se ha cre-
ído más importante. De todas maneras, si queremos obtener los datos “brutos” para con-
feccionar nosotros mismos nuestras variables e índices, entonces tenemos que ir no a infor-
mes sino a la base de datos, para conseguir los ficheros de microdatos, como se verá más
adelante.
Los informes de PISA, al estar este programa orientado al diseño de políticas, no con-
sisten solo en tablas de datos, sino que contienen un análisis de la situación de los diferen-
tes países, de características de las escuelas que tienen relación estadística con los resultados,
tanto a nivel de calidad como de equidad, y posibles explicaciones que sitúan los datos en
un marco que permite un análisis de los mismos. Junto con los informes, hay tablas de datos
descargables en formato Excel. Estas tablas en Excel son susceptibles de poder ser trabaja-
das para nuestros estudios. Por ejemplo, a partir de una tabla Excel, se pueden obtener grá-
ficos adecuados a aquello que queramos estudiar; o bien podemos hacer cálculos con el pro-
grama Excel, como encontrar medidas de dispersión y de tendencia central, que nos permitan
sintetizar la información y presentarla de una manera más rápida o más comprensible para
la audiencia de nuestro trabajo. En estos casos, cuando usemos el programa Excel, debemos
177
Estadística básica para educadores
tener en cuenta cómo funcionan las fórmulas estadísticas para hacer los cálculos de mane-
ra correcta.
También tenemos que considerar la naturaleza de los datos (no se puede calcular una
media aritmética de datos nominales, por ejemplo, puesto que no tiene sentido; en cambio
de una ordinal o una de intervalo, sí que se puede calcular). Por otro lado, si queremos “mez-
clar” datos (como por ejemplo generar una tabla con resultados académicos por niveles edu-
cativos en varios países), es preciso recordar que a veces los intervalos no tienen la misma
amplitud.
En la web de PISA también encontramos las bases de datos de los diversos estudios
realizados. Si entramos, por ejemplo, en “PISA 2009 Database”, nos encontramos con
tres secciones que nos permiten explorar los datos de PISA 2009 más allá de lo que apa-
rece en los informes. Estos datos adicionales están orientados sobre todo a las personas
interesadas en la investigación educativa. En la sección “Download the PISA 2009 dat
set” encontramos los datos de más bajo nivel de elaboración, esto es, los resultados de los
cuestionarios y los tests que se han aplicado a estudiantes, por países. Los cuestionarios y
sus correspondientes libros de codificación se encuentran en formato pdf. Los datos reca-
bados se ofrecen en archivos de texto plano (.txt), que son importables desde múltiples pla-
taformas diferentes (SPSS, SAS, Excel, etc.). De esta manera, si alguien quiere usar dichos
datos, únicamente tiene que bajarse los archivos de control con SAS o SPSS y luego impor-
tar los datos en .txt. Una vez abiertos los ficheros .txt, se ejecutan los archivos de control (se
pueden encontrar instrucciones más precisas en el “PISA 2003 Data Analysis Manuals for
SPSS and SAS users”.
Finalmente, los datos por países de cada pregunta de test y de cuestionarios se pueden
encontrar en los llamados compendia, en formatos tanto .doc como .xls (Word y Excel, res-
pectivamente).
De todas maneras, la web de PISA (igual que otras webs que ofrecen datos de libre dis-
posición) cuenta con una interfaz que permite la consulta de datos de manera sencilla e
intuitiva. Por ejemplo, si en aras de los requerimientos del estudio que estamos haciendo
necesitamos mirar por países qué porcentajes del alumnado tienen determinadas caracterís-
ticas o están en escuelas con determinadas características y qué resultados obtienen estas dis-
tintas tipologías de alumnado, podemos usar la herramienta “Interactive data selection” que
genera tablas exportables a Excel.
En cambio, si lo que necesitamos es el mismo grupo de datos del ejemplo anterior, pero
desde una perspectiva multidimensional (por ejemplo, resultados de países por sexo de los
estudiantes, y por si la escuela donde se escolariza es pública o privada), entonces usamos la
herramienta “Multi-dimensional Data Request”. Esta herramienta nos envía por email un
archivo Excel con tablas en las que se indican los porcentajes de estudiantes y sus resultados
conforme a la petición que hemos realizado, y seleccionando los casos de la matriz según las
dimensiones que hemos escogido (en total se pueden establecer hasta cuatro dimensiones
simultáneamente).
Además de lo comentado anteriormente, PISA también nos da la oportunidad de con-
sultar las preguntas de los tests. PISA usa preguntas que son comunes en distintas ediciones
178
Anexo 1: La explotación y el uso de los datos secundarios
de diferentes tests, que son preguntas ancla que sirven para poder comparar los resultados
en los estudios longitudinales. Estas preguntas, como es obvio, no pueden hacerse públicas,
pues de este modo estarían disponibles por si algún país o escuela quisiera prepararlas, adul-
terando así los resultados. Sin embargo, para que el público en general y las personas inves-
tigadoras puedan conocer el tipo de preguntas que se hace en PISA, hay algunas de estas
preguntas que están abiertas y disponibles para el público. Las preguntas que se hacen públi-
cas se sustituyen en las ediciones siguientes, para evitar el efecto de sesgo que se menciona-
ba anteriormente.
Otra fuente de datos que se utiliza de forma muy habitual en educación es Education at
a Glance (disponible en Internet). Dentro de esta página encontramos una serie de valio-
sas estadísticas que podemos consultar, como por ejemplo los indicadores de la OCDE
relativos a educación de diferentes años o bases de datos relativas exclusivamente a edu-
cación.
179
Estadística básica para educadores
180
Anexo 1: La explotación y el uso de los datos secundarios
sus estudios e informes. Algunos de estos nos son de gran valor, ya que nos aportan datos a
nivel nacional desglosados por Comunidades Autónomas y a nivel internacional viéndose
el lugar que ocupamos en comparación con otros países europeos.
Algunas temáticas interesantes que podemos trabajar con los datos que nos ofrece el
INE son, por ejemplo, la participación de personas adultas en educación formal y no for-
mal, el gasto público en educación o la vinculación entre el nivel de estudios y el mercado
de trabajo. Para acceder a ellos, el INE dispone de una herramienta que muestra las dife-
rentes variables existentes en la base de datos. En esta herramienta seleccionamos las varia-
181
Estadística básica para educadores
bles de las que queremos extraer las tablas de frecuencias, o bien cruzarlas con otras varia-
bles, y el propio sistema nos ofrece los datos, que podemos importar en Excel o en fichero
de datos de texto plano (.txt).
182
Anexo 1: La explotación y el uso de los datos secundarios
183
Estadística básica para educadores
Vamos a retomar algunos de los ejemplos utilizados en el apartado anterior para profundi-
zar en cómo se encuentran estructurados los datos que necesitamos utilizar para las investi-
gaciones o actividades formativas que nos propongamos. En algunas de las páginas web
comentadas existen apartados de metodología donde se explica de forma detallada el pro-
ceso que se ha seguido para la obtención de los datos. En otros casos contamos tan solo con
la definición de los indicadores, sin poder disponer de informaciones complementarias sobre
la muestra o los márgenes de error.
Es importante siempre acudir a las fuentes más reconocidas e ir directamente a los datos
que necesitamos. Si queremos datos estadísticos que constan en el informe PISA 2009 debe-
mos ir a la OCDE y buscarlos. Puede resultar contraproducente consultar otras fuentes que
han explotado esos datos, ya que han podido incurrir en algún tipo de error, especialmen-
te si los han reelaborado.
Si el profesorado de un centro escolar se encuentra realizando un estudio sobre el éxito
escolar de su alumnado en comparación con otros centros educativos de su comunidad autó-
noma, es necesario que tenga muy presente el cómo, desde los órganos educativos autonó-
micos, llevan a cabo los informes sobre evaluación de competencias que le podrían servir
para evaluar esta cuestión. Se deberían tener en cuenta, por ejemplo, la muestra, los erro-
res, los cuestionarios que se han aplicado, quiénes han participado en el estudio, cómo se
ha seleccionado la muestra, cómo se han recogido los datos, cómo se ha realizado su poste-
rior explotación, etc. En el caso del INE, por ejemplo, se utilizan diversas formas para reco-
ger los datos existentes. Entre otras, las siguientes son ejemplo de ello: por censo, enumera-
ción por muestreo, combinación de censo y muestreo, por enumeración completa de datos
administrativos originales y por formulario estadístico individual. Además de conocer la
metodología de recogida de datos es básico también saber cómo han sido recogidos. En este
caso, el INE utiliza la entrevista personal directa, la conversación por teléfono, la transcrip-
ción de documentos administrativos, la autoenumeración por correo o de cualquier otra
forma, la observación directa de los hechos y las formas mixtas.
A veces comparamos datos de manera indiscriminada, como si fueran de la misma natu-
raleza, o se hubieran construido de la misma manera. Sin embargo, no siempre es así y hay
que tener mucho cuidado en cómo se usan los datos, porque, al hacerlo, podemos juntar
muestras de poblaciones diferentes, lo cual es un error estadístico grave que nos lleva a con-
clusiones incorrectas. Volviendo al ejemplo del INE, si estamos utilizando sus datos esta-
dísticos, es importante entrar en el apartado del Inventario de Operaciones Estadísticas de
la Administración General del Estado (IOE) y constatar la metodología empleada para la
obtención de los datos. La metodología de recogida de datos que utilizan establece tres gran-
des grupos: la obtención directa de datos estadísticos; utilización de fuentes administrati-
vas; obtención de estadísticas derivadas de otros resultados estadísticos y recopilaciones.
Si queremos, por ejemplo, consultar los datos relativos a la Encuesta sobre la Participa-
ción de la Población Adulta en las Actividades de Aprendizaje (EADA), debemos leer deteni-
damente toda la información relativa a cómo ha sido diseñada y puesta en marcha (en este
184
Anexo 1: La explotación y el uso de los datos secundarios
185
Estadística básica para educadores
Podemos obtener los cuestionarios del alumnado y de las escuelas. De esta forma, dis-
ponemos de las preguntas que han sido realizadas y nos hacemos una idea de las variables
con las que podremos trabajar. Una vez hemos examinado los cuestionarios pasaríamos a
elegir los países que nos interesan para extraer las tablas y las variables de alumnado y de
escuelas.
En conclusión...
Como hemos podido comprobar, usar datos estadísticos ya elaborados no es tarea fácil. No
solo hay que saber dónde buscarlos. También tienen que estar dentro de un marco teórico
y responder a las preguntas de investigación que guían nuestro trabajo. Además, cuando usa-
mos datos que han hecho otras personas, tenemos que ser extremadamente cautelosos por-
que no sabemos las condiciones en las que los han elaborado, cómo se ha seleccionado la
muestra, a qué poblaciones se refieren y si son comparables con otras fuentes de datos, o no.
Cuando vemos una tabla de datos, tenemos que desarrollar un espíritu crítico: no creernos
de entrada nada de lo que veamos; preguntar siempre de dónde salieron los datos, quién los
elaboró, cómo, cómo se agruparon, etc. Estas son preguntas fundamentales que, si las tene-
mos en cuenta, evitarán en muchos casos malas prácticas y que hagamos afirmaciones que
no son correctas y que pueden generar visiones sesgadas de la realidad. Nuestra responsabi-
lidad como investigadores está en juego.
Para la reflexión...
2003 2008
UE (27 países) 5,14(1) 5,07(1)
Alemania 4,70 4,55
Austria 5,57 5,46
[.../...]
186
Anexo 1: La explotación y el uso de los datos secundarios
187
Estadística básica para educadores
188
Anexo 1: La explotación y el uso de los datos secundarios
2. Analizando los datos que nos aporta la sección de participación de personas adultas
en actividades educativas formales y no formales en la web del INE, podríamos lle-
gar a concluir que, a mayor nivel de estudios, mayor es la participación de las per-
sonas adultas. Ese dato nos podría inducir a afirmar que las personas más formadas
son las que más se interesan por seguir formándose y que aquellos y aquellas que no
poseen un cierto nivel de estudios no participan por falta de interés, porque no les
motiva formarse. Fíjate en el siguiente cuadro:
189
Estadística básica para educadores
Country Variable Category % (%SE) Mean (SE) Mean (SE) Mean (SE)
Spain SC08Q01 1 6.87 (1.22) 460 (5.58) 474 (7.16) 486 (7.74)
Spain SC08Q01 2 38.67 (3.39) 458 (4.53) 475 (4.52) 484 (4.77)
Spain SC08Q01 3 45.28 (3.58) 461 (3.96) 483 (3.59) 490 (3.83)
Spain SC08Q01 m 9.18 (1.73) 474 (10.46) 489 (9.20) 501 (9.80)
OCDE Total SC08Q01 1 7.60 (0.75) 475 (3.92) 484 (4.17) 491 (5.27)
OCDE Total SC08Q01 2 46.39 (1.19) 494 (2.43) 487 (2.11) 496 (2.10)
OCDE Total SC08Q01 3 37.87 (1.08) 485 (1.82) 489 (1.83) 495 (1.81)
OCDE Total SC08Q01 m 8.14 (0.66) 449 (4.54) 437 (7.65) 443 (7.56)
OCDE Average SC08Q01 1 10.35 (0.36) 482 (3.97) 492 (3.69) 495 (3.34)
OCDE Average SC08Q01 2 33.30 (0.50) 485 (2.19) 491 (1.87) 493 (1.82)
OCDE Average SC08Q01 3 48.21 (0.57) 501 (1.37) 506 (1.29) 509 (1.33)
OCDE Average SC08Q01 m 8.86 (0.37) 488 (2.66) 490 (2.73) 492 (2.70)
a - The category does not apply in the country concerned. Data therefore missing
c - There are too few observations to provide reliable estimates
m - Missing or invalid response category
OCDE Average - the average of the valid percentages and mean performance of OCDE countries.
OCDE Total - (OCDE as single entity) - each country contributes in proportion to the number of 15-year-olds
enrolled in its schools.
190
ANEXO 2
Software estadístico en las ciencias
sociales y educativas: el caso del SPSS
Las personas que nos dedicamos actualmente a la investigación en ciencias sociales y edu-
cativas no necesitamos muchas veces hacer complejos y tediosos cálculos matemáticos para
llegar a los resultados numéricos que andamos buscando. Ese tipo de procesos ya están sis-
tematizados y se pueden realizar utilizando programas informáticos especializados. Lo impor-
tante, en nuestro trabajo, es saber, por un lado, interpretar qué dicen los resultados que arro-
jan los programas informáticos y, por otro, qué operaciones podemos pedirles a dichos
programas que hagan.
El software estadístico está preparado para calcular virtualmente cualquier cosa que le pida-
mos (si tiene una base numérica). Pero no todo lo que podemos pedirle al programa es váli-
do, matemática y estadísticamente hablando. En este anexo explicaremos cómo utilizar el pro-
grama más usado en ciencias sociales y educativas para hacer cálculos estadísticos, el SPSS
(Statistics Package for Social Sciences) y qué nos dicen las herramientas que contiene. Para la
confección de este anexo hemos utilizado la versión 18, que se denomina PASW statistics 18
(http://support.spss.com/productsext/statistics/documentation/18/clientindex.html).
En cualquier manual de SPSS podemos ver cómo funcionan los diferentes menús. No
vamos a detenernos en ese punto; ya existen muchos manuales donde puede encontrarse
esta información y nuestro interés se centra en resaltar los elementos básicos para trabajar
con datos cuantitativos o cualitativos en una investigación (Green y Salking, 2005). Para
llevar a cabo análisis estadístico con el programa SPSS es necesario seguir una serie de pasos
que podríamos concretar de la siguiente manera:
1. Introducir los datos en el programa. Para ello es necesario definir primeramente las
variables y posteriormente introducir los datos obtenidos con cada instrumento de
medida. Una vez introducidos, los guardaremos con la extensión .sav.
191
Estadística básica para educadores
2. Depurar la matriz minimizando algunos posibles errores y adecuar los datos a los
análisis que pretendemos realizar, transformando o creando nuevas variables a par-
tir de las existentes, si procede.
3. Seleccionar el procedimiento a seguir. Habitualmente, dentro de las posibilidades
existentes con el programa, desplegaremos el menú “analizar”, donde dispondremos
de las opciones de análisis de datos más utilizadas.
4. Realizar el análisis. Pediremos al ordenador todas las pruebas que nos interesen den-
tro de la ventana ANALIZAR.
Cuando encendemos el programa SPSS, aparece una pantalla que es una hoja con celdas
dispuestas en filas y columnas, a lo largo y ancho de la pantalla (algo así como una hoja de
cálculo de Excel). En esta pantalla es donde se introducen los datos numéricos que hemos
recogido durante el trabajo de campo. Más adelante ya veremos que los datos pueden pro-
ceder de fuentes primarias (los podemos haber elaborado/obtenido nosotros mismos) o bien
pueden proceder de fuentes secundarias (bases de datos ya existentes, que bien se pueden
importar o bien se pueden reelaborar teniendo en cuenta la manera como han sido elabo-
rados, para no desvirtuarlos ni usarlos de manera incorrecta).
192
Anexo 2: Software estadístico en las ciencias sociales y educativas: el caso del SPSS
existente, crear una consulta mediante el asistente para bases de datos, abrir un origen de
datos existente o abrir otro tipo de archivo. Si es la primera vez que entramos debemos bien
ir a la opción de introducir datos y aceptar o bien cancelar y aparecerá igualmente la pan-
talla de vista de datos y vista de variables (figura inferior).
193
Estadística básica para educadores
194
Anexo 2: Software estadístico en las ciencias sociales y educativas: el caso del SPSS
195
Estadística básica para educadores
En la figura anterior vemos cómo han sido definidas las variables de sexo, edad y nivel
de estudios. En estos casos, se trata de variables numéricas y el formato no ha sido alterado.
En la columna de “valores” han sido introducidos todos los valores necesarios para que el
programa identifique las diferentes opciones que las personas encuestadas tenían a la hora
196
Anexo 2: Software estadístico en las ciencias sociales y educativas: el caso del SPSS
Vista de datos
En segundo lugar, introduciremos los datos relativos a cada caso. Para ello, iremos a vista de
datos y añadiremos la información. Si se trata de un cuestionario, deberíamos primeramente
codificar todas las posibles respuestas que las personas encuestadas puedan proporcionar-
nos. Esta información es la que hemos debido introducir previamente al darle “valores” a
cada variable.
En la matriz cada fila corresponde con un caso (una persona que haya respondido un
cuestionario, por ejemplo) y cada columna es una variable (que puede corresponder, o no,
con una pregunta del cuestionario). A veces las preguntas de los cuestionarios son de múl-
tiple respuesta, de manera que en cada pregunta encontramos más de una variable. La codi-
ficación del cuestionario tiene que ser una tarea previa para asegurarnos después que vamos
a ser capaces de organizar la información de manera correcta (es decir, eficiente). Se reco-
mienda siempre hacer una prueba piloto, para ver si el cuestionario funciona y si está bien
estructurado, para ser luego vaciado en una matriz de datos coherente.
Cuando encendemos SPSS, la pantalla que aparece por defecto suele ser la pantalla de
entrada de los datos: es una tabla, donde en cada celda apuntamos el dato correspondiente.
197
Estadística básica para educadores
198
Anexo 2: Software estadístico en las ciencias sociales y educativas: el caso del SPSS
datos perdidos (que el SPSS indica con una coma o un punto en el visor de la matriz
de datos).
Supongamos que queremos analizar la relación existente entre el tipo de agrupamiento
en el aula y los resultados académicos obtenidos por países, en los diferentes niveles educa-
tivos. Vamos a la matriz, localizamos las columnas correspondientes a: “tipo de agrupación”,
“país”, “nivel de estudios” y “resultados obtenidos en PISA”, y las cruzamos. El programa
nos construye una tabla de frecuencias cruzadas (CROSSTABS), donde nos dice, del país
A, los que están “dentro del aula”, en el “nivel educativo de secundaria”, obtienen tal o cual
nota en PISA. De ahí deducimos que en secundaria, si los estudiantes están juntos, enton-
ces sacan mejor (o peor nota) que si están separados en clases diferentes. Pero surge un pro-
blema, la variable “nivel educativo” no es homogénea (cada país tiene su propio sistema edu-
cativo, y lo que aquí es primer curso de secundaria, en otro país puede ser séptimo curso de
primaria, por ejemplo); por tanto, no son datos comparables, porque estamos hablando de
cosas diferentes. Sin embargo, el SPSS construirá una tabla, con números, y nos la mostra-
rá cuando le pidamos los resultados. Por eso hay que estar tan alerta a la hora de usar datos
secundarios y siempre preguntarse qué tipo de datos tenemos y si son (o no) equiparables
entre sí (por ello, es fundamental ir al documento explicativo de cómo usar los datos de
SPSS disponible en la web de PISA).
Al usar datos de fuentes primarias este tipo de problemas desaparece, pero entonces apa-
recen otra serie de amenazas que debemos tener en cuenta para no cometer errores. Lo fun-
damental radica en definir de manera correcta todas las variables y no mezclar datos. Por
ejemplo, si estamos llevando a cabo un estudio longitudinal y cambiamos un poco una de
las preguntas (porque nos hayamos percatado de que las categorías de respuesta no estaban
del todo bien orientadas), no la podríamos analizar de manera conjunta, al menos sin rea-
lizar una serie de operaciones que puedan permitirlo.
Hay que tener en cuenta una serie de consideraciones. Si los datos nuevos son más agre-
gados que los datos previos, entonces la unidad de agregación que debe prevalecer es la nue-
va. En otras palabras, si en un primer momento pedimos a cada persona entrevistada su edad
y luego nos damos cuenta de que con pedirles que se sitúen en una escala agrupada de 10
en 10 años es suficiente, a la hora de analizar la variable “edad”, en los cuestionarios origi-
nales tendremos que reagrupar la variable edad en grupos de 10 en 10, para que sean com-
parables. En SPSS eso es fácil: simplemente tenemos que crear una variable nueva “edad_2”,
recodificada (Green y Salking, 2005).
Cuando abrimos el SPSS y entramos en un archivo nuevo o bien abrimos uno existente,
estamos entrando en lo que se llama “editor de datos”. Hay dos componentes esenciales del
editor de datos: el modo de vista de datos, que es donde aparece la matriz (es decir, toda la
información que hemos recogido con las encuestas); y el modo de vista de variables, que es
la pantalla donde aparecen todas las variables que tenemos, definidas de acuerdo al tipo, a
199
Estadística básica para educadores
200
Bibliografía
201
Estadística básica para educadores
Campos, A. (2004). Laplace: Ensayo filosófico sobre las probabilidades. Revista Colombiana de Esta-
dística, 27(2), 153-177.
Cardano, G. (1998). Llibre dels jocs d’atzar. Antologia mínima. Santa Coloma de Gramanet: Casa del
mestre.
Chomsky, N. (1967). The responsibility of intellectuals. The New York Review of Books.
Christian, K., Morrison, F.J., & Briant, F.B. (1998). Predicting kindergarten academic skills: Inter-
actions among child care, maternal education and family literacy environments. Early Childho-
od Research Quarterly, 13(3), 501-521.
Cochran, W. G. (1971/ 1980). Técnicas de muestreo. México: C.E.C.S.A.
Coleman, J.S., Campbell, E.Q., Hobson, C.J., McPartland, J., Mood, A.M., Weinfeld, F.D. et al.
(1966). Equality of educational opportunity. Washington, D.C.: National Center for Education-
al Statistics.
Comer, J. (1980). School power. New York: The free press.
CREA (2006-2011). INCLUD-ED. Strategies for inclusion and social cohesion from education in Europe.
INTEGRATED PROJECT, Priority 7, Sixth Framework Programme of the European Com-
mission.
CREA (2001-2005). AMAL: Inmigración y mercado laboral. Plan Nacional de Investigación Cientí-
fica, Desarrollo e Innovación Tecnológica. Ministerio de Ciencia y Tecnología.
Darwin, Ch. (1998). L’origen de les espècies. Barcelona: Edicions 62.
De Moivre, A. (1967). The doctrine of chances: A method of calculating the probabilities of events in
play. New York: Chelsea.
Downie, N.M. & Heath, R.W. (1970). Basic Statistical Methods. New York: Harper & Row.
Duncan, O.D. (1966). Path analysis: sociological examples. American Journal of Sociology, 72, 1-16.
Durkheim, E. (1998). El suicidio. Madrid: AKAL.
Edgeworth, F.Y. (1923). Statistics of examinations. Journal of the Royal Statistical Society, 86(1), 59-
60.
Efron, B. (1979). Bootstrap Methods: Another look at the Jackknife. The Annals of Statistics, 7(1),
1-26.
Elboj, C.; Puigdellívol, I.; Soler, M.; Valls, R. (2002). Comunidades de aprendizaje. Transformar la
educación. Barcelona: Graó.
Epstein, J. & Dauber, S. (1991). School programs and teacher practices of parent involvement in inner-
city elementary and middle schools. Elementary School Journal, 91, 291-305.
Epstein, J.L. (1986). Parent involvement: Implications for limited-English-proficient parents. In C.
Simich-Dudgeon (Ed.), Issues of parent involvement and literacy. Washintong DC: Trinity col-
lege.
EUROSTAT. Education at a glance. http://www.oecd.org/document/54/0,3746,en_2649_
37455_38082166_1_1_1_37455,00.html
EUROSTAT. European Office of statistics. http://epp.eurostat.ec.europa.eu/portal/page/portal/euro-
stat/home/
EUROSTAT. Labour force survey. http://epp.eurostat.ec.europa.eu/portal/page/portal/ labour_mar-
ket/introduction
Fermat, P. (1894-1912). Oeuvres de Fermat. Publiées par Paul Tannery et Charles Henry. Paris: Gau-
thier-Villars.
Fermat, P. (1989). Precís des ouvres mathématiques. Sceaux: Gabay.
Fisher, R. A. (1949). Métodos estadísticos para investigadores. Madrid: Aguilar.
202
Bibliografía
203
Estadística básica para educadores
Jordan, G.E., Snow, C.E. & Porche, M.V. (2000). Project EASE: The effect of a family literacy pro-
ject on kindergarten students’ early literacy skills. Reading Research Quarterly, 35, 524-546.
Jöreskog, K.G., Sorbom, D. (2006). LISREL 8.8 for Windows. Lincolnwood, IL: Scientific Software
International Inc.
Kendall, M. (1956). The beginnings of probability calculus. Miometrika, 43, 1-14.
Kendall, M. (1961). The book of fates. Biometrika 48, 220-222.
Kline, M. (1968). Mathematics for the nonmathematician. New York: Dover.
Kolmogorov, A. (1956). Foundations of the theory of probability. New York: Chelsea Pub. Co.
Ladson-Billings, G. (1994). The dreamkeepers: Successful teachers of African American children. San
Francisco: Jossey-Bass.
Laplace, P. S. (1774) Mémoire sur la probabilité des causes par les événements, en «Memoires de mathé-
matique et de physique, presentés à l’Académie Royale des Sciences, par divers savans» 6.
Laplace, P.S. (1985). Ensayo filosófico sobre las probabilidades. Bilbao: Instituto Técnico de Materia-
les y Construcciones.
Lazarsfeld, P.F. (1961). Notes on the history of quantification in sociology. Trends, sources and pro-
blems. Isis, 52(2).
Legendre, A. M. (1811-1817). Exercices de calcul intégral sur divers ordres de trascendantes et sur les
quadratures. Paris: Ve. Courcier.
Legendre, A.M. (1805). Nouvelles methodes pour la détermination des orbites des comètes. Paris: Courcier.
LLECE. Latin American Laboratory for Assessment of the Quality of Education. http://portal.unesco.org/geog-
raphy/en/ev.php-URL_ID=7919&URL_DO=DO_TOPIC&URL_SECTION=201.html.
Mantel, N., Tukey, J., Ciminera, J.L., Heyse, J.F. (1982). Tumorigenicity assays, including use of the
Jackknife. Biometrical Journal, 24(6), 579-596.
Merton, R. (1977). La sociología de la ciencia: Investigaciones teóricas y empíricas. Madrid: Alianza.
Ministerio de Educación y Ciencia. (2007). PISA 2006. Programa para la Evaluación Internacional
de alumnos de la OCDE. Informe español. Madrid: Secretaría General Técnica.
Montfort, R. (2006). Essay d’analyse sur les jeux de hazard. AMS: Chelsea Publishing (v.o. 1708).
Mulaik, S.A. and Brett, J.M. (1982). Causal analysis: assumptions, models, and data. Beverly Hills:
Sage Publications.
OCDE. Programme for International Student Assessment (PISA). http://www.pisa.oecd.org/
pages/0,2987,en_32252351_32235731_1_1_1_1_1,00.html.
OCDE. (2008). Education at a Glance 2008: OECD Indicators. Documento disponible en:
http://www.oecd.org/dataoecd/23/46/41284038.pdf.
Pacioli, L. (1994). Summa de arithmetica, geometria, proportioni et proportionalita. Madrid: Asocia-
ción española de Contabilidad y Administración de Empresas.
Pascal, B. (1998). Oeuvres complètes. Paris: Gallimart.
Pearson, E. S. (1938) Karl Pearson: An Appreciation of some Aspects of his Life and Work. Cambridge:
University Press. [citas de la trad. esp.: Pearson, creador de la estadística aplicada. Buenos Aires:
Espasa-Calpe, 1948].
Pearson, E.S.; Kendall, M. (Eds.) (1970). Studies in the History of Statistics and Probability. Charles
Griffin & Company Limited: London.
Pearson, K. (1914-1930). Life and letters of Francis Galton. Cambridge: University Press.
Peña, D. (1986). Estadística y métodos I. Fundamentos. Madrid: Alianza Universidad Textos.
Peña, D. y Romo, J. (1997). Introducción a la estadística para las Ciencias Sociales. Madrid: McGraw-
Hill.
204
Bibliografía
Pérez, C., Santín C. (2007). Minería de datos: técnicas y herramientas. Madrid: Thomson Editores.
Petty, W. (1691). The political anatomy of Ireland. Economic Writtings. Vol. 1.
Piovani, J.I. (2005). Los orígenes de la estadística: de investigación sociopolítica empírica a conjun-
to de técnicas para el análisis de datos. Reflexiones. Revista de ciencias sociales de la Universidad de
Palermo, 1(1), 1-20.
Poison, S.D. (2005). Recherches sur la probabilité des jugements en matière criminelle et en matière civi-
le. Elibron Classics.
Poisson, D. (1837). Recherches sur la probabilité des jugements en matière criminelle et en matière civi-
le. París: Bachelier, Imprimeur-libraire.
Porter, Th. (1986). The rise of statistical thinking, 1820-1900. Princeton: University Press.
Quetelet, A. (1844). Recherches statistiques. Bruxels: Hayez.
SACMEQ. Southern and Eastern Africa consortium for monitoring educational quality.
http://www.sacmeq.org/
Sánchez, J. (1987). Proyecto docente e investigador para Estadística. Universidad de Murcia.
Sierra Bravo, R. (1981). Ciencias sociales: análisis estadístico y modelos matemáticos: teoría y ejercicios.
Madrid: Paraninfo.
Sierra Bravo, R. (1985). Técnicas de investigación social: teoría y ejercicios. Madrid: Paraninfo.
Sierra Bravo, R. (1992). Análisis estadístico multivariable: teoría y ejercicios. Madrid: Paraninfo.
Snedecor, G. W y Cochran, W G. (1971). Métodos Estadísticos. México: C.E.C.S.A.
Spearman, C.E. (1927). The abilities of man: their nature and measurement. London: Macmillan.
Stevens, S.S. (1946). On the theory of scales measurement. Science, 103, 677-680.
Stingler, S.M. (1986). The history of statistics. The measurement of uncertainity before 1900. Cam-
bridge, MA: Harvard University Press.
Thurstone, L.L. (1925). The fundamentals of statistics. New York: The Macmillan company.
Torrado, M. (2001). Estadística descriptiva básica. Barcelona: Ediciones UB.
UNESCO. Institute for Statistics. Global monitoring report on education. http://www.unesco.org/
new/en/education/themes/leading-the-international-agenda/efareport/
Vilà, R. y Bisquerra, R. (2004). El análisis cuantitativo de los datos. En Bisquerra, R. (Ed.) Metodo-
logía de la investigación educativa (pp. 259-271). Madrid: Editorial La Muralla.
Visauta, B., & Batallé, P. (1986). Métodos estadísticos aplicados. Tomo II: Estadística inferencial. Bar-
celona: PPU.
Woessmann, L. & Schutz, G. (2006). Efficiency and equity in European Education and Training Sys-
tems. Analytical report for the European Commission prepared by the European Expert Net-
work on Economics of Education. http://e-demos.iacm.forth.gr/index.php/europefocus/332-
eenee-2006.
Wright, S. (1921). Correlation and causation. Journal of Agricultural Research, 20, 557-585.
Yepes, M. (2006). ¿Cómo puedo pasar una base de datos de EXCEL a SPSS? Butlletí La recerca, 5.
Documento disponible en: http://www.ub.edu/ice/recerca/pdf/ficha5-cast.pdf
Yule, G. U. (1954). Introducción a la estadística matemática. Madrid: Aguilar.
205