Está en la página 1de 143

ganz1912

La certeza absoluta
y otras ficciones
Los secreto s de la estad ística

Pere G rim a

E i mundo es matemático
L

I
•i

*
1*Í

i
g a n z1 9 1 2

La certeza absoluta
y otras ficciones
Los se cre to s de la e stad ística

P e re G rim a

EL muwA o es wutóemático
g an z1912

A A licia y Pau

© 2010, Pere Grima por el texto


© 2011, R B A Coleccionables, S.A.

Realización: E D I T E C
Diseño cubierta: Lloreng Martí
Créditos fotográficos: age fotostock

Reservados todos los derechos. Ninguna parte de esta


publicación puede ser reproducida, almacenada o transmitida
por ningún medio sin permiso del editor.

ISBN:978-84-473-6962-1
Depósito legal: NA-1082-2011

Impreso y encuadernado en Rodesa,Villatuerta (Navarra)

Impreso en España - Printed in Spain

https://tinyurl.com/y794dggv
https://tinyurl.com/y9malmmm
Sumario

Prefacio ..................................................................................................................... 9
Capítulo 1. Estadística descriptiva: cómo sacar la información
relevante de una maraña de datos .............................................................. 11
Preludio histórico: la gran epidemia de cólera de 1854 .................................... 11
A la caza del criminal ........................................................................................ 12
La fuerza de un gráfico......................................................................................... 13
Resumiendo los datos (1): medidas de tendencia central ................................. 15
La media aritmética ............................................................................................... 15
La mediana .............................................................................................................. 17
M o d a ........................................................................................................................ 17
Resumiendo los datos (2): medidas de dispersión ................................................. 19
R a n g o ...................................................................................................................... 19
Varianza y desviación típica................................................................................. 19
Coeficiente de variación ...................................................................................... 21
Resumiendo los datos (y 3): medidas de posición ............................................. 23
C uartiles.................................................................................................................. 23
Percentiles ............................................................................................................ 24
Porcentajes: parecen inofensivos pero son peligrosos ......................................... 26
Cuestiones generales .......................................................................................... 26
N o es lo que parece: la paradoja de Sim pson................................................... 27
Representaciones gráficas de una variable........................................................... 28
Representaciones de la relación entre dos variables .......................................... 36
Atención: las escalas pueden engañar....................................................................... 39

Capítulo 2. Cálculo de probabilidades: criterios para movernos


en un m undo de incertidumbre .................................................................. 43
Cálculo de probabilidades y estadística................................................................ 45
La probabilidad y sus leyes ...................................................................................... 48
Regla de la «o» .................................................................................................... 51
Regla de la «y» .................................................................................................... 51
Contando casos .................................................................................................. 51
Aplicando las reglas............................................................................................ 52

5
SUMARIO

El azar tiene familias ................................................................................................ 55


U na que ya hemos visto: la distribución binomial ....................................... 55
De los muertos por coz de caballo en el ejército prusiano a los goles
en la liga española de futbol: la distribución de Poisson........................ 58
La campana de Gauss o distribución normal ................................................ 61
Otras distribuciones. Reflexión final sobre los modelos «teóricos» .......... 67
U n entretenimiento: probabilidades sorprendentes............................................. 68
Falsos positivos ..................................................................................................... 68
El problema del cum pleaños............................................................................. 69
La combinación ganadora sale dos veces ....................................................... 71
Números seguidos en La Primitiva ................................................................. 72

C apítulo 3. C onocer el todo mirando una p a r t e .......................................... 75


¿Cuántos peces hay en un lago? ¿Cuántos taxis hay en una ciu dad?.............. 76
Peces ...................................................................................................................... 76
T axis....................................................................................................................... 80
¿Qué proporción de hogares tiene conexión a Internet? ................................. 83
«El Partido A aventaja al Partido B en 3,6 puntos» ............................................ 87
La pregunta del millón ....................................................................................... 87
¡Sorpresa! El tamaño de la muestra casi no depende del tamaño
de la población..................................................................................................... 90
¿Le hace falta sal a la so p a ?................................................................................ 90
¿Cuál es mi grupo sanguíneo?.......................................................................... 90
El poder lo da la aleatoriedad ................................................................................. 92
La encuesta que cambió las encuestas: Landon frente a Roosevelt ........... 93
Sorteos polémicos para el servicio m ilitar...................................................... 94
Encuestas «informales» ....................................................................................... 95
¿Sí o sí? Influencia de cómo se formulan las preguntas............................... 96
Suena el teléfono. . . pero usted no está en su casa. Las encuestas
telefónicas ...................................................................................................... 97
U n caso particular: los sondeos electorales........................................................... 97
La intención de voto va cam biando................................................................ 97
¿A quién votarán los indecisos?........................................................................ 98
La falta de sinceridad en las respuestas............................................................ 99
Del porcentaje de votos al número de escaños ............................................. 99
Pero la estadística sí funciona............................................................................... 100

6
SUMARIO

Capítulo 4. C óm o razonamos para tomar decisiones


(eso que llamamos «contraste de hipótesis») ........................................... 101
El razonamiento ante la catadora de t é ................................................................ 102
El peso, la estatura, el coeficiente de correlación y su significación
estadística............................................................................................................. 105
Esquema de razonamiento: el contraste de hipótesis ......................................... 108
¿Y si no puede rechazarse la hipótesis n u la?................................................. 109
Otro ejemplo: ¿estaban equilibrados los dados?.................................................. 111
Hasta aquí, sí; a partir de aquí, no: fronteras para el p-valor ............................. 114

Capítulo 5. ¿Es mejor? ¿Es más eficaz? C óm o diseñar pruebas


para responder a estas p regu n tas................................................................. 117
Un estudio a gran escala: la vacuna contra la poliomielitis .............................. 117
El interés y las peculiaridades de la poliom ielitis......................................... 118
El grupo de control ........................................................................................... 119
Dos grupos «lo más parecidos posible»: control por placebo
y diseño «doble ciego» ................................................................................ 120
Necesidad de tomar una muestra muy gran de............................................. 122
Resultados ........................................................................................................... 122
El papel de la estadística. La poliomielitis h o y .............................................. 123
Aspirina e infarto ..................................................................................................... 123
Tabaco y cáncer de pulm ón................................................................................... 125
Aleatorización y bloqueo ....................................................................................... 127
Hágalo usted mismo ................................................................................................ 131
¿Sirve una cucharilla para mantener el gas en una botella de cava? ......... 131
¿Realmente sabe elegir si el melón está en su pu n to ?................................. 132
¿Sirve la aspirina para que las flores duren m ás?........................................... 132
¿Duran más las pilas caras?................................................................................ 133
¿Sirven las bolsas de agua para espantar las moscas? ..................................... 137

B ib lio g rafía............................................................................................................... 139

Índice analítico ........................................................................................................ 141

7
!
Prefacio
La estadística es una disciplina que suena familiar. Estamos acostumbrados a oír ha­
blar de ella en los medios de comunicación: un estudio (estadístico, claro) dice que
baja el consumo de tal sustancia entre los jóvenes, los resultados de una encuesta
afirman que tal político está mejor valorado que tal otro, o que si hoy se hicieran
las elecciones ganaría tal partido con tantos puntos de ventaja. Hasta en los partidos
de fútbol se comenta que las estadísticas dicen, por ejemplo, que tal equipo marca
más goles en la segunda parte. Curiosamente, aunque hablamos de estadística para
referirnos a esta- disciplina, las «estadísticas» en plural son simplemente datos. Qué
información se puede sacar de los datos y cuál es el grado de fiabilidad de esa in­
formación (eso es «estadística» en singular) no siempre son cuestiones evidentes.
A veces la estadística también se considera un terreno poco serio. Que diga algo
no quiere decir que ocurra, y es muy posible que ese equipo de fútbol que siempre
marca en la segunda parte esta vez no marque ningún gol. En esto contrasta con las
matemáticas, que tienen una imagen mucho más seria. Si un equipo es «matemá­
ticamente campeón», será campeón, pase lo que pase. A esta imagen de algo poco
sólido seguramente también ayuda la perplejidad que crea esa habilidad que tienen
los políticos para presentar datos y estadísticas de forma que siempre avalen sus
teorías o sus intereses.
Pero hay mucho más que todo eso. La estadística está presente en muchos ám­
bitos: en la investigación médica (¿es mejor un nuevo fármaco?), en la biología
(¿cuántos ejemplares de cierta especie hay en un territorio?, ¿están en peligro de
extinción?), cuando es necesario realizar previsiones (¿cuánta electricidad se gastará
mañana?), en los estudios de mercado (¿qué tipo de envase gustará más al consu­
midor?), en los estudios sociológicos (¿qué piensan los jóvenes sobre tal tema?), en
economía (¿cuánto han aumentado los precios?), en los estudios de fiabilidad indus­
trial (¿cada cuánto conviene revisar las piezas de un avión?) o en la gestión de la ca­
lidad en las empresas (¿en qué problema conviene concentrar los esfuerzos?). Quizás
esta lista haya salido demasiado larga, pero no es en absoluto exhaustiva: hay muchas
áreas en las que la estadística es fundamental para avanzar en el conocimiento.
La estadística estudia cómo recoger datos (¿cuántos?, ¿de qué forma?) y cómo
analizarlos para obtener la información que perifúta responder a las preguntas que
nos planteamos. Se trata de avanzar en el conocimiento a partir de la observación
y el análisis de la realidad, de una forma inteligente y objetiva. Es la esencia del
método científico.

9
PREFACIO

Este texto hace un recorrido por algunos de los aspectos más interesantes de la
estadística, desde cómo presentar la información mediante gráficos y cómo evitar
que nos metan goles -por seguir con el símil futbolístico- cuando nos los presentan,
hasta cómo planificar la recogida de datos para responder a las preguntas planteadas,
pasando por encuestas, sondeos electorales y la forma de razonar que se encuentra
en todos los tests estadísticos. Tampoco falta una incursión en el cálculo de proba­
bilidades, un tema que quizá para muchos pueda parecer árido y difícil pero que sin
necesidad de entrar en grandes profundidades permite descubrir cuestiones muy
interesantes.
La intención es que la lectura resulte entretenida y formativa. Si en algo lo he
conseguido ha sido gracias a lo que he aprendido de mis compañeros en la Uni­
versidad Politécnica de Cataluña y de profesores apasionados con la enseñanza de
la estadística como Roberto Behar, de la Universidad delValle en Cali, Colombia.
Finalmente, deseo agradecer a Pedro Delicado, Lluis Marco, Lourdes Rodero y X a­
vier Tort-Martorell una detallada lectura de la primera versión de este texto y sus
atinados comentarios y sugerencias que han permitido introducir notables mejoras.

10
Capítulo 1

Estadística descriptiva:
cómo sacar la información
relevante de una maraña
de datos
¿Qué hacer cuando nos encontramos ante un gran conjunto de datos de los que se
pretende extraer alguna información? Sin duda alguna, la primera acción recomen­
dada es «echarles un vistazo», pero no mirándolos tal cual uno detrás de otro -nuestra
mente está poco capacitada para captar información de esa forma-, sino a través de
representaciones gráficas o resumiendo los datos en unos pocos valores que, esos sí,
se pueden mirar e interpretar directamente.

Preludio histórico: la gran epidemia de cólera de 1854


El distrito del Soho es una de las zonas más pintorescas de la capital británica. Su
irresistible mezcla de modernidad y tradición lo convierte en parada obligada para
los numerosos turistas que, año tras año, frecuentan sus locales de impecable diseño
o descansan sus doloridos pies en los encantadores parques que emergen aquí y allá
entre las estrechas callejuelas. Con tal número de atracciones y el trajín característico
del centro de toda gran ciudad es poco probable que se repare en una fiel réplica
de una típica f uente de agua pública del siglo x ix ubicada en una esquina de la calle
Broadwick. Sin embargo, este modesto monumento —porque de un monumento se
trata—conmemora un evento de tal importancia que bien podría alzarse un centenar
de metros e iluminar con un foco el cielo londinense.
Erigida en 1992 en honor del epidemiólogo británico John Snow, la f uente de
la calle Broadwick está desplazada apenas unos metros de otra idéntica que, en 1854,
bombeaba agua procedente delTámesis para su uso por parte de la vecindad. En
agosto de ese año fatídico se declaró en la zona una brutal epidemia de cólera que
al cabo de tres días había matado a más de 100 personas y, a las dos semanas, más

11
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

de 500. Más de tres cuartas partes de la población abandonó sus casas para escapar
así de los vapores malsanos que se creía que era el medio por el que se propagaba
la terrible enfermedad.
John Snow, médico eminente que un año antes había administrado personalmente
cloroformo a la reinaVictoria en ocasión de su séptimo parto, no opinaba lo mismo.
En un texto escrito en 1849 arguyó que el cólera no se transmitía por el aire sino
por el agua. La comunidad médica prestó poca ateneión a sus argumentos, en buena
parte porque no se apoyaban en ninguna teoría concreta acerca de qué era exacta­
mente lo que el agua podía contener que causara la enfermedad. Las convicciones
de Snow se basaban, por el contrario, en un auténtico arsenal de observaciones en
las que se establecía una conexión inexorable entre el líquido elemento y la transmi­
sión del cólera. Se trataba de una evidencia de tipo «meramente» estadístico, de una
relación entre una causa y un efecto para la que, como se ha dicho, Snow no disponía
de explicación. A pesar de ello, tan convincentes fueron las observaciones de Snow, y
tan bien supo exponerlas, que sus contemporáneos no tuvieron más remedio que
aceptar sus tesis y, al hacerlo, la forma en la que las ciudades modernas proveen de
agua a su población inició una transformación radical.

A la caza del cr^^nal

El cólera es una enfermedad terrible cuyos síntomas principales son súbitos e


intensísimos vómitos y diarreas que pueden provocar una deshidratación fatal. La
epidemia de cólera que estalló el 31 de agosto de 1854 fue muy pronto caracte­
rizada como «la peor en la historia del país». Las cifras son espeluznantes: en 72
horas la cifra de víctimas ascendía ya a 127, muchas de ellas niños. A los tres días
del estallido, Snow visitó la zona en compañía del reverendo local Henry W hi-
tehead, y descubrió que la mayor parte de muertes se habían producido en casas
próximas a la fuente pública de agua de la calle Broad en su intersección con la
Cambridge. Snow anotó:

«Al estudiar la zona, hallé que casi todas las muertes habían tenido lugar a poca
distancia de la fuente de la calle Broad. Sólo diez de las muertes se produjeron
en casas cuya fuente de agua más próxima no fuera aquélla. En cinco de esos
casos, la familia me comentó que preferían el agua de la fuente de Broad a
la de la que tenían más cerca, y en otros tres descubrí que las víctimas, unos
niños, pasaban por la fuente de camino a la escuela».

12
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Al examinar la fuente, Snow no halló ningún rastro notable de contaminación.


A continuación consultó los registros forenses e hizo una lista detallada de las muer­
tes de los dos días pasados. Ninguno de los empleados de una fabrica de cerveza
próxima a la fuente había contraído la enfermedad, y un asilo para pobres situado
asimismo en las cercanías, que atendía a más de 500 personas, había registrado un
muy modesto número de cinco casos fatales. Los informes diarios sobre la epidemia
hablaban de nuevas víctimas en zonas alejadas, tales como Hampstead e Islington.
Parecía que la tesis de Snow flaqueaba.
El médico redobló, no obstante, sus esfuerzos. Se paseó edificio por edificio, casa
por casa, y averiguó que tanto el asilo para pobres como la fabrica de cerveza dispo­
nían de su propio pozo de agua y no consumían de la fuente. Una vez en Hampstead,
la familia le informó que la víctima, una mujer, se hacía traer cada día una botella
de agua de la fuente de la calle Broad porque «su sabor le gustaba más». La sobrina
de la mujer, que también había fallecido recientemente de cólera, hacía lo mismo.
«¿Y dónde vivía esa mujer?» podemos casi imaginarnos a Snow preguntando. «En
Islington», fire la respuesta.
El médico escribió, en tono modesto: «La conclusión de mi investigación es, en
consecuencia, que no hay estallido de cólera o presencia destacada de la enfermedad
en esta parte de Londres excepto entre aquellas personas que tenían por hábito beber
agua de la mencionada Arente». U n escueto párrafo que iba a revolucionar la salud
pública en todo el mundo.
El día 7 de septiembre, con la epidemia todavía desatada, Snow solicitó una
reunión urgente con las autoridades locales y les comunicó sus hallazgos. Además
del informe oral, Snow mostró un mapa de la zona en el que había marcado el nú­
mero y la localización de las víctimas. Este mapa resultó tan convincente que al día
siguiente la manija de la fuente fue retirada. El número de muertes cayó en picado
y, en poco tiempo, la epidemia cesó completamente.

L a fu e rz a d e u n g rá fic o

El mapa original de Snow se conserva en la actualidad en el Museo Británico. En


1855 se incluyó una versión mejorada en una edición revisada de su texto de 1849,
un fragmento del cual se muestra a continuación. Seguramente resulta difícil para
el lector moderno hacerse una idea de lo revolucionario del modo en que Snow
presentó los datos de su investigación, ya el uso de las representaciones gráficas es
ahora muy habitual para mostrar la información.

13
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Fragmento del mapa de la zona del Soho donde estalló la epidemia de cólera de 1854.
La fuente de la calle Broad se indica por medio de la leyenda «Pump», en el centro del mapa.
Las rayas horizontales indican las víctimas de cada vivienda.

Al señalizar cada víctima con una marca individualizada -las barras paralelas—,
asignar el mismo peso visual a cada una de ellas y situarlas, vivienda a vivienda,
sobre un mapa convencional, se hace evidente de un único vistazo el componen­
te geográfico de la epidemia. Resulta obvio que la mayor parte de las muertes se
acumulan alrededor de la fuente («pump») de la calle Broad, en el centro del mapa.
Si se completa esta información con el celoso trabajo de campo llevado a cabo por
Snow, la tesis de que el contagio de la enfermedad estaba directamente relacionado
con la fuente no requería de ninguna teoría específica sobre la naturaleza de dicha
relación. Las autoridades locales así lo entendieron, y el resultado de desmantelar la
fuente fue no sólo la erradicación de esa epidemia puntual sino la constatación de
que el cólera podía transmitirse por un medio acuoso. Los experimentos llevados

14
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

a cabo por Louis Pasteur entre 1860 y 1864 serían clave a la hora de consolidar la
teoría de los gérmenes o agentes patógenos, y otorgaron así cobijo teórico postfacto
a las observaciones de Snow. En 1885 el alemán R obert Koch identificó la bacteria
Vibro cholerae como la causante de la enfermedad, y hacia finales de siglo buena parte
de las urbes occidentales habían renovado sus redes de suministro de agua potable,
alejando así el fantasma del cólera de las calles de medio mundo.

Resumiendo los datos (1): medidas


de tendencia central
Si usted tuviera que describir la cara de un sospechoso para que los demás lo pu­
diéramos reconocer seguramente tendría dificultades, a no ser que el sospechoso
tuviera algún rasgo muy destacado. Sin embargo, los expertos de la policía saben en
qué características fijarse y con qué adjetivos describirlas para que otra persona que
también domine ese lenguaje pueda hacerse una idea de cómo es el individuo en
cuestión y, si conviene, también saben cómo dibujarlo para que los demás puedan
identificarlo.
En estadística se hace algo parecido. Para resumir la información de un gran
conjunto de datos se seleccionan unas pocas medidas que concentran la máxima
información y a la vista de ellas -pueden ser 5 o 6 valores- podemos hacernos una
idea bastante fidedigna del comportamiento de los datos en general. Estas medidas
se suelen presentar divididas en tres grupos: de tendencia central, de dispersión y de
posición. En este apartado describiremos las primeras, las cuales indican en torno a
qué valores se encuentran los datos.

La media aritmética

Todos los que, cuando éramos estudiantes, estábamos pendientes de si aprobábamos


o no una asignatura sabemos calcular medias. En una escala de O a 10, si se aprueba
a partir de 5 y la nota final es la media de tres exámenes parciales, se suspende si
se ha sacado 3, 2 y 6, y se aprueba si las notas son 4, 4 y 7 (¿y si son 4, 4,5 y 6,3?).
La media aritmética es la medida de tendencia central por excelencia. Sus buenas
propiedades, junto al hecho de ser fácil de entender y de calcular, hacen que sea
muy popular. También tiene aspectos no tan triviales, como cuando se hacen ope­
raciones con medias. La media de (3, 4, 5) es 4, y la de (4, 6) es 5, pero la media del
conjunto no es la media de las medias (4 + 5)/2 = 4,5, sino 4,4. En general, si tenemos

15
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

un conjunto de nt valores que tiene media y otro de n2 valores con media x ,, la


media del conjunto :XT será:

rtjXj +M,X,
» , + »2

Lo cual es exactamente lo mismo que hacer la media de todos los valores, ya


que si una muestra tiene n datos y su media es x , la suma de todos será riX; así, en
el numerador tenemos la suma de todos los valores y en el denominador, el número
de los que hay.
Veamos un ejemplo. Si en una empresa la edad media de sus trabajadores es de 36
años para los hombres y 32 para las mujeres, ¿cuál es la edad media global? Depende
de la proporción de hombres y mujeres. Si una mitad son hombres y la otra mujeres,
la edad media será de 34 años. Si hay un 75% de hombres y un 25% de mujeres, será
de 35. Obsérvese que en la fórmula anterior la proporción que representa el primer
conjunto de datos es p = n 1/(n ) + n 2) y la del segundo p2 = n2/ ( n + n 2), de modo
que se puede escribir de la forma:

También hay casos en los que la media no es la medida más adecuada. Si se trata
de resumir el tiempo que un proveedor tarda en suministrar un producto, o lo que
tarda un tren entre dos poblaciones, la media es un mal indicador de la calidad del
servicio. Puede ser que el plazo de entrega pactado sea de 10 días y la mitad de las
veces entreguen el material en 2 (el cliente no lo espera, no le cabe en el almacén,
etc.) y la otra mitad en 18 (el cliente ya está desesperado), pero en promedio se está
cumpliendo perfectamente. Lo mismo ocurre con el tren: llegar unos días media
hora antes al trabajo (especialmente si no podemos entrar antes de la hora prevista)
no compensa el que otros días lleguemos media hora tarde. En estos casos, una
medida más informativa sería el porcentaje de veces que se llega tarde o con más
de un cierto retraso.
Otro problema que tiene la media es que es muy influenciable por valores ex­
tremos. Seguramente causará extrañeza saber que la mayoría de las personas tiene
un número de piernas superior a la media, pero esto es así, ya que algunas tienen
sólo una o ninguna (valores extremos), y eso hace que la media esté ligeramente
por debajo de dos.

16
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

La mediana

La mediana es el valor que queda en el centro al ordenar los datos de menor a ma­
yor. Si los datos son: 6, 7, 5, 2 y 9, la mediana es 6 (el que queda en el centro una
vez ordenados). Si el número de datos es par, ninguno queda en el centro, y en este
caso la mediana es el promedio de los dos centrales. Sus propiedades cubren algunos
flancos débiles de la media. Así, es más robusta frente a la presencia de anomalías. Un
ejemplo muy simple: en los datos anteriores la media es 5,8 y la mediana es 6. Si al
introducirlos en el ordenador nos equivocamos y en lugar del 9 introducimos 99, la
media pasa a ser 23,8, mientras que la mediana sigue siendo 6. Cuando se trabaja con
datos todavía no depurados, fijarse en la mediana puede ser más recomendable que
hacerlo en la media, ya que la información que proporciona está menos afectada por
las posibles anomalías que puedan existir.
Otra de las ventajas de la mediana frente a la media es que, atendiendo a su
propia definición, la mediana deja un 50% de las observaciones por encima y otro
50% por debajo.
Si queremos saber, por ejemplo, si en nuestra empresa estamos entre los que
cobran más o entre los que cobran menos, debemos comparar nuestro salario con
la mediana, y no con la media. Si únicamente hay 10 trabajadores y los salarios son
(pongamos que en miles de euros): 0,8, 0,8, 0,9, 0,9, 1,0, 1,0, 1,1, 1,1, 1,2 y 10, todos
menos 1 (en este caso el 90%) están por debajo de la media, que es 1,88. Esto no
pasa nunca con la mediana: si estamos por encima de la mediana, estamos con el
50 % de los que más cobran.
Otro ejemplo. Si un examen se aprueba sacando una nota igual o superior a 5 y
la nota media que ^rn sacado los estudiantes es de 5, no sabemos qué proporción ha
aprobado. Si se han exanunado 50 estudiantes, puede ser que 41 hayan suspendido
con un 4; que 8 hayan sacado un 10 y que 1 haya obtenido un 6. Esto da media 5,
aunque es verdad que son unas notas muy raras. Si la mediana es 5, seguro que la
mitad ha aprobado.

Moda

Cuando se habla de medidas de tendencia central siempre se cita también la moda.


Es el valor que más se repite. Si los datos son O, 2, 7, 2, 8, 2, 5, 4, la moda es 2. Su
uso tiene más sentido con los datos cualitativos. Así, por ejemplo, si en una muestra
de recién nacidos se observa que el color de ojos más frecuente es el castaño, se dirá

17
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

FLORENCE NIGHTINGALE

En el verano de 1853, tras destruir completamente la arma­


da turca, la flota rusa del Mar Negro estaba en condiciones
de tomar Estambul y controlar el estrecho del Bosforo, ame­
nazando tanto las comunicaciones británicas con la India.
como los intereses franceses en el Mediterráneo. Así las
cosas, Inglaterra declaró la guerra a Rusia enviando tropas,
que se sumaban a las francesas y a las turcas, a la península
de Crimea. Era el principio de la guerra de Crimea, que
hasta su finalización en 1856 provocó miles de muertos.
Citada como la peor gestionada de todas las guerras en las que ha participado Inglaterra, es la
primera de la que se tienen fotografías y también la primera que era seguida por reporteros.
Esto puede parecer un detalle sin demasiada importancia, pero resultó que los periodistas expli­
caban en sus crónicas las pésimas condiciones de vida de los soldados y los desastres debidos a
la incompetencia de los militares, lo cual generó un estado de indignación general en la opinión
pública que obligó al ministro de guerra británico a enviar un cuerpo de enfermeras bajo la
dirección de una mujer entregada, inteligente y práctica llamada Florence Nightingale.
Cuando las enfermeras llegaron al hospital el caos era total. Florence Nightingale explicó que
la mayor parte de las defunciones eran debidas a enfermedades infecciosas y no a las heridas
con que los soldados habían llegado. Vio, entendió y documentó con datos la asociación entre
la masificación de enfermos y la tasa de mortalidad, centrando sus actuaciones en mejorar la
limpieza, la nutrición y el orden en los cuidados a los enfermos.
Lo cierto es que durante los siete primeros meses de la guerra, antes de llegar Florence Nightin­
gale, un soldado británico herido en el campo de batalla tenía más posibilidades de sobrevivir
si se quedaba en el frente que si era transportado a un hospital militar. Sin embargo, durante
los últimos seis meses de guerra, tras los cambios introducidos en los hospitales, el ratio de
mortalidad bajó del 40 al 2%.
Florence Nightingale supo elegir los datos que mostraban la realidad tal como era, y realizó los
análisis y las comparaciones adecuadas para entender cuál era el problema y cuáles las medidas
que se debían tomar. Y con esos análisis estadísticos, explicados de forma experta, fue capaz de
enfrentarse a la burocracia y el conservadurismo del ejército y convencer a las jerarquías militares
de la necesidad de dar un cambio radical a las condiciones de los hospitales. Salvó muchas vidas,
y muchos de los procedimientos que introdujo son todavía estándares en los hospitales actua­
les. Florence Nightingale fue la primera mujer admitida en la Royal Statistical Society británica.

18
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

que la moda del color de los ojos es el castaño. N o hay más. Seguramente la razón de
la presencia de la moda en este contexto se debe más a la tradición que a su utilidad.

Resumiendo los datos (2): medidas de dispersión


Seguramente alguna vez le han contado aquello de que si un señor se come un pollo
y otro no se come ninguno, la estadística dice que en promedio se han comido medio
pollo cada uno. O que si uno va a la cocina de su casa y mete los pies en la nevera y
la cabeza en el horno, se le queda el cuerpo a la temperatura media ideal. El problema
es querer resumir la información sólo con promedios sin atender a la variabilidad
que presentan los datos. Otro ejemplo que también pone de manifiesto el mismo
error es identificar el bienestar de los ciudadanos de un país únicamente teniendo
en cuenta la renta per cápita (eso sería el medio pollo que se come cada uno). Si a
usted le hubieran dado a escoger en qué país quería nacer, seguramente le hubiera
convenido fijarse no sólo en la renta per cápita sino también en la variabilidad. Es
mejor nacer en un país donde todo el mundo tiene asegurado un cuarto de pollo
que en otro donde en promedio tocan a medio, pero en el que usted tendría muchas
posibilidades de quedarse sin ninguno. En definitiva, para resumir la información
que contienen los datos es necesario cuantificar también su dispersión, y para ello
se dispone de varias medidas, que veremos a continuación.

Rango

El rango es la diferencia entre los valores máximo y mínimo. Por ejemplo, si los datos
son 2, 6, 7, 12, 12, 18, el rango es 18 —2 = 16. Tiene la ventaja de ser una medida
muy sencilla, pero el inconveniente de que no aprovecha bien la información que
contienen los datos. Utilizar sólo los extremos, que además pueden ser raros, es muy
pobre, especialmente si el conjunto de datos es grande. Si tenemos pocos datos (del
orden de 4 o 5) el rango no es una medida tan mala. Si tenemos sólo dos es tan
buena como cualquier otra, pero en este caso seguramente ya no hace falta resumir.

Varianza y desviación típica

La medida de variabilidad más utilizada es la desviación típica, pero para definirla


es mejor empezar por la varianza, ya que la desviación típica es simplemente la raíz
cuadrada de la varianza.

19
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Si tuviéramos que diseñar una medida de dispersión, la primera idea sería hacer
participar a todos los datos que tenemos, como en el caso de la media. Por ejemplo,
si los datos son 1,2, 4, 7 y 9 podemos calcular el promedio de las distancias de cada
valor respecto a la media, que es 4,6:

(1-4 ,6 ) + (2 -4 ,6 ) + (4 -4 ,6 ) + (7 -4 ,6 ) + (9 -4 ,6 ) _ Q
5 _ '

El problema de esta medida es que siempre da cero, sean cuales sean los valores
considerados y, por lo tanto, no mide nada (da el mismo valor haya mucha o poca
dispersión). La solución más inmediata es utilizar el valor absoluto de las diferencias:

|1 - 4 ,6 |+ |2 - 4 ,6 |+ |4 - 4 ,6 |+ |7 - 4 ,6 | + |9-4,6|
2,72.
5

Esa medida se llama «desviación media» y es una buena medida (a mayor disper­
sión de los datos mayor valor obtenido), pero tiene unas propiedades mucho más
interesantes el valor que resulta resolviendo el problema de que las diferencias se
compensen a base de elevarlas al cuadrado:

(1 -4 ,6 )2 + ( 2 - 4 ,6 ) 2+ (4 - 4 ,6 ) 2 + (7 ~ 4 ,6 )2 + (9 - 4 ,6 )2
_ 9,04.
5

0,6

. 2,6 _ 2 ,4 „
3,6 4,4

1 I I I I 1 I I I I 1 1 I I 1 1 I I I I
»
1 I I 1 1 1 1 1 I I 1 1 1 1 1

I 1 1 1 | 1 1 1
A|
1 1 1 1 1 |
0 1 2 3 4 5 6 7 8 9 10

4, 6

Distancia d e cada valor con respecto a la media (4,6).


La varanza es el prom edio de los cuadrados de esas distancias.

20
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Esto es lo que llamamos varianza, y no sólo sirve para medir la dispersión, sino
que también se encuentra en el meollo de gran parte de la teoría y de los métodos
estadísticos. Se designa como G2^El inconveniente de la varianza es que sus unidades
son las de los datos elevados al cuadrado. Si se trata de longitudes medidas en me­
tros, las unidades de la varianza son metros al cuadrado y esto complica un poco la
interpretación. La solución es muy sencilla, se hace la raíz cuadrada y asunto resuelto.
A este resultado, que designamos como O", se le llama desviación típica, y es
la medida de dispersión por excelencia. Muchas veces la desviación típica hace
pareja con la media para encargarse, sólo ellas dos, de resumir las características
de los datos.

UN POCO DE FORMULACIÓN

La fórmula general de la varianza es:

E n j

a = — —'-----,
N

donde x¡ representa cada uno de los valores que se tienen; ^, su media, y N es el número de
valores. La fórmula correspondiente a la desviación típica es:

<7=

Coeficiente de variación

¿Qué tiene más variabilidad: el peso de los gatos o el de las vacas? Supongamos que
el peso medio de los gatos es de 4 kg y que en el 95% de los casos está entre 3 y 5
kg, y que las vacas de cierto tipo tienen un peso entre 480 y 500 kg, también en el
95% de los casos. Si usted observara un conjunto de gatos vería mucha variabilidad
entre ellos (algunos pesan casi el doble que otros), mientras que las vacas las vería
casi todas iguales.
Sin embargo, la desviación típica del peso de los gatos estará en torno a 0,5 kg
(de acuerdo con el patrón de variabilidad de los pesos, el 95% de los individuos
está en el intervalo media ± dos desviaciones típicas, lo que se verá en el capítulo
siguiente al tratar la distribución normal), mientras que en el caso de las vacas es de
5 kg, 1O veces más, aunque veamos menos variabilidad.

21
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Para resolver esta paradoja que se da en la comparación de variabilidades se


define el coeficiente de variación, que es igual al cociente entre la desviación típica
y la media:

CV = - .
x

Esto se denomina normalizar la variabilidad con respecto a la media. En nuestro


ejemplo, para los gatos tenemos O, 125 y para las vacas 0,01, sin unidades, ya que ésta
es una medida adimensional.

DOS TECLAS PARA CALCULAR LA DESVIACIÓN TÍPICA

La varianza y la desviación típica, a pesar de encontrarse en el centro de la teoría estadística,


tienen un problema que muchas veces se intenta mantener en secreto. Cuando nos ponemos a'

resumir la información que contienen unos datos, podemos encontrarnos en una de las siguientes
situaciones:

1. Los datos que tenemos son el objeto de nuestro interés. Queremos saber la media o la desvia­
ción típica de esos datos, que constituyen lo que denominamos «población».

2. Los datos que tenemos son una muestra de la población objeto de estudio. Es decir, lo que nos

interesa no es tanto conocer la media o la desviación típica de los datos que tenemos como
estimar («hacernos una idea») de esos valores en la población.

A efectos de la media no importa si nos encontramos en un caso o en otro. La fórmula es la

misma, ya que el mejor estimador para la media de la población es la media de una muestra. Es
necesario, como siempre que queremos sacar conclusiones sobre la población a través de una

muestra, que ésta sea representativa.


En el caso de la varianza las cosas cambian ligeramente. Si lo que se tiene es la población, la fór­
mula que hay que utilizar es la deducida anteriormente, pero si lo que se tiene es una muestra y

lo que interesa es estimar la varianza de la población, la fórmula utilizada es la siguiente:

S2 = I > ,-X )- _
n -1

¿Por qué? El problema reside en que cuando se trabaja con muestras, la variabilidad se calcula
en torno a la media de la propia muestra (no en torno a la media de la población, que es lo que

22
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Resumiendo los datos (y 3): medidas de posición


Hay medidas muy utilizadas que no son de tendencia central ni de dispersión. Sirven
para «establecer mojones», delimitar zonas en el conjunto de los datos y así tener una
referencia para la localización de valores.

Cuartiles

Ordenados los datos de menor a mayor, la mediana es el que los separa en dos mi­
tades. El primer cuartil es la mediana de la primera mitad dejando, por lo tanto, el*4

realmente interesa). Podría decirse que la media de la muestra se adapta a los propios datos de la
muestra y esto tiende a minusvalorar la variabilidad de la población. Al dividir por n -1 se obtiene
un valor ligeramente mayor que estima mejor la varianza de la población. Es distinto dividir por
4 que por 3, pero no hay mucha diferencia entre dividir por 100 o por 99. A efectos prácticos,
cuando la muestra es grande, estas disquisiciones dejan de tener relevancia.
No se preocupe si esto le parece un llo y no lo acaba de entender. Siga sin remordimientos y si

alguna vez tiene que elegir, considere que tiene una muestra (fórmula que divide por n -1 ).
Si utiliza algún tipo de software estadístico que no le pregunta, esto será lo que está haciendo.

X : M edia de los datos.

o n: Desviación tipo de los datos cuando lo que


se tiene es toda la población (lo que interesa
es la desviación tipo de «esos» datos).

on-,: Desviación tipo de los datos cuando se tiene


una muestra y lo que se pretende es estimar la
desviación tipo de la población de la que proviene
la muestra.

Funciones estadísticas en una calculadora:


una tecla para la media y dos para la desviación típica.

23
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

25% de valores por debajo y el 75% por encima. La mediana de la segunda mitad es
el tercer cuartil, que deja el 75% por debajo y el 25% por encima.

Menor----- ► 50
52
57
58
59
25%
60
61
• Q1 =61: Primer cuartil.
61
64
Datos ordenados de 75%
68
menor a mayor. 69 50%
71
72
73
t
Me = 75,5: Mediana.
78
78
80
81
i
50%
82
82 75%
84
• Q3 = 86: Tercer cuartil.
90
92
93 25%
94
95
Esquema de obtención de la mediana y los
98
cuartiles en un conjunto de 30 datos.
Mayor *• 100

Así, si en su empresa el primer cuartil de los salarios es de 1.000 € , la mediana


es 1.300 € y el tercer cuartil es de 2.000 € , si usted cobra 800 € está entre el 25%
que menos gana. Si su salario es de 1.500 € está entre la mitad que más gana, pero
como mínimo un 25% de los empleados percibe más dinero que usted. Si cobra
2.100 euros está entre el 25% de privilegiados que más ganan.

Percentiles

El percentil del 15% es el valor que -con todos los datos ordenados- deja por debajo
el 15% y, evidentemente, el 85% por encima. Los cuartiles son los percentiles del 25
y del 75% y la mediana, el más singular, es el del 50%.
Retom ando el ejemplo de los salarios, si el suyo está en el percentil del 70%
significa que el 70% cobran menos que usted (o que el 30% cobran más, si prefiere

24
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

ver el vaso medio vacío).También se usan los percentiles para medir los resultados de
los tests de inteligencia. Si usted está en el percentil del 90% significa que la habilidad
que mide el test la tienen peor que usted el 90% de la población a la que va dirigido.
Muchas personas tienen su primer contacto con los percentiles cuando el pediatra
de su hijo les dice que la estatura del niño está en el percentil del -digam os- 45%.
Esto significa que el 45% de los niños (las referencias son distintas para niños y niñas)
de su edad miden menos que él. La Organización Mundial de la Salud edita tablas y
gráficos de referencia sobre el crecimiento para distintos segien tos de edad.

Gráficos de referencia editados por la Organización Mundial de la Salud


con la mediana y los percentiles del 3, 75, 85 y 97% para las estaturas
de los jóvenes (chicas arriba, chicos abajo) de 5 a 19 años.

25
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Porcentajes: parecen inofensivos pero son peligrosos


Una forma de destacar algún aspecto relevante de los datos es utilizar porcentajes («el
65% de los menores de 10 a 17 años admite que accede a videojuegos para mayores
de edad»), pero los libros de estadística no tratan este tema, quizá porque creen que no
entra en su terreno o bien porque consideran que es demasiado fácil. El símbolo del
porcentaje se ve en las calculadoras más sencillas junto con los de sumar, restar, multi­
plicar y dividir, y éste parece un tema que domina cualquier persona que conozca las
reglas básicas de la aritmética. Sin embargo, los porcentajes se pueden prestar a confu­
siones y malentendidos, por lo que no estará de más entretenerse un poco en este tema.

Cuestiones generales

Siempre se debe tener en cuenta de qué es el porcentaje.Veamos un-ejemplo: un gel


suele venderse en botellas de 750 ce y ahora, por el mismo precio, la botella es de
1.000 ce. ¿Qué porcentaje de gel están regalando? Depende de sobre qué valor se
calcule el porcentaje:sobre el contenido inicial se regala el 33%, y sobre el final, el 25%.
También se debe distinguir entre porcentajes y puntos porcentuales.Así, si se dice
que los beneficios de una empresa han pasado de un 2 a un 4% han aumentado
2 puntos porcentuales (¡pero no un 2%!).
Igualmente se debe distinguir entre porcentajes basados en niveles y porcentajes
basados en cambios de nivel. El siguiente ejemplo aclara esta cuestión. Un vendedor
vendió el año pasado por valor de 10 millones de euros. Su objetivo para este año
era aumentar su facturación en un 6%. El vendedor ha logrado vender sólo por
valor de 10,3 millones. ¿Qué porcentaje de objetivo ha logrado? Si el objetivo es el
incremento, sólo consigue el 50%, pero si se interpreta que el objetivo era vender
10,6 y ha vendido 10,3, ha logrado el 97,2%.
Por último, también hay que andarse con cuidado cuando se realizan opera­
ciones con porcentajes:

1. Si el precio de un producto se aumenta el 20% y después disminuye tam­


bién el 20%, ¿cómo queda el precio final respecto al inicial? N o se queda
como estaba, disminuye un 4%. Si el precio inicial era X , el final será
(X + 0,2X) - 0,2(X + 0,2X) = X - 0,04X.
2. Un producto está formado por 10 componentes y cada componente aumenta
su coste un 2%, ¿cuánto aumenta el coste del producto? Aumenta un 2%. N o

26
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

im p o rta q u e haya u n o s c o m p o n e n te s m u y caro s y o tro s m u y b arato s. Si no lo


v e claro h a g a las cu en tas y se co n v e n c erá.
3. S i Ju a n g a n a u n 1 .0 0 0 % m á s q u e P e d ro , g a n a 11 v e ce s m á s (n o 10). S i g a n a un
100% m ás g a n a el d o b le , si gan a un 2 0 0 % m ás el trip le, etc.

N o es lo que parece: la paradoja de Simpson

C u a n d o se d a n p o rc e n ta je s g lo b a le s c o m p a r a n d o g ru p o s q u e a su v e z c o n tie n e n
v a ria s p a r te s, p u e d e p a r e c e r q u e o c u r r e u n a c o sa c u a n d o en re a lid a d está o c u ­
r r ie n d o o tra . Este fe n ó m e n o se c o n o c e c o n el n o m b r e d e p a r a d o ja d e S im p s o n .
V e a m o s un e je m p lo .
U n a gran c o m p a ñ ía ab re u n a n ueva fá b rica crean d o 2 5 0 p u e sto s d e trab ajo en los
d e p a rta m e n to s d e co m p ra s, m o n ta je y alm a cé n . En total se p resen tan 3 5 5 h o m b re s
y 3 2 5 m u je res, de los cu ales so n a d m itid o s 1 9 0 h o m b re s (el 5 3 ,5 % ) y 6 0 m u je re s (el
18 ,5 % ). S e c o m p r u e b a q u e el nivel de p rep aració n d e h o m b re s y m u je re s es sim ilar
en tre los asp iran tes a cad a d e p a rta m e n to . ¿P o d e m o s ase g u ra r q u e se h a d isc rim in a d o
a las m u je res? L a resp u esta es no. L o s d a to s so n lo s sigu ien tes:

Aspirantes Admitidos % Admitidos


Departamento Plazas
Hombres Mujeres Hombres Mujeres Hombres Mujeres

Compras 30 25 100 5 25 20 25

Montaje 200 250 25 180 20 72 80

Almacén 20 80 200 5 15 6,25 7,5

TOTAL 250 355 325 190 60 53,5 18,5

E n realid ad , en to d o s lo s d e p a rta m e n to s la p ro p o rc ió n d e a d m itid o s ha sid o m a ­


y o r en tre las m u je res. L a clave está en q u e al d e p a rta m e n to q u e o fre ce m ás p lazas se
h an p re se n ta d o m u c h o s h o m b re s y p o c a s m u je re s, m ie n tra s q u e en lo s q u e o fre ce n
m e n o s p lazas o c u rr e lo co n tra rio .
Y u n a c u rio sid a d p ara te rm in a r este a p a rta d o d e p o rc e n ta je s: la n o tic ia cita d a
al p r in c ip io d e q u e el 6 5 % de los jó v e n e s d e l O a 17 a ñ o s a d m ite q u e a c c e d e a
v id e o ju e g o s para m a y o re s d e e d a d , está e x tr a íd a del titu la r d e u n p e r ió d ic o . El
tex to d e la n o tic ia a clara d e d ó n d e sale el 6 5 % : ¡d e l 50% d e lo s c h ic o s y del 15%
d e las ch ic as! (¿ q u é p o rc e n ta je h u b ie ra d ad o si se tratara d e l 50% d e c h ic o s y del
6 0 % d e las ch ic as?).

27
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Representaciones gráficas de una variable


Empezaremos planteándole un reto: el dueño de una panadería está preocupa­
do porque sospecha que las barras de pan que vende tienen un peso demasiado
variable, de forma que algunas pueden estar incluso por debajo de los límites
que marca la ley. Se utilizan dos máquinas para hacer el pan y también trabajan
dos operarios, unos días hace el pan uno y otros días, el otro. La siguiente tabla
contiene los pesos (en gramos) de una muestra de barras de pan que se han ido
recogiendo durante 20 días:

Día Operario M áqi ina 1 M áqi l ina 2

1 A 220,3 215,5 219,1 219,2 220,3 208,0 214,4 219,2

2 B 215,8 222,0 218,9 213,6 216,9 213,4 217,7 217,7

3 B 220,4 218,7 218,6 219,6 222,9 219,7 209,4 221,6

4 B 221,5 227,0 219,5 222,5 223,1 215,3 220,4 215,6

5 A 215,7 225,3 223,0 218,0 216,0 210,9 221,4 210,9

6 A 222,7 215,1 219,6 217,3 212,1 213,0 218,0 216,5

7 A 216,0 218,8 217,9 213,0 216,9 216,0 213,5 219,2

8 B 219,4 218,3 216,7 224,1 216,2 218,4 216,6 214,9

9 B 219,8 222,6 219,1 217,7 216,2 212,2 216,9 214,9

10 A 220,2 219,5 222,4 219,9 222,9 214,3 219,1 216,7

11 B 218,0 223,9 219,6 221,9 214,9 212,6 219,4 213,3

12 B 219,3 219,6 218,8 219,9 219,0 216,7 216,4 213,5

13 B 220,0 214,1 224,3 217,4 218,0 219,5 219,5 222,3

14 A 223,9 220,6 219,5 219,6 211,8 218,2 218,3 217,4

15 A 218,1 218,8 218,4 217,9 214,6 215,7 218,0 216,4

16 B 216,9 221,6 220,6 222,6 215,6 220,4 217,3 216,2

17 B 217,9 225,7 222,2 216,1 212,5 214,6 209,7 211,3

18 A 224,2 216,2 219,9 220,4 215,8 219,9 216,5 211,9

19 A 214,1 219,7 222,4 224,5 213,7 209,7 216,9 213,1

20 A 221,1 225,0 222,7 222,2 212,5 217,5 217,4 215,7

28
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

El peso debe ser de 220 ± 10 gramos y supondremos que estos datos son repre­
sentativos de la producción general. Las preguntas que nos planteamos son: ¿existe
algún problema?, ¿qué está pasando?, ¿qué hay que hacer para resolver el problema,
si es que existe?
Si usted intenta sacar conclusiones simplemente mirando los datos es posible que
se equivoque.Aunque en este caso sólo hay 160 valores, intentar sacar conclusiones «a
ojo» siempre es arriesgado.Tampoco es necesario empezar haciendo grandes cálculos
o aplicando técnicas sofisticadas; basta con representar los datos gráficamente, como
puede ver a continuación.

Tolerancia Tolerancia

Pesos
Histograma de los pesos de 160 barras de pan.

Este gráfico se llama histograma y es m uy útil para analizar la variabilidad que


presentan los datos.
En nuestro ejemplo de la variabilidad del peso de las barras de pan, el histogra­
ma pone de manifiesto que sí existe un problema, ya que aparecen unidades fuera
del límite de tolerancia de una forma natural; es decir, no se trata de excepciones,
sino que forman parte de la variación natural del proceso.
Estratificando por operario y máquina, como muestran los histogramas si­
guientes, se observa que el problema está en la máquina 2, que está descentrada.
N o hay problema en la máquina 1, y los dos operarios se comportan práctica­
mente igual.

29
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Frecuencia Máquina 1 Máquina 2

Pesos Pesos

Operario A Operario B
Frecuencia

Pesos Pesos

Pesos de las barras de pan estratificados por máquina y po r operario.

Incluso cuando se tienen muy pocos datos, por ejemplo:

21,1 17,8 19,7 18,6 16,8 21,7 28,7 20,1 19,5 17,8

un simple diagrama de puntos pone de manifiesto detalles que pueden pasar desa­
percibidos al mirar los datos. En este caso existe un valor bastante separado del resto
y sería conveniente analizar a qué se debe esta desviación (quizás es un error de
tecleado y debería ser 18,7 en lugar de 28,7).Estas cuestiones son importantes, ya que
trabajar con datos erróneos puede dar al traste con el estudio que se esté realizando.

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Diagrama de puntos de un conjunto de datos.

30
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Cuando se desea tener en cuenta el orden en el que se han tomado los datos,
los histogramas o los diagramas de puntos no sirven. Lo que se hace es represen­
tarlos en un diagrama de serie temporal como el de la figura siguiente, que pone
de manifiesto el crecimiento de la estatura media de los españoles a lo largo del
siglo xx. Por supuesto, no se pueden hacer extrapolaciones a la vista de este tipo
de gráficos: no está nada claro que midamos 2,70 metros dentro de 1.000 años, si
es que llegamos.

Año de nacimiento

Evolución generacional de la estatura media de la población adulta en España, 1900-1982.


(fuente: J. Spijker, J. Pérez y A.D. Cámara: «Cambios generacionales de la estatura en la España
del siglo x x a partir de la Encuesta Nacional de Salud», revista Estadística Española, n° 169, 2008).

Además de los gráficos típicos como los que acabamos de ver, y los diagramas
de pastel y similares, también se pueden utilizar otros menos conocidos, como los
diagramas de tallo y hojas.
Veamos un caso práctico. En una clase de 92 estudiantes se pidió a los alumnos
que se tomaran las pulsaciones durante un minuto y el histograma de la página
siguiente representa los valores obtenidos (todos los datos utilizados en este ejem­
plo forman parte de uno de los archivos que incorpora el paquete de software
estadístico Minitab).

31
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Pulsaciones por minuto

Tallo Hojas
4 8
5 4 4
5 8 8 8
6 0 0 0 0 1 2 2 2 2 2 2 2 2 2 4 4 4 4
6 6 6 6 6 6 8 8 8 8 8 8 8 8 8 8 8
7 0 0 0 0 0 0 2 2 2 2 2 2 4 4 4 4 4
7 6 6 6 6 6 8 8 8 8 8
8 0 0 0 2 2 2 4 4 4 4
8 6 7 8 8 8
9 0 0 0 0 2 2 4
9 6 6
10 o
Histograma y diagrama de tallo y hojas de las pulsaciones por minuto de 92 estudiantes.

A la derecha tenemos el diagrama de tallo y hojas. Para construirlo se divide cada


valor en dos partes: la menos significativa -en este caso las unidades- serán las hojas,
y el resto -decenas y centenas- forman el tallo. El valor menor es 48, a continuación
sigue 54 y otra vez 54, después tres veces el 58, hasta el último, que es 100. Observe
que el perfil que conforman las filas coincide con el perfil del histograma, por lo
tanto, la información que contiene el histograma está también en el diagrama de tallo
y hojas, pero además:

1. Se pueden reconstruir los datos originales. A la vista del histograma sabemos


que hay un valor entre 45 y 50, pero no podemos conocer su valor exacto,
mientras que en el diagrama de tallo y hojas no se pierde esta información.

32
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

2. El diagrama de tallo y hojas permite observar detalles que de otra forma pa­
sarían desapercibidos. Por ejemplo, no es razonable pensar que los estudiantes
del ejemplo estuvieron tomándose el pulso durante un minuto. Si así fuera,
aproximadamente la mitad serían pares y la otra lita d , impares, pero lo que
observamos es que casi todos son pares, lo cual significa que contaron durante
30 o 15 segundos y multiplicaron por 2 o por 4, y el resultado obtenido de esta
forma tiene un margen de error mayor que si se hubiera contado realmente
durante un minuto.

En ocasiones se diseñan gráficos específicos para ilustrar una determinada


situación. Un ejemplo de este tipo son los gráficos que figuran en la edición
digital de algunos diarios acompañando sus retransmisiones de los partidos de
fútbol. Estos gráficos muestran la marcha del partido, poniendo de manifiesto las
oportunidades de gol de cada equipo a través de toda una serie de variables; de
esta manera, quedan reflejados desde los centros al área hasta los goles conseguidos
o los penaltis fallados.

■"Barcelona ■ - SporMng

Desenlace de las jugadas de ataque a lo largo de un partido de fútbol


(fuente: Elpais.com).

Sin embargo, lo habitual cuando hay que hacer algún gráfico es usar un programa
de ordenador, ya sean paquetes específicos de software estadístico, hojas de cálculo
o procesadores de texto.
El procesador de texto que se ha usado para redactar este libro permite crear e
insertar gráficos fácilmente. De esta manera, se pueden elegir gráficos espectaculares
en tres dimensiones o simplemente gráficos «planos», entre otras opciones. Debe
tenerse en cuenta que, en general, los gráficos en tres dimensiones son más vistosos
pero menos claros.
Escoja uno u otro tipo según le convenga, y cuando se los enseñen ya sabrá lo
que ha preferido quien se los muestre.

33
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

A B C D

Gráficos construidos con el procesador de textos Word.

Volvamos al ejemplo de la panadería para terminar este apartado dedicado a las


representaciones gráficas de una variable. Suponga que existe una tercera máquina
de la que también se tiene una muestra de los pesos de 80 barras de pan (igual que
se tiene de la máquina 1). ¿Qué le parece la variabilidad de esta nueva máquina con
respecto a la máquina 1?

34
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Máquina 1

Pesos

Pesos

¿Qué diría de la máquina 3 con respecto a la máquina 1?

Si le ha parecido que la máquina 3 produce con más variabilidad que la 1, se


equivoca. Los dos histogramas se han construido con el mismo conjunto de datos,
tienen distinto aspecto porque las escalas son distintas.
Es verdad, era una trampa, la culpa era de la forma de presentar los datos. M o­
raleja: cuando realice gráficos para comparar distintas situaciones, asegúrese de que
las escalas son iguales. Por defecto el programa de ordenador adapta el recuadro a
la variabilidad de los datos; hay que intervenir para forzar la igualdad de escalas, de
lo contrario provocará errores en las personas que miren los gráficos y hasta usted
mismo puede caer en su propia trampa.

35
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

Representaciones de la relación entre dos variables


Cuando interesa representar la relación entre dos variables se utilizan gráficos como
el siguiente, que muestra la relación entre precio y potencia de un conjunto de 449
coches con motor diesel. Puede observarse cómo algunos valores de la potencia,
como 150 CV, son más frecuentes que otros.También se pueden identificar algunos
coches que son baratos en comparación con los otros de igual potencia.

120
110 ■
••
100 ■

90 ■ , t
Audi AS
80 ■ 4.2 Tdi
1
( j 70 ■
o
"O
60 e e Mercedes
E-Class 420
l 50 * CDI
Oh
> 40 ■
O _ — Citroen Cs V6 ^HDI
30

.'JÜ
• —— Mazda 3 2.2 CRTD Sportive
20
Hyundai Accent 1.5 VGT
10 ■

o
50 100 150 200 250 300 350
cv
Relación entre precio y potencia de un conjunto de 449 coches con motor diésel
(fuente: Página web del Real Automóvil Club de España, 10 de noviembre 2009,
buscador de coches nuevos: turismo-berlina, diesel y 4 puertas).

Que se observe una estrecha relación entre variables no implica que exista necesaria­
mente una relación causa-efecto entre ellas. Por ejemplo, si se realiza un gráfico de este
tipo relacionando los daños que causan los incendios con el número de bomberos que
acuden a apagarlos,seguramente se observará ^una estrecha relación entre ellas: a <^ños,
más bomberos, pero esto no significa que sean los bomberos los que causan los daños.
Otro ejemplo: los escolares que tienen los pies más grandes cometen menos faltas de
ortografía que los que los tienen pequeños. ¿No se lo cree? Sí, los niños mayores tienen

36
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

los pies más grandes y hacen menos faltas de ortografía. En los dos casos existe una
tercera variable que es la que mantiene la relación causa-efecto con las dos que se ana­
lizan. En el primer caso era la magnitud del incendio, y en el segundo, la edad del niño.
Pero hay casos en los que no está tan claro. El 28 de diciembre de 1994 el diario
T ie New York Times publicó un artículo sobre los posibles efectos para la salud del
consumo moderado de vino e incluía una tabla con el consumo medio y la tasa de
fallecimientos por enfermedades cardiacas en un conjunto de 21 países. A continua­
ción tenemos una representación gráfica de estos datos:

350 - -
-s
Irlanda
o 300 . . Finlandia
o • Reino Unido
o
o • Nueva Zelanda
o
250 Noruega
o
Islandia suecia•Dinamarca
u 200 •Australia
Estados Unidos • Canadá
• Alemania (RF)
u 1 Austria
¡ j 150 Holanda
¡ cju
Bélgica Suiza Italia
,uJ 100 España

cu Francia

50

0
0 1 2 3 4 5 6 7 8 ~9~ 10
Consumo de vino (en litros de alcohol por persona y año)

Relación entre muertes po r enfermedad cardiaca y consum o de vino en 21 países


(fuente: The New York Times, 28 de diciembre de 1994).

Se observa que los países más consumidores de vino tienen una menor tasa de
muertes por enfermedades cardiacas. Pero como se ha comentado, esto no implica
que entre las dos variables haya necesariamente una relación de causa-efecto. Este
gráfico no nos dice que si bebemos más vino (dentro de lo razonable, ya se entiende)
tendremos menos riesgo de padecer una enfermedad cardiaca. Los países más con­
sumidores de vino son también los mayores productores, y donde se produce vino
hay un clima, unos hábitos alimenticios, unas costumbres... que podrían ser la causa

37
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

GRÁFICOS SENCILLOS PARA SITUACIONES JURÍDICAMENTE COMPLEJAS

Las elecciones a la presidencia de los Estados Unidos del año 2000 con el demócrata Al Gore
frente al republicano George Bush tuvieron un resultado muy ajustado y también muy discutido.
En el Estado de Florida, con unos 6 millones de electores, Bush ganó por 537 votos de diferencia,
y quien ganaba en ese Estado tenla la mayon'a necesaria para ser presidente. Hubo impugnacio­
nes y los jueces tuvieron que decidir. Sin entrar en consideraciones jurídicas, el gráfico muestra

los votos que obtuvo Al Gore frente a los de otro candidato, Patrick J. Buchanan, en cada uno
de los 67 condados del Estado de Florida.

3,5 - 1 Votos d e Patrick J.


Buchanan frente a
Condado de Palm
3,0 - Beach Country los de A l Gore en
cada uno de los 67
condados del Estado
2.5 -
de Florida (fuente:
D S. M oore: Learning
2,0 -
from Data, en
«Statistics: A Guide
1.5 - to the Unknown»,
4 é edición).
1,0 -

0,5 -
£
p.T
i ■“ n ■ r ”

0 100 200 300 400

Votos Al Gore (en miles)

Lo primero que salta a la vista es que el valor de Palm Beach no sigue el patrón general. Los
puntos se presentan agrupados marcando una tendencia según la cual en Palm Beach se podían

atribuir a Buchanan unos 1.500 votos, pero obtuvo 3.411. A vista del gráfico está claro que algo
debía tener Palm Beach de singular. Pero no había ninguna razón para que Buchanan sacara en
ese condado un porcentaje de votos muy superior a los otros; él mismo y su equipo declararon

que obtener mil votos era para ellos una previsión optimista. Pronto estuvo claro que lo sin­
gular era el diseño de la papeleta utilizada para votar en este condado. Había que perforar un
círculo según el candidato elegido, pero la asignación de círculos a cada candidato se prestaba

a confusión y muchas personas -seguramente más de 2.000, basta mirar el gráfico- votaron a
Buchanan cuando en realidad querían votar a Al Gore.

38
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

de la disminución de ese tipo de enfermedades.También podría deberse al consumo


moderado de vino, pero esto no lo demuestran los datos disponibles.

Atención: las escalas pueden engañar


Dado un conjunto de datos, la media o la desviación típica son unos valores concre­
tos; si alguien nos dice que la media aritmética de unos datos es 3, 1 y otro mantiene
que es 4,2, uno de los dos se equivoca (también podría ser que se equivocaran los
dos) porque a un conjunto de datos le corresponde un único valor de la media.
Pero esto no pasa con las representaciones gráficas; dado un conjunto de datos, si
los representamos en un histograma la forma del gráfico dependerá de las escalas
elegidas (ya se ha visto con los datos de una hipotética máquina 3 en la panadería), y
también de la anchura de los intervalos y de los valores que marcan los límites de los
intervalos (aunque la anchura sea la misma, el histograma no tiene la misma forma
si los límites están en 190, 192, 194... que si están en 191, 193, 195...) .
Por ejemplo, la evolución de un indicador económico en los últimos seis meses
se podría representar mediante el gráfico de la izquierda, que muestra una subida
espectacular, o con el de la derecha, en el que parece que se ha mantenido prácti­
camente estable. La diferencia está en la escala vertical.

1 0 0 ---------------------------------------
9 0 ---------------------------------------
8 0 ---------------------------------------
7 0 ---------------------------------------
6 0 ---------------------------------------
50 . -----------------------------------—
40 --------------- - ---------- -----------
3 0 ---------------------------------------
2 0 ---------------------------------------
1 0 ---------------------------------------
- - - - - - - - - - - - - - - - - ¡- - - - - - - - - - - - - 1 i- - - - - - - - - - - - - - - - t — *- - - - - - - - - - r 0 TI------ 1------- 1------- 1------- 1------ T
1 2 3 4 5 6 1 2 3 4 5 6
Los d o s gráficos representan lo s mismos valores, pero en el de la izquierda da la sensación
de que ha habido una gran subida, mientras que en el de la derecha parece que los valores
se han mantenido prácticamente estables.

También la escala horizontal puede dar sorpresas. En la siguiente figura se representan


las ventas de los últimos 4 años, pero como este gráfico se ha hecho en mayo de 2010, los
datos de este año sólo llegan hasta abril, y aunque ya se indica en la escala, la impresión

39
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

EL D ESA STR E D EL C H A LL E N G E R

I Todos hemos visto alguna vez la imagen del transbordador espacial Challenger en posición de des-
| pegue: una especie de avión pegado verticalmente a un gran depósito de combustible que tiene a
ambos lados algo que parecen depósitos más pequeños y que son los cohetes que colocan el apa­

rato en órbita. Estos cohetes, al igual que otras partes del transbordador, no se pueden transportar

en una sola pieza, así que se fabrican por partes, se transportan al lugar de lanzamiento y ali! se
ensamblan. Para asegurar que no haya fugas en las uniones, que podrían provocar una catástrofe,
se utilizan grandes juntas tóricas de caucho de unos 6 mm de grosor y 12 metros de diámetro.

La noche del 27 al 28 de enero de 1986 un grupo de técnicos y directivos de la empresa fabri­


cante de los cohetes mantuvo una teleconferencia con sus homólogos de la NASA para discutir
la posibilidad de aplazar el lanzamiento previsto para el día siguiente. Estaban preocupados por­
que las previsiones para la temperatura ambiente eri el momento del lanzamiento eran mucho
más bajas de lo habitual (entre 26 y 29 °F; - 2 y - 3 °C) y se temía que a esas temperaturas las

juntas no garantizaran la estanqueidad. Se tenían datos de lanzamientos anteriores, ya que se


recuperaban las carcasas de los cohetes y se analizaban meticulosamente, y en alguna ocasión

se habían detectado desperfectos en las juntas, aunque nunca se había producido un accidente
serio. Después de analizar los datos disponibles se consideró que no había evidencia de que la

temperatura afectara al posible deterioro de las juntas y la decisión fue mantener el lanzamiento.
A la mañana siguiente, a los 59 segundos de iniciarse el despegue empezó a salir una llama ■
por una junta que al parecer no era estanca. La llama creció rápidamente llegando al tanque de
combustible líquido, que se rompió y explotó, provocando la muerte de los siete astronautas que

iban a bordo, la conmoción del mundo entero y un replanteamiento general de todo el programa
de actividades de la NASA.
El entonces presidente Ronald Reagan designó una comisión de investigación formada por pres­

tigiosos miembros de la comunidad científica y espacial. La comisión determinó que se había rea­
lizado un análisis muy pobre de los datos disponibles, y que uno de los errores fue no considerar

los vuelos en los que las juntas no habían sufrido ningún daño (figura 1) mientras que un análisis
detallado del comportamiento de las juntas en todos los lanzamientos hubiera puesto de mani­
fiesto la relación entre los desperfectos observados y la temperatura de lanzamiento (figura 2).
La figura 2 muestra claramente que no hay ninguna experiencia y, por lo tanto, ninguna seguridad

de que a la temperatura prevista no haya problemas. Además, se observa también que al disminuir
la temperatura tienden a aparecer más problemas. En la figura 3 se ha sustituido el número de

juntas con algún daño (no se distingue la magnitud del deterioro) por una valoración que realizó
la comisión de investigación; aquí la relación se muestra todavía más clara.

40
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

<= ,2
.^ -o 2
JQJ e
"O
o
Q:; 7i i
E e:
■'I" l"~1T i | i " i - r i— { l l i l | i i i i | i i > l ( l l l 1 j l I l 1 ¡

45 50 55 60 65 70 75 80 85 70 75 80 85

Temperatura (°F) en las juntas en el momento del lanzamiento


Figura 7. Cada punto representa un lanzamiento en el que se había detectado algún daño en las
juntas. En el eje vertical figura el número de incidentes y en el horizontal, la temperatura (en °F)
a la que se realizó el lanzamiento.

l/l
ro o
§o ,c
A3 2 -
_-oQJ e
o Ol 1 - temperatura previa i...... . .
Qj (ij en el fomento del lanzamiento
p OH »-[-r ~rr r' _n-r T»1 ’tfr ’
25 30 35 40 45 50 55 60 65 70 75 80 85
Temperatura (°F) en las juntas en el momento del lanzamiento
Figura 2. La escala se amplía hasta incorporar las temperaturas previstas d e lanzamiento;
también se incluyen los vuelos que no presentaron ningún desperfecto en las juntas.

o .. 1 2 -
ro e:
■o
OJ V) 8
"O..!
- § °Q- A---- Temperatura prevista;.........j
en el momentp del lanzamiento
O
/ |■i-i ,¡ i r n y , -, r T i- r , -,-t|rr r-T—r rr i ¡ i i i |
« |» »|i » « i

25 30 35 40 45 50 55 60 65 70 75 80 85
Temperatura (°F) en las juntas en el momento del lanzamiento
Figura 3. Para cada vuelo se ha valorado el daño sufrido p o r las juntas obteniendo la valoración
que aparece en el eje vertical (fuente: E. WTufte: Visual Explanations).

Éste es un claro ejemplo de cómo un simple análisis gráfico de los datos puede aportar mucha
información sobre el problema que se está analizando.

41
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS

que da es que las ventas están cayendo, mientras que -supoiúendo que hasta abril se pro­
duce un tercio de las ventas anuales- la previsión para este año estaría por encima de 150.

200

2007 2008 2009 2010


(hasta abril)
Los cuatro valores no son comparables: el de 201Osólo llega hasta abril.

También se puede dar una impresión u otra según cuál sea la variable que se
elige. Por ejemplo, si su empresa vende cada vez menos, tal como indica el gráfico de
abajo a la izquierda, puede presentar el gráfico de la derecha en que se representan
los valores acumulados que, obviamente, van subiendo.

Dos formas de mostrar la evolución de las ventas: mensuales (izquierda) o acumuladas (derecha).

Pero, por favor, no se quede con la idea de que los gráficos son sólo algo amorfo que
se puede adaptar para transmitir la idea que interese. Se pueden diseñar gráficos claros
y muy útiles que p eriiten captar la información de un vistazo, como los histogramas
del caso de la panadería, y también se pueden exponer gráficos enredados, confusos e
incluso torticerosjugando con las escalas o con la variable que se representa, o usando
dibujos o ilustraciones que confundan. En general, un poco de atención, sentido crítico
y algo de experiencia sirven para desenmascarar esas situaciones.

42
Capítulo 2

Cálculo de probabilidades:
criterios para movernos en
un mundo de incertidumbre
El cálculo de probabilidades despierta mucho interés entre quienes piensan que
esta disciplina permite diseñar estrategias para ganar en casinos, loterías o en al­
gún otro tipo de juego de azar. Pero pronto se descubre que no sirve para ello; en
realidad, le sirve a quien diseña los juegos, pero no al jugador si el primero hace
bien su trabajo.
M ás allá de los juegos de azar, el cálculo de probabilidades es útil en numero­
sos ámbitos, desde la medicina, donde se evalúan probabilidades cuando se toman
decisiones como la de lanzar campañas de vacunación masivas, hasta el control de
calidad en la industria, donde en ocasiones hay que decidir sobre la calidad de un
gran conjunto de piezas basándose sólo en la inspección de unas pocas unidades.
El cálculo de probabilidades con un enfoque matemático surgió muy tarde, ya
en el siglo x v i i , y la formalización de la probabilidad por Laplace como el núme­
ro de casos favorables partido por el número de casos posibles no llegó hasta 1814,
más de 2.000 años después de que Arquímedes descubriera la fórmula del volumen
de la esfera, que es mucho menos intuitiva. La idea imperante era que los resulta­
dos que dependen del azar son imprevisibles, no tienen ley y, por lo tanto, están
fuera de la capacidad del hombre. Además, también se consideraba que el azar
pertenecía al terreno de los dioses y se le daba un significado mágico, de designio
divino; de este modo, su estudio fue una actividad demasiado peligrosa durante
mucho tiempo.
U no de los trabajos considerados como pioneros en el estudio de las leyes
del azar es el que realizó Galileo hacia 1620 por encargo de un aristócrata. Se
trataba de analizar cuál era el valor más probable de la suma de los resultados
obtenidos al lanzar 3 dados. Se creía que los valores 10 y 11 eran los más proba­
bles, pero no se estaba seguro y por ello se quiso consultar a uno de los mayores
sabios de la época.

43
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Galileo escribió un informe de 4 páginas


explicando cuál era su conclusión y cómo
había llegado a ella. El esquema de razona­
miento era el siguiente:

1. Un dado tiene 6 caras y por simetría


podemos considerar que todas tienen
la misma probabilidad de salir. Por lo
tanto, la probabilidad de que salga una
en concreto es 1 entre 6.

2. Para cada uno de los 6 resultados po­


sibles del primer dado tenemos otros
6 cuando se lanza el segundo. En total,
Retrato de Galileo realizado p o r Tintoretto.
El sabio italiano realizó uno de los primeros se tienen 36 resultados posibles, tal y
estudios en el ámbito del cálculo de como indica la siguiente tabla, en la
probabilidades.
que D l se refiera al lanzamiento del
primer dado y D2, al del segundo.

D1 D2 D1 D2 D1 D2 D1 D2 D1 D2 D1 D2

1 1 2 1 3 1 4 1 5 1 6 1
1 2 2 2 3 2 4 2 5 2 6 2

1 3 2 3 3 3 4 3 5 3 6 3

1 4 2 4 3 4 4 4 5 4 6 4
1 5 2 5 3 5 4 5 5 5 6 5
1 6 2 6 3 6 4 6 5 6 6 6

Todas las parejas tienen la misma probabilidad de salir, pero no todos los valores
de la suma aparecen con la misma frecuencia. Hay sólo una posibilidad entre
36 de que sume 2 (obtener 1 y 1), y también sólo una de que sume 12 (6 y 6 ),
pero hay 6 entre 36 (es decir, 1 entre 6 ) de que sume 7, que es el resultado más
probable.3

3. Si en lugar de 2 dados se lanzan 3, el razonamiento es el mismo. Para cada


uno de los 36 resultados posibles que se tienen al lanzar 2 dados existen 6
posibilidades para el tercero, por lo que el número de resultados posibles es

44
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

6 - 6 - 6 = 216. La siguiente figura muestra la frecuencia con la que aparece


cada uno de ellos. Efectivamente, la probabilidad de que salga 10 o de que
salga 11 es la misma: 2 7 /216 = O, 125, mientras que la probabilidad de
que salga 9 o de que salga 12 es ligeramente inferior: 25/216 = 0,116.

Suma de los resultados de lanzar 3 dados

Es sorprendente la fina percepción que debían de tener aquellos jugadores para


intuir que los valores 10 y 11 tienen la misma probabilidad de salir, y que ésta es
ligeramente superior a la que tienen los valores 9 y 12.

Cálculo de probabilidades y estadística


La estadística había sido una disciplina dedicada a recoger y describir datos demo­
gráficos o de interés para la administración del Estado, hasta que en el siglo x i x la
incorporación del cálculo de probabilidades abrió un abanico de posibilidades mucho
más amplio. Pronto las compañías de seguros empezaron a utilizar las estadísticas de
mortalidad y la teoría de la probabilidad para estimar las esperanzas de vida y esta­
blecer las primas de los seguros de una forma mucho más ajustada a lo que después
acababa ocurriendo.
De la misma forma, cuando se realizan sondeos electorales se utilizan los re­
sultados de las encuestas y el cálculo de probabilidades para predecir los resultados
de las elecciones y evaluar la confianza que podemos tener en esas predicciones.
Igualmente, cuando se evalúa la eficacia de un nuevo medicamento estudiando sus

45
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

efectos sobre una muestra de pacientes, las conclusiones se obtienen a partir de los
resultados obtenidos y de la aplicación de métodos estadísticos en los que interviene
el cálculo de probabilidades.
Pero no hace falta ser un experto ni ser capaz de resolver problemas complicados
de cálculo de probabilidades para poder entender y aplicar los métodos estadísticos

LOS JUEGOS DE AZAR Y EL ORIGEN DEL CÁLCULO DE PROBABILIDADES

El cálculo de probabilidades no es singular sólo por lo tarde que surgió, sino también por las mo­
tivaciones que impulsaron su nacimiento y desarrollo. Cuando se estudia la historia de los avances
de la ciencia nos encontramos con trabajadores abnegados que se sacrificaron por entender el
funcionamiento del mundo, o por la salud y el bienestar de la humanidad. Sin embargo, el cálculo
de probabilidades surgió por el interés de unos personajes de vida ociosa interesados en saber cuáles
eran las mejores estrategias para ganar en los juegos de azar, actividad que por lo visto ocupaba
gran parte de su tiempo.
Una de las primeras discusiones sobre cálculo de probabilidades en términos matemáticos se en­
cuentra en la correspondencia que mantuvieron Pierre Fermat y Blaise Pascal en 1654 acerca de un
problema planteado por un filósofo -y jugador- de la época conocido como el Caballero de Méré.
El problema trataba sobre la forma más justa de repartirse el importe de una apuesta si el juego se
tenía que interrumpir antes de llegar al final; por ejemplo, si gana la apuesta el primero en ganar
3 partidas, pero el juego acaba cuando se va 2 a 1.

46
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

más habituales. Tampoco es buena idea relacionar la estadística sólo con los casinos y
los juegos de azar. A veces nos encontramos con que en las portadas de los libros de
estadística aparecen ruletas, dados o barajas de cartas, pero no bosques, quirófanos, niños,
escuelas o líneas de producción, cuando la estadística es mucho más útil e interesante
en estos campos.*1

Una opción sería que todo se lo quedara el que va ganando, otra podría ser repartírselo a partes
iguales, pero tanto Fermat como Pascal estuvieron de acuerdo en que en un caso como éste lo
más razonable es que se lleve tres cuartas partes el que ha ganado 2 partidas.
Si los jugadores son A y By el que lleva ganadas las 2 partidas es A, el razonamiento es el siguien­
te: supongamos que siguen jugando y que la probabilidad de ganar una partida es del 50%, la
misma para los 2. El juego acabaría de uno de los siguientes modos:

1. La siguiente partida la gana A. Como ya irán 3 a 1 el juego acaba, gana A y se lleva todo el
dinero. La probabilidad de que esto ocurra es 0,5.
2. La siguiente partida la gana B. con lo que quedan 2 a 2 ysiguen jugando. A continuación gana
A, con lo que se ponen 3 a 2 a favor de A y termina el juego. La probabilidad de ir por este
camino es 0,5 • 0,5 = 0,25 (gane B y gane A).
3. La siguiente partida la gana B y a continuación vuelve a ganar B. En este caso acaban 2 a 3 y
B gana el juego. La probabilidad de que se vaya por este camino también es 0,5 • 0,5 = 0,25.

Debe terminar
el juego Posibles resultados si continuara

A-B
' ® } Gana A. Probabilidad = 0,5 • 0,5 = 0,25.

Gana B. Probabilidad = 0,5 ■ 0,5 = 0,25.


2-3

Recopilando, si siguieran jugando la probabilidad de que ganara A sería O,75 (0,5 + 0,25), mien­
tras que la probabilidad de que ganara B sería 0,25. En 3 de cada 4 ocasiones ganaría A; por lo
tanto, es razonable que se quede con las tres cuartas partes de la apuesta.

47
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

La probabilidad y sus leyes


De acuerdo con las ideas que ya están en el texto de Galileo, si una prueba tiene n
resultados posibles, todos igualmente probables, y el suceso A aparece en k de esos
posibles resultados, la probabilidad de que ocurra A es:

p (a )= n.
n

Es decir,

. ..... Casos favorables


Probabilidad de que ocurra un suceso = -------------------.
Casos posibles

Por ejemplo, si en una bolsa hay 5 bolas, de las cuales 3 son azules y 2 son negras,
si se saca una al azar la probabilidad de que sea azul es 3/5. Así de fácil.
En algunos casos la probabilidad teórica se puede definir atendiendo a la simetría
del objeto que genera los resultados, como en el caso del lanzamiento de monedas o
dados. Otro enfoque consiste en considerar la probabilidad como la proporción de
veces que ocurre el suceso al aumentar indefinidamente el número de experimentos.
Así, para saber cuál es la probabilidad de que al lanzar una moneda salga cara hay que
lanzarla muchas veces y ver a qué valor tiende la proporción de caras. Lo mismo ocu­
rre con los dados; cuando decimos que la probabilidad de que salga un cierto valor
es 1/ 6 , nos estamos refiriendo a un dado perfecto, y quizás ése no es el caso del que
tenemos en las manos.
Algunos investigadores han lanzado monedas o dados muchas veces y han ido
anotando los resultados obtenidos. Uno de ellos fue el matemático inglés John
Kerrich, que fue encarcelado en Dinamarca durante la Segunda Guerra Mundial.
Estando en prisión, lanzó 10.000 veces una moneda al aire: le salieron 5.067 caras
y 4.933 cruces.
La proporción de caras iba fluctuando tal y como se indica en la siguiente
figura, aunque éstos no son los datos de Kerrich sino una simulación. A medida
que el número de lanzamientos crece las fluctuaciones se van amortiguando y es
razonable suponer que la proporción tenderá a un valor constante si el número de
lanzamientos continuara indefinidamente. Ese valor será la probabilidad de obtener
cara con esa moneda.

48
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Número de lanzamientos (escala logarítmica)

Evolución de la proporción de caras al lanzar 10.000 veces una moneda


(obtenida por simulación).

Otros investigadores que han reali­


zado ejercicios similares son el conde
de Buffon, científico francés del siglo
xviii que en 4.000 lanzamientos ob­
tuvo 2.048 caras, y Karl Pearson, uno
de los padres de la estadística actual,
que lanzó la moneda 24.000 veces (él
o alguno de sus ayudantes) y obtuvo
12.012 caras.
Respecto al lanzamiento de dados,
los resultados más famosos son los que
obtuvo en 1850 un astrónomo suizo
llamado Wolf al lanzar nada menos que
20.000 veces un par de dados, uno rojo
y otro blanco. Los resultados obtenidos
El conde de Buffon realizó numerosos estudios
en aquella prueba están detallados en la sobre el cálculo de probabilidades en el siglo xvii
tabla de la página siguiente. Retrato realizado po r Fran;ois-Hubert Drouais.

49
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Dado blanco
- Total Proporción
1 2 3 4 5 6

í 1 547 587 500 462 621 690 3.407 0,170

2 | 609 655 497 535 651 684 3.631 0,182

0 3 514 540 468 438 587 629 3.176 0,159


o
" 4 462 507 414 413 509 611 2.916 0,146
o
5 551 562 499 506 658 672 3.448 0,172

6 563 598 519 487 609 646 3.422 O, 171

Total 3.246 3.449 2.897 2.841 3.635 3.932 20.000 1,000

Proporción 0,162 0,172 0,145 0,142 0,182 0,197 1,000

Los resultados obtenidos con las monedas parecen coherentes con la suposiciór
de que están bien equilibradas (probabilidad de cara = 0,5), pero en los resultados
de lanzar los dados hay proporciones que se alejan bastante del valor teórico. Tanto
el dado blanco como el rojo parecen tener un déficit de valores 3 y 4. De momento,
podemos representar los resultados en un gráfico para verlos más claros (R = dado
rojo, B = dado blanco). Más adelante, cuando en el capítulo 3 se hable de contraste
de hipótesis, se discutirá si es razonable pensar que los dados no están equilibrados.

Resultados obtenidos al lanzar2 0 .0 0 0 veces un dado rojo (R) y otro blanco (B).

50
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

R egla de la «o »

La probabilidad de que ocurra un suceso A u («o») otro B, si los dos no pueden


ocurrir a la vez, es la suma de las probabilidades de cada uno de ellos. Por ejemplo,
en una baraja de póquer de 52 cartas (sin comodines) la probabilidad de que al sacar
una carta al azar sea un as o una figura es:

4 .
Probabilidad de que sea un as: P(A) = — (casos favorables/casos posibles).

. 12
Probabilidad de que sea una figura: P(B) = — .

. 4 12 16
Probabilidad de que sea as o figura: P(A o B) = P(A) + P(B) = + 52
52 .

Regla de la «y»

La probabilidad de que ocurra un suceso A «y» otro B, si son independientes, es


decir, si la ocurrencia de uno no afecta a la probabilidad de ocurrencia del otro, es
igual al producto de sus probabilidades. Por ejemplo, al lanzar un dado dos veces la
probabilidad de sacar primero un 3 y después un 4 es:

1 .
Probabilidad de sacar un 3: P(A) = — (casos favorables/casos posibles).
6

1
Probabilidad de sacar un 4: P ( B ) = - .
6

Probabilidad de sacar primero un 3 y después un 4: P(A y B) = ---- = — .


6 6 36

Contando casos

Contar los casos favorables o los casos posibles suele ser la parte más laboriosa del
trabajo, aunque en algunas situaciones también se pueden hacer las cuentas con razo­
namientos simples o por analogía con situaciones similares. Por ejemplo, si para ir de A
a C hay que pasar por B y tenemos 3 caminos para ir de A a B y 2 para ir de B a C, ¿de

51
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

cuantas maneras se puede ir de A a C? Para cada una de las 3 opciones que existen para
ir a B tenemos 2 para ir de B a C, luego en total hay 6 formas distintas de ir de A a C.

Veamos otro caso que parece más complicado. En las quinielas de fútbol españolas
hay 3 opciones para cada partido: gana el que juega en casa (1), empatan (X) o gana
el que juega en campo contrario (2). ¿Cuál es la probabilidad de acertar la quiniela
completa de 14 partidos?
Está claro que los casos favorables son sólo uno: existe una única combinación
ganadora. Los casos posibles parecen más difíciles de contar, pero podemos usar la
misma idea que para contar los caninos para ir de A a C: el primer partido tiene
3 resultados posibles, para cada resultado del primero hay 3 opciones para el segundo;
es decir, que si hubieran sólo 2 partidos las posibilidades serían 3 -3 = Y . Siguiendo
el razonamiento se llega a la conclusión de que para 14 partidos los casos posibles
son 3'h Luego, la probabilidad de tener 14 aciertos si se rellena la quiniela al azar es
de 1 /3 14, aproximadamente 1 entre 4,8 millones.
Para estos menesteres también son muy útiles las fórmulas de la combinatoria; se
verá alguna en el contexto de los problemas comentados más adelante.

Aplicando las reglas

A continuación, las reglas anteriores se aplicarán a un ejemplo. Para ello, calculare­


mos la probabilidad de que al lanzar 5 veces una moneda al aire salgan 3 caras y 2
cruces, en cualquier orden. Como pronto se podrá comprobar este problema tiene
más relevancia de la que parece a primera vista. Iremos por partes:

1. La probabilidad de que en un lanzamiento salga cara, y también de que salga


cruz, es igual a 0,5.2

2. La probabilidad de que en 2 lanzamientos salga cara y cara es 0,5 ■ 0,5 = 0,25.


Hemos aplicado la regla de la «y» porque los resultados son independientes, es

52
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

FRANCIS GALTON Y EL QUINCUNX

Francis Galton (1822-191 1) fue un científico con un


amplio campo de intereses, desde la antropología hasta
la economía, la filosofía, la meteorología y la estadísti­
ca. Era primo de Charles Darwin. Tenía una gran vitali­
dad y curiosidad por conocer el mundo, y disfrutaba de
una holgada situación económica que le permitía dedi­
carse a los temas que le interesaban. Aunque estudió
medicina apenas ejerció la profesión y en cuanto recibió
la herencia de su familia se fue a conocer mundo. Entre
otras aventuras pasó dos años explorando A.frica y le
fue otorgada la medalla de oro de la Royal Geographi-
cal Society en reconocimiento a sus actividades.
Entre sus aportaciones figura un detallado análisis de las huellas dactilares y su recomendación de
que fueran utilizadas como sistema para la identificación de delincuentes, tal y como desde enton­
ces se viene realizando. Estudió también la herencia y la transmisión de caracteres, observando que
los hijos de padres altostienden también a ser altos, pero no tanto como sus padres, y lo mismo
ocurre con los hijos de padres bajos, que tienden a ser bajos pero menos que sus padres, produ­
ciéndose un efecto de vuelta a la media de la población que Galton denominó «regresión» a la
media, acuñando un nuevo término que forma parte de las palabras clave de la estadística actual.
Para ilustrar la forma que presenta la variabilidad debida a causas aleatorias ideó un aparato que
denominó «quincunx» en el que se dejan caer bolas que pasan a través de una zona de clavos
I colocados al tresbolillo de forma que van chocando y, al azar, van cayendo a la derecha o a la
izquierda. Pasada esta zona las bolas caen por unos canales y se observa que la disposición que
forman responde a la campana de Gauss. El quincunx todavía se usa en las aulas para ilustrar la
forma distribución normal, y hoy en día también se pueden encontrar simuladores en Internet.

decir, que salga cara la primera vez no aumenta ni disminuye la probabili dad
de que salga cara la segunda.

3. La probabilidad de que en 5 lanzamientos salga: cara y cara y cara y cruz y cruz


es: 0,5 ■ 0,5 ■ 0,5 ■ 0,5 ■ 0,5 = 0,5 3 • 0,5 2 = 0,03125 (es verdad, también po­
dríamos haber escrito 0,5\ pero para hacerlo extensivo a otros casos que veremos
más adelante ahora nos va mejor separar las probabilidades de cara y cruz).

53
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Lo que hemos calculado es la probabilidad de que salgan primero 3 caras (C)


y después 2 cruces ( + ) en este orden: C C C + + . Nosotros queremos calcular la
probabilidad de que salgan 3 caras y 2 cruces en cualquier orden:

Orden Probabilidad
CCC + + 0,53- • 0,52
c c + c + 0,53 • 0,52
c + c c + 0,53 • 0,52

+ + c c c 0,53 . 0,52

Es decir, que salga C C C + + , o + + C C C , o C + C + C, o . . . L a probabi­


lidad que buscamos será la suma de las probabilidades de cada uno de los órdenes
posibles. Podemos sumar aplicando la regla de la «o» porque los sucesos son in­
compatibles (no puede salir un orden y otro a la vez). Y como las probabilidades
son las mismas para todos los órdenes también podemos multiplicar la probabi­
lidad de tener un orden concreto por el número de ordenaciones que pueden
presentarse (con lo que nos adentramos en el ámbito de la combinatoria). Si se
tiene n objetos se pueden ordenar de n! formas distintas. Por ejemplo, si se tiene
5 libros y 5 espacios para colocarlos en la librería, el primero se puede colocar
en cualquiera de los 5 espacios, para el segundo ya sólo se puede elegir entre 4,
entre 3 para el tercero, entre 2 para el cuarto y únicamente queda 1 para el quinto;
luego las posibilidades son: 5 • 4 • 3 • 2 • 1 = 120. En nuestro caso también tenemos
5 «objetos» pero no son todos distintos: tenemos 3 iguales por un lado y 2 por
otro, así que las permutaciones entre esos iguales no hay que tenerlas en cuenta y
para ello dividimos por 3! y 2!. El número de ordenaciones que se pueden hacer
con 3 caras y 2 cruces es:

5!
= 10.
3!-2!

Ya lo tenemos todo para calcular la probabilidad buscada. É sta será:

5!
------0,5 3 0,52 = 0,3125.
3!-2!

54
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

¿Y para qué sirve saber cuál es la probabilidad de que al lanzar 5 veces una mo­
neda al aire salgan 3 caras? Seguramente para muy poco, pero a continuación se verá
que el procedimiento seguido se puede generalizar a otros ámbitos de gran interés.

El azar tiene famüias


El 29 de abril de 2004 un lector presentaba la siguiente duda en un consultorio in­
formático de un diario de gran circulación: «He usado una hoja Excel para calcular
números aleatorios utilizando la función «= aleatorio()», pero siempre me da resultados
muy pequeños, casi cero, y yo quiero un sistema para hacer lotería primitiva, que son
6 números hasta el 49».
Parece que este lector pensaba que si un valor depende del azar -si es aleato­
rio - no está ligado a ningún tipo de reglas y ya está todo dicho, pero esto no es así.
Existen distintos tipos de variables aleatorias, y la primera división que hacemos es
entre variables continuas (se miden en una escala continua) como peso, longitud,
densidad..., o discretas (con valores separados unos de otros) como el número de
piezas defectuosas en un lote, el número de coches que llegan por minuto a una
gasolinera... En realidad, disponemos de todo un «catálogo» de distribuciones de
probabilidad y lo primero que hacemos cuando nos enfrentamos a una variable
aleatoria es ver si encaja en alguna de las distribuciones descritas. Lo habitual es que
sí encaje, de forma que no hace falta que deduzcamos las fórmulas para calcular sus
probabilidades, ni su media u otras características de interés: alguien ya lo hizo y la
información está a nuestra disposición para poder ser aplicada.
Al principio puede parecer difícil distinguir los distintos tipos de variables aleatorias,
como quien no conoce un género musical y le parece difícil identificar los tipos de
canciones, aunque con un poco de práctica es facil distinguir unos de otros. A conti­
nuación se analizan algunas características y usos de las tres distribuciones de probabi­
lidad, seguramente las más conocidas; primero, dos discretas y después, una continua.

U n a que ya hemos visto: la distribución binomial

Aplicando las reglas generales del cálculo de probabilidades hemos podido determinar
la probabilidad de que salgan 3 caras y 2 cruces (en cualquier orden) al lanzar 5 veces
una moneda mediante la expresión:
5!
53 -O, 52.
31-21

55
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

En general, el número de éxitos al realizar n experimentos cuando la probabili­


dad de éxito, p, es constante es una variable aleatoria que sigue una distribución de
probabilidad muy conocida denominada «binomial». N o hace falta deducir nuevas
fórmulas para calcular probabilidades cuando nos encontramos ante un caso que
encaja en este escenario.

UNA FÓRMULA MUY ÚTIL

Más allá de los números concretos, si se trata de calcular la probabilidad de que salgan x
caras realizando n lanzamientos y llamamos p a la probabilidad de obtener cara y 1 - p a la

de cruz, la fórmula será:


n!
p 'o - p r .
x\(n-x)\

Lo interesante es que esta fórmula no sólo esválida para el problema del lanzamiento de mo­
nedas, sino que puede generalizarse a cualquier ámbito de acuerdo con el siguiente esquema:

Lanzamiento de monedas Generalización

Lanzar n monedas. Realizar n experimentos.


Puede salir cara o cruz. Cada experimento tiene dos resultados
posibles, que denominaremos «éxito»
o «fracaso».
Tanto la probabilidad de cara (p) como Tanto la probabilidad de éxito (p) como
l¡ la de cruz (1 - p) se mantiene constan- de fracaso (1 - p ) se mantiene constante
r te en todos los lanzamientos. en todos los experimentos.
í Interesa la probabilidad de obtener x Interesa la probabilidad de obtener x éxitos
caras en n lanzamientos. en n experimentos.

Veamos estos tres problemas:

1. Una línea de producción produce un 1% de piezas defectuosas. Si las piezas


se colocan en cajas de 50 unidades, ¿cuál es la probabilidad de que una caja
tenga 2 unidades defectuosas?2

2. U njugador profesional de baloncesto tiene un porcentaje de éxitos del 75% en


tiros libres, ¿cuál es la probabilidad de que consiga 8 canastas si realiza 1Otiros?

56
C A L C U L O D E P R O B A B I L I D A D E S : C R I T E R I O S P A R A M O V E R N O S E N U N M U N D O D E I N C E R T I D U M B R E

3. Si unapareja tiene 4 hijos, ¿cuál esla probabilidaddequetenga2varones y


2chicas?
¿Qué tienenencomúnestosproblemas?Lostresseajustanal escenariodescrito
y, por lo tanto, sonmuyfáciles deresolver.
Númerode Probabilidad Número
Problema experimentos deéxito deéxitos Respuesta
n P X

Piezadefectuosa 50 0,01 2 ^ 0! ',012-o',9948=0',076.


2!-48
101
---0,7
Baloncesto 10 0,75 8 8!-2! ' 5a.0',252=0',282.
Hijos/-as 4 0,5 2 2!-4!0
2! ,52.052=0,375.

Los cálculos puedenhacersecon unahoja decálculo. En Excel seescribe tal


como seindica acontinuación:

X . . fx =DiSTR.BINOM(
B lDlSTR.BIt\IOM(núm_éxito; ensayes; prob_b:ito; acumulado) | g

El último valor, después dela probabilidad de éxito, espara indicar si sedesea


calcular sólolaprobabilidadparael número deéxitos indicado (por ejemplo, tener
exactamente2defectos) y enestecasocolocamosunO,olaprobabilidadacumulada
hastaesevalor (tener 2defectos omenos) encuyocasocolocamos un 1.

Al ▼ í" ■ fx | =DISTR.BI NOM(2;50;0,01;0)


A B C D 1 E
1 0,07561804|

En el casodeljugador debaloncestohayquesuponer quelaprobabilidaddeen­


cestar esconstante, esdecir, quenodependedelapresióndel público, delosnervios
ni delatrascendencia del partido (seguramenteunadelasvirtudes que debetener
unbuenjugador esladeser insensibleaesascosas). En el casodelos hijosylashijas
57
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

muchas personas piensanquesi setienen 4hijos lo másprobable esque2deellos


seanhijos y 2, hijas, perolaprobabilidaddequeestoocurra essólodel 38%;lomás
probable (62%) es quesetenga cualquier otra combinación.

D e los muertos por coz de caballo en el ejército prusiano a los goles


en la liga española de fútbol: la distribución de Poisson

Cuandounavariableseajustaal modelobinomial sepuede contar tantoel número


deocurrencias comoel deno ocurrencias (número depiezas correctas odepiezas
defectuosas) ytambiénhayuntopeenel númerodeocurrencias: el númeromáximo
depiezas correctas seráel total delas que tenemos.
En ocasiones nos encontramos con variables que representan el número de
sucesos queocurrenpor unidaddetiempo, odeespacio, deformaquenosepuede
contarsunoocurrenciay noexistelímite,al menosdesdeel puntodevistateórico.
Ejemplos típicos de este tipo devariable son: el número de visitas diarias auna
páginaweb, el número de averías anuales deun ascensor, el número dellamadas
quelleganauna centralitatelefónica durantelahora del almuerzoy,seguramente,
el númerodee - m a ils queustedrecibeadiario. Si las ocurrencias sonenel espacio,
los ejemplos podrían ser: el número depuntos deóxido por metro dealambre, el
número detaras por metro cuadrado (o por cada 10metros cuadrados) detela, o
el número depasas enunacucharadade
cereales para el desayuno.
En 1837 el matemático francés Si-
méonPoissonbuscólamanerademodifi­
carlafórmuladeladistribuciónbinomial
paraadaptarlaasituaciones como éstay
se encontró con una curiosa expresión
en la que basta saber el número medio
deocurrencias (A.) parapoder calcular la
probabilidad de que se presenten cual­
quier número de ellas. La fórmula que
dala probabilidaddeque sepresentenx
ocurrencias es:

El matemático francés del siglo xix


Siméon Poisson.
P(x) =e

58
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Así, si unascensor seavería unpromedio dedosveces al alio 2), la proba­


bilidaddequedurante unañonoseaveríe es:

P(x =O)=<
>-2_= 0,14.
O!

Y si una página web recibe un promedio de 100 visitas al día (consideramos


que es el mismo todos los días de la semana, aunque seguramente habría que
distinguir entrelaborables y festivos), la probabilidad deque undía reciba menos
de80 visitas es:
79
loo-
P(x <80) =

Lo cual noesprecisamentecómododecalcular, peroparaesoestánlas hojas de


cálculo:

1 A *1 8
1 O.C1745132¡i

En 1898 el economista y estadístico


ruso Ladislaus Bortkiewicz publicó un
libro mostrando que la distribución de
Poisson podía ser usada para explicar la
regularidad estadística queseaprecia en
la ocurrencia de sucesos raros. Utilizó
datossobresuicidios y muertes acciden­
tales en diversas circunstancias, pero su
ejemplo más famoso es el del número
desoldados muertos por coz.de caballo
en los 14 cuerpos del ejército prusiano
duranteunperiodode20años (de 1875
a1894).
Ladislaus Bortkiewicz, estadístico ruso
Enlasiguientetablalafrecuenciaob­ que amplió los usos de la distribución
servadacorrespondeal númerodecuer- de Poisson.

59
1

CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

pos del ejército multiplicado por el número de años que tuvieron el número de
muertos que se indica (total = 14 ■ 20). El número medio de muertos por cuerpo del
ejército y año es (91 + 2 • 32 + 3 • 11 + 4 • 2)/280 y utilizando este valor en nues­
tra fórmula se obtienen las frecuencias teóricas que se indican en la siguiente tabla.

Número de muertos Frecuencia Frecuencia


por coz de caballo observada ' | teórica
o 144 139
1 91 1 97
2 32 34
3 11 8
4 2 i 1
5o más o i o
Total 280 i 280

Puestos a buscar unos datos más acordes con nuestros tiempos, puede pensarse
en los goles que un equipo marca en un partido de fútbol, ya que esta variable
responde bien al esquema de la distribución de Poisson: son sucesos por unidad de
tiempo (partido), no hay límite y no se puede contar el número de «no goles». Así,
el diagrama de la izquierda representa el número de goles que marcó cada equipo
en cada uno de los 380 partidos de la liga española de fútbol en la temporada 2008­
2009. El diagrama de la derecha muestra los datos deducidos con nuestra fórmula.

Distribución observada Distribución de Poisson

Goles por equipo Goles por equipo

Distribución observada y distribución teórica de acuerdo con el modelo de Poisson d el número


de goles marcados po r cada equipo en los 380 partidos de la temporada 2008-2009
de la liga española de fútbol.

60
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Efectivamente, los perfiles son muy parecidos. El modelo de Poisson explica bien
la variabilidad en el número de goles que un equipo marca en un partido.

L a c a m p a n a d e G a u ss o d is tr ib u c ió n n o r m a l

La campana de Gauss es muy popular en matemáticas. Su forma corresponde al


perfil del histograma que representa un gran conjunto de valores afectados por lo
que se denomina variabilidad natural. Por ejemplo, los paquetes de azúcar de 1 kg
no pesan exactamente 1 .000 ,0000 ... g, sino que unos pesan un poco más y otros,
un poco menos. É sta es una variabilidad inevitable, producida por muchas pequeñas
causas, seguramente imperceptibles una a una, pero que conjuntamente tienen un
efecto que sí se nota. En el gráfico adjunto se observa que la mayoría de valores
están agrupados en torno al valor central y que a medida que nos alejamos de ese
valor las observaciones son cada vez más escasas. Es la típica forma de la campana
de Gauss o distribución normal.

Posible distribución del peso de un gran conjunto de paquetes de azúcar de 7 kg,


que dibuja una típica campana de Gauss.

La expresión matemática de la forma de la campana fue deducida por primera


vez en 1733 por el matemático francés Abraham de Moivre, pero su nombre está
asociado al alemán Carl Friedrich Gauss, que en 1809 la utilizó para explicar su
teoría sobres los errores de medición, especialmente los referidos a observaciones
astronómicas. Gauss comprobó que con independencia de si el objeto medido
está cerca o lejos, o de si es grande o pequeño, si se repiten las mediciones en
igualdad de condiciones, los valores obtenidos se distribuyen siempre de esa
peculiar forma.

61
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Pero la distribución normal ocupa un lugar muy destacado en la teoría estadística


no sólo porque explica la teoría de los errores, sino porque representa un tipo de
variabilidad muy habitual en la naturaleza; en la naturaleza en general y en el cuerpo
humano en particular.

Imagen de Gauss en un billete de 1O marcos alemanes, en cuyo centro


se aprecia la gráfica de una distribución normal.

Uno de los nombres ligados a los orígenes de la estadística moderna es el del cien­
tífico belga Adolphe Quételet, que durante el siglo xix realizó numerosos estudios para
poner de manifiesto la regularidad estadística (número de crímenes, de nacimientos, de
muertes, etc.). En su búsqueda de datos para
mostrar la distribución normal, se encontró
con un regalo inesperado: una revista escocesa
había publicado la estatura y el perímetro torá­
cico de más de 5.000 soldados pertenecientes
a diversos regimientos escoceses, y esos datos
le permitieron poner de manifiesto que la va­
riabilidad que presentaban los soldados era del
mismo tipo que la descrita por la ley de los
errores.
En palabras de Quételet: «Si una persona
poco práctica en medir el cuerpo humano
midiera repetidamente a un soldado típico,
5.738 mediciones hechas en un individuo
Adolphe Quételet, uno de los más no se agruparán ciertamente con más regula-
importantes estadísticos del siglo xix. ridad ... que las 5.738 mediciones hechas en

62
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

LA LEY DE STIGLER DE LOS EPÓNIMOS


Muchos descubrimientos científicos, enferme­

dades, leyes, teoremas o constantes, llevan el

nombre del que los descubrió. Ahí están la en­


fermedad de Alzheimer, la constante de Euler,
el último teorema de Fermat, el cometa Halley
o la campana de Gauss. Ese nombre propio
con que se designa una ley o un fenómeno se
llama «epónimo».

Stephen Stigler, profesor de estadística de la


Universidad de Chicago y reconocido histo­
riador de esta materia, ha enunciado una ley
que, de forma breve y rotunda dice que «nin­

gún descubrimiento científico lleva el nombre

del que realmente lo hizo». De los citados, la


enfermedad de Alzheimer (por Alois Alzhei­

Retrato de Abraham de Moivre, quien mer) parece que ya fue descrita por al menos
dedujo la denominada campana de Gauss, media docena de científicos antes que él; la
muchos años antes de que lo hiciera el
constante de Euler fue descubierta por Jacob
famoso matemático alemán.
Bernoülli; el último teorema de Fermat, si es

teorema, no es de Fermat (sería conjetura), ya que no fue demostrado hasta 1995 por Andrew
Wiles; el cometa Halley fue descubierto por los astrónomos ya antes de Jesucristo, aunque sí es
verdad que Edmond Halley calculó su órbita y predijo la fecha de su retorno, y en un tema más
propio de nuestro ámbito de estudio, está muy bien documentado que la distribución normal,

con su forma de campana, no fue descubierta ni descrita por primera vez por Gauss sino por el
matemático francés Abraham de Moivre, que publicó sus trabajos sobre esta cuestión en 1733,
casi 80 años antes de que lo hiciera Gauss.

Esto no significa que unos científicos se apropien indebidamente de los méritos de otros, lo que
ocurre es que algunos realizan aportaciones relevantes, o divulgan un asunto que ya existía pero

que no era conocido, y a partir de ahí, sin que ellos tomen parte, se les identifica con ese descu­
brimiento. El profesor Stigler publicó un artículo sobre este tema, que ya había sido comentado

por muchos otros antes que él, entre ellos por Robert Merton, a quien cita con frecuencia. Pero
con un toque de humor, para añadir un nuevo ejemplo a su ley, propuso que se llamara ley de
Stigler, y lo cierto es que así se ha quedado.

63
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

los soldados escoceses;y si senospresentaranlasdosseriessinningunaespecificación


particular,nosveríamosmuyconfundidosparaestablecerquéseriesetomódelos5.738
soldadosdiferentesy cuál seobtuvodeunsoloindividuoaplicandomenoshabilidady
mediosmástoscos demedición».

Histograma vivo. Cada individuo se ha colocado en la columna que le corresponde según su


estatura (fuente: Edward R. Tufte: The Visual Display o f Quantitative Information, citando el trabajo
de Bran L. Joiner «Living Histograms», publicado en 1975 en la International Statistical Review).

Hay otrarazón que daunprotagonismo especial aladistribución normal. Mu­


chasveces la materia prima delos estudios estadísticos sonlas medias: secompara
la producción m e d ia por planta utilizando un fertilizante u otro, ose analiza si el
valor m e d io deunamuestraes coherente con el valor quesesuponeparala media
dela población, etc. Pues bien, las medias presentanvariabilidad,ya quesegúnqué
muestrasesaquela media será una u otra, y esavariabilidad sepuede caracterizar,
aefectos prácticos, através deladistribuciónnormal, incluso si los datos originales
apartir delos cuales secalcula no son normales. Por ejemplo, al lanzar undadose
obtiene unvalor deuna distribución que no tiene nadaquever conla normal; es
unadistribución discreta consólo6valoresposibles: 1,2, 3, 4, 5y 6, todos ellos con
lamismaprobabilidaddesalir. Si lanzamos dosdadosy nosquedamos conlamedia,
ya no todos los valores (dela media) tienen lamismaprobabilidad desalir; esmás
probable quelamediasea3,5. Si lo hacemos con4dados el perfil del diagramade
barras querepresentalasprobabilidades delos valores quepuedetomar lamediaya
recuerdael perfil delacampanadeGauss, y si lanzamos 10dados, lo que seríasacar
un tamaño demuestraigual a 10, el perfil dela campanayasereconoce deforma
evidente.Así pues, si trabajamos con medias, lanormal esnuestradistribución.
64
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

La distribución d e las medias tiende a la distribución normal aunque los valores


con que se construyen las medias no sean normales.

De todas formas, y a pesar de su indudable protagonismo, el nombre de «normal»


no es muy afortunado. Llamando «normal» a una distribución parece que las otras
sean raras, y eso no es así. Pero el nombre ya ha cuajado tanto que es el más utilizado,
aunque hay quien se empeña en llamarla «distribución gaussiana».
Si por la naturaleza de los datos con que se está trabajando se considera que su
variabilidad se puede caracterizar mediante esta distribución (también se puede
verificar gráficamente o mediante los tests estadísticos adecuados) basta conocer
dos valores para tenerla totalmente definida: la media, que es el valor en que está
centrada la campana, y su desviación típica, que indica lo aplanada o esbelta que es.

Media y desviación típica: los d o s parámetros que caracterizan una distribución normal.

65
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Si el peso de los paquetes de azúcar sigue una distribución normal con media
1.000 gramos y desviación típica 5 gramos, podemos calcular qué proporción de
paquetes tendrá un peso superior a 1.010 gramos, entre 995 y 1.010 o inferior a 995.
Hasta hace poco tiempo había que realizar unos cálculos y consultar unas tablas (que
todavía se incluyen al final de muchos libros de estadística), pero hoy en día basta
con utilizar una hoja de cálculo. Por ejemplo, la probabilidad de que un paquete
pese menos de 995 gramos será:

Al i jSr =DISTR.NQRM(995;1000;5;1)____________
' A ' B ! d I S T R ,. N O R .M ( x ; m e d i a ; d e s v _ e s t á n d a r ; a c u m )

1 .0,158655251
n

Obsérvese que puede afirmarse que aproximadamente el 16% de los paquetes


tendrá un contenido inferior a 995 gramos, pero nada puede decirse sobre el peso
de un paquete concreto, por la núsma razón que puede hablarse de la esperanza de
vida de una población, pero no la edad a que morirá cada uno de sus individuos.
Existen también unas reglas rápidas que se basan en la propiedad de que, con
independencia de cuáles sean los valores de su media (|¿, léase «mu») y su desviación
típica (a o «sigma»), el 68% de los elementos se encuentran en el intervalo ± la ,
el 95%, en el intervalo ± 2 a y el 99,7%, en el intervalo ± 3 a . Así, en el caso
anterior, como la media era = 1.000 y la desviación típica, a = 5, en el intervalo
995-1.005 tendremos el 68% de las observaciones; por lo tanto, fuera tendremos el
32%, el 16% a cada lado, luego el 16% estará por debajo de 995.

66
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Esta regla también puede servir para interpretar el valor de la desviación típica.
Si se piensa en la distribución de las estaturas, la media podría ser 170 cm y la des­
viación típica debe estar entre los 6 o 7 cm, ya que, fijándonos en los valores altos,
una estatura de 1,90 seguramente es superada por el 1 o el 2 %o de la población, lo
que vendrían a ser 3 desviaciones típicas por encima de la media.

O t r a s d is tr ib u c io n e s. R e f l e x i ó n fin a l s o b r e lo s m o d e lo s « te ó r ic o s »

Existen otras distribuciones de probabilidad. Por ejemplo, si la variable es continua y


todos los valores son igualmente probables, la distribución se llama «uniforme». Excel
da valores de esta distribución entre Oy 1 cuando se le piden números aleatorios con
la instrucción «=aleatorioQ»,y éstos eran los que se encontraba la persona que quería
números para rellenar boletos de la lotería Primitiva. El catálogo de distribuciones
incluye muchas más; en la siguiente figura pueden verse los que contiene el paquete
de software estadístico Minitab.

file £d¡t Dita¡ £alc ¿tat graph Editor Toáis Help


$: |P Cajeulator...
3 J ! £olumnSt*tist¡ci...
i ®t m v c Ibssbí Is

Stlnndardiu-,
01 MatagattemcdOat#
MakeMestJD.u..
iM akelndicatorVariables-.
Setfiase-,
fiandomData
£hi-Square...
M
atrices a'
f-
...
l¿rwform_.

fiinomial...
Gwmftriic-.
NegativaBinornial—
^p^^TOtric...
Discreta...
* C1 C2 C3 C4 ¡I £osson... C8 C9 C10
|
Beti~
Cauehy-
Ejponertial...
gamma,..
.aplace-
LargsstExtremaValué.-
Lsgisiic-
loglogijtic...
iognoqnat-
SmallestExtremeVa*ue_.
Triangular..
Ü leibulL.

Distribuciones de probabilidad para las que se pueden calcular probabilidades


directamente con el paquete de so ftva re estadístico Minitab.

67
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Catalogado o no, no hay que confundir el modelo con la realidad. Aunque la


esfera es una figura geométrica muy frecuente en el universo, seguro que no hay
ningún objeto que sea perfectamente esférico. Entonces, ¿de qué sirven las fórmulas
de la superficie o del volumen de la esfera? Sirven porque a efectos prácticos dan
valores suficientemente aproximados. Lo mismo ocurre con las distribuciones de
probabilidad.
Uno de los ejem plos más socorridos para ilustrar la distribución normal es el
de las alturas de las personas, pero si tuviéramos las alturas exactas de los millones
de habitantes adultos del planeta, podríamos comprobar que no se ajustan «exac­
tamente» a nuestra conocida campana, y tampoco lo harían si estratificamos por
sexo, raza, o lo que sea.
Se trata de un buen modelo de referencia que permite realizar, con toda la
precisión necesaria, estimaciones sobre los valores de las alturas, pero no deja de
ser un modelo teórico que no coincide exactamente con la realidad. Lo mismo
ocurre con las otras distribuciones en las que, seguramente porque en la práctica
no se cumplen con exactitud las hipótesis que se consideran, no dejan de ser mo­
delos teóricos (lo de teórico para un modelo es un calificativo innecesario), pero,
eso sí, enormemente útiles.

Un entretenimiento: probabilidades sorprendentes


Los problemas de cálculo de probabilidades causan respeto porque pueden ser bas­
tante difíciles, aun teniendo un enunciado aparentemente inocente (¿cuál es la pro­
babilidad de que la combinación ganadora de la lotería Primitiva tenga dos números
seguidos?).
Lo interesante es que se descubren probabilidades sorprendentes, en algunos casos
muy distintas de lo que uno diría dejándose llevar por la intuición.Y los problemas
difíciles se pueden intentar resolver con un poco de imaginación.Veamos algunos
ejemplos.

Falsos positivos

En un chequeo rutinario a una persona le detectan una enfermedad que padece el


1 'Xmde la población. El tipo de análisis que le han realizado produce un 5% de falsos
positivos (marca que tiene la enfermedad cuando en realidad no se padece). ¿Cuál
es la probabilidad de que realmente tenga la enfermedad?

68
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Quizás esté pensando que es del 95%, pero entonces se equivocaría, ya que en
realidad es mucho menor. Por cada 1.000 personas analizadas tendremos 50 falsos
positivos (el 5%) y 1 positivo verdadero. Luego, si entre los 51 positivos únicamente
hay uno verdadero, la probabilidad de que sea el suyo es sólo de 1/51, es decir, li­
geramente menor del 2%.

E l problema del cumpleaños

En una clase de 30 estudiantes, ¿cuál es la probabilidad de que 2 o más celebren su


cumpleaños el mismo día?
Muchas personas piensan que esta probabilidad debe ser muy pequeña, pero lo
ciertos es que no lo es tanto. Debemos empezar calculando la probabilidad de que
2 personas no hayan nacido el mismo día. La primera no tiene restricciones, ha
podido nacer cualquier día del año (365 casos favorables sobre 365 posibles), pero
la segunda ha podido nacer cualquier día menos el que ha nacido la primera (364
días favorables sobre 365 posibles):

365 364
= <), 9973.
365 365

De forma análoga, la probabilidad de que 3 hayan nacido en días distintos será:

365 364 363


0,9918.
365 365 365

Y la probabilidad de que 30 hayan nacido en días distintos:

365 364 363 336 „ _


----------------- . . . -------= 0,2937.
365 365 365 365

Solo hay dos posibilidades: todos han nacido en días distintos o al menos 2 han
nacido el mismo día. Luego la probabilidad de que al menos 2 hayan nacido el
mismo día será:

365 364 363 336


365 365 365 365

69
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

C O M P A R T IR C U M P L E A Ñ O S

Aunque parezca sorprendente, la probabilidad de que en un grupo de 23 personas dos o más


celebren su cumpleaños el mismo día es ligeramente superior al 50% (exactamente del 50,7%).
Si los razonamientos que hay tras la forma de calcular esa probabilidad no acaban de convencer,
puede verse lo que ocurre en diversos grupos de 23 personas. El problema es encontrarlos y
saber la fecha de nacimiento de cada uno. Sin embargo, hay alternativas.
En un campo de fútbol hay 23 personas (11 + 11 + 1, el árbitro) y en Internet es fácil encontrar
tanto las alineaciones de los partidos como la fecha de nacimiento de los jugadores. Dicho y he­
cho', tomando los partidos de la primera jornada del año 201 O(la del 3 de enero) de la primera
división de la liga española de fútbol, de los 1O partidos que se jugaron, en 5 había personas en
el campo que compartían día de cumpleaños, en concreto:

Valencia - Espanyol Bruno (V) y Forlín (E), el 10 de enero.


Javi Venta y Cazorla el 13 de diciembre; Capdevila y Fuster el 3 de
Barcelona - Villareal
febrero. Los cuatro son del Villarreal.

At. Madrid - Sevilla No hay coincidencias.


Racing - Tenerife No hay coincidencias.
Aquí tenemos tres parejas: Botía (S) y Munúa (M) el 27 de enero;
Sporting - Málaga Maldonado (S) y Fernando (M) el 2 de junio; Manu y Torres, los dos
del Málaga, el 14 de agosto.
Getafe - Valladolid No hay coincidencias.
Zaragoza - Deportivo No hay coincidencias.
Almería -Xerez No hay coincidencias.
Mallorca - Athletic Amorebieta y Castillo, ambos del Athletic, el 29 de marzo.
Osasuna - R. Madrid Roversio (O) y Alvaro Arbeola (RM) el 17 de enero.

Pero tampoco crea que si la probabilidad es del 50% entre 1O casos, seguro que hay 5 «éxi­
tos», de la misma forma que al lanzar 1Oveces una moneda no tienen porque salir 5 caras. Las
probabilidades son:

Partidos con
2 3 4 5 6 7 8 9 10 1
coincidencia

Probabilidad 0,001 0,01 0,04 0,12 0,21 0,25 0,21 0,12 0,04 0,01 0,0011

1 L o d e « d i c h o » m á s r á p i d o q u e lo d e « h e c h o » . E s t o ú l t i m o c o n la a y u d a d e F ilip a d a S i lv a , e s t u d i a n t e d e

I n g e n i e r í a i n d u s t r ia l.

70
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

Eso es, la probabilidad de que en un grupo de 30 personas 2 o más hayan nacido


el núsmo día es del orden del 70%. Con 23 personas ya es ligeramente superior al
SO%, y con 40 es del 89%.

Probabilidad d e que en un grupo de personas 2 o más hayan nacido


el mismo día del año en función del tamaño del grupo.

Variante (lo núsmo, pero visto al revés): en un grupo de 30 personas, ¿cuál es la


probabilidad de que 2 o más mueran el núsmo día (no necesariamente del núsmo
año)?

La combinación ganadora sale dos veces

Veamos otro caso de probabilidades sorprendentes. Una persona juega toda su vida
adulta (pongamos SO años) a la lotería Primitiva; si se realizan 2 sorteos por semana,
¿cuál es la probabilidad de que durante ese periodo salga más de una vez la núsma
combinación ganadora?

71
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

A u n q u e hay otras variantes, lo h a b itu a l es e le g ir 6 núm eros del 1 al 49, y hay


13.983.816 form as de hacerlo (son co m b in a cio n e s de 49 elem entos tornados de 6
en 6), de las cuales sólo una es la ganadora.
S u p o n ie n d o que esta persona ju e g u e 100 veces al año, ju g a rá 5 .0 0 0 veces a lo
larg o de su v id a y resulta que el p ro b le m a planteado es análogo al del cum pleaños,
pero es co rn o si tu v ié ra m o s u n año co n 1 3 .9 8 3 .8 1 6 días y 5 .0 0 0 personas, cada
una de las cuales ha n a cid o u n o de esos días. ¿Cuál es la p ro b a b ilid a d de que 2
o más hayan n a cid o el m is m o día? A p lic a n d o las fó rm u la s que hem os visto (una
h o ja de cá lcu lo es im p re s c in d ib le ) resulta que esta p ro b a b ilid a d es del 59%. Lue g o
no es raro que, si lle v a b ie n las cuentas, descubra que ha tocado 2 veces la m ism a
c o m b in a c ió n .

Números seguidos en La Primitiva

Finalizarem os este apartado con una cu e stió n que quizá se haya planteado en alguna
ocasión. ¿Cuál es la p ro b a b ilid a d de que en el sorteo de la lo te ría P rim itiv a salgan
2 núm eros seguidos?
Es más alta de lo que p u d iera parecer en u n p rin c ip io , exactam ente del 49,5% .
C a lc u la r este v a lo r c o n las fó rm u la s de la c o m b in a to ria n o es in m e d ia to , p e ro
pue d e co m p ro b arse que éste es su o rd e n de m a g n itu d u tiliz a n d o una h o ja de
cálculo E xcel.
E l p ro c e d im ie n to puede ser el siguiente:

1. C o lo q u e los nú m e ro s del 1 al 49 en la co lu m n a A .

2. E n la c o lu m n a B ponga núm eros aleatorios.

3. O rd e n e la co lu m n a B arrastrando en la o rd e n a ció n a la c o lu m n a A .

4. A h o ra tiene la c o lu m n a A desordenada al azar. C o p ie los 6 p rim e ro s valores


en la colum na C. É sa será la c o m b in a c ió n ganadora.5

5. E n la c o lu m n a D c o lo q u e las 15 d ife re n c ia s , en v a lo r a b s o lu to , que se


p u e d e n c a lc u la r e n tre los va lo re s de la c o m b in a c ió n ganadora. P ara su
in fo rm a c ió n , la c o lu m n a F de la fig u ra in d ic a el c o n te n id o de las celdas
de la c o lu m n a D .

72
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE

El..... -■ (- A | -MIN(D1:D15)
A B C D í E : F 1
1 24 0,406033264 24 25l l=ABS(C$l-C2)
2 49 0,692061135 49 10 =ABS(C$1-C3)
3 34 0,888345552 34 1 =ABS(C$1-C4)
4 25 0,690317785 25 18 =ABS(C$1-C5)
í) 42 0,510624023 42 14 =ABS(C$1-C6)
6 10 0,731399102 10 15 =ABS(C$2-C3)
7_ ^ 35 0,80523146 24 =ABS(C$2-C4)
8 29 0,485161895 7 =ABS(C$2-C5)
9 5 0,841222518 39 =ABS(C$2-C6)
10 44 0,073104639 9 =ABS(C$3-C4}
11 ^ 7 0,437421932 8 =ABS(C$3-C5}
12 46 0,594398038 24 =ABS(C$3-C6)
13 15 0,081228671 17 =ABS(C$4-C5)
14 38 0,109743618 15 =ABS(C$C6)
15 ^ 13 0,341018331 32 =ABS(C5-C6)

6. En la primera posición de la columna E coloque el valor mínimo de la columna


D. Si este valor es 1 significa que hay números seguidos en la combinación
ganadora.

Una vez completado este proceso, si vuelve a reordenar la columna B arrastrando


en la ordenación a la columna A, volverá a tener una combinación ganadora y todos
los números se recalcularán. La gracia está en que una vez hecho esto basta pulsar la
tecla F4 para que todo el proceso se repita. Podrá comprobar que aproximadamente
la mitad de las veces aparece un 1 en la columna E.
Si conoce algún lenguaje de programación también puede escribir un pequeño
programa que simule el sorteo y contar el número de veces que salen números
seguidos.
Otra opción es consultar los datos históricos. En España están publicados en
la página web del Organismo de Loterías del Estado (www.onlae.es) y desde que
aparecieron los primeros datos el 17 de octubre de 1985 hasta el 31 de diciembre
de 2009 se han realizado 2.245 sorteos, en 1.148 de los cuales (SO, 14%) aparecen
números seguidos.
Traca final: el 22 de agosto de 2002 la combinación ganadora fue: 13, 21, 24,
26, 32 y 34, y el 10 de diciembre de 2009 fue. .. ¡exactamente la misma! N o es tan
raro, la probabilidad de que haya alguna coincidencia en 2.245 sorteos es del 16,5%.

73
C a p ítu lo 3

Conocer el todo mirando


una parte
Una de las actividades más típicas de la estadística es la de extraer conclusiones sobre
el todo mirando sólo una parte.Al «todo» se le denomina «población», herencia de las
primeras aplicaciones de la estadística, en las que efectivamente el objeto de estudio
era una población de individuos. Ahora se le sigue llamando de la misma forma,
pero la población ya no debe estar formada necesariamente por personas; pueden ser
los peces de un lago o los aparatos que ha producido una fábrica durante el último
año. También, por supuesto, puede estar formada por el conjunto de ciudadanos
con derecho a voto en las próximas elecciones o por el conjunto de personas que
padecen una determinada enfermedad.
Estudiar la población exhaustivamente casi siempre es imposible. N o es viable
preguntar a todos los electores a quién piensan votar en las próximas elecciones, ni
a todos los enfermos qué tal les ha sentado un nuevo fármaco. Por otra parte, si la
característica de interés de las piezas fabricadas es su resistencia a la tracción y hay que
romperlas para conocer ese valor, quizá se puedan romper todas para saber cuánto
«resistían», pero no parece que esto sea lo más sensato.
Lo que se hace es elegir una parte de la población, que se denomina «muestra»,
y, a partir de los resultados obtenidos en esa muestra, estimar (hacernos una idea
lo más aproximada posible) las características de la población. Las reglas del cálculo
de probabilidades permiten obtener información sobre la calidad de la estimación
realizada a través de una serie de conceptos como los denominados «nivel de con­
fianza» o «margen de error».
Claro que todo esto será verdad siempre y cuando la muestra sea representativa
del conjunto de la población. Si no es representativa, es evidente que no sirve, aunque
a veces en determinados informes se exagera la importancia de los aspectos mate­
máticos (ya que apabullar con un lenguaje matemático que no se entiende suele ser
barato y efectivo) y se descuida la forma en la que se ha recogido la muestra. Esto
último es mucho más caro, pero es una cuestión absolutamente crítica para garantizar
la validez de las conclusiones.

75
CONOCER EL TODO MIRANDO UNA PARTE

Estimación d e las características d e la población a través de una muestra representativa.

¿Cuántos peces hay en un lago?


¿Cuántos taxis hay en una ciudad?
A continuación veremos dos ejemplos de estimación de características de la pobla­
ción, en este caso su tamaño, aplicando técnicas de muestreo.

P eces

Contar cuántos peces hay en un lago no parece una tarea fácil, especialmente si es
grande y de aguas turbias, pero los biólogos saben cómo hacerlo. Utilizando técni­
cas estadísticas, por supuesto. Un método muy utilizado es el llamado de «pesca y
repesca» (o, en general, de «captura-recaptura», porque no sólo sirve para peces). El
procedimiento es el siguiente:

1. Pescar una muestra de peces, marcarlos y devolverlos al agua. Naturalmente


esto no se puede hacer de cualquier manera. La pesca hay que realizarla de
forma que no se lastime a los peces. Existen técnicas como el uso de descargas
eléctricas que los aturde durante el tiempo suficiente para cogerlos y marcarlos.

76
CONOCER EL TODO MIRANDO UNA PARTE

La marca no debe p e rju d ic a r la m o v ilid a d n i la supervivencia del pez y tam bién


es necesario que p e rd u re al menos hasta la repesca.

2. D e ja r pasar u n tie m p o (puede ser unos días) hasta que sea razonable considerar
que los peces marcados se han dispersado p o r to d o el lago, y v o lv e r a pescar
o tra m uestra (la «repesca») de u n n ú m e ro que no necesariam ente debe ser
ig u a l al de la pesca.

3. H acer los cálculos: si en el lago hay N peces y se marcan M , la p ro p o rc ió n de


peces marcados es M /N . En la repesca se capturan C peces, que pueden consi­
derarse com o una m uestra representativa de todos los peces del lago, y entre ellos
se encuentran R marcados. Es razonable considerar que la p ro p o rc ió n de peces
marcados en la segunda muestra es sim ila r a la p ro p o rc ió n de peces marcados
en el lago, es decir:

M _ R

N - C

D e fo rm a que una e stim ación del n ú m e ro de peces que hay en el lago es (des­
pejando N ):

Veamos a c o n tin u a c ió n un e je m p lo n u m é ric o .


Pesca. Se pescan y se marcan u n c o n ju n to de M peces (que puede considerarse una
muestra aleatoria de los N p e c e s d e l lago). E n nuestro caso, M = 15.

77
CONOCER EL TODO MIRANDO UNA PARTE

Repesca. Se deja pasar u n tie m p o para que los peces marcados se dispersen p o r to d o
el lago y se pescan otros ( Q contando el n ú m e ro (R) de los que aparecen marcados.
E n nuestro caso, C = 1 5 y R = 3.

M ■C 15-15
C á lcul o. E l n u m e ro d e peces en el l ago estarn en to rn o a: N = 75.
R 3

C o n c lu s ió n : n ú m e ro
de peces en to rn o a 75.

Pero, ¿qué significa «estar en to rn o a»? E n el ejem plo, si se entretiene en contarlos,


verá que en el lago ha y 67 peces y, p o r lo tanto, se ha c o m e tid o u n e rro r del 12%.
¿Es éste u n e rro r m a yo r o m e n o r de lo q u e cabía esperar? ¿Cuál es la m a g n itu d del
e rro r que se puede c o m e te r aplicando este m étodo?
Basándose en hipótesis razonables y argum entos m atem áticos, la teoría estadística
se encarga de responder a estas preguntas, aunque para hacernos una idea ta m b ié n
podem os u tiliz a r un pe q u e ñ o p ro g ra m a de o rd e n a d o r que sim ule el proceso sobre
u n n ú m e ro de peces fija d o p o r nosotros. D e esta fo rm a se puede re p e tir la pesca y

78
CONOCER EL TODO MIRANDO UNA PARTE

repesca tantas veces como se quiera y, viendo el número de peces que se habría esti­
mado en cada simulación, se puede determinar también la magnitud de los errores
que se comenten y con qué frecuencia se presenta cada uno de ellos.
Con los datos de nuestro ejemplo, en el 85% de los casos se encuentran entre 2 y
5 peces marcados, lo que aplicando la fórmula que hemos deducido conduce a una
estimación de entre 112 y 45 peces. El 15% de las veces la estimación está fuera de
este intervalo.

85 %
30

25
r

20

i: 15
V 15
o
10 -

5-
P

o n i ja
o 1 2 3 4 5 6 7 8 9
Peces encontrados marcados en la repesca

Distribución del número de peces encontrados marcados en la repesca


con los datos del ejemplo (resultados obtenidos simulando el proceso 10.000 veces).

Los errores que se cometen por exceso son más frecuentes que los que se dan
por defecto, y también resulta que el valor medio de las estimaciones es 82, superior
al valor real. Cuando esto ocurre, se dice que el estimador es «sesgado», no apunta
bien al verdadero valor del parámetro que se está estimando.
La estimación mejora notablemente introduciendo unas pequeñas correcciones
en la fórmula. El único problema es que ya no la podem osjustifcar de forma sencida.
CONOCER EL TODO MIRANDO UNA PARTE

Utilizando esta fórmula, encontrar 2 peces marcados conduce a una estimación


de 84, y si encontramos 5 la estimación será de 42. Por lo tanto, en el 85% de los
casos la estimación estará entre 42 y 84. Además, el 27% de las veces encontraremos
3 peces marcados y nuestra estimación será de 64, muy próxima al valor real. Éste
es un estimador «insesgado», es decir, que si repetimos el proceso muchas veces, en
promedio el valor estimado coincide con el valor real.
También se pueden incluir coeficientes de corrección si se considera que no todos
los peces tienen la misma probabilidad de ser capturados, o si la marca puede afectar
a su supervivencia, o si algunos peces pueden perder las marcas. En fin, éste es un
tema muy bien estudiado y que los libros de ecología tratan con detalle.También es
un buen ejemplo de cómo la estadística permite abordar problemas que de entrada
parecen muy dificiles, si no imposibles.

Taxis

El reto es mucho más ficil si de lo que se trata es de contar el número de taxis que hay
en una ciudad. La primera opción es buscarlo en Internet.Así, por ejemplo, la página
web del ayuntamiento de una gran ciudad informa de que en el área metropolitana
de la población existen 10.481 licencias de ta.xi. A cada licencia le corresponde un
vehículo. Asunto resuelto.

Número de licencias 10.481

Número de credenciales de taxistas 19.019 (12.536 activas)

Carreras diarias Más de 225.000

Vehículos autorizados para taxi 13 marcas / 55 modelos

Antigüedad 5 años: 67,5%


Entre 5 y 7 años: 19,6%
Entre 7 y 1Oaños: 9,5%
+ 1Oaños: 3,4%

Media de edad del parque de vehículos de taxi 4 años

Pero si no se encuentra el dato, se puede utilizar la estadística. Los taxis tie­


nen un número de licencia que está a la vista en el coche, y estos números son
correlativos desde el 1 hasta el número de licencias que existen. Cuando nos

80
CONOCER EL TODO MIRANDO UNA PARTE

co m p ra m o s un coche n u e vo el n ú m e ro de m a tríc u la es ta m b ié n n u e vo (el que


v ie n e a c o n tin u a c ió n del ú ltim o que se ha dado) y la m a tríc u la d e l co ch e v ie jo ,
si va al desguace, deja de e x is tir.
Sin e m b a rg o, con el n ú m e ro de lic e n c ia de los ta xis no o c u rre lo m is m o
(aunque es p ro b a b le que haya exce p cion e s): el n ú m e ro de lice n cia s es fijo , y si
una persona q u ie re ser taxista le debe c o m p ra r la lic e n c ia a o tro de fo rm a que
su n ú m e ro será el de la lic e n c ia que ha c o m p ra d o . Esto fa c ilita m u c h o la tarea
de co n ta r, y en 10 m in u to s , en el c e n tro de la ciudad, sin te lé fo n o n i c o n e x ió n
a In te rn e t, se puede hacer una m u y buena e s tim a c ió n d e l n ú m e ro to ta l de taxis
que hay.Veam os có m o .
Si de una p o b la c ió n num erada se sacan los valores: 8, 14, 22, 27 y 35, y le p id e n
que dé una e s tim a ció n del n ú m e ro de e le m e n to s que c o n tie n e , seguro que no
dirá 25, p o rq u e a la vista de los n ú m e ro s que han salido, c o m o m ín im o hay 35,
y ta m p o co dirá 1.000 p o rq u e sería m u y ra ro que si ése fuera el n ú m e ro , sacando
5 al azar todos sean tan pequeños. S eguram ente una buena e stim a c ió n estará en
to rn o a 40 o 50.
U n a p rim e ra idea para dar una regla puede su rg ir al observar que en una p o bla­
c ió n de este tip o el n ú m e ro to ta l de elem entos es ig ual a 2 veces su m edia m enos
uno. P or ejem plo, si la p o b la c ió n consta de 10 elem entos, sus valores serán 1 ,2 , 3, 4,
5, 6, 7, 8 ,9 y 1 0 ,la m edia 5,5 y el n ú m e ro de elem entos de la p o b la c ió n 2 • 5,5 - 1.
E n general, si x es la m edia de una p o b la c ió n fo rm a d a p o r N nú m e ro s seguidos
p a rtie n d o del 1, siem pre se v e rific a que:

N = 2 :X -1 .

Si aplicam os esta regla general a los datos de la m uestra a n te rio r, su m e d ia es


2 1 ,2 ; lu e g o la e stim a c ió n será 2 2 1 , 2 - 1::4 1 , lo cual lig a m u y b ie n con lo que
nos había pa re cid o de fo rm a in tu itiv a .
Pero este sistema tiene u n p ro b le m a im p o rta n te . Si los datos son 3, 4, 6 y 15, l a
m e d ia es 7 y nuestra e s tim a c ió n para el n ú m e ro to ta l de ele m e n to s es 13, lo cual
es e v id e n te m e n te falso, ya que en la m uestra tenem os el e le m e n to n ú m e ro 15 y,
p o r lo ta n to , c o m o m ín im o hay ese n ú m e ro de e lem entos. Es bastante rid íc u lo ,
y n o tan raro, usar técnicas sofisticadas para lle g a r a co n clu sio n e s que el se n tid o
c o m ú n dice que son falsas. H a b rá que pensar nuevos m é to d o s.
E n realidad sólo nos hace falta saber cuántos elem entos hay p o r encim a de 35
para saber cuántos h a y en to ta l.

81
CONOCER EL TODO MIRANDO UNA PARTE

8, 14, 22, 27, 35

U n a o p c ió n que parece bastante razonable es, p o r sim etría, co n sid era r que a
c o n tin u a c ió n del ú ltim o hay tantos elem entos com o antes del p rim e ro . E n este caso
sumaríamos 7 a 35 y nuestra estim ación sería 42. E l in c o n v e n ie n te de este m é to d o
es que ignoram os la in fo rm a c ió n que aporta el n ú m e ro de elem entos que ha y entre
las observaciones, y siem pre co n vie ne aprovechar toda la in fo rm a c ió n disponible.
U n a fo rm a de hacerlo es a ñ a d ir al ú ltim o v a lo r el p ro m e d io de las distancias entre
las observaciones que tenem os (la p rim e ra distancia es el n ú m e ro de los elem entos
que h a y antes de la p rim e ra o b se rva ció n ).

E n nuestro caso habrá que añadir:

7+5+7+4+7
5

P o r ta n to nuestra e s tim a c ió n será 41. E n general, si x ¡ , x 2.. ., x representa los


valores en las p o sicio n e s 1 , 2 . . . , n, la c a n tid a d que se debe a ñ a d ir al ú ltim o v a lo r
será:

(X ~ l) + (x2 - x 1-1 ) + (x3 - x , - 1) + . ■■ + (x,[ x,,_i-1)


n

Y es fa c il c o m p ro b a r que esta expresión es equivalente a:

X
- 1
n

82
CONOCER EL TODO MIRANDO UNA PARTE

Por tanto, la mejor estimación del número total de elementos de la población es:

X
x +_!l_-1.
" n

¿Y qué calidad posee este estimador? Puede demostrarse (como lo hace la es­
tadística matemática) que con los criterios que se manejan para calificar las carac­
terísticas de un estimador éste es el mejor que se puede calcular. En la jerga de los
especialistas se dice que es un estimador U M V U E (palabra que corresponde a las
siglas de Uniformly Mínimum- Variance Unbiased Estimator).
Así pues, basta con mirar las licencias de 20 taxis y al valor de la mayor se le suma
ese valor dividido por 20 y se le resta una unidad. En el caso de nuestro ejemplo, si el
número de licencias es 10.481 y efectivamente están numerados de forma correlativa,
en el 95% de los casos nuestra estimación estará entre 9.175 y 10.990.
Evidentemente, este método no sólo sirve para contar taxis.También se puede
utilizar, por ejemplo, para estimar el número de participantes en una carrera po­
pular si se entregan los dorsales de forma correlativa desde el 1 hasta el número
del último que se inscribe. También, cambiando totalmente de escenario, parece
que los servicios de espionaje han utilizado estas técnicas para estimar la cantidad
de armamento del que dispone el enemigo. Si las armas llevan un número de serie
y se apoderan de unas pocas, ya hemos visto que no es difícil deducir el número
total de las que se disponen.

¿Qué proporción de hogares tiene conexión a Internet?


En primer lugar deben estar claros los términos que se manejan: ¿qué es un hogar?,
¿qué entendemos por conexión a Internet? N o tiene sentido hilar muy fino en el
cálculo de unos valores que no está claro lo que significan.
U n titular de un diario decía que la mitad de los cigarrillos los fuman personas
con trastornos mentales, parece que queriendo decir que «la mitad de los que fuman
están locos» y esto suena a exageración.Pero no, en el texto del artículo definía como
trastorno mental la adicción a alguna sustancia, por lo que seguramente no la mitad
sino prácticamente todos los cigarrillos son fumados por personas con adicción y,
por lo tanto, con «trastornos mentales». Muchas palabras que utilizamos de forma
habitual tienen un significado confuso y una de ellas es «familia». ¿Qué es una fa­
milia? ¿Un matrimonio con sus hijos? ¿Y si los abuelos viven en la misma casa hay

83
CONOCER EL TODO MIRANDO UNA PARTE

E S T IM A C IO N E S S O B R E L A C O M B IN A C IÓ N G A N A D O R A
D E L A L O T E R Í A P R IM IT IV A

Sabemos de sobra que todos los números de la lotería Primitiva tienen la misma probabilidad de
salir, pero ¿y la media de la combinación ganadora? El día 7 de enero de 201 O la combinación
ganadora en la lotería Primitiva española fue 19, 24, 25, 38, 43 y 49, lo que tiene una media de
33, y el sábado 9 de enero fue 13, 26, 29, 30, 31 y 43, lo que da una media de 28,67 (redon­
deando). ¿Todas las medias tienen la misma probabilidad de salir, o unas salen más que otras?
La respuesta es que unas salen más que otras porque, tal y como vimos en el capítulo anterior,
las medias tienden a seguir el patrón de la distribución normal. La distribución de la media de
los sorteos efectuados entre el 17 de octubre de 1985 y el 31 de diciembre de 2009 está repre­
sentada en el siguiente histograma:

5 10 15 20 25 30 35 40 45 49

Medias de las combinaciones ganadoras

Es mucho más probable que la media esté entre 20 y 30 que entre 5 y 15. Entonces, ¿por qué
no apostamos siempre por combinaciones que tengan una media entre 20 y 30? Porque hay
muchas más combinaciones que tienen esas medias, y la probabilidad de que le toque a una
combinación en concreto es siempre la misma.
Dicho de otro modo, en un sorteo hay 1.000 números, ¿qué es más probable, que toque
entre el 500 y el 550 o fuera de ese intervalo? Evidentemente, es más probable que toque
fuera, pero eso no quiere decir que un número de dentro tenga menos probabilidades que
uno de fuera.

84
CONOCER EL TODO MIRANDO UNA PARTE

que contarlos como miembros de la familia? Parece raro que pertenecer o no a una
familia dependa de la casa en la que vives. También se puede entender familia en
un sentido mucho más amplio, como cuando en las bodas se habla de la familia del
novio y de la de la novia, y que fácilmente son varias decenas de personas cada una.
¿Un hogar es igual a una vivienda? Seguramente no, porque si no vive nadie
no puede ser un hogar. Si se trata de una vivienda de fin de semana, o que sólo se
ocupa en la época de vacaciones, seguramente tampoco puede ser considerada como
un hogar. Un piso de estudiantes, que está ocupado durante el curso académico,
¿es un hogar? Parece que un hogar está ligado a una familia, ¿o no es necesario? Es
imprescindible, por lo tanto, ponerse de acuerdo en lo que se entiende por hogar.
Lo que significa tener conexión a Internet seguramente presenta menos dudas,
no importa si es a través de módem o por banda ancha. Sin embargo, hay viviendas
que tienen conexión inalámbrica porque su vecino la tiene y no está protegida, o
porque viven cerca de una biblioteca o zona de acceso gratuito; ¿hay que contar
que esos hogares tienen conexión a Internet, o sólo se cuentan los que la pagan?

OIOCWWIOOfCtAl^W^FSWacCA ediMbrite ___ [j

bogar.
ÍÍX-Ib.latfocJrit,aJj.der.de/nciu.fitcgo)
J,rn.Sitiodondeselucelaiumbn:enliscocinu,chimcacas,homosdefundición.etc.
2. Casaodomicilio.
3. Fanúíía,grupodepcrs.onasemparentadasquevivenjuntas.
4. M ÜlD.CHestablecimientobenéfico).
5. Centrodeocioenelquesereúnenpersonasquetienencncomiinunaactividad,
unasiliaciónpersona!ounaproeedcneia. deípevu'ionr.ntf.
6. • n.ns.foguea.
I l.m.lwga.rdonde combustiónu:produceencomunicacióndircciacondairc.

Definición de «hogar» en el diccionario d e la Real Academia Española.

Supongamos que se define hogar como una vivienda en la que conviven la mayor
parte del año una o más personas que están emparentadas, y se entiende que tienen
conexión a Internet si está bajo su control el contar con ella o dejar de tenerla.
Si sobre una población total de 100.000 hogares se toma una muestra de 1.000
y resulta que la proporción de los que tienen conexión a Internet en esa muestra
es del 51,9%, ¿significa que éste es exactamente el porcentaje en toda la población?
Evidentemente, la respuesta es que «no necesariamente». Si en lugar de la muestra
que nos ha tocado por azar, nos hubiera tocado otra, seguramente el resultado no
hubiera sido idéntico, podría haber salido 50,7 o 52,3, por ejemplo.

85
CONOCER EL TODO MIRANDO UNA PARTE

Por esa razón, cuando se dan los resultados de un estudio de este tipo no sólo se
presenta el valor de la proporción estimada, sino que también se informa sobre un
margen de error razonable en torno a ese valor. Por ejemplo, el resultado de la esti­
mación podría ser: 51,9% ± 2,3%.
El 2,3% que sumamos y restamos es lo que se denomina «margen de error». Sig­
nifica que aunque nos ha salido un valor concreto nosotros no podemos estar seguros
de que en la población el valor sea exactamente ése. El cálculo de probabilidades
nos permite determinar la variabilidad que presenta nuestra estimación y a partir
de ella calcular el margen de error (en el fondo de este asunto está la distribución
binomial, aquí el experimento es mirar un hogar y los dos resultados posibles son:
tiene conexión a internet o no la tiene).
Al intervalo que incluye el margen de error se le denomina «intervalo de confian­
za», ¿podemos asegurar que el verdadero valor estará dentro? La respuesta vuelve a ser
que no, no podemos estar seguros. El margen de error se calcula para un determinado
nivel de confianza y lo habitual es que ese nivel sea del 95%, lo cual significa que se
ha calculado por un procedimiento que sabemos que acierta (incluye el verdadero
valor de la proporción buscada) en el 95% de los casos, pero no podemos saber si
acierta en nuestro caso concreto. Es como si nos diera el intervalo una persona que
dice la verdad el 95% de las veces; podemos estar bastante seguros de que es verdad,
pero no totalmente seguros.

Intervalo de confianza del 95%

I
r 51,9% ± 2,3%
Estimación Margen
^ Puntual de error

Dice la verdad el
95% de las veces
Concepto de intervalo de confianza.

También pueden calcularse intervalos de confianza del 99, o del 99,9%, pero no
suele hacerse porque, dado un tamaño de muestra, cuanto mayor es el nivel de con­
fianza mayor es el margen de error que se obtiene, y de nada sirve decir con muchí­
sima seguridad que la proporción que se busca está en el intervalo 51,9 ± 40%, para

86
CONOCER EL TODO MIRANDO UNA PARTE

eso no hacía falta hacer ningún estudio. Si se desea aumentar el nivel de confianza
manteniendo el margen de error no hay más remedio que aumentar el tamaño de la
muestra (el dinero soluciona muchos problemas, y también éste).

« E l P a r t id o A a v e n t a ja a l P a r t id o B e n 3 ,6 p u n t o s »

Bajo un titular como el anterior es habitual encontrar en la prensa textos como el


siguiente: «Si hoy se celebraran elecciones generales, el Partido A aventajaría en 3,6
puntos porcentuales al partido B,según la estimación de voto probable realizada por
la empresa X . Hace tres meses,la ventaja era de 5 décimas menos. El dato confirma
una tendencia favorable para el partido A».Y en un recuadro titulado «Ficha técnica»
se informa,entre otras cosas, de que el margen de error de los datos referidos al total
de la muestra es del ±4,5% . Un análisis superficial de estos datos pone de manifiesto
que no está tan claro que A vaya por delante de B. Si la encuesta da para el partido
A un porcentaje de votos del 41,6%, el margen de error indica que una estimación
razonable para esa proporción está entre 37,1 y 46, 1,y si el partido B parte del 38%,
estamos diciendo que el intervalo en el que esperamos encontrar este valor está
entre 33,5 y 42,5. Por lo tanto, también podría ser, de acuerdo con los datos que
proporciona la encuesta, que A saque el 39% y B el 40%.
De lo que no cabe ninguna duda es que si hace tres meses la ventaja era de 5
décimas menos (¡en los resultados de la encuesta, no de la realidad!), esto no confir­
ma -en absoluto- una tendencia favorable para el partido A.

L a p r e g u n ta d e l m illó n

Seguramente la pregunta que se hacen con más frecuencia los que realizan una en­
cuesta es: ¿cuál debe ser el tamaño de la muestra para que los resultados sean fiables?
La respuesta es «depende», y depende de:

1. La precisión con que se desea tener los resultados o, dicho de otra forma, del
margen de error que se esté dispuesto a asumir. Si se desea que el margen de error
sea del 1%, se necesita un tamaño de muestra mayor que si se acepta uno del 4%.2

2. De la seguridad, lo que se denomina «nivel de confianza», con la que se desea


realizar la estimación. Si nos conformamos con un intervalo de confianza del 80%
necesitaremos un tamaño de muestra menor que si el intervalo debe ser del 95%.

87
CONOCER EL TODO MIRANDO UNA PARTE

3. Del verdadero valor de la proporción que se desea estimar. Aunque de entrada


esto parece un poco raro, es razonable que así sea. Si en la población no hay
variabilidad (el 100% de los elementos son iguales) basta con una sola unidad
para saber cómo son. Si en una urna todas las bolas son blancas, o todas son
negras, basta con sacar una para saber de qué color son. Cuanta mayor variabi­
lidad existe, mayor tamaño de muestra se necesita, y el caso más desfavorable es
cuando la proporción es del 50%. Lo que hacemos es suponer un valor para esta
proporción intentando pecar más bien por exceso. Si no sabemos nada o que­
remos ser conservadores, suponemos que es del 50% y segiro que el tamaño de
muestra no deberá ser mayor de lo que nos salga. Si sabemos que la proporción
que buscamos es menor (por ejemplo, el porcentaje de viviendas que tienen fax),
podríamos suponer, curándonos en salud, que es del 20% (seguro que es menor).

4. Del tamaño de la población. Cuando la población es pequeña (pongamos que


hasta 100.000 individuos), y si el margen de error que se desea también es
pequeño (del 1 o del 2%), a mayor tamaño de población se requiere mayor
tamaño de muestra. Pero para poblaciones grandes, o márgenes de error del
5% o mayores, la influencia del tamaño de la población apenas se nota. So­
bre este tema hay bastantes malentendidos y más adelante lo comentaremos
con detalle.

EL T A M A Ñ O D E L A M U E S T R A

Por si alguna vez le hace falta, la fórmula que liga todos los ingredientes para determinar el
tamaño de la muestra es:

n. z jjq N
E2N + z 2
a,2p q '
Siendo:
za/2 el valor ligado al nivel de confianza. Si es del 95%, el caso más habitual, vale 1,96.
En ocasiones se toma el valor de 2, y en ese caso corresponde a un intervalo de confianza
del 95,5%.
p es la proporción que se desea estimar

q, 1 - p .
E el margen de error.
N el tamaño de la población.

88
CONOCER EL TODO MIRANDO UNA PARTE

Ya sólo necesita una hoja de cálculo para ir probando y ver lo que ocurre con el
tamaño de muestra cuando se aumenta el nivel de confianza o cuando se cambia el
margen de error, o cómo afectan cualquiera de las variables que intervienen. Tam­
bién puede construir una tabla como la siguiente, en la que ya está casi todo hecho.

Tamaño de Margen de error


la población ±1% ±2% ±3% ±4% ±5% ±10%
500 467 414 341 273 218 81
1.000 906 706 517 376 278 88
1.500 1.298 924 624 429 306 91
2.000 1.656 1.092 696 462 323 92
2.500 1.984 1.225 748 485 333 93

3.000 2.286 1.334 788 501 341 94


3.500 2.566 1.425 818 513 347 94
4.000 2.824 1.501 843 522 351 94
4.500 3.065 1.566 863 530 354 95
5.000 3.289 1.623 880 536 357 95

6.000 3.693 1.715 906 546 362 95


7.000 4.049 1.788 926 553 365 95
8.000 4.365 1.847 942 559 367 95
9.000 4.647 1.896 954 563 369 96
10.000 4.899 1.937 965 567 370 96

15.000 5.856 2.070 997 578 375 96


20.000 6.489 2.144 1.014 583 377 96
25.000 6.939 2.191 1.024 587 379 96
50.000 8.057 2.291 1.045 594 382 96
100.000 8.763 2.345 1.056 597 383 96

500.000 9.423 2.390 1.065 600 384 97


1.000.000 9.513 2.396 1.066 600 384 97
1.500.000 9.543 2.398 1.067 600 385 97
2.000.000 9.558 2.399 1.067 601 385 97
50.000.000 9.602 2.401 1.068 601 385 97

Tabla con los tamaños de muestra necesarios para un nivel de confianza del 95%
y en el caso más desfavorable en que p = q = O,5.

89
CONOCER EL TODO MIRANDO UNA PARTE

¡Sorpresa! El tamaño de la muestra casi no depende


del tamaño de la población
Existen algunas ideas sobre el tamaño de las muestras que, a pesar de estar bastante
extendidas, son totalmente falsas. Por ejemplo, en ocasiones se duda sobre los resulta­
dos de una encuesta con el argumento de que «la muestra no es representativa, pues
ni siquiera llega a ser el 10% de la población». Cifras como ésta del 10%, o cualquier
otra, son totalmente arbitrarias. El profesor Roberto Behar, de la Universidad del
Valle en Cali, Colombia, lo explica con unas claras analogías.

¿Le hace falta sal a la sopa?

Para preparar la sopa tenemos una olla, pongamos que más bien pequeña, y para saber
si está bien de sal la catamos con una cuchara. Si un día tenemos invitados y hay
que preparar la sopa en una olla mucho mayor, ¿necesitaremos también una cuchara
mucho mayor para catarla? Es evidente que no. Todos usamos la misma cuchara, y
damos el sorbo de la misma forma, tanto si la olla es grande como si es pequeña. El
tamaño de la muestra no depende del tamaño de la población.
Lo que sí hay que hacer, sea cual sea el tamaño de la olla, es remover bien para
homogeneizar la sopa, y asegurarnos de que cualquier posible muestra brinde la
misma información.A nadie le sorprende que sea mucho más importante mezclar
bien antes de probar que aumentar el tamaño de la cuchara.Y también sabemos
que el error de no remover no se corrige utilizando una cuchara más grande. Si
la muestra no es representativa, aumentar su tamaño no resuelve el problema. En
absoluto.

¿Cuál es mi grupo sanguíneo?

Basta con una gota de sangre para conocer de forma inequívoca el tipo de sangre
de una persona, puesto que todas las gotas de sangre de una persona son del mismo
tipo; vista una quedan vistas todas. De nuevo se pone de manifiesto que el impacto
de la homogeneidad es más importante que el del tamaño de la población. La misma
cantidad de sangre se requiere para un niño recién nacido, de apenas 2 kilos y medio,
que para su padre, aunque éste pese más de 100 kilos.
Pero no sólo se dispone del argumento de la intuición. También se puede usar
la fórmula para ver cuál es la relación entre el tamaño de la muestra y el tamaño de la

90
CONOCER EL TODO MIRANDO UNA PARTE

L O S Z U R D O S V IV E N M E N O S ( ¿ O N O ? )

El 4 de abril de 1991 el W a sh in g to n P o st publicaba en su portada una noticia sobre un estudio


que ponía de manifiesto que los zurdos viven, en promedio, 9 años menos que los diestros.
El estudio se basaba en el análisis de las defunciones en dos condados de California en los
que se analizó la edad de las personas al morir según fueran diestras o zurdas. Mientras que
los diestros llegaban a edades avanzadas con cierta frecuencia, entre los zurdos era mucho
más raro.
La noticia tuvo un gran impacto y rápidamente surgieron explicaciones que justificaban este
resultado: se dijo que los zurdos son más propensos a determinado tipo de enfermedades y a
sufrir accidentes graves; una de las causas podría ser que las máquinas, los aparatos que usamos
a diario, el mundo en general, está pensado y hecho para los diestros. Eso provoca entre los
zurdos inadaptación, accidentes ... y como consecuencia de todo ello una considerable dismi­
nución de la esperanza de vida.
Pero no, en febrero de 1993 se publicó en el A m e ric a n J o u rn a l o f P u b lic H ealth un riguroso
artículo, muy bien documentado, poniendo las cosas en su sitio: la diferencia de edad al morir
se podía explicar completamente por la diferencia en la distribución de las edades de diestros
y zurdos. Resulta que a principios del siglo xx cuando un niño mostraba tendencia a comer o
a escribir con la mano izquierda se le forzaba a hacerlo con la derecha, de forma que cuando
se realizó el estudio había muy pocos zurdos ancianos y, por lo tanto, morían muy pocos a esa
I edad, pero no porque no hubieran llegado a viejos, sino porque no les dejaron llegar a zurdos.
Este artículo no salió en las portadas de los periódicos, cumpliéndose aquello de que siempre
tienen más impacto mediático las noticias más sorprendentes o espectaculares. Este caso tam­
bién pone de manifiesto que cuando se tienen unos datos es fácil encontrar razones verosímiles
que los justifiquen. Creo que los que explican las razones por las que el día anterior subió o bajó
la bolsa saben algo sobre esto.

población. Si la población es pequeña la muestra crece rápidamente al aumentar


la población, pero a partir de cierto valor ya prácticamente se mantiene estable.
Para un margen de error del 3% y un nivel de confianza del 95%, en una po­
blación de unos 10.000 individuos hace falta una muestra de unos 1.000. A partir
de ese valor el tamaño de muestra requerido ya crece poco. Para una población
de 100.000 se necesita una muestra de 1.056, para 1 millón la muestra debe ser de
1.066, y para 50 millones, de 1.068. Hace falta el mismo tamaño de muestra para
una ciudad pequeña que para toda una nación.

91
CONOCER EL TODO MIRANDO UNA PARTE

1.200

Relación entre el tamaño de la población y el tamaño de la muestra


para un margen de error del 3% y un nivel de confianza del 95%.

Eso sí, es necesario asegurarse de que la muestra es representativa. Si ello se puede


garantizar, si se remueve bien la olla, no importa el tamaño de la cuchara.

El poder lo da la aleatoriedad
A veces los informes sobre los resultados de una encuesta destacan los cálculos de
los niveles de confianza, pero pasan de puntillas sobre la forma en que se ha obteni­
do la muestra, o lo explican y es evidente que esa muestra no es aleatoria. Toda la
matemática que hay detrás de esos cálculos se basa en unas propiedades que sólo se
cumplen cuando la muestra es aleatoria. Si no es así, se le está otorgando un poder
que no tiene, y el nivel de confianza será incorrecto, por muy bien que se hayan
hecho los cálculos.
La mejor forma de seleccionar una muestra aleatoria es tener un listado de to­
dos los individuos de la población, seleccionar la muestra al azar e ir detrás de ellos:
localizarlos, acordar día y hora para la entrevista, acudir a la cita, etc.; el problema es
que esto es muy caro. Otra opción es seleccionar casas; es más fácil, pero durante el
día no están los que trabajan y de noche seguramente no tienen ganas de atender a

92
CONOCER EL TODO MIRANDO UNA PARTE

entrevistadores.Además, si hay que esperar a la noche para realizar alguna entrevista,


cundirá poco el día.
Esas muestras totalmente aleatorias tienen la ventaja de que los métodos de es­
timación estadística funcionan muy bien, pero como ya hemos comentado tienen
el inconveniente de que son caras. Existen otras variantes, cada una con sus ventajas
e inconvenientes, como el muestreo estratificado (se divide la población en estratos
y se sacan las muestras de esos estratos, lo cual es más eficiente si dentro de ellos
hay poca variabilidad) o el muestreo por conglomerados (por ejemplo, en lugar de
seleccionar individuos se seleccionan bloques de pisos y se entrevista a todos los que
viven en ellos, lo cual es más barato que ir tras individuos dispersos geográficamente).
Las empresas que se dedican a estos menesteres saben cómo hacerlo para lograr los
niveles de fiabilidad requeridos de una forma económicamente viable. Pero, en cual­
quier caso, siempre es crítico asegurar la representatividad de la muestra. Descuidar
este aspecto puede conducir a fracasos muy sonados.

La encuesta que cambió las encuestas: Landon frente a Roosevelt

En las elecciones presidenciales de Estados Unidos de 1936 se presentaban A lfLan-


don por el Partido Republicano y Franklin D. Roosevelt por el Demócrata. El Literary
Digest, una revista respetada e influyente de la época que había realizado predicciones
con éxito en anteriores contiendas electorales, llevó a cabo el mayor sondeo electoral
de la historia. Envió por correo alrededor de 1O millones de cuestionarios tomando
las direcciones de las listas de propietarios de automóviles y de las guías telefónicas.
Se recibieron 2.300.000 respuestas y de ellas se dedujo que ganaría Landon con una
proporción de 3 votos por cada 2 de Roosevelt.
Com o ya habrá adivinado, ganó Roosevelt y, además, lo hizo con un amplio
margen (60,8% de los votos). El error se produjo porque la muestra a partir de la
cual se habían estimado los resultados no era representativa de los votantes en ge­
neral. En 1936 los coches y los teléfonos sólo estaban al alcance de las clases más
acomodadas (que tendían a votar a los republicanos). El esfuerzo fue enorme, y el
fracaso, todavía mayor.
En contraste con este resultado, una empresa recién creada por George Gallup
acertó el resultado consultando a menos de 5.000 personas, pero asegurándose de
que la muestra fuera representativa. La lección fue bien aprendida: ya no se volvieron
a realizar sondeos únicamente a base de «fuerza bruta» y la empresa del señor Gallup
se convirtió en una referencia de prestigio para los estudios de opinión.

93
Cuando se pretende sacar una muestra, o un solo número, al azar, hay que cuidar
los detalles porque de lo contrario pueden surgir problemas imprevistos. Un caso
muy citado por los especialistas es el que se produjo en Estados Unidos cuando se
realizó el sorteo para determinar el orden de incorporación al servicio militar en el
reemplazo de 1970 (con la guerra de Vietnam todavía en marcha).
Era la primera vez que se hacía un sorteo de este tipo y en una caja se colocaron
366 cápsulas, cada una con la fecha de un día del año. Primero se introdujeron las 31
del mes de enero, después las 29 de febrero y así sucesivamente hasta las 31 cápsulas
de diciembre. Se removieron y una mano inocente las fue sacando. Los que nacieron
en la fecha que apareció en primer lugar eran los primeros en incorporarse, después
se incorporaban los de la fecha sacada en segundo lugar, y así hasta el final.
El problema se produjo porque, por lo visto, las cápsulas no se removieron
bien. Las fechas de diciembre, que fueron añadidas las últimas, se quedaron encima
y salieron al principio en una proporción mayor de la que por azar cabía esperar,
mientras que las de enero se quedaron en el fondo y salieron más bien hacia el fi­
nal, de forma que los varones nacidos en diciembre fueron reclutados y enviados a
Vietnam en mayor número que los nacidos en enero. Los medios de comunicación
se dieron cuenta del problema y denunciaron el hecho, pero así se quedó. Eso sí, al
año siguiente se cambió el sistema y el sorteo se realizó de forma realmente aleatoria.
En Europa, más concretamente en España, se dio un caso parecido. En 1997
había 165.342 jóvenes en edad de incorporarse al servicio militar, pero no había
plazas para todos. Sobraban 16.442, así que se hizo un sorteo para decidir quiénes
quedaban excluidos del reemplazo. Se asignó un número a cada mozo y la idea era
sacar uno al azar y que se librara el que tuviera ese número y los 16.441 que venían
a continuación. El problema se produjo por la forma de sacar un número al azar
entre el 1 y el 165.342.
En primer lugar se sacó un número de un bombo que sólo contenía el O y el 1
para decidir si el número estaría entre el 1 y el 99.999 (caso de salir el cero) o entre
el 100.000 y el 165.342 (caso de salir el 1) y salió el 1.A continuación, se sacó un
número del O al 9 de un segundo bombo y salió el 8. Com o el número que iba a
salir era el ciento ochenta y pico mil, mayor de lo que interesaba, se volvió a tomar
otra bola hasta que salió un número inferior o igual a 6. ¿Algún problema? Pues sí,
la probabilidad de salga un número entre 1 y 99.999 era la misma que entre 100.000
y 165.342, pero en el primer caso hay más valores que en el segundo, y esto hace

94
CONOCER EL TODO MIRANDO UNA PARTE

que para algunos la probabilidad de librarse fuera del 8,2% mientras que para otros
era del 12,6%, más del 50% superior.

E n c u e s ta s « in fo r m a le s»

U n colegio profesional envía una carta a sus colegiados pidiéndoles que rellenen
un cuestionario sobre su trabajo y sus ingresos anuales. El objetivo es realizar un
informe que sirva a los propios colegiados como referencia para la negociación de
sus salarios. Se les pregunta sobre el tipo de empresa en la que trabajan: multina­
cional, familiar, grande, pequeña, con mucha tradición, recién creada etc.; sobre el
sector, sobre su puesto de trabajo, sobre su antigüedad en el puesto, en la empresa,
en la profesión... y, finalmente, cuál es su salario fijo bruto y los complementos que
cobra habitualmente. La carta incluye un sobre con el sello puesto para devolver
el cuestionario por correo. Han respondido 357 colegiados de un total de 5.000
cartas enviadas, se presentan las conclusiones con un nivel de confianza del 95% y
un margen de error del 5%.
Aunque si consulta la tabla de los tamaños de muestra verá que los números
cuadran, el problema es que la muestra no es aleatoria y, por lo tanto, ninguno de
esos valores tiene sentido. Las muestras autoseleccionadas Oe preguntamos a todos y
contesta el que quiere) nunca se pueden considerar aleatorias. Es posible que los que
tienen cargos ejecutivos estén muy ocupados, viajen mucho y no tengan tiempo de
contestar este tipo de encuestas, ni los que llegan tarde a su casa, ni los que cobran
muy poco o están en paro y no tienen ganas de darle vueltas a este tema, ni aquellos
que tienen una estructura de salario que no se adapta a lo que está previsto en el
cuestionario, etc. En fin, no es una muestra aleatoria, y si no lo es, no se pueden
aplicar las deducciones matemáticas que se basan en esta consideración.
Lo mismo ocurre con los cuestionarios que a veces encontramos en las habitacio­
nes de los hoteles para que opinemos sobre las instalaciones o la calidad del servicio.
Seguramente sólo responden los que están especialmente disgustados y encuentran en
ese cuestionario una forma de desfogarse, o aquellos que están agradecidos por algo y
lo quieren decir por escrito (y quizá también aquellos a los que les sobra el tiempo y se
entretienen en rellenarlo). La información que se recoge puede ser útil para identificar
cosas que se han hecho bien o que se han hecho mal, pero no para sacar estadísticas
fiables sobre lo que opinan los huéspedes que han pasado por esa habitación.
Salir a la calle micrófono en mano (y cámara al hombro) para saber lo que piensa
la gente sobre algún aspecto polémico y luego emitir sus opiniones en la televisión

95
CONOCER EL TODO MIRANDO UNA PARTE

tras una frase del tipo «hemos salido a la calle para saber lo que piensan los madri­
leños sobre ...» puede hacer más dinámico y ameno el programa, pero no sirve para
conocer la opinión de los ciudadanos.

¿Sí o sí? Influencia de cómo se formulan las preguntas

La forma como se plantean las preguntas, el orden en el que se realizan o el énfasis


que se pone en algunas palabras, pueden afectar a las respuestas que se obtienen. Si
se insinúa cuál es la respuesta «correcta», el entrevistado tiende a responder lo que
cree que el entrevistador quiere oír.
En una época en la que el autor y un colega, también dedicado a la estadística,
realizábamos actividades de divulgación de nuestra disciplina en cursos de verano,
mostrábamos cómo la forma en la que se realiza la pregunta influye en la respuesta
realizando nosotros mismos una encuesta entre los asistentes. Explicábamos que se
trataba de saber su opinión sobre una posible nueva ley de financiación de los partidos
políticos y repartíamos unas papeletas que parecían todas iguales, pero en la mitad
se hacía la pregunta de una forma y en la otra mitad, de otra.

¿Considera usted que debería haber una ley que evite la posibilidad de que los grandes
grupos financieros entreguen elevadas sumas de dinero para financiar campañas
electorales'?

□ SI □ NO

¿Considera usted que debería estar pemiitido que los empresarios y organizaciones
puedan aportar fondos para financiar de forma controlada y transparente las campañas
electorales de los partidos que apoyan?

□ SI □ NO

Dos formas de plantear una pregunta sobre la financiación de los partidos políticos.

Casi todos los encuestados respondían que sí, con independencia de la papeleta
entregada. Pero unos decían que sí a «evitar la posibilidad de que grandes grupos

96
CONOCER EL TODO MIRANDO UNA PARTE

financieros entreguen elevadas sumas de dinero» y los otros a que «los empresarios
y organizaciones pueden a p o rta r fondos». Ya ve, depende de lo que le interese que
salga puede plantear la pregunta de una fo rm a o de o tra y asunto resuelto. P o r eso
es tan im p o rta rte cuál es la pre g u n ta que se hace y c ó m o se hace, y ta m b ié n que
ju n to con los resultados del estudio se in fo rm e sobre cuáles fu e ro n exactam ente las
preguntas que se plantearon.

Suena el teléfono ... pero usted no está en su casa.


Las encuestas telefónicas

L o más fá c il y c ó m o d o son las encuestas telefónicas, aunque es e vid e nte que tam bién
presentan algunos inconvenientes. E l te lé fo n o está al alcance de prácticam ente todos,
al m enos en las zonas desarrolladas tecnológicam ente, p e ro u n problem a nuevo puede
ser que las fam ilias jóvenes usen sólo el te lé fo n o m ó v il, p o r lo que su n ú m e ro no
aparece en las guías telefónicas y n o pueden ser seleccionadas p o r ese p ro ce d im ie n to .
H a y que plantearse si puede afectar a la respuesta el hecho de que las casas sin
te lé fo n o fijo hayan quedado descartadas de la muestra. T ie n e m ucha im p o rta n c ia a
qué ho ra se llam a, p o r q u ié n se pregunta o có m o se sustituye a los que n o desean
contestar. D escuidar estos aspectos puede c o n d u c ir a graves errores en las p re d ic ­
ciones p o r falta de representatividad de la m uestra.

U n c a s o p a r tic u la r : lo s s o n d e o s e le c to r a le s

Los sondeos electorales son una de las aplicaciones estadísticas de las que más se habla
(y lo c ie rto es que n o siempre b ie n ). Este tip o de estudios es singular p o r el interés
que despiertan y porqu e , a diferencia de lo que o cu rre en otros casos, al fin a l se acaba
sabiendo el verdadero v a lo r de los parám etros que se han estimado. E l p ro b le m a es
que, además de las dificu lta d e s habituales para conseguir muestras aleatorias, existen
otras dificultades específicas.Veamos algunas.

La intención de voto va . cambiando

Los resultados que se presentan están basados en encuestas realizadas varios días —o
incluso varias semanas— antes de las elecciones. E n algunos países está p ro h ib id o
p u b lica r resultados de sondeos electorales du ra n te u n c ie rto p e rio d o de tie m p o antes
de las elecciones (en España es una semana).

97
¿A quién votarán los indecisos?

Los indecisos son el g ra n problem a para los encargados de realizar sondeos electorales.
N o es ra ro que el porcentaje de los que todavía n o saben a q u ié n vo ta rá n esté entre
el 20 y el 50% de los encuestados. E n estos casos se realiza una asignación de v o to en

C Ó M O O B T E N E R IN F O R M A C IÓ N C O N F ID E N C IA L M A N T E N IE N D O
E L S E C R E T O D E L E N T R E V IS T A D O

Cuando se pregunta sobre comportamientos socialmente mal vistos o de carácter muy personal,
es fácil que el entrevistado engañe. Pero hay formas de obtener esa información preservando
la intimidad del encuestado incluso ante el entrevistador-a. Por ejemplo, supongamos que es
embarazoso contestar « s í » . Para que el entrevistado pueda hablar sin temor, puede actuarse
de la siguiente forma:

1. Se le hace coger una carta de una baraja de póquer, en la que la mitad son negras y la
otra mitad, rojas. Mira la carta sólo él, y la devuelve a la baraja.
2. Si le ha salido roja responde «Sf», mientras que si le ha salido negra responde a la pre­
gunta que le han formulado.

Está claro que si responde «sí» el entrevistador no tiene manera de saber si le ha salido una carta
roja o si está respondiendo a la pregunta, con lo que la confidencialidad queda garantizada.
Si se hacen 1.000 entrevistas y 612 personas responden que «sí», aproximadamente 500 lo
harán porque les ha salido la carta roja y esas respuestas hay que descartarlas. De los otros 500,
los que realmente han respondido a la pregunta, 112 han respondido positivamente, luego
nuestra estimación es 112/500 = 22,4%.

98
CONOCER EL TODO MIRANDO UNA PARTE

fu n c ió n de la respuesta a preguntas c o m o «¿Con qué p a rtid o simpatiza usted más?»


o «¿De qué p a rtid o se siente usted más cercano?», o ta m b ié n «¿A qué p a rtid o v o tó
usted en las ú ltim a s elecciones?». Se tra ta de que el e x p e rto «adivine» a qué p a rtid o
votará una persona aunque ella todavía n o lo sepa.
Está claro que la asignación de los v o to s indecisos a u n p a rtid o o a o tro es una
tarea de im p o rta n c ia crítica, y su é x ito responde más a c o n o c im ie n to s relacionados
co n la sociología y co n la p o lític a que co n la estadística.

La falta de sinceridad en las respuestas

La redacción de las preguntas que se va n a p ro p o n e r y el o rden en el que se realizan


son ta m b ié n aspectos críticos. E s c rib ir preguntas claras, que n o induzcan a dar de­
term inadas respuestas, n o es tarea fá cil y requiere co n o c e r b ie n la técnica de cóm o
plantear las preguntas y ta m b ié n requiere disponer de entrevistadores b ie n entrenados
y m otivados (léase b ie n pagados).
A veces existen con d icio n e s de lib e rta d de expresión particulares, que hacen más
o menos creíbles las respuestas de los ciudadanos y que harán que el v o lu m e n de los
llam ados «indecisos» sea m a yo r o m e n o r, ya que quizás en lu g a r de indecisos lo que
en realidad se tiene son «decisos cautos», que prefieren m antener reservada su o p in ió n .

D e l porcentaje de votos al número de escaños

E n muchas ocasiones lo verdaderam ente relevante, más que el porcentaje de votos


que va a o b te n e r cada p a rtid o , es el n ú m e ro de escaños, y los sistemas que se u tiliz a n
para d is trib u ir los escaños en fu n c ió n del porcentaje de votos (co m o la le y d ’H o n d t)
acaban de c o m p lic a r las cosas. P o r eje m p lo , para una d e te rm in a d a c irc u n s c rip c ió n
e le cto ra l en la que h a y 5 escaños en ju e g o se puede p re d e c ir co n una confianza del
95% que u n d e te rm in a d o p a rtid o o b te n d rá u n 32% de los votos co n u n m argen
de e rro r del 3%. E l pro b le m a está en que si obtiene u n 31 % le corresponderá u n
escaño, m ientras que si o b tie n e el 33 % le corresponderán 2 .Y ésta es una dife re n cia
im p o rta n te pero que n o puede distinguirse co n la in fo rm a c ió n de la que se dispone.
O tro pro b le m a es que algunas legislaciones e xig e n u n m ín im o porce n ta je de
vo to s (p o r ejem plo, el 5%) para e ntrar en el reparto. Si u n p a rtid o está rozando este
porcentaje (p o r ejem p lo , si su e stim ación de v o to es d e l 4,6% ) n o se puede saber si
llegará o no, y el hech o de que o c u rra una cosa u o tra afectará ta m b ié n al n ú m e ro
de escaños del resto de partidos.

99
Cuando se realizan sondeos electorales existen muchas dificultades para lograr buenas
predicciones, dificultades que van más allá de aquellas que se refieren al ámbito de
la teoría del muestreo estadístico (por no hablar de manipulaciones y de resultados
interesados). Sería conveniente tener medida la frecuencia y la magnitud con la que
fallan los sondeos electorales serios (de los otros no hablamos), pues al igual que las
malas noticias son las que nos invaden a través de los medios informativos, también las
pifias en las predicciones son más destacadas que los aciertos. Incluso en el ambiente
académico, es más sensacional, a veces más pedagógico y siempre más agradecido,
ilustrar lo que no debe hacerse que mostrar ejemplos en los que las predicciones han
funcionado bien.
También pueden existir, y de hecho existen, encuestas que son el resultado de
consultas interesadas que pretenden influir sobre la opinión de los electores. La ex­
periencia y seriedad de la empresa responsable del estudio, así como del medio de
comunicación en el que se publica, también son un buen indicador de la confianza
que merecen los sondeos más allá de ese 95% que se suele indicar en la ficha técnica.

100
C a p ítu lo 4

Cómo razonamos para tomar


decisiones (eso que llamamos
«contraste de hipótesis»)
Fue a finales de la década de 1920 e n C a m b rid g e , Inglaterra. U n g ru p o de profeso­
res, sus esposas y algunos invitados estaban to m a n d o el té al aire lib re aprovechando
lo agradable de la tarde. C o n la taza en la m a n o y después de dar el p rim e r sorbo,
una señora co m e n tó que notaba u n sabor d iferente si el té se ponía antes o después
que la leche.
C o n to d a cortesía, c ó m o no, a lg u ie n h iz o unas re fle x io n e s sobre lo d ifíc il que
eso era, y así su rg ió u n a d iscu sió n en la que se e s g rim ie ro n to d o tip o de a rg u ­
m entos procedentes del m u n d o de la fisica y de la q u ím ic a : la c o m p o s ic ió n del
p ro d u c to resultante era la m ism a ta n to ' si se ve rtía p rim e ro el té co m o si se p o n ía
antes la leche, las p a rtíc u la s disueltas acababan e xa cta m e n te ig u a l, el g ra d ie n te
de tem peraturas no podía in f lu ir , etc. N o , n o era p o sib le d is tin g u ir una taza de
o tr a ... ¿o q u izá se les escapaba algo?
U n o de los a llí presentes, u n h o m b re de unos 40 años llam ado R o n a ld A y lm e r
Fisher, propuso salir de dudas aplicando u n p ro c e d im ie n to «revolucionario»: hacer
la prueba. C la ro que n o se po d ía hacer co n una sola taza de cada tip o , p o rq u e la
p ro b a b ilid a d de acertar al azar sería de y si acertaba n o sabrían si había sido p o r
casualidad o si realm ente había p o d id o d is tin g u ir una m ezcla de la o tra . Pero si se le
daban 4 tazas de cada tip o la p ro b a b ilid a d de q u e acertara al azar sería sólo de 1 entre
70 (existen 70 maneras distintas de elegir 4 objetos entre 8); así que si acertaba en
esas condiciones p o d ría n a firm a r que sí sabía d is tin g u ir una preparación de la otra
con una p ro b a b ilid a d de e rro r pequeña y, además, conocida.
Fisher ya era p o r aqu e l entonces u n afam ado profesor, que en 1935 pu b lica ría u n
te xto de referencia que m arcó u n antes y u n después en las estrategias de recogida de
datos m ediante la e xp e rim e n ta c ió n . E l títu lo del lib ro es The D e s ig n e f E x p e r im e n t s y
en el capítulo 2 in tro d u c e algunos de los conceptos clave u tiliz a n d o este caso c o m o
h ilo co n d u cto r.

101
T
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

E l r a z o n a m ie n t o a n te la c a t a d o r a d e té

D e entrada supondrem os que la catadora de té n o sabe d is tin g u ir u n caso de o tro ;


eso es lo que nos parece n o rm a l, y sólo creeremos en su h a b ilid a d si los datos re ­
cogidos en u n e x p e rim e n to b ie n diseñado y c o n tro la d o están en co n tra de esa h i­
pótesis in icia l. Estar en co n tra significa que sus resultados sean m u y p o c o probables
en el caso de que realm ente n o sepa d is tin g u ir, y lo que sig n ifica p o c o probable lo
d ecidim os nosotros m ism os: que o c u rra m enos del 5% de las veces, m enos del 1%,
0 c u a lq u ie r o tro valor.
Si sólo estamos dispuestos a creerla cuando el resultado d e l e x p e rim e n to pueda
o c u r r ir p o r azar (p o r casualidad, sin que sea m é r ito de la señora) m enos d e l 5%
de las veces, n o se rv irá u n e x p e rim e n to en el que se le den a p ro b a r 3 tazas de
cada tip o , ya que hay 20 fo rm a s de e le g ir 3 objetos entre 6 y sólo una es la fo rm a
c o rre cta de h a ce rlo ; lu e g o la p ro b a b ilid a d de acertar p o r azar es exactam ente de
1 e ntre 20, o sea d e l 5%. N o es d if í c il d e d u c irlo : la p rim e ra taza se puede e le g ir
e n tre 6; la segunda, e n tre 5 y la tercera, e n tre 4, p o r lo que tenem os 6 • 5 • 4 = 120
maneras de e le g ir 3 tazas, p e ro en este c ó m p u to hem os te n id o en cu e n ta el o rden
en el que se han e le g id o , es decir, s u p o n ie n d o que las tazas las hemos e tiq u e ta d o
con las letras de la A a la F, hem os c o n ta d o c o m o casos d is tin to s el sacar A D F que
F D A . Para descontar los casos re p e tid o s tenem os que d iv id ir p o r el n ú m e ro de
o rdenaciones que se p u e d e n d a r c o n 3 tazas (3 • 2 • 1 = 6). P o r lo ta n to , el n ú m e ro
de maneras de e le g ir 3 tazas de u n g ru p o de 6 es ig u a l a 120 / 6 = 20. Si tenem os 4
y 4 de cada tip o el n ú m e ro de maneras de seleccionar 4 será: 8 • 7 • 6 ' 5 / 4 • 3 •
• 2 • 1 = 70, y co m o sólo hay u n c o n ju n to de 4 en el que se ha puesto p rim e ro
el té que la leche, la p ro b a b ilid a d de a ce rta r p o r azar cuál es este c o n ju n to es de
1 entre 70, es decir, d e l 1,4% . Si de las 4 tazas que elige se e q u iv o c a en una, ya no
será razonable co n sid era r que sabe d is tin g u irla s , ya que la p ro b a b ilid a d de que esto
o c u rra p o r azar es casi d e l 23% .
Pero n o se nos tie n e n que i r todas las energías tras los razonam ientos matemáticos.
T am bién hay que estar m u y atentos a to d o s los detalles en la realización d e l e x p e ri­
m ento, en no dar pistas a la catadora... Fisher lo describe claramente insistiendo en
que las tazas se le deben presentar en u n o rd e n aleatorio:

«N uestro e x p e rim e n to consistirá en p re p a rar o ch o tés c o n leche, cuatro de


u n m o d o y otros cu a tro del o tro , y lle v a r las tazas (en u n o rd e n escogido al
azar) a la catadora para que in d iq u e su o p in ió n . Se le habrá e x p lic a d o antes

102
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

en qué va a co n sistir la prueba: se le darán a p ro b a r och o tazas, cuatro de cada


tip o , en u n o rd e n e le g id o al azar (p o r dados, ru le ta , cartas etc., o sim plem ente
p o r núm eros publicados en alguna fo rm a ); su tarea consiste en separar las
tazas en dos grupos de cu a tro clasificándolos, si puede, según se haya puesto
p rim e ro el té o la leche».

¿Y qué o c u rrió ? F isher n o cuenta en su lib ro cuál fue el resultado d e l e x p e ri­


m e n to , p ero e ntre los presentes se e n co n tra b a el p ro fe so r H u g h S m ith , que co n tó
esta h is to ria a D a v id Salsburg, a u to r de u n lib r o excelente sobre la e x p lo s ió n de la
estadística en el sig lo x x , T h e L a d y T a s t in g T e a . E l te x to arranca c o n ta n d o esta his­
to ria que, n a tu ra lm en te , es la que da títu lo al lib ro .Y cuenta que el p ro fe s o r S m ith
le d ijo que sí, que la señora id e n tific ó todas y cada una de las tazas c o rre cta m e n te .

T H E

D E S I G N O F

E X P E R I M E N T S

R . A . F I S H E R F R .S .

The Design of Experiments, un libro clá sico y p io n e r o en s u ca m p o ,


e n e l q u e R olan d F ish e r utiliza e l e je m p lo d e la ca ta d o ra d e té
para ilustrar las ideas clave d e su m é t o d o d e ra zo n a m ien to .

103
CÓMO RA.lONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

R O N A L D A Y L M E R F IS H E R :
L A P E R S O N A A D E C U A D A EN E L M O M E N T O P R E C IS O

Nacido en 1890, Fisher fue un científico de


sólida formación matemática que destacó
por sus importantes contribuciones en los
campos de la estadística y la genética. Aun­
que no existen ran kin gs oficiales, es sin duda
uno de los personajes que más aportaciones
realizó a la estadística en el siglo xx, si no el
que más.
Según algunas fuentes, de pequeño era un
niño debilucho pero con muchas ganas de
aprender y muy interesado por la astrono­
mía. También tenía serios problemas de vi­
sión, por lo que los médicos le prohibieron
leer con luz artificial (que no era como la
que usamos hoy). Esto mermó sus posibili­
dades de estudio y, para que no se retrasara,
tuvo un profesor que le enseñaba matemáticas sin usar lápiz ni papel ni ningún tipo de ayuda
visual, lo cual le despertó una profunda visión geométrica que más adelante le permitió abordar
y resolver problemas difíciles con un enfoque geométrico muy original.
A los 29 años, junto con su esposa, que entonces tenía 20 y con la que ya había tenido 3 hijos
(otras cosas han cambiado, además de la luz eléctrica), se trasladó a vivir a una vieja granja cerca
de la estación agrícola experimental de Rothamsted, al norte de Londres. Había sido contratado
por los dueños de este centro, fabricantes de abonos, con la intención de que pusiera orden
en las enormes cantidades de datos que se habían ido recopilando a los largo de 90 años de
funcionamiento de la estación.
Fisher demostró que, tal y como se habían tomado los datos, la influencia de las lluvias y de la
meteorología en general enmascaraba la posible influencia de los fertilizantes que se estaban
probando. En terminología actual diríamos que ambos factores estaban «confundidos». Pero
no sólo dijo qué se hacía mal, también explicó cómo había que hacerlo y publicó un libro, The

D e s ig n o f E x p e rim e n ts , que marcó el inicio de una nueva época en los planes experimentales
de recogida de datos y que ha tenido grandes repercusiones en la investigación agrícola e
industrial.

104
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

E l p e s o , la e s ta tu ra , e l c o e fic ie n te de c o r r e la c ió n

y s u s ig n if ic a c ió n e s ta d ís tic a

Sabernos que e l peso está relacionado con la estatura, que las personas más altas
tie n d e n a pesar más que las bajas (es verdad que hay excepciones, pero estarnos
hablando de una regla general). N o es una re la c ió n m atem ática; si de a lguien nos
d ice n su estatura n o podrem os calcular su peso aplicando una fó rm u la , p e ro existe
una tendencia, una cierta relación.
E l siguiente g ráfico muestra la relación entre el peso y la estatura de u n g ru p o de
92 estudiantes universitarios (los datos se han o b te n id o de u n archivo que in c o rp o ra el
paquete de software estadístico M in ita b , el m ism o que com entam os en el capítulo 1).

100-

90 -

80 -

o
¡u 70 -

60 -

50 1

40
150 155 160 165 170 175 180 185 190 195
A ltu ra (cm)

Relación entre peso y altura de un grupo de 92 estudiantes.

¿Usted diría que hay «mucha», «bastante» o «alguna» relación? C o m o com prenderá,
necesitamos ser más concretos para va lo ra r este tip o de situaciones, y para ello existe
una m edida denom inada «coeficiente de correlación» (a veces se añade «de Pearson»).
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

La fó rm u la d e l c o e fic ie n te de c o rre la c ió n es u n po co aparatosa p ero fá c il de


ju s tific a r (no se preocupe, aquí n o entrarem os en e llo ). R especto a otras posibles
alternativas, que las hay, el c o e fic ie n te de c o rre la c ió n tiene muchas ventajas: sus
valores siempre están acotados entre —1 y 1 y n o depende de las unidades co n las
que se han to m a d o los datos; en nuestro caso, da el m is m o resultado si los tenem os
en centím etros y k ilo s que si los tu vié ra m o s en pulgadas y libras (que es c o m o están
en el archivo o rig in a l).
Si el coe ficie nte de c o rre la c ió n es ig u a l a 1 sig n ifica que la re la ció n entre las dos
variables es perfecta, y que al aum entar una ta m b ié n aum enta la otra. E n este caso sí
tenem os una relación m atem ática y se puede d e d u c ir el va lo r exacto de una variable
a p a rtir de la otra, pero con datos reales nunca hay que esperar tanta p e rfe cció n . Si
es de, p o r ejem plo, 0,8, en general quiere decir que la re la ció n es clara; con nuestros
datos se obtiene 0,785. Si es cero sig n ifica que n o existe n in g u n a relación. Los valores
negativos in d ic a n lo m ism o que los positivos, pero en ese caso cuando una variable
aum enta la otra dism inuye.

Dl =COEF.DE.CORREL(Al:A92;Bl:B92)
1 —
h l A ! B i c \ D , E
1J 167,64 : 63,56 | 0 ,7 ^ ^ 6 4 1
2 j 182,88 te,83
3, i____ lo e c o _______ __ T i dA i_________________________

Cálculo con Excel del coeficiente de correlación.

Pero esta m e d id a ta m b ié n presenta algunos problem as (¡nada es p e rfe c to !). Si


n o existe n in g u n a re la ció n entre las variables n o hay que esperar que el co e ficie nte
de co rre la c ió n tenga u n v a lo r exactam ente ig u a l a cero, p o rq u e esto s ig n ific a que
los datos se d istrib u y e n co n u n e q u ilib rio p e rfe c to que n o se da en la práctica. L o
que sí podem os d e c ir es que estará alrededor de c e ro .Y ahora el p ro b le m a es: ¿qué
significa «alrededor de cero»?
Adem ás, tiene el agravante de que su sig n ific a d o depende del n ú m e ro de puntos
que tengam os. Si tenem os m u y pocos puntos, el hecho de que salga bastante alejado
del cero es una señal m u y po co s ó lid a de la posible existencia de c o rre la c ió n . Si sólo
se tie n e n 2 p u n to s siem pre saldrá 1 o - 1 , haya o n o co rre la ció n .
E l siguiente diagram a con tie n e 35 puntos y el coeficiente de co rre la ció n es 0,494.
¿Está lo suficientem ente alejado d e l cero c o m o para p o d e r a firm a r qu e la co rre la ció n
realm ente existe? ¿O es más razonable pensar que esa disposición de los puntos (o

106
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

lo que es lo m ism o , ese co e ficie nte de c o rre la c ió n ) se puede o b te n e r p o r azar sin


que haya n in g ú n tip o de re lación e ntre las variables?

70 '

65

60

• • •
55 '
bC • •
c.

11) 50 -

45 -|

40
155 160 165 170 175 180
A ltu ra (cm)

¿E x iste relación e n tre e s ta s variables?

Para ve r si es razonable tomarse en serio el co e ficie nte de c o rre la c ió n o b te n id o


(técnicam ente se d iría «para ve r si es estadísticamente significativo») podem os echar
m ano de la sim ulación . G eneram os dos c o n ju n to s de núm eros aleatorios, 35 p o r
u n la d o y 35 p o r otro. Está claro q u e estos dos co n ju n to s de núm eros n o tendrán
n in g un a relación entre ellos; al haberse e legido al azar serán to ta lm e n te in d e p e n ­
dientes, pero sabemos que su co e ficie nte de c o rre la c ió n n o será exactam ente ig u a l
a cero, será, p o r ejem plo, -0 ,1 2 3 , y si re p e tim o s el proceso generando o tra vez dos
co n ju nto s de 35 núm e ro s aleatorios el nuevo c o e ficie n te de co rre la c ió n p o d ría ser
0,213, y si lo volvem os a hacer. .. Y si lo hacemos 10.000 veces obtendrem os 10.000
valores d e l coe ficie nte de c o rre la c ió n de dos c o n ju n to s de 35 valores q u e n o tie n e n
nada que ve r e ntre sí. H a c e rlo anotando los resultados u n o a u n o sería m u y le n to ,
pero u n pequeño program a lo hace casi al instante. Los resultados o b te n id o s están
representados en el siguiente h istogram a, en el que, co n una rayita, se in d ic a dónde
está el v a lo r que estamos discutiendo.

107
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

500

400

300 -
u
Q
o
u
u
200 -

100 -

Valores del c o e ficie n te de c o rre la c ió n

Valores del coeficiente de correlación para conjuntos de 35 pares de datos independientes.

Vemos que sí, que nuestro valor puede salir cuando las variables son in d e p e n d ie n ­
tes, pero vem os ta m b ié n que es m u y ra ro que así sea. A n a liz a n d o los resultados de
la sim u la ció n (en el histo g ra m a n o se aprecia) resulta que han salido 12 valores p o r
encim a de 0,494 y 9 p o r debajo de --0,494. Esto significa q u e u n a diferencia respecto
al cero co m o la que nosotros tenem os, o m ayor que ésa, se presenta aproxim adam ente
2 veces de cada 1.000 cuando las variables son independientes.
¿Es nu e stro caso u n o de ésos que se presentan 2 veces de cada 1.000? N o lo
sabemos, pero es poco probable. Seguram ente lo más razonable es considerar que sí
h a y relación en nuestros datos que, p o r c ie rto , co rresponden al peso y a la altura de
las 35 m ujeres que h a y en el g ru p o de 92 estudiantes considerados a n te rio rm e n te .

E s q u e m a d e r a z o n a m ie n to : e l c o n tr a ste d e h ip ó te sis

T a n to en el caso de la catadora de té c o m o en este o tro de la re la ció n entre va­


riables h a y una pre g u n ta que responder: ¿es razonable creer que la catadora de té
sabe d is tin g u ir una m ezcla de otra?, ¿podemos considerar que las dos variables están

108
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

correlacionadas? E n ambos casos el ra zo n a m ie n to seguido para re sponder ha sido


el siguiente:

1. Planteamos una hipótesis p o r defecto, que suele ser conservadora. E n el caso de


la catadora de té suponem os que n o es capaz de d ife re n cia r entre las dos p re ­
paraciones, y en el caso de la correlación, de entrada suponemos que n o la hay.

2. C alculam os un v a lo r a p a rtir de los datos disponibles, y si no tenem os datos (o


los que tenem os n o sirven) hay que obtenerlos. E n el caso de la re la c ió n entre
variables el v a lo r que resume la s itu a ció n es el co e fic ie n te de c o rre la c ió n . E n
e l caso de la catadora de té hay q u e p la n ific a r una prueba y e l resultado es el
n ú m e ro de errores que com ete.

3. Si el v a lo r o b te n id o está entre los que cabe esperar cuando la h ip ó te sis p o r


defecto es cierta , n o hay n in g u n a ra z ó n para d e c ir que ésta sea falsa y, p o r lo
tanto, la m antenem os. S in em bargo, si ese v a lo r es m u y poco probable, si n o
es coherente c o n la hipótesis p o r defecto, nos quedam os c o n la alternativa (la
señora sí d istingue los dos tip o s de té, sí hay re la c ió n entre la variables).

E n los textos de estadística verá que a la hipótesis p o r defecto se la d e n o m in a


«hipótesis nula» y a la alternativa (es decir, lo que o cu rre si la hipótesis p o r defecto
n o es creíble) se la lla m a «hipótesis alternativa» (aquí n o h a y sorpresa).A la p ro b a b i­
lid a d de que se dé u n v a lo r co m o el que ha salido (o más discrepante) si la hipótesis
nula es cierta, se la d e n o m in a «p-valor», y éste es el n ú m e ro que más se m ira e n los
tests estadísticos, p o rq u e ahí está la clave de si es razonable m a n te n e r o rechazar la
hipótesis nula.
E n nuestros casos, si la catadora de té id e n tific a co rre cta m e n te las 4 tazas de u n
tip o podrem os rechazar la hipótesis n u la c o n u n p -v a lo r del 1,4%. E n el caso de la
re la ció n entre variables el p -v a lo r es del 2%o, ya que si n o h u b ie ra re la c ió n e ntre
ellas (hipótesis nula) la p ro b a b ilid a d de te n e r u n co eficiente de c o rre la c ió n c o m o el
que hemos o b te n id o , o m ayor, es precisam ente del 2%o.

¿ Y si n o p u e d e r e c h a z a r s e la h ip ó t e s is n u la ?

Si el p -v a lo r es grande n o puede decirse que los datos estén en c o n tra d ic c ió n co n


la hipótesis n u la , p e ro eso n o sig n ifica - e n absoluto— que se haya dem ostrado que

109
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

es cierta. P o r eso p re fe rim o s hablar de rechazar o n o la hipótesis nula, pero n o de


aceptarla (quizá co n u n n iv e l de sutileza que m uchas veces n o se entiende) y, m ucho
menos, d e cir que se ha dem ostrado que es cierta.
U n s ím il que siem pre se u tiliz a para e x p lic a r esta s itu a c ió n es el del ju ic io en
el que, c o m o sabemos, la h ip ó te s is n u la es que el acusado es in o c e n te . Es decir,

UN C A S O R A R O :
D IS T R IB U C IÓ N D E L C O E F I C I E N T E D E C O R R E L A C IÓ N C O N 3 P U N T O S

Fisher fue el primero en obtener una fórmula general para la distribución del coeficiente de co­
rrelación. Las matemáticas que utilizó no son nada elementales y parece que Karl Pearson, otro
i de los prohombres de la estadística y editor de la revista de referencia en su época, no llegó a
entenderla y puso pegas a su publicación. Esto no sentó muy bien a Fisher y el incidente acabó
derivando en enemistad y rivalidad entre los que seguramente eran los mayores estadísticos de
i' la época (lo cual, por otra parte, seguramente no es tan ■raro).
La fórmula ofrece resultados curiosos. Si se tienen 3 puntos correspondientes a variables inde­
pendientes, la distribución de los valores que puede tomar su coeficiente de correlación tiene
una forma extraña, justo lo contrario de la omnipresente forma de campana: los valores más
1 probables son los que están a ambos extremos.

D istrib u ció n teórica d e l c o e fic ie n te d e co rrela ció n d e variables in d e p e n d ie n te s

c u a n d o só lo s e tien en 3 p u n to s , s e g ú n la fó rm u la teó rica d e d u c id a p o r F ish e r (izquierda)


y re su lta d o d e realizar W .0 0 0 s im u la c io n e s (derech a).

Si se tienen 4 puntos resulta que todos los valores del coeficiente de correlación son igual­
mente probables. Cuando se tienen 5 puntos el valor más frecuente ya es el cero y a media que
aumenta el número de puntos va apareciendo la «inevitable» forma de campana.

110
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

se considera que es in o c e n te a n o ser que haya evid e ncia s que dem uestren lo
c o n tra rio . Las pruebas que se han id o re c o g ie n d o son las evidencias que estarán
o n o en co n tra de la h ip ó te sis de in o c e n c ia . Si en la ro p a del acusado había san­
gre de la v íc tim a es una e vid e ncia clara en co n tra de la h ip ó te sis de in o c e n c ia ,
p e ro si n o la hay, si n o h a y pruebas p o rq u e el d e lito fu e m u y b ie n p la n ific a d o , o
p o rq u e la p o lic ía ha actuado m u y m a l, n o se p o d rá c o n d e n a r al acusado - n o se
p u e d e rechazar la hip ó te sis n u la -, p e ro eso n o s ig n ific a q u e se haya d e m o stra d o
que es in o c e n te .

O t r o e je m p lo : ¿ e s ta b a n e q u ilib r a d o s lo s d a d o s ?

E n el ca pítulo 2 se com entó que en 1850 u n astrónom o suizo se e n tre tu vo en lanzar


20.000 veces un par de dados, u n o ro jo y o tro blanco, y que en ambos casos los
resultados que o b tu v o parecen alejarse bastante de los valores te ó ric o s esperados, lo
cual nos hacía sospechar que quizá los dados n o estaban b ie n e quilibrados. C o m o
cada u n o de los 6 resultados posibles son ig u a lm e n te probables, si t ir ó los dados
20.000 veces el resultado te ó ric o esperado para cada u n o de los 6 resultados posibles
es 3.333 (= 2 0 .0 0 0 /6 ). La siguiente tabla resum e los valores obtenidos, los te ó rico s,
y la discrepancia en v a lo r absoluto.

Resultados

1 2 3 4 5 6
_

Valor obtenido 3.407 3.631 3.176 2.916 3.448 3.422


Jado rojc

Valor teórico (dado


3.333 3.333 3.333 3.333 3.333 3.333
equilibrado)

Discrepancia
74 298 157 417 115 89
(valor absoluto)

Valor obtenido 3.246 3.449 2.897 2.841 3.635 3.932


o
Dado blanc

Valor teórico (dado


3.333 3.333 3.333 3.333 3.333 3.333
equilibrado)

Discrepancia
87 116 436 492 302 599
(valor absoluto)

111
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

¿Son estas discrepancias ra zó n s u fic ie n te para sospechar que los dados n o están
equilibrados? ¿O se pueden a trib u ir al azar? A fin de cuentas ta m b ié n sería raro que
cada resultado apareciera exactam ente una sexta parte de las veces. Para salir de dudas
vamos a realizar u n contraste de hipótesis de acuerdo co n el esquema de razona­
m ie n to que u tiliz ó Fisher en el caso de la catadora de té. D e entrada supondrem os
que los dados están e q u ilib ra d o s (¿cómo ib a n a estar si no?) y sólo rechazaremos esa
o p c ió n si los datos que tenem os están en c o n tra d ic c ió n c o n ella.
T om arem os c o m o v a lo r relevante para re s u m ir la in fo rm a c ió n d is p o n ib le la
m áxim a discrepancia entre los valores o b te n id o s y los valores esperados. E n la tabla
a n te rio r se puede ve r que para el dado ro jo es de 417 y para el blanco, de 599. La
pregunta ahora es: ¿qué valores cabe esperar para estas discrepancias si el dado está
perfectam ente equ ilibrado? U n a vez más podem os responder a esta pre g u n ta ha­
cie n d o sim ulaciones.
S im ulam os el la n za m ie n to de 20.000 dados, con ta m o s cuántas veces sale cada
v a lo r y nos quedam os c o n el que presenta la m á x im a discrepancia c o n el v a lo r
esperado. La p rim e ra vez que lo hem os h e ch o esa m á xim a discrepancia ha sido 83,
la segunda ve z ha sido 97 y después de h acerlo 10.000 veces e l histogram a de los
valores obtenidos es el que fig u ra a c o n tin u a c ió n , y ta m b ié n hem os añadido una
señal en los valores correspondientes a los dados ro jo y blanco.

700 -

600 -

500 -
•u
S 400 -
u
£ 300

200 -

100 - D a d o ro jo D a d o blanco

o J I \

0 50 100 150 200 250 300 350 4 0 0 450 500 550 600

M á x im a discrepancia c o n e l v a lo r previsto (3.333)

D istrib u ció n d e la d iscre p a n cia m á xim a c u a n d o e l d a d o está e q u ilib ra d o


y valores q u e s e han o b te n id o .

112
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

Es evid e nte que nuestros datos están en c o n tra d ic c ió n co n la hipótesis de que


los dados están equilibrados. Si esta ú ltim a fu e ra cierta, unos valores c o m o los que
tenem os serían m uy, pero que m u y poco probables.
Seguro q ue el p -v a lo r es cero co n m uchos decimales y, p o r lo tanto, c o n una
p ro b a b ilid a d de equivocarnos prácticam ente nula, podem os a firm a r q u e los dados
no estaban equilibrados.
E n lu g a r de e legir sólo la m á x im a discrepancia c o m o v a lo r que resume la in ­
fo rm a c ió n disponible, ta m b ié n podem os usar una m edida que tenga en cuenta las
discrepancias de los 6 resultados.
Esta m edida p odría ser la suma de todas discrepancias calculadas c o m o la d ife ­
rencia entre la frecuencia observada y la frecuencia esperada, elevada al cuadrado (así
no se compensan los valores positivos con los negativos) y d iv id id a p o r la frecuencia
esperada.
Es decir, para el dado ro jo :

(3.407 -3 .3 3 3 ,3 3 )2 (3 .6 3 1 -3 .3 3 3 ,3 3 )2 (3 .1 7 6 -3 .3 3 3 ,3 3 )2
3.333,33 3.333,33 3.333,33

(2 .1 9 6 -3 .3 3 3 ,3 3 )2 (3 .4 4 8 -3 .3 3 3 ,3 3 )2 (3 .4 2 2 -3 .3 3 3 ,3 3 )2 ^
3.333,33 3.333,33 3.333,33

S eguram ente esta m e d id a le parece inne cesa ria m e n te co m p lica d a , pero tie n e
la ventaja de que n o es necesario c o n s tru ir p o r s im u la c ió n la d is trib u c ió n que
sigue cuando la hipótesis n u la es c ie rta (la llam am os « d is trib u c ió n de referencia»).
La d is trib u c ió n que sigue esta m edida de discrepancia es m u y c o n o c id a y tie n e
u n n o m b re que raram ente se o lv id a a los que han o íd o h a b la r de ella. Se llam a
«chi-cuadrado» y a este tip o de test se lo d e n o m in a «test de ch i-cu a d ra d o » . Fue
u tiliz a d o p o r p rim e ra vez en 1900 p o r K a r l Pearson, o tr o de los personajes im ­
po rta n te s en la h is to ria de la estadística (su n o m b re ya había salido al re fe rirn o s al
c o e ficie n te de co rre la c ió n ).
Para los tests estadísticos más habituales n o es necesario o b te n e r la d is trib u c ió n
de referencia p o r s im u la c ió n , sino que se deduce co n ra zo n a m ie n to s m atem áticos.
La fó rm u la que da d is trib u c ió n del co e fic ie n te de c o rre la c ió n es bastante c o m p lic a ­
da y n o tie n e u n n o m b re específico para ella sola, aunque si el ta m a ñ o de m uestra
es grande se parece m u c h o a una d is trib u c ió n n o rm a l. P o r cie rto , el p rim e ro que
d e d u jo la fó rm u la de esta d is trib u c ió n fue ... R o n a ld A y lm e r Fisher.

113
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

P O C A D IS C R E P A N C IA T A M B IÉ N ES S O S P E C H O S A

Si lanzamos 20.000 veces un dado perfectamente equilibrado, cada uno de los 6 valores que '
pueden salir aparecen alrededor de 20.000/6 = 3.333 veces. Es muy raro que la discrepancia
entre las frecuencias observadas y las teóricas llegue a ser mayor que 250 para algún resultado. I
Esto sólo ocurre del orden de una vez cada 100.000. ■
Pero también es muy extraño que las frecuencias obtenidasse parezcan muchísimo a las previstas.
Por ejemplo, si nos dicen que al lanzar 20.000 veces un dado se han obtenido las frecuencias:

1 2 3 4 5 6
3.333 3.334 3.333 3.333 3.334 3.333

tenemos razones para sospechar de la veracidad de esa información, ya que tal parecido entre
la frecuencia obtenida y la esperada se da menos de una vez cada millón.
Fisher puso de manifiesto una curiosa coincidencia entre los datos experimentales que publicó
Mendel en sus famosos trabajos con plantas de guisantes y los resultados teóricos que cabía
esperar, y lo más sorprendente es que Mendel había previsto un resultado incorrecto para al­
gunos experimentos y los resultados experimentales presentaban una sospechosa similitud con
esos valores incorrectos. No necesariamente debía haber sido el mismo Mendel quien cometiera
fraude con los datos, decía Fisher, sino algún asistente que no había hecho su trabajo con dili­
gencia y como sabía lo que Mendel quería oír...
Este tema ha generado grandes discusiones. N o sólo es un problema de cálculo de probabilida­
des sino también de genética y de botánica cuando se discuten las posibles incidencias que se
pueden presentar en las plantas y que hace que las proporciones obtenidas de unos u otros tipos
puedan variar. La controversia ha sido larga y parece que es difícil sacar conclusiones definitivas,
aunque hay un consenso general en considerar que no existe ninguna evidencia sólida de que
Mendel, o quien fuera, retocara los datos.

H a s t a a q u í , s í; a p a r t i r d e a q u í , n o : f r o n t e r a s p a r a e l p - v a l o r

Suele fijarse u n valor, a m e n u d o el 5%, tal que si el p -v a lo r que se o b tie n e es m e n o r


se rechaza la hipótesis n ula y si es m a y o r n o se rechaza. A ese v a lo r fro n te ra se le
d e n o m in a «nivel de significación».
A u n q u e a todo s nos gustan las reglas claras y sencillas, n o es sensato to m a r u n
va lo r c o m o fronte ra universal y a p lica rlo siempre c o n in dependencia d e l c o n te x to

114
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

en el que esté situado. F ija r u n v a lo r fro n te ra es lo m is m o que d e c id ir la p ro b a b ili­


dad de equivocarnos si se rechaza la hipótesis nula, y la p ro b a b ilid a d de e rro r que
es razonable asum ir depende, sin duda, de la s itu a ció n en la que estemos y de las
consecuencias de c o m e te r el error.
S upongam os, p o r e je m p lo , que u n día p o r la m añana al salir de casa m ira m o s
có m o está el tie m p o y consideram os que hay una p ro b a b ilid a d d e l 10% de que
llu e va , ¿debemos v o lv e r a casa a p o r e l paraguas? A nadie le parecerá te m e ra rio
que sigamos y co rra m o s u n riesgo d e l 10% de que la llu v ia nos p ille d esprote­
g idos. Si nos e q uivoca m o s n o pe rd e m os m u c h o (q u izá nos m o je m o s u n p o c o ) y
ta m b ié n hay que c o n s id e ra r que i r to d o el día c o n el paraguas sin que llu e v a es
bastante in c o m o d o .
O tr a situ a ció n.V a m o s c o n d u c ie n d o p o r una carretera se cu n d a ria m u y p o c o
transitada. E n u n ca m b io de rasante, sin n in g u n a v is ib ilid a d de los coches q u e v ie ­
n e n de fre n te , vem os que h a y u n p e q u e ñ o bache en el lu g a r p o r d o n d e debem os
pasar,aunque lo podría m o s e v ita r co lo cá nd o n o s a la iz q u ie rd a . Pero n o lo harem os.
La p ro b a b ilid a d de que p o r esa carretera ta n p o c o transitada nos cru ce m o s c o n u n
coche es pequeña, y que nos cru ce m o s ju s to en e l c a m b io de rasante es m u c h o
m e n o r. P ero n o lo harem os p o rq u e au n q u e la p ro b a b ilid a d es m u y pequeña, si se
p ro d u c e nos p e rju d ic a m u c h o (m u c h ís im o ). A dem ás pasar p o r e l bache es sólo
una lig e ra in c o m o d id a d .
Es e v id e n te que la p ro b a b ilid a d de e rr o r que estamos dispuestos a c o rre r al
to m a r una decisión depende de las circunstancias y de lo que nos cuesta el e rro r.
Sin salir de la carretera, pero con u n e je m p lo m enos dram ático, podem os c o n ­
siderar el caso de los radares para m e d ir la v e lo c id a d a la que c irc u la n los coches. Es
b ie n sabido que estos aparatos, co m o c u a lq u ie r o tro , dan los resultados con u n c ie rto
e rro r de m e d ició n , de fo rm a que si in d ic a n que u n coche va a 120 k m / h ta m b ié n
es posible que vaya a 119 o a 122. P o r esta ra zó n si la v e lo cid a d m á x im a son esos
120 k m / h se m u lta a los conductores sólo cuando el radar m uestra una velocidad
que sobrepasa ese lím ite en una cie rta cantidad, para que a pesar del in e v ita b le e rro r
de m e d ic ió n sea prácticam ente seguro que e l c o n d u c to r iba a más velocidad de la
p e rm itid a . E le g ir u n m a rg e n p o r encim a del lím ite que produzca u n 5% de errores
(m ultas a conductores que en realidad n o han sobrepasado la velocidad m á xim a ) sería
una de cisión m u y discutida, ya que significaría que cada día se m u lta ría a cientos de
personas injustam ente.
E n d e fin itiv a , la s e le c c ió n d e l v a lo r fro n te ra n o es u n p ro b le m a de carácter
estadístico sino que depende d e l p ro b le m a que se está tratando. C u a n d o se realiza

115
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)

una prueba para a n a liza r si u n n u e v o fá rm a co es m e jo r que el actual para cu ra r


una e nferm edad, to m a r c o m o v a lo r fro n te ra 0 ,05 s ig n ific a que co rre m o s u n riesgo
de l 5% de d e c ir que es más eficaz cu a n d o en re a lid a d n o lo es. ¿Qué im p lic a c io n e s
tie n e esto? ¿Puede te n e r el nuevo tra ta m ie n to efectos secundarios perjudiciales? ¿Es
m u c h o más caro que el tra ta m ie n to co n ve n cio n a l? La respuesta a los in te rro g an te s
planteados son im p o rta n te s para fija r el v a lo r fro n te ra más conve n ie n te .
Pero ta m b ié n es verdad que en m u ch o s casos se to m a c o m o referencia el v a lo r
de 0,05 sin e n tra r en más consideraciones. E l p o rq u é se u tiliz a 0 ,0 5 tie n e que v e r
co n los valores que fig u ra n en las tablas. C u a n d o se em p e za ron a elaborar, c o n
u n o s m edios m u y ru d im e n ta rio s , só lo se ta b u la ro n los valores co rre sp o nd ie n te s a
algunas probabilidades -n ú m e ro s fáciles co m o 0 ,0 0 1 ,0 ,0 0 5 , 0 ,0 1 ,0 ,0 5 , O, 1 0 .. . - y
de entre los disponibles se aco stu m b ró a to m a r el c o rre s p o n d ie n te a 0 ,05 c o m o el
más adecuado para separar lo h a b itu a l de lo raro. La ventaja del 0,05 es que es u n
v a lo r re d o n d o en nuestro sistema d e cim a l. Si tu vié ra m o s 6 dedos seguram ente c o n ­
sideraríam os más n a tu ra l to m a r decisiones u tiliz a n d o el 0 ,0 6 c o m o v a lo r fro n te ra .

116
C a p ítu lo 5

¿Es mejor? ¿Es más eficaz?


Cómo diseñar pruebas para
responder a estas preguntas
La estadística es necesaria cu a n d o se plantea una pre g u n ta y para responderla hay
que recoger y analizar datos. Preguntas de este tip o son las que se plantean sobre si
una vacuna es eficaz, si u n m e d ic a m e n to es m e jo r o si u n sistema de soldadura es
más resistente que otro.
U n o de los problem as habituales es que o btener los datos siem pre es la b o rio s o (y
caro) y h a y que pensarse b ie n la m e jo r m anera de hacerlo para n o de rro ch ar recursos,
siem pre escasos. O tr o p ro b le m a es que al fin a l nunca tenem os todos los datos que
nos gustaría, y h a y que saber sacarles el m á x im o ju g o .T o d o e llo , además, en presencia
de la va ria b ilid a d , es decir, los datos n o responden a expresiones m atem áticas sino
que en las mismas co n d icio n e s el resultado n o siem pre es e l m ism o.
Si la p re g u n ta es: ¿sirve to m a r de fo rm a re g u la r una c ie rta dosis de aspirina para
d is m in u ir la p o s ib ilid a d de te n e r u n in fa rto ? Se p o d ría in te n ta r responder ha cie nd o
razonam ientos sobre los efectos de la aspirina en el o rg a n ism o , p e ro m uchas veces
la re a lid a d acaba so rp re n die n d o . La fo rm a más segura es re co g e r datos; en esencia,
se trata de d iv id ir u n g ru p o en dos partes lo más parecidas p o sib le : a u n a p a rte
se le asigna e l tra ta m ie n to c o n a sp irin a , a la o tra , n o y se co m p a ra n resultados.
Sabemos que n o todo s los in d iv id u o s que p a rtic ip a n e n e l estudio son iguales, n i
todos reaccionan de la m ism a fo rm a cuando to m a n aspirina. H a y que saber lid ia r
co n to d o eso y sacar conclusiones in d ic a n d o ta m b ié n el g rado de fia b ilid a d que
se les puede o to rg a r. Esto es estadística.

U n e s t u d i o a g r a n e s c a la : l a v a c u n a c o n t r a l a p o l i o m i e l i t i s

La p o s ib ilid a d de inm u n iza rse fre n te a una e nferm edad infecciosa seguram ente ha
sido u n o de los d escu b rim ie n to s que más im p a c to ha te n id o en la lucha contra las
enfermedades y en la m e jo ra de la salud y de la esperanza de vida. Pero cada e n fe rm e ­

117
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

dad requ ie re su vacuna específica y dar c o n ella n o siem pre es fá c il. E x is te n varios
p ro c e d im ie n to s para prepararlas y en pruebas de la b o ra to rio o en e x p e rim e n to s
con anim ales, o co n h u m a n o s a pequeña escala, se pueden te n e r bastantes pistas
sobre su n iv e l de eficacia. Pero antes de dar una vacuna p o r buena y re co m e n d a r su
uso m asivo a to d a la p o b la c ió n es necesario estar m u y seguro de que sus b e n e fic io s
com pensarán los costos y los riesgos que in e v ita b le m e n te se asumen. Y en estas
pruebas de v e rific a c ió n la estadística tie n e m u c h o que decir.
E n 1954 se re a lizó una prueba a g ra n escala para eva lu ar la eficacia de una
vacuna c o n tra la p o lio m ie litis (la vacuna Salk, desarrollada p o r el e p id e m ió lo g o
Jonas Salk). E l proceso que se s ig u ió está m u y b ie n e x p lic a d o en el lib r o L a e s­

t a d í s t ic a : u n a g u í a d e lo d e s c o n o c id o , en el que se d e sa rro lla n 29 casos de a p lic a c ió n


de la estadística en áreas m u y diversas, cada u n o de ellos e s c rito p o r u n a u to r que
conoce el tem a a fo n d o . E l c a p ítu lo c o rre s p o n d ie n te a los trabajos para v e rific a r
la u tilid a d de esta vacuna fu e e scrito p o r el p ro fe s o r Paul M e ie r, de la U n iv e rs id a d
de C hica g o .

E l interés y las peculiaridades de la poliomielitis

La eficacia de las vacunas que se han id o d e sa rrollando ha hecho de la p o lio m ie litis


una enfe rm e d a d p rá c tic a m e n te erradicada, p e ro hasta n o hace m u c h o era una de
las más tem idas. Atacaba a los n iñ o s, d e ja n d o a m u ch o s de ellos p a ra lítico s o c o n
secuelas de p o r vida .A d e m á s, v e n ía en oleadas epidém icas im p re visib le s y, cosa c u ­
riosa, afectaba más a los g ru p o s sociales c o n m ejores c o n d ic io n e s de v id a , m ientras
que apenas se daba en los países o en las capas sociales más pobres. R e su lta que
en la p o b la c ió n m enos fa vo re cid a el ataque se p ro d u c ía antes, cu a n d o los bebés
todavía estaban p ro te g id o s p o r las defensas de la m adre, y cuando eran atacados p o r
el v iru s n o desarrollaban la e n fe rm e d a d queda n d o , además, in m u n iz a d o s ; m ientras
los que v iv ía n en c o n d ic io n e s más h ig ié n ica s c o n tra ía n la e n fe rm e d a d más tarde,
cuando ya n o tenía n defensas m aternas. O tra circu n sta n cia que seguram ente in ­
flu y ó en los esfuerzos para lu c h a r co n tra esta e n fe rm e d a d fue que el presidente
R o o s e v e lt ta m b ié n la había p a d e cid o y m ostraba g ra n p re d isp o sició n a apoyar la
in v e s tig a c ió n en este cam po.
A p rin c ip io s de la década de 1950 las a u to rid a d e s sanitarias de Estados U n id o s
consideraron que la n u e va vacuna desarrollada porJo n a s S alk había dem ostrado ser
segura y eficaz en los e studios que se h a b ía n realizado a pequeña escala, p e ro antes
de re co m e n d a r su e m p le o gene ra liza d o era necesario te n e r pruebas irre fu ta b le s

118
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

ta n to de que era eficaz c o m o de que no te n d ría efectos secundarios p e rju d icia le s.


A sí se d e c id ió p o n e r en m archa el m a y o r e x p e rim e n to que se había realizado hasta
entonces en el cam po de la sanidad p ú b lic a .

E l grupo de control

Suponga que se prueba u n m e d ic a m e n to c o n tra c ie rta e n fe rm e d a d y se constata


que to d o el m u n d o que lo to m a se cura antes de 7 días. ¿Puede decirse que es
eficaz?
Q uizás estará pensando que sí, que si to d o el m u n d o se cura debe ser p o rq u e es
eficaz, pero la verdad es que ese tip o de e x p e rim e n to n o lo dem uestra. Es posible
que sin to m a r nada aquellas personas ta m b ié n se h u b ie ra n cu ra d o en aquel plazo.
Incluso p o d ría ser que sin to m a r el m e d ica m e n to , la cu ra ció n se produzca en 2 o 3
días y to m á n d o lo haya que esperar 5 o 6.
P o r esta razón cuando se pru e b a la eficacia de u n n u e vo m e d ica m e n to , o de una
nueva vacuna, se parte de u n c o n ju n to de in d iv id u o s representativos de aquellos
a los que va d ir ig id o y se d iv id e en dos g ru p o s de fo rm a a le a to ria para asegurar
que n o haya diferencias sistemáticas e ntre las características de los que caen en
u n g ru p o o en el o tro . S ó lo a los de u n g ru p o se les da el m e d ic a m e n to ; los del
o tro se u tiliz a n para analizar, p o r c o m p a ra c ió n , los efectos del n u e vo fárm aco. A
este g ru p o que n o recibe n in g ú n tra ta m ie n to se le d e n o m in a « g ru p o de c o n tro l» .
E n el caso de la p o lio m ie litis su in c id e n c ia presentaba flu ctu a cio n e s caprichosas.
P o r e je m p lo , en 1952, año de m a y o r in c id e n c ia en el p e rio d o de 1930 a 1956,
h u b o del o rd e n de 6 0 .0 0 0 afectados en Estados U n id o s , m ie n tra s que en 1953
só lo h u b o unos 3 5 .0 0 0 , una d is m in u c ió n de más d e l 40% . Si en 1953 se h u b ie ra
p ro b a d o una nueva vacuna to ta lm e n te in e fic a z , p o d ría pensarse que sí era eficaz a
la vista de la notable d is m in u c ió n de casos. Y éste n o fue u n hecho e xce p cio n a l,
de 1931 a 1932 el n ú m e ro de casos se re d u jo más de m ita d , y lo m is m o o c u rr ió
d e l 35 al 36, del 37 al 38, del 41 al 42, del 46 al 47 y d e l 55 al 56.
T a m p o c o era una buena idea va cunar a lo s n iñ o s de una z o n a ,lo s del estado de
N u e v a Y o rk , p o r e je m p lo , y de ja r sin v a c u n a r a los de o tra , c o m o los de C h ica g o ,
ya que la in c id e n c ia n o era h o m o g é n e a y podía p e rfe cta m e n te o c u r r ir que u n
d e te rm in a d o año en u n estado tu v ie ra n una in c id e n c ia m u y alta y en o tr o fuera
baja.E ra necesario to m a r to d o el c o n ju n to de participantes en el estudio y d iv id ir lo
en dos gru p o s sim ilares a los que to d o afectara exactam ente de la m ism a fo rm a .
A u n g ru p o se le s u m in is tró la vacuna y el o tr o actuó c o m o g ru p o de c o n tro l.

119
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

D os grupos «lo más parecidos posible»: control por placebo


y diseño «doble ciego»

Si unas personas reciben u n tra ta m ie n to (se to m a n una pastilla todos los días, o se
les pone una in ye c c ió n una sola vez, c o m o era el caso de la vacuna Salk) y otros n o
re c ib e n nada, los que han re c ib id o algo, si están convencidos de que eso tie n e algún
efecto curativo, notarán alguna m e jo ría aunque el p ro d u c to carezca com pletam ente
de acción terapéutica. Es lo que se d e n o m in a «efecto placebo». Seguram ente ahí
radica el é x ito de muchas de las llamadas m edicinas alternativas, en eso y en que
muchas dolencias se curan solas, co n tra ta m ie n to y sin él.
E n el caso de la p o lio m ie litis , el n iñ o es afectado p o r la enferm edad o n o es afec­
tado, y se p o dría pensar que aquí n o hay p ro b le m a de p e rce p ció n de m e jo ría p o r el
hecho de estar o no estar vacunado. Pero n o todos los casos eran graves n i dejaban
secuelas, y si u n n iñ o que había sido vacu n a d o presentaba síntomas que p o d ía n ser
de p o lio m ie litis , q u izá los padres, y ta m b ié n el m é d ic o , pensarían que d ifíc ilm e n te
el n iñ o se había contagiado (¡estaba vacunado!), y si realm ente era u n caso leve que
evolucionaba bien, p o d ría ser con f u n d id o con o tra enferm edad y acabar siendo u n
caso de in fe c c ió n no registrado. E n cam bio, en los n o vacunados, más atentos ante
cualquier síntom a al sentirse más desprotegidos, seguramente se analizarían los casos
más a fo n d o y serían diagnosticados, lo cual podía c o n d u c ir a la falsa im p re s ió n de
que había una m a y o r in c id e n c ia en el g ru p o de n o vacunados.
Para e vita r q u e el efecto pla ce bo ju e g u e s ó lo a fa v o r d e l g ru p o tratado, en este
tip o de pruebas lo m e jo r es que todos re cib a n u n tra ta m ie n to de apariencia s im i­
lar, de fo rm a que n o sepan si están to m a n d o el p rin c ip io a c tiv o o esa fa ls ific a c ió n
c o n el m is m o aspecto y sabor que la p a s tilla real y que llam am os «placebo». Pero
n o sólo el in d iv id u o que p a rtic ip a en el e stu d io no sabe si ha sido in c lu id o en el
g ru p o tratado o en el de c o n tro l (en el caso de la p o lio más que en el n iñ o quizá
h a y que pensar en los padres), sino que el m é d ic o que lo tra ta ta m p o c o sabe si está
to m a n d o el placebo o el p rin c ip io activo. N o es que los m édicos n o sean de fiar,
pero p o d ría darse el caso de que se dejara lle v a r p o r sus p re ju ic io s y si el n iñ o está
en el g ru p o tra ta d o y considera que ha re c ib id o u n tra ta m ie n to cu ra tiv o , tenderá
a in fo rm a r de un a m a y o r m e jo ría , m ie n tra s que si sabe que ha to m a d o u n placebo,
q uizá tie n d a a in te rp re ta r lo que le cu e n ta el p a cie nte fijándose más en lo m a lo
que en lo bueno.
Para que n o exista la p o s ib ilid a d de que esto o c u rra , este tip o de estudios se
diseñan de fo rm a que n i el paciente n i el m é d ic o que lo trata e in fo rm a sobre los

120
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

D IF E R E N C IA S IG N IF IC A T IV A Y D IF E R E N C IA IM P O R T A N T E

Cuando se realizan comparaciones se da mucha importancia a descubrir si las diferencias que


se observan son o no son significativas; en realidad, eso es lo que pretenden dilucidar todos los
tests estadísticos. Pero aunque parezca un contrasentido, el hecho de que una diferencia sea
significativa no implica que sea importante.
Se dice que es significativa cuando se cree que no puede ser debida al azar, que realmente
los dos tratamientos que se comparan dan resultados distintos. Pero podemos estar seguros
de que son distintos aunque esa diferencia sea tan pequeña que a efectos prácticos resulte
irrelevante.
Por ejemplo, un estudio realizado haciendo muchas pruebas podría poner de manifiesto que
la resistencia que se consigue con un tipo de pegamento es mayor que con otro, pero que
esa diferencia sea casi imperceptible. También podrfa ocurrir que por disponer de pocos datos
o porque la variabilidad en los resultados sea grande, se observe una diferencia grande pero
que pueda ser debida al azar; es decir, que no estemos seguros de que realmente uno sea
mejor que el otro.

resultados sepan q u ié n está to m a n d o el p rin c ip io a c tiv o y q u ié n el placebo, p o r eso


se llam an «estudios de d o b le ciego».
Pero el g ru p o de c o n tro l p o r placebo ta m b ié n presenta algunos p ro b le m a s y
u n o de ellos es que exige una org a n iza ció n com pleja. E n el caso de la vacuna Salk
había que preparar inyectables con p rin c ip io a c tiv o idénticos a los que únicam ente
eran una so lu ció n salina, p o r lo que tenían que estar num erados y controlados para
p o d e r id e n tific a r cuál era de cada tip o a pesar de que n i el personal sanitario que
ponía la vacuna n i el m é d ic o que realizaba el se g u inú e n to sabía si co n te n ía o n o el
p rin c ip io activo.
O tro problem a era el planteado en el á m b ito de la ética. La cuestión fue que a
algunas personas no les parecía razonable in ye cta r a los niños que p a rticip a b a n en
el estudio una so lu ció n salina en lu g a r de una vacuna que estaban bastante seguros
de que era eficaz.
Se propuso c o m o alternativa va cu n a r a los niños de segundo curso y to m a r a los
de p rim e ro y tercero c o m o g ru p o de c o n tro l. E sto tenía algunos problem as, c o m o
el de ro m p e r el p rin c ip io de d o b le ciego, p ero fin a lm e n te así se h iz o aproxim ada­
m ente en la ífutad de las áreas, m ientras que en la o tra m ita d se em plearon grupos
de c o n tro l p o r placebo.

121
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

Necesidad de tomar una muestra muy grande

La tasa de in cid e n c ia de la enferm edad era sólo de 50 afectados p o r cada 100.000


in d ivid u o s, y se esperaba que la vacuna redujera esa in cid e n cia a la m ita d . Es evidente
que n o se pueden hacer las pruebas con grupos pequeños. Si, p o r ejem plo, vacunamos
a 1.000 niños y otros 1.000 se u tiliz a n com o g ru p o de co n tro l, lo más probable es
que no haya n in g ú n afectado en n in g u n o de los grupos y el e xp e rim e n to n o haya
servido para nada. Si se u tiliz a n 10.000 en cada g ru p o puede o c u r r ir que en el de
c o n tro l tengamos 5 afectados y en el vacunado, sólo 2. Pero la diferencia es tan pe­
queña que se podría a trib u ir al azar (n o se p o drá rechazar la hipótesis n u la de que la
tasa de afectación es la m ism a). Era necesario que en cada g ru p o h u b ie ra cientos de
m iles para que las conclusiones se pu d iera n considerar sólidas. Era necesario realizar
u n e xp e rim e n to a gran escala.

Resultados

Se v e rific ó sin lu g a r a dudas que la vacuna era eficaz. E n el g ru p o vacunado la tasa


de in c id e n c ia era menos de la m ita d que en el g ru p o al que se había inyectado u n
placebo. E l p -v a lo r de la pru e b a era del o rd e n de 10-9, es d e cir, en el caso de que n o
h u b ie ra diferencias e n tre u n g ru p o y o tro , una discrepancia ta n gra n d e sólo se daría
p o r azar aproxim adam ente una vez de cada m il m illo n e s.

Casos de poliomielitis
Población estudiada
N° ] Tasa (x100.000)
Control por placebo:
| Vacunados 200.745 57 28
| Placebo 201.229 142 71
| Control por cursos:
| Vacunados 221.998 56 25
| Grupos de control 725.173 391 54

Los resultados eran similares en las áreas d o n d e se u tiliz a ro n los cursos a n te rio r
y p o s te rio r c o m o g ru p o de c o n tro l y todos quedaron satisfechos de la fo rm a co m o
se había lle va d o a cabo el e x p e rim e n to , ha cie nd o las cosas lo m e jo r que había sido
posible. P ero a pesar de que la dife re n cia era m u y clara a fa vo r del g ru p o tratado, si
n o hubiera existid o el g ru p o de c o n tro l p o r placebo siem pre quedaría la duda sobre
otras posibles interp re ta cio n e s de los resultados.

122
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

E l papel de la estadística. La poliomielitis hoy

La vacuna Salk, aunque supuso u n paso adelante en la lucha c o n tra la e n ferm edad,
n o era todavía enteram ente satisfactoria y a los pocos años fue su s titu id a p o r otra
vacuna más eficaz, que antes de ser usada m asivam ente fue so m e tid a a pruebas
estadísticas diseñadas y realizadas de la fo rm a adecuada. H o y en día, la p o lio m ie litis
es una enferm edad en vías de e x tin c ió n . Sólo quedan cu a tro países en el m u n d o en
los que la enferm edad sigue siendo endém ica: N ig e ria , In d ia , Pakistán y A fganistán.
La O M S , la U n ic e f y o tro s organism os in te rn a c io n a le s han a n u n cia d o que se están
h a cie nd o esfuerzos en estos países y estim an que m u y p ro n to ya n o se p ro d u c irá n
nuevos casos de la enfe rm e d a d . L u e g o habrá que esperar 3 años más para que la
p o lio m ie litis sea declarada o fic ia lm e n te e lim in a d a de la faz de la T ie rra .

A sp ir in a e in fa r to

E n 1983 se in ic ió en Estados U n id o s u n e stu d io a g ra n escala para m e d ir la in ­


flu e n c ia de la aspirin a en las enferm edades del cora zó n . E studios más pequeños
habían dem ostrado que una persona que haya te n id o u n ataque al co ra zó n puede
re d u c ir el rie sg o de u n se gundo ataque to m a n d o a sp irin a , pero n o había n in g u n a
p ru e b a de que el efecto b e n e fic io s o se pu d iera e xte n d e r a la p o b la c ió n m asculina
en general.
F u e ro n in v ita d o s a p a rtic ip a r 2 6 1 .2 4 8 m édicos varones de más de 40 años,
cu yo s datos fu e r o n o b te n id o s de los re g is tro s de la A s o c ia c ió n A m e ric a n a de
M é d ic o s . D e e ntre to d o s e llo s, 5 9 .2 8 5 se o fre c ie ro n a p a rtic ip a r, p e ro h u b o que
e x c lu ir a los que te n ía n una h is to ria c lín ic a c o m p lic a d a , o a los que ya estaban
to m a n d o aspirina o presentaban reacciones adversas cu a n d o la to m a b a n . A l fin a l
q u e d a ro n 22.071 m é d ico s, que p o d ía n ser considerados to d o s ellos in d iv id u o s
sanos y de bajo riesgo, que to m a ro n unas dosis de 325 m g de a sp irin a (o el p la ­
cebo) en días alterno s.
A la vez que se e studiaba el efe cto de la a sp irin a se aprovechó para estudiar
ta m b ié n el efecto del b e ta -c a ro te n o (u n co m p u e s to que el o rg a n is m o tra n s fo r­
m a en v ita m in a A ) en la p re v e n c ió n de d e te rm in a d o s tip o s de cáncer. A sí pues,
los p a rticip a n te s se d is trib u y e ro n a le a to ria m e n te en cu a tro g ru p o s según to m a ­
ran aspirina y b e ta -c a ro te n o reales, aspirina real y u n placebo de b e ta -c a ro te n o ,
placebo de aspirina y b e ta -c a ro te n o real, y placebos ta n to de a sp irin a c o m o de
b e ta -ca ro te n o .

123
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

Aspirina + Aspirina + Placebo de aspirina + Placebo de aspirina +


beta-caroteno. placebo de beta-caroteno. placebo de
beta-caroteno. beta-caroteno.

Tratamientos asignados a los cuatro grupos. El aspecto de lo que tomaban


era idéntico en todos los casos. El asterisco indica lo que en realidad era un placebo.

A pesar de los e strictos c rite rio s de selección aplicados para p a rtic ip a r en el


estudio, se tenía u n c o n ju n to de personas de diversa edad, d is tin to h is to ria l c lín i­
co, d is tin to carácter, unos eran fum a d o re s y otro s n o .. . P o r e llo era necesario ser
m u y escrupuloso c o n la asignación al azar de cada in d iv id u o a u n o de los cu a tro
g ru p o s, ya que sólo de esta fo rm a se p o d ía estar seguro de que los cu a tro te n d ría n
características sim ilares Se p o d ría o b je ta r que es p o sible que las personas que están
a p u n to de s u frir u n in fa rto caigan m a y o rita ria m e n te , p o r casualidad, en u n o de
los grupos, p ero la teoría de la p ro b a b ilid a d nos asegura que si el re p a rto se hace
re a lm e n te al azar, la p ro b a b ilid a d de que eso o c u rra en g ru p o s tan grandes es
co m p le ta m en te despreciable.
A sí pues, co m o los cuatro grupos estaban fo rm a d o s p o r personas similares, y es­
taban sometidas a unas condiciones am bientales ta m b ié n similares, si se observaban
diferencias im porta n te s en los resultados de cada gru p o , más allá de lo a trib u ib le
al azar, serían debidas a que los tratam ientos seguidos habían p ro d u c id o resultados
diferentes. É sta es la lógica de los e x p e rim e n to s para la com paración de tratam ientos
co n muestras aleatorias independientes.
E l estudio fu e de d o b le ciego, es d e c ir, que n i los p a rtic ip a n te s n i los res­
ponsables de re a liz a r su s e g u im ie n to sabían a cuál de los cu a tro grupos estaban
asignados. U n c o m ité de su p e rvisió n ib a a n a liza n d o los resultados cada seis meses
y a u n q u e se había p re visto que el e s tu d io durara siete años, después de c in c o los
resultados de la asp irin a e ran tan b uenos que la in v e s tig a c ió n se in te rr u m p ió para
p o d e r in fo rm a r lo más rá p id o posible, ta n to a los p a rticip a n te s co m o a la p ro fe s ió n
m é d ic a en general.

124
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

Grupo aspirina Grupo placebo


(n = 11.037) (n = 11.034)
Infartos de miocardio
Mortal 5 18
No mortal 99 171

Total 104 171

E l g ru p o de la a s p irin a estaba fo rm a d o p o r los que to m a ro n a s p irin a más


b e ta -ca ro te n o y los que to m a ro n asp irin a más pla ce bo de b e ta -ca ro te n o , y el del
placebo, p o r los otros dos. U n test estadístico de c o m p a ra c ió n de p ro p o rc io n e s
po n e de m a n ifie sto que si la aspirina n o tu v ie ra efecto (la p ro b a b ilid a d de te n e r
u n in fa rto fuera la m ism a en u n g ru p o que en el o tro ) una d ife re n c ia c o m o la que
hem os o b te n id o , o m ayor, se daría p o r azar del o rd e n de 2 veces p o r cada 100.000.
L o razonable es, p o r lo ta n to , co n sid era r que la a s p irin a reduce la p o s ib ilid a d de
s u fr ir u n in fa rto .
La n o tic ia salió en la po rta d a del N e w Y o rk T im e s y tu v o una gran repercusión
m ediática. R especto al b eta-caroteno el estudio siguió d u ra n te el p e rio d o previsto
y n o he e ncontrado referencias sobre los resultados finales. Sospecho que n o fu e ro n
buenos, porq u e -c o n s u lta n d o lo que h o y se sabe sobre sus e fe c to s - parece que no
sólo no d ism in u ye la p o s ib ilid a d de c o n tra e r cáncer, sino que la aum enta en el caso
de los fum adores.
P ero la aspirina ta m p o c o es la panacea. Se cree que actúa p o r in h ib ic ió n del
proceso de agregación de plaquetas, c o n lo que se reduce la fo rm a c ió n de coágu­
los pero el m ism o m ecanism o ta m b ié n supone u n p e lig ro p o te n cia l. D e hecho, el
estudio m o s tró que había u n pequeño, y n o sig n ifica tivo , exceso de m o rta lid a d p o r
em bolias entre los q u e re c ib ie ro n aspirina. P o r eso la consigna nunca ha sido to m a rla
a discreción y se insiste en seguir la re co m e n d a ció n del m é d ic o que deberá valorar
las ventajas y los inco n ven ie n te s de cada caso.

Tabaco y c á n c e r d e p u lm ó n

H o y en día n o hay e vid e ncia más clara y menos d iscu tid a que el hecho de que
«fum ar p e rju d ica seriam ente la salud», pero esto n o siem pre ha sido así. H o y se co ­
noce cuáles son los com ponentes del h u m o del tabaco que pueden p rovocar cáncer
y se sabe c ó m o actúan para in d u c ir la tra n s fo rm a c ió n de células sanas en células
cancerosas, lo cual se ha dem ostrado e xp e rim e n ta lm e n te co n animales. Pero, co m o

125
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

en tantas otras ocasiones, la señal de alarm a de que algo no iba b ie n y que c o n d u jo


a investigaciones más detalladas, fu e ro n los datos estadísticos. Lo s datos disponibles
en la década de 1950 ya p o n ía n de m a n ifie sto una m a yo r in c id e n c ia de cáncer de
p u lm ó n entre los fum adores que entre los n o fum adores, pero era necesario realizar
estudios más detallados para c o n firm a r estas sospechas.
Para v e rific a r esa re lación entre cáncer de p u lm ó n , y ta m b ié n otras enfermedades,
con el h á b ito de fu m a r, se realizaron siete grandes estudios en el m u n d o anglosajón
(uno en e l R e in o U n id o , o tr o en Canadá y c in c o en Estados U n id o s ); todos ellos
fu e ro n estudios a gran escala, y el n ú m e ro de participantes osciló entre 34.000 y
448.000. Básicam ente el p ro c e d im ie n to era el m is m o en todos ellos: se e n vió u n
c u e stio n a rio a las personas seleccionadas para p a rtic ip a r preguntándoles sobre sus
hábitos de co n su m o actual y pasado ju n to co n otros datos dem ográficos y se creó
u n sistema para garantizar que cuando m o ría alguna de las personas que habían
resp o n d id o al cuestio n a rio este hecho quedara registrado ju n to al d ia g nó stico de la
causa de la m uerte.
Estos estudios p e rm itie ro n te n e r datos sobre la in flu e n c ia de la edad a la que se
e m pezó a fum ar, el tip o y la cantidad de tabaco fu m a d o h a b itu a lm e n te y ta m b ié n
qué es lo que o c u rría con los ex fum adores. U n a de las conclusiones fue que entre
los fum adores la in cid e n cia del cáncer de p u lm ó n es entre 11 y 20 veces m a y o r que
entre los no fum adores.
U n a de las pegas que se puede p o ner a este tip o de estudios, y de hecho se le
pusieron y Fisher fu e u n o de los abanderados, es que lo que se dem uestra es que
entre los fum adores existe una m a y o r in c id e n c ia de, p o r e je m p lo , cáncer de p u l­
m ó n , p e ro eso n o im p lic a que la causa sea el tabaco. P odría ser, p o r eje m p lo , que las
personas que adquieren e l h á b ito de fu m a r sean más inquietas, más nerviosas, y que
esa p e cu lia rid a d que les hace propensos a caer en el h á b ito de fu m a r sea ta m b ié n
la que les hace propensos a padecer ese tip o de enferm edades, o ta m b ié n puede ser
que haya algo en la estructura genética de algunas personas que las haga propensas a
caer en la adicción del tabaco y, a la vez p ero n o a causa de, tener más posibilidades
de padecer cáncer de p u lm ó n .
Estas pegas se pu e d e n p o n e r p o rq u e los estudios realizados n o son diseños expe­
rim e n ta le s c o m o en e l caso de la vacuna de la p o lio o estudios de la re la c ió n entre
consum o de aspirina y enferm edades cardiacas. E n esos casos el g ru p o de estudio
se d iv id ía aleatoria m e n te en dos partes: e l g ru p o tra ta d o y el g ru p o de c o n tro l, y
co m o to d o se diseñaba para que la ú n ic a d ife re n c ia entre u n g ru p o y o tro fuera
e l efecto del fa cto r que se estaba estudiando, si existían diferencias significativas

126
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

entre gru p o s éstas te n ía n que ser debidas al e fe cto de ese fa c to r que actuaba de
fo rm a d is tin ta en los dos g ru p o s . S in e m b a rg o , los estudios sobre la in flu e n c ia
d e l tabaco n o fu e ro n diseños e xp e rim e n ta le s, sino estudios prospectivos, es decir,
existen dos g ru p o s que ya están hechos y observam os c ó m o e v o lu c io n a u n o y
o tro . E n este caso n o se p o d ía o b lig a r a fu m a r a n o fum adores y a que dejaran de
hacerlo fum adores e m p e d e rn id o s. L le va nd o la teoría al e x tre m o , lo ideal h u b ie ra
sido que todos fu m a ra n , p e ro una m ita d elegida al azar fu m a ra tabaco n o rm a l,
y la o tra m ita d una sustancia que se supiera to ta lm e n te in o c u a y que tu v ie ra u n
aspecto y u n «sabor» id é n tic o al d e l tabaco.
Los fa b rica n te s de tabaco p o d ría n a rg u m e n ta r que éste es el ú n ic o e s tu d io
c o rre c to ,y te n d ría n ra zó n , tan c o rre c to c o m o im p o s ib le de lle v a r a cabo. Pero con
los datos disponibles es o b v io , más a llá de to d a d u d a razonable, que el tabaco es
u n fa c to r de riesgo im p o rta n te para el cáncer de p u lm ó n , el cáncer de vejiga, las
enferm edades cardiacas y ta m b ié n o tro s tip o s de enferm edades. La c o n e x ió n entre
cáncer de p u lm ó n y c o n su m o de tabaco se ha observado en m ú ltip le s estudios en
m u y diversos países y c o n te x to s , lo cual e lim in a la p o sible p re d is p o s ic ió n de u n
g ru p o específico de personas, p ero, además, se conoce cuáles son los c o m p o n e n te s
d e l h u m o d e l tabaco que p u e d e n p ro v o c a r cáncer. La hipótesis genética n o puede
e x p lic a r el a u m e n to de in c id e n c ia que se ha p ro d u c id o en las m ujeres cu a n d o
éstas se han in c o rp o ra d o al h á b ito de fu m a r, o el a u m e n to de la in c id e n c ia en n o
fum adores expuestos al h u m o de los c ig a rrillo s de otras personas. E n fi.n, es una
o b vie da d p ero n o siem pre fue así, y la estadística ha estado en la vanguardia d a n d o
argum entos para p o n e rlo de m a n ifie sto .

A le a t o r iz a c ió n y b lo q u e o

C u a n do se diseñan e x p e rim e n to s para co m p a ra r lo que g e n é rica m e n te se d e n o ­


m in a n t r a t a m ie n to s (puede ser co m p a ra r dos m e d ica m e n to s c o n tra una e n fe rm e ­
dad o dos catalizadores para m e jo ra r el re n d im ie n to de una re a cció n q u ím ic a ) la
clave está en co n se g u ir dos c o n ju n to s de datos en los cuales la ú n ic a v a ria b le que
afecta de fo rm a d is tin ta es aquella c u y o e fe cto se q u ie re estudiar. E n el cam po de
la m e d ic in a lo que se com para (los tra ta m ie n to s) p u e d e n ser dos m e d ica m e n to s,
o to m a r u n m e d ic a m e n to fre n te a n o to m a r nada, c o m o en el caso de la vacuna
co n tra la p o lio , o la in flu e n c ia de to m a r asp irin a en los ataques cardiacos. C o m o ya
se ha visto, la clave es d iv id ir a los in d iv id u o s que p a rtic ip a n en el e s tu d io en dos
gru p o s que sean lo más parecidos posible (el azar, aunque parezca p a ra d ó jic o , es

127
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

un b u e n in s tru m e n to para asegurar ese e q u ilib r io entre los dos grupos) a los que
to d o afecta exactam ente ig u a l e xce p to el fa c to r c u y o efecto se desea estudiar; p o r
lo ta n to , si existen diferencias sig n ifica tiva s entre los dos g ru p o s (diferencias más
allá de lo que sería a trib u ib le al azar) éstas se a trib u y e n al fa c to r que ha actuado de
fo rm a d is tin ta en los dos g ru p o s. P e ro si además d e l fa c to r que se está estudiando
afectan ta m b ié n otros de fo rm a d ife re n te a cada g ru p o , en el caso de que haya
diferencias entre u n o y o tro n o p o d re m o s saber si son debidas al fa c to r que se
estudia o a cu a lq u ie ra de los otros que ta m b ié n están actuando.
Veamos u n ejem plo. U n o de los te x to s de referencia sobre diseño de e x p e rim e n ­
tos es S ta tis tic s fo r E x p e r im e n t e n de B o x , H u n te r y H u n te r, en el que se exp lica c ó m o
se diseñó u n e x p e rim e n to para com parar el desgaste de dos m ateriales para fa b ric a r
suelas de zapato para jóvenes. Si se dispone de, p o r eje m p lo , 1O jóvenes para hacer
la prueba, una idea p o d ría ser d iv id irlo s aleatoriam ente en dos grupos de 5: a los
de u n g ru p o darles zapatos con la suela A y a los del o tro , los de la suela B. A l cabo
de u n tie m p o (pongam os 6 meses) se les pid e que vengan co n los zapatos, se m id e
el desgaste de las suelas elaboradas co n cada m a te ria l y se realiza el test estadístico
correspondiente (en este caso sería el lla m a d o test de la t de S tu d e n t para muestras
independientes).
N a tu ra lm e n te , el re p a rto se habría hecho al azar; n o valdría i r al p a tio de una
escuela y p e d ir a los jó ve n es que h icie ra n una fila y a los 5 que llegaran p rim e ro
darles zapatos co n la suela A y a los 5 ú ltim o s c o n la suela B , ya que seguram ente los
p rim e ro s c o rre n más, se m u even más y desgastan más la suela de los zapatos.
Pero este diseño de la recogida de datos tie n e u n problem a. E n el desgaste de la
suela de los zapatos puede in flu ir el m a te ria l (eso se tra ta de saber), pero ta m b ié n
puede in flu ir el niñ o : quizás hay niños que c o rre n m u ch o , e in clu so que ju e g a n al
fú tb o l co n esos zapatos, y otros que c o rre n poco. In clu so puede haber a lg u n o que
apenas se los ponga p o rq u e n o le gusten o p o rq u e le hacen daño, p o r lo que des­
gastará p o co las suelas.
A sí pues, si en el desgaste n o sólo in flu y e el m a te ria l de la suela sino ta m b ié n otros
factores, en el caso de e n c o n tra r d ife re n cia n o p o d rá saberse si es debida al m a te ria l
o a esos otros factores. In clu so p o d ría o c u r r ir que n o se encu e n tre n diferencias p o r
el efecto de los factores perturbadores, cuando en re alidad sí las hay.
¿ C ó m o s o lu c io n a r este problem a? Q u e cada n iñ o tenga u n zapato c o n una
suela de u n tip o y o tro c o n la suela del o tro tip o . C o m o los dos pies siem pre van
ju n to s , las diferencias de desgaste h a b rá que atribuírselas al m a te ria l y n o a n in g ú n
o tr o factor.

128
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

W IL L IA M S E A L Y G O S S E T , A L I A S « S T U D E N T »

Todo el que se ha adentrado un poco en el es­


tudio de la estadística se ha encontrado con la
distribución t de Student (seguramente más utili­
zada que la mismísima normal) o con los tests de
la t de Student para la comparación de las medias.
«Student» es el pseudónimo con que firmaba sus
trabajos W.S. Gosset (1876-1937), un hombre que
realizó grandes aportaciones a la estadística y que
desarrolló toda su vida profesional en la fábrica de
cervezas Guinness de Dublín.
A principios del siglo xx, justo cuando Gosset aca­
baba de graduarse en matemáticas y química en la
Universidad de Oxford, la Guinness habla pasado a
manos de un joven heredero que decidió ir más allá ¡■ « 1 1 1 im rnnm

de los métodos tradicionales y artesanos contratando a científicos que introdujeran procedimien­


tos más avanzados, y «Student» fue uno de los fichajes. Nuestro hombre reconoció rápidamente
la importancia del uso de técnicas estadísticas en la investigación sobre las mejores formas
de elaborar cerveza. Era necesario estudiar la. influencia de unas materias primas que podían
tener características muy variables y que eran muy sensibles a las condiciones ambientales. Era
necesario hacer pruebas, pero siempre se hacían pocas y había que trabajar con pocos datos.
Hasta entonces se consideraba que las muestras siempre eran lo suficientemente grandes como
para poder estimar con precisión los parámetros de la población utilizada para calcular pro­
babilidades. Sin embargo, cuando se trabaja con muestras pequeñas esas estimaciones son
imprecisas y eso cambia las cosas. Gosset estudió cuál era la solución a este problema y publicó
sus conclusiones en un artículo con el pseudónimo «Student» porque era norma de la empresa
que sus técnicos no publicaran artículos con los resultados de sus investigaciones.
Hay diversas versiones sobre el cómo y el por qué del pseudónimo. Una versión dice que en la
Guinness se enteraron del hobby matemático de Gosset cuando éste ya había fallecido, pero
existen también otras como la que indica que no sólo estaban al corriente de estas publicaciones
sino que fue el mismo director de la empresa quien le sugirió usar Student como pseudónimo.
Parece que la intención no era tanto ocultar las teorías estadísticas que se estaban desarrollan­
do, sino evitar que los otros fabricantes de cerveza supieran que la Guinness estaba utilizando
técnicas estadísticas para mejorar los productos y los procesos de producción.

129
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

E n este tip o de diseño n o se co m p a ra la m e d ia de una m uestra fre n te a la m e ­


dia de la o tra , sino que las com paraciones se realizan n iñ o a n iñ o . Si en general se
desgasta más una suela que la o tra (n o im p o r ta que se desgasten m u c h o o p o co ,
lo que im p o rta es la d ife re n c ia entre la una y la otra) será d e b id o a la d ife re n c ia
de m ateriales.
E l test estadístico q u e se realiza para co m p a ra r m edias cuando los datos se h a n
re c o g id o de esta fo rm a se lla m a te st de la t de S tu d e n t para datos apareados.
C la ro que sería una m ala idea co lo c a r siem pre la suela tip o A en el pie derecho
y la B en el iz q u ie rd o , p o rq u e q u izá tie n d e a desgastarse más la suela de u n p ie
qu e la d e l o tro , pe ro e llo se puede subsanar a le a to riza n d o el o rd e n (p o r e je m p lo ,
para cada n iñ o se lanza una m oneda, si sale cara se coloca e l m a te ria l A en el pie
derecho y si sale c ru z, en el iz q u ie rd o ).
D e esta fo rm a se espera que si el p ie tiene alguna in flu e n c ia , al a le a to riza r esa
in flu e n c ia quede d ifu m in a d a entre los dos m ateriales sin afectar a u n o de fo rm a
d ife re n te que al o tro.
A le to riz a r n o cuesta nada y p ro te g e co n tra la in flu e n c ia de posibles factores
conocidos e in c lu s o desconocidos. P o r e je m p lo , u n caso s im ila r al de las suelas de
zapato son los estudios que se realizan para p ro b a r la resistencia al d e te rio ro (rayas,
desgaste...) de cie rto s tip o s de re c u b r im ie n to s u p e rfic ia l que se c o lo c a en los c ris­
tales de las gafas. Si a u n g ru p o de personas se les dan gafas cuyos cristales tie n e n
u n tip o de re c u b rim ie n to , y a o tro se le dan d e l o tr o tip o y al cabo de u n tie m p o
se les pide que de vu e lva n las gafas para m e d ir el d e te rio ro d e l re c u b rim ie n to , está
c la ro que en d ic h o d e te rio ro in flu irá n o sólo el m a te ria l sino ta m b ié n e l tra to que
cada u n o haya dado a sus gafas, así c o m o el a m b ie n te en e l que se desenvuelve,
entre otros factores.
P o r lo ta n to , c o m o en el caso de las suelas de zapato, lo m e jo r será dar a cada
persona las gafas de fo rm a que cada c ris ta l tenga u n re c u b rim ie n to de u n tip o
(cla ro que esto n o se p o d rá hacer si u n o es azul y e l o tr o a m a rillo ). P e ro ¿habría
que a le a to riza r el o rd e n en el que se coloca cada tra ta m ie n to , o p o d ría m o s p o n e r
siem pre el A en el o jo d erecho y el B , en el iz q u ie rd o ?
S iem pre es m e jo r a le a to riza r. D ic e n los que han estu d ia d o estos temas que
c u a n d o nos lim p ia m o s las gafas sie m p re em pezam os p o r el m is m o crista l. N o
to d o el m u n d o e m p ie za p o r el m ism o , p e ro q u ie n e m p ie za p o r e l de la derecha
siem pre lo hace así, y lo m is m o q u ie n em pieza p o r el de la iz q u ie rd a .Y e l que se
lim p ia en p r im e r lu g a r siem pre se lim p ia m e jo r y ... E n fin , p o r si acaso, siem pre
es m e jo r aleatorizar.

130
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

H á g a lo u s te d m is m o

E xiste n leyendas urbanas (¿o quizá n o los son?) cuya veracidad se puede d ilu c id a r
usando la estadística.Veamos algunos ejem plos.

¿Sirve una cucharilla para mantener el gas en una botella de cava?

A lgunas personas creen que c o lo c a r una c u c h a rilla en la boca de una b o te lla de


cava evita que se escape el gas (o al menos que n o se escape ta n to c o m o si estuviera
abierta) y de esta fo rm a se conserva m e jo r de u n día para otro. U n a fo rm a de salir
de dudas es... p ro ba n d o (a «probar» ta m b ié n lo llam am os «experim entar»).
Este d ile m a recuerda al de la catadora de té y tam bién se puede abordar co n una
persona que pruebe unas copas de una b otella conservada con cucharilla y otras de otra
b o te lla en la que no se haya puesto nada. D e entrada, ya sabemos que la prueba n o se
puede hacer co n una copa de cada tip o ; h a y que tener, co m o n ú n im o , 3 copas de una
b o te lla y 3 de la o tra , idénticas en to d o , in clu ye n d o la fo rm a en la que se han conser­
vado, con la única excepción de que en una se ha puesto cu ch a rilla y en la otra, no.
Si el catador id e n tific a las 3 copas que p ro v ie n e n de la b o te lla con cucharilla, y
si to d o se ha hecho bien, la p ro b a b ilid a d de que haya acertado p o r azar es exacta­
m ente del 5% (recuerde, 3 objetos se pueden e le g ir entre 6 de 20 form as distintas, y
sólo una es la correcta). Para que la p ro b a b ilid a d de que acierte p o r azar sea m e n o r
habría que darle a catar más copas, pero h a y que te n e r en cuenta que seguram ente
irá p e rd ie n d o facultades gustativas, y ta m b ié n de las otras.
Puede pensarse que realicen la p ru e b a varias personas, p e ro hay que andarse
co n cuidado p o rq u e a lgo que es raro si se pru e b a una sola vez, ya n o es tan ra ro si
se prueba m uchas veces. Si la p ro b a b ilid a d de que una persona acierte p o r azar es
del 5%, si la prueba la hacen 5 personas la p ro b a b ilid a d de que alguna acierte es del
o rd e n del 40%, y eso ya n o dem uestra nada.
C laro que se podría d e cir que para qué tanta co m p lic a c ió n si se puede u tiliz a r una
m áquina que m id a el c o n te n id o de gas en la b o te lla c o n y sin cu ch a rilla , y asunto
resuelto. Es verdad, si se dispone de la m áquina, ésa sería una buena o p c ió n , aunque
es posible que la m á quina n o te diferencias y que, sin em bargo, p o n e r la cu c h a rilla
n o sirva para nada, p o rq u e q u ie n se to m a el cava son las personas, n o las m áquinas,
y si las personas n o son capaces de d is tin g u ir una situ a ció n de otra, la c u c h a rilla es
in ú til. P o r la m ism a razón, ta m p o co hace falta que la p ru e b a la haga u n catador co n
dotes excepcionales.

131
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

¿Realmente sabe elegir si el melón está en su punto?

La elección de u n m e ló n en su p u n to todavía se parece más al caso de la catadora


de té. A lgunas personas m a n tie n e n que son capaces de e le g ir el m e jo r m e ló n a
base de sopesar, tocar. .. Para v e r si realm ente es así, una prueba p o d ría consistir en
presentar 5 m elones tom ados al azar y que el e x p e rto e lija el que le parece m e jo r.
A c o n tin u a c ió n prepararle una cata de cada u n o de esos m elones (sin saber a cuál
corresponde, naturalm ente) y que vuelva a elegir el m e jo r, ahora sabiendo el sabor
que tiene cada uno, y ve r si c o in c id e n ambas elecciones. E l p ro b le m a es que la p ro ­
b a b ilid a d de que lo acierte p o r azar es 1 /5 (20%) y, p o r lo tanto, aunque lo acierte
n o dem uestra nada. P ero si se hace la pru e b a 2 veces y acierta las 2, la p ro b a b ilid a d
de que haya acertado p o r azar ya es sólo del 4%, y si acierta 3 veces sería del 8 % 0, lo
cual ya es m u y raro a n o ser que se tenga esa habilidad.

¿Sirve la aspirina para que las flores duren más?

Parece que las virtu d e s de la aspirina n o se acaban en el te rre n o de la m edicina. Está


bastante extendida la creencia de que las flores de u n ram o d u ran más si se añade
una aspirina al agua del ja rró n .
U n e x p e rim e n to para c o m p ro b a r si esto es c ie rto se p o d ría o rg a n iz a r to m a n d o
dos ram os de 2 0 flores cada u n o , m e jo r si son todas distintas, de fo rm a que tenga­
m os dos rosas, dos claveles, dos m argaritas ... Se pone una flo r en u n ja r r o n c ito y
su pareja en o tro igual, situ á n d o lo s ju n to s y asegurándonos de que las co n d ic io n e s
de lu z y to d o lo que puede in f l u ir a la d u ra c ió n de las flo re s afecta exactam ente
ig u a l en los dos casos. La única d ife re n c ia será que en u n ja r r ó n p o n d re m o s aspi­
rin a y en e l o tro , no.
Si la aspirina n o afecta, la p ro b a b ilid a d de que se m a rc h ite p rim e ro una, o la
otra, es de l 50%; p o r lo ta n to , sería m u y poco pro b a b le que en los 20 casos d u re
más la que tie n e aspirina. L a p ro b a b ilid a d de que esto o c u rra p o r azar es la m is ­
m a que la de que salga cara las 2 0 veces que se tir a una m o n e d a al aire, y esto es
(aplicando la regla de la «y» vista en el c a p ítu lo 2) 0 ,5 20 = 9,5 ■ 10 "7 (del o rd e n de
u n caso entre u n m illó n ). Si esto o c u rrie ra sería una e vid e ncia m u y clara de que
la aspirina es eficaz.
La p ro b a b ilid a d de que la flo r c o n a sp irin a dure más en 19 casos c o m o m ín im o
es de 2 entre 10.000, en 15 casos c o m o m ín im o es del 2%, y si se to m a n 14 casos la
p ro b a b ilid a d ya es de casi el 6 %. L u e g o n o es ta n raro que la flo r co n aspirina dure

132
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

14 o más veces, siendo la aspirina ineficaz. T o m a n d o una p ro b a b ilid a d de e rro r del


5% (lo que se d e n o m in a «nivel de significación») se debería considerar que la aspirina
es eficaz si gana c o m o m ín im o en 15 casos.

N° mínimo de veces que dura Probabilidad de que ocurra


más la flor con aspirina*1
6 si la aspirina no es eficaz
20 0,00000095
19 0,00002003
18 0,00020123
17 0,00128841
16 0,00590897
15 0,02069473
14 0,05765915

Este test es m u y sencillo, y n o tie n e en cuenta si una flo r d ura u n día más que la
o tra o dura una semana más. E xiste n otros tests, c o m o e l lla m a d o de W ilc o x o n para
datos apareados, que sí tie n e n en cu e n ta la d ife re n cia en cada pareja. Pero lo más
im p o rta n te n o es ta n to e l test que se e lig e c o m o asegurarse de que el e x p e rim e n to
se ha p la n ifica d o y realizado de la fo rm a adecuada, y de que n o se extra p o la n las
conclusiones más allá de lo que se ha probado.

¿Duran más las pilas caras?

C u a n do com pram os u n aparato para escuchar m úsica podem os o p ta r p o r u n o u o tro


no sólo p o r las prestaciones, sino p o rq u e nos gusta más uno que o tro. Pero cuando
com pram os pilas lo ú n ic o relevante es la dura ció n .
Y es curioso observar la dife re n cia de p re c io que hay e ntre las pilas de u n m ism o
tip o según la m arca o el lu g a r don d e se com pren. Las pilas norm ales de 1,5 vo ltio s
pueden valer más del doble si son de marcas conocidas que si se com pran de marcas
blancas en superm ercados de p ro d u c to s baratos (que n o necesariam ente m alos).
T am b ié n es verdad que ú ltim a m e n te las marcas conocidas hacen ofertas especiales
y estas diferencias de p re cio ya n o son tan grandes (el m e rca d o im p o n e sus leyes).
¿Duran más las pilas caras?Y en el caso de que efectivam ente d u re n más, ¿vale la
pena comprarlas? Es decir, ¿el aum ento de d u ra ció n compensa el aum ento de precio?
Para responder a estas preguntas se necesitan datos;hay que diseñar cuidadosam ente el
p ro c e d im ie n to para obtenerlos y ha y que analizarlos de la fo rm a adecuada para sacar

133
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

i ¿ C Ó M O S E P A R A R 20 R A T A S E N D O S G R U P O S D E 10
D E F O R M A A L E A T O R IA ?

r Suponga que realiza un trabajo de investigación con ratas de laboratorio para comparar la
S resistencia al esfuerzo cuando se sigue un determinado tipo de dieta (llamémosla A, podría
ser «rica en ácidos grasos saturados» o algo por el estilo) frente a otra (B). Dispone de 20
I ratas similares de aproximadamente la misma edad y características generales; usted las divide
aleatoriamente en dos grupos de 10y a cada grupo fo alimenta con la dieta correspondiente.
Después de unos cuantos meses de cuidados y atenciones, las ratas se someten a una prueba
de esfuerzo que consiste en hacerlas nadar en un recipiente contando el tiempo que tardan
hasta que ya no son capaces de mantenerse en la superficie (en ese momento se las salva).
Los resultados son que el grupo que ha seguido la dieta B tiene una mayor resistencia que el
] A (los tiempos medios de uno y otro grupo presentan una diferencia claramente significativa
a favor del B), y usted está encantado con el hallazgo. Pero... ¿cómo separó las ratas? Al azar,
naturalmente, metió la mano en la jaula y «al azar» separó una, después otra, y asi hasta
tener las 10. Ése fue el grupo A, y el que se quedó en la jaula fue el B. ¿Algo que objetar?
Pues sí. Si lo hizo de esa forma el reparto no fue aleatorio. Haciéndolo de esa forma (metiendo
la mano y sacando la primera que pille) tendrá tendencia a pillar a las más lentas, las que son
más débiles o tienen menos reflejos (las otras son las que se esconden antes), y ésas (el grupo
A) son las que han resultado ser más lentas. ¿Pero son más lentas por el efecto de la alimenta­
ción, o.ha salido así porque usted puso las más lentas en un grupo? No hay forma de saberlo.
Moraleja: es muy importante asegurarse de que el reparto en los grupos que se van a com­
parar se haga de forma totalmente aleatoria, echando mano de números, papelitos o lo que
sea necesario. Un error en este tema tiene difícil solución.

conclusiones. Es decir, hay que u tiliz a r la estadística. E l p ro b le m a n o es elem ental,


entre otras, p o r las siguientes razones:

1. E n la d u ra ció n de las pilas h a y v a ria b ilid a d , ta n to e n tre las caras c o m o entre


las baratas. N o se pu e d e n com parar una y una porque seguro que la d u ra ció n
será diferente (si lo m e d im o s con la p re cisió n adecuada) y eso n o quiere decir
que el tip o que ha d u ra d o más una vez siempre dure más.

2. Si cogemos una m uestra de pilas de cada tip o y com param os la d u ra c ió n m edia


de cada muestra, el hecho de que una m edia sea m a yo r que la o tra ta m p o co

134
¿ES MEJOR? ¿ES MAS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

garantiza nada. Si todas las pilas fu eran de la núsm a m arca y las divid ié ra m o s
en dos grupos, seguro de que la m edia de u n g ru p o n o sería id éntica a la del
o tro . H ace falta que la dife re n cia sea «estadísticamente significativa».

3. Las pilas tie n e n diferentes aplicaciones, co n diferentes ritm o s de descarga, y


puede ser que para algunas aplicaciones la d u ra c ió n sea ig u a l y para otras sea
diferente.

4. M e d ir la du ra ció n de las pilas n o es :facil. N o podem os estar to d o el día (¡y la


noche!) atentos a cuándo deja de fu n c io n a r u n aparato.

Se puede escoger u n tip o de aplicación y com parar la d u ra c ió n de una muestra


de pilas caras y o tra de baratas. Para u n r itm o de descarga c o m o el que ocasiona
una lin te rn a se p o d ría conectar una p ila a u n despertador (con agujas, n o va le n los
digitales) y a una b o m b illa (de lin te rn a ) de la fo rm a en la que se in d ic a en la fig u ra .
C uando la p ila se acaba se para el despertador y n ú ra n d o el tie m p o que ha estado
fu n cio n a n d o se puede saber el tie m p o que ha tardado la p ila en descargarse. H a y
que n ú ra r c o m o rrú n im o una vez cada 12 horas, pero en estas con d icio n e s las pilas
n o durarán m ucho.

E sq u e m a pa ra m e d ir la d u ra ció n d e u n a pila.

135
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

Para analizar los datos obte n id o s siem pre es recom endable em pezar representán­
dolos gráficam ente. E n u n caso c o m o éste, en el que se tendrá u n n ú m e ro re d u cid o
(p o r ejem plo, de 10 pilas de cada tip o ), bastará con representarlos en diagramas de
puntos y com parar. Puede ser que n o se aprecien diferencias, que se vean de fo rm a
clara, o que la situación sea dudosa. Los test estadísticos deberán c o n firm a r esa im ­
presión in ic ia l; no puede ser que gráficam ente parezca una cosa y que el test diga
la contraria.

• • •• • .1 • •
• •• — • • • •• N o se aprecian diferencias.



• •• • •• • •
La m edia del segundo g ru p o
•••

••


••

es m ayor que la del p rim e ro .


• • • •
• ••• •• N o está claro que la d iferencia
m
•• • • • •• • • sea significativa.

Tres p o s ib le s situ a cio n e s a n alizadas g rá fica m en te.

Para analizar datos o b te n id o s de esta m anera se puede a p lica r el test de la t de


S tu d e n t para muestras in d e pe n d ie n te s. C o n una h e rra m ie n ta de c á lc u lo com o el
p ro g ra m a E x c e l es m u y fá cil: ú n ica m e n te se tie n e que in d ic a r en qué lu g a r están
los datos, si se tra ta de u n test de una o de dos colas y qué va ria n te del test se
desea realizar.
L o de una o dos colas hace referencia a la hipótesis alternativa (la nula es que
no hay d ife re n cia ): si es que duran más las caras, que es lo razonable, la prueba es de
una sola cola; si la alte rn a tiva fuera que tie n e n duraciones distintas, la prueba sería
de dos colas.
R e specto al tip o de test hay que in d ic a r si se trata de datos apareados y, en el caso
de los que no lo sean, que es lo que sucede en nuestro ejem plo, si se puede considerar
que la va riabilidad es la m ism a en las dos situaciones. Si los datos tienen el aspecto
que se ve en los anteriores diagramas de p u n to s n o h a y pro blem a en co n sid era r que
la va ria b ilid a d es la m ism a. E n caso de duda se puede in d ic a r que no son iguales; el
resultado apenas cambia.
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

Dl --------—
=PRUEBA.T(A1:A10;B1:B10;1;2)
m A i B ' C
i 9,40 11,371 | 0,01545874|
2 10,56 9,911
3 8,24 10,87
4 9,48 10,52 1
s 17 i n
O b te n c ió n d e l p -v a lo r en un t e s t d e la t d e S t u d e n t c o n Excel.

E n el caso dudoso, el que co rre sp o nd e al te rc e r d iagram a de p u n to s , el test nos


dice que el p -v a lo r es de 0 ,0 2 (n o tie n e s e n tid o d a rlo c o n tantos decim ales c o m o
presenta E xce l) y, c o m o ya sabemos, esto s ig n ific a que si en p ro m e d io n o h u b ie ra
difere ncia en la d u ra c ió n de u n tip o de pilas u o tro , una d ife re n cia tan grande c o m o
la o b te n id a en la pru e b a realizada se daría p o r azar u n 2% de las veces.

¿Sirven las bolsas de agua para espantar las moscas?

C o lg a r bolsas transparentes de p lá s tic o llenas de agua es u n re m e d io casero para


a h u y e n ta r las moscas m u y p o p u la r (bu sca n d o en In te r n e t he v is to referencias
desde L a tin o a m é ric a hasta T a ila n d ia ). H a y personas que cre e n que sirve y otras
creen que no.
L o curioso es que las que sí lo creen, lo hacen p o r razones b ie n diversas: al­
gunos a rg u m e nta n que la lu z se d escom pone al atravesar la bolsa de agua y eso
d e so rie n ta a la mosca p o r el h e c h o de te n e r ojos com puestos. O tro s d ic e n que las
moscas e v ita n acercarse al agua p o rq u e saben que si se m o ja n n o pueden v o la r, y
ta m b ié n algunos o p in a n que son útiles p o r lo c o n tra rio : se co lo c a n en las tiendas
para atraer a las moscas y que n o m o le ste n al p ú b lic o .
¿Sirve o n o sirve? Sin e n tra r en los p o rq u é s de las cosas, la ú n ica fo rm a de
responder a esta p reg u n ta es re c o g e r datos en u n e x p e rim e n to b ie n diseñado y v e r
qué conclusiones se pueden e x tra e r. N o es fá c il, es ve rd a d . La idea sería c o n ta r las
moscas que hay en u n espacio con bolsas y sin bolsas. U n o s días habría que p o n e r
las bolsas y otros n o (al azar) y c o n ta r cuántas h a y cada día.
Pero c o n ta r moscas n o es fá c il, a u n q u e la te c n o lo g ía puede ayudar: algunas
cámaras fo tográficas se pueden p ro g ra m a r para que hagan fo to s cada c ie rto tie m p o
y q uizá co n una bue n a cám ara y co n fo n d o b la n co se p u e d e n i r h a cie n d o fo to s
y después c o n ta r cuántas moscas había en cada m o m e n to . E n el caso de que éste
fu e ra u n m é to d o v ia b le , tie n e el in c o n v e n ie n te de que n o d is tin g u e si las moscas

137
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS

son siem pre las m ismas o si se van renovando. O tra fo rm a de c o n ta r de m anera


in d ire c ta cuántas moscas m e ro d e a n p o r la zona p o d ría ser u tiliz a r esas tiras pegajosas
donde las moscas se quedan pegadas ...
S eguram ente al le c to r se le o c u rrirá n otras form as. L o c ie rto es que si n o se
recogen datos en u n e x p e rim e n to b ie n diseñado n o se sabrá si las bolsas son o n o
son útiles.
B ib lio g r a fía

B e h a r , R . y GRIMA, P., 5 5 R e s p u e s t a s a p r e g u n t a s típ ica s d e e sta d ís tic a , M a d rid , D íaz


de Santos, 2004.
B l a s t l a n d , M.y D i l n o t , A . , E l tigre q u e n o e s tá . U n p a s e o p o r la j u n g l a d e la e s ta d ístic a ,

M a d rid , Ed. T u rn e r, 2009.


G ^ ^ ^ , P. (e d ito r), E s t a d ís t ic a e n a c c ió n , p u b lic a d o p o r la Facultad de M atem áticas y
Estadística de la U n iv e rs id a d P o lité cn ica de C ataluña. Se puede descargar g ra tu i­
tam ente en: h ttp ://u p c o m m o n s .u p c .e d u /e -p rin ts /h a n d le /2 1 1 7 /7 8 1 O.
P a u l o s , J . A . , E l h o m b re a n u m é r ic o , c o le c c ió n M etatem as, Barcelona,Tusquets, 1990.
P e ñ a , D., F u n d a m e n t o s d e e sta d ís tic a , M a d rid , A lianza, 2001.
S a l s b u r g , D ., T h e L A d y T a s tin g T e a . H o w S t a tis tic s R e v o l u t i o n i z e d S c íe n c e i n th e T w e n t ie t h

C en tu ry , N u e v a Y o rk , W .H . Freeman, 2001.
T a n j r , J . M . e t A L . , L A e s ta d ís tic a : u n a g u ía d e lo d e s c o n o c id o , M a d rid , A lianza, 1989.

139
Ín d ic e a n a lític o

aleatoriedad 9 2 -9 8 d is trib u c ió n
aleatorización 127-130 b in o m ia l 5 5 -5 8 , 86
aspirina 117 c h i-cu a d ra d o 113
e in fa rto 123-12 5 de Poisson 58-61
y d u ra ció n flores 132-133 de referencia 113
n o rm a l 23, 53, 6 1 -6 8 , 8 4 ,1 1 3
B ehar, R . 10, 90 doble ciego 1 20-121, 124
b lo q u e o 127-130
bolsas de agua 137-138 elecciones presidenciales
B u ffo n , conde de 49 en Estados U n id o s 38, 93
escaños 100
campana de Gauss 53, 6 1 -6 7 , 110 estim ación 68, 7 5 -8 7 , 93, 98, 100
catadora de té 102-1 0 3 , 10 8 -1 0 9 p u n tu a l 86
C h a lle n g e r 40
coe ficie nte falsos positivos 6 8 -6 9
de co rre la ció n 1 0 5 -1 1 O F erm at, P. 4 6 -4 7
de v a ria c ió n 23 Fisher, R .A . 1 0 1 -1 0 4 , 110, 113, 114,
cólera en Londres 11-15 126
contraste de hipótesis 50, 1 0 1 -1 1 6
c o n tro l p o r placebo 12 0 -1 2 2 G a lile o 4 3 -4 4 , 48
correlación 106, 109 G a lto n , F. 53
cuartiles 2 3 -2 4 G allup, G. 93
cuchara para catar la sopa 90, 92 Gauss, F. 6 1 -6 3
cu ch a rilla en el cava 131 goles en la lig a española 58-61
cum pleaños 6 9 -7 2 Gosset,W.S. 129
g ru p o de c o n tro l 119-122
dados equilibrados 50, 111-113
desviación típ ica 19 -2 3 , 3 9 ,6 5 -6 7 hipótesis
diagram a 60, 64 alternativa 109, 136
de puntos 31, 137 nula 1 0 9 -1 1 5 , 122
de ta llo y hojas 32, 33 histogram a 2 9 -3 2 , 35, 61, 64, 84, 108,
diferencia sig nificativa 121, 126, 128, 112
134-136

141
In d ic e a n a l ít ic o

indecisos 9 9 -1 0 0 porcentajes 2 5 -2 7
p ro b a b ilid a d 4 3 -7 3 , 75, 86, 115, 124,
K e r r ic h J . 48 129
p -v a lo r 109, 1 14-116, 122, 136-137
L a n d o n ,A . 93
ley de S tig le r 63 Q u e te le t, A. 62
lo te ría P rim itiv a 55, 67, 68, 7 1 ,7 2 -7 3 , qum cunx 53
84
rango 19
m argen de e rro r 33, 75, 8 6 -9 2 , 95, regla d e la «o» 5 1 ,5 4
100 regla de la «y» 5 1 ,5 2 , 132
m edia a ritm é tica 15-16, 39 R o o se velt, F.D. 93, 118
m ediana 17, 23-25
m e ló n , ¿está en su punto? 132 sal en la sopa 90
M e n d e l, G. 114 Salsburg, D . 103
M é ré , caballero de 46 separar ratas 134
m oda 17-19 S m ith , H . 103
m uertos p o r c o z de caballo 58-61 Snow,J. 11-15
muestra 16, 22, 64, 7 5 -7 7 , 8 1 ,8 7 -9 9 , sondeos electorales 45, 93, 9 8 -1 0 0
1 2 2 ,1 3 4 -1 3 6 sorteo en el se rvicio m ilita r 9 4 -9 5
Stigler, S. 63
N ig h tin g a le , F. 18 S tudent 1 28-130, 136, 137
n ive l de confianza 75, 8 6 -8 9 , 91, 92,
95 tabaco y cáncer de p u lm ó n 125-127
tam año de muestra 8 7 -9 2
paradoja de S im pson 2 6 -2 7 taxis en una ciudad 8 0 -8 3
Pascal, B. 46-4 7
Pearson, K . 49, 110, 113 vacuna de la p o lio m ie litis 117-123,
peces en un lago 7 6 -8 0 126, 127
percentiles 2 4 -2 5 varianza 1 9 -22
pesca y repesca 76
pilas (d u ra ció n de) 133-137 W o lf, R . 49
p o b la ció n 2 1 -2 2 , 7 5 -7 6 , 81, 83, 9 0 -9 2
Poisson, S. 58 zurdos 91
L a c e r t e z a a b s o l u t a

y o t r a s f i c c i o n e s

L o s s e c r e t o s d e la e s t a d í s t i c a

La estadística ha sido descrita como la práctica de "torturar


a los números para que confiesen". Esta suspicacia posiblemente
se deba a que la estadística parte de la convicción de que
"cierto" significa poco más que "altamente probable". Con
todo, es sin duda la rama más importante de la matemática
aplicada, y constituye nuestra mejor guía para tomar decisiones
correctas cuando nos enfrentamos a la incertidumbre, es decir,
casi siempre.

También podría gustarte