Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La certeza absoluta
y otras ficciones
Los secreto s de la estad ística
Pere G rim a
E i mundo es matemático
L
I
•i
*
1*Í
i
g a n z1 9 1 2
La certeza absoluta
y otras ficciones
Los se cre to s de la e stad ística
P e re G rim a
EL muwA o es wutóemático
g an z1912
A A licia y Pau
Realización: E D I T E C
Diseño cubierta: Lloreng Martí
Créditos fotográficos: age fotostock
ISBN:978-84-473-6962-1
Depósito legal: NA-1082-2011
https://tinyurl.com/y794dggv
https://tinyurl.com/y9malmmm
Sumario
Prefacio ..................................................................................................................... 9
Capítulo 1. Estadística descriptiva: cómo sacar la información
relevante de una maraña de datos .............................................................. 11
Preludio histórico: la gran epidemia de cólera de 1854 .................................... 11
A la caza del criminal ........................................................................................ 12
La fuerza de un gráfico......................................................................................... 13
Resumiendo los datos (1): medidas de tendencia central ................................. 15
La media aritmética ............................................................................................... 15
La mediana .............................................................................................................. 17
M o d a ........................................................................................................................ 17
Resumiendo los datos (2): medidas de dispersión ................................................. 19
R a n g o ...................................................................................................................... 19
Varianza y desviación típica................................................................................. 19
Coeficiente de variación ...................................................................................... 21
Resumiendo los datos (y 3): medidas de posición ............................................. 23
C uartiles.................................................................................................................. 23
Percentiles ............................................................................................................ 24
Porcentajes: parecen inofensivos pero son peligrosos ......................................... 26
Cuestiones generales .......................................................................................... 26
N o es lo que parece: la paradoja de Sim pson................................................... 27
Representaciones gráficas de una variable........................................................... 28
Representaciones de la relación entre dos variables .......................................... 36
Atención: las escalas pueden engañar....................................................................... 39
5
SUMARIO
6
SUMARIO
7
!
Prefacio
La estadística es una disciplina que suena familiar. Estamos acostumbrados a oír ha
blar de ella en los medios de comunicación: un estudio (estadístico, claro) dice que
baja el consumo de tal sustancia entre los jóvenes, los resultados de una encuesta
afirman que tal político está mejor valorado que tal otro, o que si hoy se hicieran
las elecciones ganaría tal partido con tantos puntos de ventaja. Hasta en los partidos
de fútbol se comenta que las estadísticas dicen, por ejemplo, que tal equipo marca
más goles en la segunda parte. Curiosamente, aunque hablamos de estadística para
referirnos a esta- disciplina, las «estadísticas» en plural son simplemente datos. Qué
información se puede sacar de los datos y cuál es el grado de fiabilidad de esa in
formación (eso es «estadística» en singular) no siempre son cuestiones evidentes.
A veces la estadística también se considera un terreno poco serio. Que diga algo
no quiere decir que ocurra, y es muy posible que ese equipo de fútbol que siempre
marca en la segunda parte esta vez no marque ningún gol. En esto contrasta con las
matemáticas, que tienen una imagen mucho más seria. Si un equipo es «matemá
ticamente campeón», será campeón, pase lo que pase. A esta imagen de algo poco
sólido seguramente también ayuda la perplejidad que crea esa habilidad que tienen
los políticos para presentar datos y estadísticas de forma que siempre avalen sus
teorías o sus intereses.
Pero hay mucho más que todo eso. La estadística está presente en muchos ám
bitos: en la investigación médica (¿es mejor un nuevo fármaco?), en la biología
(¿cuántos ejemplares de cierta especie hay en un territorio?, ¿están en peligro de
extinción?), cuando es necesario realizar previsiones (¿cuánta electricidad se gastará
mañana?), en los estudios de mercado (¿qué tipo de envase gustará más al consu
midor?), en los estudios sociológicos (¿qué piensan los jóvenes sobre tal tema?), en
economía (¿cuánto han aumentado los precios?), en los estudios de fiabilidad indus
trial (¿cada cuánto conviene revisar las piezas de un avión?) o en la gestión de la ca
lidad en las empresas (¿en qué problema conviene concentrar los esfuerzos?). Quizás
esta lista haya salido demasiado larga, pero no es en absoluto exhaustiva: hay muchas
áreas en las que la estadística es fundamental para avanzar en el conocimiento.
La estadística estudia cómo recoger datos (¿cuántos?, ¿de qué forma?) y cómo
analizarlos para obtener la información que perifúta responder a las preguntas que
nos planteamos. Se trata de avanzar en el conocimiento a partir de la observación
y el análisis de la realidad, de una forma inteligente y objetiva. Es la esencia del
método científico.
9
PREFACIO
Este texto hace un recorrido por algunos de los aspectos más interesantes de la
estadística, desde cómo presentar la información mediante gráficos y cómo evitar
que nos metan goles -por seguir con el símil futbolístico- cuando nos los presentan,
hasta cómo planificar la recogida de datos para responder a las preguntas planteadas,
pasando por encuestas, sondeos electorales y la forma de razonar que se encuentra
en todos los tests estadísticos. Tampoco falta una incursión en el cálculo de proba
bilidades, un tema que quizá para muchos pueda parecer árido y difícil pero que sin
necesidad de entrar en grandes profundidades permite descubrir cuestiones muy
interesantes.
La intención es que la lectura resulte entretenida y formativa. Si en algo lo he
conseguido ha sido gracias a lo que he aprendido de mis compañeros en la Uni
versidad Politécnica de Cataluña y de profesores apasionados con la enseñanza de
la estadística como Roberto Behar, de la Universidad delValle en Cali, Colombia.
Finalmente, deseo agradecer a Pedro Delicado, Lluis Marco, Lourdes Rodero y X a
vier Tort-Martorell una detallada lectura de la primera versión de este texto y sus
atinados comentarios y sugerencias que han permitido introducir notables mejoras.
10
Capítulo 1
Estadística descriptiva:
cómo sacar la información
relevante de una maraña
de datos
¿Qué hacer cuando nos encontramos ante un gran conjunto de datos de los que se
pretende extraer alguna información? Sin duda alguna, la primera acción recomen
dada es «echarles un vistazo», pero no mirándolos tal cual uno detrás de otro -nuestra
mente está poco capacitada para captar información de esa forma-, sino a través de
representaciones gráficas o resumiendo los datos en unos pocos valores que, esos sí,
se pueden mirar e interpretar directamente.
11
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
de 500. Más de tres cuartas partes de la población abandonó sus casas para escapar
así de los vapores malsanos que se creía que era el medio por el que se propagaba
la terrible enfermedad.
John Snow, médico eminente que un año antes había administrado personalmente
cloroformo a la reinaVictoria en ocasión de su séptimo parto, no opinaba lo mismo.
En un texto escrito en 1849 arguyó que el cólera no se transmitía por el aire sino
por el agua. La comunidad médica prestó poca ateneión a sus argumentos, en buena
parte porque no se apoyaban en ninguna teoría concreta acerca de qué era exacta
mente lo que el agua podía contener que causara la enfermedad. Las convicciones
de Snow se basaban, por el contrario, en un auténtico arsenal de observaciones en
las que se establecía una conexión inexorable entre el líquido elemento y la transmi
sión del cólera. Se trataba de una evidencia de tipo «meramente» estadístico, de una
relación entre una causa y un efecto para la que, como se ha dicho, Snow no disponía
de explicación. A pesar de ello, tan convincentes fueron las observaciones de Snow, y
tan bien supo exponerlas, que sus contemporáneos no tuvieron más remedio que
aceptar sus tesis y, al hacerlo, la forma en la que las ciudades modernas proveen de
agua a su población inició una transformación radical.
«Al estudiar la zona, hallé que casi todas las muertes habían tenido lugar a poca
distancia de la fuente de la calle Broad. Sólo diez de las muertes se produjeron
en casas cuya fuente de agua más próxima no fuera aquélla. En cinco de esos
casos, la familia me comentó que preferían el agua de la fuente de Broad a
la de la que tenían más cerca, y en otros tres descubrí que las víctimas, unos
niños, pasaban por la fuente de camino a la escuela».
12
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
L a fu e rz a d e u n g rá fic o
13
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Fragmento del mapa de la zona del Soho donde estalló la epidemia de cólera de 1854.
La fuente de la calle Broad se indica por medio de la leyenda «Pump», en el centro del mapa.
Las rayas horizontales indican las víctimas de cada vivienda.
Al señalizar cada víctima con una marca individualizada -las barras paralelas—,
asignar el mismo peso visual a cada una de ellas y situarlas, vivienda a vivienda,
sobre un mapa convencional, se hace evidente de un único vistazo el componen
te geográfico de la epidemia. Resulta obvio que la mayor parte de las muertes se
acumulan alrededor de la fuente («pump») de la calle Broad, en el centro del mapa.
Si se completa esta información con el celoso trabajo de campo llevado a cabo por
Snow, la tesis de que el contagio de la enfermedad estaba directamente relacionado
con la fuente no requería de ninguna teoría específica sobre la naturaleza de dicha
relación. Las autoridades locales así lo entendieron, y el resultado de desmantelar la
fuente fue no sólo la erradicación de esa epidemia puntual sino la constatación de
que el cólera podía transmitirse por un medio acuoso. Los experimentos llevados
14
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
a cabo por Louis Pasteur entre 1860 y 1864 serían clave a la hora de consolidar la
teoría de los gérmenes o agentes patógenos, y otorgaron así cobijo teórico postfacto
a las observaciones de Snow. En 1885 el alemán R obert Koch identificó la bacteria
Vibro cholerae como la causante de la enfermedad, y hacia finales de siglo buena parte
de las urbes occidentales habían renovado sus redes de suministro de agua potable,
alejando así el fantasma del cólera de las calles de medio mundo.
La media aritmética
15
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
rtjXj +M,X,
» , + »2
También hay casos en los que la media no es la medida más adecuada. Si se trata
de resumir el tiempo que un proveedor tarda en suministrar un producto, o lo que
tarda un tren entre dos poblaciones, la media es un mal indicador de la calidad del
servicio. Puede ser que el plazo de entrega pactado sea de 10 días y la mitad de las
veces entreguen el material en 2 (el cliente no lo espera, no le cabe en el almacén,
etc.) y la otra mitad en 18 (el cliente ya está desesperado), pero en promedio se está
cumpliendo perfectamente. Lo mismo ocurre con el tren: llegar unos días media
hora antes al trabajo (especialmente si no podemos entrar antes de la hora prevista)
no compensa el que otros días lleguemos media hora tarde. En estos casos, una
medida más informativa sería el porcentaje de veces que se llega tarde o con más
de un cierto retraso.
Otro problema que tiene la media es que es muy influenciable por valores ex
tremos. Seguramente causará extrañeza saber que la mayoría de las personas tiene
un número de piernas superior a la media, pero esto es así, ya que algunas tienen
sólo una o ninguna (valores extremos), y eso hace que la media esté ligeramente
por debajo de dos.
16
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
La mediana
La mediana es el valor que queda en el centro al ordenar los datos de menor a ma
yor. Si los datos son: 6, 7, 5, 2 y 9, la mediana es 6 (el que queda en el centro una
vez ordenados). Si el número de datos es par, ninguno queda en el centro, y en este
caso la mediana es el promedio de los dos centrales. Sus propiedades cubren algunos
flancos débiles de la media. Así, es más robusta frente a la presencia de anomalías. Un
ejemplo muy simple: en los datos anteriores la media es 5,8 y la mediana es 6. Si al
introducirlos en el ordenador nos equivocamos y en lugar del 9 introducimos 99, la
media pasa a ser 23,8, mientras que la mediana sigue siendo 6. Cuando se trabaja con
datos todavía no depurados, fijarse en la mediana puede ser más recomendable que
hacerlo en la media, ya que la información que proporciona está menos afectada por
las posibles anomalías que puedan existir.
Otra de las ventajas de la mediana frente a la media es que, atendiendo a su
propia definición, la mediana deja un 50% de las observaciones por encima y otro
50% por debajo.
Si queremos saber, por ejemplo, si en nuestra empresa estamos entre los que
cobran más o entre los que cobran menos, debemos comparar nuestro salario con
la mediana, y no con la media. Si únicamente hay 10 trabajadores y los salarios son
(pongamos que en miles de euros): 0,8, 0,8, 0,9, 0,9, 1,0, 1,0, 1,1, 1,1, 1,2 y 10, todos
menos 1 (en este caso el 90%) están por debajo de la media, que es 1,88. Esto no
pasa nunca con la mediana: si estamos por encima de la mediana, estamos con el
50 % de los que más cobran.
Otro ejemplo. Si un examen se aprueba sacando una nota igual o superior a 5 y
la nota media que ^rn sacado los estudiantes es de 5, no sabemos qué proporción ha
aprobado. Si se han exanunado 50 estudiantes, puede ser que 41 hayan suspendido
con un 4; que 8 hayan sacado un 10 y que 1 haya obtenido un 6. Esto da media 5,
aunque es verdad que son unas notas muy raras. Si la mediana es 5, seguro que la
mitad ha aprobado.
Moda
17
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
FLORENCE NIGHTINGALE
18
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
que la moda del color de los ojos es el castaño. N o hay más. Seguramente la razón de
la presencia de la moda en este contexto se debe más a la tradición que a su utilidad.
Rango
El rango es la diferencia entre los valores máximo y mínimo. Por ejemplo, si los datos
son 2, 6, 7, 12, 12, 18, el rango es 18 —2 = 16. Tiene la ventaja de ser una medida
muy sencilla, pero el inconveniente de que no aprovecha bien la información que
contienen los datos. Utilizar sólo los extremos, que además pueden ser raros, es muy
pobre, especialmente si el conjunto de datos es grande. Si tenemos pocos datos (del
orden de 4 o 5) el rango no es una medida tan mala. Si tenemos sólo dos es tan
buena como cualquier otra, pero en este caso seguramente ya no hace falta resumir.
19
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Si tuviéramos que diseñar una medida de dispersión, la primera idea sería hacer
participar a todos los datos que tenemos, como en el caso de la media. Por ejemplo,
si los datos son 1,2, 4, 7 y 9 podemos calcular el promedio de las distancias de cada
valor respecto a la media, que es 4,6:
(1-4 ,6 ) + (2 -4 ,6 ) + (4 -4 ,6 ) + (7 -4 ,6 ) + (9 -4 ,6 ) _ Q
5 _ '
El problema de esta medida es que siempre da cero, sean cuales sean los valores
considerados y, por lo tanto, no mide nada (da el mismo valor haya mucha o poca
dispersión). La solución más inmediata es utilizar el valor absoluto de las diferencias:
|1 - 4 ,6 |+ |2 - 4 ,6 |+ |4 - 4 ,6 |+ |7 - 4 ,6 | + |9-4,6|
2,72.
5
Esa medida se llama «desviación media» y es una buena medida (a mayor disper
sión de los datos mayor valor obtenido), pero tiene unas propiedades mucho más
interesantes el valor que resulta resolviendo el problema de que las diferencias se
compensen a base de elevarlas al cuadrado:
(1 -4 ,6 )2 + ( 2 - 4 ,6 ) 2+ (4 - 4 ,6 ) 2 + (7 ~ 4 ,6 )2 + (9 - 4 ,6 )2
_ 9,04.
5
0,6
. 2,6 _ 2 ,4 „
3,6 4,4
1 I I I I 1 I I I I 1 1 I I 1 1 I I I I
»
1 I I 1 1 1 1 1 I I 1 1 1 1 1
1»
I 1 1 1 | 1 1 1
A|
1 1 1 1 1 |
0 1 2 3 4 5 6 7 8 9 10
4, 6
20
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Esto es lo que llamamos varianza, y no sólo sirve para medir la dispersión, sino
que también se encuentra en el meollo de gran parte de la teoría y de los métodos
estadísticos. Se designa como G2^El inconveniente de la varianza es que sus unidades
son las de los datos elevados al cuadrado. Si se trata de longitudes medidas en me
tros, las unidades de la varianza son metros al cuadrado y esto complica un poco la
interpretación. La solución es muy sencilla, se hace la raíz cuadrada y asunto resuelto.
A este resultado, que designamos como O", se le llama desviación típica, y es
la medida de dispersión por excelencia. Muchas veces la desviación típica hace
pareja con la media para encargarse, sólo ellas dos, de resumir las características
de los datos.
UN POCO DE FORMULACIÓN
E n j
a = — —'-----,
N
donde x¡ representa cada uno de los valores que se tienen; ^, su media, y N es el número de
valores. La fórmula correspondiente a la desviación típica es:
<7=
Coeficiente de variación
¿Qué tiene más variabilidad: el peso de los gatos o el de las vacas? Supongamos que
el peso medio de los gatos es de 4 kg y que en el 95% de los casos está entre 3 y 5
kg, y que las vacas de cierto tipo tienen un peso entre 480 y 500 kg, también en el
95% de los casos. Si usted observara un conjunto de gatos vería mucha variabilidad
entre ellos (algunos pesan casi el doble que otros), mientras que las vacas las vería
casi todas iguales.
Sin embargo, la desviación típica del peso de los gatos estará en torno a 0,5 kg
(de acuerdo con el patrón de variabilidad de los pesos, el 95% de los individuos
está en el intervalo media ± dos desviaciones típicas, lo que se verá en el capítulo
siguiente al tratar la distribución normal), mientras que en el caso de las vacas es de
5 kg, 1O veces más, aunque veamos menos variabilidad.
21
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
CV = - .
x
resumir la información que contienen unos datos, podemos encontrarnos en una de las siguientes
situaciones:
1. Los datos que tenemos son el objeto de nuestro interés. Queremos saber la media o la desvia
ción típica de esos datos, que constituyen lo que denominamos «población».
2. Los datos que tenemos son una muestra de la población objeto de estudio. Es decir, lo que nos
interesa no es tanto conocer la media o la desviación típica de los datos que tenemos como
estimar («hacernos una idea») de esos valores en la población.
misma, ya que el mejor estimador para la media de la población es la media de una muestra. Es
necesario, como siempre que queremos sacar conclusiones sobre la población a través de una
S2 = I > ,-X )- _
n -1
¿Por qué? El problema reside en que cuando se trabaja con muestras, la variabilidad se calcula
en torno a la media de la propia muestra (no en torno a la media de la población, que es lo que
22
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Cuartiles
Ordenados los datos de menor a mayor, la mediana es el que los separa en dos mi
tades. El primer cuartil es la mediana de la primera mitad dejando, por lo tanto, el*4
realmente interesa). Podría decirse que la media de la muestra se adapta a los propios datos de la
muestra y esto tiende a minusvalorar la variabilidad de la población. Al dividir por n -1 se obtiene
un valor ligeramente mayor que estima mejor la varianza de la población. Es distinto dividir por
4 que por 3, pero no hay mucha diferencia entre dividir por 100 o por 99. A efectos prácticos,
cuando la muestra es grande, estas disquisiciones dejan de tener relevancia.
No se preocupe si esto le parece un llo y no lo acaba de entender. Siga sin remordimientos y si
alguna vez tiene que elegir, considere que tiene una muestra (fórmula que divide por n -1 ).
Si utiliza algún tipo de software estadístico que no le pregunta, esto será lo que está haciendo.
23
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
25% de valores por debajo y el 75% por encima. La mediana de la segunda mitad es
el tercer cuartil, que deja el 75% por debajo y el 25% por encima.
Menor----- ► 50
52
57
58
59
25%
60
61
• Q1 =61: Primer cuartil.
61
64
Datos ordenados de 75%
68
menor a mayor. 69 50%
71
72
73
t
Me = 75,5: Mediana.
78
78
80
81
i
50%
82
82 75%
84
• Q3 = 86: Tercer cuartil.
90
92
93 25%
94
95
Esquema de obtención de la mediana y los
98
cuartiles en un conjunto de 30 datos.
Mayor *• 100
Percentiles
El percentil del 15% es el valor que -con todos los datos ordenados- deja por debajo
el 15% y, evidentemente, el 85% por encima. Los cuartiles son los percentiles del 25
y del 75% y la mediana, el más singular, es el del 50%.
Retom ando el ejemplo de los salarios, si el suyo está en el percentil del 70%
significa que el 70% cobran menos que usted (o que el 30% cobran más, si prefiere
24
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
ver el vaso medio vacío).También se usan los percentiles para medir los resultados de
los tests de inteligencia. Si usted está en el percentil del 90% significa que la habilidad
que mide el test la tienen peor que usted el 90% de la población a la que va dirigido.
Muchas personas tienen su primer contacto con los percentiles cuando el pediatra
de su hijo les dice que la estatura del niño está en el percentil del -digam os- 45%.
Esto significa que el 45% de los niños (las referencias son distintas para niños y niñas)
de su edad miden menos que él. La Organización Mundial de la Salud edita tablas y
gráficos de referencia sobre el crecimiento para distintos segien tos de edad.
25
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Cuestiones generales
26
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
C u a n d o se d a n p o rc e n ta je s g lo b a le s c o m p a r a n d o g ru p o s q u e a su v e z c o n tie n e n
v a ria s p a r te s, p u e d e p a r e c e r q u e o c u r r e u n a c o sa c u a n d o en re a lid a d está o c u
r r ie n d o o tra . Este fe n ó m e n o se c o n o c e c o n el n o m b r e d e p a r a d o ja d e S im p s o n .
V e a m o s un e je m p lo .
U n a gran c o m p a ñ ía ab re u n a n ueva fá b rica crean d o 2 5 0 p u e sto s d e trab ajo en los
d e p a rta m e n to s d e co m p ra s, m o n ta je y alm a cé n . En total se p resen tan 3 5 5 h o m b re s
y 3 2 5 m u je res, de los cu ales so n a d m itid o s 1 9 0 h o m b re s (el 5 3 ,5 % ) y 6 0 m u je re s (el
18 ,5 % ). S e c o m p r u e b a q u e el nivel de p rep aració n d e h o m b re s y m u je re s es sim ilar
en tre los asp iran tes a cad a d e p a rta m e n to . ¿P o d e m o s ase g u ra r q u e se h a d isc rim in a d o
a las m u je res? L a resp u esta es no. L o s d a to s so n lo s sigu ien tes:
Compras 30 25 100 5 25 20 25
27
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
28
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
El peso debe ser de 220 ± 10 gramos y supondremos que estos datos son repre
sentativos de la producción general. Las preguntas que nos planteamos son: ¿existe
algún problema?, ¿qué está pasando?, ¿qué hay que hacer para resolver el problema,
si es que existe?
Si usted intenta sacar conclusiones simplemente mirando los datos es posible que
se equivoque.Aunque en este caso sólo hay 160 valores, intentar sacar conclusiones «a
ojo» siempre es arriesgado.Tampoco es necesario empezar haciendo grandes cálculos
o aplicando técnicas sofisticadas; basta con representar los datos gráficamente, como
puede ver a continuación.
Tolerancia Tolerancia
Pesos
Histograma de los pesos de 160 barras de pan.
29
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Pesos Pesos
Operario A Operario B
Frecuencia
Pesos Pesos
21,1 17,8 19,7 18,6 16,8 21,7 28,7 20,1 19,5 17,8
un simple diagrama de puntos pone de manifiesto detalles que pueden pasar desa
percibidos al mirar los datos. En este caso existe un valor bastante separado del resto
y sería conveniente analizar a qué se debe esta desviación (quizás es un error de
tecleado y debería ser 18,7 en lugar de 28,7).Estas cuestiones son importantes, ya que
trabajar con datos erróneos puede dar al traste con el estudio que se esté realizando.
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
30
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Cuando se desea tener en cuenta el orden en el que se han tomado los datos,
los histogramas o los diagramas de puntos no sirven. Lo que se hace es represen
tarlos en un diagrama de serie temporal como el de la figura siguiente, que pone
de manifiesto el crecimiento de la estatura media de los españoles a lo largo del
siglo xx. Por supuesto, no se pueden hacer extrapolaciones a la vista de este tipo
de gráficos: no está nada claro que midamos 2,70 metros dentro de 1.000 años, si
es que llegamos.
Año de nacimiento
Además de los gráficos típicos como los que acabamos de ver, y los diagramas
de pastel y similares, también se pueden utilizar otros menos conocidos, como los
diagramas de tallo y hojas.
Veamos un caso práctico. En una clase de 92 estudiantes se pidió a los alumnos
que se tomaran las pulsaciones durante un minuto y el histograma de la página
siguiente representa los valores obtenidos (todos los datos utilizados en este ejem
plo forman parte de uno de los archivos que incorpora el paquete de software
estadístico Minitab).
31
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Tallo Hojas
4 8
5 4 4
5 8 8 8
6 0 0 0 0 1 2 2 2 2 2 2 2 2 2 4 4 4 4
6 6 6 6 6 6 8 8 8 8 8 8 8 8 8 8 8
7 0 0 0 0 0 0 2 2 2 2 2 2 4 4 4 4 4
7 6 6 6 6 6 8 8 8 8 8
8 0 0 0 2 2 2 4 4 4 4
8 6 7 8 8 8
9 0 0 0 0 2 2 4
9 6 6
10 o
Histograma y diagrama de tallo y hojas de las pulsaciones por minuto de 92 estudiantes.
32
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
2. El diagrama de tallo y hojas permite observar detalles que de otra forma pa
sarían desapercibidos. Por ejemplo, no es razonable pensar que los estudiantes
del ejemplo estuvieron tomándose el pulso durante un minuto. Si así fuera,
aproximadamente la mitad serían pares y la otra lita d , impares, pero lo que
observamos es que casi todos son pares, lo cual significa que contaron durante
30 o 15 segundos y multiplicaron por 2 o por 4, y el resultado obtenido de esta
forma tiene un margen de error mayor que si se hubiera contado realmente
durante un minuto.
■"Barcelona ■ - SporMng
Sin embargo, lo habitual cuando hay que hacer algún gráfico es usar un programa
de ordenador, ya sean paquetes específicos de software estadístico, hojas de cálculo
o procesadores de texto.
El procesador de texto que se ha usado para redactar este libro permite crear e
insertar gráficos fácilmente. De esta manera, se pueden elegir gráficos espectaculares
en tres dimensiones o simplemente gráficos «planos», entre otras opciones. Debe
tenerse en cuenta que, en general, los gráficos en tres dimensiones son más vistosos
pero menos claros.
Escoja uno u otro tipo según le convenga, y cuando se los enseñen ya sabrá lo
que ha preferido quien se los muestre.
33
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
A B C D
34
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Máquina 1
Pesos
Pesos
35
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
120
110 ■
••
100 ■
90 ■ , t
Audi AS
80 ■ 4.2 Tdi
1
( j 70 ■
o
"O
60 e e Mercedes
E-Class 420
l 50 * CDI
Oh
> 40 ■
O _ — Citroen Cs V6 ^HDI
30
.'JÜ
• —— Mazda 3 2.2 CRTD Sportive
20
Hyundai Accent 1.5 VGT
10 ■
o
50 100 150 200 250 300 350
cv
Relación entre precio y potencia de un conjunto de 449 coches con motor diésel
(fuente: Página web del Real Automóvil Club de España, 10 de noviembre 2009,
buscador de coches nuevos: turismo-berlina, diesel y 4 puertas).
Que se observe una estrecha relación entre variables no implica que exista necesaria
mente una relación causa-efecto entre ellas. Por ejemplo, si se realiza un gráfico de este
tipo relacionando los daños que causan los incendios con el número de bomberos que
acuden a apagarlos,seguramente se observará ^una estrecha relación entre ellas: a <^ños,
más bomberos, pero esto no significa que sean los bomberos los que causan los daños.
Otro ejemplo: los escolares que tienen los pies más grandes cometen menos faltas de
ortografía que los que los tienen pequeños. ¿No se lo cree? Sí, los niños mayores tienen
36
ESTADISTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
los pies más grandes y hacen menos faltas de ortografía. En los dos casos existe una
tercera variable que es la que mantiene la relación causa-efecto con las dos que se ana
lizan. En el primer caso era la magnitud del incendio, y en el segundo, la edad del niño.
Pero hay casos en los que no está tan claro. El 28 de diciembre de 1994 el diario
T ie New York Times publicó un artículo sobre los posibles efectos para la salud del
consumo moderado de vino e incluía una tabla con el consumo medio y la tasa de
fallecimientos por enfermedades cardiacas en un conjunto de 21 países. A continua
ción tenemos una representación gráfica de estos datos:
350 - -
-s
Irlanda
o 300 . . Finlandia
o • Reino Unido
o
o • Nueva Zelanda
o
250 Noruega
o
Islandia suecia•Dinamarca
u 200 •Australia
Estados Unidos • Canadá
• Alemania (RF)
u 1 Austria
¡ j 150 Holanda
¡ cju
Bélgica Suiza Italia
,uJ 100 España
tí
cu Francia
50
0
0 1 2 3 4 5 6 7 8 ~9~ 10
Consumo de vino (en litros de alcohol por persona y año)
Se observa que los países más consumidores de vino tienen una menor tasa de
muertes por enfermedades cardiacas. Pero como se ha comentado, esto no implica
que entre las dos variables haya necesariamente una relación de causa-efecto. Este
gráfico no nos dice que si bebemos más vino (dentro de lo razonable, ya se entiende)
tendremos menos riesgo de padecer una enfermedad cardiaca. Los países más con
sumidores de vino son también los mayores productores, y donde se produce vino
hay un clima, unos hábitos alimenticios, unas costumbres... que podrían ser la causa
37
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
Las elecciones a la presidencia de los Estados Unidos del año 2000 con el demócrata Al Gore
frente al republicano George Bush tuvieron un resultado muy ajustado y también muy discutido.
En el Estado de Florida, con unos 6 millones de electores, Bush ganó por 537 votos de diferencia,
y quien ganaba en ese Estado tenla la mayon'a necesaria para ser presidente. Hubo impugnacio
nes y los jueces tuvieron que decidir. Sin entrar en consideraciones jurídicas, el gráfico muestra
los votos que obtuvo Al Gore frente a los de otro candidato, Patrick J. Buchanan, en cada uno
de los 67 condados del Estado de Florida.
0,5 -
£
p.T
i ■“ n ■ r ”
Lo primero que salta a la vista es que el valor de Palm Beach no sigue el patrón general. Los
puntos se presentan agrupados marcando una tendencia según la cual en Palm Beach se podían
atribuir a Buchanan unos 1.500 votos, pero obtuvo 3.411. A vista del gráfico está claro que algo
debía tener Palm Beach de singular. Pero no había ninguna razón para que Buchanan sacara en
ese condado un porcentaje de votos muy superior a los otros; él mismo y su equipo declararon
que obtener mil votos era para ellos una previsión optimista. Pronto estuvo claro que lo sin
gular era el diseño de la papeleta utilizada para votar en este condado. Había que perforar un
círculo según el candidato elegido, pero la asignación de círculos a cada candidato se prestaba
a confusión y muchas personas -seguramente más de 2.000, basta mirar el gráfico- votaron a
Buchanan cuando en realidad querían votar a Al Gore.
38
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
1 0 0 ---------------------------------------
9 0 ---------------------------------------
8 0 ---------------------------------------
7 0 ---------------------------------------
6 0 ---------------------------------------
50 . -----------------------------------—
40 --------------- - ---------- -----------
3 0 ---------------------------------------
2 0 ---------------------------------------
1 0 ---------------------------------------
- - - - - - - - - - - - - - - - - ¡- - - - - - - - - - - - - 1 i- - - - - - - - - - - - - - - - t — *- - - - - - - - - - r 0 TI------ 1------- 1------- 1------- 1------ T
1 2 3 4 5 6 1 2 3 4 5 6
Los d o s gráficos representan lo s mismos valores, pero en el de la izquierda da la sensación
de que ha habido una gran subida, mientras que en el de la derecha parece que los valores
se han mantenido prácticamente estables.
39
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
EL D ESA STR E D EL C H A LL E N G E R
I Todos hemos visto alguna vez la imagen del transbordador espacial Challenger en posición de des-
| pegue: una especie de avión pegado verticalmente a un gran depósito de combustible que tiene a
ambos lados algo que parecen depósitos más pequeños y que son los cohetes que colocan el apa
rato en órbita. Estos cohetes, al igual que otras partes del transbordador, no se pueden transportar
en una sola pieza, así que se fabrican por partes, se transportan al lugar de lanzamiento y ali! se
ensamblan. Para asegurar que no haya fugas en las uniones, que podrían provocar una catástrofe,
se utilizan grandes juntas tóricas de caucho de unos 6 mm de grosor y 12 metros de diámetro.
se habían detectado desperfectos en las juntas, aunque nunca se había producido un accidente
serio. Después de analizar los datos disponibles se consideró que no había evidencia de que la
temperatura afectara al posible deterioro de las juntas y la decisión fue mantener el lanzamiento.
A la mañana siguiente, a los 59 segundos de iniciarse el despegue empezó a salir una llama ■
por una junta que al parecer no era estanca. La llama creció rápidamente llegando al tanque de
combustible líquido, que se rompió y explotó, provocando la muerte de los siete astronautas que
iban a bordo, la conmoción del mundo entero y un replanteamiento general de todo el programa
de actividades de la NASA.
El entonces presidente Ronald Reagan designó una comisión de investigación formada por pres
tigiosos miembros de la comunidad científica y espacial. La comisión determinó que se había rea
lizado un análisis muy pobre de los datos disponibles, y que uno de los errores fue no considerar
los vuelos en los que las juntas no habían sufrido ningún daño (figura 1) mientras que un análisis
detallado del comportamiento de las juntas en todos los lanzamientos hubiera puesto de mani
fiesto la relación entre los desperfectos observados y la temperatura de lanzamiento (figura 2).
La figura 2 muestra claramente que no hay ninguna experiencia y, por lo tanto, ninguna seguridad
de que a la temperatura prevista no haya problemas. Además, se observa también que al disminuir
la temperatura tienden a aparecer más problemas. En la figura 3 se ha sustituido el número de
juntas con algún daño (no se distingue la magnitud del deterioro) por una valoración que realizó
la comisión de investigación; aquí la relación se muestra todavía más clara.
40
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
<= ,2
.^ -o 2
JQJ e
"O
o
Q:; 7i i
E e:
■'I" l"~1T i | i " i - r i— { l l i l | i i i i | i i > l ( l l l 1 j l I l 1 ¡
45 50 55 60 65 70 75 80 85 70 75 80 85
l/l
ro o
§o ,c
A3 2 -
_-oQJ e
o Ol 1 - temperatura previa i...... . .
Qj (ij en el fomento del lanzamiento
p OH »-[-r ~rr r' _n-r T»1 ’tfr ’
25 30 35 40 45 50 55 60 65 70 75 80 85
Temperatura (°F) en las juntas en el momento del lanzamiento
Figura 2. La escala se amplía hasta incorporar las temperaturas previstas d e lanzamiento;
también se incluyen los vuelos que no presentaron ningún desperfecto en las juntas.
o .. 1 2 -
ro e:
■o
OJ V) 8
"O..!
- § °Q- A---- Temperatura prevista;.........j
en el momentp del lanzamiento
O
/ |■i-i ,¡ i r n y , -, r T i- r , -,-t|rr r-T—r rr i ¡ i i i |
« |» »|i » « i
25 30 35 40 45 50 55 60 65 70 75 80 85
Temperatura (°F) en las juntas en el momento del lanzamiento
Figura 3. Para cada vuelo se ha valorado el daño sufrido p o r las juntas obteniendo la valoración
que aparece en el eje vertical (fuente: E. WTufte: Visual Explanations).
Éste es un claro ejemplo de cómo un simple análisis gráfico de los datos puede aportar mucha
información sobre el problema que se está analizando.
41
ESTADÍSTICA DESCRIPTIVA: CÓMO SACAR LA INFORMACIÓN RELEVANTE DE UNA MARAÑA DE DATOS
que da es que las ventas están cayendo, mientras que -supoiúendo que hasta abril se pro
duce un tercio de las ventas anuales- la previsión para este año estaría por encima de 150.
200
También se puede dar una impresión u otra según cuál sea la variable que se
elige. Por ejemplo, si su empresa vende cada vez menos, tal como indica el gráfico de
abajo a la izquierda, puede presentar el gráfico de la derecha en que se representan
los valores acumulados que, obviamente, van subiendo.
Dos formas de mostrar la evolución de las ventas: mensuales (izquierda) o acumuladas (derecha).
Pero, por favor, no se quede con la idea de que los gráficos son sólo algo amorfo que
se puede adaptar para transmitir la idea que interese. Se pueden diseñar gráficos claros
y muy útiles que p eriiten captar la información de un vistazo, como los histogramas
del caso de la panadería, y también se pueden exponer gráficos enredados, confusos e
incluso torticerosjugando con las escalas o con la variable que se representa, o usando
dibujos o ilustraciones que confundan. En general, un poco de atención, sentido crítico
y algo de experiencia sirven para desenmascarar esas situaciones.
42
Capítulo 2
Cálculo de probabilidades:
criterios para movernos en
un mundo de incertidumbre
El cálculo de probabilidades despierta mucho interés entre quienes piensan que
esta disciplina permite diseñar estrategias para ganar en casinos, loterías o en al
gún otro tipo de juego de azar. Pero pronto se descubre que no sirve para ello; en
realidad, le sirve a quien diseña los juegos, pero no al jugador si el primero hace
bien su trabajo.
M ás allá de los juegos de azar, el cálculo de probabilidades es útil en numero
sos ámbitos, desde la medicina, donde se evalúan probabilidades cuando se toman
decisiones como la de lanzar campañas de vacunación masivas, hasta el control de
calidad en la industria, donde en ocasiones hay que decidir sobre la calidad de un
gran conjunto de piezas basándose sólo en la inspección de unas pocas unidades.
El cálculo de probabilidades con un enfoque matemático surgió muy tarde, ya
en el siglo x v i i , y la formalización de la probabilidad por Laplace como el núme
ro de casos favorables partido por el número de casos posibles no llegó hasta 1814,
más de 2.000 años después de que Arquímedes descubriera la fórmula del volumen
de la esfera, que es mucho menos intuitiva. La idea imperante era que los resulta
dos que dependen del azar son imprevisibles, no tienen ley y, por lo tanto, están
fuera de la capacidad del hombre. Además, también se consideraba que el azar
pertenecía al terreno de los dioses y se le daba un significado mágico, de designio
divino; de este modo, su estudio fue una actividad demasiado peligrosa durante
mucho tiempo.
U no de los trabajos considerados como pioneros en el estudio de las leyes
del azar es el que realizó Galileo hacia 1620 por encargo de un aristócrata. Se
trataba de analizar cuál era el valor más probable de la suma de los resultados
obtenidos al lanzar 3 dados. Se creía que los valores 10 y 11 eran los más proba
bles, pero no se estaba seguro y por ello se quiso consultar a uno de los mayores
sabios de la época.
43
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
D1 D2 D1 D2 D1 D2 D1 D2 D1 D2 D1 D2
1 1 2 1 3 1 4 1 5 1 6 1
1 2 2 2 3 2 4 2 5 2 6 2
1 3 2 3 3 3 4 3 5 3 6 3
1 4 2 4 3 4 4 4 5 4 6 4
1 5 2 5 3 5 4 5 5 5 6 5
1 6 2 6 3 6 4 6 5 6 6 6
Todas las parejas tienen la misma probabilidad de salir, pero no todos los valores
de la suma aparecen con la misma frecuencia. Hay sólo una posibilidad entre
36 de que sume 2 (obtener 1 y 1), y también sólo una de que sume 12 (6 y 6 ),
pero hay 6 entre 36 (es decir, 1 entre 6 ) de que sume 7, que es el resultado más
probable.3
44
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
45
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
efectos sobre una muestra de pacientes, las conclusiones se obtienen a partir de los
resultados obtenidos y de la aplicación de métodos estadísticos en los que interviene
el cálculo de probabilidades.
Pero no hace falta ser un experto ni ser capaz de resolver problemas complicados
de cálculo de probabilidades para poder entender y aplicar los métodos estadísticos
El cálculo de probabilidades no es singular sólo por lo tarde que surgió, sino también por las mo
tivaciones que impulsaron su nacimiento y desarrollo. Cuando se estudia la historia de los avances
de la ciencia nos encontramos con trabajadores abnegados que se sacrificaron por entender el
funcionamiento del mundo, o por la salud y el bienestar de la humanidad. Sin embargo, el cálculo
de probabilidades surgió por el interés de unos personajes de vida ociosa interesados en saber cuáles
eran las mejores estrategias para ganar en los juegos de azar, actividad que por lo visto ocupaba
gran parte de su tiempo.
Una de las primeras discusiones sobre cálculo de probabilidades en términos matemáticos se en
cuentra en la correspondencia que mantuvieron Pierre Fermat y Blaise Pascal en 1654 acerca de un
problema planteado por un filósofo -y jugador- de la época conocido como el Caballero de Méré.
El problema trataba sobre la forma más justa de repartirse el importe de una apuesta si el juego se
tenía que interrumpir antes de llegar al final; por ejemplo, si gana la apuesta el primero en ganar
3 partidas, pero el juego acaba cuando se va 2 a 1.
46
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
más habituales. Tampoco es buena idea relacionar la estadística sólo con los casinos y
los juegos de azar. A veces nos encontramos con que en las portadas de los libros de
estadística aparecen ruletas, dados o barajas de cartas, pero no bosques, quirófanos, niños,
escuelas o líneas de producción, cuando la estadística es mucho más útil e interesante
en estos campos.*1
Una opción sería que todo se lo quedara el que va ganando, otra podría ser repartírselo a partes
iguales, pero tanto Fermat como Pascal estuvieron de acuerdo en que en un caso como éste lo
más razonable es que se lleve tres cuartas partes el que ha ganado 2 partidas.
Si los jugadores son A y By el que lleva ganadas las 2 partidas es A, el razonamiento es el siguien
te: supongamos que siguen jugando y que la probabilidad de ganar una partida es del 50%, la
misma para los 2. El juego acabaría de uno de los siguientes modos:
1. La siguiente partida la gana A. Como ya irán 3 a 1 el juego acaba, gana A y se lleva todo el
dinero. La probabilidad de que esto ocurra es 0,5.
2. La siguiente partida la gana B. con lo que quedan 2 a 2 ysiguen jugando. A continuación gana
A, con lo que se ponen 3 a 2 a favor de A y termina el juego. La probabilidad de ir por este
camino es 0,5 • 0,5 = 0,25 (gane B y gane A).
3. La siguiente partida la gana B y a continuación vuelve a ganar B. En este caso acaban 2 a 3 y
B gana el juego. La probabilidad de que se vaya por este camino también es 0,5 • 0,5 = 0,25.
Debe terminar
el juego Posibles resultados si continuara
A-B
' ® } Gana A. Probabilidad = 0,5 • 0,5 = 0,25.
Recopilando, si siguieran jugando la probabilidad de que ganara A sería O,75 (0,5 + 0,25), mien
tras que la probabilidad de que ganara B sería 0,25. En 3 de cada 4 ocasiones ganaría A; por lo
tanto, es razonable que se quede con las tres cuartas partes de la apuesta.
47
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
p (a )= n.
n
Es decir,
Por ejemplo, si en una bolsa hay 5 bolas, de las cuales 3 son azules y 2 son negras,
si se saca una al azar la probabilidad de que sea azul es 3/5. Así de fácil.
En algunos casos la probabilidad teórica se puede definir atendiendo a la simetría
del objeto que genera los resultados, como en el caso del lanzamiento de monedas o
dados. Otro enfoque consiste en considerar la probabilidad como la proporción de
veces que ocurre el suceso al aumentar indefinidamente el número de experimentos.
Así, para saber cuál es la probabilidad de que al lanzar una moneda salga cara hay que
lanzarla muchas veces y ver a qué valor tiende la proporción de caras. Lo mismo ocu
rre con los dados; cuando decimos que la probabilidad de que salga un cierto valor
es 1/ 6 , nos estamos refiriendo a un dado perfecto, y quizás ése no es el caso del que
tenemos en las manos.
Algunos investigadores han lanzado monedas o dados muchas veces y han ido
anotando los resultados obtenidos. Uno de ellos fue el matemático inglés John
Kerrich, que fue encarcelado en Dinamarca durante la Segunda Guerra Mundial.
Estando en prisión, lanzó 10.000 veces una moneda al aire: le salieron 5.067 caras
y 4.933 cruces.
La proporción de caras iba fluctuando tal y como se indica en la siguiente
figura, aunque éstos no son los datos de Kerrich sino una simulación. A medida
que el número de lanzamientos crece las fluctuaciones se van amortiguando y es
razonable suponer que la proporción tenderá a un valor constante si el número de
lanzamientos continuara indefinidamente. Ese valor será la probabilidad de obtener
cara con esa moneda.
48
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
49
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Dado blanco
- Total Proporción
1 2 3 4 5 6
Los resultados obtenidos con las monedas parecen coherentes con la suposiciór
de que están bien equilibradas (probabilidad de cara = 0,5), pero en los resultados
de lanzar los dados hay proporciones que se alejan bastante del valor teórico. Tanto
el dado blanco como el rojo parecen tener un déficit de valores 3 y 4. De momento,
podemos representar los resultados en un gráfico para verlos más claros (R = dado
rojo, B = dado blanco). Más adelante, cuando en el capítulo 3 se hable de contraste
de hipótesis, se discutirá si es razonable pensar que los dados no están equilibrados.
Resultados obtenidos al lanzar2 0 .0 0 0 veces un dado rojo (R) y otro blanco (B).
50
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
R egla de la «o »
4 .
Probabilidad de que sea un as: P(A) = — (casos favorables/casos posibles).
. 12
Probabilidad de que sea una figura: P(B) = — .
. 4 12 16
Probabilidad de que sea as o figura: P(A o B) = P(A) + P(B) = + 52
52 .
Regla de la «y»
1 .
Probabilidad de sacar un 3: P(A) = — (casos favorables/casos posibles).
6
1
Probabilidad de sacar un 4: P ( B ) = - .
6
Contando casos
Contar los casos favorables o los casos posibles suele ser la parte más laboriosa del
trabajo, aunque en algunas situaciones también se pueden hacer las cuentas con razo
namientos simples o por analogía con situaciones similares. Por ejemplo, si para ir de A
a C hay que pasar por B y tenemos 3 caminos para ir de A a B y 2 para ir de B a C, ¿de
51
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
cuantas maneras se puede ir de A a C? Para cada una de las 3 opciones que existen para
ir a B tenemos 2 para ir de B a C, luego en total hay 6 formas distintas de ir de A a C.
Veamos otro caso que parece más complicado. En las quinielas de fútbol españolas
hay 3 opciones para cada partido: gana el que juega en casa (1), empatan (X) o gana
el que juega en campo contrario (2). ¿Cuál es la probabilidad de acertar la quiniela
completa de 14 partidos?
Está claro que los casos favorables son sólo uno: existe una única combinación
ganadora. Los casos posibles parecen más difíciles de contar, pero podemos usar la
misma idea que para contar los caninos para ir de A a C: el primer partido tiene
3 resultados posibles, para cada resultado del primero hay 3 opciones para el segundo;
es decir, que si hubieran sólo 2 partidos las posibilidades serían 3 -3 = Y . Siguiendo
el razonamiento se llega a la conclusión de que para 14 partidos los casos posibles
son 3'h Luego, la probabilidad de tener 14 aciertos si se rellena la quiniela al azar es
de 1 /3 14, aproximadamente 1 entre 4,8 millones.
Para estos menesteres también son muy útiles las fórmulas de la combinatoria; se
verá alguna en el contexto de los problemas comentados más adelante.
52
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
decir, que salga cara la primera vez no aumenta ni disminuye la probabili dad
de que salga cara la segunda.
53
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Orden Probabilidad
CCC + + 0,53- • 0,52
c c + c + 0,53 • 0,52
c + c c + 0,53 • 0,52
+ + c c c 0,53 . 0,52
5!
= 10.
3!-2!
5!
------0,5 3 0,52 = 0,3125.
3!-2!
54
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
¿Y para qué sirve saber cuál es la probabilidad de que al lanzar 5 veces una mo
neda al aire salgan 3 caras? Seguramente para muy poco, pero a continuación se verá
que el procedimiento seguido se puede generalizar a otros ámbitos de gran interés.
Aplicando las reglas generales del cálculo de probabilidades hemos podido determinar
la probabilidad de que salgan 3 caras y 2 cruces (en cualquier orden) al lanzar 5 veces
una moneda mediante la expresión:
5!
53 -O, 52.
31-21
55
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Más allá de los números concretos, si se trata de calcular la probabilidad de que salgan x
caras realizando n lanzamientos y llamamos p a la probabilidad de obtener cara y 1 - p a la
Lo interesante es que esta fórmula no sólo esválida para el problema del lanzamiento de mo
nedas, sino que puede generalizarse a cualquier ámbito de acuerdo con el siguiente esquema:
56
C A L C U L O D E P R O B A B I L I D A D E S : C R I T E R I O S P A R A M O V E R N O S E N U N M U N D O D E I N C E R T I D U M B R E
X . . fx =DiSTR.BINOM(
B lDlSTR.BIt\IOM(núm_éxito; ensayes; prob_b:ito; acumulado) | g
58
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
1 A *1 8
1 O.C1745132¡i
59
1
pos del ejército multiplicado por el número de años que tuvieron el número de
muertos que se indica (total = 14 ■ 20). El número medio de muertos por cuerpo del
ejército y año es (91 + 2 • 32 + 3 • 11 + 4 • 2)/280 y utilizando este valor en nues
tra fórmula se obtienen las frecuencias teóricas que se indican en la siguiente tabla.
Puestos a buscar unos datos más acordes con nuestros tiempos, puede pensarse
en los goles que un equipo marca en un partido de fútbol, ya que esta variable
responde bien al esquema de la distribución de Poisson: son sucesos por unidad de
tiempo (partido), no hay límite y no se puede contar el número de «no goles». Así,
el diagrama de la izquierda representa el número de goles que marcó cada equipo
en cada uno de los 380 partidos de la liga española de fútbol en la temporada 2008
2009. El diagrama de la derecha muestra los datos deducidos con nuestra fórmula.
60
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Efectivamente, los perfiles son muy parecidos. El modelo de Poisson explica bien
la variabilidad en el número de goles que un equipo marca en un partido.
L a c a m p a n a d e G a u ss o d is tr ib u c ió n n o r m a l
61
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Uno de los nombres ligados a los orígenes de la estadística moderna es el del cien
tífico belga Adolphe Quételet, que durante el siglo xix realizó numerosos estudios para
poner de manifiesto la regularidad estadística (número de crímenes, de nacimientos, de
muertes, etc.). En su búsqueda de datos para
mostrar la distribución normal, se encontró
con un regalo inesperado: una revista escocesa
había publicado la estatura y el perímetro torá
cico de más de 5.000 soldados pertenecientes
a diversos regimientos escoceses, y esos datos
le permitieron poner de manifiesto que la va
riabilidad que presentaban los soldados era del
mismo tipo que la descrita por la ley de los
errores.
En palabras de Quételet: «Si una persona
poco práctica en medir el cuerpo humano
midiera repetidamente a un soldado típico,
5.738 mediciones hechas en un individuo
Adolphe Quételet, uno de los más no se agruparán ciertamente con más regula-
importantes estadísticos del siglo xix. ridad ... que las 5.738 mediciones hechas en
62
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Retrato de Abraham de Moivre, quien mer) parece que ya fue descrita por al menos
dedujo la denominada campana de Gauss, media docena de científicos antes que él; la
muchos años antes de que lo hiciera el
constante de Euler fue descubierta por Jacob
famoso matemático alemán.
Bernoülli; el último teorema de Fermat, si es
teorema, no es de Fermat (sería conjetura), ya que no fue demostrado hasta 1995 por Andrew
Wiles; el cometa Halley fue descubierto por los astrónomos ya antes de Jesucristo, aunque sí es
verdad que Edmond Halley calculó su órbita y predijo la fecha de su retorno, y en un tema más
propio de nuestro ámbito de estudio, está muy bien documentado que la distribución normal,
con su forma de campana, no fue descubierta ni descrita por primera vez por Gauss sino por el
matemático francés Abraham de Moivre, que publicó sus trabajos sobre esta cuestión en 1733,
casi 80 años antes de que lo hiciera Gauss.
Esto no significa que unos científicos se apropien indebidamente de los méritos de otros, lo que
ocurre es que algunos realizan aportaciones relevantes, o divulgan un asunto que ya existía pero
que no era conocido, y a partir de ahí, sin que ellos tomen parte, se les identifica con ese descu
brimiento. El profesor Stigler publicó un artículo sobre este tema, que ya había sido comentado
por muchos otros antes que él, entre ellos por Robert Merton, a quien cita con frecuencia. Pero
con un toque de humor, para añadir un nuevo ejemplo a su ley, propuso que se llamara ley de
Stigler, y lo cierto es que así se ha quedado.
63
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Media y desviación típica: los d o s parámetros que caracterizan una distribución normal.
65
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Si el peso de los paquetes de azúcar sigue una distribución normal con media
1.000 gramos y desviación típica 5 gramos, podemos calcular qué proporción de
paquetes tendrá un peso superior a 1.010 gramos, entre 995 y 1.010 o inferior a 995.
Hasta hace poco tiempo había que realizar unos cálculos y consultar unas tablas (que
todavía se incluyen al final de muchos libros de estadística), pero hoy en día basta
con utilizar una hoja de cálculo. Por ejemplo, la probabilidad de que un paquete
pese menos de 995 gramos será:
Al i jSr =DISTR.NQRM(995;1000;5;1)____________
' A ' B ! d I S T R ,. N O R .M ( x ; m e d i a ; d e s v _ e s t á n d a r ; a c u m )
1 .0,158655251
n
66
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Esta regla también puede servir para interpretar el valor de la desviación típica.
Si se piensa en la distribución de las estaturas, la media podría ser 170 cm y la des
viación típica debe estar entre los 6 o 7 cm, ya que, fijándonos en los valores altos,
una estatura de 1,90 seguramente es superada por el 1 o el 2 %o de la población, lo
que vendrían a ser 3 desviaciones típicas por encima de la media.
O t r a s d is tr ib u c io n e s. R e f l e x i ó n fin a l s o b r e lo s m o d e lo s « te ó r ic o s »
Stlnndardiu-,
01 MatagattemcdOat#
MakeMestJD.u..
iM akelndicatorVariables-.
Setfiase-,
fiandomData
£hi-Square...
M
atrices a'
f-
...
l¿rwform_.
fiinomial...
Gwmftriic-.
NegativaBinornial—
^p^^TOtric...
Discreta...
* C1 C2 C3 C4 ¡I £osson... C8 C9 C10
|
Beti~
Cauehy-
Ejponertial...
gamma,..
.aplace-
LargsstExtremaValué.-
Lsgisiic-
loglogijtic...
iognoqnat-
SmallestExtremeVa*ue_.
Triangular..
Ü leibulL.
67
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Falsos positivos
68
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Quizás esté pensando que es del 95%, pero entonces se equivocaría, ya que en
realidad es mucho menor. Por cada 1.000 personas analizadas tendremos 50 falsos
positivos (el 5%) y 1 positivo verdadero. Luego, si entre los 51 positivos únicamente
hay uno verdadero, la probabilidad de que sea el suyo es sólo de 1/51, es decir, li
geramente menor del 2%.
365 364
= <), 9973.
365 365
Solo hay dos posibilidades: todos han nacido en días distintos o al menos 2 han
nacido el mismo día. Luego la probabilidad de que al menos 2 hayan nacido el
mismo día será:
69
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
C O M P A R T IR C U M P L E A Ñ O S
Pero tampoco crea que si la probabilidad es del 50% entre 1O casos, seguro que hay 5 «éxi
tos», de la misma forma que al lanzar 1Oveces una moneda no tienen porque salir 5 caras. Las
probabilidades son:
Partidos con
2 3 4 5 6 7 8 9 10 1
coincidencia
Probabilidad 0,001 0,01 0,04 0,12 0,21 0,25 0,21 0,12 0,04 0,01 0,0011
1 L o d e « d i c h o » m á s r á p i d o q u e lo d e « h e c h o » . E s t o ú l t i m o c o n la a y u d a d e F ilip a d a S i lv a , e s t u d i a n t e d e
I n g e n i e r í a i n d u s t r ia l.
70
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Veamos otro caso de probabilidades sorprendentes. Una persona juega toda su vida
adulta (pongamos SO años) a la lotería Primitiva; si se realizan 2 sorteos por semana,
¿cuál es la probabilidad de que durante ese periodo salga más de una vez la núsma
combinación ganadora?
71
CÁLCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
Finalizarem os este apartado con una cu e stió n que quizá se haya planteado en alguna
ocasión. ¿Cuál es la p ro b a b ilid a d de que en el sorteo de la lo te ría P rim itiv a salgan
2 núm eros seguidos?
Es más alta de lo que p u d iera parecer en u n p rin c ip io , exactam ente del 49,5% .
C a lc u la r este v a lo r c o n las fó rm u la s de la c o m b in a to ria n o es in m e d ia to , p e ro
pue d e co m p ro b arse que éste es su o rd e n de m a g n itu d u tiliz a n d o una h o ja de
cálculo E xcel.
E l p ro c e d im ie n to puede ser el siguiente:
1. C o lo q u e los nú m e ro s del 1 al 49 en la co lu m n a A .
3. O rd e n e la co lu m n a B arrastrando en la o rd e n a ció n a la c o lu m n a A .
72
CALCULO DE PROBABILIDADES: CRITERIOS PARA MOVERNOS EN UN MUNDO DE INCERTIDUMBRE
El..... -■ (- A | -MIN(D1:D15)
A B C D í E : F 1
1 24 0,406033264 24 25l l=ABS(C$l-C2)
2 49 0,692061135 49 10 =ABS(C$1-C3)
3 34 0,888345552 34 1 =ABS(C$1-C4)
4 25 0,690317785 25 18 =ABS(C$1-C5)
í) 42 0,510624023 42 14 =ABS(C$1-C6)
6 10 0,731399102 10 15 =ABS(C$2-C3)
7_ ^ 35 0,80523146 24 =ABS(C$2-C4)
8 29 0,485161895 7 =ABS(C$2-C5)
9 5 0,841222518 39 =ABS(C$2-C6)
10 44 0,073104639 9 =ABS(C$3-C4}
11 ^ 7 0,437421932 8 =ABS(C$3-C5}
12 46 0,594398038 24 =ABS(C$3-C6)
13 15 0,081228671 17 =ABS(C$4-C5)
14 38 0,109743618 15 =ABS(C$C6)
15 ^ 13 0,341018331 32 =ABS(C5-C6)
73
C a p ítu lo 3
75
CONOCER EL TODO MIRANDO UNA PARTE
P eces
Contar cuántos peces hay en un lago no parece una tarea fácil, especialmente si es
grande y de aguas turbias, pero los biólogos saben cómo hacerlo. Utilizando técni
cas estadísticas, por supuesto. Un método muy utilizado es el llamado de «pesca y
repesca» (o, en general, de «captura-recaptura», porque no sólo sirve para peces). El
procedimiento es el siguiente:
76
CONOCER EL TODO MIRANDO UNA PARTE
2. D e ja r pasar u n tie m p o (puede ser unos días) hasta que sea razonable considerar
que los peces marcados se han dispersado p o r to d o el lago, y v o lv e r a pescar
o tra m uestra (la «repesca») de u n n ú m e ro que no necesariam ente debe ser
ig u a l al de la pesca.
M _ R
N - C
D e fo rm a que una e stim ación del n ú m e ro de peces que hay en el lago es (des
pejando N ):
77
CONOCER EL TODO MIRANDO UNA PARTE
Repesca. Se deja pasar u n tie m p o para que los peces marcados se dispersen p o r to d o
el lago y se pescan otros ( Q contando el n ú m e ro (R) de los que aparecen marcados.
E n nuestro caso, C = 1 5 y R = 3.
M ■C 15-15
C á lcul o. E l n u m e ro d e peces en el l ago estarn en to rn o a: N = 75.
R 3
C o n c lu s ió n : n ú m e ro
de peces en to rn o a 75.
78
CONOCER EL TODO MIRANDO UNA PARTE
repesca tantas veces como se quiera y, viendo el número de peces que se habría esti
mado en cada simulación, se puede determinar también la magnitud de los errores
que se comenten y con qué frecuencia se presenta cada uno de ellos.
Con los datos de nuestro ejemplo, en el 85% de los casos se encuentran entre 2 y
5 peces marcados, lo que aplicando la fórmula que hemos deducido conduce a una
estimación de entre 112 y 45 peces. El 15% de las veces la estimación está fuera de
este intervalo.
85 %
30
25
r
20
i: 15
V 15
o
10 -
5-
P
o n i ja
o 1 2 3 4 5 6 7 8 9
Peces encontrados marcados en la repesca
Los errores que se cometen por exceso son más frecuentes que los que se dan
por defecto, y también resulta que el valor medio de las estimaciones es 82, superior
al valor real. Cuando esto ocurre, se dice que el estimador es «sesgado», no apunta
bien al verdadero valor del parámetro que se está estimando.
La estimación mejora notablemente introduciendo unas pequeñas correcciones
en la fórmula. El único problema es que ya no la podem osjustifcar de forma sencida.
CONOCER EL TODO MIRANDO UNA PARTE
Taxis
El reto es mucho más ficil si de lo que se trata es de contar el número de taxis que hay
en una ciudad. La primera opción es buscarlo en Internet.Así, por ejemplo, la página
web del ayuntamiento de una gran ciudad informa de que en el área metropolitana
de la población existen 10.481 licencias de ta.xi. A cada licencia le corresponde un
vehículo. Asunto resuelto.
80
CONOCER EL TODO MIRANDO UNA PARTE
N = 2 :X -1 .
81
CONOCER EL TODO MIRANDO UNA PARTE
U n a o p c ió n que parece bastante razonable es, p o r sim etría, co n sid era r que a
c o n tin u a c ió n del ú ltim o hay tantos elem entos com o antes del p rim e ro . E n este caso
sumaríamos 7 a 35 y nuestra estim ación sería 42. E l in c o n v e n ie n te de este m é to d o
es que ignoram os la in fo rm a c ió n que aporta el n ú m e ro de elem entos que ha y entre
las observaciones, y siem pre co n vie ne aprovechar toda la in fo rm a c ió n disponible.
U n a fo rm a de hacerlo es a ñ a d ir al ú ltim o v a lo r el p ro m e d io de las distancias entre
las observaciones que tenem os (la p rim e ra distancia es el n ú m e ro de los elem entos
que h a y antes de la p rim e ra o b se rva ció n ).
7+5+7+4+7
5
X
- 1
n
82
CONOCER EL TODO MIRANDO UNA PARTE
Por tanto, la mejor estimación del número total de elementos de la población es:
X
x +_!l_-1.
" n
¿Y qué calidad posee este estimador? Puede demostrarse (como lo hace la es
tadística matemática) que con los criterios que se manejan para calificar las carac
terísticas de un estimador éste es el mejor que se puede calcular. En la jerga de los
especialistas se dice que es un estimador U M V U E (palabra que corresponde a las
siglas de Uniformly Mínimum- Variance Unbiased Estimator).
Así pues, basta con mirar las licencias de 20 taxis y al valor de la mayor se le suma
ese valor dividido por 20 y se le resta una unidad. En el caso de nuestro ejemplo, si el
número de licencias es 10.481 y efectivamente están numerados de forma correlativa,
en el 95% de los casos nuestra estimación estará entre 9.175 y 10.990.
Evidentemente, este método no sólo sirve para contar taxis.También se puede
utilizar, por ejemplo, para estimar el número de participantes en una carrera po
pular si se entregan los dorsales de forma correlativa desde el 1 hasta el número
del último que se inscribe. También, cambiando totalmente de escenario, parece
que los servicios de espionaje han utilizado estas técnicas para estimar la cantidad
de armamento del que dispone el enemigo. Si las armas llevan un número de serie
y se apoderan de unas pocas, ya hemos visto que no es difícil deducir el número
total de las que se disponen.
83
CONOCER EL TODO MIRANDO UNA PARTE
E S T IM A C IO N E S S O B R E L A C O M B IN A C IÓ N G A N A D O R A
D E L A L O T E R Í A P R IM IT IV A
Sabemos de sobra que todos los números de la lotería Primitiva tienen la misma probabilidad de
salir, pero ¿y la media de la combinación ganadora? El día 7 de enero de 201 O la combinación
ganadora en la lotería Primitiva española fue 19, 24, 25, 38, 43 y 49, lo que tiene una media de
33, y el sábado 9 de enero fue 13, 26, 29, 30, 31 y 43, lo que da una media de 28,67 (redon
deando). ¿Todas las medias tienen la misma probabilidad de salir, o unas salen más que otras?
La respuesta es que unas salen más que otras porque, tal y como vimos en el capítulo anterior,
las medias tienden a seguir el patrón de la distribución normal. La distribución de la media de
los sorteos efectuados entre el 17 de octubre de 1985 y el 31 de diciembre de 2009 está repre
sentada en el siguiente histograma:
5 10 15 20 25 30 35 40 45 49
Es mucho más probable que la media esté entre 20 y 30 que entre 5 y 15. Entonces, ¿por qué
no apostamos siempre por combinaciones que tengan una media entre 20 y 30? Porque hay
muchas más combinaciones que tienen esas medias, y la probabilidad de que le toque a una
combinación en concreto es siempre la misma.
Dicho de otro modo, en un sorteo hay 1.000 números, ¿qué es más probable, que toque
entre el 500 y el 550 o fuera de ese intervalo? Evidentemente, es más probable que toque
fuera, pero eso no quiere decir que un número de dentro tenga menos probabilidades que
uno de fuera.
84
CONOCER EL TODO MIRANDO UNA PARTE
que contarlos como miembros de la familia? Parece raro que pertenecer o no a una
familia dependa de la casa en la que vives. También se puede entender familia en
un sentido mucho más amplio, como cuando en las bodas se habla de la familia del
novio y de la de la novia, y que fácilmente son varias decenas de personas cada una.
¿Un hogar es igual a una vivienda? Seguramente no, porque si no vive nadie
no puede ser un hogar. Si se trata de una vivienda de fin de semana, o que sólo se
ocupa en la época de vacaciones, seguramente tampoco puede ser considerada como
un hogar. Un piso de estudiantes, que está ocupado durante el curso académico,
¿es un hogar? Parece que un hogar está ligado a una familia, ¿o no es necesario? Es
imprescindible, por lo tanto, ponerse de acuerdo en lo que se entiende por hogar.
Lo que significa tener conexión a Internet seguramente presenta menos dudas,
no importa si es a través de módem o por banda ancha. Sin embargo, hay viviendas
que tienen conexión inalámbrica porque su vecino la tiene y no está protegida, o
porque viven cerca de una biblioteca o zona de acceso gratuito; ¿hay que contar
que esos hogares tienen conexión a Internet, o sólo se cuentan los que la pagan?
bogar.
ÍÍX-Ib.latfocJrit,aJj.der.de/nciu.fitcgo)
J,rn.Sitiodondeselucelaiumbn:enliscocinu,chimcacas,homosdefundición.etc.
2. Casaodomicilio.
3. Fanúíía,grupodepcrs.onasemparentadasquevivenjuntas.
4. M ÜlD.CHestablecimientobenéfico).
5. Centrodeocioenelquesereúnenpersonasquetienencncomiinunaactividad,
unasiliaciónpersona!ounaproeedcneia. deípevu'ionr.ntf.
6. • n.ns.foguea.
I l.m.lwga.rdonde combustiónu:produceencomunicacióndircciacondairc.
Supongamos que se define hogar como una vivienda en la que conviven la mayor
parte del año una o más personas que están emparentadas, y se entiende que tienen
conexión a Internet si está bajo su control el contar con ella o dejar de tenerla.
Si sobre una población total de 100.000 hogares se toma una muestra de 1.000
y resulta que la proporción de los que tienen conexión a Internet en esa muestra
es del 51,9%, ¿significa que éste es exactamente el porcentaje en toda la población?
Evidentemente, la respuesta es que «no necesariamente». Si en lugar de la muestra
que nos ha tocado por azar, nos hubiera tocado otra, seguramente el resultado no
hubiera sido idéntico, podría haber salido 50,7 o 52,3, por ejemplo.
85
CONOCER EL TODO MIRANDO UNA PARTE
Por esa razón, cuando se dan los resultados de un estudio de este tipo no sólo se
presenta el valor de la proporción estimada, sino que también se informa sobre un
margen de error razonable en torno a ese valor. Por ejemplo, el resultado de la esti
mación podría ser: 51,9% ± 2,3%.
El 2,3% que sumamos y restamos es lo que se denomina «margen de error». Sig
nifica que aunque nos ha salido un valor concreto nosotros no podemos estar seguros
de que en la población el valor sea exactamente ése. El cálculo de probabilidades
nos permite determinar la variabilidad que presenta nuestra estimación y a partir
de ella calcular el margen de error (en el fondo de este asunto está la distribución
binomial, aquí el experimento es mirar un hogar y los dos resultados posibles son:
tiene conexión a internet o no la tiene).
Al intervalo que incluye el margen de error se le denomina «intervalo de confian
za», ¿podemos asegurar que el verdadero valor estará dentro? La respuesta vuelve a ser
que no, no podemos estar seguros. El margen de error se calcula para un determinado
nivel de confianza y lo habitual es que ese nivel sea del 95%, lo cual significa que se
ha calculado por un procedimiento que sabemos que acierta (incluye el verdadero
valor de la proporción buscada) en el 95% de los casos, pero no podemos saber si
acierta en nuestro caso concreto. Es como si nos diera el intervalo una persona que
dice la verdad el 95% de las veces; podemos estar bastante seguros de que es verdad,
pero no totalmente seguros.
I
r 51,9% ± 2,3%
Estimación Margen
^ Puntual de error
Dice la verdad el
95% de las veces
Concepto de intervalo de confianza.
También pueden calcularse intervalos de confianza del 99, o del 99,9%, pero no
suele hacerse porque, dado un tamaño de muestra, cuanto mayor es el nivel de con
fianza mayor es el margen de error que se obtiene, y de nada sirve decir con muchí
sima seguridad que la proporción que se busca está en el intervalo 51,9 ± 40%, para
86
CONOCER EL TODO MIRANDO UNA PARTE
eso no hacía falta hacer ningún estudio. Si se desea aumentar el nivel de confianza
manteniendo el margen de error no hay más remedio que aumentar el tamaño de la
muestra (el dinero soluciona muchos problemas, y también éste).
« E l P a r t id o A a v e n t a ja a l P a r t id o B e n 3 ,6 p u n t o s »
L a p r e g u n ta d e l m illó n
Seguramente la pregunta que se hacen con más frecuencia los que realizan una en
cuesta es: ¿cuál debe ser el tamaño de la muestra para que los resultados sean fiables?
La respuesta es «depende», y depende de:
1. La precisión con que se desea tener los resultados o, dicho de otra forma, del
margen de error que se esté dispuesto a asumir. Si se desea que el margen de error
sea del 1%, se necesita un tamaño de muestra mayor que si se acepta uno del 4%.2
87
CONOCER EL TODO MIRANDO UNA PARTE
EL T A M A Ñ O D E L A M U E S T R A
Por si alguna vez le hace falta, la fórmula que liga todos los ingredientes para determinar el
tamaño de la muestra es:
n. z jjq N
E2N + z 2
a,2p q '
Siendo:
za/2 el valor ligado al nivel de confianza. Si es del 95%, el caso más habitual, vale 1,96.
En ocasiones se toma el valor de 2, y en ese caso corresponde a un intervalo de confianza
del 95,5%.
p es la proporción que se desea estimar
q, 1 - p .
E el margen de error.
N el tamaño de la población.
88
CONOCER EL TODO MIRANDO UNA PARTE
Ya sólo necesita una hoja de cálculo para ir probando y ver lo que ocurre con el
tamaño de muestra cuando se aumenta el nivel de confianza o cuando se cambia el
margen de error, o cómo afectan cualquiera de las variables que intervienen. Tam
bién puede construir una tabla como la siguiente, en la que ya está casi todo hecho.
Tabla con los tamaños de muestra necesarios para un nivel de confianza del 95%
y en el caso más desfavorable en que p = q = O,5.
89
CONOCER EL TODO MIRANDO UNA PARTE
Para preparar la sopa tenemos una olla, pongamos que más bien pequeña, y para saber
si está bien de sal la catamos con una cuchara. Si un día tenemos invitados y hay
que preparar la sopa en una olla mucho mayor, ¿necesitaremos también una cuchara
mucho mayor para catarla? Es evidente que no. Todos usamos la misma cuchara, y
damos el sorbo de la misma forma, tanto si la olla es grande como si es pequeña. El
tamaño de la muestra no depende del tamaño de la población.
Lo que sí hay que hacer, sea cual sea el tamaño de la olla, es remover bien para
homogeneizar la sopa, y asegurarnos de que cualquier posible muestra brinde la
misma información.A nadie le sorprende que sea mucho más importante mezclar
bien antes de probar que aumentar el tamaño de la cuchara.Y también sabemos
que el error de no remover no se corrige utilizando una cuchara más grande. Si
la muestra no es representativa, aumentar su tamaño no resuelve el problema. En
absoluto.
Basta con una gota de sangre para conocer de forma inequívoca el tipo de sangre
de una persona, puesto que todas las gotas de sangre de una persona son del mismo
tipo; vista una quedan vistas todas. De nuevo se pone de manifiesto que el impacto
de la homogeneidad es más importante que el del tamaño de la población. La misma
cantidad de sangre se requiere para un niño recién nacido, de apenas 2 kilos y medio,
que para su padre, aunque éste pese más de 100 kilos.
Pero no sólo se dispone del argumento de la intuición. También se puede usar
la fórmula para ver cuál es la relación entre el tamaño de la muestra y el tamaño de la
90
CONOCER EL TODO MIRANDO UNA PARTE
L O S Z U R D O S V IV E N M E N O S ( ¿ O N O ? )
91
CONOCER EL TODO MIRANDO UNA PARTE
1.200
El poder lo da la aleatoriedad
A veces los informes sobre los resultados de una encuesta destacan los cálculos de
los niveles de confianza, pero pasan de puntillas sobre la forma en que se ha obteni
do la muestra, o lo explican y es evidente que esa muestra no es aleatoria. Toda la
matemática que hay detrás de esos cálculos se basa en unas propiedades que sólo se
cumplen cuando la muestra es aleatoria. Si no es así, se le está otorgando un poder
que no tiene, y el nivel de confianza será incorrecto, por muy bien que se hayan
hecho los cálculos.
La mejor forma de seleccionar una muestra aleatoria es tener un listado de to
dos los individuos de la población, seleccionar la muestra al azar e ir detrás de ellos:
localizarlos, acordar día y hora para la entrevista, acudir a la cita, etc.; el problema es
que esto es muy caro. Otra opción es seleccionar casas; es más fácil, pero durante el
día no están los que trabajan y de noche seguramente no tienen ganas de atender a
92
CONOCER EL TODO MIRANDO UNA PARTE
93
Cuando se pretende sacar una muestra, o un solo número, al azar, hay que cuidar
los detalles porque de lo contrario pueden surgir problemas imprevistos. Un caso
muy citado por los especialistas es el que se produjo en Estados Unidos cuando se
realizó el sorteo para determinar el orden de incorporación al servicio militar en el
reemplazo de 1970 (con la guerra de Vietnam todavía en marcha).
Era la primera vez que se hacía un sorteo de este tipo y en una caja se colocaron
366 cápsulas, cada una con la fecha de un día del año. Primero se introdujeron las 31
del mes de enero, después las 29 de febrero y así sucesivamente hasta las 31 cápsulas
de diciembre. Se removieron y una mano inocente las fue sacando. Los que nacieron
en la fecha que apareció en primer lugar eran los primeros en incorporarse, después
se incorporaban los de la fecha sacada en segundo lugar, y así hasta el final.
El problema se produjo porque, por lo visto, las cápsulas no se removieron
bien. Las fechas de diciembre, que fueron añadidas las últimas, se quedaron encima
y salieron al principio en una proporción mayor de la que por azar cabía esperar,
mientras que las de enero se quedaron en el fondo y salieron más bien hacia el fi
nal, de forma que los varones nacidos en diciembre fueron reclutados y enviados a
Vietnam en mayor número que los nacidos en enero. Los medios de comunicación
se dieron cuenta del problema y denunciaron el hecho, pero así se quedó. Eso sí, al
año siguiente se cambió el sistema y el sorteo se realizó de forma realmente aleatoria.
En Europa, más concretamente en España, se dio un caso parecido. En 1997
había 165.342 jóvenes en edad de incorporarse al servicio militar, pero no había
plazas para todos. Sobraban 16.442, así que se hizo un sorteo para decidir quiénes
quedaban excluidos del reemplazo. Se asignó un número a cada mozo y la idea era
sacar uno al azar y que se librara el que tuviera ese número y los 16.441 que venían
a continuación. El problema se produjo por la forma de sacar un número al azar
entre el 1 y el 165.342.
En primer lugar se sacó un número de un bombo que sólo contenía el O y el 1
para decidir si el número estaría entre el 1 y el 99.999 (caso de salir el cero) o entre
el 100.000 y el 165.342 (caso de salir el 1) y salió el 1.A continuación, se sacó un
número del O al 9 de un segundo bombo y salió el 8. Com o el número que iba a
salir era el ciento ochenta y pico mil, mayor de lo que interesaba, se volvió a tomar
otra bola hasta que salió un número inferior o igual a 6. ¿Algún problema? Pues sí,
la probabilidad de salga un número entre 1 y 99.999 era la misma que entre 100.000
y 165.342, pero en el primer caso hay más valores que en el segundo, y esto hace
94
CONOCER EL TODO MIRANDO UNA PARTE
que para algunos la probabilidad de librarse fuera del 8,2% mientras que para otros
era del 12,6%, más del 50% superior.
E n c u e s ta s « in fo r m a le s»
U n colegio profesional envía una carta a sus colegiados pidiéndoles que rellenen
un cuestionario sobre su trabajo y sus ingresos anuales. El objetivo es realizar un
informe que sirva a los propios colegiados como referencia para la negociación de
sus salarios. Se les pregunta sobre el tipo de empresa en la que trabajan: multina
cional, familiar, grande, pequeña, con mucha tradición, recién creada etc.; sobre el
sector, sobre su puesto de trabajo, sobre su antigüedad en el puesto, en la empresa,
en la profesión... y, finalmente, cuál es su salario fijo bruto y los complementos que
cobra habitualmente. La carta incluye un sobre con el sello puesto para devolver
el cuestionario por correo. Han respondido 357 colegiados de un total de 5.000
cartas enviadas, se presentan las conclusiones con un nivel de confianza del 95% y
un margen de error del 5%.
Aunque si consulta la tabla de los tamaños de muestra verá que los números
cuadran, el problema es que la muestra no es aleatoria y, por lo tanto, ninguno de
esos valores tiene sentido. Las muestras autoseleccionadas Oe preguntamos a todos y
contesta el que quiere) nunca se pueden considerar aleatorias. Es posible que los que
tienen cargos ejecutivos estén muy ocupados, viajen mucho y no tengan tiempo de
contestar este tipo de encuestas, ni los que llegan tarde a su casa, ni los que cobran
muy poco o están en paro y no tienen ganas de darle vueltas a este tema, ni aquellos
que tienen una estructura de salario que no se adapta a lo que está previsto en el
cuestionario, etc. En fin, no es una muestra aleatoria, y si no lo es, no se pueden
aplicar las deducciones matemáticas que se basan en esta consideración.
Lo mismo ocurre con los cuestionarios que a veces encontramos en las habitacio
nes de los hoteles para que opinemos sobre las instalaciones o la calidad del servicio.
Seguramente sólo responden los que están especialmente disgustados y encuentran en
ese cuestionario una forma de desfogarse, o aquellos que están agradecidos por algo y
lo quieren decir por escrito (y quizá también aquellos a los que les sobra el tiempo y se
entretienen en rellenarlo). La información que se recoge puede ser útil para identificar
cosas que se han hecho bien o que se han hecho mal, pero no para sacar estadísticas
fiables sobre lo que opinan los huéspedes que han pasado por esa habitación.
Salir a la calle micrófono en mano (y cámara al hombro) para saber lo que piensa
la gente sobre algún aspecto polémico y luego emitir sus opiniones en la televisión
95
CONOCER EL TODO MIRANDO UNA PARTE
tras una frase del tipo «hemos salido a la calle para saber lo que piensan los madri
leños sobre ...» puede hacer más dinámico y ameno el programa, pero no sirve para
conocer la opinión de los ciudadanos.
¿Considera usted que debería haber una ley que evite la posibilidad de que los grandes
grupos financieros entreguen elevadas sumas de dinero para financiar campañas
electorales'?
□ SI □ NO
¿Considera usted que debería estar pemiitido que los empresarios y organizaciones
puedan aportar fondos para financiar de forma controlada y transparente las campañas
electorales de los partidos que apoyan?
□ SI □ NO
Dos formas de plantear una pregunta sobre la financiación de los partidos políticos.
Casi todos los encuestados respondían que sí, con independencia de la papeleta
entregada. Pero unos decían que sí a «evitar la posibilidad de que grandes grupos
96
CONOCER EL TODO MIRANDO UNA PARTE
financieros entreguen elevadas sumas de dinero» y los otros a que «los empresarios
y organizaciones pueden a p o rta r fondos». Ya ve, depende de lo que le interese que
salga puede plantear la pregunta de una fo rm a o de o tra y asunto resuelto. P o r eso
es tan im p o rta rte cuál es la pre g u n ta que se hace y c ó m o se hace, y ta m b ié n que
ju n to con los resultados del estudio se in fo rm e sobre cuáles fu e ro n exactam ente las
preguntas que se plantearon.
L o más fá c il y c ó m o d o son las encuestas telefónicas, aunque es e vid e nte que tam bién
presentan algunos inconvenientes. E l te lé fo n o está al alcance de prácticam ente todos,
al m enos en las zonas desarrolladas tecnológicam ente, p e ro u n problem a nuevo puede
ser que las fam ilias jóvenes usen sólo el te lé fo n o m ó v il, p o r lo que su n ú m e ro no
aparece en las guías telefónicas y n o pueden ser seleccionadas p o r ese p ro ce d im ie n to .
H a y que plantearse si puede afectar a la respuesta el hecho de que las casas sin
te lé fo n o fijo hayan quedado descartadas de la muestra. T ie n e m ucha im p o rta n c ia a
qué ho ra se llam a, p o r q u ié n se pregunta o có m o se sustituye a los que n o desean
contestar. D escuidar estos aspectos puede c o n d u c ir a graves errores en las p re d ic
ciones p o r falta de representatividad de la m uestra.
U n c a s o p a r tic u la r : lo s s o n d e o s e le c to r a le s
Los sondeos electorales son una de las aplicaciones estadísticas de las que más se habla
(y lo c ie rto es que n o siempre b ie n ). Este tip o de estudios es singular p o r el interés
que despiertan y porqu e , a diferencia de lo que o cu rre en otros casos, al fin a l se acaba
sabiendo el verdadero v a lo r de los parám etros que se han estimado. E l p ro b le m a es
que, además de las dificu lta d e s habituales para conseguir muestras aleatorias, existen
otras dificultades específicas.Veamos algunas.
Los resultados que se presentan están basados en encuestas realizadas varios días —o
incluso varias semanas— antes de las elecciones. E n algunos países está p ro h ib id o
p u b lica r resultados de sondeos electorales du ra n te u n c ie rto p e rio d o de tie m p o antes
de las elecciones (en España es una semana).
97
¿A quién votarán los indecisos?
Los indecisos son el g ra n problem a para los encargados de realizar sondeos electorales.
N o es ra ro que el porcentaje de los que todavía n o saben a q u ié n vo ta rá n esté entre
el 20 y el 50% de los encuestados. E n estos casos se realiza una asignación de v o to en
C Ó M O O B T E N E R IN F O R M A C IÓ N C O N F ID E N C IA L M A N T E N IE N D O
E L S E C R E T O D E L E N T R E V IS T A D O
Cuando se pregunta sobre comportamientos socialmente mal vistos o de carácter muy personal,
es fácil que el entrevistado engañe. Pero hay formas de obtener esa información preservando
la intimidad del encuestado incluso ante el entrevistador-a. Por ejemplo, supongamos que es
embarazoso contestar « s í » . Para que el entrevistado pueda hablar sin temor, puede actuarse
de la siguiente forma:
1. Se le hace coger una carta de una baraja de póquer, en la que la mitad son negras y la
otra mitad, rojas. Mira la carta sólo él, y la devuelve a la baraja.
2. Si le ha salido roja responde «Sf», mientras que si le ha salido negra responde a la pre
gunta que le han formulado.
Está claro que si responde «sí» el entrevistador no tiene manera de saber si le ha salido una carta
roja o si está respondiendo a la pregunta, con lo que la confidencialidad queda garantizada.
Si se hacen 1.000 entrevistas y 612 personas responden que «sí», aproximadamente 500 lo
harán porque les ha salido la carta roja y esas respuestas hay que descartarlas. De los otros 500,
los que realmente han respondido a la pregunta, 112 han respondido positivamente, luego
nuestra estimación es 112/500 = 22,4%.
98
CONOCER EL TODO MIRANDO UNA PARTE
99
Cuando se realizan sondeos electorales existen muchas dificultades para lograr buenas
predicciones, dificultades que van más allá de aquellas que se refieren al ámbito de
la teoría del muestreo estadístico (por no hablar de manipulaciones y de resultados
interesados). Sería conveniente tener medida la frecuencia y la magnitud con la que
fallan los sondeos electorales serios (de los otros no hablamos), pues al igual que las
malas noticias son las que nos invaden a través de los medios informativos, también las
pifias en las predicciones son más destacadas que los aciertos. Incluso en el ambiente
académico, es más sensacional, a veces más pedagógico y siempre más agradecido,
ilustrar lo que no debe hacerse que mostrar ejemplos en los que las predicciones han
funcionado bien.
También pueden existir, y de hecho existen, encuestas que son el resultado de
consultas interesadas que pretenden influir sobre la opinión de los electores. La ex
periencia y seriedad de la empresa responsable del estudio, así como del medio de
comunicación en el que se publica, también son un buen indicador de la confianza
que merecen los sondeos más allá de ese 95% que se suele indicar en la ficha técnica.
100
C a p ítu lo 4
101
T
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
E l r a z o n a m ie n t o a n te la c a t a d o r a d e té
102
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
T H E
D E S I G N O F
E X P E R I M E N T S
R . A . F I S H E R F R .S .
103
CÓMO RA.lONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
R O N A L D A Y L M E R F IS H E R :
L A P E R S O N A A D E C U A D A EN E L M O M E N T O P R E C IS O
D e s ig n o f E x p e rim e n ts , que marcó el inicio de una nueva época en los planes experimentales
de recogida de datos y que ha tenido grandes repercusiones en la investigación agrícola e
industrial.
104
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
E l p e s o , la e s ta tu ra , e l c o e fic ie n te de c o r r e la c ió n
y s u s ig n if ic a c ió n e s ta d ís tic a
Sabernos que e l peso está relacionado con la estatura, que las personas más altas
tie n d e n a pesar más que las bajas (es verdad que hay excepciones, pero estarnos
hablando de una regla general). N o es una re la c ió n m atem ática; si de a lguien nos
d ice n su estatura n o podrem os calcular su peso aplicando una fó rm u la , p e ro existe
una tendencia, una cierta relación.
E l siguiente g ráfico muestra la relación entre el peso y la estatura de u n g ru p o de
92 estudiantes universitarios (los datos se han o b te n id o de u n archivo que in c o rp o ra el
paquete de software estadístico M in ita b , el m ism o que com entam os en el capítulo 1).
100-
90 -
80 -
o
¡u 70 -
60 -
50 1
40
150 155 160 165 170 175 180 185 190 195
A ltu ra (cm)
¿Usted diría que hay «mucha», «bastante» o «alguna» relación? C o m o com prenderá,
necesitamos ser más concretos para va lo ra r este tip o de situaciones, y para ello existe
una m edida denom inada «coeficiente de correlación» (a veces se añade «de Pearson»).
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
Dl =COEF.DE.CORREL(Al:A92;Bl:B92)
1 —
h l A ! B i c \ D , E
1J 167,64 : 63,56 | 0 ,7 ^ ^ 6 4 1
2 j 182,88 te,83
3, i____ lo e c o _______ __ T i dA i_________________________
106
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
70 '
65
60
• • •
55 '
bC • •
c.
11) 50 -
—
45 -|
40
155 160 165 170 175 180
A ltu ra (cm)
107
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
500
400
300 -
u
Q
o
u
u
200 -
100 -
Vemos que sí, que nuestro valor puede salir cuando las variables son in d e p e n d ie n
tes, pero vem os ta m b ié n que es m u y ra ro que así sea. A n a liz a n d o los resultados de
la sim u la ció n (en el histo g ra m a n o se aprecia) resulta que han salido 12 valores p o r
encim a de 0,494 y 9 p o r debajo de --0,494. Esto significa q u e u n a diferencia respecto
al cero co m o la que nosotros tenem os, o m ayor que ésa, se presenta aproxim adam ente
2 veces de cada 1.000 cuando las variables son independientes.
¿Es nu e stro caso u n o de ésos que se presentan 2 veces de cada 1.000? N o lo
sabemos, pero es poco probable. Seguram ente lo más razonable es considerar que sí
h a y relación en nuestros datos que, p o r c ie rto , co rresponden al peso y a la altura de
las 35 m ujeres que h a y en el g ru p o de 92 estudiantes considerados a n te rio rm e n te .
E s q u e m a d e r a z o n a m ie n to : e l c o n tr a ste d e h ip ó te sis
108
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
¿ Y si n o p u e d e r e c h a z a r s e la h ip ó t e s is n u la ?
109
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
UN C A S O R A R O :
D IS T R IB U C IÓ N D E L C O E F I C I E N T E D E C O R R E L A C IÓ N C O N 3 P U N T O S
Fisher fue el primero en obtener una fórmula general para la distribución del coeficiente de co
rrelación. Las matemáticas que utilizó no son nada elementales y parece que Karl Pearson, otro
i de los prohombres de la estadística y editor de la revista de referencia en su época, no llegó a
entenderla y puso pegas a su publicación. Esto no sentó muy bien a Fisher y el incidente acabó
derivando en enemistad y rivalidad entre los que seguramente eran los mayores estadísticos de
i' la época (lo cual, por otra parte, seguramente no es tan ■raro).
La fórmula ofrece resultados curiosos. Si se tienen 3 puntos correspondientes a variables inde
pendientes, la distribución de los valores que puede tomar su coeficiente de correlación tiene
una forma extraña, justo lo contrario de la omnipresente forma de campana: los valores más
1 probables son los que están a ambos extremos.
Si se tienen 4 puntos resulta que todos los valores del coeficiente de correlación son igual
mente probables. Cuando se tienen 5 puntos el valor más frecuente ya es el cero y a media que
aumenta el número de puntos va apareciendo la «inevitable» forma de campana.
110
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
se considera que es in o c e n te a n o ser que haya evid e ncia s que dem uestren lo
c o n tra rio . Las pruebas que se han id o re c o g ie n d o son las evidencias que estarán
o n o en co n tra de la h ip ó te sis de in o c e n c ia . Si en la ro p a del acusado había san
gre de la v íc tim a es una e vid e ncia clara en co n tra de la h ip ó te sis de in o c e n c ia ,
p e ro si n o la hay, si n o h a y pruebas p o rq u e el d e lito fu e m u y b ie n p la n ific a d o , o
p o rq u e la p o lic ía ha actuado m u y m a l, n o se p o d rá c o n d e n a r al acusado - n o se
p u e d e rechazar la hip ó te sis n u la -, p e ro eso n o s ig n ific a q u e se haya d e m o stra d o
que es in o c e n te .
O t r o e je m p lo : ¿ e s ta b a n e q u ilib r a d o s lo s d a d o s ?
Resultados
1 2 3 4 5 6
_
Discrepancia
74 298 157 417 115 89
(valor absoluto)
Discrepancia
87 116 436 492 302 599
(valor absoluto)
111
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
¿Son estas discrepancias ra zó n s u fic ie n te para sospechar que los dados n o están
equilibrados? ¿O se pueden a trib u ir al azar? A fin de cuentas ta m b ié n sería raro que
cada resultado apareciera exactam ente una sexta parte de las veces. Para salir de dudas
vamos a realizar u n contraste de hipótesis de acuerdo co n el esquema de razona
m ie n to que u tiliz ó Fisher en el caso de la catadora de té. D e entrada supondrem os
que los dados están e q u ilib ra d o s (¿cómo ib a n a estar si no?) y sólo rechazaremos esa
o p c ió n si los datos que tenem os están en c o n tra d ic c ió n c o n ella.
T om arem os c o m o v a lo r relevante para re s u m ir la in fo rm a c ió n d is p o n ib le la
m áxim a discrepancia entre los valores o b te n id o s y los valores esperados. E n la tabla
a n te rio r se puede ve r que para el dado ro jo es de 417 y para el blanco, de 599. La
pregunta ahora es: ¿qué valores cabe esperar para estas discrepancias si el dado está
perfectam ente equ ilibrado? U n a vez más podem os responder a esta pre g u n ta ha
cie n d o sim ulaciones.
S im ulam os el la n za m ie n to de 20.000 dados, con ta m o s cuántas veces sale cada
v a lo r y nos quedam os c o n el que presenta la m á x im a discrepancia c o n el v a lo r
esperado. La p rim e ra vez que lo hem os h e ch o esa m á xim a discrepancia ha sido 83,
la segunda ve z ha sido 97 y después de h acerlo 10.000 veces e l histogram a de los
valores obtenidos es el que fig u ra a c o n tin u a c ió n , y ta m b ié n hem os añadido una
señal en los valores correspondientes a los dados ro jo y blanco.
700 -
600 -
500 -
•u
S 400 -
u
£ 300
200 -
100 - D a d o ro jo D a d o blanco
o J I \
0 50 100 150 200 250 300 350 4 0 0 450 500 550 600
112
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
(3.407 -3 .3 3 3 ,3 3 )2 (3 .6 3 1 -3 .3 3 3 ,3 3 )2 (3 .1 7 6 -3 .3 3 3 ,3 3 )2
3.333,33 3.333,33 3.333,33
(2 .1 9 6 -3 .3 3 3 ,3 3 )2 (3 .4 4 8 -3 .3 3 3 ,3 3 )2 (3 .4 2 2 -3 .3 3 3 ,3 3 )2 ^
3.333,33 3.333,33 3.333,33
S eguram ente esta m e d id a le parece inne cesa ria m e n te co m p lica d a , pero tie n e
la ventaja de que n o es necesario c o n s tru ir p o r s im u la c ió n la d is trib u c ió n que
sigue cuando la hipótesis n u la es c ie rta (la llam am os « d is trib u c ió n de referencia»).
La d is trib u c ió n que sigue esta m edida de discrepancia es m u y c o n o c id a y tie n e
u n n o m b re que raram ente se o lv id a a los que han o íd o h a b la r de ella. Se llam a
«chi-cuadrado» y a este tip o de test se lo d e n o m in a «test de ch i-cu a d ra d o » . Fue
u tiliz a d o p o r p rim e ra vez en 1900 p o r K a r l Pearson, o tr o de los personajes im
po rta n te s en la h is to ria de la estadística (su n o m b re ya había salido al re fe rirn o s al
c o e ficie n te de co rre la c ió n ).
Para los tests estadísticos más habituales n o es necesario o b te n e r la d is trib u c ió n
de referencia p o r s im u la c ió n , sino que se deduce co n ra zo n a m ie n to s m atem áticos.
La fó rm u la que da d is trib u c ió n del co e fic ie n te de c o rre la c ió n es bastante c o m p lic a
da y n o tie n e u n n o m b re específico para ella sola, aunque si el ta m a ñ o de m uestra
es grande se parece m u c h o a una d is trib u c ió n n o rm a l. P o r cie rto , el p rim e ro que
d e d u jo la fó rm u la de esta d is trib u c ió n fue ... R o n a ld A y lm e r Fisher.
113
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
P O C A D IS C R E P A N C IA T A M B IÉ N ES S O S P E C H O S A
Si lanzamos 20.000 veces un dado perfectamente equilibrado, cada uno de los 6 valores que '
pueden salir aparecen alrededor de 20.000/6 = 3.333 veces. Es muy raro que la discrepancia
entre las frecuencias observadas y las teóricas llegue a ser mayor que 250 para algún resultado. I
Esto sólo ocurre del orden de una vez cada 100.000. ■
Pero también es muy extraño que las frecuencias obtenidasse parezcan muchísimo a las previstas.
Por ejemplo, si nos dicen que al lanzar 20.000 veces un dado se han obtenido las frecuencias:
1 2 3 4 5 6
3.333 3.334 3.333 3.333 3.334 3.333
tenemos razones para sospechar de la veracidad de esa información, ya que tal parecido entre
la frecuencia obtenida y la esperada se da menos de una vez cada millón.
Fisher puso de manifiesto una curiosa coincidencia entre los datos experimentales que publicó
Mendel en sus famosos trabajos con plantas de guisantes y los resultados teóricos que cabía
esperar, y lo más sorprendente es que Mendel había previsto un resultado incorrecto para al
gunos experimentos y los resultados experimentales presentaban una sospechosa similitud con
esos valores incorrectos. No necesariamente debía haber sido el mismo Mendel quien cometiera
fraude con los datos, decía Fisher, sino algún asistente que no había hecho su trabajo con dili
gencia y como sabía lo que Mendel quería oír...
Este tema ha generado grandes discusiones. N o sólo es un problema de cálculo de probabilida
des sino también de genética y de botánica cuando se discuten las posibles incidencias que se
pueden presentar en las plantas y que hace que las proporciones obtenidas de unos u otros tipos
puedan variar. La controversia ha sido larga y parece que es difícil sacar conclusiones definitivas,
aunque hay un consenso general en considerar que no existe ninguna evidencia sólida de que
Mendel, o quien fuera, retocara los datos.
H a s t a a q u í , s í; a p a r t i r d e a q u í , n o : f r o n t e r a s p a r a e l p - v a l o r
114
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
115
CÓMO RAZONAMOS PARA TOMAR DECISIONES (ESO QUE LLAMAMOS «CONTRASTE DE HIPÓTESIS»)
116
C a p ítu lo 5
U n e s t u d i o a g r a n e s c a la : l a v a c u n a c o n t r a l a p o l i o m i e l i t i s
La p o s ib ilid a d de inm u n iza rse fre n te a una e nferm edad infecciosa seguram ente ha
sido u n o de los d escu b rim ie n to s que más im p a c to ha te n id o en la lucha contra las
enfermedades y en la m e jo ra de la salud y de la esperanza de vida. Pero cada e n fe rm e
117
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
dad requ ie re su vacuna específica y dar c o n ella n o siem pre es fá c il. E x is te n varios
p ro c e d im ie n to s para prepararlas y en pruebas de la b o ra to rio o en e x p e rim e n to s
con anim ales, o co n h u m a n o s a pequeña escala, se pueden te n e r bastantes pistas
sobre su n iv e l de eficacia. Pero antes de dar una vacuna p o r buena y re co m e n d a r su
uso m asivo a to d a la p o b la c ió n es necesario estar m u y seguro de que sus b e n e fic io s
com pensarán los costos y los riesgos que in e v ita b le m e n te se asumen. Y en estas
pruebas de v e rific a c ió n la estadística tie n e m u c h o que decir.
E n 1954 se re a lizó una prueba a g ra n escala para eva lu ar la eficacia de una
vacuna c o n tra la p o lio m ie litis (la vacuna Salk, desarrollada p o r el e p id e m ió lo g o
Jonas Salk). E l proceso que se s ig u ió está m u y b ie n e x p lic a d o en el lib r o L a e s
118
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
E l grupo de control
119
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
Si unas personas reciben u n tra ta m ie n to (se to m a n una pastilla todos los días, o se
les pone una in ye c c ió n una sola vez, c o m o era el caso de la vacuna Salk) y otros n o
re c ib e n nada, los que han re c ib id o algo, si están convencidos de que eso tie n e algún
efecto curativo, notarán alguna m e jo ría aunque el p ro d u c to carezca com pletam ente
de acción terapéutica. Es lo que se d e n o m in a «efecto placebo». Seguram ente ahí
radica el é x ito de muchas de las llamadas m edicinas alternativas, en eso y en que
muchas dolencias se curan solas, co n tra ta m ie n to y sin él.
E n el caso de la p o lio m ie litis , el n iñ o es afectado p o r la enferm edad o n o es afec
tado, y se p o dría pensar que aquí n o hay p ro b le m a de p e rce p ció n de m e jo ría p o r el
hecho de estar o no estar vacunado. Pero n o todos los casos eran graves n i dejaban
secuelas, y si u n n iñ o que había sido vacu n a d o presentaba síntomas que p o d ía n ser
de p o lio m ie litis , q u izá los padres, y ta m b ié n el m é d ic o , pensarían que d ifíc ilm e n te
el n iñ o se había contagiado (¡estaba vacunado!), y si realm ente era u n caso leve que
evolucionaba bien, p o d ría ser con f u n d id o con o tra enferm edad y acabar siendo u n
caso de in fe c c ió n no registrado. E n cam bio, en los n o vacunados, más atentos ante
cualquier síntom a al sentirse más desprotegidos, seguramente se analizarían los casos
más a fo n d o y serían diagnosticados, lo cual podía c o n d u c ir a la falsa im p re s ió n de
que había una m a y o r in c id e n c ia en el g ru p o de n o vacunados.
Para e vita r q u e el efecto pla ce bo ju e g u e s ó lo a fa v o r d e l g ru p o tratado, en este
tip o de pruebas lo m e jo r es que todos re cib a n u n tra ta m ie n to de apariencia s im i
lar, de fo rm a que n o sepan si están to m a n d o el p rin c ip io a c tiv o o esa fa ls ific a c ió n
c o n el m is m o aspecto y sabor que la p a s tilla real y que llam am os «placebo». Pero
n o sólo el in d iv id u o que p a rtic ip a en el e stu d io no sabe si ha sido in c lu id o en el
g ru p o tratado o en el de c o n tro l (en el caso de la p o lio más que en el n iñ o quizá
h a y que pensar en los padres), sino que el m é d ic o que lo tra ta ta m p o c o sabe si está
to m a n d o el placebo o el p rin c ip io activo. N o es que los m édicos n o sean de fiar,
pero p o d ría darse el caso de que se dejara lle v a r p o r sus p re ju ic io s y si el n iñ o está
en el g ru p o tra ta d o y considera que ha re c ib id o u n tra ta m ie n to cu ra tiv o , tenderá
a in fo rm a r de un a m a y o r m e jo ría , m ie n tra s que si sabe que ha to m a d o u n placebo,
q uizá tie n d a a in te rp re ta r lo que le cu e n ta el p a cie nte fijándose más en lo m a lo
que en lo bueno.
Para que n o exista la p o s ib ilid a d de que esto o c u rra , este tip o de estudios se
diseñan de fo rm a que n i el paciente n i el m é d ic o que lo trata e in fo rm a sobre los
120
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
D IF E R E N C IA S IG N IF IC A T IV A Y D IF E R E N C IA IM P O R T A N T E
121
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
Resultados
Casos de poliomielitis
Población estudiada
N° ] Tasa (x100.000)
Control por placebo:
| Vacunados 200.745 57 28
| Placebo 201.229 142 71
| Control por cursos:
| Vacunados 221.998 56 25
| Grupos de control 725.173 391 54
Los resultados eran similares en las áreas d o n d e se u tiliz a ro n los cursos a n te rio r
y p o s te rio r c o m o g ru p o de c o n tro l y todos quedaron satisfechos de la fo rm a co m o
se había lle va d o a cabo el e x p e rim e n to , ha cie nd o las cosas lo m e jo r que había sido
posible. P ero a pesar de que la dife re n cia era m u y clara a fa vo r del g ru p o tratado, si
n o hubiera existid o el g ru p o de c o n tro l p o r placebo siem pre quedaría la duda sobre
otras posibles interp re ta cio n e s de los resultados.
122
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
La vacuna Salk, aunque supuso u n paso adelante en la lucha c o n tra la e n ferm edad,
n o era todavía enteram ente satisfactoria y a los pocos años fue su s titu id a p o r otra
vacuna más eficaz, que antes de ser usada m asivam ente fue so m e tid a a pruebas
estadísticas diseñadas y realizadas de la fo rm a adecuada. H o y en día, la p o lio m ie litis
es una enferm edad en vías de e x tin c ió n . Sólo quedan cu a tro países en el m u n d o en
los que la enferm edad sigue siendo endém ica: N ig e ria , In d ia , Pakistán y A fganistán.
La O M S , la U n ic e f y o tro s organism os in te rn a c io n a le s han a n u n cia d o que se están
h a cie nd o esfuerzos en estos países y estim an que m u y p ro n to ya n o se p ro d u c irá n
nuevos casos de la enfe rm e d a d . L u e g o habrá que esperar 3 años más para que la
p o lio m ie litis sea declarada o fic ia lm e n te e lim in a d a de la faz de la T ie rra .
A sp ir in a e in fa r to
123
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
124
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
Tabaco y c á n c e r d e p u lm ó n
H o y en día n o hay e vid e ncia más clara y menos d iscu tid a que el hecho de que
«fum ar p e rju d ica seriam ente la salud», pero esto n o siem pre ha sido así. H o y se co
noce cuáles son los com ponentes del h u m o del tabaco que pueden p rovocar cáncer
y se sabe c ó m o actúan para in d u c ir la tra n s fo rm a c ió n de células sanas en células
cancerosas, lo cual se ha dem ostrado e xp e rim e n ta lm e n te co n animales. Pero, co m o
125
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
126
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
entre gru p o s éstas te n ía n que ser debidas al e fe cto de ese fa c to r que actuaba de
fo rm a d is tin ta en los dos g ru p o s . S in e m b a rg o , los estudios sobre la in flu e n c ia
d e l tabaco n o fu e ro n diseños e xp e rim e n ta le s, sino estudios prospectivos, es decir,
existen dos g ru p o s que ya están hechos y observam os c ó m o e v o lu c io n a u n o y
o tro . E n este caso n o se p o d ía o b lig a r a fu m a r a n o fum adores y a que dejaran de
hacerlo fum adores e m p e d e rn id o s. L le va nd o la teoría al e x tre m o , lo ideal h u b ie ra
sido que todos fu m a ra n , p e ro una m ita d elegida al azar fu m a ra tabaco n o rm a l,
y la o tra m ita d una sustancia que se supiera to ta lm e n te in o c u a y que tu v ie ra u n
aspecto y u n «sabor» id é n tic o al d e l tabaco.
Los fa b rica n te s de tabaco p o d ría n a rg u m e n ta r que éste es el ú n ic o e s tu d io
c o rre c to ,y te n d ría n ra zó n , tan c o rre c to c o m o im p o s ib le de lle v a r a cabo. Pero con
los datos disponibles es o b v io , más a llá de to d a d u d a razonable, que el tabaco es
u n fa c to r de riesgo im p o rta n te para el cáncer de p u lm ó n , el cáncer de vejiga, las
enferm edades cardiacas y ta m b ié n o tro s tip o s de enferm edades. La c o n e x ió n entre
cáncer de p u lm ó n y c o n su m o de tabaco se ha observado en m ú ltip le s estudios en
m u y diversos países y c o n te x to s , lo cual e lim in a la p o sible p re d is p o s ic ió n de u n
g ru p o específico de personas, p ero, además, se conoce cuáles son los c o m p o n e n te s
d e l h u m o d e l tabaco que p u e d e n p ro v o c a r cáncer. La hipótesis genética n o puede
e x p lic a r el a u m e n to de in c id e n c ia que se ha p ro d u c id o en las m ujeres cu a n d o
éstas se han in c o rp o ra d o al h á b ito de fu m a r, o el a u m e n to de la in c id e n c ia en n o
fum adores expuestos al h u m o de los c ig a rrillo s de otras personas. E n fi.n, es una
o b vie da d p ero n o siem pre fue así, y la estadística ha estado en la vanguardia d a n d o
argum entos para p o n e rlo de m a n ifie sto .
A le a t o r iz a c ió n y b lo q u e o
127
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
un b u e n in s tru m e n to para asegurar ese e q u ilib r io entre los dos grupos) a los que
to d o afecta exactam ente ig u a l e xce p to el fa c to r c u y o efecto se desea estudiar; p o r
lo ta n to , si existen diferencias sig n ifica tiva s entre los dos g ru p o s (diferencias más
allá de lo que sería a trib u ib le al azar) éstas se a trib u y e n al fa c to r que ha actuado de
fo rm a d is tin ta en los dos g ru p o s. P e ro si además d e l fa c to r que se está estudiando
afectan ta m b ié n otros de fo rm a d ife re n te a cada g ru p o , en el caso de que haya
diferencias entre u n o y o tro n o p o d re m o s saber si son debidas al fa c to r que se
estudia o a cu a lq u ie ra de los otros que ta m b ié n están actuando.
Veamos u n ejem plo. U n o de los te x to s de referencia sobre diseño de e x p e rim e n
tos es S ta tis tic s fo r E x p e r im e n t e n de B o x , H u n te r y H u n te r, en el que se exp lica c ó m o
se diseñó u n e x p e rim e n to para com parar el desgaste de dos m ateriales para fa b ric a r
suelas de zapato para jóvenes. Si se dispone de, p o r eje m p lo , 1O jóvenes para hacer
la prueba, una idea p o d ría ser d iv id irlo s aleatoriam ente en dos grupos de 5: a los
de u n g ru p o darles zapatos con la suela A y a los del o tro , los de la suela B. A l cabo
de u n tie m p o (pongam os 6 meses) se les pid e que vengan co n los zapatos, se m id e
el desgaste de las suelas elaboradas co n cada m a te ria l y se realiza el test estadístico
correspondiente (en este caso sería el lla m a d o test de la t de S tu d e n t para muestras
independientes).
N a tu ra lm e n te , el re p a rto se habría hecho al azar; n o valdría i r al p a tio de una
escuela y p e d ir a los jó ve n es que h icie ra n una fila y a los 5 que llegaran p rim e ro
darles zapatos co n la suela A y a los 5 ú ltim o s c o n la suela B , ya que seguram ente los
p rim e ro s c o rre n más, se m u even más y desgastan más la suela de los zapatos.
Pero este diseño de la recogida de datos tie n e u n problem a. E n el desgaste de la
suela de los zapatos puede in flu ir el m a te ria l (eso se tra ta de saber), pero ta m b ié n
puede in flu ir el niñ o : quizás hay niños que c o rre n m u ch o , e in clu so que ju e g a n al
fú tb o l co n esos zapatos, y otros que c o rre n poco. In clu so puede haber a lg u n o que
apenas se los ponga p o rq u e n o le gusten o p o rq u e le hacen daño, p o r lo que des
gastará p o co las suelas.
A sí pues, si en el desgaste n o sólo in flu y e el m a te ria l de la suela sino ta m b ié n otros
factores, en el caso de e n c o n tra r d ife re n cia n o p o d rá saberse si es debida al m a te ria l
o a esos otros factores. In clu so p o d ría o c u r r ir que n o se encu e n tre n diferencias p o r
el efecto de los factores perturbadores, cuando en re alidad sí las hay.
¿ C ó m o s o lu c io n a r este problem a? Q u e cada n iñ o tenga u n zapato c o n una
suela de u n tip o y o tro c o n la suela del o tro tip o . C o m o los dos pies siem pre van
ju n to s , las diferencias de desgaste h a b rá que atribuírselas al m a te ria l y n o a n in g ú n
o tr o factor.
128
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
W IL L IA M S E A L Y G O S S E T , A L I A S « S T U D E N T »
129
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
130
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
H á g a lo u s te d m is m o
E xiste n leyendas urbanas (¿o quizá n o los son?) cuya veracidad se puede d ilu c id a r
usando la estadística.Veamos algunos ejem plos.
131
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
132
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
Este test es m u y sencillo, y n o tie n e en cuenta si una flo r d ura u n día más que la
o tra o dura una semana más. E xiste n otros tests, c o m o e l lla m a d o de W ilc o x o n para
datos apareados, que sí tie n e n en cu e n ta la d ife re n cia en cada pareja. Pero lo más
im p o rta n te n o es ta n to e l test que se e lig e c o m o asegurarse de que el e x p e rim e n to
se ha p la n ifica d o y realizado de la fo rm a adecuada, y de que n o se extra p o la n las
conclusiones más allá de lo que se ha probado.
133
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
i ¿ C Ó M O S E P A R A R 20 R A T A S E N D O S G R U P O S D E 10
D E F O R M A A L E A T O R IA ?
r Suponga que realiza un trabajo de investigación con ratas de laboratorio para comparar la
S resistencia al esfuerzo cuando se sigue un determinado tipo de dieta (llamémosla A, podría
ser «rica en ácidos grasos saturados» o algo por el estilo) frente a otra (B). Dispone de 20
I ratas similares de aproximadamente la misma edad y características generales; usted las divide
aleatoriamente en dos grupos de 10y a cada grupo fo alimenta con la dieta correspondiente.
Después de unos cuantos meses de cuidados y atenciones, las ratas se someten a una prueba
de esfuerzo que consiste en hacerlas nadar en un recipiente contando el tiempo que tardan
hasta que ya no son capaces de mantenerse en la superficie (en ese momento se las salva).
Los resultados son que el grupo que ha seguido la dieta B tiene una mayor resistencia que el
] A (los tiempos medios de uno y otro grupo presentan una diferencia claramente significativa
a favor del B), y usted está encantado con el hallazgo. Pero... ¿cómo separó las ratas? Al azar,
naturalmente, metió la mano en la jaula y «al azar» separó una, después otra, y asi hasta
tener las 10. Ése fue el grupo A, y el que se quedó en la jaula fue el B. ¿Algo que objetar?
Pues sí. Si lo hizo de esa forma el reparto no fue aleatorio. Haciéndolo de esa forma (metiendo
la mano y sacando la primera que pille) tendrá tendencia a pillar a las más lentas, las que son
más débiles o tienen menos reflejos (las otras son las que se esconden antes), y ésas (el grupo
A) son las que han resultado ser más lentas. ¿Pero son más lentas por el efecto de la alimenta
ción, o.ha salido así porque usted puso las más lentas en un grupo? No hay forma de saberlo.
Moraleja: es muy importante asegurarse de que el reparto en los grupos que se van a com
parar se haga de forma totalmente aleatoria, echando mano de números, papelitos o lo que
sea necesario. Un error en este tema tiene difícil solución.
134
¿ES MEJOR? ¿ES MAS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
garantiza nada. Si todas las pilas fu eran de la núsm a m arca y las divid ié ra m o s
en dos grupos, seguro de que la m edia de u n g ru p o n o sería id éntica a la del
o tro . H ace falta que la dife re n cia sea «estadísticamente significativa».
E sq u e m a pa ra m e d ir la d u ra ció n d e u n a pila.
135
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
Para analizar los datos obte n id o s siem pre es recom endable em pezar representán
dolos gráficam ente. E n u n caso c o m o éste, en el que se tendrá u n n ú m e ro re d u cid o
(p o r ejem plo, de 10 pilas de cada tip o ), bastará con representarlos en diagramas de
puntos y com parar. Puede ser que n o se aprecien diferencias, que se vean de fo rm a
clara, o que la situación sea dudosa. Los test estadísticos deberán c o n firm a r esa im
presión in ic ia l; no puede ser que gráficam ente parezca una cosa y que el test diga
la contraria.
• • •• • .1 • •
• •• — • • • •• N o se aprecian diferencias.
•
•
• •• • •• • •
La m edia del segundo g ru p o
•••
••
•
••
• • • •
• ••• •• N o está claro que la d iferencia
m
•• • • • •• • • sea significativa.
Dl --------—
=PRUEBA.T(A1:A10;B1:B10;1;2)
m A i B ' C
i 9,40 11,371 | 0,01545874|
2 10,56 9,911
3 8,24 10,87
4 9,48 10,52 1
s 17 i n
O b te n c ió n d e l p -v a lo r en un t e s t d e la t d e S t u d e n t c o n Excel.
137
¿ES MEJOR? ¿ES MÁS EFICAZ? CÓMO DISEÑAR PRUEBAS PARA RESPONDER A ESTAS PREGUNTAS
C en tu ry , N u e v a Y o rk , W .H . Freeman, 2001.
T a n j r , J . M . e t A L . , L A e s ta d ís tic a : u n a g u ía d e lo d e s c o n o c id o , M a d rid , A lianza, 1989.
139
Ín d ic e a n a lític o
aleatoriedad 9 2 -9 8 d is trib u c ió n
aleatorización 127-130 b in o m ia l 5 5 -5 8 , 86
aspirina 117 c h i-cu a d ra d o 113
e in fa rto 123-12 5 de Poisson 58-61
y d u ra ció n flores 132-133 de referencia 113
n o rm a l 23, 53, 6 1 -6 8 , 8 4 ,1 1 3
B ehar, R . 10, 90 doble ciego 1 20-121, 124
b lo q u e o 127-130
bolsas de agua 137-138 elecciones presidenciales
B u ffo n , conde de 49 en Estados U n id o s 38, 93
escaños 100
campana de Gauss 53, 6 1 -6 7 , 110 estim ación 68, 7 5 -8 7 , 93, 98, 100
catadora de té 102-1 0 3 , 10 8 -1 0 9 p u n tu a l 86
C h a lle n g e r 40
coe ficie nte falsos positivos 6 8 -6 9
de co rre la ció n 1 0 5 -1 1 O F erm at, P. 4 6 -4 7
de v a ria c ió n 23 Fisher, R .A . 1 0 1 -1 0 4 , 110, 113, 114,
cólera en Londres 11-15 126
contraste de hipótesis 50, 1 0 1 -1 1 6
c o n tro l p o r placebo 12 0 -1 2 2 G a lile o 4 3 -4 4 , 48
correlación 106, 109 G a lto n , F. 53
cuartiles 2 3 -2 4 G allup, G. 93
cuchara para catar la sopa 90, 92 Gauss, F. 6 1 -6 3
cu ch a rilla en el cava 131 goles en la lig a española 58-61
cum pleaños 6 9 -7 2 Gosset,W.S. 129
g ru p o de c o n tro l 119-122
dados equilibrados 50, 111-113
desviación típ ica 19 -2 3 , 3 9 ,6 5 -6 7 hipótesis
diagram a 60, 64 alternativa 109, 136
de puntos 31, 137 nula 1 0 9 -1 1 5 , 122
de ta llo y hojas 32, 33 histogram a 2 9 -3 2 , 35, 61, 64, 84, 108,
diferencia sig nificativa 121, 126, 128, 112
134-136
141
In d ic e a n a l ít ic o
indecisos 9 9 -1 0 0 porcentajes 2 5 -2 7
p ro b a b ilid a d 4 3 -7 3 , 75, 86, 115, 124,
K e r r ic h J . 48 129
p -v a lo r 109, 1 14-116, 122, 136-137
L a n d o n ,A . 93
ley de S tig le r 63 Q u e te le t, A. 62
lo te ría P rim itiv a 55, 67, 68, 7 1 ,7 2 -7 3 , qum cunx 53
84
rango 19
m argen de e rro r 33, 75, 8 6 -9 2 , 95, regla d e la «o» 5 1 ,5 4
100 regla de la «y» 5 1 ,5 2 , 132
m edia a ritm é tica 15-16, 39 R o o se velt, F.D. 93, 118
m ediana 17, 23-25
m e ló n , ¿está en su punto? 132 sal en la sopa 90
M e n d e l, G. 114 Salsburg, D . 103
M é ré , caballero de 46 separar ratas 134
m oda 17-19 S m ith , H . 103
m uertos p o r c o z de caballo 58-61 Snow,J. 11-15
muestra 16, 22, 64, 7 5 -7 7 , 8 1 ,8 7 -9 9 , sondeos electorales 45, 93, 9 8 -1 0 0
1 2 2 ,1 3 4 -1 3 6 sorteo en el se rvicio m ilita r 9 4 -9 5
Stigler, S. 63
N ig h tin g a le , F. 18 S tudent 1 28-130, 136, 137
n ive l de confianza 75, 8 6 -8 9 , 91, 92,
95 tabaco y cáncer de p u lm ó n 125-127
tam año de muestra 8 7 -9 2
paradoja de S im pson 2 6 -2 7 taxis en una ciudad 8 0 -8 3
Pascal, B. 46-4 7
Pearson, K . 49, 110, 113 vacuna de la p o lio m ie litis 117-123,
peces en un lago 7 6 -8 0 126, 127
percentiles 2 4 -2 5 varianza 1 9 -22
pesca y repesca 76
pilas (d u ra ció n de) 133-137 W o lf, R . 49
p o b la ció n 2 1 -2 2 , 7 5 -7 6 , 81, 83, 9 0 -9 2
Poisson, S. 58 zurdos 91
L a c e r t e z a a b s o l u t a
y o t r a s f i c c i o n e s
L o s s e c r e t o s d e la e s t a d í s t i c a