Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
La variabilidad del estimador. Cuánta menos variabilidad tenga, más precisa será la
estimación.
El intervalo obtenido contiene el valor del parámetro poblacional el Q% de las veces que
aplicamos la fórmula a muestras aleatorias simples de tamaño n tomadas al azar.
A partir de aquí, podemos decir que tener una confianza del Q% significa que usamos una
fórmula que acierta el Q% de las veces que la aplicamos. Pero asumimos que en un (100-
Q) % de las veces da un intervalo que no contiene el valor del parámetro poblacional, y no
sabemos cuándo sí y cuándo no. De manera que solo podemos tener una cierta confianza,
fruto del optimismo, de que esta fórmula con nuestra muestra acierta. Es decir, podemos
estar bastante seguros de que acierte, pero no podemos estarlo completamente.
Ejemplo 1:
Esto significará que tenemos un 95% de seguridad en que el aumento medio de alcohol en
sangre de una persona después de beber 4 cañas de cerveza está entre el 40.53% y el 41.87%,
porque este intervalo lo habremos calculado con una fórmula que el 95% de las veces que la
aplicamos a muestras aleatorias de 40 personas da un intervalo que contiene la media
poblacional que queremos estimar. Nosotros somos optimistas y “confiamos” estar dentro
de este 95% de aciertos.
2
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Hay un 95% de probabilidad de que el intervalo [40.53, 41.87] contenga el valor real
del aumento medio de alcohol en sangre de una persona después de beber 4 cañas de
cerveza.
Por definición, un 95% de los intervalos de confianza del 95% para el aumento medio
de alcohol etc. contienen el valor real de este aumento medio.
[40.53, 41.87] es un intervalo de confianza del 95% para el aumento medio de alcohol
etc., obtenido a partir de una muestra aleatoria.
Entonces, [40.53, 41.87] tiene una probabilidad del 95% de contener el valor real del
aumento medio de alcohol etc. en el mismo sentido que si un 95% de las personas
tienen una determinada característica, y cojo una persona al azar, esta persona tiene
un 95% de probabilidad de tener esa característica.
Ejemplo 2:
3
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
No podemos usar formas como “el valor real de θ tiene una probabilidad del Q% de
pertenecer a [a,b]”, ya que no significa lo mismo y se considera falsa.
¿Para qué sirve saber que un IC-Q% para un parámetro θ sea [a,b]?
Existen dos tipos de métodos básicos de cálculo de intervalos de confianza a partir de una
muestra aleatoria:
- De nuestra muestra, tomamos al azar muchas (miles de) muestras aleatorias simples
(permitiendo repeticiones) del mismo tamaño que nuestra muestra.
- Calculamos el estimador para cada una de estas muestras.
- Usamos el vector de resultados para estimar un intervalo de confianza. Por ejemplo,
tomamos como IC-95% el intervalo entre los cuantiles 0.025 y 0.975 de este vector.
4
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
*El bootstrap es una herramienta muy poderosa para calcular intervalos de confianza y, en
general, para estimar la distribución muestral de un estadístico. Tanto, que en la práctica ya
empieza a sustituir los métodos paramétricos. Pero no hace milagros: si la muestra es
pequeña o muy poco representativa de la población, un intervalo de confianza calculado con
el bootstrap no sirve, al igual que si lo hubiésemos calculado con un método paramétrico.
5
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
que significa que para el 95% de las muestras aleatorias simples de tamaño n la μ cae dentro
del intervalo
6
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Ejemplo 3: Después de calcular 200 Intervalos de Confianza del 95% mediante el bloque de
código de R (explicado en los apuntes del profesor) obtenemos el gráfico siguiente:
Si contamos los intervalos rojos, veréis que hemos fallado 11 veces y por lo tanto hemos
acertado 189 veces, es decir, en un 94.5% de los intervalos. Es aproximadamente lo que
esperábamos (95%). Así, hemos comprobado que esta fórmula “acierta”, en el sentido de que
el intervalo que produce contiene la μ, alrededor del 95% de las veces.
Importante. En esta simulación, de los 200 IC-95% que se han calculado, 11 no han
contenido el valor real de μ. Así, podemos decir que un intervalo de confianza no
siempre acierta.
7
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Por lo tanto, estimamos con un 95% de confianza que el porcentaje medio de aumento de
alcohol en sangre después de tomar 4 cañas de cerveza está entre el 40.5% y el 41.9%, o que
es del 41.2% más menos 0.7 puntos porcentuales.
Para el cálculo anterior, hemos supuesto que la variable poblacional tomada sigue una
distribución normal, ¿qué pasaría si no lo fuera?
En este caso, como el tamaño de la muestra n=40 es lo bastante grande como para
poder usar el Teorema Central del Límite (fórmula explicada en la próxima sección).
Nos dice que el intervalo obtenido sigue siendo (aproximadamente) un intervalo de
confianza del 95% para μ.
Si n fuera pequeño y X muy diferente de una normal, no se puede usar esta fórmula y
habría que usar otros métodos (por ejemplo, el bootstrap).
8
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Así, en la fórmula usada en la sección anterior, cambiando 0.95 por q, llegamos al siguiente
teorema:
Esta fórmula se puede usar para el IC-q, para la media poblacional basada en la t de student,
si la variable poblacional es normal o si la muestra aleatoria simple es grande.
La “probabilidad de equivocarnos” se reparte por igual a los dos lados del intervalo ,
ya que en una fracción (1−q) /2 de las veces que apliquemos la fórmula, el valor real
del parámetro estará a la izquierda del extremo inferior y en otra
fracción (1−q)/2 de estas ocasiones estará a la derecha del extremo superior.
Para una misma muestra y una misma fórmula (paramétrica) para calcular el
intervalo de confianza, si el nivel de confianza crece, el intervalo se ensancha.
Ejemplo 6: en el Ejemplo 5, teníamos n=40, ¯¯¯x=41.2 y ˜s=2.1.
El IC-95% tiene q=0.95, por lo tanto, tn−1, (1+q) /2=t39,0.975=2.02, y daba
*Si cambiamos de muestra (o de fórmula, si hay más de una) para calcular el intervalo de
confianza, puede pasar cualquier cosa.
9
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Se explican tres métodos para calcular este intervalo de confianza, que son el método de
Clopper-Pearson, el de Wilson y el de Laplace.
Ventajas:
Se puede usar siempre, independientemente del tamaño de la muestra.
Es “exacto” porque se basa en la distribución exacta de S.
Inconvenientes:
Como los números de éxitos en muestras de tamaño fijo avanzan a saltos (0, 1, 2, 3,…),
suele dar intervalos de confianza más anchos de lo necesario.
Los intervalos que produce no son de la forma “probabilidad muestral ± algo”.
Se necesita un ordenador para calcularlo, no basta una calculadora.
Este método no se puede usar con muestras de cualquier tamaño, han de ser lo
bastante grandes como para poder usar el Teorema Central del Límite.
Se basa en la aproximación a la normal dada por el Teorema Central del Límite, y por
lo tanto el intervalo resultante es un intervalo de confianza “aproximado”, no exacto
como el de Clopper-Pearson. De todos modos, esto no es un gran problema.
Fórmula de Laplace
Tomamos una muestra aleatoria simple de X, de tamaño n todavía más grande, y que el valor
de ˆpX no sea muy próximo ni a 0 ni a 1. Para fijar unas condiciones que suelen ser
suficientes, supongamos que:
n≥100.
10
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
En este caso, en la fórmula del intervalo de Wilson los términos z2(1+q) /2/n son
despreciablemente pequeños comparados con los otros. Si los igualamos a 0, obtenemos la
fórmula siguiente para calcular un IC-q para pX:
Tenemos que saber la fórmula de
Laplace. No hay que saber las
fórmulas de los otros dos
métodos, aunque sí cuándo se
pueden usar y cuándo no.
Esta fórmula es la más popular, y se puede calcular “a mano”. Además, precede en más de
100 años a los otros dos métodos.
Hay que usarla siempre que se pueda, ya que da un intervalo centrado en la proporción
muestral.
Para calcularlo solo podemos usar el método de Clopper-Pearson, y este es uno de los pocos
casos en que este intervalo tiene una expresión analítica sencilla. Si en una muestra aleatoria
simple de tamaño n de una variable Be(pX) obtenemos 0 éxitos, el IC-q de Clopper-Pearson
para pX es
En nuestro caso, n=20, da el intervalo [0,0.1684]. Por lo tanto, estimamos con un 95% de
confianza que menos del 16.84% de los pacientes operados con esta técnica nueva
desarrollan complicaciones importantes en las 24 horas siguientes a la operación.
Regla del 3: cuando en una muestra aleatoria simple de tamaño n de una variable aleatoria
de Bernoulli de parámetro pX no encontramos ningún éxito, un IC-95% para pX va,
aproximadamente, de 0 a 3/n.
11
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Se suele usar cuando se tiene que calcular “a mano” un intervalo de confianza del 95% para
una probabilidad pX a partir de una muestra aleatoria simple donde no ha habido ningún
éxito.
Usando esta regla, en el ejemplo 7 con n=20 obtendríamos el intervalo [0,3/20]= [0,0.15],
no muy lejos del [0,0.1684] que hemos obtenido.
El intervalo de confianza de Laplace es ^pX±M y por lo tanto, si contiene el valor real de pX, el
error |ˆpX−pX| que cometemos cuando decimos que el valor de pX es ^pX es como máximo
este M.
- Típica pregunta al diseñar un estudio: ¿de qué tamaño he de tomar la muestra para
garantizar que el margen de error en la estimación sea como máximo un valor
dado Mmax? En el caso del intervalo de Laplace para una proporción, podemos dar un
tamaño n que garantice un error máximo dado Mmax valga lo que valga ˆpX∈[0,1].
Función y=p(1−p), con p∈[0,1], es una parábola cóncava con vértice en su punto p=0.5.
12
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Concluimos que si tomamos n tal que cumpla ese cáclculo, entonces seguro que M≤Mmax,
valga lo que valga ˆpX.
Por consiguiente, lo que haremos será calcular la n para obtener un margen de error como
máximo Mmax en el caso más desfavorable (o en el peor de los casos): cuando el intervalo
da lo más ancho posible, es decir, suponiendo que ˆpX=0.5.
Teorema
Si se cumple esto, el margen de error del intervalo de Laplace calculado con una muestra de
tamaño n será como máximo Mmax.
13
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
“Poblaciones finitas”
Tomamos una muestra aleatoria sin reposición y la población no es mucho más grande que la
muestra.
Si X una variable aleatoria de Bernoulli Be(pX) definida sobre una población de
tamaño N y tomamos una muestra aleatoria sin reposición de X, con n≥100 y números
de éxitos y fracasos ≥10, un intervalo de confianza de nivel de confianza q para pX es,
aproximadamente,
En las condiciones del punto anterior, para obtener un intervalo de confianza de nivel
de confianza q para pX con un margen de error Mmax en el caso más desfavorable
(ˆpX=0.5) habrá que tomar una muestra de tamaño
Si las dos muestras son grandes, pongamos cada una de 50 o más sujetos, y las proporciones
muestrales no son muy cercanas a 0 o a 1 (para fijar ideas, que en cada muestra haya como
mínimo 5 éxitos y 5 fracasos), un IC-q para la diferencia p1−p2 es, aproximadamente,
14
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Si X1 y X2 son aproximadamente normales o si las muestras usadas son grandes (de nuevo,
digamos, ambas de tamaño como mínimo 40), entonces podemos usar un método
paramétrico basado en una distribución t de Student, que da un intervalo centrado en la
diferencia de medias muestrales, de la forma
Pero el número de grados de libertad ν a usar en el cuantil y el error típico van a depender de
dos factores.
Por un lado, de que las muestras sean independientes (hemos medido X1 y X2 sobre dos
muestras obtenidas de manera independiente la una de la otra) o emparejadas (hemos
medido X1 y X2 sobre los individuos de una misma muestra o hay un emparejamiento natural
entre los sujetos de las dos muestras; en particular, si las muestras son emparejadas ha de
pasar que n1=n2).
Y si las muestras son independientes, la fórmula a usar depende de si las varianzas
de X1 y X2 son iguales o diferentes.
15
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
La hipótesis nula H0 es “no hay diferencia”, “no pasa nada”, “no hay nada extraño” o el
equivalente en el contexto del contraste:
o La moneda es equilibrada (50% de probabilidad de cara).
Por defecto, estamos dispuestos a aceptar H0: que no hay diferencia, que no pasa nada.
o Por defecto, estamos dispuestos a aceptar que la moneda es equilibrada (la mayoría
lo son, ¿no?).
o Por defecto, estamos dispuestos a aceptar que los dos tratamientos son igual de
efectivos (en general, si tomáis dos tratamientos cualesquiera, al azar, y los aplicáis
a enfermos de X, los dos van a ser igual de (in)efectivos).
16
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
17
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
14.2 Un ejemplo
Tenemos una moneda, y creemos que está trucada en favor de cara. Queremos contrastarlo.
Aquí la variable aleatoria X que nos interesa es “lanzamos la moneda y miramos si sale cara”,
que es de Bernoulli con probabilidad de éxito (es decir, probabilidad de sacar cara con
nuestra moneda) pCara.
La hipótesis nula será que la moneda no está trucada (no le pasa nada a nuestra moneda), y la
alternativa (de la que busco evidencia), que la moneda está trucada en favor de cara. En
términos de pCara, el contraste es:
14.2.1 Ejemplo 1
Supongamos que lanzamos la moneda 3 veces y obtenemos 3 caras. ¿Es evidencia suficiente
de que está trucada?
El resultado obtenido no es muy improbable con una moneda equilibrada: pasa, de media,
en 1 de cada 8 secuencias de 3 lanzamientos. Por lo tanto, no vamos a considerarlo
evidencia suficiente de que la moneda esté trucada. Aceptamos que la moneda es
equilibrada.
18
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
14.2.2 Ejemplo 2
Supongamos que ahora lanzamos la moneda 10 veces y obtenemos 10 caras. ¿Es evidencia
suficiente de que está trucada?
14.3 El p-valor
El p-valor es la probabilidad de que si la hipótesis nula es verdadera, el estadístico de
contraste tome en una muestra aleatoria simple del mismo tamaño que la nuestra, un valor
tan o más extremo, en el sentido de la hipótesis alternativa, que el obtenido con nuestra
muestra.
No significa que:
19
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
20
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
14.5 Recapitulación
Nivel de significación, α: probabilidad de rechazar H0 si esta es verdadera (probabilidad
de error de tipo I, de falso positivo).
Estadístico de contraste: lo que calculamos sobre una muestra aleatoria simple y nos
permite definir una regla de rechazo de H0.
Región crítica o de rechazo: el rango de valores del estadístico de contraste para los que
rechazamos H0 con un nivel de significación α dado.
21
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
Por lo tanto, el intervalo de confianza de nivel de confianza 1−α para este contraste es
22
Grado de Medicina (UIB) – Comisión de Apuntes Asignatura: BIOESTADÍSTICA
23