Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lección 5 Página 1 de 35
LECCIÓN 5.
ESTIMACIÓN.
Una Muestra Aleatoria Simple es una muestra aleatoria en la que cada miembro
del grupo tiene la misma probabilidad de ser elegido.
1
Pr( X = 0) = Pr( X = 1) = ... = Pr( X = 9) =
10
Una Tabla de Números Aleatorios es una colección de dígitos que satisfacen
las siguientes propiedades:
2.- El valor de cualquier dígito es independiente del valor de cualquier otro dígito
en la tabla.
Una asignación aleatoria es la que se lleva a cabo sobre los miembros elegibles
de una población conforme se van reclutando en el estudio, es decir la selección
se hace de manera anticipada, antes de conocer siquiera a los pacientes.
Otro tipo de estrategia que se utiliza para evitar sesgos en el manejo de los
individuos sometidos a un estudio clínico es el cegamiento. Se dice que un
estudio clínico es doble ciego cuando ni el médico tratante ni los pacientes
conocen el tratamiento que se está prescribiendo. Se dice que un estudio es ciego
simple cuando sólo los pacientes no conocen el tipo de tratamiento al que están
asignados, pero el clínico si.
n n
xi 1
X = ∑ = ∑ xi
i =1 n i =1 n
Sin embargo es importante señalar que mientras más grande sea el tamaño (n)
de nuestra muestra, más representativa de la media poblacional μ, será nuestra
media muestral x.
queremos estudiar y entonces x debe ser vista como una variable aleatoria
representativa de la media de todas las posibles muestras de tamaño n que
pueden ser obtenidas de la población. Al ser x una variable aleatoria es
susceptible en si misma de tener una distribución a la que se le denomina
distribución muestral.
Simplificado: Sean x1, x2, ... xn muestras aleatorias obtenidas de una determinada
población con media μ. El valor esperado para la media muestral x es E(x) = μ .
L = ∑ i =1 ci X i
n
El valor esperado de una combinación lineal es:
n
E ( L) = ∑ i =1 ci E ( X i ) y la Varianza Var ( L) = ∑ ci Var ( X i ) de aquí que la
n 2
i =1
⎛ n 1 ⎞
Var ⎜ ∑ xi ⎟
Var ( x ) = ⎝ i =1 n ⎠
(Si nos fijamos la varianza de la Media viene a ser el
n
promedio de las varianzas de todas las medias muestrales) y aplicando las
propiedades de la combinación lineal de variables aleatorias tenemos:
⎛1⎞ ⎛ n 1 ⎞ n
1 ⎛ 1 ⎞ n
Var ( x ) = ⎜ ⎟ Var ⎜ ∑ xi ⎟ = ∑ Var ( xi ) = ⎜ 2 ⎟ ∑ Var ( xi )
⎝n⎠ ⎝ i =1 n ⎠ i =1 n2 ⎝ n ⎠ i =1
⎛ 1 ⎞ 2 ⎛ 1 ⎞ σ2
Var ( X ) = ⎜ 2 ⎟ (σ + σ + ... + σ ) = ⎜ 2 ⎟ (nσ ) =
2 2 2
⎝n ⎠ ⎝n ⎠ n
σ2
Si Var ( X ) = entonces la Desviación Estandar o Error Estandar de la Media
n
σ2 σ S
será Var ( X ) = = y es estimado por el cual representa la
n n n
estimación de la Desviación Estandar obtenida a partir de un conjunto de medias
muestrales obtenidas a su vez de muestras repetidas de tamaño n de una
población con una varianza subyacente σ2. (Ver Error Estándar en pagina de
Excel en donde se muestra un ejemplo con muestras de tamaño progresivamente
mayor).
Solución: Lo ideal sería tomar muestras repetidas del mismo tamaño durante
varios periodos menstruales, pero hemos de aceptar que es muy probable que los
valores obtenidos fueran muy cercanos a los ya registrados, así que podríamos
hacer nuestra estimación a partir de la media muestral:
∑ (x − x )
i
2
(36.2 − 36.47) 2 + ... + (36.8 − 36.47) 2 0.321
Var ( x) = S 2 ( x) = i =1
= = = 0.0321
n 10 10
s 0.1791 0.1791
= = = 0.056°
n 10 3.1622
La verdadera media poblacional (μ) se encuentra aproximadamente entre dos
errores estándar (hacia arriba y hacia abajo) de la x [o si se prefiere, entre dos
desviaciones estándar (hacia arriba y hacia abajo) de la distribución de la media
muestral ¡OJO¡ no debe confundirse al error estándar de la media con la
desviación estándar de una observación individual (xi) ]. Entonces, en el caso que
nos ocupa la verdadera media (μ) de la temperatura corporal basal de esta mujer
está entre 36.47° ± 2 (0.056)° = (36.36° – 36.58°), así que cualquier elevación de
0.5° C por arriba de este rango puede significar que la mujer está ovulando.
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 7 de 35
Si X1, X2, ..., Xn son muestras aleatorias de una población con media μ y varianza
Se tiene una población de 200 pacientes recién nacidos cuyos pesos al nacimiento
oscilan entre 2,412 g y 3,430 g y se desea calcular la probabilidad de que el
promedio del peso de una muestra de 10 pacientes tomados a partir de dicha
población esté entre 2,626 y 3,376 g dado que la media poblacional es de 3,000 g
con una desviación estándar de 552 g.
Esto significa que de todas las muestras de tamaño n = 10 que puedan tomarse a
partir de nuestra población de recién nacidos, el 96.8% de las medias se espera
que caigan entre el rango de 2,626 y 3,376 g.
Con frecuencia uno puede estar interesado en obtener intervalos con niveles de
confianza distintos al 95%. El nivel de confianza puede ser expresado como
100% x (1-α), así si α = 0.05 entonces 100% x (1- 0.05) = 100% x 0.95 = 95%
( )
Pr μ − Z1−α /2σ / n < x < μ + Z1−α /2σ / n = 1 − α y respectivamente
también ( )
Pr x − Z1−α /2σ / n < μ < x + Z1−α /2σ / n = 1 − α
( X ± Z1−α / 2σ n)
Es importante darnos cuenta que el que aumente el nivel de confianza, no
necesariamente significa que se está siendo más estricto en la estimación del
rango de valores entre los que puede encontrarse la verdadera media poblacional
(μ), sino lo contrario. El hecho de utilizar más un intervalo con 95% de confianza
se debe a que él representa el espacio contenido por dos (1.96) desviaciones
estándar hacia arriba y hacia abajo de la media de una distribución normal.
Ahora bién, como ya habíamos dicho antes, un IC nos sirve para darnos idea del
rango en el que probablemente esté contenida la verdadera media poblacional (μ),
y esta característica puede tener usos prácticos como en el siguiente ejemplo
también tomado del Rosner.
Como podemos ver la media poblacional de 175 mg/dL está muy por debajo del
límite inferior de nuestro IC, luego entonces, es muy probable que exista
predisposición familiar con respecto al nivel de colesterol.
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 11 de 35
La Distribución t:
(X − μ)
Si X ~ N (μ ,σ 2 ) y Z= entonces Z ~ N (0,1)
σ
(x − μ )
∼ N ( 0 , 1)
⎛ σ ⎞ que dice que el valor obtenido de la diferencia entre la
⎜ ⎟
⎝ n ⎠
media muestral y la media poblacional dividido por el error estándar, tiene una
distribución normal estándar, lo cual está sustentado por el teorema del límite
central. Sin embargo debemos reconocer que esta situación es de alguna manera
artificial, pues la mayoría de las veces la varianza poblacional (σ2) de nuestros
datos no se conoce.
(x − μ )
La distribución ⎛ s ⎞ se conoce como la “Distribución t de Student” y no
⎜ ⎟
⎝ n ⎠
se trata de una sola distribución sino de una familia de distribuciones que están
indexadas por un parámetro que se denominó grados de libertad (gl ó df) de la
distribución y que está directamente relacionado con el tamaño de la muestra.
Figura 5.2
La figura
corresponde a la
gráfica de la
función de
densidad de la
probabilidad. Se
puede apreciar
que la forma de la
distribución (t de
Student), depende
del tamaño de la
muestra. Conforme
k aumenta la
forma es más parecida a la de la distribución normal.
⎛ X −μ ⎞
∼ N ( μ , σ 2 ) y son independientes, entonces ⎜
Si X1, X2, ..., Xn ⎟ está
⎝S/ n⎠
distribuida como una distribución t con (n-1) grados de libertad (df).
Pr(td < td,u) ≡ u (siendo u el área bajo la curva de la distribución t con d grados
de libertad).
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 14 de 35
Solución: Para ello buscamos en la tabla el valor 9 en las columnas y el valor 0.75
en los renglones y esto nos da una probabilidad de 0.764; entonces:
Solución: Pr(t6 < -1.45) = Pr(t6 > 1.45) = 1- Pr(t6 < 1.45) = 1 – 0.901 = 0.099
En el apartado anterior ya, de alguna manera, vimos este caso. Lo que queremos
en términos matemáticos es:
Para calcularlo ya sabemos que: Pr(tn < x ) + Pr(tn > x ) = 1, despejando nos
queda:
Pr(x1 < tn < x2) = Pr(tn < x2) – Pr(tn < x1)
Solución:
Pr(0.75 < t25 < 1.25) = Pr (t25 < 1.25) – Pr (t25 < 0.75) = 0.889 – 0.770 = 0.119
Interpolación lineal:
La expresión:
( x − x1 )
y= ( y2 − y1 ) + y1
( x2 − x1 )
nos permite calcular los valores no
contenidos en la tabla, pero siempre
añade un cierto error cuando se
substituye la función y = f(x) por la
ecuación de la recta que pasa entre
dos puntos conocidos y = r(x), por ello
es conveniente que los puntos x1 y x2
estén lo más próximos posible.
( x − x1 )
Si nos fijamos, la expresión: y= ( y2 − y1 ) + y1 es por completo
( x2 − x1 )
similar a la ecuación de la recta que pasa por dos puntos con intersección en el
eje de las ordenadas: y = mx + b en donde m representa la pendiente de la recta
y −y
que se calcula por trigonometría como m = 2 1 ; si reordenamos los términos de
x2 − x1
( y2 − y1 )
la expresión original quedaría: y= ( x − x1 ) + y1 .
( x2 − x1 )
Solución: Expresado matemáticamente hay que calcular Pr(t10 < 0.87), pero
resulta que el valor de x = 0.87 no viene en las tablas, pero si está el valor para
x1 = 0.85 y para x2 = 0.90. Entonces buscamos:
y = ?, y1 = 0.792 y2 = 0.805
( y 2 − y1 ) (0.805 − 0.792)
y= ( x − x1 ) + y1 = (0.87 − 0.85) + 0.792
( x2 − x1 ) (0.90 − 0.85)
0.013 0.00026
= (0.02) + 0.792 = + 0.792 = .0052 + 0.792 = 0.7972
0.05 0.05
Solución: Para ello buscamos en la Tabla Inversa sobre la columna del 0.85 y en
la fila correspondiente a 5 grados de libertad y obtenemos:
x = 1.155768
lim
tn ( x) = N (0,1) Por lo tanto se puede hacer una aproximación de la
n→∞
distribución t de Student de n grande a través de la tabla de
distribución normal estándar.
(
Pr x − tn −1,1−α /2 s / n < μ < x + tn −1,1−α /2 s / n = 1 − α )
Ejemplo tomado del Rosner:
Si X1, X2, ..., Xn son muestras aleatorias de una población con media μ y varianza
σ2, la Varianza de la Muestra: s2 es un estimador no sesgado de σ2 sobre
todas las muestras aleatorias de tamaño n que puedan ser obtenidas a partir de
esta población. Esto es, el valor esperado de la varianza muestral es la varianza
poblacional (E(s2) = σ2). Dicho de otra forma, si se toman muestras repetidas de
tamaño n a partir de una misma población y se calcula la varianza de cada
muestra (s2), el promedio de un gran número de varianzas de tales muestras de
tamaño n será la varianza poblacional (σ2)
Entonces:
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 22 de 35
1 n
s =
2
∑
n − 1 i =1
( X i − X )2 En palabras: es la sumatoria de los cuadrados de
La distribución Xi Cuadrada.
Así como para calcular los intervalos de confianza para la media cuando nuestra
muestra es limitada, tuvimos que utilizar la distribución t; para poder calcular los
intervalos de confianza para la varianza, tenemos que utilizar una nueva familia
de distribuciones: la distribución Xi cuadrada. (se pronuncia ji cuadrada)
Debido a que la forma de la distribución está regida por k ó n ó n-1 (los grados
de libertad) el valor esperado de una distribución X2n es precisamente n ó k ó
(n-1) y su varianza es 2n ó 2k ó 2(n-1). Entonces:
Así como lo hicimos con la media poblacional (μ) para estimar intervalos de
confianza a través de la media muestral (x), para estimar intervalos de confianza
para la varianza poblacional (σ2), necesitamos encontrar la distribución muestral
de nuestra varianza (s2).
Si recordamos de lo ya visto cuando hablábamos de la distribución normal, si una
variable aleatoria X tenía una distribución normal con media μ y varianza σ2,
nosotros podíamos crear una nueva variable Z a través del proceso de
estandarización que consistía en restarle a nuestra variable la media poblacional y
dividirla entre la desviación estándar poblacional, y de esa forma teníamos una
variable con una distribución normal estándar, con media 0 y varianza 1.
Expresado matemáticamente:
(X − μ)
Si X ~ N (μ ,σ 2 ) y Z= entonces Z ~ N (0,1)
σ
Bien, pues de manera análoga lo podemos hacer con una variable cuadrática a la
que llamaremos yi2 y que representará a todas las varianzas de las muestras que
podamos tomar de una población subyacente que suponemos tiene una
distribución normal, de tal forma que:
n n
( xi − μ ) 2 n
Si X ~ N (μ ,σ 2 ) y ∑y =∑
i =1
2
i
i =1 σ 2 entonces ∑y
i =1
2
i ∼ X n2 ,
n
( xi − μ ) 2 n
( xi − x ) 2
∑
i =1 σ 2
∼X 2
n ahora ∑
i =1 σ 2
∼ X n2−1 [1]
∑(X i − X )2 n
s =
2 i =1
de aquí podemos pasar a (n − 1) s = ∑ ( X i − X ) 2
2
n −1 i =1
n
Si ahora substituimos ∑(X
i =1
i − X )2 por (n − 1) s 2 en [1] tenemos:
(n − 1) s 2 σ2
∼X 2
n −1 de aquí podemos pasar a s ∼ 2
X n2−1
σ2 (n − 1)
Esta última fórmula dice que la varianza muestral tiene una distribución Xi
σ2
cuadrada con n-1 grados de libertad multiplicada por la constante
(n − 1)
matemáticamente: (
Pr μ − 1.96σ / n < x < μ + 1.96σ / n = .95 y )
respectivamente también (
Pr x − 1.96σ / n < μ < x + 1.96σ / n = .95 )
Entonces, un Intervalo de Confianza (IC) 95% para μ cuando σ2 se conoce,
está dado por:
⎝ n −1 n −1 ⎠
Pero como lo que nos interesa es obtener intervalos con el 100% x (1-α) de
confianza para la varianza poblacional (σ2) que no conocemos y que
pretendemos estimar a partir de nuestra varianza muestral (s2), vamos a
manipular la desigualdad o inequidad anterior de manera similar a lo que hacemos
con las igualdades, equidades o ecuaciones; utilizaremos sólo la de la izquierda,
pues la inequidad derecha es similar:
σ 2 X n2−1,α / 2
< s2 de aquí podemos pasar a: σ 2 X n2−1,α / 2 < ( n − 1) s 2
n −1
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 27 de 35
( n − 1) s 2
y, de esta última a:
σ < 2
2
de manera análoga la inequidad derecha
X n −1,α / 2
( n − 1) s 2
quedaría así:
< σ 2
y combinándolas tenemos:
X n2−1,1−α / 2
( n − 1) s 2 ( n − 1) s 2
2
<σ 2
< y de aquí podemos decir que la
X n − 1,1 − α / 2 X n2− 1,α / 2
probabilidad de que la varianza poblacional (σ2) se encuentre entre estas dos
desigualdades es igual a 1-α:
⎡ ( n − 1) s 2 ( n − 1) s 2 ⎤
Pr ⎢ 2 <σ 2
< ⎥ =1−α
2 , entonces:
⎣⎢ X n − 1,1 − α / 2 X n − 1,α / 2 ⎦⎥
deben notarse los subíndices de Xi2 : n-1, 1-α/2 para el lado izquierdo del
intervalo y n-1, α/2 para el lado derecho. Esto se debe a que la distribución Xi2 no
es simétrica con respecto al 0 como lo son las distribuciones normal estandarizada
y la distribución t, pues debido a que se trata de valores cuadráticos, todos son
positivos y por las mismas razones el valor mínimo y máximo del intervalo no son
simetricamente proporcionales con respecto al valor de s2, a diferencia de lo que
ocurre con las otras distribuciones cuyos intervalos de confianza si son simétricos
y proporcionales al valor de x.
∑ (X i − X )2
[ −6 − ( −.2)]2 + [3 − ( −.2)]2 + ... + [ −2 − ( −.2)]2 5.82 + 3.2 2 + ... + 1.82 73.56
s =
2 i =1
= = = = 8.1733
n −1 10 − 1 9 9
⎡ ( n − 1) s 2 ⎤
, ( n − 1) s
2
⎢ 2 2 ⎥ = ⎡⎣ 9 s 2 / X 92, 0 .9 7 5 , 9 s 2 / X 92, 0 .0 2 5 ⎤⎦ =
⎣ X n − 1 ,1 − α / 2 X n − 1, α / 2 ⎦
[9 (8 .1 7 3 3 ) / 1 9 .0 2 , 9 (8 .1 7 3 3 ) / 2 .7 0 ] = (3 .8 6 7 4 , 2 7 .2 4 4 3 )
Pr(X2n-1 < x ), en donde el subíndice n-1 representa, en este caso, los grados de
libertad (que también se expresa con frecuencia como k ó n simplemente)
Ejemplo:
En lenguaje matemático sería ¿Cuál es Pr(X2k < x) en este caso, Pr(X24 < 1.2) ?
Pero ¿qué hacemos cuando se trata de valores de Pr(X2k > x) (mayores de x)?
En lenguaje matemático: ¿Cuál es Pr(X2k > x) en este caso, Pr(X24 > 1.2) ?
Solución: Pr(X2k > x) = 1- Pr(X2k < x); por tanto Pr(X24 > 1.2) = 1- Pr(X24 < 1.2)
En imágenes sería:
Expresado matemáticamente escribimos: Pr(x1 < X2k < x2), siendo x1 < x2 . Pues,
al igual que lo hicimos con las distribución t de Student, tenemos que:
Pr(x1 < X2k < x2) = Pr(X2k < x2) - Pr(X2k < x1)
Ejemplo: ¿Cual es la probabilidad de que una variable con distribución X2k con 8
grados de libertad se encuentre entre 3.4 y 5.6 ?
Es decir: Pr(x1 < X2k < x2) = Pr(3.4 < X28 < 5.6) = Pr(X2k < 5.6) - Pr(X28 < 3.4)
y en este caso: Pr(X28 < 5.6) = 0.308063 y Pr(X28 < 3.4) = 0.093189 entonces:
La interpolación lineal:
La función chi-cuadrado es continua para x mayor que cero, pero en la tabla sólo
se presentan algunos de sus valores, para calcular los valores no recogidos en la
tabla, al igual que lo hicimos para la distribución t de Student, podemos emplear
la Interpolación lineal. Para una explicación mayor referirse a la pagina 18 de
este documento.
( x − x1 ) ( y2 − y1 )
La expresión: y= ( y2 − y1 ) + y1 ó y= ( x − x1 ) + y1
( x2 − x1 ) ( x2 − x1 )
nos permite calcular los valores no contenidos en la tabla, pero siempre añade un
cierto error cuando se substituye la función y = f(x) por la ecuación de la recta que
pasa entre dos puntos conocidos y = r(x), por ello es conveniente que los puntos
x1 y x2 estén lo más próximos posible.
( y2 − y1 ) 0.123932 − 0.098751
y= ( x − x1 ) + y1 = (1.75 − 1.6) + 0.098751
( x2 − x1 ) 1.8 − 1.6
0.025181
y= (0.15) + 0.098751 = 0.0188857 + 0.098751 = 0.1176367
0.2
Entonces: Pr(X25 < 1.75) = 0.1176367
En este caso la pregunta es: Para una distribución X2k de k grados de libertad
¿Cuál es el valor de x que deja a su izquierda una probabilidad (o que tiene una
probabilidad acumulada) p ?
( y2 − y1 ) 0.2 − 0.1
y= ( x − x1 ) + y1 = (1.2 − 1.064) + 0.1
( x2 − x1 ) 1.649 − 1.064
0.1
y= (0.136) + 0.1 = 0.1709 × 0.136 + 0.1 = 0.1232
0.585
Entonces Pr ( X24 < 1.2 ) = 0.1232
Lim
X k2 ( x) = N ( k , ( x)
Dicho matemáticamente: k →∞ 2k ) y en este caso
Entonces, sea
X = ∑ Xi , en donde Xi = 1. Es decir que X representa el
i =1
número de observaciones en las que se produjo el evento de interés entre el total
de observaciones que conforman la muestra (n), de tal forma que cada Xi
corresponde a un ensayo Bernoulli independiente del resto en donde si se produjo
el evento (por ejemplo una enfermedad).
1 n X
pˆ = ∑ X i = y ya que ^p es una media muestral podemos
n i =1 n
σ2 pq pq
Var ( pˆ ) = = y se ( pˆ ) =
n n n
Por tanto, para cualquier muestra de tamaño n, la proporción de eventos en la
muestra ^p es un estimador no sesgado de la proporción de eventos en la
población p. El error estándar de esta proporción está dado por: pq / n y
Supongamos también que se logra colectar una muestra de 5,000 votantes que sí
desean cooperar con la “encuesta de salida”, entonces: dejaremos que la variable
aleatoria Xi represente la voluntad del votante, en donde si la iava persona votó por
el PAN Xi = 1 y si votó por cualquier otro partido Xi = 0, siendo i = 1, 2, 3, ..., 5000
la etiqueta que identifica a la 1ª, 2ª, 3ª, ..., 5000ava persona respectivamente.
Autor: Jorge Maza V Apuntes de Bioestadística. Lección 5 Página 35 de 35
1 n X 1000
pˆ = ∑ X i = = = 0.2 es decir el 20%
n i =1 n 5000
Ahora que tenemos la proporción muestral calculemos la varianza y el error
estándar de nuestra muestra:
Para poder estimar el intervalo por el método de la teoría normal, debemos asumir
que la aproximación normal a la distribución binomial es válida, de tal manera que
el número de eventos, representados por X, observados a partir de n elementos,
estarán normalmente distribuidos con una media np y una varianza npq; o
correspondientemente, la proporción de eventos observados a partir de n
elementos = ^p = X/n, está normalmente distribuida con una media p y una
varianza pq/n.