Está en la página 1de 146

Distribución normal estándar Si una distribución es simétrica y con forma de campana el 95% se

Ejemplo de la normal estándar (ver clase de ayudantía) encuentra entre ≈ III. '

desu .

Tabla z: variables estándar Icaza para una variable z


Metodología de estandarizar la variable para poder utilizar la tabla Ejercicio 1. Se sabe que la Presión Arterial Diastólica (PAD) de
Una variable aleatoria 𝑋~𝑁 𝜇, 𝜎2 se puede estandarizar
cierta población distribuye Normal(80,144).
"

"" " "" de° "" "


aplicando a cada observación proveniente de 𝑋 la =
E ± 2

80+24=104

transformación |

|
80-24=54
=

𝑧 = 𝑥 − 𝜇/ 𝜎
:

* ± nae
l 80+-12=92
La nueva variable aleatoria 𝑍 tendrá distribución 𝑍~𝑁 0,1 . /
l
8o ± 12
=
68 .

i I
Este valor z se conoce como z-score. En el área de la salud es
,

,
,

ampliamente utilizado para clasificar como sano o enfermo a I I :|


' '
diferentes poblaciones. Por ejemplo, estado nutricional o presión
'

arterial en niños.
564-@0ari-.w 104
• ¿Cuál es la probabilidad de que un sujeto seleccionado al azar
Se calcula para cada edad tenga PAD inferior a 90? pcxcaol
PAY <
90-100-2 )
=

Buscar como funciona el z score en 2 diapos explicadas.

Ejemplo 1: Se generan 300 datos tal que 𝑋 = 𝑃𝑒𝑠𝑜 ~ 𝑁(65, 25) ↳ Plz <
¥2 0/(0/83) → ahora se

4%+9%2+0.7967
=

E
• Se dice que un sujeto es hipertenso si su PAD≥90, ¿cuál es la
pz :X
probabilidad de que un sujeto seleccionado al azar sea
hipertenso? Px : dentro
tabla
de la
.

PAD
• ¿Cuál es el valor de la presión arterial a partir del cual se
encuentra el 10% de los casos más severos (más altos)?

PCXLK) 0.90
=

-0¥ )
PIZLK = 09
Propio peso restar 65 (media de la distribución)
Ahora la media está en 0
Y se divide por la variación estándar va a quedar mas chica la
1

K .

despejar
variabilidad R = 95,36
de PAD
Peso-65/5 ¥280 =
428 →

j.is?Iaoiiw
Inferencia
Estimación e Intervalos de Confianza

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Estimación puntual

2. Intervalos de confianza.

facultadmedicina.uc.cl 3
Introducción

Muestra

Análisis descriptivo Inferencia

Población

facultadmedicina.uc.cl 4
Introducción

Los parámetros poblacionales ( 𝜇, 𝜎 2 , 𝑝 ) se consideran


habitualmente como cantidades fijas, pero desconocidas. Luego,
interesa estimarlas a partir de una muestra.
Interesa que los estimadores muestrales sean un buen reflejo de
los parámetros poblacionales
muestral .pro#EIond Parámetros

(desconocidos)
Estimadores
(conocidos)
x → promedio

2 Varones poblacional
s varianza  2→ + = d. E

'Ü⊕
@ → pavoumetr p̂
→ proporción
nuestra p proporción Población
poblacional poblacional
Muestra h :

facultadmedicina.uc.cl 5
Introducción

La inferencia es una rama de la estadística con métodos y


herramientas que nos permiten generalizar los resultados
obtenidos a partir de una muestra, a la población de la cual
procede y representa.

Las principales herramientas para realizar inferencia estadística


son:

• Estimación Puntual
[0ns:
• Estimación Intervalar-

• Contraste de Hipótesis

facultadmedicina.uc.cl 6
Estimación Puntual

facultadmedicina.uc.cl
7
Estimación Puntual

facultadmedicina.uc.cl
8
Estimación Puntual

facultadmedicina.uc.cl
9
Estimación Puntual

facultadmedicina.uc.cl
10
Estimación Puntual

facultadmedicina.uc.cl
11
Estimación Puntual

facultadmedicina.uc.cl
12
Estimación Puntual

facultadmedicina.uc.cl
13
Estimación Puntual

facultadmedicina.uc.cl
14
Estimación Puntual

Ya vimos que para una muestra aleatoria 𝑥1 , … , 𝑥𝑛 proveniente


de una población, podemos obtener valores basados en los
estimadores muestrales que nos permitan estimar puntualmente
el o los verdaderos parámetros poblacionales.

El problema es que para distintas muestras el valor del


estadístico cambia (concepto de variabilidad muestral).

facultadmedicina.uc.cl
15
Intervalos de Confianza

Intervalo de Confianza: rango de valores (calculado en una


muestra) que cubre al verdadero valor del parámetro, con verdadero
una
estimador nuestra para construir
en un

probabilidad determinada. para metro

La probabilidad de que el verdadero valor del parámetro se


encuentre cubierto por el intervalo construido se denomina
1-. nivel de confiar
nivel de confianza, y se denota por☐ Ya

El nivel de significancia [significance level] se simboliza por  y


corresponde a la probabilidad de error, es decir, a la probabilidad
de que el verdadero parámetro poblacional quede fuera del
intervalo de confianza.

facultadmedicina.uc.cl
16
Intervalos de Confianza

Generalmente se construyen intervalos con confianza


1-=95% (o significancia =5%). Menos frecuentes son los

intervalos con =10% o =1%. a =
es el error determina
,

la significancia

Así, el intervalo de confianza permitirá entregar una medida de


variabilidad asociada a la estimación del parámetro.

facultadmedicina.uc.cl
17
Intervalos de Confianza

La línea roja muestra el valor del parámetro


desconocido 𝜇, al que le estamos
calculando un intervalo de confianza a
partir de cada una de las 𝑘 muestras.
5 de las nuestras no contienen al
para metro .

IC95%: si tuviéramos 100 muestras de la


variable aleatoria, y en cada una
calculáramos el promedio y luego el IC,
entonces se espera que 95 de esos
intervalos cubran al verdadero valor del
parámetro.

IC99%:si se construyen IC de 99% de


confianza, se espera que 1 de cada 100
intervalos no contenga al verdadero valor
del parámetro.
facultadmedicina.uc.cl
18
↓ Interferencia ↓

✗puede ser categórica ◦ numérica P M


-

Msp :(proporción
porcentaje) Intervalos de Confianza
o

sin numérica Il promedio ) o de (5)

"

!:*
entero .am

:
/

facultadmedicina.uc.cl
Beneficios nutricionales y metabólicos asociados con la actividad y el transporte público: resultados de la Encuesta
Nacional de Salud 2016-2017. Passi et al. (2020)
✗~ NI u, ) → INN ( Mi
si ✗ diestoibuye normal entonces
no

Nfcx) → In Nu, TV)


,
el

.
t.ae
Intervalos de Confianza para µ 642-41.961=0.95
tiro

sENNlui_ jInTR.MhTC.EBoodG@Ptl.G
-

Ü

Espí Nloit 2-
↳ consumo en
las-4M¥.IS

Suponga que 𝑥1 , … , 𝑥𝑛 es una muestra aleatoria proveniente de


una población Normal 𝜇, 𝜎 2 y se quiere construir un intervalo
de confianza para 𝜇.

• Caso 1: n es suficientemente grande (n>30) y 𝜎 2 se estima


usando el valor muestral 𝑠 2 .

𝑥ҧ − 𝜇
𝑍= ∼ Normal(0,1)
𝑠/ 𝑛

facultadmedicina.uc.cl 20
?⃝
Intervalos de Confianza para µ

𝑃(−1.96 < 𝑧 < 1.96) = 0.95 Distribución z


Luego, si una variable 𝑋 tiene
distribución Normal 𝜇, 𝜎 2 , el 95% 2.5%
95% de las veces:
ҧ
𝑥−𝜇
-1,96 < < 1,96 −1.96 1.96
𝑠/ 𝑛
S / Mi
LIM
1,96 Jj ( 1.96
.

- .

Despejando  : ↓ 𝑠 𝑠
𝑥ҧ − 1,96 ∗ ≤ 𝜇 ≤ 𝑥ҧ + 1,96 ∗
𝑛 𝑛
E- 1.96
.

551A <
M< I + 1.96 VA
El resultado, es un intervalo de confianza al 95% para la media 
cuando la variable 𝑋 es Normal, con 𝑛 > 30 y 2 desconocido.
facultadmedicina.uc.cl 21
Intervalos de Confianza para µ

facultadmedicina.uc.cl
üú . Intervalos de Confianza para µ

' ¥2 E. ✗ +
ÍᵗZt%'s
En general, para cualquier α tenemos que:
𝑥ҧ − 𝜇
P 𝑧𝛼 ≤ ≤ 𝑧1−𝛼 = 1 − 𝛼
2 𝑠/ 𝑛 2
Despejando

𝑠 𝑠
P 𝑥ҧ − 𝑧1−𝛼 ⋅ ≤ 𝜇 ≤ 𝑥ҧ + 𝑧1−𝛼 ⋅ =1−𝛼
2 𝑛 2 𝑛
𝑠
𝜇 ∈ 𝑥ҧ ± 𝑧1−𝛼 ⋅
2 𝑛

facultadmedicina.uc.cl 23
?⃝
Intervalos de Confianza para µ

Ejercicio 1
La detección a tiempo del retraso cognitivo severo en niños que nacen
muy prematuro es crucial, ya que determina su capacidad cognitiva en el
futuro. La prueba de Lenguaje BSDI (Bayley scale of infant development)
es una prueba que se aplica a niños de 2 a 8 años, y que tiene por objetivo
medir el grado de capacidad cognitiva del niño. Se sabe que los puntajes
de esta prueba siguen una distribución Normal.

Un investigador aplica esta prueba a un grupo de 45 niños/as nacidos muy


prematuros y obtiene un puntaje promedio de 100 y d.e. de 15.

Construya un IC de 95% para la media poblacional  del puntaje BSDI.


Construya además un IC de 99% bajo los mismos supuestos.
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Solución:

La distribución es Normal, luego el intervalo de 95% de confianza es:


100 − 1.96 ∗ 15/ 45 <  < 100 + 1.96 ∗ 15/ 45

Es decir, 𝟗𝟓, 𝟔 <  < 𝟏𝟎𝟒, 𝟒. Luego, el puntaje medio poblacional (de
niños de 2 a 8 años nacidos muy prematuros) se estima entre 95,6 y 104,4
puntos con una confianza de 95%.

Para construir el intervalo con confianza 99%, se debe usar z=2.575 en vez
de z=1.96. Luego, el intervalo es:
100 − 2,575 ∗ 15/ 45 <  < 100 + 2,575 ∗ 15/ 45

Es decir, 𝟗𝟒, 𝟐 <  < 𝟏𝟎𝟓, 𝟕


facultadmedicina.uc.cl
Intervalos de Confianza para µ

Seguimos bajo el supuesto que X es proveniente de una población


Normal 𝜇, 𝜎 2

• Caso 2: Si n es pequeño y 𝜎 2 se estima usando el valor


muestral 𝑠 2 . Se utiliza:

𝑥−𝜇
𝑇= ∼ t − Student(𝑛 − 1)
𝑠/ 𝑛

facultadmedicina.uc.cl
Intervalos de Confianza para µ

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Del gráfico se tiene que:

𝑥−𝜇
P 𝑡𝛼,(𝑛−1) ≤ ≤ 𝑡1−𝛼,(𝑛−1) = 1 − 𝛼
2 𝑆/ 𝑛 2

Por la simetría de la t-Student(n-1), y de forma análoga al Pivote


Z, se obtiene que:
𝑆
𝜇 ∈ 𝑥 ± 𝑡1−𝛼,(𝑛−1) ⋅
2 𝑛
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Para construir el intervalo de 95% de confianza para  es


necesario calcular el percentil 97.5% de la t de Student con n-1
grados de libertad.

s s
X − t0.975,( n−1)     X + t0.975,( n−1) 
n n

Notar en la tabla T que a medida que el tamaño muestral crece,


el percentil 97.5% de la distribución t de Student se aproxima al
percentil respectivo de la distribución normal estándar.

facultadmedicina.uc.cl
Tabla
t-Student

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Ejercicio 2
Desarrolle el mismo Ejercicio anterior, pero suponga ahora que el
investigador aplica esta prueba a un grupo de 25 niños/as nacidos muy
prematuros y obtiene un puntaje promedio de 100 y d.e. de 15.

Construya un IC de 95% para la media poblacional  del puntaje BSDI.


Construya además un IC de 90% bajo los mismos supuestos.

Solución:
T con n-1=24 g.l.
Para una confianza de 95% se tiene que t=2,064.
Para una confianza de 90% se tiene que t=1,711.

facultadmedicina.uc.cl
Intervalos de Confianza para µ

• Caso 3: Si no se puede asumir que X ~ Normal y n es


suficientemente grande (>30), entonces por TCL se
puede usar Z o T

Ejercicio 3: para los datos del Ejercicio 1,


Construya el IC si no se sabe nada acerca de la
distribución de probabilidad de los puntajes.

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Caso 4: Si no se puede asumir que X ~ Normal y n no es


suficientemente grande (n<30):

Posibles caminos:

(i) Transformar los datos para conseguir Normalidad (por


ejemplo log(X)). El IC se obtiene igual que en el punto
anterior.

(ii) No hacer IC para . Muy usado para n chico (en ese caso se
hacen IC para la mediana, por ejemplo, o no se hacen IC).
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Resumen:
Sea X una variable aleatoria continua. Se tienen observaciones
𝑥1 , … , 𝑥𝑛 de esa variable aleatoria.

facultadmedicina.uc.cl
Población
Intervalo de Confianza para 𝒑

Suponga que 𝑥1 , … , 𝑥𝑛 es una muestra aleatoria proveniente de


una población Bernoulli 𝑝 y se quiere construir un intervalo de
confianza para 𝑝.

Por el Teorema del Límite Central tenemos que

𝑝(1 − 𝑝)
𝑝~Normal
Ƹ 𝑝,
𝑛
Donde se estima
𝑝(1 − 𝑝) 𝑝(1
Ƹ − 𝑝)Ƹ
=
𝑛 𝑛
facultadmedicina.uc.cl 35
Intervalo de Confianza para 𝒑

Luego, para muestras grandes se tiene que :


𝑝Ƹ − 𝑝
𝑍 = ~Normal(0,1)
𝑝Ƹ ⋅ (1 − 𝑝)/𝑛
Ƹ

Y el I.C. de nivel α queda dado por

𝑝 ∈ 𝑝Ƹ ± 𝑧1−𝛼 ⋅ 𝑝Ƹ ⋅ (1 − 𝑝)/𝑛
Ƹ
2

facultadmedicina.uc.cl 36
Intervalo de Confianza para 𝒑

Es decir, procediendo en forma análoga al caso de la media,


podemos construir un intervalo de 95% de confianza para la
proporción poblacional P.

𝑝Ƹ ⋅ 1 − 𝑝Ƹ 𝑝Ƹ ⋅ (1 − 𝑝)Ƹ
𝑝Ƹ − 1,96 ⋅ ≤ 𝑝 ≤ 𝑝Ƹ + 1,96 ⋅
𝑛 𝑛

facultadmedicina.uc.cl
37
Intervalo de Confianza para 𝒑

Ejercicio 5.
La Encuesta Nacional de Salud 2009-2010 arrojó que 237
personas de 65 o más años padecía de cataratas de un total de
998 personas muestreadas en ese grupo etario. Construya un
intervalo de confianza para la verdadera proporción 𝑝.

0,24 ∙ 1 − 0,24 0,24 ∙ 1 − 0,24


0,24 − 1,96 ⋅ ≤ 𝑝 ≤ 0,24 + 1,96 ⋅
998 998
0,214 ≤ 𝑝 ≤ 0,266

Interpretación. La prevalencia poblacional de cataratas en personas de 65 o


más años se estima en 24.0%. Con una confianza de 95%, el intervalo que va
desde 21,4 a 26,6 contendrá al verdadero valor del parámetro.
facultadmedicina.uc.cl
38
Intervalo de Confianza para 𝒑

Hipertensión en relación con estado nutricional, actividad física y etnicidad en niños


chilenos entre 6 y 13 años de edad (NutrHosp 2016)

facultadmedicina.uc.cl
Intervalo de Confianza para 𝒑

Hipertensión en relación con estado nutricional, actividad física y etnicidad en niños


chilenos entre 6 y 13 años de edad (NutrHosp 2016)

facultadmedicina.uc.cl
facultadmedicina.uc.cl
clase 1

Probabilidades
Distribución Normal

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Distribución Normal
2. Distribución Normal Estándar
3. Propiedades
4. Ejercicios

facultadmedicina.uc.cl
Distribución Normal n

[Normal distribution]
La principal distribución en estadística es la llamada distribución
Normal, distribución de Gauss o distribución Gaussiana. Su
importancia radica en que: normal
comportandistribución
q
'
se
como

• permite modelar numerosos fenómenos naturales, sociales y


psicológicos.
• varios procedimientos estadísticos usados habitualmente
asumen la normalidad de los datos observados.
promedio lo queimporta
con

simetría
media
y
esto es

facultadmedicina.uc.cl
Distribución
Distrito uci Normal

flx)
Cualquier función que tenga .

de d. estándar)
Ian2a ( Zble
día
¥91

la define media y
distribuye Normal
una una varianza
variaba ✗ , y
2 normal
✗distribuye normalµ →
de distrito
N para metros
.

~


E. Él ¥5
=
=

indica donde está la torva


tomar
varianza solo debe
valores positivos .

facultadmedicina.uc.cl
?⃝
La media es la 9-
'
ubica a la distribución .

Distribución Normal

pero la
aquí cambia Sigman es la misma
media
-

media ubica a la
distribución .

facultadmedicina.uc.cl
Distribución Normal


µ
.

caso continuo se calcula prob en intervalos


en
.

Por complemento se tiene: Para dos valores dados 𝑎nopunt


y 𝑏uakspot
(conesv.a.n.con.tn
𝑎 < 𝑏) se tiene:
𝑃 𝑋 ≥ 𝑏 = 1 − 𝑃(𝑋 < 𝑏)
✗ ~ N (3,4)
: Plain )
Pixar ) PLXLO)
-
𝑃 𝑎 < 𝑋 ≤ 𝑏 = 𝐹 𝑏 − 𝐹(𝑎)
facultadmedicina.uc.cl
Distribución Normal Estándar
[Standard Normal Distribution]

, an me
,¡ ay , ua,
¡ ama ,
¿
ama
mama
tiene la particularidad de
la
2 #Inviable aleatoria pero pertenecera

normal stand ar


¡
^
'

p r o b . a e ? m e I i z . - fa D = - P l z s - 2
)

facultadmedicina.uc.cl
Distribución Normal Estándar

esto produce
un efecto espejo .

lo
q piden
'

Dibujar

Propiedades: como 𝜇 = 0 entonces


mmmm

• 𝑃 𝑋 ≤ 𝑧𝑝 = 𝑃 𝑋 ≥ −𝑧𝑝 efecto espero .


1 -
( XL
-

Zp)

ü
ÁL
• 𝑃 𝑋 ≤ 𝑧𝑝 = 1 − 𝑃 𝑋 < −𝑧𝑝 o equivalentemente
=

- Z

Φ 𝑧𝑝 = 1 − Φ −𝑧𝑝
facultadmedicina.uc.cl
Distribución Normal Estándar

Tabla de la Distribución Normal Estándar. Resultado de


(2-(0-72)
1010.74
Φ 𝑧𝑝 = 𝑝 para 𝑧𝑝 > 0.
=

qirJi jYvY_vdecimawalorz.LEo3@lt.i
¿ Que valor z a comerla al 84T .

facultadmedicina.uc.cl
Distribución Normal Estándar

encuentra ≈ en
se

facultadmedicina.uc.cl
Distribución Normal Estándar

Una variable aleatoria 𝑋~𝑁 𝜇, 𝜎 2 se puede estandarizar


aplicando a cada observación proveniente de 𝑋 la
transformación La nuevavariable
va a

𝑥−𝜇 distribuir normal ( 0,11


𝑧=
𝜎
La nueva variable aleatoria 𝑍 tendrá distribución 𝑍~𝑁 0,1 .
Este valor z se conoce como z-score. En el área de la salud es
ampliamente utilizado para clasificar como sano o enfermo a
diferentes poblaciones. Por ejemplo, estado nutricional o presión
arterial en niños.

facultadmedicina.uc.cl
cualquier variable normal puede pasar
estándar si le Resto la media
a ser una ,
yo
Y divido la desviación estándar .

por

Distribución Normal Estándar

Ejemplo 1: Se generan 300 datos tal que 𝑋 = 𝑃𝑒𝑠𝑜 ~ 𝑁(65, 25)


Histograma de Peso
Normal
60
-
Media 64,87
Desv.Est. 4,709
-
n.de
N 300 personas
50 en esta
tabla
A- delta
40
Frecuencia

Peso -65 =
algunos pueden quedar con A
con _
o A -1
30
todas las distancias ql
tendrian que sumar
generamos
O
20
.

estos deltas
la nueva variable de
la misma pero
10 tienen ,

central O .

cada de esos deltas , divide


0 Si a uno se
5
48 52 56 60 64 68 72 76 por la desviación estándar que es

media
achica la variabilidad
Peso
se
.

facultadmedicina.uc.cl
Estandarizar :
restar la media
y ,

la desviación
dividir ✗

estornudar

Distribución Normal Estándar


ver esto

¿Y si a cada observación le resto ¿Y si ahora cada delta lo divido


la media? por la d.e.?

Histograma de Peso - 65 Histograma de (Peso-65)/5


Normal Normal
50 Media -0,02648
Media -0,1324 40
Desv.Est. 4,709 Desv.Est. 0,9419
N 300 N 300

40
30

Frecuencia
Frecuencia

30

20
20

10
10

0 0
-13,5 -9,0 -4,5 0,0 4,5 9,0 13,5 -3 -2 -1 0 1 2

Peso - 65 (Peso-65)/5

facultadmedicina.uc.cl
Distribución Normal Estándar

facultadmedicina.uc.cl
Distribución Normal Estándar

facultadmedicina.uc.cl
Distribución Normal Estándar

facultadmedicina.uc.cl
Ejercicios

Ejercicio 1. Se sabe que la Presión Arterial Diastólica (PAD) de


→ desviación estándar de 12

cierta población distribuye Normal(80,144).


• ¿Cuál es la probabilidad de que un sujeto seleccionado al azar
menor
tenga PAD inferior a 90?
• Se dice que un sujeto es hipertenso si su PAD≥90, ¿cuál es la
probabilidad de que un sujeto seleccionado al azar sea
hipertenso?
• ¿Cuál es el valor de la presión arterial a partir del cual se
encuentra el 10% de los casos más severos (más altos)?

facultadmedicina.uc.cl
Ejercicios

facultadmedicina.uc.cl
Resumen

facultadmedicina.uc.cl
facultadmedicina.uc.cl
flasel
Probabilidades
Distribución del promedio bajo Normalidad
Teorema Central del Límite

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos
variabilidad muestral :

1. Variabilidad

2. Distribución del promedio muestral bajo Normalidad.

3. Teorema Central del Límite.

4. Distribución del promedio y de una proporción.

facultadmedicina.uc.cl 3
Variabilidad

Estudiar una muestra no es lo mismo que estudiar a toda la


población: toda muestra tiene una variabilidad asociada.

Este concepto de variabilidad proviene del hecho que cada


muestra extraída será siempre diferente a otra potencial
muestra.

Ejemplo 1. Recordemos el ejemplo que muestra la edad de 350


casos de cáncer al pulmón (asumamos que es la población
completa), pero sólo tenemos acceso a la edad de 10 de estos
pacientes.

facultadmedicina.uc.cl 4
Variabilidad

64 66 46 71 65 73 61 70 27 80 52 61 39 76 49 63 72 62 62 53 86 69 60 66 70

75 58 90 73 85 75 44 74 52 80 50 65 45 78 84 59 40 57 67 48 54 74 54 44 65

64 76 73 50 59 54 74 60 42 74 83 60 83 73 60 67 70 44 52 68 76 69 63 86 62

84 65 41 73 57 73 69 91 70 47 54 29 51 55 68 47 59 73 63 61 59 43 58 65 48

73 59 63 66 48 60 55 62 55 63 75 80 67 92 63 63 72 95 61 61 86 60 63 58 46

79 75 93 45 72 60 78 72 47 65 77 57 50 64 33 52 63 69 51 53 54 45 71 45 39

63 73 75 49 61 41 70 72 43 64 69 43 63 57 53 62 61 71 59 45 79 70 63 51 51

71 42 45 71 62 38 79 50 50 49 54 67 65 49 67 85 84 52 42 68 49 56 69 66 63

76 44 72 65 64 49 60 71 61 71 59 59 62 58 73 57 67 77 66 56 48 61 49 51 75

51 50 73 78 58 76 53 71 44 53 70 74 72 66 25 56 65 67 88 63 60 68 69 68 63

49 63 68 62 71 67 60 80 63 30 81 81 39 81 57 49 62 61 49 52 70 68 59 64 72

51 63 59 67 33 62 61 63 51 45 56 43 49 79 52 70 56 67 48 53 86 65 53 46 73

65 38 40 80 63 57 67 42 57 71 46 58 92 53 51 55 88 58 61 52 58 49 67 53 56

68 76 81 65 50 79 42 81 47 79 46 77 69 62 50 51 50 82 57 82 61 56 66 68 39

facultadmedicina.uc.cl 5
Variabilidad

La edad media de estos 350 pacientes de cáncer al pulmón es


61.87 años.
Al repetir 40 veces el experimento de tomar 10 casos
consecutivos y calcular la edad media, se obtuvieron los
siguientes resultados:

61,5 58,0 61,4 62,8 54,4 69,0 65,6 62,3 56,3 57,8
Promedio de los
10 casos del 65,8 59,6 65,4 74,4 64,7 60,8 69,3 56,8 58,6 63,1
recuadro
66,8 61,3 63,0 60,2 64,9 61,0 63,0 59,8 64,3 66,6

65,9 53,5 61,8 57,6 61,3 65,4 65,8 60,1 59,2 69,2

facultadmedicina.uc.cl 6
Variabilidad

"
?
esta
no
son
tabú
Representación gráfica: las queleyó y

75 Representati
mas
depende
vas
tamaño
del

muestra
70

65
Promedio

60

55

50

45
0 10 20 30 40
Muestras
40 Muestras de Tamaño 10

facultadmedicina.uc.cl 7
Variabilidad

Representación gráfica:
75

70

65
Promedio

60

55

50

45
0 10 20 30 40
Muestras
40 Muestras de Tamaño 30

facultadmedicina.uc.cl 8
Variabilidad

Representación gráfica:
75

70

65
Promedio

60

55

50

45
0 10 20 30 40
Muestras
40 Muestras de Tamaño 100

facultadmedicina.uc.cl 9
Variabilidad

Toda muestra tiene asociada cierta variabilidad. Esto se refleja


en que cada vez que tomemos una muestra, el promedio
calculado será diferente al que hubiéramos obtenido otra
muestra, a pesar de que provengan ambas muestras de una
misma población.

Mientras menor sea el tamaño de la muestra, el promedio


tendrá una mayor variabilidad asociada, y viceversa.

facultadmedicina.uc.cl 10
Variabilidad

Desviación estándar
Se simboliza por la letra σ (población) o s (muestra) y se calcula
como la raíz de la varianza.
𝑛
1
𝑠= ෍(𝑥𝑖 − 𝑥)ҧ 2
(𝑛 − 1)
𝑖=1

Para la muestra de edades,

𝑠 = 194.2667 = 13.938
facultadmedicina.uc.cl
11
Variabilidad

La medida de dispersión para medir la variabilidad del promedio


es el error estándar.

El error estándar [standard error]: mide la variabilidad esperada


del promedio muestral como estimación de la media
poblacional. Depende del tamaño de la muestra y se calcula
de mientras más crezca

como: variabilidad
>

estándar
n . el error de

datos
𝑠 los disminuye
la media

más chico
𝑆𝐸𝑀 = del tamaño .
Si n es

𝑛 Rail muestral el estándar


más grande
error
hace
se

÷ :*:{ 𝑠 13.9
En la muestra de ejemplo: 𝑆𝐸𝑀 = = ≈ 4.4
𝑛 10
facultadmedicina.uc.cl 12
Variabilidad

una medida
interesa tener
variabilidad muestral
• de

:
'
Hand"

desviación
datos
:

cuantificar
^ de los
variabilidadestándar intentael promedio
variar
el error puede
cuanto

facultadmedicina.uc.cl 13
teorema: si lo>datos distribuyen normal ,
el promedio distribuye
normal .

Distribución del promedio bajo Normalidad

Simulación µ d
Se generan 2000 datos con ~𝑁(18,9)

Histograma de Normal
Normal
1 60
Media 1 7,93
Desv.Est. 3,053
1 40 N 2000

1 20
• al

• ? 1 00
Frecuencia

•¥
de
promedio


80
esperaría al
° un
° g, saco
"
60
muestra ,
torno
esta en
mete
40 que
18
si la poblacion de origen
.

20

0
9 12 15 18 21 24 27
Normal

facultadmedicina.uc.cl 14
Distribución del promedio bajo normalidad

Muestra Media DesvEst N


1 17.38 2.46 50
Se obtienen 40
2 17.56 2.70 50 muestras de tamaño
3 17.63 2.65 50
4 18.42 3.24 50
50.
5 18.18 2.80 50
6 18.26 3.01 50
7 17.81 3.56 50
8 18.20 3.13 50
9 18.33 2.12 50
10 17.45 3.28 50
11 18.79 2.65 50
12 17.53 2.41 50
13 18.45 2.43 50
14 18.22 2.86 50
15 17.82 3.23 50
16 18.33 3.42 50
17 17.70 3.45 50
18 18.23 2.17 50
19 18.63 2.68 50
20 18.08 2.81 50 facultadmedicina.uc.cl 15
Distribución del promedio bajo normalidad

Forma
parecida
pero
esuu
Histograma de las tiene
la
una
origfnalpnaj varias
Histograma de Media
Normal
medias obtenidas Mucho
of
a

10 Media 1 7,88
Desv.Est. 0,4087
de 40 muestras. N 40

8
la variabilidad es mucho
menor que los datos originales
Frecuencia

\
4

0
1 7,2 1 7,6 1 8,0 1 8,4 1 8,8 O
Media
TME.io
:

Bob

facultadmedicina.uc.cl 16
Distribución del promedio bajo normalidad

q¡ÜIm%TÑÍ
el

ÜÍÍ
"
pasa
promedio
.

Esto

" el
en
se
" una
población disminuye normal con una media y unavarianza
el Promedio distribuye
gym y (µ
" " "" como nana,
(µ , → ,

Sea 𝑋 es una v.a. que toma valores 𝑥1, 𝑥2, … , 𝑥𝑛, donde cada
18,32)

↳I~NH8í% m
2 1 𝑛
𝑥𝑖 ~ 𝑁(𝜇, 𝜎 ) y 𝑥ҧ = σ𝑖=1 𝑥𝑖 , entonces: kN /
𝑛

2 𝑋−𝜇 ത
ത 𝜎 Τ
𝑋 ~ 𝑁(𝜇, 𝑛) o equivalentemente, 𝜎 ~𝑁(0,1)
𝑛

La d.s. del promedio es 𝜎ൗ 𝑛 , se denomina error estándar


poblacional y se estima por 𝑠ൗ 𝑛.

facultadmedicina.uc.cl 17
?⃝
Distribución del promedio bajo normalidad

Ejemplo 2.

Si la edad de una población de niños en estudio tiene XNN / 6,154

distribución Normal, con media =6 y varianza 2=2.25, PCX>9)


=
1- PIXLG )
)

^ᵗª"""""""""÷
=L pl -2<345
✗"
-

= 1- PLZCZ
-0.9772=0.0228
215%-0.028 =p
.

• ¿Cuál es la probabilidad de que un niño de esa población


tenga más de 9 años?

• ¿Cuál es la probabilidad de que el promedio de las edades de


10 niños de dicha población sea mayor de 9 años? EEE
el
:

PIINOD 1- PIXLOII

X~NK.it#)--EEiE:IPlIk91--PlZl9o-G-g )
-
-

=P/ZLG/ tienen.

'

≤ 1-1=0
I
I
5
.
I

6 ¥ facultadmedicina.uc.cl 18
Teorema Central del Límite (TCL) tamaño muestra
n = .

[Central Limit Theorem] HYON


la distribución de
importa origen no distribuya normal
'
no
q
qi tener alguna media y alguna varianza
pero tiene .

si eltamaño muestra es suficientemente grande , entonces


de todas formas el promedio distribuye normal con rueda
µ y varianza
5%

Sea 𝑓(𝑥) una función densidad con media poblacional  y


varianza finita 2. Sea 𝑋ത el promedio de una muestra aleatoria
de tamaño 𝑛 de 𝑋 ~ 𝑓(𝑥).
' ⊖
IKI Si la nuestra

Entonces: %

𝜎2

𝑋~𝑁 𝜇, cuando 𝑛 → ∞
𝑛
n > 30

facultadmedicina.uc.cl 19
Teorema Central del Límite (TCL)

Basta que la v.a. 𝑋 tenga distribución con varianza finita 2 y


media poblacional , para que el promedio muestral tenga
distribución Normal, cuando el tamaño muestral es grande.
Una variante del TCL se obtiene al estandarizar:

𝑋ത − 𝜇
𝜎 ~𝑁(0,1)
𝑛

facultadmedicina.uc.cl 20
Teorema Central del Límite (TCL)

Ejemplo 3: Distribución de la edad al momento de morir de


N=103,325 individuos en Chile el año 2015.

La media poblacional de la 3500


Histograma de Edad

edad al momento de morir


media
3000

es =70,8 años. La varianza 2500


desviación
es 2=384,2 (=19.6)
varianza .
estándar

Frecuencia
2000

1 500
la distribución no es normal .

1 000

500


0
si la nuestra fuera
muy pequeno puede ,
salir 0 16 32 48 64 80 96 112
cualquier cosa .

Edad

facultadmedicina.uc.cl 21
Teorema Central del Límite (TCL)

El error estándar de muestras tamaño 40 es 3,09.


La distribución de los promedios de edad para muestras
tamaño n=40 toma forma Normal. Esto verifica que se cumple
el TCL.

La figura ilustra los


promedios de 1000
muestras de tamaño
𝑛 = 40.
Promedio=70,9
s.d.=3,09
facultadmedicina.uc.cl 22
Teorema Central del Límite (TCL)

Ejemplo 3b.

No se conoce la distribución de IMC de una población de adultos


en estudio, pero se sabe que la media es de 27 y varianza de 9,

• ¿Cuál es la probabilidad de que un adulto tenga un IMC


individual de
Prob
'
no
porq, es una .

superior a 28?una

su
poblacion que
distribución .
no conozco

• ¿Cuál es la probabilidad de que el promedio de IMC en una


puedo que la
muestra de 10 adultos sea superior a 28? muestra muy
no

es
ya

pequeña

• ¿Cuál es la probabilidad de que el promedio de IMC en una


muestra de 40 adultos sea superior a 28?
facultadmedicina.uc.cl
calculan en variables
se
categóricas .

Distribución de una Proporción P

Sea 𝑷 la proporción poblacional de personas que poseen cierta


característica de interés (por ejemplo, la proporción de personas
con obesidad en RM, porcentaje de jóvenes con lesión en la
rodilla en la UC, etc.).
Si el tamaño muestral es grande, el Teorema Central del Límite
nos asegura que la proporción muestral de casos con la
característica tiene distribución Normal:
ej:p 0.46
=

muestras de la población 0.45 0.48 0.46 0.50.39


tomo muchas
𝑃(1−𝑃)

g.¡
proporción de
muestra mido la
𝑃~𝑁 𝑃, cuando 𝑛 → ∞ proporciones tienden
a una
estas
en cada
y van a normal
entonces esas proporciones distribución . -

Ya que
hombres ,
distribuir normal . 𝑛 espero que me salgan mias
cercanas a 0.46 .

facultadmedicina.uc.cl 24
Distribución de una Proporción 𝒑

F- de
De una población de 3000 personas, donde el 60% son hombres,
se toman 80 muestras de tamaño 100, y en cada una se observa
la proporción de hombres obtenida.
Histogram of P Estimado
Normal
18

16

14
Mean
StDev
N
0.6045
0.04888
80
* →
%
12
Frequency

10

2
r
0
0.50 0.55 0.60 0.65 0.70
P Estimado

facultadmedicina.uc.cl 25
Distribución de una Proporción 𝒑

Ejemplo 4.
Se sabe que la prevalencia de hipertensión en una población
adulta es 𝑃 = 0,15.
Calcule la probabilidad de que en una muestra aleatoria de 100
personas, la proporción de hipertensos sea superior a 0.2

F~Nlo.rs FIEL
Y
PIP > 0.21=1-4%0.21
P < e.
2) Plz
) =p / 2- <
=

Ojazos) PIZLO MI e. 55A


- =
=
-

facultadmedicina.uc.cl 26
Resumen

• El TLC sirve para calcular probabilidades cuando se


quiere inferir sobre el promedio o la proporción de
una variable aleatoria.

• La idea detrás del TLC es que el promedio/proporción


es una cantidad aleatoria, luego, en muestras
suficientemente grandes, seguirán una distribución
Normal con
𝑃(1−𝑃) 2

𝑃~𝑁 𝑃, y 𝑥ҧ ~ 𝑁(𝜇, Τ𝑛) cuando 𝑛 → ∞
𝜎
𝑛

facultadmedicina.uc.cl
facultadmedicina.uc.cl
Probabilidades
Distribución Chi-cuadrado y t-Student

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Distribución Chi-cuadrado
2. Distribución t-Student

r
facultadmedicina.uc.cl 3
Distribución Chi-cuadrado
→ para metro de la
Sea 𝑋 una v.a. que sigue una distribución Chi cuadrado con ☐
𝑘 grados distribución

de libertad [degrees of freedom], es decir, X ~ χ2(𝑘) .

wantomenagrado~
de
libertad
"
grado
"
l "W
de
→ libertad más asimétrica es
gagoouó ,
,

→ "
#" A medida que aumentan
de
" Lor
gogó grados de libertad se va
"
haciendo más simétrica , se
y "
va asemejando a una Forma
" normal .

spot

todos los valores que
toma
la variable aleatoria son
positivos .

Esta distribución es asimétrica y tiene un parámetro: los grados de


libertad. Notar que la v.a. (continua) toma solo valores positivos
facultadmedicina.uc.cl 4
percentihes

e
Tabla
Chi cuadrado
columna grados de
libertad
1
:
dit
las prob estar
. en el margen EEI
valor de la variable
y el
aleatoria está
la tabla .
adentro de
¡É

facultadmedicina.uc.cl 5
Distribución Chi-cuadrado

Ejercicio 1 (Distribución Chi cuadrado)


Sea X una variable aleatoria con distribución Chi cuadrado con 5
O
grados de libertad, es decir, X~χ(5) .

• ¿Cuál es la probabilidad de que X tome un valor menor a


12.83? lo 0.975 97,5% de probabilidad
= =
.

• ¿Cuál es la probabilidad de que X tome un valor mayor o igual


a 12.83? 0.975 1-0.975 0.025
= =

• ¿Cuál es la probabilidad de que X tome un valor inferior a


0.83? 0.025 y

En la figura de la diapositiva 5, identificar la densidad de la Chi(5)


y los puntos 0.83 y 12.83 y confirmar la no simetría.
facultadmedicina.uc.cl 6
Distribución Chi-cuadrado

I Y
12.83
0.83
.

facultadmedicina.uc.cl 7
Distribución t Student
Sea 𝑋 una v.a. que sigue una distribución t-Student con 𝑘 grados de
libertad, es decir, X ~ 𝑡(𝑘) . f-
Student es simétrica

lor de
cuando
disminuye grados
hacen maí
libertad , las colas se
damos
pesadas ,
es decir , les
los valores
más probabilidad a

más del
alejados 0 .

O O
Esta distribución es simétrica en torno al cero y tiene un parámetro:
los grados de libertad.
facultadmedicina.uc.cl 8
Distribución t Student

Sea 𝑋~𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡(𝑘). Se tiene que:


0
Toma valores en el intervalo (−∞, ∞) . aunque está centrada
en
-
- La forma de la distribución t Student es similar a la normal,
pero con colas más pesadas.

-
- En la medida que aumentan los grados de libertad 𝑘, la
distribución t se va asemejando a una Normal.

facultadmedicina.uc.cl 9
percentiles ( prob. acomodadas )
,

¥
Tabla
t-Student
:::
de la

:
÷
¡
facultadmedicina.uc.cl 1
0
Distribución t Student

Ejercicio 2 (t-Student).

Sea Y una variable aleatoria con distribución t Student con 3


grados de libertad, es decir, Y~t (3) .

• ¿Entre qué valores se encuentra el 95% central de la


|
"" valores
9m
distribución? p
entre.
0.025
y p
.
0,975 -3,182
y
3.182
corresponden esos dos :

• ¿Entre qué valores se encuentra el 95% central de la


distribución si ahora Y tiene 30 grados de libertad? -2.042 y 2.042
• ¿Entre qué valores se encuentra el 95% central de la
distribución si ahora Y distribuye Normal estándar? 1.96 y 1.94 -

facultadmedicina.uc.cl 11
Resumen

Dos nuevas distribuciones continuas formadas a partir de la


Normal estándar: t Student y Chi cuadrado.

• t -Student está centrada en 0; toma valores de −∞ a +∞.


• El centro de la Chi cuadrado depende de sus grados de
libertad; toma valores entre 0 e infinito (positivo).

facultadmedicina.uc.cl 12

facultadmedicina.uc.cl
Inferencia
Estimación e Intervalos de Confianza

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Estimación puntual

2. Intervalos de confianza.

facultadmedicina.uc.cl 3
Introducción

Muestra

Análisis descriptivo Inferencia

Población

facultadmedicina.uc.cl 4
Introducción

Los parámetros poblacionales ( 𝜇, 𝜎 2 , 𝑝 ) se consideran


habitualmente como cantidades fijas, pero desconocidas. Luego,
interesa estimarlas a partir de una muestra.
Interesa que los estimadores muestrales sean un buen reflejo de
los parámetros poblacionales Paramuericas
media
variables Parámetros


(desconocidos)
Estimadores
(conocidos)
x
2
:*
'

s  2
µ:

p̂ p Población

Muestra
facultadmedicina.uc.cl 5
Introducción

La inferencia es una rama de la estadística con métodos y


herramientas que nos permiten generalizar los resultados
obtenidos a partir de una muestra, a la población de la cual
procede y representa.

Las principales herramientas para realizar inferencia estadística


son:

• Estimación Puntual
• Estimación Intervalar
• Contraste de Hipótesis

facultadmedicina.uc.cl 6
Estimación Puntual

facultadmedicina.uc.cl
7
Estimación Puntual

facultadmedicina.uc.cl
8
Estimación Puntual

correcto
"
es "'
no
decir fija
es "
ción
} que se

la
estima
'

puntualum
en en

el
en error
de

facultadmedicina.uc.cl
9
Estimación Puntual

facultadmedicina.uc.cl
10
Estimación Puntual

facultadmedicina.uc.cl
11
Estimación Puntual

facultadmedicina.uc.cl
12
Estimación Puntual

facultadmedicina.uc.cl
13
Estimación Puntual

facultadmedicina.uc.cl
14
Estimación Puntual

Ya vimos que para una muestra aleatoria 𝑥1 , … , 𝑥𝑛 proveniente


de una población, podemos obtener valores basados en los
estimadores muestrales que nos permitan estimar puntualmente
el o los verdaderos parámetros poblacionales.
no considera la variabilidad muestral
El problema es que para distintas muestras el valor del
estadístico cambia (concepto de variabilidad muestral).

facultadmedicina.uc.cl
15
Intervalos de Confianza

Intervalo de Confianza: rango de valores (calculado en una


muestra) que cubre al verdadero valor del parámetro, con una
probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se
encuentre cubierto por el intervalo construido se denomina
confianza
nivel de confianza, y se denota por 1-. →

El nivel de significancia [significance level] se simboliza por  y


corresponde a la probabilidad de error, es decir, a la probabilidad
de que el verdadero parámetro poblacional quede fuera del
intervalo de confianza.

facultadmedicina.uc.cl
16
Intervalos de Confianza

Generalmente se construyen intervalos con confianza


1-=95% (o significancia =5%). Menos frecuentes son los
intervalos con =10% o =1%.
✗ es el error ,

determina la significancia
Así, el intervalo de confianza permitirá entregar una medida de
variabilidad asociada a la estimación del parámetro.

facultadmedicina.uc.cl
17
Intervalos de Confianza

La línea roja muestra el valor del parámetro


desconocido 𝜇, al que le estamos
calculando un intervalo de confianza a
partir de cada una de las 𝑘 muestras.

IC95%: si tuviéramos 100 muestras de la


variable aleatoria, y en cada una
calculáramos el promedio y luego el IC,
entonces se espera que 95 de esos
intervalos cubran al verdadero valor del
parámetro.

IC99%:si se construyen IC de 99% de


confianza, se espera que 1 de cada 100
intervalos no contenga al verdadero valor
del parámetro.
facultadmedicina.uc.cl
18
si
✗ categórica : se observa estimador de proporción o
porcentaje
✗ numérica : promedio y desviación estando

Intervalos de Confianza
variables se presentan proporción
.

En estas
esti
Variable numérica entrega promedio como

categoría

• A

categórica

con
categórica

Beneficios nutricionales y metabólicos asociados con la actividad y el transporte público: resultados de la Encuesta facultadmedicina.uc.cl
Nacional de Salud 2016-2017. Passi et al. (2020)
Intervalos de Confianza para µ

Suponga que 𝑥1 , … , 𝑥𝑛 es una muestra aleatoria proveniente de


una población Normal 𝜇, 𝜎 2 y se quiere construir un intervalo
de confianza para 𝜇.
n grande y
✗ distribuye normal
• Caso 1: n es suficientemente grande (n>30) y 𝜎 2 se estima
usando el valor muestral 𝑠 2 .
IC Usando N ( 0,11 i
" ¥:* .

𝑥ҧ − 𝜇 %) z
-19 -

Sync
I MI 1.96
-
.
YA

𝑍= ∼ Normal(0,1) -
1,96 1,96 MEI -11.96 Tri
-

𝑠/ 𝑛
-

) Yi
"%
I - .

www.synynio/Zi#Th~N(
-

°"
Pl -
1,96 LZ < 1,961 ao.gg "'
"" "
oh "" '' '

< 1.96
* t.ae <
×¥g
-

~
Nly , TY → I~Nlu.TK )
exige mama
30 facultadmedicina.uc.cl 20
✗ 4- CXI → INN / µ , syn ) → aqui
?⃝
Intervalos de Confianza para µ
si quiere un intervalo de confianza a 95 :

𝑃(−1.96 < 𝑧 < 1.96) = 0.95 Distribución z


Luego, si una variable 𝑋 tiene
distribución Normal 𝜇, 𝜎 2 , el 95% 2.5%
95% de las veces:
ҧ
𝑥−𝜇
-1,96 < < 1,96 −1.96 1.96
𝑠/ 𝑛

Despejando  : 𝑠 𝑠
𝑥ҧ − 1,96 ∗ ≤ 𝜇 ≤ 𝑥ҧ + 1,96 ∗
𝑛 𝑛

El resultado, es un intervalo de confianza al 95% para la media 


cuando la variable 𝑋 es Normal, con 𝑛 > 30 y 2 desconocido.
facultadmedicina.uc.cl 21
Intervalos de Confianza para µ

facultadmedicina.uc.cl
Intervalos de Confianza para µ

1=-1-42
' %
:

ÜY
⇐ "

En general, para cualquier α tenemos que:



Pl 1.9617-4.961=0.95
-

𝑥ҧ − 𝜇
P 𝑧𝛼 ≤ ≤ 𝑧1−𝛼 = 1 − 𝛼
2 𝑠/ 𝑛 2
Despejando

𝑠 𝑠
P 𝑥ҧ − 𝑧1−𝛼 ⋅ ≤ 𝜇 ≤ 𝑥ҧ + 𝑧1−𝛼 ⋅ =1−𝛼
confianza generalizada
2 𝑛 2 𝑛
Formula intervalo :

EIZ i Na Vn
' 𝑠
𝜇 ∈ 𝑥ҧ ± 𝑧1−𝛼 ⋅
-
- .

2 𝑛

facultadmedicina.uc.cl 23
Intervalos de Confianza para µ

2- 1.96 en 95%
5- d. estándar
=

Ejercicio 1
La detección a tiempo del retraso cognitivo severo en niños que nacen
muy prematuro es crucial, ya que determina su capacidad cognitiva en el
futuro. La prueba de Lenguaje BSDI (Bayley scale of infant development)
es una prueba que se aplica a niños de 2 a 8 años, y que tiene por objetivo
medir el grado de capacidad cognitiva del niño. Se sabe que los puntajes
de esta prueba siguen una distribución Normal. * ± zafa .
'

qq.y.gg.gg.gg#,,y
Un investigador aplica esta prueba a un grupo de 45 niños/as nacidos muy
prematuros y obtiene un puntaje promedio de 100 y d.e. de 15.aquí
M E (95.6211-04,38) → de
sonó

donde salió ? el
se

4.38
# Y

Construya un IC de 95% para la media poblacional  del puntaje BSDI.


Construya además un IC de 99% bajo los mismos supuestos.
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Solución:

La distribución es Normal, luego el intervalo de 95% de confianza es:


100 − 1.96 ∗ 15/ 45 <  < 100 + 1.96 ∗ 15/ 45

Es decir, 𝟗𝟓, 𝟔 <  < 𝟏𝟎𝟒, 𝟒. Luego, el puntaje medio poblacional (de
niños de 2 a 8 años nacidos muy prematuros) se estima entre 95,6 y 104,4
puntos con una confianza de 95%.

Para construir el intervalo con confianza 99%, se debe usar z=2.575 en vez
de z=1.96. Luego, el intervalo es:
100 − 2,575 ∗ 15/ 45 <  < 100 + 2,575 ∗ 15/ 45
Este dato sale de la tabla

Es decir, 𝟗𝟒, 𝟐 <  < 𝟏𝟎𝟓, 𝟕


facultadmedicina.uc.cl
Préqigión
↑ ( 1- a) %
aumento confianza : intervalo menos prosigo

F- MMM + ' "" Intervalos de Confianza para µ



hh 30

t.EE ☒ ± tina . Era

Seguimos bajo el supuesto que X es proveniente de una población


Normal 𝜇, 𝜎 2

n pequeno y ✗
distrito Me normal
• Caso 2: Si n es pequeño y 𝜎 2 se estima usando el valor
muestral 𝑠 2 . Se utiliza: IC usando T student -
.

𝑥−𝜇
+ Studer 𝑇= ∼ t − Student(𝑛 − 1)
𝑠/ 𝑛
-

80

÷
^
son

2,262 facultadmedicina.uc.cl
Intervalos de Confianza para µ

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Del gráfico se tiene que:

𝑥−𝜇
P 𝑡𝛼,(𝑛−1) ≤ ≤ 𝑡1−𝛼,(𝑛−1) = 1 − 𝛼
2 𝑆/ 𝑛 2

Por la simetría de la t-Student(n-1), y de forma análoga al Pivote


Z, se obtiene que:
𝑆
𝜇 ∈ 𝑥 ± 𝑡1−𝛼,(𝑛−1) ⋅
2 𝑛
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Para construir el intervalo de 95% de confianza para  es


necesario calcular el percentil 97.5% de la t de Student con n-1
grados de libertad.

s s
X − t0.975,( n−1)     X + t0.975,( n−1) 
n n

Notar en la tabla T que a medida que el tamaño muestral crece,


el percentil 97.5% de la distribución t de Student se aproxima al
percentil respectivo de la distribución normal estándar.

facultadmedicina.uc.cl
Tabla
t-Student

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Ejercicio 2
Desarrolle el mismo Ejercicio anterior, pero suponga ahora que el
investigador aplica esta prueba a un grupo de 25 niños/as nacidos muy
prematuros y obtiene un puntaje promedio de 100 y d.e. de 15.

Construya un IC de 95% para la media poblacional  del puntaje BSDI.


Construya además un IC de 90% bajo los mismos supuestos.

Solución: en tabla
25-1 = 24 5 buscar
T con n-1=24 g.l.
Para una confianza de 95% se tiene que t=2,064.
Para una confianza de 90% se tiene que t=1,711.

facultadmedicina.uc.cl
Intervalos de Confianza para µ

n grande y ✗ no distribuye normal


• Caso 3: Si no se puede asumir que X ~ Normal y n es
suficientemente grande (>30), entonces por TCL se
puede usar Z o T TLC : IC usando NLQ 1)

Ejercicio 3: para los datos del Ejercicio 1,


Construya el IC si no se sabe nada acerca de la
distribución de probabilidad de los puntajes.

facultadmedicina.uc.cl
Intervalos de Confianza para µ

Caso 4: Si no se puede asumir que X ~ Normal y n no es


metricot
suficientemente grande (n<30):
hacer IC no para
transformar datos o
normal
✗ no distribuye
Posibles caminos: n
pequeño .

(i) Transformar los datos para conseguir Normalidad (por


ejemplo log(X)). El IC se obtiene igual que en el punto
anterior.

(ii) No hacer IC para . Muy usado para n chico (en ese caso se
hacen IC para la mediana, por ejemplo, o no se hacen IC).
facultadmedicina.uc.cl
Intervalos de Confianza para µ

Resumen:
Sea X una variable aleatoria continua. Se tienen observaciones
𝑥1 , … , 𝑥𝑛 de esa variable aleatoria.

facultadmedicina.uc.cl
a
ver
¥
.

Intervalo de Confianza para 𝒑


de

Suponga que 𝑥1 , … , 𝑥𝑛 es una muestra aleatoria proveniente de


una población Bernoulli 𝑝 y se quiere construir un intervalo de
confianza para 𝑝.

Por el Teorema del Límite Central tenemos que


%FEYYIWestp.mil
"


"

𝑝(1 − 𝑝)
𝑝~Normal
Ƹ 𝑝,
𝑛
Donde se estima
𝑝(1 − 𝑝) 𝑝(1
Ƹ − 𝑝)Ƹ
=
𝑛 𝑛
facultadmedicina.uc.cl 35
Intervalo de Confianza para 𝒑

Luego, para muestras grandes se tiene que :


𝑝Ƹ − 𝑝
𝑍 = ~Normal(0,1)
𝑝Ƹ ⋅ (1 − 𝑝)/𝑛
Ƹ

Y el I.C. de nivel α queda dado por

𝑝 ∈ 𝑝Ƹ ± 𝑧1−𝛼 ⋅ 𝑝Ƹ ⋅ (1 − 𝑝)/𝑛
Ƹ
2

facultadmedicina.uc.cl 36
Intervalo de Confianza para 𝒑

Es decir, procediendo en forma análoga al caso de la media,


podemos construir un intervalo de 95% de confianza para la
proporción poblacional P.

𝑝Ƹ ⋅ 1 − 𝑝Ƹ 𝑝Ƹ ⋅ (1 − 𝑝)Ƹ
𝑝Ƹ − 1,96 ⋅ ≤ 𝑝 ≤ 𝑝Ƹ + 1,96 ⋅
𝑛 𝑛

facultadmedicina.uc.cl
37
Intervalo de Confianza para 𝒑

Ejercicio 5.
La Encuesta Nacional de Salud 2009-2010 arrojó que 237
personas de 65 o más años padecía de cataratas de un total de
998 personas muestreadas en ese grupo etario. Construya un
intervalo de confianza para la verdadera proporción 𝑝.
El estimador puntual es 237 de 998 personas → ↑ =

23% ,
= 0,24


si 0,24 ∙ 1 − 0,24 0,24 ∙ 1 − 0,24
y 0,24 − 1,96 ⋅ ≤ 𝑝 ≤ 0,24 + 1,96 ⋅
Éi pobl )

PE ↑ ± 2-
.

psyz
"
998
0,214 ≤ 𝑝 ≤ 0,266 proporción poblacional
interpretar
la
:
998
al 95% de

. .
.
contar"

Interpretación. La prevalencia poblacional de cataratas en personas de 65 o


más años se estima en 24.0%. Con una confianza de 95%, el intervalo que va
desde 21,4 a 26,6 contendrá al verdadero valor del parámetro.
facultadmedicina.uc.cl
38
Intervalo de Confianza para 𝒑

Hipertensión en relación con estado nutricional, actividad física y etnicidad en niños


chilenos entre 6 y 13 años de edad (NutrHosp 2016)

prevalencia con

facultadmedicina.uc.cl
Intervalo de Confianza para 𝒑

Hipertensión en relación con estado nutricional, actividad física y etnicidad en niños


chilenos entre 6 y 13 años de edad (NutrHosp 2016)
Intervalos de confianza para proporciones

facultadmedicina.uc.cl
facultadmedicina.uc.cl
facultadmedicina.uc.cl

También podría gustarte