Está en la página 1de 34

Universidad Andrés Bello

Instituto de Salud Pública Andrés Bello

Clase 7
Unidad II: Probabilidades
Tema: Variables aleatorias – Distribución
Normal

Curso: Bioestadís/ca
Código: SPAB300 NRC: 1094/1095
Carrera: Obstetricia
Docente: Cecilia Villegas Leiva
2023
Unidad II: Probabilidades

Aprendizajes esperados Clase 7:


• Conocer y utilizar los conceptos de
Distribución de probabilidades teóricas.
Contenidos Clase 7:

• Distribución de Probabilidades: variables


aleatorias discretas y continuas.
• Distribución Binomial.
• Distribución Normal.
• Distribución t de student.
Introducción

• Variables: mediciones que se efectúan sobre los individuos de una muestra.


• Experimento aleatorio: Cuando en un experimento no se puede predecir el
resultado final.
• Probabilidad como una aplicación del conjunto de los sucesos a valores en el
intervalo [0, 1] que satisface ciertas propiedades.
• A una probabilidad en el espacio muestral Ω se le llama también
distribución de probabilidad en Ω.
• Para calcular probabilidades, se necesita un espacio muestral Ω y una
probabilidad P sobre él, es decir, un espacio de probabilidad (Ω, P ).
• En ocasiones, en lugar de interesarnos por el resultado concreto de un
experimento aleatorio, sólo nos interesa una cierta función de ese
resultado, lo que nos conduce al concepto de variable aleatoria.
Variable aleatoria

• De manera informal, una variable aleatoria es un valor numérico que


corresponde al resultado de un experimento aleatorio.
• Ejemplos:
• Una variable aleatoria X como resultado de lanzar una moneda al
aire puede tomar el valor 1 si el resultado es cara y 0 si es cruz.
De este modo, escribiremos, por ejemplo, P (X = 1) = 0,5
• Una variable aleatoria Y puede ser el resultado de medir en oC la
temperatura corporal de adultos varones sanos. Cuando se han
tomado muchas observaciones (infinitas), se puede llegar a la
conclusión, que la probabilidad de que la temperatura corporal
sea inferior a 36,8 oC es igual a 0,8, lo que escribimos con P (Y <
36,8) = 0,8.
Variable aleatoria

• Variable aleatoria (v.a) es una función del espacio muestral asociado


a un experimento aleatorio en R, que a cada resultado de dicho
experimento le asigna un número real, obtenido por la medición de
cierta característica.
X: Ω → R
⍵ →X(⍵)
• Se denota la variable aleatoria por una letra mayúscula.
• El conjunto imagen de esa función es el conjunto de valores que
puede tomar la variable aleatoria, que serán denotados por letras
minúsculas.
Distribución de Probabilidad

• Los diferentes valores de una variable aleatoria y las probabilidades


asociadas constituyen la distribución de probabilidad de la variable.

• Algunas de las distribuciones más utilizadas son:


• Distribución de probabilidad binomial
• Distribución de probabilidad normal
• Distribución de probabilidad t de student
Grupos de variables aleatorias

• Variables aleatorias discretas son aquellas que tan sólo puede


tomar un número discreto (finito o infinito) de valores. Cada uno de
estos valores lleva asociada una probabilidad positiva, mientras que
la probabilidad de los restantes valores es 0.

• Variables aleatorias continuas son aquellas que pueden tomar


cualquier valor dentro de un intervalo. En este caso, la probabilidad
de obtener un valor concreto es 0, por lo que las probabilidades se
asignan a intervalos de valores.
Distribución Binomial

• La distribución Binomial se define como una serie de experimentos o


ensayos en los que solo podemos tener 2 posibles resultados (éxito
o fracaso), siendo el éxito la variable aleatoria. Corresponde a una
distribución de probabilidad discreta.
• En la distribución binomial hay tres variables:
• n es el número de veces que repe/mos el experimento.
• p es uno de los dos resultados al que llamaremos éxito.
• q es el otro resultado posible al que llamaremos fracaso.

• Como p y q son los dos únicos resultados posibles, entre los dos su
porcentaje debe sumar uno, por lo que p =1- q.
Distribución Normal

• Se dice que muchos fenómenos en el campo de la salud se


distribuyen normalmente.
• Es la base del análisis estadístico, ya que en ella se sustenta casi toda
la inferencia estadística.
• La distribución Normal, a veces se denomina distribución Gaussiana,
en honor de Karl Friedrich Gauss (1777-1855), quien también derivó
su ecuación a partir de un estudio de errores de mediciones
repetidas de la misma cantidad.
Distribución Normal

Una v.a.c. X que tiene la


distribución en forma de campana
se llama variable aleatoria normal.
La ecuación matemática para la
distribución de probabilidad de la
variable normal depende de dos
parámetros µ y σ, su media y
desviación estándar, El área total bajo la curva y
respectivamente. sobre el eje horizontal es
igual a 1.
Se anota X~N(µ,σ).
Distribución Normal

La función de densidad de la v.a. normal X, con media µ y desviación


estándar σ es:

Una vez que se especifican µ y σ, la curva normal queda determinada por


completo.
Distribución Normal

Caso 1: Caso 2: Caso 3:


Características

1.- Tiene Forma de campana y sus colas se


ex/enden hacia el infinito, tanto a la
derecha como a la izquierda, pero nunca
tocan el eje lo cual significa que son
asintó/cas con respecto al eje horizontal.

2.- Media, mediana y moda coinciden en


su valor.
Media=Mediana =Moda

y
3.- Simétrica con respecto al eje y.
Caracterís?cas

4.- Continua

5.- El máximo de la distribución está en el


valor de µ (media poblacional) µ

6.- La distribución queda completamente


definida por la media µ y la desviación estándar
s lo que significa que por cada valor diferente
de cada uno de ellos se especifica una normal
diferente.
7.- La s o dispersión de los valores con
respecto a la media, determina el grado
de aplanamiento o levantamiento de la
distribución. µ es parámetro de
localización o posición y s de dispersión

µ
8.- La forma no se altera por cambios de µ µ
pero si de s

s s

9.- El área total bajo la curva sobre el


eje x es una cantidad de área (= 1 =
100%) lo que se deduce del hecho de
que la distribución normal es una
distribución de probabilidad. Por su 100%
simetría el 50% está a la derecha de la
perpendicular que se levanta sobre la 50% 50%
media y el otro 50% a la izquierda.
10.- Tiene dos puntos de inflexión (punto en
el cual la curva cambia su velocidad de
crecimiento o decrecimiento) (µ + s) y (µ - s)

(µ - s ) µ (µ + s )

11.- Cualquiera sean los valores de la


media y desviación estándar, al sumar y 68.3%
restar a la media una, dos y tres veces la
desviación estándar se determinan pares
de valores de la variable que se ubican en 95.4%

el gráfico y que encierran respec/vamente 97.3%


el 68,3% , 95,4% y 97,3% de los casos.
(µ - 1s) µ (µ + 1s)
(µ - 2s) (µ + 2s)
(µ - 3s) (µ + 3s)
Tabla de distribución Normal Estándar

La distribución Normal permite determinar el área bajo la curva o


probabilidades, pero no es posible establecer tablas separadas para cada
valor de µ y σ. Pero existe una tabla de áreas de la “Normal Reducida ” o
“Normal Estándar” que se caracteriza por tener media 0 y desviación
estándar 1. También llamada “Normal (0,1)” y simbolizada por:

Z ~ N (0,1)

Z se distribuye normal con media 0 y DS igual a 1

µ =0
s =1
Tabla de distribución Normal Estándar

Para usar estas tablas hay que transformar


x-µ
la variable original, en una variable normal
z=
s
estándar z la que se calcula:

• Siendo x el valor de interés; µ la media de la variable y s su


desviación estándar.
• Estandarización de variables aleatorias normales.
• En general, el valor de z se interpreta como el número de desviaciones
estándar que están comprendidas entre la media y un cierto valor de
variable x.
Tabla de distribución Normal Estándar

La “Curva Normal” obtenida “sobre” la curva “Normal Estándar” o “Normal


(0,1)”, haciendo coincidir sus valores obteniendo una equivalencia entre
ellos.

“Curva Normal”

“Normal Estándar”
o
“Normal (0,1)”

µ =0
s =1
Tabla de distribución Normal Estándar
z Segundo decimal

Hasta Primer
decimal
Proporciones=
probabilidades
Las Tablas indican el área bajo la curva normal estándar que corresponde a
P(Z<z) para valores de z que van desde -3,49 a 3,49.
Ejemplos uso de la Tabla distribución Normal
Estándar
1) Calcular la probabilidad de que z sea menor que 1,64.
Primero localizamos un valor de z igual a 1,6 en la primera columna
(izquierda), después nos “movemos” a lo largo de la fila hasta encontrar la
columna correspondiente a 0,04, donde leemos 0,9495.
Por lo tanto, P(Z<1,64)= 0,9495

P(Z<1,64)

µ=0 1,64
Ejemplos uso de la Tabla distribución Normal
Estándar
2) Dada una distribución normal estándar, calcular el área bajo la curva
que se encuentra a) a la derecha de z=1,46 y b) entre z=-1,75 y z=0,86.
a) El área a la derecha de z=1,46 es igual a 1 menos el área a la izquierda
de z=1,46, es decir:
P(Z> 1,46)= 1 - P(Z<1,46)= 1- 0,9279=0,0721.

P(Z<1,46)

P(Z>1,46)

µ=0 1,46
Ejemplos uso de la Tabla distribución Normal
Estándar
2) Dada una distribución normal estándar, calcular el área bajo la curva
que se encuentra a) a la derecha de z=1,46 y b) entre z= -1,75 y z=0,86.
b) El área entre z=-1,75 y z=0,86 es igual al área a la izquierda de z=0,86
menos el área a la izquierda de z=-1,75.
P(-1,75<Z<0,86)= P(Z < 0,86)- P(Z < -1,75)= 0,8051 – 0,0401= 0,765

P(-1,75<Z<0,86)

µ=0
-1,75 0,86
Ejemplos uso de la Tabla distribución Normal
Estándar
3) Encontrar el valor de z que deja un área de 0,0495 bajo la curva a la
izquierda.
Para encontrar un valor de z que corresponda a una probabilidad dada, el
proceso se invierte. El valor de z que deja un área de 0,0495 bajo la curva
a la izquierda de z se ve que es -1.65.
P(Z<-1,65)= 0,0495

P(Z<z)= 0,0495

-1,65 µ=0
y “Curva Normal”

Ejemplo 4: El peso al nacer
?
tiene µ=3 kg y σ=0,2 kg,
calcular la probabilidad de
que un recién nacido pese
más de 3,2 kg? x x peso al nacer
µ = 3 kg
s = 0,2
(µ + s)
“Normal Estándar” 3+0,2
y ó =3,2 kg
“Normal (0,1)”
𝑥 − 𝜇 3,2 − 3
𝑧= = =1
𝜎 0,2 P(Z >1)= 15,87%

P(Z > 1)=1 – P(Z < 1)=


1 – 0,8413= µ=0 z z
0,1587= 15,87% s =1
Ejemplo 5: Las puntuaciones de ansiedad tienen un promedio de 25 y
DS=3,5.
a) ¿Cuál es la probabilidad de que una persona tenga un puntaje entre 20 y
30?

i) Calcular los valores de z para 20 y 30:


20 − 25
x-µ 𝑧! = = −1,428 P(-1,428 < Z < 1,428)=84,72%
z= 3,5
s
30 − 25
𝑧" = = 1,428
3,5
ii) Una vez obtenido el valor de z1, se busca en la tabla 20 25 30
el valor de la proporción que le corresponde y que z1 z2
indica el área que queda hacia la izquierda. µ=0
µ = 25
s =1
Lo mismo es para z2. Es decir: s = 3,5
P(Z<1,428)=0,9236 y P(Z< -1,428)=0,0764

iii) P(-1,428 < Z < 1,428)= P(Z < 1,428) – P(Z < -1,428)
0,9236 – 0,0764 = 0,8472=84,72%
b) ¿Cuál es la probabilidad de tener una puntuación inferior a 20?
Ya se sabe que z1= -1,428 y P(Z < -1,428)= 0,0764= 7,64%

P(Z< -1,428)=0,0764= 7,64%

20 25 30
µ = 25 µ=0
s = 3,5 s =1

c) ¿Cuál es la probabilidad de tener una puntuación superior a 30? Ya se sabe


que z2= 1,428 y P(Z<1,428)=0,9236. Por lo tanto:
P(Z >1,428)= 1- P(Z< 1,428)= 1 – 0,9236= 0,0764= 7,64%

P(Z>1,428)=0,0764 = 7,64%

20 25 30
µ = 25 µ=0
s = 3,5 s =1
d) ¿Cuál es la probabilidad de tener una puntuación inferior a 30?
La respuesta se puede obtener por dos vías:
Ya sabemos que z2= 1,428 y P(Z > 1,428)=0,0764
1 o 100%

a) P(Z<1,428)= 1 – P(Z>30)= ? P(Z>1,428)=0,0764


1 – 0,0764 = 0,9236 = 92,36%

20 25 30
µ = 25 µ=0
s = 3,5 s =1

0,5 o 50%
P?1

b) P(Z<0)=0,5 y P?1= 0,5-0,0764=0,4236 P(Z>1,428)=0,0764

P(Z<1,428)=0,4236 +0,5=0,9236 =92,36% 20 25 30


µ = 25 µ=0
s = 3,5 s =1

P(Z<1,428)= P(Z<0)+P?1
Distribución t de Student

• Hay situaciones en que se sabe que la distribución de una población


es normal pero se desconoce la desviación estándar de ésta y más aún
se puede desconocer la media.
• En estos casos no se puede hacer uso de la Normal estándar, se usa
una alternativa de la distribución Normal llamada t de Student o
simplemente Distribución t, que usa la desviación estándar de la
muestra (S) para estimar s .
• t de Student se usa para muestras pequeñas <30 y cuando se
desconoce la desviación estándar.

x-µ x-µ
t= z=
s
s
n
La distribución T se caracteriza por:

1. Tiene una media igual a 0.


2. Es simétrica respecto a la media.
3. Tiene una varianza mayor que uno pero a medida que aumenta el
tamaño de la muestra se acerca a una Normal, es decir, mientras más
grande es la muestra, es mas parecida a la Normal.
4. Se extiende desde menos infinito a más infinito.
5. Es una familia de distribuciones. Hay una distribución diferente para
cada tamaño de muestra (n-1) que es el denominador para calcular S.

N=8

N=14

N=20

N=35
La distribución T se caracteriza por:
n Probabilidades

6. (n-1) (tamaño de la muestra menos


1) es llamado “grados de libertad”.
7. La distribución t es más aplastada en
el centro que la normal y tiene las
colas más largas.
8. t se aproxima a la Normal a medida

Grados de libertad
que (n-1) tiende a infinito.
Valores T
9. Las tablas de t presentan las
probabilidades en la parte superior,
los grados de libertad en la primera
columna y los valores de t en el
interior de la tabla.
Bibliografía

• Blair, R. & Richard, T. (2008). Bioestadís*ca. Editorial Pearson.


• Milton, S, (2001). Estadís*ca para biología y ciencias de la salud.
Editorial McGraw-hill
• Walpole, R. & Myers, R. (2012). Probabilidad y estadís*ca para
ingeniería y ciencias. Editorial Pearson.

También podría gustarte