Está en la página 1de 10

VARIABLES ALEATORIAS CONTINUAS Y DISTRIBBUCIONES DE

PROBABILIDAD CONTINUAS

En el capítulo anterior hemos estudiado variables aleatorias discretas. Recuerda


que una variable aleatoria es un valor numérico que corresponde al resultado de
un experimento aleatorio. Podemos clasificar las variables aleatorias en
discretas y continuas en función del conjunto de valores que pueden tomar.
Estudiaremos en este tema variables aleatorias continuas y nos centraremos en
un modelo de distribución continua (la distribución normal) que ha adquirido una
especial relevancia por ser adecuada para modelizar una gran cantidad de
situaciones prácticas.

Variables aleatorias continuas


Una variable aleatoria es continua cuando puede tomar cualquier valor en un
intervalo. Por ejemplo, el peso de una persona o el contenido de paracetamol en
un lote de pastillas.
El estudio de las variables continuas es más sutil que el de las discretas.
Recordemos que la construcción del histograma es más delicada que el del
diagrama de barras ya que depende de la elección de las clases.
Se ha comprobado en la práctica que tomando más observaciones de una
variable continua y haciendo más finas las clases, el histograma tiende a
estabilizarse en una curva suave que describe la distribución de la variable . Esta
función, f(x); se llama función de densidad de la variable X. La función de
densidad constituye una idealización de los histogramas de frecuencia o un
modelo del cual suponemos que proceden las observaciones.
Medidas características de una variable aleatoria continua
Los conceptos que permiten resumir una distribución de frecuencias utilizando
valores numéricos pueden utilizarse también para describir la distribución de
probabilidad de una variable aleatoria.
3.1 Media o esperanza
Se define la media poblacional o esperanza de una variable aleatoria continua
como

µ = E(X) = Σ(Xi pxi) = npx


Ejemplo 37.
La interpretación de la media o esperanza es el valor esperado al realizar el
experimento con la variable aleatoria. Además, la media puede verse también
como el valor central de la distribución de probabilidad
3.2 Varianza
Se define la varianza de una variable aleatoria como
σ2= VarX = Σ pxi(X - X)2
Edjemplo 38
Probabilidades de vida de pacientes terminales de cancer
Nivel de cancer Pacientes xi Probabilidades de vida %
Nivel 1 3 25
Nivel 2 2 35
Nivel 3 1 40
Total 6 100%
Calcular el valor esperado o miedia y la varianza de pacientes con canser
terminal

µ = E(X) = Σ(Xi pxi) = npx = 1.85 pacientes


npxi
X-X (X – X)2 pxi(X – X)2
3*0.25= 0.75 1.15 1.3225 0.330625
2*0.35= 0.7 0.15 0.025 0.07875
1*0.40= 0.40 -0.85 0.7225 0.289
Total = 1.85 - - 0.698375

σ2= VarX = Σ pxi(X - X) 2 =0.6983


σ =0.83 pscientes
La interpretación de la varianza es la misma que para un conjunto de datos: es
un valor no negativo que expresa la dispersión de la distribución alrededor de la
media. Además, se puede calcular la desviación típica poblacional como la raíz
cuadrada de la varianza. Los valores pequeños de indican concentración de la
distribución alrededor de la esperanza y valores grandes corresponden a
distribuciones más dispersas.

4. Principales modelos de distribuciones continuas


5. La distribución normal
La distribución normal es la más importante y de mayor uso de todas las
distribuciones continuas de probabilidad. Por múltiples razones se viene
considerando la más idónea para modelizar una gran diversidad de mediciones
de la Medicina, Física, Química o Biología. La normal es una familia de variables
que depende de dos parámetros, la media y la varianza, fue reconocida por primera
vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich
Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva;
de ahí que también se le conozca, más comúnmente, como la "campana de Gauss".
Dado que todas están relacionadas entre si mediante una transformación muy
sencilla, empezaremos estudiando la denominada normal estándar para luego
denir la familia completa.
5.1 La distribución normal estándar N(0,1)
La distribución de una variable normal está completamente determinada por dos
parámetros, su media (µ) y su desviación estándar σ . Con esta notación, la densidad
de la normal viene dada por la ecuación llamada
Funcion de densidad de probabilidad normal :

, que determina la curva en forma de campana.

Curva de la Distribción Normal

-3σ -2σ -1σ µ 1σ 2σ 3σ


Esta gráfica muestra tres formas diferentes de medir el área bajo la curva normal. Sin
embargo, muy pocas de las aplicaciones que haremos de la distribución normal de
probabilidad implican intervalos de exactamente (más o menos) 1, 2 ó 3 desviaciones
estándar a partir de la media. Para estos casos existen tablas estadísticas que indican
porciones del área bajo la curva normal que están contenidas dentro de cualquier
número de desviaciones estándar (más o menos) a partir de la media.

Propiedades de la distribucion de probadilidad normal:

No importa cuáles sean los valores de µ y σ ; para un distribución de probabilidad


normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en
áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:
*Aproximadamente el 68% de todos los valores de una población normalmente
distribuida se encuentra dentro de ± 1 desviación estándar de la media.

*Aproximadamente el 95.5% de todos los valores de una población normalmente


distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.

*Aproximadamente el 99.7% de todos los valores de una población normalmente


distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.

Afortunadamente también podemos utilizar una distribución de probabilidad normal


estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla podemos
determinar el área o la probabilidad de que la variable aleatoria distribuida normalmente
esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas
en términos de desviaciones estándar y se concoce como regla empirica.

Uso de la tabla de distribución norlam de probabilidad normal estándar

Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el
mismo número de desviaciones estándar a partir de la media contendrán la misma
fracción del área total bajo la curva para cualquier distribución de probabilidad normal.
Esto hace que sea posible usar solamente una tabla (Apéndice Tabla 1) de la
distribución de probabilidad normal estándar.

El valor de z en la tabla es absoluto, es decir, z en la tabla no tiene signo; las areas que
se muestran en la tabla son las areas bajo la curva de probabilidad normal estandar
entre la media y los valores posiditivos de z, y como la distrilbucion es simetrica esta
area le corresponde a ambos lados de la curva.
Aarea bajo la curva noral

El estadistilco de la Disribucion Normal

En la que:
x = valor de la variable aleatoria que nos preocupa.
µ = media de la distribución de la variable aleatoria.
σ =desviación estándar de la distribución.
z = número de desviaciones estándar que hay desde x a la media de la distribución.
(eluso de z es solamente un cambio de escala de medición del eje horizontal).
Ejemplo:

La glucemia basal de los diabéticos atendidos en un centro sanitario puede


considerarse como una variable normalmente distribuida, con media 106 mg por 100
ml, y desviación típica 8 mg por 100 ml N(106; 8). Calcular:
a) La proporción de diabéticos con una glucemia basal inferior a 120 mg por 100 ml,
P(x<120)( recuerde que la variable continua es lo mismo menor que menor o igual).
b) La proporción de diabéticos con una glucemia basal comprendida entre 10 y 120 mg
por 100 ml.
c) La proporción de diabéticos con una glucemia basal mayor de 120 mg por 100 ml.
d) El nivel de glucemia basal tal que por debajo de él están el 25% de los diabéticos, es
decir, el primer cuartil.
f) La proporción de diabéticos con una glucemia basal menor de 100 mg por 100 ml.

a) El cálculo anterior no puede realizarse directamente, puesto que no se dispone de


tablas para los parámetros correspondientes a la variable X, pero tipificando 120 se
obtiene:

z = 120-106 = 1.75
8

El valor tipificado tiene la siguiente propiedad:


P(X≤ 120) = P(Z ≤1,75)

Z= +1.75

Donde P(X≤ 120) = P(Z ≤1,75) = 0.4599 +0.5 = 0.9599

La proporción de diabéticos con una glucemia basal menor de 120 mg por 100 ml es
0,9599. También se podría decir que la probabilidad de que un diabético seleccionado
al azar en esta población tenga una glucemia basal inferior a 120 mg por 100 ml es
0,9599.
b) La proporción de diabéticos con una glucemia basal comprendida entre 106 y 120
mg por 100 ml

P(104 ≤ X≤108) = PZ1 + Pz2

X1=103.5 X2=108.5

Z1 = 103.5-106 = -0.31 Pz1= 0.1217


8

Z2 = 108.5 - 106 = 0.31 Pz2= 0.1217


8

P(104 ≤ X≤108) = PZ1 + Pz2 = 0.1217 + 0.1217 = 0. 2434


La proporción de diabéticos con una glucemia basal comprendida entre 106 y 120 mg
por 100 ml es de 24.34%
c) La proporción de diabéticos con una glucemia basal mayor de 120 mg por 100 ml.

P(x>110) = 0.5 – P(Z2)

X2=10.5

P(Z2)? Z2 = 110.5-106 = 0.56 P(Z2)= 0.2123


8
P(x>110) = 0.5 – P(Z2) = 0.5 - 0.2123 =0.2877
La proporción de diabéticos con una glucemia basal mayor de 120 mg por 100 ml. Es
de 28.77.

d) El nivel de glucemia basal tal que por debajo de él están el 25% de los diabéticos, es
decir, el primer cuartil

El area 0.25 tiene un un Z aproximado de Z= + 0.67 y por órmula:

z = x-µ
σ
Sustituyendo en la fórmula

0.67 = x-106
8
X= z σ + µ

Por lo tanto X= 0.67*8 +106 mg por 100 ml.


c) La proporción de diabéticos con una glucemia basal mayor de 100 mg por 100 ml.

P(X>100) 0.5 – P(X1)

-z1
Z1 = 100-106 = -0.75 P(X1) = 0.2734
8

P(X>100) 0.5 – P(X1) = 0.5 -0.2738 = 0.2262


La proporción de diabéticos con una glucemia basal menor de 100 mg por 100 ml. Es
de 22.62%