Está en la página 1de 41

Distribuciones de

Probabilidad: Variables
Continuas.

1
Distribuciones Continuas
Las distribuciones de probabilidad continuas son aquellas en las que la variable aleatoria puede asumir un
número infinito de valores, que son resultado de una medición. Por ejemplo, el valor de la temperatura media
del aire en intervalos dados de tiempo. Por supuesto que las variables aleatorias continuas dependen de la
exactitud del instrumento de medición en este caso del termómetro.

También existen varios tipos de distribuciones continuas de probabilidad:

Distribución Normal o gausiana,


Distribución t de Student,
Distribución χ-cuadrado,
Distribución Gamma

Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con curvas.
Distribuciones continuas:
Normal o gausiana
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754) y posteriormente,
Carl Friedrich Gauss (1777-1855) formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente,
como la "campana de Gauss".

La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación
estándar. La función de densidad de la curva normal está definida por la siguiente ecuación:

Donde μ es el valor medio


σ es la desviación estándar

Es la distribución continua de probabilidad más importante de toda la estadística. Como vimos anteriormente, una variable
aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos
valores usualmente resultan de medir algo (medidas de longitud, de peso, de tiempo, de temperatura, etc.)
Características de la distribución de probabilidad normal
La distribución de probabilidad normal y su curva tiene las siguientes características:

1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribución son iguales y se localizan en el
centro de la distribución.
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está
antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto
significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.

La familia de la distribución de probabilidad normal


La forma de la campana de Gauss depende de los parámetros µ y σ . La media indica la posición de la campana, de modo que para
diferentes valores de la gráfica es desplazada a lo largo del eje horizontal.

Por otra parte, la desviación estándar determina el grado de achatamiento de la curva. Cuanto mayor sea el valor de σ , más se
dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto,
una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
Propiedades de la distribución normal

Algunas propiedades de la distribución normal son:

1) Es simétrica respecto de su media, μ;

2) La moda y la mediana son ambas iguales a la media, μ;

3) Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.

4) Las probabilidades en un entorno de la media son:

4.1 en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el 68,26% de la distribución;


4.2 en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la distribución;
4.3 por su parte, en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente, el 99,74% de la distribución.

Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el
hecho de que prácticamente la totalidad de la distribución se encuentre a tres desviaciones típicas de la
media justifica los límites de las tablas empleadas habitualmente en la normal estándar.
Densidad de Probabilidad

• N (0,1) y N(µ ,s2)


Probabilidad Acumulada

• N (0,1) y N(µ ,s2)


Distribución Normal Estándar
Para facilitar los cálculos se decidió tabular la normal para diferentes probabilidades con variables que siguen la distribución
normal. Pero, puesto que sería imposible tener una tabla para cada posible distribución normal, se elaboró solo una tabla, la
tabla de la distribución normal estándar, que es la distribución con media igual a cero y desviación estándar igual a uno.

De esta manera solo se tiene que transformar o estandarizar una distribución normal específica, se revisa la tabla, y se conoce la
probabilidad. Para estandarizar los valores de una variable, se utiliza la siguiente fórmula:

z =(x – μ) / σ

Con esta fórmula podemos transformar cualquier distribución normal a la distribución normal estándar

50 % de las observaciones están en el intervalo (x ± 0,68 σ)


68,3 % de las observaciones están en el intervalo (x ± σ)
95 % de las observaciones están en el intervalo (x ± 1,96 σ)
99 % de las observaciones están en el intervalo (x ± 2,58 σ)
99,9 % de las observaciones están en el intervalo (x ± 3,29 σ)
Normal o gausiana (Ejemplo 1)

Dados los datos de temperaturas medias (º C) para


el mes de Enero de la Estación Meteorológica. Se 1971 24.2 1986 26.5
pide determinar la probabilidad de que la 1972 24.8 1987 25.2

temperatura media del mes de Enero sea inferior a 1973 25.0 1988 24.9

26 ° C. 1974 25.2 1989 27.0


1975 24.7 1990 26.1
1976 25.3 1991 24.6
1977 24.9 1992 24.7
1978 24.9 1993 25.7
1979 26.1 1994 25.2
1980 25.8 1995 26.0
Media = 25,4 °C 1981 24.8 1996 25.6
Número de datos: n = 30 1982 24.6 1997 27.2
Desviación típica = 0.8 °C 1983 26.1 1998 24.0
Para la temperatura de 26 ºC, la variable tipificada será : ([26-25,4]/0.80) = 0,75. 1984 25.6 1999 25.8
En las tablas para un valor de z = 0,75, tenemos que la probabilidad de obtener una 1985 26.0 2000 26.7
valor inferior a Z será 0,7734.
Luego el 77,34 % de los años la temperatura será inferior a 26 ºC.
Normal o gausiana
Uso de Tabla Distribución Z
• Para determinar la probabilidad de ocurrencia de un suceso entre 2 puntos debemos
determinar el área bajo la curva entre dichos puntos.
• Depende tipo de tabla. Usaremos tabla de -¥ a X, ya que da la probabilidad acumulada.
• Existen otros tipos de tabla
• 0 a X, X a ¥, etc.
• Debemos razonar siempre como determinar el área.
• En nuestra tabla, para determinar P(-¥ a X) o P(Z ≤ X):
1. Buscamos en la columna izquierda de la tabla el valor del entero y primer decimal
2. Buscamos en la fila superior el valor del segundo decimal,
3. Interceptamos ambos valores obteniendo el valor de P.
4. Interpretamos este valor
Uso Tabla Normal Estándar (a)

Obtenga la probabilidad de que Z obtenga los siguientes valores:


• P (Z £ 1.17)
• Buscamos en la columna izquierda de la tabla el valor 1.1, y en la primera fila el
valor 0.07, interceptamos ambos valores obteniendo el valor de 0.8790, que es
el valor que buscábamos:
P(Z £ 1.17) = 0.879
Uso Tabla Normal Estándar (b)
• P(0£ Z £ 1.17)
• Esto lo podemos escribir de la siguiente forma también:
P(Z ≤1.17) - P(Z £ 0)
• El primer término lo conocemos, por que lo resolvimos en el literal a.
• Para el segundo término sabemos que la distribución normal es simétrica y que su área total es
igual a 1, por lo tanto el área que hay de -¥ a 0 (P(Z £ 0)) es igual a 1/2 = 0.5.
• Por lo que el valor que buscábamos estará dado por:
P(0≤ Z £ 1.17) = 0.879 - 0.5 = 0.379
Uso Tabla Normal Estándar (c)
• P(Z ³ 1.17)
• Sabiendo que el área total bajo toda la curva Normal de -¥ a +¥ es igual a 1, y conociendo el valor
del área de -¥ a 1.17, el valor del área de 1.17 a +¥ será:
1 - P(Z £ 1.17) = 1 - 0.879 = 0.121
Uso Tabla Normal Estándar (d)
• P(Z £ -1.17)
• Como estamos tratando con una curva simétrica, este valor será el mismo que el del literal c:
P(Z £ -1.17) = P(Z ³ 1.17) = 0.121
Uso Tabla Normal Estándar (e)
• P(0.42£ Z £ 1.17)
• Al igual que en el literal b, esto lo podemos escribir como:
P(Z ≤1.17) - P(Z £ 0.42).
• El primer valor lo conocemos, el segundo lo encontramos en la tabla de la misma forma:
P( Z £ 1.17) – P(Z £ 0.42)= 0.879-0.6628= 0.2162
Uso Tabla Normal Estándar (f)
h) P(|Z| ³ 1.17)
• Determinar el área de -¥ a -1.17 y de 1.17 a +¥. Como la curva es simétrica, simplemente multiplicamos el valor de P(Z ³
1.17) del literal c por 2:
P(|Z| ³ 1.17) = 2 x P(Z ³ 1.17) = 2 x 0.121 = 0.242
Uso Tabla Normal Estándar (g)
i) P(|Z| £ 1.17)
• Área dada por 1 menos valor literal h, ya que el valor total del área es igual a 1:
P(½Z½ £ 1.17) = 1- P(½Z½³ 1.17) = 1 - 0.242 = 0.758
Ejemplo 2
• La temperatura durante setiembre está distribuida normalmente con
media 18,7ºC y desviación standard 5ºC. Calcule la probabilidad de que
la temperatura durante setiembre esté por debajo de 21ºC.
Tabla Distribución Z

Esta tabla nos proporciona la probabilidad desde que ocurran sucesos menores
que Z = 0,46. Esto es, la probabilidad de que ocurran sucesos desde menos
infinito hasta el valor de Z de 0,46 es 0,6772. Esto es, un 67,72 %.
Distribución “t” de Student

• Desarrollada con base en distribuciones de frecuencia empíricas por


William Gosset, (a) “Student”.
• “The probable error of a mean” Biometrika (1908)

• Cervecero - estadístico con dificultadas al usar distribución Normal en


muestras pequeñas.

• Sin embargo, fue Fisher el que encontró mas aplicaciones para esta.
Distribución “t” de Student

• Distribución muestral del promedio se ajusta muy bien a la distribución Normal


cuando se conoce s. Si n es grande, esto no presenta ningún problema, aun cuando
s sea desconocida, por lo que en este caso es razonable sustituirla por s.

• Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas
muestras, esto no funciona tan bien.
Distribución “t” de Student

• Definiendo el estadístico t:

x -µ
t=
s/ n

• Se puede probar que siendo `x el promedio de una muestra tomada de


una población normal con media µ y varianza s2, el estadístico t es el
valor de una variable aleatoria con distribución "t" de Student y
parámetro n (grados de libertad) = n-1.
Características Distribución “t”
• Tiene media igual 0, es asintótica al eje x y su dominio va de - ¥ a
+¥;
• El área bajo la curva desde -¥ a +¥ es igual a 1
• µ = 0, s2 depende parámetro n (grados libertad)
• Varianza > 1, pero se aproxima a 1 cuando nÞ¥
• Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó
más, excelente aproximación
• Entre las aplicaciones:
• Estimación de intervalos de confianza para medias a partir de muestras
pequeñas
• Pruebas de hipótesis basadas en muestras < 30
Tabla de Distribución “t”

• Valores de ta a la derecha de los


cuales se encuentra el (100 x
a)% área de la curva.
• Localizamos la columna del valor
de a y fila del valor de n. La
intersección de la fila y la
columna nos dará el valor de ta.
Ejercicio en tabla
a) Calcular la probabilidad de obtener un valor mayor que 2,26 en una
distribución t con 9 gdl

b) Calcular la probabilidad de obtener un valor mayor que 2,26 o


menor que -2,26 en una distribución t con 9 gdl

c) Calcular el valor de t después del cual se encuentre el 5% del área


de la curva con 9 gdl

d) Calcular el valor de t para alfa = 0,05 con 9 gdl y dos colas


Chi-cuadrado
• Distribución Chi-cuadrado es una función de densidad de probabilidad
que representa la distribución muestral de la varianza.

• Definimos el estadístico Chi-cuadrado (c2) como:

2
(n - 1) s
c =2

s 2
Caracteristicas Chi-cuadrado
• Asimétrica y asintótica al eje x por la derecha;
• Su dominio va de 0 a +¥
• Área bajo la curva desde 0 a +¥ =1
• Tiene parámetro n = n-1 (g.d.l.)
• Al aumentar n se aproxima a la normal
• Representa distribución muestral de la varianza.
• Entre las aplicaciones:
• Determinación intervalos confianza para varianzas
• Pruebas de hipótesis para una varianza
• Tablas de contingencia
• El ajuste de datos a una distribución dada conocida
• Las pruebas de independencia.
Tabla Distribución c2

• Valores c2 para varios n,


• Área a su derecha = a.
• 1ª columna = n
• 1ª fila: áreas en la cola a la
derecha de c2
• Cuerpo tabla son los valores
de c2
Ejercicios

a) Calcular la probabilidad de obtener un valor mayor de 23.7 en


una distribución c2 con n = 14 g.d.l.

b) Calcular el valor de c2 despues del cual se encuentre el 5% del


área en una distribución Chi-cuadrado con 4 g.d.l.
Distribución "F” de Fisher
• Tambien llamada "F” de Fisher - Schnedecor
• Representa la distribución muestreal de la razón de dos varianzas. Es
decir que se obtiene de la razón de dos distribuciones Ji-cuadrado.
• Definimos el estadístico F como:
2
s
F= 2 1

s2
• El cual es el valor de una variable aleatoria que tiene distribución F con
parámetros n1=n1-1 y n2=n2-1.
Propiedades de Distribución F
• Asimétrica, y asintótica al eje x por el lado derecho
• Su dominio va de 0 a +¥
• Area bajo curva desde 0 a +¥ =1
• Tiene parámetros n1=n1-1 y n2=n2-1.
• Entre sus aplicaciones:
• Pruebas de hipótesis entre 2 varianzas
• Análisis de varianza
• Análisis de covarianza.
Tabla de Distribución F
• Tablas independientes de valores
de F para a=0.01 y a=0.05 para
varias combinaciones de n1 y n2.
• Se escoge la tabla para la
probabilidad deseada y se escoge
n1 en la fila superior y n2 en la 1ª
columna. La intersección nos da el
valor de F deseado.
Tabla de Distribución F

40
Distribuciones de
Probabilidad: Variables
Continuas.

41

También podría gustarte