Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones Estadisticas PDF
Distribuciones Estadisticas PDF
LOS DATOS)
Permite calcular la probabilidad de tener k fracasos antes de que ocurra el r-ésimo éxito.
En el caso de que los sucesos ocurran a intervalos regulares de tiempo, esta variable
proporciona el tiempo total para que ocurran r éxitos.
Hay una forma equivalente de definir esta variable, como el número de ensayos que hay
que realizar para obtener el r-ésimo éxito (Palmer, 1995).
En el siguiente gráfico se muestra la función de probabilidad de la distribución
Binomial negativa con un número de éxitos igual a 10 y una probabilidad de éxito de
0.4. En abcisas se representan los distintos valores que puede tomar la variable X
(número de ensayos), y en ordenadas se representa la probabilidad asociada a cada valor
posible de X.
En la dirección http://home.clara.net/sisa/negbino2.htm se puede acceder a una página
con la calculadora que se muestra a continuación, en la que se han introducido los
parámetros utilizados en el gráfico anterior para el cálculo de probabilidades no
acumuladas basadas en la función de probabilidad de la distribución Binomial negativa.
Distribución Geométrica
Distribución Multinomial
Generaliza la distribución binomial al caso en que la población se divida en k>2 grupos
mutuamente exclusivos y exhaustivos. Permite obtener la probabilidad de la ocurrencia
de una determinada repartición.
En este caso se cumple que n = x1 + x2 + ... + xk , donde cada xi tiene una probabilidad
pi de ocurrencia. Se cumple que ∑ pi=1.
DISTRIBUCIONES CONTINUAS
Distribución Uniforme
Distribución Triangular
Se denomina así por el hecho de que la función de densidad tiene una forma triangular,
que viene definida de la siguiente manera:
Se denomina triangular cuando viene definida por dos parámetros, que representan el
valor mínimo y el valor máximo de la variable. En este caso el triángulo es equilátero.
Se denomina triangularG (triangular general), cuando viene dada por tres parámetros,
que representan el valor mínimo y el valor máximo de la variable, y el valor del punto
en el que el triángulo toma su altura máxima. En este caso el triángulo no es
necesariamente equilátero.
La función de densidad de la distribución triangularG viene dada por:
Cuando el valor de c sea la media de los dos valores extremos a y b, tendremos la
distribución triangular. En el siguiente gráfico se puede ver una distribución triangular
(triángulo equilátero de color negro) y una triangularG (triángulo no equilátero de color
rojo).
Distribución Log-Normal
Esta distribución es usada para modelizar datos que presentan asimetría positiva.
A continuación se proporciona el gráfico que el programa STATLETS realiza al
especificar los parámetros 3 y 0.9 para la distribución Lognormal. Creemos que este
programa utiliza esta distribución de forma incorrecta ya que usa los parámetros µ y σ
como la media y desviación estándar de la distribución, que como hemos dicho
anteriormente es incorrecto.
Nuestra creencia en que los cálculos bajo esta distribución no son correctos, viene
apoyada en que sus resultados difieren de los obtenidos con otros programas tipo
MINITAB o SPSS.
Distribución Gamma
En la dirección http://www.stat.ucla.edu/calculators/cdf/gamma/gammacalc.phtml
accederá a un calculador de probabilidades acumuladas basadas la distribución Gamma.
En dicha aplicación, especificando 3 de los siguientes valores proporciona el cuarto (en
el que debe introducirse un signo de interrogación): valor de X, probabilidad
acumulada, parámetro de escala y parámetro de forma. UCLA Statistics.
Como ejemplo, se ha calculado la probabilidad acumulada en el punto X=1 con
parámetros de escala y de forma igual a 30, de forma que Pr(X≤ 1)=0.524283.
Distribución Erlang
Por lo tanto, si tomamos como ejemplo la distribución Erlang con parámetro de forma
15 y parámetro de escala 5 obtendríamos que Pr(X≤ 3)= 0.534346, valor equivalente en
una distribución Gamma con los mismos parámetros. No existirá esa igualdad cuando el
parámetro de forma no sea un valor entero.
Distribución Exponencial
Distribución Weibull
Esta distribución se generaliza a una que depende de tres parámetros, denominada W(α
,β ,µ ) siendo α >0, β >0 y µ ≥ 0. El parámetro µ es el valor más pequeño que puede
tomar la variable.
La distribución Weibull es una de las pocas distribuciones que puede ser usada para
modelizar datos que presentan asimetría negativa.
Está definida para todo valor de x, siendo µ un parámetro de localización (moda) y σ >0
un parámetro de escala. Los valores de la variable aleatoria son no negativos, mientras
que el dominio de la distribución se mueve en todo el eje real.
En la siguiente figura se muestran dos funciones de densidad Gumbel, una de ellas con
parámetro moda 3 y parámetro escala 5, y la otra con parámetros 5 y 10
respectivamente.
Distribución Beta
En la siguiente figura se presentan tres funciones de densidad Beta, cada una de ellas
con parámetros p (Shape 1) y q (Shape 2) distintos.
En la dirección http://www.stat.ucla.edu/calculators/cdf/beta/betacalc.phtml tendrá
acceso a un calculador de probabilidades acumuladas basadas en dicha distribución.
Especificando 3 de los siguientes valores proporciona el cuarto (en el que debe
introducirse un signo de interrogación): valor de X, probabilidad acumulada, parámetro
p (A Parameter) y parámetro q (B Parameter). UCLA Statistics.
Con los datos de ejemplo introducidos en el calculador se obtendría que ?=0.5, es decir,
Pr(X≤ 0.5)=0.5. Esta probabilidad acumulada en el punto X=0.5 para los parámetros
dados se puede corroborar en el gráfico anterior, puesto que existe un 50% de área
(0.5*100) perteneciente a la distribución Beta (3,3) que queda por debajo de dicho valor
X, hecho perfectament visible si se traza una línea imaginaria perpendicular al eje de
abcisas desde el punto X=0.5 al punto de corte con la función de densidad en cuestión.
Distribución de Cauchy
Distribución Logística
Creemos que, al calcular el valor de la función de densidad por medio del programa
STATLETS, este proporciona el valor con un pequeño error, por lo que es aconsejable,
en este caso, utilizar otro programa. Entre los programas comerciales se pueden utilizar
el MINITAB, el SPSS o el STATISTICA.
En la dirección http://www.stat.ucla.edu/calculators/cdf/logistic/logisticcalc.phtml
encontrará un calculador basado en la función de distribución Logística. Especificando
3 de los siguientes valores proporciona el cuarto (en el que debe introducirse un signo
de interrogación): valor de X, probabilidad acumulada, parámetro α (Location
Parameter) y parámetro β (Scale Parameter). UCLA Statistics.
Distribución de Laplace
En la dirección http://www.stat.ucla.edu/calculators/cdf/laplace/laplacecalc.phtml
encontrará un calculador basado en la función de distribución de Laplace. UCLA
Statistics.
Especificando 3 de los siguientes valores proporciona el cuarto (en el que debe
introducirse un signo de interrogación): valor de X, probabilidad acumulada, parámetro
media (Location Parameter) y parámetro de escala (Scale Parameter). Como ejemplo, y
basándonos en los parámetros del gráfico anterior, se obtiene que Pr(X≤ 2)= 0.932332.
Distribución de Pareto
Esta distribución depende de dos parámetros positivos, α y x0. La introdujo Pareto para
describir unidades económicas tales como salarios, rentas, etc., y se simboliza mediante
Par(α , x0)
Permite calcular la probabilidad, por ejemplo, de tener una renta superior a un
determinado valor x0.
Cuando un investigador lleva a cabo una prueba de hipótesis para estudiar, por ejemplo,
la posible existencia de relación entre variables, aplicará una prueba estadística que le
proporcionará un valor que deberá ser situado en la distribución de referencia para
poder averiguar la plausibilidad de la hipótesis nula de no relación y, en función del área
(probabilidad) que le corresponda, tomar la decisión de mantener la hipótesis nula de no
relación (independencia) o rechazar dicha hipótesis en favor de la hipótesis alternativa
de existencia de relación entre las variables analizadas.
Se distingue entre variables aleatorias discretas y continuas, definiéndose una variable
aleatoria discreta aquella que puede tomar un número finito o numerable de valores,
mientras que una variable aleatoria continua puede tomar infinitos valores, es decir
cualquier valor dentro de un intervalo.
Cuando se trata de variables discretas, se puede calcular la probabilidad de obtener un
determinado valor , por medio de la función de probabilidad, denominada f(x) y
definida como la probabilidad P(X=x), así como la probabilidad de obtener un valor
inferior o igual a x, por medio de la función de distribución, denominada F(x) y definida
como la probabilidad acumulada P(X≤ x).
DISTRIBUCIONES DISCRETAS
Distribución de Bernoulli
Sea un experimento aleatorio donde sólo pueden darse dos resultados: presencia del
suceso (definido como X=1) o ausencia del suceso (definido como X=0). La
distribución de esta variable aleatoria viene determinada por un parámetro, p que
representa la probabilidad de acertar o tener éxito en una realización.
Distribución Binomial
Distribución de Poisson
El valor del parámetro λ > 0 representa el número promedio esperado, por unidad de
tiempo o de espacio.
Así pues, al parámetro λ se le denomina parámetro de tasa, ya que, en una unidad de
espacio o de tiempo puede que no se observen exactamente λ eventos, pero sin embargo
en un amplio espacio de tiempo o de espacio esperaremos observar un evento
ocurriendo en una tasa de λ por unidad del tiempo o del espacio.
En general se define que una variable aleatoria de Poisson describe un evento raro o
poco frecuente, lo cual debe ser entendido en el sentido de que la probabilidad de
P(X=k) es menor a medida que el valor de k es mayor.
Ejemplos: el número de errores en una página de un libro, el número de llamadas
telefónicas equivocadas al cabo de un día.
En el siguiente gráfico se muestra la función de probabilidad de Poisson con λ =4.
En la dirección http://www.stat.ucla.edu/calculators/cdf/poisson/poissondens.phtml
tendrá acceso a un calculador de la distribución de Poisson no acumulada, en la que
especificando el valor de X ( número de sucesos) y el parámetro λ (Intensity parameter,
que representa el número promedio de sucesos esperado) se proporciona la probabilidad
de ocurrencia de esos X sucesos (campo Density). Para ello, pulsar el botón Submit!.
UCLA Statistics.
DISTRIBUCIONES CONTINUAS
Distribución Normal
Es una distribución simétrica cuyos valores se mueven en todo el eje real. Depende de
dos parámetros, la media µ y la desviación estándar σ . Se simboliza por N(µ ,σ ).
Esta distribución, conocida también como distribución gausiana o distribución de
Laplace-Gauss, es la distribución más conocida y utilizada en estadística, siendo una
distribución seguida por un gran número de variables.
Cuando a una variable X que sigue la normal N(µ ,σ ).se le realiza el cambio de variable
Y=(X-µ )/σ se obtiene la distribución normal N(0,1) denominada normal centrada y
reducida, o distribución normal estándar o unitaria.
En el siguiente gráfico se muestra la función de densidad de la distribución Normal
centrada y reducida.
En la dirección http://www.stat.ucla.edu/calculators/cdf/normal/normaldens.phtml
encontrará un calculador de la distribución Normal no acumulada , en la que
introduciendo el valor X, la media y la desviación estándar de la distribución se obtiene
la densidad del valor X. UCLA Statistics.
Como se ve en la figura, dado un valor X=1.96 se obtiene su densidad en la distribución
Normal centrada y reducida, f(x=1.96)=0.058441.
Distribución Ji-cuadrado
En la dirección http://www.stat.ucla.edu/calculators/cdf/ncchi2/ncchi2calc.phtml se
puede calcular la probabilidad acumulada en el valor X de una distribución Ji- cuadrado
no centrada con n grados de libertad y parámetro de descentralización δ . Especificando
3 de los siguientes cuatro valores proporciona el cuarto (en el que debe introducirse un
signo de interrogación): valor X, probabilidad, grados de libertad (Degrees of Freedom)
y parámetro de descentralización (Noncentrality Parameter) . UCLA Statistics.
Con los tres parámetros especificados en la figura se obtendría una probabilidad
acumulada de 0.489703 (Pr(X≤ 20).
Distribución t de Student
En la dirección
http://www.stat.ucla.edu/calculators/cdf/ncstudent/ncstudentcalc.phtmlse puede
calcular la probabilidad acumulada asociada a un valor X situado en una distribución t
de Student no centrada con n grados de libertad y parámetro de descentralización δ .
UCLA Statistics.
Distribución F de Snedecor
Se deben introducir los grados de libertad del numerador, los grados de libertad del
denominador y el valor de F. Pulsar a continuación el botón Compute, que calculará la
probabilidad dejada a la derecha del valor F. En el ejemplo vemos que, dada una
distribución F de Snedecor con 5 y 10 grados de libertad, el valor F=1 deja una
probabilidad de 0.46512 a su derecha (área del 46,5%), valor complementario al
obtenido en el calculador anterior (0.534881, que corresponde con la probabilidad que
deja el valor F=1 a su izquierda).
Si bien a primera vista puede parecer que las distribuciones no tienen nada en común, lo
cierto es que, bajo ciertas condiciones, dos distribuciones pueden tener una equivalencia
tal que, para un valor determinado, la probabilidad bajo las dos distribuciones sea muy
similar, por lo que su cálculo puede ser realizado sobre cualquiera de las dos
distribuciones, por lo que, en este caso, se utilizará la distribución que sea más cómoda
para el usuario.
Binomial y Poisson
Una distribución binomial B(n,p) puede ser aproximada por medio de la distribución de
Poisson P(λ ), cuando la probabilidad de ocurrencia sea pequeña, sin más que obtener el
valor del parámetro λ de Poisson por medio de la relación:
En la dirección
http://www.stat.wvu.edu/SRS/Modules/PoissonApprox/poissonapprox.html puede
encontrar una aplicación en la que se demuestra cómo una distribución binomial puede
ser aproximada por una distribución de Poisson. Se puede comparar la distribución de
frecuencias bajo una binomial y una Poisson cuando modificamos los valores n y p.
Incluye ejercicios y ejemplos. Eberly College of Arts and Sciences. Departament of
Statistics.
En esta aplicación se puede optar entre la visualización de la función de probabilidad
(f(x)), que representa la probabilidad en un punto específico, o bien, por la función de
distribución (F(x)), que representa la probabilidad acumulada.
Para actualizar los cambios en las distribuciones una vez modificados los parámetros n
y p se debe pulsar el botón Rescale.
En la dirección
http://www.stat.wvu.edu/SRS/Modules/NormalApprox/normalapprox.html se
encuentra una aplicación que puede usarse para obtener la aproximación de la binomial
a la Normal, para estudiar las diferencias entre las probabilidades obtenidas bajo las dos
distribuciones, y para estudiar en qué condiciones la aproximación es buena. Permite
ajustar los parámetros n y p, y ver gráficamente si la forma de la distribución se ajusta a
la normal. Por otra parte, también se puede optar entre la visualización de la función de
probabilidad (Binomial) / densidad (Normal) (f(x)), que representa la probabilidad en un
punto (Binomial) o intervalo (Normal) específico, o bien, por la función de distribución
(F(x)), que representa la probabilidad acumulada. Eberly College of Arts and Sciences.
Department of Statistics.
Para actualizar los cambios en las distribuciones una vez modificados los parámetros n
y p se debe pulsar el botón Rescale.
En la imagen puede ver como hemos aproximado una distribución binomial B(20, 0.5) a
una distribución normal, y cómo la probabilidad asociada al rango de valores discretos
7-13 (columnas) en la distribución binomial (0.8846) es muy similar a la probabilidad
asociada al mismo rango continuo (6.5-13.5, línea amarilla) de la distribución normal
(0.8824).
La selección de un rango de valores o área del gráfico para encontrar su probabilidad se
debe realizar a través de la lista desplegable que se encuentra encima del gráfico, en la
zona grisácea. Si hacemos clic en el botón de flecha que aparece justo al final del campo
con el texto Prob, aparecerá una lista de las posibles formas de selección de una zona
del gráfico. Una vez seleccionada la opción emergerá un cuadro de diálogo donde
introducir los valores discretos enteros del eje X que definirán la zona a seleccionar (en
color azul en el gráfico):
x>= a Se debe introducir el valor a en el campo Lower bound .
x<=a Se debe introducir el valor a en el campo Upper bound
a<=x<=b Se debe introducir el valor a en el campo Lower bound y b en el campo Upper
bound
x=? Se debe introducir el valor discreto escogido.
Poisson y Normal
Normal y Ji-cuadrado
Para n grande (n≥ 30), un valor de la distribución ji-cuadrado se puede obtener por su
valor en la distribución normal, por medio de la siguiente transformación:
SOFTWARE ADECUADO
Una distribución viene caracterizada, entre otros índices, por una medida de su
localización, la esperanza matemática, y una medida de su dispersión alrededor de la
esperanza, denominada variancia.
A partir de la función de probabilidad o de densidad se puede calcular el valor de la
esperanza matemática, que representa el centro de gravedad de los valores de la
distribución donde la masa de cada punto es proporcional a la densidad en dicho punto.
Su cálculo se realiza por medio de la siguiente expresión:
Para una variable discreta:
Una expresión que a veces resulta más fácil utilizar para el cálculo de la variancia viene
dada por:
Binomial: B(n,p)
Poisson: P(λ )
Normal: N(µ , σ )
Ji-cuadrado: χ 2(n)
t de Student: t(n)
F de Snedecor: F(m,n)