Está en la página 1de 8

Distribucin de Bernoulli

En teora de probabilidad y estadstica, la distribucin de Bernoulli (o distribucin dicotmica), nombrada as


por el matemtico y cientfico suizo Jakob Bernoulli, es una distribucin de probabilidad discreta, que toma
valor 1 para la probabilidad de xito () y valor 0 para la probabilidad de fracaso ().
Si es una variable aleatoria que mide el "nmero de xitos", y se realiza un nico experimento con dos
posibles resultados (xito o fracaso), se dice que la variable aleatoria se distribuye como una Bernoulli de
parmetro .
Su funcin de probabilidad viene definida por:
La frmula ser:
Un experimento al cual se aplica la distribucin de Bernoulli se conoce como Ensayo de Bernoulli o
simplemente ensayo, y la serie de esos experimentos como ensayos repetidos.

Propiedades caractersticas

Esperanza matemtica:

Varianza:

Funcin generatriz de momentos:

Funcin caracterstica:

Moda:

0 si q > p (hay ms fracasos que xitos)


1 si q < p (hay ms xitos que fracasos)
0 y 1 si q = p (los dos valores, pues hay igual nmero de fracasos que de xitos)

Asimetra (Sesgo):

Curtosis:

La Curtosis tiende a infinito para valores de cercanos a 0 a 1, pero para la distribucin de Bernoulli
tiene un valor de curtosis menor que el de cualquier otra distribucin, igual a -2.

Caracterizacin por la binomial:

; donde es una distribucin binomial.

Distribuciones Relacionada

Si son variables aleatorias identicamente distribuidas con la distribucin de Bernoulli con la misma
probabilidad de xito en todas, entonces la variable aleatoria presenta una distribucin binomial de
probabilidad.

Ejemplo

"Lanzar una moneda, probabilidad de conseguir que salga cruz".


Se trata de un solo experimento, con dos resultados posibles: el xito (p) se considerar sacar cruz.
Valdr 0,5. El fracaso (q) que saliera cara, que vale (1 - p) = 1 - 0,5 = 0,5.

La variable aleatoria X medir "nmero de cruces que salen en un lanzamiento", y slo existirn dos
resultados posibles: 0 (ninguna cruz, es decir, salir cara) y 1 (una cruz).

Por tanto, la v.a. X se distribuir como una Bernoulli, ya que cumple todos los requisitos.

Distribucin binomial
En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que cuenta el nmero de
xitos en una secuencia de n ensayos de Bernoulli independientes entre s, con una probabilidad fija p de
ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotmico, esto es,
slo son posibles dos resultados. A uno de estos se denomina xito y tiene una probabilidad de ocurrencia p y
al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado nmero de
xitos. Para n = 1, la binomial se convierte, de hecho, en una distribucin de Bernoulli.
Para representar que una variable aleatoria X sigue una distribucin binomial de parmetros n y p, se escribe:
La distribucin binomial es la base del test binomial de significacin estadstica.

Ejemplo

Las siguientes situaciones son ejemplos de experimentos que pueden modelizarse por esta distribucin:

Se lanza un dado diez veces y se cuenta el nmero X de tres obtenidos: entonces X ~ B(10, 1/6)

Se lanza una moneda dos veces y se cuenta el nmero X de caras obtenidas: entonces X ~ B(2, 1/2)

Experimento binomial

Existen muchas situaciones en las que se presenta una experiencia binomial. Cada uno de los experimentos
es independiente de los restantes (la probabilidad del resultado de un experimento no depende del resultado
del resto). El resultado de cada experimento ha de admitir slo dos categoras (a las que se denomina xito y
fracaso). Las probabilidades de ambas posibilidades han de ser constantes en todos los experimentos (se
denotan como p y q o p y 1-p).

Se designa por X a la variable que mide el nmero de xitos que se han producido en los n experimentos.

Cuando se dan estas circunstancias, se dice que la variable X sigue una distribucin de probabilidad binomial,
y se denota B(n,p).

Ejemplo.

Supongamos que se lanza un dado (con 6 caras) 51 veces y queremos conocer la probabilidad de que el
nmero 3 salga 20 veces. En este caso tenemos una X ~ B(51, 1/6) y la probabilidad sera P(X=20):

Distribucin geomtrica
En teora de probabilidad y estadstica, la distribucin geomtrica es cualquiera de las dos distribuciones de
probabilidad discretas siguientes:
la distribucin de probabilidad del nmero X del ensayo de Bernoulli necesaria para obtener un xito,
contenido en el conjunto { 1, 2, 3,...} o

la distribucin de probabilidad del nmero Y = X 1 de fallos antes del primer xito, contenido en el
conjunto { 0, 1, 2, 3,... }.

Propiedades
1. La distribucin geomtrica no tiene memoria, es decir,

2. Si la probabilidad de xito en cada ensayo es p, entonces la de que x ensayos sean necesarios para
obtener un xito es para x = 1, 2, 3,.... Equivalentemente, la de que haya x fallos antes del primer
xito es para y = 0, 1, 2,... .En ambos casos, la secuencia de es una progresin geomtrica.

3. El valor esperado de una variable aleatoria X distribuida geomtricamente es y dado que Y = X-1, .

4. En ambos casos, la varianza es .

5. Las funciones generatrices de X y la de Y son, respectivamente, .

6. Como su anloga continua, la distribucin exponencial, la distribucin geomtrica carece de memoria.


Esto significa que si intentamos repetir el experimento hasta el primer xito, entonces, dado que el
primer xito todava no ha ocurrido, la distribucin de condicional del nmero de ensayos adicionales
no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene
"memoria" de estos fallos. La distribucin geomtrica es de hecho la nica distribucin discreta sin
memoria.

7. De todas estas distribuciones de contenidas en {1, 2, 3,... } con un valor esperado dado , la
distribucin geomtrica X con parmetro p = 1/ es la de mayor entropa.

1. La distribucin geomtrica del nmero y de fallos antes del primer xito es infinitamente divisible, esto
es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,..., Yn distribuidas
idnticamente la suma de las cuales tiene la misma distribucin que tiene Y. Estas no sern
geomtricamente distribuidas a menos que n = 1.

Distribuciones relacionadas[editar]
La distribucin geomtrica es un caso especial de la distribucin binomial negativa con parmetro k = 1. Ms
generalmente, si Y 1,...,Yk son variables independientes distribuidas geomtricamente con parmetro p,
entonces sigue a una distribucin binomial negativa con parmetros k y p.

Si Y1,...,Yr son variables independientes distribuidas geomtricamente (con diferentes parmetros de


xito pm posibles ), entonces su mnimo es tambin geomtricamente distribuido, con parmetro

La distribucin de Poisson

Se trata de un modelo discreto, pero en el que el conjunto de valores con probabilidad no nula
no es finito, sino numerable. Se dice que una variable aleatoria X sigue la distribucin de
Poisson si su funcin de densidad viene dada por:

Como vemos, este modelo se caracteriza por un slo parmetro , que debe ser positivo.

Esta distribucin suele utilizarse para contajes del tipo nmero de individuos por unidad de
tiempo, de espacio, etc.

Propiedades del modelo de Poisson

1) Esperanza: E(X) = .

2) Varianza: V(X) = .

En esta distribucin la esperanza y la varianza coinciden.

3) La suma de dos variables aleatorias independientes con distribucin de Poisson resulta en


una nueva variable aleatoria, tambin con distribucin de Poisson, de parmetro igual a la
suma de parmetros:

X1 ~ P( = 1) y X2 ~ P( = 2)

y definimos Z = X1 + X2, entonces,

Z ~ P( = 1 + 2)

Este resultado se extiende inmediatamente al caso de n variables aleatorias independientes con


distribucin de Poisson. En este caso, la variable suma de todas ellas sigue una distribucin de
Poisson de parmetro igual a la suma de los parmetros.

Anlisis de Correlacin
El anlisis de correlacin emplea mtodos para medir la significacin del grado o
Intensidad de asociacin entre dos o mas variables. El concepto de correlacin esta
Estrechamente vinculado al concepto de regresion, pues, para que una ecuacion de
regresin sea razonable los puntos muestrales deben estar cenidos a la ecuacion de
regresion; ademas el coeficiente de correlacion debe ser:
- grande cuando el grado de asociacion es alto (cerca de +1 o -1, y pequeno cuando
es bajo, cerca de cero.
- independiente de las unidades en que se miden las variables.
Coeficiente de correlacion Lineal Simple ( r).
Es un numero que indica el grado o intensidad de asociacion entre las variables X e Y. Su
valor varia entre -1 y +1; esto es:
-1 r 1.
Si r = -1, la asociacion es perfecta pero inversa; es decir, a valores altos de una variable le
corresponde valores bajos a la otra variable, y viceversa.
Si r=+1, tambien la asociacion es perfecta pero directa.
Si r=0, no existe asociacion entre las dos variables.
Luego puede verse que a medida que r se aproxime a -1 o +1 la asociacion es mayor, y
cuando se aproxima a cero la asociacion disminuye o desaparece.
El coeficiente de correlacion esta dada por:
SCX SCY
SPXY
r
.
=
Para los datos de la produccion de madera aserrada total entre los anos 1990 a 1999,
existe una asociacion de 0.68.
( )( ) 0.68
105525,86 82,5
2015,17 r = =
Coeficiente de Determinacion (R)
F. de Mendiburu
9
Mide el porcentaje de variacion en la variable respuesta, explicada por la variable
independiente.
De la descomposicion de la suma de cuadrados total, se obtuvo:
SCT = SCR + SCE
SCR = Suma de cuadrados de la regresion.
SCE = Suma de cuadrados residual (error).
dividiendo ambos miembros por la SCT, se tiene:
1 = SCR/SCT + SCE/SCT
de este resultado, se define el coeficiente de determinacion como:
R2 = 1 - SCE/SCT = SCR/SCT
R2 = SC regresion / SC total
Como SCR SCT, se deduce que 0 R2 1.
Interpretacion de R2:
Se interpreta como una medida de ajuste de los datos observados y proporciona el
porcentaje de la variacion total explicada por la regresion.
R2 es un valor positivo, expresado en porcentaje es menor de 100.
Tambien, se puede obtener el R2 ajustado que es la relacion entre cuadrados medios, asi:
R2 ajustado = 1 CME / CM Total;
Este valor podria ser negativo en algunos casos.
Lo que se espera que ambos R2, resulten similares, para dar una confianza al coeficiente
de determinacion.
Para el ejemplo, resulta:
R2 ajustado = 1 70378 / (105526 / 9 ) = 0,39 y R2 = 1 56302,7 / 105525,86 = 0,46

También podría gustarte