Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Propiedades caractersticas
Esperanza matemtica:
Varianza:
Funcin caracterstica:
Moda:
Asimetra (Sesgo):
Curtosis:
La Curtosis tiende a infinito para valores de cercanos a 0 a 1, pero para la distribucin de Bernoulli
tiene un valor de curtosis menor que el de cualquier otra distribucin, igual a -2.
Distribuciones Relacionada
Si son variables aleatorias identicamente distribuidas con la distribucin de Bernoulli con la misma
probabilidad de xito en todas, entonces la variable aleatoria presenta una distribucin binomial de
probabilidad.
Ejemplo
La variable aleatoria X medir "nmero de cruces que salen en un lanzamiento", y slo existirn dos
resultados posibles: 0 (ninguna cruz, es decir, salir cara) y 1 (una cruz).
Por tanto, la v.a. X se distribuir como una Bernoulli, ya que cumple todos los requisitos.
Distribucin binomial
En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que cuenta el nmero de
xitos en una secuencia de n ensayos de Bernoulli independientes entre s, con una probabilidad fija p de
ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotmico, esto es,
slo son posibles dos resultados. A uno de estos se denomina xito y tiene una probabilidad de ocurrencia p y
al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado nmero de
xitos. Para n = 1, la binomial se convierte, de hecho, en una distribucin de Bernoulli.
Para representar que una variable aleatoria X sigue una distribucin binomial de parmetros n y p, se escribe:
La distribucin binomial es la base del test binomial de significacin estadstica.
Ejemplo
Las siguientes situaciones son ejemplos de experimentos que pueden modelizarse por esta distribucin:
Se lanza un dado diez veces y se cuenta el nmero X de tres obtenidos: entonces X ~ B(10, 1/6)
Se lanza una moneda dos veces y se cuenta el nmero X de caras obtenidas: entonces X ~ B(2, 1/2)
Experimento binomial
Existen muchas situaciones en las que se presenta una experiencia binomial. Cada uno de los experimentos
es independiente de los restantes (la probabilidad del resultado de un experimento no depende del resultado
del resto). El resultado de cada experimento ha de admitir slo dos categoras (a las que se denomina xito y
fracaso). Las probabilidades de ambas posibilidades han de ser constantes en todos los experimentos (se
denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el nmero de xitos que se han producido en los n experimentos.
Cuando se dan estas circunstancias, se dice que la variable X sigue una distribucin de probabilidad binomial,
y se denota B(n,p).
Ejemplo.
Supongamos que se lanza un dado (con 6 caras) 51 veces y queremos conocer la probabilidad de que el
nmero 3 salga 20 veces. En este caso tenemos una X ~ B(51, 1/6) y la probabilidad sera P(X=20):
Distribucin geomtrica
En teora de probabilidad y estadstica, la distribucin geomtrica es cualquiera de las dos distribuciones de
probabilidad discretas siguientes:
la distribucin de probabilidad del nmero X del ensayo de Bernoulli necesaria para obtener un xito,
contenido en el conjunto { 1, 2, 3,...} o
la distribucin de probabilidad del nmero Y = X 1 de fallos antes del primer xito, contenido en el
conjunto { 0, 1, 2, 3,... }.
Propiedades
1. La distribucin geomtrica no tiene memoria, es decir,
2. Si la probabilidad de xito en cada ensayo es p, entonces la de que x ensayos sean necesarios para
obtener un xito es para x = 1, 2, 3,.... Equivalentemente, la de que haya x fallos antes del primer
xito es para y = 0, 1, 2,... .En ambos casos, la secuencia de es una progresin geomtrica.
3. El valor esperado de una variable aleatoria X distribuida geomtricamente es y dado que Y = X-1, .
7. De todas estas distribuciones de contenidas en {1, 2, 3,... } con un valor esperado dado , la
distribucin geomtrica X con parmetro p = 1/ es la de mayor entropa.
1. La distribucin geomtrica del nmero y de fallos antes del primer xito es infinitamente divisible, esto
es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,..., Yn distribuidas
idnticamente la suma de las cuales tiene la misma distribucin que tiene Y. Estas no sern
geomtricamente distribuidas a menos que n = 1.
Distribuciones relacionadas[editar]
La distribucin geomtrica es un caso especial de la distribucin binomial negativa con parmetro k = 1. Ms
generalmente, si Y 1,...,Yk son variables independientes distribuidas geomtricamente con parmetro p,
entonces sigue a una distribucin binomial negativa con parmetros k y p.
La distribucin de Poisson
Se trata de un modelo discreto, pero en el que el conjunto de valores con probabilidad no nula
no es finito, sino numerable. Se dice que una variable aleatoria X sigue la distribucin de
Poisson si su funcin de densidad viene dada por:
Como vemos, este modelo se caracteriza por un slo parmetro , que debe ser positivo.
Esta distribucin suele utilizarse para contajes del tipo nmero de individuos por unidad de
tiempo, de espacio, etc.
1) Esperanza: E(X) = .
2) Varianza: V(X) = .
X1 ~ P( = 1) y X2 ~ P( = 2)
Z ~ P( = 1 + 2)
Anlisis de Correlacin
El anlisis de correlacin emplea mtodos para medir la significacin del grado o
Intensidad de asociacin entre dos o mas variables. El concepto de correlacin esta
Estrechamente vinculado al concepto de regresion, pues, para que una ecuacion de
regresin sea razonable los puntos muestrales deben estar cenidos a la ecuacion de
regresion; ademas el coeficiente de correlacion debe ser:
- grande cuando el grado de asociacion es alto (cerca de +1 o -1, y pequeno cuando
es bajo, cerca de cero.
- independiente de las unidades en que se miden las variables.
Coeficiente de correlacion Lineal Simple ( r).
Es un numero que indica el grado o intensidad de asociacion entre las variables X e Y. Su
valor varia entre -1 y +1; esto es:
-1 r 1.
Si r = -1, la asociacion es perfecta pero inversa; es decir, a valores altos de una variable le
corresponde valores bajos a la otra variable, y viceversa.
Si r=+1, tambien la asociacion es perfecta pero directa.
Si r=0, no existe asociacion entre las dos variables.
Luego puede verse que a medida que r se aproxime a -1 o +1 la asociacion es mayor, y
cuando se aproxima a cero la asociacion disminuye o desaparece.
El coeficiente de correlacion esta dada por:
SCX SCY
SPXY
r
.
=
Para los datos de la produccion de madera aserrada total entre los anos 1990 a 1999,
existe una asociacion de 0.68.
( )( ) 0.68
105525,86 82,5
2015,17 r = =
Coeficiente de Determinacion (R)
F. de Mendiburu
9
Mide el porcentaje de variacion en la variable respuesta, explicada por la variable
independiente.
De la descomposicion de la suma de cuadrados total, se obtuvo:
SCT = SCR + SCE
SCR = Suma de cuadrados de la regresion.
SCE = Suma de cuadrados residual (error).
dividiendo ambos miembros por la SCT, se tiene:
1 = SCR/SCT + SCE/SCT
de este resultado, se define el coeficiente de determinacion como:
R2 = 1 - SCE/SCT = SCR/SCT
R2 = SC regresion / SC total
Como SCR SCT, se deduce que 0 R2 1.
Interpretacion de R2:
Se interpreta como una medida de ajuste de los datos observados y proporciona el
porcentaje de la variacion total explicada por la regresion.
R2 es un valor positivo, expresado en porcentaje es menor de 100.
Tambien, se puede obtener el R2 ajustado que es la relacion entre cuadrados medios, asi:
R2 ajustado = 1 CME / CM Total;
Este valor podria ser negativo en algunos casos.
Lo que se espera que ambos R2, resulten similares, para dar una confianza al coeficiente
de determinacion.
Para el ejemplo, resulta:
R2 ajustado = 1 70378 / (105526 / 9 ) = 0,39 y R2 = 1 56302,7 / 105525,86 = 0,46