Está en la página 1de 23

Distribución

binomial

Herramientas
Matemáticas III
Estadística I

1
Variable aleatoria discreta
Por variable numérica, se entiende una variable que produce respuestas
numéricas ante una medición o un conteo. Así, podemos citar como
ejemplos: identificar cuántos varones existen en un determinado curso de la
universidad (conteo) o bien la frecuencia de arribo de los colectivos
interurbanos a determinado lugar (medición).
Podemos clasificar a las variables numéricas en discretas y continuas.
Cuando se desea recabar datos de un evento y este proceso implica una
medición, estamos tratando con una variable numérica continua.
En cambio, si al recabar los datos, el proceso surgen de un conteo entonces
la variable es una variable numérica discreta.

Valor esperado de una variable aleatoria. Esperanza


matemática

Si consideramos que los parámetros de la distribución son n y p y la media


de la distribución

μ = n.p,

Donde
n = es el número de ensayos;
p = probabilidad de aciertos;

Entonces definiremos la esperanza matemática o valor esperado de una


variable aleatoria como la media de la distribución:

E(x) = n.p.

Es una media aritmética ponderada de los resultados esperados.


Para encontrar el valor esperado de una variable aleatoria discreta,
realizamos el producto entre cada valor que la variable puede tomar y la
probabilidad de ocurrencia de ese valor y, posteriormente, sumamos dichos
productos. El valor esperado le da un valor a cada resultado posible según la
frecuencia con que se manifiesta. Por lo tanto, los más frecuentes tienen
asignado un peso mayor.

2
Distribuciones de variable aleatoria discreta
Para realizar un estudio de distribución de variable aleatoria, debemos
considerar todos los casos posibles en los que se puede presentar el evento;
son mutuamente excluyentes y exhaustivos.
Tendremos que tener en cuenta también que, en muchos casos, el evento
aleatorio puede tomar valores no numéricos.
En este caso, la distribucion de probabilidad es una lista mutuamente
excluyente de todos los resultados numéricos posibles; de tal manera que
cada probabilidad de ocurrencia se asocia con un resultado.
Hemos visto, en el punto anterior, la expresión de la media, μ:

𝜇 = 𝐸(𝑥) = ∑ 𝑋𝑖. 𝑃(𝑥𝑖) .


𝑖=1

𝑋𝑖 = 𝑖 − ésimo resultado de la variable aleatoria discreta 𝑋;


𝑃(𝑥𝑖) = probabilidad de ocurrencia del 𝑖 − ésimo resultado de 𝑋.

Varianza de una variable aleatoria discreta

Se calcula como la sumatoria de los productos entre el cuadrado de la


diferencia entre cada valor que adopta la variable y la media de la
distribución, y la probabilidad de que la variable adquiera ese valor.

𝑁
2 2
𝜎 = ∑[𝑋𝑖 − 𝐸(𝑥𝑖) ] . 𝑃(𝑥𝑖) .
𝑖=1

Desviación estándar de una variable aleatoria discreta

Hemos visto que la desviación estándar de la distribución está dada por la


raíz cuadrada de la varianza de dicha distribución.

Por lo tanto:

𝑁
2
𝜎= √𝜎 2 = √∑[𝑋𝑖 − 𝐸(𝑥𝑖) ] . 𝑃(𝑥𝑖) =
𝑖=1

3
Distribución binomial

Parámetros

Condiciones que debe cumplir una distribución para responder al modelo


binomial
Debe estar formada la distribución por n ensayos idénticos.

1) Cada resultado del ensayo puede lograr solo dos resultados, si a uno lo
denominamos acierto o éxito, el otro se denominará desacierto o fracaso.
2) Si a la probabilidad del éxito la llamamos P(acierto) = p, la probabilidad
del fracaso P(desacierto) = q; por lo tanto, q = 1- p.
3) Los eventos son independientes entre sí. Esto indica que el resultado
obtenido por cada ensayo es independiente del resultado de ensayos
anteriores.
4) La probabilidad del acierto se considera constante; esto significa que la
población es muy grande o infinita, o que los ensayos se realizan sin
reposición.

Expresión general

En este tipo de distribución, las probabilidades del número posible de


aciertos en n ensayos quedan determinadas por el desarrollo de la potencia
del binomio (q + p)n, donde el exponente n es el número de ensayos. El
desarrollo de dicha potencia se expresa como sigue:

(𝑞 + 𝑝)𝑛 = 𝑎0 . 𝑞 𝑛 . 𝑝0 + 𝑎1 . 𝑞 𝑛−1 𝑝1 + ⋯ + 𝑎𝑛 . 𝑞 0 . 𝑝𝑛 .

Los coeficientes ao, a1, . . ., an surgen de las combinaciones de n elementos


tomados de x en x.
De esta manera, la probabilidad de que, en n ensayos, se tengan x aciertos
está dada por la expresión:

𝑃(𝑥) = 𝑛. 𝐶𝑥 . 𝑞 𝑛−𝑥 . 𝑝 𝑥 .

Indica la cantidad de aciertos en n ensayos donde p es la probabilidad del


acierto y q = 1- p corresponde con la probabilidad del desacierto.

Características de la distribución binomial

4
Media

Como hemos visto, los parámetros de esta distribución son n y p, y su media


de la distribución es:
𝜇 = 𝑛. 𝑝.

Por lo tanto, si la esperanza matemática o valor esperado de una variable


aleatoria es igual que la media de la distribución, esto implica que:

E(x) = n.p.

Varianza

Podemos considerar la varianza como:

Var(x) = n.p.q.

Desvío estándar

Y a la desviación estándar, como:

𝜎 = √𝑉𝑎𝑟𝑥 = √𝑛. 𝑝. 𝑞.

Además, debe cumplirse que:

∑ 𝑃(𝑥𝑖) = 1.

Para todo i desde 0 a n.

5
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.

6
Distribución
de Poisson

Herramientas
Matemáticas III
Estadística I

1
Distribución de Poisson
Este tipo de distribución es apropiada para determinadas situaciones
donde se analizan eventos aleatorios con restricciones predeterminadas,
como la cantidad de hechos o eventos producidos en un intervalo de
tiempo o de espacio.
Entre ellos, se puede analizar la distribución de llamadas telefónicas de un
central de remises, los trámites de contribuyentes en una oficina pública, las
personas que llegan a una farmacia mutual y el número de colectivos que
llegan a destino en una terminal de una gran ciudad.

Como veremos, en la recolección de datos de estos ejemplos, existe una


característica comun: se pueden analizar a traves de una variable aleatoria
discreta por lo que se tratan de números enteros, ya que provienen de un
conteo, por ejemplo: 0, 1, 2, 3, 4, 5, etcétera.

Parámetro

Esta distribución tiene como parámetro un solo valor, el promedio de


ocurrencia, al que denominaremos con la letra lambda (λ). Este parámetro
(λ) representa el número medio de eventos por intervalos de tiempo.

Expresión general

La expresión matemática que resuelve esta distribución donde,


generalmente, la letra X representa a esta variable discreta y puede tomar
valores enteros (0, 1, 2, 3, 4, 5, etc.) es:

𝜆𝑥 . 𝑒 −𝜆
𝑃(𝑥) = .
𝑥!

2
Donde:

x = número de éxitos/ocurrencias;
λ = promedio de ocurrencias;
e = logaritmo neperiano (e = 2,717281...).
En esta distribución, debe cumplirse que:
∑ 𝑃(𝑥𝑖) = 1,

Donde i varía, al menos teóricamente, entre cero e infinito.


La utilización de la tabla de Poisson permite no realizar a mano los cálculos
de las probabilidades para encontrar similares resultados.

Media
En la distribución de Poisson, la media es igual que el valor esperado. E(x) es
igual que la esperanza matemática, que, en esta distribución, coincidiría con
λ, es decir, lambda, lo que nos quedaría expresado de esta manera:

𝜇 = 𝜆 = 𝐸(𝑥).

Varianza
La varianza, siguiendo el mismo razonamiento, también es igual a λ:

𝜎 2 = 𝑉𝑎𝑟(𝑥)= λ.

Desvío estándar

La desviación estándar:

𝜎 = √𝜎 2 = √𝜆.

En ciertas oportunidades, si queremos evitar la densa tarea de calcular


distribuciones binomiales de probabilidad, podemos recurrir a la
distribución de Poisson. Esta puede ser una razonable aproximación a la
binomial si se cumplen ciertas condiciones. Una de esas situaciones ocurre

3
cuando n es grande y p es pequeña, es decir, si el número de ensayos es
grande y la probabilidad binomial de tener éxito es pequeña.
Una estimación, utilizada con más frecuencia por los expertos en el tema, es
que la distribución de Poisson provee una buena aproximación a la
distribución binomial cuando n es igual o mayor que 20, y p es igual o menor
que 0,05.

En los casos en que se cumplen estas condiciones, podemos sustituir la


media de la distribución binomial (n.p) por la media de la distribución de
Poisson (λ).

(𝑛. 𝑝)𝑥 . 𝑒 −𝑛.𝑝


𝑃(𝑥) = .
𝑥!

4
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.

5
Distribución
hipergeométrica

Herramientas
Matemáticas III
Estadística I

1
Distribución hipergeométrica
Es la distribución correcta para calcular el riesgo del consumidor; a menudo, se
aproxima a la distribución binomial.
Si contamos una población finita de tamaño N y, de estos N elementos de la
población, solamente k de ellos cumplen con una característica particular,
deducimos que N - k es la cantidad de elementos de la población que no cumplen
con esa condición.
Si de la población se extrae una muestra de n elementos de manera tal que se
cumpla que:

n/N >= 0,05,

entonces la probabilidad de que, en la muestra de n elementos, se tengan x de


los k está dada por la expresión:

(𝑁−𝑘)
𝐶(𝑛−𝑥) . 𝐶𝑥𝑘
𝑃(𝑥) = .
𝐶𝑛𝑁

Parámetros
Nos preguntamos: ¿por qué, si el evento presenta características similares a las
de una distribución binomial, no se resuelve mediante ese modelo, o bien
buscamos esta alternativa? La respuesta es que existen motivos que hacen que
se prefiera utilizar este tipo de distribución por sobre la binomial.

 que la población es finita, y el tamaño de la muestra es grande, significativo


respecto del tamaño poblacional y, por lo tanto, modifica la probabilidad de
elegir;
 el muestreo se realiza sin reposición y, al ser significativa, el tamaño de la
muestra con respecto al tamaño de la población modifica la probabilidad de
acierto.

Si recordamos, en la distribución binomial, la probabilidad de lo que


consideramos acierto se mantiene constante, y esto se logra únicamente si el
muestreo se realiza con reposición o la población es infinita o muy grande.

2
Expresión general
Esta expresión se basa en la teoría combinatoria, donde:

N = tamaño de la población;

n = tamaño de la muestra;

k = número de éxitos en la población;

x = número de éxitos en la muestra;

(𝑁−𝑘)
𝐶(𝑛−𝑥) . 𝐶𝑥𝑘
𝑃(𝑥) = .
𝐶𝑛𝑁

Para encontrar la expresión que dé la media de la distribución hipergeométrica,


debemos recordar nuevamente que la media corresponde con el valor esperado
o esperanza matemática.
Además, si el muestreo es representativo de la población, la media de la muestra
tenderá a ser igual que la media poblacional:

𝑘 𝐸(𝑥)
𝜇= = .
𝑁. 100 𝑛. 100

Por lo tanto, despejando E(x), tendremos:

𝑛
𝐸(𝑥) = .
𝑁. 𝑘

3
Bibliografía de Referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía (7.a
ed.). México: Pearson Educación.

4
Distribución
de variable
continua

Herramientas
Matemáticas III
Estadística I

1
Distribución de variable
continua
Como habíamos visto, las variables podían ser continuas o discretas; de esta
manera, podemos entonces clasificar los modelos de acuerdo con el tipo de
variable.

 Variable discreta:
o binomial;
o de Poisson;
o hipergeométrica.

 Variable continua:
o normal;
o T (de Student);
o chi cuadrado.

En este concepto, se trata solamente la distribución continua normal.

Distribución normal

Definiremos ahora, una distribución que analice las probabilidades de que la


variable aleatoria adopte un valor dentro de un intervalo. La distribución de
variable continua, que responde en forma más general a más cantidad de
casos y situaciones en las que la variable se mide en un intervalo, es la
distribución normal, también llamada distribución de Gauss.
La distribución normal es reconocida en Estadística por varias razones.

En el ámbito empresarial, existen muchas variables de medición, cuyas


distribuciones se asimilan a la distribución normal.

 La distribución normal puede asimilarse a distribuciones de variables


discretas como la distribución binomial y la distribución de Poisson; lo que
simplifica el trabajo.
 La distribución normal es una herramienta muy importante para la
estadística inferencial a través del teorema de límite central.

2
Distribución normal estándar

1) Tiene forma de campana, de allí el nombre de campana de Gauss.


2) Su eje de simetría respecto del eje vertical pasa por la abscisa de
mayor ordenada.
3) El valor de la abscisa de mayor ordenada coincide con la media, la
mediana y la moda por ser simétrica respecto del eje vertical que pasa
por ese punto.
4) Las ramas de la campana son asintóticas respecto del eje horizontal y
se extienden desde -ꝏ al +ꝏ.
5) La expresión de la función toma el nombre de “función de densidad de
probabilidades” y su expresión es:

La forma de esta función está indicada en el siguiente gráfico:

Figura 1: Distribución Normal o Gaussiana

Fuente: Elaboración Propia

6) Se considera que la superficie encerrada por la función y el eje horizontal


son iguales a 1. Esto significa que la integral de la función F(x) entre los
límites - ꝏ y + ꝏ = 1 es ∫F(x).dx = 1.

3
7) La probabilidad de que la variable aleatoria tome un valor en un intervalo
(a; b) está dada por la superficie encerrada por la función y el eje
horizontal en ese intervalo:

P(a ≤ x ≤ b) = ∫F(x).dx.

Figura 2: Area bajo una curva normal

Fuente: Elaboración propia

8) La probabilidad que la variable tome un valor puntual es igual a cero: P(x


= a) = 0. Si el intervalo (a, b) disminuye, porque el extremo b se acerca a
a, la probabilidad disminuye. Y, en el límite, cuando b coincide con a, la
probabilidad toma el valor cero; ya que no se tiene superficie por no
existir un intervalo.
9) Otra de las características de la curva normal es que el área debajo de la
curva, entre el valor de la media aritmética y un punto cualquiera sobre
las abscisas está en función del número de desviaciones estándar.

4
Figura 3: Distribución Normal-Características

Fuente: Levin y Rubin, 2004, p. 209.

Significa que esa superficie es proporcional al número de desviaciones


estándar de la distancia entre la media y X, siendo X un punto genérico. En
fórmulas, lo podemos expresar así:

z.σ = x – μ,

donde Z es el coeficiente de proporcionalidad que indica la cantidad de


desviaciones estándar correspondientes con la diferencia de abscisas entre
X y la media. El valor de Z puede adoptar valores entre cero y un poco más
de 3; ya que, si recordamos la regla empírica que indicando que el 99,7 % de
las observaciones de una distribución normal ocurren en el intervalo
comprendido entre la media menos 3σ y la media más 3σ.
Con estas características, se construye una distribución con los valores de z,
y dicha distribución se llamará “distribución normal estándar”, cuya media
es:

𝜇(𝑧) = 0,

y su desviación estándar:

𝜎(𝑧) = 1.

5
Se construyeron tablas para distribución normal estándar (DNE), donde,
para cada valor de Z, se obtuvo un porcentaje del área total, y estas tablas
se encuentran en los apéndices de la bibliografía. En esta tabla, verificamos
que el área encerrada por la DNE, para z = 1, es igual a 0,3413; para z = 2, a
0,4772; y para z = 3, a 0,4987, de acuerdo con lo expresado por la ley
empírica. Como ejercicio, prueba corroborar la ley empírica con estos
resultados.

Resolución de una distribución binomial por aproximación con


la normal

Cuando una distribución binomial presenta un número de ensayos elevados,


n grande, y la probabilidad del éxito es próxima a 0,5, dicha distribución
puede ser resuelta por aproximación con la distribución normal. Para lo cual,
haremos algunas consideraciones para tener en cuenta.

 Las medias de las distribuciones normal y binomial son iguales:

𝜇(𝑥) = 𝑛. 𝑝.

 Los desvíos estándar de las distribuciones normal y binomial son iguales:

𝜎(𝑥) = √𝑛. 𝑝. 𝑞.

 No olvides que la distribución normal responde a una variable del tipo


continua (por medición); la binomial, en cambio, a una variable del tipo
discreta (por conteo).

6
Resolución de una Distribución de Poisson por aproximación
con la normal

Esta expresión corresponde a una Distribución de Poisson para el cálculo de


probabilidades en variables aleatorias discretas.

Si bien sirve para el cálculo en forma manual, es muy engorroso utilizarla por
lo que podemos utilizar las tablas para calcular las probabilidades de
Poisson.
Para poder asimilar este tipo de distribución a una distribución normal,
siempre con las precauciones del caso, deberíamos realizar los reemplazos
que vemos a continuación.

Podemos utilizar la Distribución de Poisson como una aproximación de la


Distribución Binomial, sustituyendo a por n.p, condicionado solamente a
que n ≥ 20 y p ≤ 0,05

Esta expresión permite que, calculando Z; se pueda utilizar una tabla de


distribución normal estandar para calcular la probabilidad que esté dentro
de una distancia Z de la media artimética

7
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.

También podría gustarte