4 Distribucion de Probabilidad Discreta

También podría gustarte

Está en la página 1de 16

Capítulo 4

Distribuciones de Probabilidad Discreta.

4.1 Variables Aleatorias

Una variable aleatoria es una variable que puede tomar cualquier valor numérico.

Estos valores numéricos están determinados por un proceso o por un experimento

aleatorio. Las variables aleatorias se pueden clasificar en:

Una variable aleatoria , se dice que es una variable aleatoria discreta, si sus

valores solo pueden tomar un número finito y contable de valores. Generalmente

estos valores provienen de un experimento, en donde los resultados se cuantifican

mediante el conteo.

Ejemplo 4.1: Un alumno regular de la carrera de economía, tiene en el segundo

semestre 7 materias que debe cursar. Si definimos a como el número de

materias que el alumno va a pasar en este semestre, entonces:

= (0,1,2,3,4,5,6,7)

Puesto que los posibles valores de son finitos y contables (además de enteros),

entonces decimos que es una variable aleatoria discreta, ya que sus valores se ven

limitados a 7.
La probabilidad de que una variable aleatoria, tome un valor determinado, se

simboliza por:

( = ) (4.1.1)

Si a cada posible resultado , le asignamos un valor de probabilidad, entonces

tenemos una distribución de probabilidad.

Ejemplo 4.2: Juan Vera vende automóviles nuevos en Toyotoshi. Por lo general,

Juan vende la mayor cantidad de automóviles los sábados. Ideó la siguiente

distribución de probabilidades de la cantidad de automóviles que espera vender

un sábado determinado.

Autos
Probabilidad
Vendidos
0 0.10
1 0.20
2 0.30
3 0.30
4 0.10
Total 1
Tabla 4.1

Se trata de una distribución de probabilidad discreta para la variable aleatoria

denominada número de automóviles vendidos.

280
1 ( )
240

200

0.50
160

120

80

040
200 400 600 800 1,000 1,200
0 1 2 3 4
Figura 4.1

En una distribución de probabilidad se cumple que 0 ≤ ( = ) ≤ 1 y además

la suma de las probabilidades es 1, es decir ∑ = ( = ) = 1.

4.1.1 Valor Esperado

La media de una variable aleatoria , se denomina valor esperado y se simboliza

por:

( ) = (4.1.2)

En el caso de una variable aleatoria discreta, esta se calcula por:

( ) = ( )
=
(4.1.3)
= ( )+ ( ) + ⋯+ ( )

La esperanza se utiliza para como una medida del punto central de una variable

aleatoria. Se obtiene sumando los posibles valores de una variable aleatoria,

ponderada por sus respectivas probabilidades.

Ejemplo 4.3: Las ventas de automóviles de una playa de autos de los últimos

300 días de operación, se muestran a continuación:

Autos
Días Probabilidad
Vendidos
54 0 0.18
117 1 0.39
72 2 0.24
42 3 0.14
12 4 0.04
3 5 0.01
300 1
Tabla 4.2
Podemos notar que la tabla 4.2 es claramente una distribución de probabilidad. Si

consideramos a como el número de autos vendidos, esto significa que es una

variable aleatoria discreta, ya que sus valores están entre 0 y 5 autos vendidos.

Si graficamos los valores de la distribución de probabilidad, obtenemos:

280
( )
240

200
0.50

160

0.25
120

80

040
200 400 600
0 1 2 3800 4 1,0005 1,200

Figura 4.2

Si calculamos el valor esperado de la variable aleatoria que es el número de

autos vendidos, tenemos:

( ) = 0(0.18) + 1(0.39) + 2(0.24) + 3(0.14) + 4(0.04) + 5(0.01)

= 1.5

Esto significa que a la larga se venderán en promedio 1.5 autos por día.

4.1.2 Varianza

Si tenemos en cuenta que , es una variable aleatoria discreta; si aplicamos

esperanzas al cuadrado de las desviaciones con respecto a su media, a ese

resultado llamamos varianzas y se simboliza:


= ( − ) (4.1.4)

Que se puede calcular por:

= ( − ) ( ) (4.1.5)
=

Además de esta expresión se puede derivar:

= ( )− (4.1.6)

Por cuestiones matemáticas, la varianza no puede ser ningún número negativo, es

decir, se cumple que > 0. La raíz cuadrada de la varianza, es el error estándar

o desviación típica. Esto se calcula por:



= (4.1.7)

Resulta más útil utilizar el error estándar o desviación típica, ya que esta se

encuentra en las mismas unidades que la variable aleatoria. Mientras que la

varianza está en unidades al cuadrado, esto hace que resulte más difícil su

interpretación.

Ejemplo 4.4: Calculamos la varianza de las ventas de autos del ejemplo anterior,

utilizando la siguiente tabla auxiliar:

− ( − ) ( ) ( − ) ( )
-1.5 2.25 0.18 0.405
-0.5 0.25 0.39 0.0975
0.5 0.25 0.24 0.06
1.5 2.25 0.14 0.315
2.5 6.25 0.04 0.25
3.5 12.25 0.01 0.1225
1.25
Tabla 4.3

El resultado implica que la varianza de las ventas de la playa de autos es de 1.25

y su desviación típica o error estándar:



= 1.25

= 1.118

Puesto que las varianzas están en unidades al cuadrado, el error estándar o

desviación típica suele ser más fácil de interpretar. En este caso la desviación

típica es de 1.118 autos.

4.2 La Distribución Binomial

La distribución binomial es una distribución de probabilidad discreta que es muy

frecuente. Se utiliza cuando en un experimento hay solo dos posibles resultados en

cada determinado intento. Se suele utilizar para calcular la probabilidad de éxitos

en un proceso de Bernouilli.

4.2.1 El Proceso de Bernouilli

Un proceso de Bernouilli cumple con las siguientes propiedades:

1º. En cada ensayo solo hay dos resultados que son mutuamente excluyentes.

A lo resultados se los suele denominar éxito y fracaso,

2º. Los resultados de los ensayos son independientes,

3º. La probabilidad de éxito en cada ensayo, permanece constante de un

ensayo a otro.

Ejemplo 4.5: Un proceso de Bernouilli, que es muy común, es el experimento de

lanzar una moneda al aire.

→ 0.5

→ 0.5

Analizando este experimento tenemos:

1) Podemos ver que solo existen dos resultados; cara o cruz (1º condición).
2) Los resultados son independientes (2º condición), un lanzamiento es

independiente de otro y no influirá en el resultado de otro lanzamiento;

3) Las probabilidades permaneces constantes (3º condición), hay una

probabilidad de 50% para cada resultado.

A los eventos de un proceso de Bernouilli se les suele denominar 1 al éxito y 0 al

fracaso.

La probabilidad de éxito se denota por y la probabilidad de fracaso se denota

por 1 − . Si calculamos la esperanza de un proceso de Bernouilli:

( ) = ( )+ ( )

= 1( ) + 0(1 − ) (4.2.1)

Y la varianza:

= ( − ) ( )
=
(4.2.2)
= (1 − )

Ejemplo 4.5: Si calculamos la esperanza en el experimento de lanzar una

moneda al aire, y damos valor 1 a cara y 0 a cruz, entonces tenemos:

( ) = 1(0.5) + 0(0.5)

= 0.5

Donde vemos que se cumple lo establecido por la ecuación 4.2.1. Al calcular la

varianza:

= (1 − 0.5) 0.5 + (0 − 0.5) (1 − 0.5)

= 0.125 + 0.125

= 0.25
Y si utilizamos la ecuación 4.2.2:

= 0.5(1 − 0.5)

= 0.25

Vemos que ambos resultados son idénticos. Al aplicar la raíz cuadrada se obtiene

el error estándar.

4.2.2 Calculo de la Distribución Binomial

Una probabilidad binomial se calcula mediante la fórmula:

! −
( ) = (1 − ) (4.2.3)
!( − )!

Donde:

 es la cantidad de repeticiones del experimento

 es la cantidad de éxitos

 es la probabilidad de éxito y 1 − es la probabilidad de fracaso.

El valor esperado de una distribución binomial se determinan por:

( ) = (4.2.4)

Y su varianza:

= (1 − ) (4.2.5)

Ejemplo 4.6: La probabilidad de que un vendedor concrete una venta es de 0.20.

Si un vendedor llama a 6 clientes, ¿Cuál es la probabilidad de que logre concretar

4 ventas? La información es que = 6 es la cantidad de veces que el vendedor

intento vender. La cantidad de éxitos = 4, es decir las ventas que logro

concretar. La probabilidad de éxitos, = 0.20 y la probabilidad de no lograr


venta alguna se calcula por 1 − = 1 − 0.20 = 0.80. Al calcular la probabilidad

utilizando la fórmula de probabilidad binomial:

6! −
(4) = (0.20) (0.80)
4! (6 − 4)!

(6 × 5 × 4 × 3 × 2 × 1)
= (0.20) (0.80)
(4 × 3 × 2 × 1)(2 × 1)

= 0.01536

Esto implica una muy baja probabilidad de concretar 4 ventas. Si calculamos el

valor esperado de las ventas, si se realizan 6 llamadas a clientes:

( ) = 6(0.20)

= 1.2

Y la varianza:

= 6(0.20)(1 − 0.20)

= 0.96

4.2.3 Calculo de la Distribución Binomial con R

La distribución binomial se puede calcular con R, utilizando el comando dbinom,

utilizando la sintaxis dbinom(x, size, prob). En la sintaxis se tiene en

cuenta que:

 x puede ser un escalar o un vector.

 size es el número de ensayos

 prob es la probabilidad de éxitos en cada ensayo

Utilizando este comando se puede calcular la probabilidad de 4 ventas del ejemplo

4.6 escribiendo:

> dbinom(4,6,0.20)

[1] 0.01536
La probabilidad es la misma que se obtuvo de forma manual en el ejemplo

numérico. También podemos calcular las probabilidades de todos los intentos,

para este caso el comando en R, es:

> dbinom(
dbinom(c(0,1,2,3,4,5,6),6,0.20)
c(0,1,2,3,4,5,6),6,0.20)

[1] 0.262144 0.393216 0.245760 0.081920 0.015360 0.001536


0.000064

Donde utilizamos c para crear un vector numérico. De esta manera R, nos

calcula la probabilidad de los 6 intentos del vendedor.

Podemos utilizar R y calcular la probabilidad


probabilidad de que se puedan concretar 4 o más

ventas, en este caso el comando:

> sum(dbinom(c(4,5,6),6,0.20))

[1] 0.01696

La probabilidad de concretar 4 ventas o más, es de apenas 1.696%. Todos estos

resultados se pueden ver en:

Figura 4.3
4.3 La Distribución Hipergeometrica

La distribución hipergeometrica es otra de las distribuciones de probabilidad

discreta, que se utilizan a menudo. Se suele recurrir a esta, cuando los supuestos

de la distribución binomial, no se cumplen. Esta distribución se utiliza cuando:

1º. El muestreo se hace sin devolución;

2º. Los eventos no son independientes;

3º. La probabilidad de éxito no es constante;

4º. Si se cumple ⁄ > 0.05

En pocas palabras, la distribución hipergeometrica se utiliza cuando el muestreo

se realiza sin devolución, ya que con este tipo de muestreo, las probabilidades

cambian sistemáticamente. La fórmula para calcular es:


( ) = − (4.3.1)

Donde:

 es el número de sucesos en una muestra

 tamaño de la muestra

 tamaño de la población

 elementos que tienen la característica definida como éxito

Ejemplo 4.7: De un grupo de 6 empleados, 3 han estado en la empresa cinco

años o más. Si se toma al azar 4 empleados del grupo de 6, ¿Cuál es la

probabilidad de que exactamente 2 tengan una antigüedad de cinco años o más?

Analizando el problema, tenemos:

1º. Una población de = 6;


2º. De ese grupo de 6, hay 3 empleados que cumplen la característica de estar

5 años o más en la empresa, en ese caso definimos = 3;

3º. Se extrae una muestra de = 4,

4º. Se debe de calcula la probabilidad de que = 2.

¿Por qué usar la distribución hipergeometrica? Se deben seleccionar 4 empleados

al azar, y hay 3 que han estado más de 5 años. La probabilidad de extraer a uno

de los 3 más antiguos es 3⁄6. Después de la primera extracción las probabilidades

quedan de la siguiente manera:

 Si después de la primera extracción se le selecciona a uno de los 3 más

antiguos la probabilidad de extraer a otro de los más antiguos es 2⁄5.

 Si después de la primera extracción no se le selecciona a uno de los 3 más

antiguos la probabilidad de extraer a otro de los más antiguos es 3⁄5.

Primero, podemos notar que el muestreo se hace sin devolución, no se extrae a un

empleado y luego se le vuelve a incorporar al grupo. Segundo, las probabilidades

no permanecen constantes, varían de una extracción a otra. No se cumplen las

condiciones para utilizar una distribución binomial, lo que significa que la

distribución hipergeométrica es la indicada.

Al calcula la probabilidad hipergeometrica:

6−3 3
(2) = 4−2 2
6
4

3 3
= 2 2
6
4
Ahora aplicamos ! de la forma:
3! 3!
2! (3 − 2)! 2! (3 − 2)!
(2) =
6!
4! (6 − 4)!

3! 3!
= 2! 1! 2! 1!
6!
4! 2!

(3)(3)
=
(15)

= 0.6

Nótese que al aplicar ! se tiene que !⁄ ! ( − )!. El resultado indica que hay una

probabilidad de 60% de que al extraer 4 empleados al azar, 2 empleados tengan

una antigüedad de 5 años o más.

4.3.1 Calculo de la Distribución Hipergeometrica con R

La distribución hipergeometrica se puede calcular con R, utilizando el comando

dhyper, utilizando la sintaxis dhyper(x, m, n, k). En la sintaxis se tiene

en cuenta que:

 x puede ser un escalar o un vector. Es el valor a evaluar ( )

 m es el tamaño de la muestra. ( )

 n es la diferencia entre −

 k número de elementos que cumplen cierta característica ( )

Utilizando este comando se puede calcular la probabilidad de extraer a 2

empleados con más de 5 años de antigüedad del ejemplo 4.7 escribiendo:

> dhyper(2,4,6-4,3)

[1] 0.6

La probabilidad es la misma que se obtuvo de forma manual en el ejemplo

numérico. Los resultados obtenidos se pueden ver de la siguiente manera:


Figura 4.4

4.4 Distribución de Poisson

La distribución de Poisson es otra distribución de probabilidad discreta. Se utiliza

para calcular la probabilidad de un evento aleatorio sobre algún intervalo de

tiempo o espacio.
espacio Las condiciones que se deben dar son:

1. Los sucesos o éxitos son independientes; y

2. El número medio de éxitos


éxitos por unidad de tiempo permanece constante.

La fórmula para calcular


calcular una probabilidad es:


( ) = (4.4..1)
!

Donde:

 es el número de éxitos

 base del sistema de logaritmos neperianos.

 número medio de éxitos por unidad de tiempo


Ejemplo 4.8: En un departamento de reparación de maquinarias se recibe un

promedio de 5 solicitudes de servicios por hora. ¿Cuál es la probabilidad de que se

reciban exactamente 3 solicitudes de servicios en 1 hora elegida al azar?

Analizando los datos del problema, podemos ver que el promedio de solicitudes

por hora es 5, entonces tenemos que = 5. La cuestión aquí, es calcular la

probabilidad de recibir 3 llamadas en 1 hora. Con esto podemos calcular:


5
(3) =
3!

0.8422433749
=
6

= 0.14037 …

La probabilidad de que se reciban 3 solicitudes es de 14.03%.

4.4.1 Calculo de la Distribución de Poisson con R

La distribución de Poisson, también se puede calcular con R, utilizando el

comando dpois, utilizando la sintaxis dpois(x, lambda). Donde tenemos

en cuenta que:

 x puede ser un escalar o un vector. Es el valor a evaluar ( )

 lambda es el número medio de éxitos. ( )

Utilizando este comando se puede calcular la probabilidad de recibir 3 llamadas

en 1 hora, del ejemplo 4.8:

dpois(3,5)

[1] 0.1403739

La probabilidad de obtener menos de 3 solicitudes:

> sum(dpois(c(0,1,2),5))

[1] 0.124652
Los resultados obtenidos se pueden ver de la siguiente manera:

Figura 4.5

Referencias:

 Fundamentos de Estadística. Daniel Peña. Alianza. 2014


2014.

 Estadística Aplicada a Administración y Economía. Leonard J. Kazmier.

McGraw-Hill.
McGraw Hill. 2006

 Estadística para Administración y Economía. Paul Newbold, William L.

Carlson & Betty M. Thorne. Pearson. 2008

 Estadística. Murray R. Spiegel & Larry J. Stephens. McGraw-Hill.


McGraw Hill. 2009.
2009

 Estadística Aplicada a los Negocios y la Economía. Allen L. Webster.

McGraw-Hill.
McGraw Hill. 2000.
2000

 Estadística Aplicada a los Negocio


Negocios y la Economía. Douglas A. Lind,

William G. Marchal & Samuel A. Wathen. McGraw-Hill.


McGraw Hill. 2009.
2009

 Estadística para Administración y Economía. David R. Anderson, Dennis

J. Sweeney & Thomas A. Williams. Cengage Learning. 2008

También podría gustarte