Está en la página 1de 13

Variable aleatoria y distribuciones discretas de probabilidad

Introducción: el concepto de una variable que es aleatoria se asocia directamente con los
conceptos de probabilidad, revisados en el capítulo anterior; así que ampliaremos un poco
esos conceptos en este capítulo.

Variable aleatoria
Una variable aleatoria es aquella variable que toma diferentes valores numéricos, mediante un
proceso de contar o medir, como producto de un experimento aleatorio.

Esta variable es un valor o magnitud que cambia de una ocurrencia a otra sin seguir una
secuencia predecible, es decir, en forma aleatoria.

Recordamos que un experimento aleatorio es aquel del cual conocemos sus resultados
(espacio muestral), pero no sabemos cuál de ellos (que punto muestra) es el que sucederá-. Es
decir, resultado del experimento está libre de una determinación, es aleatorio.

Por ejemplo, considere como experimento un partido de futbol entre el equipo “A” y “B”, y la
variable aleatoria asociada con este experimento mostrara los posibles resultados de este
juego.

Los posibles resultados del experimento son: gana “A”, “B”, hay empate, sin embargo, no
sabemos cuál de estos tres resultados se dará. La variable aleatoria tiene tres valores
numéricos de probabilidad de ocurrencia .por ejemplo, suponga que la variable aleatoria
referida toma los valores de ocurrencia siguientes:

2 gana “B”

1 gana “A” 3 empate

Entonces, la variable aleatoria de este juego de futbol tiene tres resultados posibles:

Espacio muestral (juego de futbol) = {gana “A”, gana “B”, empate}.

La variable aleatoria del juego puede definirse como:

VA (juego de futbol) = {1, 2, 3}

Formalmente, Hildebrand y Lyman proponen la siguiente definición de variable aleatoria:


“dado un espacio muestral S, una variable aleatoria es una regla (función) que asigna un valor
numérico a cada resultado de “S”.

Por otro lado, dado que una variable aleatoria toma valores numéricos producto de un
proceso de contar o bien de un proceso de medir, entonces, con base en ellos estas variables
se clasifican en variables aleatorias discreta o discontinuas.

Las variables aleatorias discretas son aquellas que toman un número limitado de valores,
generalmente números enteros que son producto de un conteo.

Ejemplo:
Considere que en una oficina de la Tesorería de Gobierno del Distrito Federal (GDF) se está
analizando el numero d contribuyentes que son atendidos diariamente. Los registrados de los
últimos 80 días indican que el número de contribuyentes atendidos esta entre 120 y 130, como
se muestra en el cuadro estadístico 4.1

Cuadro 4.1

Numero de Días observados en


contribuyentes Este nivel
120 2
121 4
122 7
123 9
124 11
125 14
126 11
127 9
128 7
129 4
130 2
total 80

Como la variable aleatoria comprende valores numéricos enteros entre 120 y 130
contribuyentes, entonces esta es una VA discreta.

Una variable aleatoria continua es aquella que toma cualquier valor numérico producto de
una medición , el cual está referido a un rango o intervalo de valores, es decir, es aquella
variable, que puede tomar un valor entero, un entero y una fracción, o bien, una fracción de
una unidad.

Ejemplo:

Considere el gasto en fotocopias y libros en un trimestre de un grupo de 35 alumnos de una


universidad (cuadro 4.2)

1150.25 1352.67 983.45 1365.11 942.71 1577.77 330


872.37 1126.57 1184.17 1046.35 1110.5 1050.86 851.6
1459.56 1252.01 373.91 1047.4 1064.46 1018.23 996.92
941.96 767.37 1598.57 1598.66 1343.29 1617.73 1300.76
1013.27 1402.59 1108.94 1108.94 1326.19 1074.86 975.86

Como puede observarse, esta variable, que es producto d una medición, toma valores de gasto
desde $330.00 hasta $ 1617,73, es decir, cualquier valor dentro de este intervalo, por lo que
esta constituye una VA continua.

Distribución de probabilidades de una variable aleatoria discreta

Es el conjunto de todos los posibles resultados numéricos de un experimento a los que


podemos asignar un valor de ocurrencia o probabilidad. Este conjunto de resultados son
mutuamente excluyentes y pueden expresarse mediante una formula, una gráfica o por medio
de un cuadro estadístico (tabla).
Matemáticamente ablando, la distribución de probabilidades de una variable aleatoria discreta
X es una función Px (x) que da un valor de probabilidad a cada valor x que forma la variable
aleatoria X.

Esta distribución de probabilidades de una variable aleatoria discreta X tiene las siguientes
propiedades:

 La probabilidad Px (x) de cada valor que presenta la variable X debe tomar un valor
numérico en el intervalo
0≤ Px(x) ≤1
 La suma de las probabilidades para todos los valores (x) de X es igual a 1(uno), es
decir,
𝑛

∑ 𝑃𝑥(𝑥) = 1 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑖 = 1,2,3, … 𝑛


𝑖=1

 Como cada valor de X es un suceso mutuamente excluyente, sus probabilidades son


activas, es decir:
𝑃(𝑋 = 𝑥1 ∪ 𝑋 = 𝑥2 ) = 𝑃𝑋 (𝑥1 ) + 𝑃𝑥 (𝑥2 )
Si retomamos el ejemplo de la oficina de tesorería del gobierno del distrito federal, a cada
valor de la variable aleatoria le podemos asignar un valor numérico de ocurrencia
(probabilidad) en la siguiente forma:

Por ejemplo, la probabilidad de que se presentan 121 contribuyentes es:


4
𝑃(𝑋 = 121) = =0.05
80

Con el mismo procedimiento, se calcula la distribución de probabilidad de los valores


numéricos que toma la variable aleatoria discreta.

Numero de Días observados en Probabilidad de que la


contribuyentes X Este nivel variable aleatoria X se
presente
120 2 0.0250
121 4 0.0500
122 7 0.0875
123 9 0.1125
124 11 0.1375
125 14 0.1750
126 11 0.1375
127 9 0.1125
128 7 0.0875
129 4 0.0500
130 2 0.0250
total 80 1

Como podrá observarse, la variable aleatoria discreta del número de contribuyentes cumple
con tres propiedades de la distribución de probabilidad de una variable aleatoria discreta, que
hemos propuesto previamente, es decir:
 La probabilidad Px (121) de que la variable X tome el valor numérico de 121
contribuyentes está en el intervalo
0 ≤ 𝑃𝑥 (121) ≤ 1
 La suma de las probabilidades para todos los valores (x) de X es igual a 1, es decir,

∑ 𝑃𝑥(120,121,122, … ,130) = 1
𝑖=1

 Como cada valor de X es un suceso mutuamente excluyente, sus probabilidades son


aditivas, es decir ,
𝑃(𝑋 = 120 ∪ 𝑋 = 121) = 𝑃𝑥 (120) + 𝑃𝑥 (121) = 0.075

Ejemplo:

El administrador de una clínica del Instituto de Seguro Social al Servicio de os Trabajadores del
Estado (ISSSTE) analiza el número de consultas médicas del servicio geriátrico que se
proporcionan semanalmente. Los resultados de las últimas 40 semanas se muestran en el
cuadro 4.6.

Numero de servicios Numero de semanas


Geriátricos por semanas
70 5
71 7
72 9
73 8
74 6
75 5
total 40

Se calcula la distribución de probabilidades para esta variable aleatoria discreta y se elabora la


gráfica de la distribución correspondiente.

Solución:

Numero de servicios Numero de semanas Probabilidad de que la


Geriátricos por semanas variable aleatoria X se
presente
70 5 0.125
71 7 0.175
72 9 0.225
73 8 0.200
74 6 0.150
75 5 0.125
total 40 1.0

Falta barra
Valor esperado en la toma de decisiones
Si el administrador de la oficina de tesorería del gobierno del distrito federal (GDF)
pregunto, ¿Cuántos contribuyentes espero recibir en los próximos días?; responder a su
pregunta le permitirá determinar el número de empleados que requerirá para seguir
prestando un servicio de calidad entonces este analista, deberá obtener un número
estimado de contribuyentes para estos días (un promedio) y tomar una decisión.
La herramienta requerida en este caso recibe el nombre de medida o valor esperado de
una distribución de probabilidad discreta.
El valor esperado de una variable aleatoria discreta es una media ponderada de todos
los resultados posibles que presenta esta variable aleatoria. en esta media ponderada,
los ponderados o pesos son as probabilidades que están relacionadas, como ya se dijo,
con cada uno de los valores numéricos de la variable.
Matemáticamente, este valor esperado se puede expresar como:
𝑛

𝜇 = 𝑉𝐸(𝑋) = 𝐸(𝑋) = ∑ 𝑋𝑖 𝑃(𝑋𝑖 ), 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑖 = 1,2,3 … , 𝑛


𝑖=0

Donde:
𝑋𝑖 = i-esimo valor numérico de la variable aleatoria discreta X.
𝑃(𝑋𝑖 ) = probabilidad de ocurrencia del i-esimo resultado de la variable aleatoria
discreta X.
De la expresión matemática se observa que para obtener el valor esperado de una VA
discreta X se debe multiplicar cada valor de la variable toma por la probabilidad de
ocurrencia de ese valor u luego se suman los productos.
Por ejemplo, si queremos obtener el valor esperado de contribuyentes que llegaran a la
oficina de la tesorería del GDF, lo obtendríamos en la siguiente forma:
Numero de Días observados en Probabilidad de que la 𝑋𝑖 𝑃(𝑋𝑖 )
contribuyentes X Este nivel variable aleatoria X se
presente
120 2 0.0250 3.000
121 4 0.0500 6.050
122 7 0.0875 10.675
123 9 0.1125 13.838
124 11 0.1375 17.050
125 14 0.1750 21.875
126 11 0.1375 17.325
127 9 0.1125 14.288
128 7 0.0875 11.200
129 4 0.0500 6.450
130 2 0.0250 3.250
total 80 1 125
𝑉𝐸(𝑋) 𝑜 𝐸(𝑋) = 125 𝑐𝑜𝑛𝑡𝑟𝑖𝑏𝑢𝑦𝑒𝑛𝑡𝑒𝑠
Es decir, el analista estaría, esperando en los próximos días un promedio de 125
contribuyentes, lo cual le permite tomar una decisión acerca del número de empleados
que se requerirán para atenderlos y ofrecer con ello un servicio de calidad.
Varianza y desviación estándar de una variable aleatoria discreta
La dispersión el comportamiento de una variable aleatoria discreta puede medirse,
también mediante dos estadísticos de dispersión ya conocidos: la varianza y la
desviación estándar.

La varianza (𝜎 2 ) de una variable aleatoria discreta puede definirse como la media


ponderada de los cuadros de la diferencia entre cada valor numérico que toma la
variable aleatoria (𝑋𝑖 ) y su valor esperado [E(X)]. En donde los ponderados de esta
diferencia son precisamente los valores de probabilidad asociados con cada valor
numérico de la variable aleatoria.
Matemáticamente, la varianza de una variable aleatoria discreta puede expresarse
como:

𝜎 2 = ∑𝑛𝑖=1[𝑋𝑖 − 𝐸(𝑋)]2 𝑃(𝑋𝑖 ) 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑖 = 1,2,3, … 𝑛


Donde:

𝑋𝑖 = i-esimo valor numérico de la variable aleatoria discreta X.


E(X) = media o valor esperado de la variable aleatoria discreta X.
𝑃(𝑋𝑖 ) = probabilidad de ocurrencia del i-esemo resultado de la variable aleatoria
discreta X.
Como ya se indicó en los primeros capítulos de este libro, la varianza es un estadístico
que mide la dispersión en unidades al cuadrado; por lo que para obtener una dispersión
en las mismas unidades en que se mide la media o valor esperado de la variable aleatoria
discreta, se debe obtener la raíz cuadrada de ella; con ello, se calcula la desviación
estándar de la variable aleatoria discreta.
Matemáticamente, la desviación estándar (𝜎) de una variable aleatoria discreta se
define como:
𝑛

𝜎 = √∑[𝑋𝑖 − 𝐸(𝑋)]2 𝑃(𝑋𝑖 ) 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑖 = 1,2,3, … 𝑛


𝑖=1

Donde:
𝑋𝑖 =i-esimo valor numérico de la variable aleatoria discreta X.
E(X) = media o valor esperado de la variable aleatoria discreta X.
𝑃(𝑋𝑖 ) = probabilidad de ocurrencia del i-esimo resultado de la variable aleatoria
discreta X.
Por ejemplo, si retomamos el ejemplo de la franquicia de la ciudad de puebla, en México,
referente a las ventas de su helado de mandarina, obtendríamos una varianza d una
desviación estándar de esta variable aleatoria discreta en la siguiente forma.

Numero de Número de Probabilidad 𝑋𝑖 𝑃(𝑋𝑖 ) [𝑋𝑖 𝐸(𝑋)]2 𝑃(𝑋𝑖 )


helados de días en que se de que la
mandarina por observó esta variable
días 𝑋𝑖 ventana aleatoria X se
presente
30 6 0.120 3.60 0.726192
31 8 0.160 4.96 0.341056
32 12 0.240 7.68 0.050784
33 11 0.220 7.26 0.064152
34 7 0.140 4.76 0.332024
35 6 0.120 4.20 0.774192
total 50 1.0 32.5 2.2884

La varianza es : 𝜎 2 . = 2.2884 helados, y la desviación estándar: 𝜎 = 1.5 helados.


Es decir, el administrador de esta franquicia esperaría vender un promedio de 32.5
helados de mandarina por día con una nueva variación aproximada de este promedio
de 1.5 helados; esto es, entre 31 y 34 helados de este sabor por día.
Distribución de probabilidad binomial
Es una distribución de probabilidad de una gran cantidad de variables aleatorias discreta
cuyos experimentales son generados mediante un proceso conocido como de Bernoulli.
Su nombre se establece en honor del matemático suizo Jacob Bernoulli (1654-1705)
Esta distribución de probabilidad se ocupa de experimentos en donde su resultado solo
puede tomar un solo valor de dos posibles, porque estos resultados son mutuamente
excluyentes. Por ejemplo, considere usted la siguiente pregunta en una entrevista :
¿trabajo usted la semana pasada? Sus posibles respuestas son: si, o bien, no. Dos
posibles resultados, es una binomial y, por tanto, un entrevistado solo puedo responder
a una de ellas; es decir, las respuestas se excluyen mutuamente.
Cálculo de probabilidades en una distribución binomial
Si se conoce la probabilidad de que en un experimento determinado se producirá un
éxito, entonces es posible determinar cuántos éxitos habrá en un número determinado
de experimentos.
Matemáticamente, un experimento que presenta un proceso de Bernoulli puede
definirse mediante los siguientes símbolos:
𝑃 = la probabilidad de tener un éxito.
𝑞 = (1 − 𝑝) =la probabilidad de tener un fracaso.
𝑟 = El número éxitos deseados al realizar un proceso de Bernoulli
𝑛 = el número total de ensayos o intento utilizados (este número es fijo durante el
experimento).
Y calcularse con la relación:
𝑛!
𝑃𝑛, 𝑟 = 𝑟!(𝑛−𝑟)! 𝑝𝑟 𝑞 𝑛−𝑟 (4.1)

Recordemos que el símbolo n!, significa n factorial. Por ejemplo, 3! = 3x2x1=6, y que 0!
= 1.
Ejemplo:
En un cuestionario acerca del empleo se pregunta: ¿usted trabajo actualmente? Se ha
considerado que el 65% de los entrevistados responderá que “si”. se hicieron ocho
cuestionarios del estudio. ¿Qué probabilidad hay de que en cinco de ellos respondan
afirmativamente?
8!
Solución: 𝑃8.5 = 0.655 0.358−5
5!(8−5)

𝑛 = 8, 𝑟 = 5, 𝑝 = 0.65
𝑞 = 1 − 𝑝 = 0.35 𝑃8.5 = 56(0.116029)(0.042875)
𝑃8.5 = 0.2786
La probabilidad de que en cinco de ellos respondan afirmativa es: 0.2786
En la hoja electrónica de calculo Excel podemos utilizar la función que permite calcular
la probabilidad de una distribución binomial
=DISTRI.BINOM(r,n,p,), para nuestro ejemplo, la probabilidad buscada se calcula con la
función :
= DISTR. BINOM (5,8,0.65), cuyo valor en la celda de la hoja es: 𝑃8.5 = 0.278585779.
Medida d=e desviación estándar en una distribución binomial
Como ya se indicó en el tema anterior, se cuenta con las fórmulas de cálculo de la media
y la desviación estándar de la distribución de probabilidad de una variable aleatoria, por
lo que, en el caso de una distribución binomial, este cálculo se simplifica
considerablemente dado que solo tenemos dos posibles resultados.
La medida de una distribución binomial se calcula mediante (4.2):
𝜇 = 𝑉𝐸(𝑋) = 𝐸(𝑋) = 𝑛𝑝 (4.2)
Donde:
n= número total de ensayos o intentos utilizados en el experimento.
P= la probabilidad de tener un éxito.
Y la desviación estándar de una distribución binomial (4.3) se calcula como:

𝜎 = √𝑛 𝑝(1 − 𝑝)

𝜎 = √𝑛 𝑝 𝑞 (4.3)

Donde:
n = número total de ensayos o intentos utilizados en el experimento.
P = la probabilidad de tener un éxito.
q = la probabilidad de tener un fracaso.
Ejemplo:
En la zona norte del distrito federal se ha realizado un estudio que muestra que un 70%
de los hogares en la zona tienen servicio de internet. Si seleccionamos 50 hogares
aleatoriamente. ¿Qué promedio de hogares en la muestra contara con el servicio de
internet?
Solución:
n = 50 hogares seleccionados
p = 0.70 de contar con servicio de internet
q = 0.30 de contar con servicio de internet
por tanto: µ= 50(0.70) =35 hogares en promedio en la zona cuentan con servicio de
internet, con una desviación estándar de:

𝜎 = √50(0.70)(0.30) =3.24 hogares.

Distribución de probabilidad hipergeometrica


Una de las características de la distribución binomial es que la probabilidad de éxito debe
ser la misma para cada ensayo sucesivo, esto se debe a que se trata de un proceso en el
que el número de ensayos es finito y con reemplazo de los elementos que forman el
experimento. Por ejemplo, en un examen, la probabilidad de que un individuo adivine
la respuesta correcta para una pregunta con dos opciones, “a” y “b”, es 0.50.

La distribución de probabilidad hipergeometrica surge al seleccionar una muestra sin


reemplazo de una población finita conocida y que presenta una proporción relativa
grande de la población, de tal forma que la probabilidad de éxito cambia de una
selección a otra. Por lo que la distribución hipergeometrica determina la probabilidad
de tener un determinado número de éxitos en una muestra que se obtuvo de una
población con un determinado nuero de éxitos.
En resumen, puede establecerse que una distribución de probabilidad se puede manejar
con una distribución de probabilidad hipergeometrica si:

 Se selecciona una muestra de una población finita sin reposición.


 El tamaño de la muestra “n” es mayor que 5% d tamaño de la población (N).
La relación matemáticamente que permite calcular distribución de probabilidad
hipergeometrica es:

𝑌 𝐶𝑥 𝑁−𝑦 𝐶𝑛−𝑥
𝑃(𝑥) =
𝑁 𝐶𝑛

Donde:
C = símbolo de las combinaciones
N = tamaño de la población
n = tamaño de la muestra
y = número de éxitos en la muestra
x = número de éxitos en la muestra
N-y = número de fracasos en la población
n-x = número de fracasos en la muestra
ejemplo:
el administrador del estado de santa clara cuenta con diez vacas Holstein de alto
rendimiento, pero cuatro de ellas al revisarlas el veterinario, se les detecta una
enfermedad contagiosa. ¿Qué probabilidad hay de que, en una muestra de tres vacas,
dos de ellas presenten la enfermedad contagiosa?
Solución:
N = 10 n=3 y=4 x =2

𝑌 𝐶𝑥 𝑁−𝑦 𝐶𝑛−𝑥
𝑃(𝑥) =
𝑁 𝐶𝑛

4 𝐶2 10−4 𝐶3−2
𝑃(𝑥) =
10 𝐶3

(6)(6)
𝑃(𝑥) = = 0.30
120
Media y varianza de la distribución de probabilidad hipergeometrica
La media de la distribución de probabilidad hipergeometrica s define como:
𝑛𝑦
𝜇= ; donde y/n = P, la cual tiende al valor de la media en una distribución binomial
𝑁
(𝜇 = 𝑛𝑝) si el tamaño de la población (N) es muy grande con respecto al tamaño de la
muestra(n).
La varianza, por otro lado, está definida con la relación:
𝑦 𝑁−𝑦 𝑁−𝑛
𝜎2 = 𝑛 ( ) ( )( )
𝑁 𝑁 𝑁
Distribución de probabilidad de poisson
Es una distribución de probabilidad que se aplica para variables aleatorias discretas, ya
que mide la frecuencia relativa de un evento en función a una unidad de tiempo, a una
de espacio, o bien, a una de volumen.
La distribución de poisson permite describir el comportamiento de la probabilidad n
problemas como:

 Número de llegadas de clientes por hora a un banco, restaurante o bien, una


tienda.
 Número de accidentes por semana en una escuela, empresa o carretera.
 El número de imperfecciones por centímetro en los toldos de las carrocerías de
automóviles nuevos.
Esta distribución de probabilidades de poisson es el resultado de las siguientes hipótesis:

 Los eventos suceden uno a la vez, es decir, la probabilidad d que ocurran dos o
más eventos en el mismo instante es cero.
 La probabilidad de ocurrencia del evento de interés es constante para dos
intervalos distintos de tiempo, espacio o volumen.
Media y varianza de una distribución de probabilidad de poisson
Con base en la definición de la distribución de probabilidades de poisson se establece
que la media o valor esperado es igual que lambda (𝜆).
𝐸(x)=𝜆
La varianza para esta distribución de probabilidad también es igual que lambda (𝜆).

𝜎2 = 𝜆
Y la desviación estándar para esta distribución de probabilidad es igual que:

𝜎 = √𝜆
Ejemplo: en una sucursal del banco Aztek ubicada en el centro de la ciudad llega un
promedio de seis clientes por minuto. Si se considera una distribución de poisson, ¿Qué
desviación estándar de clientes se tiene en esta sucursal?
Solución:
𝐸(𝑥) = 𝜆 = 6 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜 𝜎 2 = 6 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜

𝜎 = √𝜆

𝜎 = √6 = 2.45 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜


Es decir, en promedio tenemos un arribo de seis clientes por minuto con una dispersión
de más y menos 2.45 clientes. Esto es en cada minuto se puede esperar la llegada de
entre cuatro y ocho clientes.
Distribuciones discretas de probabilidad en Excel
Las distribuciones discretas de probabilidad, puede tratarse mediante el uso de
funcionamiento construidas para ellas en Excel.