Está en la página 1de 8

Funciones de Probabilidad

Variables aleatorias:
Una variable aleatoria X es una función que asigna un número real a cada elemento muestral
asociado a un experimento aleatorio.

Por ejemplo, consideremos el experimento que consiste en verificar si las 4 puertas de un


auto están abiertas o cerradas. El espacio muestral sería entonces

Ω = {CCCC – CCCA – CCAA – CCAC – CACC – CACA – CAAA – CAAC - ACCC – ACCA – ACAA –
ACAC – AACC – AACA – AAAA – AAAC }

La variable aleatoria a considerar podría ser por ejemplo X = cantidad de puertas abiertas.

Al tomar valores que dependen de un experimento aleatorio, la variable X hereda el carácter


aleatorio: sabemos la cantidad de resultados posibles (rango de X: 0, 1 , 2 , 3, 4), pero no
sabemos el resultado en un experimento en particular.

Entonces tiene sentido, preguntarse la probabilidad de que X tome cierto valor


determinado, P(X = a) para a: 0, 1, 2, 3, 4. Se representa mediante su distribución de
probabilidad que no es otra cosa que el rango de la función con la probabilidad en cada
caso. Puede darse en una tabla o con una fórmula.

En el ejemplo, si suponemos equiprobabilidad entre estar cerrada o abierta cada puerta,n


la distribución de probabilidad es

K P(X=k)

0 1/16

1 4/16

2 6/16

3 4/16

4 1/16

Notemos que la suma de la columna de la derecha da 1, y así debe ser. En una distribución
de probabilidades de una variable aleatoria discreta, la suma de las probabilidades
correspondientes a todos los valores del rango es igual a 1.
Función de distribución acumulada: es una función que a cada valor del rango de la
variable aleatoria X le asigna la probabilidad de tomar a lo sumo ese valor. Es decir,

En el ejemplo:

k P(X=k) FX(k)

0 1/16 1/16

1 4/16 5/16

2 6/16 11/16

3 4/16 15/16

4 1/16 16/16

Distribución Binomial:

Supongamos ahora que la probabilidad que una puerta esté abierta es P(A)=p y otra vez, la
apertura de las 4 puertas en independiente entre sí. Calculemos P(X = a) para a: 0,…4. Los
4
casos favorables tienen a puertas abiertas y 4-a cerradas, en algún orden y hay ( ) formas
𝑎
de ordenar esa secuencia. Como sabemos que P(A) = p, y P(𝐴̅)=1-p, la probabilidad de cada
4
secuencia es pa q4−a , multiplicando por la cantidad de secuencias, 𝑃(𝑋 = 𝑎) = ( ) 𝑝𝑎 𝑞4−𝑎
𝑎

Esta situación aparece en muchos casos de estudio, por lo que fue formalizado: una variable
aleatoria X que cuenta la cantidad de "éxitos" en n repeticiones independientes de un
experimento que solo tiene dos resultaos posibles (éxito y no éxito) con probabilidad de
éxito p, donde p se mantiene constante en las n repeticiones del experimento se dice que
sigue una distribución Binomial y se representa

Dónde n y p son parámetros (datos que dependen del problemas concreto) y su rango es
X=0, 1, … , n

Razonando de manera análoga al ejemplo, tenemos que


Esperanza matemática de X

La esperanza matemática o valor esperado de una variable aleatoria es el valor alrededor


del cual se concentran los valores. Será equivalente a un promedio o media aritmética y se
representa como E[X] o μ.

En el caso de una distribución discreta se calcula

𝐸(𝑋) = ∑ 𝑎. 𝑃(𝑥 = 𝑎)
𝑎 ∈ 𝑅𝑎𝑛𝑔𝑜

Propiedades:

Varianza o Variancia de X

La varianza de una variable aleatoria X es una medida de dispersión que mide la variabilidad
de los valores de X respecto de la media. Se representa como Var[X]

𝑉𝑎𝑟(𝑋) = ∑ (𝑎 − 𝐸(𝑥))2 . 𝑃(𝑥 = 𝑎)


𝑎 ∈ 𝑅𝑎𝑛𝑔𝑜

Otra medida de variabilidad es el desvío estándar, que es la raíz cuadrada de la varianza.


Se representa con la letra griega sigma y la ventaja con respecto a la varianza es que tiene
la misma unidad de medida que la variable. Mientras menor sea el desvío, mayor es la
concentración alrededor de la media.

En nuestro ejemplo:

E(x) = 0. 1/16 + 1 . 4/16 + 2 . 6/16 + 3 . 4/16 + 4 . 1/16 = 2.

La cantidad esperada de puertas abiertas es 2.

Para calcular la varianza, calculamos la esperanza de (x-E(x))2 , es decir que a cada valor de
X le restamos E[X]=2 y lo elevamos al cuadrado. Después hacemos la misma operatoria de
calcular la esperanza, es decir multiplicar cada valor por su probabilidad y sumar todo:

Var (x) = (0-2)2. 1/16 + (1-2)2. 4/16 + (2-2)2. 6/16 + (3 -2)2. 4/16 + (4-2)2. 1/16 = 1

Por lo tanto, σ = 1 .
El caso anterior la variable aleatoria es discreta (toma valores separados entre sí y no
necesariamente hay un valor entre otros dos), veamos ahora un ejemplo de una variable
aleatoria continua (el rango es un intervalo continuo):

Un disco gira libremente, perfectamente balanceado, numerado en su circunferencia


con una escala lineal y continua de 0 a 2π. Se detiene el disco y se marca una posición.
Sea X el número en el cual se detiene el disco. ¿Cuál es la probabilidad de que el
resultado sea el número pi?

Podemos suponer que detenerse en cada una de las posiciones del disco son sucesos
igualmente probables. Dado que tenemos infinitas posiciones distintas, la probabilidad
buscada será 1 sobre infinito. Y esto tiende a cero. Es decir: P(X=π)=0

Si X es una variable aleatoria continua, (𝑋=a)=0 ∀𝑥. Esto no implica que el suceso X= a sea
imposible. Para tener un valor positivo de probabilidad debemos considerar un intervalo,
por lo que calculamos 𝑃(a ≤ 𝑋 ≤ 𝑏).

En este caso se habla de una función de densidad de probabilidad f(x) y de función


acumulada F(x), donde F(X = a) = P(x ≤a). Si bien no entraremos en detalle en este curso, la
probabilidad se puede calcular de la siguiente manera

En el ejemplo, 𝑃(a ≤ 𝑋 ≤ 𝑏) = (b - a)/ 2π, pero tampoco entraremos en detalle. Si alguien


desea profundizar, puede buscar distribución uniforme.

Distribución Normal

Veamos ahora la más popular de las distribuciones de probabilidad, conocida como Normal,
campana de Gauss, distribución de Laplace. Su función de densidad es:

En la expresión aparecen las constantes matemáticas 𝜋, 𝑒, y las constantes 𝜇 𝑦 𝜎 que


dependen del problema y son E(X) = 𝜇 y Var(X) = 𝜎2.
La distribución normal es simétrica respecto de la media y la función de densidad alcanza
su máximo en X= μ. Los puntos de inflexión (dónde cambia la concavidad de la campana) se
dan en μ - σ y μ + σ. Entre esos valores se encuentra el 68% de los datos. La media entre + y
– cierta cantidad de veces su desvío también tiene su interpretación en términos de cuántos
valores quedan en esa porción central:

La probabilidad que la variable X cumpla cierta condición corresponde al área bajo la curva.

Estos valores están tabulados o se obtienen mediante calculadoras virtuales. Llamemos F(X)
a la función acumulada:

P(x ≤ a) = F(a)

P( a ≤ x) = 1 – F(a)

P(a ≤ x ≤ b) = F(b) – F(a)

¿Dónde obtener F(a)?

Opción 1: Calculadora virtual de probabilidades normales

https://www.uv.es/ceaces/scrips/tablas/tanormal.htm

Opción 2: Excel.
Si bien usar Excel solo para calcular probabilidades es incómodo, muchas veces se trabaja a
la largo de todo un curso con Excel para probabilidades y estadística, por lo cual se
transforma en una opción cómoda, para no cambiar de programa.

La función DISTR.NORM.N(a, media, desvío estándar, 1) nos devuelve F(a) para la media y
desvío estándar especificado. El valor 1 es un valor lógico que indica que buscamos la
función acumulada.

Opción 3: Tablas

Esa es una tabla de distribución normal (pueden buscar otra más clara en cualquier libro de
probabilidades). Como no podemos tener una tabla para cada caso particular de media y
desvío estándar, se trabaja en una en particular, con media 0 y desvío 1. En esa tabla se
puede rescatar la información de cualquier distribución normal mediante la
estandarización.

Distribución Normal Estandarizada.

Una variable aleatoria normal puede transformarse en una normal a una estandarizada
mediante la siguiente fórmula:

Transformado una variable X, normal con media μ y desvío estándar σ en una variable Z con
media 0 y desvío estándar 1.
𝑎−𝜇
Sabemos que P(X ≤ a ) = P( Z ≤ 𝜎
)

Ejemplo: Una fábrica de producción de agua embotellada, cuenta con una máquina de
envasado automático, la cual vierte en cada botella una cierta cantidad de agua que
sigue una distribución normal con media de 500 mililitros y una varianza de 25
mililitros. ¿Qué porcentaje de las botellas se llenan con agua entre 490 y 507 mililitros?

Nos está pidiendo la probabilidad que 490 ≤ x ≤ 507, con los datos μ = 500 y σ2 = 25 (σ = 5).

En la calculadora será:

El 89,6% de las botellas se llenan con esa cantidad.

En Excel: F(507, 500, 5, 1 ) - F(490, 500, 5, 1 ) = 0,91924334 – 0,02275013 = 0, 89649321

Obtenemos el mismo resultado, con mayor precisión.

En la tabla hay que trabajar más:


490−500 507−500
Primero estandarizamos los valores buscados: 5
= -2 y 5
= 1,4

Luego buscamos esos valores en la tabla dada y a probabilidad buscada es

F(1,4 ) – F(2) = 0,9192 - 0,0228 = 0,8964

La distribución normal es la más importante por varios motivos. Primero porque aparece
frecuentemente en la realidad: muchos fenómenos que podemos medir tanto en las
ciencias exactas como las sociales de asemejan en su frecuencia a esta distribución.

Además, cumple una propiedad llamada Teorema del Límite Central.

Este teorema se refiere a la distribución del promedio de variables aleatorias de una misma
distribución. Este teorema será de mucha utilidad al momento de utilizar la media
aritmética de una muestra, como estimador de la media poblacional.

Teorema:

Dada una población con una distribución de probabilidad CUALQUIERA, con E(X) = μ y
Var(X) = σ2 finitas, de la que se extrae una muestra simple al azar de tamaño n, de valores
independientes X1, X2, …,Xn y se calcula el promedio o media muestral de estas
𝑛
∑ 𝑋𝑖
observaciones 𝑋̅ = 𝑖=1
𝑛
,

Si n es suficientemente grande se demuestra que la variable aleatoria 𝑋̅ se distribuye


𝜎 2
normalmente con media ( 𝑋̅ )=𝜇 y 𝑉𝑎𝑟(𝑋̅)= 𝑛

Ejemplo: Una empresa de mensajería que opera en la ciudad tarda en promedio 30


minutos en llevar un paquete, con una desviación σ = 8 minutos. Supongamos que
durante el día de hoy han repartido 100 paquetes. ¿Cuál es la probabilidad de que el
promedio de los tiempos de entrega de hoy sea menor a 32 minutos?

Consideremos la variable X: “Tiempo de entrega del paquete” con μ = 30 minutos y σ=8, que
no conocemos su distribución de probabilidad.

Consideremos también la variable aleatoria promedio: 𝑋̅ = promedio de tiempo de entrega


de los 100 paquetes del día de hoy.

Por el teorema del límite central, con n = 100 sabemos 𝑋̅ sigue una distribución normal con
media 30 y varianza 82/100 = 0,64, por lo tanto desvío 0,8

Debemos calcular ( 𝑋̅ ≤ 32)=F(32) = 0,994

También podría gustarte