Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo 3
Variable aleatoria
“una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de
la variable aleatoria depende del resultado del experimento”
Discreta: Es la que asume un número finito de valores o una serie infinita de valores, como, por ejemplo, el de los
números naturales.
Ejemplos de variables aleatorias discretas. Se describe el experimento y qué variable aleatoria nos interesa. Luego,
en la tercera columna se muestran los posibles resultados de ese experimento, que son siempre valores numéricos.
Variables aleatorias continuas: pueden adoptar cualquier valor numérico dentro de un intervalo de números reales.
Cuando el experimento requiere resultados experimentales que están dentro de una escala de medición, como el
tiempo, peso, distancia, entre otras magnitudes, en general, las variables aleatorias continuas están unidas al
conjunto de números reales. Entre dos números reales hay infinitos valores reales.
Ejemplo: Se describe el experimento y qué variable aleatoria nos interesa. Luego, en la tercera columna, se muestran
los posibles resultados de ese experimento, que son siempre valores numéricos.
Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un
experimento que se presentaron realmente cuando se efectuó este, mientras que una distribución de probabilidad
es un listado de las probabilidades de todos los posibles resultados que podrían obtenerse si el experimento se
llevara a cabo
Las distribuciones de probabilidad pueden basarse, además, en consideraciones teóricas, como, por ejemplo, el
lanzamiento de una moneda.
También pueden surgir de estimaciones subjetivas, de la experiencia, como, por ejemplo, en las compañías de
seguros pueden estimar los índices de mortalidad para asignar la probabilidad de muerte entre los diferentes grupos
etarios.
Inclusive, en el caso de las distribuciones de frecuencias podemos pensar una distribución de probabilidad como una
distribución de frecuencias teórica, pues nos muestra cómo se espera que varíen los resultados.
- Funciones de probabilidad
En el caso de una variable aleatoria discreta x, la forma que adopta la distribución de probabilidades está definida
por una función de probabilidad f(x), cuyo valor es cada una de las probabilidades de la variable aleatoria.
Al elaborar una función de probabilidad para una variable aleatoria discreta, deben satisfacerse las dos condiciones
siguientes:
Sabemos que las funciones pueden estar definidas por tablas y gráficos, entre otras formas. Pero la forma más
utilizada en matemáticas es mediante una fórmula matemática que, para cada valor de x, se obtiene un valor de f(x).
Análogamente, para describir las funciones de probabilidad, se suele usar una fórmula de la que se obtiene el valor
de la función de probabilidad f(x) para cada valor x.
El típico caso de aplicación de esa función es lanzar un dado. Si definimos la variable aleatoria x, número de puntos
en la cara del dado en la parte superior, observemos que el valor de probabilidad siempre será 1/6.
Las funciones de probabilidad discretas más empleadas suelen especificarse mediante fórmulas.
Tres de los modelos de este tipo de variables son las distribuciones binomial, hipergeométrica y de Poisson, que
estudiaremos en la próxima lectura. Cada una de estas distribuciones tiene su fórmula de función de probabilidades,
que permiten calcular las probabilidades para cada variable aleatoria.
También puede trabajarse mediante tablas de probabilidades para encontrar el valor de probabilidad buscado y no
tener que aplicar la fórmula para cada variable aleatoria discreta que se busque.
Los modelos mencionados, repetimos, se utilizan para variables aleatorias discretas y a través de ellos podremos
calcular las probabilidades para cada variable aleatoria discreta que necesitemos.
Aclaración: en términos prácticos, P(x)=f(x), es decir que se utilizan indistintamente para indicar probabilidad de
variable aleatoria y función de probabilidad de variable aleatoria.
Valor esperado
El valor esperado, o media, de una variable aleatoria es una medida de la posición central
El valor esperado es un promedio ponderado de los valores que toma la variable aleatoria. Esa ponderación se
realiza multiplicando cada variable aleatoria por su probabilidad.
Ex=μ=∑ x.f(x)
Varianza
Además de una medida de posición, necesitamos para una mejor descripción de la distribución de la variable
aleatoria, una medida de dispersión, una medida que nos indique la dispersión de la variable aleatoria discreta.
Su fórmula es:
Var(x)=o2=∑(x-μ)2.f(x)
Nota: Recuerda que esta es la fórmula de la varianza, solo que como f(x) es la probabilidad de x, ya está dividida por
el número total de ensayos (observaciones). Es decir, f(x) son las probabilidades o las frecuencias relativas.
La varianza es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria con respecto a
la media. Esa ponderación está dada por las probabilidades.
la desviación (x - µ), mide cuán alejado del valor esperado μ o E(X), se encuentra un valor determinado de la variable
aleatoria.
Para calcular la varianza de una variable aleatoria, estas desviaciones se elevan al cuadrado y después se ponderan
con el correspondiente valor de la función de probabilidad.
Distribución binomial
Un experimento binomial está relacionado con un experimento de pasos múltiples en el que es necesario identificar
todas las posibles maneras en que el experimento puede presentarse y la probabilidad de ocurrencia de cada una de
ellas. Estas posibles maneras pueden determinarse teóricamente o como resultado de un análisis subjetivo,
producto de la experiencia.
- Características de un experimento binomial
El estudio está centrado en determinar la probabilidad que en n ensayos se obtenga un número x de aciertos. Este
número de aciertos se constituye en los distintos valores que puede adoptar la variable, que, por ser producto de un
conteo, es del tipo discreta.
Si se presentan las propiedades 2), 3) y 4), se dice que los ensayos son generados por un proceso de Bernoulli. Si,
además, se presenta la propiedad 1), se trata de un experimento binomial.
En un experimento binomial, lo que interesa es el número de éxitos en n ensayos. Si x denota el número de éxitos en
n ensayos, es claro que x tomará los valores 0, 1, 2, 3, ..., n. Dado que el número de estos valores es finito, x es una
variable aleatoria discreta. A la distribución de probabilidad correspondiente a esta variable aleatoria se le llama
distribución de probabilidad binomial.
En las aplicaciones de los experimentos binomiales, se emplea una fórmula matemática llamada función de
probabilidad binomial, que sirve para calcular la probabilidad de x éxitos en n ensayos. Empleando los conceptos de
probabilidad, se mostrará el desarrollo de la fórmula.
Parámetros
Como en cualquier función, existen parámetros (números reales) y variables (en este caso la función binomial que
depende de la variable aleatoria).
En el caso de la función binomial, los parámetros son n y p. Estos son los parámetros que caracterizan a la función y
son constitutivos de la fórmula:
n: número de ensayos
p: probabilidad de éxito
por lo que se suele escribir: Bin (n,p) que significa distribución binomial de parámetros n y p.
¿Cuál es la probabilidad de que las cuatro veces salga cara suponiendo que la moneda está perfectamente
balanceada?
Datos:
Aclaraciones
Recuerda que las combinaciones son conjuntos que pueden formarse con n elementos tomados de la x. Las
calculadoras científicas simples tienen esta función. Es la tecla nCr, por ejemplo, si deseas calcular cuántos grupos de
6 personas puedes formar tomadas de a 3, el cálculo es C6,3, por calculadora, 6 nCr 3 =20.
Cuando p es pequeño, la distribución binomial está sesgada hacia la derecha (asimetría positiva). Es el caso del
ejemplo 2 (p=0,01) y el caso de la empresa de salud (p=0,15).
Cuando p es mayor que 0,5, la distribución está sesgada hacia la izquierda (asimetría negativa).
¿Qué sucedería cuando n aumenta y p permanece constante? La distribución tendría la misma forma, pero a medida
que aumenta n, las líneas verticales estarían cada vez más juntas y asumirían la forma de campana en las
distribuciones simétricas. Y, en el resto de los casos, se suavizarían los rectángulos y adoptarían forma curva con
sesgo a la izquierda o a la derecha, tal cual vimos en el módulo 1.
Ahora resolveremos los mismos problemas, pero usando las tablas de distribución de probabilidad binomial. Estas se
encuentran en el anexo de este módulo. Es conveniente que las imprimas para manejarlas con más facilidad y para
cuando vayas a rendir los exámenes. ¡No olvides llevarlas!
Puedes utilizar cualquiera de las dos tablas, todo depende de ti, de la que te resulte más práctica. Pero ten en cuenta
que hay una diferencia en su manejo. En el anexo se presentan para descargar las tablas puntuales y acumuladas. A
continuación, estudiarás cómo se utilizan.
Estas tablas sirven para buscar una probabilidad puntual, por ejemplo, el caso en que la variable aleatoria toma un
solo valor. Por ejemplo, para x=7, si se busca x<7, tendrás que sumar todas las probabilidades que están por debajo
de 7 o utilizar la tabla acumulada, que también te mostramos como se maneja.
Tomando como punto de partida la definición de esperanza matemática o valor esperado de una variable aleatoria:
Ex=μ=n.p
E(x)=4×0,5=2
Significa que el valor que se espera obtener en promedio, si repetimos el ensayo muchas veces, es de 2 caras.
Ejemplo 2: Datos: n=10; p=0,01 (Defectuosos)
E(x)=10×0,01=0,1
Significa que el valor que se espera obtener, en promedio, si repetimos el ensayo muchas veces es de 0,1 defectos.
Var(x)=n.p.q
Ejemplo:
Determinación del tamaño de la muestra para una estimación por intervalo de la media poblacional
Las condiciones que deben darse para que sea una distribución de Poisson
Esta distribución tiene como parámetro un solo valor, el promedio de ocurrencia, al que denominaremos como
Lambda: λ
x: Número de éxitos/ocurrencias
Parámetros
Observa que el número de ocurrencias x, no tiene límite superior. Esta es una variable aleatoria discreta que toma
los valores de una sucesión infinita de números (x = 0, 1, 2,…).
Donde i varía, al menos teóricamente, entre cero e infinito. Decimos teóricamente, ya que, por ejemplo, si se
informa que en promedio en una pista de aterrizaje de aviones despegan por hora tres aviones de cabotaje; no
tendría sentido pretender determinar la probabilidad de que en una hora aterricen en dicho aeropuerto 90 aviones
de cabotaje.
En la distribución de Poisson, la media, que es igual al valor esperado, E(x) es igual a lo que se espera que ocurra, es
decir λ.
La varianza también es igual al promedio de ocurrencia λ. Por lo tanto, la desviación estándar es:
El parámetro es λ y el número e, que ya lo conocemos, lo podemos calcular por calculadora. Es irracional con
infinitas cifras decimales no periódicas. Por eso, tendremos que aproximarlo. Mi consejo es que hagas todos los
cálculos directamente sin poner valores parciales en las cuentas.
Entonces:
Distribución hipergeométrica
Esta distribución viene a dar solución a los casos en los que no hay reposición de elementos en un experimento y por
lo tanto la probabilidad de ocurrencia no se mantiene constante. Cuando estudiemos las características de esta
distribución y la ejemplifiquemos, notaremos que la población no se considera infinita frente a la muestra. Es más,
población y muestra están cercanas en tamaño.
si de la población se extrae una muestra de 10 alumnos y el muestreo se realiza sin reposición, la probabilidad de
elegir un nuevo alumno, azarosamente, de la división y que haya aprobado el parcial de Estadística, ya no será P (A) =
15/40, pues esta probabilidad se ha visto modificada por el muestreo previo realizado.
Pero, aparentemente, el fenómeno presenta características similares a la de una binomial, en la que hay dos
opciones: éxito/fracaso.
- Que la población es finita y el tamaño de la muestra es grande, significativo, respecto al tamaño poblacional
y, por lo tanto, modifica la probabilidad de elegir nuevamente a un alumno que aprobó el parcial.
- El muestreo se realiza sin reposición y, al ser significativo el tamaño de la muestra con respecto al tamaño de
la población, modifica la probabilidad de acierto.
Debemos recordar que, en la distribución binomial, la probabilidad de lo que consideramos acierto se mantiene
constante y esto solo se logra si el muestreo se realiza con reposición o la población es infinita o muy grande.
En cada una de las pruebas se dan dos resultados posibles mutuamente excluyentes: éxito (E) o fracaso (F).
Las probabilidades de obtener un éxito o un fracaso varían en las sucesivas pruebas, dependiendo de los resultados
anteriores.
La población es finita y el tamaño de la muestra es grande; para establecer un límite, se aplica la distribución
hipergeométrica si la muestra es mayor al 5 % de la población: n > 5% N
Si denotamos con:
Entonces:
La probabilidad de que en una muestra aleatoria de n elementos, seleccionados sin reemplazo, se tengan x éxitos de
los k éxitos que hay en la población y n-x fracasos de los N-k fracasos de la población, se calcula con la siguiente
fórmula:
que proporciona la probabilidad de tener x éxitos en una muestra de tamaño n (utilizaremos la notación de número
combinatorios:
- Valor esperado (media) y varianza de la distribución hipergeométrica
Tablas
- Existen tablas para calcular la distribución de una variable aleatoria en un experimento hipergeométrico,
pero no vamos a necesitarlas en este curso.
- Existen tablas para calcular la distribución de una variable aleatoria en un experimento hipergeométrico,
pero no vamos a necesitarlas en este curso.
Para calcular la probabilidad de una o varias variables aleatorias puede recurrirse al complemento si es necesario.
En muchas oportunidades, nos encontramos con distribuciones que responden al modelo binomial, con un p
(probabilidad de éxito) pequeño y un n (número de ensayos) grande. En estos casos, el cálculo de las probabilidades
de éxito se puede volver tedioso, especialmente, cuando n o p no se encuentra en la tabla. A los efectos de su
resolución, puede aplicarse la distribución de Poisson.
Condiciones
Para poder aproximar mediante la distribución de Poisson una distribución binomial, se deben cumplir las siguientes
condiciones:
Con n ≥ 20 y p ≤ 0,05
DISTRIBUCION NORMAL
La distribución de variable continua que responde a una gran cantidad de situaciones en donde la variable se mide
en un intervalo es la distribución normal también denominada Campana de Gauss, en honor a los trabajos
desarrollados por el matemático Carl Gauss (1777-1855).
Función de densidad
Ya hemos dicho anteriormente que podemos imaginarnos algunas funciones curvilíneas como idealizaciones de un
polígono de frecuencias, asociado a un histograma de frecuencias.
Las distribuciones de probabilidad de una variable aleatoria continua pueden imaginarse así cuando se aumenta
indefinidamente el número de datos y se disminuye paulatinamente la amplitud de los intervalos de un polígono de
frecuencias relativas.
Definición:
Una función F(x) se dice que es una función de densidad de una variable aleatoria continua X si se verifican:
1- La función F(x) es positiva o nula en todo el dominio de definición
2- El área limitada por la gráfica de la función y el eje de abscisas son iguales a la unidad.
Es simétrica respecto al eje vertical que pasa por la abscisa de mayor ordenada.
El valor de la abscisa de mayor ordenada coincide con la media y al ser simétrica respecto al eje vertical que pasa por
ese punto, coincide con la mediana y con la moda.
Curva de la distribución de probabilidad normal: Se muestra la forma de campana que adopta la distribución normal
para resaltar que la rige una función que se llama función de densidad.
Notación-parámetros: Entonces podemos decir que la distribución normal necesita de la media y de la desviación
estándar para quedar definida: N(µ,σ) se lee distribución normal de media µ y desviación estándar σ.
Se muestra la forma de campana que adopta la distribución normal y se destaca el área por debajo de la curva, la
función de densidad. Esta área es igual a 1 y responde a la integral de la función de densidad F(X).
La superficie encerrada por la función de densidad y por el eje horizontal es igual a 1. Esto implica que dicha
superficie está definida mediante una integral, que es la integral de la función de densidad, entre los límites -∞ y
+∞. Entonces:
En una variable aleatoria continua, no tiene sentido el estudio de la probabilidad en un valor aislado. Entonces, la
probabilidad de x=c (cuando c es un número real cualquiera) es cero.
P(x=c)=0
Pero sí tiene sentido la probabilidad de que la variable tome valores dentro de un intervalo. Si asociamos la
probabilidad de que la variable aleatoria tome un valor comprendido en un intervalo (a; b), con la integral definida
de la función de densidad entre x=a y x=b, nos queda:
No hace falta mostrar la fórmula si sustituimos a F(x) por su función de densidad, pero te imaginarás como queda…
No te preocupes porque, para facilitar estos cálculos, existe la tabla de la distribución de probabilidades de la
normal, que utilizaremos más adelante.
Distribución normal estándar: Esta es la distribución normal estándar o tipificada, que se caracteriza por tener una
media igual a cero y una desviación estándar igual a 1. La campana abarca algo más de tres desviaciones estándar a
la izquierda y tres a la derecha de la media.
En un primer paso, nuestro problema será averiguar cuán desviados están de la media los valores que queremos
averiguar para resolver nuestro problema. Luego, se calculan las probabilidades de esa área bajo la curva, limitada
por el intervalo que nos interesa.
El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que
el punto dista de la media.
Quiere decir que, dada una determinada situación para determinar las distintas probabilidades que adopta la
variable de acuerdo con el intervalo analizado, solo será necesario estudiar la distribución normal correspondiente a
ese caso; para ello, habría que operar con las correspondientes integrales, pero lo tedioso del proceso hace que se
simplifique todo el cálculo mediante:
1- la estandarización
2- el uso de tablas
Entonces, si los extremos del intervalo no coinciden exactamente con 1, 2 o 3 desviaciones estándar, ¿cómo
calculamos las probabilidades?
Dijimos que la situación se salva estandarizando nuestro problema a una distribución normal con µ=0 y σ=1. Entre la
familia de las distribuciones normales, las que tienen por media 0 y por desviación típica 1 son, sin duda, las más
importantes de todas.
Esta distribución aparece totalmente tabulada y, como veremos más adelante, permitirá el cálculo de cualquier tipo
de probabilidad asociada a un área bajo la curva normal. Entonces:
Tablas: Aclaraciones:
En el eje vertical van los valores de probabilidad de la variable aleatoria. En estos gráficos, se omitieron las escalas,
pero deben respetarse las escalas en el eje vertical, porque es lo que le da la forma a la distribución. Además,
queríamos mostrar solo la transformación que se da en el eje horizontal. Pues no interesa en este momento saber
cómo llevar un problema cualquiera a un problema estandarizado o tipificado para poder hacerlo general y así usar
una tabla que nos de las probabilidades de los intervalos que buscamos (área bajo la curva) sin tener que realizar
cálculos tediosos mediante integrales.
Cada tipo de tabla que se explica a continuación tiene la tabla para que la utilices cuando la necesites para practicar
y para que, también, la puedas descargar.
Recuerda ver qué tabla estás usando. Mi consejo es que aprendas a manejarlas a todas. Para distinguirlas, tienes que
fijarte en el pequeño gráfico que hay en la primera hoja de la tabla, en la parte superior.
Recuerda que solo tienes que saber manejar bien una tabla, aquí te mostramos algunas de las opciones de tablas
más utilizadas.
Observa que todas las tablas tienen, al comienzo, en la parte superior, un gráfico que muestra el tipo de tabla de la
que se trata y qué probabilidades muestra. Las figuras que muestran las tablas acumuladas en la parte superior son
las siguientes:
Este gráfico tiene como fin identificar, por medio de un pequeño dibujo que está en la parte superior de la primera
página de la tabla (muchas veces junto a su fórmula), la tabla de distribución normal acumulada. A veces vienen en
dos partes, la parte 1 muestra los valores para z negativos y cero, como la que se presenta aquí.
Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera
página de la tabla (muchas veces junto a su fórmula), la tabla de distribución normal acumulada. A veces, vienen en
dos partes. La parte 2 muestran los valores para z positivos y el cero.
Como la distribución normal es simétrica, muchas veces la tabla de la distribución normal estándar viene por la
mitad, es decir, solo desde z=0 hasta, aproximadamente, z=3,5 (según el autor).
Esto es porque los valores se repiten por ser simétrica con respecto al eje por donde pasa la media, mediana y moda.
Por lo tanto, a la izquierda y a la derecha, las áreas son iguales y se repiten.
Por esto mismo, ¡hay que tener cuidado! Esta tabla también acumula desde la izquierda. El primer valor de
probabilidad para z=0 es 0,5. Por lo tanto, sus probabilidades correspondientes van desde 0,5 hasta 1.
3) Tablas cuya área bajo la curva está dada por la franja que delimita z=0 y un z positivo
Además de la tabla acumulada de la normal, te mostraremos el manejo de otra tabla muy utilizada. Es la que está en
el texto básico. Esta tabla entrega probabilidades del área comprendida entre la media, a cualquier valor z positivo.
Esta tabla tiene otro manejo. La figura que muestra la tabla en la parte superior es la siguiente:
Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera
página, la tabla de distribución normal estándar. La parte sombreada indica las probabilidades que entrega la tabla.
Hasta aquí hemos estudiado ejemplos de cómo calcular probabilidades para determinados valores de z.
Muchas veces nos encontramos con una probabilidad y se necesita hacer lo inverso; es decir, necesitamos calcular z.
Supongamos que necesitamos calcular un valor de z mínimo de manera tal que la probabilidad de obtener un valor
de z mayor que el calculado sea de 0,10.
En este gráfico, se ve la situación planteada en el llamado problema inverso de cálculo en una distribución normal.
Dada el área y la probabilidad, encontrar el valor de z que limita dicha área.
Para poder resolver este problema, también se usa la tabla de la distribución normal, pero de manera distinta.
Si observamos la figura, el área a la que se refiere el ejemplo está ubicada en la cola derecha de la distribución
normal.
Pero la tabla que venimos utilizando nos da el área que está a la izquierda del valor de z buscado.
No es complicado darse cuenta de que el área que está a la izquierda es la probabilidad de 0,90.
Vamos ahora a recorrer el cuerpo de la tabla, donde están las probabilidades y buscamos la probabilidad acumulada
más cercana a 0,9000. Observa en la porción de la tabla de la normal acumulada que se muestra más abajo, en la
tabla 5, que la flecha verde indica cómo se recorre la tabla: de izquierda a derecha, fila por fila. Es importante
comprenderla bien y ver hacia donde aumentan las probabilidades, es lógico que aumenten cuando aumenta z.
Tomamos el más cercano que es 0,8997 y nos fijamos el valor de z correspondiente: z=1,28.
Observemos la porción de tabla en la que se encuentran las probabilidades más cercanas a 0,9000.
Esta es la porción de la tabla de probabilidad acumulada que venimos utilizando en la que se encuentra el valor de
probabilidad más cercano a 0,9000. El objetivo es encontrar el valor de z correspondiente.
Entonces, podemos concluir que el área a la izquierda de 1,28 es, aproximadamente igual a 0,9 o, lo que es lo mismo,
el valor z mínimo buscado, que deja un área o una probabilidad de 0,10 a la derecha es 1,28.
Otra forma de expresarlo es que 0,10 es la probabilidad aproximada de que z sea mayor que 1,28.
Aclaraciones importantes:
El valor de z es aproximado. En realidad, para ser más precisos, habría que hacer una interpolación entre los valores
de las probabilidades y los valores de z correspondientes. Así, posiblemente, el valor de z sería un poco mayor a 1,28
en algunos pocos centésimos. A efectos prácticos, se toma la probabilidad más cercana a la solicitada, como
acabamos de hacer.
Si las dos probabilidades más cercanas están a la misma distancia de la buscada, se suele agregar un tercer decimal
que se obtiene de sumar 0,005 al z encontrado. Por ejemplo: si la probabilidad a buscar es 0,9299, vemos que en la
tabla las probabilidades más cercanas son 0,9292 y 0,9306, que están a la misma distancia de 0,9299. Entonces, se
podría decir que el z correspondiente es z= 1,475. Es lo mismo que hacer un promedio entre los dos z
correspondientes a las dos probabilidades que están a la misma distancia que la buscada.
Es importante hacer un bosquejo del problema para poder analizarlo mejor y descubrir qué es lo que tenemos que
calcular.
Para lo mismo que nos sirve el directo. Son muchas las situaciones en las que podemos encontrarnos en la necesidad
de aplicarlo.
En internet tienes muchas herramientas con las que puedes controlar tus ejercicios o ver cómo varían las curvas
según la desviación estándar o la media. Es muy interesante poder interactuar con estos programas.
Además, puedes buscar las áreas bajo la curva con el Microsoft Excel, en la sección de funciones. Hasta puedes llegar
a generar una tabla tú mismo.
Cuando en un experimento binomial el número de ensayos n es tan grande que no está en la tabla de la distribución
binomial o se hace dificultoso realizar los cálculos, dicha distribución puede ser resuelta, por aproximación, con la
distribución normal. Algunos autores mencionan la condición de que la probabilidad de éxito debe ser cercana a 0,5,
pero no es excluyente.
En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la
lectura 2.
En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la
lectura 2.
n: número de ensayos
p: probabilidad de éxito
n.p ≥ 5 y n.q ≥ 5
μ=n.p
La desviación estándar de la distribución normal será la desviación estándar de la binomial:
σ=√(n.p.q)
Recuerda que:
en una distribución de probabilidad continua, las probabilidades se calculan como el área bajo la curva de la función
de densidad correspondiente.
También es cierto que en una distribución de probabilidad continua la probabilidad de la variable aleatoria puntual
es cero.
Entonces, para aproximar una distribución binomial, que es de variable discreta, a la distribución normal, hay que
tener en cuenta el factor de corrección por continuidad, que es ± 0,5. Este se suma o se resta a la variable aleatoria
según el caso.
Lo vamos a explicar de la siguiente forma: cuando se nos pide la probabilidad de 15 éxitos exactamente, el área bajo
la curva a integrar (o buscar en la tabla) comprende el intervalo 14,5 a 15,5 para disminuir el error de aproximación.
Recordemos que la binomial es una distribución de variable discreta y perfectamente puede quererse calcular la
probabilidad de una variable aleatoria discreta cualquiera.
Entonces P(x=15) de una distribución binomial con variable discreta, se aproxima mediante el cálculo de
P(14,5≤x≤15,5) a una distribución normal con una variable aleatoria continua.
También podemos aproximar la distribución de Poisson a la Normal cuando λ ≥ 10. Aclaramos que la distribución
sigue siendo de Poisson, una distribución de variable aleatoria discreta con n finito, como en la binomial. Pero, si λ es
lo suficientemente grande, la gráfica se va aproximando a una curva normal. Además, la aproximación se hace por
practicidad, ya que los errores por la aproximación son muy pequeños.
Ya dijimos la condición λ≥10. Si la vamos a tratar como una normal, necesitamos la media y la desviación estándar,
que son las siguientes:
μ=λ
σ=√λ
Una vez calculados estos parámetros, se procede a la estandarización de la variable aleatoria y a calcular la
probabilidad solicitada. Por ejemplo, una Poisson (16) es aproximadamente una Normal (16, 4).
Por supuesto que, con la planilla Excel u otra aplicación en línea, podemos calcular las probabilidades de los modelos
estudiados y eso sería lo más exacto, pero muchas veces tendremos que realizar los cálculos solo con una
calculadora y manualmente, por lo que no está de más saber cómo son los procedimientos de aproximación.