Está en la página 1de 16

ESTADISTICA

Modulo 3

Distribuciones de probabilidad-Variable aleatoria

 Variable aleatoria

“una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de
la variable aleatoria depende del resultado del experimento”

 Variables aleatorias discretas y continuas

Discreta: Es la que asume un número finito de valores o una serie infinita de valores, como, por ejemplo, el de los
números naturales.

Ejemplos de variables aleatorias discretas. Se describe el experimento y qué variable aleatoria nos interesa. Luego,
en la tercera columna se muestran los posibles resultados de ese experimento, que son siempre valores numéricos.

Valores posibles para la


Experimento Variable aleatoria x
variable aleatoria x
Invitar 100 personas para un Número de personas que 0, 1, 2, 3, 4,..., 100
evento asistirán al evento
Se realiza un control de calidad
en una fábrica de autopartes y se Número de piezas que tienen 0, 1, 2, 3, 4, …, 20
toma una muestra de 20 piezas algún defecto
Calificar la atención de un Calificación del profesional 0: Malo
profesional en un centro de salud. 1: Regular
2: Bueno
3: Muy bueno
4: Excelente
Responder los llamados en un Número de llamadas 1, 2, 3,…
Call Center

Variables aleatorias continuas: pueden adoptar cualquier valor numérico dentro de un intervalo de números reales.
Cuando el experimento requiere resultados experimentales que están dentro de una escala de medición, como el
tiempo, peso, distancia, entre otras magnitudes, en general, las variables aleatorias continuas están unidas al
conjunto de números reales. Entre dos números reales hay infinitos valores reales.

Ejemplo: Se describe el experimento y qué variable aleatoria nos interesa. Luego, en la tercera columna, se muestran
los posibles resultados de ese experimento, que son siempre valores numéricos.

Valores posibles para la


Experimento Variable aleatoria x
variable aleatoria x
Medir las llamadas
telefónicas a un comercio Tiempo en minutos entre dos x≥0
llamadas consecutivas
Construir una casa Porcentaje del proyecto terminado x≥0
en cuatro meses

 Distribuciones de probabilidad discretas

Diferencias entre distribuciones de frecuencias y distribución de probabilidad:

Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un
experimento que se presentaron realmente cuando se efectuó este, mientras que una distribución de probabilidad
es un listado de las probabilidades de todos los posibles resultados que podrían obtenerse si el experimento se
llevara a cabo

Las distribuciones de probabilidad pueden basarse, además, en consideraciones teóricas, como, por ejemplo, el
lanzamiento de una moneda.

También pueden surgir de estimaciones subjetivas, de la experiencia, como, por ejemplo, en las compañías de
seguros pueden estimar los índices de mortalidad para asignar la probabilidad de muerte entre los diferentes grupos
etarios.

Inclusive, en el caso de las distribuciones de frecuencias podemos pensar una distribución de probabilidad como una
distribución de frecuencias teórica, pues nos muestra cómo se espera que varíen los resultados.

- Funciones de probabilidad

En el caso de una variable aleatoria discreta x, la forma que adopta la distribución de probabilidades está definida
por una función de probabilidad f(x), cuyo valor es cada una de las probabilidades de la variable aleatoria.

- Condiciones para que exista una función de probabilidad

Al elaborar una función de probabilidad para una variable aleatoria discreta, deben satisfacerse las dos condiciones
siguientes:

- Fórmulas para las funciones de probabilidad

Sabemos que las funciones pueden estar definidas por tablas y gráficos, entre otras formas. Pero la forma más
utilizada en matemáticas es mediante una fórmula matemática que, para cada valor de x, se obtiene un valor de f(x).

Análogamente, para describir las funciones de probabilidad, se suele usar una fórmula de la que se obtiene el valor
de la función de probabilidad f(x) para cada valor x.

El ejemplo más sencillo es el de función de probabilidad uniforme discreta, donde:

El típico caso de aplicación de esa función es lanzar un dado. Si definimos la variable aleatoria x, número de puntos
en la cara del dado en la parte superior, observemos que el valor de probabilidad siempre será 1/6.

Las funciones de probabilidad discretas más empleadas suelen especificarse mediante fórmulas.

Tres de los modelos de este tipo de variables son las distribuciones binomial, hipergeométrica y de Poisson, que
estudiaremos en la próxima lectura. Cada una de estas distribuciones tiene su fórmula de función de probabilidades,
que permiten calcular las probabilidades para cada variable aleatoria.

También puede trabajarse mediante tablas de probabilidades para encontrar el valor de probabilidad buscado y no
tener que aplicar la fórmula para cada variable aleatoria discreta que se busque.

Los modelos mencionados, repetimos, se utilizan para variables aleatorias discretas y a través de ellos podremos
calcular las probabilidades para cada variable aleatoria discreta que necesitemos.

Aclaración: en términos prácticos, P(x)=f(x), es decir que se utilizan indistintamente para indicar probabilidad de
variable aleatoria y función de probabilidad de variable aleatoria.

 Valor esperado

El valor esperado, o media, de una variable aleatoria es una medida de la posición central
El valor esperado es un promedio ponderado de los valores que toma la variable aleatoria. Esa ponderación se
realiza multiplicando cada variable aleatoria por su probabilidad.

Ex=μ=∑ x.f(x)

E(x): Esperanza o valor esperado de la variable aleatoria discreta x.

 Varianza

Además de una medida de posición, necesitamos para una mejor descripción de la distribución de la variable
aleatoria, una medida de dispersión, una medida que nos indique la dispersión de la variable aleatoria discreta.

Su fórmula es:

Var(x)=o2=∑(x-μ)2.f(x)

Nota: Recuerda que esta es la fórmula de la varianza, solo que como f(x) es la probabilidad de x, ya está dividida por
el número total de ensayos (observaciones). Es decir, f(x) son las probabilidades o las frecuencias relativas.

La varianza es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria con respecto a
la media. Esa ponderación está dada por las probabilidades.

la desviación (x - µ), mide cuán alejado del valor esperado μ o E(X), se encuentra un valor determinado de la variable
aleatoria.

Para calcular la varianza de una variable aleatoria, estas desviaciones se elevan al cuadrado y después se ponderan
con el correspondiente valor de la función de probabilidad.

A la suma de estas desviaciones al cuadrado, ponderadas, se la conoce como varianza.

Modelos especiales de distribuciones de probabilidad de variable discreta: binomial

 Distribución binomial

Un experimento binomial está relacionado con un experimento de pasos múltiples en el que es necesario identificar
todas las posibles maneras en que el experimento puede presentarse y la probabilidad de ocurrencia de cada una de
ellas. Estas posibles maneras pueden determinarse teóricamente o como resultado de un análisis subjetivo,
producto de la experiencia.
- Características de un experimento binomial

Resumamos sus características:

1- El experimento consiste en una serie de n ensayos idénticos.


2- En cada ensayo hay dos resultados posibles. A uno de estos resultados, se lo llama éxito y, al otro, se lo llama
fracaso o desacierto.
3- La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro. Por ende, la probabilidad de
fracaso, que se denota (1 - p), tampoco cambia de un ensayo a otro. La probabilidad del acierto se mantiene
constante (esto implica que la población es muy grande o infinita, o los ensayos se realizan sin reposición).
4- Los ensayos son independientes. Esto indica que el resultado de cada ensayo es independiente del resultado
de ensayos anteriores.

El estudio está centrado en determinar la probabilidad que en n ensayos se obtenga un número x de aciertos. Este
número de aciertos se constituye en los distintos valores que puede adoptar la variable, que, por ser producto de un
conteo, es del tipo discreta.

Si se presentan las propiedades 2), 3) y 4), se dice que los ensayos son generados por un proceso de Bernoulli. Si,
además, se presenta la propiedad 1), se trata de un experimento binomial.

En un experimento binomial, lo que interesa es el número de éxitos en n ensayos. Si x denota el número de éxitos en
n ensayos, es claro que x tomará los valores 0, 1, 2, 3, ..., n. Dado que el número de estos valores es finito, x es una
variable aleatoria discreta. A la distribución de probabilidad correspondiente a esta variable aleatoria se le llama
distribución de probabilidad binomial.

- Expresión general de la distribución binomial

En las aplicaciones de los experimentos binomiales, se emplea una fórmula matemática llamada función de
probabilidad binomial, que sirve para calcular la probabilidad de x éxitos en n ensayos. Empleando los conceptos de
probabilidad, se mostrará el desarrollo de la fórmula.

 Parámetros

Como en cualquier función, existen parámetros (números reales) y variables (en este caso la función binomial que
depende de la variable aleatoria).

En el caso de la función binomial, los parámetros son n y p. Estos son los parámetros que caracterizan a la función y
son constitutivos de la fórmula:

n: número de ensayos

p: probabilidad de éxito

por lo que se suele escribir: Bin (n,p) que significa distribución binomial de parámetros n y p.

¿Cuál es la probabilidad de que las cuatro veces salga cara suponiendo que la moneda está perfectamente
balanceada?

Datos:

n=4; p=0,5; q=0,5

x=4 (pues queremos cuatro aciertos. El acierto es que salga cara)

Aclaraciones
Recuerda que las combinaciones son conjuntos que pueden formarse con n elementos tomados de la x. Las
calculadoras científicas simples tienen esta función. Es la tecla nCr, por ejemplo, si deseas calcular cuántos grupos de
6 personas puedes formar tomadas de a 3, el cálculo es C6,3, por calculadora, 6 nCr 3 =20.

Otra opción es calcular las combinaciones mediante su desarrollo por factoriales:

- Conclusiones sobre los gráficos de la distribución binomial

Cuando p es pequeño, la distribución binomial está sesgada hacia la derecha (asimetría positiva). Es el caso del
ejemplo 2 (p=0,01) y el caso de la empresa de salud (p=0,15).

Cuando p = 0,5, la distribución binomial es simétrica. Es el caso del ejemplo 1 (p=0,5).

Cuando p es mayor que 0,5, la distribución está sesgada hacia la izquierda (asimetría negativa).

¿Qué sucedería cuando n aumenta y p permanece constante? La distribución tendría la misma forma, pero a medida
que aumenta n, las líneas verticales estarían cada vez más juntas y asumirían la forma de campana en las
distribuciones simétricas. Y, en el resto de los casos, se suavizarían los rectángulos y adoptarían forma curva con
sesgo a la izquierda o a la derecha, tal cual vimos en el módulo 1.

Uso de la tabla de probabilidades binomiales

Existen tablas para buscar estas probabilidades.

Ahora resolveremos los mismos problemas, pero usando las tablas de distribución de probabilidad binomial. Estas se
encuentran en el anexo de este módulo. Es conveniente que las imprimas para manejarlas con más facilidad y para
cuando vayas a rendir los exámenes. ¡No olvides llevarlas!

Para las distribuciones de probabilidad discreta, existen dos tipos de tablas:

Tabla de distribuciones puntuales

Tabla de distribuciones acumuladas

Puedes utilizar cualquiera de las dos tablas, todo depende de ti, de la que te resulte más práctica. Pero ten en cuenta
que hay una diferencia en su manejo. En el anexo se presentan para descargar las tablas puntuales y acumuladas. A
continuación, estudiarás cómo se utilizan.

- Tabla de distribuciones puntuales para la binomial

Estas tablas sirven para buscar una probabilidad puntual, por ejemplo, el caso en que la variable aleatoria toma un
solo valor. Por ejemplo, para x=7, si se busca x<7, tendrás que sumar todas las probabilidades que están por debajo
de 7 o utilizar la tabla acumulada, que también te mostramos como se maneja.

 Esperanza y varianza de una distribución binomia

Tomando como punto de partida la definición de esperanza matemática o valor esperado de una variable aleatoria:

Ex=μ=n.p

Calculemos ahora la esperanza matemática para los ejemplos mencionados anteriormente.

Ejemplo 1: Datos: n=4; p=0,5; q=0,5

E(x)=4×0,5=2

Significa que el valor que se espera obtener en promedio, si repetimos el ensayo muchas veces, es de 2 caras.
Ejemplo 2: Datos: n=10; p=0,01 (Defectuosos)

E(x)=10×0,01=0,1

Significa que el valor que se espera obtener, en promedio, si repetimos el ensayo muchas veces es de 0,1 defectos.

- Varianza y desviación estándar de una distribución binomial

Deduciendo del mismo modo para la varianza, se obtiene:

Var(x)=n.p.q

Entonces la desviación estándar será:

Ejemplo:

Otras distribuciones de variables discretas: Poisson-Hipergeométrica. Aproximación

 Determinación del tamaño de la muestra para una estimación por intervalo de la media poblacional

Las condiciones que deben darse para que sea una distribución de Poisson

1- La probabilidad de ocurrencia de un evento es la misma para cualquier intervalo de la misma magnitud.


2- El número de ocurrencias/no ocurrencias en cualquier intervalo es independiente del número de
ocurrencias/no ocurrencias en cualquier otro intervalo.
3- La probabilidad de que el evento ocurra es proporcional a la longitud del intervalo.
4- La probabilidad de que uno o más eventos se presenten en un intervalo muy pequeño, es tan pequeña que
puede despreciarse.
5- En realidad, es una binomial para n que tiende a infinito y p a cero.

- Expresión matemática. Parámetros

Esta distribución tiene como parámetro un solo valor, el promedio de ocurrencia, al que denominaremos como
Lambda: λ

La expresión matemática (función de densidad) correspondiente a esta distribución es:


P(x): Es la probabilidad de que ocurra un evento x dentro de un intervalo (probabilidad de tener exactamente x
ocurrencias).

x: Número de éxitos/ocurrencias

Parámetros

λ: Promedio de ocurrencia o valor esperado en un intervalo

e: número irracional (e = 2,717281...)

Observa que el número de ocurrencias x, no tiene límite superior. Esta es una variable aleatoria discreta que toma
los valores de una sucesión infinita de números (x = 0, 1, 2,…).

En esta distribución debe cumplirse que:

Donde i varía, al menos teóricamente, entre cero e infinito. Decimos teóricamente, ya que, por ejemplo, si se
informa que en promedio en una pista de aterrizaje de aviones despegan por hora tres aviones de cabotaje; no
tendría sentido pretender determinar la probabilidad de que en una hora aterricen en dicho aeropuerto 90 aviones
de cabotaje.

- Valor esperado y varianza de la distribución de Poisson

En la distribución de Poisson, la media, que es igual al valor esperado, E(x) es igual a lo que se espera que ocurra, es
decir λ.

La varianza también es igual al promedio de ocurrencia λ. Por lo tanto, la desviación estándar es:

El parámetro es λ y el número e, que ya lo conocemos, lo podemos calcular por calculadora. Es irracional con
infinitas cifras decimales no periódicas. Por eso, tendremos que aproximarlo. Mi consejo es que hagas todos los
cálculos directamente sin poner valores parciales en las cuentas.

Entonces:

 Distribución hipergeométrica

Esta distribución viene a dar solución a los casos en los que no hay reposición de elementos en un experimento y por
lo tanto la probabilidad de ocurrencia no se mantiene constante. Cuando estudiemos las características de esta
distribución y la ejemplifiquemos, notaremos que la población no se considera infinita frente a la muestra. Es más,
población y muestra están cercanas en tamaño.

si de la población se extrae una muestra de 10 alumnos y el muestreo se realiza sin reposición, la probabilidad de
elegir un nuevo alumno, azarosamente, de la división y que haya aprobado el parcial de Estadística, ya no será P (A) =
15/40, pues esta probabilidad se ha visto modificada por el muestreo previo realizado.
Pero, aparentemente, el fenómeno presenta características similares a la de una binomial, en la que hay dos
opciones: éxito/fracaso.

La diferencia está en lo siguiente:

- Que la población es finita y el tamaño de la muestra es grande, significativo, respecto al tamaño poblacional
y, por lo tanto, modifica la probabilidad de elegir nuevamente a un alumno que aprobó el parcial.
- El muestreo se realiza sin reposición y, al ser significativo el tamaño de la muestra con respecto al tamaño de
la población, modifica la probabilidad de acierto.

Debemos recordar que, en la distribución binomial, la probabilidad de lo que consideramos acierto se mantiene
constante y esto solo se logra si el muestreo se realiza con reposición o la población es infinita o muy grande.

- Características de una distribución hipergeométrica

El proceso consta de n pruebas separadas, de entre un conjunto de N pruebas posibles.

En cada una de las pruebas se dan dos resultados posibles mutuamente excluyentes: éxito (E) o fracaso (F).

Los ensayos son dependientes.

Las probabilidades de obtener un éxito o un fracaso varían en las sucesivas pruebas, dependiendo de los resultados
anteriores.

La población es finita y el tamaño de la muestra es grande; para establecer un límite, se aplica la distribución
hipergeométrica si la muestra es mayor al 5 % de la población: n > 5% N

- Expresión matemática. Parámetros

Si denotamos con:

N: número de elementos de la población (finita)

k: número de éxitos en la población

n: número de ensayos (muestra)

x: variable aleatoria, éxitos que se pretende encontrar en la muestra

Entonces:

N-k: n.º de fracasos de la población

n-x: n.º de fracasos en la muestra o en los ensayos.

La probabilidad de que en una muestra aleatoria de n elementos, seleccionados sin reemplazo, se tengan x éxitos de
los k éxitos que hay en la población y n-x fracasos de los N-k fracasos de la población, se calcula con la siguiente
fórmula:

que proporciona la probabilidad de tener x éxitos en una muestra de tamaño n (utilizaremos la notación de número
combinatorios:
- Valor esperado (media) y varianza de la distribución hipergeométrica

 Tablas
- Existen tablas para calcular la distribución de una variable aleatoria en un experimento hipergeométrico,
pero no vamos a necesitarlas en este curso.
- Existen tablas para calcular la distribución de una variable aleatoria en un experimento hipergeométrico,
pero no vamos a necesitarlas en este curso.

La sumatoria de todas las probabilidades puntuales de cada variable aleatoria es igual a 1.

Para calcular la probabilidad de una o varias variables aleatorias puede recurrirse al complemento si es necesario.

- Usar calculadora científica para resolver las combinaciones.


 Resolución de la binomial por aproximación a la de Poisson

¿Cuándo aproximamos y por qué?

En muchas oportunidades, nos encontramos con distribuciones que responden al modelo binomial, con un p
(probabilidad de éxito) pequeño y un n (número de ensayos) grande. En estos casos, el cálculo de las probabilidades
de éxito se puede volver tedioso, especialmente, cuando n o p no se encuentra en la tabla. A los efectos de su
resolución, puede aplicarse la distribución de Poisson.

Condiciones

Para poder aproximar mediante la distribución de Poisson una distribución binomial, se deben cumplir las siguientes
condiciones:

Ser un experimento binomial

Con n ≥ 20 y p ≤ 0,05

Parámetros: λ=n.p pues es la media de la binomial.

DISTRIBUCION NORMAL

Una distribución de variable continua

La distribución de variable continua que responde a una gran cantidad de situaciones en donde la variable se mide
en un intervalo es la distribución normal también denominada Campana de Gauss, en honor a los trabajos
desarrollados por el matemático Carl Gauss (1777-1855).

 Función de densidad

Ya hemos dicho anteriormente que podemos imaginarnos algunas funciones curvilíneas como idealizaciones de un
polígono de frecuencias, asociado a un histograma de frecuencias.

Las distribuciones de probabilidad de una variable aleatoria continua pueden imaginarse así cuando se aumenta
indefinidamente el número de datos y se disminuye paulatinamente la amplitud de los intervalos de un polígono de
frecuencias relativas.

A estas funciones de probabilidad de variables continuas las llamaremos Funciones de Densidad.

Definición:

Una función F(x) se dice que es una función de densidad de una variable aleatoria continua X si se verifican:
1- La función F(x) es positiva o nula en todo el dominio de definición
2- El área limitada por la gráfica de la función y el eje de abscisas son iguales a la unidad.

Existen otras funciones de densidad, pero la más importante es la normal.

- Características de la distribución normal

Se muestra la forma de campana que adopta la distribución


normal. En el eje horizontal, van las variables aleatorias continuas (expresadas por intervalos) y, en el eje vertical, las
probabilidades que adoptan dichas variables.

Tiene forma acampanada.

Es simétrica respecto al eje vertical que pasa por la abscisa de mayor ordenada.

El valor de la abscisa de mayor ordenada coincide con la media y al ser simétrica respecto al eje vertical que pasa por
ese punto, coincide con la mediana y con la moda.

Nunca tocan el eje horizontal y teóricamente se extiende desde (-∞ ) a (+∞)

Curva de la distribución de probabilidad normal: Se muestra la forma de campana que adopta la distribución normal
para resaltar que la rige una función que se llama función de densidad.

La ecuación a la que responde esta función es la denominada función de densidad de la normal.

Notación-parámetros: Entonces podemos decir que la distribución normal necesita de la media y de la desviación
estándar para quedar definida: N(µ,σ) se lee distribución normal de media µ y desviación estándar σ.

- Más características de la distribución normal

Distribución normal. Área bajo la curva

Se muestra la forma de campana que adopta la distribución normal y se destaca el área por debajo de la curva, la
función de densidad. Esta área es igual a 1 y responde a la integral de la función de densidad F(X).
La superficie encerrada por la función de densidad y por el eje horizontal es igual a 1. Esto implica que dicha
superficie está definida mediante una integral, que es la integral de la función de densidad, entre los límites -∞ y
+∞. Entonces:

Distribución normal. Probabilidad de un intervalo de la variable continua: Se muestra el área correspondiente,


limitada por el intervalo real (a; b), situación que se presenta en la mayoría de los problemas de distribución normal.

En una variable aleatoria continua, no tiene sentido el estudio de la probabilidad en un valor aislado. Entonces, la
probabilidad de x=c (cuando c es un número real cualquiera) es cero.

P(x=c)=0

Pero sí tiene sentido la probabilidad de que la variable tome valores dentro de un intervalo. Si asociamos la
probabilidad de que la variable aleatoria tome un valor comprendido en un intervalo (a; b), con la integral definida
de la función de densidad entre x=a y x=b, nos queda:

No hace falta mostrar la fórmula si sustituimos a F(x) por su función de densidad, pero te imaginarás como queda…
No te preocupes porque, para facilitar estos cálculos, existe la tabla de la distribución de probabilidades de la
normal, que utilizaremos más adelante.

Distribución normal estándar: Esta es la distribución normal estándar o tipificada, que se caracteriza por tener una
media igual a cero y una desviación estándar igual a 1. La campana abarca algo más de tres desviaciones estándar a
la izquierda y tres a la derecha de la media.
En un primer paso, nuestro problema será averiguar cuán desviados están de la media los valores que queremos
averiguar para resolver nuestro problema. Luego, se calculan las probabilidades de esa área bajo la curva, limitada
por el intervalo que nos interesa.

El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que
el punto dista de la media.

Quiere decir que, dada una determinada situación para determinar las distintas probabilidades que adopta la
variable de acuerdo con el intervalo analizado, solo será necesario estudiar la distribución normal correspondiente a
ese caso; para ello, habría que operar con las correspondientes integrales, pero lo tedioso del proceso hace que se
simplifique todo el cálculo mediante:

1- la estandarización
2- el uso de tablas

¿Cómo calcular las probabilidades o porcentajes, en cualquier intervalo real?

Entonces, si los extremos del intervalo no coinciden exactamente con 1, 2 o 3 desviaciones estándar, ¿cómo
calculamos las probabilidades?

Dijimos que la situación se salva estandarizando nuestro problema a una distribución normal con µ=0 y σ=1. Entre la
familia de las distribuciones normales, las que tienen por media 0 y por desviación típica 1 son, sin duda, las más
importantes de todas.

La notación que emplearemos para referirnos a esta normal será N(0,1).

Esta distribución aparece totalmente tabulada y, como veremos más adelante, permitirá el cálculo de cualquier tipo
de probabilidad asociada a un área bajo la curva normal. Entonces:

Primer paso: estandarización de la variable aleatoria.

Segundo paso: buscar en la tabla la variable estandarizada.

Tablas: Aclaraciones:

En el eje vertical van los valores de probabilidad de la variable aleatoria. En estos gráficos, se omitieron las escalas,
pero deben respetarse las escalas en el eje vertical, porque es lo que le da la forma a la distribución. Además,
queríamos mostrar solo la transformación que se da en el eje horizontal. Pues no interesa en este momento saber
cómo llevar un problema cualquiera a un problema estandarizado o tipificado para poder hacerlo general y así usar
una tabla que nos de las probabilidades de los intervalos que buscamos (área bajo la curva) sin tener que realizar
cálculos tediosos mediante integrales.

 Tablas: tipos y formas de utilizarlas

Cada tipo de tabla que se explica a continuación tiene la tabla para que la utilices cuando la necesites para practicar
y para que, también, la puedas descargar.

Recuerda ver qué tabla estás usando. Mi consejo es que aprendas a manejarlas a todas. Para distinguirlas, tienes que
fijarte en el pequeño gráfico que hay en la primera hoja de la tabla, en la parte superior.

Recuerda que solo tienes que saber manejar bien una tabla, aquí te mostramos algunas de las opciones de tablas
más utilizadas.

1) Tablas acumuladas con z negativo, cero y positivo.

Observa que todas las tablas tienen, al comienzo, en la parte superior, un gráfico que muestra el tipo de tabla de la
que se trata y qué probabilidades muestra. Las figuras que muestran las tablas acumuladas en la parte superior son
las siguientes:
Este gráfico tiene como fin identificar, por medio de un pequeño dibujo que está en la parte superior de la primera
página de la tabla (muchas veces junto a su fórmula), la tabla de distribución normal acumulada. A veces vienen en
dos partes, la parte 1 muestra los valores para z negativos y cero, como la que se presenta aquí.

Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera
página de la tabla (muchas veces junto a su fórmula), la tabla de distribución normal acumulada. A veces, vienen en
dos partes. La parte 2 muestran los valores para z positivos y el cero.

2) Tablas acumuladas con z positivo

Como la distribución normal es simétrica, muchas veces la tabla de la distribución normal estándar viene por la
mitad, es decir, solo desde z=0 hasta, aproximadamente, z=3,5 (según el autor).

Esto es porque los valores se repiten por ser simétrica con respecto al eje por donde pasa la media, mediana y moda.
Por lo tanto, a la izquierda y a la derecha, las áreas son iguales y se repiten.

Por esto mismo, ¡hay que tener cuidado! Esta tabla también acumula desde la izquierda. El primer valor de
probabilidad para z=0 es 0,5. Por lo tanto, sus probabilidades correspondientes van desde 0,5 hasta 1.

3) Tablas cuya área bajo la curva está dada por la franja que delimita z=0 y un z positivo

Además de la tabla acumulada de la normal, te mostraremos el manejo de otra tabla muy utilizada. Es la que está en
el texto básico. Esta tabla entrega probabilidades del área comprendida entre la media, a cualquier valor z positivo.
Esta tabla tiene otro manejo. La figura que muestra la tabla en la parte superior es la siguiente:

Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera
página, la tabla de distribución normal estándar. La parte sombreada indica las probabilidades que entrega la tabla.

Problema inverso de la distribución normal

Hasta aquí hemos estudiado ejemplos de cómo calcular probabilidades para determinados valores de z.
Muchas veces nos encontramos con una probabilidad y se necesita hacer lo inverso; es decir, necesitamos calcular z.

Supongamos que necesitamos calcular un valor de z mínimo de manera tal que la probabilidad de obtener un valor
de z mayor que el calculado sea de 0,10.

En este gráfico, se ve la situación planteada en el llamado problema inverso de cálculo en una distribución normal.
Dada el área y la probabilidad, encontrar el valor de z que limita dicha área.

Para poder resolver este problema, también se usa la tabla de la distribución normal, pero de manera distinta.

Primero es importante interpretar qué se está solicitando.

Si observamos la figura, el área a la que se refiere el ejemplo está ubicada en la cola derecha de la distribución
normal.

Pero la tabla que venimos utilizando nos da el área que está a la izquierda del valor de z buscado.

No es complicado darse cuenta de que el área que está a la izquierda es la probabilidad de 0,90.

Vamos ahora a recorrer el cuerpo de la tabla, donde están las probabilidades y buscamos la probabilidad acumulada
más cercana a 0,9000. Observa en la porción de la tabla de la normal acumulada que se muestra más abajo, en la
tabla 5, que la flecha verde indica cómo se recorre la tabla: de izquierda a derecha, fila por fila. Es importante
comprenderla bien y ver hacia donde aumentan las probabilidades, es lógico que aumenten cuando aumenta z.

Encontramos dos valores de probabilidad muy cercanos a 0,9000: el 0,8997 y el 0,9015.

Tomamos el más cercano que es 0,8997 y nos fijamos el valor de z correspondiente: z=1,28.

Observemos la porción de tabla en la que se encuentran las probabilidades más cercanas a 0,9000.

Esta es la porción de la tabla de probabilidad acumulada que venimos utilizando en la que se encuentra el valor de
probabilidad más cercano a 0,9000. El objetivo es encontrar el valor de z correspondiente.

Entonces, podemos concluir que el área a la izquierda de 1,28 es, aproximadamente igual a 0,9 o, lo que es lo mismo,
el valor z mínimo buscado, que deja un área o una probabilidad de 0,10 a la derecha es 1,28.

Otra forma de expresarlo es que 0,10 es la probabilidad aproximada de que z sea mayor que 1,28.

Aclaraciones importantes:
El valor de z es aproximado. En realidad, para ser más precisos, habría que hacer una interpolación entre los valores
de las probabilidades y los valores de z correspondientes. Así, posiblemente, el valor de z sería un poco mayor a 1,28
en algunos pocos centésimos. A efectos prácticos, se toma la probabilidad más cercana a la solicitada, como
acabamos de hacer.

Si las dos probabilidades más cercanas están a la misma distancia de la buscada, se suele agregar un tercer decimal
que se obtiene de sumar 0,005 al z encontrado. Por ejemplo: si la probabilidad a buscar es 0,9299, vemos que en la
tabla las probabilidades más cercanas son 0,9292 y 0,9306, que están a la misma distancia de 0,9299. Entonces, se
podría decir que el z correspondiente es z= 1,475. Es lo mismo que hacer un promedio entre los dos z
correspondientes a las dos probabilidades que están a la misma distancia que la buscada.

Es importante hacer un bosquejo del problema para poder analizarlo mejor y descubrir qué es lo que tenemos que
calcular.

¿Para qué nos sirve el problema inverso?

Para lo mismo que nos sirve el directo. Son muchas las situaciones en las que podemos encontrarnos en la necesidad
de aplicarlo.

- Herramientas en línea o software libres sobre la distribución normal

En internet tienes muchas herramientas con las que puedes controlar tus ejercicios o ver cómo varían las curvas
según la desviación estándar o la media. Es muy interesante poder interactuar con estos programas.

Además, puedes buscar las áreas bajo la curva con el Microsoft Excel, en la sección de funciones. Hasta puedes llegar
a generar una tabla tú mismo.

Aproximación de la binomial a la normal

Aproximación de una distribución binomial a una normal

Cuando en un experimento binomial el número de ensayos n es tan grande que no está en la tabla de la distribución
binomial o se hace dificultoso realizar los cálculos, dicha distribución puede ser resuelta, por aproximación, con la
distribución normal. Algunos autores mencionan la condición de que la probabilidad de éxito debe ser cercana a 0,5,
pero no es excluyente.

- Condiciones que deben darse para hacer la aproximación

En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la
lectura 2.

Recordemos los parámetros de la distribución binomial:

En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la
lectura 2.

Recordemos los parámetros de la distribución binomial:

n: número de ensayos

p: probabilidad de éxito

q=1-p: probabilidad de fracaso

Para resolverla por la normal, deben darse las siguientes condiciones:

n.p ≥ 5 y n.q ≥ 5

La media de la distribución normal será la media de la distribución binomial:

μ=n.p
La desviación estándar de la distribución normal será la desviación estándar de la binomial:

σ=√(n.p.q)

- Resolución de una distribución binomial por aproximación con la normal

Recuerda que:

en una distribución de probabilidad continua, las probabilidades se calculan como el área bajo la curva de la función
de densidad correspondiente.

También es cierto que en una distribución de probabilidad continua la probabilidad de la variable aleatoria puntual
es cero.

Entonces, para aproximar una distribución binomial, que es de variable discreta, a la distribución normal, hay que
tener en cuenta el factor de corrección por continuidad, que es ± 0,5. Este se suma o se resta a la variable aleatoria
según el caso.

Lo vamos a explicar de la siguiente forma: cuando se nos pide la probabilidad de 15 éxitos exactamente, el área bajo
la curva a integrar (o buscar en la tabla) comprende el intervalo 14,5 a 15,5 para disminuir el error de aproximación.
Recordemos que la binomial es una distribución de variable discreta y perfectamente puede quererse calcular la
probabilidad de una variable aleatoria discreta cualquiera.

Entonces P(x=15) de una distribución binomial con variable discreta, se aproxima mediante el cálculo de
P(14,5≤x≤15,5) a una distribución normal con una variable aleatoria continua.

Aproximación de Poisson a la normal

Aproximación de la distribución de Poisson a la normal

También podemos aproximar la distribución de Poisson a la Normal cuando λ ≥ 10. Aclaramos que la distribución
sigue siendo de Poisson, una distribución de variable aleatoria discreta con n finito, como en la binomial. Pero, si λ es
lo suficientemente grande, la gráfica se va aproximando a una curva normal. Además, la aproximación se hace por
practicidad, ya que los errores por la aproximación son muy pequeños.

Ya dijimos la condición λ≥10. Si la vamos a tratar como una normal, necesitamos la media y la desviación estándar,
que son las siguientes:

μ=λ

σ=√λ

Una vez calculados estos parámetros, se procede a la estandarización de la variable aleatoria y a calcular la
probabilidad solicitada. Por ejemplo, una Poisson (16) es aproximadamente una Normal (16, 4).

Por supuesto que, con la planilla Excel u otra aplicación en línea, podemos calcular las probabilidades de los modelos
estudiados y eso sería lo más exacto, pero muchas veces tendremos que realizar los cálculos solo con una
calculadora y manualmente, por lo que no está de más saber cómo son los procedimientos de aproximación.

También podría gustarte