Está en la página 1de 5

Distribución de Probabilidad (variables discretas)

Las distribuciones de probabilidad se asemejan a las distribuciones de frecuencia


relativas. La variable aleatoria de una distribución de probabilidad corresponde a la
variable respuesta de una distribución de frecuencias.

Variables Aleatorias

Variable que toma valor numérico único para cada uno de los resultados en el espacio
muestral de un experimento. Una variable aleatoria se utiliza para indicar el resultado de
un experimento probabilístico. Puede tomar cualquier valor numérico que pertenezca al
conjunto de todos los resultados posibles del experimento. Cada evento de un
experimento probabilístico también debe ser definido de manera que le sea asignado solo
un valor de variable aleatoria y todo evento debe tener asignado un valor. La variable
aleatoria discreta es una cuenta de algo (producto de un conteo). Ejemplo1: V.A.: Nº de
caras que caen al lanzar 5 monedas, puede formar valores enteros entre 0 y 5. Ejemplo 2:
V.A.: Nº de total de puntos que se obtienen al lanzar 2 dados.

Distribución de Probabilidad de una variable aleatoria discreta

Distribución de probabilidad: distribución de las probabilidades asociadas a cada uno de


los valores de una variable aleatoria. La distribución de probabilidad es una población
teórica; se utiliza para representar poblaciones empíricas (verdaderas). Algunas veces
conviene definir una regla que permita expresar la probabilidad de un evento en términos
del valor de la variable aleatoria. Dicha expresión se escribe como una formula y se llama
Función de Probabilidad.

Función de Probabilidad

Regla que asigna probabilidad a los valores de la variable aleatoria. Toda función de
probabilidad deber tener las 2 propiedades básicas de la probabilidad:

1. La probabilidad asignada a cada valor de la variable aleatoria debe estar entre 0 y


1, inclusive: 0 ≤ P ( x)≤1
2. La suma de las probabilidades asignadas a todos los valores de la variable
aleatoria debe ser igual a 1: ∑ P ( x )=1 ∀ x
La función de probabilidad asigna el valor cero a todos aquellos valores de x sean
diferente de los especificados por la función.

Los valores de la variable aleatoria se marcan en el eje horizontal, la probabilidad


asociada a cada valor de la variable aleatoria se marca en ele vertical. Se representa con
un histograma de líneas ya que la variable solo puede tomar valores discretos. Las
longitudes de las líneas representa el valor de la probabilidad. También es común el uso
de histogramas regulares (el ancho de la banda es 1 por lo que el área de la barra es
igual al valor de probabilidad).
Media y varianza de una distribución de probabilidad discreta

∑ fx = x f
La media de una distribución de frecuencia es: x́=
n
∑ ( n)
Sabiendo que la probabilidad de un evento es la fr esperada de su ocurrencia, si P( x )
f
reemplaza puede hallarse la media de una distribución de probabilidad teórica:
n

E ( x )=∑ [ xP(x ) ] valor esperado o esperanza.

x́ y s: estadísticos muéstrales

μ y σ : parámetros poblacionales (son constantes, valores desconocidos).

La media de x es la media del total de la población de resultados experimentales. El


símbolo para la media de x (en una distribución de probabilidades) es μ:

μ=∑ [ x . P (x) ]

La varianza de distribuciones de probabilidades discretas se define de manera semejante


a la varianza de datos muéstrales

σ 2=∑ [ ( x−μ )2 . P(x ) ]


2
σ 2=∑ [ x 2 . P( x) ] −{[ x . P( x) ] }

σ 2=∑ [ x 2 . P( x) ] −μ 2

La desviación estándar es la raíz cuadrada de la varianza:

σ =√ σ 2

Distribuciones de probabilidades normales

Aquellas distribuciones de probabilidad cuyo dominio es el conjunto de todos los números


reales se llama Normal, de Campana o de Gauss. Muchas variables tienen una
distribución aproximadamente normal. Sus histogramas son aproximadamente simétricos
y abultados en el centro. Las distribuciones normales están asociadas a variables
aleatorias continuas. Existen fórmulas que proporcionan información sobre la distribución
normal. Dos funciones describen y definen esta distribución. En ambas se utiliza la
variable aleatoria como variable independiente.
2
−1 x−μ

La formula y=f ( x )=
1
e
[ ( ) ] para toda x real; produce una ordenada ( y ¿
2 σ

σ √2 π
correspondiente a cada punto de lagrafica de distribución normal para cada abscisa ( x ).
b
La formula P ( a ≤ x ≤b )=∫ f ( x ) dx produce la probabilidad asociada a x cuando este valor
a
se encuentra en el intervalo entre los valores a y b.

La variable aleatoria x es continua. Al considerar variables continuas se discutirá la


probabilidad de que x tome un valor entre 2 extremos del intervalo y se representara la
probabilidad como área bajo la gráfica de la distribución.
b
Puesto que P ( a ≤ x ≤b ) esta dada ∫ f ( x ) dx la medida de esta probabilidad es también la
a
medida de la probabilidad de que una variable aleatoria continúa tiene un valor dentro de
un intervalo determinado.

Distribución normal estándar

La clave para trabajar con la distribución normal es el valor z . Las medidas de


probabilidad asociada a la variable aleatoria x están determinadas por su posición relativa
con respecto a la media y la desviación estándar de la distribución. La regla empírica dice
que aproximadamente el 68% de los datos distan de la media cuando mucho 1desviacion
estándar. El valor de la media y el tamaño de tal desviación no cambian este hecho.

x−μ
z= ¿
σ

El valor z es considerado como variable estandarizada ya que sus unidades son


desviaciones estándar. La distribución de probabilidad normal asociada a este valor z
recibe el nombre de Distribución Normal Estándar. Otras probabilidades pueden
encontrarse por adición, sustracción, etc. Con base en el concepto de simetría de que el
área total bajo la curva es 1. El área bajo la curva es también la medida de la probabilidad
asociada a un intervalo. Por ejemplo: P ( 0< z <1.52 )=0.4357 . Puesto que el área bajo la
curva representa la medida de probabilidad, el área total bajo la curva es exactamente 1.
Esta distribución es simétrica con respecto a la recta que pasa por z=0

Las áreas bajo la curva representan eventos mutuamente excluyentes. Por eso se uede
trabajar matemáticamente con ellas.

La simetría de la distribución normal es un factor clave en la determinación de las


probabilidades asociadas a valores por debajo (izquierda) de la media. El área entre la
media y z=−aes exactamente la misma que entre la media z=+ a
Aplicaciones de las distribuciones normales

Cuando se trabaja con una distribución normal, es necesario conocer su media μ y sus
desviación estándar σ . Una vez que se saben estos valores cualquier valor de la variable
aleatoria x puede ser convertido fácilmente en el valor z estándar:

x−μ
z=
σ

Notación para z

Cuando se trabaja con la notación z estándar, frecuencia resulta útil y necesaria


identificarlo con un área bajo la curva normal. Un procedimiento común es utilizar el área
bajo la curva derecha de z . Esta área se escribirá entre paréntesis después de z . Ejemplo:
z (0.05) es el valor de z tal que exactamente 0.05 del área bajo la curva está a su
derecha.

Si el valor esta exactamente a la mitad entre las cifras de la tabla se redondea al valor de
z mas grande.

Variabilidad muestral

Con los datos muéstrales pueden obtenerse diferentes medidas descriptivas ( x , s , etc).
Sin embargo no se tiene interés en la muestra en si pues los elementos utilizados en la
prueba (experimento) fueron destruidos, de manera que ya no pueden utilizarse. Lo
importante es obtener información sobre la población total y ciertamente no se puede
probar cada elemento (ninguno quedaría para ser utilizado). En consecuencia, de alguna
manera debe deducirse información o hacer inferencias sobre la población tomando como
base los resultados observados en la muestra. Es necesario investigar la variabilidad de
los estadísticos resultantes del muestreo repetido. Por lo tanto es necesario hallar:

 Medidas de tendencia central para estadísticos muéstrales.


 Medidas de variabilidad para estadísticos muéstrales.
 Distribución de dichas estadísticos.

Una vez recopilado esta información podemos calcular parámetros poblacionales.

Distribuciones muéstrales

Para hacer inferencias acerca de una población es necesario examinar los resultados
muéstrales. Como está distribuido un estadístico muestral cuando se ha muestreado
repetitivamente

Distribución de muestreo de una estadística muestral


Distribución de valores de la estadística muestral obtenido a partir de todas las muestras
posibles de una población. Todas las muestras deben ser del mismo tamaño y la
estadística muestral puede ser cualquier estadístico descriptivo.

Muestra aleatoria: muestra que se obtiene de manera que cada uno de las muestras
posibles de un tamaño fijo tenga las mismas probabilidades de ser seleccionado.

Teorema central del límite: informa acerca de la distribución de muestreo de medias de


muestras de tamaño n. Existen 3 tipos de información de que se de desea conocer sobre
una distribución:

 Debe estar en el centro


 Que tanto varía
 Como está repartida.

Si se toman todas las muestras posibles cada uno de tamaño n de una población con
media μ y desviación estándar σ , la distribucion de muestreo de las medias muéstrales:

 Tendrá una media μ x́ igual a μ.


σ
 Tendrá una desviación estándar σ x́ igual a
√n
 Será de tipo normal cuando la población de la que proceden las muestras sea
normal o bien será aproximadamente normal para muestras de tamaño 30 o
mayores, cuando la distribución original no sea normal. La aproximación dela
distribución normal mejora conforme aumenta el tamaño de muestra

En resumen el Teorema cental limite establece que:

1. μ x́ =¿ μ.las media de las medias ( x́ ) es igual a la media de las x.


σ
2. σ x́ =¿ el error estándar de la media es igual a la desviación estándar de la
√n
población dividida entre la raíz cuadrada del tamaño de la muestra.
3. Las medias muéstrales están distribuidas de manera aproximadamente normal
( sin importar la forma de la población original.

N es el tamaño de cada muestra en la distribución normal

También podría gustarte