Quimiometria 2020

Distribución de Probabilidad (variables discretas)
Las distribuciones de probabilidad se asemejan a las distribuciones de frecuencia

relativas. La variable aleatoria de una distribución de probabilidad corresponde a la
variable respuesta de una distribución de frecuencias.
Variables Aleatorias
Variable que toma valor numérico único para cada uno de los resultados en el espacio
muestral de un experimento. Una variable aleatoria se utiliza para indicar el resultado de
un experimento probabilístico. Puede tomar cualquier valor numérico que pertenezca al
conjunto de todos los resultados posibles del experimento. Cada evento de un
experimento probabilístico también debe ser definido de manera que le sea asignado solo
un valor de variable aleatoria y todo evento debe tener asignado un valor. La variable
aleatoria discreta es una cuenta de algo (producto de un conteo). Ejemplo1: V.A.: Nº de
caras que caen al lanzar 5 monedas, puede formar valores enteros entre 0 y 5. Ejemplo 2:
V.A.: Nº de total de puntos que se obtienen al lanzar 2 dados.
Distribución de Probabilidad de una variable aleatoria discreta
Distribución de probabilidad: distribución de las probabilidades asociadas a cada uno de

los valores de una variable aleatoria. La distribución de probabilidad es una población
teórica; se utiliza para representar poblaciones empíricas (verdaderas). Algunas veces
conviene definir una regla que permita expresar la probabilidad de un evento en términos
del valor de la variable aleatoria. Dicha expresión se escribe como una formula y se llama
Función de Probabilidad.
Función de Probabilidad
Regla que asigna probabilidad a los valores de la variable aleatoria. Toda función de
probabilidad deber tener las 2 propiedades básicas de la probabilidad:
1. La probabilidad asignada a cada valor de la variable aleatoria debe estar entre 0 y

1, inclusive: 0 ≤ P ( x)≤1
2. La suma de las probabilidades asignadas a todos los valores de la variable
aleatoria debe ser igual a 1: ∑ P ( x )=1 ∀ x
La función de probabilidad asigna el valor cero a todos aquellos valores de x sean
diferente de los especificados por la función.
Los valores de la variable aleatoria se marcan en el eje horizontal, la probabilidad

asociada a cada valor de la variable aleatoria se marca en ele vertical. Se representa con
un histograma de líneas ya que la variable solo puede tomar valores discretos. Las
longitudes de las líneas representa el valor de la probabilidad. También es común el uso
de histogramas regulares (el ancho de la banda es 1 por lo que el área de la barra es
igual al valor de probabilidad).
Media y varianza de una distribución de probabilidad discreta
∑ fx = x f
La media de una distribución de frecuencia es: x́=
n
∑ ( n)
Sabiendo que la probabilidad de un evento es la fr esperada de su ocurrencia, si P( x )
f
reemplaza puede hallarse la media de una distribución de probabilidad teórica:
n
E ( x )=∑ [ xP(x ) ] valor esperado o esperanza.
x́ y s: estadísticos muéstrales
μ y σ : parámetros poblacionales (son constantes, valores desconocidos).
La media de x es la media del total de la población de resultados experimentales. El

símbolo para la media de x (en una distribución de probabilidades) es μ:
μ=∑ [ x . P (x) ]
La varianza de distribuciones de probabilidades discretas se define de manera semejante

a la varianza de datos muéstrales
σ 2=∑ [ ( x−μ )2 . P(x ) ]

2
σ 2=∑ [ x 2 . P( x) ] −{[ x . P( x) ] }
σ 2=∑ [ x 2 . P( x) ] −μ 2
La desviación estándar es la raíz cuadrada de la varianza:
σ =√ σ 2
Distribuciones de probabilidades normales
Aquellas distribuciones de probabilidad cuyo dominio es el conjunto de todos los números

reales se llama Normal, de Campana o de Gauss. Muchas variables tienen una
distribución aproximadamente normal. Sus histogramas son aproximadamente simétricos
y abultados en el centro. Las distribuciones normales están asociadas a variables
aleatorias continuas. Existen fórmulas que proporcionan información sobre la distribución
normal. Dos funciones describen y definen esta distribución. En ambas se utiliza la
variable aleatoria como variable independiente.
2
−1 x−μ
La formula y=f ( x )=
1
e
[ ( ) ] para toda x real; produce una ordenada ( y ¿
2 σ
σ √2 π
correspondiente a cada punto de lagrafica de distribución normal para cada abscisa ( x ).
b
La formula P ( a ≤ x ≤b )=∫ f ( x ) dx produce la probabilidad asociada a x cuando este valor
a
se encuentra en el intervalo entre los valores a y b.
La variable aleatoria x es continua. Al considerar variables continuas se discutirá la

probabilidad de que x tome un valor entre 2 extremos del intervalo y se representara la
probabilidad como área bajo la gráfica de la distribución.
b
Puesto que P ( a ≤ x ≤b ) esta dada ∫ f ( x ) dx la medida de esta probabilidad es también la
a
medida de la probabilidad de que una variable aleatoria continúa tiene un valor dentro de
un intervalo determinado.
Distribución normal estándar
La clave para trabajar con la distribución normal es el valor z . Las medidas de

probabilidad asociada a la variable aleatoria x están determinadas por su posición relativa
con respecto a la media y la desviación estándar de la distribución. La regla empírica dice
que aproximadamente el 68% de los datos distan de la media cuando mucho 1desviacion
estándar. El valor de la media y el tamaño de tal desviación no cambian este hecho.
x−μ
z= ¿
σ
El valor z es considerado como variable estandarizada ya que sus unidades son

desviaciones estándar. La distribución de probabilidad normal asociada a este valor z
recibe el nombre de Distribución Normal Estándar. Otras probabilidades pueden
encontrarse por adición, sustracción, etc. Con base en el concepto de simetría de que el
área total bajo la curva es 1. El área bajo la curva es también la medida de la probabilidad
asociada a un intervalo. Por ejemplo: P ( 0< z <1.52 )=0.4357 . Puesto que el área bajo la
curva representa la medida de probabilidad, el área total bajo la curva es exactamente 1.
Esta distribución es simétrica con respecto a la recta que pasa por z=0
Las áreas bajo la curva representan eventos mutuamente excluyentes. Por eso se uede
trabajar matemáticamente con ellas.
La simetría de la distribución normal es un factor clave en la determinación de las

probabilidades asociadas a valores por debajo (izquierda) de la media. El área entre la
media y z=−aes exactamente la misma que entre la media z=+ a
Aplicaciones de las distribuciones normales
Cuando se trabaja con una distribución normal, es necesario conocer su media μ y sus
desviación estándar σ . Una vez que se saben estos valores cualquier valor de la variable
aleatoria x puede ser convertido fácilmente en el valor z estándar:
x−μ
z=
σ
Notación para z
Cuando se trabaja con la notación z estándar, frecuencia resulta útil y necesaria

identificarlo con un área bajo la curva normal. Un procedimiento común es utilizar el área
bajo la curva derecha de z . Esta área se escribirá entre paréntesis después de z . Ejemplo:
z (0.05) es el valor de z tal que exactamente 0.05 del área bajo la curva está a su
derecha.
Si el valor esta exactamente a la mitad entre las cifras de la tabla se redondea al valor de
z mas grande.
Variabilidad muestral
Con los datos muéstrales pueden obtenerse diferentes medidas descriptivas ( x , s , etc).
Sin embargo no se tiene interés en la muestra en si pues los elementos utilizados en la
prueba (experimento) fueron destruidos, de manera que ya no pueden utilizarse. Lo
importante es obtener información sobre la población total y ciertamente no se puede
probar cada elemento (ninguno quedaría para ser utilizado). En consecuencia, de alguna
manera debe deducirse información o hacer inferencias sobre la población tomando como
base los resultados observados en la muestra. Es necesario investigar la variabilidad de
los estadísticos resultantes del muestreo repetido. Por lo tanto es necesario hallar:
 Medidas de tendencia central para estadísticos muéstrales.

 Medidas de variabilidad para estadísticos muéstrales.
 Distribución de dichas estadísticos.
Una vez recopilado esta información podemos calcular parámetros poblacionales.
Distribuciones muéstrales
Para hacer inferencias acerca de una población es necesario examinar los resultados
muéstrales. Como está distribuido un estadístico muestral cuando se ha muestreado
repetitivamente
Distribución de muestreo de una estadística muestral

Distribución de valores de la estadística muestral obtenido a partir de todas las muestras
posibles de una población. Todas las muestras deben ser del mismo tamaño y la
estadística muestral puede ser cualquier estadístico descriptivo.
Muestra aleatoria: muestra que se obtiene de manera que cada uno de las muestras
posibles de un tamaño fijo tenga las mismas probabilidades de ser seleccionado.
Teorema central del límite: informa acerca de la distribución de muestreo de medias de

muestras de tamaño n. Existen 3 tipos de información de que se de desea conocer sobre
una distribución:
 Debe estar en el centro

 Que tanto varía
 Como está repartida.
Si se toman todas las muestras posibles cada uno de tamaño n de una población con
media μ y desviación estándar σ , la distribucion de muestreo de las medias muéstrales:
 Tendrá una media μ x́ igual a μ.

σ
 Tendrá una desviación estándar σ x́ igual a
√n
 Será de tipo normal cuando la población de la que proceden las muestras sea
normal o bien será aproximadamente normal para muestras de tamaño 30 o
mayores, cuando la distribución original no sea normal. La aproximación dela
distribución normal mejora conforme aumenta el tamaño de muestra
En resumen el Teorema cental limite establece que:
1. μ x́ =¿ μ.las media de las medias ( x́ ) es igual a la media de las x.

σ
2. σ x́ =¿ el error estándar de la media es igual a la desviación estándar de la
√n
población dividida entre la raíz cuadrada del tamaño de la muestra.
3. Las medias muéstrales están distribuidas de manera aproximadamente normal
( sin importar la forma de la población original.
N es el tamaño de cada muestra en la distribución normal

Quimiometria 2020

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Quimiometria 2020

Cargado por

Copyright:

Formatos disponibles

Distribución de Probabilidad (variables discretas)

Las distribuciones de probabilidad se asemejan a las distribuciones de frecuencia

Distribución de Probabilidad de una variable aleatoria discreta

Distribución de probabilidad: distribución de las probabilidades asociadas a cada uno de

1. La probabilidad asignada a cada valor de la variable aleatoria debe estar entre 0 y

Los valores de la variable aleatoria se marcan en el eje horizontal, la probabilidad

E ( x )=∑ [ xP(x ) ] valor esperado o esperanza.

μ y σ : parámetros poblacionales (son constantes, valores desconocidos).

La media de x es la media del total de la población de resultados experimentales. El

La varianza de distribuciones de probabilidades discretas se define de manera semejante

σ 2=∑ [ ( x−μ )2 . P(x ) ]

La desviación estándar es la raíz cuadrada de la varianza:

Distribuciones de probabilidades normales

Aquellas distribuciones de probabilidad cuyo dominio es el conjunto de todos los números

La variable aleatoria x es continua. Al considerar variables continuas se discutirá la

Distribución normal estándar

La clave para trabajar con la distribución normal es el valor z . Las medidas de

El valor z es considerado como variable estandarizada ya que sus unidades son

La simetría de la distribución normal es un factor clave en la determinación de las

Cuando se trabaja con la notación z estándar, frecuencia resulta útil y necesaria

 Medidas de tendencia central para estadísticos muéstrales.

Una vez recopilado esta información podemos calcular parámetros poblacionales.

Distribución de muestreo de una estadística muestral

Teorema central del límite: informa acerca de la distribución de muestreo de medias de

 Debe estar en el centro

 Tendrá una media μ x́ igual a μ.

En resumen el Teorema cental limite establece que:

1. μ x́ =¿ μ.las media de las medias ( x́ ) es igual a la media de las x.

N es el tamaño de cada muestra en la distribución normal

También podría gustarte