Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones de Probabilidad
Distribuciones de Probabilidad
Distribuciones de Probabilidad
• Probabilidad: Con una muestra aleatoria o
experimento aleatorio, la probabilidad que
una observación tome un valor en particular
es la proporción de veces que el resultado
ocurriría en una secuencia muy larga de
observaciones.
• Generalmente corresponde a la proporción
poblacional (y por lo tanto, cae entre 0 y 1) ya
sea para una población real o conceptual.
Reglas básicas de probabilidad
Sean A, B posibles resultados
• P(no A) = 1 – P(A)
• Para A y B, posibles resultados distintos
P(A o B) = P(A) + P(B)
• P(A y B) = P(A)P(B dado A)
• Para resultados “independientes”
P(B dado A) = P(B), entonces
P(A y B) = P(A)P(B)
Datos de GSS 2006
Happiness
Income Very Pretty Not too Total
---------------------
Above Aver. 272 294 49 615
Average 454 835 131 1420
Below Aver. 185 527 208 920
---------------------
Total 911 1656 388 2955
0 P( y ) 1, P( y ) 1
Ejemplo
• Selecciona una muestra aleatoria de 3 personas y
pregunta si están a favor (F) o en contra (C) de un
sistema de salud público
y = número a favor (0, 1, 2, ó 3)
• Para posibles muestras de tamaño n = 3,
Muestra y Muestra y
(C, C, C) 0 (C, F, F) 2
(C, C, F) 1 (F, C, F) 2
(C, F, C) 1 (F, F, C) 2
(F, C, C) 1 (F, F, F) 3
• Si la población está igualmente dividida entre F y C, estas
ocho muestras son igualmente posibles y la distribución de
probabilidad de la variable aleatoria y (el número a favor)
es
y P(y)
0 1/8
1 3/8
2 3/8
3 1/8
• (Caso especial de la “distribución binomial”, en Cap. 6)
• En la práctica, las distribuciones de probabilidad son
estimadas de datos muestrales y entonces tienen una
forma de distribuciones de frecuencias
Datos GSS
• Ejemplo: y = número de personas que conocen a
alguien que se haya suicidado en los últimos 12 meses
(variable “suiknew”).
Distribución de probabilidad estimada es
y P(y)
0 .895
1 .084
2 .015
3 .006
Media (valor esperado)
• Como las distribuciones de frecuencias,
distribuciones de probabilidad tienen medidas
descriptivas tales como media y desviación estándar
• Media (valor esperado)
E (Y ) yP( y )
• µ = 0(0.895) + 1(0.084) + 2(0.015) + 3 (0.006) = 0.13
representa un “resultado promedio de una secuencia
larga”
(media = moda = 0)
Desviación estándar
• Desviación estándar – medida de una distancia
“típica” de un resultado de la media, denotada
por
= ( y ) P ( y )
2