Documentos de Académico
Documentos de Profesional
Documentos de Cultura
probabilidad.
1
Tema 6. Se que te estarás preguntando ¿Qué es una distribución de probabilidad?.
Bueno una distribución de probabilidad es un despliegue de todos los posibles
resultados de un experimento, junto con las probabilidades de cada uno de sus
posibles resultados. Este análisis es fundamental para el evaluador de políticas
públicas ya que debemos analizar los posibles resultados que pueden generar las
políticas públicas implementadas por el gobierno.
2
En esta lección revisaremos los siguientes temas:
1. Curva de Lorenz
2. Índice de Gini
3. Tipos de gráficos según problema
3.1. Descripción y comparación de categorías
3.2. Análisis y comparación de distribuciones
3.3. Análisis de series temporales
3.4. Distribución conjunta de dos variables
3
Objetivos
Cognoscitivo: El alumno comprenderá la importancia de las distribuciones de
probabilidad.
Procedimental: El alumno aplicará y resolverá los diferentes ejercicios revisados en
esta lección.
Actitudinal: El alumno dimensionará la importancia de evaluar los problemas
públicos, utilizando las densidades de probabilidad de los eventos.
4
Para empezar a explicar qué es una variable aleatoria recordemos los siguientes
conceptos analizados anteriormente:
Variable aleatoria: una variable aleatoria es una variable cuyo valor es el resultado de
un evento aleatorio, supongamos que se lanza una moneda tres veces y se anota el
número de caras que se obtienen. Los posibles resultados son 0 caras, 1 cara, 2 caras
o 3 caras. La variable aleatoria es el número de caras que se obtienen, y los posibles
resultados son los valores de la variable aleatoria.
5
Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria
discreta puede asumir sólo ciertos valores, con frecuencia números enteros, y resulta
principalmente del conteo. El número de caras en el experimento del lanzamiento de
la moneda es un ejemplo de una variable aleatoria discreta. Los valores de las
variables aleatorias se restringen sólo a ciertos números: 0, 1, 2 y 3. El resultado del
lanzamiento de un dado, el número de camiones que llegan por hora al puerto de
carga, y el número de clientes que están en fila para sacar sus libros favoritos, son
otros ejemplos de variables aleatorias discretas.
6
Una variable aleatoria continua resulta principalmente de la medición y puede tomar
cualquier valor, al menos dentro de un rango dado. Los pesos del agua mineral es un
ejemplo, debido a que los contenedores pueden tomar cualquier valor entre 10 y 25
libras. Otros ejemplos de variables aleatorias continuas incluyen la estatura de los
usuarios del metro, los ingresos de los empleados en una dependencia municipal y el
tiempo transcurrido entre la llegada de cada usuario a la ventanilla de atención. En
cada caso, la variable aleatoria puede medirse con cualquier valor, incluyendo
fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un
número continuo o infinito de subdivisiones (el dólar puede subdividirse sólo 100
veces), comúnmente se tratan como distribuciones continuas de probabilidad.
7
Una distribución de probabilidad es un despliegue de todos los posibles resultados de
un experimento junto con las probabilidades de cada resultado. Un ejemplo de esto
sería suponer que la probabilidad de lanzar una moneda tres veces y de obtener
ninguna cara es de 1/8, la probabilidad de obtener una cara es 3/8, la probabilidad de
obtener dos caras es de 3/8 y la por último la probabilidad de obtener tres caras es
de 1/8. Esta distribución de probabilidad se presenta en la siguiente tabla, la cual
muestra todos los resultados posibles y sus probabilidades. Vale la pena destacar que
las probabilidades suman 1.
8
Ya que generamos la tabla de las probabilidades del evento X, graficamos el
comportamiento de las distribución de probabilidad del evento, en el eje de las Y se
coloca la probabilidad (P(X)) y en el eje de las X se coloca los resultados de obtener
una cara. (Ver figura no.29)
Dado esto podemos definir la distribución de probabilidad como una lista de todos
los resultados posibles de algún experimento y de la probabilidad relacionada con
cada resultado. La probabilidad de que la variable aleatoria X tome algún valor
especifico, 𝑥𝑖 , se escribe 𝑃 𝑋 = 𝑥𝑖 . Por tanto, la probabilidad de que los tres
lanzamientos de una moneda resulten en dos caras es 𝑃(𝑋 = 2) = 3 8. Vale la pena
notar que 0 ≤ 𝑃 𝑋 = 𝑥𝑖 ≤ 1 y 𝑃(𝑋 = 𝑥𝑖 ) = 1.
9
La media de una distribución de probabilidad se llama valor esperado 𝐸 𝑋 , y se halla
multiplicando cada resultado posible por su probabilidad y sumando los resultados,
tal y como se muestra en la fórmula:
10
Para poder entender mejor la media de las distribuciones discretas retomaremos el
ejemplo de lanzar un dado, la probabilidad para el experimento de lanzar un dado se
muestra en las primeras dos columnas de la tabla no.39.
11
Ya que conocemos la probabilidad del evento lo que necesitamos realizar es
multiplicar la probabilidad del evento por el evento 𝑥𝑖 𝑃(𝑥𝑖 ) y los resultados
obtenidos se suman como se muestra en la tabla no.40.
Por lo tanto podemos decir que el valor esperado de una variable aleatoria discreta
es la media ponderada de todos los posibles resultados en los cuales los pesos son las
probabilidades respectivas de tales resultados.
En nuestro ejemplo de lanzar un dado podemos decir que el valor esperado a la hora
de lanzarlo es de 3.5, (lo cual es muy poco probable que suceda), lo podemos
interpretar de la siguiente forma: si se promedian los resultados de los lanzamientos
del dado se obtendrá 3.5.
12
Para el análisis de varianza de una distribución de probabilidad es conceptualmente el
promedio de las desviaciones al cuadrado con respecto de la media, por lo tanto la
varianza se puede definir como:
13
Lo que nos indica que las diferencias entre los eventos y su media se eleva al
cuadrado y se multiplica por su respectiva probabilidad y por último se suman sus
resultados como se muestra en la tabla no. 41.
14
Para poder calcular la desviación estándar de la distribución de probabilidad la
fórmula es la siguiente:
𝜎 = 𝜎2
𝜎 = 2.92 = 1.71
15
Ejemplo:
Supongamos que el número de inscritos al programa PROSPERA de manera mensual
presentó una variación de 5 a 20 inscritos en los últimos dos años, supongamos que
queremos evaluar el número de inscritos por mes, para esto necesitamos conocer la
frecuencia de cada nivel de inscritos por mes (Ver tabla no.42).
16
Solución:
17
Ya que conocemos la probabilidad de inscritos por mes, debemos calcular el valor
esperado utilizando nuestra fórmula (ver tabla no.44):
𝜇=𝐸 𝑋 = 𝑥𝑖 𝑃 𝑥𝑖
18
Dado lo anterior podemos decir que el valor esperado de inscritos al programa
PROSPERA por mes es de 10.9
Ahora necesitamos conocer la variabilidad de inscritos por mes, para poder calcular
esto utilizamos la siguiente fórmula (ver tabla no.45):
𝜎2 = 𝑥𝑖 − 𝜇 2 𝑃 𝑥𝑖
𝜎= 𝜎 2 = 18.718 = 4.236
19
Interpretación:
20
La distribución Binomial (distribución discreta de probabilidad)
21
Una distribución normal presenta cuatro propiedades:
1. Sólo debe haber dos posibles resultados. Uno se identifica como éxito, y el otro
como fracaso. Sin embargo, se advierte que estos términos no tienen ninguna
connotación de bueno o malo. Son completamente objetivos y un éxito no
implica necesariamente un resultado deseable.
2. La probabilidad de un éxito es 𝜋, sigue siendo constante de un ensayo al
siguiente, al igual que lo hace la probabilidad de fracaso que es de 1 − 𝜋.
3. La probabilidad de un éxito en un ensayo es totalmente independiente de
cualquier otro ensayo.
4. El experimento puede repetirse muchas veces.
22
En el caso de la evaluación de las políticas públicas podemos encontrar casos que se
comportan como una distribución binomial, un ejemplo de esto sería realizar una
evaluación de impacto donde se mide si se cumple o no cumple con los objetivos del
programa, si nos damos cuenta solo existen dos posibles respuestas al análisis.
Distribución binomial:
𝑛!
𝑃(𝑥) = 𝜋 𝑥 (1 − 𝜋)𝑛−𝑥
𝑥! 𝑛 − 𝑥
=n 𝐶𝑥 (𝜋)𝑥 (1 − 𝜋)𝑛−𝑥
23
Para poder entender mejor esto realicemos el siguiente ejemplo: Supongamos que la
probabilidad de participación de la sociedad civil en las políticas públicas
implementadas en los últimos años en el municipio de Toluca es de 𝜋 = 10%. Desea
determinar la probabilidad de que de 𝑛 = 20 actores que se ven involucrados en la
siguiente implementación son seleccionados de manera aleatoria, 𝑥 = 5, de estos
actores sean ciudadanos. Esto se puede expresar como 𝑃 𝑥 = 5 𝑛 = 20, 𝜋 = 0.10 ,
lo cual se lee como la probabilidad de cinco éxitos dado que hay 20 ensayos y la
probabilidad de un éxito de cualquier ensayo es del 10%.
24
Otra manera para estimar esta probabilidad es a través de las tablas de probabilidad
de la distribución binomial que se encuentran como material complementario en esta
lección. Vale la pena destacar que las dos primeras columnas en la tabla muestran los
posibles valores para 𝑛 y 𝑥. Para esto debemos ubicar el valor de 20 para 𝑛 debido a
que hay 20 ensayos (actores) en el experimento y localice la fila que contenga los
valores para 𝑥 = 5 y después busque la columna encabezada con 𝜋 = 0.10 y se
encontrara el valor 0.0319.
25
La media y la varianza de una distribución binomial
26
Distribución binomial acumulada
Dado los datos del ejercicio de la sección sobre el último informe laboral de México,
suponga que desea determinar la probabilidad de que 3 o menos estudiantes
encontraron trabajo el primer año de egreso. Este problema implica una distribución
binomial acumulada debido a que se está interesado en un rango de valores (0 a 3)
en lugar de un solo número específico. El siguiente arreglo ordenado ilustra este
punto. La probabilidad del evento A(0 a 3 Trabajan) es 𝑃 𝐴 = (𝑃 𝑋 ≤ 3).
Evento A
0 1 2 3 4 5 6 7 (𝜋 = 0.40)
27
La siguiente tabla de probabilidad binomial acumulada proporciona la probabilidad
de que el número de éxitos sea igual o menor que cierta cantidad. Un ejemplo de
esto es suponer que se desea conocer 𝑃(𝐴) = 𝑃(𝑋 ≥ 5). Dicha tabla nos dará
directamente la probabilidad de que un número de éxitos sea igual o mayor que
alguna cantidad. Observando el arreglo ordenado se tiene que:
Evento A
0 1 2 3 4 5 6 7 (𝜋 = 0.40)
Evento 𝐴
28
Si el evento 𝐴 es 𝑃(𝑋 ≥ 5), entonces 𝐴 es 4 o menos, lo cual puede hallarse en la
tabla de probabilidad binomial acumulada. Se sabe que 𝑃 𝐴 = 1 − 𝑃 𝐴 . Entonces,
𝑃 𝑋 ≥ 5 𝑛 = 7, 𝜋 = 0.40 = 1 − 𝑃 𝑋 ≤ 4 𝑛 = 7, 𝜋 = 0.40 = 1 − 0.9037 =
0.0963. La probabilidad de que por lo menos 5 de 7 egresados tengan empleo el
primer año de haber egresado de la escuela es de 9.63%.
29
La distribución hipergeométrica
Distribución hipergeométrica
𝑃 𝑥 =rCx N-1Cn-x
NCn
30
Por lo tanto, podemos decir que una distribución hipergeométrica es una distribución
discreta que modela el número de eventos en una muestra de tamaño fijo cuando
usted conoce el número total de elementos en la población de la cual proviene la
muestra. Cada elemento de la muestra tiene dos resultados posibles.
31
Supongamos que la Ciudad de México presenta problemas de contaminación, por lo
tanto la Secretaría de Medio Ambiente decide realizar un operativo para combatir
este problema generando retenes para verificar las emisiones de los vehículos que
circulan en la ciudad de manera aleatoria. Si se cuenta con 𝑁 = 10 automóviles en el
retén, y 𝑟 = 4 de estos autos emiten altas emisiones de CO2, ¿Cuál es la probabilidad
de seleccionar una muestra de 𝑛 = 3 en la cual 𝑥 = 2 autos contaminantes?
𝑃 𝑋 = 2 = 4C2 10-4C3-2
10C3
6𝑋6
= = 0.30
120
32
Ejemplo:
33
Solución:
𝑃 𝑋 = 1 =4C1 5C2
9C3
4 × 10
= = 0.4762
84
𝑃 𝑋 = 0 =4C0 5C3
9C3
34
1 × 10
= = 0.1190
84
34
Por tanto, 𝑃 𝑋 ≤ 1 = 0.4762 + 0.1190 = 0.5952, esto quiere decir que existía casi
un 60% de probabilidad, sin considerar el género, de que no más de una mujer fuera
ascendida. Con base en tales hallazgos, como otras pruebas presentadas en el caso, la
corte dictaminó que no había suficiente evidencia de discriminación.
35
Como puedes darte cuenta el uso de la probabilidad es sumamente importante para
tu formación como evaluador.
36
Para profundizar en estos temas, te recomiendo revisar la siguiente bibliografía.
37