Está en la página 1de 38

Bienvenidos a la semana 6, donde abordaremos el tema de las distribuciones de

probabilidad.

1
Tema 6. Se que te estarás preguntando ¿Qué es una distribución de probabilidad?.
Bueno una distribución de probabilidad es un despliegue de todos los posibles
resultados de un experimento, junto con las probabilidades de cada uno de sus
posibles resultados. Este análisis es fundamental para el evaluador de políticas
públicas ya que debemos analizar los posibles resultados que pueden generar las
políticas públicas implementadas por el gobierno.

2
En esta lección revisaremos los siguientes temas:
1. Curva de Lorenz
2. Índice de Gini
3. Tipos de gráficos según problema
3.1. Descripción y comparación de categorías
3.2. Análisis y comparación de distribuciones
3.3. Análisis de series temporales
3.4. Distribución conjunta de dos variables

3
Objetivos
Cognoscitivo: El alumno comprenderá la importancia de las distribuciones de
probabilidad.
Procedimental: El alumno aplicará y resolverá los diferentes ejercicios revisados en
esta lección.
Actitudinal: El alumno dimensionará la importancia de evaluar los problemas
públicos, utilizando las densidades de probabilidad de los eventos.

4
Para empezar a explicar qué es una variable aleatoria recordemos los siguientes
conceptos analizados anteriormente:

Variable aleatoria: una variable aleatoria es una variable cuyo valor es el resultado de
un evento aleatorio, supongamos que se lanza una moneda tres veces y se anota el
número de caras que se obtienen. Los posibles resultados son 0 caras, 1 cara, 2 caras
o 3 caras. La variable aleatoria es el número de caras que se obtienen, y los posibles
resultados son los valores de la variable aleatoria.

5
Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria
discreta puede asumir sólo ciertos valores, con frecuencia números enteros, y resulta
principalmente del conteo. El número de caras en el experimento del lanzamiento de
la moneda es un ejemplo de una variable aleatoria discreta. Los valores de las
variables aleatorias se restringen sólo a ciertos números: 0, 1, 2 y 3. El resultado del
lanzamiento de un dado, el número de camiones que llegan por hora al puerto de
carga, y el número de clientes que están en fila para sacar sus libros favoritos, son
otros ejemplos de variables aleatorias discretas.

6
Una variable aleatoria continua resulta principalmente de la medición y puede tomar
cualquier valor, al menos dentro de un rango dado. Los pesos del agua mineral es un
ejemplo, debido a que los contenedores pueden tomar cualquier valor entre 10 y 25
libras. Otros ejemplos de variables aleatorias continuas incluyen la estatura de los
usuarios del metro, los ingresos de los empleados en una dependencia municipal y el
tiempo transcurrido entre la llegada de cada usuario a la ventanilla de atención. En
cada caso, la variable aleatoria puede medirse con cualquier valor, incluyendo
fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un
número continuo o infinito de subdivisiones (el dólar puede subdividirse sólo 100
veces), comúnmente se tratan como distribuciones continuas de probabilidad.

7
Una distribución de probabilidad es un despliegue de todos los posibles resultados de
un experimento junto con las probabilidades de cada resultado. Un ejemplo de esto
sería suponer que la probabilidad de lanzar una moneda tres veces y de obtener
ninguna cara es de 1/8, la probabilidad de obtener una cara es 3/8, la probabilidad de
obtener dos caras es de 3/8 y la por último la probabilidad de obtener tres caras es
de 1/8. Esta distribución de probabilidad se presenta en la siguiente tabla, la cual
muestra todos los resultados posibles y sus probabilidades. Vale la pena destacar que
las probabilidades suman 1.

8
Ya que generamos la tabla de las probabilidades del evento X, graficamos el
comportamiento de las distribución de probabilidad del evento, en el eje de las Y se
coloca la probabilidad (P(X)) y en el eje de las X se coloca los resultados de obtener
una cara. (Ver figura no.29)

Dado esto podemos definir la distribución de probabilidad como una lista de todos
los resultados posibles de algún experimento y de la probabilidad relacionada con
cada resultado. La probabilidad de que la variable aleatoria X tome algún valor
especifico, 𝑥𝑖 , se escribe 𝑃 𝑋 = 𝑥𝑖 . Por tanto, la probabilidad de que los tres
lanzamientos de una moneda resulten en dos caras es 𝑃(𝑋 = 2) = 3 8. Vale la pena
notar que 0 ≤ 𝑃 𝑋 = 𝑥𝑖 ≤ 1 y 𝑃(𝑋 = 𝑥𝑖 ) = 1.

9
La media de una distribución de probabilidad se llama valor esperado 𝐸 𝑋 , y se halla
multiplicando cada resultado posible por su probabilidad y sumando los resultados,
tal y como se muestra en la fórmula:

Media o valor esperado de una distribución de probabilidad discreta


𝜇=𝐸 𝑋 = 𝑥𝑖 𝑃 𝑥𝑖

En donde 𝑥𝑖 son los resultados individuales.

10
Para poder entender mejor la media de las distribuciones discretas retomaremos el
ejemplo de lanzar un dado, la probabilidad para el experimento de lanzar un dado se
muestra en las primeras dos columnas de la tabla no.39.

11
Ya que conocemos la probabilidad del evento lo que necesitamos realizar es
multiplicar la probabilidad del evento por el evento 𝑥𝑖 𝑃(𝑥𝑖 ) y los resultados
obtenidos se suman como se muestra en la tabla no.40.

Por lo tanto podemos decir que el valor esperado de una variable aleatoria discreta
es la media ponderada de todos los posibles resultados en los cuales los pesos son las
probabilidades respectivas de tales resultados.

En nuestro ejemplo de lanzar un dado podemos decir que el valor esperado a la hora
de lanzarlo es de 3.5, (lo cual es muy poco probable que suceda), lo podemos
interpretar de la siguiente forma: si se promedian los resultados de los lanzamientos
del dado se obtendrá 3.5.

12
Para el análisis de varianza de una distribución de probabilidad es conceptualmente el
promedio de las desviaciones al cuadrado con respecto de la media, por lo tanto la
varianza se puede definir como:

Varianza de una distribución de probabilidad


𝜎2 = 𝑥𝑖 − 𝜇 2 𝑃 𝑥𝑖

13
Lo que nos indica que las diferencias entre los eventos y su media se eleva al
cuadrado y se multiplica por su respectiva probabilidad y por último se suman sus
resultados como se muestra en la tabla no. 41.

14
Para poder calcular la desviación estándar de la distribución de probabilidad la
fórmula es la siguiente:
𝜎 = 𝜎2

Y esta nos muestra la dispersión de los resultados alrededor de su media,


continuando con nuestro ejemplo calculamos la desviación estándar de la
distribución de probabilidades de lanzar un dado y obtenemos lo siguiente:

𝜎 = 2.92 = 1.71

15
Ejemplo:
Supongamos que el número de inscritos al programa PROSPERA de manera mensual
presentó una variación de 5 a 20 inscritos en los últimos dos años, supongamos que
queremos evaluar el número de inscritos por mes, para esto necesitamos conocer la
frecuencia de cada nivel de inscritos por mes (Ver tabla no.42).

El Secretario de SEDESOL espera que estas cifras reflejen un incremento en el número


promedio de inscritos al programa por encima de 𝜇 = 7.3 que era el promedio
mensual anterior, así como una reducción de la variabilidad de inscritos por mes, que
había sido de 𝜎 = 5.7. De lo contrario se tendría que reestructurar el programa para
determinar las causas de una baja inscripción de beneficiarios.

16
Solución:

Lo primero que debemos realizar es obtener la probabilidad del número de inscritos


por mes, esto es dividir el número de inscritos por el total de meses que es de 24
meses: (Ver tabla no. 43)

17
Ya que conocemos la probabilidad de inscritos por mes, debemos calcular el valor
esperado utilizando nuestra fórmula (ver tabla no.44):
𝜇=𝐸 𝑋 = 𝑥𝑖 𝑃 𝑥𝑖

18
Dado lo anterior podemos decir que el valor esperado de inscritos al programa
PROSPERA por mes es de 10.9

Ahora necesitamos conocer la variabilidad de inscritos por mes, para poder calcular
esto utilizamos la siguiente fórmula (ver tabla no.45):
𝜎2 = 𝑥𝑖 − 𝜇 2 𝑃 𝑥𝑖

Después de obtener la varianza, necesitamos obtener la desviación estándar con el


objetivo de presentar la variabilidad de inscritos por mes:

𝜎= 𝜎 2 = 18.718 = 4.236

19
Interpretación:

En el informe presentado al Secretario de SEDESOL, se le comunica que el número de


inscritos mensualmente aumento a 11, cuatro inscritos más que la administración
anterior y que la variabilidad de inscritos mensualmente disminuyó en 4.236 de 5.7
que la administración anterior, por lo tanto podemos decir que el sistema de
inscripción al programa PROSPERA ha mejorado.

20
La distribución Binomial (distribución discreta de probabilidad)

La distribución binomial es una distribución de probabilidad discreta que mide el


número de éxitos si la variable es una variable aleatoria discreta, es decir, sólo puede
tomar los valores 0, 1, 2, 3, 4,..., n suponiendo que se han realizado n número de
pruebas y estas solo toman dos posibles resultados los cuales puede ser éxito o
fracaso. Los experimentos de este tipo siguen una distribución binomial, con base en
el proceso de Bernoulli, llamado así por Jacob Bernoulli (1654-1705).

21
Una distribución normal presenta cuatro propiedades:
1. Sólo debe haber dos posibles resultados. Uno se identifica como éxito, y el otro
como fracaso. Sin embargo, se advierte que estos términos no tienen ninguna
connotación de bueno o malo. Son completamente objetivos y un éxito no
implica necesariamente un resultado deseable.
2. La probabilidad de un éxito es 𝜋, sigue siendo constante de un ensayo al
siguiente, al igual que lo hace la probabilidad de fracaso que es de 1 − 𝜋.
3. La probabilidad de un éxito en un ensayo es totalmente independiente de
cualquier otro ensayo.
4. El experimento puede repetirse muchas veces.

22
En el caso de la evaluación de las políticas públicas podemos encontrar casos que se
comportan como una distribución binomial, un ejemplo de esto sería realizar una
evaluación de impacto donde se mide si se cumple o no cumple con los objetivos del
programa, si nos damos cuenta solo existen dos posibles respuestas al análisis.

Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es


posible estimar cuántos éxitos habrá en un número dado de ensayos. Por ejemplo, si
se conoce la probabilidad de que uno de los Actores involucrados en la
implementación de una política pública fuera un actor público o privado como lo
maneja el Banco Interamericano de Desarrollo (BID) en su informe Global
Competitiveness Report, entonces puede estimarse la probabilidad de que un
número determinado de actores pertenezcan a ser un actor público o privado. La
probabilidad de que 𝑛 número de actores de un número 𝑥 dado, pertenezca o no a la
clasificación anterior es de:

Distribución binomial:
𝑛!
𝑃(𝑥) = 𝜋 𝑥 (1 − 𝜋)𝑛−𝑥
𝑥! 𝑛 − 𝑥
=n 𝐶𝑥 (𝜋)𝑥 (1 − 𝜋)𝑛−𝑥

23
Para poder entender mejor esto realicemos el siguiente ejemplo: Supongamos que la
probabilidad de participación de la sociedad civil en las políticas públicas
implementadas en los últimos años en el municipio de Toluca es de 𝜋 = 10%. Desea
determinar la probabilidad de que de 𝑛 = 20 actores que se ven involucrados en la
siguiente implementación son seleccionados de manera aleatoria, 𝑥 = 5, de estos
actores sean ciudadanos. Esto se puede expresar como 𝑃 𝑥 = 5 𝑛 = 20, 𝜋 = 0.10 ,
lo cual se lee como la probabilidad de cinco éxitos dado que hay 20 ensayos y la
probabilidad de un éxito de cualquier ensayo es del 10%.

Por lo tanto podemos calcular la probabilidad de los eventos como:


5 20−5
20 𝐶5 (0.10) (0.90) = 15,504 0.00001 0.2058911 = 0.0319

La probabilidad de que 5 de cada 20 actores seleccionados de manera aleatoria sean


ciudadanos es de 3.19%.

24
Otra manera para estimar esta probabilidad es a través de las tablas de probabilidad
de la distribución binomial que se encuentran como material complementario en esta
lección. Vale la pena destacar que las dos primeras columnas en la tabla muestran los
posibles valores para 𝑛 y 𝑥. Para esto debemos ubicar el valor de 20 para 𝑛 debido a
que hay 20 ensayos (actores) en el experimento y localice la fila que contenga los
valores para 𝑥 = 5 y después busque la columna encabezada con 𝜋 = 0.10 y se
encontrara el valor 0.0319.

25
La media y la varianza de una distribución binomial

Antes se mostró cómo determinar la media y la varianza de una distribución discreta


utilizando las fórmulas anteriores, sin embargo, si sólo hay dos resultados posibles,
como en la distribución binomial, la media y la varianza pueden determinarse de una
manera más fácil:

Media de una distribución binomial


𝐸(𝑋) = 𝜇 = 𝑛𝜋
La varianza de una distribución binomial
𝜎2 = 𝑛𝜋 1 − 𝜋
Y la desviación estándar de una distribución binomial
𝜎= 𝜎2

Retomando el ejercicio anterior de los actores públicos (servidores públicos) y


sociedad civil (ciudadanos) donde 𝑛 = 20, su valor esperado seria 𝐸 𝑋 = 𝜇 =
20 0.10 = 2, de los 20 actores seleccionados aleatoriamente se esperaría que 2
fueran actores públicos y su varianza es de 𝜎2 = (20)(0.10)(1 − 0.10) = 1.8 y la
desviación estándar es de 𝜎 = 1.8 = 1.3416.

26
Distribución binomial acumulada

Dado los datos del ejercicio de la sección sobre el último informe laboral de México,
suponga que desea determinar la probabilidad de que 3 o menos estudiantes
encontraron trabajo el primer año de egreso. Este problema implica una distribución
binomial acumulada debido a que se está interesado en un rango de valores (0 a 3)
en lugar de un solo número específico. El siguiente arreglo ordenado ilustra este
punto. La probabilidad del evento A(0 a 3 Trabajan) es 𝑃 𝐴 = (𝑃 𝑋 ≤ 3).

Evento A

0 1 2 3 4 5 6 7 (𝜋 = 0.40)

En la tabla de probabilidad binomial que se presenta al final del capítulo debemos


encontrar la probabilidad de hallar los siguientes valores y después sumarlos:
𝑃 𝑋 ≤ 3 𝑛 = 7, 𝜋 = 0.40 = 𝑃 𝑋 = 0 + 𝑃 𝑋 = 1 + 𝑃 𝑋 = 2 + 𝑃 𝑋 = 3 =
0.0280 + 0.1306 + 0.2613 + 0.2903 = 0.7102.

27
La siguiente tabla de probabilidad binomial acumulada proporciona la probabilidad
de que el número de éxitos sea igual o menor que cierta cantidad. Un ejemplo de
esto es suponer que se desea conocer 𝑃(𝐴) = 𝑃(𝑋 ≥ 5). Dicha tabla nos dará
directamente la probabilidad de que un número de éxitos sea igual o mayor que
alguna cantidad. Observando el arreglo ordenado se tiene que:

Evento A
0 1 2 3 4 5 6 7 (𝜋 = 0.40)
Evento 𝐴

28
Si el evento 𝐴 es 𝑃(𝑋 ≥ 5), entonces 𝐴 es 4 o menos, lo cual puede hallarse en la
tabla de probabilidad binomial acumulada. Se sabe que 𝑃 𝐴 = 1 − 𝑃 𝐴 . Entonces,
𝑃 𝑋 ≥ 5 𝑛 = 7, 𝜋 = 0.40 = 1 − 𝑃 𝑋 ≤ 4 𝑛 = 7, 𝜋 = 0.40 = 1 − 0.9037 =
0.0963. La probabilidad de que por lo menos 5 de 7 egresados tengan empleo el
primer año de haber egresado de la escuela es de 9.63%.

29
La distribución hipergeométrica

Como se acaba de explicar, la distribución binomial es apropiada sólo si la


probabilidad de un éxito permanece constante para cada intento. Esto ocurre si el
muestreo se realiza con reemplazo de una población finita (o muy grande). Sin
embargo, si la población es pequeña y ocurre el muestreo sin reemplazo, la
probabilidad de un éxito variará. Si la probabilidad de un éxito no es constante, la
distribución hipergeométrica es de especial utilidad. La función de probabilidad para
la distribución hipergeométrica es:

Distribución hipergeométrica
𝑃 𝑥 =rCx N-1Cn-x
NCn

En donde N= es el tamaño de la población, r= es el número de éxitos en la población,


n= es el tamaño de la muestra y x= es el número de éxitos en la muestra.

30
Por lo tanto, podemos decir que una distribución hipergeométrica es una distribución
discreta que modela el número de eventos en una muestra de tamaño fijo cuando
usted conoce el número total de elementos en la población de la cual proviene la
muestra. Cada elemento de la muestra tiene dos resultados posibles.

31
Supongamos que la Ciudad de México presenta problemas de contaminación, por lo
tanto la Secretaría de Medio Ambiente decide realizar un operativo para combatir
este problema generando retenes para verificar las emisiones de los vehículos que
circulan en la ciudad de manera aleatoria. Si se cuenta con 𝑁 = 10 automóviles en el
retén, y 𝑟 = 4 de estos autos emiten altas emisiones de CO2, ¿Cuál es la probabilidad
de seleccionar una muestra de 𝑛 = 3 en la cual 𝑥 = 2 autos contaminantes?

𝑃 𝑋 = 2 = 4C2 10-4C3-2
10C3
6𝑋6
= = 0.30
120

Existe un 30% de probabilidad de seleccionar tres automóviles y 2 de los cuales sean


contaminantes.

32
Ejemplo:

En un caso reciente de discriminación en el estado de Puebla, tres mujeres


entablaron una demanda contra la Secretaría de Hacienda y Crédito Público, por
discriminación de sexo. De las nueve personas que eran elegibles para un ascenso,
cuatro eran mujeres. Tres de las nueves personas recibieron en realidad el ascenso;
pero sólo una de ellas era mujer. Las otras tres mujeres elegibles demandaron. Una
consideración importante en el caso, unida con la probabilidad de que las tres
personas que recibieron ascenso sólo una mujer fuera seleccionada por casualidad.
Es decir, si el género no era un factor, ¿cuál es la probabilidad de que no más que uno
de los tres ascensos fuera asignado a una mujer?

33
Solución:

Un evaluador especializado en asuntos legales fue llamado por el abogado defensor


para refutar los cargos. El evaluador calculó la probabilidad de que ante la ausencia
de discriminación, sólo una de las mujeres sería ascendida en su cargo. Por lo tanto,
se realizó la siguiente operación:

N = 9 el número de personas elegibles para ser ascendidas


r = 4 el número en la población identificado como éxito (mujeres)
n = 3 el tamaño de la muestra (quienes fueron seleccionados para el ascenso), y
𝑥 ≤ 1; el número de éxitos (mujeres) en la muestra.

La probabilidad de que no más de una mujer fuera ascendida es 𝑃 𝑋 = 0 +


𝑃 𝑋=1 .

𝑃 𝑋 = 1 =4C1 5C2
9C3
4 × 10
= = 0.4762
84
𝑃 𝑋 = 0 =4C0 5C3
9C3

34
1 × 10
= = 0.1190
84

34
Por tanto, 𝑃 𝑋 ≤ 1 = 0.4762 + 0.1190 = 0.5952, esto quiere decir que existía casi
un 60% de probabilidad, sin considerar el género, de que no más de una mujer fuera
ascendida. Con base en tales hallazgos, como otras pruebas presentadas en el caso, la
corte dictaminó que no había suficiente evidencia de discriminación.

35
Como puedes darte cuenta el uso de la probabilidad es sumamente importante para
tu formación como evaluador.

36
Para profundizar en estos temas, te recomiendo revisar la siguiente bibliografía.

37

También podría gustarte