Está en la página 1de 16

1

Estadística y
Probabilidad

Etapa 2. Conceptos de estadística


2

Tabla de contenido

Introducción ................................................................................................................................3
Pregunta orientadora ..................................................................................................................3
1. Definiciones y conceptos básicos ...........................................................................................3
1.1. Población y muestra............................................................................................................ 3
1.2. Variables cuantitativas discretas y continuas ...................................................................... 4
1.3. Variables cualitativas ordinales y nominales ....................................................................... 5
3. Medidas de tendencia central .................................................................................................7
3.1. Media o promedio aritmético ............................................................................................... 7
3.2. Mediana…........................................................................................................................... 7
3.3. Moda……… ........................................................................................................................ 9
4. Medidas de dispersión............................................................................................................9
4.1. Varianza y desviación estándar........................................................................................... 9
4.2. Desviación media y coeficiente de variación ......................................................................10
5. Probabilidad .........................................................................................................................11
5.1. Definición y Problemas de aplicación .................................................................................11
5.2. Reglas de la multiplicación .................................................................................................12
5.3. Problema condicional .........................................................................................................12
5.4. Probabilidad condicional ....................................................................................................13
5.5. Teorema de Bayes .............................................................................................................14
5.6. Regla de la suma ...............................................................................................................15
5.7. Diagrama de Árbol .............................................................................................................16
Referencias...............................................................................................................................16
3

Introducción

Generalmente el concepto de estadística lo asociamos a una gran cantidad de números, la


mayoría de veces presentados en forma de gráficos y tablas de diversa índole que se distingue
con el nombre de “Estadística descriptiva”. Así mismo se asocia este concepto con informes que
con una precisión discutible, se encuentran en publicaciones diversas llamadas en general como
Estadística.

Sin embargo, no sobra aclarar que esas series de datos con las cuales nos encontramos, deben
corresponder a un tema específico, lógico y que permita tomar decisiones. Sobre esto podemos
inicialmente mencionar ejemplos elementales, como averiguar cuánto tarda un automóvil en ir de
la ciudad A a la B; cuánto pesa un recién nacido; de varios candidatos a la presidencia, cual será
el favorito en las próximas elecciones, entre otros. En la mayoría de las veces uno mismo hace
sus apreciaciones sobre los resultados y se entera si se demoró lo normal en recorrer una
trayectoria.

En oposición a lo que acabamos de presentar, se puede dar cuenta el que un conjunto abstracto
de números referente a una situación cualquiera puede considerarse simplemente informativa y
por consiguiente no ser estadística. Por lo tanto, el enfoque para comenzar se basará en resolver
aquellos aspectos de la investigación de observaciones utilizando la estadística y probabilidad
como medio.

Pregunta orientadora

¿Qué instrumento se puede tomar de los observables definiendo la caracterización


representativa bajo incertidumbre la cual se manifiesta con modelos aleatorios y de observación?

1. Definiciones y conceptos básicos

1.1. Población y muestra

Población se refiere al universo, conjunto o totalidad de elementos sobre los que se investiga o
hacen estudios. Muestra es una parte o subconjunto de elementos que se seleccionan
previamente de una población para realizar un estudio. Las poblaciones están compuestas por
elementos que tienen características en común, y pueden ser de varios tipos:

 Población finita: es aquella que se puede contar y se pueden estudiar con mayor
facilidad a sus integrantes. Por ejemplo, la cantidad de personas inscritas en un gimnasio.

 Población infinita: son inmensas poblaciones donde se hace muy difícil contabilizar a
sus integrantes, por lo que suele tomarse en cuenta solo una porción de ella a la hora de
realizar un estudio, seleccionando así una muestra. Por ejemplo, la cantidad de granos
de arena en una playa.
4

 Población real: son grupos de integrantes tangibles. Por ejemplo, la cantidad de


animales en un zoológico.

 Población hipotética: son poblaciones posibles que pueden ser estudiadas ante una
eventualidad. Por ejemplo, la cantidad de nacimientos de bebés prematuros.

Las muestras se emplean para hacer estudios de las poblaciones que se hacen un poco
más factibles, ya que en ocasiones por el tamaño de las poblaciones no es fácil realizar
los estudios, existen diferentes tipos de muestreo por medio de los cuales a partir de una
población se pueden extraer los datos a analizar.

 Muestreo aleatorio simple: los elementos se eligen de una lista al azar. Funciona más
eficazmente cuando el universo es reducido y homogéneo.

 Muestreo sistemático: el primer elemento se elige al azar y luego se escogen a


intervalos constantes los elementos restantes.

 Muestreo estratificado: se realiza dividiendo a la población en partes o estratos que


respondan a características establecidas y luego se eligen aleatoriamente los individuos
que se van a estudiar.

 Muestreo por conglomerado: la población se divide en grupos heterogéneos y estos a


su vez se subdividen en grupos homogéneos con características comunes para ser
estudiados de acuerdo con lo requerido por el investigador.

1.2. Variables cuantitativas discretas y continuas

Las variables cuantitativas son las que se pueden representar a partir de un resultado numérico
y son las más utilizadas en encuestas. Las variables cuantitativas se pueden dividir en discretas
y continuas.

Ilustración 1. Tipos de variables cuantitativas

Fuente: autoría propia

 Discreta: la variable discreta otorga cifras que se encuentran separadas en escalas, es


decir que no poseen valores entre ellas, sino que el resultado comprende un valor exacto,
de esta manera, dichas variables solo pueden adquirir un valor en números enteros. Por
ejemplo, una persona puede tener 1, 2, 3 o más perros, pero no un perro y medio.
5

 Continua: la variable continua, por otro lado, puede otorgar un valor de cualquier intervalo
o medición, es decir que puede haber otros valores en medio de dos exactos.
Generalmente estos son representados por valores decimales, por lo cual la cifra será
mucho más específica. Por ejemplo, la estatura de una persona puede ser de 1,75
centímetros.

1.3. Variables cualitativas ordinales y nominales

Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de un objeto o persona, sin hacer uso de números, de esta
manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o
categoría no numérica. Por ejemplo, el sexo de una persona es una variable cualitativa, ya que
es masculino o femenino.

Ilustración 2. Variables cualitativas

Fuente: autoría propia

Nominal: variable que no es representada por números ni tiene algún tipo de orden, y por lo
tanto es matemáticamente menos precisa. Por ejemplo, son variables nominales los colores:
negro, azul, rojo, amarillo, naranja, entre otros.

Ordinaria: es también conocida como variable cuasi cuantitativa, es representada por una
modalidad que no requiere números, pero sí consta de un orden o un puesto. Por ejemplo, el
nivel socioeconómico: alto, medio, bajo.

Binaria: se trabaja con valores específicos del tipo binario. Por ejemplo, el sexo de una persona
será masculino o femenino.

2. Tablas de frecuencia

La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución


de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas
ordinales. La tabla de frecuencias es una herramienta que permite ordenar los datos de manera
6

que se presentan numéricamente las características de la distribución de un conjunto de datos o


muestra.

En la tabla que se muestra a continuación tenemos varios ítems los cuales el 𝑋𝑖 que representa
la variable a analizar y la columna representa los valores que toma esa variable, en la siguiente
columna, la frecuencia absoluta 𝑓 es presentada, cuyo valor es el número de veces que se midió
dicho valor de la variable, en la siguiente columna se representan las frecuencias relativas, las
cuales son el resultado de dividir la frecuencia absoluta por el número total de mediciones, en la
columna número 4 y 5 se muestran las frecuencias acumuladas que es el resultado de sumar las
frecuencias absolutas hasta la posición donde se encuentra el dato que se desea calcular; es
decir, que para calcular la frecuencia relativa de 4 hay que sumar 7+19+25+12=63.

Tabla 1. Variables para analizar

Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa


𝑿𝒊 absoluta acumulada relativa acumulada
1 7 7 0,06 0,06
2 19 26 0,15 0,21
3 25 51 0,20 0,41
4 12 63 0,10 0,50
5 23 86 0,18 0,69
6 15 101 0,12 0,81
7 8 109 0,06 0,87
8 16 125 0,13 1,00

Fuente: autoría propia

Por otro lado, tenemos las tablas de datos agrupadas en las cuales como su nombre lo indica,
los datos se agrupan para formar lo que se conoce como clases y así facilitar la interpretación de
los datos.

Tabla 2. Variables agrupadas

Intervalos Frecuencia Marca de clase


15 a 70 23 42,5
70 a125 16 97,5
125 a 180 10 152,5
180 a 235 1 207,5
235 a 290 1 262,5
290 a 345 2 317,5
345 a 400 3 372,5
400 a 455 4 427,5
Total 60

Fuente: autoría propia


7

En este caso, tenemos la columna de la marca de clase que es un número que me va a


representar a todos los datos dentro del intervalo, esta marca de clase se calcula sacando el
promedio de los límites superior e inferior del intervalo. Existe una manera de determinar la
cantidad de clases óptimas en un determinado número de datos, la conocida regla de Sturges
me permite determinar la amplitud del intervalo, es decir que tan grande este debe ser. La regla
de Sturges se puede escribir como 𝑐 = 1 + 𝑙𝑜𝑔2 (𝑀) donde 𝑀 es el tamaño de la muestra y 𝑐 es
el ancho del intervalo.

3. Medidas de tendencia central

Una medida de tendencia central es un valor único que resume un conjunto de datos. De una
manera práctica señala el centro de los valores.

3.1. Media o promedio aritmético

La media aritmética es la suma de todos los valores de la población o muestra dividido entre el
número total de dichos datos. Para este parámetro, hacemos uso de las fórmulas dispuestas en
la siguiente tabla:

Tabla 3. Promedio aritmético

Fuente: (Estadística y probabilidad, 2016)

A continuación, presentamos algunas propiedades de la media aritmética:

1. Todo conjunto de datos de tipo numérico tiene un valor medio


2. Para evaluar la media se consideran todos los valores
3. La media toma un valor único
4. Es útil para comparar dos o más poblaciones
5. La sumatoria de las desviaciones con respecto a la media es igual a 0
6. La media Aritmética se ve afectada por valores extremos del conjunto de datos

3.2. Mediana

La mediana se define como “el valor abajo del cual se encuentra la mitad de los valores y arriba
del cual se encuentra la otra mitad.” Es decir, la mediana es el punto central o medio de los datos,
después de ordenarlos de menor a mayor o viceversa, donde el 50% de las observaciones son
menores a dicho valor y el 50% son superiores.
8

Al igual que la media, la mediana presenta algunas propiedades importantes:

1. Es única, solo existe una mediana para un conjunto de datos.


2. No se ve afectada por valores extremos en el sentido de ser o muy grandes o extremadamente
pequeños.
3. Se puede calcular para todo tipo de datos de nivel ordinal, de intervalo, razón o numérico.

Para determinar la mediana de todo un conjunto de datos, los ordenamos preferiblemente de


menor a mayor, su valor estará localizado en el centro de la distribución.

Para datos no agrupados, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición (n+1) /2 , en símbolos es:

𝑀𝑒 = 𝑥𝑛+1
2

Por ejemplo, si tenemos 7 datos, que ordenados son:

𝑥1 = 4, 𝑥2 = 7, 𝑥3 = 8, 𝑥4 = 5, 𝑥5 = 6, 𝑥6 = 3, 𝑥7 = 1

El valor central es el cuarto (𝑥4 = 5). Este valor, que es la mediana de ese conjunto de datos, nos
deja 3 datos por debajo y tres por encima del valor calculado.

b) Si n es par, la mediana es la media aritmética de los dos valores centrales. Por ejemplo
si n=6, la mediana es el punto central de los datos 𝑥3, 𝑥4.

𝑥1 = 4, 𝑥2 = 7, 𝑥3 = 8, 𝑥4 = 5, 𝑥5 = 6, 𝑥6 = 3

Para los anteriores datos la mediana se calcula:

𝑥𝑛 + 𝑥𝑛 + 1 𝑥3 + 𝑥4 8 + 5
2 2
𝑀𝑒 = = = = 6,5
2 2 2

Si los datos están agrupados en una tabla de distribución de frecuencias de clase, la mediana se
puede hallar aplicando la siguiente fórmula:

𝑛
− 𝐹𝑎𝑐
𝑀𝑒 = 𝐿𝑖𝑐 + (2 )𝑐
𝑓𝑚𝑒
Donde:

𝐿𝑖𝑐 Límite inferior de clase del renglón de la mediana


𝐹𝑎𝑐 Frecuencia acumulada anterior al renglón de la mediana
𝑓𝑚𝑒 Frecuencia absoluta del renglón de la mediana
𝑐 Tamaño del intervalo donde se localiza la mediana
9

3.3. Moda

Se define como el dato que se presenta con mayor frecuencia. Se determina, para datos
agrupados con la aplicación de la siguiente fórmula:

𝑑𝑖
𝑀𝑜 = 𝐿𝑖𝑐 + ( )𝑐
𝑑1 + 𝑑2

𝐿𝑖𝑐 Límite inferior de clase del renglón de la mediana


𝑑𝑖 Diferencias entre las frecuencias absolutas del renglón de la moda y la
frecuencia del inmediato anterior.
𝑑2 Diferencias entre las frecuencias absolutas del renglón de la moda y la
frecuencia siguiente.
𝑐 Tamaño del intervalo donde se localiza la moda.

4. Medidas de dispersión

Las medidas de tendencia central solamente localizan el centro de los datos, pero un promedio
no indica nada si no se establece como están distribuidos los datos con respecto al citado
promedio. En tal sentido se hace necesario establecer qué tanto están alejados con respecto a
la media; es decir, describir la variabilidad o dispersión de los datos considerados.

4.1. Varianza y desviación estándar

Rango y Amplitud

El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Se utiliza en aplicaciones del control estadístico de la calidad y de los procesos de producción.

𝑅 = 𝑥𝑀 − 𝑥𝑚 (𝑅𝑎𝑛𝑔𝑜 𝑜 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛)

La varianza se define como el promedio de las desviaciones cuadráticas de los datos con
respecto a la media. La desviación estándar se define como la raíz cuadrada de la varianza. Se
extrae la raíz con el propósito de mantener las unidades de los datos originales.

Para la población se utiliza la fórmula:

∑(𝑥𝑖 − 𝜇)2
𝜎=√
𝑁

Donde:

𝜎: Desviación estándar de la población


𝑥𝑖 : Valor de cada dato de la población
𝜇: Promedio Aritmético.
10

𝑁: Tamaño de la población.

Para la muestra se presentan cambios en cuanto a simbología y un factor de corrección en su


valor, causado por el error de muestreo así:

(∑ 𝑥)2
∑(𝑥𝑖 − 𝜇)2 ∑ (𝑥 2 − )
√ 𝑛
𝑠=√ =
𝑛−1 𝑛−1

𝑠: Desviación estándar de la muestra


𝑥𝑖 : Valor de cada dato de la muestra
𝜇: Promedio aritmético
𝑛: Tamaño de la muestra

Si los datos se encuentran agrupados en una tabla de distribución de frecuencias, la fórmula para
la desviación estándar se convierte entonces en:

∑(𝑥𝑖 − 𝜇)2 𝑓𝑖
𝑆=√
𝑛−1

Haciendo uso de la última columna de la tabla de frecuencias.

4.2. Desviación media y coeficiente de variación

Desviación media

Es el promedio de los valores absolutos de las desviaciones con respecto a la media.

∑ |𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛

Coeficiente de variación

Es una medida relativa que se define como el cociente entre la desviación estándar y la media
aritmética, expresada como un porcentaje. Su utilidad radica en poder comparar conjuntos de
datos que tienen diferentes unidades o los datos están en las mismas unidades, pero los valores
medios están muy distantes. El resultado se expresa en porcentaje y se calcula de la forma
siguiente:
𝑠
𝐶𝑉 =
𝑥̅

Por ejemplo, si el cálculo anterior para dos conjuntos de datos nos da el 20% y el 10%, se
interpreta que el primer conjunto tiene una mayor dispersión relativa, con respecto a la media de
la distribución.
11

5. Probabilidad

Gran parte de la vida del hombre se caracteriza por la incertidumbre. Muchos fenómenos del
mundo parecen estar dominados por el comportamiento aleatorio. Casi todas las decisiones se
toman en un entorno caracterizado por la ausencia de un conocimiento completo de la situación.
Así, una decisión acerca de la cantidad de unidades a fabricar se basa en las estimaciones del
número de unidades que se espera vender. El término probabilidad se refiere al estudio de la
aleatoriedad y la incertidumbre. En cualquier situación donde se produzca uno o más de varios
resultados, la teoría de la probabilidad proporciona métodos adecuados para cuantificar las
posibilidades, oportunidades o simplemente probabilidades.

5.1. Definición y Problemas de aplicación

La probabilidad es una medida de la posibilidad relativa de que un evento ocurra en el futuro, se


relaciona con procesos aleatorios caracterizados por el azar.

Hay tres enfoques de probabilidad: clásica, empírica y subjetiva.

Clásica o a-priori:

Se basa en la consideración de que los resultados de un experimento son igualmente posibles.


Los resultados son probables, el resultado se puede dar por anticipado y se calcula de la forma
siguiente.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠


𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Empírica o a-posteriori:

Se basa en las frecuencias relativas. Los resultados no se pueden dar con anterioridad.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑖ó 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑒𝑛 𝑒𝑙 𝑝𝑎𝑠𝑎𝑑𝑜


𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Subjetiva:

Probabilidad que es asignada por un experto basándose en cualquier información o chisme


disponible.

Adicionalmente consideremos otras clases de eventos:

Dos o más eventos son mutuamente excluyentes si la ocurrencia de cualquiera de ellos, implica
que ninguno de los otros eventos pueda ocurrir al mismo tiempo, o sea, no pueden ocurrir o
presentarse al mismo tiempo. Por ejemplo, es chino o es china, o es tuerca o es tornillo; pero no
las dos cosas a la vez.
12

Dos o más eventos son independientes si la ocurrencia de un evento no afecta la probabilidad


de ocurrencia de otros. Lo denominamos muestreo con reposición.

Los eventos son dependientes si la ocurrencia de un evento afecta la ocurrencia de otro. En este
caso se realiza un muestreo sin reposición.

Colectivamente exhaustivo: Si por lo menos uno de los eventos debe ocurrir cuando se realiza
un experimento, es decir su unión explica todos los posibles resultados de un experimento.

5.2. Reglas de la multiplicación

De acuerdo con los enfoques clásico o empírico para determinar probabilidades, el valor de
probabilidad se basa en el cociente del número de resultados elementales igualmente probables
que son favorables, con respecto al número total de resultados en el espacio muestral. Cuando
los problemas son simples, es posible contar en forma directa los resultados elementales, sin
embargo, en la práctica no se puede llevar a cabo tan fácilmente esta labor. Para determinar el
número de posibles resultados elementales, hacemos uso de ciertas reglas o principios de
conteo.

Principio de la multiplicación

Si dos experimentos se realizan en orden o en sucesión y si hay n1 posibles resultados en el


primero y n2 en el segundo, entonces habrá n1 n2 resultados posibles combinados. Se parte de
la hipótesis de que el resultado del primer experimento no influye en el resultado del segundo.

Si N experimentos se realizan en orden o en sucesión con 𝒏 , 𝒏𝟐 , … , 𝒏𝑵 posibles resultados


para N experimentos, entonces habrá l primero y n2 en el segundo, entonces habrá 𝒏𝟏 ∙ 𝒏𝟐 ∙ …
∙ 𝒏𝑵 posibles resultados combinados.

Ejemplo

El principio también es aplicable a la emisión de placas de automóviles, donde las tres primeras
posiciones son letras, con determinadas restricciones y las tres últimas son dígitos. El número
total de placas emitidas en una ciudad estará dado por:

𝑛1 ∙ 𝑛2 ∙ 𝑛3 ∙ 𝑛4 ∙ 𝑛5 ∙ 𝑛6 = 𝑀𝐾𝑈170 = (5)(18)(26)(10)(10)(10) = 2.340.000 𝑝𝑙𝑎𝑐𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.

5.3. Problema condicional

La probabilidad de un evento E es un número comprendido entre 0 y 1 ambos inclusive, en


símbolos:
0 ≤ 𝑃(𝐸) ≤ 1

Una probabilidad en tanto por uno se debe expresar con 4 cifras decimales Ej. 0,3658. La anterior
cifra se puede escribir como 36,58%. Un valor cercano a cero significa que es poco probable que
el evento suceda. Un valor cercano a uno significa que es altamente probable que el evento
suceda.
13

La probabilidad de que un evento suceda es igual a uno menos la probabilidad de que el evento
no ocurra y viceversa. Se conoce con el nombre de regla del complemento.

𝑃(𝐸) = 1 − 𝑃(𝐸′)
𝑃(𝐸′) = 1 − 𝑃(𝐸)

Si dos eventos E1 y E2 son mutuamente excluyentes, la regla especial de la adición indica que
la probabilidad de que ocurra uno u otro de los eventos, es igual a la suma de sus probabilidades
simples.

𝑃(𝐸1 ∪ 𝐸2) = 𝑃(𝐸1) + 𝑃(𝐸2)

Dados n eventos E1, E2, E3…… En mutuamente excluyentes, la probabilidad de que ocurra uno
u otro de los eventos, es igual a la suma de sus probabilidades simples o probabilidades
marginales.

𝑃(𝐸1 ∪ 𝐸2 ∪ 𝐸3……. ∪ 𝐸𝑛 ) = 𝑃(𝐸1) + 𝑃(𝐸2) + 𝑃(𝐸3) + ⋯ + 𝑃(𝐸𝑛 )

Si dos eventos E1 y E2 son no mutuamente excluyentes, la regla especial de la adición indica que
la probabilidad de que ocurra uno u otro de los eventos o ambos a la vez, se puede expresar
mediante la siguiente fórmula:

𝑃(𝐸1 ∪ 𝐸2) = 𝑃(𝐸1) + 𝑃(𝐸2) − 𝑃(𝐸1 ∩ 𝐸2)

Si dos eventos E1 y E2 son independientes, entonces la probabilidad conjunta de que estos se


sucedan al mismo tiempo o en sucesión es igual al producto de las probabilidades marginales,
algunos autores la nombran como regla especial de la multiplicación, y se puede expresar
mediante la siguiente fórmula:

𝑃(𝐸1 ∩ 𝐸2) = 𝑃(𝐸1)𝑃(𝐸2)

Es una generalización para “n” eventos independientes, entonces la probabilidad conjunta que
los E1, E2, E3…… En eventos ocurran al mismo tiempo o en sucesión es igual al producto de
las probabilidades marginales y se puede expresar mediante la siguiente fórmula:

𝑃(𝐸1 ∩ 𝐸2 ∩ 𝐸3……. ∩ 𝐸𝑛 ) = 𝑃(𝐸1)𝑃(𝐸2)𝑃(𝐸3) … 𝑃(𝐸𝑛 )

5.4. Probabilidad condicional

Es la probabilidad de que ocurra un evento determinado, dado que otro evento ya haya ocurrido.

La probabilidad de que ocurra el evento A dado que el evento B ha ocurrido se escribe P(A/B).

¡Recordemos la definición de eventos independientes!

Dos o más eventos son independientes si la ocurrencia de un evento no afecta la probabilidad


de ocurrencia de otros eventos. Así mismo, dos eventos son dependientes si la probabilidad de
ocurrencia de un evento es afectada por la ocurrencia o no ocurrencia del otro evento.
14

De acuerdo con lo expresado la regla general de multiplicación es utilizada para encontrar la


probabilidad conjunta de que dos eventos ocurran y se determina para eventos independientes
y dependientes de la siguiente forma:

La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran
se encuentra multiplicando la probabilidad de que suceda A, por la probabilidad condicional de
que ocurra el evento B.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)

Si los eventos son independientes.

5.5. Teorema de Bayes

En el siglo XVIII el reverendo Thomas Bayes quería probar la existencia de Dios, para ello intentó
desarrollar una fórmula matemática con base en evidencias terrenales disponibles. Más adelante,
Laplace afinó el trabajo de Bayes y le dio el nombre de Teorema de Bayes. Es conocido como la
fórmula de la probabilidad de causas. La probabilidad condicional tiene en cuenta información
adicional acerca de la ocurrencia de un evento para encontrar la probabilidad de otro. En este
caso, para expresar la probabilidad condicional de un evento aleatorio A dado que sucedió B
necesitamos primero otro resultado y como se vería afectado su valor.

Parte de una situación en la que es posible conocer las probabilidades de que ocurra una serie
de sucesos Ai. A esta se añade un suceso B cuya ocurrencia proporciona cierta información, ya
que las probabilidades de ocurrencia de B son diferentes y dependen de que Ai haya ocurrido.
Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos indica cómo
modifica esta información las probabilidades de los sucesos Ai.

En la sección de las reglas básicas de probabilidad habíamos enunciado que se puede


determinar una probabilidad condicional para eventos independientes y dependientes de la
siguiente forma:

La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran
se encuentra multiplicando la probabilidad de que suceda A, por la probabilidad condicional de
que ocurra el evento B.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)

Si los eventos son independientes.

Si dos eventos E1 y E2 son independientes, entonces la probabilidad condicional de que ocurra


E1 dado que ocurrió E2, es equivalente a la probabilidad marginal de E1. Igualmente, la
probabilidad condicional de que ocurra E2 dado que ocurrió E1, es equivalente a la probabilidad
marginal de E2., en símbolos lo expresamos:

𝑃(𝐸1|𝐸2) = 𝑃(𝐸1)

𝑃(𝐸2|𝐸1) = 𝑃(𝐸2)
15

Si dos eventos E1 y E2 son dependientes, entonces la probabilidad condicional de que ocurra


E1 dado que ocurrió E2, es igual a la probabilidad conjunta de los eventos E1 y E2 dividida entre
la probabilidad marginal o probabilidad simple de E2. De igual manera, se expresa la probabilidad
condicional de que ocurra E2 dado que ocurrió E1, en símbolos lo expresamos:

P(E1 ∩ E2)
P(E1|E2) =
P(E2)

P(E1 ∩ E2)
P(E2|E1) =
P(E1)

De igual manera para comprender el nombrado Teorema de Bayes, se hace necesario tener
presente los enfoques de clásico (a priori) y empírico (a posteriori).

Teniendo en cuenta lo expuesto, la probabilidad se calcula haciendo uso de la fórmula


generalizada del “Teorema de Bayes”, en la cual se parte de la hipótesis de que los Ai eventos
son mutuamente excluyentes y colectivamente exhaustivos.

𝑃(𝐴)𝑃(𝐵|𝐴𝑖 )
𝑃(𝐴𝑖 |𝐵) =
𝑃(𝐴𝑖 )𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵|𝐴2 ) + ⋯ + 𝑃(𝐴𝑛 )𝑃(𝐵|𝐴𝑛 )

5.6. Regla de la suma

Si dos o más sucesos son tales, que solamente uno de ellos puede ocurrir en un solo ensayo, se
dice que son mutuamente excluyentes. Se denomina probabilidad aditiva y será igual a la suma
de las probabilidades de cada suceso.

𝑃 = 𝑃1 + 𝑃2 + 𝑃3 + ⋯ + 𝑃𝑛

Consideremos que p1, p2, p3,................pn son las distintas probabilidades de n sucesos
mutuamente excluyentes, la probabilidad (P) de que uno de estos sucesos se presente en un
solo ensayo, estará dada por la suma de las probabilidades para cada suceso.

𝑃 = 𝑃1 + 𝑃2 + 𝑃3 + ⋯ + 𝑃𝑛

De acuerdo a lo anterior, mutuamente excluyente significa que solamente un solo suceso o


evento puede ocurrir, o sea que los demás no se pueden presentar al mismo tiempo. La fórmula
anterior la podemos expresar de una manera más fácil y entendible:

𝑃(𝐴𝑜𝐵) = 𝑃𝐴 + 𝑃𝐵

𝑃(𝐴𝑜𝐵𝑜𝐶) = 𝑃𝐴 + 𝑃𝐵 + 𝑃𝐶 = PAUBUC

donde U significa unión.


16

5.7. Diagrama de Árbol

El diagrama de árbol es una representación gráfica útil para organizar cálculos que abarcan
varias etapas. Cada segmento en el árbol es una etapa del problema. Las probabilidades escritas
cerca de las ramas son las probabilidades condicionales del experimento.

Ejemplo

En una bolsa que contiene 7 chips rojos y 5 chips azules, se seleccionan dos chips uno después
del otro sin reemplazarlo. Elabore un diagrama de árbol mostrando esta información.

Ilustración 3. Diagrama de árbol

Fuente: (Estadística y Probabilidad, 2016)

Referencias

Ortega L.H. (2016). Estadística y probabilidad. MATHUMBI.

Martínez C. (2013) Estadística y probabilidad. Ecoe Ediciones.

También podría gustarte