Está en la página 1de 28

Estadística

Términos y Medidas Estadísticas


Estadística
-La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis
de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre
fenómenos observados.
-Es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio
que la genera siguiendo las leyes de la probabilidad.
Variables Cuantitativas
Cantidades determinísticas
Son cantidades que tienen un valor fijo y este permanece invariable.
Ejm: El kilo, duración de un minuto.
Cantidades estocásticas
Son cantidades que tienen un valor aleatorio o pueden variar.
Ejm: La altura de una mujer ecuatoriana, duración de una batería de celular, vida útil de
una computadora.
Variables Cualitativas
Son aquellos cuyos valores o resultados no se pueden asociar a un número
• Nominales: Sus valores no se pueden ordenar. (Grupo sanguíneo, religión)
• Ordinales: Sus valores se pueden ordenar (Grado de satisfacción, Nivel de luz)
Población
Conjunto sobre el cual se estudiará alguna característica
Ejm: Estudiantes de una universidad (característica a estudiar: cantidad de dinero que
gastan a diario en la universidad), Turistas extranjeros que van a Galápagos (característica
a estudiar: País de origen del turista), Bolsos hechos en Italia (característica a estudiar:
Material del que están compuesto)
Censo
Recolección de datos de toda la población
*No siempre es posible abarcar a toda una población debido a la logística que requiere o
es demasiado grande la población
Muestra
Subconjunto de una población
Ejm: (Población: Estudiantes de una universidad – Muestra: Estudiantes de la facultad de
administración), (Población: Turistas extranjeros que van a Galápagos – Muestra: Turistas
que vienen del continente asiático)
Parámetro
-Es un número que resume la gran cantidad de datos que pueden derivarse del estudio de
una variable estadística.
-Característica de interés de una población
Ejm: (Población: Estudiantes de una universidad – Parámetro: Mínima cantidad de dinero
que llevan los estudiantes), (Población: Turistas extranjeros que van a Galápagos –
Muestra: Cantidad promedio de turistas por año que visitan Galápagos)
Estimador
-Característica medida en una muestra.
(Muestra: Estudiantes de la facultad de administración – Estimador: Mínima cantidad de
dinero que llevan los estudiantes de dicha facultad), (Muestra: Turistas que vienen del
continente asiático – Estimador: Edad promedio de los turistas que vienen de Asia a
Galápagos)
*El estimador no será igual al parámetro.
*Si la muestra es representativa (la muestra se aproxima a la población), el estimador se
asemejará al parámetro.
*Cálculo del parámetro requiere censo (porque así se cubre a toda la población)
*Cálculo de un estimador es más económico (porque se requiere una parte de la población
“se estudian a menos entes, seres u objetos”)
Frecuencias
Indica la cantidad de veces que se repite una observación.
Medidas de tendencia central y dispersión
Medidas de tendencia central
Es un número situado hacia el centro de la distribución de los valores de una serie de
observaciones (medidas), en la que se encuentra ubicado el conjunto de los datos.
Este número por lo general suele representar a todas las medidas realizadas.

1. Media aritmética o promedio


Representa a todas las medidas realizadas. Se representa con el símbolo 𝑥̅ . Se
define de la siguiente manera:

2. Mediana
Es el valor “de en medio” de entre todos los valores obtenidos y ordenados.
Se expresa con el símbolo 𝑥̃ .
Se la puede obtener a través de la siguiente fórmula.
Ejm:

Supongamos que se han obtenido 7 valores. Y que cada 𝑥1 , 𝑥2 , . . . . . . 𝑥𝑛 tienen un


valor, entonces la mediana será el valor de 𝑥4 .

Medidas de ubicación
Mediana
La mediana divide la muestra en 2 partes.

Donde se puede dar lo siguiente:


➢ Al menos de la mitad de las observaciones son menores o iguales que la mediana.
➢ Al menos de la mitad de las observaciones son mayores o iguales que la mediana.
Moda
Es el valor con mayor frecuencia (el valor que más veces sale o se repite).
La moda existe siempre y cuando todos los valores/observaciones no tengan la misma
frecuencia. Sin embargo, si puede existir más de una moda.
Cuartiles
Divide la muestra en 4 partes: 𝑞1 , 𝑞2 , 𝑞3 .

Donde:
➢ Al menos el 25% de las observaciones son menores o iguales que 𝑞1
➢ 𝑞2 es la mediana.
➢ Al menos el 75% de las observaciones son menores o iguales que 𝑞3
También se pueden definir otras formas de dividir la muestra como terciles (𝑡1 , 𝑡2 ), deciles,
percentiles, etc.

Cuantil
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de
una variable aleatoria (son las divisiones de una muestra, de aquí nacen los terciles,
cuartiles, deciles, etc.).
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable 𝑥𝑝 que
marca un corte de modo que una proporción p de valores de la población es menor o igual
que 𝑥𝑝 .

Se define al p-ésimo cuantil de una muestra de la siguiente forma:

𝑐𝑝 = 𝑥(𝑝[𝑛+1])
De tal manera que:
➢ Si p[n+1] es entero, entonces el cuantil será una de las observaciones de la
muestra.
➢ Si p[n+1] no es entero, entonces el cuantil será el promedio de 2 observaciones.

• Sea k la parte entera de p[n+1] y α la parte decimal.


• El p-ésimo cuantil viene dado por:

𝑐𝑃 = 𝑥(𝑘) + 𝛼(𝑥(𝑘+1) − 𝑥(𝑘) ) = (1 − 𝛼)𝑥(𝑘) + 𝛼𝑥(𝑘+1)

-Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles
0,25; 0,50 y 0,75).
-Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles
0,20; 0,40; 0,60 y 0,80).
Ejm1:

Tercer cuartil: 𝑞3 = 𝑐(0,75)

Donde n=24, entonces 0,75(24+1)=18,75

𝑞3 = 𝑥(18,75) = 𝑥(18) + 0,75(𝑥(19) − 𝑥(18) ) = (0,25)𝑥(𝟏𝟖) + 0,75𝑥(19)


Podemos concluir que de las 24 observaciones

• 18 son menores o iguales que 𝑞3 , el 75% exacto


• 6 son mayores o iguales que 𝑞3 , el 25% exacto

Ejm2:

Primer quintil: 𝑞1 = 𝑐(0,20)

Donde n=19, entonces 0,20(19+1)=4

𝑞1 = 𝑥(4)
Podemos concluir que de las 19 observaciones

• 4 son menores o iguales que 𝑞1 , el 21,05%


• 16 son mayores o iguales que 𝑞1 , el 84,21%
Medidas de dispersión
Nos indica cuanto varían los datos.
Rango
Intervalo entre un valor máximo y un valor mínimo.

𝑟 = 𝑥(𝑓) − 𝑥(𝑖)
Rango intercuantil
Intervalo entre un cuantil máximo y un cuantil mínimo.

𝑖𝑟 = 𝑞(𝑓) − 𝑞(𝑖)
Varianza
Representa la variabilidad de una serie de datos respecto a su media elevadas al cuadrado
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

Desviación estándar
Representa la variabilidad de una serie de datos respecto a su media

𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un
rango de valores más amplio.
Ejm:
Tenemos las notas de los exámenes de los estudiantes de estadística. Calcular la
desviación estándar. Si las notas vienen dadas de la siguiente manera
(50,60,10,56,96,60)
50 + 60 + 10 + 56 + 96 + 60 332
𝑥̅ = = = 55,33
6 6
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

∑(𝑥𝑖 − 𝑥̅ )2 = (50 − 55,33)2 + (60 − 55,33)2 + (10 − 55,33)2 + (56 − 55,33)2 + (96 − 55,33)2 + (60 − 55,33)2
𝑖=1
= 3781.33
𝟑𝟕𝟖𝟏. 𝟑𝟑
𝒔=√ = 𝟐𝟕, 𝟓𝟐
𝟓

Curtosis
Denota la concentración de valores que están representados en una gráfica. Una curtosis
grande implica una mayor concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que existe una relativamente
menor frecuencia de valores intermedios.
Estas se clasifican en:
➢ Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media, siendo una
curva muy apuntada.

➢ Mesocúrtica: la Curtosis=0. Distribución normal.

➢ Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media, presentando


una forma muy achatada.

Gráficos estadísticos
Diagramas de caja
Son una presentación visual que describe varias características importantes, al mismo tiempo,
tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.
Valor Aberrante

Valor Aberrante o Atípico: Es una observación que es numéricamente distante del resto de los
datos.

Estas asimetrías también se conocen como sesgos los cuales se clasifican según su
inclinación.
Note que el sesgo se refiere a que se considera una gran parte de un lado de los datos
mientras que el otro no se le tiene mucha importancia. (Debido a esto es que el sesgo va en
dirección a la menor cantidad representativa entre las mediciones u observaciones) Ejm. Si en
una población hay una gran cantidad de personas que son diestros (su mano dominante es la
derecha) entonces existe un sesgo respecto a los zurdos ya que no representan a muchas
personas.
Si la mediana se sitúa en el centro de la caja entonces la distribución es simétrica y tanto la
media, mediana y moda coinciden.
Diagrama de barras
Se usa en variable discreta. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura sea igual a la
frecuencia absoluta de ese valor.
Histograma
Se utiliza con variables continuas, o agrupadas en intervalos, representando en el eje X los
intervalos de clase y levantando rectángulos de base la longitud de los distintos intervalos y de
altura tal que el área sea proporcional a las frecuencias representadas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de
los rectángulos.

Diagrama de Sectores
Es un gráfico empleado fundamentalmente para variables cualitativas.
Las modalidades se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia
relativa de cada modalidad o valor por 360º.

Ojivas
Representan la frecuencia acumulada, se construye uniendo los puntos más altos de cada
columna de un histograma que represente las frecuencias acumuladas
Sesgo a la derecha Sesgo a la izquierda

Diferencia entre el polígono de frecuencias y ojiva


El polígono de frecuencias parte desde el histograma de frecuencias absolutas, mientras que la
ojiva parte del histograma de frecuencias acumuladas. Además, el polígono de frecuencias se
forma uniendo los puntos medios de la parte superior de cada barra, mientras que la ojiva se
forma uniendo el extremo derecho de la parte superior de cada barra.
En el siguiente gráfico, se apreciará mejor:

Fuente: https://matemovil.com/histogramas-ejemplos-y-ejercicios/

Observaciones Multivariantes
Se da cuando hay mas de 1 característica de interés en una población.
Cuando se toman mas de una medida en un mismo individuo estas suelen tener alguna
relación Ejm: A mayor estatura mayor peso.
Observaciones Bivariantes
Tenemos 2 datos que vendrían en ℝ2 . (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ). . . . . . . . . (𝑥𝑛 , 𝑦𝑛 ) , Estos pueden ser
graficados en una gráfica de dispersión.
Decimos que una relación es perfecta cuando la grafica tiene un comportamiento lineal.
Cuando una relación no es perfecta entonces es una relación estadística.
Medida de Covariación
Nos permite definir el comportamiento de nuestras observaciones. Se usa la siguiente formula
(𝑥𝑖 − 𝑥̅ ) × (𝑦𝑖 − 𝑦̅)
Comportamiento curvilíneo
Comportamiento lineal creciente

Covarianza
Indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el
dato básico para determinar si existe una dependencia entre ambas variables

Si la covarianza >>0 (muy alejada de cero), la relación es creciente


Si la covarianza <<0 (muy alejada de cero), la relación es decreciente
Caso contrario si es muy cercano o igual a cero entonces no hay relación o la relación no es
creciente ni decreciente
Correlación
Indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. (sus valores están entre 1 y -1)

Si la correlación 𝑟𝑥𝑦 ≈ 1 (muy cercano a cero), la relación es creciente

Si la correlación 𝑟𝑥𝑦 ≈ −1 (muy cercano a cero), la relación es decreciente

Si la correlación 𝑟𝑥𝑦 = 1 Línea recta.


Experimento
Es cualquier proceso que proporciona datos, numéricos o no numéricos
Ejm: Al dar a luz conocer el género de los 2 hijos, al lanzar 1 dado saber el numero resultante.

Al conjunto de posibles resultados de un experimento se los denota con el símbolo Ω.


Ejm:
• En el experimento del género de los 2 hijos , Ω = {HH,HM,MM}
• En el experimento del dado, Ω ={1,2,3,4,5,6}
Espacio Muestral
El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio
y se suele representar por la letra S, donde S es subconjunto del conjunto potencia de Ω.
Por ejemplo, cuando lanzamos una moneda, ¿cuáles son todos los posibles resultados que
podemos obtener? Que salga cara o cruz, ¿verdad? En total son dos posibles resultados, por lo
que el espacio muestral tiene 2 elementos.
Ω = {cara, cruz}
Y si lanzamos un dado, tenemos en total 6 posibles resultados que pueden salir. Por lo tanto el
espacio muestral sería de 6 elementos.
S= {1, 2, 3, 4, 5, 6}.
Suceso o Evento
Un suceso es cualquier subconjunto o elemento del espacio muestral. Denotados con la letra E.
Ejm
“Sacar cara” en el lanzamiento de una moneda, “sacar el número 5” o “sacar un número primo”
en el lanzamiento de un dado son sucesos.
Probabilidad
La probabilidad asociada a un suceso o evento aleatorio es una medida del grado de
certidumbre de que dicho suceso pueda ocurrir. Se suele expresar como un número entre 0 y
1, donde un suceso imposible tiene probabilidad cero y un suceso seguro tiene probabilidad
uno.
Cálculo de probabilidad
Se utiliza la regla de Laplace, la cual establece que: en el caso de que todos los resultados de
un experimento aleatorio sean equiprobables, Laplace define la probabilidad de un suceso A
como el cociente entre el número de resultados favorables a que ocurra el suceso A en el
experimento y el número de resultados posibles del experimento.
#𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑜 𝐸𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
𝑃(𝐸) =
#𝛺 𝑜 𝑇𝑜𝑑𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Ejm:
Tenemos las 27 letras en un alfabeto y queremos saber la probabilidad que la letra que
saquemos sea una vocal.
5
𝑃(𝑆𝑎𝑐𝑎𝑟 𝑉𝑜𝑐𝑎𝑙) = = 0,16 𝑜 16%
27
Técnicas de Conteo
Las técnicas de conteo nos permitirán establecer el espacio muestral para el cálculo de
probabilidades.
Permutación
Una permutación de un conjunto de elementos es una disposición de dichos elementos
teniendo en cuenta el orden. El número de permutaciones de “n” elementos tomados de “k” en
“k” se calcula con la fórmula:

Ejm:
Eduardo, Carlos y Sergio se han presentado a un concurso de pintura. El concurso otorga $200
al primer lugar y $100 al segundo. ¿De cuántas formas se pueden repartir los premios de
primer y segundo lugar?
Permutación con repetición
La permutación con repetición se usa cuando en un total de “n” elementos, el primero se repite
“a” veces, el segundo “b” veces, el tercero “c” veces…
La fórmula para calcular el número de permutaciones u ordenamientos es la siguiente:

Donde:
• n = a+b+c
Hay tres condiciones en la permutación con repetición:
• Importa el orden.
• Hay elementos repetidos.
• Participan todos los elementos en los ordenamientos.
Ejm:
Cuantas palabras diferentes se pueden formar con las letras de la palabra BANANA.
Número de veces que se repite la letra B = 1
Número de veces que se repite la letra A = 3
Número de veces que se repite la letra N = 2

Número total de elementos: n = 1+3+2 ➜ n = 6

Combinación
Una combinación de un conjunto de elementos es una selección de dichos elementos sin tener
en cuenta el orden.
El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:

Ejm:
Se va a programar un torneo de ajedrez para los 10 integrantes de un club. ¿Cuántos partidos
se deben programar si cada integrante jugará con cada uno de los demás sin partidos de
revancha?
Combinación con repetición
Las combinaciones con repetición de m elementos tomados de n en n (m \ge n), son los
distintos grupos formados por n elementos de manera que:
• No entran todos los elementos.
• No importa el orden.
• Sí se repiten los elementos.

𝑛+𝑘−1 (𝑛 + 𝑘 − 1)! (𝑛 + 𝑘 − 1)!


( )= =
𝑘 (𝑛 + 𝑘 − 1 − 𝑘)! 𝑘! (𝑛 − 1)! 𝑘!
Ejm:
En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas se pueden elegir
cuatro botellas?
Podemos deducir lo siguiente:
➢ No entran todos los elementos. Sólo elije 4.
➢ No importa el orden. Da igual que elija 2 botellas de anís y 2 de ron, que 2 de ron y 2 de
anís.
➢ Sí se repiten los elementos. Puede elegir más de una botella del mismo tipo

Planteamiento de los separadores y cajas


Nos permite establecer una relación ente variables y una igualdad, en el cual los espacios u
ánforas creados por los separadores representaran a las variables y el total de los elementos
de dichas ánforas representara la igualdad. Finalmente tendríamos que calcular de cuantas
maneras se podrían distribuir los separadores.
De tal forma que tendríamos la siguiente formula:
Sea:
• n: la cantidad de elementos total o la igualdad a la que se quiere llegar
• m: la cantidad de variables o ánforas necesarias para la igualdad
• k: la cantidad de separadores que es igual a m-1

𝑛+𝑘 (𝑛 + 𝑘)!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!
A continuación, un ejemplo para que quede más claro lo anterior mencionado.
Ejm:
Cuantas posibles soluciones con valores no negativos satisfacen la siguiente ecuación

𝑥1 + 𝑥2 + 𝑥3 = 10
El planteamiento sería el siguiente:
Podemos usar números del 0 al 10, tendiendo soluciones del tipo:
• 10+0+0=10
• 3+3+4=10
• …….
En un caso tendríamos la siguiente solución

En otro caso tendríamos la siguiente

Ahora solo nos queda determinar de cuantas maneras podríamos distribuir los separadores.
Nuestras variables quedan de la siguiente manera:
• n: 10
• m: 3
• k: m-1= 3-1=2
10 + 2 (12)!
( )= = 66
2 (8)! 2!
Este ejercicio puede ser resuelto a través de combinación con repetición.
Y quedaría de la siguiente manera

10 + 3 − 1 (12)!
( )= = 66
10 (9)! 10!
Queda al lector demostrar o entender la resolución planteada por combinación con repetición.
Ejercicios de cálculo de probabilidades:
Ej1:
Una empacadora de frutas 12 frutas de tipo (dulce, seca y cítrica) y tene

Ej2:
En una mesa redonda para 5 personas se sientan (José, María, Pepe, Sech, Manuel). ¿Cuál es
la probabilidad qué Manuel y María se sienten juntos?
• Primero definimos el espacio muestral, así que calculamos todas posibles maneras en
que se puedan sentar todos:
n!=5!=120
Nos queda que #𝛺 = 120
• Calculamos como se podrían sentar Manuel y María asumiendo que son una persona.
n!=4!=24
Finalmente
24
P(MyM) = = 0,2
120
Probabilidad Condicional
Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La
probabilidad condicional se escribe P(A|B) o P(A/B), y se lee «la probabilidad de A dado B».
Ejm:
¿Cuál es la probabilidad de que alguien sufra un robo en diciembre?. Como podemos darnos
cuenta existe una probabilidad de sufrir un robo, pero en el mes de diciembre la probabilidad de
sufrir un robo aumenta. Tendríamos una probabilidad más alta
¿Cuál es la probabilidad de que llueva en Guayaquil en Junio?. En este caso existe una
probabilidad de que llueva en Guayaquil, pero esta probabilidad disminuye al ser en el mes de
junio ya que se estaría en la estación seca.
La probabilidad condicional de 𝐸2 dado 𝐸1 se define como:

𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Cumpliéndose las siguientes condiciones

➢ 𝑃(𝐸2 |𝐸1 ) ≥ 0
➢ 𝑃(𝐸1 |𝐸1 ) ≥ 1
➢ 𝐸2 ∩ 𝐸3 = ∅ ⇒ 𝑃(𝐸2 ∩ 𝐸3 |𝐸1 ) = 𝑃(𝐸2 |𝐸1 ) + 𝑃(𝐸3 |𝐸1 )

Ejm:

Note que 𝑃(𝐸2 |𝐸1 ) es la probabilidad de 𝐸2 Sobre el conjunto u subespacio del espacio
muestral dado por E1 .
Ejm:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste la
fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el
chocolate.
Evento A: que a un amigo le gusten los fresa. P(A) = ?
Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25 %.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el
chocolate.
Independencia
Se da cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra
o no, es decir, cuando ambos sucesos no están relacionados.

Existe independencia de condición si se cumple que : 𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸1 )𝑃(𝐸2 )


Además, cuando dos eventos son independientes sucede que:

𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 )𝑃(𝐸2 )


𝑃(𝐸2 |𝐸1 ) = = = 𝑃(𝐸2 )
𝑃(𝐸1 ) 𝑃(𝐸1 )
Se ve claramente que como 𝐸2 es independiente a pesar de que se lo condicione por 𝐸1 su
probabilidad es la misma (es 𝐸2 ).
Conjuntos disjuntos no garantizan la independencia de probabilidad.
Ejm:
Si hay una probabilidad del 10% de que Júpiter se alineará con Marte, y una probabilidad del
50% de que su tirada de una moneda saldrá águilas, entonces ¿qué es la probabilidad de que
Júpiter se alineará con Marte y su tirada de la moneda saldrá águilas (suponiendo que Júpiter
no tenga ningún efecto en el resultado de su tirada)?
J: Júpiter se alineará con Marte
A: Su tirada saldrá águilas
Pues Júpiter no tiene ningún efecto en su tirada de la moneda, tomamos estos sucesos como
independientes, y así la probabilidad de que ambos sucesos ocurrirán es
P(J ∩ A) = P(J)P(A) = (0.10)(0.50) = .05.

Teorema de Bayes
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo
información de antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta
característica que condiciona su probabilidad.

Dado un espacio de probabilidad (𝛺, 𝑆, 𝑃). Con las probabilidades condicionales 𝐸1 y 𝐸2 tal
que:
𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) = y 𝑃(𝐸1 |𝐸2 ) =
𝑃(𝐸1 ) 𝑃(𝐸2 )
Despejando se tendría que:

𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸2 |𝐸1 )𝑃(𝐸1 ) = 𝑃(𝐸1 |𝐸2 )𝑃(𝐸2 )


Finalmente, el teorema de Bayes se define a través de la siguiente formula.

𝑃(𝐸1 ∩ 𝐸2 )𝑃(𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )

Ejm2:
En una academia, la probabilidad de que a un alumno seleccionado al azar le guste el helado
es del 60 %, mientras que la probabilidad de que a un alumno le guste la torta es del 36 %.
Además, se sabe que la probabilidad de que a un alumno le guste la torta dado que le gusta el
helado es del 40 %. Calcular la probabilidad de que a un alumno le guste el helado, dado que
le gusta la torta.
Solución
Primero definimos los 2 eventos con los que vamos a trabajar:
h: que a un alumno le guste el helado.
t: que a un alumno le guste la torta.
Tenemos los siguientes datos:
P(h) = 0,6.
P(t) = 0,36.
P(t|h) = 0,4.
Nos piden calcular P(h|t).
Aplicamos el teorema de Bayes:

Entonces, la probabilidad de que un alumno le guste el helado dado que le gusta la torta es de
0,6667 o 66,67 %.
Probabilidad Total
Sean los eventos A,E ∈ S.
Entonces A se puede particionar en 2 eventos disjuntos:

𝐴 = (𝐴 ∩ 𝐸) ∪ (𝐴 ∩ 𝐸 𝐶 )

Graficamente seria así

Entonces la probabilidad de A viene dado por:

𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐸) + 𝑃(𝐴 ∩ 𝐸 𝐶 )


𝑃(𝐴) = P(𝐴|𝐸)P(E) + 𝑃(𝐴|𝐸 𝐶 )P(𝐸 𝐶 )
Note que son probabilidades condicionadas (no independientes)

Además 𝐸 y 𝐸 𝐶 forman una partición del espacio muestral S.


Ley de probabilidad Total
Si particionamos el espacio muestral en k eventos exhaustivos (la union de todos los k forman
a S(el espacio muetral)) y mutuamente excluyentes (conjuntos disjuntos).
Tal que:

𝐸1 , 𝐸2 , … . , 𝐸𝑘 𝜖 𝑆
De modo que:

𝐸1 ∪ 𝐸2 ∪ … .∪ 𝐸𝑘 = 𝑆
∀i,j 𝜖 N ≤ k ^ i ≠ j / Ei ∩ Ei = ∅
Por lo cual podemos concluir que:
𝑘

𝑃(𝐴) = ∑ 𝑃(𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )


𝑖=1

Siempre y cuando A este particionado por 𝐸𝑖 .


No necesariamente la unión de los eventos debe formar al espacio muestral. Es suficiente con
que la suma de las probabilidades de cada evento sea 1.

Combinando el teorema de Bayes con la ley de la probabilidad total.

𝑃(A|𝐸j )𝑃(𝐸j )
𝑃(𝐸j |A) = 𝑘
∑ 𝑃(𝐴|𝐸j )𝑃(𝐸j )
j=1

Ejm:
En un acuario se tienen solo 2 especies de peces, el 40% son de la especie azul y el 60% son
de la especie roja. De la especie azul, el 30% son machos; mientras que, de la especie roja, el
40% son hembras. ¿Cuál es la probabilidad de que un pez elegido aleatoriamente en el acuario
sea macho?

• 𝑨𝟏 : que un pez elegido aleatoriamente sea de la especie azul. P(𝐴1 )=0,4


• 𝑨𝟐 : que un pez elegido aleatoriamente sea de la especie roja. P(𝐴2 )=0,6
• B: que un pez elegido aleatoriamente sea macho.
• De la especie azul, el 30% son machos. 𝑃(B|A1 ) = 0,3
• El 40% de los peces de la especia roja son hembras, por ello, el 60% serán machos. Por
lo tanto 𝑃(B|A2 ) = 0,6
Ejm2:

También podría gustarte