Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. Mediana
Es el valor “de en medio” de entre todos los valores obtenidos y ordenados.
Se expresa con el símbolo 𝑥̃ .
Se la puede obtener a través de la siguiente fórmula.
Ejm:
Medidas de ubicación
Mediana
La mediana divide la muestra en 2 partes.
Donde:
➢ Al menos el 25% de las observaciones son menores o iguales que 𝑞1
➢ 𝑞2 es la mediana.
➢ Al menos el 75% de las observaciones son menores o iguales que 𝑞3
También se pueden definir otras formas de dividir la muestra como terciles (𝑡1 , 𝑡2 ), deciles,
percentiles, etc.
Cuantil
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de
una variable aleatoria (son las divisiones de una muestra, de aquí nacen los terciles,
cuartiles, deciles, etc.).
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable 𝑥𝑝 que
marca un corte de modo que una proporción p de valores de la población es menor o igual
que 𝑥𝑝 .
𝑐𝑝 = 𝑥(𝑝[𝑛+1])
De tal manera que:
➢ Si p[n+1] es entero, entonces el cuantil será una de las observaciones de la
muestra.
➢ Si p[n+1] no es entero, entonces el cuantil será el promedio de 2 observaciones.
-Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles
0,25; 0,50 y 0,75).
-Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles
0,20; 0,40; 0,60 y 0,80).
Ejm1:
Ejm2:
𝑞1 = 𝑥(4)
Podemos concluir que de las 19 observaciones
𝑟 = 𝑥(𝑓) − 𝑥(𝑖)
Rango intercuantil
Intervalo entre un cuantil máximo y un cuantil mínimo.
𝑖𝑟 = 𝑞(𝑓) − 𝑞(𝑖)
Varianza
Representa la variabilidad de una serie de datos respecto a su media elevadas al cuadrado
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Desviación estándar
Representa la variabilidad de una serie de datos respecto a su media
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un
rango de valores más amplio.
Ejm:
Tenemos las notas de los exámenes de los estudiantes de estadística. Calcular la
desviación estándar. Si las notas vienen dadas de la siguiente manera
(50,60,10,56,96,60)
50 + 60 + 10 + 56 + 96 + 60 332
𝑥̅ = = = 55,33
6 6
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
∑(𝑥𝑖 − 𝑥̅ )2 = (50 − 55,33)2 + (60 − 55,33)2 + (10 − 55,33)2 + (56 − 55,33)2 + (96 − 55,33)2 + (60 − 55,33)2
𝑖=1
= 3781.33
𝟑𝟕𝟖𝟏. 𝟑𝟑
𝒔=√ = 𝟐𝟕, 𝟓𝟐
𝟓
Curtosis
Denota la concentración de valores que están representados en una gráfica. Una curtosis
grande implica una mayor concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que existe una relativamente
menor frecuencia de valores intermedios.
Estas se clasifican en:
➢ Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media, siendo una
curva muy apuntada.
Gráficos estadísticos
Diagramas de caja
Son una presentación visual que describe varias características importantes, al mismo tiempo,
tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.
Valor Aberrante
Valor Aberrante o Atípico: Es una observación que es numéricamente distante del resto de los
datos.
Estas asimetrías también se conocen como sesgos los cuales se clasifican según su
inclinación.
Note que el sesgo se refiere a que se considera una gran parte de un lado de los datos
mientras que el otro no se le tiene mucha importancia. (Debido a esto es que el sesgo va en
dirección a la menor cantidad representativa entre las mediciones u observaciones) Ejm. Si en
una población hay una gran cantidad de personas que son diestros (su mano dominante es la
derecha) entonces existe un sesgo respecto a los zurdos ya que no representan a muchas
personas.
Si la mediana se sitúa en el centro de la caja entonces la distribución es simétrica y tanto la
media, mediana y moda coinciden.
Diagrama de barras
Se usa en variable discreta. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura sea igual a la
frecuencia absoluta de ese valor.
Histograma
Se utiliza con variables continuas, o agrupadas en intervalos, representando en el eje X los
intervalos de clase y levantando rectángulos de base la longitud de los distintos intervalos y de
altura tal que el área sea proporcional a las frecuencias representadas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de
los rectángulos.
Diagrama de Sectores
Es un gráfico empleado fundamentalmente para variables cualitativas.
Las modalidades se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia
relativa de cada modalidad o valor por 360º.
Ojivas
Representan la frecuencia acumulada, se construye uniendo los puntos más altos de cada
columna de un histograma que represente las frecuencias acumuladas
Sesgo a la derecha Sesgo a la izquierda
Fuente: https://matemovil.com/histogramas-ejemplos-y-ejercicios/
Observaciones Multivariantes
Se da cuando hay mas de 1 característica de interés en una población.
Cuando se toman mas de una medida en un mismo individuo estas suelen tener alguna
relación Ejm: A mayor estatura mayor peso.
Observaciones Bivariantes
Tenemos 2 datos que vendrían en ℝ2 . (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ). . . . . . . . . (𝑥𝑛 , 𝑦𝑛 ) , Estos pueden ser
graficados en una gráfica de dispersión.
Decimos que una relación es perfecta cuando la grafica tiene un comportamiento lineal.
Cuando una relación no es perfecta entonces es una relación estadística.
Medida de Covariación
Nos permite definir el comportamiento de nuestras observaciones. Se usa la siguiente formula
(𝑥𝑖 − 𝑥̅ ) × (𝑦𝑖 − 𝑦̅)
Comportamiento curvilíneo
Comportamiento lineal creciente
Covarianza
Indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el
dato básico para determinar si existe una dependencia entre ambas variables
Ejm:
Eduardo, Carlos y Sergio se han presentado a un concurso de pintura. El concurso otorga $200
al primer lugar y $100 al segundo. ¿De cuántas formas se pueden repartir los premios de
primer y segundo lugar?
Permutación con repetición
La permutación con repetición se usa cuando en un total de “n” elementos, el primero se repite
“a” veces, el segundo “b” veces, el tercero “c” veces…
La fórmula para calcular el número de permutaciones u ordenamientos es la siguiente:
Donde:
• n = a+b+c
Hay tres condiciones en la permutación con repetición:
• Importa el orden.
• Hay elementos repetidos.
• Participan todos los elementos en los ordenamientos.
Ejm:
Cuantas palabras diferentes se pueden formar con las letras de la palabra BANANA.
Número de veces que se repite la letra B = 1
Número de veces que se repite la letra A = 3
Número de veces que se repite la letra N = 2
Combinación
Una combinación de un conjunto de elementos es una selección de dichos elementos sin tener
en cuenta el orden.
El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:
Ejm:
Se va a programar un torneo de ajedrez para los 10 integrantes de un club. ¿Cuántos partidos
se deben programar si cada integrante jugará con cada uno de los demás sin partidos de
revancha?
Combinación con repetición
Las combinaciones con repetición de m elementos tomados de n en n (m \ge n), son los
distintos grupos formados por n elementos de manera que:
• No entran todos los elementos.
• No importa el orden.
• Sí se repiten los elementos.
𝑛+𝑘 (𝑛 + 𝑘)!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!
A continuación, un ejemplo para que quede más claro lo anterior mencionado.
Ejm:
Cuantas posibles soluciones con valores no negativos satisfacen la siguiente ecuación
𝑥1 + 𝑥2 + 𝑥3 = 10
El planteamiento sería el siguiente:
Podemos usar números del 0 al 10, tendiendo soluciones del tipo:
• 10+0+0=10
• 3+3+4=10
• …….
En un caso tendríamos la siguiente solución
Ahora solo nos queda determinar de cuantas maneras podríamos distribuir los separadores.
Nuestras variables quedan de la siguiente manera:
• n: 10
• m: 3
• k: m-1= 3-1=2
10 + 2 (12)!
( )= = 66
2 (8)! 2!
Este ejercicio puede ser resuelto a través de combinación con repetición.
Y quedaría de la siguiente manera
10 + 3 − 1 (12)!
( )= = 66
10 (9)! 10!
Queda al lector demostrar o entender la resolución planteada por combinación con repetición.
Ejercicios de cálculo de probabilidades:
Ej1:
Una empacadora de frutas 12 frutas de tipo (dulce, seca y cítrica) y tene
Ej2:
En una mesa redonda para 5 personas se sientan (José, María, Pepe, Sech, Manuel). ¿Cuál es
la probabilidad qué Manuel y María se sienten juntos?
• Primero definimos el espacio muestral, así que calculamos todas posibles maneras en
que se puedan sentar todos:
n!=5!=120
Nos queda que #𝛺 = 120
• Calculamos como se podrían sentar Manuel y María asumiendo que son una persona.
n!=4!=24
Finalmente
24
P(MyM) = = 0,2
120
Probabilidad Condicional
Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La
probabilidad condicional se escribe P(A|B) o P(A/B), y se lee «la probabilidad de A dado B».
Ejm:
¿Cuál es la probabilidad de que alguien sufra un robo en diciembre?. Como podemos darnos
cuenta existe una probabilidad de sufrir un robo, pero en el mes de diciembre la probabilidad de
sufrir un robo aumenta. Tendríamos una probabilidad más alta
¿Cuál es la probabilidad de que llueva en Guayaquil en Junio?. En este caso existe una
probabilidad de que llueva en Guayaquil, pero esta probabilidad disminuye al ser en el mes de
junio ya que se estaría en la estación seca.
La probabilidad condicional de 𝐸2 dado 𝐸1 se define como:
𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Cumpliéndose las siguientes condiciones
➢ 𝑃(𝐸2 |𝐸1 ) ≥ 0
➢ 𝑃(𝐸1 |𝐸1 ) ≥ 1
➢ 𝐸2 ∩ 𝐸3 = ∅ ⇒ 𝑃(𝐸2 ∩ 𝐸3 |𝐸1 ) = 𝑃(𝐸2 |𝐸1 ) + 𝑃(𝐸3 |𝐸1 )
Ejm:
Note que 𝑃(𝐸2 |𝐸1 ) es la probabilidad de 𝐸2 Sobre el conjunto u subespacio del espacio
muestral dado por E1 .
Ejm:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste la
fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el
chocolate.
Evento A: que a un amigo le gusten los fresa. P(A) = ?
Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25 %.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el
chocolate.
Independencia
Se da cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra
o no, es decir, cuando ambos sucesos no están relacionados.
Teorema de Bayes
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo
información de antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta
característica que condiciona su probabilidad.
Dado un espacio de probabilidad (𝛺, 𝑆, 𝑃). Con las probabilidades condicionales 𝐸1 y 𝐸2 tal
que:
𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) = y 𝑃(𝐸1 |𝐸2 ) =
𝑃(𝐸1 ) 𝑃(𝐸2 )
Despejando se tendría que:
𝑃(𝐸1 ∩ 𝐸2 )𝑃(𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Ejm2:
En una academia, la probabilidad de que a un alumno seleccionado al azar le guste el helado
es del 60 %, mientras que la probabilidad de que a un alumno le guste la torta es del 36 %.
Además, se sabe que la probabilidad de que a un alumno le guste la torta dado que le gusta el
helado es del 40 %. Calcular la probabilidad de que a un alumno le guste el helado, dado que
le gusta la torta.
Solución
Primero definimos los 2 eventos con los que vamos a trabajar:
h: que a un alumno le guste el helado.
t: que a un alumno le guste la torta.
Tenemos los siguientes datos:
P(h) = 0,6.
P(t) = 0,36.
P(t|h) = 0,4.
Nos piden calcular P(h|t).
Aplicamos el teorema de Bayes:
Entonces, la probabilidad de que un alumno le guste el helado dado que le gusta la torta es de
0,6667 o 66,67 %.
Probabilidad Total
Sean los eventos A,E ∈ S.
Entonces A se puede particionar en 2 eventos disjuntos:
𝐴 = (𝐴 ∩ 𝐸) ∪ (𝐴 ∩ 𝐸 𝐶 )
𝐸1 , 𝐸2 , … . , 𝐸𝑘 𝜖 𝑆
De modo que:
𝐸1 ∪ 𝐸2 ∪ … .∪ 𝐸𝑘 = 𝑆
∀i,j 𝜖 N ≤ k ^ i ≠ j / Ei ∩ Ei = ∅
Por lo cual podemos concluir que:
𝑘
𝑃(A|𝐸j )𝑃(𝐸j )
𝑃(𝐸j |A) = 𝑘
∑ 𝑃(𝐴|𝐸j )𝑃(𝐸j )
j=1
Ejm:
En un acuario se tienen solo 2 especies de peces, el 40% son de la especie azul y el 60% son
de la especie roja. De la especie azul, el 30% son machos; mientras que, de la especie roja, el
40% son hembras. ¿Cuál es la probabilidad de que un pez elegido aleatoriamente en el acuario
sea macho?