Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. Mediana
Es el valor “de en medio” de entre todos los valores obtenidos y ordenados.
Se expresa con el símbolo 𝑥̃ .
Se la puede obtener a través de la siguiente fórmula.
Medidas de ubicación
Mediana
La mediana divide la muestra en 2 partes.
Donde:
➢ Al menos el 25% de las observaciones son menores o iguales que 𝑞1
➢ 𝑞2 es la mediana.
➢ Al menos el 75% de las observaciones son menores o iguales que 𝑞3
También se pueden definir otras formas de dividir la muestra como terciles (𝑡1 , 𝑡2 ), deciles,
percentiles, etc.
Cuantil
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de
una variable aleatoria (son las divisiones de una muestra, de aquí nacen los terciles,
cuartiles, deciles, etc.).
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable 𝑥𝑝 que
marca un corte de modo que una proporción p de valores de la población es menor o igual
que 𝑥𝑝 .
𝑐𝑝 = 𝑥(𝑝[𝑛+1])
De tal manera que:
-Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles
0,25; 0,50 y 0,75).
-Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles
0,20; 0,40; 0,60 y 0,80).
Ejm1:
Ejm2:
𝑞1 = 𝑥(4)
Podemos concluir que de las 19 observaciones
𝑟 = 𝑥(𝑓) − 𝑥(𝑖)
𝑖𝑟 = 𝑞(𝑓) − 𝑞(𝑖)
Varianza
Representa la variabilidad de una serie de datos respecto a su media elevadas al cuadrado
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Desviación estándar
Representa la variabilidad de una serie de datos respecto a su media
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un
rango de valores más amplio.
Ejm:
Tenemos las notas de los exámenes de los estudiantes de estadística. Calcular la
desviación estándar. Si las notas vienen dadas de la siguiente manera
(50,60,10,56,96,60)
50 + 60 + 10 + 56 + 96 + 60 332
𝑥̅ = = = 55,33
6 6
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
∑(𝑥𝑖 − 𝑥̅ )2 = (50 − 55,33)2 + (60 − 55,33)2 + (10 − 55,33)2 + (56 − 55,33)2 + (96 − 55,33)2 + (60 − 55,33)2
𝑖=1
= 3781.33
Curtosis
Denota la concentración de valores que están representados en una gráfica. Una curtosis
grande implica una mayor concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que existe una relativamente
menor frecuencia de valores intermedios.
Estas se clasifican en:
➢ Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media, siendo una
curva muy apuntada.
Gráficos estadísticos
Diagramas de caja
Son una presentación visual que describe varias características importantes, al mismo tiempo,
tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.
Valor Aberrante o Atípico: Es una observación que es numéricamente distante del resto de los
datos.
Estas asimetrías también se conocen como sesgos los cuales se clasifican según su
inclinación.
Note que el sesgo se refiere a que se considera una gran parte de un lado de los datos
mientras que el otro no se le tiene mucha importancia. (Debido a esto es que el sesgo va en
dirección a la menor cantidad representativa entre las mediciones u observaciones) Ejm. Si en
una población hay una gran cantidad de personas que son diestros (su mano dominante es la
derecha) entonces existe un sesgo respecto a los zurdos ya que no representan a muchas
personas.
Si la mediana se sitúa en el centro de la caja entonces la distribución es simétrica y tanto la
media, mediana y moda coinciden.
Diagrama de barras
Se usa en variable discreta. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura sea igual a la
frecuencia absoluta de ese valor.
Diagrama de Sectores
Es un gráfico empleado fundamentalmente para variables cualitativas.
Las modalidades se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia
Ojivas
Representan la frecuencia acumulada, se construye uniendo los puntos más altos de cada
columna de un histograma que represente las frecuencias acumuladas
Fuente: https://matemovil.com/histogramas-ejemplos-y-ejercicios/
Observaciones Multivariantes
Se da cuando hay mas de 1 característica de interés en una población.
Cuando se toman mas de una medida en un mismo individuo estas suelen tener alguna
relación Ejm: A mayor estatura mayor peso.
Observaciones Bivariantes
Tenemos 2 datos que vendrían en ℝ2 . (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ). . . . . . . . . (𝑥𝑛 , 𝑦𝑛 ) , Estos pueden ser
graficados en una gráfica de dispersión.
Covarianza
Indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el
dato básico para determinar si existe una dependencia entre ambas variables
Ejm:
Eduardo, Carlos y Sergio se han presentado a un concurso de pintura. El concurso otorga $200
al primer lugar y $100 al segundo. ¿De cuántas formas se pueden repartir los premios de
primer y segundo lugar?
Donde:
• n = a+b+c
Hay tres condiciones en la permutación con repetición:
• Importa el orden.
• Hay elementos repetidos.
• Participan todos los elementos en los ordenamientos.
Ejm:
Cuantas palabras diferentes se pueden formar con las letras de la palabra BANANA.
Número de veces que se repite la letra B = 1
Número de veces que se repite la letra A = 3
Número de veces que se repite la letra N = 2
Combinación
Una combinación de un conjunto de elementos es una selección de dichos elementos sin tener
en cuenta el orden.
El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:
Ejm:
Se va a programar un torneo de ajedrez para los 10 integrantes de un club. ¿Cuántos partidos
se deben programar si cada integrante jugará con cada uno de los demás sin partidos de
revancha?
𝑛+𝑘 (𝑛 + 𝑘)!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!
A continuación, un ejemplo para que quede más claro lo anterior mencionado.
Ejm:
Cuantas posibles soluciones con valores no negativos satisfacen la siguiente ecuación
𝑥1 + 𝑥2 + 𝑥3 = 10
El planteamiento sería el siguiente:
Podemos usar números del 0 al 10, tendiendo soluciones del tipo:
• 10+0+0=10
• 3+3+4=10
• …….
En un caso tendríamos la siguiente solución
Ahora solo nos queda determinar de cuantas maneras podríamos distribuir los separadores.
Nuestras variables quedan de la siguiente manera:
• n: 10
• m: 3
• k: m-1= 3-1=2
10 + 3 − 1 (12)!
( )= = 66
10 (9)! 10!
Queda al lector demostrar o entender la resolución planteada por combinación con repetición.
Ejercicios de cálculo de probabilidades:
Ej1:
Una empacadora de frutas 12 frutas de tipo (dulce, seca y cítrica) y tene
Ej2:
En una mesa redonda para 5 personas se sientan (José, María, Pepe, Sech, Manuel). ¿Cuál es
la probabilidad qué Manuel y María se sienten juntos?
• Primero definimos el espacio muestral, así que calculamos todas posibles maneras en
que se puedan sentar todos:
n!=5!=120
Nos queda que #𝛺 = 120
• Calculamos como se podrían sentar Manuel y María asumiendo que son una persona.
n!=4!=24
Finalmente
24
P(MyM) = = 0,2
120
Probabilidad Condicional
Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La
probabilidad condicional se escribe P(A|B) o P(A/B), y se lee «la probabilidad de A dado B».
Ejm:
¿Cuál es la probabilidad de que alguien sufra un robo en diciembre?. Como podemos darnos
cuenta existe una probabilidad de sufrir un robo, pero en el mes de diciembre la probabilidad de
sufrir un robo aumenta. Tendríamos una probabilidad más alta
¿Cuál es la probabilidad de que llueva en Guayaquil en Junio?. En este caso existe una
probabilidad de que llueva en Guayaquil, pero esta probabilidad disminuye al ser en el mes de
junio ya que se estaría en la estación seca.
𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Cumpliéndose las siguientes condiciones
➢ 𝑃(𝐸2 |𝐸1 ) ≥ 0
➢ 𝑃(𝐸1 |𝐸1 ) ≥ 1
➢ 𝐸2 ∩ 𝐸3 = ∅ ⇒ 𝑃(𝐸2 ∩ 𝐸3 |𝐸1 ) = 𝑃(𝐸2 |𝐸1 ) + 𝑃(𝐸3 |𝐸1 )
Ejm:
Note que 𝑃(𝐸2 |𝐸1 ) es la probabilidad de 𝐸2 Sobre el conjunto u subespacio del espacio
muestral dado por E1 .
Ejm:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste la
fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el
chocolate.
Evento A: que a un amigo le gusten los fresa. P(A) = ?
Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25 %.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el
chocolate.
Teorema de Bayes
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo
información de antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta
característica que condiciona su probabilidad.
Dado un espacio de probabilidad (𝛺, 𝑆, 𝑃). Con las probabilidades condicionales 𝐸1 𝑦 𝐸2 tal
que:
𝑃(𝐸1 ∩ 𝐸2 )𝑃(𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Ejm2:
En una academia, la probabilidad de que a un alumno seleccionado al azar le guste el helado
es del 60 %, mientras que la probabilidad de que a un alumno le guste la torta es del 36 %.
Además, se sabe que la probabilidad de que a un alumno le guste la torta dado que le gusta el
helado es del 40 %. Calcular la probabilidad de que a un alumno le guste el helado, dado que
le gusta la torta.
Solución
Primero definimos los 2 eventos con los que vamos a trabajar:
h: que a un alumno le guste el helado.
t: que a un alumno le guste la torta.
Tenemos los siguientes datos:
Entonces, la probabilidad de que un alumno le guste el helado dado que le gusta la torta es de
0,6667 o 66,67 %.
Probabilidad Total
Sean los eventos A,E ∈ S.
Entonces A se puede particionar en 2 eventos disjuntos:
𝐴 = (𝐴 ∩ 𝐸) ∪ (𝐴 ∩ 𝐸 𝐶 )
𝐸1 , 𝐸2 , … . , 𝐸𝑘 𝜖 𝑆
De modo que:
𝐸1 ∪ 𝐸2 ∪ … .∪ 𝐸𝑘 = 𝑆
∀𝑖,𝑗 𝜖 N ≤ k ^ 𝑖 ≠ 𝑗 / Ei ∩ Ei = ∅
Por lo cual podemos concluir que:
𝑘
𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑃(𝐸𝑗 |𝐴) = 𝑘
∑ 𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑗=1
Ejm:
En un acuario se tienen solo 2 especies de peces, el 40% son de la especie azul y el 60% son
de la especie roja. De la especie azul, el 30% son machos; mientras que, de la especie roja, el
40% son hembras. ¿Cuál es la probabilidad de que un pez elegido aleatoriamente en el acuario
sea macho?
Función de Distribución
Es una función ℝ → ℝ cuyo rango será la posibilidad del evento. Tal que F(x)=P(X ≤ x).
Note que los x son números reales que son elementos del rango de la función de distribución.
Esperanza Matemática
Es la generalización de la media aritmética a toda la población, es decir, es la media de la
variable aleatoria.
Note que la función de probabilidad se denota como: f(x), mientras que la función de
distribución se denota como F(x).
μ = E(X) = ∑ xi ⋅ P(xi )
i=1
Segundo momento
𝑛
𝜇2 = 𝐸(𝑋 2 ) = ∑ xi 2 ⋅ P(xi )
𝑖=
Varianza
𝑛
Además
𝜎 2 = 𝐸(𝑋 2 ) − μ2
Propiedades
Note que el salto entre cada elemento del dominio es el mismo, en este caso el salto es de
(0,1).
Experimento Bernoulli
Se da en aquellas situaciones en las que sólo hay dos posibles resultados mutuamente
excluyentes (verdadero/falso, en una prueba; defectuoso/no defectuoso, en los artículos que
salen de una fábrica; aprobado/suspendido, etc.). Decimos que son mutuamente excluyentes
porque no pueden darse simultáneamente (un examen no puede estar aprobado y suspendido
al mismo tiempo; una respuesta no puede ser simultáneamente verdadera o falsa, etc...).
Una manera común de designar estos dos resultados es como Éxito (E) o Fracaso (F).
Note que en este tipo de distribución solo nos interesas las probabilidades de éxito.
Generador de momentos
Ejm:
Ejm2:
Un reciente estudio de la Asociación Americana de Conductores de Autopista ha revelado que
el 60% de los conductores norteamericanos usa regularmente el cinturón de seguridad. Se
selecciona una muestra de 10 conductores en una autopista del estado de Oklahoma.
a) ¿Cuál es la probabilidad de que exactamente siete de ellos lleven el cinturón de seguridad?
b) ¿Cuál la probabilidad de que al menos siete de los conductores lleven el cinturón de
seguridad?
➢ Solamente hay dos posibles resultados en cada una de las comprobaciones que se
hacen a los conductores: llevan el cinturón de seguridad (resultado que denominaremos
("éxito") o no lo llevan ("fracaso").
Cumple, por tanto, las condiciones del Proceso de Bernoulli, en el cual definimos una variable
aleatoria que es "número de conductores que llevan el cinturón", es decir, "número de
éxitos". Se trata, por tanto, de una distribución Binomial con n=10 y p=0.6.
a)
10 10!
P(X = 7) = ( ) 0,67 ⋅ 0, 43 = 0,67 ⋅ 0, 43 = 0,215
7 7! (10 − 7)!
Experimento Geométrico
Es un experimento Bernoulli que se repetirá hasta tener éxito.
𝑓(𝑥) = (1 − 𝑝)𝑥−1 𝑝
Para fracasos:
𝑓(𝑥) = (1 − 𝑝)𝑥 𝑝
Ejm2:
Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta el nacimiento de la
esperada hija. Calcular el número esperado de hijos (entre varones y hembras) que tendrá el
matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres hijos o más.
Ejemplo:
Hallar k y la función de densidad a partir de una función de distribución continua
Ejm:
Distribución Exponencial
Es un caso particular de la familia de distribuciones Gamma .Dada una variable aleatoria X que
tome valores reales no negativos {x 0} diremos que tiene una distribución exponencial de
parámetro λ con λ 0, si y sólo si su función de densidad tiene la expresión:
Existe otra definición en la cual λ se obtiene de una relación con la función gamma.
Función de densidad
Función de distribución
Distribución Gamma
Distribución Ji Cuadrado
Distribución Beta
DISTRIBUCIÓN NORMAL
Distribución Normal
La distribución normal es la más común entre todas las distribuciones de probabilidad utilizadas
en Estadística y tiene importantes aplicaciones en la modelización de variables estadísticas
asociadas a los elementos de una población.
Estandarización
Ejm2:
Si X se distribuye como N(20,4), calcular las siguientes probabilidades:
1) P(X < 15).
Ejm 3:
Para El tiempo empleado, en horas, en hacer un determinado producto sigue una
distribución N(10, 2) . Se pide la probabilidad de que ese producto se tarde en hacer:
a) Menos de 7 horas
Usando R:
De forma directa
Normalizando
b) Entre 8 y 13 horas
DISTRIBUCIONES CONJUNTAS
Variables aleatorias conjuntamente distribuidas
En variables discretas
Si X1, X2, X3…Xn son variables aleatorias conjuntas discretas, se define su función de
probabilidad conjunta como: Cuando de manera independiente las variables aleatorias a
considerar son discretas. De tal manera que:
Ejm:
Entre las propiedades de esta función tenemos que si fijamos una variable aleatoria podremos
obtener su probabilidad sumando las probabilidades de las filas u columnas según
corresponda. A esto se lo conoce como probabilidad marginal
Más propiedades
Ejm:
Calcular la probabilidad de x<2y
Ejm2:
ESTIMADORES
Estadísticos
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro
desconocido de la población. Por ejemplo, si se desea conocer el precio medio poblacional de
un artículo (parámetro desconocido) se recogen observaciones del precio de dicho artículo en
diversos establecimientos (muestra) pudiendo utilizarse la media aritmética de las
observaciones para estimar el precio medio poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige el
estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,
convergencia y robustez (consistencia).
Ejm:
Cota de Rao-Cramer
Eficiencia
Un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es
menor que la del segundo.
Sean 𝜃̂1 y 𝜃̂2 dos estimadores insesgados, se dice que 𝜃̂1 es más eficiente que 𝜃̂2 si se verifica que
𝑉𝑎𝑟(𝜃̂1 ) y Var( 𝜃̂2 ).
̂1 )
𝑉𝑎𝑟(𝜃
La eficiencia relativa se mide por el ratio: ̂2 )
𝑣𝑎𝑟(𝜃
Consistencia
Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para
un estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda
a ser el valor del parámetro poblacional, propiedad que se denomina consistencia.
Solución
̂ es insesgado (o centrado) cuando se verifica E(𝜽
a) Un estimador 𝜽 ̂) =
Distribución de la Media
Tamaño de Muestra
Ejm
Contraste de hipótesis
Procedimiento de evaluación
Probabilidad de rechazar 𝐻0
Ejemplo
Ejm:
Ejemplo:
Ejemplo
Ejemplo:
Función de probabilidad
Aproximación asintótica
Ejm:
Probabilidades
Ejm:
Verificar si existen la creencia en Dios tiene alguna dependencia con el nivel de educacion
Prueba Ji-Cuadrado
Prueba de Kolmogorov-Smirnov
Ejm
Modelos
Ejemplo