Estadística

Estadística
Términos y Medidas Estadísticas

Estadística
-La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis
de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre
fenómenos observados.
-Es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio
que la genera siguiendo las leyes de la probabilidad.
Variables Cuantitativas
Cantidades determinísticas
Son cantidades que tienen un valor fijo y este permanece invariable.
Ejm: El kilo, duración de un minuto.
Cantidades estocásticas
Son cantidades que tienen un valor aleatorio o pueden variar.
Ejm: La altura de una mujer ecuatoriana, duración de una batería de celular, vida útil de
una computadora.
Variables Cualitativas
Son aquellos cuyos valores o resultados no se pueden asociar a un número
• Nominales: Sus valores no se pueden ordenar. (Grupo sanguíneo, religión)
• Ordinales: Sus valores se pueden ordenar (Grado de satisfacción, Nivel de luz)
Población
Conjunto sobre el cual se estudiará alguna característica
Ejm: Estudiantes de una universidad (característica a estudiar: cantidad de dinero que
gastan a diario en la universidad), Turistas extranjeros que van a Galápagos (característica
a estudiar: País de origen del turista), Bolsos hechos en Italia (característica a estudiar:
Material del que están compuesto)
Censo
Recolección de datos de toda la población
*No siempre es posible abarcar a toda una población debido a la logística que requiere o
es demasiado grande la población
Muestra
Subconjunto de una población
Apuntes realizados por: David Yánez L.

Ejm: (Población: Estudiantes de una universidad – Muestra: Estudiantes de la facultad de
administración), (Población: Turistas extranjeros que van a Galápagos – Muestra: Turistas
que vienen del continente asiático)
Parámetro
-Es un número que resume la gran cantidad de datos que pueden derivarse del estudio de
una variable estadística.
-Característica de interés de una población
Ejm: (Población: Estudiantes de una universidad – Parámetro: Mínima cantidad de dinero
que llevan los estudiantes), (Población: Turistas extranjeros que van a Galápagos –
Muestra: Cantidad promedio de turistas por año que visitan Galápagos)
Estimador
-Característica medida en una muestra.
(Muestra: Estudiantes de la facultad de administración – Estimador: Mínima cantidad de
dinero que llevan los estudiantes de dicha facultad), (Muestra: Turistas que vienen del
continente asiático – Estimador: Edad promedio de los turistas que vienen de Asia a
Galápagos)
*El estimador no será igual al parámetro.
*Si la muestra es representativa (la muestra se aproxima a la población), el estimador se
asemejará al parámetro.
*Cálculo del parámetro requiere censo (porque así se cubre a toda la población)
*Cálculo de un estimador es más económico (porque se requiere una parte de la población
“se estudian a menos entes, seres u objetos”)
Frecuencias
Indica la cantidad de veces que se repite una observación.

Medidas de tendencia central y dispersión
Medidas de tendencia central
Es un número situado hacia el centro de la distribución de los valores de una serie de
observaciones (medidas), en la que se encuentra ubicado el conjunto de los datos.
Este número por lo general suele representar a todas las medidas realizadas.
1. Media aritmética o promedio

Representa a todas las medidas realizadas. Se representa con el símbolo 𝑥̅ . Se
define de la siguiente manera:
2. Mediana
Es el valor “de en medio” de entre todos los valores obtenidos y ordenados.
Se expresa con el símbolo 𝑥̃ .
Se la puede obtener a través de la siguiente fórmula.

Ejm:
Supongamos que se han obtenido 7 valores. Y que cada 𝑥1 , 𝑥2 , . . . . . . 𝑥𝑛 tienen un

valor, entonces la mediana será el valor de 𝑥4 .
Medidas de ubicación
Mediana
La mediana divide la muestra en 2 partes.
Donde se puede dar lo siguiente:

➢ Al menos de la mitad de las observaciones son menores o iguales que la mediana.
➢ Al menos de la mitad de las observaciones son mayores o iguales que la mediana.
Moda
Es el valor con mayor frecuencia (el valor que más veces sale o se repite).

La moda existe siempre y cuando todos los valores/observaciones no tengan la misma
frecuencia. Sin embargo, si puede existir más de una moda.
Cuartiles
Divide la muestra en 4 partes: 𝑞1 , 𝑞2 , 𝑞3 .
Donde:
➢ Al menos el 25% de las observaciones son menores o iguales que 𝑞1
➢ 𝑞2 es la mediana.
➢ Al menos el 75% de las observaciones son menores o iguales que 𝑞3
También se pueden definir otras formas de dividir la muestra como terciles (𝑡1 , 𝑡2 ), deciles,
percentiles, etc.
Cuantil
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de
una variable aleatoria (son las divisiones de una muestra, de aquí nacen los terciles,
cuartiles, deciles, etc.).
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable 𝑥𝑝 que
marca un corte de modo que una proporción p de valores de la población es menor o igual
que 𝑥𝑝 .
Se define al p-ésimo cuantil de una muestra de la siguiente forma:
𝑐𝑝 = 𝑥(𝑝[𝑛+1])
De tal manera que:

➢ Si p[n+1] es entero, entonces el cuantil será una de las observaciones de la
muestra.
➢ Si p[n+1] no es entero, entonces el cuantil será el promedio de 2 observaciones.
• Sea k la parte entera de p[n+1] y α la parte decimal.

• El p-ésimo cuantil viene dado por:
𝑐𝑃 = 𝑥(𝑘) + 𝛼(𝑥(𝑘+1) − 𝑥(𝑘) ) = (1 − 𝛼)𝑥(𝑘) + 𝛼𝑥(𝑘+1)
-Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles
0,25; 0,50 y 0,75).
-Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles
0,20; 0,40; 0,60 y 0,80).
Ejm1:
Tercer cuartil: 𝑞3 = 𝑐(0,75)
Donde n=24, entonces 0,75(24+1)=18,75
𝑞3 = 𝑥(18,75) = 𝑥(18) + 0,75(𝑥(19) − 𝑥(18) ) = (0,25)𝑥(𝟏𝟖) + 0,75𝑥(19)

Podemos concluir que de las 24 observaciones
• 18 son menores o iguales que 𝑞3 , el 75% exacto

• 6 son mayores o iguales que 𝑞3 , el 25% exacto
Ejm2:
Primer quintil: 𝑞1 = 𝑐(0,20)
Donde n=19, entonces 0,20(19+1)=4
𝑞1 = 𝑥(4)
Podemos concluir que de las 19 observaciones
• 4 son menores o iguales que 𝑞1 , el 21,05%

• 16 son mayores o iguales que 𝑞1 , el 84,21%
Medidas de dispersión
Nos indica cuanto varían los datos.
Rango
Intervalo entre un valor máximo y un valor mínimo.
𝑟 = 𝑥(𝑓) − 𝑥(𝑖)

Rango intercuantil
Intervalo entre un cuantil máximo y un cuantil mínimo.
𝑖𝑟 = 𝑞(𝑓) − 𝑞(𝑖)
Varianza
Representa la variabilidad de una serie de datos respecto a su media elevadas al cuadrado
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Desviación estándar
Representa la variabilidad de una serie de datos respecto a su media
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un
rango de valores más amplio.
Ejm:
Tenemos las notas de los exámenes de los estudiantes de estadística. Calcular la
desviación estándar. Si las notas vienen dadas de la siguiente manera
(50,60,10,56,96,60)
50 + 60 + 10 + 56 + 96 + 60 332
𝑥̅ = = = 55,33
6 6
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
∑(𝑥𝑖 − 𝑥̅ )2 = (50 − 55,33)2 + (60 − 55,33)2 + (10 − 55,33)2 + (56 − 55,33)2 + (96 − 55,33)2 + (60 − 55,33)2
𝑖=1
= 3781.33

𝟑𝟕𝟖𝟏. 𝟑𝟑
𝒔=√ = 𝟐𝟕, 𝟓𝟐
𝟓
Curtosis
Denota la concentración de valores que están representados en una gráfica. Una curtosis
grande implica una mayor concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que existe una relativamente
menor frecuencia de valores intermedios.
Estas se clasifican en:
➢ Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media, siendo una
curva muy apuntada.
➢ Mesocúrtica: la Curtosis=0. Distribución normal.
➢ Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media, presentando

una forma muy achatada.
Gráficos estadísticos
Diagramas de caja
Son una presentación visual que describe varias características importantes, al mismo tiempo,
tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.

Valor Aberrante
Valor Aberrante o Atípico: Es una observación que es numéricamente distante del resto de los
datos.
Estas asimetrías también se conocen como sesgos los cuales se clasifican según su
inclinación.
Note que el sesgo se refiere a que se considera una gran parte de un lado de los datos
mientras que el otro no se le tiene mucha importancia. (Debido a esto es que el sesgo va en
dirección a la menor cantidad representativa entre las mediciones u observaciones) Ejm. Si en
una población hay una gran cantidad de personas que son diestros (su mano dominante es la
derecha) entonces existe un sesgo respecto a los zurdos ya que no representan a muchas
personas.
Si la mediana se sitúa en el centro de la caja entonces la distribución es simétrica y tanto la
media, mediana y moda coinciden.
Diagrama de barras
Se usa en variable discreta. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura sea igual a la
frecuencia absoluta de ese valor.

Histograma
Se utiliza con variables continuas, o agrupadas en intervalos, representando en el eje X los
intervalos de clase y levantando rectángulos de base la longitud de los distintos intervalos y de
altura tal que el área sea proporcional a las frecuencias representadas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de
los rectángulos.
Diagrama de Sectores
Es un gráfico empleado fundamentalmente para variables cualitativas.
Las modalidades se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia

relativa de cada modalidad o valor por 360º.
Ojivas
Representan la frecuencia acumulada, se construye uniendo los puntos más altos de cada
columna de un histograma que represente las frecuencias acumuladas

Sesgo a la derecha Sesgo a la izquierda
Diferencia entre el polígono de frecuencias y ojiva

El polígono de frecuencias parte desde el histograma de frecuencias absolutas, mientras que la
ojiva parte del histograma de frecuencias acumuladas. Además, el polígono de frecuencias se
forma uniendo los puntos medios de la parte superior de cada barra, mientras que la ojiva se
forma uniendo el extremo derecho de la parte superior de cada barra.
En el siguiente gráfico, se apreciará mejor:
Fuente: https://matemovil.com/histogramas-ejemplos-y-ejercicios/
Observaciones Multivariantes
Se da cuando hay mas de 1 característica de interés en una población.
Cuando se toman mas de una medida en un mismo individuo estas suelen tener alguna
relación Ejm: A mayor estatura mayor peso.
Observaciones Bivariantes
Tenemos 2 datos que vendrían en ℝ2 . (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ). . . . . . . . . (𝑥𝑛 , 𝑦𝑛 ) , Estos pueden ser
graficados en una gráfica de dispersión.

Decimos que una relación es perfecta cuando la gráfica tiene un comportamiento lineal.
Cuando una relación no es perfecta entonces es una relación estadística.
Medida de Covariación
Nos permite definir el comportamiento de nuestras observaciones. Se usa la siguiente formula
(𝑥𝑖 − 𝑥̅ ) × (𝑦𝑖 − 𝑦̅)
Comportamiento curvilíneo

Comportamiento lineal creciente
Covarianza
Indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el
dato básico para determinar si existe una dependencia entre ambas variables
Si la covarianza >>0 (muy alejada de cero), la relación es creciente

Si la covarianza <<0 (muy alejada de cero), la relación es decreciente
Caso contrario si es muy cercano o igual a cero entonces no hay relación o la relación no es
creciente ni decreciente
Correlación
Indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. (sus valores están entre 1 y -1)
Si la correlación 𝑟𝑥𝑦 ≈ 1 (muy cercano a cero), la relación es creciente
Si la correlación 𝑟𝑥𝑦 ≈ −1 (muy cercano a cero), la relación es decreciente
Si la correlación 𝑟𝑥𝑦 = 1 Línea recta.

Experimento
Es cualquier proceso que proporciona datos, numéricos o no numéricos
Ejm: Al dar a luz conocer el género de los 2 hijos, al lanzar 1 dado saber el numero resultante.
Al conjunto de posibles resultados de un experimento se los denota con el símbolo Ω.

Ejm:
• En el experimento del género de los 2 hijos , Ω = {HH,HM,MM}
• En el experimento del dado, Ω ={1,2,3,4,5,6}

Espacio Muestral
El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio
y se suele representar por la letra S, donde S es subconjunto del conjunto potencia de Ω.
Por ejemplo, cuando lanzamos una moneda, ¿cuáles son todos los posibles resultados que
podemos obtener? Que salga cara o cruz, ¿verdad? En total son dos posibles resultados, por lo
que el espacio muestral tiene 2 elementos.
Ω = {cara, cruz}
Y si lanzamos un dado, tenemos en total 6 posibles resultados que pueden salir. Por lo tanto el
espacio muestral sería de 6 elementos.
S= {1, 2, 3, 4, 5, 6}.
Suceso o Evento
Un suceso es cualquier subconjunto o elemento del espacio muestral. Denotados con la letra E.
Ejm
“Sacar cara” en el lanzamiento de una moneda, “sacar el número 5” o “sacar un número primo”
en el lanzamiento de un dado son sucesos.
Probabilidad
La probabilidad asociada a un suceso o evento aleatorio es una medida del grado de
certidumbre de que dicho suceso pueda ocurrir. Se suele expresar como un número entre 0 y
1, donde un suceso imposible tiene probabilidad cero y un suceso seguro tiene probabilidad
uno.

Cálculo de probabilidad
Se utiliza la regla de Laplace, la cual establece que: en el caso de que todos los resultados de
un experimento aleatorio sean equiprobables, Laplace define la probabilidad de un suceso A
como el cociente entre el número de resultados favorables a que ocurra el suceso A en el
experimento y el número de resultados posibles del experimento.
#𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑜 𝐸𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
𝑃(𝐸) =
#𝛺 𝑜 𝑇𝑜𝑑𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Ejm:
Tenemos las 27 letras en un alfabeto y queremos saber la probabilidad que la letra que
saquemos sea una vocal.
5
𝑃(𝑆𝑎𝑐𝑎𝑟 𝑉𝑜𝑐𝑎𝑙) = = 0,16 𝑜 16%
27
Técnicas de Conteo
Las técnicas de conteo nos permitirán establecer el espacio muestral para el cálculo de
probabilidades.
Permutación
Una permutación de un conjunto de elementos es una disposición de dichos elementos
teniendo en cuenta el orden. El número de permutaciones de “n” elementos tomados de “k” en
“k” se calcula con la fórmula:
Ejm:
Eduardo, Carlos y Sergio se han presentado a un concurso de pintura. El concurso otorga $200
al primer lugar y $100 al segundo. ¿De cuántas formas se pueden repartir los premios de
primer y segundo lugar?

Permutación con repetición
La permutación con repetición se usa cuando en un total de “n” elementos, el primero se repite
“a” veces, el segundo “b” veces, el tercero “c” veces…
La fórmula para calcular el número de permutaciones u ordenamientos es la siguiente:
Donde:
• n = a+b+c
Hay tres condiciones en la permutación con repetición:
• Importa el orden.
• Hay elementos repetidos.
• Participan todos los elementos en los ordenamientos.
Ejm:
Cuantas palabras diferentes se pueden formar con las letras de la palabra BANANA.
Número de veces que se repite la letra B = 1
Número de veces que se repite la letra A = 3
Número de veces que se repite la letra N = 2
Número total de elementos: n = 1+3+2 ➜ n = 6
Combinación
Una combinación de un conjunto de elementos es una selección de dichos elementos sin tener
en cuenta el orden.
El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:
Ejm:
Se va a programar un torneo de ajedrez para los 10 integrantes de un club. ¿Cuántos partidos
se deben programar si cada integrante jugará con cada uno de los demás sin partidos de
revancha?

Combinación con repetición
Las combinaciones con repetición de m elementos tomados de n en n (m \ge n), son los
distintos grupos formados por n elementos de manera que:
• No entran todos los elementos.
• No importa el orden.
• Sí se repiten los elementos.
𝑛+𝑘−1 (𝑛 + 𝑘 − 1)! (𝑛 + 𝑘 − 1)!

( )= =
𝑘 (𝑛 + 𝑘 − 1 − 𝑘)! 𝑘! (𝑛 − 1)! 𝑘!
Ejm:
En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas se pueden elegir
cuatro botellas?
Podemos deducir lo siguiente:
➢ No entran todos los elementos. Sólo elije 4.
➢ No importa el orden. Da igual que elija 2 botellas de anís y 2 de ron, que 2 de ron y 2 de
anís.
➢ Sí se repiten los elementos. Puede elegir más de una botella del mismo tipo
Planteamiento de los separadores y cajas

Nos permite establecer una relación ente variables y una igualdad, en el cual los espacios u
ánforas creados por los separadores representaran a las variables y el total de los elementos
de dichas ánforas representara la igualdad. Finalmente tendríamos que calcular de cuantas
maneras se podrían distribuir los separadores.
De tal forma que tendríamos la siguiente formula:

Sea:
• n: la cantidad de elementos total o la igualdad a la que se quiere llegar
• m: la cantidad de variables o ánforas necesarias para la igualdad
• k: la cantidad de separadores que es igual a m-1
𝑛+𝑘 (𝑛 + 𝑘)!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!
A continuación, un ejemplo para que quede más claro lo anterior mencionado.
Ejm:
Cuantas posibles soluciones con valores no negativos satisfacen la siguiente ecuación
𝑥1 + 𝑥2 + 𝑥3 = 10
El planteamiento sería el siguiente:
Podemos usar números del 0 al 10, tendiendo soluciones del tipo:
• 10+0+0=10
• 3+3+4=10
• …….
En un caso tendríamos la siguiente solución
En otro caso tendríamos la siguiente
Ahora solo nos queda determinar de cuantas maneras podríamos distribuir los separadores.
Nuestras variables quedan de la siguiente manera:
• n: 10
• m: 3
• k: m-1= 3-1=2

10 + 2 (12)!
( )= = 66
2 (8)! 2!
Este ejercicio puede ser resuelto a través de combinación con repetición.
Y quedaría de la siguiente manera
10 + 3 − 1 (12)!
( )= = 66
10 (9)! 10!
Queda al lector demostrar o entender la resolución planteada por combinación con repetición.
Ejercicios de cálculo de probabilidades:
Ej1:
Una empacadora de frutas 12 frutas de tipo (dulce, seca y cítrica) y tene
Ej2:
En una mesa redonda para 5 personas se sientan (José, María, Pepe, Sech, Manuel). ¿Cuál es
la probabilidad qué Manuel y María se sienten juntos?
• Primero definimos el espacio muestral, así que calculamos todas posibles maneras en
que se puedan sentar todos:
n!=5!=120
Nos queda que #𝛺 = 120
• Calculamos como se podrían sentar Manuel y María asumiendo que son una persona.
n!=4!=24
Finalmente
24
P(MyM) = = 0,2
120
Probabilidad Condicional
Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La
probabilidad condicional se escribe P(A|B) o P(A/B), y se lee «la probabilidad de A dado B».
Ejm:
¿Cuál es la probabilidad de que alguien sufra un robo en diciembre?. Como podemos darnos
cuenta existe una probabilidad de sufrir un robo, pero en el mes de diciembre la probabilidad de
sufrir un robo aumenta. Tendríamos una probabilidad más alta
¿Cuál es la probabilidad de que llueva en Guayaquil en Junio?. En este caso existe una
probabilidad de que llueva en Guayaquil, pero esta probabilidad disminuye al ser en el mes de
junio ya que se estaría en la estación seca.

La probabilidad condicional de 𝐸2 dado 𝐸1 se define como:
𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Cumpliéndose las siguientes condiciones
➢ 𝑃(𝐸2 |𝐸1 ) ≥ 0
➢ 𝑃(𝐸1 |𝐸1 ) ≥ 1
➢ 𝐸2 ∩ 𝐸3 = ∅ ⇒ 𝑃(𝐸2 ∩ 𝐸3 |𝐸1 ) = 𝑃(𝐸2 |𝐸1 ) + 𝑃(𝐸3 |𝐸1 )
Ejm:
Note que 𝑃(𝐸2 |𝐸1 ) es la probabilidad de 𝐸2 Sobre el conjunto u subespacio del espacio
muestral dado por E1 .
Ejm:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste la
fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el
chocolate.
Evento A: que a un amigo le gusten los fresa. P(A) = ?
Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25 %.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el
chocolate.

Independencia
Se da cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra
o no, es decir, cuando ambos sucesos no están relacionados.
Existe independencia de condición si se cumple que : 𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸1 )𝑃(𝐸2 )

Además, cuando dos eventos son independientes sucede que:
𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 )𝑃(𝐸2 )

𝑃(𝐸2 |𝐸1 ) = = = 𝑃(𝐸2 )
𝑃(𝐸1 ) 𝑃(𝐸1 )
Se ve claramente que como 𝐸2 es independiente a pesar de que se lo condicione por 𝐸1 su
probabilidad es la misma (es 𝐸2 ).
Conjuntos disjuntos no garantizan la independencia de probabilidad.
Ejm:
Si hay una probabilidad del 10% de que Júpiter se alineará con Marte, y una probabilidad del
50% de que su tirada de una moneda saldrá águilas, entonces ¿qué es la probabilidad de que
Júpiter se alineará con Marte y su tirada de la moneda saldrá águilas (suponiendo que Júpiter
no tenga ningún efecto en el resultado de su tirada)?
J: Júpiter se alineará con Marte
A: Su tirada saldrá águilas
Pues Júpiter no tiene ningún efecto en su tirada de la moneda, tomamos estos sucesos como
independientes, y así la probabilidad de que ambos sucesos ocurrirán es
P(J ∩ A) = P(J)P(A) = (0.10)(0.50) = .05.
Teorema de Bayes
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo
información de antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta
característica que condiciona su probabilidad.
Dado un espacio de probabilidad (𝛺, 𝑆, 𝑃). Con las probabilidades condicionales 𝐸1 𝑦 𝐸2 tal
que:

𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) = 𝑦 𝑃(𝐸1 |𝐸2 ) =
𝑃(𝐸1 ) 𝑃(𝐸2 )
Despejando se tendría que:
𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸2 |𝐸1 )𝑃(𝐸1 ) = 𝑃(𝐸1 |𝐸2 )𝑃(𝐸2 )

Finalmente, el teorema de Bayes se define a través de la siguiente formula.
𝑃(𝐸1 ∩ 𝐸2 )𝑃(𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Ejm2:
En una academia, la probabilidad de que a un alumno seleccionado al azar le guste el helado
es del 60 %, mientras que la probabilidad de que a un alumno le guste la torta es del 36 %.
Además, se sabe que la probabilidad de que a un alumno le guste la torta dado que le gusta el
helado es del 40 %. Calcular la probabilidad de que a un alumno le guste el helado, dado que
le gusta la torta.
Solución
Primero definimos los 2 eventos con los que vamos a trabajar:
h: que a un alumno le guste el helado.
t: que a un alumno le guste la torta.
Tenemos los siguientes datos:

P(h) = 0,6.
P(t) = 0,36.
P(t|h) = 0,4.
Nos piden calcular P(h|t).
Aplicamos el teorema de Bayes:
Entonces, la probabilidad de que un alumno le guste el helado dado que le gusta la torta es de
0,6667 o 66,67 %.
Probabilidad Total
Sean los eventos A,E ∈ S.
Entonces A se puede particionar en 2 eventos disjuntos:
𝐴 = (𝐴 ∩ 𝐸) ∪ (𝐴 ∩ 𝐸 𝐶 )
Graficamente seria así
Entonces la probabilidad de A viene dado por:
𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐸) + 𝑃(𝐴 ∩ 𝐸 𝐶 )

𝑃(𝐴) = 𝑃(𝐴|𝐸)𝑃(𝐸) + 𝑃(𝐴|𝐸 𝐶 )𝑃(𝐸 𝐶 )
Note que son probabilidades condicionadas (no independientes)
Además 𝐸 𝑦 𝐸 𝐶 forman una partición del espacio muestral S.

Ley de probabilidad Total
Si particionamos el espacio muestral en k eventos exhaustivos (la union de todos los k forman
a S(el espacio muetral)) y mutuamente excluyentes (conjuntos disjuntos).
Tal que:
𝐸1 , 𝐸2 , … . , 𝐸𝑘 𝜖 𝑆
De modo que:
𝐸1 ∪ 𝐸2 ∪ … .∪ 𝐸𝑘 = 𝑆
∀𝑖,𝑗 𝜖 N ≤ k ^ 𝑖 ≠ 𝑗 / Ei ∩ Ei = ∅
Por lo cual podemos concluir que:
𝑘
𝑃(𝐴) = ∑ 𝑃(𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )

𝑖=1
Siempre y cuando A este particionado por 𝐸𝑖 .

No necesariamente la unión de los eventos debe formar al espacio muestral. Es suficiente con
que la suma de las probabilidades de cada evento sea 1.
Combinando el teorema de Bayes con la ley de la probabilidad total.
𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑃(𝐸𝑗 |𝐴) = 𝑘
∑ 𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑗=1
Ejm:
En un acuario se tienen solo 2 especies de peces, el 40% son de la especie azul y el 60% son
de la especie roja. De la especie azul, el 30% son machos; mientras que, de la especie roja, el
40% son hembras. ¿Cuál es la probabilidad de que un pez elegido aleatoriamente en el acuario
sea macho?
• 𝑨𝟏 : que un pez elegido aleatoriamente sea de la especie azul. P(𝐴1 )=0,4

• 𝑨𝟐 : que un pez elegido aleatoriamente sea de la especie roja. P(𝐴2 )=0,6
• B: que un pez elegido aleatoriamente sea macho.
• De la especie azul, el 30% son machos. 𝑃(𝐵|𝐴1 ) = 0,3
• El 40% de los peces de la especia roja son hembras, por ello, el 60% serán machos. Por
lo tanto 𝑃(𝐵|𝐴2 ) = 0,6

Ejm2:

VARIABLE ALEATORIA DISCRETA
Es una función que asigna un valor numérico, al resultado de un experimento aleatorio.
Donde su dominio es el espacio muestral, la relación (la función) es el experimento/evento cuya
representación será a través de una letra mayúscula y el rango representado por la misma de
la función, pero minúscula con subíndices, estos elementos del rango serán dados por un
número real que vienen a ser la cantidad de eventos favorables a la condición dada por la
relación.
Función de Distribución
Es una función ℝ → ℝ cuyo rango será la posibilidad del evento. Tal que F(x)=P(X ≤ x).

Ejm Variable Aleatoria
Su funcion de distribución vendría dada de la siguiente manera

Función de probabilidad
Asigna un valor de probabilidad a los valores de la variable aleatoria.
Siguiendo el ejemplo anterior:
Note que los x son números reales que son elementos del rango de la función de distribución.
Esperanza Matemática
Es la generalización de la media aritmética a toda la población, es decir, es la media de la
variable aleatoria.
Note que la función de probabilidad se denota como: f(x), mientras que la función de
distribución se denota como F(x).

Media o valor esperado o primer momento
n
μ = E(X) = ∑ xi ⋅ P(xi )
i=1
Segundo momento
𝑛
𝜇2 = 𝐸(𝑋 2 ) = ∑ xi 2 ⋅ P(xi )
𝑖=
Varianza
𝑛
𝜎 2 = 𝑣𝑎𝑟(𝑋) = 𝐸((𝑋 − μ)2 ) = ∑(xi − μ)2 ⋅ P(xi )

𝑖=
Además
𝜎 2 = 𝐸(𝑋 2 ) − μ2
Propiedades
Función Generadora de momentos

Variable aleatoria discreta - uniforme
Una variable aleatoria discreta tiene distribución uniforme cuando la probabilidad en todos los
valores de la función de probabilidad f(x) son iguales; es decir, cuando todos los posibles
valores que puede adoptar la variable (x1 , x2 , . . . . . xn ) tienen la misma probabilidad.
Además, cumple con las siguientes características.
Ejm variable aleatoria discreta

f(x), funcion de probabilidad

F(x), funcion de distribución
Note que el salto entre cada elemento del dominio es el mismo, en este caso el salto es de
(0,1).
Experimento Bernoulli
Se da en aquellas situaciones en las que sólo hay dos posibles resultados mutuamente
excluyentes (verdadero/falso, en una prueba; defectuoso/no defectuoso, en los artículos que
salen de una fábrica; aprobado/suspendido, etc.). Decimos que son mutuamente excluyentes
porque no pueden darse simultáneamente (un examen no puede estar aprobado y suspendido
al mismo tiempo; una respuesta no puede ser simultáneamente verdadera o falsa, etc...).
Una manera común de designar estos dos resultados es como Éxito (E) o Fracaso (F).
Variable aleatoria discreta - Binomial

Sea un experimento aleatorio en el que pueden obtenerse dos resultados posibles,
mutuamente excluyentes (el resultado de uno no influye en el otro) , con probabilidades
constantes en el que p es la probabilidad de éxito (Experimento Bernoulli). Supongamos que
se realizan n pruebas independientes Sea X la variable definida como el número de éxitos
resultantes entonces diremos que X se distribuye como una distribución binomial.
Note que en este tipo de distribución solo nos interesas las probabilidades de éxito.

Ejm:
Experimentación con 3 mediciones y con la condición de poseer 2 experimentos exitosos.
Generador de momentos
Función de probabilidad de una distribución binomial

Función de distribución de una distribución binomial
Ejm:
Ejm2:
Un reciente estudio de la Asociación Americana de Conductores de Autopista ha revelado que
el 60% de los conductores norteamericanos usa regularmente el cinturón de seguridad. Se
selecciona una muestra de 10 conductores en una autopista del estado de Oklahoma.
a) ¿Cuál es la probabilidad de que exactamente siete de ellos lleven el cinturón de seguridad?
b) ¿Cuál la probabilidad de que al menos siete de los conductores lleven el cinturón de
seguridad?
➢ Solamente hay dos posibles resultados en cada una de las comprobaciones que se
hacen a los conductores: llevan el cinturón de seguridad (resultado que denominaremos
("éxito") o no lo llevan ("fracaso").
➢ La probabilidad de "éxito" (llevar el cinturón) es la misma e invariable : 60%.

➢ Las pruebas son independientes: si el cuarto conductor que es parado no lleva el
cinturón de seguridad, eso no condiciona el resultado de la comprobación para el quinto
conductor que sea parado.
Cumple, por tanto, las condiciones del Proceso de Bernoulli, en el cual definimos una variable
aleatoria que es "número de conductores que llevan el cinturón", es decir, "número de
éxitos". Se trata, por tanto, de una distribución Binomial con n=10 y p=0.6.
a)
10 10!
P(X = 7) = ( ) 0,67 ⋅ 0, 43 = 0,67 ⋅ 0, 43 = 0,215
7 7! (10 − 7)!
b) Se puede realizar de 2 formas:

1:
P(X ≤ 7) = 1 − P(X = 10) − P(X = 9) − P(X = 8)
2:
P(X ≤ 7) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)

+P(X = 6) + P(X = 7)
Trabajando con la primera forma:
P(X≤7) = 1 - 0,006 - 0,04 - 0.121 = 0.833
Experimento Geométrico
Es un experimento Bernoulli que se repetirá hasta tener éxito.
Para calcular primer éxito:
𝑓(𝑥) = (1 − 𝑝)𝑥−1 𝑝
Para fracasos:
𝑓(𝑥) = (1 − 𝑝)𝑥 𝑝

Para primer éxito
Generador de momentos
1
𝑀(𝑡) = 𝑒 𝑡 𝑝 [ ]
1 − (1 − 𝑝)𝑒 𝑡
Media y Varianza
1 1−𝑃
μ= ; 𝜎2 =
𝜌 𝑝2
Para fracasos
Función de probabilidad de una distribución geométrica.

Función de distribución en una distribución geométrica.
Ejm2:
Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta el nacimiento de la
esperada hija. Calcular el número esperado de hijos (entre varones y hembras) que tendrá el
matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres hijos o más.
Variable aleatoria discreta - Binomial Negativa

Es un experimento de tipo Bernoulli el cual se repetirá hasta conseguir r éxitos.

Ejm2:
Para tratar a un paciente de una afección de pulmón, han de ser operados en operaciones
independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que si todo va bien, lo que
ocurre con probabilidad de 7/11, el lóbulo queda definitivamente sano, pero si no es así se
deberá esperar el tiempo suficiente para intentarlo posteriormente de nuevo. Se practicará la
cirugía hasta que 4 de sus 5 lóbulos funcionen correctamente. ¿Cuál es el valor de
intervenciones que se espera que deba padecer el paciente? ¿Cuál es la probabilidad de que
se necesiten 10 intervenciones?
Este es un ejemplo claro de experimento aleatorio regido por una ley binomial negativa, ya que
se realizan intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio que se
utiliza para detener el proceso. Identificando los parámetros se tiene que si X= Número de
operaciones hasta obtener r=4 con resultado positivo

Ejm3:
Se sabe que la probabilidad de que un niño expuesto a una enfermedad contagiosa la
contraiga es de 0,4. Calcula la probabilidad de que el décimo niño estudiado sea el tercero en
contraer la enfermedad.
Podemos enfocar el problema como una binomial negativa de parámetros X = 10, k=3 y p=0,4
Variable aleatoria discreta - Distribución Hipergeométrica

Es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realicen
experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación
experimental inicial.
Es una distribución fundamental en el estudio de muestras pequeñas de poblaciones pequeñas
y en el cálculo de probabilidades de juegos de azar. Tiene grandes aplicaciones en el control
de calidad para procesos experimentales en los que no es posible retornar a la situación de
partida.

Ejm2:
De cada 20 piezas fabricadas por una máquina, hay 2 que son defectuosas. Para realizar un
control de calidad, se observan 15 elementos y se rechaza el lote si hay alguna que sea
defectuoso. Vamos a calcular la probabilidad de que el lote sea rechazado.

Variable aleatoria discreta - Distribución de Poisson
Sus casos se suelen caracterizar por el número de sucesos de un determinado evento en un
período de tiempo. Cada uno de estos eventos toma dos posibles valores, éxito o fracaso,
equivalente a recibir una llamada o no recibirla, accidentarse o no accidentarse, etc... Además,
la probabilidad del éxito es muy pequeña. Es decir, la probabilidad de tener un accidente es
muy baja.

Ejm2:
Un analista de empresas ha pronosticado que el 3.5% de las pequeñas empresas irán a la
bancarrota en 1995. Para una muestra de 100 pequeñas empresas, estime la probabilidad de
que al menos tres de ellas entren en bancarrota, suponiendo que la predicción del experto es
correcta.
* Cumple los requisitos de un Proceso de Bernoulli, puesto que hay dos resultados posibles
(bancarrota o no bancarrota); la probabilidad es constante (3.5% predicho por el experto); y las
pruebas son independientes.
* Puede ser considerada una Binomial, puesto que definimos una variable aleatoria que es el
número de empresas que entran en bancarrota ("éxito").
* Pero cumple las condiciones para ser analizada como una distribución de Poisson, puesto
que n es muy grande (n=100) y p muy pequeña (p=0,035), por lo que la media es muy pequeña
en relación a n (n*p = 3,5)
Usaremos la distribución de Poisson con media 3,5 para aproximar nuestra distribución.
La probabilidad de que al menos 3 de las 100 empresas entren en bancarrota es igual a la
probabilidad de que entren 3 empresas, más la de que entren cuatro, más cinco, y así hasta
100.
Se puede hacer de forma tradicional usando cualquiera de las siguientes 2 formas para una
distribución binomial.
P(3) + P(4) + P(5) +.........+ P(100) = 1 - P(0) - P(1) - P(2)
Para P(0):
𝑒 −3,5 ⋅ 3,50 0,30197 ⋅ 1
𝑓(0) = = = 0,302
0! 1
Siguiendo con P(1) y P(2) tendremos:
P(X ≤ 3) = 1 - 0,302 - 0,1057 - 0,1850 = 0.679

VARIABLE ALEATORIA CONTINUA
En este caso, podemos diferenciar una variable continua de una discreta por el simple hecho
que los valores del dominio se los relaciona con un intervalo del rango. Mientras que en la
discreta varios valores del dominio se asociaban a un solo valor.
Función de distribución continua
Ejemplo:
Hallar k y la función de densidad a partir de una función de distribución continua

Esperanza Matemática
Ejm:

Distribución Uniforme
Diremos que la variable aleatoria X se distribuye UNIFORMEMENTE en un intervalo [a,b] .
Y su función de densidad es:
Gráfica de función de densidad
Su respectiva función de distribución la podemos obtener a través de un proceso de integración

cuyo resultado nos daría un gráfico así.

Función Gamma
Distribución Exponencial
Es un caso particular de la familia de distribuciones Gamma .Dada una variable aleatoria X que
tome valores reales no negativos {x 0} diremos que tiene una distribución exponencial de
parámetro λ con λ 0, si y sólo si su función de densidad tiene la expresión:
Existe otra definición en la cual λ se obtiene de una relación con la función gamma.
Función de densidad
Función de distribución

Media
1
μ=
λ
Varianza
1
𝜎=
λ2
Función Generadora de momentos
Distribución Gamma
Distribución Ji Cuadrado

Función Beta
Distribución Beta
DISTRIBUCIÓN NORMAL
Distribución Normal
La distribución normal es la más común entre todas las distribuciones de probabilidad utilizadas
en Estadística y tiene importantes aplicaciones en la modelización de variables estadísticas
asociadas a los elementos de una población.

Propiedades:
Cumple las siguientes propiedades:
• Es simétrica respecto de x = m pues f(m-x) = f(m+x).
• Alcanza un máximo en x = m y vale
1
√2𝛱𝜎
• Es creciente para x < m, y decreciente para x > m
• (4) Los puntos de abcisas (m-s) y (m+s) son de inflexión.

Comportamiento de la distribución normal
Con varianza fija
Con media fija

Distribución Normal Estándar
Estandarización

Tabla con los valores de las distribuciones normales

Ejm:
Ejm2:
Si X se distribuye como N(20,4), calcular las siguientes probabilidades:
1) P(X < 15).

2) P(4X - 5 > 80).
Ejm 3:
Para El tiempo empleado, en horas, en hacer un determinado producto sigue una
distribución N(10, 2) . Se pide la probabilidad de que ese producto se tarde en hacer:
a) Menos de 7 horas
Usando R:
De forma directa
Normalizando
b) Entre 8 y 13 horas
P[-1 ≤ z ≤1,5] = 1 - 0,1587 - 0,0668 = 0,7745

Usando R:
De forma directa

Normalizando
DISTRIBUCIONES CONJUNTAS
Variables aleatorias conjuntamente distribuidas
En variables discretas
Si X1, X2, X3…Xn son variables aleatorias conjuntas discretas, se define su función de
probabilidad conjunta como: Cuando de manera independiente las variables aleatorias a
considerar son discretas. De tal manera que:
Ejm:

Función de probabilidad conjunta
Siguiendo con el ejemplo anterior, tendríamos la siguiente función si relacionamos cada valor
de cada variable aleatoria entre sí.
Entre las propiedades de esta función tenemos que si fijamos una variable aleatoria podremos
obtener su probabilidad sumando las probabilidades de las filas u columnas según
corresponda. A esto se lo conoce como probabilidad marginal

Probabilidad Marginal
Más propiedades
Función de densidad conjunta

Ejm:
Ejm:
Calcular la probabilidad de x<2y

Solución
Para este tipo de ejercicios tenemos que calcular el área de la región especificada, por lo cual
tendríamos que integrar la región.
Funciones de densidad marginal

Valores esperados
Donde las funciones pertenecen a las funciones de densidad de cada variable.
Valor esperado en 2 variables

Ejm:
Ejm2:
ESTIMADORES
Estadísticos
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro
desconocido de la población. Por ejemplo, si se desea conocer el precio medio poblacional de
un artículo (parámetro desconocido) se recogen observaciones del precio de dicho artículo en
diversos establecimientos (muestra) pudiendo utilizarse la media aritmética de las
observaciones para estimar el precio medio poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige el
estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,
convergencia y robustez (consistencia).

El valor de un estimador proporciona una estimación puntual del valor del parámetro en
estudio. En general, se realiza la estimación mediante un intervalo, es decir, se obtiene un
intervalo (estadístico muestral ± error estimación) dentro del cual se espera se encuentre el
valor poblacional dentro de un cierto nivel de confianza. El nivel de confianza es la probabilidad
de que a priori el valor poblacional se encuentre contenido en el intervalo.
Ejm:

Estimador
Es un estadístico que se usa para estimar un parámetro
-Sesgo: Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza del
estimador sea igual al valor del parámetro que se desea estimar.

Error cuadrático Medio
Cota de Rao-Cramer
Eficiencia
Un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es
menor que la del segundo.
Sean 𝜃̂1 y 𝜃̂2 dos estimadores insesgados, se dice que 𝜃̂1 es más eficiente que 𝜃̂2 si se verifica que
𝑉𝑎𝑟(𝜃̂1 ) y Var( 𝜃̂2 ).
̂1 )
𝑉𝑎𝑟(𝜃
La eficiencia relativa se mide por el ratio: ̂2 )
𝑣𝑎𝑟(𝜃

La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden.
Consistencia
Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para
un estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda
a ser el valor del parámetro poblacional, propiedad que se denomina consistencia.
Un estimador 𝜃̂ consistente es un estimador asintóticamente insesgado cuya varianza tiende a

cero al aumentar el tamaño muestral.
El estimador 𝜃̂ es consistente cuando 𝑙𝑖𝑚 𝐸(𝜃̂) = 𝜃 y 𝑙𝑖𝑚 𝑉(𝜃̂) = 0

𝑛→∞ 𝑛→∞

MÉTODOS DE ESTIMACIÓN
Métodos de los momentos

Consiste en tomar como estimadores de los momentos de la población a los momentos de la
muestra . Podríamos decir que es un caso particular del método de analogía. En términos
operativos consiste en resolver el sistema de equivalencias entre unos adecuados momentos
empíricos(muestrales) y teóricos(poblacionales).
El procedimiento consiste en igualar momentos poblacionales respecto al origen α𝑟 a los

correspondientes momentos muestrales respecto al origen 𝑎𝑟 , formando así tantas ecuaciones
como parámetros poblacionales se pretenden estimar:

Probabilidad de muestra observada

Función de Verosimilitud - Métodos de la máxima verosimilitud
La estimación por máxima verosimilitud es un método de optimización
que supone que la distribución de probabilidad de las observaciones es
conocida.
Sea (𝑥1 , … , 𝑥𝑛 ) una muestra aleatoria (no necesariamente simple) de
una población X con función de masa 𝑃𝜃 (o función de densidad 𝑓𝜃 )
donde 𝜃 = (𝜃1 , . .. , 𝜃𝑛 )
Ejm: Distribución Geométrica

EJERCICOS ESTIMADORES
1. La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N( ,  ). Se extraen muestras aleatorias simples de
tamaño 4. Como estimadores del parámetro , se proponen los siguientes:
a) Comprobar si los estimadores son insesgados

b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir del Error
Cuadrático Medio.
Solución
̂ es insesgado (o centrado) cuando se verifica E(𝜽
a) Un estimador 𝜽 ̂) =
Los tres estimadores son insesgados o centrados

b) El estimador más eficiente es el que tenga menor varianza

Intervalo de confianza
Distribución de la Media
Distribución Normal Estándar

Intervalo de confianza para la Media
Tamaño de Muestra
Ejm

Intervalos para media sin conocer la varianza
Distribuciones muestrales para la normal

Intervalos en caso normal
Intervalos para proporciones

Verdadera confianza
Intervalos de confianza para diferencia de medias

Intervalos para la razón de varianzas
Intervalos para muestras pareadas
Intervalos de confianza para diferencia de proporciones

PRUEBA DE HIPÓTESIS
Método Científico
Ejemplo del juicio
Contraste de hipótesis

Errores de conclusión
Procedimiento de evaluación
Probabilidad de rechazar 𝐻0

Función de Potencia

Determinación del tamaño de la muestra
Funcion de potencia cola derecha

Función de potencia: Cola izquierda
Función de potencia: Dos colas

Hipótesis sobre μ: muestra grande, cola derecha
Hipótesis sobre μ: muestra grande, cola izquierda

Hipótesis sobre μ: muestra grande, dos colas
Hipótesis sobre μ: muestra normal, cola derecha
Hipótesis sobre μ: muestra normal, cola izquierda

Hipótesis sobre μ: muestra normal, dos colas
Ejemplo
Hipótesis sobre 𝝈𝟐 : muestra normal, cola derecha

Hipótesis sobre 𝝈𝟐 : muestra normal, cola izquierda
Hipótesis sobre 𝝈𝟐 : muestra normal, dos colas
Ejm:

Hipótesis sobre p (proporción): muestra grande, cola derecha
Hipótesis sobre p (proporción): muestra grande, cola izquierda
Hipótesis sobre p (proporción): muestra grande, dos colas

Ejemplo:
Dos medias: muestra grande, cola derecha
Dos medias: muestra grande, cola izquierda

Dos medias: muestra grande, dos colas
Dos medias: muestra normal, cola derecha
Dos medias: muestra normal, izquierda

Dos medias: muestra normal, dos colas
Ejemplo:

Dos varianzas: muestra normal: cola derecha
Dos varianzas: muestra normal: cola derecha
Dos varianzas: muestra normal: dos colas
Ejemplo

Dos proporciones: muestra grande, cola derecha
Dos proporciones: muestra grande, cola izquierda

Dos proporciones: muestra grande, dos colas
Ejemplo:

TABLAS DE CONTINGENCIA
Experimento Multinomial
Función de probabilidad

Prueba de hipótesis
Aproximación asintótica
Ejm:

Tablas de 2 vías
Probabilidades

Prueba de Pearson
Ejm:
Verificar si existen la creencia en Dios tiene alguna dependencia con el nivel de educacion

BONDAD DE AJUSTE
Prueba Ji-Cuadrado

Ejm: Variable Discreta
Ejm: Variable Continua

Distribución Empírica
Prueba de Kolmogorov-Smirnov
Ejm

Se rechaza H0
REGRESIÓN LINEAL SIMPLE
Relaciones estadísticas
Modelos

Regresión lineal simple
Estimación de Mínimos Cuadrados

Estimadores de mínimos cuadrados

Estimación de la Varianza
Ejemplo

Referencias
https://www2.ulpgc.es/hege/almacen/download/5/5509/Tema_1.pdf
https://www.youtube.com/watch?v=Rc3TJHcNSW0&list=PLxLmq9XZ1FnQSXmN6uFNzGUQSs
3kZCpIN&ab_channel=FCNMESPOL
https://matemovil.com/estadistica/
https://economipedia.com/
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferen
cia/VAdiscreta/4_1DistribucionHipergeometrica/index.html
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferen
cia/VAdiscreta/4_4DistribucionBinomialNegativa.html
https://www.estadistica.net/

Estadística

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística

Cargado por

Copyright:

Formatos disponibles

Estadística

Términos y Medidas Estadísticas

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

1. Media aritmética o promedio

Apuntes realizados por: David Yánez L.

Supongamos que se han obtenido 7 valores. Y que cada 𝑥1 , 𝑥2 , . . . . . . 𝑥𝑛 tienen un

Donde se puede dar lo siguiente:

Apuntes realizados por: David Yánez L.

Se define al p-ésimo cuantil de una muestra de la siguiente forma:

Apuntes realizados por: David Yánez L.

• Sea k la parte entera de p[n+1] y α la parte decimal.

𝑐𝑃 = 𝑥(𝑘) + 𝛼(𝑥(𝑘+1) − 𝑥(𝑘) ) = (1 − 𝛼)𝑥(𝑘) + 𝛼𝑥(𝑘+1)

Tercer cuartil: 𝑞3 = 𝑐(0,75)

Donde n=24, entonces 0,75(24+1)=18,75

𝑞3 = 𝑥(18,75) = 𝑥(18) + 0,75(𝑥(19) − 𝑥(18) ) = (0,25)𝑥(𝟏𝟖) + 0,75𝑥(19)

• 18 son menores o iguales que 𝑞3 , el 75% exacto

Primer quintil: 𝑞1 = 𝑐(0,20)

Donde n=19, entonces 0,20(19+1)=4

• 4 son menores o iguales que 𝑞1 , el 21,05%

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

➢ Mesocúrtica: la Curtosis=0. Distribución normal.

➢ Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media, presentando

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Diferencia entre el polígono de frecuencias y ojiva

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Si la covarianza >>0 (muy alejada de cero), la relación es creciente

Si la correlación 𝑟𝑥𝑦 ≈ 1 (muy cercano a cero), la relación es creciente

Si la correlación 𝑟𝑥𝑦 ≈ −1 (muy cercano a cero), la relación es decreciente

Si la correlación 𝑟𝑥𝑦 = 1 Línea recta.

Apuntes realizados por: David Yánez L.

Al conjunto de posibles resultados de un experimento se los denota con el símbolo Ω.

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Número total de elementos: n = 1+3+2 ➜ n = 6

Apuntes realizados por: David Yánez L.

𝑛+𝑘−1 (𝑛 + 𝑘 − 1)! (𝑛 + 𝑘 − 1)!

Planteamiento de los separadores y cajas

Apuntes realizados por: David Yánez L.

En otro caso tendríamos la siguiente

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Apuntes realizados por: David Yánez L.

Existe independencia de condición si se cumple que : 𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸1 )𝑃(𝐸2 )

𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 )𝑃(𝐸2 )

Apuntes realizados por: David Yánez L.

𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸2 |𝐸1 )𝑃(𝐸1 ) = 𝑃(𝐸1 |𝐸2 )𝑃(𝐸2 )

Apuntes realizados por: David Yánez L.

Graficamente seria así

Entonces la probabilidad de A viene dado por:

𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐸) + 𝑃(𝐴 ∩ 𝐸 𝐶 )

Además 𝐸 𝑦 𝐸 𝐶 forman una partición del espacio muestral S.

Apuntes realizados por: David Yánez L.

𝑃(𝐴) = ∑ 𝑃(𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )

Siempre y cuando A este particionado por 𝐸𝑖 .

Combinando el teorema de Bayes con la ley de la probabilidad total.

• 𝑨𝟏 : que un pez elegido aleatoriamente sea de la especie azul. P(𝐴1 )=0,4

Apuntes realizados por: David Yánez L.