Está en la página 1de 106

Estadística

Términos y Medidas Estadísticas


Estadística
-La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis
de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre
fenómenos observados.
-Es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio
que la genera siguiendo las leyes de la probabilidad.
Variables Cuantitativas
Cantidades determinísticas
Son cantidades que tienen un valor fijo y este permanece invariable.
Ejm: El kilo, duración de un minuto.
Cantidades estocásticas
Son cantidades que tienen un valor aleatorio o pueden variar.
Ejm: La altura de una mujer ecuatoriana, duración de una batería de celular, vida útil de
una computadora.
Variables Cualitativas
Son aquellos cuyos valores o resultados no se pueden asociar a un número
• Nominales: Sus valores no se pueden ordenar. (Grupo sanguíneo, religión)
• Ordinales: Sus valores se pueden ordenar (Grado de satisfacción, Nivel de luz)
Población
Conjunto sobre el cual se estudiará alguna característica
Ejm: Estudiantes de una universidad (característica a estudiar: cantidad de dinero que
gastan a diario en la universidad), Turistas extranjeros que van a Galápagos (característica
a estudiar: País de origen del turista), Bolsos hechos en Italia (característica a estudiar:
Material del que están compuesto)
Censo
Recolección de datos de toda la población
*No siempre es posible abarcar a toda una población debido a la logística que requiere o
es demasiado grande la población
Muestra
Subconjunto de una población

Apuntes realizados por: David Yánez L.


Ejm: (Población: Estudiantes de una universidad – Muestra: Estudiantes de la facultad de
administración), (Población: Turistas extranjeros que van a Galápagos – Muestra: Turistas
que vienen del continente asiático)
Parámetro
-Es un número que resume la gran cantidad de datos que pueden derivarse del estudio de
una variable estadística.
-Característica de interés de una población
Ejm: (Población: Estudiantes de una universidad – Parámetro: Mínima cantidad de dinero
que llevan los estudiantes), (Población: Turistas extranjeros que van a Galápagos –
Muestra: Cantidad promedio de turistas por año que visitan Galápagos)
Estimador
-Característica medida en una muestra.
(Muestra: Estudiantes de la facultad de administración – Estimador: Mínima cantidad de
dinero que llevan los estudiantes de dicha facultad), (Muestra: Turistas que vienen del
continente asiático – Estimador: Edad promedio de los turistas que vienen de Asia a
Galápagos)
*El estimador no será igual al parámetro.
*Si la muestra es representativa (la muestra se aproxima a la población), el estimador se
asemejará al parámetro.
*Cálculo del parámetro requiere censo (porque así se cubre a toda la población)
*Cálculo de un estimador es más económico (porque se requiere una parte de la población
“se estudian a menos entes, seres u objetos”)
Frecuencias
Indica la cantidad de veces que se repite una observación.

Apuntes realizados por: David Yánez L.


Medidas de tendencia central y dispersión
Medidas de tendencia central
Es un número situado hacia el centro de la distribución de los valores de una serie de
observaciones (medidas), en la que se encuentra ubicado el conjunto de los datos.
Este número por lo general suele representar a todas las medidas realizadas.

1. Media aritmética o promedio


Representa a todas las medidas realizadas. Se representa con el símbolo 𝑥̅ . Se
define de la siguiente manera:

2. Mediana
Es el valor “de en medio” de entre todos los valores obtenidos y ordenados.
Se expresa con el símbolo 𝑥̃ .
Se la puede obtener a través de la siguiente fórmula.

Apuntes realizados por: David Yánez L.


Ejm:

Supongamos que se han obtenido 7 valores. Y que cada 𝑥1 , 𝑥2 , . . . . . . 𝑥𝑛 tienen un


valor, entonces la mediana será el valor de 𝑥4 .

Medidas de ubicación
Mediana
La mediana divide la muestra en 2 partes.

Donde se puede dar lo siguiente:


➢ Al menos de la mitad de las observaciones son menores o iguales que la mediana.
➢ Al menos de la mitad de las observaciones son mayores o iguales que la mediana.
Moda
Es el valor con mayor frecuencia (el valor que más veces sale o se repite).

Apuntes realizados por: David Yánez L.


La moda existe siempre y cuando todos los valores/observaciones no tengan la misma
frecuencia. Sin embargo, si puede existir más de una moda.
Cuartiles
Divide la muestra en 4 partes: 𝑞1 , 𝑞2 , 𝑞3 .

Donde:
➢ Al menos el 25% de las observaciones son menores o iguales que 𝑞1
➢ 𝑞2 es la mediana.
➢ Al menos el 75% de las observaciones son menores o iguales que 𝑞3
También se pueden definir otras formas de dividir la muestra como terciles (𝑡1 , 𝑡2 ), deciles,
percentiles, etc.

Cuantil
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de
una variable aleatoria (son las divisiones de una muestra, de aquí nacen los terciles,
cuartiles, deciles, etc.).
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable 𝑥𝑝 que
marca un corte de modo que una proporción p de valores de la población es menor o igual
que 𝑥𝑝 .

Se define al p-ésimo cuantil de una muestra de la siguiente forma:

𝑐𝑝 = 𝑥(𝑝[𝑛+1])
De tal manera que:

Apuntes realizados por: David Yánez L.


➢ Si p[n+1] es entero, entonces el cuantil será una de las observaciones de la
muestra.
➢ Si p[n+1] no es entero, entonces el cuantil será el promedio de 2 observaciones.

• Sea k la parte entera de p[n+1] y α la parte decimal.


• El p-ésimo cuantil viene dado por:

𝑐𝑃 = 𝑥(𝑘) + 𝛼(𝑥(𝑘+1) − 𝑥(𝑘) ) = (1 − 𝛼)𝑥(𝑘) + 𝛼𝑥(𝑘+1)

-Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles
0,25; 0,50 y 0,75).
-Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles
0,20; 0,40; 0,60 y 0,80).
Ejm1:

Tercer cuartil: 𝑞3 = 𝑐(0,75)

Donde n=24, entonces 0,75(24+1)=18,75

𝑞3 = 𝑥(18,75) = 𝑥(18) + 0,75(𝑥(19) − 𝑥(18) ) = (0,25)𝑥(𝟏𝟖) + 0,75𝑥(19)


Podemos concluir que de las 24 observaciones

• 18 son menores o iguales que 𝑞3 , el 75% exacto


• 6 son mayores o iguales que 𝑞3 , el 25% exacto

Ejm2:

Primer quintil: 𝑞1 = 𝑐(0,20)

Donde n=19, entonces 0,20(19+1)=4

𝑞1 = 𝑥(4)
Podemos concluir que de las 19 observaciones

• 4 son menores o iguales que 𝑞1 , el 21,05%


• 16 son mayores o iguales que 𝑞1 , el 84,21%
Medidas de dispersión
Nos indica cuanto varían los datos.
Rango
Intervalo entre un valor máximo y un valor mínimo.

𝑟 = 𝑥(𝑓) − 𝑥(𝑖)

Apuntes realizados por: David Yánez L.


Rango intercuantil
Intervalo entre un cuantil máximo y un cuantil mínimo.

𝑖𝑟 = 𝑞(𝑓) − 𝑞(𝑖)
Varianza
Representa la variabilidad de una serie de datos respecto a su media elevadas al cuadrado
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

Desviación estándar
Representa la variabilidad de una serie de datos respecto a su media

𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un
rango de valores más amplio.
Ejm:
Tenemos las notas de los exámenes de los estudiantes de estadística. Calcular la
desviación estándar. Si las notas vienen dadas de la siguiente manera
(50,60,10,56,96,60)
50 + 60 + 10 + 56 + 96 + 60 332
𝑥̅ = = = 55,33
6 6
𝑛
1
𝑠 = √𝑠 2 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

∑(𝑥𝑖 − 𝑥̅ )2 = (50 − 55,33)2 + (60 − 55,33)2 + (10 − 55,33)2 + (56 − 55,33)2 + (96 − 55,33)2 + (60 − 55,33)2
𝑖=1
= 3781.33

Apuntes realizados por: David Yánez L.


𝟑𝟕𝟖𝟏. 𝟑𝟑
𝒔=√ = 𝟐𝟕, 𝟓𝟐
𝟓

Curtosis
Denota la concentración de valores que están representados en una gráfica. Una curtosis
grande implica una mayor concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que existe una relativamente
menor frecuencia de valores intermedios.
Estas se clasifican en:
➢ Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media, siendo una
curva muy apuntada.

➢ Mesocúrtica: la Curtosis=0. Distribución normal.

➢ Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media, presentando


una forma muy achatada.

Gráficos estadísticos
Diagramas de caja
Son una presentación visual que describe varias características importantes, al mismo tiempo,
tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.

Apuntes realizados por: David Yánez L.


Valor Aberrante

Valor Aberrante o Atípico: Es una observación que es numéricamente distante del resto de los
datos.

Estas asimetrías también se conocen como sesgos los cuales se clasifican según su
inclinación.
Note que el sesgo se refiere a que se considera una gran parte de un lado de los datos
mientras que el otro no se le tiene mucha importancia. (Debido a esto es que el sesgo va en
dirección a la menor cantidad representativa entre las mediciones u observaciones) Ejm. Si en
una población hay una gran cantidad de personas que son diestros (su mano dominante es la
derecha) entonces existe un sesgo respecto a los zurdos ya que no representan a muchas
personas.
Si la mediana se sitúa en el centro de la caja entonces la distribución es simétrica y tanto la
media, mediana y moda coinciden.
Diagrama de barras
Se usa en variable discreta. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura sea igual a la
frecuencia absoluta de ese valor.

Apuntes realizados por: David Yánez L.


Histograma
Se utiliza con variables continuas, o agrupadas en intervalos, representando en el eje X los
intervalos de clase y levantando rectángulos de base la longitud de los distintos intervalos y de
altura tal que el área sea proporcional a las frecuencias representadas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de
los rectángulos.

Diagrama de Sectores
Es un gráfico empleado fundamentalmente para variables cualitativas.
Las modalidades se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia

Apuntes realizados por: David Yánez L.


relativa de cada modalidad o valor por 360º.

Ojivas
Representan la frecuencia acumulada, se construye uniendo los puntos más altos de cada
columna de un histograma que represente las frecuencias acumuladas

Apuntes realizados por: David Yánez L.


Sesgo a la derecha Sesgo a la izquierda

Diferencia entre el polígono de frecuencias y ojiva


El polígono de frecuencias parte desde el histograma de frecuencias absolutas, mientras que la
ojiva parte del histograma de frecuencias acumuladas. Además, el polígono de frecuencias se
forma uniendo los puntos medios de la parte superior de cada barra, mientras que la ojiva se
forma uniendo el extremo derecho de la parte superior de cada barra.
En el siguiente gráfico, se apreciará mejor:

Fuente: https://matemovil.com/histogramas-ejemplos-y-ejercicios/

Observaciones Multivariantes
Se da cuando hay mas de 1 característica de interés en una población.
Cuando se toman mas de una medida en un mismo individuo estas suelen tener alguna
relación Ejm: A mayor estatura mayor peso.
Observaciones Bivariantes
Tenemos 2 datos que vendrían en ℝ2 . (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ). . . . . . . . . (𝑥𝑛 , 𝑦𝑛 ) , Estos pueden ser
graficados en una gráfica de dispersión.

Apuntes realizados por: David Yánez L.


Decimos que una relación es perfecta cuando la gráfica tiene un comportamiento lineal.
Cuando una relación no es perfecta entonces es una relación estadística.
Medida de Covariación
Nos permite definir el comportamiento de nuestras observaciones. Se usa la siguiente formula
(𝑥𝑖 − 𝑥̅ ) × (𝑦𝑖 − 𝑦̅)
Comportamiento curvilíneo

Apuntes realizados por: David Yánez L.


Comportamiento lineal creciente

Covarianza
Indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el
dato básico para determinar si existe una dependencia entre ambas variables

Si la covarianza >>0 (muy alejada de cero), la relación es creciente


Si la covarianza <<0 (muy alejada de cero), la relación es decreciente
Caso contrario si es muy cercano o igual a cero entonces no hay relación o la relación no es
creciente ni decreciente
Correlación
Indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. (sus valores están entre 1 y -1)

Si la correlación 𝑟𝑥𝑦 ≈ 1 (muy cercano a cero), la relación es creciente

Si la correlación 𝑟𝑥𝑦 ≈ −1 (muy cercano a cero), la relación es decreciente

Si la correlación 𝑟𝑥𝑦 = 1 Línea recta.

Apuntes realizados por: David Yánez L.


Experimento
Es cualquier proceso que proporciona datos, numéricos o no numéricos
Ejm: Al dar a luz conocer el género de los 2 hijos, al lanzar 1 dado saber el numero resultante.

Al conjunto de posibles resultados de un experimento se los denota con el símbolo Ω.


Ejm:
• En el experimento del género de los 2 hijos , Ω = {HH,HM,MM}
• En el experimento del dado, Ω ={1,2,3,4,5,6}

Apuntes realizados por: David Yánez L.


Espacio Muestral
El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio
y se suele representar por la letra S, donde S es subconjunto del conjunto potencia de Ω.
Por ejemplo, cuando lanzamos una moneda, ¿cuáles son todos los posibles resultados que
podemos obtener? Que salga cara o cruz, ¿verdad? En total son dos posibles resultados, por lo
que el espacio muestral tiene 2 elementos.
Ω = {cara, cruz}
Y si lanzamos un dado, tenemos en total 6 posibles resultados que pueden salir. Por lo tanto el
espacio muestral sería de 6 elementos.
S= {1, 2, 3, 4, 5, 6}.
Suceso o Evento
Un suceso es cualquier subconjunto o elemento del espacio muestral. Denotados con la letra E.
Ejm
“Sacar cara” en el lanzamiento de una moneda, “sacar el número 5” o “sacar un número primo”
en el lanzamiento de un dado son sucesos.
Probabilidad
La probabilidad asociada a un suceso o evento aleatorio es una medida del grado de
certidumbre de que dicho suceso pueda ocurrir. Se suele expresar como un número entre 0 y
1, donde un suceso imposible tiene probabilidad cero y un suceso seguro tiene probabilidad
uno.

Apuntes realizados por: David Yánez L.


Cálculo de probabilidad
Se utiliza la regla de Laplace, la cual establece que: en el caso de que todos los resultados de
un experimento aleatorio sean equiprobables, Laplace define la probabilidad de un suceso A
como el cociente entre el número de resultados favorables a que ocurra el suceso A en el
experimento y el número de resultados posibles del experimento.
#𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑜 𝐸𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
𝑃(𝐸) =
#𝛺 𝑜 𝑇𝑜𝑑𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Ejm:
Tenemos las 27 letras en un alfabeto y queremos saber la probabilidad que la letra que
saquemos sea una vocal.
5
𝑃(𝑆𝑎𝑐𝑎𝑟 𝑉𝑜𝑐𝑎𝑙) = = 0,16 𝑜 16%
27
Técnicas de Conteo
Las técnicas de conteo nos permitirán establecer el espacio muestral para el cálculo de
probabilidades.
Permutación
Una permutación de un conjunto de elementos es una disposición de dichos elementos
teniendo en cuenta el orden. El número de permutaciones de “n” elementos tomados de “k” en
“k” se calcula con la fórmula:

Ejm:
Eduardo, Carlos y Sergio se han presentado a un concurso de pintura. El concurso otorga $200
al primer lugar y $100 al segundo. ¿De cuántas formas se pueden repartir los premios de
primer y segundo lugar?

Apuntes realizados por: David Yánez L.


Permutación con repetición
La permutación con repetición se usa cuando en un total de “n” elementos, el primero se repite
“a” veces, el segundo “b” veces, el tercero “c” veces…
La fórmula para calcular el número de permutaciones u ordenamientos es la siguiente:

Donde:
• n = a+b+c
Hay tres condiciones en la permutación con repetición:
• Importa el orden.
• Hay elementos repetidos.
• Participan todos los elementos en los ordenamientos.
Ejm:
Cuantas palabras diferentes se pueden formar con las letras de la palabra BANANA.
Número de veces que se repite la letra B = 1
Número de veces que se repite la letra A = 3
Número de veces que se repite la letra N = 2

Número total de elementos: n = 1+3+2 ➜ n = 6

Combinación
Una combinación de un conjunto de elementos es una selección de dichos elementos sin tener
en cuenta el orden.
El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:

Ejm:
Se va a programar un torneo de ajedrez para los 10 integrantes de un club. ¿Cuántos partidos
se deben programar si cada integrante jugará con cada uno de los demás sin partidos de
revancha?

Apuntes realizados por: David Yánez L.


Combinación con repetición
Las combinaciones con repetición de m elementos tomados de n en n (m \ge n), son los
distintos grupos formados por n elementos de manera que:
• No entran todos los elementos.
• No importa el orden.
• Sí se repiten los elementos.

𝑛+𝑘−1 (𝑛 + 𝑘 − 1)! (𝑛 + 𝑘 − 1)!


( )= =
𝑘 (𝑛 + 𝑘 − 1 − 𝑘)! 𝑘! (𝑛 − 1)! 𝑘!
Ejm:
En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas se pueden elegir
cuatro botellas?
Podemos deducir lo siguiente:
➢ No entran todos los elementos. Sólo elije 4.
➢ No importa el orden. Da igual que elija 2 botellas de anís y 2 de ron, que 2 de ron y 2 de
anís.
➢ Sí se repiten los elementos. Puede elegir más de una botella del mismo tipo

Planteamiento de los separadores y cajas


Nos permite establecer una relación ente variables y una igualdad, en el cual los espacios u
ánforas creados por los separadores representaran a las variables y el total de los elementos
de dichas ánforas representara la igualdad. Finalmente tendríamos que calcular de cuantas
maneras se podrían distribuir los separadores.
De tal forma que tendríamos la siguiente formula:

Apuntes realizados por: David Yánez L.


Sea:
• n: la cantidad de elementos total o la igualdad a la que se quiere llegar
• m: la cantidad de variables o ánforas necesarias para la igualdad
• k: la cantidad de separadores que es igual a m-1

𝑛+𝑘 (𝑛 + 𝑘)!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!
A continuación, un ejemplo para que quede más claro lo anterior mencionado.
Ejm:
Cuantas posibles soluciones con valores no negativos satisfacen la siguiente ecuación

𝑥1 + 𝑥2 + 𝑥3 = 10
El planteamiento sería el siguiente:
Podemos usar números del 0 al 10, tendiendo soluciones del tipo:
• 10+0+0=10
• 3+3+4=10
• …….
En un caso tendríamos la siguiente solución

En otro caso tendríamos la siguiente

Ahora solo nos queda determinar de cuantas maneras podríamos distribuir los separadores.
Nuestras variables quedan de la siguiente manera:
• n: 10
• m: 3
• k: m-1= 3-1=2

Apuntes realizados por: David Yánez L.


10 + 2 (12)!
( )= = 66
2 (8)! 2!
Este ejercicio puede ser resuelto a través de combinación con repetición.
Y quedaría de la siguiente manera

10 + 3 − 1 (12)!
( )= = 66
10 (9)! 10!
Queda al lector demostrar o entender la resolución planteada por combinación con repetición.
Ejercicios de cálculo de probabilidades:
Ej1:
Una empacadora de frutas 12 frutas de tipo (dulce, seca y cítrica) y tene

Ej2:
En una mesa redonda para 5 personas se sientan (José, María, Pepe, Sech, Manuel). ¿Cuál es
la probabilidad qué Manuel y María se sienten juntos?
• Primero definimos el espacio muestral, así que calculamos todas posibles maneras en
que se puedan sentar todos:
n!=5!=120
Nos queda que #𝛺 = 120
• Calculamos como se podrían sentar Manuel y María asumiendo que son una persona.
n!=4!=24
Finalmente
24
P(MyM) = = 0,2
120
Probabilidad Condicional
Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La
probabilidad condicional se escribe P(A|B) o P(A/B), y se lee «la probabilidad de A dado B».
Ejm:
¿Cuál es la probabilidad de que alguien sufra un robo en diciembre?. Como podemos darnos
cuenta existe una probabilidad de sufrir un robo, pero en el mes de diciembre la probabilidad de
sufrir un robo aumenta. Tendríamos una probabilidad más alta
¿Cuál es la probabilidad de que llueva en Guayaquil en Junio?. En este caso existe una
probabilidad de que llueva en Guayaquil, pero esta probabilidad disminuye al ser en el mes de
junio ya que se estaría en la estación seca.

Apuntes realizados por: David Yánez L.


La probabilidad condicional de 𝐸2 dado 𝐸1 se define como:

𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )
Cumpliéndose las siguientes condiciones

➢ 𝑃(𝐸2 |𝐸1 ) ≥ 0
➢ 𝑃(𝐸1 |𝐸1 ) ≥ 1
➢ 𝐸2 ∩ 𝐸3 = ∅ ⇒ 𝑃(𝐸2 ∩ 𝐸3 |𝐸1 ) = 𝑃(𝐸2 |𝐸1 ) + 𝑃(𝐸3 |𝐸1 )

Ejm:

Note que 𝑃(𝐸2 |𝐸1 ) es la probabilidad de 𝐸2 Sobre el conjunto u subespacio del espacio
muestral dado por E1 .
Ejm:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste la
fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el
chocolate.
Evento A: que a un amigo le gusten los fresa. P(A) = ?
Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25 %.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el
chocolate.

Apuntes realizados por: David Yánez L.


Independencia
Se da cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra
o no, es decir, cuando ambos sucesos no están relacionados.

Existe independencia de condición si se cumple que : 𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸1 )𝑃(𝐸2 )


Además, cuando dos eventos son independientes sucede que:

𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 )𝑃(𝐸2 )


𝑃(𝐸2 |𝐸1 ) = = = 𝑃(𝐸2 )
𝑃(𝐸1 ) 𝑃(𝐸1 )
Se ve claramente que como 𝐸2 es independiente a pesar de que se lo condicione por 𝐸1 su
probabilidad es la misma (es 𝐸2 ).
Conjuntos disjuntos no garantizan la independencia de probabilidad.
Ejm:
Si hay una probabilidad del 10% de que Júpiter se alineará con Marte, y una probabilidad del
50% de que su tirada de una moneda saldrá águilas, entonces ¿qué es la probabilidad de que
Júpiter se alineará con Marte y su tirada de la moneda saldrá águilas (suponiendo que Júpiter
no tenga ningún efecto en el resultado de su tirada)?
J: Júpiter se alineará con Marte
A: Su tirada saldrá águilas
Pues Júpiter no tiene ningún efecto en su tirada de la moneda, tomamos estos sucesos como
independientes, y así la probabilidad de que ambos sucesos ocurrirán es
P(J ∩ A) = P(J)P(A) = (0.10)(0.50) = .05.

Teorema de Bayes
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo
información de antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta
característica que condiciona su probabilidad.

Dado un espacio de probabilidad (𝛺, 𝑆, 𝑃). Con las probabilidades condicionales 𝐸1 𝑦 𝐸2 tal
que:

Apuntes realizados por: David Yánez L.


𝑃(𝐸1 ∩ 𝐸2 ) 𝑃(𝐸1 ∩ 𝐸2 )
𝑃(𝐸2 |𝐸1 ) = 𝑦 𝑃(𝐸1 |𝐸2 ) =
𝑃(𝐸1 ) 𝑃(𝐸2 )
Despejando se tendría que:

𝑃(𝐸1 ∩ 𝐸2 ) = 𝑃(𝐸2 |𝐸1 )𝑃(𝐸1 ) = 𝑃(𝐸1 |𝐸2 )𝑃(𝐸2 )


Finalmente, el teorema de Bayes se define a través de la siguiente formula.

𝑃(𝐸1 ∩ 𝐸2 )𝑃(𝐸2 )
𝑃(𝐸2 |𝐸1 ) =
𝑃(𝐸1 )

Ejm2:
En una academia, la probabilidad de que a un alumno seleccionado al azar le guste el helado
es del 60 %, mientras que la probabilidad de que a un alumno le guste la torta es del 36 %.
Además, se sabe que la probabilidad de que a un alumno le guste la torta dado que le gusta el
helado es del 40 %. Calcular la probabilidad de que a un alumno le guste el helado, dado que
le gusta la torta.
Solución
Primero definimos los 2 eventos con los que vamos a trabajar:
h: que a un alumno le guste el helado.
t: que a un alumno le guste la torta.
Tenemos los siguientes datos:

Apuntes realizados por: David Yánez L.


P(h) = 0,6.
P(t) = 0,36.
P(t|h) = 0,4.
Nos piden calcular P(h|t).
Aplicamos el teorema de Bayes:

Entonces, la probabilidad de que un alumno le guste el helado dado que le gusta la torta es de
0,6667 o 66,67 %.
Probabilidad Total
Sean los eventos A,E ∈ S.
Entonces A se puede particionar en 2 eventos disjuntos:

𝐴 = (𝐴 ∩ 𝐸) ∪ (𝐴 ∩ 𝐸 𝐶 )

Graficamente seria así

Entonces la probabilidad de A viene dado por:

𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐸) + 𝑃(𝐴 ∩ 𝐸 𝐶 )


𝑃(𝐴) = 𝑃(𝐴|𝐸)𝑃(𝐸) + 𝑃(𝐴|𝐸 𝐶 )𝑃(𝐸 𝐶 )
Note que son probabilidades condicionadas (no independientes)

Además 𝐸 𝑦 𝐸 𝐶 forman una partición del espacio muestral S.

Apuntes realizados por: David Yánez L.


Ley de probabilidad Total
Si particionamos el espacio muestral en k eventos exhaustivos (la union de todos los k forman
a S(el espacio muetral)) y mutuamente excluyentes (conjuntos disjuntos).
Tal que:

𝐸1 , 𝐸2 , … . , 𝐸𝑘 𝜖 𝑆
De modo que:

𝐸1 ∪ 𝐸2 ∪ … .∪ 𝐸𝑘 = 𝑆
∀𝑖,𝑗 𝜖 N ≤ k ^ 𝑖 ≠ 𝑗 / Ei ∩ Ei = ∅
Por lo cual podemos concluir que:
𝑘

𝑃(𝐴) = ∑ 𝑃(𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )


𝑖=1

Siempre y cuando A este particionado por 𝐸𝑖 .


No necesariamente la unión de los eventos debe formar al espacio muestral. Es suficiente con
que la suma de las probabilidades de cada evento sea 1.

Combinando el teorema de Bayes con la ley de la probabilidad total.

𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑃(𝐸𝑗 |𝐴) = 𝑘
∑ 𝑃(𝐴|𝐸𝑗 )𝑃(𝐸𝑗 )
𝑗=1

Ejm:
En un acuario se tienen solo 2 especies de peces, el 40% son de la especie azul y el 60% son
de la especie roja. De la especie azul, el 30% son machos; mientras que, de la especie roja, el
40% son hembras. ¿Cuál es la probabilidad de que un pez elegido aleatoriamente en el acuario
sea macho?

• 𝑨𝟏 : que un pez elegido aleatoriamente sea de la especie azul. P(𝐴1 )=0,4


• 𝑨𝟐 : que un pez elegido aleatoriamente sea de la especie roja. P(𝐴2 )=0,6
• B: que un pez elegido aleatoriamente sea macho.
• De la especie azul, el 30% son machos. 𝑃(𝐵|𝐴1 ) = 0,3
• El 40% de los peces de la especia roja son hembras, por ello, el 60% serán machos. Por
lo tanto 𝑃(𝐵|𝐴2 ) = 0,6

Apuntes realizados por: David Yánez L.


Ejm2:

Apuntes realizados por: David Yánez L.


VARIABLE ALEATORIA DISCRETA
Es una función que asigna un valor numérico, al resultado de un experimento aleatorio.
Donde su dominio es el espacio muestral, la relación (la función) es el experimento/evento cuya
representación será a través de una letra mayúscula y el rango representado por la misma de
la función, pero minúscula con subíndices, estos elementos del rango serán dados por un
número real que vienen a ser la cantidad de eventos favorables a la condición dada por la
relación.

Función de Distribución
Es una función ℝ → ℝ cuyo rango será la posibilidad del evento. Tal que F(x)=P(X ≤ x).

Apuntes realizados por: David Yánez L.


Ejm Variable Aleatoria

Su funcion de distribución vendría dada de la siguiente manera

Apuntes realizados por: David Yánez L.


Función de probabilidad
Asigna un valor de probabilidad a los valores de la variable aleatoria.
Siguiendo el ejemplo anterior:

Note que los x son números reales que son elementos del rango de la función de distribución.
Esperanza Matemática
Es la generalización de la media aritmética a toda la población, es decir, es la media de la
variable aleatoria.
Note que la función de probabilidad se denota como: f(x), mientras que la función de
distribución se denota como F(x).

Apuntes realizados por: David Yánez L.


Media o valor esperado o primer momento
n

μ = E(X) = ∑ xi ⋅ P(xi )
i=1

Segundo momento
𝑛

𝜇2 = 𝐸(𝑋 2 ) = ∑ xi 2 ⋅ P(xi )
𝑖=

Varianza
𝑛

𝜎 2 = 𝑣𝑎𝑟(𝑋) = 𝐸((𝑋 − μ)2 ) = ∑(xi − μ)2 ⋅ P(xi )


𝑖=

Además

𝜎 2 = 𝐸(𝑋 2 ) − μ2
Propiedades

Función Generadora de momentos

Apuntes realizados por: David Yánez L.


Variable aleatoria discreta - uniforme
Una variable aleatoria discreta tiene distribución uniforme cuando la probabilidad en todos los
valores de la función de probabilidad f(x) son iguales; es decir, cuando todos los posibles
valores que puede adoptar la variable (x1 , x2 , . . . . . xn ) tienen la misma probabilidad.

Además, cumple con las siguientes características.

Ejm variable aleatoria discreta


f(x), funcion de probabilidad

Apuntes realizados por: David Yánez L.


F(x), funcion de distribución

Note que el salto entre cada elemento del dominio es el mismo, en este caso el salto es de
(0,1).
Experimento Bernoulli
Se da en aquellas situaciones en las que sólo hay dos posibles resultados mutuamente
excluyentes (verdadero/falso, en una prueba; defectuoso/no defectuoso, en los artículos que
salen de una fábrica; aprobado/suspendido, etc.). Decimos que son mutuamente excluyentes
porque no pueden darse simultáneamente (un examen no puede estar aprobado y suspendido
al mismo tiempo; una respuesta no puede ser simultáneamente verdadera o falsa, etc...).
Una manera común de designar estos dos resultados es como Éxito (E) o Fracaso (F).

Variable aleatoria discreta - Binomial


Sea un experimento aleatorio en el que pueden obtenerse dos resultados posibles,
mutuamente excluyentes (el resultado de uno no influye en el otro) , con probabilidades
constantes en el que p es la probabilidad de éxito (Experimento Bernoulli). Supongamos que
se realizan n pruebas independientes Sea X la variable definida como el número de éxitos
resultantes entonces diremos que X se distribuye como una distribución binomial.

Note que en este tipo de distribución solo nos interesas las probabilidades de éxito.

Apuntes realizados por: David Yánez L.


Ejm:
Experimentación con 3 mediciones y con la condición de poseer 2 experimentos exitosos.

Generador de momentos

Función de probabilidad de una distribución binomial

Apuntes realizados por: David Yánez L.


Función de distribución de una distribución binomial

Ejm:

Ejm2:
Un reciente estudio de la Asociación Americana de Conductores de Autopista ha revelado que
el 60% de los conductores norteamericanos usa regularmente el cinturón de seguridad. Se
selecciona una muestra de 10 conductores en una autopista del estado de Oklahoma.
a) ¿Cuál es la probabilidad de que exactamente siete de ellos lleven el cinturón de seguridad?
b) ¿Cuál la probabilidad de que al menos siete de los conductores lleven el cinturón de
seguridad?
➢ Solamente hay dos posibles resultados en cada una de las comprobaciones que se
hacen a los conductores: llevan el cinturón de seguridad (resultado que denominaremos
("éxito") o no lo llevan ("fracaso").

➢ La probabilidad de "éxito" (llevar el cinturón) es la misma e invariable : 60%.

Apuntes realizados por: David Yánez L.


➢ Las pruebas son independientes: si el cuarto conductor que es parado no lleva el
cinturón de seguridad, eso no condiciona el resultado de la comprobación para el quinto
conductor que sea parado.

Cumple, por tanto, las condiciones del Proceso de Bernoulli, en el cual definimos una variable
aleatoria que es "número de conductores que llevan el cinturón", es decir, "número de
éxitos". Se trata, por tanto, de una distribución Binomial con n=10 y p=0.6.

a)
10 10!
P(X = 7) = ( ) 0,67 ⋅ 0, 43 = 0,67 ⋅ 0, 43 = 0,215
7 7! (10 − 7)!

b) Se puede realizar de 2 formas:


1:
P(X ≤ 7) = 1 − P(X = 10) − P(X = 9) − P(X = 8)
2:

P(X ≤ 7) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)


+P(X = 6) + P(X = 7)
Trabajando con la primera forma:
P(X≤7) = 1 - 0,006 - 0,04 - 0.121 = 0.833

Experimento Geométrico
Es un experimento Bernoulli que se repetirá hasta tener éxito.

Para calcular primer éxito:

𝑓(𝑥) = (1 − 𝑝)𝑥−1 𝑝
Para fracasos:

𝑓(𝑥) = (1 − 𝑝)𝑥 𝑝

Apuntes realizados por: David Yánez L.


Para primer éxito
Generador de momentos
1
𝑀(𝑡) = 𝑒 𝑡 𝑝 [ ]
1 − (1 − 𝑝)𝑒 𝑡
Media y Varianza
1 1−𝑃
μ= ; 𝜎2 =
𝜌 𝑝2
Para fracasos

Función de probabilidad de una distribución geométrica.

Apuntes realizados por: David Yánez L.


Función de distribución en una distribución geométrica.

Ejm2:
Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta el nacimiento de la
esperada hija. Calcular el número esperado de hijos (entre varones y hembras) que tendrá el
matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres hijos o más.

Variable aleatoria discreta - Binomial Negativa


Es un experimento de tipo Bernoulli el cual se repetirá hasta conseguir r éxitos.

Apuntes realizados por: David Yánez L.


Ejm2:
Para tratar a un paciente de una afección de pulmón, han de ser operados en operaciones
independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que si todo va bien, lo que
ocurre con probabilidad de 7/11, el lóbulo queda definitivamente sano, pero si no es así se
deberá esperar el tiempo suficiente para intentarlo posteriormente de nuevo. Se practicará la
cirugía hasta que 4 de sus 5 lóbulos funcionen correctamente. ¿Cuál es el valor de
intervenciones que se espera que deba padecer el paciente? ¿Cuál es la probabilidad de que
se necesiten 10 intervenciones?
Este es un ejemplo claro de experimento aleatorio regido por una ley binomial negativa, ya que
se realizan intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio que se
utiliza para detener el proceso. Identificando los parámetros se tiene que si X= Número de
operaciones hasta obtener r=4 con resultado positivo

Apuntes realizados por: David Yánez L.


Ejm3:
Se sabe que la probabilidad de que un niño expuesto a una enfermedad contagiosa la
contraiga es de 0,4. Calcula la probabilidad de que el décimo niño estudiado sea el tercero en
contraer la enfermedad.
Podemos enfocar el problema como una binomial negativa de parámetros X = 10, k=3 y p=0,4

Variable aleatoria discreta - Distribución Hipergeométrica


Es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realicen
experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación
experimental inicial.
Es una distribución fundamental en el estudio de muestras pequeñas de poblaciones pequeñas
y en el cálculo de probabilidades de juegos de azar. Tiene grandes aplicaciones en el control
de calidad para procesos experimentales en los que no es posible retornar a la situación de
partida.

Apuntes realizados por: David Yánez L.


Ejm2:
De cada 20 piezas fabricadas por una máquina, hay 2 que son defectuosas. Para realizar un
control de calidad, se observan 15 elementos y se rechaza el lote si hay alguna que sea
defectuoso. Vamos a calcular la probabilidad de que el lote sea rechazado.

Apuntes realizados por: David Yánez L.


Variable aleatoria discreta - Distribución de Poisson
Sus casos se suelen caracterizar por el número de sucesos de un determinado evento en un
período de tiempo. Cada uno de estos eventos toma dos posibles valores, éxito o fracaso,
equivalente a recibir una llamada o no recibirla, accidentarse o no accidentarse, etc... Además,
la probabilidad del éxito es muy pequeña. Es decir, la probabilidad de tener un accidente es
muy baja.

Apuntes realizados por: David Yánez L.


Ejm2:
Un analista de empresas ha pronosticado que el 3.5% de las pequeñas empresas irán a la
bancarrota en 1995. Para una muestra de 100 pequeñas empresas, estime la probabilidad de
que al menos tres de ellas entren en bancarrota, suponiendo que la predicción del experto es
correcta.
* Cumple los requisitos de un Proceso de Bernoulli, puesto que hay dos resultados posibles
(bancarrota o no bancarrota); la probabilidad es constante (3.5% predicho por el experto); y las
pruebas son independientes.
* Puede ser considerada una Binomial, puesto que definimos una variable aleatoria que es el
número de empresas que entran en bancarrota ("éxito").
* Pero cumple las condiciones para ser analizada como una distribución de Poisson, puesto
que n es muy grande (n=100) y p muy pequeña (p=0,035), por lo que la media es muy pequeña
en relación a n (n*p = 3,5)
Usaremos la distribución de Poisson con media 3,5 para aproximar nuestra distribución.
La probabilidad de que al menos 3 de las 100 empresas entren en bancarrota es igual a la
probabilidad de que entren 3 empresas, más la de que entren cuatro, más cinco, y así hasta
100.
Se puede hacer de forma tradicional usando cualquiera de las siguientes 2 formas para una
distribución binomial.
P(3) + P(4) + P(5) +.........+ P(100) = 1 - P(0) - P(1) - P(2)
Para P(0):
𝑒 −3,5 ⋅ 3,50 0,30197 ⋅ 1
𝑓(0) = = = 0,302
0! 1
Siguiendo con P(1) y P(2) tendremos:
P(X ≤ 3) = 1 - 0,302 - 0,1057 - 0,1850 = 0.679

Apuntes realizados por: David Yánez L.


VARIABLE ALEATORIA CONTINUA
En este caso, podemos diferenciar una variable continua de una discreta por el simple hecho
que los valores del dominio se los relaciona con un intervalo del rango. Mientras que en la
discreta varios valores del dominio se asociaban a un solo valor.

Función de distribución continua

Ejemplo:
Hallar k y la función de densidad a partir de una función de distribución continua

Apuntes realizados por: David Yánez L.


Esperanza Matemática

Ejm:

Apuntes realizados por: David Yánez L.


Distribución Uniforme
Diremos que la variable aleatoria X se distribuye UNIFORMEMENTE en un intervalo [a,b] .
Y su función de densidad es:

Gráfica de función de densidad

Su respectiva función de distribución la podemos obtener a través de un proceso de integración


cuyo resultado nos daría un gráfico así.

Apuntes realizados por: David Yánez L.


Función Gamma

Distribución Exponencial
Es un caso particular de la familia de distribuciones Gamma .Dada una variable aleatoria X que
tome valores reales no negativos {x 0} diremos que tiene una distribución exponencial de
parámetro λ con λ 0, si y sólo si su función de densidad tiene la expresión:

Existe otra definición en la cual λ se obtiene de una relación con la función gamma.

Función de densidad

Función de distribución

Apuntes realizados por: David Yánez L.


Media
1
μ=
λ
Varianza
1
𝜎=
λ2
Función Generadora de momentos

Distribución Gamma

Distribución Ji Cuadrado

Apuntes realizados por: David Yánez L.


Función Beta

Distribución Beta

DISTRIBUCIÓN NORMAL
Distribución Normal
La distribución normal es la más común entre todas las distribuciones de probabilidad utilizadas
en Estadística y tiene importantes aplicaciones en la modelización de variables estadísticas
asociadas a los elementos de una población.

Apuntes realizados por: David Yánez L.


Propiedades:
Cumple las siguientes propiedades:
• Es simétrica respecto de x = m pues f(m-x) = f(m+x).
• Alcanza un máximo en x = m y vale
1
√2𝛱𝜎
• Es creciente para x < m, y decreciente para x > m
• (4) Los puntos de abcisas (m-s) y (m+s) son de inflexión.

Apuntes realizados por: David Yánez L.


Comportamiento de la distribución normal
Con varianza fija

Con media fija

Apuntes realizados por: David Yánez L.


Distribución Normal Estándar

Estandarización

Apuntes realizados por: David Yánez L.


Tabla con los valores de las distribuciones normales

Apuntes realizados por: David Yánez L.


Ejm:

Ejm2:
Si X se distribuye como N(20,4), calcular las siguientes probabilidades:
1) P(X < 15).

Apuntes realizados por: David Yánez L.


2) P(4X - 5 > 80).

Ejm 3:
Para El tiempo empleado, en horas, en hacer un determinado producto sigue una
distribución N(10, 2) . Se pide la probabilidad de que ese producto se tarde en hacer:
a) Menos de 7 horas

Usando R:
De forma directa

Normalizando

b) Entre 8 y 13 horas

P[-1 ≤ z ≤1,5] = 1 - 0,1587 - 0,0668 = 0,7745


Usando R:
De forma directa

Apuntes realizados por: David Yánez L.


Normalizando

DISTRIBUCIONES CONJUNTAS
Variables aleatorias conjuntamente distribuidas
En variables discretas
Si X1, X2, X3…Xn son variables aleatorias conjuntas discretas, se define su función de
probabilidad conjunta como: Cuando de manera independiente las variables aleatorias a
considerar son discretas. De tal manera que:

Ejm:

Apuntes realizados por: David Yánez L.


Función de probabilidad conjunta
Siguiendo con el ejemplo anterior, tendríamos la siguiente función si relacionamos cada valor
de cada variable aleatoria entre sí.

Entre las propiedades de esta función tenemos que si fijamos una variable aleatoria podremos
obtener su probabilidad sumando las probabilidades de las filas u columnas según
corresponda. A esto se lo conoce como probabilidad marginal

Apuntes realizados por: David Yánez L.


Probabilidad Marginal

Más propiedades

Función de densidad conjunta

Apuntes realizados por: David Yánez L.


Ejm:

Ejm:
Calcular la probabilidad de x<2y

Apuntes realizados por: David Yánez L.


Solución
Para este tipo de ejercicios tenemos que calcular el área de la región especificada, por lo cual
tendríamos que integrar la región.

Funciones de densidad marginal

Apuntes realizados por: David Yánez L.


Valores esperados
Donde las funciones pertenecen a las funciones de densidad de cada variable.

Valor esperado en 2 variables

Apuntes realizados por: David Yánez L.


Ejm:

Ejm2:

ESTIMADORES
Estadísticos
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro
desconocido de la población. Por ejemplo, si se desea conocer el precio medio poblacional de
un artículo (parámetro desconocido) se recogen observaciones del precio de dicho artículo en
diversos establecimientos (muestra) pudiendo utilizarse la media aritmética de las
observaciones para estimar el precio medio poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige el
estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,
convergencia y robustez (consistencia).

Apuntes realizados por: David Yánez L.


El valor de un estimador proporciona una estimación puntual del valor del parámetro en
estudio. En general, se realiza la estimación mediante un intervalo, es decir, se obtiene un
intervalo (estadístico muestral ± error estimación) dentro del cual se espera se encuentre el
valor poblacional dentro de un cierto nivel de confianza. El nivel de confianza es la probabilidad
de que a priori el valor poblacional se encuentre contenido en el intervalo.

Ejm:

Apuntes realizados por: David Yánez L.


Estimador
Es un estadístico que se usa para estimar un parámetro
-Sesgo: Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza del
estimador sea igual al valor del parámetro que se desea estimar.

Apuntes realizados por: David Yánez L.


Error cuadrático Medio

Cota de Rao-Cramer

Eficiencia
Un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es
menor que la del segundo.

Sean 𝜃̂1 y 𝜃̂2 dos estimadores insesgados, se dice que 𝜃̂1 es más eficiente que 𝜃̂2 si se verifica que
𝑉𝑎𝑟(𝜃̂1 ) y Var( 𝜃̂2 ).
̂1 )
𝑉𝑎𝑟(𝜃
La eficiencia relativa se mide por el ratio: ̂2 )
𝑣𝑎𝑟(𝜃

Apuntes realizados por: David Yánez L.


La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden.

Consistencia
Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para
un estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda
a ser el valor del parámetro poblacional, propiedad que se denomina consistencia.

Un estimador 𝜃̂ consistente es un estimador asintóticamente insesgado cuya varianza tiende a


cero al aumentar el tamaño muestral.

El estimador 𝜃̂ es consistente cuando 𝑙𝑖𝑚 𝐸(𝜃̂) = 𝜃 y 𝑙𝑖𝑚 𝑉(𝜃̂) = 0


𝑛→∞ 𝑛→∞

Apuntes realizados por: David Yánez L.


MÉTODOS DE ESTIMACIÓN

Métodos de los momentos


Consiste en tomar como estimadores de los momentos de la población a los momentos de la
muestra . Podríamos decir que es un caso particular del método de analogía. En términos
operativos consiste en resolver el sistema de equivalencias entre unos adecuados momentos
empíricos(muestrales) y teóricos(poblacionales).

El procedimiento consiste en igualar momentos poblacionales respecto al origen α𝑟 a los


correspondientes momentos muestrales respecto al origen 𝑎𝑟 , formando así tantas ecuaciones
como parámetros poblacionales se pretenden estimar:

Apuntes realizados por: David Yánez L.


Probabilidad de muestra observada

Apuntes realizados por: David Yánez L.


Función de Verosimilitud - Métodos de la máxima verosimilitud
La estimación por máxima verosimilitud es un método de optimización
que supone que la distribución de probabilidad de las observaciones es
conocida.
Sea (𝑥1 , … , 𝑥𝑛 ) una muestra aleatoria (no necesariamente simple) de
una población X con función de masa 𝑃𝜃 (o función de densidad 𝑓𝜃 )
donde 𝜃 = (𝜃1 , . .. , 𝜃𝑛 )

Ejm: Distribución Geométrica

Apuntes realizados por: David Yánez L.


EJERCICOS ESTIMADORES
1. La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N( ,  ). Se extraen muestras aleatorias simples de
tamaño 4. Como estimadores del parámetro , se proponen los siguientes:

a) Comprobar si los estimadores son insesgados


b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir del Error
Cuadrático Medio.

Solución
̂ es insesgado (o centrado) cuando se verifica E(𝜽
a) Un estimador 𝜽 ̂) =

Los tres estimadores son insesgados o centrados


b) El estimador más eficiente es el que tenga menor varianza

Apuntes realizados por: David Yánez L.


Intervalo de confianza

Distribución de la Media

Distribución Normal Estándar

Apuntes realizados por: David Yánez L.


Apuntes realizados por: David Yánez L.
Intervalo de confianza para la Media

Tamaño de Muestra

Ejm

Apuntes realizados por: David Yánez L.


Intervalos para media sin conocer la varianza

Distribuciones muestrales para la normal

Apuntes realizados por: David Yánez L.


Intervalos en caso normal

Intervalos para proporciones

Apuntes realizados por: David Yánez L.


Verdadera confianza

Intervalos de confianza para diferencia de medias

Apuntes realizados por: David Yánez L.


Intervalos para la razón de varianzas

Intervalos para muestras pareadas

Intervalos de confianza para diferencia de proporciones

Apuntes realizados por: David Yánez L.


PRUEBA DE HIPÓTESIS
Método Científico

Ejemplo del juicio

Contraste de hipótesis

Apuntes realizados por: David Yánez L.


Errores de conclusión

Procedimiento de evaluación

Probabilidad de rechazar 𝐻0

Apuntes realizados por: David Yánez L.


Función de Potencia

Apuntes realizados por: David Yánez L.


Determinación del tamaño de la muestra

Funcion de potencia cola derecha

Apuntes realizados por: David Yánez L.


Función de potencia: Cola izquierda

Función de potencia: Dos colas

Apuntes realizados por: David Yánez L.


Hipótesis sobre μ: muestra grande, cola derecha

Hipótesis sobre μ: muestra grande, cola izquierda

Apuntes realizados por: David Yánez L.


Hipótesis sobre μ: muestra grande, dos colas

Hipótesis sobre μ: muestra normal, cola derecha

Hipótesis sobre μ: muestra normal, cola izquierda

Apuntes realizados por: David Yánez L.


Hipótesis sobre μ: muestra normal, dos colas

Ejemplo

Hipótesis sobre 𝝈𝟐 : muestra normal, cola derecha

Apuntes realizados por: David Yánez L.


Hipótesis sobre 𝝈𝟐 : muestra normal, cola izquierda

Hipótesis sobre 𝝈𝟐 : muestra normal, dos colas

Ejm:

Apuntes realizados por: David Yánez L.


Hipótesis sobre p (proporción): muestra grande, cola derecha

Hipótesis sobre p (proporción): muestra grande, cola izquierda

Hipótesis sobre p (proporción): muestra grande, dos colas

Apuntes realizados por: David Yánez L.


Ejemplo:

Dos medias: muestra grande, cola derecha

Dos medias: muestra grande, cola izquierda

Apuntes realizados por: David Yánez L.


Dos medias: muestra grande, dos colas

Dos medias: muestra normal, cola derecha

Dos medias: muestra normal, izquierda

Apuntes realizados por: David Yánez L.


Dos medias: muestra normal, dos colas

Ejemplo:

Apuntes realizados por: David Yánez L.


Dos varianzas: muestra normal: cola derecha

Dos varianzas: muestra normal: cola derecha

Dos varianzas: muestra normal: dos colas

Ejemplo

Apuntes realizados por: David Yánez L.


Dos proporciones: muestra grande, cola derecha

Dos proporciones: muestra grande, cola izquierda

Apuntes realizados por: David Yánez L.


Dos proporciones: muestra grande, dos colas

Ejemplo:

Apuntes realizados por: David Yánez L.


TABLAS DE CONTINGENCIA
Experimento Multinomial

Función de probabilidad

Apuntes realizados por: David Yánez L.


Prueba de hipótesis

Aproximación asintótica

Ejm:

Apuntes realizados por: David Yánez L.


Tablas de 2 vías

Probabilidades

Apuntes realizados por: David Yánez L.


Prueba de Pearson

Ejm:
Verificar si existen la creencia en Dios tiene alguna dependencia con el nivel de educacion

Apuntes realizados por: David Yánez L.


BONDAD DE AJUSTE

Prueba Ji-Cuadrado

Apuntes realizados por: David Yánez L.


Ejm: Variable Discreta

Ejm: Variable Continua

Apuntes realizados por: David Yánez L.


Distribución Empírica

Prueba de Kolmogorov-Smirnov

Ejm

Apuntes realizados por: David Yánez L.


Se rechaza H0
REGRESIÓN LINEAL SIMPLE
Relaciones estadísticas

Modelos

Apuntes realizados por: David Yánez L.


Regresión lineal simple

Estimación de Mínimos Cuadrados

Apuntes realizados por: David Yánez L.


Estimadores de mínimos cuadrados

Apuntes realizados por: David Yánez L.


Estimación de la Varianza

Ejemplo

Apuntes realizados por: David Yánez L.


Apuntes realizados por: David Yánez L.
Referencias
https://www2.ulpgc.es/hege/almacen/download/5/5509/Tema_1.pdf
https://www.youtube.com/watch?v=Rc3TJHcNSW0&list=PLxLmq9XZ1FnQSXmN6uFNzGUQSs
3kZCpIN&ab_channel=FCNMESPOL
https://matemovil.com/estadistica/
https://economipedia.com/
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferen
cia/VAdiscreta/4_1DistribucionHipergeometrica/index.html
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferen
cia/VAdiscreta/4_4DistribucionBinomialNegativa.html
https://www.estadistica.net/

Apuntes realizados por: David Yánez L.

También podría gustarte