Está en la página 1de 7

Distribución Binomial

Los ensayos de bernoulli (o pruebas binomiales) tienen 2 resultados posibles: Éxito


(p) y fracaso (q). La distribución binomial es una distribución de probabilidad
discreta (con decimales) que cuenta el número de éxitos en una secuencia de
ensayos bernoulli independientes entre sí

n son el número de repeticiones del evento


p es la probabilidad del evento en una sola repetición
q es la probabilidad del evento desfavorable en una repetición (q=1-p)
r es el número de repeticiones del evento deseado

En una variable con distribución binomial


La media se representa como μ y es igual a n*p
La varianza se representa σ2 y es igual a n*p*q
La desviación estándar se representa como σ y es simplemente la raíz cuadrada
de la varianza

Algunos términos importantes son


- Inclusive: (r1≤x≤r2)
- Cuando mucho: (x≤r)
Si r=3
Entonces p(x≤3)= (p=0)+(p=1)+(p=2)+(p=3)
- Al menos: (x≥r)
Si n=5 y r=2
Entonces p(x≥2)= (p=2)+(p=3)+(p=4)+(p=5)
- Al menos 1: (x≥1)
Entonces 1-p(x=0)
- Exactamente: (x=r)

Distribución de poisson
Distribución de probabilidades de variables discretas, especialmente conteos u
otros eventos raros en un periodo dado
- Los eventos son aleatorios e independientes
- La probabilidad de ocurrencia entre eventos es constante
- No hay un número fijo de ensayos
- Se especializa en sucesos con probabilidades muy pequeñas o sucesos
muy raros
- No establece un límite superior al conteo
La probabilidad va decreciendo a medida que x aumenta
e (número de euler) = la base del logaritmo natural
λ= promedio de éxitos y varianza esperada por unidad = μ (p*q)
λ también = σ2

Son básicamente las mismas operaciones que en los términos de la distribución


binomial. La unica diferencia seria Al menos, que se resuelve así:
(x≥r)=1-(x<r)
Si (x≥5)= 1-(x<5)=1-((x=0)+(x=1)+(x=2)+(x=3)+(x=4))

Distribución normal
Es la más famosa y común, se usa para variables cuantitativas continuas
(enteros). No se puede calcular la probabilidad de un valor exacto, si no la
probabilidad acumulada hasta llegar a un valor determinado. Este valor es dado por
que tan lejos se encuentra de la media, y se mide en desviaciones estándar
Las distancias en desviaciones estándar se representan con Z, y a la distribución de
estos valores se le conoce como distribución normal estandarizada
La gráfica posee ciertas características como
- Tiene una media de 0
- El área bajo la curva es 1
- Es simétrica con respecto al centro

x=valor sobre el eje x


μ=media poblacional
σ=desviación estándar
Z siempre se redondeará a 2 decimales, y una vez que lo obtengamos habra que
buscarlo en la tabla para sacar la verdadera probabilidad
Aproximación a la distribución normal
Aunque la distribución binomial es para datos discretos, es posible realizar una
aproximación a la normal, que es de datos continuos
Se utiliza cuando
- p no sea cercano a 0 o 1
- n es muy grande
- n es pequeña pero p es cercana a 0.5
- Si n*p y n*q son mayores o iguales a 5
Se utiliza la corrección de yates para convertir una variable discreta a continua, y
por lo tanto la formula se vuelve:

Si x≥ entonces -0.5
Si x≤ entonces +0.5
Si x> entonces +0.5
Si x< entonces -0.5

También se puede establecer una relación entre la distribución poisson y normal


Se utiliza cuando
- p es pequeño pero n es muy grande

Estimación e intervalos de confianza


Cuanto mas grande es una muestra, más representativa es de su población
Cuando se tienen diferentes muestras aleatorias de una misma población, lo
promedios tienden a agruparse cerca del promedio total de la población, con una
pequeña variación
Se conoce como distribución muestral a la distribución de todos los valores
posibles

Usualmente se desconocen los parámetros de la población, así que se busca usar


los resultados de las muestras para encontrar algún conocimiento en específico de
los parámetros. A esto se le conoce como estimación
Un estimador es un estadístico con ciertas propiedades unicas, las cuales serian:
- Sesgo: La diferencia entre el valor esperado y el verdadero. Siempre se
busca que el estimador sea insesgado (también llamado centrado)
- Consistencia: El estimador es consistente si se aproxima al valor del
parámetro cuanto mayor sea n
- Eficiencia: Un estimador es más eficiente que otro si la varianza de su
distribución muestral es menor. Mientras menos eficiente sea, menor es la
confianza de que el estadístico de la muestra se aproxime al parámetro
poblacional

Hay 2 tipos de estimación


1) La puntual, que se trata de solo un valor extraído de la muestra
2) Por intervalos, que es cuando se usan dos valores para definir el intervalo

En la estimación por intervalos de confianza se determinan 2 estimadores, que


será el limite inferior y superior del intervalo
Un intervalo de confianza generalmente depende de los siguientes factores
- Tamaño de la muestra seleccionada
- Nivel de confianza (habitualmente 95% o 99%)
- Margen de error de la estimación
- Lo estimado en la muestra (media, varianza, diferencia de medias, etc.)

La probabilidad de éxito en la estimación se representa como 1-α, se denomina


como nivel de confianza. α es el error aleatorio o nivel de significación

Intervalo de confianza para proporciones: Indica el rango de proporciones en el


cual se espera que se encuentre un determinado porcentaje del total de las
proporciones muestrales de una población

Zc para 95%=1.96
Zc para 99%=2.58

Intervalo de confianza para diferencia entre 2 proporciones poblacionales:

Intervalo de confianza para medias poblacionales:

Intervalo de confianza para diferencia entre 2 medias poblacionales:

Intervalo de confianza para muestras pequeñas (<30)


- Distribución T Student
Se utiliza una constante derivada de la varianza de la muestra llamada grados de
libertad
Estos se definen como el número de la muestra menos el número de parámetros a
estimar
Los grados de libertad se calculan como:

Este tipo de distribución tiene ciertas características como


- Cada curva t tiene forma de campana de gauss (simétrica) con centro en 0
- Cada curva está más dispersas que la curva normal estándar Z
- Mientras más aumentan los grados de libertad, menos dispersa se vuelve
la curva
- A medida que los grados de libertad tienen a infinito, las curvas t se
aproximan a la curva normal estandar

Cuando la desviación estándar de la muestra (σ) es desconocida, se usa esta


fórmula
Para calcular el intervalo de confianza para la diferencia entre 2 medias se usa esta
fórmula

Los grados de libertad se calcularán de manera diferente

Y Sp2 (el cual representa una estimación puntual de la varianza comun) se


calcula

- Distribución chi-cuadrada
Si se extraen todas las muestras posibles de una población normal y a cada
muestra se le calcula su varianza, se obtendrá una distribución muestral de
varianzas chi cuadrada
- El área bajo la curva chi-cuadrada y sobre el eje horizontal es 1
- Las distribuciones no son simétricas. Son sesgadas a la derecha
- La forma de la distribución depende de los grados de libertad. Hay un numero
infinito de distribuciones x2

A parte del nivel de confianza, tambien se tiene que sacar en nivel de


significancia
Ej para 95%

También podría gustarte