Está en la página 1de 3

Distribución Binomial Negativa I

𝑋 ∼ 𝐵𝑁(𝑟, 𝑝) → ensayos independientes

En vez de definir el número de ensayos y observar el número de éxitos, suponga que se continúan los ensayos
hasta hasta que exactamente ocurrieron r éxitos.
Se usa para moldear estadísticas de accidentes, datos psicológicos, compras de consumidor y otras situaciones
similares donde la frecuencia de ocurrencia entre grupos o individuos no se espera que sea la misma.

➔ p: probabilidad de éxito de cada ensayo, es constante


➔ r: número de éxitos
➔ x: variable aleatoria, número de fracasos necesarios para obtener exactamente r éxitos, número de
fracasos hasta que se observan exactamente r éxitos.

𝑓(𝑋) = 𝑃(𝑋 = 𝑥) = ( 𝑥+𝑟−1


𝑟−1 ). 𝑝 . (1 − 𝑝)
𝑟 𝑥

Donde:
● r = 1, 2, 3,...
● x = 0, 1, 2, 3,...
● 0<𝑝≤1

❖ x + r → representa el número de ensayos independientes necesarios para alcanzar exactamente r


éxitos, en un experimento binomial donde la probabilidad de éxito de cada ensayo es p
❖ El resultado del último ensayo fue éxito, el último ensayo sería x + k , entonces antes del último
ensayo ocurrieron k - 1 éxitos y x+ k - 1 ensayos
𝑟.(1−𝑝)
𝐸(𝑋) = µ = 𝑝
2 𝑟.(1−𝑝)
𝑉𝑎𝑟(𝑋) = σ = 2
𝑝
“Pasame el dato”
Estadística → recolectar, analizar e interpretar datos de una población
Herramientas para recolectarlos → encuestas o censos
Hacer un estudio y sacar conclusiones de una población muy grande o muy compleja, para eso se realiza una
“inferencia estadística” → el estudios se hace a un subgrupo o una muestra, que representa a la población
completa, se usa la información obtenida para sacar conclusiones sobre toda la población
Una muestra es válida si es representativa → contener las características importantes de la población en la
misma proporción en la que se da en la totalidad
Razón → cociente entre dos cantidades
● Tasas - cociente dado por una cierta cantidad y una unidad elegida - ej, unidad mil habitantes, 32,8 de
cada 1000 personas están enfermas
● Porcentajes - la unidad para establecer la relación es cien - divide al porcentaje por cien se obtiene la
proporción de un total - ej, 60%, 60 de cada 100, proporción de 0,6
La estadística proporciona información a partir de datos, esta info suele estar expresada a través de valores →
“datos”, se eligen a partir de la elección de las características que se quieran estudiar de la población o
muestra.
Características → se pueden constituir en las variables de un estudio
Variables → se observan y se tipifican o cuantifican de forma de traducir los resultados en una información
Información → producto de las variables que se elige, internacionalidad que se pueda perseguir en un
determinado estudio, las variables van a influir en la info que se va a obtener
Dependiendo de la definición elegida varía ampliamente el valor de la tasa, la elección de las variables puede
transformar los datos que se obtienen y generar distintas informaciones según la intencionalidad del estudio
Variables:
● Variables numéricas - los datos numéricos son los valores que adquieren - ej, cantidad de personas
- Variables discretas - donde la variables numérica puede tomar determinados valores dentro
de una distribución
- Variables continuas - es factible que la variable numérica tome valores intermedios a los
valores posibles
● Variables categóricas - responden a valores que pueden tomar esas variables - ej, sexo, edad, nivel
educativo - generalmente no responden a números
Gráficos:
● Gráfico circular - muestra la relación entre las partes y la totalidad en una distribución de variables
categóricas
● Gráfico de barras - se quiere un panorama de cómo se distribuyen las cantidades de una variable
categórica a partir de una simple vista - la altura de cada barra tiene relación con el valor que toma la
variable en cada caso - importante trabajar con una escala que permita comunicar eficazmente las
relaciones - ancho de las barras indistinto, pero el mismo para todas - tmb se usa para poner en
relación más de una variable categórica
● Histogramas - representan variables numéricas - formados por rectángulos cuya altura se vincula con
la cantidad en que se repite el dato llamado frecuencia - o vinculados con la proporción llamada
frecuencia relativa - el ancho de las barras importantes, relaciona los valores de la variable numérica
- se pueden agrupar en intervalos de clase, para caracterizar una variable según el interés que tenga
el estudio, no es necesario que tengan el mismo tamaño
Gran colección de datos → medida resumen expresándolos con un número que permite tener una idea rápida y
aproximada de cómo se comportan
Medida de posición central:
● Media - media aritmética o promedio - se suman todos los datos y se dividen por la cantidad de datos
que tiene el conjunto
● Mediana - se ordenan de menor a mayor los valores del conjunto considerando el que queda en el
medio - con una cant par de valores, se hace el promedio entre los valores que están en la mitad
● Moda - valor que ocurre con más frecuencia, una distribución puede no tener moda o tener varias
Conociendo sólo el valor central no se puede saber cómo se comportan todos los datos de la colección →
importante tener en cuenta la dispersión que tienen el resto de los valores con respecto a este → desviación
o dispersión → cuánto se alejan el resto de los datos del valor central
Rango → manera más simple de determinar la variación, es la diferencia entre el amyor y el menor de los
datos del conjunto
Desviación típica o estándar → se suman cada uno de los cuadrados de las diferencias entre el valor medio
(a) y cada valor del conjunto (xi), y se divide al total por la cantidad de elementos del conjunto de valores (n), a
ese resultado se le calcula la raíz cuadrada

𝑛
2
∑(𝑥𝑖− 𝑎)
𝑖=
𝑆= 𝑛
Calcula el promedio de los alejamientos, informa cuánto debería ser una dispersión “aceptable”, permite ver si
los valores reales se encuentran representados dentro del conjunto o no. Como la desviación puede estar por
encima o por debajo del promedio, considerar todas las diferencias como positivas
Coeficiente de dispersión → determina la dispersión de los datos con respecto al promedio, compara entre
las diferentes muestras y establece cuál es tiene mayor nivel mayor nivel de homogeneidad entre ellas - se
calcula el cociente entre la desviación y su valor promedio
𝑠
𝐶𝑣 =
𝑥
Curva de “densidad” → la obtenemos si tomamos el punto medio de la base de cada barra
del histograma, elevamos la altura hasta cortar cada rectángulo, consideramos cada una de
esas marcas unidas en un trazo continuo
Cuando la curva tiene:
● Comportamiento simétrico - valor centrar funciona como espejo para ambos
lados - “campana de Gauss”, cuanto más similares sean los valore entre estas
tres m, más simétrica resulta la curva

● Moda muy por debajo de la media, curva tendrá un sesgo hacia la izquierda
● Moda muy por encima de la media, curva tendrá un sesgo hacia la derecha

También podría gustarte