Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CI: 29618479
Tipos de variables:
Esta división se realiza dependiendo del tipo de variable a estudiar. Las cuatro principales
(de las que nacen todas las demás) son:
Por simplicidad, cuando no hay lugar a confusión, suele omitirse el subíndice x y se escribe
simplemente F (x). Donde en la fórmula anterior:
Propiedades
Para dos números reales cualesquieraaay b tal que (a< b)( )¿, los sucesos ( X ≤ a) y
(a< X ≤b) son mutuamente excluyentes y su unión es el suceso ( X ≤ b), por lo que tenemos
entonces que:
y finalmente
Por lo tanto una vez conocida la función de distribución F (x) para todos los valores de la
variable aleatoria x x conoceremos completamente la distribución de probabilidad de la
variable.
Es una distribución en el intervalo [a,b] en la cual las probabilidades son las mismas para
todos los posibles resultados, desde el mínimo de a hasta el máximo de b. El experimento
de lanzar un dado es un ejemplo que cumple la distribución uniforme, ya que todos los 6
resultados posibles tienen 1/6 de probabilidad de ocurrencia.
Donde:
b – a = Rango de la distribución
La probabilidad de que una observación caiga entre dos valores se calcula de la siguiente
manera:
donde:
Esta función cuantil se llama a veces la función probit. No hay una primitiva elemental para
la función probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado
la inexistencia de tal función. Existen varios métodos exactos para aproximar la función
cuantil mediante la distribución normal (véase función cuantil).
Los valores Φ(x) pueden aproximarse con mucha precisión por distintos métodos, tales
como integración numérica, series de Taylor, series asintóticas y fracciones continuas.
y satisface
1.
2.
Donde
1. Γ ( n+1 ) =n Γ (n)
2. Γ ( n+1 ) =n ! n ∈ Z
+¿ ¿
3. Γ ( 2 )=Γ ( 1 )=1
4. Γ ( 12 )=√ π
El valor esperado y la varianza de una variable aleatoria X Γ ( α , λ ) son
Distribuciones Relacionadas
n
distribuidas tales que X i exp ( λ ) entonces ∑ X i Γ ( n , λ ).
i=1
Si X Γ ( 1 , λ )entonces X exp ( λ ).
Si X Γ ( n2 , 2) con n ∈ N entonces X X 2n.
En estadística, se dice que una variable aleatoria X continua tiene una distribución
exponencial con parámetro λ> 0 y escribimos X exp( λ) si su función de densidad es
De forma adicional esta distribución presenta una función adicional que es función
Supervivencia (S), que representa el complemento de Función de distribución.
Se pueden calcular una variable aleatoria de distribución exponencial x por medio de una
variable aleatoria de distribución uniformeu=U (0,1):
o, dado que (1−u) es también una variable aleatoria con distribución U ( 0,1), puede
utilizarse la versión más eficiente:
Relaciones
Si X es una variable aleatoria discreta (representada, de manera general, por una tabla de
valores xi y probabilidades pi=P(X=xi)),
X P(X=xi)
X1 P1
X2 P2
… …
Xn Pn
La esperanza se calcula como la media aritmética de los valores, es decir, la suma de los
valores por sus posibilidades (las probabilidades serían las frecuencias relativas.
Recordemos que la media aritmética de una variable estadística se definió como
es decir, sería la esperanza de una variable cuyos valores aparecen todos con la misma
probabilidad pi=1/n .
Si a una variable estadística la representamos por sus valores x i, y sus frecuencias relativas
son f i=ni /n , entonces la media aritmética se puede escribir como
esto es, suma de valores por frecuencias. En el caso de una variable aleatoria, las
frecuencias se transforman en probabilidades (de ocurrencia). Por eso la esperanza es un
valor medio esperado.
El Teorema de Chebyshev explica que al menos 1-1/k2 de datos de una muestra deben caer
dentro de K, que es las desviaciones estándar de estándar de la media. En cualquier
ejercicio o prueba, el K es un número real positivo mayor que uno.
Cuando sucede una distribución normal, se sabe que al menos un 68% de los datos es una
desviación estándar de la media. Por otro lado, el 95% son dos desviaciones están de la
media, y el 99% aproximadamente se encuentra dentro de las tres desviaciones estándar de
la media.
Estos valores mencionados anteriormente, son bastante útiles para memorizar porque los
valores que se calculan a partir de los datos a menudo se distribuyen aproximadamente
normalmente debido al teorema del límite central. Tener una idea base de cómo los
diferentes múltiplos de una desviación estándar corresponde a los intervalos de confianza,
les permite a los usuarios comprender de manera más intuitiva la importancia de los
gráficos, tablas y cálculos que incluyen valores de error de una desviación estándar.
Las distribuciones que son aproximadamente normales, son consideradas comunes, pero
hay muchas circunstancias en que las que este no será el caso. La las distribuciones con una
cola más pesada, se esperaría que haya menos de la distribución dentro de cada uno de los
múltiplos de la desviación estándar. Mientras que para las distribuciones con una cola
menos pesada, ocurriría completamente lo contrario. Para las distribuciones que no son
normales, hay una gran probabilidad de que esos números 68/95/99.7 sean inexactos.
En caso que se esté trabajando con una distribución de probabilidad que es desconocida, los
valores de confianza para diferentes números de desviaciones estándar de la medida
también resultarán desconocido. De encontrarse en esta situación, resultará útil tener una
noción del ‘peor de los casos’ cuando los valores de confianza se encuentran bajo.
Características importantes del Teorema de Chebyshev
La desigualdad también se puede emplear con la frase de ‘datos de una muestra’ cuando se
encuentra en una distribución de probabilidad. Lo anterior ocurre porque la desigualdad de
Chebyshev es el resultado de la probabilidad, que luego se aplica en la estadística.
Cuando se muestrea los datos del teorema, es útil saber cuán dispensables o dispersas son
las mediciones en este rango. Por ejemplo, suponga que ha estado rastreando sus gastos de
desayuno y, en promedio, gasta unos 10$ por día antes y durante el trabajo. Probablemente
le interesaría saber si gastó constantemente esa cantidad o si tuvo unos gastos muy grandes
que sesgaron el promedio general.
Por lo que vemos, es una excelente manera de ver estadísticamente cuántos gastos hemos
hecho de acuerdo a la probabilidad estándar del Teorema de Chebyshev. Si bien esta
ecuación a menudo da como resultado un rango relativamente amplio de valores, es útil
porque solo requiere el conocimiento de la media y la desviación estándar, que se calculan
fácilmente a partir de cualquier muestra o población de datos. El teorema también
proporciona lo que podría llamarse una mirada en el peor de los casos de la dispersión de
datos, como se mencionó anteriormente.
Para poder investigar este teorema, primero es necesario comparar los cálculos con la regla
general 68-95-99.7 para distribuciones normales. Dado que esos números representan los
datos que se encuentran dentro de los límites, se utiliza la desigualdad de Chebysgev para
los datos dentro de los límites. Esta fórmula es la siguiente.
Probabilidad = 1 – (1 / k 2 )
Donde, matemáticamente, los valores menores o iguales a 1 no son válidos para este
cálculo. Sin embargo, conectar los valores de k para 2 y 3 es más simple de lo que parece.
En esos casos de 2 y 3, el Teorema de Chebyshev establece que al menos el 75% de los
datos caerán dentro de las 2 desviaciones estándar de la media y se espera que el 89% de
los datos caigan dentro de las 3 desviaciones estándar de la media.
Esto es menos preciso que los 95% y 99.7% que se pueden usar para una distribución
normal conocida; sin embargo el Teorema de Chebyshev es cierta para todas las
distribuciones de los datos, no solo para una distribución normal.
Supongamos que se han muestreado los pesos de los perros en un determinado refugio de
animales. Al analizar el muestreo, se ha descubierto que la muestra tiene una media de 20
libras con una desviación estándar de 3 libras. Con el uso del Teorema de Chebyshev.
Sabiendo que el 75% de los perros que se han muestreado tienen pesos que son dos
desviaciones estándar de la media. Dos veces la desviación estándar da un resultado de
2×3= 6. Restando y sumando esto, da una media de 20
Lo anterior solo nos dice que el 75% de los perros tienen un peso de 14 libras a 26 libras.
Este es un ejemplo bastante práctico de cómo funciona el Teorema de Chebyshev o al
menos cómo se puede emplear en un ejemplo de la vida real. La estadística se encuentra
siempre al tanto.
Si sabemos más acerca de la distribución con la que se está trabajando, entonces se podrá
garantizar que más datos estén a un cierto número de desviaciones estándar de la media.
Por ejemplo, si se sabe la distribución normal, entonces el 95% de los datos son dos
desviaciones estándar de la media. El Teorema de Chebyshev explica que en esta
situación, sabremos que al menos el 75% de los datos son dos desviaciones estándar de la
media. Tal como se mostró en el ejemplo anteriormente resuelto.
El Teorema de Chebyshev puede ser útil al hacer ciertas estimaciones aproximadas sobre
los intervalos de confianza, pero a menudo también es una herramienta muy útil cuando se
quieran probar casos estadísticos. Una muestra simple, pero bastante eficaz, donde el
teorema se usa a menudo es en la ley de los grandes números. Por ejemplo, una gran prueba
de esto sería:
La ley de los grandes números establece que para k, las variables aleatorias
independientes e idénticamente distribuidas es la media muestral.
Variables estandarizadas
Semivarianzas
Este es un método alternativo al estandarizado para obtener los límites más definidos
mediante las variaciones parciales, también conocido como semivarianzas.
La variante unilateral puede usarse para probar la proposición de que para distribuciones de
probabilidad que tienen un valor esperado y una media, la media y la mediana no pueden
diferir entre sí en más de una desviación estándar.