Está en la página 1de 7

ESTADÍSTICA

GUÍA DE ESTUDIOS 2020

DISTRIBUCIÓN
DE PROBABILIDADES
V.A.C.

Prof. Tit. Ing. Agr. MELITÓN MATEO BARROZO


Jefe de Trabajos Prácticos C.P.N. HORACIO CERDÁ
DISTRIBUCIÓN DE PROBABILIDADES DE VARIABLES ALEATORIAS
CONTÍNUAS – V.A.C.
INTRODUCCIÓN

Al igual que analizamos las distribuciones de variables aleatorias discretas, ahora


lo hacemos con las variables aleatorias contínuas.

En este caso existen variados esquemas que se utilizan de acuerdo al tipo de


estudio y/o análisis estadístico que estemos realizando, por importancia y aplicación nos
enfocamos en algunas.

A modo de introducción analizamos en general con la distribución de variables


aleatorias contínuas en una función.

𝑦 = ⬚⬚ 𝑓(x)

a b

Consideramos que:

El intervalo “a – b” contiene valores de variable contínuos y que cumple:


𝑏
∫𝑎 𝑓(𝑥) 𝑑𝑥 = 1 y fuera del intervalo = 0

Por lo que decimos que cumple las condiciones de cierre para poder estimar
probabilidades en las variables que se encuentran en el mencionado intervalo, ya que el
área comprendida es igual a 1 siendo equivalente a la probabilidad total. Es imposible
estimar la probabilidad para una variable ya que en este caso el área para un punto es 0. Sí
podemos hacerlo considerando un intervalo alrededor del punto.
𝑐+ ∆𝑥
𝑃(𝑐) =∫ 𝑓(𝑥) 𝑑𝑥
𝑐 − ∆𝑥

Al aplicar probabilidades dentro del intervalo podemos determinar los parámetros


tales como:
A.- ESPERANZA

Aplicando el concepto de la media como “𝒎𝟏” , obtenemos:


𝒃
̅ = ∫ 𝒙. 𝒇(𝒙) 𝒅𝒙
𝝁
𝒂

B.- VARIANZA – DISPERSIÓN

Aplicando el concepto de 𝜎 2 = 𝑚2 − 𝑚12 obtenemos:


𝒃 𝒙
𝝈 = ∫ 𝒙𝟐 𝒇(𝒙) 𝒅𝒙 − ∫ 𝒙𝒇(𝒙) 𝒅𝒙
𝟐
𝒂 𝒂

𝒃 𝒙
𝝈 = √∫ 𝒙𝟐 𝒇(𝒙) 𝒅𝒙 − ∫ 𝒙𝒇(𝒙) 𝒅𝒙
𝒂 𝒂

C.- MEDIANA
𝑴𝒆
𝑴𝒆 = ∫ 𝒇(𝒙) 𝒅𝒙 = 𝟎, 𝟓
𝒂

Como se aprecia la Me se obtiene resolviendo la integral anterior.

D.- PERCENTILES

De igual forma se pueden estimar las fracciones tales como: cuartiles, quintiles,
deciles y percentiles colocando el área correspondiente.

También se pueden calcular probabilidades entre variables dentro del intervalo.

1.- DISTRIBUCIÓN NORMAL

Es la distribución más usada en el ámbito estadístico por múltiples razones:


practicidad, casi infinitas aplicaciones, genialidad en el descubrimiento, etc. Y justamente
por estas razones es que se ha dado en llamar “normal” .

Según la bibliografía, en lo que hace al autor de su descubrimiento no existe uno


claro, lo que sí sabe quienes más la usaron y difundieron, GAUSS por un lado y LAPLACE
por otro, de ahí que se la conozca como distribución de “Gauss – Laplace”, y mayormente
como “distribución gaussiana”

Responde a la distribución de una variable llamada “estándar” que es igual a:

̅
𝒙𝒊 − 𝝁
𝒛=
𝝈

Donde:

𝑥𝑖 = variable de población;
𝜇̅ = media aritmética de esa población;

𝜎 = desviación de dicha población

La distribución responde a:

𝑧2
∞ 1 −
∫−∞ 𝜎√2𝜋 𝑒 2 𝑑𝑧 = 1

Como se puede apreciar cumple las condiciones de cierre: a) toma todos los
valores de “z” , por lo tanto no existen valores a considerar fuera de ese intervalo y b) el
área bajo la función es igual a 1.

La expresión es: z = N(0,1) que se lee: “variable “z” con comportamiento Normal
con 0 y 1”

Los parámetros de la distribución normal son:

Media aritmética → ̅=𝟎


𝝁
Desviación estándar → 𝝈=𝟏
Coeficiente de asimetría → 𝜸𝟏 = 𝟎
Coeficiente de curtosis → 𝜸𝟐 = 𝟎

Consecuencia: es utilizable para estimar probabilidades en poblaciones que sean


aproximadamente normales, con:

𝛾1 ≅ 0 ; Asimetría y 𝛾2 ≅ 0 ; Curtosis

La expresión general es: x ≅ N(𝝁


̅ , 𝝈) que se lee: “variable “x” con comportamiento
APROXIMADAMENTE Normal con parámetros media y desviación estándar determinados”

Esta es la justificación estadística y matemática de aplicabilidad de probabilidad a


los múltiples casos que cumplen con las condiciones de parámetros normales, ya que el
área es igual a la probabilidad.

      
A.- Si se considera lo que incluye el intervalo 𝝁 ± 𝟏𝝈 observamos que el área es
68,26% por lo tanto se excluye el 31,74% y se interpreta de la siguiente forma: “en un
intervalo de más – menos una dispersión alrededor de la media aritmética está incluída el
68,26% de la población, dejando fuera el 31,74% de dicha población”

Cuando se efectúan estimaciones con este intervalo significa que el intervalo de


confianza es del 68,26% y el error estadístico es del 31,74%.

En valores estandarizados esto es: 0 ± 𝟏 𝒛

B.- Si se considera lo que incluye el intervalo 𝝁 ± 𝟐𝝈 observamos que el área es


95,44% por lo tanto se excluye el 4,56% y se interpreta de la siguiente forma: “en un
intervalo de más – menos dos veces la dispersión alrededor de la media aritmética está
incluída el 95,44% de la población, dejando fuera el 4,56% de dicha población”

Cuando se efectúan estimaciones con este intervalo significa que el intervalo de


confianza es del 95,44% y el error estadístico es del 4,56%.

En valores estandarizados esto es: 0 ± 𝟐 𝒛

C.- Si se considera lo que incluye el intervalo 𝝁 ± 𝟑𝝈 observamos que el área es


99,74% por lo tanto se excluye el 0,26% y se interpreta de la siguiente forma: “en un
intervalo de más – menos tres veces la dispersión alrededor de la media aritmética está
incluída el 99,74% de la población, dejando fuera el 0,26% de dicha población”

Cuando se efectúan estimaciones con este intervalo significa que el intervalo de


confianza es del 99,74% y el error estadístico es del 0,26%.

En valores estandarizados esto es: 0 ± 𝟑 𝒛

INTERPRETACIÓN

Analizando los errores y la observamos que en el caso de 𝜇 ± 2𝜎 el error es del


4,56% y en 𝜇 ± 3𝜎 el error es del 0,26%

En un principio estaríamos de acuerdo en realizar estimaciones con intervalos de


±3𝜎ya que el error es del 0,26%, es decir que estaríamos cometiendo 4,30% menos de
error que 𝜇 ± 2𝜎, pero si consideramos la amplitud relativa de los intervalos observamos
que incorporamos un 50% más de 𝜎, y esta es la razón por la que estadísticamente el error
es menor cuando el intervalo alrededor de la media aritmética es 𝝁 ± 𝟐𝝈.

Razón por la que prácticamente todas las estimaciones asumen este error
estadístico, la que por cuestiones de practicidad se toma 5%.

Cuando el intervalo de estimación es del 95% los valores estandarizados “z” =


±𝟏, 𝟗𝟔 (𝝁 ± 𝟏, 𝟗𝟔𝝈) y cuando el intervalo de estimación es del 99% los valores
estandarizados “z” = ±𝟐, 𝟓𝟖 (𝝁 ± 𝟐, 𝟓𝟖𝝈)
APLICACIÓN

𝑧2
𝒙𝒊 − 𝝁
̅ ∞ 1
A partir del conocimiento que 𝒛 = y su función ∫−∞ 𝑒 − 2 𝑑𝑧 = 1 podemos
𝝈 𝜎√2𝜋
determinar las probabilidades determinando las áreas, resolviendo la integral definida,
correspondientes para los distintos valores de “z”. Estos valores están tabulados por lo
que la resolución es utilizando las tablas.

1.- DISTRIBUCIÓN “t” STUDENT

Esta distribución fue obtenida por William Gosset, quien en su momento trabajaba
en la fábrica de cerveza Ginness y ésta prohibía a sus empleados publicar trabajos por
protección industrial, por lo que usó el seudónimo “Student” , para publicar sus
conclusiones.

También es la distribución de una variable estandarizada que llamó

𝒙𝒊 − 𝒙̅
𝒕= 𝑺𝒙

√𝒏
Tiene elementos en común con la variable “z”, como el numerador, que es el
desvío de variable respecto de la media aritmética, y en denominador aparece la
desviación, salvo que en este caso son parámetros muestrales.

Media muestral:
𝒏
𝟏
̅
𝒙 = ∑ 𝒙 𝒊 𝒓𝒊
𝒏
𝒊=𝟏

Varianza Muestral
𝒏
𝟏
𝑺𝟐(𝒙) = ̅)𝟐 𝒓𝒊
∑(𝒙𝒊 − 𝒙
𝒏−𝟏
𝒊=𝟏

Desviación típica

S(x) = √𝑺𝟐(𝒙)

Observamos que la diferencia con la varianza poblacional es que está dividida por
“n – 1” por lo que es mayor al igual que la desviación típica y es lógico porque
regularmente los tamaños de las muestras son finitas.

Dado que la desviación típica varía con el tamaño de la muestra, siendo mayor
cuando n = 2, y disminuye a medida que aumenta, siendo el límite la distribución normal,
razón por la que se incorpora el concepto de “grado de libertad” simbolizado “”.
¿Qué es grado de libertad? Es lo siguiente: en un determinado tamaño de muestra
es el número de variables que pueden variar sin alterar el resultado final. Por ejemplo, en
una población de estudiantes sabemos que la 𝜇̅ = 20, si tomamos una muestra n = 5 de
esa población con valores: 𝑥1 = 19, 𝑥2 = 20, 𝑥3 = 20, 𝑥4 = 21, es evidente para que la
𝑥̅ = 20, existe para 𝒙𝟓 un único valor que satisface dicha condición. Por lo que decimos que
en esa muestra n =5, “obtenemos libremente 4 valores”, por lo que grados de libertad:

n – 1

La integral definida de la variable “t” es similar a la normal, su intervalo es también


-∞ ≤ 𝑡 ≤ +∞ , el área es también igual a 1, la media es igual 0 y el coeficiente de
asimetría es igual a 0; de ahí la aplicabilidad de probabilidades. La diferencia fundamental
con normal es que la varianza y por lo tanto la desviación típica varían en función del
tamaño de muestra siendo mayor cuando “ n = 2”, y entonces existe una curva
PLATICÚRTICA para cada tamaño de muestra

−∞ -t +t +∞

Este esquema es a modo de ejemplo, ya que la curva con “= 1” en realidad es bien
platicúrtica por lo tanto más extendida y a medida que aumenta el límite es la normal.

Los valores de área en cada curva y para cada valor de ±𝑡 se encuentran tabulados
y por practicidad para los valores más usuales de área.

APLICACIONES

Las aplicaciones más usuales son:

 para estimar intervalos de confianza con determinados ∝


 toma de decisiones en pruebas de hipótesis

También podría gustarte