Está en la página 1de 38

Muestreo estadístico Rubén Medinaceli O.

MUESTREO ESTADÍSTICO

El propósito de este tema es introducir conceptos referidos al muestreo estadístico y


presentar algunas distribuciones vinculadas al muestreo estadístico.

1. Muestreo estadístico

Hasta ahora se han tratado temas ligados a la teoría de probabilidades. El tema del
muestreo constituye un ingreso a la teoría de la estadística.

1.1. Inferencia inductiva

El progreso de la ciencia, en gran proporción, se adscribe a la experimentación. El


investigador realiza un experimento y obtiene algunos datos; con base en estos datos, él
emite ciertas conclusiones. Generalmente, estas conclusiones van más allá de los
materiales y operaciones del experimento particular; en otras palabras, el investigador
generaliza los resultados de un experimento particular a la clase (o conjunto) de todos los
experimentos similares. Esta suerte de extensión de lo particular a lo general, es llamada
inferencia inductiva. Es uno de los caminos para encontrar conocimiento nuevo.

Sin embargo, la inferencia inductiva es un proceso peligroso; de hecho, en la inferencia


inductiva está presente la incertidumbre.

Uno no puede, libremente, efectuar ciertas generalizaciones; aunque, es posible efectuar


inferencias inciertas cuando es posible medir la incertidumbre asociada; para ello, el
experimento debe desarrollarse en el marco de ciertos principios.

Es importante señalar que la inferencia estadística es una inferencia inductiva.

De esta manera, la estadística cumple dos roles importantes:

• Proporcionar técnicas para efectuar inferencias inductivas.

• Medir el grado o el nivel de incertidumbre asociado a las inferencias inductivas, en


términos de probabilidades.

Para ilustrar la inferencia inductiva considere el siguiente ejemplo:

Suponga que se tiene un silo de almacenamiento con 10 millones de semillas de flores


dentro. Se sabe que una parte de las semillas producirá flores blancas y la parte restante
producirá flores rojas. Se desea conocer cuántas (o que porcentaje) de las semillas
producirán flores blancas.

La única manera de estar seguros de la respuesta que se dé a la pregunta sería plantar


cada semilla, esperar un tiempo, y luego proceder al conteo de las flores blancas.

Sin embargo, lo señalado no es factible ya que se quiere, por ejemplo, vender las semillas;
aun cuando no se las quiera vender, se preferiría obtener una respuesta sin tanto esfuerzo.

1
Muestreo estadístico Rubén Medinaceli O.

Otra manera de lograr una respuesta sería plantar unas pocas semillas, esperar un tiempo,
y en base a los colores de estas pocas flores, predecir cuántas de los 10 millones de
semillas, producirán flores blancas.

Si por ejemplo se plantan 100 semillas y 40 de ellas producen flores blancas, se podría
afirmar que 40% de los 10 millones de semillas producirán flores blancas. Obviamente, no
se tendría ninguna seguridad sobre esta afirmación. Desde el punto de vista de la
estadística se podría llegar a una afirmación probabilística como la siguiente: el porcentaje
de semillas que producirán flores blancas es algún valor entre 35% y 45% y la probabilidad
que esto ocurra es igual al 90%.

La manera descrita es, en los hechos, la única factible. Este es un proceso de inferencia
inductiva. Nótese que no se tiene plena seguridad sobre la respuesta, aunque se siente
cierta confiabilidad en la respuesta en un sentido probabilístico.

1.2. Inferencia deductiva

Antes de continuar con la inferencia estadística, es importante decir algo sobre el otro tipo
de inferencia, la inferencia deductiva. Mientras las conclusiones que se logran a través de
la inferencia inductiva son probables, las conclusiones logradas con la inferencia deductiva
son conclusivas o definitivas.

Para ilustrar la inferencia deductiva, considere las siguientes premisas:

Premisa mayor: Uno de los ángulos interiores de un triángulo rectángulo vale 90°

Premisa menor: El triángulo A es rectángulo

Si se acepta estas dos premisas, la conclusión obligada es:

Conclusión: Uno de los ángulos interiores del triángulo A vale 90°

Este es un ejemplo de inferencia deductiva la cual es definida como un método para deducir
información (conclusión) a partir de hechos aceptados (premisas).

A pesar de la enorme importancia de la inferencia deductiva, gran parte del nuevo


conocimiento en el mundo real se logra a través de la inferencia inductiva.

Otro ejemplo que ilustra la inferencia deductiva sería el siguiente,

Recordando inicialmente las siguientes definiciones,

Un espacio de muestreo, denotado por 𝑺, es la colección o conjunto de todos los


resultados posibles de un experimento aleatorio.

Un evento es un subconjunto de un espacio de muestreo 𝑺.

La clase de todos los eventos posibles en el espacio de muestreo de un experimento


aleatorio se conoce con el nombre de espacio de eventos y se denota por A

2
Muestreo estadístico Rubén Medinaceli O.

En este marco, la teoría axiomática de probabilidades define la función probabilidad de la


siguiente manera,

La función probabilidad, denotada por 𝑃(∙), es una función conjunto con dominio A (un
algebra de eventos) y codominio el intervalo (0, 1) que pertenece al conjunto de los números
reales (𝑅); que satisface los siguientes axiomas:

Axioma 1 (𝐴1): P(A) ≥ 0; ∀ A ∈ A


Axioma 2 (𝐴2): 𝑃(𝑆) = 1
Axioma 3 (𝐴3): Si 𝐴 y 𝐵 son eventos mutuamente excluyentes en A ; esto es,
(𝐴 ∩ 𝐵) = ∅, se tiene que,
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

En el caso de la teoría axiomática de probabilidades, los hechos aceptados son los tres
axiomas.

Las conclusiones son las operaciones adicionales requeridas, que en un formalismo


matemático se enuncian como teoremas o corolarios. Considere el siguiente teorema,

Teorema

Sea 𝐴𝑐 el complemento de un evento 𝐴 ∈ A

Luego,

𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)

A Ac

Una conclusión es la demostración de este teorema,

𝐴 ∩ 𝐴𝑐 = ∅ → 𝐴 𝑦𝐴𝑐 𝑠𝑜𝑛 𝑚𝑢𝑡𝑢𝑎𝑚𝑒𝑛𝑡𝑒 𝑒𝑥𝑐𝑙𝑢𝑦𝑒𝑛𝑡𝑒𝑠

𝐴 ∪ 𝐴𝑐 = 𝑆

𝑃(𝐴 ∪ 𝐴𝑐 ) = 𝑃(𝑆)

𝐷𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜 𝑎𝑙 𝐴3

𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 𝑃(𝑆)

3
Muestreo estadístico Rubén Medinaceli O.

𝐷𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜 𝑎𝑙 𝐴2

𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1

𝐸𝑛 𝑒𝑓𝑒𝑐𝑡𝑜,

𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)

Esta demostración es un ejemplo claro de inferencia deductiva.

1.3. Poblaciones y muestras

Se ha señalado que el problema central en el descubrimiento de conocimiento nuevo en el


mundo real consiste en observar la característica de interés en algunos de los elementos
involucrados; y sobre la base de estas pocas observaciones, plantear una conclusión
referida a la característica de interés para la totalidad de los elementos involucrados.

1.3.1. Definición

El conjunto de observaciones de la característica de interés sobre la totalidad de los


elementos involucrados recibe el nombre de población.

1.3.2. Definición

El conjunto de observaciones de la característica de interés efectuadas solo sobre algunos


de los elementos involucrados recibe el nombre de muestra de la población.

En el mundo real, el objetivo de un estudio o una investigación (el problema) es analizar


algún aspecto de la característica de interés referida a todos los elementos involucrados;
para ello, es imposible o poco práctico examinar la población entera; sin embargo, se puede
estudiar o investigar una parte de la población (una muestra de la población); y, sobre la
base de esta investigación limitada, efectuar inferencias relacionadas con la población
entera.

Si se recurre al modelo estadístico para resolver el problema real, la característica de interés


se describe con una variable aleatoria (por ejemplo, X) y la población de la característica
de interés se representa por la función de distribución o de densidad de probabilidad de la
variable aleatoria X, 𝒇𝑿 (𝒙); el objetivo de la investigación (el problema a resolver) se
expresa en términos de alguno de los parámetros de la variable aleatoria 𝑿 . Esto es:

4
Muestreo estadístico Rubén Medinaceli O.

Realidad Modelo estadístico

𝑓𝑋 (𝑥)
Población
de la
característica de
interés 𝜎2

Población

𝜇 𝑋

Variable aleatoria que describe


la característica de interés: 𝑋

Población: 𝑓𝑋 (𝑥)

Parámetros: 𝜇, 𝜎 2

¡P r o b l e m a! ¡P r o b l e m a!
(Vinculado a la característica de interés) (Expresado en términos de los parámetros)

Muestra aleatoria:
(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )
Realización:
(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 )

¿Solución
al problema?
Análisis estadístico de
la realización
(Estadística
Descriptiva)

INFERENCIA
ESTADÍSTICA
(Estimación de parámetros)
(Pruebas de hipótesis)

5
Muestreo estadístico Rubén Medinaceli O.

1.3.3. Definición

fX(x)

σ2 ¿?

Población:

µ ¿? X

Muestra aleatoria: 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏

Realización: 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 , ⋯ , 𝒙𝒏

En estadística se dice que una variable aleatoria X se realiza cuando toma un valor
específico x.

Si 𝑓𝑋 (𝑥) es una población con media 𝜇 (desconocida) y varianza 𝜎 2 (desconocida)

Si (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una variable aleatoria n-dimensional cuya función de distribución


o densidad de probabilidad conjunta viene dada por 𝑓𝑋1,𝑋2,⋯,𝑋𝑛 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 ).

(𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de tamaño n de una población 𝑓𝑋 (𝑥) con


media µ y varianza σ2, sí y solamente si,

a)

𝑓𝑋1,𝑋2,⋯,𝑋𝑛 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 ) = 𝑓𝑋1 (𝑥1 ) 𝑓𝑋2 (𝑥2 ) ⋯ 𝑓𝑋𝑛 (𝑥𝑛 )

Vale decir que las variables aleatorias 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 son independientes

b)

𝑓𝑋 (. ) es común a cada una de las variables aleatorias 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 (en forma y en


parámetros), esto es:

• Cada una de las variables aleatorias 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑, ⋯ , 𝑿𝒏 tiene la distribución de la


población:

𝑓𝑋 (𝑥) = 𝑓𝑋1 (𝑥1 ) = 𝑓𝑋2 (𝑥2 ) = ⋯ = 𝑓𝑋𝑛 (𝑥𝑛 )

• Cada una de las variables aleatorias 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑, ⋯ , 𝑿𝒏 tiene los parámetros, de la


población:

𝐸[𝑋1 ] = 𝐸[𝑋2 ] = ⋯ = 𝐸[𝑋𝑛 ] = 𝜇

6
Muestreo estadístico Rubén Medinaceli O.

𝑉𝑎𝑟[𝑋1 ] = 𝑉𝑎𝑟[𝑋2 ] = ⋯ = 𝑉𝑎𝑟[𝑋𝑛 ] = 𝜎 2

En términos estrictamente estadísticos, (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de


tamaño n de una población 𝑓𝑋 (𝑥) con media 𝜇 y varianza 𝜎 2 ; si las variables aleatorias
𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑, ⋯ , 𝑿𝒏 son independientes e idénticamente distribuidas (iid)

1.4. Estadísticos y momentos de una muestra

1.4.1. Definición

Un estadístico es una función solo de variables aleatorias observables (medibles);


consecuentemente; en otras palabras, un estadístico es una variable aleatoria que no
contiene parámetros desconocidos.

Una variable aleatoria observable es una variable aleatoria que se puede medir y obtener
valores (realizaciones) de la variable aleatoria.

Parámetro desconocido es un parámetro que no ha sido estimado.

Por ejemplo, si una variable aleatoria observable X sigue una distribución normal con media
µ y varianza σ2, donde los parámetros µ y σ2 son desconocidos; X - µ no es un estadístico
ya que µ es un parámetro desconocido.

Una de las tareas principales en estadística es, precisamente, encontrar estadísticos


apropiados para estimar parámetros.

Si (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de una población 𝒇𝑿 (𝒙) sigue una


distribución normal con media µ (desconocida) y varianza σ2 (desconocida), por ejemplo,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Es un estadístico.

1
𝑃 = {min[𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ] + 𝑚𝑎𝑥 [𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ]}
2

También es un estadístico.

Sin embargo,

𝑇 = 𝑋̅ − 𝜇

No es un estadístico, ya que µ es un parámetro desconocido.

7
Muestreo estadístico Rubén Medinaceli O.

1.4.2. Definición

Si (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de una población 𝑓𝑋 (𝑥) con media 𝜇 y


varianza 𝜎 2 , el r-avo momento de la muestra, denotado por 𝑀𝑟′ , se define como:
𝑛
1
𝑀𝑟′ = ∑ 𝑋𝑖𝑟
𝑛
𝑖=1

Si, por ejemplo, 𝒓 = 𝟏,

Se tiene el primer momento de la muestra, igual a:


𝑛
1
𝑀1′ = ∑ 𝑋𝑖
𝑛
𝑖=1

Si 𝒓 = 𝟐

Se tiene el segundo momento de la muestra, igual a:


𝑛
1
𝑀2′ = ∑ 𝑋𝑖2
𝑛
𝑖=1

Nótese que los momentos de la muestra son ejemplos de estadísticos.

Recuerde que,

Si X es una variable aleatoria cuya función de distribución o de densidad de probabilidad es


fX(x), el r-avo momento de X, denotado por 𝜇𝑟′ , se define como:

𝜇𝑟′ = 𝐸[𝑋𝑟 ]

Nótese que,

𝜇1′ = 𝐸[𝑋] = 𝜇𝑋

𝜇2′ = 𝐸[𝑋2 ]

En el actual contexto, el r-avo momento de la variable aleatoria X, se constituye en el


r-avo momento de la población 𝒇𝑿 (𝒙).

1.4.3. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥).

Luego,

𝐸[𝑀𝑟′ ] = 𝜇𝑟′

8
Muestreo estadístico Rubén Medinaceli O.

En palabras, la esperanza o valor esperado del r-avo momento de la muestra es igual


al r-avo momento de la población

Demostrando el teorema se tiene que:


𝑛
1
𝐸[𝑀𝑟′ ] = 𝐸 [ ∑ 𝑋𝑖𝑟 ]
𝑛
𝑖=1

La esperanza de una constante por una variable es igual a la constante por la esperanza
de la variable, por tanto,
𝑛
1
𝐸[𝑀𝑟′ ] = 𝐸 [∑ 𝑋𝑖𝑟 ]
𝑛
𝑖=1

La esperanza de una suma es igual a la suma de las esperanzas, esto es,


𝑛 𝑛
1 1 1
𝐸[𝑀𝑟′ ] = ∑ 𝐸[𝑋𝑖𝑟 ] = ∑ 𝜇𝑟′ = 𝑛𝜇𝑟′ = 𝜇𝑟′
𝑛 𝑛 𝑛
𝑖=1 𝑖=1

1.5. Media de la muestra

1.5.1. Definición

Si (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de una población 𝑓𝑋 (𝑥); la media de la


muestra, denotada por 𝑿 ̅ , se define como:

𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Nótese que la media de la muestra es el primer momento de la muestra aleatoria.

La media de la muestra es función solamente de variables aleatorias observables; por tanto,


𝑋̅ es un estadístico y consecuentemente es una variable aleatoria y como tal tiene, una
media, una varianza y una distribución.

1.5.2. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) con media µ
(desconocida) y varianza σ2 (desconocida).

Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

9
Muestreo estadístico Rubén Medinaceli O.

La media de la muestra.

Luego,

a)

𝐸[𝑋̅] = 𝜇𝑋̅ = 𝜇

En palabras, la media de la muestra, en promedio, es igual a la media de la población.

b)

𝜎2
𝑉𝑎𝑟[𝑋̅] = 𝜎𝑋2̅ =
𝑛

En palabras, la varianza de la media de la muestra es igual a la varianza de la población


dividida por el tamaño de la muestra.

Demostrando este teorema se tiene que,

a)
𝑛 𝑛 𝑛
1 1 1 1
𝐸[𝑋̅] = 𝐸 [ ∑ 𝑋𝑖 ] = 𝐸 [∑ 𝑋𝑖 ] = ∑ 𝐸[𝑋𝑖 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑛 ]}
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1

Recuerde que,

𝐸[𝑋1 ] = 𝐸[𝑋2 ] = ⋯ = 𝐸[𝑋𝑛 ] = 𝜇

Por tanto,

1 1
𝐸[𝑋̅] = {𝜇 + 𝜇 + ⋯ + 𝜇} = {𝑛𝜇} = 𝜇
𝑛 𝑛

b)
𝑛
1
𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [ ∑ 𝑋𝑖 ]
𝑛
𝑖=1

Recuerde que en general,

𝑉𝑎𝑟[𝑎𝑋] = 𝑎2 𝑉𝑎𝑟[𝑋]

Por tanto,
𝑛
1
𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [∑ 𝑋𝑖 ]
𝑛2
𝑖=1

10
Muestreo estadístico Rubén Medinaceli O.

Como, 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 son variables aleatorias independientes,


𝑛
1 1
𝑉𝑎𝑟[𝑋̅] = 2 ∑ 𝑉𝑎𝑟[𝑋𝑖 ] = 2 {𝑉𝑎𝑟[𝑋1 ] + 𝑉𝑎𝑟[𝑋2 ] + ⋯ + 𝑉𝑎𝑟[𝑋𝑛 ]}
𝑛 𝑛
𝑖=1

Recordando que,

𝑉𝑎𝑟[𝑋1 ] = 𝑉𝑎𝑟[𝑋2 ] = ⋯ = 𝑉𝑎𝑟[𝑋𝑛 ] = 𝜎 2

Finalmente se tiene que,

1 2 1 𝜎2
𝑉𝑎𝑟[𝑋̅] = {𝜎 + 𝜎 2 + ⋯ + 𝜎2} = {𝑛𝜎 2} =
𝑛2 𝑛2 𝑛

Hasta ahora se conocen la media y la varianza de la media de la muestra (𝑋̅); falta


conocer la forma de la distribución de 𝑋̅, 𝑓𝑋̅ (. ). El siguiente teorema, uno de los más
importantes de la estadística, proporciona la distribución asintótica de 𝑋̅.

1.5.3. Teorema central del límite

Sea 𝑓𝑋 (𝑥) una población con media µ (desconocida) y varianza σ2 (desconocida).

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de tamaño n de dicha población.

Sea
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

la media de la muestra.

Luego, a medida que 𝑛 → ∞,

̅ , 𝒇𝑿̅ (. ), converge a una distribución normal con media µ y varianza


La distribución de 𝑿
σ /n.
2

Vale decir,

11
Muestreo estadístico Rubén Medinaceli O.

𝑓𝑋 (𝑥)

σ2

µ X

Muestra aleatoria: (𝑿 𝟏 , 𝑿 𝟐 , 𝑿 𝟑 , ⋯ , 𝑿 𝒏 )

Media de la muestra:
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

𝑨 𝒎𝒆𝒅𝒊𝒅𝒂 𝒒𝒖𝒆 𝒏 → ∞

𝑓𝑋̅ (. )

σ2 / n

µ ̅
𝑿

̅ converge a una distribución normal con media


Este teorema señala que la distribución de 𝑿
µ y varianza σ /n.
2

Lo sorprendente de este teorema es que no se dice nada sobre la forma de la distribución


de la población; cualquiera sea la forma de esta distribución, la distribución de la media de
̅ ) es aproximadamente normal para muestras grandes.
la muestra (𝑿

12
Muestreo estadístico Rubén Medinaceli O.

1.6. Varianza de la muestra

1.6.1. Definición

Si (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) es una muestra aleatoria de una población 𝑓𝑋 (𝑥); la varianza de la


muestra, denotada por S2, se define como:
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Nótese que la media de la muestra es función solamente de variables aleatorias


observables; por tanto, S2 también es un estadístico y consecuentemente es una variable
aleatoria y como tal, tiene una media, una varianza y una distribución.

1.6.2. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) con media µ y
varianza σ2.

Sea,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

La varianza de la muestra.

Luego,

a)

𝐸[𝑆 2 ] = 𝜎 2

En palabras, la varianza de la muestra, en promedio, es igual a la varianza de la población.

b)

1 𝑛−3 4
𝑉𝑎𝑟[𝑆 2 ] = (𝜇4 − 𝜎 ) ; 𝑝𝑎𝑟𝑎 𝑛 > 1
𝑛 𝑛−1

Donde, µ4 es el cuarto momento de X

La varianza de la varianza de la muestra es irrelevante para fines prácticos.

Se demuestra solamente la primera parte del teorema

a)

Inicialmente, se puede ver que:

13
Muestreo estadístico Rubén Medinaceli O.

𝑛 𝑛 𝑛

∑(𝑋𝑖 − 𝜇)2 = ∑(𝑋𝑖 − 𝑋̅ + 𝑋̅ − 𝜇)2 = ∑[(𝑋𝑖 − 𝑋̅) + (𝑋̅ − 𝜇)]2


𝑖=1 𝑖=1 𝑖=1

𝑛 𝑛

∑(𝑋𝑖 − 𝜇) = ∑[(𝑋𝑖 − 𝑋̅)2 + 2(𝑋𝑖 − 𝑋̅)(𝑋̅ − 𝜇) + (𝑋̅ − 𝜇)2 ]


2

𝑖=1 𝑖=1
0
𝑛 𝑛 𝑛

∑(𝑋𝑖 − 𝜇)2 = ∑(𝑋𝑖 − 𝑋̅)2 + 2(𝑋̅ − 𝜇) ∑(𝑋𝑖 − 𝑋̅) + 𝑛(𝑋̅ − 𝜇)2


𝑖=1 𝑖=1 𝑖=1

𝑛 𝑛

∑(𝑋𝑖 − 𝜇)2 = ∑(𝑋𝑖 − 𝑋̅)2 + 𝑛 (𝑋̅ − 𝜇)2


𝑖=1 𝑖=1

De donde,
𝑛 𝑛

∑(𝑋𝑖 − 𝑋̅)2 = ∑(𝑋𝑖 − 𝜇)2 − 𝑛(𝑋̅ − 𝜇)2 (∗)


𝑖=1 𝑖=1

Continuando con la demostración del teorema,


𝑛 𝑛
1 1
𝐸[𝑆 2 ] =𝐸[ ∑(𝑋𝑖 − 𝑋̅)2 ] = 𝐸 [∑(𝑋𝑖 − 𝑋̅)2 ]
𝑛−1 𝑛−1
𝑖=1 𝑖=1

Utilizando (∗), se tiene:


𝑛 𝑛
1 1
𝐸[𝑆 2 ] =𝐸[ ∑(𝑋𝑖 − 𝜇)2 − 𝑛(𝑋̅ − 𝜇)2 ] = {∑ 𝐸[(𝑋𝑖 − 𝜇)2 ] − 𝑛𝐸[(𝑋̅ − 𝜇)2 ]}
𝑛−1 𝑛−1
𝑖=1 𝑖=1

𝑛 𝑛
1 1 𝜎2
𝐸[𝑆 2 ] = {∑ 𝑉𝑎𝑟[𝑋] − 𝑛𝑉𝑎𝑟[𝑋̅]} = {∑ 𝜎 2 − 𝑛 }
𝑛−1 𝑛−1 𝑛
𝑖=1 𝑖=1

1 1
𝐸[𝑆 2 ] = {𝑛𝜎 2 − 𝜎 2 } = 𝜎 2 (𝑛 − 1) = 𝝈𝟐
𝑛−1 𝑛−1

Falta conocer la forma de la distribución de S2

2. Muestreo de poblaciones que siguen una distribución normal

2.1. El rol de la distribución normal en la estadística

Como se verá más adelante, la distribución normal juega un rol predominante en la


estadística. Solo el teorema del límite central asegura que este será el caso; aunque,
existen otras razones igualmente importantes.

14
Muestreo estadístico Rubén Medinaceli O.

En primer lugar, muchas poblaciones encontradas en investigaciones en diferentes áreas


del conocimiento, parecen tener una distribución normal a un buen grado de aproximación.
Este fenómeno es bastante razonable en virtud del teorema del límite central.

Otra consideración que favorece a la distribución normal es el hecho que la matemática de


la estadística basada en una población que sigue una distribución normal es bastante
accesible.

2.1.1. Definición

Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:

1 1 𝑥−𝜇 2
− 2( 𝜎 )
𝑓𝑋 (𝑥) = 𝑒 ; −∞ ≤ 𝑥 ≤ ∞
√2𝜋 𝜎

Se dice que la variable aleatoria X sigue una distribución normal con media µ y varianza
σ2; y se denota por 𝑿 ~ 𝑵(𝝁; 𝝈𝟐 ).

La forma de la distribución normal es aproximadamente la siguiente:

fX(x)

σ2

𝑿 ~ 𝑵(𝝁; 𝝈𝟐 )
µ

Nótese que:

• La curva es simétrica respecto de un eje vertical que pasa por la media µ

• La curva tiene sus puntos de inflexión en 𝑥 = 𝜇 ± 𝜎, es cóncava hacia abajo si 𝜇 −


𝜎 < 𝑋 < 𝜇 + 𝜎 y cóncava hacia arriba en caso contrario.

• La curva se aproxima en forma asintótica al eje horizontal, a medida que avanza


en uno u otro sentido a partir de la media.

2.1.2. Teorema

Sea X una variable aleatoria que sigue una distribución normal con media µ y varianza
σ2.

15
Muestreo estadístico Rubén Medinaceli O.

Luego, reiterando:

a)

𝐸[𝑋] = 𝜇𝑋 = 𝜇

b)

𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜎 2

2.1.3. Definición

Si Z es una variable aleatoria que sigue una distribución normal con media µ = 0 y
varianza σ2 = 1, se dice que la variable aleatoria Z sigue una distribución normal
estandarizada y se denota por 𝒁 ~ 𝑵(𝟎; 𝟏). Esto es,

fZ(z)

σ2 = 1

𝒁 ~ 𝑵(𝟎, 𝟏)
µ=0

2.1.4. Teorema

Sea,

𝑋 ~ 𝑁(𝜇; 𝜎 2 )

Sea, Z una variable aleatoria tal que:

𝑋−𝜇
𝑍=
𝜎

Luego,

𝑍 ~ 𝑁(0; 1)

Este teorema es muy importante para operar con la distribución normal. En palabras,
dice que, con el cambio de variable señalado, cualquier distribución normal puede
ser convertida en una distribución normal estandarizada

16
Muestreo estadístico Rubén Medinaceli O.

La pregunta inmediata es: ¿para que necesitamos convertir una distribución normal
cualquiera en una distribución normal estandarizada?

La respuesta está en el siguiente ejercicio.

1.1.1. Ejercicio 1

Problema:

Sea,

𝑋 ~ 𝑁(10; 9)

Calcular P(X ≤ 12)

Solución:

Se conoce que la variable aleatoria X sigue una distribución normal con media µ = 10 y
varianza σ2 = 9; esto es,

𝒇𝑿 (𝒙)

P(X ≤ 12)

σ2 = 9; σ =3

𝑋 ~ 𝑁(10; 9)
µ = 10
x0 = 12

Por tanto,
12
1 1 𝑥−10 2
− 2( 3 )
𝑃(𝑋 ≤ 12) = ∫ 𝑒 𝑑𝑥
√2𝜋3
−∞

Lamentablemente, esta integral es indeterminada; vale decir, no existe. ¿Qué hacer?. Se


debe recurrir a una aproximación numérica. Afortunadamente, ya se cuenta con la
aproximación numérica requerida y esta vienen en tablas. Sin embargo, estas tablas son
válidas solamente para una distribución normal estandarizada. Por tanto, aquí surge la
necesidad de convertir la distribución normal que se tiene en una distribución normal
estandarizada. Vale decir,

17
Muestreo estadístico Rubén Medinaceli O.

𝑋 − 𝜇 12 − 10
𝑃(𝑋 ≤ 12) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0,67)
𝜎 3

Gráficamente, esta estandarización se puede expresar de la siguiente manera:

𝒇𝑿 (𝒙)

P(X ≤ 12)

σ2 = 9; σ =3

𝑿 ~ 𝑵(𝟏𝟎; 𝟗)
µ = 10
x0 = 12

𝒇𝒁 (𝒛)

P(Z ≤ 0,67)

𝑿−𝝁
𝒁= ~𝑵(𝟎; 𝟏)
𝝈
µ=0
z0 = 0,67

El acceso a la tabla (cualquier libro de estadística tiene esta tabla, la que se muestra es una
parte de la tabla) es muy sencillo, tal como se muestra a continuación:

Primer decimal Segundo decimal

z0 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

18
Muestreo estadístico Rubén Medinaceli O.

Por tanto,

𝑋 − 𝜇 12 − 10
𝑃(𝑋 ≤ 12) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0,67) = 𝟎, 𝟕𝟒𝟖𝟔
𝜎 3

2.2. Media de la muestra

2.2.1. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media 𝜇 y varianza 𝜎 2 .

Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

La media de la muestra.

Luego,

𝑋̅ es una variable aleatoria que sigue una distribución normal con media µ y varianza σ2/n

Este es un teorema muy parecido al teorema del límite central. Sin embargo, en el teorema
del límite central la forma de la distribución de la población es cualquiera; en este teorema
es normal. En el teorema del límite central, la media de la muestra 𝑋̅ converge, a medida
que 𝑛 → ∞, a una distribución normal; en este teorema, 𝑋̅ tiene una distribución normal.

2.3. Distribución Chi-cuadrada

2.3.1. Definición

Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:

1 1 𝑘⁄2 𝑘−1 − 1𝑥
𝑓𝑋 (𝑥) = ( ) 𝑥 2 𝑒 2 ; 𝑥 ≥ 0; 𝑘 𝑒𝑠 𝑢𝑛 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜
𝛤(𝑘⁄2) 2

Se dice que la variable aleatoria X sigue una distribución chi-cuadrada con k grados de
libertad y se denota por: 𝑋 ~ 𝑿𝟐𝒌

Nótese que la función de densidad de probabilidad incluye la función gamma. Recuerde


que,

𝛤(𝑡) = ∫ 𝑥 𝑡−1 𝑒 −𝑥 𝑑𝑥 ; 𝑡 > 0


0

Ocurre además que,

19
Muestreo estadístico Rubén Medinaceli O.

𝛤(𝑡 + 1) = 𝑡𝛤(𝑡)

Si t = n (un entero)

𝛤(𝑛 + 1) = 𝑛!

2.3.2. Teorema

Sea 𝑋 ~ 𝑿2𝑘

Luego,

a)

𝐸[𝑋] = 𝑘

b)

𝑉𝑎𝑟[𝑋] = 2𝑘

Nótese que el parámetro de la distribución chi-cuadrada es k; si se conoce k se conoce


la media, la varianza y la forma específica de la distribución de X.

La forma general de la distribución chi-cuadrada es la siguiente:

𝑓𝑋 (𝑥)

Var [X] = 2k

0 E[X] = k 𝑋 ~ 𝑿𝟐𝒌

20
Muestreo estadístico Rubén Medinaceli O.

2.3.3. Ejercicio 1.a

Problema:
2
Sea 𝑋 ~ 𝑿10

Calcular la 𝑃(𝑋 ≤ 16,0)

Solución:

𝑓𝑋 (𝑥)

P(X ≤ 16,0)

0 x0= 16,0 𝑋 ~ 𝑿𝟐𝟏𝟎

16
1 1 5 4 − 1𝑥
𝑃(𝑋 ≤ 16,0) = ∫ ( ) 𝑥 𝑒 2 𝑑𝑥
𝛤(5) 2
0

La integral es compleja, nadie desea resolver la misma; la solución es recurrir a una


aproximación numérica que generalmente viene en una tabla. Cualquier libro de estadística
incluye esta tabla. A continuación, se muestra una parte de la misma.

PROBABILIDADES CON LA DISTRIBUCIÓN CHI-CUADRADA


𝒇𝑿 (𝒙)

G = P(X ≤ x0)

0 x0 𝑋 ~ 𝑿𝟐𝒌
𝒌 𝑮
0,005 0,010 0,025 0,050 0,100 0,250 0,500 0,750 0,900 0,950 0,975 0,990 0,995
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0
9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2
11 2,60 3,05 3,82 4,57 5,58 7,58 10,30 13,7 17,3 19,7 121,9 24,7 26,8
12 3,07 3,57 4,40 5,23 6,30 8,44 11,30 14,8 18,5 21,0 23,3 26,2 28,3
13 3,57 4,11 5,01 5,89 7,04 9,30 12,30 16,0 19,8 22,4 24,7 27,7 29,8

21
Muestreo estadístico Rubén Medinaceli O.

Se busca la fila correspondiente a los grados de libertad (en este caso k =10); en esta fila
se busca el valor correspondiente a x0 (en este caso x0 = 16,0); finalmente se obtiene la
probabilidad correspondiente en la fila de valores de G. En este caso,

𝑃(𝑋 ≤ 16,0) = 0,900

Si la tabla no incluye el valor x0 de interés, hay que recurrir a una interpolación lineal
tomando el inmediato inferior y el inmediato superior. Nótese que la tabla también puede
ser utilizada para encontrar x0 cuando se conoce G.

2.3.4. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.

Sea,
𝑛
𝑋𝑖 − 𝜇 2
𝑈 = ∑( )
𝜎
𝑖=1

Luego,

𝑈 ~ 𝑿𝟐𝒏

En palabras, la suma de n distribuciones normales estandarizadas independientes elevadas


al cuadrado sigue una distribución chi-cuadrada con n grados de libertad.

2.3.5. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.

Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

La media de la muestra

Sea,
𝑛 2
𝑋𝑖 − 𝑋̅
𝑈 = ∑( )
𝜎
𝑖=1

Luego,

22
Muestreo estadístico Rubén Medinaceli O.

𝑈 ~ 𝑿𝟐𝒏−𝟏

Con respecto al teorema anterior, éste reemplaza la media de la población (µ) con la media
de la muestra (𝑿̅ ); y señala que por esta razón la distribución de U pierde un grado de
libertad.

2.3.6. Teorema

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.

Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

La media de la muestra

Sea,
𝑛
1
2
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

La varianza de la muestra

Sea,

(𝑛 − 1)𝑆 2
𝑈=
𝜎2

Luego,

𝑈 ~ 𝑿𝟐𝒏−𝟏

Recuerde que este punto se inició indicando que se buscaba la distribución de S2. No se
ha logrado este propósito. Sin embargo, se ha obtenido la distribución de una variable
aleatoria U de la que S2 es parte; esto es suficiente para los fines prácticos.

2.4. Distribución t de estudiante

2.4.1. Definición

Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:

𝛤[(𝑘 + 1)⁄2] 1 1
𝑓𝑋 (𝑥) = ; −∞ ≤ 𝑥 ≤ ∞ ; 𝑘 𝑒𝑠 𝑢𝑛 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜

𝛤(𝑘 2 ) √𝑘𝜋 (1 + 𝑥 𝑘)(𝑘+1)⁄2
2 ⁄

23
Muestreo estadístico Rubén Medinaceli O.

Se dice que la variable aleatoria X sigue una distribución t de estudiante con k grados
de libertad y se denota por: 𝑿 ~ 𝒕𝒌

2.4.2. Teorema

Sea 𝑿 ~ 𝒕𝒌

Luego,

a)

𝐸[𝑋] = 0 ; 𝑠𝑖 𝑘 > 2

b)

𝑘
𝑉𝑎𝑟[𝑋] = ; 𝑠𝑖 𝑘 > 2
𝑘−2

Nótese que el parámetro de la distribución t de estudiante es k. La forma de su función


de densidad de probabilidad es la siguiente:

fX(x)

σ2 = k / (k-2)

𝑿 ~ 𝒕𝒌
µ=0

La forma de la distribución t de estudiante es muy parecida a la forma de la distribución


normal estandarizada, es simétrica respecto de un eje vertical que pasa por µ = 0. La
media de la distribución t de estudiante es igual a 0 y su varianza prácticamente igual a 1
para valores grandes de k.

En otras palabras, para valores grandes de k la distribución t de estudiante converge a


una distribución normal estandarizada.

2.4.3. Ejercicio 2

Problema:

Sea X una variable aleatoria que sigue una distribución t de estudiante con cinco (5)
grados de libertad (𝑋 ~ 𝑡5 ).

24
Muestreo estadístico Rubén Medinaceli O.

Calcular la P (X ≤ 2,015).

Solución:

Si 𝑋 ~ 𝑡5

fX(x)

P(X ≤ 2,015)

𝑿 ~ 𝒕𝟓
µ=0
x0=2,015

Por tanto,

2,015
𝛤[3] 1 1
𝑃(𝑋 ≤ 2,015) = ∫ 𝑑𝑥
𝛤(5⁄2) √5𝜋 (1 + 𝑥 2 ⁄5)3
−∞

Es una integral compleja que nadie desea resolver. Por tanto, se debe recurrir a una
aproximación numérica la misma que viene en una tabla incluida en cualquier libro de
estadística. A continuación, se muestra una parte de esta tabla:

25
Muestreo estadístico Rubén Medinaceli O.

PROBABILIDADES CON LA DISTRIBUCIÓN t de estudiante

fX(x)

α = P (X ≥ x0)

0 x0 𝑋 ~ 𝑡𝑘

k 𝜶
0,10 0,05 0,025 0,01 0,005
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355

El uso de la tabla es muy sencillo. Con los grados de libertad (k = 5, en el presente caso)
se ubica la fila de interés; en la misma se busca el valor de x0 (x0 = 2,015, en el presente
caso); el valor de α [P (X ≥ x0)] se encuentra en la primera fila de la tabla. Por tanto,

𝑃(𝑋 ≤ 2,015) = 1 − 𝑃(𝑋 ≥ 2,015) = 1 − 0,05 = 𝟎, 𝟗𝟓

Está permitida la interpolación lineal. La tabla también puede ser utilizada para encontrar el
valor de x0 que le corresponde a un cierto valor de α.

2.4.4. Teorema

Sea,

𝑍 ~ 𝑁(0,1)

Sea,

𝑈 ~ Ӽ2𝑘

Sean Z y U variables aleatorias independientes

Sea,

𝑍
𝑇=
√𝑈
𝑘

Luego,

26
Muestreo estadístico Rubén Medinaceli O.

𝑇 ~ 𝑡𝑘

Este teorema señala el camino para lograr una distribución t de estudiante con k grados
de libertad. Dice que el cociente de una distribución normal estandarizada sobre la raíz
cuadrada de una distribución chi-cuadrada dividida por sus grados de libertad. La
distribución t de estudiante así formada tiene los mismos grados de libertad que la
distribución chi-cuadrada.

Este teorema resulta importante a la hora de buscar estadísticos requeridos por la inferencia
estadística.

Considere el siguiente ejemplo,

Ejemplo

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.

fX(x)

σ2

𝑿 ~ 𝑵(𝝁; 𝝈𝟐 )
µ

𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏

Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

La media de la muestra

Sea,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

27
Muestreo estadístico Rubén Medinaceli O.

La varianza de la muestra

Se sabe que,

𝜎2
𝑋̅ ~𝑁 (𝜇; )
𝑛

Estandarizando 𝑋̅ se tiene que,

𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0; 1)
√𝑛

También se sabe que,

(𝑛 − 1)𝑆 2
𝑈= ~ 𝑿2𝑛−1
𝜎2

Recordando que,

𝑍
𝑇= ~𝑡𝑘
√𝑈
𝑘

Donde,

𝑍 ~ 𝑁(0; 1)

𝑈 ~ 𝑿2𝑘

En el caso del muestreo se tendrá que,

𝑋̅ − 𝜇
𝜎
𝑇= √𝑛 ~ 𝑡𝑛−1
(𝑛 − 1)𝑆 2
√ 𝜎2
𝑛−1

Vale decir,

𝑋̅ − 𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛

Este estadístico será muy útil a la hora de efectuar inferencia estadística vinculada a la
media de la población 𝜇.

28
Muestreo estadístico Rubén Medinaceli O.

2.5. Distribución F

2.5.1. Definición

Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:

𝛤[(𝑚 + 𝑛)⁄2] 𝑚 𝑚⁄2 𝑥 (𝑚−2)⁄2


𝑓𝑋 (𝑥) = ( ) ; 𝑥 ≥ 0; 𝑚 𝑦 𝑛 𝑠𝑜𝑛 𝑒𝑛𝑡𝑒𝑟𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠
𝛤[𝑚⁄2]𝛤[𝑛⁄2] 𝑛 [1 + (𝑚⁄𝑛)𝑥](𝑚+𝑛)⁄2

Se dice que la variable aleatoria X sigue una distribución F con m y n grados de libertad,
y se denota por:

𝑿 ~ 𝑭𝒎; 𝒏

2.5.2. Teorema

Sea,

𝑋 ~ 𝐹𝑚; 𝑛

Luego,

i)

𝑛
𝐸[𝑋] = ; 𝑠𝑖 𝑛 > 2
𝑛−2

ii)

2𝑛2 (𝑚 + 𝑛 − 2)
𝑉𝑎𝑟[𝑋] = ; 𝑠𝑖 𝑛 > 4
𝑚(𝑛 − 2)2 (𝑛 − 4)

Nótese que los parámetros de la distribución F son m y n. La forma de su función de


densidad de probabilidad es la siguiente:

fX(x)

2𝑛2 (𝑚+𝑛−2)
𝜎2 =
𝑚(𝑛−2)2 (𝑛−4)

𝑛
0 𝜇= 𝑋 ~ 𝐹𝑚;𝑛
𝑛−2

29
Muestreo estadístico Rubén Medinaceli O.

2.5.3. Ejercicio 3

Problema:

Sea X una variable aleatoria que sigue una distribución F con 4 y 6 grados de libertad
(𝑋 ~ 𝐹4;6 ).

Calcular la P(X ≤ 6,23)

Solución:

Si 𝑋 ~ 𝐹4;6

fX(x)

P(X ≤ 6,23)

0 𝑋 ~ 𝐹4;6
x0 = 6,23
6,23
𝛤[(4 + 6)⁄2] 4 4⁄2 𝑥 (4−2)⁄2
𝑃(𝑋 ≤ 6,23) = ∫ ( ) 𝑑𝑥
𝛤[4⁄2]𝛤[6⁄2] 6 [1 + (4⁄6)𝑥](4+6)⁄2
0

Es una integral difícil, nadie desea resolverla analíticamente; por tanto, se debe recurrir a
una aproximación numérica que en este caso viene en una tabla, incluida en cualquier libro
de estadística. A continuación, se muestra una parte de dicha tabla:

30
Muestreo estadístico Rubén Medinaceli O.

PROBABILIDADES CON LA DISTRIBUCIÓN F

𝑮 = 𝑷(𝑿 ≤ 𝒙𝟎 )

0 𝑥0 𝑋 ~ 𝐹𝑚;𝑛

G n m
2 3 4 5 6 7
0,900 5 3,78 3,62 3,52 3,45 3,40 3,37
0,950 5,79 5,41 5,19 5,05 4,95 4,88
0,975 8,43 7,76 7,39 7,15 6,98 6,85
0,990 13,30 12,10 11,40 11,00 10,70 10,50
0,995 18,30 16,5 15,60 14,90 14,50 14,20
0,900 6 3,46 3,29 3,18 3,11 3,05 3,01
0,950 5,14 4,76 4,53 4,39 4,28 4,21
0,975 7,26 6,60 6,23 5,99 5,82 5,70
0,990 10,90 9,78 9,15 8,75 8,47 8,26
0,995 14,50 12,9 12,00 11,50 11,10 10,80
0,900 7 3,26 3,07 2,96 2,88 2,83 2,78
0,950 4,74 4,35 4,12 3,97 3,87 3,79
0,975 6,54 5,89 5,52 5,29 5,12 4,99
0,990 9,55 8,45 7,85 7,46 7,19 6,99
0,995 12,4 10,90 10,10 9,52 9,16 8,89

Se ingresa con los grados de libertad en el debido orden; en la intersección se busca el


valor de x0 y se encuentra la probabilidad correspondiente en la primera columna de la
tabla.

Es importante recordar que,

𝐹𝑚;𝑛 ≠ 𝐹𝑛;𝑚

En el presente caso,

𝑃(𝑋 ≤ 6,23) = 𝟎, 𝟗𝟕𝟓

Cada libro tiene su propio formato para esta y las tablas anteriores; sin embargo, una
revisión cuidadosa a la tabla facilita su acceso.

2.5.4. Teorema

Sea,

𝑈 ~ 𝑿2𝑚

31
Muestreo estadístico Rubén Medinaceli O.

Sea,

𝑉 ~ 𝑿2𝑛

Sean

𝑈 𝑦 𝑉 variables aleatorias independientes.

Sea,

𝑈
𝐹= 𝑚
𝑉
𝑛

Luego,

𝐹 ~ 𝐹𝑚; 𝑛

En palabras, el teorema dice que el cociente de dos distribuciones chi-cuadrada divididas


por sus respectivos grados de libertad, sigue una distribución F con grados de libertad que
corresponden al numerador y denominador, en ese orden.

Este teorema es muy importante a la hora de buscar estadísticos requeridos por la


inferencia estadística.

2.5.5. Ejercicio 4

Problema:

Si T es una variable aleatoria que sigue una distribución t de estudiante con k grados
de libertad ( 𝑇 ~ 𝑡𝑘 ).

Obtener la distribución de T2

Solución:

Si 𝑇 ~ 𝑡𝑘

𝑍
𝑇=
√𝑈
𝑘

Donde,

𝑍 ~ 𝑁(0; 1)

𝑈 ~ Ӽ2𝑘

Por tanto,

32
Muestreo estadístico Rubén Medinaceli O.

𝑍2
𝑇2 = 1
𝑈
𝑘

Donde,

𝑍 2 ~ Ӽ12

Consecuentemente, resulta que 𝑇 2 es igual al cociente de dos distribuciones chi-cuadrada


divididas por sus respectivos grados de libertad. Por tanto,

𝑇 2 ~ 𝐹1; 𝑘

En palabras, 𝑇 2 sigue una distribución F con 1 y k grados de libertad.

2.5.6. Ejercicio 5

Problema:

Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).

Cuál es la distribución de:

a)

𝑋1 + 𝑋2
𝑌=
√2

b)

𝑋1 + 𝑋2
𝑅=
√(𝑋1 − 𝑋2 )2

33
Muestreo estadístico Rubén Medinaceli O.

Solución:

fX(x)

σ2 = 1

𝑋 ~ 𝑁(0; 1)
µ=0

X1, X2

Si X1, X2 es una muestra aleatoria de una población normal estandarizada

𝑋1 ~ 𝑁(0; 1) 𝑦 𝑋2 ~ 𝑁(0; 1)

Recuerde que la suma de distribuciones normales independientes es también normal con


una media igual a la suma de medias y varianza igual a la suma de varianzas; esto es:

(𝑋1 + 𝑋2 ) ~ 𝑁(0 + 0; 1 + 1) ~ 𝑁(0; 2)

(𝑋1 − 𝑋2 ) ~ 𝑁(0 − 0; 1 + 1) ~ 𝑁(0; 2)

Recordando además que, si a y b son constantes y las variables aleatorias independientes


X y Y siguen distribuciones normales con medias µ x y µy y varianzas σx2 y σy2
respectivamente,

𝑎𝑋 + 𝑏𝑌 ~ 𝑁(𝑎𝜇𝑋 + 𝑏𝜇𝑌 ; 𝑎2 𝜎𝑋2 + 𝑏 2 𝜎𝑌2 )

Por tanto,

1 1 1 1 1 1
𝑋1 + 𝑋2 ~ 𝑁 [ (0) + (0); (1) + (1)] ~ 𝑁(0; 1)
√2 √2 √2 √2 2 2

1 1 1 1 1 1
𝑋1 − 𝑋2 ~ 𝑁 [ (0) − (0); (1) + (1)] ~ 𝑁(0; 1)
√2 √2 √2 √2 2 2

En consecuencia,

34
Muestreo estadístico Rubén Medinaceli O.

a)

𝑋1 + 𝑋2
𝑌= ~ 𝑁(0; 1)
√2

b)

𝑋 + 𝑋2
𝑋1 + 𝑋2 √2 ( 1 )
𝑁(0; 1)
𝑅= = √2 ~ ~ 𝑡1
√(𝑋1 − 𝑋2 )2 𝟐
𝑋 − 𝑋2 2 𝑿
√ 𝟏
√2√( 1 ) 1
√2

2.5.7. Ejercicio 6

Problema:

Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sean 𝑋̅ 𝑦 𝑌̅ las medias de las muestras correspondientes.
Sean 𝑆𝑋2 𝑦 𝑆𝑌2 las varianzas de las muestras correspondientes

Cuál es la distribución de:

𝑋̅ − 𝑌̅
𝑃=
2 2
√𝑆𝑋 + 𝑆𝑌
2

Solución:

fX(x)

σ2 = 1

𝑋 ~ 𝑁(0; 1)
µ=0

X1, X2

Si X1, X2 es una muestra aleatoria de una población normal estandarizada:

35
Muestreo estadístico Rubén Medinaceli O.

𝑋1 ~ 𝑁(0; 1) 𝑦 𝑋2 ~ 𝑁(0; 1)

1
𝑋̅ ~ 𝑁 (0; )
2

(2 − 1)𝑆𝑋2 𝑆𝑋2
𝑈= = = 𝑆𝑋2 ~ 𝑿𝟐𝟏
𝜎2 1

fY(y)

σ2 = 1

𝑌 ~ 𝑁(0; 1)
µ=0

Y1, Y2

Si Y1, Y2 es una muestra aleatoria de una población normal estandarizada:

𝑌1 ~ 𝑁(0; 1) 𝑦 𝑌2 ~ 𝑁(0; 1)

1
𝑌̅ ~ 𝑁 (0; )
2

(2 − 1)𝑆𝑌2 𝑆𝑌2
𝑉= = = 𝑆𝑌2 ~ 𝑿𝟐𝟏
𝜎2 1
1 1
(𝑋̅ − 𝑌̅ ) ~ 𝑁 (0 − 0; + ) ~ 𝑁(0; 1)
2 2

(𝑆𝑋2 + 𝑆𝑌2 ) ~ Ӽ22

Por tanto,

𝑋̅ − 𝑌̅ 𝑁(0; 1)
𝑃= ~ ~ 𝑡2
2
√𝑆𝑋 + 𝑆𝑌2 √Ӽ2
2

2 2

36
Muestreo estadístico Rubén Medinaceli O.

2.5.8. Ejercicio 7

Problema:

Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población que sigue una distribución
normal con media 𝜇𝑋 y varianza 𝜎 2 .

Sea (𝒀𝟏 , 𝒀𝟐 , 𝒀𝟑 , ⋯ , 𝒀𝒎 ) una muestra aleatoria de una población que sigue una distribución
normal con media 𝜇𝑌 y varianza 𝜎 2 .

Sean 𝑆𝑋2 𝑦 𝑆𝑌2 las correspondientes varianzas de las muestras.

Encontrar la distribución de

𝑆𝑋2
𝑅=
𝑆𝑌2

Solución
𝑛
1
𝑆𝑋2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

𝑚
1
𝑆𝑌2 = ∑(𝑌𝑖 − 𝑌̅ )2
𝑚−1
𝑖=1

(𝑛 − 1)𝑆𝑋2
𝑈= ~ Ӽ2𝑛−1
𝜎2

(𝑚 − 1)𝑆𝑌2
𝑉= ~ Ӽ2𝑚−1
𝜎2

Se conoce que,

𝑈
𝐹 = − 1 ~ 𝐹𝑛−1;𝑚−1
𝑛
𝑉
𝑚−1

Por tanto,

(𝑛 − 1)𝑆𝑋2
𝑈 𝜎2
𝑛−1 = 𝑛−1 𝑆𝑋2
= = 𝑅 ~ 𝐹𝑛−1; 𝑚−1
𝑉 (𝑚 − 1)𝑆𝑌2 𝑆𝑌2
𝑚−1 𝜎2
𝑚−1

37
Muestreo estadístico Rubén Medinaceli O.

Ejercicios propuestos
1.

Sea 𝑋 ~ 𝐹𝑚;𝑛
1
Sea 𝑌 =
𝑋
¿Cuál es la distribución de Y?

2.

Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal con
µ = 0 y σ2 = 1.
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal con
µ = 1 y σ2 =1

¿Cuál es la distribución de 𝑋̅ + 𝑌̅?

3.

Si X1, X2 es una muestra aleatoria de una población que sigue una distribución normal con
µ = 0 y σ2 = 1.

¿Cuál es la distribución de 1/Z si Z = X12/X22?

4.

Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sean 𝑋̅ 𝑦 𝑌̅ las medias de las muestras correspondientes.
Sean 𝑆𝑋2 𝑦 𝑆𝑌2 las varianzas de las muestras correspondientes
Si,
𝑋̅ − 𝑌̅
𝑃=
2 2
√𝑆𝑋 + 𝑆𝑌
2

¿Cuál es la distribución de P2?

38

También podría gustarte