Está en la página 1de 37

Estadísticas

Semestre 2-2017

Distribuciones muestrales
Parámetro y estadígrafo

Parámetro es una medida de resumen numérica que se


calcula usando todas las unidades de la población. Es un
número fijo que generalmente no conocemos.

Estadística (estadígrafo) es una medida de resumen


numérica que se calcula a partir de las unidades de la
muestra. El valor de la estadística se conoce cuando
tomamos una muestra, pero varia de muestra en muestra

2
Inferencia estadística

Inferencia estadística: es el proceso de sacar conclusiones


de la población basados en la información de una muestra
de esa población.

Sus objetivos son:


• Estimar parámetros
• Construir intervalos de confianza
• Testear hipótesis o pruebas de significación estadística

3
Distribución muestral

Si queremos hacer inferencia es necesario conocer la


relación entre el parámetro y el estadígrafo. Si conocemos
la distribución muestral podemos hacer inferencia.

La distribución de probabilidad de una estadística se llama


distribución muestral.

Una estadística muestral proveniente de una muestra


aleatoria simple que tiene un patrón de comportamiento
(predecible) en repetidas muestras. Este patrón es llamado
la distribución muestral de la estadística.
4
Distribución muestral

La distribución muestral de una estadística depende del


tamaño de la población, el tamaño de las muestras y el
método de elección de las muestras.

Ojo con los errores!!

El error muestral se refiere a la variación natural existente


entre muestras tomadas de la misma población. Los errores
que surgen al tomar las muestras y que no pueden
clasificarse como errores muestrales y se denominan
errores no muestrales.
5
Sesgo y Precisión

Dos características que siempre deseamos que tenga


nuestras mediciones son:
1. que sean insesgadas o exactas, es decir que la
medición esté próxima al valor verdadero.
2. que sean precisas, o sea que mediciones repetidas
caigan dentro de un intervalo reducido.

6
Sesgo y Precisión

Preciso pero no Exacto pero no


exacto preciso

No preciso y no Preciso y exacto


exacto

7
Distribución de una media muestral

La distribución muestral de la media muestral es la


distribución de los valores de las medias muestrales de
todas las posibles muestras del mismo tamaño n tomadas
de la misma población.

Si sacamos muestras aleatorias de tamaño n de una


población con media μ y desviación estándar s, la
distribución de la media muestral tiene las siguientes
propiedades:

8
Distribución de una media muestral

1. El promedio de todos los valores posibles de medias


muestrales es igual al parámetro μ. En otras palabras, la
media muestral 𝑋" es un estimador insesgado de μ.
𝜇$& = 𝜇

2. Error estándar de la media muestral: Es la desviación


estándar de las posibles medias muestrales.
(
𝜎$& = )

“El error estándar disminuye si el tamaño de la muestra


aumenta”
9
Distribución de una media muestral

3. Si la población original tiene distribución Normal, entonces


para cualquier tamaño muestral n la distribución de la media
muestral es también Normal

Si 𝑋~ 𝑁 𝜇, 𝜎 ⇒ 𝑥̅ ~𝑁(𝜇, 𝜎2 𝑛)

4. Si la población de origen no es Normal, pero n es


“suficientemente” grande la distribución de la media muestral
es aproximadamente Normal

Si 𝑋 ≁ 𝑁 𝜇, 𝜎 ⇒ 𝑥̅ ~̇𝑁(𝜇, 𝜎2 𝑛)
10
Distribución de una media muestral

Ejemplos:
Suponga que las subidas salariales porcentuales anuales de un
grupo de trabajadores de un grupo de empresas de tamaño
medio siguen una distribución normal que tiene una media de
12,2% y una desviación típica de 3,6%. Si se toma una muestra
aleatoria de 9 observaciones de esta población y se calcula la
media muestral ¿cuál es la probabilidad de que la media
muestral sea inferior a un 10%?

La probabilidad de que la media muestral sea inferior a un 10%


es de 0,0336 o 3,36%.

11
Distribución de una media muestral

Una empresa eléctrica fabrica baterías que tienen una duración


que se distribuye aproximadamente en forma normal, con media
de 800 horas y desviación estándar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 baterías tenga
una vida promedio de menos de 775 horas.

La respuesta sería que la probabilidad de que la media de la


muestra de 16 baterías sea menor a 775 horas es de 0,0062 o
0,62 %.

12
Distribución de una media muestral

Un fabricante de bujías sostiene que la duración de estas sigue


una distribución normal que tiene una media de 36.000
kilómetros y una desviación típica de 4.000 kilómetros. Para
validar su afirmación, toma una muestra aleatoria de 16 bujías
las que presentan una duración media de 34.500 kilómetros. Si
la afirmación del fabricante es correcta ¿cuál es la probabilidad
de obtener una media muestral de 34.500 o menos?

La probabilidad que la media sea de 34.500 kilómetros o menos


es de 0,0660 o 6,6%

13
Distribución de una media muestral

El uso del Teorema del Límite Central (TLC) y la distribución


normal es ciertamente útil en aplicaciones que giran alrededor
de las inferencias sobre la media de la población o la diferencia
entre dos medias de población. Sin embargo se supone que la
desviación estándar de la población se conoce.

Cuando los datos (los valores en la muestra) se utilizan para


calcular la media, hay 1 grado de libertad menos en la
información que se utiliza para estimar la varianza poblacional
σ2.

14
Distribución de una media muestral

Si el tamaño de la muestra es n entonces decimos que la


distribución T tiene n-1 grados de libertad. Según esto, hay una
distribución T diferente para cada tamaño de la muestra.

Estas distribuciones son una familia de distribuciones de


probabilidad continuas. Las curvas de densidad son simétricas y
con forma de campana como la distribución normal estándar.
Sus medias son 0 y sus varianzas son mayores que 1 (tienen
colas más pesadas).

Las colas de las distribuciones T disminuyen más lentamente


que las colas de la distribución normal. Si los grados de libertad
son mayores más próxima a 1 es la varianza y la función de
15
densidad es más parecida a la densidad normal.
Distribución de una media muestral

Sin embargo, en muchos escenarios experimentales el


conocimiento de σ no es más razonable que el conocimiento de
la media μ de la población. Frecuentemente, de hecho, una
estimación de σ la debe proporcionar la misma información
muestral que produce la media muestral. Como consecuencia,
una estadística natural a considerar para tratar con las
inferencias sobre μ es:

16
Distribución de una media muestral

Puesto que S es el análogo de la muestra para σ. Si el tamaño


de la muestra es pequeño, los valores de S2 fluctúan de forma
considerable de una muestra a otra y la distribución de T se
desvía de forma apreciable de la de una distribución normal
estándar.

Si el tamaño de la muestra es suficientemente grande, digamos


n>=30, la distribución de T no difiere de manera considerable de
la normal estándar. Sin embargo, para n<30, es útil tratar con la
distribución exacta de T

Esta función se conoce como la distribución T (de Student) con


v grados de libertad. Por lo tanto la variable aleatoria tiene una
17
distribución T con v=n-1 grados de libertad.
Distribución de una media muestral

Cuando n es mayor que 30, la


diferencia entre la normal y la
distribución T de Student no suele
ser muy importante.

18
Distribución de una media muestral

Ejemplo:
Un fabricante de bujías sostiene que la duración de estas tiene
una media de 36.000 kilómetros. Una muestra aleatoria de 16
bujías tiene una duración media de 34.500 kilómetros y una
desviación típica muestral de 4.000 kilómetros. Si la afirmación
del fabricante es correcta ¿cuál es la probabilidad de obtener
una media muestral de 34.500 o menos?

19
Distribución de una media muestral

Un ingeniero químico afirma que el rendimiento medio de la


población de cierto proceso en lotes es 500 gr/ml de materia
prima. Para verificar esta afirmación muestrea 25 lotes cada
mes. Si el valor T calculado cae entre −t0,05 y t0,05 queda
satisfecho con su afirmación. ¿Qué conclusión extraería de una
muestra que tiene una media de 518 gr/ml y una desviación
estándar de 40 gramos?. Supongamos que la distribución de
rendimientos es aproximadamente normal.

El fabricante queda satisfecho con esta afirmación si una


muestra de 25 lotes rinde un valor t entre −1,711 y 1,711. Si
μ=500, entonces t=2,25; un valor muy por arriba de 1,711.

20
Distribución de una proporción muestral

La distribución muestral de la proporción muestral es la


distribución de los valores de las proporciones muestrales de
todas las posibles muestras del mismo tamaño n tomadas de la
misma población.

Si P representa la proporción de elementos en una población


con cierta característica de interés, es decir, la proporción de
“éxitos”, donde “éxito” corresponde a tener la característica.

Si sacamos muestras aleatorias simples de tamaño n de la


población donde la proporción de “éxitos” es P, entonces la
distribución muestral de la proporción muestral tiene las
siguientes propiedades:
21
Distribución de una proporción muestral

1. El promedio de todos los valores posibles de 𝑝̂ es igual al


parámetro P. En otras palabras, 𝑝̂ es un estimador
insesgado de P .
𝜇89 = 𝑃

2. Error estándar de la proporción muestral: Es la desviación


estándar de las posibles proporciones muestrales y mide la
dispersión de la proporción muestral.

𝑃(1 − 𝑃)
𝜎89 =
𝑛
22
Distribución de una proporción muestral

3. Si n es “suficientemente” grande, la distribución de la


proporción muestral es aproximadamente Normal:

̇ 𝑃(1−𝑃)
𝑝̂ ~ 𝑁(𝑃, )
𝑛

23
Distribución de una proporción muestral

Ejemplos:

Se ha estimado que el 43% de los licenciados en administración


de empresas cree que la asignatura de ética empresarial es
muy importante para impartir valores éticos a los estudiantes.
¿Cual es la probabilidad de que más de la mitad de una muestra
aleatoria de 80 licenciados crea esto?

La probabilidad de que la mitad de la muestra crea en el valor


de la asignatura de ética empresarial es de 0,1020 (10,2%).

24
Distribución de una proporción muestral

Se ha extraído una muestra aleatoria de 250 viviendas de una


gran población de viviendas antiguas para estimar la proporción
cuya instalación eléctrica es peligrosa. Si el 30% de las
viviendas tiene realmente una instalación eléctrica peligrosa
¿cuál es la probabilidad de que la proporción de viviendas de la
muestra que tienen una instalación eléctrica peligrosa esté entre
el 25 y 35%?

La probabilidad de que la proporción muestral esté comprendida


entre 25 y 30% , dado P=30 es de 0,9146 (91,46%).

25
Distribución muestral de la varianza

Si podemos suponer que la distribución poblacional de una


variable es normal, podemos demostrar que la varianza
muestral y poblacional están relacionadas a través de una
distribución de probabilidad que se conoce con el nombre de
distribución ji cuadrado.

Dada una muestra aleatoria de n observaciones procedentes de


una población que sigue una distribución normal cuya varianza
poblacional es σ2 y cuya varianza muestral es S2, tenemos que:

Tiene una distribución ji cuadrado (𝜒 2 ) con n – 1 grados de


26

libertad
Distribución muestral de la varianza

En muchas aplicaciones en las que interviene la varianza


poblacional, hay que hallar los valores de la distribución
acumulada de 𝜒 2 , sobre todo la cola superior y la inferior de la
distribución, por ejemplo:

Para ello tenemos la distribución de la variables aleatoria que


sigue una distribución ji cuadrado. Así, por ejemplo, con 10
grados de libertad, el valor K correspondiente al intervalo inferior
es 3,94. Así mismo, en el caso del intervalo superior de 0,05 el
valor K es 18,31.

27
Distribución muestral de la varianza

Sea S2 la varianza muestral de una muestra aleatoria de n


observaciones procedentes de una población que tiene una σ2:

1. La distribución de S2 en el muestreo tiene una media σ2

2. La varianza de la distribución de S2 en un muestreo depende


de la distribución de la población subyacente. Si esta
distribución es normal, entonces

28
Distribución muestral de la varianza

3. Si la distribución de la población es normal, entonces


se distribuye como una

Si S2 es la varianza de una muestra aleatoria de tamaño n que


se toma de una población normal que tiene desviación estándar
σ, entonces la estadística tiene una distribución ji cuadrado con
v=n-1 grados de libertad.

29
Distribución muestral de la varianza

Un proceso produce lotes de un producto químico cuyas concentraciones de


impurezas siguen una distribución normal de varianza 1,75. Halle la
probabilidad de que la varianza muestral sea superior a 3,1 si toma una
muestra aleatoria de 20 lotes.
Entre 0,01 y 0,05 (0,0201 exactamente)

Se cree que los sueldos que perciben durante el primer año los ingenieros
recién titulados siguen una distribución normal que tiene una desviación típica
de $2.500. Si se toma una muestra aleatoria de 16 observaciones:
a) Halle la probabilidad de que la desviación típica muestral sea superior a
$3,000.
Algo superior a 0,1 (0,1187 exactamente)
a) Halle la probabilidad de que la desviación típica muestral sea inferior a
$1,500.
Entre 0,01 y 0,05 (0,0118 exactamente)
30
Distribución muestral de la varianza

Ejemplos:
El responsable de calidad de una empresa de electrónica le ha
pedido a usted que cree un proceso de control de calidad para
la fabricación de un mecanismo de control A. La variabilidad de
la resistencia técnica, expresada en ohnios, es fundamental
para este mecanismo. Las normas de fabricación especifican
una desviación típica de 3,6 y la distribución poblacional de las
medidas de la resistencia es normal. El proceso de control
requiere que se obtenga una muestra aleatoria de 6
observaciones de la población de mecanismos y que se calcule
la varianza muestral. Halle un límite superior de la varianza
muestral tal que la probabilidad de que se supere este límite,
dada una desviación típica poblacional de 3,6 que sea inferior a
un α=0,05. 31
Distribución muestral de la varianza

Si la varianza muestral S2, procedente de una muestra


aleatoria de tamaño 6 es superior a 28,69, existen pruebas
contundentes para sospechar que la varianza poblacional
es superior a 12,96 y que hay que detener el proceso de
producción y realizar los debidos ajustes.

32
Distribución muestral de la varianza

El gerente de calidad de una compañía de alimentos congelados


quiere estar seguro de que la variación del peso de las bolsas de
verduras es pequeña, de manera que la empresa no produzca una
elevada proporción de bolsas que tengan un peso inferior al indicado.
Le ha pedido que halle el límite superior e inferior del cociente entre la
varianza muestral y la varianza poblacional de una muestra aleatoria
de 20 observaciones. Los límites son tales que la probabilidad de que
cociente sea inferior al limite inferior es de 0,025 y la probabilidad de
que sea superior al límite superior es de 0,025. Por lo tanto, el 95% de
los cocientes estará entre estos límites. Suponga que la distribución
poblacional es normal.

La varianza muestral se encuentra entre 46,9% y 172,9% de la


varianza poblacional con una probabilidad de 0,95.
33
Distribución muestral para la
relación de dos varianzas

Suponiendo que S2x es la varianza muestral de una muestra


aleatoria de nx observaciones procedentes de una población
que sigue una distribución normal que tiene varianza
poblacional σ2x y S2y es la varianza muestral de una muestra
aleatoria de ny observaciones procedentes de una población
que sigue una distribución normal que tiene varianza
poblacional σ2y , en este caso, la variable aleatoria

34
Distribución muestral para la
relación de dos varianzas

Sigue una distribución conocida con el nombre de F con (nx – 1)


grados de libertad en el numerador y (ny – 1) grados de libertad
en el denominador.

La distribución F, es el cociente entre dos variables aleatorias ji


cuadrado, dividida cada una por sus grados de libertad.

Una distribución F con v1 grados de libertad en el numerados y


v2 grados de libertad en el denominador se representa de la
forma Fv1,v2 Fv1,v2,α que es el numero para el que:

35
Distribución muestral para la
relación de dos varianzas

Ejemplo, los puntos de corte de Fv1,v2,α cuando α es igual a 0,05


y 0,01 para una muestra de 11 observaciones en el numerador y
21 observaciones en el denominador (para el cociente de dos
varianzas poblacionales, se coloca la varianza muestral mayor en el
numerador del estadístico F)

Por lo tanto

36
Estadísticas
Semestre 2-2017

Distribuciones muestrales

También podría gustarte