Está en la página 1de 30

Estadística II / Funciones Variables Aleatorias.

Distribuciones Muestrales

Muestreo Aleatorio Población Muestra

Herramientas Estadísticas

Mediana Muestral Media Muestral Moda

k
 n 1,2,3,4,4,4,5,6,7
x= (n  1) / 2 ; n es impar
 xi  xi * fi
(n / 2)  ((n / 2)  1) ; n es par

x= x  i 1 x  i 1
2 n n
Variancia Muestral
Variancia Muestral Media Poblacional
(Datos agrupados)
n n n 2
 k 
 ( xi  x ) n*  ( xi )
2 k
xi2 x1  x2  ...  x N  xi
2
n *  xi * fi    xi * fi 
2
   
S 2  i 1 S2  i 1 i 1 S2  i 1  i 1  N N
n 1 n * (n  1) n * (n  1)

Desviación estándar muestral (S)


Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribuciones Muestrales

Ejemplo: El número de respuestas incorrectas en una prueba de


competencia de falso o verdadero para una muestra aleatoria de 15
estudiantes fueron los siguientes: 2,1,3,0,1,3,6,0,3,3,5,2,1,4 y 2. Encuentre: a)
la media, b) la mediana c) la moda, d) varianza y desviación estándar.
Ordenar datos: 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6
k
 xi * fi (0 * 2)  (1* 3)  (2 * 3)  (3 * 4)  (4 *1)  (5 *1)  (6 *1)
a) x  i 1 x  2.4
n 15
b) (n  1) / 2 es impar x(15+1)/2 = x8 = 2
x f x2 x2 *f x*f
c) 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6
0 2 0 0 0
2 1 3 1 3 3
k  k 
n* xi2 * fi   i i 
x * f 2 3 4 12 6

d) 2
S  i 1  i 1 
3 4 9 36 12
n * (n  1)
2 4 1 16 16 4
2 (15*128)  (36)
S   2.9714 5 1 25 25 5
15* (15  1)
6 1 36 36 6
e) S = 1.7237  15 91 128 36 Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribuciones Muestrales
Ejemplo: Los periodos de tiempo, en minutos, que 10 pacientes esperaron
en un consultorio médico antes de recibir tratamiento fueron: 5, 11, 9, 5, 10,
15, 6, 10, 5, y 10. Tratando los datos como una muestra aleatoria, encuentre.
a) la media, b) la mediana c) la moda, d) varianza y desviación estándar.
Ordenar datos: 5,5,5,6,9,10,10,10,11,15
k
 xi * fi (5 * 3)  (6 *1)  (9 *1)  (10 * 3)  (11*1)  (15 *1)  (6 *1)
a) x  i 1 x  8.6 min .
n 10
x x2
b) (n / 2)  ((n / 2)  1) es impar 5 25
2 [x(5)+X(5+1)]/2 = (9+10)/2 = 9.5 5 25
5 25

c) 5,5,5,6,9,10,10,10,11,15 6 36

n n 9 81

n *  xi2  ( xi ) 2 10 100
d) S 2  i 1 i 1 10 100
n * (n  1) 10 100
(10 * 838)  7396 11 121
S2   10.93
10 * (10  1) 15 225

e) S = 3.30  86 838 Ing. Deny González


Estadística II / Estimación Estadística.

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO


Estimador

Un estimador de un parámetro poblacional es una función de los datos


muestrales. En pocas palabras, es una fórmula que depende de los valores
obtenidos de una muestra, para realizar estimaciones.
Por ejemplo, un estimador de la media poblacional, μ, sería la media
muestral, , según la siguiente fórmula:

Donde (x1, x2, ..., xn) sería el conjunto de datos de la muestra.

El estimador es una variable aleatoria que asigna a cada valor de la función


su probabilidad de aparición, esto es, la probabilidad de la muestra de la que
se extrae.
Ing. Deny González
Estadística II / Estimación Estadística.

POBLACION Y MUESTREO

MUESTREO PROBABILISTICO

Los métodos de muestreo probabilísticos son aquellos que se basan


en el principio de equiprobabilidad. Es decir, aquellos en los que todos
los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser
seleccionadas.

TIPOS MUESTREOS PROBABILISTICOS


Muestreo aleatorio simple
Muestreo aleatorio sistematico
Muestreo aleatorio estratificado
Ing. Deny González
Estadística II / Estimación Estadística.

POBLACION Y MUESTREO

MUESTREO NO PROBABILISTICO
En este tipo de muestreo, puede haber clara influencia de la persona o personas
que seleccionan la muestra o simplemente se realiza atendiendo a razones de
comodidad. Salvo en situaciones muy concretas en la que los errores cometidos no
son grandes, debido a la homogeneidad de la población, en general no es un tipo de
muestreo riguroso y científico, dado que no todos los elementos de la población
pueden formar parte de la muestra

TIPOS DE MUESTREO NO PROBABILISTICOS

Muestreo por cuotas


Muestreo intencional o por conveniencia
Bola de nieve.
Ing. Deny González
Estadística II / Estimación Estadística.

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO

En la estadística tiene un papel destacado la noción de MUESTRA ALEATORIA.

Una muestra aleatoria de tamaño n es:

Una colección de n variables aleatorias.


Todas con la misma distribución.
Todas independientes.
Esta definición idealiza la operación de repetir n veces la observación de la misma variable
aleatoria, siendo las repeticiones independientes una de otra.

La colección de donde extraemos la muestra aleatoria, se denomina POBLACIÓN. Nuestra


intención al tomar una muestra, es la de hacer INFERENCIA. Este término lo usamos en
estadística para denotar al procedimiento con el que hacemos afirmaciones acerca de
valores generales de la población mediante los números que observamos en la muestra.
Ing. Deny González
Estadística II / Estimación Estadística.

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO

Suponga que observamos el proceso de fabricación de las ``bolitas'' que se le ponen al


envase de los desodorantes ``roll on''. No todas las bolitas van a tener el mismo diámetro, si
escogemos, al azar una bolita, tendremos un valor para el diámetro que es una variable
aleatoria. Podemos suponer que los diámetros tienen la distribución normal, debido a
nuestra experiencia con el proceso, conocemos que la desviación estándar de la población
es de 4 mm (aproximadamente). Pero, también por experiencia, sabemos que el diámetro
promedio puede variar por desajuste de la maquinaria productora. De modo que tenemos:

una POBLACIÓN, que son todas las bolitas que se producen.


un PARÁMETRO de la población conocido (o casi) que es la desviación estándar.
otro PARÁMETRO cuyo valor es desconocido: la media .

Ing. Deny González


Estadística II / Estimación Estadística.

ESTIMACION DE TAMAÑO DE MUESTREO


Si la población es finita, es decir conocemos el total de la población y deseásemos
saber cuántos del total tendremos que estudiar la respuesta seria:

Donde:
N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
Fuente:https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
Ing. Deny González
Estadística II / Estimación Estadística.

ESTIMACION DE TAMAÑO DE MUESTREO

¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes


para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor
p = 0.5 (50%) que maximiza el tamaño muestral.

Donde:
N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
Fuente:https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
Ing. Deny González
Estadística II / Estimación Estadística.

ESTIMACION DE TAMAÑO DE MUESTREO

Si la población es finita, también podemos aplicar la siguiente ecuación

Donde
S2 varianza de la poblacion

Según diferentes seguridades el coeficiente de Za varía, así:

Si la seguridad Za fuese del 90% el coeficiente sería 1.645


Si la seguridad Za fuese del 95% el coeficiente sería 1.96
Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24
Si la seguridad Za fuese del 99% el coeficiente sería 2.576 Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribución Muestrales de media (Teorema de Limite Central)


Supóngase que una muestra aleatoria de n observaciones se toma de una población
normal con media  y variancia 2. Cada observación de la muestra aleatoria tiene la
misma distribución normal, por lo que,
X 1  X 2  ...  X n
X
n
Tiene una distribución normal con media
    ...  
x  
n
 2
Y variancia:  x2 
n
La suma de una gran numero de variables aleatorias idénticas e independientes n cada
una de ellas con media poblacional  y variancia finita 2 tiene una función de
densidad de probabilidad igual a:
x
Z

n
La aproximación normal para x generalmente será buena si n > 30.
Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribución Muestrales de media (Teorema de Limite Central)

Ejemplo: Una compañía fabrica focos que tiene un periodo de vida que esta
distribuido aproximadamente en forma normal, con media igual a 800 horas y
una desviación estándar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 focos tenga una vida promedio de menos de 775
horas.
La distribución muestral de X será aproximadamente normal con  = 800.
Correspondiendo a x = 775.

775  800
Z  2.5
40
16
Y por lo tanto, P(X < 775) = P(Z<-2.5), por tabla
P(X < 775) = 0.0062

775 800

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Muestrales de media (Teorema de Limite Central)

Ejemplo: supongamos que se sabe que el peso de los sujetos de una


determinada población sigue una distribución aproximadamente normal,
con una media de 80 kg y una desviación estándar de 10 kg. ¿Podremos
saber cual es la probabilidad de que una persona, elegida al azar, tenga
un peso superior a 100 kg?

Datos:  = 80 kg / x = 100 /  = 10 kg / n = 1.

100  80
Z 2
10
1
Y por lo tanto, como el área total bajo la curva es igual a 1, se puede deducir que:

P(X > 100) = 1- P(Z<2), por tabla


P(X > 100) = 1-0.9772 = 0.0228

Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de


eso población tenga un peso mayor de 100 Kg , es de aproximadamente de un 2.3%
Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribución Muestrales de media


Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones
discretas o continuas, con medias 1 y 2 y variancias 21 y 22, respectivamente,
entonces la distribución muestral de la diferencia de medias X1 y X2, esta distribuida
aproximadamente en forma normal con media y variancias:

 x1  x2  1   2
12  22
 2
x1  x2  
n1 n2
De aquí que,
( x1  x2 )  ( 1   2 )
Z
  12    22 
  
 n1   n2 
   

Es aproximadamente una variable normal estándar.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Muestrales de media


Ejemplo: Una muestra de tamaño n1=5 se saca aleatoriamente de una población que
esta normalmente distribuida con media 1=50 y variancia 21 = 9 y se registra la media
muestral x1. Una segunda muestra aleatoria de tamaño n2=4 se selecciona,
independiente de la primera muestra, de una población diferente que también esta
normalmente distribuida, con media 2 = 40 y variancia 22, = 4 y se registra la media
muestral x2. Encuentre P(X1-X2 < 8.2).

Se sabe que la distribución es normal con media:  x1  x2  1  2  50  40  10


12  22 9 4
 2
x1  x2      2.8
n1 n2 5 4
De aquí que,
8.2  10
Z  1.08
2.8

P(X1- X2 < 8.2) = P(Z<-1.08)


= 0.1401
Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Si la seguridad Za fuese del 95% el coeficiente sería 1.96


Si la seguridad Za fuese del 99% el coeficiente sería 2.576

a)

b)

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

EJERCICIOS PROPUESTOS

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

EJERCICIOS PROPUESTOS

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Chi cuadrado


Si s2 es la varianza es la varianza de una muestra aleatoria de tamaño n tomada de una
población normal cuya variancia es , entonces,

(n  1) * s 2
 
2
2

Es un valor de una variable aleatoria que tiene la distribución chi-cuadrada con


parámetro v=n-1.

V es denominado número de grados de libertad.

Observación: A diferencia de la distribución t, es necesario tabular los valores de 2


para  > 0.5, porque la distribución chi cuadrada no es simétrica.

La probabilidad de que una muestra aleatoria produzca un valor chi cuadrado mas
grande que cualquier valor especificado es igual al área bajo la curva a la derecha de
este valor.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Chi cuadrado


Para utilizar una prueba de hipótesis chi cuadrada, debemos tener un tamaño de
muestra lo suficientemente grande para garantizar la similitud entre la distribución
teórica correcta y nuestra distribución de muestreo de x2, estadística chi cuadrada.
Cuando las frecuencias esperadas son muy pequeñas el valor de x2 estará
sobrestimado y se tendrá como resultado demasiados rechazos de la hipótesis nula,
para evitar incurrir en inferencias incorrectas de la prueba de hipótesis chi cuadrada.
Siga la regla general que dice que una frecuencia esperada de menos de cinco en una
celda de una tabla de contingencia es demasiado pequeña para utilizarse.

GRAFICA DISTRIBUCION JI CUADRADA PARA V= 2, 5, Y 10 GRADOS DE LIBERTAD

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Chi cuadrado


Ejemplo: Un fabricante de baterías para automóvil garantiza que sus baterías
duraran, un promedio, 3 años con una desviación estándar de un año. Si 5 de
estas tienen desviaciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿ Esta el fabricante
convencido aún de que sus baterías tienen una desviación estándar de 1año?

Solución: S2 = 0.815, 2 = 1 y n = 5

(5  1) * 0.815
2   3.26
1

v = N-1 = 4, El valor mas cercano a 3.26 que se encuentra en la tabla es 2.195 y


3.357 y sus probabilidades son 0.7 y 0.5, lo que significa que la probabilidad es
alta, el fabricante no tiene razón para sospechar que la  es diferente de 1.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución Chi cuadrado


Ejemplo: Suponga que el espesor de un componente de un semiconductor es
una dimensión crítica. El proceso de producción de tal característica se
distribuye normalmente con una desviación estándar de 0.6 milésimas de
pulgada. Para controlar el proceso se toman muestras periódicas de veinte
piezas, y se define un límite de control con base en una probabilidad de 0.01 de
que la varianza muestral exceda dicho límite, si el proceso está bajo control.
Qué se puede concluir si para una muestra dada la desviación estándar es 0.84
milésimas de pulgada?
Solución: S = 0.84, = 0.6 y n = 20. Por tabla = 36.19

(19) * 0.842
 
2
2
 37.24
0.6
Por lo tanto el criterio de decisión se puede expresar en una de las dos formas
siguientes:
a) Como X2 = 37.24 > 36.19 la muestra no proviene de un proceso con una
desviación estándar de 0.60.
b) Se calcula S2 = 0.842 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma
conclusión de que no es probable que la muestra tomada provenga de una
población con una desviación estándar de 0.60 milésimas de pulgada.Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribución t
Para valores pequeños de n a menos de que supongamos que la muestra proviene de
una población normal. Bajo esta condición,

Si x es la media de una muestra aleatoria de tamaño n tomada de una población


normal que tiene media  y variancia 2 , entonces

x
t
s
n
Es el valor de una variable aleatoria con distribución t y parámetro v=n-1.

La forma global de la distribución t es similar a la de una distribución normal (ambas


tienen forma de campana y son simétricas con respecto al origen).

No es necesario tabular los valores de t para  > 0.50, pues por la simetría de la
distribución t1-  = - t. Por lo tanto, el valor de t corresponde al área de la cola situada a
la izquierda de  es - t .

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución t

Ejemplo: Un fabricante de fusibles asegura que con una sobrecarga del 20%,
sus fusibles se fundirán al cabo de 12.4 min en promedio. Para probar esta
afirmación una muestra de 20 fusibles fue sometida a una sobre carga de un
20% y los tiempos que tardaron en fundirse tuvieron una media de 10.63 min y la
desviación estándar de 2.48 min. Si se supone que los datos constituyen una
muestra aleatoria de una población normal. ¿ Se tiende a apoyar o a refutar la
afirmación del fabricante?.

Solución: S = 2.48, n = 20,  = 12.4, x = 10.63

10.63  12.4
t  3.19
2.48
20

v = N-1 = 19, El valor mas cercano a 3.19 es 2.81 y su probabilidad es 0.005 baja,
por lo tanto los datos tienden a refutar la afirmación del fabricante.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución t
Ejemplo: En un recorrido de prueba de una hora cada uno, el consumo promedio de gasolina de un
motor fue 16.4 galones, con una desviación estándar de 2.1 galones. Se quiere saber si es cierta la
afirmación de que "el consumo promedio de gasolina es 12 galones/hora".
Solución: S = 2.1, n = 16,  = 12, x = 16.4

Para responder la pregunta debemos verificar que tan probable es que una muestra de 16.4 galones
pertenezca a una distribución con una media de 12. Por lo tanto, debemos calcular la probabilidad de
que la media muestral sea mayor o igual que 16.4 si la verdadera media de donde proviene dicha
muestra es 12 galones. Esto es:

x 16.4  12
t t  8.38
s 2.1
n 16

Buscando en la tabla de la distribución t con 15 grados de libertad, tenemos que para una
probabilidad de 0.005 el respectivo valor de t es 2.947, lo cual implica que la probabilidad para t = 8.38
es cero). Por lo tanto, concluimos que la probabilidad de obtener una muestra con una media de 16.4
de una población cuya media es 12.0 es cero, es decir, que "el consumo promedio de gasolina no es
12 galones/hora", sino que es superior.

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución t
Ejemplo: El valor de t con v= 14 grados de libertad que tiene un área de 0.025 a la izquierda, y por lo
tanto un area de 0.975 a la derecha, es:

Solución: t0.975 = - t0.025 = - 2.145

Ejemplo: Encuentre P(-t0.025 < T < - t0.05 ).

Solución:

Area a la derecha 0.05


Area a la izquierda 0.0025
Area total = 1- 0.05 - 0.025 = 0.925

Ing. Deny González


Estadística II / Funciones Variables Aleatorias.

Distribución f
Se define como la relación de dos variables aleatorias chi cuadrada independientes,
cada una dividida por su numero de grados de libertad. De aquí que puede escribirse:
U
v
f  1
V
v2
Donde U y V son variables aleatorias independientes que tiene una distribución chi
cuadrada con v1 y v2 grados de libertad, respectivamente.

Teorema 1. Si se escribe f (v1,v2 ) para f  con v1 y v2 grados de libertad, se obtiene

1
f1 (v1, v2 ) 
f (v2 , v1 )

Teorema 2. Si S21 y S22 son las variancias de variables aleatorias independientes de


tamaños n1 y n2 que se sacan de poblaciones normales con variancias de 21 y 22,
respectivamente, entonces,
 22 * S12
F
12 * S 22
Tiene una distribución F con v1= n1-1 y v2=n2-1 grados de libertad. Ing. Deny González
Estadística II / Funciones Variables Aleatorias.

Distribución f
Ejemplo 1: Si dos muestras aleatorias independientes de tamaño n1= 7 y n2=13
se toman de una población normal, ¿Cuál es la probabilidad de que la variancia
de la primera sea al menos tres veces mas grande que la de la segunda?

Solución: Por tabla para v1=7-1=6 y v2=13-1=12 (se intercepta) y encontramos


que f0.05= 3 por lo tanto, la probabilidad deseada es 0.05.

Otra forma de verlo


 22 * S12 3S 22
S12=3S22 F  3 , busca en tabla y la probabilidad es 0.05
12 * S 22 S 22
12= 22

Ejemplo 2: Encuéntrese el valor de F0.95 para v1=10 y v2=20 grados de liberad

1 1
f1 (v1, v2 )    0.36
f 0.05 (20,10) 2.77

Ing. Deny González

También podría gustarte