Está en la página 1de 6

Laboratorio 7-8, Probabilidad y Estadística, IN1062C

Semana 01/06 – 08/06 de 2018 Preparó: Prof. Rosamel Sáez Espinoza


n
En este laboratorio se trabajará con distribuciones muestrales para X
i 1
i y X suma y

media de una muestra aleatoria de tamaño n, usando como software de apoyo R.


Como ya indicamos en clases, la distribución muestral no es más que la distribución de
probabilidad de cualquier estadístico (medida muestral basada en una muestra aleatoria)
que se obtiene por muestreo repetido. La tabla de frecuencia y el histograma son buenos
indicadores para darse cuenta en forma aproximada cual podría ser la distribución teórica
y después mediante un test de bondad de ajuste se puede contrastar si dicha distribución
supuesta es o no correcta.
Actividad: Generación de muestras aleatorias y determinación aproximada de la
n
distribución muestral para X
i 1
i y X , aproximada ya que no podremos trabajar con todas

las muestras posibles.

Paso 1: Abrir el programa R, para ello hacemos clic en el icono , hecho esto aparece la
consola de R

Paso2: Cargar la aplicación Rcmdr, que nos permitirá trabajar en R usando una plataforma
de menú. Para ello siga la siguiente secuencia:
Hacer clic sobre la opción Paquete  Cargar  buscar Rcmdr  ok y esperar que aparezca
la siguiente pantalla.
Paso 3: Vamos a generar 1000 muestras de tamaño 50 de una población distribuida normal
con media 120 y desviación estándar 20, para ello seguimos la siguiente secuencia:

Luego en la siguiente pantalla damos los valores para lo que queremos:

El nombre de nuestro archivo con las 1000 será NormalSamples, que puede ver en el icono
Visualizar conjunto de datos en la pantalla de Rcmdr.
Paso 4: En la última columna del archivo NormalSample, podemos visualizar que esta
contiene 1000 medias muestrales cada una basada en 50 observaciones. En el proceso de
estimación puntual para el parámetro  , media de la población, sólo una de ellas será
usada en este proceso ¿qué tan alejado estará del verdadero valor? Las probabilidades nos
dan la respuesta.
Paso 5: Comenzaremos realizando un histograma con cualquiera de las observaciones y
para la media, consideremos por ejemplo la observación 25 y además el histograma para la
variable media. Haremos los dos gráficos en la misma hoja .
Antes de hacer el histograma, en la hoja R Script de Rcmdr escriba la siguiente instrucción:
par(mfrow = c(1,2)), esta prepara la hoja para recibir dos gráficos, (una fila dos columnas).
Para ejecutar la instrucción marque el rango y luego haga clic sobre ejecutar, luego siga los
siguientes comandos:
gráfico  histograma  en datos marque obs25  opciones  Densidad y ACEPTAR
Ahora sobrepondremos la curva normal en ambos histogramas, para ello en el R Script de
R escriba lo siguiente y luego ejecute.
curve(dnorm(x,mean=mean(NormalSamples$obs25),sd=sd(NormalSamples$obs25)), xlim
= c(60,190),add=TRUE, col="red", lwd=2)
Realice ahora el histograma con la variable mean
Ahora sobrepondremos la curva normal en ambos histogramas, para ello en el R Script de
R escriba lo siguiente y luego ejecute.
curve(dnorm(x,mean=mean(NormalSamples$mean),sd=sd(NormalSamples$mean)), xlim =
c(110,130),add=TRUE, col="red", lwd=2).
0.14
0.020

0.12
0.015

0.10
0.08
density

density
0.010

0.06
0.04
0.005

0.02
0.000

0.00

60 100 140 180 110 120 130

obs25 mean

De la gráfica ¿Podemos observar que ambas variables siguen una distribución Normal?
Además de observar el gráfico, hacer un Q-Q plot o un P-P plot, también existe una manera
formal, una prueba de bondad de ajuste, para ello debemos contrastar una hipótesis acerca
de la distribución de la población generadora de los datos.
En R contamos con la aplicación rriskDistributions para realizar la prueba de bondad de ajuste,
para ello siga los siguientes pasos:

En Rcmdr vaya a Herramientas  cargar paquetes  buscar en el listado rriskDistributions


Aceptar

Por ahora este paquete sirve para estudiar las siguientes distribuciones Normal, Logística, Uniforme,
Gamma, Lognormal, Weibull, Cauchy, Exponencial, Chi-cuadrado, F y T-Student.

Para este primer desarrollo contrastaremos la hipótesis:

H0: La población generadora de los datos sigue distribución Normal

H1: La población generadora de los datos no sigue distribución Normal


Para este contraste siga los siguientes pasos:

En la pantalla R Sript escriba lo siguiente para estudiar si la obs25 viene de una población distribuida
normal: ajuste<- fit.cont(NormalSamples$obs25) , la salida de esta instrucción es

Al hacer clic sobre ok, nos entrega la siguiente salida

Paso 6: Repita lo mismo para la columna de las medias: ajusteMed<-


fit.cont(NormalSamples$mean).

Paso 7: Generar 1000 muestras de tamaño 50 de una población distribuida normal con
media 120 y desviación estándar 20, añadiendo al conjunto de datos la suma de cada
muestra:
Paso 8: Para verificar si la variable suma, basada en las 1000 muestras aleatorias sigue
distribución normal seguimos la siguiente secuencia:
En Rcmdr vaya a Herramientas  cargar paquetes  buscar en el listado rriskDistributions
Aceptar.

Recuerde que la hipótesis a contrastar es:

H0: La población de sumas muestrales sigue distribución Normal

H1: La población de sumas muestrales no sigue distribución Normal

Para este contraste siga los siguientes pasos:

En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(NormalSamples$sum) , la salida de esta instrucción es

Paso 9: Generar 1000 muestras de tamaño 80 de una población distribuida exponencial con
media 2.5, añadiendo al conjunto de datos la media de cada muestra:
Paso 10: Verificar si la variable media, basada en las 1000 muestras aleatorias sigue
distribución aproximadamente normal
La hipótesis a contrastar es:
H0: La población de medias muestrales sigue distribución Normal

H1: La población de medias muestrales no sigue distribución Normal


Para este contraste siga los siguientes pasos:

En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(ExponentialSamples$mean) .

Paso 11: Generar 1000 muestras de tamaño 40 de una población distribuida Binomial con
parámetro 0.3, añadiendo al conjunto de datos la media de cada muestra:
Paso 12: Verificar si la variable media, basada en las 1000 muestras aleatorias sigue
distribución aproximadamente normal
La hipótesis a contrastar es:
H0: La población de medias muestrales sigue distribución Normal

H1: La población de medias muestrales no sigue distribución Normal

Para este contraste siga los siguientes pasos:

En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(BinomialSamples$mean) .

También podría gustarte