Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paso 1: Abrir el programa R, para ello hacemos clic en el icono , hecho esto aparece la
consola de R
Paso2: Cargar la aplicación Rcmdr, que nos permitirá trabajar en R usando una plataforma
de menú. Para ello siga la siguiente secuencia:
Hacer clic sobre la opción Paquete Cargar buscar Rcmdr ok y esperar que aparezca
la siguiente pantalla.
Paso 3: Vamos a generar 1000 muestras de tamaño 50 de una población distribuida normal
con media 120 y desviación estándar 20, para ello seguimos la siguiente secuencia:
El nombre de nuestro archivo con las 1000 será NormalSamples, que puede ver en el icono
Visualizar conjunto de datos en la pantalla de Rcmdr.
Paso 4: En la última columna del archivo NormalSample, podemos visualizar que esta
contiene 1000 medias muestrales cada una basada en 50 observaciones. En el proceso de
estimación puntual para el parámetro , media de la población, sólo una de ellas será
usada en este proceso ¿qué tan alejado estará del verdadero valor? Las probabilidades nos
dan la respuesta.
Paso 5: Comenzaremos realizando un histograma con cualquiera de las observaciones y
para la media, consideremos por ejemplo la observación 25 y además el histograma para la
variable media. Haremos los dos gráficos en la misma hoja .
Antes de hacer el histograma, en la hoja R Script de Rcmdr escriba la siguiente instrucción:
par(mfrow = c(1,2)), esta prepara la hoja para recibir dos gráficos, (una fila dos columnas).
Para ejecutar la instrucción marque el rango y luego haga clic sobre ejecutar, luego siga los
siguientes comandos:
gráfico histograma en datos marque obs25 opciones Densidad y ACEPTAR
Ahora sobrepondremos la curva normal en ambos histogramas, para ello en el R Script de
R escriba lo siguiente y luego ejecute.
curve(dnorm(x,mean=mean(NormalSamples$obs25),sd=sd(NormalSamples$obs25)), xlim
= c(60,190),add=TRUE, col="red", lwd=2)
Realice ahora el histograma con la variable mean
Ahora sobrepondremos la curva normal en ambos histogramas, para ello en el R Script de
R escriba lo siguiente y luego ejecute.
curve(dnorm(x,mean=mean(NormalSamples$mean),sd=sd(NormalSamples$mean)), xlim =
c(110,130),add=TRUE, col="red", lwd=2).
0.14
0.020
0.12
0.015
0.10
0.08
density
density
0.010
0.06
0.04
0.005
0.02
0.000
0.00
obs25 mean
De la gráfica ¿Podemos observar que ambas variables siguen una distribución Normal?
Además de observar el gráfico, hacer un Q-Q plot o un P-P plot, también existe una manera
formal, una prueba de bondad de ajuste, para ello debemos contrastar una hipótesis acerca
de la distribución de la población generadora de los datos.
En R contamos con la aplicación rriskDistributions para realizar la prueba de bondad de ajuste,
para ello siga los siguientes pasos:
Por ahora este paquete sirve para estudiar las siguientes distribuciones Normal, Logística, Uniforme,
Gamma, Lognormal, Weibull, Cauchy, Exponencial, Chi-cuadrado, F y T-Student.
En la pantalla R Sript escriba lo siguiente para estudiar si la obs25 viene de una población distribuida
normal: ajuste<- fit.cont(NormalSamples$obs25) , la salida de esta instrucción es
Paso 7: Generar 1000 muestras de tamaño 50 de una población distribuida normal con
media 120 y desviación estándar 20, añadiendo al conjunto de datos la suma de cada
muestra:
Paso 8: Para verificar si la variable suma, basada en las 1000 muestras aleatorias sigue
distribución normal seguimos la siguiente secuencia:
En Rcmdr vaya a Herramientas cargar paquetes buscar en el listado rriskDistributions
Aceptar.
En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(NormalSamples$sum) , la salida de esta instrucción es
Paso 9: Generar 1000 muestras de tamaño 80 de una población distribuida exponencial con
media 2.5, añadiendo al conjunto de datos la media de cada muestra:
Paso 10: Verificar si la variable media, basada en las 1000 muestras aleatorias sigue
distribución aproximadamente normal
La hipótesis a contrastar es:
H0: La población de medias muestrales sigue distribución Normal
En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(ExponentialSamples$mean) .
Paso 11: Generar 1000 muestras de tamaño 40 de una población distribuida Binomial con
parámetro 0.3, añadiendo al conjunto de datos la media de cada muestra:
Paso 12: Verificar si la variable media, basada en las 1000 muestras aleatorias sigue
distribución aproximadamente normal
La hipótesis a contrastar es:
H0: La población de medias muestrales sigue distribución Normal
En la pantalla R Sript escriba lo siguiente para estudiar si la variable suma viene de una población
distribuida normal: ajuste<- fit.cont(BinomialSamples$mean) .