Está en la página 1de 6

Tarea de R intermedio

Presentar las respuestas en un script de RStudio.


Ejercicio 1. (5 puntos)
Un agricultor encuentra que el peso en kilogramos de una piña es una variable aleatoria
X con función de densidad

f ( x )=k (x 2−10 x+ 25) 0≤ x≤3

a) Hallar k
b) Para una piña elegida al azar, ¿Cuál es la probabilidad que pese menos de 2
kilogramos?
c) Se escoge al azar 3 piñas, ¿Cuál es la probabilidad que al menos dos pesen menos de
2 kilogramos?
Presentar las sentencias del procedimiento.

DESARROLLO
a) Hallar k
b

∫ f ( x ) d ( x ) =1 Una función de densidad es igual a 1


a

∫ k (x 2−10 x+25) d ( x ) =1
0

3
K ∫ ( x 2−10 x +25)d ( x )=1
0

Por otro lado, hallamos la antiderivada de

x3 2
x 2−10 x+ 25 = −5 x + 25 x
3
Aplicamos el TFC
3
x3

0
( 3 )
−5 x 2+ 25 x dx=1/ k

33 2 03 2
[ −5 ¿3 + 25∗3 ] - [ −5 ¿ 0 +25∗0 ] = 1/k
3 3
K = 1/39

b) Para una piña elegida al azar, ¿Cuál es la probabilidad que pese menos de 2
kilogramos?
Rpta: La probabilidad es de 83.75%
SENTENCIAS DEL PROCEDIMIENTO
n=10 #Suponiendo que el número de piñas es 10

f = function(x){
k*(x^2-10*x+25)
}
x = seq(0,3,0.01)
plot(x,f(x),type = "l")

# calcule lo siguiente:
# --------------------
# a) 1 - P(2 <= X <= 3)
a = 2; b = 3
x = seq(0,3,0.01)
plot(x,f(x),type = "l")
lines(a,f(a),type = "h")
lines(b,f(b),type = "h")

# calculo del area bajo la curva


# ------------------------------

area = function(n,a,b){
x = runif(n,a,b)
(b-a)*mean(f(x))
}

Pa = area(1000000,a,b)
Pa
P = 1-Pa
c) Se escoge al azar 3 piñas, ¿Cuál es la probabilidad que al menos dos pesen
menos de 2 kilogramos?

X: Número de piñas que pesan menos de 2 Kilos


SENTENCIA DEL PROCEDIMIENTO:
dbinom(2,3,P)
Rpta: La Probabilidad es de 34.18%
Ejercicio 2. (5 puntos)
Se sabe que una población de esta conformada por tres estratos de tamaño N1 =
4500, N2 = 2700 y N3 = 4800, del cual se desea extraer una muestra de tamaño 400
para estimar la media poblacional, si se conocen las varianzas de cada estrato
σ 12=160, σ 22=600 y σ 32=390. Con la información proporcionada, ¿Cuáles son los
tamaños muestrales que deberíamos extraer de cada estrato?
SENTENCIAS DEL PROCEDIMIENTO
Presentar las sentencias del procedimiento.
#Sean los tamaños poblacionales:
Ni= c(4500,2700,4800) #Donde i=Número de estratos
#Sean las varianzas muestrales:
Si= c(160,600,390) #Donde i=3
#Sea el tamaño de la muestra:
n1=400
#Hallamos los tamaños muestrales para cada estrato
ni=ceiling(Ni*Si/sum(Ni*Si)*n1)
ni
#Para comprobar sumamos el total de tamaños muestrales
tm=sum(ni)
#Respuesta:
#Para el estrato 1 se tomarán 69 muestras.
#Para el estrato 2 se tomarán 154 muestras.
#Para el estrato 3 se tomarán 178 muestras.
Ejercicio 3. (5 puntos)
Se dispone de una muestra de tamaño n de una variable continua x, y se desea
hacer la estimación de la proporción de veces que x es superado por cierto valor
x0=0.5. Si usted decidió hacer la estimación por el método Bootstrap, ¿Cuál sería el
procedimiento que permite la estimación bootstrap? Seleccionar la opción
correcta.
a. n = length(x); xo = 0.5; k = 10000; p = NULL
for(i in 1:k){
rm = sample(1:n,n,replace = T)
xrm = x[rm]
p[i] = length(xrm[xrm > xo])/n}
mean(p)
b. n = length(x); xo = 0.5; p = NULL
for(i in 1:n){
rm = sample(1:n,n,replace = T)
xrm = x[rm]
p[i] = length(xrm[xrm > xo])/n}
mean(p)
c. n = length(x); xo = 0.5; p = NULL
for(i in 1:n){
rm = sample(1:n,n,replace = F)
xrm = x[rm]
p[i] = length(xrm[xrm > xo])/n}
mean(p)
d. n = length(x); xo = 0.5; k = 10000; p = NULL
for(i in 1:k){
rm = sample(1:n,n,replace = T)
xrm = x[rm]
p[i] = length(xrm[xrm < xo])/n}
mean(p)

Ejercicio 4. (5 puntos)
a. Con los datos del archivo datos_tarea.RData contrastar si hay diferencias
significativas entre el promedio del gasto total de la vivienda
correspondientes a ingresos con datos perdidos, y el promedio del gasto
total de la vivienda correspondientes a ingresos con datos no perdidos.
Presentar las sentencias del procedimiento.

Nota de ayuda: La siguiente sentencia muestra una tabla cruzada, donde


TRUE=dato no perdido y FALSE=dato perdido. Las filas representan al Gasto y
las columnas al Ingreso.
table(is.finite(ENAHO15VIV$GASTOVIV),is.finite(ENAHO15VIV$INGRES

OVIV)
SENTENCIAS DEL PROCEDIMIENTO
#Abrimos el archivo
load("C:/Users/fayac/Desktop/datos_tarea.RData")
#Usamos el comando attach para trabajar con los datos
#de ENAHO15VIV por separado y sin problemas
attach(ENAHO15VIV)
#Instalamos la libreria "VIM"
install.packages("VIM")
#Llamamos a la libreria VIM
library(VIM)
#Grafico para realizar el analisis previo
marginplot(ENAHO15VIV[,c("INGRESOSVIV", "GASTOVIV")])
#Creación de una variable binaria llamada "ingresos"
#en reemplazo de la variable "INGRESOSVIV"
#los datos completos (celestes) serán reemplazados por 0
#los datos incompletos (rojos) serán reemplazados por 1
ingresos = INGRESOVIV
ingresos[ingresos >= 0] = 0
ingresos[is.na(ingresos)] <- 1
#Ahora aplicamos el test t para muestras pareadas
#Planteamiento de hipótes:
# Ho: Media1 = Media2 => Media1 - Media2 = 0
# H1: Media1 # Media2
t.test(ingresos,GASTOVIV,alternative = "two.sided",
paired = T,mu=0)
#p-value < 2.2e-16
#Respuesta
#Se rechaza Ho, sí hay diferencias significativas
RESPUESTA:
Sí existen diferencias significativas entre el promedio del gasto total de la
vivienda correspondientes a ingresos con datos perdidos, y el promedio del gasto
total de la vivienda correspondientes a ingresos con datos no perdidos.

También podría gustarte