Está en la página 1de 4

# Curso completo de Estadística Inferencial con R y Python

# 2023-04-30

# _____________________________________

# Tema 1 Muestreo estadístico

# _____________________________________

# 1.1 Tipos de muestreo

# _____________________________________

# 1.1.1 Muestreo aleatorio CON reposición

# Para simular un muestreo de 6 empresas con reposición en una página web de 2000
empresas

# en R, haríamos los siguiente:

set.seed(6)

sample(1:2000, 6, replace = TRUE)

# _____________________________________

# 1.1.2 Muestreo aleatorio SIN reposición

# Para simular un muestreo de 6 empresas con reposición en una página web de 2000
empresas

# en R, haríamos los siguiente:

sample(1:2000, 6, replace = FALSE)

# Consideremos la tabla de datos Forbes que contiene 2000 empresas de 11 columnas

# variables: 2022 ranking, nombre de la organización, industria, país, año de fundación,CEO,


Ingresos (Miles de millones), Ganancias (miles de millones), Valor de mercado (miles de
millones), Total de empleados.

head(Forbes_2000_top_company_CLNQ11)

# Empresas elegidas.

set.seed(10) # set.seed fija la semilla, para que siempre dé la misma muestra.


empresas.elegidas.10.sin = sample(1:2000, 10, replace = FALSE)

muestra.Forbes_2000_top_company_CLNQ11.10.sin =
Forbes_2000_top_company_CLNQ11[empresas.elegidas.10.sin, ]

muestra.Forbes_2000_top_company_CLNQ11.10.sin

# 1.1.4 Muestreo sistemático

set.seed(15) # Primero fijamos para la reproducibilidad del experimento

(primera.empresa = sample(1:2000, 1)) # hallamos la etiqueta de 1ra empresa

incremento = floor(2000/10) # hallamos el incremento que iremos sumando a la 1ra empresa


elegida

empresa.elegidas.10.sis = seq(from = primera.empresa, by = incremento, length.out = 10) #


elegir la empresa

# 1.1.5 Muestreo aleatorio estratificado

# consideramos que la tabla de datos Forbes_2000_top_company_CLNQ11 está estratificada


en 11 columnas.

set.seed(25) # fijamos la semilla de aleatoriedad por reproducibilidad

# hallamos la muestra de las columnas de cada una de las empresas:

Forbes_2000_top_company_CLNQ11

clm.muestra.2022ranking = sample(1:181, 1,replace = FALSE)

clm.muestra.nombre_de_la_organización = sample(182:363, 1,replace = FALSE)

clm.muestra.industria= sample(364:544, 1,replace = FALSE)

clm.muestra.pais = sample(545:725, 1,replace = FALSE)

clm.muestra.año_de_fundacion = sample(726:906, 1,replace = FALSE)

clm.muestra.CEO= sample(907:1087, 1,replace = FALSE)

clm.muestra.ingresos = sample(1088:1268, 1,replace = FALSE)

clm.muestra.ganancias = sample(1269:1449, 1,replace = FALSE)

clm.muestra.activos = sample(1450: 1630, 1,replace = FALSE)

clm.muestra.valor_de_mercado = sample(1631:1811, 1,replace = FALSE)

clm.muestra.total_de_empleados = sample(1812:1992, 1,replace = FALSE)


# seguidamente, la muestra estratificada juntando las 11 columnas de cada empresa

(muestra.Forbes_2000_top_company_CLNQ11.est =
rbind(Forbes_2000_top_company_CLNQ11[clm.muestra.2022ranking,],

Forbes_2000_top_company_CLNQ11[clm.muestra.nombre_de_la_organización,],

Forbes_2000_top_company_CLNQ11[clm.muestra.industria,],

Forbes_2000_top_company_CLNQ11[clm.muestra.pais,],

Forbes_2000_top_company_CLNQ11[clm.muestra.año_de_fundacion, ],

Forbes_2000_top_company_CLNQ11[clm.muestra.CEO, ],

Forbes_2000_top_company_CLNQ11[clm.muestra.ingresos, ],

Forbes_2000_top_company_CLNQ11[clm.muestra.ganancias, ],

Forbes_2000_top_company_CLNQ11[clm.muestra.activos,],

Forbes_2000_top_company_CLNQ11[clm.muestra.valor_de_mercado,],

Forbes_2000_top_company_CLNQ11[clm.muestra.total_de_empleados,] ))

# 1.1.6 Muestreo por conglomerados

# Consideremos la tabla Forbes del paquete faraway. Esta tabla de datos nos

# da información sobre 2000 empresas

# install.packages("faraway")

library(faraway)

head(Forbes_2000_top_company_CLNQ11)

# 1.1.6 Muestreo por conglomerados

# Consideremos la tabla Forbes del paquete faraway. Esta tabla de datos nos

# da información sobre 2000 empresa

# calcular una muestra de tamaño indeterminado de las empresas por conglomerados

# eligiendo como conglomerados las empresas (2000)

set.seed(19)

números.empresas.elegidas = sample(1:2000,10,replace = FALSE)


empresas.elegidas = unique(Forbes_2000_top_company_CLNQ11$`2022 Ranking,Organization
Name,Industry,Country,Year Founded,CEO,Revenue (Billions),Profits (Billions),Assets
(Billions),Market Value (Billions),Total Employees`)[números.empresas.elegidas]

empresas.elegidas # Las empresas elegidas son

# La muestra elegida está formada por empresas:

muestra.Forbes_2000_top_company_CLNQ11.con =
Forbes_2000_top_company_CLNQ11[Forbes_2000_top_company_CLNQ11$`2022
Ranking,Organization Name,Industry,Country,Year Founded,CEO,Revenue (Billions),Profits
(Billions),Assets (Billions),Market Value (Billions),Total Employees`%in%empresas.elegidas,]

head(muestra.Forbes_2000_top_company_CLNQ11.con, 10)

También podría gustarte