2000 Empres As

# Curso completo de Estadística Inferencial con R y Python
# 2023-04-30
# _____________________________________
# Tema 1 Muestreo estadístico
# _____________________________________
# 1.1 Tipos de muestreo
# _____________________________________
# 1.1.1 Muestreo aleatorio CON reposición
# Para simular un muestreo de 6 empresas con reposición en una página web de 2000
empresas
# en R, haríamos los siguiente:
set.seed(6)
sample(1:2000, 6, replace = TRUE)
# _____________________________________
# 1.1.2 Muestreo aleatorio SIN reposición
# Para simular un muestreo de 6 empresas con reposición en una página web de 2000
empresas
# en R, haríamos los siguiente:
sample(1:2000, 6, replace = FALSE)
# Consideremos la tabla de datos Forbes que contiene 2000 empresas de 11 columnas
# variables: 2022 ranking, nombre de la organización, industria, país, año de fundación,CEO,

Ingresos (Miles de millones), Ganancias (miles de millones), Valor de mercado (miles de
millones), Total de empleados.
head(Forbes_2000_top_company_CLNQ11)
# Empresas elegidas.
set.seed(10) # set.seed fija la semilla, para que siempre dé la misma muestra.

empresas.elegidas.10.sin = sample(1:2000, 10, replace = FALSE)
muestra.Forbes_2000_top_company_CLNQ11.10.sin =
Forbes_2000_top_company_CLNQ11[empresas.elegidas.10.sin, ]
muestra.Forbes_2000_top_company_CLNQ11.10.sin
# 1.1.4 Muestreo sistemático
set.seed(15) # Primero fijamos para la reproducibilidad del experimento
(primera.empresa = sample(1:2000, 1)) # hallamos la etiqueta de 1ra empresa
incremento = floor(2000/10) # hallamos el incremento que iremos sumando a la 1ra empresa

elegida
empresa.elegidas.10.sis = seq(from = primera.empresa, by = incremento, length.out = 10) #

elegir la empresa
# 1.1.5 Muestreo aleatorio estratificado
# consideramos que la tabla de datos Forbes_2000_top_company_CLNQ11 está estratificada

en 11 columnas.
set.seed(25) # fijamos la semilla de aleatoriedad por reproducibilidad
# hallamos la muestra de las columnas de cada una de las empresas:
Forbes_2000_top_company_CLNQ11
clm.muestra.2022ranking = sample(1:181, 1,replace = FALSE)
clm.muestra.nombre_de_la_organización = sample(182:363, 1,replace = FALSE)
clm.muestra.industria= sample(364:544, 1,replace = FALSE)
clm.muestra.pais = sample(545:725, 1,replace = FALSE)
clm.muestra.año_de_fundacion = sample(726:906, 1,replace = FALSE)
clm.muestra.CEO= sample(907:1087, 1,replace = FALSE)
clm.muestra.ingresos = sample(1088:1268, 1,replace = FALSE)
clm.muestra.ganancias = sample(1269:1449, 1,replace = FALSE)
clm.muestra.activos = sample(1450: 1630, 1,replace = FALSE)
clm.muestra.valor_de_mercado = sample(1631:1811, 1,replace = FALSE)
clm.muestra.total_de_empleados = sample(1812:1992, 1,replace = FALSE)

# seguidamente, la muestra estratificada juntando las 11 columnas de cada empresa
(muestra.Forbes_2000_top_company_CLNQ11.est =
rbind(Forbes_2000_top_company_CLNQ11[clm.muestra.2022ranking,],
Forbes_2000_top_company_CLNQ11[clm.muestra.nombre_de_la_organización,],
Forbes_2000_top_company_CLNQ11[clm.muestra.industria,],
Forbes_2000_top_company_CLNQ11[clm.muestra.pais,],
Forbes_2000_top_company_CLNQ11[clm.muestra.año_de_fundacion, ],
Forbes_2000_top_company_CLNQ11[clm.muestra.CEO, ],
Forbes_2000_top_company_CLNQ11[clm.muestra.ingresos, ],
Forbes_2000_top_company_CLNQ11[clm.muestra.ganancias, ],
Forbes_2000_top_company_CLNQ11[clm.muestra.activos,],
Forbes_2000_top_company_CLNQ11[clm.muestra.valor_de_mercado,],
Forbes_2000_top_company_CLNQ11[clm.muestra.total_de_empleados,] ))
# 1.1.6 Muestreo por conglomerados
# Consideremos la tabla Forbes del paquete faraway. Esta tabla de datos nos
# da información sobre 2000 empresas
# install.packages("faraway")
library(faraway)
head(Forbes_2000_top_company_CLNQ11)
# 1.1.6 Muestreo por conglomerados
# Consideremos la tabla Forbes del paquete faraway. Esta tabla de datos nos
# da información sobre 2000 empresa
# calcular una muestra de tamaño indeterminado de las empresas por conglomerados
# eligiendo como conglomerados las empresas (2000)
set.seed(19)
números.empresas.elegidas = sample(1:2000,10,replace = FALSE)

empresas.elegidas = unique(Forbes_2000_top_company_CLNQ11$`2022 Ranking,Organization
Name,Industry,Country,Year Founded,CEO,Revenue (Billions),Profits (Billions),Assets
(Billions),Market Value (Billions),Total Employees`)[números.empresas.elegidas]
empresas.elegidas # Las empresas elegidas son
# La muestra elegida está formada por empresas:
muestra.Forbes_2000_top_company_CLNQ11.con =
Forbes_2000_top_company_CLNQ11[Forbes_2000_top_company_CLNQ11$`2022
Ranking,Organization Name,Industry,Country,Year Founded,CEO,Revenue (Billions),Profits
(Billions),Assets (Billions),Market Value (Billions),Total Employees`%in%empresas.elegidas,]
head(muestra.Forbes_2000_top_company_CLNQ11.con, 10)

2000 Empres As

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2000 Empres As

Cargado por

Copyright:

Formatos disponibles

# Curso completo de Estadística Inferencial con R y Python

# Tema 1 Muestreo estadístico

# 1.1 Tipos de muestreo

# 1.1.1 Muestreo aleatorio CON reposición

# en R, haríamos los siguiente:

sample(1:2000, 6, replace = TRUE)

# 1.1.2 Muestreo aleatorio SIN reposición

# en R, haríamos los siguiente:

sample(1:2000, 6, replace = FALSE)

# Consideremos la tabla de datos Forbes que contiene 2000 empresas de 11 columnas

# variables: 2022 ranking, nombre de la organización, industria, país, año de fundación,CEO,

set.seed(10) # set.seed fija la semilla, para que siempre dé la misma muestra.

# 1.1.4 Muestreo sistemático

set.seed(15) # Primero fijamos para la reproducibilidad del experimento

(primera.empresa = sample(1:2000, 1)) # hallamos la etiqueta de 1ra empresa

incremento = floor(2000/10) # hallamos el incremento que iremos sumando a la 1ra empresa

empresa.elegidas.10.sis = seq(from = primera.empresa, by = incremento, length.out = 10) #

# 1.1.5 Muestreo aleatorio estratificado

# consideramos que la tabla de datos Forbes_2000_top_company_CLNQ11 está estratificada

set.seed(25) # fijamos la semilla de aleatoriedad por reproducibilidad

# hallamos la muestra de las columnas de cada una de las empresas:

clm.muestra.2022ranking = sample(1:181, 1,replace = FALSE)

clm.muestra.nombre_de_la_organización = sample(182:363, 1,replace = FALSE)

clm.muestra.industria= sample(364:544, 1,replace = FALSE)

clm.muestra.pais = sample(545:725, 1,replace = FALSE)

clm.muestra.año_de_fundacion = sample(726:906, 1,replace = FALSE)

clm.muestra.CEO= sample(907:1087, 1,replace = FALSE)

clm.muestra.ingresos = sample(1088:1268, 1,replace = FALSE)

clm.muestra.ganancias = sample(1269:1449, 1,replace = FALSE)

clm.muestra.activos = sample(1450: 1630, 1,replace = FALSE)

clm.muestra.valor_de_mercado = sample(1631:1811, 1,replace = FALSE)

clm.muestra.total_de_empleados = sample(1812:1992, 1,replace = FALSE)

# 1.1.6 Muestreo por conglomerados

# da información sobre 2000 empresas

# 1.1.6 Muestreo por conglomerados

# da información sobre 2000 empresa

# calcular una muestra de tamaño indeterminado de las empresas por conglomerados

# eligiendo como conglomerados las empresas (2000)

números.empresas.elegidas = sample(1:2000,10,replace = FALSE)

empresas.elegidas # Las empresas elegidas son

# La muestra elegida está formada por empresas:

También podría gustarte