Está en la página 1de 4

Por: Mario Orlando Suárez Ibujés Fecha: 28/03/2024 https://orcid.

org/0000-0002-3962-5433

MUESTREO ALEATORIO SIMPLE CON R STUDIO


TABLA DE CONTENIDOS
1. Identificar a qué corresponden las siguientes líneas ............................. 1
2. Carga de la base de datos ........................................................ 2
3. Obtención de una muestra aleatoria simple de tamaño n entre 1 y N sin reemplazo ... 2
4. Media, varianza y desviación estándar de variable “mate” ......................... 3
5. Tamaño de la muestra para estimar la media mat con un error de estimación de +-
0.09 ................................................................................ 3
6. Variabilidad/homogeneidad de la variable mat ..................................... 4
7. Referencias ...................................................................... 4

1. Identificar a qué corresponden las siguientes líneas


(n1<-s2.calif*1.96^2/2^2)
(nn1<-n1/(1+n1/N))
(n2=s2.ingrl*1.96^2/2^2)
(nn2=-n2/(1+n2/N))

Las líneas de n1 y n2 corresponde al tamaño de la muestra cuya fórmula es


𝑆 2𝑍2
𝑛=
𝛿2
Donde:
𝑛 = tamaño de la muestra
𝑆 2 = variabilidad
𝛿 = error de estimación
𝑍 = valor obtenido mediante niveles de confianza. Si se lo toma en relación con el 95%
de confianza su valor es de 1,96 o en relación con el 99% de confianza su valor es de
2,58 (Suárez, 2018).
El tamaño de la muestra es directamente proporcional a la variabilidad, es decir, a
mayor tamaño de la muestra mayor variabilidad o a menor tamaño de la muestra menor
variabilidad.
El tamaño de la muestra es inversamente proporcional al error de estimación, es decir,
a mayor error de estimación el tamaño muestral es menor o viceversa.

1
Por: Mario Orlando Suárez Ibujés Fecha: 28/03/2024 https://orcid.org/0000-0002-3962-5433

Las líneas nn1 y nn2 se refiere al cálculo del tamaño de la muestra con factor de
corrección (Revelo,2023).
𝑛
𝑛
1+𝑁
El factor de corrección corrige el impacto de ajustar la varianza a la distribución de
muestreo. Se emplea cuando el tamaño de la muestra n representan más del 5% del tamaño
de la población N

2. Carga de la base de datos


datos <- read.csv("educacion.txt")
str(datos)

## 'data.frame': 8240 obs. of 12 variables:


## $ folio : int 1 2 3 4 5 6 7 8 9 10 ...
## $ cve_ent : int 9 9 9 9 9 9 15 5 5 9 ...
## $ tipo : int 2 2 2 2 2 2 2 2 2 2 ...
## $ edad : int 19 19 20 20 21 20 20 19 21 20 ...
## $ sexo : int 1 2 2 1 2 1 1 2 2 2 ...
## $ promedio: int 71 36 22 44 80 46 52 56 34 45 ...
## $ ingresos: int 9161 36305 13040 15300 10027 33339 4493 8738 47162 9430 ...
## $ trabaja : int 0 0 0 0 0 1 0 0 0 1 ...
## $ ingles : int 4 4 5 4 3 5 4 4 3 5 ...
## $ calif : int 58 60 75 57 41 61 45 53 45 51 ...
## $ mate : int 73 47 73 67 40 33 40 67 20 27 ...
## $ esp : int 50 56 69 56 44 63 31 44 31 50 ...

names(datos)

## [1] "folio" "cve_ent" "tipo" "edad" "sexo" "promedio"


## [7] "ingresos" "trabaja" "ingles" "calif" "mate" "esp"

attach(datos)
datos$mate=mate/17
N=length(datos$folio)
n=50

3. Obtención de una muestra aleatoria simple de tamaño n entre 1 y N sin


reemplazo
ind1=sample(1:N,n,replace = F)
# Resumen de la base
sort(ind1)

2
Por: Mario Orlando Suárez Ibujés Fecha: 28/03/2024 https://orcid.org/0000-0002-3962-5433

## [1] 99 332 403 637 862 1071 1540 1611 1767 2174 2324 2454 2526 2535 2642
## [16] 2958 3397 3431 3487 3541 3663 3728 3863 3869 3988 4277 4279 4322 4541 4552
## [31] 4841 4977 5183 5222 5569 5722 5759 5926 6075 6292 6340 6368 6952 7037 7074
## [46] 7117 7412 7478 7906 8170

muestra1=datos[ind1,] # dataframe
# variables población
names(datos)

## [1] "folio" "cve_ent" "tipo" "edad" "sexo" "promedio"


## [7] "ingresos" "trabaja" "ingles" "calif" "mate" "esp"

4. Media, varianza y desviación estándar de variable “mate”


media_mat=mean(datos$mate)
media_mat

## [1] 2.022487

media_m_mat=mean(muestra1$mate)
media_m_mat

## [1] 2.005882

s2.mat=var(muestra1$mate)
s2.mat

## [1] 1.253902

s.mat=sd(muestra1$mate)
s.mat

## [1] 1.119777

5. Tamaño de la muestra para estimar la media mat con un error de estimación


de +- 0.09
n1=s2.mat*1.96^2/0.09^2

## [1] 594.6899

# A más variabilidad el tamaño muestral es mayor.


# A mayor error el tamaño muestral es menor

## proporción que representa la muestra de la población


n1/N

## [1] 0.07217111

# Como n1/N es mayor al 5% se emplea el factor de corrección


(nn1=n1/(1+n1/N))

## [1] 554.6595

3
Por: Mario Orlando Suárez Ibujés Fecha: 28/03/2024 https://orcid.org/0000-0002-3962-5433

6. Variabilidad/homogeneidad de la variable mat

dess_mat<-sd(datos$mat)
dess_mat

## [1] 1.088905

media_mat<-mean(datos$mat)
media_mat

## [1] 2.022487

CV_mat<-dess_mat/media_mat
CV_mat

## [1] 0.5383988

#Homogéneos si CV < 15%


#Mediadamente homogéneos si 15%< CV< 30%
#Heterogéneos si CV > 30%
# Por lo tanto, los datos mat son heterogéneos.

7. Referencias
Suárez, M. (2018). Probabilidades y Estadística empleando las TIC.
http://repositorio.utn.edu.ec/handle/123456789/8698
Revelo, G. (2023). Técnicas del muestreo. https://n9.cl/akhc7

También podría gustarte