Está en la página 1de 4

Taller 3 Muestreo Herbario

Esmeralda Van strahlen Martinez. Código estudiantil 202230006444

8/12/2022

Taller 3 Muestreo Estratificado Proporcional


Considere el documento Herbario en Material complementario de Blackboard. Suponga que usted está
interesado en sacar una muestra con el fin de estimar el promedio de latitud de las plantas (debemos suponer
que los únicos valores de la columna P que conoceremos son los que terminen siendo parte de la muestra).
Usted está dispuesto a tolerar un margen de error de 0,007 grados de latitud. Suponga también que, la
desviación estándar experimental s = 0, 21 es la misma para todos los estratos. 1. Calcule el tamaño de
muestra n. 2. Haga un muestreo estratificado proporcional en el que los estratos son los valores de la columna
“Orden”. 3. Calcule un intervalo de confianza del 90 %.

## # A tibble: 6 x 49
## OID ID Seccion Guid Numer~1 Nombr~2 Apell~3 Numer~4 Fecha~5 Pais
## <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 -1 6 e15 Vasculares c7cc6c~ 9 Sánche~ Sánchez 1796 1990-1~ Colo~
## 2 -1 7 e15 Vasculares eb10c2~ 10 Sánche~ Sánchez 1826 1990-1~ Colo~
## 3 -1 8 e15 Vasculares 3eaad6~ 11.1 Sánche~ Sánchez 120 1985-1~ Colo~
## 4 -1 1.34e17 Vasculares 069676~ 190.1 Sánche~ Sánchez 269 1985-1~ Colo~
## 5 -1 1.57e17 Vasculares 6c064f~ 225.1 Sánche~ Sánchez 113 1985-1~ Colo~
## 6 -1 1.66e17 Vasculares 33ec9d~ 240 Sánche~ Sánchez 197 1985-1~ Colo~
## # ... with 39 more variables: Departamento <chr>, Municipio <chr>,
## # SitioColecta <chr>, ElevacionMinima <dbl>, ElevacionMaxima <dbl>,
## # Latitud <dbl>, Longitud <dbl>, Datum <lgl>, Notas <chr>,
## # NombreDeterminador <chr>, FechaDeterminacion <chr>, Calificador <chr>,
## # Reino <chr>, Division <chr>, SuperClase <chr>, Clase <chr>, Orden <chr>,
## # Familia <chr>, Genero <chr>, EpitetoEspecifico <chr>, AutorEpiteto <chr>,
## # SubEspecie <chr>, AutorSubEspecie <chr>, Variedad <chr>, ...

Lo primero que hacemos con el dataset anterior es ver los grupos que podemos tener en la columna Orden:
Dejamos los datos nulos en la columna orden con el nombre “Not Orden”.

dim(dataset)

## [1] 12787 49

##
## Alismatales Apiales Aquifoliales Arecales Asparagales
## 65 259 25 28 850
## Asterales Boraginales Brassicales Buxales Canellales
## 1944 53 110 6 31

1
## Caryophyllales Celastrales Chloranthales Commelinales Cornales
## 356 1 23 35 4
## Crossosomatales Cucurbitales Cyatheales Cycadales Dioscoreales
## 1 96 69 6 9
## Dipsacales Equisetales Ericales Escalloniales Fabales
## 206 24 794 45 365
## Fagales Gentianales Geraniales Gleicheniales Gunnerales
## 102 451 84 9 4
## Hymenophyllales Icacinales Isoetales Lamiales Laurales
## 43 1 2 728 68
## Liliales Lycopodiales Magnoliales Malpighiales Malvales
## 71 130 8 631 61
## Myrtales Not Orden Nymphaeales Ophioglossales Oxalidales
## 804 9 2 3 267
## Picramniales Pinales Piperales Poales Polypodiales
## 2 42 212 1293 807
## Proteales Ranunculales Rosales Salviniales Santalales
## 28 171 598 7 112
## Sapindales Saxifragales Selaginellales Solanales Vitales
## 81 80 4 447 2
## Zingiberales
## 18

Calculamos las categorias que tenemos y son:

## [1] 61

Para encontrar el tamaño de la muestra podemos usar la afijación aproximada, usando costes iguales debido
a que para el caso no los conocemos. Por ende usaremos la afijación de Neymann:

P 2
L
Nk σ k
k=1
n= PL
N 2 D + i=1 Ni σi2
Sea:
B2
D=
4
El valor de la muestra es:

## [1] 2809.129

para cada estrato usaremos la siquiente formula:


!
ni σi
ni = n PL
k=1 Nk σk
Al usar la formula obtenemos los siguientes resultados:

## [,1]
## Alismatales 15
## Apiales 57
## Aquifoliales 6

2
## Arecales 7
## Asparagales 187
## Asterales 428
## Boraginales 12
## Brassicales 25
## Buxales 2
## Canellales 7
## Caryophyllales 79
## Celastrales 1
## Chloranthales 6
## Commelinales 8
## Cornales 1
## Crossosomatales 1
## Cucurbitales 22
## Cyatheales 16
## Cycadales 2
## Dioscoreales 2
## Dipsacales 46
## Equisetales 6
## Ericales 175
## Escalloniales 10
## Fabales 81
## Fagales 23
## Gentianales 100
## Geraniales 19
## Gleicheniales 2
## Gunnerales 1
## Hymenophyllales 10
## Icacinales 1
## Isoetales 1
## Lamiales 160
## Laurales 15
## Liliales 16
## Lycopodiales 29
## Magnoliales 2
## Malpighiales 139
## Malvales 14
## Myrtales 177
## Not Orden 2
## Nymphaeales 1
## Ophioglossales 1
## Oxalidales 59
## Picramniales 1
## Pinales 10
## Piperales 47
## Poales 285
## Polypodiales 178
## Proteales 7
## Ranunculales 38
## Rosales 132
## Salviniales 2
## Santalales 25
## Sapindales 18
## Saxifragales 18

3
## Selaginellales 1
## Solanales 99
## Vitales 1
## Zingiberales 4

Realizando el muestreo por Orden, obtenemos el siguiente dataset:

## # A tibble: 6 x 49
## OID ID Seccion Guid Numer~1 Nombr~2 Apell~3 Numer~4 Fecha~5 Pais
## <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 -1 2.46e19 Vasculares f79538~ 16342 Orejue~ Orejue~ 2257 2015-0~ Colo~
## 2 -1 2.46e19 Vasculares 176d67~ 16349 Orejue~ Orejue~ 1894 2015-0~ Colo~
## 3 -1 2.92e19 Vasculares d34e2c~ catalo~ Reina,~ Reina 900 2015-0~ Colo~
## 4 -1 7.25e18 Vasculares 11a3cc~ 8116 Morale~ Morale~ 3421 2012-1~ Colo~
## 5 -1 1.88e18 Vasculares d59ca4~ 2311 Peña, ~ Peña 49 1998-0~ Colo~
## 6 -1 3.37e19 Vasculares e1ea39~ catalo~ Cabrer~ Cabrera 4159 2016-1~ Colo~
## # ... with 39 more variables: Departamento <chr>, Municipio <chr>,
## # SitioColecta <chr>, ElevacionMinima <dbl>, ElevacionMaxima <dbl>,
## # Latitud <dbl>, Longitud <dbl>, Datum <lgl>, Notas <chr>,
## # NombreDeterminador <chr>, FechaDeterminacion <chr>, Calificador <chr>,
## # Reino <chr>, Division <chr>, SuperClase <chr>, Clase <chr>, Orden <chr>,
## # Familia <chr>, Genero <chr>, EpitetoEspecifico <chr>, AutorEpiteto <chr>,
## # SubEspecie <chr>, AutorSubEspecie <chr>, Variedad <chr>, ...

Organizando podemos ver la media por categoria:

## # A tibble: 61 x 2
## Orden ‘mean(Latitud)‘
## <chr> <dbl>
## 1 Alismatales 4.59e15
## 2 Apiales 4.42e15
## 3 Aquifoliales 4.53e15
## 4 Arecales 4.45e15
## 5 Asparagales 4.45e15
## 6 Asterales 4.45e15
## 7 Boraginales 4.52e15
## 8 Brassicales 4.64e15
## 9 Buxales 4.68e15
## 10 Canellales 4.61e15
## # ... with 51 more rows

Veamos la media general por estrato:

## mean SE
## Latitud 4.4654e+15 2.2857e+12

Tenemos los intervalos de confianza:

## 5 % 95 %
## Latitud 4.461689e+15 4.469208e+15

También podría gustarte