Está en la página 1de 23

Fase 2– Identificación de Variables Estadísticas

Estadística Descriptiva Para Agrarias

Realizado Por:

Natalia Alejandra Laverde Vanegas

Código: 1.033.656.035

Tutor:

Natalia Correa

Código Curso:

300046_79

Universidad Nacional Abierta y a Distancia - UNAD

Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente - ECAPMA

Programa, Agronomía

CEAD - Medellín

Febrero de 2021
Variable Cuantitativa Discreta

A un grupo de estudiantes se les pregunto cuántos hermanos tenían y se obtuvieron las

siguientes respuestas:

Dado el planteamiento anterior se realizan los siguientes cálculos:

a. Hallar media muestral

Para hallar la media muestral se aplica la fórmula para ello la cual es:

Entonces se debe realizar una suma del total de los valores y dividirlo sobre el número de

datos.

0+ 0+0+1+1+1+1+2+2+2+2+2+2+3+3+3+ 3+4 +4 +5
Media muestral=
20

41
Media muestral=
20

Media muestral=2,05

Por lo tanto, la media muestral para este caso es 2,05.

b. Hallar mediana muestral

La mediana muestral es el valor que ocupa el lugar central en todos los datos cuando estos

están ordenados de menor a mayor.

Por ello, se ordenan los datos de menor a mayor así:


0,0,0,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,5

Siendo así el valor central de los datos anteriores es el dato número 10 que sería el 2.

Entonces la mediana de este ejemplo es 2.

c. Hallar moda

La moda es el valor con más frecuencia dentro de la distribución de los datos, es decir, el

valor que más se repite.

0,0,0,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,5

Luego de ordenar los datos se evidencia que el valor que más se repite es el 2, lo que quiere

decir que gran parte de los estudiantes tienen 2 hermanos.

Siendo así, la moda para este ejemplo es el 2.

d. Hallar varianza

La varianza muestral de un conjunto de datos se calcula usando la fórmula:


n
S2=∑ ¿ ¿¿
I=1

Siendo n el número total de datos, X́ la media muestral, y Xi cada dato de la muestra.

Por lo tanto, para este caso se realiza el siguiente procedimiento:

S2=¿

36,95
S2 =
19

S2=1,9447

Dado el procedimiento anterior, se obtiene que la varianza es de 1,9447.

e. Hallar desviación estándar

La desviación estándar se halla con el uso de la siguiente formula:


n
S= √∑I=1
¿¿ ¿ ¿

Entonces,

36,95
S=
√ 19

S= √1,9447

S=1,3945

Finalmente, la desviación estándar para este ejemplo es de 1,3945.

f. Hallar el rango de datos.

El rango de datos para este caso es de 5, porque se resta al número máximo (5) el número

mínimo (0). Entonces el rango de este ejemplo esta de 0-5.

g. Indicar el valor de los cuatro cuartiles.

Los cuartiles son los valores que dividen la muestra en tres partes iguales, para ello se toma la

muestra con los datos ordenados de menor a mayor;

0,0,0,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,5

Como para este caso son 20 datos, los cuartiles se dividen en dé a 5 como se subrayó

anteriormente.

Entonces los cuartiles se denotarían así:

Q1=1

Q2=2

Q3=3

Q4=5

h. Realizar el grafico de frecuencia absoluta


Para realizar el grafico de frecuencias absolutas se debe primero realizar la tabla de frecuencia

absoluta.

Número de 0 1 2 3 4 5

Hermanos
Frecuencia 3 4 6 4 2 1
Teniendo la tabla se realiza el grafico de barras. Este tipo de gráficos es apto para representar

frecuencias de variables cuantitativas discretas.

Diagrama de Barras Frecuencia Absoluta


7
6
Frecuencia Absoluta

5
4
3
2
1
0
0 1 2 3 4 5
Número de Hermanos

Resultados Obtenidos en el Programa R

R version 3.4.2 (2017-09-28) -- "Short Summer"

Copyright (C) 2017 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.

[Previously saved workspace restored]

>

> # CURSO ESTADISTICA DESCRIPTIVA (300046_951) PERIODO ACADÉMICO 16-1 DE

2021

>

> # CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL CODIGO

R UNIDAD 1

> > # Recuerde que para ejecutar cada una de las líneas del código debe digitar "Control+r"

> # Recuerde siempre ejecutarlo en orden, de arriba hacia abajo

>

> # Las líneas del código que inician con el símbolo # no son comandos sino textos explicatorios

>

> # IMPORTANTE: NO MODIFIQUE NINGUNA PARTE DEL CÓDIGO

> # Si lo modifica, le puede aparecer errores

> # Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y descárguelo

nuevamente

>
> # En este ejercicio conoceremos los principales tipos de varables que se manejan en estadística

descriptiva:

> # Variable cuantitativa continua

> # Variable cuantitativa discreta

> # Variable cualitativa o categórica

>> # VARIABLES CUANTITATIVAS CONTINUAS

>

> # Son variables de mediciones en individuos u objetos como peso, edad, altura, entre muchas

otras.

> # son variables que admiten decimales.

> # En la variable de ejemplo, se le preguntó la edad a 15 estudiantes universitarios:

> # Tenga presente que la edad es una varible continua, ya que puede admitir números decimales

> # Por ejemplo, alguien que tenga 15 años y 6 meses, es equivalente a una edad de 15.5 años.

>

> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25,20,21.5,20,22.7,19.2)

>

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de

ellos:

> summary(edad)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

15.00 19.20 20.00 20.39 22.00 25.00

> mean(edad)#media aritmética

[1] 20.39
> var(edad)#varianza

[1] 5.735684

> sd(edad)#desviación estándar

[1] 2.394929

> min(edad) #Mínimo

[1] 15

> max(edad)# Máximo

[1] 25

> range(edad) #Rango

[1] 15 25

> median(edad)# Mediana

[1] 20

> length(edad)# Número de datos

[1] 20

> quantile(edad, 0.25)# Cuantil Q1

25%

19.2

> quantile(edad, 0.75)# Cuantil Q3

75%

22

> quantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

20
> IQR(edad) #Rango intercuartílico

[1] 2.8

> sort(edad)# Ordenar

[1] 15.0 17.0 18.0 18.4 19.2 19.2 19.4 19.6 20.0 20.0 20.0 20.4 21.4 21.5 22.0

[16] 22.0 22.7 23.0 24.0 25.0

>

> ### Regla de Sturges para creación de histograma en variables continuas

> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores

perdidos

[1] 15 25

> nclass.Sturges(edad)#Número de intervalos

[1] 6

> seq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos

[1] 15 17 19 21 23 25

>

intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRUE)

> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad

observada

[1] (17,19] (19,21] (19,21] (21,23] (19,21] (19,21] (19,21] (21,23] (17,19]

[10] (23,25] [15,17] (21,23] [15,17] (21,23] (23,25] (19,21] (21,23] (19,21]

[19] (21,23] (19,21]

Levels: [15,17] (17,19] (19,21] (21,23] (23,25]

> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)
>

> #Histograma de la variable edad con la regla de Sturges:

> # Cuando el comando produce la gráfica, lo saca del código y lo dirige a esta.

> # Para volver al código para seguir ejecutándolo, es importante que ubique el cursor en la parte

superior del marco,

> # en donde se encuentra el nombre del archivo: "Codigo Fase 2 - Variables Estadísticas.t"

> # Si ubica el cursor dentro del texto del archivo, corre el riesgo de perder el orden que llevaba al

ejecutar el código

> # y le pueden quedar partes del código sin ejecutar.

> hist(edad,main="PERIODO 951 - Histograma con Regla de Sturges variable

edad",breaks=puntos) # este comando crea el gráfico de histograma con la regla de Sturges

>

> # Instalación libreria "agricolae":

> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del

código

> # En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"

>

> install.packages("agricolae")

Installing package into ‘C:/Users/usuario/Documents/R/win-library/3.4’

(as ‘lib’ is unspecified)

--- Please select a CRAN mirror for use in this session ---

Warning: dependency ‘questionr’ is not available

also installing the dependencies ‘combinat’, ‘klaR’, ‘AlgDesign’


There are binary versions available but the source versions are later:

binary source needs_compilation

klaR 0.6-14 0.6-15 FALSE

AlgDesign 1.1-7.3 1.2.0 TRUE

agricolae 1.3-1 1.3-3 FALSE

Binaries will be installed

probando la URL 'https://cloud.r-project.org/bin/windows/contrib/3.4/combinat_0.0-8.zip'

Content type 'application/zip' length 29547 bytes (28 KB)

downloaded 28 KB

probando la URL 'https://cloud.r-project.org/bin/windows/contrib/3.4/AlgDesign_1.1-7.3.zip'

Content type 'application/zip' length 573119 bytes (559 KB)

downloaded 559 KB

package ‘combinat’ successfully unpacked and MD5 sums checked

package ‘AlgDesign’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in

C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t\downloaded_packages

installing the source packages ‘klaR’, ‘agricolae’

probando la URL 'https://cloud.r-project.org/src/contrib/klaR_0.6-15.tar.gz'

Content type 'application/x-gzip' length 294627 bytes (287 KB)

downloaded 287 KB

probando la URL 'https://cloud.r-project.org/src/contrib/agricolae_1.3-3.tar.gz'

Content type 'application/x-gzip' length 654836 bytes (639 KB)

downloaded 639 KB
ERROR: dependency 'questionr' is not available for package 'klaR'

* removing 'C:/Users/usuario/Documents/R/win-library/3.4/klaR'

ERROR: dependency 'klaR' is not available for package 'agricolae'

* removing 'C:/Users/usuario/Documents/R/win-library/3.4/agricolae'

The downloaded source packages are in

‘C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t\downloaded_packages’

Warning messages:

1: comando ejecutado '"C:/PROGRA~1/R/R-34~1.2/bin/x64/R" CMD INSTALL -l

"C:\Users\usuario\Documents\R\win-library\3.4"

C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t/downloaded_packages/klaR_0.6-15.tar.gz'

tiene estatus 1

2: In install.packages("agricolae") :

installation of package ‘klaR’ had non-zero exit status

3: comando ejecutado '"C:/PROGRA~1/R/R-34~1.2/bin/x64/R" CMD INSTALL -l

"C:\Users\usuario\Documents\R\win-library\3.4"

C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t/downloaded_packages/agricolae_1.3-

3.tar.gz' tiene estatus 1

4: In install.packages("agricolae") :

installation of package ‘agricolae’ had non-zero exit status

>

> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del

código

> # En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"


>

> install.packages("agricolae")

Installing package into ‘C:/Users/usuario/Documents/R/win-library/3.4’

(as ‘lib’ is unspecified)

Warning: dependency ‘questionr’ is not available

also installing the dependency ‘klaR’

There are binary versions available but the source versions are later:

binary source needs_compilation

klaR 0.6-14 0.6-15 FALSE

agricolae 1.3-1 1.3-3 FALSE

installing the source packages ‘klaR’, ‘agricolae’

probando la URL 'https://cloud.r-project.org/src/contrib/klaR_0.6-15.tar.gz'

Content type 'application/x-gzip' length 294627 bytes (287 KB)

downloaded 287 KB

probando la URL 'https://cloud.r-project.org/src/contrib/agricolae_1.3-3.tar.gz'

Content type 'application/x-gzip' length 654836 bytes (639 KB)

downloaded 639 KB

ERROR: dependency 'questionr' is not available for package 'klaR'

* removing 'C:/Users/usuario/Documents/R/win-library/3.4/klaR'

ERROR: dependency 'klaR' is not available for package 'agricolae'

* removing 'C:/Users/usuario/Documents/R/win-library/3.4/agricolae'

The downloaded source packages are in

‘C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t\downloaded_packages’
Warning messages:

1: comando ejecutado '"C:/PROGRA~1/R/R-34~1.2/bin/x64/R" CMD INSTALL -l

"C:\Users\usuario\Documents\R\win-library\3.4"

C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t/downloaded_packages/klaR_0.6-15.tar.gz'

tiene estatus 1

2: In install.packages("agricolae") :

installation of package ‘klaR’ had non-zero exit status

3: comando ejecutado '"C:/PROGRA~1/R/R-34~1.2/bin/x64/R" CMD INSTALL -l

"C:\Users\usuario\Documents\R\win-library\3.4"

C:\Users\usuario\AppData\Local\Temp\Rtmp6ROD4t/downloaded_packages/agricolae_1.3-

3.tar.gz' tiene estatus 1

4: In install.packages("agricolae") :

installation of package ‘agricolae’ had non-zero exit status

>

> # Damos "OK" y el programa instala el paquete

> # Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté totalmente

instalada

> # Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in (muestra la

carpeta donde se guardaron)"

> # Debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda (R

Console)

> # Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en

color rojo
> library(agricolae)

Error in library(agricolae) : there is no package called ‘agricolae’

>

> ### Gráficos de variables continuas:

> # Histograma de la variable edad

>

> hist(edad,ylab="Frecuencia",main="PERIODO 951 - Histograma de la variable continua

Edad")

>

> # Como pueden ver, una vez instalada la libreria "agricolae" no hace falta realizar todos los

pasos que se

> # necesitaron para obtener el histograma por medio de la Regla de Sturges

> boxplot(edad,ylab="Edad (años)",main="PERIODO 951 - Boxplot o diagrama de cajas variable

continua") # Gráfico de diagrama de cajas o Boxplot

> # El boxplot organiza los datos de menor a mayor y los agrupa en cuatro cuartiles, donde cada

uno tiene la misma

> # cantidad de datos.

>

> # VARIABLES CUANTITATIVAS DISCRETAS

>

> # Variables de conteos, solo toman valores en números enteros como número de hermanos, de

frutos, etc.
> # En la variable de ejemplo, se le preguntó a un curso de 15 estudiantes cuántos hermanos

tenían cada uno de ellos:

>

> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2,3,2,2,0,1)

>

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de

ellos:

> summary(Hermanos)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.00 1.00 2.00 2.05 3.00 5.00

> min(Hermanos) #Mínimo

[1] 0

> max(Hermanos)# Máximo

[1] 5

> range(Hermanos) #Rango

[1] 0 5

> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON

SUMMARY

[1] 2.05

> median(Hermanos)# Mediana

[1] 2

> length(Hermanos)# NÚMERO DE DATOS

[1] 20
> sd(Hermanos)# Desviación típica

[1] 1.394538

> quantile(Hermanos, 0.25)# Cuantil Q1

25%

> quantile(Hermanos, 0.75)# Cuantil Q3

75%

> quantile(Hermanos, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

> IQR(Hermanos) #Rango intercuartílico

[1] 2

> sort(Hermanos)# Ordenar

[1] 0 0 0 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 5

> ##En este caso las tablas de frecuencias se desarrollan por pasos:

> table(Hermanos) #Tabla de frecuencias absolutas

Hermanos

012345

346421

> fabs=table(Hermanos)##Tabla de frecuencias absolutas

> fabs

Hermanos
012345

346421

> fabsacum<-as.table(cumsum(fabs))#Frecuencias absolutas acumuladas

> fabsacum

0 1 2 3 4 5

3 7 13 17 19 20

> frel=prop.table(table(Hermanos))#Tabla de frecuencias relativas

> frel

Hermanos

0 1 2 3 4 5

0.15 0.20 0.30 0.20 0.10 0.05

> frelacum<-as.table(cumsum(frel))#Frecuencias relativas acumuladas

> frelacum

0 1 2 3 4 5

0.15 0.35 0.65 0.85 0.95 1.00

> # Podemos decir que cero hermanos tiene el 0.133 en proporción ó el 13.3% de los individuos

encuestados.

> # Las proporciones se multiplican por 100 para expresarlas en porcentaje.

>

> ##Gráficos de variables cuantitaivas discretas:

> boxplot(Hermanos,ylab="número de hermanos",main="PERIODO 951 - Boxplot o diagrama de

cajas variable discreta")


> barplot(fabs,xlab="Número de hermanos",ylab="Frecuencias absolutas",main="PERIODO 951

- Diagrama de barras Frecuencia Absoluta")

> barplot(frel,xlab="Número de hermanos",ylab="Frecuencias relativas",main="PERIODO 951 -

Diagrama de barras Frecuencia relativa")

> barplot(frelacum,xlab="Número de hermanos",ylab="Frecuencias relativas",main="PERIODO

951 - Diagrama de barras Frecuencias relativas acumuladas")

> pie(fabs,col=rainbow(6),main=c("PERIODO 951 - Gráfico de tarta de Hermanos")) #Gráfico

de tarta

>

> # VARIABLES CUALITATIVAS

>

> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza, etc...

> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el color o

la raza

> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de

estudios o el estrato socioeconómico.

> # A continuación tomaremos como ejemplo la variable categórica "Nivel de estudios"

> # de los agricultores pertenecientes a una misma vereda.

> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada nivel de

estudio:

> # Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2: “Estudios Secundarios”;

3:“Estudios Superiores”

>
> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3)

>

> # Esto es lo que respondió cada agricultor ya codificado, para poderlo analizar en el programa

R.

>

> # Ahora, hay que explicarle al programa lo que significa cada número

>

> # Se le aclara que nuestra variable tiene 4 categorías, del 0 al 3:

>

> estudios=factor(estudios, levels=c(0,1,2,3),

+ # Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y cuál es su

etiqueta:

+ labels=c("Sin estudios","Estudios Primarios","Estudios Secundarios","Estudios Superiores"))

>

> estudios # Muestra lo que respondió cada agricultor y los cuatro niveles de la variable:

[1] Estudios Primarios Estudios Secundarios Sin estudios

[4] Estudios Primarios Sin estudios Estudios Primarios

[7] Estudios Primarios Estudios Secundarios Estudios Superiores

[10] Estudios Secundarios Estudios Superiores Estudios Primarios

[13] Estudios Secundarios Estudios Superiores

4 Levels: Sin estudios Estudios Primarios ... Estudios Superiores


>

> # Una vez se ha codificado exitosamente la variable, se puede analizar con R:

> # Presentar estos resultados en un cuadro y explicar:

>

> summary(estudios)# debe aparecer cada nivel, con el número de agricultores que se encuentran

en cada uno de estos:

Sin estudios Estudios Primarios Estudios Secundarios

2 5 4

Estudios Superiores

> table(estudios) #Tabla de frecuencias absolutas

estudios

Sin estudios Estudios Primarios Estudios Secundarios

2 5 4

Estudios Superiores

>

> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes

> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó

inicialmente

> # En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"

> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":

>
> fabs1=table(estudios)# Tabla de frecuencias absolutas

> fabs1 # si no se le cambia el nombre, aparecería el mismo resultado que produjo en la variable

discreta

estudios

Sin estudios Estudios Primarios Estudios Secundarios

2 5 4

Estudios Superiores

> frel1=prop.table(table(estudios))# Tabla de frecuencias relativas

> frel1

estudios

Sin estudios Estudios Primarios Estudios Secundarios

0.1428571 0.3571429 0.2857143

Estudios Superiores

0.2142857

>

> # Podemos decir que el 0.143 de los agricultores encuestados no tienen estudios o en

proporción, el 14.3%

> # Para pasarlo a porcentaje, se multiplica el resultado por 100

>

> ##Gráficos de variables cualitativas

> barplot(fabs1,ylab="Frecuencias absolutas",xlab="Nivel de estudio",main="PERIODO 951 -

Diagrama de barras frecuencias absolutas nivel de estudio agricultor")


> barplot(frel1,ylab="Frecuencias relativas",xlab="Nivel de estudio",main="PERIODO 951 -

Diagrama de barras frecuencias relativas nivel de estudio de agricultores")

>

> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al grupo al

que pertenece.

> # Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva (para

ciencias agrarias)

>

>

También podría gustarte