Está en la página 1de 37

Unidad #1 Fase 2 Identificación de variables estadísticas.

Presentado por: Eddie José Jiménez Donado


C.C. 72190105
Código curso: 300046
Grupo: 300046-7
Director: Camilo Andrés Cárdenas.

Universidad nacional abierta y a distancia UNAD


Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente-ECAPMA
Estadística descriptiva (para agrarias)
Mayo 2021
Introducción

El siguiente trabajo se realizó con el fin de afianzar conocimiento acerca de los conceptos
fundamentales de la estadística, entre ellos los diferentes tipos de variables como son las
cuantitativas y cualitativas que se utilizan para procesar la información recibida tratando de
estructurar los datos y detectar un patrón general de comportamiento. En este sentido las variables
cuantitativas están dadas por la medida de tendencia central como son la media, la moda, la
mediana y medidas de posición como los percentiles y de dispersión como la varianza; mientras que
las variables cualitativas se suelen agrupar en frecuencias o en grupos de individuos que comparten
la misma característica y que se pueden representar mediante tablas y gráficos,
Podemos afirmar así que mediante el uso de las variables estadísticas podemos realizar inferencias y
sacar conclusiones a partir de los datos suministrados y comprender de mejor manera la situación
que se nos quiere representar.
Tabla de contenido

1. Objetivos……………………………………………………………………………….1

2. Explicar en sus propias palabras diferentes conceptos de variables estadísticas…........2

3. Se les preguntó a 20 estudiantes del curso Estadística Descriptiva su edad (es una variable
cuantitativa continua, los meses se pasaron a números decimales……………………...3

4. A los mismos estudiantes se les preguntó cuántos hermanos tenían (variable cuantitativa
discreta) ………………………………………………………………………………..3

5. Instalar el programa R (descargar el archivo ejecutable “R-4.0.2……………………..5

6. Presentación de gráficos para presentar se deben dividir en tres


secciones………………………......................................................................................6

7. Conclusiones……………………………………………………………………………7

8. Bibliografía……………………………………………………………………………..8
OBJETIVOS

OBJETIVO GENERAL

 Comprender de manera teórica y práctica los diferentes tipos de variables estadísticas


cuantitativas y cualitativas y desarrollar competencias en el uso y manejo de dichas
variables.

OBJETIVOS ESPECIFICOS

 Identificar de manera eficaz los diferentes criterios para la clasificación de variables


estadísticas.

 Conocer los conceptos básicos de frecuencias utilizados en la estadística con sus


respectivos enfoques.

 Comprender las diferentes medidas de dispersión como la varianza, desviación estándar, los
cuartiles y los percentiles y los diferentes gráficos utilizados para cada variable.


1. Explicar en sus propias palabras diferentes conceptos sobres variables estadísticas:

a. Qué es una variable cuantitativa continua.

Es aquella que puede asumir un número incontable de valores. Ejemplo: La estatura de tu


mejor amigo, el ancho de una pelota de futbol.

b. Qué es una variable cuantitativa discreta.

Es aquella que puede asumir un número contable de valores. Ejemplo: El número de hijos
de una familia, la cantidad de dedos de las manos.

c. Qué es una variable cualitativa nominal.


Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un
criterio de orden. Ejemplos: El estado civil modalidades: soltero, casado, separado,
divorciado y viudo.

d. Qué es una variable cualitativa categórica.

Es una variable que puede tomar uno de un número limitado, y por lo general fijo, de
posibles valores, asignados a cada unidad individual u otro tipo de observación a un grupo
en particular o categoría nominal sobre la base una característica cualitativa.

e. Cuál es la diferencia entre media poblacional y media muestral.


La diferencia radica en que la media poblacional es toda la totalidad de los datos para
realizar la estimación, mientras que la media muestral se basa en una muestra significativa
de esa población.
f. Qué es la varianza de una población.
Es una medida de dispersión que se utiliza para representar la variabilidad de una población
respecto de la media aritmética de la misma.

g. Qué es desviación estándar.


Es una medida de dispersión más común, que indica que tan dispersos están los datos con
respecto a la medida, es decir mientras mayor sea la desviación estándar, mayor será la
dispersión de los datos.

h. ¡Qué es la Regla de Sturges ¿para qué sirve?


En la estadística descriptiva la regla de Sturges es un criterio muy utilizado cuando se
quiere realizar un histograma de frecuencias ya que con esta regla se calcula el número de
clases (o intervalos) necesarios para representar fielmente los datos.

i. ¡Qué es frecuencia absoluta?


Indica el número de veces que se repite cada uno de los valores en la muestra. El
Subíndice (i) se interpreta del mismo modo que en xi

j. ¿Qué es frecuencia relativa?


Es el cociente entre la frecuencia absoluta y el número total de datos que incluye la
muestra. Indica, por tanto, la proporción de individuos para los que la variable toma un
determinado valor.

k. ¿Qué es frecuencia relativa acumulada?


Se obtiene acumulando o sumando las frecuencias absolutas anteriores a la considerada en
cada caso, es decir, del mismo modo que la frecuencia absoluta acumulada, pero usando las
frecuencias relativas en vez de las absolutas.

l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable


continua y de una discreta?
La tabla de frecuencias absolutas es una herramienta que permite ordenar los datos de
manera que se presenten numéricamente las características de la distribución de un
conjunto de datos o muestra y mientras que una variable continua es necesario definir
primero una cantidad de clases o intervalos de clase.

m. ¡Qué es un Boxplot o diagrama de cajas, para qué sirve?


Es un método estandarizado para representar gráficamente una serie de datos numéricos a
través de sus cuartiles. De esta manera, el diagrama de caja muestra a simple vista la
mediana y los cuartiles de los datos, pudiendo también representar los valores atípicos de
estos.

n. En qué tipo de variables se usa el histograma.


El histograma se usa en variables continuas para mostrar gráficamente la distribución de
dicha variable, aunque también se puede usar para variables discretas. Es decir, mediante un
histograma se puede mostrar gráficamente la distribución de una variable cuantitativa o
numérica.

o. ¿En qué tipo de variables se usa el gráfico de barras?


El gráfico de barras se utiliza para representar datos de variables cualitativas o discretas.
Está formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada
uno de los valores de la variable

2. Se les preguntó a 20 estudiantes del curso Estadística Descriptiva su edad (es una variable
cuantitativa continua, los meses se pasaron a números decimales):

18.4 19.2 19.6 23 20


20.4 19.4 21.4 18 24
17 22 15 22 25
20 21.5 20 22.7 19.2

Hallar:
a. Media.

La media de un conjunto de números, llamada también el promedio, es la suma de los


datos dividida entre el número total de datos.

Resolución del ejercicio.

X= 18.4+19.2+19.6+23+20+20.4+19.4+21.4+18+24+17+22+15+22+25=407.8/20
X=20.39

b. Mediana.

La mediana de un conjunto de números es el número medio en el conjunto (después que


los números han sido arreglados del menor al mayor) o si hay un número o un par de
datos igual, la mediana es el promedio de los dos números medios.
Resolución del ejercicio:
Se ordenan los números de mayor a menor.

15
17
18.4
19.2
19.2
19.4
19.6
20
20
20
20.4
21.4
21.5
22
22
22.7
23
24
25
La mediana del ejercicio =20, porque es el número medio.
Me=20.
c. Moda.

La moda de un conjunto de números es que aparece más a menudo. En un grupo puede


haber dos modas y se conoce como bimodal, y más de dos modas o multimodal cuando
se repiten más de dos valores; se llama amodal cuando en conjunto de números no se
repiten los valores.

Resolución del ejercicio.

18.4 19.2 19.6 23 20


20.4 19.4 21.4 18 24
17 22 15 22 25
20 21.5 20 22.7 19.2

La Moda de este ejercicio es = 20 Porque son los valores que aparecen con más
frecuencia.
Mo= 20

d. Varianza.
Es una medida de dispersión que representa la variabilidad de unas series de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado
divididos entre el total de observaciones.
Formula:

Donde:
X=variable sobre la que se pretende calcular la varianza Xi=observación número i de la
variable x. i puede tomar valores entre 1 y n.
Xi=número de observaciones.
X: Es la media de variable x.

Resolución del ejercicio.


Nro. Datos X-X’ (datos – (X-X’)<2 (suma de
X’ promedio) los cuadrados)
1 15 15-20.39= -5.39 29.0521
2 17 17-20.39= -3.39 11.4921
3 18 18-20.39= -2.39 5.7121
4 18.4 18.4-20.39= -1.99 3.9601
5 19.2 19.2-20.39= -1.19 1.4161
6 19.2 19.2-20.39= -1.19 1.4161
7 19.4 19.4-20.39= -0.99 0.9801
8 19.6 19.6-20.39= -0.79 0.6241
9 20 0.1521
20-20.39= -0.39
10 20 20-20.39= -0.39 0.1521
11 20 20-20.39= -0.39 0.1521
12 20.4 20.4-20.39= 0.01 0.0001
13 21.4 21.4-20.39= 1.01 1.0201
14 21.5 21.5-20.39= 1.11 1.2321
15 22 22-20.39= 1.61 2.5921
16 22 22-20.39= 1.61 2.5921
17 22.7 22.7-20.39= 2.31 5.3361
18 23 23-20.39= 2.61 6.8121
19 24 24-20.39= 3.61 13.0321
20 25 25-20.39= 4.61 21.2521
Tota 1.77636 108.978
l

Promedio: 20.39
Varianza es igual:
Var(x)= 5.4489

e. Desviación estándar.

Fórmula:

Es igual a la raíz cuadrada de la diferencia entre el promedio de los cuadrados de los


valores y el cuadrado del valor promedio.
Resolución del ejercicio.
El resultado se obtiene sacándole la raíz cuadrada a la varianza.
Varianza = 5.4489

Desviación estándar√ 5.4489= 2.3342879

Desviación estándar= 2.3342879


f. Rango de datos.
Es una medida de dispersión, una medida de como los datos individuales pueden diferir
de la media. El rango se calcula simplemente restando el valor mínimo del máximo
conjunto.
Resolución del ejercicio
El rango es la resta o diferencia del número mayor del número menor.
Rango= 25-15= 10
Rango=10

g. Indicar el valor de los cuatro cuartiles.


Los cuartiles son los tres elementos de un conjunto de datos ordenados que dividen el
conjunto en cuatro partes iguales.

Cuartiles Datos valores


Posición Q1 5 19.2
Posición Q2 10 20
Posición Q3 15 22
Posición Q4 20 25

h. Realice el grafico de frecuencia absoluta utilizando la regla de Sturges.


En estadística descriptiva la regla de Sturges es un criterio muy utilizado cuando se
quiere realizar un histograma de frecuencias ya que con esta regla se calcula el número
de clases (o intervalos) necesarios para representar fielmente los datos.
Gráfico de frecuencia absoluta

8
7
6

Frecuencia
5 8
4
3 5
2 3 3
1 1
0
(15 - 17) (17 - 19) (19 - 21) (21 - 23) (23 - 25)
Intervalo

Clases 5.29339899
Intervalo 2

DATOS fi
(15-17) 1
(17-19) 3
(19-21) 8
(21-23) 5
(23-25) 3

3. A los mismos estudiantes se les preguntó cuántos hermanos tenían (variable cuantitativa
discreta):

0 1 4 1 2
3 2 3 1 2
0 5 4 3 2
3 2 2 0 1

Para hallar los resultados se realizan las fórmulas antes relacionadas así:
a) Media:

Se sumas los datos y se le saca el promedio.


X= 0+3+0+3+1+2+5+2+4+3+4+2+1+1+3+0+2+2+2+1=
X= 41/20=2.05
Media=2.05.
b) Mediana Muestral
Se ordenan los números de menor a mayor:

0
0
0
1
1
1
1
2
2
2
2
2
2
2
3
3
3
3
4
4
5
Me=2 porque es el número medio.
c) Moda:
Según la fórmula:

Mo= 2, porque es número que más se repite.

0
0
0
1
1
1
1
2
2
2
2
2
2
2
3
3
3
3
4
4
5

d) Varianza:
Es una medida de dispersión que representa la variabilidad de unas series de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones
Se halla mediante la siguiente fórmula:

Nro. Datos X-X’ (datos – (X-X’)<2 (suma de


X’ promedio) los cuadrados)
1 0 -2.05 4.2025
2 0 -2.05 4.2025
3 0 -2.05 4.2025
4 1 -1.05 1.1025
5 1 -1.05 1.1025
6 1 -1.05 1.1025
7 1 -1.05 1.1025
8 2 -0.05 0.0025
9 2 0.0025
-0.05
10 2 -0.05 0.0025
11 2 -0.05 0.0025
12 2 -0.05 0.0025
13 2 -0.05 0.0025
14 3 0.95 0.9025
15 3 0.95 0.9025
16 3 0.95 0.9025
17 3 0.95 0.9025
18 4 1.95 3.8025
19 4 1.95 3.8025
20 5 2.95 8.7025
Tota 41 36.95
l

La varianza es la sumatoria de los cuadrados divido entre el número de datos.


Var(x)=36.95/20
Var(x)=1.8475
e) Desviación estándar
Se obtiene sacándole raíz cuadrada a la varianza.

Var(x)= √ 1.8475=1.3592277.
f) Rango
Se resta el valor mínimo del máximo.
Rango= 5-0 = 5
g) Valor de los cuartiles.

Q1 5 1
Q2 10 2
Q3 15 3
Q4 20 5

h) Gráfica de frecuencia Absoluta

5,29339898
#clases 6
Interval
o 1

datos Frecuencia absoluta


(0-1) 3
(1- 2) 4
(2-3) 6
(3-4) 4
(4-5) 3
  20

GRAFICO DE FRECUENCIA ABSOLUTA.


frecuencia
7
6
5
4
3
2
1
0
(0 -1) (1 - 2) (2 -3)- (3-4) (4-5)

6. Instalación del programa R.


7. Presentación de gráficos Obtenidos.

a) Gráficos de variables cuantitativa continuas

PERIODO 951 - Histograma con Regla de Sturges variable edad


8
6
Frequency

4
2
0

16 18 20 22 24

edad
Explicación:
Entre los (16-18) años de edad, hay dos personas.
Entre los (18-20) años de edad, hay 8 personas.
Entre los (20-22) años de edad, hay cuatro personas.
Entre los (22-24) años de edad hay 2 personas.

PERIODO 951 - Histograma de la variable continua Edad


8
6
Frecuencia

4
2
0

14 16 18 20 22 24 26

edad

Explicación de la gráfica:

Entre los (14-16) hay una sola persona.


Entre los (16-18) hay dos personas.
Entre los (18-20) hay 8 personas.
Entre los (20-22) hay 5 personas.
Entre los (22-24) hay 3 personas.
Entre los (24-26) hay 1 persona.

PERIODO 951 - Boxplot o diagrama de cajas variable continua


24
22
Edad (años)

20
18
16
Explicación: Según la gráfica la edad mínima es de 16 años y la máxima es de 24.

El 50% tiene 20 años de edad (mediana).


El 75% tiene 22 años de edad.
El 25% está entre 16-18 años.
El restante 25% se encuentra entre los 24 años de edad.

b) Gráficos de variables cuantitativa discreta.

PERIODO 951 - Boxplot o diagrama de cajas variable discreta


5
4
n ú m e ro d e h e rm a n o s

3
2
1
0

Explicación: datos mínimo es 0 y le dato máximo es 5

El 75% de los estudiantes tiene 3 hermanos.


El 50% de los estudiantes tiene 2 hermanos.
El 25% de los estudiantes tiene 1 hermano.
El 25 % de los estudiantes tiene 5 hermanos.
PERIODO 951 - Diagrama de barras Frecuencia Absoluta
6
5
Frecuencias absolutas

4
3
2
1
0

0 1 2 3 4 5

Número de hermanos

Explicación de gráfica:
En la barra 0 indica que hay una frecuencia de 3 hermanos.
En la barra 1 indica que hay una frecuencia de 4 hermanos.
En la barra 2 indica que hay una frecuencia de 6 hermanos.
En la barra 3 indica que hay una frecuencia de 4 hermanos.
En la barra 4 indica que una frecuencia de 2 hermanos.
En la barra 5 hay una frecuencia de un solo hermano.

PERIODO 951 - Gráfico de tarta de Hermanos

2
5

Explicación: según la grafica


Un 25% de los estudiantes tiene 2 hermanos. Están identificados con color verde
Un 25% de los estudiantes tiene un (1) hermano. Están identificado con color amarillo.
Un 25% de los estudiantes tiene 3 hermanos identificado con azul menta.
Un 15% de los estudiantes tiene, no tiene hermanos. Están identificados con color rojo.
Un 5% de los estudiantes tiene 5 hermanos. Stan identificados con el color rosado.
Un 10% de los estudiantes tiene 4 hermanos. Están identificados con azul oscuro.
C) Graficas de variable cualitativa.
Diagrama de barras frecuencias absoluta nivel de estudio agricultor.

PERIODO 951 - Diagrama de barras frecuencias absolutas nivel de estudio agricultor


5
4
Frecuencias absolutas

3
2
1
0

Sin estudios Estudios Primarios Estudios Superiores

Nivel de estudio

Explicación:
Según la gráfica podemos observar que:
Entre (0-2) agricultores se encuentra sin estudio.
Entre (0-5) Realizaron completos sus estudios primarios.
Entre (0-4) completaron sus estudios secundarios.
Entre (0-3) Realizaron sus estudios superiores.
PERIODO 951 - Diagrama de barras frecuencias relativas nivel de estudio de agricultores
0.35
0.30
0.25
Frecuencias relativas

0.20
0.15
0.10
0.05
0.00

Sin estudios Estudios Primarios Estudios Superiores

Nivel de estudio

Explicación: Según la gráfica:


15% de los agricultores se encuentran sin estudios.
35% de los agricultores realizaron sus estudios primarios.
30% de los agricultores realizaron sus estudios secundarios.
20% de los agricultores realizaron sus estudios superiores.
Conclusiones

1. Se conocieron los diferentes conceptos aplicados a las variables estadísticas y se e


interpretaron sus fundamentos teóricos teniendo en cuenta que la variable es una
característica observable que puede tomar diferentes valores y pueden ser cuantitativas y
cualitativas.

2. Podemos afirmar que la estadística descriptiva describe, analiza y representa un


grupo de datos usando métodos numéricos y gráficos representando la información
contienda en ella.

3. El diagrama de cajas es un gráfico que utiliza los cuartiles para representar un


conjunto de datos, permitiendo así observar la distribución de los mismos y sus
principales características.
Bibliografías
*Matus, R., Hernández, M., & García, E. (2010). Estadística. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
ppg=1&docID=3187261&tm=1519661894239
Mecabot. (2017). El software R, una herramienta para implementar métodos numéricos.
Recuperado de: http://mecabot-ula.org/tutoriales/r-project-metodos-numericos/
Mirás M & Rodríguez E. (20181). Técnicas estadísticas con hoja de cálculo y R. Recuperado
dehttps://publicacions.uvigo.es/opencms/export/sites/publicacions/publicacions_gl/documentos/xnd
ice_y_primer_capxtulo_TECNICAS_ESTADISTICAS.pdf.
Saenz J. (2010). Métodos estadísticos con R y R comandar. Recuperado de:https://cran.r-
project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf.
Páginas web.
www.varsitytutors.com>spanish>topics.
www.ecured.cu>variable_estadistica.
WWW. Matemovil.com.>Estadística.
9. Copia de resultados obtenidos en R console

R version 4.0.5 (2021-03-31) -- "Shake and Throw"


Copyright (C) 2021 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,


o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

[Previously saved workspace restored]

> # CURSO ESTADISTICA DESCRIPTIVA (300046_951) PERIODO ACADÉMICO 16-1 DE


2021
> # CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL CODIGO R
UNIDAD 1
> # Las líneas del código que inician con el símbolo # no son comandos sino textos explicatorios
>
> # IMPORTANTE: NO MODIFIQUE NINGUNA PARTE DEL CÓDIGO
> # Si lo modifica, le puede aparecer errores
> # En este ejercicio conoceremos los principales tipos de varables que se manejan en estadística
descriptiva:
> # Variable cuantitativa continua
> # Variable cualitativa o categórica
>r # VARIABLES CUANTITATIVAS CONTINUAS
Error: objeto 'r' no encontrado
> # Son variables de mediciones en individuos u objetos como peso, edad, altura, entre muchas
otras.
> # son variables que admiten decimales.
> # En la variable de ejemplo, se le preguntó la edad a 15 estudiantes universitarios:
> r# Tenga presente que la edad es una variable continua, ya que puede admitir números decimales

> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25,20,21.5,20,22.7,19.2)
> r#Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> r#Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> rmean(edad)#media aritmética


Error in rmean(edad) : no se pudo encontrar la función "rmean"
> var(edad)#varianza
[1] 5.735684
> sd(edad)#desviación estándar
[1] 2.394929
> min(edad) #Mínimo
[1] 15
> max(edad)# Máximo
[1] 25
> rrrrange(edad) #Rango
> median(edad)# Mediana
[1] 20
> rlength(edad)# Número de datos

> quantile(edad, 0.25)# Cuantil Q1


25%
19.2
> quantile(edad, 0.75)# Cuantil Q3
75%
22
> rrquantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana
Error in rrquantile(edad, 0.5) :
no se pudo encontrar la función "rrquantile"
> rIQR(edad) #Rango intercuartílico

> sort(edad)# Ordenar


[1] 15.0 17.0 18.0 18.4 19.2 19.2 19.4 19.6 20.0 20.0 20.0 20.4 21.4 21.5 22.0
[16] 22.0 22.7 23.0 24.0 25.0
>
> ### Regla de Sturges para creación de histograma en variables continuas
> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores
perdidos
[1] 15 25
> nclass.Sturges(edad)#Número de intervalos
[1] 6
> rseq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos
Error in rseq(15, 25, length = nclass.Sturges(edad)) :
no se pudo encontrar la función "rseq"
>
RintervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRUE)
> rrintervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada

> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)

> #Histograma de la variable edad con la regla de Sturges:


> # Cuando el comando produce la gráfica, lo saca del código y lo dirige a esta.
> # Para volver al código para seguir ejecutándolo, es importante que ubique el cursor en la parte
superior del marco,
> # en donde se encuentra el nombre del archivo: "Codigo Fase 2 - Variables Estadísticas.t"
> # Si ubica el cursor dentro del texto del archivo, corre el riesgo de perder el orden que llevaba al
ejecutar el código
> # y le pueden quedar partes del código sin ejecutar.
> hist(edad,main="PERIODO 951 - Histograma con Regla de Sturges variable
edad",breaks=puntos) # este comando crea el gráfico de histograma con la regla de Sturges
>
> # Instalación libreria "agricolae":
> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del
código
> # En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"
>
> install.packages("agricolae")
Installing package into ‘C:/Users/eddie/OneDrive/Documentos/R/win-library/4.0’
(as ‘lib’ is unspecified)
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cran.microsoft.com/bin/windows/contrib/4.0/agricolae_1.3-3.zip'
Content type 'application/zip' length 1294389 bytes (1.2 MB)
downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked


The downloaded binary packages are in
C:\Users\eddie\AppData\Local\Temp\RtmpARlmKJ\downloaded_packages
> # Damos "OK" y el programa instala el paquete
> # Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté totalmente
instalada
> # Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in (muestra la
carpeta donde se guardaron)"
> # Debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda (R Console)
> # Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo
> library(agricolae)
>
> ### Gráficos de variables continuas:
> # Histograma de la variable edad
>
> hist(edad,ylab="Frecuencia",main="PERIODO 951 - Histograma de la variable continua Edad")
> # Como pueden ver, una vez instalada la libreria "agricolae" no hace falta realizar todos los pasos
que se
> # necesitaron para obtener el histograma por medio de la Regla de Sturges
> boxplot(edad,ylab="Edad (años)",main="PERIODO 951 - Boxplot o diagrama de cajas variable
continua") # Gráfico de diagrama de cajas o Boxplot
> # cantidad de datos.
> # VARIABLES CUANTITATIVAS DISCRETAS
>
> # Variables de conteos, solo toman valores en números enteros como número de hermanos, de
frutos, etc.
> # En la variable de ejemplo, se le preguntó a un curso de 15 estudiantes cuántos hermanos tenían
cada uno de ellos:
>
> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2,3,2,2,0,1)
>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:
> summary(Hermanos)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00 1.00 2.00 2.05 3.00 5.00
> min(Hermanos) #Mínimo
[1] 0
> max(Hermanos)# Máximo
[1] 5
> range(Hermanos) #Rango
[1] 0 5
> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON SUMMARY
[1] 2.05
> median(Hermanos)# Mediana
[1] 2
> length(Hermanos)# NÚMERO DE DATOS
[1] 20
> sd(Hermanos)# Desviación típica
[1] 1.394538
> quantile(Hermanos, 0.25)# Cuantil Q1
25%
1
> quantile(Hermanos, 0.75)# Cuantil Q3
75%
3
> quantile(Hermanos, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
2
> IQR(Hermanos) #Rango intercuartílico
[1] 2
> rsort(Hermanos)# Ordenar
Error in rsort(Hermanos) : no se pudo encontrar la función "rsort"
> ##En este caso las tablas de frecuencias se desarrollan por pasos:
> table(Hermanos) #Tabla de frecuencias absolutas
Hermanos
012345
346421
> fabs=table(Hermanos)##Tabla de frecuencias absolutas
> fabs
Hermanos
012345
346421
> fabsacum<-as.table(cumsum(fabs))#Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5
3 7 13 17 19 20
> frel=prop.table(table(Hermanos))#Tabla de frecuencias relativas
> frel
Hermanos
0 1 2 3 4 5
0.15 0.20 0.30 0.20 0.10 0.05
> frelacum<-as.table(cumsum(frel))#Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5
0.15 0.35 0.65 0.85 0.95 1.00
> # Podemos decir que cero hermanos tiene el 0.133 en proporción ó el 13.3% de los individuos
encuestados.
> # Las proporciones se multiplican por 100 para expresarlas en porcentaje.
>
> ##Gráficos de variables cuantitaivas discretas:
> boxplot(Hermanos,ylab="número de hermanos",main="PERIODO 951 - Boxplot o diagrama de
cajas variable discreta")
> boxplot(Hermanos,ylab="número de hermanos",main="PERIODO 951 - Boxplot o diagrama de
cajas variable discreta")
> barplot(fabs,xlab="Número de hermanos",ylab="Frecuencias absolutas",main="PERIODO 951 -
Diagrama de barras Frecuencia Absoluta")
> pie(fabs,col=rainbow(6),main=c("PERIODO 951 - Gráfico de tarta de Hermanos")) #Gráfico de
tarta
> # VARIABLES CUALITATIVAS
>
> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza, etc...
> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el color o la
raza
> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de
estudios o el estrato socioeconómico.
> # A continuación tomaremos como ejemplo la variable categórica "Nivel de estudios"
> # de los agricultores pertenecientes a una misma vereda.
> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada nivel de
estudio:
> # Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2: “Estudios Secundarios”;
3:“Estudios Superiores”
>
> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3)
>
> # Esto es lo que respondió cada agricultor ya codificado, para poderlo analizar en el programa R.
>r
Error: objeto 'r' no encontrado
> # Ahora, hay que explicarle al programa lo que significa cada número
>
> # Se le aclara que nuestra variable tiene 4 categorías, del 0 al 3:
>
> estudios=factor(estudios, levels=c(0,1,2,3),
+
+ # Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y cuál es su
etiqueta:
+
+ labels=c("Sin estudios","Estudios Primarios","Estudios Secundarios","Estudios Superiores"))
>
> estudios # Muestra lo que respondió cada agricultor y los cuatro niveles de la variable:
[1] Estudios Primarios Estudios Secundarios Sin estudios
[4] Estudios Primarios Sin estudios Estudios Primarios
[7] Estudios Primarios Estudios Secundarios Estudios Superiores
[10] Estudios Secundarios Estudios Superiores Estudios Primarios
[13] Estudios Secundarios Estudios Superiores
4 Levels: Sin estudios Estudios Primarios ... Estudios Superiores
>
> # Una vez se ha codificado exitosamente la variable, se puede analizar con R:
> # Presentar estos resultados en un cuadro y explicar:
>r
Error: objeto 'r' no encontrado
> summary(estudios)# debe aparecer cada nivel, con el número de agricultores que se encuentran en
cada uno de estos:
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
> table(estudios) #Tabla de frecuencias absolutas
estudios
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
>
> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes
> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó
inicialmente
> # En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"
> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":
>
> fabs1=table(estudios)# Tabla de frecuencias absolutas
> fabs1 # si no se le cambia el nombre, aparecería el mismo resultado que produjo en la variable
discreta
estudios
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
> frel1=prop.table(table(estudios))# Tabla de frecuencias relativas
> frel1
estudios
Sin estudios Estudios Primarios Estudios Secundarios
0.1428571 0.3571429 0.2857143
Estudios Superiores
0.2142857
>
> # Podemos decir que el 0.143 de los agricultores encuestados no tienen estudios o en proporción,
el 14.3%
> # Para pasarlo a porcentaje, se multiplica el resultado por 100
>r
Error: objeto 'r' no encontrado
> ##Gráficos de variables cualitativas
> barplot(fabs1,ylab="Frecuencias absolutas",xlab="Nivel de estudio",main="PERIODO 951 -
Diagrama de barras frecuencias absolutas nivel de estudio agricultor")
> barplot(frel1,ylab="Frecuencias relativas",xlab="Nivel de estudio",main="PERIODO 951 -
Diagrama de barras frecuencias relativas nivel de estudio de agricultores")
> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al grupo al que
pertenece.
> # Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva (para ciencias
agrarias)

También podría gustarte