Está en la página 1de 33

Fase 2 - Identificación de variables estadísticas

Participantes

Gustavo Adolfo Macias Aldana

John Sebastián Hincapié

Laura Katherine Martínez

Universidad Nacional Abierta y a Distancia (UNAD)

Estadística Descriptiva (para agrarias)

Septiembre/2020
Introducción

La variable estadística es una herramienta que nos enseña a


identificar las características o propiedades de un individuo que está
propensa a adquirir diferentes resultados. Estos resultados o valores,
a su vez, se caracterizan por poder medirse y contabilizarse, En este
trabajo abordaremos temas muy relevantes en nuestro desarrollo
universitario, puesto que temas como los conceptos básico de
probabilidad, las variables Aleatorias discretas y su distribución de
probabilidad, que nos dará capacidades de analizar explicar e
interpretar los principales datos cuantitativos y cualitativos asociados
a nuestras futuras actividades agropecuarias y ambientales, usar las
herramientas de estadística descriptiva nos ayuda en el desarrollo te
problemas en una producción agropecuaria qué puede llegar a hacer
sobresaliente y sustentable que a su vez aportaría desarrollo en la
región.
Objetivos
 adquirir el desarrollo de competencias para realizar
recomendaciones de uso y manejo de las variables estadísticas.

 Analizar y interpretar los principales datos cuantitativos y


cualitativos asociados a las actividades agrícola, pecuaria y/o
ambiental.

 desarrollar capacidades para el manejo estadístico descriptivo


de datos, mediante la estrategia de aprendizaje del estudio de
casos de la vida real

 Explicar e interpretar y conocer el manejo de diferentes


programas y herramientas de estadística descriptiva.

 Aportar soluciones eficaces en los problemas que se presenten


en una producción agropecuaria, logrando así que esta sea
resiliente y sustentable que a su vez aporta al desarrollo
regional.
¿Qué es una variable cuantitativa continua?
Se dice que una variable continua es aquella que puede asumir un
número incontable de valores.  Tanto las variables discretas, como las
continuas, son variables estadísticas cuantitativas
¿Qué es una variable cuantitativa discreta?
Hace referencia a aquella variable que puede asumir un número
contable de valores, como por ejemplo los goles en un mundial de
futbol, la cantidad de estudiantes en un salón, etc.

¿Qué es una variable cualitativa nominal?


la variable cualitativa nominal representa variantes o formas no
numéricas que no aceptan o tienen en relevancia de orden, como por
ejemplo: país donde vive: Colombia, México, España, otro ejemplo
seria, color favorito: azul, verde, rojo, amarillo, etc.
¿Qué es una variable cualitativa categórica?
También denominada variable cualitativa o variable de atributos, cuando
hablamos de una variable categórica hacemos referencia a categorías o
grupos, como por ejemplo: la marca de un celular, la nacionalidad de
una persona, etc.
¿Cuál es la diferencia entre media poblacional y media muestral?
Cuando nos referimos a media poblacional lo hacemos refiriéndonos a la
totalidad de los datos y información que tenemos para poder obtener
una estimación aproximada, cosa que es diferente con la media
poblacional, que se basa en una muestra pequeña de esa población.
¿Qué es la varianza de una población?
Se dice que es una medida de variación igual a la desviación estándar,
en otras palabras es un dato que representa la variabilidad de una serie
de datos respecto a una población
¿Qué es desviación estándar?
Es la medida o el dato de dispersión mas común, y este normalmente
indica que tan dispersos están los datos.
¿Qué es la Regla de Sturges? ¿para qué sirve?
Básicamente es una regla practica que trata sobre el numero de clases
que deben considerar al elaborar un histograma, y este numero se da
por la expresión c=1+ log2 (M) donde M es el tamaño de dicha muestra y
sirve para determinar el numero de clases o intervalos que son
necesarios para representar gráficamente un conjunto de datos
estadísticos.

¿Qué es frecuencia absoluta?


No es una medida útil para hacer comparaciones, la frecuencia absoluta
de una variable básicamente es el numero de veces que aparece en la
muestra dicho valor de la variable, por ejemplo: 15 profesores que
pertenecen a la universidad UNAD.
¿Qué es frecuencia relativa?
Cuando hablamos de la frecuencia relativa nos referimos a el cociente
entre la fuerza absoluta de un determinado valor y el número de datos,
esta se puede expresar en tantos por ciento y se representa por n, la
suma de las frecuencias relativas es igual a 1.

¿Qué es frecuencia relativa acumulada?


Básicamente es el resultado de sumar las frecuencias relativas de las
observaciones y valores de una población y muestra, esta representa
por siglas hi
¿Cuál es la diferencia entre una tabla de frecuencias absolutas
de una variable continua y de una discreta?
la diferencia se basa en que las tablas de frecuencia absolutas de una
variable continua pueden tomar todos los valores de un intervalo, en
cambio en las discretas se toman los valores aislados.

¿Qué es un Boxplot o diagrama de cajas, para qué sirve?

En general es un tipo de gráfico que nos muestra un resumen de una


gran cantidad de información en cinco medidas descriptivas, que nos
ayuda a intuir su morfología y simetría.
A estos gráficos nos permite identificar valores que sean diferentes y
comparar como están distribuidos.

En qué tipo de variables se usa el histograma. o. En qué tipo de


variables se usa el gráfico de barras.
Un histograma es una gráfica adecuada para representar variables
continuas, pero también se puede usar para variables discretas. Eso
quiere decir que mediante un histograma se puede ilustrar gráficamente
la distribución de una variable cuantitativa o numérica

2. Con los siguientes datos de la variable cuantitativa continua


“Edad”:
18.4 19.2 19.6 23 20
20.4 19.4 21.4 18 24
17 22 15 22 25

Hallar:

a. Media.
Tomamos los datos, los sumamos y luego los dividimos por el numero de datos existentes

18.4 +19.2 +19.6 +23+ 20+ 20.4 +19.4 +21.4 +18+ 24+ 17 +22 +15 +22+ 25= 304.4

304.4 / 15 = 20.29 media

b. Mediana.
Tomar los datos y ordenarlos de menor a mayor, el dato que se encuentre en el centro será la
mediana

15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 23, 24, 25

19.6+20=39.6/2= 19.8 mediana

c. Moda.

El dato que mas se repite será la moda en este caso 22

18.4, 19.2 , 19.6, 23, 20, 20.4, 19.4, 21.4, 18, 24, 17, 22, 15, 22, 25,

Xi X Xi - X
15 20.2 5.2 27.4
17 20.2 3.2 10.24
18 20.2 2.2 4.8
18.4 20.2 1.8 3.24
19.2 20.2 -1 0.64
19.6 20.2 -0.6 0.36
20 20.2 0.2 0.4
20.4 20.2 0.2 0.4
21.4 20.2 1.2 1.44
22 20.2 2 4
23 20.2 2.8 7.81
24 20.2 3.8 14.44
25 20.2 4.8 23.04
22 20.2 2 4
d. Varianza. 107.88

S2= Ʃ( Xi – X ) = 107.88

S2= Ʃ(107.88)
15-1
2=
S 7.70 variacion estandar

e. Desviación estándar.
S2=

S2= 2.77 Desviación estándar

f. Rango de datos.

Al mayor de los datos se le resta el menor de los datos, eso quiere decir:

R=ma x x −minx

R=¿ 25 – 15 = 10 Rango de datos

g. Indicar el valor de los cuatro cuartiles.

15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25

Q1 Q2 Q3
18.4 20 22
25% 50% 75%
Es decir que el 25% tiene menos de 18.4 o 18.4 años

Es decir que el 50% tiene menos de 20 años o 20 años

Es decir que el 75% tiene menos de 22 años o 22 años

h. Realice el gráfico de frecuencia absoluta utilizando la regla de

Sturges.

18.4, 19.2 , 19.6, 23, 20, 20.4, 19.4, 21.4, 18, 24, 17, 22, 15, 22, 25,

R: = 10 Rango de datos
K : intervalos
A i : amplitud

La regla de Sturges nos dice: K=1+ 3,322 Log n n= numero de datos

es decir: K = 1 + 3,322 Log 15


k = 5.32 intervalos
aproximamos al número menor en este caso 5 pero y si es impar entonces
sería el mayor en este caso no se aplica asi que es 5

R 10
A i: k Ai5=2 R: = 10
K:5
A i :2

clases X F Fr F
15. - 17 16 1 0.06 1

17 - 19 18 3 0.2 4

19 - 21 20 5 0.33 9

21 - 23 22 4 0.26 13

23 - 25 24 2 0.13 15
18+20
X = promedio de los intervalos es decir x= 2
= 19 y así sucesivamente

F = frecuencia absoluta, es el numero de veces que se repite un dato es decir


por ejemplo del 18 al 20 sin contar el 20 : por ejemplo entre 15. Y 17 sin
incluir el 17
18.4, 19.2 , 19.6, 23, 20, 20.4, 19.4, 21.4, 18, 24, 17, 22, 15, 22,
25,
Solo esta el 15.
fi 15 1
0.99
Fr= frecuencia relativa Fr = n Fr 15
=0.06 y así sucesivamente.

F= frecuencia absoluta acomulada, esto quiere decir que el resultado se da


por la suma de las frecuencias una a una es decir 1+3=4, 4+5=9, 9+4=13, 13+
2 = 15.

3)

0 1 4 1 2
3 2 3 1 2
0 5 4 3 2

MEDIA: 0+1+4+1+2+3+2+3+1+2+0+5+4+3+2= 2,2


MEDIANA: 0-0-1-1-1-2-2-2-2-3-3-3-4-4-5= 2
MODA: 2
VARIANZA: 2,13
DESVIACION ESTANDAR: 29,824
RANGO DE DATOS: 5-0= 5
VALOR DE LOS CUARTILES= Q 1=4 , Q 2=8 , Q 3=12
Gráficos de variable cuantitativa continua

PERIODO 764 - Histograma con Regla de Sturges variable edad


5
4
3
Frequency

2
1
0

16 18 20 22 24

edad

Descripción del gráfico:

Un histograma es un grafico muy utilizado en estadística descriptiva, en particular un histograma


con regla de Sturges es un método usado para determinar el numero de clases que deben existir
en un histograma de frecuencias, para así poder clasificar un cierto conjunto de datos que
representan una población o muestra.

Análisis de resultado:

Este es el histograma de la variable edad usando la regla de Sturges, vemos que los datos se
organizaron en cinco niveles, también podemos observar que la mayor frecuencia de los datos se
organizó entre 20 y 22, también podemos observar claramente que los demás grupos se
organizaron en la frecuencia 2, los valores mas bajos de edad y los mas altos presentan las
frecuencias mas bajas.

PERIODO 764 - Histograma de la variable continua Edad


5
4
Frecuencia

3
2
1
0

14 16 18 20 22 24 26

edad

Descripción del gráfico

básicamente es una gráfica que distribuye un conjunto de datos de manera organizada, en un tipo
especial de grafica de barras, y cada barra representa un subconjunto de datos, en este tipo de
graficas podemos observar la acumulación o tendencia, la variabilidad o dispersión y la forma de
distribución de los datos.

Análisis de resultado
En este histograma observamos seis grupos de datos con diferentes frecuencia, los datos que
presentan mayor frecuencia son los 18-20 y 20-22 los cuales alcanzaron frecuencias 4 y 5
respectivamente, en cambio los datos que presentaron menores frecuencias fueron los 14-16 y
24-26 dando asi una frecuencia de 1 respectivamente.

PERIODO 764 - Boxplot o diagrama de cajas variable continua


24
22
Edad (años)

20
18
16

Descripción del gráfico:

Un bloxplot o diagrama de caja de variable continua, es una forma de presentación estadística,


destinada a resaltar aspectos de distribución de observaciones de una o varias series de datos
cuantitativos y en este caso de variables continuas, en otras palabras este tipo de gráficos nos
permite resumir, describir y analizar aspectos generales y particulares de cierto tipo de datos.

Análisis de resultado:
En este diagrama de cajas podemos interpretar que la mediana se encuentra en 20 años esta
corresponde al 50% de los datos y esta corresponde a la línea gruesa que divide la caja, el cuartil
primero nos indica la edad de 19 o menos aproximadamente y el cuartil tercero nos indica la edad
de 20 a 22, y el cuartil cuarto nos indica edades de 22 a 26 años,

Gráficos de variable cuantitativa discreta

PERIODO 764 - Boxplot o diagrama de cajas variable discreta


5
4
número de hermanos

3
2
1
0

Descripción del gráfico:

En este bloxplot o diagrama de caja de variable discreta, nos enseña una forma de presentación
estadística, destinada a resaltar aspectos de distribución de observaciones de una o varias series
de datos cuantitativos y en este caso de variables discretas, en otras palabras, este tipo de gráficos
nos permite resumir, describir y analizar aspectos generales y particulares de cierto tipo de datos.
Análisis de resultado:

este diagrama de cajas nos indica cierta cantidad de hermanos, dándonos el primer cuartil en uno
o menos, el segundo cuartil en dos o menos el tercer cuartil en tres o menos y el ultimo cuartil es
más amplio dándonos cinco o menos, nos indica también la mediana, representada por la línea
más gruesa del gráfico, esta nos muestra su valor central el cual da como resultado dos.

PERIODO 764 - Diagrama de barras Frecuencia Absoluta


4
3
Frecuencias absolutas

2
1
0

0 1 2 3 4 5

Número de hermanos

Descripción del gráfico:

en términos generales un diagrama de barras se utiliza para representar datos


cualitativos o datos cuantitativos de tipo discreto, este tipo de diagrama está formado
por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los
valores de la variable.

Análisis de resultado:

En este diagrama de barras observamos seis grupos de datos (0, 1, 2, 3, 4, 5) con diferentes
frecuencia, los datos que presentan mayor frecuencia son el 2, que indica la mayor frecuencia en
la cantidad de hermanos, la cual constituye la mediana, dos de estos datos el 1 y el 3 indican una
frecuencia de 3, nos indica la moda, por ser el dato que mas se repite.
PERIODO 764 - Diagrama de barras Frecuencia relativa
0.25
0.20
Frecuencias relativas

0.15
0.10
0.05
0.00

0 1 2 3 4 5

Número de hermanos

Descripción del gráfico:

En un diagrama de barras se utiliza para representar ciertos datos cualitativos o cuantitativos, en


este caso se expresa con datos de la variable colocados en el eje horizontal, representando los
valores de variable, y sobre el eje vertical los datos de frecuencias relativas, tos estos se muestran
a mediante barras de una altura proporcional a la frecuencia.
Análisis de resultado:

En esta grafica de frecuencias observamos las frecuencias relativas que que se expresa en
números decimales, en los valores de variable, encontramos 6 datos (0, 1, 2, 3, 4, 5) numero de
hermanos, el dato 2 de la variable indica una frecuencia de 0.25, que indica la mediana, y
constituye la mas alta sifra de frecuencia, el dato 1 y 3 indican frecuencias de 0.20.

PERIODO 764 - Diagrama de barras Frecuencias relativas acumuladas


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

0 1 2 3 4 5

Número de hermanos

Descripción del grafico:

Como ya se a indicado anteriormente, en términos generales un diagrama de barras se


utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto, este tipo
de diagrama está formado por barras rectangulares cuya altura es proporcional a la
frecuencia de cada uno de los valores de la variable, pero en este diagrama de
frecuencias acumuladas, esta representación grafica corresponde con la de una función
constante de los valores numero de hermanos.

Análisis de resultado:

En esta grafica calculamos primero la frecuencia absoluta y la frecuencia relativa, de los valores de
la población que estamos manejando, par lograr esto se han ordenado como se muestra en la
imagen, de menor a mayor y se forma el diagrama de frecuencias relativas acumuladas, en este
diagrama observamos de menor a mayor los datos de la muestra, siendo 0 el menor de los datos y
5 el mayor de estos.

PERIODO 764 - Gráfico de tarta de Hermanos

0
2

4
3

Descripción del gráfico:


un grafico de tarta, en este caso esta relacionado con datos de cantidad de
hermanos, este tipo de grafico es un recurso estadístico que se utiliza para
representar porcentajes y proporciones, en muchas ocasiones es más
sencillo hacer un gráfico circular con números enteros, si tenemos decimales
los vamos a redondear, también sirve para representar variables cualitativas o
discretas y se utiliza para representar la proporción de elementos de cada uno
de los valores de la variable.

Análisis de resultado:

En este grafico de tipo tarta, se representa por medio de colores la cantidad de


hermanos que cada estudiante tiene, observando que la mayor parte la tiene el
valor de 2 hermanos.
En otras palabras, podemos decir que la tarta esta divida en 15 cuales están
dividas de la siguiente manera:
Verde: tiene 4 partes equivalentes a la cantidad de estudiantes que tienen 2
hermanos.
Azul Turquesa: tiene 3 partes equivalentes a la cantidad de estudiantes que
tienen 3 hermanos.
Amarillo: tiene 3 partes equivalentes a la cantidad de estudiantes que tienen 1
hermano.
Azul: tiene 2 partes equivalentes a la cantidad de estudiantes que tienen 4
hermanos.
Rojo: tiene 2 partes equivalente a la cantidad de estudiantes que no tienen
hermanos.
Violeta: tiene 1 parte equivalente a la cantidad de estudiante que tiene 5
hermanos.

Gráficos de variable cualitativa

PERIODO 764 - Diagrama de barras frecuencias absolutas nivel de estudio agricultor


5
4
Frecuencias absolutas

3
2
1
0

Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

Nivel de estudio

Descripción del grafico:

Este es Un típico diagrama de barras que se utiliza para representar datos


cualitativos o datos cuantitativos de tipo discreto, en este caso se colocan los
valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas,

Análisis de resutado:
En esta grafica se representan los datos recogidos respecto a los estudios
realizados por una población de agricultores a la que se le hizo la encuesta,
donde mas del 86% de los encuestados tienen estudios primarios y solo el
14% no tienen estudios. También la gráfica esta divida en 4 secciones.

De este modo la grafica se puede leer de la siguiente manera:


14,28% de los agricultores (2 de la población total) no tienen estudios básicos.
35,71% de los agricultores (5 de la población total) tienen estudios primarios.
28,57% de los agricultores (4 de la población total) tienen estudios
secundarios.
20% de los agricultores (3 de la población total) tienen estudios superiores.

PERIODO 764 - Diagrama de barras frecuencias relativas nivel de estudio de agriculto


0 .0 0 0 .0 5 0 .1 0 0 .1 5 0 .2 0 0 .2 5 0 .3 0 0 .3 5
F re c u e n c ia s re la tiv a s

Sin estudios Estudios Secundarios

Nivel de estudio

Descripción del grafico:

Como ya se a indicado anteriormente, en términos generales un diagrama de


barras se utiliza para representar datos cualitativos o datos cuantitativos de
tipo discreto, este tipo de diagrama está formado por datos referentes a
niveles de estudio, pero con frecuencias relativas.
Análisis de resultado:

En esta tabla se expresa la frecuencia relativa de los valores recogidos en la


anterior teniendo en cuenta que la frecuencia relativa, la cual siempre va a ser
menor de la muestra total, por eso en la vemos que está representada de 0.00
a 0.35. Donde el valor mayor es la mas grande como referencia al grado de
estudios alcanzados.

Conclusiones
El desarrollo del presente trabajo colaborativo no da las herramientas
que nos ayudaran en la correcta identificación de las variables
estadísticas, también nos permite como futuros zootecnistas realizar la
recolección, organización y procesamiento de variables tanto cualitativas
como cuantitativas con ayuda del software R, que nos aporta una
introducción a los principales conceptos de probabilidad y las principales
distribuciones de probabilidad, todo esto usado a la aplicación en las
ciencias agrarias.

Referencias bibliográficas
 García, P. A. (2015). La interpretación de los datos: Una introducción a
la estadística aplicada. Recuperado de:
https://elibronet.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802

 Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad


Nacional de Colombia, recuperado de:
http://red.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_102_02.
html. Licencia: Creative Commons BY-NC-ND.

 Romero, E. (2016). Estadística para todos. Análisis de datos: estadística


descriptiva, teoría de la probabilidad e inferencia. Ediciones Pirámide. 4
Disponible en:
https://elibronet.bibliotecavirtual.unad.edu.co/es/ereader/unad/49136

Copia de los resultados que aparecen en R Console, después de


ejecutar la totalidad del código.

R version 4.0.2 (2020-06-22) -- "Taking Off Again"

Copyright (C) 2020 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.


>

> # CURSO ESTADISTICA DESCRIPTIVA (300046_764) PERIODO ACADÉMICO 16-4 DE 2020

>

> # CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL CODIGO R UNIDAD 1

>

> # Recuerde que para ejecutar cada una de las líneas del código debe digitar "Control+r"

> # Recuerde siempre ejecutarlo en orden, de arriba hacia abajo

>

> # Las líneas del código que inician con el símbolo # no son comandos sino textos explicatorios

>

> # IMPORTANTE: NO MODIFIQUE NINGUNA PARTE DEL CÓDIGO

> # Si lo modifica, le puede aparecer errores

> # Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y descárguelo
nuevamente

>

> # En este ejercicio conoceremos los principales tipos de varables que se manejan en estadística
descriptiva:

> # Variable cuantitativa continua

> # Variable cuantitativa discreta

> # Variable cualitativa o categórica

>

> # VARIABLES CUANTITATIVAS CONTINUAS

>

> # Son variables de mediciones en individuos u objetos como peso, edad, altura, entre muchas
otras.

> # son variables que admiten decimales.

> # En la variable de ejemplo, se le preguntó la edad a 15 estudiantes universitarios:

> # Tenga presente que la edad es una varible continua, ya que puede admitir números decimales

> # Por ejemplo, alguien que tenga 15 años y 6 meses, es equivalente a una edad de 15.5 años.
>

> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25)

>

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> summary(edad)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

15.00 18.80 20.00 20.29 22.00 25.00

> mean(edad)#media aritmética

[1] 20.29333

> var(edad)#varianza

[1] 7.182095

> sd(edad)#desviación estándar

[1] 2.679943

> min(edad) #Mínimo

[1] 15

> max(edad)# Máximo

[1] 25

> range(edad) #Rango

[1] 15 25

> median(edad)# Mediana

[1] 20

> length(edad)# Número de datos

[1] 15

> quantile(edad, 0.25)# Cuantil Q1

25%

18.8

> quantile(edad, 0.75)# Cuantil Q3

75%
22

> quantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

20

> IQR(edad) #Rango intercuartílico

[1] 3.2

> sort(edad)# Ordenar

[1] 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4 21.4 22.0 22.0 23.0 24.0 25.0

>

> ### Regla de Sturges para creación de histograma en variables continuas

> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores


perdidos

[1] 15 25

> nclass.Sturges(edad)#Número de intervalos

[1] 5

> seq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos

[1] 15.0 17.5 20.0 22.5 25.0

> intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRUE)

> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada

[1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (17.5,20] (20,22.5] (17.5,20]

[8] (20,22.5] (17.5,20] (22.5,25] [15,17.5] (20,22.5] [15,17.5] (20,22.5]

[15] (22.5,25]

Levels: [15,17.5] (17.5,20] (20,22.5] (22.5,25]

> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)

>

> #Histograma de la variable edad con la regla de Sturges:

> # Cuando el comando produce la gráfica, lo saca del código y lo dirige a esta.

> # Para volver al código para seguir ejecutándolo, es importante que ubique el cursor en la parte
superior del marco,
> # en donde se encuentra el nombre del archivo: "Codigo Fase 2 - Variables Estadísticas.t"

> # Si ubica el cursor dentro del texto del archivo, corre el riesgo de perder el orden que llevaba al
ejecutar el código

> # y le pueden quedar partes del código sin ejecutar.

> hist(edad,main="PERIODO 764 - Histograma con Regla de Sturges variable edad",breaks=puntos)


# este comando crea el gráfico de histograma con la regla de Sturges

>

> # Instalación libreria "agricolae":

> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del
código

> # Esta es la forma de instalar desde el editor:

>

> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar USA(IA)

Installing package into ‘C:/Users/GUSTAVO MACIAS/Documents/R/win-library/4.0’

(as ‘lib’ is unspecified)

--- Please select a CRAN mirror for use in this session ---

probando la URL 'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/agricolae_1.3-


3.zip'

Content type 'application/zip' length 1294485 bytes (1.2 MB)

downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

Error in unpackPkgZip(foundpkgs[okp, 2L], foundpkgs[okp, 1L], lib, libs_only, :

ERROR: failed to lock directory ‘C:\Users\GUSTAVO MACIAS\Documents\R\win-library\4.0’ for


modifying

Try removing ‘C:\Users\GUSTAVO MACIAS\Documents\R\win-library\4.0/00LOCK’

>

> # Damos "OK" y el programa instala el paquete

> # Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté totalmente
instalada
> # Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in (muestra la
carpeta donde se guardaron)"

> # Debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda (R Console)

> # Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> library(agricolae)

>

> ### Gráficos de variables continuas:

> # Histograma de la variable edad

>

> hist(edad,ylab="Frecuencia",main="PERIODO 764 - Histograma de la variable continua Edad")

> hist(edad,ylab="Frecuencia",main="PERIODO 764 - Histograma de la variable continua Edad")

>

> # Como pueden ver, una vez instalada la libreria "agricolae" no hace falta realizar todos los pasos
que se

> # necesitaron para obtener el histograma por medio de la Regla de Sturges

> boxplot(edad,ylab="Edad (años)",main="PERIODO 764 - Boxplot o diagrama de cajas variable


continua") # Gráfico de diagrama de cajas o Boxplot

> # El boxplot organiza los datos de menor a mayor y los agrupa en cuatro cuartiles, donde cada
uno tiene la misma

> # cantidad de datos.

>

> # VARIABLES CUANTITATIVAS DISCRETAS

>

> # Variables de conteos, solo toman valores en números enteros como número de hermanos, de
frutos, etc.

> # En la variable de ejemplo, se le preguntó a un curso de 15 estudiantes cuántos hermanos


tenían cada uno de ellos:

>

> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2)

>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> summary(Hermanos)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.0 1.0 2.0 2.2 3.0 5.0

> min(Hermanos) #Mínimo

[1] 0

> max(Hermanos)# Máximo

[1] 5

> range(Hermanos) #Rango

[1] 0 5

> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON SUMMARY

[1] 2.2

> median(Hermanos)# Mediana

[1] 2

> length(Hermanos)# NÚMERO DE DATOS

[1] 15

> sd(Hermanos)# Desviación típica

[1] 1.473577

> quantile(Hermanos, 0.25)# Cuantil Q1

25%

> quantile(Hermanos, 0.75)# Cuantil Q3

75%

> quantile(Hermanos, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

> IQR(Hermanos) #Rango intercuartílico


[1] 2

> sort(Hermanos)# Ordenar

[1] 0 0 1 1 1 2 2 2 2 3 3 3 4 4 5

> ##En este caso las tablas de frecuencias se desarrollan por pasos:

> table(Hermanos) #Tabla de frecuencias absolutas

Hermanos

012345

234321

> fabs=table(Hermanos)##Tabla de frecuencias absolutas

> fabs

Hermanos

012345

234321

> fabsacum<-as.table(cumsum(fabs))#Frecuencias absolutas acumuladas

> fabsacum

0 1 2 3 4 5

2 5 9 12 14 15

> frel=prop.table(table(Hermanos))#Tabla de frecuencias relativas

> frel

Hermanos

0 1 2 3 4 5

0.13333333 0.20000000 0.26666667 0.20000000 0.13333333 0.06666667

> frelacum<-as.table(cumsum(frel))#Frecuencias relativas acumuladas

> frelacum

0 1 2 3 4 5

0.1333333 0.3333333 0.6000000 0.8000000 0.9333333 1.0000000

> # Podemos decir que cero hermanos tiene el 0.133 en proporción ó el 13.3% de los individuos
encuestados.

> # Las proporciones se multiplican por 100 para expresarlas en porcentaje.


>

> ##Gráficos de variables cuantitaivas discretas:

> boxplot(Hermanos,ylab="número de hermanos",main="PERIODO 764 - Boxplot o diagrama de


cajas variable discreta")

> barplot(fabs,xlab="Número de hermanos",ylab="Frecuencias absolutas",main="PERIODO 764 -


Diagrama de barras Frecuencia Absoluta")

> barplot(frel,xlab="Número de hermanos",ylab="Frecuencias relativas",main="PERIODO 764 -


Diagrama de barras Frecuencia relativa")

> barplot(frelacum,xlab="Número de hermanos",ylab="Frecuencias relativas",main="PERIODO 764


- Diagrama de barras Frecuencias relativas acumuladas")

> pie(fabs,col=rainbow(6),main=c("PERIODO 764 - Gráfico de tarta de Hermanos")) #Gráfico de


tarta

>

> # VARIABLES CUALITATIVAS

>

> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza, etc...

> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el color o
la raza

> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de
estudios o el estrato socioeconómico.

> # A continuación tomaremos como ejemplo la variable categórica "Nivel de estudios"

> # de los agricultores pertenecientes a una misma vereda.

> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada nivel de
estudio:

> # Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2: “Estudios Secundarios”;


3:“Estudios Superiores”

>

> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3)

>

> # Esto es lo que respondió cada agricultor ya codificado, para poderlo analizar en el programa R.

>

> # Ahora, hay que explicarle al programa lo que significa cada número
>

> # Se le aclara que nuestra variable tiene 4 categorías, del 0 al 3:

>

> estudios=factor(estudios, levels=c(0,1,2,3),

+ # Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y cuál es su
etiqueta:

+ labels=c("Sin estudios","Estudios Primarios","Estudios Secundarios","Estudios Superiores"))

>

> estudios # Muestra lo que respondió cada agricultor y los cuatro niveles de la variable:

[1] Estudios Primarios Estudios Secundarios Sin estudios

[4] Estudios Primarios Sin estudios Estudios Primarios

[7] Estudios Primarios Estudios Secundarios Estudios Superiores

[10] Estudios Secundarios Estudios Superiores Estudios Primarios

[13] Estudios Secundarios Estudios Superiores

4 Levels: Sin estudios Estudios Primarios ... Estudios Superiores

>

> # Una vez se ha codificado exitosamente la variable, se puede analizar con R:

> # Presentar estos resultados en un cuadro y explicar:

>

> summary(estudios)# debe aparecer cada nivel, con el número de agricultores que se encuentran
en cada uno de estos:

Sin estudios Estudios Primarios Estudios Secundarios

2 5 4

Estudios Superiores

> table(estudios) #Tabla de frecuencias absolutas

estudios

Sin estudios Estudios Primarios Estudios Secundarios


2 5 4

Estudios Superiores

>

> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes

> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó
inicialmente

> # En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"

> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":

>

> fabs1=table(estudios)# Tabla de frecuencias absolutas

> fabs1 # si no se le cambia el nombre, aparecería el mismo resultado que produjo en la variable
discreta

estudios

Sin estudios Estudios Primarios Estudios Secundarios

2 5 4

Estudios Superiores

> frel1=prop.table(table(estudios))# Tabla de frecuencias relativas

> frel1

estudios

Sin estudios Estudios Primarios Estudios Secundarios

0.1428571 0.3571429 0.2857143

Estudios Superiores

0.2142857

>

> # Podemos decir que el 0.143 de los agricultores encuestados no tienen estudios o en
proporción, el 14.3%

> # Para pasarlo a porcentaje, se multiplica el resultado por 100

>
> ##Gráficos de variables cualitativas

> barplot(fabs1,ylab="Frecuencias absolutas",xlab="Nivel de estudio",main="PERIODO 764 -


Diagrama de barras frecuencias absolutas nivel de estudio agricultor")

> barplot(frel1,ylab="Frecuencias relativas",xlab="Nivel de estudio",main="PERIODO 764 -


Diagrama de barras frecuencias relativas nivel de estudio de agricultores")

>

> #Les deseamos éxitos en la ejecución de este ejercicio.

> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al grupo al
que pertenece.

> # Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva (para ciencias
agrarias)

También podría gustarte