Está en la página 1de 35

ESTADÍSTICA DESCRIPTIVA

FASE 2

GRUPO COLABORATIVO
300046_8

Realizado por:
DIDIER ARLEY BOTERO RUIZ CÓDIGO 1.022.033.417
YENIDFER PARRA RAMÍREZ CÓDIGO 1.119.585.143
DANIELA PAREJA VALLEJO CÓDIGO 1.047.972.048
YURANIS OSORIO CODIGO 23.183.325

UNIVERSIDAD NACIONAL ABIERTA


Y A DISTANCIA UNAD
AGRONOMÍA
2020
INTRODUCCION

Podemos definir la estadistica como un conjunto de herramientas matematicas las cuales


utilizamos para determinar cietos fenomenos, la estadistica parte de una informacion
detallada a la cual se le realiza un registro para poder ser analizada y examinada con el fin
de tomar asi las mejores decisiones.

Las medidas de tendencia central tienen como objetivo determinar la posición donde se
agrupan la mayor cantidad de datos, las medidas más utilizados son media, mediana,
quartiles y moda. Fuente especificada no válida.

Las medidas de dispersión sirven para cuantificar la variabilidad de una muestra de datos
las medidas más usadas son la varianza, la desviación estándar y el rango. Fuente
especificada no válida.

Con la realizacion de este trabajo se busca interpretar los fundamentos de los tipos de
variables estadisticas cualitativas y cuantitativas, ademas de que se logre comprender,
analizar y profundizar en los temas abordados, favoreciendo el aprendizaje y trabajo
colaborativo y autonomo.
OBJETIVOS

 Obtener conocimientos basicos sobre la estadistica descriptiva


 Fortalecimiento de conceptos presentes en la unidad 2 Estadistica Descriptiva
 Interpretar los tipos de variables estadisticas cuantitativas y cualitativas
 Realcionar la informacion suministrada contenida en datos, tablas o graficos
 Trabajar en grupo para conocer a los compañeros
RESOLVER LAS SIGUIENTES PREGUNTAS:

a) ¿Qué es una variable cuantitativa continua?

RTA/ Las Variables cuantitativas continuas son aquellas que se identifican ya que estas las
identificamos porque adoptan valores numéricos, es decir las identificamos con cifras.

b) ¿Qué es una variable cuantitativa discreta?

RTA/Las variables cuantitativas discretas, son aquellas que adquieren valores los cuales
están separados entre sí en una escala. Dicho de otro modo, no existen otros valores entre
los valores específicos que la variable adquiere.

c) ¿Qué es una variable cualitativa nominal?

RTA/Una variable cualitativa nominal presenta modalidades no numéricas que no admiten


un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado,


divorciado y viudo

d) ¿Qué es una variable cualitativa categórica?

RTA/Las variables categóricas se pueden identificar como variables cualitativas o variables


de atributos, las podemos identificar con ejemplos como masculino y/o femenino.
e) Cuál es la diferencia entre media poblacional y media muestral.?

RTA/La media poblacional es toda la totalidad de los datos para realizar la estimación,
mientras que la media muestral se basa en una muestra significativa de esa población.

f) ¿Qué es la varianza de una población?

RTA/ la varianza es una técnica que se utiliza para decidir si las medias entre dos o más
poblaciones iguales. Esta técnica se basa en una muestra única, que se obtiene a partir de
los datos recolectados de cada población, este análisis nos sirve para determinar las
diferencias El análisis de varianza puede servir para determinar si las diferencias entre las
medias entre los valores.

g) Qué es desviación estándar.?

RTA/ Esta es la medida de dispersión más común, la cual nos ayuda a identificar que tan
dispersos están los datos a la media. Mientras mayor sea la desviación estándar, mayor será
la dispersión de los datos.

h) Qué es la Regla de Sturges ¿para qué sirve?

RTA/La regla de stuges es utilizada para establecer el número de intervalos que se


necesitan para representar gráficamente un conjunto de datos estadísticos, con esta regla se
determina el ancho de los contenedores gráficos, de los histogramas de frecuencia.

esta regla de Sturges es aplicada especialmente en la estadística, ya que esta permite


realizar una distribución de frecuencias a través del cálculo del número de clases, así como
la longitud de cada una de estas, conocida también como amplitud.

i) ¿Qué es frecuencia absoluta?


RTA/Es una medida estadística que nos da información acerca de la cantidad de veces que
se repite un suceso al realizar un número determinado de experimentos. Esta se representa
mediante las letras fi. La letra f se refiere a la palabra frecuencia y la letra i se refiere a la
realización i-esima del experimento aleatorio.

j) ¿Qué es frecuencia relativa?

RTA/La frecuencia relativa es una medida estadística la cual se calcula como el coeficiente
de la frecuencia absoluta de algún valor de la población/muestra (fi) entre el total de valores
que componen la población/muestra (N)

Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin
ella no podríamos obtener la frecuencia relativa.

k) ¿Qué es frecuencia relativa acumulada?

RTA/ La frecuencia acumulada es el resultado de la suma de las frecuencias relativas de las


diferentes muestras. Esta se representa por las siglas Hi.

Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia
absoluta (fi) y la frecuencia (hi) de los valores de la población o muestra.

l) ¿Cuál es la diferencia entre una tabla de frecuencias absoluta de una


variable continua y de una discreta?

RTA/la diferencia es que, para realizar una tabla de frecuencias absolutas de una variable
discreta, primero que todo se ordenan los valores de menor a mayor y se calcularía la
frecuencia absoluta para cada uno, posteriormente la suma de todas las frecuencias
absolutas es igual al total de datos utilizados; por otro lado para realizar una tabla de
frecuencias absolutas de una variable continua los valores se ordenan de menor a mayor,
pero en este caso dado que la variable es continua y podría tomar cualquier valor de un
espacio continuo inapreciable, hay que agrupar las variables por intervalos.
m) ¿Qué es un Boxplot o diagrama de cajas, para qué sirve?
RTA/El diagrama de caja y bigotes (box and whisker plot en inglés) es un gráfico que
permite representar de forma gráfica la mediana y los cuartiles de un grupo de datos y se
utiliza para entender como están distribuidos los datos.

n) ¿En qué tipo de variables se usa el histograma?

RTA/Un histograma es una gráfica adecuada para representar variables continuas, aunque
también se puede usar para variables discretas. Es decir, mediante un histograma se puede
mostrar gráficamente la distribución de una variable cuantitativa o numérica.

o) ¿En qué tipo de variables se usa el gráfico de barras?

RTA/ Un gráfico de barras sirve para resumir un conjunto de datos por categorías. Nos
muestra los datos usando varias barras de la misma anchura, cada una de las cuales
representa una categoría concreta. La altura de cada barra es proporcional a una agregación
especifica

1- Con los siguientes datos de la variable cuantitativa continua Edad: 18.4; 19.2;
19.6; 23; 20; 20.4; 19.4; 21.4; 18; 24; 17; 22; 15; 22; 25.

18,4 19,2 19,6 23 20


20,4 19,4 21,4 18 24
17 22 15 22 25

Hallar:
a. Media
 Realizar la suma de todos los datos
18.4+19.2+19.6+ 23+20+20.4+ 19.4+21.4+ 18+24+17+ 22+ 15+22+ 25=304,4
 Dividir la suma obtenida entre la cantidad de datos
186
M= =20.293
15
RTA: la media es de 20.293

RTA/ 20,293

b. MEDIANA.

 Ordenar los números de menor a mayor


15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
 Como la cantidad de datos es impar entonces utilizamos la formula
Mediana= X n+1 = X 15+1 =X 8 =20
2 2

RTA/ 20.
c. MODA
Ordenar los datos de menor a mayor
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
Seleccionar el dato que más se repite

RTA/ 22

d. VARIANZA

 Realizar la suma al cuadrado

( 15−20,293 )2+ (17−20,293 )2 + ( 18−20,293 )2+ (18,4−20,293 )2 +¿

( 19,2−20,293 )2 + ( 19,4−20,293 )2 + ( 19,6−20,293 )2+ ( 20−20,293 )2 +¿

( 20,4−20,293 )2 + ( 21,4−20,293 )2+ ( 22−20,293 )2 + ( 22−20,293 )2 +¿

( 23−20,293 )2+ ( 24−20,293 )2+ (25−20,293 )2=100,549

RTA/ 7,182095238

e. DESVIACIÓN ESTÁNDAR

RTA/ 2,679943141
f. RANGO DE DATOS
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
El rango es la resta del mayor dato menos el menor dato
R=Max−Min=25−15=10
RTA/ 10
g. VALOR DE LOS CUATRO CUARTILES
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
 Para el primer cuartil realizar el siguiente calculo
Q 1=X n +1 =X 15 +1 =X 4 =18.4
4 4

Q 2=X 2 ( n+1) = X 2 (15+1 )= X 8=20


4 4

Q 3= X 3 (n+1 ) =X 3 (15+1 ) =X 12=22


4 4

RTA/ Q1 ¼ 25% :18.4


Q2 50%: 20
Q3 75%:22
h. GRAFICO DE FRECUENCIA ABSOLUTA REGLA DE
STURGES

Histograma con Regla de Sturges variable edad PERIODO 763


5
4
Frequency

3
2
1
0

16 18 20 22 24

edad

2.Con los siguientes datos de la variable cuantitativa discreta “Número de hermanos”:


0; 1; 4; 1; 2; 3; 2; 3; 1; 2; 0; 5; 4; 3; 2.

0 1 4 1 2
3 2 3 1 2
0 5 4 3 2
a) MEDIA

Realizar la suma de todos los datos de la tabla


0+1+ 4+1+2+3+ 2+ 3+1+ 2+ 0+5+ 4+3+2=33
Dividir la suma obtenida entre la cantidad de datos
33
media= =2,2
15

RTA/2,2

b) MEDIANA

Ordenar los datos de menor a mayor


0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
 Como la cantidad de datos es impar entonces utilizamos la formula
Mediana= X n+1 = X 15+1 =X 8 =2
2 2

RTA/2

c) MODA
Ordenar los datos de menor a mayor
0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
Buscar el dato que más se repite
El 0 se repite 2 veces
El 1 se repite 3 veces
El 2 se repite 4 veces
El 3 se repite 3 veces
El 4 se repite 2 veces
El 5 se repite una vez

RTA/2

d) VARIANZA

Realizar la suma al cuadrado

( 0−2,2 )2+ ( 0−2,2 )2 + ( 1−2,2 )2 + ( 1−2,2 )2+ ( 1−2,2 )2+ (2−2,2 )2

+ ( 2−2,2 )2+ ( 2−2,2 )2+ ( 2−2,2 )2 + ( 3−2,2 )2 + ( 3−2,2 )2+ ( 3−2,2 )2

+ ( 4−2,2 )2+ ( 4−2,2 )2+ ( 5−2,2 )2=30.4


Restar el resultado de la suma entre el número de datos
30.4
var= =2,026
15
RTA/2,02666667
e) DESVIACIÓN ESTÁNDAR

RTA/1,4735768

f) RANGO DE DATOS
0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
R=Max−Min=5−0=5
RTA/5
g) VALOR DE LOS CUATRO CUARTILES

0 0 1 1 1
2 2 2 2 3
3 3 4 4 5

 Para el primer cuartil realizar el siguiente calculo


Q 1=X n +1 =X 15 +1 =X 4 =1
4 4

Q 2=X 2 ( n+1) = X 2 (15+1 )= X 8=2


4 4

Q 3= X 3 (n+1 ) =X 3 (15+1 ) =X 12=3


4 4

RTA/Q1 25% :1
Q2 50% :2
Q3 75%:3
Q4: 5
h) GRAFICO DE FRECUENCIA ABSOLUTA

Diagrama de barras Frecuencia Absoluta PERIODO 763


4
Frecuencias absolutas

3
2
1
0

0 1 2 3 4 5

Número de hermanos

En el grafico identificamos la frecuencia absoluta del número de


hermanos que tiene cada uno de los estudiantes.
GRAFICO DE NUMERO DE HERMANOS DE LOS ESTUDIANTES

Grafico de tarta de Hermanos PERIODO 763

0
2

3
VARIABLE CONTINUA DE LA EDAD DE LOS ESTUDIANTES

Histograma de la variable continua Edad PERIODO 763


5
4
F re c u e n c ia

3
2
1
0

14 16 18 20 22 24 26

edad

Boxplot o diagrama de cajas variable continua


24
E d a d (a ñ o s )

22
20
18
16
DIAGRAMA DE BARRAS DE FRECUENCIA RELATIVA DEL NUMERO
DE HERMANOS DE LOS ESTUDIANTES

Diagrama de barras Frecuencia relativa PERIODO 763


0.25
0.20
Frecuencias relativas

0.15
0.10
0.05
0.00

0 1 2 3 4 5

Número de hermanos
GRAFICO DE FRECUENCIAS RELATIVAS ACUMULADAS DEL
NUMERO DE HERMANOS DE LOS ESTUDIANTES

Diagrama de barras Frecuencias relativas acumuladas PERIODO 763


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

0 1 2 3 4 5

Número de hermanos
DIAGRAMA DE BARRAS DE FRECUENCIA ABSOLUTA DEL NUMERO
DE HERMANOS DE LOS ESTUDIANTES
en el cual se identifica que hay 4 estudiantes que tienen 2 hermanos,
también encontramos 3 estudiantes que tiene cada uno de 1 hermano,
que 3 estudiantes tienen cada uno 3 hermanos, hay 2 estudiantes que
no tienen hermanos, hay 2 estudiantes que tienen 4 hermanos y 1
estudiante que tiene 5 hermanos.

Diagrama de barras Frecuencia Absoluta PERIODO 763


4
3
Frecuencias absolutas

2
1
0

0 1 2 3 4 5

Número de hermanos
DIAGRAMA DE CAJAS VARIABLE DISCRETA DEL NUMERO DE
HERMANOS DE LOS ESTUDIANTES

Boxplot o diagrama de cajas variable discreta PERIODO 763


5
4
número de hermanos

3
2
1
0

RESULTADO DE LA CONSOLA R
R version 4.0.1 (2020-06-06) -- "See Things Now"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,


o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
[Previously saved workspace restored]
>
> # CURSO ESTADISTICA DESCRIPTIVA (300046_763) PERIODO ACADÉMICO 8-3
DE 2020
>
> # CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL
CODIGO R UNIDAD 1
>
> # Recuerde que para ejecutar cada una de las líneas del código debe digitar "Control+r"
> # Recuerde siempre ejecutarlo en orden, de arriba hacia abajo
>
> # Las líneas del código que inician con el símbolo # no son comandos sino textos
explicatorios
>
> # IMPORTANTE: NO MODIFIQUE NINGUNA PARTE DEL CÓDIGO
> # Si lo modifica, le puede aparecer errores
> # Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y
descárguelo nuevamente
>
> # En este ejercicio conoceremos los principales tipos de varables que se manejan en
estadística descriptiva:
> # Variable cuantitativa continua
> # Variable cuantitativa discreta
> # Variable cualitativa o categórica
>
> # VARIABLES CUANTITATIVAS CONTINUAS
>
> # Son variables de mediciones en individuos u objetos como peso, edad, altura, entre
muchas otras.
> # son variables que admiten decimales.
> # En la variable de ejemplo, se le preguntó la edad a 15 estudiantes universitarios:
> # Tenga presente que la edad es una varible continua, ya que puede admitir números
decimales
> # Por ejemplo, alguien que tenga 15 años y 6 meses, es equivalente a una edad de 15.5
años.
> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25)
>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada
uno de ellos:
> summary(edad)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
15.00 18.80 20.00 20.29 22.00 25.00
> mean(edad)#media aritmética
[1] 20.29333
> var(edad)#varianza
[1] 7.182095
> sd(edad)#desviación estándar
[1] 2.679943
> min(edad) #Mínimo
[1] 15
> max(edad)# Máximo
[1] 25
> range(edad) #Rango
[1] 15 25
> median(edad)# Mediana
[1] 20
> length(edad)# Número de datos
[1] 15
> quantile(edad, 0.25)# Cuantil Q1
25%
18.8
> quantile(edad, 0.75)# Cuantil Q3
75%
22
> quantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
20
> IQR(edad) #Rango intercuartílico
[1] 3.2
> sort(edad)# Ordenar
[1] 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4 21.4 22.0 22.0 23.0 24.0 25.0
>
> ### Regla de Sturges para creación de histograma en variables continuas
> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de
valores perdidos
[1] 15 25
> nclass.Sturges(edad)#Número de intervalos
[1] 5
> seq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos
[1] 15.0 17.5 20.0 22.5 25.0
>
intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=T
RUE)
> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada
[1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (17.5,20] (20,22.5] (17.5,20]
[8] (20,22.5] (17.5,20] (22.5,25] [15,17.5] (20,22.5] [15,17.5] (20,22.5]
[15] (22.5,25]
Levels: [15,17.5] (17.5,20] (20,22.5] (22.5,25]
> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)
>
> #Histograma de la variable edad con la regla de Sturges:
> # Cuando el comando produce la gráfica, lo saca del código y lo dirige a esta.
> # Para volver al código para seguir ejecutándolo, es importante que ubique el cursor en la
parte superior del marco,
> # en donde se encuentra el nombre del archivo: "Codigo Fase 2 - Variables Estadísticas.t"
> # Si ubica el cursor dentro del texto del archivo, corre el riesgo de perder el orden que
llevaba al ejecutar el código
> # y le pueden quedar partes del código sin ejecutar.
> hist(edad,main="Histograma con Regla de Sturges variable edad PERIODO
763",breaks=puntos) # este comando crea el gráfico de histograma con la regla de Sturges
> utils:::menuInstallPkgs()
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/agricolae_1.3-3.zip'
Content type 'application/zip' length 1292649 bytes (1.2 MB)
downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\Usuario\AppData\Local\Temp\RtmpYbvUOY\downloaded_packages
>
> # Instalación libreria "agricolae":
> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes
comandos del código
> # Esta es la forma de instalar desde el editor:
> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar
USA(IA)
Installing package into ‘C:/Users/Usuario/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/agricolae_1.3-3.zip'
Content type 'application/zip' length 1292649 bytes (1.2 MB)
downloaded 1.2 MB
package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\Usuario\AppData\Local\Temp\RtmpYbvUOY\downloaded_packages
> # Damos "OK" y el programa instala el paquete
> # Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté
totalmente instalada
> # Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in
(muestra la carpeta donde se guardaron)"
> # Debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda (R
Console)
> # Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)"
en color rojo
> library(agricolae)
>
> ### Gráficos de variables continuas:
> # Histograma de la variable edad
> hist(edad,ylab="Frecuencia",main="Histograma de la variable continua Edad PERIODO
763")
> # Como pueden ver, una vez instalada la libreria "agricolae" no hace falta realizar todos
los pasos que se
> # necesitaron para obtener el histograma por medio de la Regla de Sturges
> boxplot(edad,ylab="Edad (años)",main="Boxplot o diagrama de cajas variable continua")
# Gráfico de diagrama de cajas o Boxplot
> # El boxplot organiza los datos de menor a mayor y los agrupa en cuatro cuartiles, donde
cada uno tiene la misma
> # cantidad de datos.
> # VARIABLES CUANTITATIVAS DISCRETAS
>
> # Variables de conteos, solo toman valores en números enteros como número de
hermanos, de frutos, etc.
> # En la variable de ejemplo, se le preguntó a un curso de 15 estudiantes cuántos
hermanos tenían cada uno de ellos:
>
> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2)
>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada
uno de ellos:
> summary(Hermanos)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 1.0 2.0 2.2 3.0 5.0
> min(Hermanos) #Mínimo
[1] 0
> max(Hermanos)# Máximo
[1] 5
> range(Hermanos) #Rango
[1] 0 5
> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON
SUMMARY
[1] 2.2
> median(Hermanos)# Mediana
[1] 2
> length(Hermanos)# NÚMERO DE DATOS
[1] 15
> sd(Hermanos)# Desviación típica
[1] 1.473577
> quantile(Hermanos, 0.25)# Cuantil Q1
25%
1
> quantile(Hermanos, 0.75)# Cuantil Q3
75%
3
> quantile(Hermanos, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
2
> IQR(Hermanos) #Rango intercuartílico
[1] 2
> sort(Hermanos)# Ordenar
[1] 0 0 1 1 1 2 2 2 2 3 3 3 4 4 5
> ##En este caso las tablas de frecuencias se desarrollan por pasos:
> table(Hermanos) #Tabla de frecuencias absolutas
Hermanos
012345
234321
> fabs=table(Hermanos)##Tabla de frecuencias absolutas
> fabs
Hermanos
012345
234321
> fabsacum<-as.table(cumsum(fabs))#Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5
2 5 9 12 14 15
> frel=prop.table(table(Hermanos))#Tabla de frecuencias relativas
> frel
Hermanos
0 1 2 3 4 5
0.13333333 0.20000000 0.26666667 0.20000000 0.13333333 0.06666667
> frelacum<-as.table(cumsum(frel))#Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5
0.1333333 0.3333333 0.6000000 0.8000000 0.9333333 1.0000000
> # Podemos decir que cero hermanos tiene el 0.133 en proporción ó el 13.3% de los
individuos encuestados.
> # Las proporciones se multiplican por 100 para expresarlas en porcentaje.
>
> ##Gráficos de variables cuantitaivas discretas:
> boxplot(Hermanos,ylab="número de hermanos",main="Boxplot o diagrama de cajas
variable discreta PERIODO 763")
> barplot(fabs,xlab="Número de hermanos",ylab="Frecuencias
absolutas",main="Diagrama de barras Frecuencia Absoluta PERIODO 763")
> barplot(frel,xlab="Número de hermanos",ylab="Frecuencias relativas",main="Diagrama
de barras Frecuencia relativa PERIODO 763")
> barplot(frelacum,xlab="Número de hermanos",ylab="Frecuencias
relativas",main="Diagrama de barras Frecuencias relativas acumuladas PERIODO 763")
> pie(fabs,col=rainbow(6),main=c("Grafico de tarta de Hermanos PERIODO
763"))#Gráfico de tarta
>
> # VARIABLES CUALITATIVAS
> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza,
etc...
> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el
color o la raza
> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de
estudios o el estrato socioeconómico.
> # A continuación tomaremos como ejemplo la variable categórica "Nivel de estudios"
> # de los agricultores pertenecientes a una misma vereda.
> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada
nivel de estudio:
> # Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2: “Estudios
Secundarios”; 3:“Estudios Superiores”
>
> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3)
>
> # Esto es lo que respondió cada agricultor ya codificado, para poderlo analizar en el
programa R.
>
> # Ahora, hay que explicarle al programa lo que significa cada número
>
> # Se le aclara que nuestra variable tiene 4 categorías, del 0 al 3:
>
> estudios=factor(estudios, levels=c(0,1,2,3),
+
+ # Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y cuál
es su etiqueta:
+
+ labels=c("Sin estudios","Estudios Primarios","Estudios Secundarios","Estudios
Superiores"))
>
> estudios # Muestra lo que respondió cada agricultor y los cuatro niveles de la variable:
[1] Estudios Primarios Estudios Secundarios Sin estudios
[4] Estudios Primarios Sin estudios Estudios Primarios
[7] Estudios Primarios Estudios Secundarios Estudios Superiores
[10] Estudios Secundarios Estudios Superiores Estudios Primarios
[13] Estudios Secundarios Estudios Superiores
4 Levels: Sin estudios Estudios Primarios ... Estudios Superiores
>
> # Una vez se ha codificado exitosamente la variable, se puede analizar con R:
> # Presentar estos resultados en un cuadro y explicar:
>
> summary(estudios)# debe aparecer cada nivel, con el número de agricultores que se
encuentran en cada uno de estos:
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
> table(estudios) #Tabla de frecuencias absolutas
estudios
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
>
> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes
> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó
inicialmente
> # En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"
> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":
>
> fabs1=table(estudios)# Tabla de frecuencias absolutas
> fabs1 # si no se le cambia el nombre, aparecería el mismo resultado que produjo en la
variable discreta
estudios
Sin estudios Estudios Primarios Estudios Secundarios
2 5 4
Estudios Superiores
3
> frel1=prop.table(table(estudios))# Tabla de frecuencias relativas
> frel1
estudios
Sin estudios Estudios Primarios Estudios Secundarios
0.1428571 0.3571429 0.2857143
Estudios Superiores
0.2142857
>
> # Podemos decir que el 0.143 de los agricultores encuestados no tienen estudios o en
proporción, el 14.3%
> # Para pasarlo a porcentaje, se multiplica el resultado por 100
>
> ##Gráficos de variables cualitativas
> barplot(fabs1,ylab="Frecuencias absolutas",xlab="Nivel de estudio",main="Diagrama de
barras frecuencias absolutas nivel de estudio agricultor PERIODO 763") #
> barplot(frel1,ylab="Frecuencias relativas",xlab="Nivel de estudio",main="Diagrama de
barras frecuencias relativas nivel de estudio de agricultores PERIODO 763")
>
> #Les deseamos éxitos en la ejecución de este ejercicio.
> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al
grupo al que pertenece.
> # Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva (para
ciencias agrarias)
>
CONCLUSIONES

 El desarrollo de esta actividad nos ayudó a adentrarnos en el ambiente que nos


brinda la estadística, lo cual nos servirá mucho en nuestra vida de profesionales.
 Identificamos e indagamos en muchos conceptos importantes en la estadística.
 Logramos trabajar en grupo apoyándonos en los conocimientos y fortalezas de cada
uno con el fin de aprender y lograr realizar la actividad de la mejor manera.
REFERENCIAS BIBLIOGRÁFICAS

Romero, E. (2016). Estadística para todos. Análisis de datos: estadística descriptiva, teoría


de la probabilidad e inferencia. Ediciones Pirámide. Disponible en: https://ebookcentral-
proquest-com.bibliotecavirtual.unad.edu.co/lib/unadsp/detail.action?
docID=4569980&query=estad%C3%ADstica+descriptiva

García, P. A. (2014). La interpretación de los datos: Una introducción a la estadística


aplicada. Recuperado de https://ebookcentral-proquest-
com.bibliotecavirtual.unad.edu.co/lib/unadsp/reader.action?
docID=3227747&query=introducci%C3%B3n+a+la+estad%C3%ADstica+

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad Nacional de


Colombia, http://red.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_102_02.html.

Matus, R., Hernández, M., & García, E. (2010). Estadística. Recuperado de:


http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
ppg=1&docID=3187261&tm=1519661894239

También podría gustarte