Está en la página 1de 34

FASE 2 - IDENTIFICACIÓN DE VARIABLES ESTADÍSTICAS

JAIR SNAIDER MEZA GOMEZ

1096211437

CODIGO (300046A_954)

TUTOR

LUIS ALBERTO CACERES TORRES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS AGRÍCOLAS PECUARIAS Y DEL MEDIO AMBIENTE


ECAPMA

AGRONOMIA

2021
INTRODUCCIÓN

En el siguiente trabajo se realiza los ejercicios propuestos de la Fase 2 -


Identificación en los cuales tiene como objetico proporcionar un aprendizaje
relacionado a la estadística descriptiva en ciencias agrarias. por lo tanto, en la
primera actividad se explica con propias palabras conceptos fundamentales de la
estadística descriptiva, como por ejemplo cuales son los tipos de variables y como
se hallan las medidas estadísticas y que contienen las tablase de frecuencias, la en
la actividad 2 se resuelve un problema con el cual se tiene unos datos para variables
aleatorias continuas, hallando las medidas de tendencia central, dispersión y
posición , además de un grafico que es un histograma para variables cuantitativas
continuas, en la actividad 3 se calculan las mismas medidas de la actividad 2 pero
a partir de un problema relacionado con una variable aleatoria discreta en la cual se
realiza una tabla de frecuencias para esta con su respectivo gráfico ,ya en la
actividad 4 y 5 se realizan ejercicios en el software R en los cuales se hallan gráficos
para una mejor comprensión e interpretación y para finalizar a partir de todo lo visto
se lleva a cabo un análisis de la vida diaria.
OBJETIVOS

• Interpretar los fundamentos de los tipos de variables estadísticas


cuantitativas y cualitativas y su forma de procesamiento

• Realizar recomendaciones de uso y manejo de las variables estadísticas

• Aplicar lo aprendido de estadística descriptiva en la solución de problemas


de la vida diaria.
1. Explicar en sus propias palabras:

a. Qué es una variable cuantitativa continua.


R/Es una variable que solo puede tomar valores numéricos y estos son valores
correspondientes a números reales, por ejemplo, la estatura.

b. Qué es una variable cuantitativa discreta.


R/Es una variable que solo pueden tomar valores numéricos y estos son valores
correspondientes a números enteros, es decir pueden ser representados por los
números naturales como por ejemplo numero de prendas de vestir que posee
una persona.
c. Qué es una variable cualitativa nominal.
R/Es una variable que representa una cualidad no necesariamente ordenada
como por ejemplo el nombre de las personas.
d. Qué es una variable cualitativa categórica.
R/ Es una variable que representa una cualidad necesariamente ordenada como
por ejemplo el el estrato socioeconómico

e. Cuál es la diferencia entre media poblacional y media muestral.


R/La media poblacional es el valor esperado de una variable aleatoria, en cambio
la media muestral es el promedio de la muestra que se obtiene a partir de una
variable aleatoria.

f. Qué es la varianza de una población. ¿Cómo se obtiene?

R/Es una medida de dispersión que representa la variabilidad de una serie de


datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones. Se obtiene mediante la
formula:

∑(𝑋𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
g. Qué es desviación estándar. ¿Cómo se obtiene? R/Es decir, la raíz cuadrada
de varianza, que representa que tan dispersos están los datos con respecto a la
media. Se obtiene mediante la formula.
∑(𝑋𝑖 − 𝑥̅ )2
𝜎=√
𝑛
h. Qué es la Regla de Sturges ¿para qué sirve?
R/En estadística descriptiva la Regla de Sturges es un criterio muy utilizado
cuando se quiere realizar una tabla de frecuencias ya que con esta regla se
calcula el número de clases (o intervalos) necesarios para representar fielmente
los datos. Se obtiene mediante la formula.

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 1 + 3,3𝐿𝑂𝐺10 (𝑛)

i. Qué es frecuencia absoluta.


R/Frecuencia absoluta es el número de veces que se repite un resultado en el
conjunto de todos los observados

j. Qué es frecuencia relativa.


R/es la proporción de cada frecuencia absoluta, es decir es el número de veces
que se produce ese resultado (frecuencia absoluta) dividido por el número total
de datos observados

k. Qué es frecuencia relativa acumulada.

R/Es el resultado de ir sumando las frecuencias relativas de las observaciones


o valores de una población o muestra

l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable


continua y de una discreta?
R/ Que en la tabla de frecuencias absolutas de una variable continua las clases
de cada frecuencia se agrupan por intervalos, en cambio para la variable discreta
las clases se agrupan puntualmente por el numero especifico
m. Qué es un Boxplot o diagrama de cajas. ¿Para qué sirve?

R/Se utiliza para representar gráficamente una serie de datos numéricos a través
de sus cuartiles. De esta manera, se muestran a simple vista la mediana y los
cuartiles de los datos,1 y también pueden representarse sus valores atípicos.

n. ¿En qué tipo de variables se usa el histograma?


R/En variables cuantitativas continuas
o. ¿En qué tipo de variables se usa el gráfico de barras?
R/ En variables cuantitativas discretas o cualitativas.
2. En el municipio de Siachoque en el departamento de Boyacá, las principales
actividades agropecuarias son el cultivo de papa y la cría de ganado criollo para
la producción de leche; sin embargo, se ha evidenciado que en las últimas
décadas la población joven ya no opta por trabajar en el campo, razón por la cual
se realizó un muestreo de 30 campesinos que se dedican a la actividad
agropecuaria dentro del municipio y se les preguntó su edad:

63,4 69,6 74,7 54,9 74,5


79,4 61,8 36,5 79,3 77,8
64,6 68,3 35,9 49,3 60,5
59,1 71,8 45,8 71,9 75,4
68,6 56,3 49,6 72,8 62,3
50,4 55,9 65,4 71,2 79,2

La edad es una variable cuantitativa continua, ya que esta se puede medir en años,
meses y días, pero para analizarla se debe pasar a números decimales; por
ejemplo, una edad de 20 años y 6 meses equivale a 20.5 años.

X Datos
ordenados
1 63,4 35,9 0,0196
2 79,4 36,5 251,5396
3 64,6 45,8 1,1236
4 59,1 49,3 19,7136
5 68,6 49,6 25,6036
6 50,4 50,4 172,6596
7 69,6 54,9 36,7236
8 61,8 55,9 3,0276
9 68,3 56,3 22,6576
10 71,8 59,1 68,2276
11 56,3 60,5 52,4176
12 55,9 61,8 58,3696
13 74,7 62,3 124,5456
14 36,5 63,4 731,1616
15 35,9 64,6 763,9696
16 45,8 65,4 314,7076
17 49,6 68,3 194,3236
18 65,4 68,6 3,4596
19 54,9 69,6 74,6496
20 79,3 71,2 248,3776
21 49,3 71,8 202,7776
22 71,9 71,9 69,8896
23 72,8 72,8 85,7476
24 71,2 74,5 58,6756
25 74,5 74,7 120,1216
26 77,8 75,4 203,3476
27 60,5 77,8 9,2416
28 75,4 79,2 140,6596
29 62,3 79,3 1,5376
30 79,2 79,4 245,2356
total 1906,2 4304,512

a. Media muestral.

∑ 𝑥𝑖 1906,2
𝑥̅ = = = 63,54
𝑛 30
R/ La media muestral de la edad de los campesinos es de 63,54.

b. Mediana muestral.

𝑁 30
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = = 15
2 2
64,6 + 65,4
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = 65
2
R/ La mediana muestral de la edad de los campesinos es de es de 65.

c. Varianza.

∑(𝑋𝑖 − 𝑥̅ )2 4304,512
𝜎2 = = = 143,484
𝑛 30
R/ La varianza de la edad de los campesinos es de 143,484.
d. Desviación estándar.

∑(𝑋𝑖 − 𝑥̅ )2
𝜎=√ = √143,484 = 11,9785
𝑛
R/ La desviación con respecto al promedio de los campesinos es de 11,9785.

e. Rango de datos.

𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑑𝑎𝑡𝑜 𝑚𝑖𝑛𝑖𝑚𝑜 = 43,5


R/El rango de la edad es de 43,5

f. Indicar el valor de los cuatro cuartiles.

• Cuartil 1

𝑁 + 1 30 + 1
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄1 = = = 7,75
4 4
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 1 = 54,9 + (0,75 ∗ (55,9 − 54,9)) = 55,65
R/ El cuartil 1 es de 55,65
• Cuartil 2

2 ∗ (𝑁 + 1) 2(30 + 1)
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄2 = = = 15,5
4 4

𝑐𝑢𝑎𝑟𝑡𝑖𝑙 2 = 64,6 + (0,5 ∗ (65,4 − 64,6)) = 65


R/ El cuartil 2 es de 65
• Cuartil 3

3 ∗ (𝑁 + 1) 3 ∗ (30 + 1)
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄3 = = = 23,25
4 4
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 3 = 72,8 + (0,5 ∗ (74,5 − 72,8)) = 73,225
R/ El cuartil 3 es de 73,225

g. Realice el gráfico de frecuencia absoluta utilizando la regla de Sturges.

datos(n) 30
Dato máximo 79,4
Dato mínimo 35,9
rango=dato
máximo -dato
mínimo 43,5

#𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 =
1 + 3,3𝐿𝑂𝐺10 (𝑛) =
5,874500141

#de intervalos 6

Amplitud=rango/#I 7,25

Distribución de frecuencias
n intervalos x=(Li+Ls) /2 f
frecuencia
L inferior L superior marca de clase absoluta
1 35,9 43,15 39,53 2
2 43,15 50,4 46,78 4
3 50,4 57,65 54,03 3
4 57,65 64,9 61,28 6
5 64,9 72,15 68,53 7
6 72,15 79,4 75,78 8
total 30
Histograma
9 8
8 7
frecuencia absoluta

7 6
6
5 4
4 3
3 2
2
1
0
43,15 50,4 57,65 64,9 72,15 79,4
35,9 43,15 50,4 57,65 64,9 72,15
Edad

3. A los mismos campesinos se les indagó del número de personas que convivían
con ellos (variable cuantitativa discreta):

6 6 8 3 8
7 4 7 8 7
5 9 5 4 3
9 9 5 5 4
6 7 7 6 9
4 9 6 3 7

Se realiza la tabla de frecuencia.


X f F
Número Frecuenci Frecuenci
de a Absoluta a Absoluta
personas Acumulad 𝑋𝑖 ∗ 𝑓𝑖 (𝑋𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
que a
convivían
con ellos
3 3 3 9 30,72
4 4 7 16 19,36
5 4 11 20 5,76
6 5 16 30 0,2
7 6 22 42 3,84
8 3 25 24 9,72
9 5 30 45 39,2
total 30 186 108,8

a. Media muestral.

∑ 𝑥𝑖 𝑓ⅈ 186
𝑥̅ = = = 6,2
𝑛 30
R/ La media de la del número de personas que convivían con los campesinos
b. Media muestral

𝑁 30
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = = = 15
2 2

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 6
R/la mediana muestral del número de personas que convivían con los campesinos
es de 6

c. Moda.

𝑀𝑜𝑑𝑎 = 𝑑𝑎𝑡𝑜 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒


𝑀𝑜𝑑𝑎 = 7

R/ la moda muestral del número de personas que convivían con los campesinos
es de 7

d. Varianza.

∑(𝑋𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖 108,8
2
𝜎 = = = 3,627
𝑛 30
R/ La varianza del número de personas que convivían con los campesinos es del
3,627.

e. Desviación estándar.
∑(𝑋𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝜎=√ = √3,627 = 1,9044
𝑛

R/ La desviación con respecto al trabajo del numero de personas que convivían


con los campesinos es de 1,9044.

f. Rango de datos.

𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑑𝑎𝑡𝑜 𝑚𝑖𝑛𝑖𝑚𝑜 = 6

R/ El rango con respecto al trabajo del numero de personas que convivían con los
campesinos es de 6.

g. Indicar el valor de los tres cuartiles.

• Cuartil 1

𝐾𝑁 1 ∗ 30
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄1 = = = 7,5
4 4
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 1 = 5

R/El 25% o menos del número de personas que convivían con los campesinos es
de 5

• Cuartil 2

𝐾𝑁 2 ∗ 30
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄2 = = = 15
4 4
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 2 = 6

R/El 50% o menos del número de personas que convivían con los campesinos es
de 6

• Cuartil 3

𝐾𝑁 3 ∗ 30
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄3 = = = 22,5
4 4
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 3 = 8

R/El 75% o menos del número de personas que convivían con los campesinos es
de 8.
h. Realice el gráfico de frecuencia absoluta.

Diagrama de barras del numero de personas que


convivían con los campesinos
7
6
6
5 5
5
4 4
4
3 3
fi

3
2
1
0
3 4 5 6 7 8 9
número de personas

Se puede observar que la frecuencia más grande de personas que convivían con
los campesinos es de 7, además que las menores frecuencias están en 4 y 8 con
una frecuencia de 3 personas viviendo en la misma vivienda.

4. Por último, se les preguntó si contaban en sus viviendas con alcantarillado,


pozo séptico o ninguno de los anteriores:

2 1 2 1 2
1 1 2 2 3
3 3 2 2 1
1 2 3 1 2
3 2 3 3 3
2 3 2 3 2
Para poder analizar los datos e ingresarlos al software de análisis estadístico,
estos se codificaron de la siguiente manera:

1= alcantarillado
2= pozo séptico
3= ninguno

VARIABLES CUALITATIVAS

Son variables atribuibles a aspectos cualitativos no numéricos, como el color, el


grado de calidad, la raza, etc...

continuación tomaremos como ejemplo la variable categórica "Vivienda"

30 agricultores se les preguntó si contaban con alcantarillado en sus viviendas

Para poder codificar lo que cada agricultor respondió, se le asigna un número a


cada respuesta:

raza de ganado: 1: alcantarillado; 2: pozo séptico; 3: ninguno de los dos

vivienda=c(2,1,2,1,2,1,1,2,2,3,3,3,2,2,1,1,2,3,1,2,3,2,3,3,3,2,3,2,3,2)

Se le aclara que nuestra variable tiene 3 categorías, del 1 al 3:


vivienda=factor(vivienda, levels=c(1,2,3),

Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y
cuál es su etiqueta:

labels=c("alcantarillado","pozo séptico","ninguno"))

vivienda # Muestra lo que respondió cada agricultor y los tres niveles de la variable:

1. pozo séptico alcantarillado pozo séptico alcantarillado pozo séptico

2. alcantarillado alcantarillado pozo séptico pozo séptico ninguno

3. ninguno ninguno pozo séptico pozo séptico alcantarillado

4. alcantarillado pozo séptico ninguno alcantarillado pozo séptico

5. ninguno pozo séptico ninguno ninguno ninguno

6. pozo séptico ninguno pozo séptico ninguno pozo séptico

7. Levels: alcantarillado pozo séptico ninguno


Una vez se ha codificado exitosamente la variable, se puede analizar con R:

Hay que tener cuidado cuando se va a usar un comando que ya se había usado
antes
Es importante cambiarle el nombre, o va a producir los resultados para los que se
creó inicialmente
En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"
Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":

Tabla de frecuencias absolutas:

fabs1=table(vivienda)
fabs1
vivienda

alcantarillado pozo séptico ninguno


7 13 10

Tabla de frecuencias relativas:


frel1=prop.table(table(vivienda))
frel1
vivienda
alcantarillado pozo séptico ninguno
0.2333333 0.4333333 0.3333333

GRÁFICOS DE VARIABLES CUALITATIVAS

Diagrama de barras frecuencias absolutas:

barplot(fabs1,ylab="Frecuencias absolutas",xlab="Disposición de aguas


negras",main="PERIODO 954 - Diagrama de barras frecuencias absolutas")
Diagrama de barras frecuencias relativas:
barplot(frel1,ylab="Frecuencias relativas",xlab="Disposición de aguas
negras",main="PERIODO 954 - Diagrama de barras frecuencias relativas")
5. Ejecute el script de la Fase 2 en el Programa R (más adelante se explica todo el
proceso) y presente los gráficos obtenidos; para ello, cuando le aparezca un
gráfico debe dar click derecho sobre este y seleccionar “copiar como metafile”
para posteriormente pegarlo en el informe.

a. Gráficos de variable cuantitativa continua i. Histograma de la variable continua


Edad

Boxplot o diagrama de cajas variable continua

b. Gráficos de variable cuantitativa discreta

1. Boxplot o diagrama de cajas variable discreta


2. Diagrama de barras Frecuencia Absoluta
3. Diagrama de barras Frecuencia relativa
4. Diagrama de barras Frecuencias relativas acumuladas
5. Gráfico de tarta de Hermanos
c. Gráficos de variable cualitativa i. Diagrama de barras frecuencias absolutas
aguas residuales

Diagrama de barras frecuencias relativas aguas residuales

Los gráficos para presentar se deben dividir en tres secciones:

Cada gráfico debe ir en una página aparte, acompañado de una explicación del
gráfico (qué es y para qué sirve el gráfico descrito) y la descripción de los resultados
que allí se presentan (indicar la mayor frecuencia, las menores frecuencias, etc…).
Recuerde que no debe pegar “pantallazos” de los gráficos sino copiarlos y pegarlos
para que se puedan visualizar de manera adecuada.

CURSO ESTADISTICA DESCRIPTIVA (300046_954) PERIODO ACADÉMICO


16-4 DE 2021

CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL


CODIGO R UNIDAD 1

Recuerde que para ejecutar cada una de las líneas del código debe digitar
"Control+r"
Recuerde siempre ejecutarlo en orden (línea por línea), de arriba hacia abajo

Las líneas del código que inician con el símbolo # no son comandos sino textos
explicatorios

IMPORTANTE: NO MODIFIQUE NINGUNA PARTE DEL CÓDIGO


Si lo modifica, le puede aparecer errores
Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y
descárguelo nuevamente

En este ejercicio conoceremos los principales tipos de variables que se manejan


en estadística descriptiva:
Variable cuantitativa continua
Variable cuantitativa discreta
Variable cualitativa o categórica
VARIABLES CUANTITATIVAS CONTINUAS

Se usan para mediciones de unidades como peso, edad, altura, entre muchas
otras.
son variables que admiten decimales.
para el ingreso de los datos, se usa el signo punto (.) para los decimales y la coma
(,) para separar cada dato y no se deja espacio entre números:

edad=c(63.4,69.6,74.7,54.9,74.5,79.4,61.8,36.5,79.3,77.8,64.6,68.3,35.9,49.3,60.5
,59.1,71.8,45.8,71.9,75.4,68.6,56.3,49.6,72.8,62.3,50.4,55.9,65.4,71.2,79.2)

Instalación libreria "agricolae":


Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes
comandos del código
En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"
También puede seleccionar los que encuentra al final de la lista, que inician con la
palabra "USA"
Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté
totalmente instalada
Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in
(muestra la carpeta donde se guardaron)"
Debe aparecer nuevamente el cursor rojo en la consola de resultados a la
izquierda (R Console)

install.packages("agricolae")
WARNING: Rtools is required to build R packages but is not currently installed.
Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/diego/OneDrive/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/agricolae_1.3-
5.zip'
Content type 'application/zip' length 1272780 bytes (1.2 MB)
downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\diego\AppData\Local\Temp\Rtmp4QEMjZ\downloaded_packages

Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece


"library(agricolae)" en color rojo:
library(agricolae)
GRÁFICOS DE VARIABLES CONTINUAS:

Histograma de la variable "Edad":


hist(edad,ylab="Frecuencia",main="PERIODO 954 - Histograma de la variable
continua Edad")

R/Del grafico se puede observar que la edad de los campesinos con mayor
frecuencia está comprendida entre 70 y 80 , y la edad de los campesinos con
menor frecuencia está entre 30 y 40 años.

Boxplot o Diagrama de cajas de la variable "Edad":


boxplot(edad,ylab="Edad (años)",main="PERIODO 954 - Boxplot o diagrama de
cajas variable continua") # Gráfico de diagrama de cajas o Boxplot
R/ del diagrama de dispersión se puede observar que la asimetría es positiva
como se observa en el histograma , además se puede observar que no hay datos
atípicos.

VARIABLE CUANTITATIVA DISCRETA

Esta variable es específica para conteos

Personas=c(6,6,8,3,8,7,4,7,8,7,5,9,5,4,3,9,9,5,5,4,6,7,7,6,9,4,9,6,3,7)

Tablas de frecuencias

Tabla de frecuencias absolutas:


fabs=table(Personas)
fabs
Personas
3456789
3445635
Frecuencias absolutas acumuladas:

fabsacum<-as.table(cumsum(fabs))
fabsacum
3 4 5 6 7 8 9
3 7 11 16 22 25 30

Tabla de frecuencias relativas:


frel=prop.table(table(Personas))
frel
Personas
3 4 5 6 7 8 9
0.1000000 0.1333333 0.1333333 0.1666667 0.2000000 0.1000000 0.1666667

Frecuencias relativas acumuladas:


frelacum<-as.table(cumsum(frel))
frelacum
3 4 5 6 7 8 9
0.1000000 0.2333333 0.3666667 0.5333333 0.7333333 0.8333333 1.0000000

GRÁFICOS DE VARIABLES DISCRETAS:

Boxplot o diagrama de cajas:

boxplot(Personas,ylab="número de Personas",main="PERIODO 954 - Boxplot o


diagrama de cajas variable discreta")
R/Se puede observar que la asimetria es positiva , además hay una dispersión alta
en los datos porque dentro del cuartil 2 es decir la mediana hasta el cuartil 1 hay
pocos datos y desde el cuartil 2 al cuartil 3 hay mayores datos.

Diagrama de barras frecuencia absoluta:


barplot(fabs,xlab="Número de Personas",ylab="Frecuencias
absolutas",main="PERIODO 954 - Diagrama de barras frecuencia absoluta")
R/ la frecuencia más alta es de 6 que corresponde a 7 personas, además la
frecuencia más baja es de 3 que comprende el numero de personas de 3 y de 8.

Diagrama de barras frecuencia relativa:


barplot(frel,xlab="Número de Personas",ylab="Frecuencias
relativas",main="PERIODO 954 - Diagrama de barras frecuencia relativa")
R/ el porcentaje que obtuvo la mejor frecuencia es del 20% que corresponde a 7
personas, y el porcentaje que obtuvo la menor frecuencia es del 10% con 3 y 8
personas correspondientemente.

Diagrama de barras frecuencias relativas acumuladas


barplot(frelacum,xlab="Número de Personas",ylab="Frecuencias
relativas",main="PERIODO 954 - Diagrama de barras frecuencias relativas
acumuladas")
R/ se puede observar que la frecuencia relativa acumulada del numero de
personas con 6 es del 37%.

Gráfico de tarta:
pie(fabs,col=rainbow(6),main=c("PERIODO 954 - Gráfico de tarta de Personas"))
R/ el porcentaje que obtuvo la mayor frecuencia es del 20% que corresponde a 7
personas, y el porcentaje que obtuvo la menor frecuencia es del 10% con 3 y 8
personas correspondientemente.

VARIABLES CUALITATIVAS

Son variables atribuibles a aspectos cualitativos no numéricos, como el color, el


grado de calidad, la raza, etc...

A continuación tomaremos como ejemplo la variable categórica "Vivienda"


A 30 agricultores se les preguntó si contaban con alcantarillado en sus viviendas
Para poder codificar lo que cada agricultor respondió, se le asigna un número a
cada respuesta:
raza de ganado: 1: “ alcantarillado” ; 2: “ pozo séptico” ; 3: “ ninguno de los dos”

vivienda=c(2,1,2,1,2,1,1,2,2,3,3,3,2,2,1,1,2,3,1,2,3,2,3,3,3,2,3,2,3,2)

Se le aclara que nuestra variable tiene 3 categorías, del 1 al 3:


vivienda=factor(vivienda, levels=c(1,2,3),
Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y
cuál es su etiqueta:
labels=c("alcantarillado","pozo séptico","ninguno"))

vivienda # Muestra lo que respondió cada agricultor y los tres niveles de la


variable:

[1] pozo séptico alcantarillado pozo séptico alcantarillado pozo séptico


[6] alcantarillado alcantarillado pozo séptico pozo séptico ninguno
[11] ninguno ninguno pozo séptico pozo séptico alcantarillado
[16] alcantarillado pozo séptico ninguno alcantarillado pozo séptico
[21] ninguno pozo séptico ninguno ninguno ninguno
[26] pozo séptico ninguno pozo séptico ninguno pozo séptico
Levels: alcantarillado pozo séptico ninguno

Una vez se ha codificado exitosamente la variable, se puede analizar con R:


Hay que tener cuidado cuando se va a usar un comando que ya se había usado
antes
Es importante cambiarle el nombre, o va a producir los resultados para los que se
creó inicialmente
En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"
Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":

Tabla de frecuencias absolutas:


fabs1=table(vivienda)
fabs1
vivienda
alcantarillado pozo séptico ninguno
7 13 10

Tabla de frecuencias relativas:


frel1=prop.table(table(vivienda))
frel1
vivienda
alcantarillado pozo séptico ninguno
0.2333333 0.4333333 0.3333333

GRÁFICOS DE VARIABLES CUALITATIVAS

Diagrama de barras frecuencias absolutas:


barplot(fabs1,ylab="Frecuencias absolutas",xlab="Disposición de aguas
negras",main="PERIODO 954 - Diagrama de barras frecuencias absolutas")
La disposición de aguas negras con pozo séptico es la mayor con una frecuencia
de 13, y la de menor frecuencia es de alcantarillado

Diagrama de barras frecuencias relativas:


barplot(frel1,ylab="Frecuencias relativas",xlab="Disposición de aguas
negras",main="PERIODO 954 - Diagrama de barras frecuencias relativas")
La disposición de aguas negras con pozo séptico es la mayor con una frecuencia
relativa del 43,33% , y la de menor frecuencia relativa es de alcantarillado con
23,33%.

Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al
grupo al que pertenece.
Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva
(para ciencias agrarias)

6. Responda las siguientes preguntas de reflexión:

a. Basado en la edad promedio de los campesinos encuestados y los resultados


presentados en el histograma de la variable continua, ¿qué opinión le merece estos
resultados?

∑ 𝑥𝑖 1906,2
𝑥̅ = = = 63,54
𝑛 30
Se puede observar del histograma observar que la edad de los campesinos con
mayor frecuencia está comprendida entre 70 y 80 , y la edad de los campesinos con
menor frecuencia está entre 30 y 40 años., además se puede observar que la
asimetría de los datos es negativa, es decir cada vez que aumenta la edad hay
mayor frecuencia, además de que la dispersión es alta.
Y se puede decir que la media no es una buena representación de los datos ya que
hay mucha dispersión.

b. ¿Cuáles factores considera usted que inciden para que los jóvenes ya no quieran
dedicarse a las labores del campo? ¿en la zona donde usted habita sucede lo
mismo?

Debido a factores de educación, económicos , de atención médica, etc. Observando


que en la zona donde vivo se ve reflejado más los fatores económicos ya que los
jóvenes salen del campo para prepararse y así volver con mejores ideas para
mejorar la tierra que heredaron de sus padres

c. Una vez evidenciados los resultados de la variable discreta y la cualitativa, ¿cómo


considera que son las condiciones de vida de las personas que habitan en la zona
rural? ¿cómo son las condiciones de vida de los campesinos en la región donde
usted habita?

De la variable discreta que es el número de personas que conviven con los


campesinos, la frecuencia más alta es de 6 que corresponde a 7 personas, además
la frecuencia más baja es de 3 que comprende el número de personas de 3 y de 8,
por lo tanto, se puede observar que en cada hogar se compone de 3 personas o
más para subsistir y todavía se puede ver mayores frecuencias de personas que
conviven con campesinos porque el campo siempre se da para que vivan más
personas dentro de un hogar. Y de la variable cualitativa se puede observar que hay
pocos campesinos con alcantarillado, es decir del estudio son los que menos tienen,
es decir que las condiciones económicas y de infraestructura no son buenas,
además el internet puede que no llegue en una frecuencia alta y pues estos motivos
hacen que muchos jóvenes quieran salir del campo para ir a la ciudad para mejorar
el futuro del campo.
d. ¿Qué elementos considera usted que debería tener un adecuado desarrollo
rural en la región que usted habita?

Acceso a una mejor vivienda con una mejor infraestructura de electricidad, agua,
internet, atención médica, mejores condiciones de empleo y trabajo para generar
mayores ingresos.
CONCLUSIONES

• Se interpreto los fundamentos de los tipos de variables estadísticas


cuantitativas y cualitativas y su forma de procesamiento

• Se aplico lo aprendido de estadística descriptiva en la solución de


problemas de la vida diaria.
• Se realizo recomendaciones de uso y manejo de las variables estadísticas
BILIOGRAFÍA
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:
Monroy, S. S. (2005). Estadística

También podría gustarte