Está en la página 1de 25

Fase 2: Identificación de variables estadísticas

Grupo 300046_31

Presentado por:
Darlyg Tatiana Mantilla Ortega Código: 1.102.723.265
Jerson Lancheros Código: 1.102.714.556
Manuel Sebastián Jerez Código:
Wilmer Espinosa Código: 1.102.725.851
Liceth Viviana Ortiz Código: 1.102.383.528

Presentado a:
Luis Alberto Cáceres Torres
Tutor

Universidad Nacional Abierta y a Distancia UNAD


Programa Agronomía
Estadística Descriptiva
Octubre 2020
INTRODUCCION
La estadística descriptiva es una ciencia transversal que puede ser aplicada a cualquiera

área de estudio que necesite la recolección de información para después procesarla y basada

en los resultados realizar la toma de decisiones. Pero todo este procesamiento no siempre es

una práctica sencilla y ágil.

Buscando precisamente poder implementar herramientas tecnológicas en el área de la

estadística, se estudia el Programa R como una alternativa de procesamiento de los datos y

que va a permitir generar gráficas y tablas relacionadas con ese procesamiento.


OBJETIVOS

OBJETIVO GENERAL
Identificar las diferentes variables estadísticas cuantitativas, cualitativas y su forma de
procedimiento.

OBJETIVO OBJETIVOS
Instalar el programa R y desarrollar los gráficos propuestos en la guía.
Desarrollar los ejercicios de las variables cuantitativa continua y cuantitativa discreta.
DESARROLLO DE LA ACTIVIDAD:
1. Resolver las siguientes preguntas:
a. Qué es una variable cuantitativa continua.
Son variables numéricas que toman un número infinito entre dos valores cual quiera.
b. Qué es una variable cuantitativa discreta.
Son variables numéricas que tienen un número contable de valores entre dos valores
cualesquiera.
c. Qué es una variable cualitativa nominal.
En esta variable los valores no pueden ser sometidos a un criterio de orden, como por
ejemplo los colores o el lugar de nacimiento
d. Qué es una variable cualitativa categórica.
Las variables categóricas también se denominan variables cualitativas o variables de
atributos. Los valores de una variable categórica son categorías o grupos mutuamente
excluyentes. Los datos categóricos pueden tener o no tener un orden lógico
e. Cuál es la diferencia entre media poblacional y media muestral.
Como su nombre lo indica, la media poblacional hace referencia a la media teniendo en
cuenta la población total, mientras que la media muestral, solo toma una porción de la
población total para hacer el estudio.
f. Qué es la varianza de una población.
Cuadrado de la desviación estándar poblacional.
g. Qué es desviación estándar.
Se obtiene de la raíz cuadrada de la varianza, conocida también como desviación típica. Se
utiliza para identificar valores extremos.
h. Qué es la Regla de Sturges ¿para qué sirve?
Es una regla práctica acerca del número de clases que deben considerar al elaborarse un
histograma. Este número viene dado por la siguiente expresión:
c= 1+ log2 ( M ), donde M es el tamaño de la muestra.
Que puede escribirse a partir de logaritmos base 10 de la siguiente forma:
c= 1 + log (M) / log (2), donde M es el tamaño de la muestra.
El valor de c (número de clases) es común redondearlo, si tu entero del resultado previo al
redondeo es "par" se redondea al alta y si el entero es "impar" se redondea a la baja.
i. Qué es frecuencia absoluta.
Es el número de veces que aparece un determinado valor en un estudio estadístico. La suma
de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para
indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee
suma o sumatoria.
j. Qué es frecuencia relativa.
Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
k. Qué es frecuencia relativa acumulada.
Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de
datos.
l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable
continua y de una discreta?
La tabla de frecuencia de una variable discreta no maneja intervalos, solo números enteros.
No se necesita agrupar datos

DEPARTAMENTO DE ECUACIONES DIFERENCIALES


Y ANÁLISIS NUMÉRICO, Universidad de Sevilla, área de análisis matemático
recuperado de
https://www.google.com/url?q=http://departamento.us.es/edan/php/asig/GRAFAR/
GFMA/Tema1.pdf&sa=D&sourc
e=hangouts&ust=1550246150702000&usg=AFQjCNFdQNod426EJV1uqosJBPApBzEJ-g
Tabla de frecuencias de variable continua: Maneja muchos valores distintos agrupados en
intervalos de clase

DEPARTAMENTO DE ECUACIONES DIFERENCIALES


Y ANÁLISIS NUMÉRICO, Universidad de Sevilla, área de análisis matemático
recuperado de
https://www.google.com/url?q=http://departamento.us.es/edan/php/asig/GRAFAR/
GFMA/Tema1.pdf&sa=D&source=hangouts&ust=1550246150702000&usg=AFQjCN
FdQNod426EJV1uqosJBPApBzEJ-g

m. Qué es un Boxplot o diagrama de cajas, para qué sirve.


Es un método estandarizado para representar gráficamente una serie de datos numéricos a
través de sus cuartiles.
n. En qué tipo de variables se usa el histograma.
En referencia a (Tablada, Balzarini, & Còrdoba, Anàlisis exploratorio de datos, 2013, p. 19)
es común graficar frecuencias de variables continuas usando histogramas y/o polígonos de
frecuencias. En la herramienta para análisis de datos llamada histograma, se pueden
observar “clases” sucesivas.
o. En qué tipo de variables se usa el gráfico de barras.
Con concepto de (Tablada, Balzarini, & Còrdoba, Anàlisis exploratorio de datos, 2013, p.
18), en la mayoría de ocasiones, se suele utilizar gráfica de barras o de sectores en cuanto a
variables cualitativas o cuantitativas discretas permitiendo complementar la información
tabular.
2. Con los siguientes datos de la variable cuantitativa continua “Edad”:
18.4 19.2 19.6 23 20

20.4 19.4 21.4 18 24

17 22 15 22 25

Min. 1st Qu. Median Mean 3rd Qu. Max.


15.00 18.80 20.00 20.29 22.00 25.00

Hallar:
a. Media.

∑ ¿ 1 xi
x 1+ x 2 + x 3 + x 4 + x 5+ x 6 + x 7 + x 8 + x 9+ x 10 + x 11+ x 12+ x 13 + x 14+ x15
i
μ= =
N N
15+17+18+18.4+ 19.2+19.4 +19.6+20+20.4 +21.4+ 22+22+23+ 24+25
¿
15
304
=20,29
15

Respuesta: 20.29333

b. Mediana.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
15 17 18 18,4 19, 19,4 19,6 20 20,4 21,4 22 22 23 24 25
2

Respuesta: 20

c. Moda.
15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25

Respuesta: 22
d. Varianza.
X (x-µ) (x-µ)2
15 -5,293333 28,01937778
17 -3,293333 10,84604444
18 -2,293333 5,259377778
18,4 -1,893333 3,584711111
19,2 -1,093333 1,195377778
19,4 -0,893333 0,798044444
19,6 -0,693333 0,480711111
20 -0,293333 0,086044444
20,4 0,106667 0,011377778
21,4 1,106667 1,224711111
22 1,706667 2,912711111
22 1,706667 2,912711111
23 2,706667 7,326044444
24 3,706667 13,73937778
25 4,706667 22,15271111

∑ ¿ ( x1 −μ )2
2 i
σ =
N−1

2 100,5493333
σ =
15−1
2
σ =7,182095

Respuesta: 7,182095

e. Desviación estándar.

σ =√ σ
2

σ =√ 7,182095
σ =2,679943

Respuesta: 2,679943

f. Rango de datos.
15-25

g. Indicar el valor de los cuatro cuartiles.

k ( N +1 )
Qk=
4

15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25
Q1 Q2 Q3
25% 50% 75%
quantile (edad, 0.25) # Cuantil Q1
25% 18.4

1 ( N +1 )
Q 1=
4
15+1 16
Q 1= = =4
4 4

Q 1=x 4 = 18,4

> quantile (edad, 0.75) # Cuantil Q3


75% 22
3 ( N +1 )
Q 3=
4

3 ( 15+1 ) 48
Q 3= = =12
4 4
Q 3=x 12= 22

> quantile (edad, 0.5)# Cuantil Q2 que es la misma mediana


50% 20
2 ( N +1 )
Q 2=
4
2 ( 15+1 ) 32
Q 2= = =8
4 4
Q 2=x 8=20

h. Realice el gráfico de frecuencia absoluta utilizando la regla de Sturges.

PERIODO 764 - Histograma con Regla de Sturges variable edad


5
4
3
Frequency

2
1
0

16 18 20 22 24

edad

3. Con los siguientes datos de la variable cuantitativa discreta “Número de hermanos”:

Min. 1st Qu. Median Mean 3rd Qu. Max.


0.0 1.0 2.0 2.2 3.0 5.0

Hallar:
a. Media.
N

∑ ¿ 1 xi x 1+ x 2 + x 3 + x 4 + x 5+ x 6 + x 7 + x 8 + x 9+ x 10 + x 11+ x 12+ x 13 + x 14+ x15


i
μ= =
N N
0+0+1+1+1+2+2+2+2+3+3+ 3+4 +4 +5 33
= =2,2
15 15
Respuesta: 2,2

b. Mediana.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0 0 1 1 1 2 2 2 2 3 3 3 4 4 5

Respuesta: 2

c. Moda.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0 0 1 1 1 2 2 2 2 3 3 3 4 4 5

Respuesta: 2

d. Varianza.
X (x-µ) (x-µ)2
0 -2,2 4,84
0 -2,2 4,84
1 -1,2 1,44
1 -1,2 1,44
1 -1,2 1,44
2 -0,2 0,04
2 -0,2 0,04
2 -0,2 0,04
2 -0,2 0,04
3 0,8 0,64
3 0,8 0,64
3 0,8 0,64
4 1,8 3,24
4 1,8 3,24
5 2,8 7,84

∑ ¿ ( x1 −μ )2
2 i
σ =
N−1

2 30,4
σ =
15−1
2
σ =2,171428571

e. Desviación estándar.
σ =√ 2,171428571
σ =1,4735

f. Rango de datos.
0 a 15
g. Indicar el valor de los cuatro cuartiles.

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15


0 0 1 1 1 2 2 2 2 3 3 3 4 4 5
25% 50% 75%

> quantile (Hermanos, 0.25) # Cuantil Q1

25% 1

1 ( N +1 )
Q 1=
4
15+1 16
Q 1= = =4
4 4

Q 1=x 4 = 1

Quantile (Hermanos, 0.75) # Cuantil Q3

75% 3

3 ( N +1 )
Q 3=
4
3 ( 15+1 ) 48
Q 3= = =12
4 4

Q 3=x 12= 3

> quantile (Hermanos, 0.5)# Cuantil Q2 que es la misma mediana

50% 2

2 ( N +1 )
Q 2=
4
2 ( 15+1 ) 32
Q 2= = =8
4 4
Q 2=x 8=2

4. Presentar los gráficos que obtenga al ejecutar el código, para ello, cuando le aparezca un
gráfico debe dar click derecho sobre este y seleccionar “copiar como metafile” para
posteriormente pegarlo en el informe. Los gráficos para presentar se deben dividir en tres
secciones:
GRAFICOS OBTENIDOS CON EL PROGRAMA R

GRÁFICOS DE VARIABLE CUANTITATIVA CONTINUA

Histograma con Regla de Sturges variable edad


PERIODO 764 - Histograma con Regla de Sturges variable edad

5
4
3
Frequency

2
1
0

16 18 20 22 24

edad

Como estamos trabajando con variable continua podemos observar 5 clases que va a representar la
cantidad de personas que están en esas edades. Para el primer rango de 15 a 17 tenemos 2 personas,
Histograma de la variable continua Edad
para el rango de 17 a 19 hay 2 personas, de 19 a 21 años hay 5 personas, de 21 a 23 hay 4 personas y de
23 a 25 hay 2 personas. En total al sumar deben dar 15.
PERIODO 764 - Histograma de la variable continua Edad

5
4
Frecuencia

3
2
1
0

14 16 18 20 22 24 26

edad

Para este grafico se obtiene 6 clases diferente al anterior que solo tenia 5. Podemos ver como cada
rango tiene la cantidad de personas que fueron encuestadas por edad. Para un total de 15

Boxplot o diagrama de cajas variable continua


PERIODO 764 - Boxplot o diagrama de cajas variable continua
24
22
Edad (años)

20
18
16

Este grafico está divido en varias secciones. Podemos observar que las barras laterales se identifican
con el valor mínimo y máximo en que esta el rango de las edades. La barra en negrita de la mitad
correspondo al Q2 en este caso 20 que es la misma mediana. Los bloques o cajas a los lados de la barra
en negrita corresponden a los Q1 y Q3.

Gráficos de variable cuantitativa discreta


Boxplot o diagrama de cajas variable discreta

PERIODO 764 - Boxplot o diagrama de cajas variable discreta


5
4
número de hermanos

3
2
1
0

Para esta variable se trabaja este tipo de grafico que nos representa con sus barras laterales los valores
máximo y minimo, en este caso 0 y 5 hermanos. La barra de la mitad corresponde al Q2 que es 2
(mediana). Los Q1 y Q3, que corresponden al 25 y 75% respectivamente están ubicados en el 1 y 3

Diagrama de barras Frecuencia Absoluta


PERIODO 764 - Diagrama de barras Frecuencia Absoluta

4
3
Frecuencias absolutas

2
1
0

0 1 2 3 4 5

Número de hermanos

Esta grafica nos muestra de manera individual la cantidad de datos obtenidos para cada cantidad de
hermanos. De las personas encuestadas solo 2 tiene 0 hermanos, 3 personas tienen 1 hermano, 4
personas tienen 2 hermanos (dato que más se repite, mayor frecuencia) , 3 personas tienen 3
hermanos, 2 personas tienen 4 hermanos y solo 1 persona tiene 5 hermanos. La cantidad de
personasno puede superar el #15

Diagrama de barras Frecuencia relativa


PERIODO 764 - Diagrama de barras Frecuencia relativa

0.25
0.20
Frecuencias relativas

0.15
0.10
0.05
0.00

0 1 2 3 4 5

Número de hermanos

Esta es otra manera de representar los datos obtenidos en la tabla de frecuencias, en este caso la
frecuencia relativa. Se muestran 6 rangos donde el de mayor frecuencia relativa es el 2 con 0.25,
seguido del 1 y 3 con 0.20, continua el 0 y 4 con 0.13 y el 5 con 0.066

Diagrama de barras Frecuencias relativas acumuladas


PERIODO 764 - Diagrama de barras Frecuencias relativas acumuladas
1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

0 1 2 3 4 5

Número de hermanos

Como su nombre lo indica, la grafica representa los datos acumulados dela grafica anterior, de manera
que la suma de todos los datos deben dar máximo 1, que representa al 100%

Gráfico de tarta de Hermanos


PERIODO 764 - Gráfico de tarta de Hermanos

0
2

Básicamente es otra forma de representar la información donde el 100% de la torta se va dividiendo en


porciones de acuerdo a los datos obtenidos para cada clase. Si miramos el grafico, podemos ver que la
porción de 2 hermanos es mayor que el 5 por ejemplo que representa la porción más pequeña de la
torta. Entre veces se repita un dato, mayor será la porción de la torta en el gráfico.

GRÁFICOS DE VARIABLE CUALITATIVA


Diagrama de barras frecuencias absolutas nivel de estudio agricultor

PERIODO 764 - Diagrama de barras frecuencias absolutas nivel de estudio agricultor


5
4
Frecuencias absolutas

3
2
1
0

Sin estudios Estudios Secundarios

Nivel de estudio

Como hemos visto las variables cualitativas están organizadas de manera categórica, en este caso son:
Sin estudio, estudios primaria, estudios secundarios, estudios superiores. Sin estudio tenemos 2
agricultores, con estudios de primaria hay 5 agricultores, con estudios secundarios 4 agricultores y con
estudios superiores 3 agricultores.

Diagrama de barras frecuencias relativas nivel de estudio de agricultores


PERIODO 764 - Diagrama de barras frecuencias relativas nivel de estudio de agricultore

0.35
0.30
0.25
Frecuencias relativas

0.20
0.15
0.10
0.05
0.00

Sin estudios Estudios Secundarios

Nivel de estudio

De acá podemos ver los datos de frecuencia de manera relativa, haciendo el cociente entre
la frecuencia absoluta de un determinado valor y el número total de datos, en este caso 15. Vemos que
la categoría con mayor cantidad de datos es estudios de primaria.

CONCLUSIONES
El desarrollo de la presente actividad ha sido de gran importancia educativa, conociendo
nuevos conceptos estadísticos muy importantes para nuestra vida profesional, inicialmente
realizando una investigación teórica y luego poniéndola en práctica en el desarrollo de
ejercicios simples que nos exigían un poco de análisis para un correcto desarrollo, todo esto
se ha logrado gracias a la orientación de los tutores encargaos del curso.

El programa R tiene una gran cantidad de ventajas relacionadas con el procesamiento de los
datos, la velocidad y la calidad de los datos, gráficos y tablas que se nos arroja como
resultado; siendo una excelente herramienta informática de velocidad en los análisis de los
resultados, además considero que esta importante herramienta es el inicio de una cadena de
aprendizaje y siendo muy útil para actividades futuras
BIBLIOGRAFIA

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat


en
problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=322177
5&query=bioestadística
 Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K. “Probabilidad y estadística
para ingeniería y ciencias”. Octava Edición. Pearson Prentice-Hall. México,
2007. V
 Material docente de la Unidad de Bioestadística Clínica.
URL: http://www.hrc.es/bioest/M_docente.html
 Iniciación a la Estadística. URL:
http://descartes.cnice.mecd.es/Estadistica/iniciacion_estadististica_fjgarcia/
FGG990_UD.htm
 Estadística Descriptiva y Probabilidad. URL:
http://thales.cica.es/rd/Recursos/rd99/ed99-0278- 01/indice.html.

También podría gustarte