Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Participantes
Septiembre/2020
Introducción
Hallar:
a. Media.
Tomamos los datos, los sumamos y luego los dividimos por el numero de datos existentes
18.4 +19.2 +19.6 +23+ 20+ 20.4 +19.4 +21.4 +18+ 24+ 17 +22 +15 +22+ 25= 304.4
b. Mediana.
Tomar los datos y ordenarlos de menor a mayor, el dato que se encuentre en el centro será la
mediana
15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 23, 24, 25
c. Moda.
18.4, 19.2 , 19.6, 23, 20, 20.4, 19.4, 21.4, 18, 24, 17, 22, 15, 22, 25,
Xi X Xi - X
15 20.2 5.2 27.4
17 20.2 3.2 10.24
18 20.2 2.2 4.8
18.4 20.2 1.8 3.24
19.2 20.2 -1 0.64
19.6 20.2 -0.6 0.36
20 20.2 0.2 0.4
20.4 20.2 0.2 0.4
21.4 20.2 1.2 1.44
22 20.2 2 4
23 20.2 2.8 7.81
24 20.2 3.8 14.44
25 20.2 4.8 23.04
22 20.2 2 4
d. Varianza. 107.88
S2= Ʃ( Xi – X ) = 107.88
S2= Ʃ(107.88)
15-1
2=
S 7.70 variacion estandar
e. Desviación estándar.
S2=
f. Rango de datos.
Al mayor de los datos se le resta el menor de los datos, eso quiere decir:
R=ma x x −minx
15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25
Q1 Q2 Q3
18.4 20 22
25% 50% 75%
Es decir que el 25% tiene menos de 18.4 o 18.4 años
Sturges.
18.4, 19.2 , 19.6, 23, 20, 20.4, 19.4, 21.4, 18, 24, 17, 22, 15, 22, 25,
R: = 10 Rango de datos
K : intervalos
A i : amplitud
R 10
A i: k Ai5=2 R: = 10
K:5
A i :2
clases X F Fr F
15. - 17 16 1 0.06 1
17 - 19 18 3 0.2 4
19 - 21 20 5 0.33 9
21 - 23 22 4 0.26 13
23 - 25 24 2 0.13 15
18+20
X = promedio de los intervalos es decir x= 2
= 19 y así sucesivamente
3)
0 1 4 1 2
3 2 3 1 2
0 5 4 3 2
2
1
0
16 18 20 22 24
edad
Análisis de resultado:
Este es el histograma de la variable edad usando la regla de Sturges, vemos que los datos se
organizaron en cinco niveles, también podemos observar que la mayor frecuencia de los datos se
organizó entre 20 y 22, también podemos observar claramente que los demás grupos se
organizaron en la frecuencia 2, los valores mas bajos de edad y los mas altos presentan las
frecuencias mas bajas.
3
2
1
0
14 16 18 20 22 24 26
edad
básicamente es una gráfica que distribuye un conjunto de datos de manera organizada, en un tipo
especial de grafica de barras, y cada barra representa un subconjunto de datos, en este tipo de
graficas podemos observar la acumulación o tendencia, la variabilidad o dispersión y la forma de
distribución de los datos.
Análisis de resultado
En este histograma observamos seis grupos de datos con diferentes frecuencia, los datos que
presentan mayor frecuencia son los 18-20 y 20-22 los cuales alcanzaron frecuencias 4 y 5
respectivamente, en cambio los datos que presentaron menores frecuencias fueron los 14-16 y
24-26 dando asi una frecuencia de 1 respectivamente.
20
18
16
Análisis de resultado:
En este diagrama de cajas podemos interpretar que la mediana se encuentra en 20 años esta
corresponde al 50% de los datos y esta corresponde a la línea gruesa que divide la caja, el cuartil
primero nos indica la edad de 19 o menos aproximadamente y el cuartil tercero nos indica la edad
de 20 a 22, y el cuartil cuarto nos indica edades de 22 a 26 años,
3
2
1
0
En este bloxplot o diagrama de caja de variable discreta, nos enseña una forma de presentación
estadística, destinada a resaltar aspectos de distribución de observaciones de una o varias series
de datos cuantitativos y en este caso de variables discretas, en otras palabras, este tipo de gráficos
nos permite resumir, describir y analizar aspectos generales y particulares de cierto tipo de datos.
Análisis de resultado:
este diagrama de cajas nos indica cierta cantidad de hermanos, dándonos el primer cuartil en uno
o menos, el segundo cuartil en dos o menos el tercer cuartil en tres o menos y el ultimo cuartil es
más amplio dándonos cinco o menos, nos indica también la mediana, representada por la línea
más gruesa del gráfico, esta nos muestra su valor central el cual da como resultado dos.
2
1
0
0 1 2 3 4 5
Número de hermanos
Análisis de resultado:
En este diagrama de barras observamos seis grupos de datos (0, 1, 2, 3, 4, 5) con diferentes
frecuencia, los datos que presentan mayor frecuencia son el 2, que indica la mayor frecuencia en
la cantidad de hermanos, la cual constituye la mediana, dos de estos datos el 1 y el 3 indican una
frecuencia de 3, nos indica la moda, por ser el dato que mas se repite.
PERIODO 764 - Diagrama de barras Frecuencia relativa
0.25
0.20
Frecuencias relativas
0.15
0.10
0.05
0.00
0 1 2 3 4 5
Número de hermanos
En esta grafica de frecuencias observamos las frecuencias relativas que que se expresa en
números decimales, en los valores de variable, encontramos 6 datos (0, 1, 2, 3, 4, 5) numero de
hermanos, el dato 2 de la variable indica una frecuencia de 0.25, que indica la mediana, y
constituye la mas alta sifra de frecuencia, el dato 1 y 3 indican frecuencias de 0.20.
0.6
0.4
0.2
0.0
0 1 2 3 4 5
Número de hermanos
Análisis de resultado:
En esta grafica calculamos primero la frecuencia absoluta y la frecuencia relativa, de los valores de
la población que estamos manejando, par lograr esto se han ordenado como se muestra en la
imagen, de menor a mayor y se forma el diagrama de frecuencias relativas acumuladas, en este
diagrama observamos de menor a mayor los datos de la muestra, siendo 0 el menor de los datos y
5 el mayor de estos.
0
2
4
3
Análisis de resultado:
3
2
1
0
Nivel de estudio
Análisis de resutado:
En esta grafica se representan los datos recogidos respecto a los estudios
realizados por una población de agricultores a la que se le hizo la encuesta,
donde mas del 86% de los encuestados tienen estudios primarios y solo el
14% no tienen estudios. También la gráfica esta divida en 4 secciones.
Nivel de estudio
Conclusiones
El desarrollo del presente trabajo colaborativo no da las herramientas
que nos ayudaran en la correcta identificación de las variables
estadísticas, también nos permite como futuros zootecnistas realizar la
recolección, organización y procesamiento de variables tanto cualitativas
como cuantitativas con ayuda del software R, que nos aporta una
introducción a los principales conceptos de probabilidad y las principales
distribuciones de probabilidad, todo esto usado a la aplicación en las
ciencias agrarias.
Referencias bibliográficas
García, P. A. (2015). La interpretación de los datos: Una introducción a
la estadística aplicada. Recuperado de:
https://elibronet.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802
>
>
> # Recuerde que para ejecutar cada una de las líneas del código debe digitar "Control+r"
>
> # Las líneas del código que inician con el símbolo # no son comandos sino textos explicatorios
>
> # Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y descárguelo
nuevamente
>
> # En este ejercicio conoceremos los principales tipos de varables que se manejan en estadística
descriptiva:
>
>
> # Son variables de mediciones en individuos u objetos como peso, edad, altura, entre muchas
otras.
> # Tenga presente que la edad es una varible continua, ya que puede admitir números decimales
> # Por ejemplo, alguien que tenga 15 años y 6 meses, es equivalente a una edad de 15.5 años.
>
> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25)
>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:
[1] 20.29333
> var(edad)#varianza
[1] 7.182095
[1] 2.679943
[1] 15
[1] 25
[1] 15 25
[1] 20
[1] 15
25%
18.8
75%
22
50%
20
[1] 3.2
[1] 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4 21.4 22.0 22.0 23.0 24.0 25.0
>
[1] 15 25
[1] 5
> intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRUE)
> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada
[15] (22.5,25]
> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)
>
> # Cuando el comando produce la gráfica, lo saca del código y lo dirige a esta.
> # Para volver al código para seguir ejecutándolo, es importante que ubique el cursor en la parte
superior del marco,
> # en donde se encuentra el nombre del archivo: "Codigo Fase 2 - Variables Estadísticas.t"
> # Si ubica el cursor dentro del texto del archivo, corre el riesgo de perder el orden que llevaba al
ejecutar el código
>
> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del
código
>
> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar USA(IA)
--- Please select a CRAN mirror for use in this session ---
downloaded 1.2 MB
>
> # Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté totalmente
instalada
> # Esperar hasta que aparezca el mensaje: "The downloaded binary packages are in (muestra la
carpeta donde se guardaron)"
> # Debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda (R Console)
> # Si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo
> library(agricolae)
>
>
>
> # Como pueden ver, una vez instalada la libreria "agricolae" no hace falta realizar todos los pasos
que se
> # El boxplot organiza los datos de menor a mayor y los agrupa en cuatro cuartiles, donde cada
uno tiene la misma
>
>
> # Variables de conteos, solo toman valores en números enteros como número de hermanos, de
frutos, etc.
>
> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2)
>
> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:
[1] 0
[1] 5
[1] 0 5
> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON SUMMARY
[1] 2.2
[1] 2
[1] 15
[1] 1.473577
25%
75%
50%
[1] 0 0 1 1 1 2 2 2 2 3 3 3 4 4 5
> ##En este caso las tablas de frecuencias se desarrollan por pasos:
Hermanos
012345
234321
> fabs
Hermanos
012345
234321
> fabsacum
0 1 2 3 4 5
2 5 9 12 14 15
> frel
Hermanos
0 1 2 3 4 5
> frelacum
0 1 2 3 4 5
> # Podemos decir que cero hermanos tiene el 0.133 en proporción ó el 13.3% de los individuos
encuestados.
>
>
> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza, etc...
> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el color o
la raza
> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de
estudios o el estrato socioeconómico.
> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada nivel de
estudio:
>
> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3)
>
> # Esto es lo que respondió cada agricultor ya codificado, para poderlo analizar en el programa R.
>
> # Ahora, hay que explicarle al programa lo que significa cada número
>
>
+ # Se indica a qué corresponde cada número, desde el menor grado hasta el mayor y cuál es su
etiqueta:
>
> estudios # Muestra lo que respondió cada agricultor y los cuatro niveles de la variable:
>
>
> summary(estudios)# debe aparecer cada nivel, con el número de agricultores que se encuentran
en cada uno de estos:
2 5 4
Estudios Superiores
estudios
Estudios Superiores
>
> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes
> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó
inicialmente
> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":
>
> fabs1 # si no se le cambia el nombre, aparecería el mismo resultado que produjo en la variable
discreta
estudios
2 5 4
Estudios Superiores
> frel1
estudios
Estudios Superiores
0.2142857
>
> # Podemos decir que el 0.143 de los agricultores encuestados no tienen estudios o en
proporción, el 14.3%
>
> ##Gráficos de variables cualitativas
>
> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al grupo al
que pertenece.
> # Preparado por: Luis Alberto Cáceres - Director del curso Estadística Descriptiva (para ciencias
agrarias)