Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GRUPO: 300046_160
OBJETIVOS
- Interpretar los fundamentos de los tipos de variables estadísticas cuantitativas y
cualitativas y su forma de procesamiento.
- Aplicar y definir los conceptos de tipos de variables , varianza y medidas de tendencia
central, como lo son la media, la mediana, la moda.
- Realizar los gráficos que obtenga al ejecutar el código en el programa “R”.
En el que:
σ 2=
∑ (x− x́)2
N
Así que reemplazamos con los valores ya conocidos:
x́=20.3
σ 2=∑ ( 15−20.3 )2+ ( 17−20.3 )2 + ( 18−20.3 )2+ (18.4−20.3 )2 + ( 19.2−20.3 )2+ (1 9.4−20.3 )2 + ( 19.6−20 .3 )2+ ( 20−20
= despejamos el cuadrado
∑ ( x− x́ )2
σ=
√ N
Como ya obtuvimos la varianza entonces evaluamos la raíz cuadrada
σ =√ 6.7
σ =2.6 años
f. Rango de datos.
Como al ordenar los números ya determinamos los valores que se están usando entonces:
R=Max x −Min x
R=25−15
R=10 años
MARCA
MARCA FRECUENCIA
INTERVALO DE
(AMPLITUD) ABSOLUTA
CLASE
1 15 17 16 2
2 17 19 18 2
3 19 21 20 5
4 21 23 22 4
5 23 25 24 2
De acuerdo con la información obtenida se puede afirmar que hay mas personas con una edad
entre 19 y 21 y la frecuencia de los demás se va alejando hasta llegar a 2.
3. Con los siguientes datos de la variable cuantitativa discreta “Número de hermanos”:
0 1 4 1 2
3 2 3 1 2
0 5 4 3 2
a. LA MEDIA: es el centro de gravedad de la distribución, o fiel de la balanza entre todos los datos.
Se calcula sumando los datos y dividiendo entre el tamaño de la muestra.
b. LA MEDIANA: es el valor que está en el centro de la distribución, es decir, el valor que supera a
la mitad de los de la muestra y se ve superado por la otra mitad.
mediana=0 0 11 1 22 22 3 3 3 4 4 5
mediana=2
c. LA MODA: es el valor de la variable que tiene mayor frecuencia en la muestra, es decir, el que se
repite más.
moda=0 0 1 11 2 22 2 33 3 4 4 5
moda=2
d. Varianza.
Numero de
hermanos Frecuencia
(hermanos) fi
xi Xi*fi Xi2*fi
0 2 0 0
1 3 3 3
2 4 8 16
3 3 9 27
4 2 8 32
5 1 5 25
Σ 15 33 103
x́=
∑ xifi = 33 =2.2
N 15
2 ∑ ( x− x́ )2 ∑ xi 2 fi
σ x= = − x́ 2
N N
2 103 2
σ x= −(2.2)
15
σ 2 x=2.026( hermanos)2
e. Desviación estándar.
Numero de
hermanos Frecuencia
(hermanos) fi Frecuencia
xi acumulada
0 2 2
1 3 5
2 4 9
3 3 12
4 2 14
5 1 15
Σ 15
CUARTIL 1
Px
Nx= ∗N
100
25
Nx= ∗15=3.75=4=1
100
CUARTIL 2
Px
Nx= ∗N
100
50
Nx= ∗15=7.5=8=2
100
CUARTIL 3
Px
Nx= ∗N
100
75
Nx= ∗15=11. 25=11=3
100
N° HERMANOS
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
0 1 2 3 4 5
ACTIVIDAD PROGRAMA R
VARIABLE CUANTITATIVA CONTINUA
2
1
0
16 18 20 22 24
edad
Considerando que la regla de sturges, permite agrupar la información por una cantidad de clases
a través de unos cálculos matemáticos; la información se representa toda a través del histograma
que permite evidenciar los rectángulos desde el valor mínimo hasta el valor máximo solo en este
rango de datos y de esta forma agruparlos de manera coherente para realizar el grafico.
En el grafico se evidencia que única y exclusivamente a partir de la información capturada se
puede hacer la representación de los datos. Aquí por ejemplo se identifica claramente el valor
máximo 25 años y el valor mínimo 15 años, donde las clases están ligadas a la amplitud
permitiendo inferir que esta corresponde a 2 años. Además, que esta información de edades al
estar agrupada por intervalos me permite observar la frecuencia con respecto a los individuos
entrevistados.
5
4
3
PERIODO 764 - Histograma de la variable continua Edad
Frecuencia
2
1
0
14 16 18 20 22 24 26
edad
El histograma es una herramienta muy importante para expresar información continua es decir
datos que estan expresados con decimales. Se dice que es una funcion experimental de
densidades; es por ello que se deduce a una representación grafica a traves de rectangulos en el
que usa información del intervalo de clase y la frescuencia. Gutierrez Behar, Pere Grima (2013).
Ahora bien el histograma que representa los datos de esdades muestra unos datos de frecuencia
con respecto a la cantidad de individuos de la muestra. Siendo el caso que 5 personas de 15 su
edad esta conprendida entre 18 y 20 años, asu ves si trasamo una linea imaginaria sobre el
comportamiento de los datos se observa que la mediana es 20 años..
Visualmente permite analizar la tendencia de la informacion mientra se aleja de la mediana; ya
que por ejemplo hay mas personas menores de 20 años que mayores a 20 años. Es de este modo
que se puede conocer la distribución grafica de una variable.
PERIODO 764 - Boxplot o diagrama de cajas variable continua
24
22
E dad (años)
20
18
16
Conocido como grafico de cajas o boxplot; es una menera de representar datos estadisticos en el
tratamiento de datos, este metodo permite revelar aspectos de distribución de ciertos datos. Es
una grafica coon unica escala, que incluye la caja, la mediana, bigotes, cercados interiores,
cercados exteriores. Palladino Alberto C (2011)
De acuerdo al deagrama se puede observar que la caja comprende el tramo entre el primer cuartil
(Q1) al tercer cuartil (Q3), correspondiendo al 50% de las observaciones, dentro de esta caja se
observa la mediana por medio de una linea y corresponde a 20 años.
Tambien se puede inferir que a partir de este grafico se observa datos agrupados centrales de la
distribución que son la caja pero tambien el 50 % que estan fueran a los costados de la caja que
son los bigotes y permite enterder las edades que se extienden hacia los extremos maximos y
minimos de los datos.
3
2
Como
podemos
1
observar en
este Boxplot o
diagrama de
0
cajas de
variable discreta el número de la cantidad de hermanos esta entre uno a tres siendo el dos una variable
muy equitativa
Grafico 2
3
2
1
0
0 1 2 3 4 5
Número de hermanos
En este diagrama de barras de frecuencia absoluta se puede observar las frecuencias de datos
absolutas que hay en el número de hermanos, siendo el dos el mayor, seguidamente del uno y el
tres que tienen una frecuencia absoluta de 3, luego siguen el cuatro y el cero que también tienen
la misma cantidad de frecuencia absoluta siendo 2 y finalizando en cinco que es el número de
hermanos con la frecuencia más baja de todos la cual es 1.
Grafico 3
0 .1 5
0 .1 0
0 .0 5
0 .0 0
0 1 2 3 4 5
Número de hermanos
En este diagrama de barras de frecuencia relativa se obtienen datos un poco más variados que los
de la anterior grafica porque en esta grafica se obtienen datos con decimales, pero el número de
hermanos es el mismo y siendo igual el orden de mayor a menor, ya que el dos sigue siendo el
número de hermanos mayor con un frecuencia relativa mayor de 0.25, seguidamente del número
de hermanos uno y tres tienen una frecuencia relativa de 0.20, siguen el número de hermanos
cuatro y cero que tienen una frecuencia relativa entre 0.10 y 0.15, y finalizando con el número de
hermanos cinco ya que tiene una frecuencia relativa mayor a 0.05 pero menor a 0.10.
Grafica 4
0.6
0.4
0.2
0.0
0 1 2 3 4 5
Número de hermanos
En este grafico de diagramas de barras de frecuencia relativa
acumulada podemos observar que es bastante diferente a los demás respecto a los datos ya que el
número de hermanos están en acenso en proporción al número de hermano siendo cero el
número de hermanos que tiene la frecuencia relativa más baja estando por encima del 0.0 pero
menor a 0.2, y siendo el número de hermanos cinco el mayor obteniendo una frecuencia relativa
de 1.0
Grafico 5
0
2
4
3
En este grafico circular o grafico de tarta se observa que el dos es el número de hermanos con
mayor porción ya que es de 26,67%, siguen las porciones de la cantidad de hermanos uno y tres
que son del 20%, seguidamente la cantidad de los hermanos cero y cuatro que tienen una porción
de 13% y por último la cantidad de los cinco hermanos que tienen una porción del 6,67%
BIBLIOGRAFIA
Romero, E. (2016). Estadística para todos. Análisis de datos: estadística descriptiva, teoría de la
probabilidad e inferencia. Ediciones Pirámide. Disponible en https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/49136
García, P. A. (2014). La interpretación de los datos: Una introducción a la estadística aplicada.
Recuperado de https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802
Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad Nacional de Colombia,
http://red.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_102_02.html. Licencia: Creative
Commons BY-NC-ND.
Matus, R., Hernández, M., & García, E. (2010). Estadística. Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/76119
Los textos de Perpiñán (s.f.) y Saenz (2010), lo ayudarán para la realización de la estrategia de
aprendizaje de la Fase 2, manejo del programa R Project:
Perpiñan, O. (s.f.). Introducción a R. Recuperado de: https://oscarperpinan.github.io/R/#datos.
Licencia Creative Commons CC-BY-SA 4.0.
Sáenz J. (2010). Métodos estadísticos con R y R comander. Recuperado de https://cran.r-
project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf
Cáceres, L. (2020). OVI Medidas de resumen. Recuperado de:
https://repository.unad.edu.co/handle/10596/33960
Copia de los resultados que aparecen en R Console, después de ejecutar la totalidad del
código.
Procedimiento en el programa R,
> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25)
> summary(edad)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
15.00 18.80 20.00 20.29 22.00 25.00
> mean(edad)#media aritmética
[1] 20.29333
> var(edad)#varianza
[1] 7.182095
> sd(edad)#desviación estándar
[1] 2.679943
> min(edad) #Mínimo
[1] 15
> max(edad)# Máximo
[1] 25
> range(edad) #Rango
[1] 15 25
> median(edad)# Mediana
[1] 20
> length(edad)# Número de datos
[1] 15
> quantile(edad, 0.25)# Cuantil Q1
25%
18.8
> quantile(edad, 0.75)# Cuantil Q3
75%
22
> quantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
20
> IQR(edad) #Rango intercuartílico
[1] 3.2
> sort(edad)# Ordenar
[1] 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4 21.4 22.0 22.0 23.0 24.0 25.0
> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores
perdidos
[1] 15 25
> nclass.Sturges(edad)#Número de intervalos
[1] 5
> seq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos
[1] 15.0 17.5 20.0 22.5 25.0
>
intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRU
E)
> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada
[1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (17.5,20] (20,22.5] (17.5,20]
[8] (20,22.5] (17.5,20] (22.5,25] [15,17.5] (20,22.5] [15,17.5] (20,22.5]
[15] (22.5,25]
Levels: [15,17.5] (17.5,20] (20,22.5] (22.5,25]
> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)
> hist(edad,main="PERIODO 764 - Histograma con Regla de Sturges variable
edad",breaks=puntos) # este comando crea el gráfico de histograma con la regla de Sturges
> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar USA(IA)
Installing package into ‘C:/Users/suare/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/agricolae_1.3-
3.zip'
Content type 'application/zip' length 1294556 bytes (1.2 MB)
downloaded 1.2 MB