Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Variables Estadísticas
Variables Estadísticas
FASE 2
GRUPO COLABORATIVO
300046_8
Realizado por:
DIDIER ARLEY BOTERO RUIZ CÓDIGO 1.022.033.417
YENIDFER PARRA RAMÍREZ CÓDIGO 1.119.585.143
DANIELA PAREJA VALLEJO CÓDIGO 1.047.972.048
YURANIS OSORIO CODIGO 23.183.325
Las medidas de tendencia central tienen como objetivo determinar la posición donde se
agrupan la mayor cantidad de datos, las medidas más utilizados son media, mediana,
quartiles y moda. Fuente especificada no válida.
Las medidas de dispersión sirven para cuantificar la variabilidad de una muestra de datos
las medidas más usadas son la varianza, la desviación estándar y el rango. Fuente
especificada no válida.
Con la realizacion de este trabajo se busca interpretar los fundamentos de los tipos de
variables estadisticas cualitativas y cuantitativas, ademas de que se logre comprender,
analizar y profundizar en los temas abordados, favoreciendo el aprendizaje y trabajo
colaborativo y autonomo.
OBJETIVOS
RTA/ Las Variables cuantitativas continuas son aquellas que se identifican ya que estas las
identificamos porque adoptan valores numéricos, es decir las identificamos con cifras.
RTA/Las variables cuantitativas discretas, son aquellas que adquieren valores los cuales
están separados entre sí en una escala. Dicho de otro modo, no existen otros valores entre
los valores específicos que la variable adquiere.
RTA/La media poblacional es toda la totalidad de los datos para realizar la estimación,
mientras que la media muestral se basa en una muestra significativa de esa población.
RTA/ la varianza es una técnica que se utiliza para decidir si las medias entre dos o más
poblaciones iguales. Esta técnica se basa en una muestra única, que se obtiene a partir de
los datos recolectados de cada población, este análisis nos sirve para determinar las
diferencias El análisis de varianza puede servir para determinar si las diferencias entre las
medias entre los valores.
RTA/ Esta es la medida de dispersión más común, la cual nos ayuda a identificar que tan
dispersos están los datos a la media. Mientras mayor sea la desviación estándar, mayor será
la dispersión de los datos.
RTA/La frecuencia relativa es una medida estadística la cual se calcula como el coeficiente
de la frecuencia absoluta de algún valor de la población/muestra (fi) entre el total de valores
que componen la población/muestra (N)
Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin
ella no podríamos obtener la frecuencia relativa.
Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia
absoluta (fi) y la frecuencia (hi) de los valores de la población o muestra.
RTA/la diferencia es que, para realizar una tabla de frecuencias absolutas de una variable
discreta, primero que todo se ordenan los valores de menor a mayor y se calcularía la
frecuencia absoluta para cada uno, posteriormente la suma de todas las frecuencias
absolutas es igual al total de datos utilizados; por otro lado para realizar una tabla de
frecuencias absolutas de una variable continua los valores se ordenan de menor a mayor,
pero en este caso dado que la variable es continua y podría tomar cualquier valor de un
espacio continuo inapreciable, hay que agrupar las variables por intervalos.
m) ¿Qué es un Boxplot o diagrama de cajas, para qué sirve?
RTA/El diagrama de caja y bigotes (box and whisker plot en inglés) es un gráfico que
permite representar de forma gráfica la mediana y los cuartiles de un grupo de datos y se
utiliza para entender como están distribuidos los datos.
RTA/Un histograma es una gráfica adecuada para representar variables continuas, aunque
también se puede usar para variables discretas. Es decir, mediante un histograma se puede
mostrar gráficamente la distribución de una variable cuantitativa o numérica.
RTA/ Un gráfico de barras sirve para resumir un conjunto de datos por categorías. Nos
muestra los datos usando varias barras de la misma anchura, cada una de las cuales
representa una categoría concreta. La altura de cada barra es proporcional a una agregación
especifica
1- Con los siguientes datos de la variable cuantitativa continua Edad: 18.4; 19.2;
19.6; 23; 20; 20.4; 19.4; 21.4; 18; 24; 17; 22; 15; 22; 25.
Hallar:
a. Media
Realizar la suma de todos los datos
18.4+19.2+19.6+ 23+20+20.4+ 19.4+21.4+ 18+24+17+ 22+ 15+22+ 25=304,4
Dividir la suma obtenida entre la cantidad de datos
186
M= =20.293
15
RTA: la media es de 20.293
RTA/ 20,293
b. MEDIANA.
RTA/ 20.
c. MODA
Ordenar los datos de menor a mayor
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
Seleccionar el dato que más se repite
RTA/ 22
d. VARIANZA
RTA/ 7,182095238
e. DESVIACIÓN ESTÁNDAR
RTA/ 2,679943141
f. RANGO DE DATOS
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
El rango es la resta del mayor dato menos el menor dato
R=Max−Min=25−15=10
RTA/ 10
g. VALOR DE LOS CUATRO CUARTILES
15 17 18 18,4 19,2
19,4 19,6 20 20,4 21,4
22 22 23 24 25
Para el primer cuartil realizar el siguiente calculo
Q 1=X n +1 =X 15 +1 =X 4 =18.4
4 4
3
2
1
0
16 18 20 22 24
edad
0 1 4 1 2
3 2 3 1 2
0 5 4 3 2
a) MEDIA
RTA/2,2
b) MEDIANA
RTA/2
c) MODA
Ordenar los datos de menor a mayor
0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
Buscar el dato que más se repite
El 0 se repite 2 veces
El 1 se repite 3 veces
El 2 se repite 4 veces
El 3 se repite 3 veces
El 4 se repite 2 veces
El 5 se repite una vez
RTA/2
d) VARIANZA
RTA/1,4735768
f) RANGO DE DATOS
0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
R=Max−Min=5−0=5
RTA/5
g) VALOR DE LOS CUATRO CUARTILES
0 0 1 1 1
2 2 2 2 3
3 3 4 4 5
RTA/Q1 25% :1
Q2 50% :2
Q3 75%:3
Q4: 5
h) GRAFICO DE FRECUENCIA ABSOLUTA
3
2
1
0
0 1 2 3 4 5
Número de hermanos
0
2
3
VARIABLE CONTINUA DE LA EDAD DE LOS ESTUDIANTES
3
2
1
0
14 16 18 20 22 24 26
edad
22
20
18
16
DIAGRAMA DE BARRAS DE FRECUENCIA RELATIVA DEL NUMERO
DE HERMANOS DE LOS ESTUDIANTES
0.15
0.10
0.05
0.00
0 1 2 3 4 5
Número de hermanos
GRAFICO DE FRECUENCIAS RELATIVAS ACUMULADAS DEL
NUMERO DE HERMANOS DE LOS ESTUDIANTES
0.6
0.4
0.2
0.0
0 1 2 3 4 5
Número de hermanos
DIAGRAMA DE BARRAS DE FRECUENCIA ABSOLUTA DEL NUMERO
DE HERMANOS DE LOS ESTUDIANTES
en el cual se identifica que hay 4 estudiantes que tienen 2 hermanos,
también encontramos 3 estudiantes que tiene cada uno de 1 hermano,
que 3 estudiantes tienen cada uno 3 hermanos, hay 2 estudiantes que
no tienen hermanos, hay 2 estudiantes que tienen 4 hermanos y 1
estudiante que tiene 5 hermanos.
2
1
0
0 1 2 3 4 5
Número de hermanos
DIAGRAMA DE CAJAS VARIABLE DISCRETA DEL NUMERO DE
HERMANOS DE LOS ESTUDIANTES
3
2
1
0
RESULTADO DE LA CONSOLA R
R version 4.0.1 (2020-06-06) -- "See Things Now"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)