Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ENCUESTA
APLICADA DURANTE EL SEMESTRE 2017-III
1
INDICE
INTRODUCCION ........................................................................................................................3
OBJETIVOS................................................................................................................................4
OBJETIVO GENERAL.............................................................................................................. 4
OBJETIVOS ESPECIFICOS ....................................................................................................... 4
JUSTIFICACION .........................................................................................................................5
VARIABLES CUALITATIVAS ........................................................................................................6
VARIABLES CUANTITATIVAS .....................................................................................................7
ANEXO....................................................................................................................................36
ANEXO DATOS NO AGRUPADOS EN R ....................................................................................36
ANEXO DATOS REALIZADOS A MANO ....................................................................................93
2
INTRODUCCIÓN
Una vez los jóvenes ingresan a la universidad se enfrentan con una nueva etapa en sus vidas,
que requiere de mucha dedicación, entrega y compromiso a fin de cumplir con sus
obligaciones de la mejor manera. Un aspecto importante dentro de esta etapa es la
alimentación que, sin duda alguna, juega uno de los papeles fundamentales en el desarrollo
mental, físico y psicológico de las personas. Sin embargo, muchos de los jóvenes actualmente
no le dan la suficiente importancia a este aspecto, de tal manera que, descuidan su
alimentación y adquieren hábitos alimenticios poco saludables, es por esta razón que se
indaga sobre la alimentación de una población de estudiantes de la Universidad Nacional sede
Bogotá, a fin de establecer posibles relaciones con su desarrollo académico, calidad de
alimentación, e índice de masa corporal, entre otros.
3
OBJETIVOS
OBJETIVO GENERAL
OBJETIVOS ESPECIFICOS
4
JUSTIFICACIÓN
5
VARIABLES CUALITATIVAS
Género
Tipo: Nominal
Facultad a la que pertenece
Tipo: Nominal
Lugar de preferencia almorzar
Tipo: Nominal
Lleva una dieta equilibrada
Tipo: Nominal
Composición frecuente del almuerzo del estudiante
Tipo: Nominal
Llevar almuerzo de la casa
Tipo: Nominal
Influencia alimentación en el rendimiento académico del estudiante
VARIABLES CUANTITATIVAS
Edad
Tipo: Discreta
Altura
Tipo: Continua
Peso
Tipo: Continua
Semestre cursado
Tipo: Discreta
Cantidad de comidas que realiza al día
Tipo: Discreta
6
VARIABLES CUANTITATIVAS
Los datos que se observan a continuación son de las variables cuantitativas que se aplicaron
en la encuesta, el cual da referencias de cada uno de los estudiantes encuestados. se
hallará: valor mínimo, valor máximo, mediana, cuartil 1, cuartil 3, media, moda, Coeficiente
de Asimetría, Coeficiente de variación, Coeficiente de Sesgo y Aplicación del Teorema De
Chebyshev a los datos.
LA MEDIANA:
CUARTIL 1 (Q1)
p _ med 1
Q1
2
CUARTIL 3 (Q3)
7
LA MEDIA
x i
media i 1
LA MODA
LA CLASE:
C ln( n 1)
La amplitud del intervalo representa los límites de los intervalos. La amplitud del
intervalo se determina con la siguiente ecuación:
8
FRECUANCIA ABSOLUTA ACUMULADA (Faa)
fa
fr
n , donde n es el tamaño total de la muestra.
LA MEDIA
MC * fa
media i 1
LA MEDIANA
9
n
( Faa1 )
Li 2 *C
fa , donde Li es el límite inferior del intervalo, en donde en su
Faa se encuentre n / 2 , Faa1 es la frecuencia absoluta acumulada
inmediatamente anterior y C es la clase.
LA MODA
( fa fa 1 )
Li *C
( fa fa 1 ) ( fa fa 1 ) , donde Li es el límite inferior del intervalo, en
donde haya mayor cantidad de datos, Fa1 es la frecuencia absoluta
VARIANZA
2
1 c
S 2
fa * (MC media)
n 1 i 1
S2
COEFICIENTE DE VARIACION:
10
SD
CV
MEDIA
TEOREMA DE CHEBYSHEV
MEDIA SD 68%
MEDIA 2SD 95%
MEDIA 3SD 99%
VARIABLE SEMESTRE
Datos no agrupados:
SEMESTRE
2 4 4 5.1 5.75 10
LA MEDIANA:
10 1
p _ med 5.5
2
44
mediana 4
2
11
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
Q1 4 ((4 4) * 0.25) 4
CUARTIL 3 (Q3)
LA MEDIA
2 3 4 4 4 4 5 6 9 10
media i 1
5.1
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 4.
SEMESTRE
2 3 6 6.42 9.5 12
12
Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:
(2,3,3,6,9,10,12).
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
33
Q1 3
2
CUARTIL 3 (Q3)
10 9
Q3 9.5
2
13
LA MEDIA
2 3 3 6 9 10 12
media i 1
6.42
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 3.
CLASE 5
AMP.
INTER 2
TEOREMA DE
MEDIA 5.58 CHEVYSHEV
MEDIANA 4.90 8.25
MEDIA ± 1SD 68%
MODA 3.76 2.91
VARIANZA 7.13 10.92
MEDIA ± 2SD 95%
SD 2.67 0.24
CV 0.48
14
LA CLASE
12 2
Amp _ I 2
5
NOTA:
Datos no agrupados:
AFS
15
LA MEDIANA:
10 1
p _ med 5.5
2
3 4
mediana 3.5
2
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
CUARTIL 3 (Q3)
LA MEDIA
0 0 1 2 3 4 4 6 7 7
media i 1
3.4
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite son tres, por ende, decimos que es multimodal.
16
AFS
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
0 2 5 4.42 7 8
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
3 1
Q1 2
2
CUARTIL 3 (Q3)
17
77
Q3 7
2
LA MEDIA
0 1 3 5 7 7 8
media i 1
4.42
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 7.
CLASE 5
AMP.
INTER 1.6
18
LA CLASE
80
Amp _ I 2.6
5
VARIABLE EDAD
EDAD
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
17 18.25 20 20.3 21.75 25
LA MEDIANA:
10 1
p _ med 5.5
2
20 20
mediana 20
2
19
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
siguiente ecuación
Q1 p3 (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
de 1 y 2 respectivamente.
CUARTIL 3 (Q3)
LA MEDIA
17 18 18 19 20 20 21 22 23 25
media i 1
20.3
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite son dos, por ende, es bimodal.
20
EDAD
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
18 19.5 22 22.428 25.5 27
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
19 20
Q1 19.5
2
CUARTIL 3 (Q3)
21
26 25
Q3 25.5
2
LA MEDIA
18 19 20 22 25 26 27
media i 1
22.428
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso no hay
datos que se repitan.
CLASE 5
AMP.
INTER 2.6
22
CV 0.13
LA CLASE
30 17
Amp _ I 2.6
5
C/D
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
2 4.25 5 4.6 5 6
LA MEDIANA:
10 1
p _ med 5.5
2
55
mediana 5
2
23
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente
ecuación
Q1 p (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 3 y 4
3
respectivamente.
CUARTIL 3 (Q3)
Q3 5 ((5 5) * 0.75) 5
LA MEDIA
2 3 4 5 5 5 5 5 6 6
media i 1
4.6
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 5.
24
C/D
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
23
Q1 2.5
2
CUARTIL 3 (Q3)
25
76
Q3 6.5
2
LA MEDIA
2 2 3 4 5 6 7
media i 1
4.14
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 2.
CLASE 5
AMP.
INTER 1
26
LA CLASE
72
Amp _ I 1
5
TQIPA
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
20 36.25 45 57 60 180
LA MEDIANA:
10 1
p _ med 5.5
2
45 45
mediana 45
2
27
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
siguiente ecuación
Q1 p (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
3
de 35 y 40 respectivamente.
CUARTIL 3 (Q3)
LA MEDIA
20 25 35 40 45 45 60 60 60 180
media i 1
57
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 60.
28
TQIPA
15 25 30 39.285 60 60
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
20 30
Q1 25
2
CUARTIL 3 (Q3)
29
60 60
Q3 60
2
LA MEDIA
15 20 30 30 60 60 60
media i 1
39.285
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 60.
CLASE 5
AMP.
INTER 33
30
LA CLASE
180 15
Amp _ I 33
5
IMC
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
19 21.75 23.5 22.8 24 26
LA MEDIANA:
10 1
p _ med 5.5
2
23 24
mediana 23.5
2
31
CUARTIL 1 (Q1)
5.5 1
Q1 3.25
2
La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente
ecuación
Q1 p (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 35 y 40
3
respectivamente.
CUARTIL 3 (Q3)
LA MEDIA
19 20 21 22 23 24 24 24 25 26
media i 1
22.8
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 24.
IMC
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
18 20 22 22 23.5 27
32
Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:
(18,20,20,22,23,24,27).
LA MEDIANA:
7 1
p _ med 4
2
CUARTIL 1 (Q1)
4 1
Q1 2.5
2
20 20
Q1 20
2
CUARTIL 3 (Q3)
24 23
Q3 23.5
2
33
LA MEDIA
18 20 20 22 23 24 27
media i 1
22
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 20.
CLASE 5
AMP.
INTER 2.8
34
LA CLASE
30 16
Amp _ I 2.8
5
35
ANEXO
VARIABLE ALTURA
Muestra de n=7
CÓDIGO R
36
PLOT
BOXPLOT
37
HISTOGRAMA
38
Muestra n=10
CÓDIGO EN R
39
PLOT
BOXPLOT
40
HISTOGRAMA
41
Altura
CÓDIGO EN R
42
PLOT
BOXPLOT
43
HISTOGRAMA
44
VARIABLE PESO
Muestra n=7
CÓDIGO EN R
45
PLOT
BOXPLOT
46
HISTOGRAMA
47
Muestra n=10
CÓDIGO EN R
48
PLOT
BOXPLOT
49
HISTOGRAMA
50
Peso
CÓDIGO EN R
51
PLOT
BOXPLOT
52
HISTOGRAMA
Análisis: Para la variable del Peso, en el plot se evidencia una leve dispersión
entre los datos, sin embargo, hay una distribución homogénea entre todos los
valores. En el boxplot se evidencia una distribución simétrica de los valores
tanto por encima como por debajo de la media. Los datos con mayor tendencia
hacia el valor mínimo. En el histograma se evidencia un comportamiento
simétrico, con mayor probabilidad de que el dato más frecuente (moda), se
encuentre cercano a los 60 (kg).
53
VARIABLE IMC
Muestra n=7
CÓDIGO EN R
54
PLOT
BOXPLOT
55
HISTOGRAMA
Muestra n=10
CÓDIGO EN R
56
Análisis: Para una muestra de 10 datos, se obtiene un promedio de 22.6 de
IMC, el 25% de la muestra corresponde a un IMC de 20.6, el 50% de la
muestra (Mediana, Quartil 2) corresponde a un IMC de 22.0, y el 75% de la
muestra (Quartil 3) corresponde a un IMC de 24.9. La varianza de la muestra
indica que los datos no están muy lejanos a la media, y la desviación estándar
indica que la dispersión entre los datos es pequeña. Esto último se confirma
con el coeficiente de variación que arroja un valor de 0.14 indicando poca
variabilidad entre los datos de la muestra. El diagrama de Ramas y Hojas
evidencia un comportamiento levemente asimétrico.
PLOT
57
BOXPLOT
HISTOGRAMA
58
IMC
CÓDIGO EN R
59
PLOT
BOXPLOT
60
HISTOGRAMA
Análisis: Para la variable del Índice de Masa Corporal, en plot muestra una
leve dispersión entre los datos, junto con una distribución homogénea en toda
la gráfica. El boxplot muestra una distribución simétrica tanto por encima como
por debajo de la mediana, es decir, del 50% del valor de todas las
observaciones. En el histograma se evidencia una distribución con tendencia
a ser simétrica. Posiblemente el valor mas frecuente se encontrará entre 20 y
22.
61
VARIABLE CANTIDAD DE DINERO QUE INVIERTE PARA ALMORZAR
Muestra n=7
CÓDIGO EN R
62
PLOT
BOXPLOT
63
HISTOGRAMA
64
Muestra n=10
CÓDIGO EN R
65
PLOT
BOXPLOT
66
HISTOGRAMA
67
Dinero que invierte para almorzar (DIPA)
CÓDIGO EN R
Análisis: Para la variable del Dinero que invierte para almorzar, se obtuvo
un valor mínimo de 0 pesos y un valor máximo de 12000 pesos que se
invierten para almorzar. El 25% de la variable corresponde a la inversión de
4500 pesos en el almuerzo, el 50% de la muestra indica una inversión de
5000 pesos en el almuerzo y el 75% corresponde a un valor de
aproximadamente 6200 pesos. La varianza arroja un valor muy alto puesto
que los dos valores atípicos acrecientan la distancia entre los datos y la
media. Así mismo sucede con la desviación estándar, la presencia de los
valores atípicos muestra poca proximidad entre ellos. El diagrama de ramas
y hojas muestra un comportamiento asimétrico.
68
PLOT
BOXPLOT
69
HISTOGRAMA
70
VARIABLE TIEMPO QUE INVIERTE EN ALMORZAR
Muestra n=7
CÓDIGO EN R
71
PLOT
BOXPLOT
72
HISTOGRAMA
73
Muestra n=10
CÓDIGO EN R
74
PLOT
BOXPLOT
75
HISTOGRAMA
76
Tiempo que invierte en almorzar
CÓDIGO EN R
77
PLOT
BOXPLOT
78
HISTOGRAMA
79
VARIABLE ACTIVIDAD FÍSICA POR SEMANA
Muestra n=7
CÓDIGO EN R
PLOT
80
BOXPLOT
HISTOGRAMA
Muestra n=10
CÓDIGO EN R
81
Análisis
PLOT
BOXPLOT
82
HISTOGRAMA
Análisis
CÓDIGO EN R
83
Análisis: Para la variable Actividad Física por semana, se obtuvo un promedio
de 3 veces por semana, un 25% de la muestra indica que realiza ejercicio 1
vez por semana, el 50% representa aproximadamente 2 veces por semana y
el 75% corresponde a 4 veces por semana. La varianza indica que los datos
no están muy lejanos a la media. La desviación estándar indica que hay
proximidad en los datos. El coeficiente variación es del orden de 0.8 lo que
indica la poca variabilida. Asimetría negativa. Diagrma ramas y hojas
comportamiento asimétrico.
PLOT
84
BOXPLOT
HISTOGRAMA
85
Análisis: Para la variable actividad física por semana, el plot muestra una
dispersión muy pequeña entre conjuntos de datos, pero no en la totalidad de
ellos. En el boxplot se evidencia una distribución cercana al valor mínimo con
tendencia a ser simétrica la distribución dentro de la caja. El histograma
evidencia que el dato mas frecuente se encontrará en el rango de 0 a 1 vez
por semana. Comportamiento asimétrico hacia la derecha.
Muestra n=7
CÓDIGO EN R
86
PLOT
BOXPLOT
87
HISTOGRAMA
Muestra n=10
CÓDIGO EN R
88
PLOT
BOXPLOT
89
HISTOGRAMA
90
Variable veces que come al día
CÓDIGO EN R
PLOT
91
BOXPLOT
HISTOGRAMA
92
CRUCE VARIABLES
93
Lugar donde almuerza vs Lleva almuerzo desde su casa
94
ANEXO DATOS REALIZADOS A MANO
95
96
97
98
99
100
101
102
103
104
105
106
107
108
Encuesta
Link: https://goo.gl/forms/cvVXjU5CYzl1BIbv2
109