Está en la página 1de 109

HÁBITOS ALIMENTICIOS DE LOS ESTUDIANTES DE LA UN.

ENCUESTA
APLICADA DURANTE EL SEMESTRE 2017-III

GABRIELA ILEANA AVILA SALAZAR


OSCAR ORLANDO BLANCO BELTRAN
JUAN SEBASTIAN GRIJALBA ARTUNDUAGA
DIEGO ALEJANDRO RODRIGUEZ GOMEZ
DAVID ALEJANDRO RUEDA PARAMO

UNIVERSIDAD NACIONAL DE COLOMBIA


FALCULTAD DE INGENIERIA
BOGOTA D.C
2017

1
INDICE
INTRODUCCION ........................................................................................................................3
OBJETIVOS................................................................................................................................4
OBJETIVO GENERAL.............................................................................................................. 4
OBJETIVOS ESPECIFICOS ....................................................................................................... 4
JUSTIFICACION .........................................................................................................................5
VARIABLES CUALITATIVAS ........................................................................................................6
VARIABLES CUANTITATIVAS .....................................................................................................7
ANEXO....................................................................................................................................36
ANEXO DATOS NO AGRUPADOS EN R ....................................................................................36
ANEXO DATOS REALIZADOS A MANO ....................................................................................93

2
INTRODUCCIÓN

Una vez los jóvenes ingresan a la universidad se enfrentan con una nueva etapa en sus vidas,
que requiere de mucha dedicación, entrega y compromiso a fin de cumplir con sus
obligaciones de la mejor manera. Un aspecto importante dentro de esta etapa es la
alimentación que, sin duda alguna, juega uno de los papeles fundamentales en el desarrollo
mental, físico y psicológico de las personas. Sin embargo, muchos de los jóvenes actualmente
no le dan la suficiente importancia a este aspecto, de tal manera que, descuidan su
alimentación y adquieren hábitos alimenticios poco saludables, es por esta razón que se
indaga sobre la alimentación de una población de estudiantes de la Universidad Nacional sede
Bogotá, a fin de establecer posibles relaciones con su desarrollo académico, calidad de
alimentación, e índice de masa corporal, entre otros.

3
OBJETIVOS

OBJETIVO GENERAL

Identificar y conocer los hábitos alimenticios de los estudiantes de la Universidad Nacional,


sede Bogotá.

OBJETIVOS ESPECIFICOS

 Realizar un estudio a través de la encuesta acerca de la alimentación los


estudiantes de la Universidad Nacional-sede Bogotá.
 Calcular las variables de posición y dispersión con base en el estudio
realizado.
 Determinar si la alimentacion de los estudiantes influyen en su rendimiento
académico.
 Establecer la relación existente entre el índice de masa corporal y los hábitos
alimenticios de los estudiantes.

4
JUSTIFICACIÓN

Debido a la gran cantidad de lugares dedicados a la venta de comida dentro de la Universidad


Nacional, se observa que muchos de estos lugares no ofrecen comida propiamente saludable.
Debido a estas observaciones se da a la tarea de aplicar una encuesta a los estudiantes de la
Universidad Nacional para conocer su alimentación dentro de la misma e identificar si esta
afecta su desempeño académico, entre otros factores.

5
VARIABLES CUALITATIVAS

 Género
Tipo: Nominal
 Facultad a la que pertenece
Tipo: Nominal
 Lugar de preferencia almorzar
Tipo: Nominal
 Lleva una dieta equilibrada
Tipo: Nominal
 Composición frecuente del almuerzo del estudiante
Tipo: Nominal
 Llevar almuerzo de la casa
Tipo: Nominal
 Influencia alimentación en el rendimiento académico del estudiante

VARIABLES CUANTITATIVAS

 Edad
Tipo: Discreta
 Altura
Tipo: Continua
 Peso
Tipo: Continua
 Semestre cursado
Tipo: Discreta
 Cantidad de comidas que realiza al día
Tipo: Discreta

 Cantidad de dinero que invierte en el almuerzo


Tipo: Continua
 Realización de actividad física
Tipo: Discreta
 Cantidad de tiempo que invierte en almorzar
Tipo: Discreta

6
VARIABLES CUANTITATIVAS

Los datos que se observan a continuación son de las variables cuantitativas que se aplicaron
en la encuesta, el cual da referencias de cada uno de los estudiantes encuestados. se
hallará: valor mínimo, valor máximo, mediana, cuartil 1, cuartil 3, media, moda, Coeficiente
de Asimetría, Coeficiente de variación, Coeficiente de Sesgo y Aplicación del Teorema De
Chebyshev a los datos.

 Para datos no agrupados:

LA MEDIANA:

La mediana representa el 50% del tamaño de la muestra. Para obtener la posición


n 1
de la mediana se aplica la ecuación p _ med  , donde n es el tamaño de la
2
muestra aleatoria.

CUARTIL 1 (Q1)

El cuartil 1 representa el 25 % del tamaño de la muestra. Para obtener la posición


del cuartil 1, se aplica la siguiente ecuación:

p _ med  1
Q1 
2

La posición del cuartil es x , dado que no es un numero entero, se hace un promedio


px  px
Q1  , donde p x y p x son los datos de las posiciones.
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

7
LA MEDIA

La media representa el promedio de los datos obtenidos en la muestra aleatoria. La


media se determina con:

x i
media  i 1

n , donde x es cada uno de los datos de la muestra aleatoria y n el


tamaño de la muestra.

LA MODA

La moda es el dato que más se repite en la muestra aleatoria.

 Para datos agrupados:

LA CLASE:

La clase es la cantidad de intervalos en los que debemos dividir el tamaño total de la


muestra. Esta dada por la ecuación, donde n es el tamaño de muestra total.

C  ln( n  1)

AMPLITUD DEL INTERVALO

La amplitud del intervalo representa los límites de los intervalos. La amplitud del
intervalo se determina con la siguiente ecuación:

lim sup lim inf


Amp _ I 
clase , donde lim sup es el dato más grande de la muestra y
lim inf es el dato más pequeño.

FRECUENCIA ABSOLUTA (fa)

La frecuencia absoluta es la cantidad de datos agrupados que se encuentran en cada


uno de los intervalos definidos.

8
FRECUANCIA ABSOLUTA ACUMULADA (Faa)

La frecuencia absoluta acumulada es la suma de cada (fa) de los intervalos.

FRECUENCIA RELATIVA (fr)

La frecuencia relativa está dada por la siguiente ecuación:

fa
fr 
n , donde n es el tamaño total de la muestra.

FRECUENCIA RELATIVA ACUMULADA (Fra)

La frecuencia relativa acumulada es la suma de cada (fr) de los intervalos.

MARCA DE CLASE (MC)

La marca de clase es el promedio entre los límites de cada intervalo.

LA MEDIA

La media representa el promedio de los datos obtenidos en la muestra total. La


media se determina con la ecuación:

 MC * fa
media  i 1

LA MEDIANA

La mediana representa el 50% del tamaño total de la muestra. Se determina con la


ecuación:

9
n
(  Faa1 )
Li  2 *C
fa , donde Li es el límite inferior del intervalo, en donde en su
Faa se encuentre n / 2 , Faa1 es la frecuencia absoluta acumulada
inmediatamente anterior y C es la clase.

LA MODA

La moda es el dato más se repite en la muestra total. Se determina con la siguiente


ecuación:

( fa  fa 1 )
Li  *C
( fa  fa 1 )  ( fa  fa 1 ) , donde Li es el límite inferior del intervalo, en
donde haya mayor cantidad de datos, Fa1 es la frecuencia absoluta

inmediatamente anterior y fa 1 es la frecuencia absoluta inmediatamente


posterior.

VARIANZA

La varianza se determina con la siguiente ecuación:

2
1 c
S 2
 fa * (MC  media)
n  1 i 1

DESVIACION ESTANDAR (SD)

La desviación estándar es la raíz cuadrada de la varianza.

S2

COEFICIENTE DE VARIACION:

El coeficiente de variación está dado por la ecuación:

10
SD
CV 
MEDIA

TEOREMA DE CHEBYSHEV

Nos da el mínimo y el máximo de desviaciones permitidas, según el límite mínimo y


el límite máximo, está dado por la siguiente ecuación:

MEDIA  SD  68%
MEDIA  2SD  95%
MEDIA  3SD  99%

VARIABLE SEMESTRE

 Datos no agrupados:

SEMESTRE

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

2 4 4 5.1 5.75 10

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(2,3,4,4,4,4,5,6,9,10).

LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el


promedio de las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se
determina que la mediana es.

44
mediana  4
2

11
CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la


siguiente ecuación Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
de 1 y 2 respectivamente.

Q1  4  ((4  4) * 0.25)  4

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. Se aplica la siguiente formula con los datos de cada
posición.

Q3  5  ((6  5) * 0.75)  5.75

LA MEDIA

 2  3  4  4  4  4  5  6  9  10
media  i 1
 5.1
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 4.

SEMESTRE

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

2 3 6 6.42 9.5 12

12
Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:
(2,3,3,6,9,10,12).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 6.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

33
Q1  3
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

10  9
Q3   9.5
2

13
LA MEDIA

 2  3  3  6  9  10  12
media  i 1
 6.42
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 3.

 Para datos agrupados:

El tamaño total de la muestra es de 100 estudiantes.

CLASE 5
AMP.
INTER 2

Li Ls Fa Faa Fr Fra MC MC-MEDIA (MC-MEDIA)²


2 4 36 36 0.36 0.36 3 -2.58 6.6564
4 6 31 67 0.31 0.67 5 -0.58 0.3364
6 8 11 78 0.11 0.78 7 1.42 2.0164
8 10 12 90 0.12 0.9 9 3.42 11.6964
10 12 10 100 0.1 1 11 5.42 29.3764

TEOREMA DE
MEDIA 5.58 CHEVYSHEV
MEDIANA 4.90 8.25
MEDIA ± 1SD 68%
MODA 3.76 2.91
VARIANZA 7.13 10.92
MEDIA ± 2SD 95%
SD 2.67 0.24
CV 0.48

14
LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

12  2
Amp _ I  2
5

NOTA:

 Al aplicar la ecuación se ve que la media se ubica en el segundo intervalo.


 Al aplicar la ecuación, se observa que la mediana se ubica en el segundo intervalo.
 Al aplicar la ecuación se observa que la moda se ubica está en el primer intervalo.

VARIABLE ACTIVIDAD FISICA POR SEMANA (AFS)

 Datos no agrupados:

AFS

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

0 1.25 3.5 3.4 5.5 7

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(0,0,1,2,3,4,4,6,7,7).

15
LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el


promedio de las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se
determina que la mediana es.

3 4
mediana   3.5
2

CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la


siguiente ecuación Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
de 1 y 2 respectivamente.

Q1  1  ((2  1) * 0.25)  1.25

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. Se aplica la siguiente formula con los datos de cada
posición.

Q3  4  ((6  4) * 0.75)  5.5

LA MEDIA

0  0 1 2  3  4  4  6  7  7
media  i 1
 3.4
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite son tres, por ende, decimos que es multimodal.

16
AFS
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

0 2 5 4.42 7 8

Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:


(0,1,3,5,7,7,8).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 5.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

3 1
Q1  2
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

17
77
Q3  7
2

LA MEDIA

0 1 3  5  7  7  8
media  i 1
 4.42
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 7.

 Para datos agrupados:

El tamaño total de la muestra es de 100 estudiantes .

CLASE 5
AMP.
INTER 1.6

Li Ls fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²


0 1.6 35 35 0.35 0.35 0.8 -2.05 4.194304
1.6 3.2 35 70 0.35 0.7 2.4 -0.45 0.200704
3.2 4.8 8 78 0.08 0.78 4 1.15 1.327104
4.8 6.4 11 89 0.11 0.89 5.6 2.75 7.573504
6.4 8 11 100 0.11 1 7.2 4.35 18.939904

MEDIA 2.85 TEOREMA DE CHEVYSHEV


MEDIANA 2.29 4.99
MEDIA ± 1SD 68%
MODA 1.60 0.70
VARIANZA 4.61 7.14
MEDIA ± 2SD 95%
SD 2.15 -1.44
CV 0.75

18
LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

80
Amp _ I   2.6
5

VARIABLE EDAD

 Para datos no agrupados

EDAD
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
17 18.25 20 20.3 21.75 25

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(17,18,18,19,20,20,21,22,23,25).

LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el


promedio de las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se
determina que la mediana es.

20  20
mediana   20
2

19
CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la

siguiente ecuación
Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
de 1 y 2 respectivamente.

Q1  18  ((19  18) * 0.25)  18.25

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. Se aplica la siguiente formula con los datos de cada
posición.

Q3  21  ((22  21) * 0.75)  21.75

LA MEDIA

17  18  18  19  20  20  21  22  23  25
media  i 1
 20.3
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite son dos, por ende, es bimodal.

20
EDAD
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
18 19.5 22 22.428 25.5 27

Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:


(18,19,20,22,25,26,27).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 22.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

19  20
Q1   19.5
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

21
26  25
Q3   25.5
2

LA MEDIA

18  19  20  22  25  26  27
media  i 1
 22.428
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso no hay
datos que se repitan.

 Para datos agrupados:

CLASE 5
AMP.
INTER 2.6

Li Ls fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²


17 19.6 39 39 0.39 0.39 18.3 -2.6 6.76
19.6 22.2 37 76 0.37 0.76 20.9 0 0
22.2 24.8 11 87 0.11 0.87 23.5 2.6 6.76
24.8 27.4 11 98 0.11 0.98 26.1 5.2 27.04
27.4 30 2 100 0.02 1 28.7 7.8 60.84

MEDIA 20.90 TEOREMA DE CHEVYSHEV


MEDIANA 20.37 MEDIA 23.67
68%
MODA 19.47 ± 1SD 18.13
VARIANZA 7.65 MEDIA 26.43
95%
SD 2.77 ± 2SD 15.37

22
CV 0.13

LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

30  17
Amp _ I   2.6
5

VARIABLE COMIDAS DIARIAS (C/D)

 Para datos no agrupados

C/D
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
2 4.25 5 4.6 5 6

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(2,3,4,5,5,5,5,5,6,6).

LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el promedio de


las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se determina que la
mediana es.

55
mediana  5
2

23
CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente

ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 3 y 4
3

respectivamente.

Q1  4  ((4  3) * 0.25)  4.25

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el cuartil 1,


pero al determinar las posiciones se cuenta de izquierda a derecha los datos previamente
ordenados. Se aplica la siguiente formula con los datos de cada posición.

Q3  5  ((5  5) * 0.75)  5

LA MEDIA

2  3  4  5  5  5  5  5  6  6
media  i 1
 4.6
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 5.

24
C/D

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

2 2.5 4 4.14 6.5 7

Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:


(2,2,3,4,5,6,7).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 4.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

23
Q1   2.5
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

25
76
Q3   6.5
2

LA MEDIA

2  2  3  4  5  6  7
media  i 1
 4.14
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 2.

 Para datos agrupados:

CLASE 5
AMP.
INTER 1

Li Ls fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²


2 3 4 4 0.04 0.04 2.5 -2.32 5.3824
3 4 22 26 0.22 0.26 3.5 -1.32 1.7424
4 5 26 52 0.26 0.52 4.5 -0.32 0.1024
5 6 34 86 0.34 0.86 5.5 0.68 0.4624
6 7 14 100 0.14 1 6.5 1.68 2.8224

MEDIA 4.82 TEOREMA DE CHEVYSHEV


MEDIANA 4.92 MEDIA 5.91
68%
MODA 5.29 ± 1SD 3.73
VARIANZA 1.19 MEDIA 7.00
95%
SD 1.09 ± 2SD 2.64
CV 0.23

26
LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

72
Amp _ I  1
5

VARIABLE TIEMPO QUE INVIERTE PARA ALMORZAR (TQIPA):

 Para datos no agrupados

TQIPA
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
20 36.25 45 57 60 180

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(20,25,35,40,45,45,60,60,60,180).

LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el


promedio de las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se
determina que la mediana es.

45  45
mediana   45
2

27
CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la

siguiente ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
3

de 35 y 40 respectivamente.

Q1  35  ((40  35) * 0.25)  36.25

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. Se aplica la siguiente formula con los datos de cada
posición.

Q3  60  ((60  60) * 0.75)  60

LA MEDIA

 20  25  35  40  45  45  60  60  60  180
media  i 1
 57
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 60.

28
TQIPA

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

15 25 30 39.285 60 60

Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:


(15,20,30,30,60,60,60).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 30.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

20  30
Q1   25
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

29
60  60
Q3   60
2

LA MEDIA

15  20  30  30  60  60  60
media  i 1
 39.285
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 60.

 Para datos agrupados

CLASE 5
AMP.
INTER 33

Li Ls Fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²


15 48 53 53 0.53 0.53 31.5 -17.49 305.9001
48 81 44 97 0.44 0.97 64.5 15.51 240.5601
81 114 1 98 0.01 0.98 97.5 48.51 2353.2201
114 147 1 99 0.01 0.99 130.5 81.51 6643.8801
147 180 1 100 0.01 1 163.5 114.51 13112.5401

MEDIA 48.99 TEOREMA DE CHEVYSHEV


MEDIANA 46.13 MEDIA 71.22
68%
MODA 43.21 ± 1SD 26.76
VARIANZA 494.01 MEDIA 93.44
95%
SD 22.23 ± 2SD 4.54
CV 0.45

30
LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

180  15
Amp _ I   33
5

VARIABLE INDICE DE MASA CORPORAL (IMC):

 Para datos no agrupados

IMC
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
19 21.75 23.5 22.8 24 26

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:


(19,20,21,22,23,24,24,24,25,26).

LA MEDIANA:

10  1
p _ med   5.5
2

La posición de la mediana en este caso es 5.5, como no es un entero se haya el promedio de


las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se determina que la
mediana es.

23  24
mediana   23.5
2

31
CUARTIL 1 (Q1)

5.5  1
Q1   3.25
2

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente

ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 35 y 40
3

respectivamente.

Q1  21  ((22  21) * 0.25)  21.75

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el cuartil 1,


pero al determinar las posiciones se cuenta de izquierda a derecha los datos previamente
ordenados. Se aplica la siguiente formula con los datos de cada posición.

Q3  24  ((24  24) * 0.75)  24

LA MEDIA

19  20  21  22  23  24  24  24  25  26
media  i 1
 22.8
10

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 24.

IMC
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
18 20 22 22 23.5 27

32
Para este procedimiento se toma una muestra aleatoria de 7 estudiantes:
(18,20,20,22,23,24,27).

LA MEDIANA:

7 1
p _ med  4
2

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria


previamente ordenada, se determina que la mediana es 22.

CUARTIL 1 (Q1)

4 1
Q1   2.5
2

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un


p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.

20  20
Q1   20
2

CUARTIL 3 (Q3)

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el


cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.

24  23
Q3   23.5
2

33
LA MEDIA

18  20  20  22  23  24  27
media  i 1
 22
7

LA MODA

La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 20.

 Para datos agrupados:

CLASE 5
AMP.
INTER 2.8

Li Ls fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²


16 18.8 7 7 0.07 0.07 17.4 -4.732 22.391824
18.8 21.6 35 42 0.35 0.42 20.2 -1.932 3.732624
21.6 24.4 44 86 0.44 0.86 23 0.868 0.753424
24.4 27.2 10 96 0.1 0.96 25.8 3.668 13.454224
27.2 30 4 100 0.04 1 28.6 6.468 41.835024

MEDIA 22.13 TEOREMA DE CHEVYSHEV


MEDIANA 23.32 24.64
MEDIA ± 1SD 68%
MODA 22.19 19.62
VARIANZA 6.29 27.15
MEDIA ± 2SD 95%
SD 2.51 17.12
CV 0.11 29.65
MEDIA ± 3SD 99%
14.61

34
LA CLASE

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

30  16
Amp _ I   2.8
5

35
ANEXO

ANEXO DATOS NO AGRUPADOS EN R

VARIABLE ALTURA

 Muestra de n=7

CÓDIGO R

Análisis: Teniendo en cuenta la muestra de 7 datos de la variable altura, se


obtiene un promedio de altura de 1.67 m, el 50% (Mediana, Quartil 2) de la
muestra representa una altura de 1.68 m, el 25% (Quartil 1) de la muestra
corresponde a una altura de 1.59 m, el 75% (Quartil 3) de la muestra
corresponde a una altura de 1.76 m. La varianza de la muestra es de 0.013 lo
que indica que los valores están muy cercanos a la media o promedio. La
desviación estándar es de 0.12, este valor indica que los valores están
próximos entre sí, y que hay una leve dispersión. El diagrama de ramas y hojas
muestra un comportamiento levemente asimétrico. El coeficiente de variación
indica que hay muy poca variabilidad entre los datos pues es un valor muy
pequeño.

36
PLOT

BOXPLOT

37
HISTOGRAMA

Análisis: Para la muestra de 7 datos, en el plot se evidencia dispersión entre


los datos, este valor se ve reflejado en la desviación estándar de la muestra,
para el boxplot se evidencia que la mayoría de datos se ubican por debajo de
la mediana, pero con una mayor cercanía al valor máximo, que corresponde
a una altura de 1.80 m, en el histograma la línea de densidad indica que hay
una mayor tendencia a que los datos se encuentre entre 1.70 y 1.80 m, así
mismo se evidencia una leve asimetría hacia la izquierda.

38
 Muestra n=10

CÓDIGO EN R

Análisis: Para una muestra de 10 datos se obtiene un promedio de altura de


1.65 m, la altura de 1.66 m representa el 50% de la muestra (Mediana, Quartil
2), el 25% de la muestra (Quartil 1), corresponde a un valor de 1.59 m, y el
75% de la muestra (Quartil 3) corresponde a un valor de 1.72m. La varianza
de la muestra es de 0.009 lo que indica que los valores están muy próximos a
la media. En cuanto a la desviación estándar, 0.09, indica un leve dispersión
entre los valores. El coeficiente de variación es del orden de 0.5, indicando así
una pequeña variabilidad, y por ende, una mayor estabilidad en los datos. El
diagrama de ramas y hojas muestra una leve asimetría a la derecha.

39
PLOT

BOXPLOT

40
HISTOGRAMA

Análisis: Para la muestra de 10 datos, en el plot se evidencia una leve


dispersión entre los datos, sin embargo, es necesario tener en cuenta la escala
de la gráfica y el espacio entre los valores. En el boxplot se evidencian que la
mayoría de datos se encuentran por debajo de la mediana. En el histograma
no se evidencian picos muy grandes, la línea de densidad tiene un
comportamiento con tendencia a ser constante. Existe una mayor probabilidad
de que el dato más frecuente se encuentre entre los valores de 1.70m y 1.75m.

41
 Altura

CÓDIGO EN R

Análisis: Para la totalidad de los datos de la variable Altura, se obtuvo un


valor mínimo de 1.49m y un máximo de 1.86m, el 25% de los datos
corresponde a una altura de 1.63 m, el 50% de los datos se ven representados
en la altura de 1.69m, y el 75% de los datos corresponden a una altura de
1.75m. La varianza de esta variable es muy pequeña, lo que indica que los
valores están próximos entre sí, con una leve dispersión como lo indica el valor
de la desviación estándar. El coeficiente de variación posee un valor mínimo
que indica poca variabilidad en los datos obtenidos. El diagrama de Ramas y
hojas muestra un comportamiento simétrico.

42
PLOT

BOXPLOT

43
HISTOGRAMA

Análisis: Para la variable altura, en el plot se evidencia una leve dispersión


entre los datos, en el boxplot se evidencia una distribución simétrica de los
datos tanto por encima como por debajo de la mediana, la cual representa el
50% de los datos. Este comportamiento simétrico también se evidencia en el
histograma, con tendencia a que tanto la mediana, la moda y la media se
ubiquen en el mismo valor, éste se encuentra entre la altura de 1.60m y 1.70m.

44
VARIABLE PESO

 Muestra n=7

CÓDIGO EN R

Análisis: Para una muestra de 7 datos de la variable peso se obtiene, un


promedio de peso en kilogramos de 64.3, el 25% de la muestra corresponde
a un peso de 60 (kg), el 50% de la muestra (Mediana, Quartil 2) corresponde
a 62 (kg), y el 75% de la muestra corresponde a un peso de 63.5 (kg). La
varianza de la muestra arroja un valor de 90.9, el cual se puede interpretar
como alto, sin embargo, este valor se debe al tamaño de los valores de la
variable de la cual se está trabajando. La desviación estándar arroja un valor
por encima de 1, ocurre lo mismo que con la varianza, el valor se debe al
tamaño de los valores de la variable peso. Sin embargo, hay una leve
variabilidad entre los datos, pues esto lo indica el coeficiente de variación que
tiene el valor de 0.1. El diagrama de Ramas y Hojas muestra un
comportamiento asimétrico con un valor atípico.

45
PLOT

BOXPLOT

46
HISTOGRAMA

Análisis: Para una muestra de 7 datos de la variable peso, en el plot se


evidencia una leve dispersión entre los datos, sin embargo, se da la existencia
de un valor atípico hacia el cual claramente habrá una gran dispersión. Los
valores del peso se encuentran entre el valor de 55 y 65 kg. En el boxplot la
distribución de los datos se encuentran entre los valores anteriormente
mencionados, adicionalmente se evidencia en la caja que la mayoría de datos
se encuentran por debajo de la mediana, es decir del 50% de la muestra. En
el histograma, la línea de densidad se evidencian 2 picos, el último represente
el valor atípico que corresponde a un peso de 85 (kg).

47
 Muestra n=10

CÓDIGO EN R

Análisis: Para una muestra de 10 datos de la variable peso, se evidencia un


promedio de peso de 65.3(kg), el 25% de la muestra corresponde a un valor
de 62.5(kg), el 50% de la muestra (Mediana, Quartil 2) corresponde a un valor
de 65.0 (kg) y el 75% de la muestra (Quartil 3) corresponde a un valor de 70.7
(kg). La varianza de la muestra aunque su valor es alto, se puede deducir que
hay una leve dispersión entre los datos. La desviación estándar también
muestra que los datos están próximos entre sí. El coeficiente de variación da
por el orden de 0.1 lo que indica estabilidad en los datos, poca variabilidad
entre ellos. El diagrama de ramas y hojas muestra un comportamiento
levemente asimétrico a la izquierda.

48
PLOT

BOXPLOT

49
HISTOGRAMA

Análisis: Para una muestra de 10 datos de la variable peso, se evidencia en


el plot dispersión entre los datos no muy grande, en el boxplot se evidencia
que la mayoría de datos se encuentran por encima del 50% de la muestra, es
decir, de la mediana, los datos tienen una distribución cercana al valor
máximo. En el histograma se evidencia que hay una mayor probabilidad de
que el valor más frecuente se encuentre entre 60(kg) y 65(kg).

50
 Peso

CÓDIGO EN R

Análisis: Para la variable del peso, se obtuvo que el valor mínimo es de 43


(kg) y el máximo de 85 (kg), el 25% de la muestra corresponde a un valor de
peso del 56.8 (kg), el 50% de la muestra (Mediana, Quartil 2) corresponde al
valor de 63 (kg), el 75% de la muestra (Quartil 3) corresponde a un valor de
68.5 (kg). La varianza de la muestra es de aproximadamente 83, lo que indica
una pequeña dispersión entre los datos. La desviación estándar muestra que
los valores se encuentran cercanos entre sí, lo que se confirma con el valor
del coeficiente de variación el cual es del orden de 0.1, arrojando una mínima
variabilidad entre los datos. El diagrama de ramas y hojas evidencia un
comportamiento simétrico.

51
PLOT

BOXPLOT

52
HISTOGRAMA

Análisis: Para la variable del Peso, en el plot se evidencia una leve dispersión
entre los datos, sin embargo, hay una distribución homogénea entre todos los
valores. En el boxplot se evidencia una distribución simétrica de los valores
tanto por encima como por debajo de la media. Los datos con mayor tendencia
hacia el valor mínimo. En el histograma se evidencia un comportamiento
simétrico, con mayor probabilidad de que el dato más frecuente (moda), se
encuentre cercano a los 60 (kg).

53
VARIABLE IMC

 Muestra n=7

CÓDIGO EN R

Análisis: Para una muestra de 7 datos de la variable del Índice de Masa


Corporal, se obtuvo un promedio de 21.2, el 25% de la muestra (Quartil 1)
corresponde a un IMC de 20.2, el 50% de la muestra (Mediana, Quartil 2)
corresponde a un valor de 20.5, y el 75% de la muestra (Quartil 3) corresponde
a un valor de 21.9. La varianza de la muestra indica que los datos son
cercanos a la media o promedio. La desviación estándar muestra que los
datos están próximos entre sí. El diagrama de Ramas y Hojas muestra un
comportamiento asimétrico hacia la derecha. El coeficiente de variación arrojó
un valor mínimo lo que indica que hay poca variabilidad entre los datos.

54
PLOT

BOXPLOT

55
HISTOGRAMA

Análisis: Para una muestra de 7 datos de la variable IMC, el plot indica


dispersión en los datos, no muy grande. El Boxplot indica que la mayoría de
lo datos se encuentran por encima de la mediana, es decir, del 50% de la
muestra, con una distribución cercana al valor máximo. El histograma muestra
un comportamiento asimétrico a la derecha. El valor más frecuente con mayor
probabilidad se encontrará entre el rango de 20 a 25 IMC.

 Muestra n=10

CÓDIGO EN R

56
Análisis: Para una muestra de 10 datos, se obtiene un promedio de 22.6 de
IMC, el 25% de la muestra corresponde a un IMC de 20.6, el 50% de la
muestra (Mediana, Quartil 2) corresponde a un IMC de 22.0, y el 75% de la
muestra (Quartil 3) corresponde a un IMC de 24.9. La varianza de la muestra
indica que los datos no están muy lejanos a la media, y la desviación estándar
indica que la dispersión entre los datos es pequeña. Esto último se confirma
con el coeficiente de variación que arroja un valor de 0.14 indicando poca
variabilidad entre los datos de la muestra. El diagrama de Ramas y Hojas
evidencia un comportamiento levemente asimétrico.

PLOT

57
BOXPLOT

HISTOGRAMA

Análisis: Para una muestra de 10 datos de la variable de Índice de Masa


Corporal, se evidencia en el plot que los datos se encuentran cercanos, estos
se distribuyen homogéneamente a lo largo de toda la gráfica. En el boxplot se
evidencia que la mayoría de datos se encuentran por encima de la mediana o
del valor que representa el 50% de la muestra. En el histograma se evidencia
una asimetría hacia la derecha. El valor más frecuente se encuentra entre un
IMC de 20 y 22.

58
 IMC

CÓDIGO EN R

Análisis: Para la variable de Índice de Masa Corporal se obtuvo, un valor


mínimo de 16.33 y un valor máximo de 30.04. El 25% de la variable IMC
corresponde al valor de 20.1, el 50% de la variables (Mediana, Quartil 2)
corresponde a un valor del 22.0, y el 75% de la muestra representa un valor
de 23.7 de IMC. La varianza de la variable es de 7 lo que indica que los datos
se encuentran próximos a la media. La desviación estándar que con respecto
al tamaño de los datos es un valor pequeño, indica una leve dispersión de los
datos. El coeficiente de variación es del orden de 0.1 que muestra poca
variabilidad. El diagrama de Ramas y hojas muestra un comportamiento con
tendencia ser simétrico.

59
PLOT

BOXPLOT

60
HISTOGRAMA

Análisis: Para la variable del Índice de Masa Corporal, en plot muestra una
leve dispersión entre los datos, junto con una distribución homogénea en toda
la gráfica. El boxplot muestra una distribución simétrica tanto por encima como
por debajo de la mediana, es decir, del 50% del valor de todas las
observaciones. En el histograma se evidencia una distribución con tendencia
a ser simétrica. Posiblemente el valor mas frecuente se encontrará entre 20 y
22.

61
VARIABLE CANTIDAD DE DINERO QUE INVIERTE PARA ALMORZAR

 Muestra n=7

CÓDIGO EN R

Análisis: Para una muestra de 7 datos de la variable que corresponde a la


cantidad de Dinero que invierte para almorzar. Se obtuvo que en promedio se
invierten 7000 pesos para almorzar. El 25% de la muestra indica que se
invierten 5500 pesos, el 50% de la muestra indica que se invierten 6000 pesos
para el almuerzo y el 75% de la muestra indica que se invierten 8000 pesos
para almorzar. La varianza de la muestra indica que los valores no se
encuentran muy próximos a la media, la desviación estándar muestra que los
valores se encuentran levemente cercanos. El coeficiente de variación indica
la poca variabilidad de los datos. El diagrama de ramas y hojas indica un
comportamiento levemente asimétrico con un valor atípico.

62
PLOT

BOXPLOT

63
HISTOGRAMA

Análisis: Para una muestra de 7 datos de la variables (DIPA) se evidencia en


el plot los valores no se encuentran muy próximos entre sí, se evidencia una
gran distancia con respecto al valor atípico de 12000 pesos invertidos para
almorzar. El boxplot muestra una distribución asimétrica de los datos, pues la
mayoría de ellos se encuentran por encima de la mediana, es decir, del 50%
del valor de la muestra, con tendencia a estar cercanos al valor mínimo, pues
el máximo es un valor atípico. El histograma muestra un comportamiento
asimétrico hacia la derecha, con probabilidad de que el valor más frecuente
se encuentre entre 4000 y 6000 pesos.

64
 Muestra n=10

CÓDIGO EN R

Análisis: Para una muestra de 10 datos de la variable (DIPA), se obtuvo en


promedio una inversión de 3650 pesos en el almuerzo, el 25% de la muestra
corresponde a 3600 pesos, el 50% de la muestra o mediana corresponde a
una inversión de aproximadamente 4200 pesos en el almuerzo, el 75% de la
muestra corresponde a la inversión de aproximadamente 4900 pesos. La
varianza de la muestra indica que los datos no están muy cercanos a la media.
La desviación estándar muestra que los datos no están próximos entre sí. El
coeficiente de variación indica muy poca variabilidad entre los datos de la
muestra. El diagrama de Ramas y Hojas indica un comportamiento asimétrico.

65
PLOT

BOXPLOT

66
HISTOGRAMA

Análisis: Para una muestra de 10 datos de la variable (DIPA), se evidencia


en el plot dispersión entre los datos, con dos datos atípicos. En el boxplot se
evidencia una distribución de los datos con tendencia al valor máximo, con
dos valores atípicos. En el histograma se evidencia un comportamiento
asimétrico hacia la izquierda, con mayor probabilidad de que el dato con mayor
frecuencia se encuentre entre 4000 y 5000.

67
 Dinero que invierte para almorzar (DIPA)

CÓDIGO EN R

Análisis: Para la variable del Dinero que invierte para almorzar, se obtuvo
un valor mínimo de 0 pesos y un valor máximo de 12000 pesos que se
invierten para almorzar. El 25% de la variable corresponde a la inversión de
4500 pesos en el almuerzo, el 50% de la muestra indica una inversión de
5000 pesos en el almuerzo y el 75% corresponde a un valor de
aproximadamente 6200 pesos. La varianza arroja un valor muy alto puesto
que los dos valores atípicos acrecientan la distancia entre los datos y la
media. Así mismo sucede con la desviación estándar, la presencia de los
valores atípicos muestra poca proximidad entre ellos. El diagrama de ramas
y hojas muestra un comportamiento asimétrico.

68
PLOT

BOXPLOT

69
HISTOGRAMA

Análisis: Para la variable (DIPA), se evidencia en el plot que los datos no se


encuentran muy próximos entre sí, esto sucede por la existencia de valores
que se ubican en los extremos, es decir, muy cercanos tanto al valor máximo
como al mínimo. El boxplot indica que la mayoría de los datos se encuentran
por encima de la mediana, es decir, del 50% de los datos, así mismo, muestra
valores atípicos o muy lejanos al promedio. El histograma indica que hay una
mayor probabilidad que el dato más frecuente se encuentre entre 4000 y 6000
pesos.

70
VARIABLE TIEMPO QUE INVIERTE EN ALMORZAR

 Muestra n=7

CÓDIGO EN R

Análisis: Para la muestra de 7 datos de la variable del tiempo que invierte en


almorzar, se obtuvo un promedio de aproximadamente 46 minutos, el 25% de
la muestra corresponde a 30 minutos, el 50% corresponde a 60 minutos y el
75% corresponde a 60 minutos. La varianza de la muestra indica que los
valores están lejanos al promedio. La desviación estándar muestra que hay
una leve cercanía entre los datos. El coeficiente de variación indica que hay
poca variabilidad. Y se obtuvo una asimetría negativa como lo indica el valor.
El diagrama de ramas y hojas indica un comportamiento asimétrico.

71
PLOT

BOXPLOT

72
HISTOGRAMA

Análisis: Para la muestra de 7 datos de la variable (TQIPA) se evidencia en


el plot una lejanía entre los datos, pues estos se ubican a los extremos de las
gráficas. El boxplot indica que la totalidad de los datos se encuentran por
debajo de la mediana, es decir del 50% de la muestra. Pues el valor máximo
coincide con el valor de la mediana. El histograma indica que hay una mayor
tendencia a que el valor mas frecuente se encuentre entre 50 y 60 minutos
dedicados almorzar.

73
 Muestra n=10

CÓDIGO EN R

Análisis: Para una muestra de 10 datos de la variable (TQIPA) se obtuvo un


promedio de 43 minutos para almorzar, el 25% de la muestra corresponde a
30 minutos, el 50% de la muestra coincide con el promedio que es de 43
minutos para almorzar, y el 75% de la muestra que coincide con el valor
máximo es de 60 minutos. Se obtuvo una varianza con un valor muy alto lo
que indica que los valores se encuentran lejanos a la media. En cuanto a la
desviación estándar los datos se encuentran un poco lejanos entre sí. El
coeficiente de variación es del orden del 0.4 lo que indica poca variabilidad.
Se obtuvo asimetría negativa. El diagrama de ramas y hojas muestra un
comportamiento asimétrico.

74
PLOT

BOXPLOT

75
HISTOGRAMA

Análisis: Para una muestra de 10 datos, en el plot se evidencia una dispersión


en toda la gráfica, sin embargo, los valores no se encuentran muy cercanos
entre sí. En el boxplot la mayoría de los datos se encuentran por encima de la
mediana, la cual coincide con el valor máximo de la muestra. En el histograma
se evidencia un comportamiento bimodal, es decir, hay la probabilidad en 2
rangos que se encuentre un valor frecuente, el primero entre 20 y 30 minutos
y el segundo entre 50 y 60 minutos.

76
 Tiempo que invierte en almorzar

CÓDIGO EN R

Análisis: Para la variable acerca del tiempo que invierte en almorzar, se


obtuvo como valor mínimo 15 minutos y como valor máximo 180 minutos. El
25% de la variable corresponde a 30 minutos, el 50% a 45 minutos y el 75%
a 60 minutos. La varianza posee un valor alto, lo que indica que los valores se
encuentran lejanos a la media, la desviación estándar indica que no hay
mucha proximidad en los valores. El coeficiente de variación es de
aproximadamente 0.5 lo que indica gran estabilidad de los datos. Presenta
una asimetría negativa. El diagrama de Ramas y hojas muestran un
comportamiento asimétrico.

77
PLOT

BOXPLOT

78
HISTOGRAMA

Análisis: Para la variable (TQIPA) se eviencia en el plot una distribución


homogénea con un valor atípico de 180 minutos, los demás valores se
encuentran por debajo de 60 minutos. En el boxplot se evidencia una
distribución muy lejana al valor atípico, deduce una distribución simétrica tanto
por encima como por debajo de la mediana. En el histograma se evidencia un
comportamiento asímétrico, con dos modas, es decir, bimodal, se pueden
presentar datos muy frecuentes en dos intervalos, entre 0 y 50 minutos.

79
VARIABLE ACTIVIDAD FÍSICA POR SEMANA

 Muestra n=7

CÓDIGO EN R

PLOT

80
BOXPLOT

HISTOGRAMA

 Muestra n=10

CÓDIGO EN R

81
Análisis

PLOT

BOXPLOT

82
HISTOGRAMA

Análisis

 Actividad Física por semana

CÓDIGO EN R

83
Análisis: Para la variable Actividad Física por semana, se obtuvo un promedio
de 3 veces por semana, un 25% de la muestra indica que realiza ejercicio 1
vez por semana, el 50% representa aproximadamente 2 veces por semana y
el 75% corresponde a 4 veces por semana. La varianza indica que los datos
no están muy lejanos a la media. La desviación estándar indica que hay
proximidad en los datos. El coeficiente variación es del orden de 0.8 lo que
indica la poca variabilida. Asimetría negativa. Diagrma ramas y hojas
comportamiento asimétrico.

PLOT

84
BOXPLOT

HISTOGRAMA

85
Análisis: Para la variable actividad física por semana, el plot muestra una
dispersión muy pequeña entre conjuntos de datos, pero no en la totalidad de
ellos. En el boxplot se evidencia una distribución cercana al valor mínimo con
tendencia a ser simétrica la distribución dentro de la caja. El histograma
evidencia que el dato mas frecuente se encontrará en el rango de 0 a 1 vez
por semana. Comportamiento asimétrico hacia la derecha.

VARIABLE VECES QUE COME AL DÍA

 Muestra n=7

CÓDIGO EN R

86
PLOT

BOXPLOT

87
HISTOGRAMA

 Muestra n=10

CÓDIGO EN R

88
PLOT

BOXPLOT

89
HISTOGRAMA

90
 Variable veces que come al día

CÓDIGO EN R

PLOT

91
BOXPLOT

HISTOGRAMA

92
CRUCE VARIABLES

 Género vs Actividad Física por semana

 Dieta Saludable vs Alimentación influye en el desempeño académico

 Género vs Que suele incluir en su dieta diaria

 Semestre vs Alimentación influye en el desempeño académico

93
 Lugar donde almuerza vs Lleva almuerzo desde su casa

 Género vs Que suele incluir en su diera diaria

94
ANEXO DATOS REALIZADOS A MANO

95
96
97
98
99
100
101
102
103
104
105
106
107
108
Encuesta

Link: https://goo.gl/forms/cvVXjU5CYzl1BIbv2

109

También podría gustarte