Informe Probabilidad PDF

HÁBITOS ALIMENTICIOS DE LOS ESTUDIANTES DE LA UN.
ENCUESTA
APLICADA DURANTE EL SEMESTRE 2017-III
GABRIELA ILEANA AVILA SALAZAR

OSCAR ORLANDO BLANCO BELTRAN
JUAN SEBASTIAN GRIJALBA ARTUNDUAGA
DIEGO ALEJANDRO RODRIGUEZ GOMEZ
DAVID ALEJANDRO RUEDA PARAMO
UNIVERSIDAD NACIONAL DE COLOMBIA

FALCULTAD DE INGENIERIA
BOGOTA D.C
2017
1
INDICE
INTRODUCCION ........................................................................................................................3
OBJETIVOS................................................................................................................................4
OBJETIVO GENERAL.............................................................................................................. 4
OBJETIVOS ESPECIFICOS ....................................................................................................... 4
JUSTIFICACION .........................................................................................................................5
VARIABLES CUALITATIVAS ........................................................................................................6
VARIABLES CUANTITATIVAS .....................................................................................................7
ANEXO....................................................................................................................................36
ANEXO DATOS NO AGRUPADOS EN R ....................................................................................36
ANEXO DATOS REALIZADOS A MANO ....................................................................................93
2
INTRODUCCIÓN
Una vez los jóvenes ingresan a la universidad se enfrentan con una nueva etapa en sus vidas,
que requiere de mucha dedicación, entrega y compromiso a fin de cumplir con sus
obligaciones de la mejor manera. Un aspecto importante dentro de esta etapa es la
alimentación que, sin duda alguna, juega uno de los papeles fundamentales en el desarrollo
mental, físico y psicológico de las personas. Sin embargo, muchos de los jóvenes actualmente
no le dan la suficiente importancia a este aspecto, de tal manera que, descuidan su
alimentación y adquieren hábitos alimenticios poco saludables, es por esta razón que se
indaga sobre la alimentación de una población de estudiantes de la Universidad Nacional sede
Bogotá, a fin de establecer posibles relaciones con su desarrollo académico, calidad de
alimentación, e índice de masa corporal, entre otros.
3
OBJETIVOS
OBJETIVO GENERAL
Identificar y conocer los hábitos alimenticios de los estudiantes de la Universidad Nacional,

sede Bogotá.
OBJETIVOS ESPECIFICOS
 Realizar un estudio a través de la encuesta acerca de la alimentación los

estudiantes de la Universidad Nacional-sede Bogotá.
 Calcular las variables de posición y dispersión con base en el estudio
realizado.
 Determinar si la alimentacion de los estudiantes influyen en su rendimiento
académico.
 Establecer la relación existente entre el índice de masa corporal y los hábitos
alimenticios de los estudiantes.
4
JUSTIFICACIÓN
Debido a la gran cantidad de lugares dedicados a la venta de comida dentro de la Universidad

Nacional, se observa que muchos de estos lugares no ofrecen comida propiamente saludable.
Debido a estas observaciones se da a la tarea de aplicar una encuesta a los estudiantes de la
Universidad Nacional para conocer su alimentación dentro de la misma e identificar si esta
afecta su desempeño académico, entre otros factores.
5
VARIABLES CUALITATIVAS
 Género
Tipo: Nominal
 Facultad a la que pertenece
Tipo: Nominal
 Lugar de preferencia almorzar
Tipo: Nominal
 Lleva una dieta equilibrada
Tipo: Nominal
 Composición frecuente del almuerzo del estudiante
Tipo: Nominal
 Llevar almuerzo de la casa
Tipo: Nominal
 Influencia alimentación en el rendimiento académico del estudiante
VARIABLES CUANTITATIVAS
 Edad
Tipo: Discreta
 Altura
Tipo: Continua
 Peso
Tipo: Continua
 Semestre cursado
Tipo: Discreta
 Cantidad de comidas que realiza al día
Tipo: Discreta
 Cantidad de dinero que invierte en el almuerzo

Tipo: Continua
 Realización de actividad física
Tipo: Discreta
 Cantidad de tiempo que invierte en almorzar
Tipo: Discreta
6
VARIABLES CUANTITATIVAS
Los datos que se observan a continuación son de las variables cuantitativas que se aplicaron
en la encuesta, el cual da referencias de cada uno de los estudiantes encuestados. se
hallará: valor mínimo, valor máximo, mediana, cuartil 1, cuartil 3, media, moda, Coeficiente
de Asimetría, Coeficiente de variación, Coeficiente de Sesgo y Aplicación del Teorema De
Chebyshev a los datos.
 Para datos no agrupados:
LA MEDIANA:
La mediana representa el 50% del tamaño de la muestra. Para obtener la posición

n 1
de la mediana se aplica la ecuación p _ med  , donde n es el tamaño de la
2
muestra aleatoria.
CUARTIL 1 (Q1)
El cuartil 1 representa el 25 % del tamaño de la muestra. Para obtener la posición

del cuartil 1, se aplica la siguiente ecuación:
p _ med  1
Q1 
2
La posición del cuartil es x , dado que no es un numero entero, se hace un promedio

px  px
Q1  , donde p x y p x son los datos de las posiciones.
2
CUARTIL 3 (Q3)
El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el

cuartil 1, pero al determinar las posiciones se cuenta de izquierda a derecha los
datos previamente ordenados. de igual forma se hace un promedio entre los datos
de cada posición.
7
LA MEDIA
La media representa el promedio de los datos obtenidos en la muestra aleatoria. La

media se determina con:
x i
media  i 1
n , donde x es cada uno de los datos de la muestra aleatoria y n el

tamaño de la muestra.
LA MODA
La moda es el dato que más se repite en la muestra aleatoria.
 Para datos agrupados:
LA CLASE:
La clase es la cantidad de intervalos en los que debemos dividir el tamaño total de la

muestra. Esta dada por la ecuación, donde n es el tamaño de muestra total.
C  ln( n  1)
AMPLITUD DEL INTERVALO
La amplitud del intervalo representa los límites de los intervalos. La amplitud del
intervalo se determina con la siguiente ecuación:
lim sup lim inf

Amp _ I 
clase , donde lim sup es el dato más grande de la muestra y
lim inf es el dato más pequeño.
FRECUENCIA ABSOLUTA (fa)
La frecuencia absoluta es la cantidad de datos agrupados que se encuentran en cada

uno de los intervalos definidos.
8
FRECUANCIA ABSOLUTA ACUMULADA (Faa)
La frecuencia absoluta acumulada es la suma de cada (fa) de los intervalos.
FRECUENCIA RELATIVA (fr)
La frecuencia relativa está dada por la siguiente ecuación:
fa
fr 
n , donde n es el tamaño total de la muestra.
FRECUENCIA RELATIVA ACUMULADA (Fra)
La frecuencia relativa acumulada es la suma de cada (fr) de los intervalos.
MARCA DE CLASE (MC)
La marca de clase es el promedio entre los límites de cada intervalo.
LA MEDIA
La media representa el promedio de los datos obtenidos en la muestra total. La

media se determina con la ecuación:
 MC * fa
media  i 1
LA MEDIANA
La mediana representa el 50% del tamaño total de la muestra. Se determina con la

ecuación:
9
n
(  Faa1 )
Li  2 *C
fa , donde Li es el límite inferior del intervalo, en donde en su
Faa se encuentre n / 2 , Faa1 es la frecuencia absoluta acumulada
inmediatamente anterior y C es la clase.
LA MODA
La moda es el dato más se repite en la muestra total. Se determina con la siguiente

ecuación:
( fa  fa 1 )
Li  *C
( fa  fa 1 )  ( fa  fa 1 ) , donde Li es el límite inferior del intervalo, en
donde haya mayor cantidad de datos, Fa1 es la frecuencia absoluta
inmediatamente anterior y fa 1 es la frecuencia absoluta inmediatamente

posterior.
VARIANZA
La varianza se determina con la siguiente ecuación:
2
1 c
S 2
 fa * (MC  media)
n  1 i 1
DESVIACION ESTANDAR (SD)
La desviación estándar es la raíz cuadrada de la varianza.
S2
COEFICIENTE DE VARIACION:
El coeficiente de variación está dado por la ecuación:
10
SD
CV 
MEDIA
TEOREMA DE CHEBYSHEV
Nos da el mínimo y el máximo de desviaciones permitidas, según el límite mínimo y

el límite máximo, está dado por la siguiente ecuación:
MEDIA  SD  68%
MEDIA  2SD  95%
MEDIA  3SD  99%
VARIABLE SEMESTRE
 Datos no agrupados:
SEMESTRE
VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX
2 4 4 5.1 5.75 10
Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:

(2,3,4,4,4,4,5,6,9,10).
LA MEDIANA:
10  1
p _ med   5.5
2
La posición de la mediana en este caso es 5.5, como no es un entero se haya el

promedio de las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se
determina que la mediana es.
44
mediana  4
2
11
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2
La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la

siguiente ecuación Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
de 1 y 2 respectivamente.
Q1  4  ((4  4) * 0.25)  4
CUARTIL 3 (Q3)

datos previamente ordenados. Se aplica la siguiente formula con los datos de cada
posición.
Q3  5  ((6  5) * 0.75)  5.75
LA MEDIA
 2  3  4  4  4  4  5  6  9  10
media  i 1
 5.1
10
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato que
más se repite es 4.
SEMESTRE
2 3 6 6.42 9.5 12
12
(2,3,3,6,9,10,12).
LA MEDIANA:
7 1
p _ med  4
2
La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria

previamente ordenada, se determina que la mediana es 6.
CUARTIL 1 (Q1)
4 1
Q1   2.5
2
La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un

p 2  p3
Q1 
promedio 2 , donde P2 y P3 son las posiciones 2 y 3 respectivamente.
33
Q1  3
2
CUARTIL 3 (Q3)

de cada posición.
10  9
Q3   9.5
2
13
LA MEDIA
 2  3  3  6  9  10  12
media  i 1
 6.42
7
LA MODA
El tamaño total de la muestra es de 100 estudiantes.
CLASE 5
AMP.
INTER 2
Li Ls Fa Faa Fr Fra MC MC-MEDIA (MC-MEDIA)²

2 4 36 36 0.36 0.36 3 -2.58 6.6564
4 6 31 67 0.31 0.67 5 -0.58 0.3364
6 8 11 78 0.11 0.78 7 1.42 2.0164
8 10 12 90 0.12 0.9 9 3.42 11.6964
10 12 10 100 0.1 1 11 5.42 29.3764
TEOREMA DE
MEDIA 5.58 CHEVYSHEV
MEDIANA 4.90 8.25
MEDIA ± 1SD 68%
MODA 3.76 2.91
VARIANZA 7.13 10.92
MEDIA ± 2SD 95%
SD 2.67 0.24
CV 0.48
14
LA CLASE
clase  ln(100  1)  4.615  5
12  2
Amp _ I  2
5
NOTA:
 Al aplicar la ecuación se ve que la media se ubica en el segundo intervalo.

 Al aplicar la ecuación, se observa que la mediana se ubica en el segundo intervalo.
 Al aplicar la ecuación se observa que la moda se ubica está en el primer intervalo.
VARIABLE ACTIVIDAD FISICA POR SEMANA (AFS)
 Datos no agrupados:
AFS
0 1.25 3.5 3.4 5.5 7

(0,0,1,2,3,4,4,6,7,7).
15
LA MEDIANA:
10  1
p _ med   5.5
2

3 4
mediana   3.5
2
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2

siguiente ecuación Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
Q1  1  ((2  1) * 0.25)  1.25
CUARTIL 3 (Q3)

posición.
Q3  4  ((6  4) * 0.75)  5.5
LA MEDIA
0  0 1 2  3  4  4  6  7  7
media  i 1
 3.4
10
LA MODA
más se repite son tres, por ende, decimos que es multimodal.
16
AFS
0 2 5 4.42 7 8

(0,1,3,5,7,7,8).
LA MEDIANA:
7 1
p _ med  4
2

CUARTIL 1 (Q1)
4 1
Q1   2.5
2

p 2  p3
Q1 
3 1
Q1  2
2
CUARTIL 3 (Q3)

de cada posición.
17
77
Q3  7
2
LA MEDIA
0 1 3  5  7  7  8
media  i 1
 4.42
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso el dato
que más se repite es 7.
El tamaño total de la muestra es de 100 estudiantes .
CLASE 5
AMP.
INTER 1.6
Li Ls fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²

0 1.6 35 35 0.35 0.35 0.8 -2.05 4.194304
1.6 3.2 35 70 0.35 0.7 2.4 -0.45 0.200704
3.2 4.8 8 78 0.08 0.78 4 1.15 1.327104
4.8 6.4 11 89 0.11 0.89 5.6 2.75 7.573504
6.4 8 11 100 0.11 1 7.2 4.35 18.939904
MEDIA 2.85 TEOREMA DE CHEVYSHEV

MEDIANA 2.29 4.99
MEDIA ± 1SD 68%
MODA 1.60 0.70
VARIANZA 4.61 7.14
MEDIA ± 2SD 95%
SD 2.15 -1.44
CV 0.75
18
LA CLASE
clase  ln(100  1)  4.615  5
80
Amp _ I   2.6
5
VARIABLE EDAD
 Para datos no agrupados
EDAD
17 18.25 20 20.3 21.75 25

(17,18,18,19,20,20,21,22,23,25).
LA MEDIANA:
10  1
p _ med   5.5
2

20  20
mediana   20
2
19
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2
siguiente ecuación
Q1  p3  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
Q1  18  ((19  18) * 0.25)  18.25
CUARTIL 3 (Q3)

posición.
Q3  21  ((22  21) * 0.75)  21.75
LA MEDIA
17  18  18  19  20  20  21  22  23  25
media  i 1
 20.3
10
LA MODA
que más se repite son dos, por ende, es bimodal.
20
EDAD
18 19.5 22 22.428 25.5 27

(18,19,20,22,25,26,27).
LA MEDIANA:
7 1
p _ med  4
2

CUARTIL 1 (Q1)
4 1
Q1   2.5
2

p 2  p3
Q1 
19  20
Q1   19.5
2
CUARTIL 3 (Q3)

de cada posición.
21
26  25
Q3   25.5
2
LA MEDIA
18  19  20  22  25  26  27
media  i 1
 22.428
7
LA MODA
La moda es el dato que más se repite en la muestra aleatoria. para este caso no hay
datos que se repitan.
CLASE 5
AMP.
INTER 2.6

17 19.6 39 39 0.39 0.39 18.3 -2.6 6.76
19.6 22.2 37 76 0.37 0.76 20.9 0 0
22.2 24.8 11 87 0.11 0.87 23.5 2.6 6.76
24.8 27.4 11 98 0.11 0.98 26.1 5.2 27.04
27.4 30 2 100 0.02 1 28.7 7.8 60.84

MEDIANA 20.37 MEDIA 23.67
68%
MODA 19.47 ± 1SD 18.13
VARIANZA 7.65 MEDIA 26.43
95%
SD 2.77 ± 2SD 15.37
22
CV 0.13
LA CLASE
clase  ln(100  1)  4.615  5
30  17
Amp _ I   2.6
5
VARIABLE COMIDAS DIARIAS (C/D)
C/D
2 4.25 5 4.6 5 6

(2,3,4,5,5,5,5,5,6,6).
LA MEDIANA:
10  1
p _ med   5.5
2
La posición de la mediana en este caso es 5.5, como no es un entero se haya el promedio de

las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se determina que la
mediana es.
55
mediana  5
2
23
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2
La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente
ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 3 y 4
3
respectivamente.
Q1  4  ((4  3) * 0.25)  4.25
CUARTIL 3 (Q3)
El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el cuartil 1,

pero al determinar las posiciones se cuenta de izquierda a derecha los datos previamente
ordenados. Se aplica la siguiente formula con los datos de cada posición.
Q3  5  ((5  5) * 0.75)  5
LA MEDIA
2  3  4  5  5  5  5  5  6  6
media  i 1
 4.6
10
LA MODA
24
C/D
2 2.5 4 4.14 6.5 7

(2,2,3,4,5,6,7).
LA MEDIANA:
7 1
p _ med  4
2

CUARTIL 1 (Q1)
4 1
Q1   2.5
2

p 2  p3
Q1 
23
Q1   2.5
2
CUARTIL 3 (Q3)

de cada posición.
25
76
Q3   6.5
2
LA MEDIA
2  2  3  4  5  6  7
media  i 1
 4.14
7
LA MODA
CLASE 5
AMP.
INTER 1

2 3 4 4 0.04 0.04 2.5 -2.32 5.3824
3 4 22 26 0.22 0.26 3.5 -1.32 1.7424
4 5 26 52 0.26 0.52 4.5 -0.32 0.1024
5 6 34 86 0.34 0.86 5.5 0.68 0.4624
6 7 14 100 0.14 1 6.5 1.68 2.8224

68%
MODA 5.29 ± 1SD 3.73
95%
SD 1.09 ± 2SD 2.64
CV 0.23
26
LA CLASE
clase  ln(100  1)  4.615  5
72
Amp _ I  1
5
VARIABLE TIEMPO QUE INVIERTE PARA ALMORZAR (TQIPA):
TQIPA
20 36.25 45 57 60 180

(20,25,35,40,45,45,60,60,60,180).
LA MEDIANA:
10  1
p _ med   5.5
2

45  45
mediana   45
2
27
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2
siguiente ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores
3
Q1  35  ((40  35) * 0.25)  36.25
CUARTIL 3 (Q3)

posición.
Q3  60  ((60  60) * 0.75)  60
LA MEDIA
 20  25  35  40  45  45  60  60  60  180
media  i 1
 57
10
LA MODA
28
TQIPA
15 25 30 39.285 60 60

(15,20,30,30,60,60,60).
LA MEDIANA:
7 1
p _ med  4
2

CUARTIL 1 (Q1)
4 1
Q1   2.5
2

p 2  p3
Q1 
20  30
Q1   25
2
CUARTIL 3 (Q3)

de cada posición.
29
60  60
Q3   60
2
LA MEDIA
15  20  30  30  60  60  60
media  i 1
 39.285
7
LA MODA
 Para datos agrupados
CLASE 5
AMP.
INTER 33
Li Ls Fa Faa fr Fra MC MC-MEDIA (MC-MEDIA)²

15 48 53 53 0.53 0.53 31.5 -17.49 305.9001
48 81 44 97 0.44 0.97 64.5 15.51 240.5601
81 114 1 98 0.01 0.98 97.5 48.51 2353.2201
114 147 1 99 0.01 0.99 130.5 81.51 6643.8801
147 180 1 100 0.01 1 163.5 114.51 13112.5401

68%
MODA 43.21 ± 1SD 26.76
95%
SD 22.23 ± 2SD 4.54
CV 0.45
30
LA CLASE
clase  ln(100  1)  4.615  5
180  15
Amp _ I   33
5
VARIABLE INDICE DE MASA CORPORAL (IMC):
IMC
19 21.75 23.5 22.8 24 26

(19,20,21,22,23,24,24,24,25,26).
LA MEDIANA:
10  1
p _ med   5.5
2
La posición de la mediana en este caso es 5.5, como no es un entero se haya el promedio de

las posiciones 5 y 6 de la muestra aleatoria previamente ordenada, se determina que la
mediana es.
23  24
mediana   23.5
2
31
CUARTIL 1 (Q1)
5.5  1
Q1   3.25
2
La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la siguiente
ecuación
Q1  p  (( p4 p3 ) * 0.25) , donde P3 y P4 toman los valores de 35 y 40
3
respectivamente.
Q1  21  ((22  21) * 0.25)  21.75
CUARTIL 3 (Q3)
El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el cuartil 1,

pero al determinar las posiciones se cuenta de izquierda a derecha los datos previamente
ordenados. Se aplica la siguiente formula con los datos de cada posición.
Q3  24  ((24  24) * 0.75)  24
LA MEDIA
19  20  21  22  23  24  24  24  25  26
media  i 1
 22.8
10
LA MODA
IMC
18 20 22 22 23.5 27
32
(18,20,20,22,23,24,27).
LA MEDIANA:
7 1
p _ med  4
2

CUARTIL 1 (Q1)
4 1
Q1   2.5
2

p 2  p3
Q1 
20  20
Q1   20
2
CUARTIL 3 (Q3)

de cada posición.
24  23
Q3   23.5
2
33
LA MEDIA
18  20  20  22  23  24  27
media  i 1
 22
7
LA MODA
CLASE 5
AMP.
INTER 2.8

16 18.8 7 7 0.07 0.07 17.4 -4.732 22.391824
18.8 21.6 35 42 0.35 0.42 20.2 -1.932 3.732624
21.6 24.4 44 86 0.44 0.86 23 0.868 0.753424
24.4 27.2 10 96 0.1 0.96 25.8 3.668 13.454224
27.2 30 4 100 0.04 1 28.6 6.468 41.835024

MEDIANA 23.32 24.64
MEDIA ± 1SD 68%
MODA 22.19 19.62
VARIANZA 6.29 27.15
MEDIA ± 2SD 95%
SD 2.51 17.12
CV 0.11 29.65
MEDIA ± 3SD 99%
14.61
34
LA CLASE
clase  ln(100  1)  4.615  5
30  16
Amp _ I   2.8
5
35
ANEXO
ANEXO DATOS NO AGRUPADOS EN R
VARIABLE ALTURA
 Muestra de n=7
CÓDIGO R
Análisis: Teniendo en cuenta la muestra de 7 datos de la variable altura, se

obtiene un promedio de altura de 1.67 m, el 50% (Mediana, Quartil 2) de la
muestra representa una altura de 1.68 m, el 25% (Quartil 1) de la muestra
corresponde a una altura de 1.59 m, el 75% (Quartil 3) de la muestra
corresponde a una altura de 1.76 m. La varianza de la muestra es de 0.013 lo
que indica que los valores están muy cercanos a la media o promedio. La
desviación estándar es de 0.12, este valor indica que los valores están
próximos entre sí, y que hay una leve dispersión. El diagrama de ramas y hojas
muestra un comportamiento levemente asimétrico. El coeficiente de variación
indica que hay muy poca variabilidad entre los datos pues es un valor muy
pequeño.
36
PLOT
BOXPLOT
37
HISTOGRAMA
Análisis: Para la muestra de 7 datos, en el plot se evidencia dispersión entre

los datos, este valor se ve reflejado en la desviación estándar de la muestra,
para el boxplot se evidencia que la mayoría de datos se ubican por debajo de
la mediana, pero con una mayor cercanía al valor máximo, que corresponde
a una altura de 1.80 m, en el histograma la línea de densidad indica que hay
una mayor tendencia a que los datos se encuentre entre 1.70 y 1.80 m, así
mismo se evidencia una leve asimetría hacia la izquierda.
38
 Muestra n=10
CÓDIGO EN R
Análisis: Para una muestra de 10 datos se obtiene un promedio de altura de

1.65 m, la altura de 1.66 m representa el 50% de la muestra (Mediana, Quartil
2), el 25% de la muestra (Quartil 1), corresponde a un valor de 1.59 m, y el
75% de la muestra (Quartil 3) corresponde a un valor de 1.72m. La varianza
de la muestra es de 0.009 lo que indica que los valores están muy próximos a
la media. En cuanto a la desviación estándar, 0.09, indica un leve dispersión
entre los valores. El coeficiente de variación es del orden de 0.5, indicando así
una pequeña variabilidad, y por ende, una mayor estabilidad en los datos. El
diagrama de ramas y hojas muestra una leve asimetría a la derecha.
39
PLOT
BOXPLOT
40
HISTOGRAMA
Análisis: Para la muestra de 10 datos, en el plot se evidencia una leve

dispersión entre los datos, sin embargo, es necesario tener en cuenta la escala
de la gráfica y el espacio entre los valores. En el boxplot se evidencian que la
mayoría de datos se encuentran por debajo de la mediana. En el histograma
no se evidencian picos muy grandes, la línea de densidad tiene un
comportamiento con tendencia a ser constante. Existe una mayor probabilidad
de que el dato más frecuente se encuentre entre los valores de 1.70m y 1.75m.
41
 Altura
CÓDIGO EN R
Análisis: Para la totalidad de los datos de la variable Altura, se obtuvo un

valor mínimo de 1.49m y un máximo de 1.86m, el 25% de los datos
corresponde a una altura de 1.63 m, el 50% de los datos se ven representados
en la altura de 1.69m, y el 75% de los datos corresponden a una altura de
1.75m. La varianza de esta variable es muy pequeña, lo que indica que los
valores están próximos entre sí, con una leve dispersión como lo indica el valor
de la desviación estándar. El coeficiente de variación posee un valor mínimo
que indica poca variabilidad en los datos obtenidos. El diagrama de Ramas y
hojas muestra un comportamiento simétrico.
42
PLOT
BOXPLOT
43
HISTOGRAMA
Análisis: Para la variable altura, en el plot se evidencia una leve dispersión

entre los datos, en el boxplot se evidencia una distribución simétrica de los
datos tanto por encima como por debajo de la mediana, la cual representa el
50% de los datos. Este comportamiento simétrico también se evidencia en el
histograma, con tendencia a que tanto la mediana, la moda y la media se
ubiquen en el mismo valor, éste se encuentra entre la altura de 1.60m y 1.70m.
44
VARIABLE PESO
 Muestra n=7
CÓDIGO EN R
Análisis: Para una muestra de 7 datos de la variable peso se obtiene, un

promedio de peso en kilogramos de 64.3, el 25% de la muestra corresponde
a un peso de 60 (kg), el 50% de la muestra (Mediana, Quartil 2) corresponde
a 62 (kg), y el 75% de la muestra corresponde a un peso de 63.5 (kg). La
varianza de la muestra arroja un valor de 90.9, el cual se puede interpretar
como alto, sin embargo, este valor se debe al tamaño de los valores de la
variable de la cual se está trabajando. La desviación estándar arroja un valor
por encima de 1, ocurre lo mismo que con la varianza, el valor se debe al
tamaño de los valores de la variable peso. Sin embargo, hay una leve
variabilidad entre los datos, pues esto lo indica el coeficiente de variación que
tiene el valor de 0.1. El diagrama de Ramas y Hojas muestra un
comportamiento asimétrico con un valor atípico.
45
PLOT
BOXPLOT
46
HISTOGRAMA
Análisis: Para una muestra de 7 datos de la variable peso, en el plot se

evidencia una leve dispersión entre los datos, sin embargo, se da la existencia
de un valor atípico hacia el cual claramente habrá una gran dispersión. Los
valores del peso se encuentran entre el valor de 55 y 65 kg. En el boxplot la
distribución de los datos se encuentran entre los valores anteriormente
mencionados, adicionalmente se evidencia en la caja que la mayoría de datos
se encuentran por debajo de la mediana, es decir del 50% de la muestra. En
el histograma, la línea de densidad se evidencian 2 picos, el último represente
el valor atípico que corresponde a un peso de 85 (kg).
47
 Muestra n=10
CÓDIGO EN R
Análisis: Para una muestra de 10 datos de la variable peso, se evidencia un

promedio de peso de 65.3(kg), el 25% de la muestra corresponde a un valor
de 62.5(kg), el 50% de la muestra (Mediana, Quartil 2) corresponde a un valor
de 65.0 (kg) y el 75% de la muestra (Quartil 3) corresponde a un valor de 70.7
(kg). La varianza de la muestra aunque su valor es alto, se puede deducir que
hay una leve dispersión entre los datos. La desviación estándar también
muestra que los datos están próximos entre sí. El coeficiente de variación da
por el orden de 0.1 lo que indica estabilidad en los datos, poca variabilidad
entre ellos. El diagrama de ramas y hojas muestra un comportamiento
levemente asimétrico a la izquierda.
48
PLOT
BOXPLOT
49
HISTOGRAMA
Análisis: Para una muestra de 10 datos de la variable peso, se evidencia en

el plot dispersión entre los datos no muy grande, en el boxplot se evidencia
que la mayoría de datos se encuentran por encima del 50% de la muestra, es
decir, de la mediana, los datos tienen una distribución cercana al valor
máximo. En el histograma se evidencia que hay una mayor probabilidad de
que el valor más frecuente se encuentre entre 60(kg) y 65(kg).
50
 Peso
CÓDIGO EN R
Análisis: Para la variable del peso, se obtuvo que el valor mínimo es de 43

(kg) y el máximo de 85 (kg), el 25% de la muestra corresponde a un valor de
peso del 56.8 (kg), el 50% de la muestra (Mediana, Quartil 2) corresponde al
valor de 63 (kg), el 75% de la muestra (Quartil 3) corresponde a un valor de
68.5 (kg). La varianza de la muestra es de aproximadamente 83, lo que indica
una pequeña dispersión entre los datos. La desviación estándar muestra que
los valores se encuentran cercanos entre sí, lo que se confirma con el valor
del coeficiente de variación el cual es del orden de 0.1, arrojando una mínima
variabilidad entre los datos. El diagrama de ramas y hojas evidencia un
comportamiento simétrico.
51
PLOT
BOXPLOT
52
HISTOGRAMA
Análisis: Para la variable del Peso, en el plot se evidencia una leve dispersión
entre los datos, sin embargo, hay una distribución homogénea entre todos los
valores. En el boxplot se evidencia una distribución simétrica de los valores
tanto por encima como por debajo de la media. Los datos con mayor tendencia
hacia el valor mínimo. En el histograma se evidencia un comportamiento
simétrico, con mayor probabilidad de que el dato más frecuente (moda), se
encuentre cercano a los 60 (kg).
53
VARIABLE IMC
 Muestra n=7
CÓDIGO EN R
Análisis: Para una muestra de 7 datos de la variable del Índice de Masa

Corporal, se obtuvo un promedio de 21.2, el 25% de la muestra (Quartil 1)
corresponde a un IMC de 20.2, el 50% de la muestra (Mediana, Quartil 2)
corresponde a un valor de 20.5, y el 75% de la muestra (Quartil 3) corresponde
a un valor de 21.9. La varianza de la muestra indica que los datos son
cercanos a la media o promedio. La desviación estándar muestra que los
datos están próximos entre sí. El diagrama de Ramas y Hojas muestra un
comportamiento asimétrico hacia la derecha. El coeficiente de variación arrojó
un valor mínimo lo que indica que hay poca variabilidad entre los datos.
54
PLOT
BOXPLOT
55
HISTOGRAMA
Análisis: Para una muestra de 7 datos de la variable IMC, el plot indica

dispersión en los datos, no muy grande. El Boxplot indica que la mayoría de
lo datos se encuentran por encima de la mediana, es decir, del 50% de la
muestra, con una distribución cercana al valor máximo. El histograma muestra
un comportamiento asimétrico a la derecha. El valor más frecuente con mayor
probabilidad se encontrará entre el rango de 20 a 25 IMC.
 Muestra n=10
CÓDIGO EN R
56
Análisis: Para una muestra de 10 datos, se obtiene un promedio de 22.6 de
IMC, el 25% de la muestra corresponde a un IMC de 20.6, el 50% de la
muestra (Mediana, Quartil 2) corresponde a un IMC de 22.0, y el 75% de la
muestra (Quartil 3) corresponde a un IMC de 24.9. La varianza de la muestra
indica que los datos no están muy lejanos a la media, y la desviación estándar
indica que la dispersión entre los datos es pequeña. Esto último se confirma
con el coeficiente de variación que arroja un valor de 0.14 indicando poca
variabilidad entre los datos de la muestra. El diagrama de Ramas y Hojas
evidencia un comportamiento levemente asimétrico.
PLOT
57
BOXPLOT
HISTOGRAMA
Análisis: Para una muestra de 10 datos de la variable de Índice de Masa

Corporal, se evidencia en el plot que los datos se encuentran cercanos, estos
se distribuyen homogéneamente a lo largo de toda la gráfica. En el boxplot se
evidencia que la mayoría de datos se encuentran por encima de la mediana o
del valor que representa el 50% de la muestra. En el histograma se evidencia
una asimetría hacia la derecha. El valor más frecuente se encuentra entre un
IMC de 20 y 22.
58
 IMC
CÓDIGO EN R
Análisis: Para la variable de Índice de Masa Corporal se obtuvo, un valor

mínimo de 16.33 y un valor máximo de 30.04. El 25% de la variable IMC
corresponde al valor de 20.1, el 50% de la variables (Mediana, Quartil 2)
corresponde a un valor del 22.0, y el 75% de la muestra representa un valor
de 23.7 de IMC. La varianza de la variable es de 7 lo que indica que los datos
se encuentran próximos a la media. La desviación estándar que con respecto
al tamaño de los datos es un valor pequeño, indica una leve dispersión de los
datos. El coeficiente de variación es del orden de 0.1 que muestra poca
variabilidad. El diagrama de Ramas y hojas muestra un comportamiento con
tendencia ser simétrico.
59
PLOT
BOXPLOT
60
HISTOGRAMA
Análisis: Para la variable del Índice de Masa Corporal, en plot muestra una
leve dispersión entre los datos, junto con una distribución homogénea en toda
la gráfica. El boxplot muestra una distribución simétrica tanto por encima como
por debajo de la mediana, es decir, del 50% del valor de todas las
observaciones. En el histograma se evidencia una distribución con tendencia
a ser simétrica. Posiblemente el valor mas frecuente se encontrará entre 20 y
22.
61
VARIABLE CANTIDAD DE DINERO QUE INVIERTE PARA ALMORZAR
 Muestra n=7
CÓDIGO EN R
Análisis: Para una muestra de 7 datos de la variable que corresponde a la

cantidad de Dinero que invierte para almorzar. Se obtuvo que en promedio se
invierten 7000 pesos para almorzar. El 25% de la muestra indica que se
invierten 5500 pesos, el 50% de la muestra indica que se invierten 6000 pesos
para el almuerzo y el 75% de la muestra indica que se invierten 8000 pesos
para almorzar. La varianza de la muestra indica que los valores no se
encuentran muy próximos a la media, la desviación estándar muestra que los
valores se encuentran levemente cercanos. El coeficiente de variación indica
la poca variabilidad de los datos. El diagrama de ramas y hojas indica un
comportamiento levemente asimétrico con un valor atípico.
62
PLOT
BOXPLOT
63
HISTOGRAMA
Análisis: Para una muestra de 7 datos de la variables (DIPA) se evidencia en

el plot los valores no se encuentran muy próximos entre sí, se evidencia una
gran distancia con respecto al valor atípico de 12000 pesos invertidos para
almorzar. El boxplot muestra una distribución asimétrica de los datos, pues la
mayoría de ellos se encuentran por encima de la mediana, es decir, del 50%
del valor de la muestra, con tendencia a estar cercanos al valor mínimo, pues
el máximo es un valor atípico. El histograma muestra un comportamiento
asimétrico hacia la derecha, con probabilidad de que el valor más frecuente
se encuentre entre 4000 y 6000 pesos.
64
 Muestra n=10
CÓDIGO EN R
Análisis: Para una muestra de 10 datos de la variable (DIPA), se obtuvo en

promedio una inversión de 3650 pesos en el almuerzo, el 25% de la muestra
corresponde a 3600 pesos, el 50% de la muestra o mediana corresponde a
una inversión de aproximadamente 4200 pesos en el almuerzo, el 75% de la
muestra corresponde a la inversión de aproximadamente 4900 pesos. La
varianza de la muestra indica que los datos no están muy cercanos a la media.
La desviación estándar muestra que los datos no están próximos entre sí. El
coeficiente de variación indica muy poca variabilidad entre los datos de la
muestra. El diagrama de Ramas y Hojas indica un comportamiento asimétrico.
65
PLOT
BOXPLOT
66
HISTOGRAMA
Análisis: Para una muestra de 10 datos de la variable (DIPA), se evidencia

en el plot dispersión entre los datos, con dos datos atípicos. En el boxplot se
evidencia una distribución de los datos con tendencia al valor máximo, con
dos valores atípicos. En el histograma se evidencia un comportamiento
asimétrico hacia la izquierda, con mayor probabilidad de que el dato con mayor
frecuencia se encuentre entre 4000 y 5000.
67
 Dinero que invierte para almorzar (DIPA)
CÓDIGO EN R
Análisis: Para la variable del Dinero que invierte para almorzar, se obtuvo
un valor mínimo de 0 pesos y un valor máximo de 12000 pesos que se
invierten para almorzar. El 25% de la variable corresponde a la inversión de
4500 pesos en el almuerzo, el 50% de la muestra indica una inversión de
5000 pesos en el almuerzo y el 75% corresponde a un valor de
aproximadamente 6200 pesos. La varianza arroja un valor muy alto puesto
que los dos valores atípicos acrecientan la distancia entre los datos y la
media. Así mismo sucede con la desviación estándar, la presencia de los
valores atípicos muestra poca proximidad entre ellos. El diagrama de ramas
y hojas muestra un comportamiento asimétrico.
68
PLOT
BOXPLOT
69
HISTOGRAMA
Análisis: Para la variable (DIPA), se evidencia en el plot que los datos no se

encuentran muy próximos entre sí, esto sucede por la existencia de valores
que se ubican en los extremos, es decir, muy cercanos tanto al valor máximo
como al mínimo. El boxplot indica que la mayoría de los datos se encuentran
por encima de la mediana, es decir, del 50% de los datos, así mismo, muestra
valores atípicos o muy lejanos al promedio. El histograma indica que hay una
mayor probabilidad que el dato más frecuente se encuentre entre 4000 y 6000
pesos.
70
VARIABLE TIEMPO QUE INVIERTE EN ALMORZAR
 Muestra n=7
CÓDIGO EN R
Análisis: Para la muestra de 7 datos de la variable del tiempo que invierte en

almorzar, se obtuvo un promedio de aproximadamente 46 minutos, el 25% de
la muestra corresponde a 30 minutos, el 50% corresponde a 60 minutos y el
75% corresponde a 60 minutos. La varianza de la muestra indica que los
valores están lejanos al promedio. La desviación estándar muestra que hay
una leve cercanía entre los datos. El coeficiente de variación indica que hay
poca variabilidad. Y se obtuvo una asimetría negativa como lo indica el valor.
El diagrama de ramas y hojas indica un comportamiento asimétrico.
71
PLOT
BOXPLOT
72
HISTOGRAMA
Análisis: Para la muestra de 7 datos de la variable (TQIPA) se evidencia en

el plot una lejanía entre los datos, pues estos se ubican a los extremos de las
gráficas. El boxplot indica que la totalidad de los datos se encuentran por
debajo de la mediana, es decir del 50% de la muestra. Pues el valor máximo
coincide con el valor de la mediana. El histograma indica que hay una mayor
tendencia a que el valor mas frecuente se encuentre entre 50 y 60 minutos
dedicados almorzar.
73
 Muestra n=10
CÓDIGO EN R
Análisis: Para una muestra de 10 datos de la variable (TQIPA) se obtuvo un

promedio de 43 minutos para almorzar, el 25% de la muestra corresponde a
30 minutos, el 50% de la muestra coincide con el promedio que es de 43
minutos para almorzar, y el 75% de la muestra que coincide con el valor
máximo es de 60 minutos. Se obtuvo una varianza con un valor muy alto lo
que indica que los valores se encuentran lejanos a la media. En cuanto a la
desviación estándar los datos se encuentran un poco lejanos entre sí. El
coeficiente de variación es del orden del 0.4 lo que indica poca variabilidad.
Se obtuvo asimetría negativa. El diagrama de ramas y hojas muestra un
comportamiento asimétrico.
74
PLOT
BOXPLOT
75
HISTOGRAMA
Análisis: Para una muestra de 10 datos, en el plot se evidencia una dispersión

en toda la gráfica, sin embargo, los valores no se encuentran muy cercanos
entre sí. En el boxplot la mayoría de los datos se encuentran por encima de la
mediana, la cual coincide con el valor máximo de la muestra. En el histograma
se evidencia un comportamiento bimodal, es decir, hay la probabilidad en 2
rangos que se encuentre un valor frecuente, el primero entre 20 y 30 minutos
y el segundo entre 50 y 60 minutos.
76
 Tiempo que invierte en almorzar
CÓDIGO EN R
Análisis: Para la variable acerca del tiempo que invierte en almorzar, se

obtuvo como valor mínimo 15 minutos y como valor máximo 180 minutos. El
25% de la variable corresponde a 30 minutos, el 50% a 45 minutos y el 75%
a 60 minutos. La varianza posee un valor alto, lo que indica que los valores se
encuentran lejanos a la media, la desviación estándar indica que no hay
mucha proximidad en los valores. El coeficiente de variación es de
aproximadamente 0.5 lo que indica gran estabilidad de los datos. Presenta
una asimetría negativa. El diagrama de Ramas y hojas muestran un
77
PLOT
BOXPLOT
78
HISTOGRAMA
Análisis: Para la variable (TQIPA) se eviencia en el plot una distribución

homogénea con un valor atípico de 180 minutos, los demás valores se
encuentran por debajo de 60 minutos. En el boxplot se evidencia una
distribución muy lejana al valor atípico, deduce una distribución simétrica tanto
por encima como por debajo de la mediana. En el histograma se evidencia un
comportamiento asímétrico, con dos modas, es decir, bimodal, se pueden
presentar datos muy frecuentes en dos intervalos, entre 0 y 50 minutos.
79
VARIABLE ACTIVIDAD FÍSICA POR SEMANA
 Muestra n=7
CÓDIGO EN R
PLOT
80
BOXPLOT
HISTOGRAMA
 Muestra n=10
CÓDIGO EN R
81
Análisis
PLOT
BOXPLOT
82
HISTOGRAMA
Análisis
 Actividad Física por semana
CÓDIGO EN R
83
Análisis: Para la variable Actividad Física por semana, se obtuvo un promedio
de 3 veces por semana, un 25% de la muestra indica que realiza ejercicio 1
vez por semana, el 50% representa aproximadamente 2 veces por semana y
el 75% corresponde a 4 veces por semana. La varianza indica que los datos
no están muy lejanos a la media. La desviación estándar indica que hay
proximidad en los datos. El coeficiente variación es del orden de 0.8 lo que
indica la poca variabilida. Asimetría negativa. Diagrma ramas y hojas
PLOT
84
BOXPLOT
HISTOGRAMA
85
Análisis: Para la variable actividad física por semana, el plot muestra una
dispersión muy pequeña entre conjuntos de datos, pero no en la totalidad de
ellos. En el boxplot se evidencia una distribución cercana al valor mínimo con
tendencia a ser simétrica la distribución dentro de la caja. El histograma
evidencia que el dato mas frecuente se encontrará en el rango de 0 a 1 vez
por semana. Comportamiento asimétrico hacia la derecha.
VARIABLE VECES QUE COME AL DÍA
 Muestra n=7
CÓDIGO EN R
86
PLOT
BOXPLOT
87
HISTOGRAMA
 Muestra n=10
CÓDIGO EN R
88
PLOT
BOXPLOT
89
HISTOGRAMA
90
 Variable veces que come al día
CÓDIGO EN R
PLOT
91
BOXPLOT
HISTOGRAMA
92
CRUCE VARIABLES
 Género vs Actividad Física por semana
 Dieta Saludable vs Alimentación influye en el desempeño académico
 Género vs Que suele incluir en su dieta diaria
 Semestre vs Alimentación influye en el desempeño académico
93
 Lugar donde almuerza vs Lleva almuerzo desde su casa
 Género vs Que suele incluir en su diera diaria
94
ANEXO DATOS REALIZADOS A MANO
95
96
97
98
99
100
101
102
103
104
105
106
107
108
Encuesta
Link: https://goo.gl/forms/cvVXjU5CYzl1BIbv2
109

Informe Probabilidad PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Informe Probabilidad PDF

Cargado por

Copyright:

Formatos disponibles

HÁBITOS ALIMENTICIOS DE LOS ESTUDIANTES DE LA UN.

GABRIELA ILEANA AVILA SALAZAR

UNIVERSIDAD NACIONAL DE COLOMBIA

Identificar y conocer los hábitos alimenticios de los estudiantes de la Universidad Nacional,

 Realizar un estudio a través de la encuesta acerca de la alimentación los

Debido a la gran cantidad de lugares dedicados a la venta de comida dentro de la Universidad

 Cantidad de dinero que invierte en el almuerzo

 Para datos no agrupados:

La mediana representa el 50% del tamaño de la muestra. Para obtener la posición

El cuartil 1 representa el 25 % del tamaño de la muestra. Para obtener la posición

La posición del cuartil es x , dado que no es un numero entero, se hace un promedio

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el

La media representa el promedio de los datos obtenidos en la muestra aleatoria. La

n , donde x es cada uno de los datos de la muestra aleatoria y n el

La moda es el dato que más se repite en la muestra aleatoria.

 Para datos agrupados:

La clase es la cantidad de intervalos en los que debemos dividir el tamaño total de la

AMPLITUD DEL INTERVALO

lim sup lim inf

FRECUENCIA ABSOLUTA (fa)

La frecuencia absoluta es la cantidad de datos agrupados que se encuentran en cada

La frecuencia absoluta acumulada es la suma de cada (fa) de los intervalos.

FRECUENCIA RELATIVA (fr)

La frecuencia relativa está dada por la siguiente ecuación:

FRECUENCIA RELATIVA ACUMULADA (Fra)

La frecuencia relativa acumulada es la suma de cada (fr) de los intervalos.

MARCA DE CLASE (MC)

La marca de clase es el promedio entre los límites de cada intervalo.

La media representa el promedio de los datos obtenidos en la muestra total. La

La mediana representa el 50% del tamaño total de la muestra. Se determina con la

La moda es el dato más se repite en la muestra total. Se determina con la siguiente

inmediatamente anterior y fa 1 es la frecuencia absoluta inmediatamente

La varianza se determina con la siguiente ecuación:

DESVIACION ESTANDAR (SD)

La desviación estándar es la raíz cuadrada de la varianza.

El coeficiente de variación está dado por la ecuación:

Nos da el mínimo y el máximo de desviaciones permitidas, según el límite mínimo y

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:

La posición de la mediana en este caso es 5.5, como no es un entero se haya el

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el

Q3  5  ((6  5) * 0.75)  5.75

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

La posición de la mediana en este caso es 4, de acuerdo con la muestra aleatoria

La posición del cuartil 1 es 2.5, dado que no es un numero entero, se hace un

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el

 Para datos agrupados:

El tamaño total de la muestra es de 100 estudiantes.

Li Ls Fa Faa Fr Fra MC MC-MEDIA (MC-MEDIA)²

clase  ln(100  1)  4.615  5

AMPLITUD DEL INTERVALO

 Al aplicar la ecuación se ve que la media se ubica en el segundo intervalo.

VARIABLE ACTIVIDAD FISICA POR SEMANA (AFS)

VALOR MIN Q1 MEDIANA MEDIA Q3 VALOR MAX

0 1.25 3.5 3.4 5.5 7

Para este procedimiento se toma una muestra aleatoria de 10 estudiantes:

La posición de la mediana en este caso es 5.5, como no es un entero se haya el

La posición del cuartil 1 es 3.5, dado que no es un numero entero, se aplica la

Q1  1  ((2  1) * 0.25)  1.25

El cuartil 3 es el 75 % del tamaño de la muestra, este se determina igual que el

Q3  4  ((6  4) * 0.75)  5.5

Para este procedimiento se toma una muestra aleatoria de 7 estudiantes: