Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIA ESTADÍSTICA
DUITAMA
2020
TABLA DE CONTENIDO
INTRODUCCIÓN ....................................................................................................................................... 6
PLANTEAMIENTO DEL PROBLEMA ........................................................................................................... 7
IDENTIFICACIÓN DEL PROBLEMA ......................................................................................................... 7
JUSTIFICACIÓN..................................................................................................................................... 7
OBJETIVOS ........................................................................................................................................... 8
Objetivo General.............................................................................................................................. 8
Objetivos Específicos ....................................................................................................................... 8
REFERENTES TEÓRICOS ............................................................................................................................ 8
Variables de estudio ............................................................................................................................ 9
MARCO CONCEPTUAL............................................................................................................................ 11
HÁBITOS ALIMENTICIOS..................................................................................................................... 11
VALORACIÓN NUTRICIONAL .............................................................................................................. 11
DIETA BALANCEADA .......................................................................................................................... 11
ALIMENTACIÓN ................................................................................................................................. 11
NUTRICIÓN ........................................................................................................................................ 12
CEREBRO Y ALIMENTACIÓN ............................................................................................................... 12
RENDIMIENTO ACADÉMICO ............................................................................................................... 12
NUTRICIÓN EN EL RENDIMIENTO ACADÉMICO................................................................................... 12
PIRÁMIDE NUTRICIONAL.................................................................................................................... 13
¿Cómo se interpreta? .................................................................................................................... 13
ÍNDICE DE MASA CORPORAL .............................................................................................................. 14
METODOLOGÍA ..................................................................................................................................... 15
TIPO DE ESTUDIO ............................................................................................................................... 15
POBLACIÓN ....................................................................................................................................... 15
MUESTRA .......................................................................................................................................... 15
VARIABLES DE ESTUDIO ..................................................................................................................... 16
RECOLECCIÓN DE DATOS ................................................................................................................... 18
INFORME ESTADÍSTICO.......................................................................................................................... 18
1. X: Edad (en años) ........................................................................................................................... 18
Sistema de hipótesis ...................................................................................................................... 19
2. X: Sexo ........................................................................................................................................... 20
3. X: Estatura en centímetros ............................................................................................................. 21
4. X: peso en kilogramos .................................................................................................................... 22
Sistema de hipótesis ...................................................................................................................... 23
5. X: Promedio último semestre (segundo semestre 2019)................................................................. 24
Sistema de hipótesis ...................................................................................................................... 24
JUZGAMIENTO DE HIPÓTESIS BAJO NORMALIDAD ............................................................................. 25
X: Estatura en centímetros ............................................................................................................. 25
X: Estatura en centímetros ............................................................................................................. 26
Y: Promedio último semestre (segundo semestre 2019) ............................................................. 27
Y: Promedio último semestre (segundo semestre 2019)................................................................. 28
ESTIMACIÓN POR INTERVALOS .......................................................................................................... 29
X: Estatura en centímetros ............................................................................................................. 29
Y: Promedio último semestre (segundo semestre 2019)................................................................. 30
6. X: Número de frutas consumidas semanalmente ........................................................................... 32
Sistema de hipótesis ...................................................................................................................... 33
7. X: Número de porciones de verduras consumida semanalmente............................................... 34
Sistema de hipótesis ...................................................................................................................... 34
Distribución Logística ..................................................................................................................... 35
8. X: Número de comidas entre desayuno, almuerzo y/o cena consumidas diariamente. ............... 36
Distribución normal ....................................................................................................................... 36
Distribución binomial negativa:...................................................................................................... 37
Distribución geométrica:................................................................................................................ 38
Distribución Poisson: ..................................................................................................................... 38
Distribución exponencial................................................................................................................ 39
9. X: Tiempo dedicado al consumo de una comida en minutos ....................................................... 40
Sistema de hipótesis ...................................................................................................................... 40
10. X: Número de panes tradicionales que consume al día ........................................................... 41
Sistema de hipótesis ...................................................................................................................... 42
11. X: Raciones de comida en comparación con las de otras personas de aproximadamente la
misma edad y del mismo género ....................................................................................................... 43
12. X: Numero de vasos de agua que bebe al día .......................................................................... 44
Sistema de hipótesis ...................................................................................................................... 45
13. X: Alimentos que consume en el desayuno ............................................................................. 46
14. X: Número de veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por
tener más tiempo para estudiar ......................................................................................................... 47
Distribución exponencial................................................................................................................ 47
Distribución Poisson ...................................................................................................................... 48
Distribución binomial negativa:...................................................................................................... 49
Distribución geométrica:................................................................................................................ 49
15. X: Número de veces a la semana que come legumbres (lenteja, garbanzo, frijol, etc.) ............ 50
X: Frecuencia con que consume azúcar .............................................................................................. 52
17. X: Número de veces que come pescado a la semana .............................................................. 52
Sistema de hipótesis ...................................................................................................................... 53
18. X: Número de veces a la semana que come grasas (malas) o embutidos ................................. 54
Sistema de hipótesis ...................................................................................................................... 55
19. X: Cantidad de productos procesados como gaseosas, bebidas energizantes, galletas, papas
fritas, etc., que consume a la semana. ............................................................................................... 56
Sistema de hipótesis ...................................................................................................................... 57
20. X: Tipo de aceite y grasas que utiliza habitualmente para cocinar o preparar las ensaladas .... 57
21. X: Número de veces que consume bebidas alcohólicas a la semana........................................ 58
Sistema de hipótesis ...................................................................................................................... 59
22. X: Controla la sal que añade a los platos ................................................................................. 60
23. X: Número de veces al día que come por impulsos debido a gula, ansiedad y/o estrés. .......... 61
Sistema de hipótesis ...................................................................................................................... 62
PREGUNTAS DE INTERÉS .................................................................................................................... 63
MODELO LINEAL .................................................................................................................................... 65
COMPONENTE ALEATORIO ................................................................................................................ 65
COMPONENTE SISTEMATICO ............................................................................................................. 67
FUNCIÓN DE ENLACE ......................................................................................................................... 68
ESTIMACIÓN DE LOS PARÁMETROS ................................................................................................... 68
ESTIMACIÓN POR INTERVALOS PARA LOS 𝜷𝒋 ..................................................................................... 70
JUZGAMIENTO DEL MODELO VÍA HIPOTESIS LINEAL .......................................................................... 72
SELECCIÓN DEL MODELO OPTIMO ..................................................................................................... 74
EVALUACIÓN DEL MODELO................................................................................................................ 81
COMPONENTE ALEATORIO ............................................................................................................ 81
HOMOCEDASTICIDAD .................................................................................................................... 81
NORMALIDAD DE LOS RESIDUALES (LOS ERRORES DEL MODELO) .................................................. 82
AUTOCORRELACIÓN ...................................................................................................................... 83
COMPONENTE SISTEMATICO ......................................................................................................... 83
DATOS INUSUALES ......................................................................................................................... 83
OUTLIERS ....................................................................................................................................... 84
DATOS INFLUYENTES ..................................................................................................................... 85
CONCLUSIONES ..................................................................................................................................... 89
REFERENCIAS BIBLIOGRÁFICAS .............................................................................................................. 90
INTRODUCCIÓN
Este proyecto estadístico está enfocado en ver la relación entre los hábitos alimenticios con el
rendimiento académico de los estudiantes activos de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama en modalidad presencial.
Para esto se utilizó una encuesta que se aplicó virtualmente y los datos se utilizaron para realizar
un informe estadístico sobre la relación entre los hábitos alimenticios con el rendimiento
académico de los estudiantes. En el informe estadístico obtuvimos variables que nos permitieron
identificar si hay relación entre los hábitos alimenticios y el rendimiento académico de los
estudiantes.
Este proyecto se lleva a cabo con ayuda del programa R Studio es un entorno de desarrollo
integrado (IDE) para el lenguaje de programación R, dedicado a la computación estadística y
gráficos, a través de ella encontramos muchos resultados a partir de los datos obtenidos en la
encuesta realizada pero también es necesario instalar en el R Studio los siguientes paquetes:
readx1: Compilar los datos de Excel al RStudio.
agricolae: Graficas en RStudio
grid y vcd: se utilizan para el test de Kolmogorov-Smirnov y Goodfit.
MASS, survival y fitdistriplus: para comparar la relación que hay entra la gráfica
acumulada con la empírica.
library(lmtest): librería para hallar test de Breusch-Pagan de homocedasticidad del modelo
library(stats) y library(faraway): Librerías para cargar la gráfica de los datos grandes de la
variable respuesta en la matriz HAT
Que nos ayudaran para poder cargar las librerías y poder utilizar los test vistos en clase.
Los test utilizando para hacer el juzgamiento de hipótesis sobre el modelo de distribución de cada
variable de estudio con el modelo de bondad de ajuste son:
Kolmogorov-Smirnov (ks.test): se utiliza para las distribuciones continuas.
Goodfit: se utiliza para las distribuciones discretas.
En primera instancia se asignó una distribución para cada una de las variables estadísticas con sus
respectivos parámetros.
Finalmente se encontró un modelo lineal el cual nos permitió determinar las variables que influyen
en el rendimiento académico.
PLANTEAMIENTO DEL PROBLEMA
Este proyecto tiene como fin saber la relación entre la alimentación y el rendimiento académico
de los estudiantes activos de la carrera LICENCIATURA EN MATEMÁTICAS Y
ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE
COLOMBIA seccional Duitama en modalidad presencial.
El enfoque a este problema es debido a que los estudiantes de dicha universidad pueden estar
teniendo una mala alimentación en su día a día, por diversas causas y esto puede estar afectando
el rendimiento académico de los estudiantes.
JUSTIFICACIÓN
Este proyecto se desarrolla por que se ha observado que muchos estudiantes no se preocupan por
una buena alimentación ni por el horario en el cual lo hacen, ya que están enfocados en el estudio
y muchas otras preocupaciones. Olvidando que es necesario una alimentación saludable que
permita desarrollar la agilidad mental, además mejorar la capacidad de concentración y bienestar
personal, forjando el rendimiento académico se mantenga o mejore por esto se busca saber a través
de este proyecto la influencia que existe entre la mala alimentación y el rendimiento académico en
la carrera LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA que ofrece la UPTC
seccional Duitama en modalidad presencial.
Se cree que un deficiente desempeño académico es consecuencia de una inadecuada alimentación
y nutrición que le limita realizar algunas actividades en el salón, tanto para participar como poner
atención a la clase. Es evidente que muchos de los alumnos se presentan a clases sin haber
desayunado, pero tampoco se alimentan en el transcurso del día, otros tienen la tendencia a
consumir comida “chatarra” durante el día, sin embargo, estos alimentos no ayudan para que los
compañeros se desempeñen bien en las clases, empezando por la cantidad de alimento que se
consume, que es muy poco y no los satisface; ocasionando que sigan con hambre y distraídos.
Siendo todo esto resultado del ritmo acelerado de vida y la limitación de recursos económicos.
OBJETIVOS
Objetivo General
Objetivos Específicos
Analizar los hábitos alimenticios de los estudiantes de la LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA (LME) de la UNIVERSIDAD PEDAGÓGICA
Y TECNOLÓGICA DE COLOMBIA (UPTC) seccional Duitama en modalidad
presencial.
Estimar los parámetros de cada variable del proyecto para poder inferir acerca de los
resultados.
Juzgar hipótesis para los modelos de probabilidad de las variables correspondientes al
proyecto.
REFERENTES TEÓRICOS
Para la presente investigación sobre “la relación de los hábitos alimenticios en el rendimiento
académico de estudiantes de la LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA”,
vamos a tener en cuenta referentes teóricos que nos aportan a la investigación ya sea porque han
realizado estudios de este tipo o porque nos aportan de manera teórica conocimientos directamente
relacionados con el enfoque de la misma.
Variables de estudio
Peso: variable cuantitativa continua se mide en kg.
Talla: variable cuantitativa continua se mide en cm.
Índice de masa muscular: variable cuantitativa continua, se mide en kg/ m².
Pliegues cutáneos a nivel bicipital, tricipital, subescapular y suprailíaco: variable
cuantitativa continua, se mide en mm.
Circunferencia abdominal: variable cuantitativa continua se mide en cm.
Parámetros analíticos: los parámetros mostrados a continuación son variables
cuantitativas continuas.
Además se indican junto a estos los valores de normalidad aceptados para la
realización de este proyecto.
Colesterol: variable cuantitativa continua se mide en mg/dl.
Son algunas de las variables de estudio más comunes y probables a desarrollar debido al complejo
que involucra el hacinamiento poblacional universitario y social en el que se va a desarrollar la
investigación.
Por otro lado, de acuerdo al trabajo de investigación (Estado nutricional y rendimiento académico
en estudiantes de educación media de los colegios IPARM (Universidad Nacional de Colombia-
sede Bogotá) y Pío XII (Municipio de Guatavita)) presentado como requisito parcial para optar al
título de: Magister en Educación de la profesional Doris Amanda Ramírez de Peña de la
Universidad Nacional de Colombia (Facultad de Ciencias Humanas, Instituto de Investigación en
Educación), del año 2014; consideramos la siguiente información como primordial para el
conocimiento y adaptación de nuestra investigación.
En la desnutrición existen diferentes tipos, pero las diversas formas suelen manifestarse de manera
conjunta, por ejemplo, las deficiencias proteínico-calóricas, de yodo, hierro y de vitamina A
(Lorenzana, 1999). Cada tipo de desnutrición resulta de una gama muy diversa de factores: en su
nivel más inmediato, las carencias nutricionales son consecuencia tanto de las enfermedades como
de una ingesta alimentaria inadecuada, lo cual debilita al organismo en diversos grados de
severidad e incluso, en los casos más graves, ocasiona la muerte (Lorenzana, 1999).
Por esta razón, una alimentación saludable debe cubrir las necesidades calóricas del organismo y
asegurar que todos los nutrientes estén en armonía (Izquierdo, Armenteros, Lancés y Martín,
2004). También, debe ser completa en su composición y adecuada a cada individuo, teniendo en
cuenta las condiciones propias de la edad, sexo, estado de salud, nivel de actividad y costumbres
(Organización Mundial de la Salud, 2004).
Además del difícil acceso a los alimentos, hay otros factores que contribuyen a la inseguridad
alimentaria:
Es indispensable conocer estos factores debido a que no son para nada externos de la presente
investigación debido al estado y situación de la población de estudio y más cuando provienen de
un modelo de educación pública que es protagonizada en un muy alto porcentaje por estratos uno
y dos en este país.
MARCO CONCEPTUAL
HÁBITOS ALIMENTICIOS
Son comportamientos conscientes, colectivos y repetitivos, que conducen a las personas a
seleccionar, consumir y utilizar determinados alimentos o dietas, en respuesta a unas influencias
sociales y culturales.
El proceso de adquisición de los hábitos alimentarios comienza en la familia.
La Infancia es el momento óptimo para adquirir unos buenos hábitos alimentarios. Estos se
adquieren por repetición y de forma casi involuntaria, la familia tiene una gran influencia y esta se
va reduciendo a medida que los niños crecen.
En cambio, en los adultos y en las personas de edad avanzada los hábitos alimentarios son muy
difíciles de cambiar.
VALORACIÓN NUTRICIONAL
Puede ser definida como la interpretación de la información obtenida a partir de estudios
antropométricos, alimentarios, bioquímicos y clínicos. Dicha información es utilizada para
determinar el estado nutricional de individuos o grupos de población en la medida que son
influenciados por el consumo y la utilización de nutrientes.
DIETA BALANCEADA
Hace referencia a un tipo de alimentación que contiene los nutrientes que el organismo necesita
para poder funcionar perfectamente. Estos nutrientes esenciales son las proteínas, los hidratos de
carbono, las vitaminas, los minerales y el agua. una alimentación balanceada permite a la persona
que la sigue tener una mejor calidad de vida con todo lo que eso conlleva.
ALIMENTACIÓN
Es un proceso mediante al cual los seres vivos consumen diferentes tipos de alimentos para obtener
de estos los nutrientes necesarios para sobrevivir y realizar todas las actividades necesarias del día
a día.
NUTRICIÓN
Es el proceso biológico en el que los organismos humanos absorben de los alimentos los nutrientes
necesarios para la vida.
La nutrición es importante porque es fundamental para el funcionamiento y el mantenimiento de
las funciones vitales de los seres vivos, ayuda a mantener el equilibrio homeostático del organismo,
tanto en procesos macro sistémicos, como la digestión o el metabolismo.
CEREBRO Y ALIMENTACIÓN
El cerebro representa sólo el 2% de nuestro peso: sin embargo, necesita alrededor del 20% de la
energía que ingerimos. Si nosotros “somos lo que comemos”, entonces nuestro cerebro también
dependerá de lo que comamos.
Un exceso o un defecto del nutriente necesario puede afectar al sistema nervioso. Una
alimentación desequilibrada puede producir carencias específicas de algunos de los nutrientes, que
se manifiestan mediante síntomas o sensaciones como apatía, desgana, irritabilidad, nerviosismo,
cansancio, falta de atención, fallos de memoria, de concentración e incluso depresión.
RENDIMIENTO ACADÉMICO
Hace referencia a la evaluación del conocimiento adquirido en el ámbito escolar, terciario o
universitario. Un estudiante con buen rendimiento académico es aquél que obtiene calificaciones
positivas en los exámenes que debe rendir a lo largo de una cursada.
En otras palabras, el rendimiento académico es una medida de las capacidades del alumno, que
expresa lo que éste ha aprendido a lo largo del proceso formativo. También supone la capacidad
del alumno para responder a los estímulos educativos. En este sentido, el rendimiento académico
está vinculado a la aptitud.
PIRÁMIDE NUTRICIONAL
La pirámide nutricional es una herramienta de educación y promoción de salud que se muestra de
manera gráfica y sencilla a través de dibujos o fotografías de los alimentos e indica que cantidades
han de consumirse para seguir una alimentación saludable.
¿Cómo se interpreta?
La forma triangular de la pirámide nutricional nos orienta sobre la frecuencia y las cantidades que
debemos consumir de diferentes alimentos. En los primeros eslabones, se sitúan los alimentos que
más peso han de tener en la alimentación diaria. A medida que vamos subiendo de niveles,
aparecen otros alimentos que hay que consumir en menor cantidad.
En el vértice se sitúan alimentos de consumo opcional y que en caso de consumirse, ha de ser
ocasionalmente.
ÍNDICE DE MASA CORPORAL
El Índice de Masa Corporal es una fórmula matemática que pone en relación el peso y la altura de
una persona, y que se utiliza para saber si ésta se encuentra en unos niveles de peso saludables
según sus características personales. Para ello, el resultado obtenido se puede comparar con unas
tablas creadas por la Organización Mundial de la Salud que establecen, para los distintos niveles
de IMC, si la persona se encuentra por encima o por debajo del nivel deseado, o en un nivel
apropiado.
METODOLOGÍA
TIPO DE ESTUDIO
Se hará un estudio de tipo investigación cuantitativa y cualitativa
POBLACIÓN
Se va a trabajar con los estudiantes activos de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama.
MUESTRA
Se plantea trabajar con 50 estudiantes de la población previamente indicada.
La muestra se seleccionara por conveniencia entre los estudiantes activos actualmente en las clases
de virtualidad y tengan acceso a internet constantemente, de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama.
VARIABLES DE ESTUDIO
Son Similares.
Raciones de comida en
comparación con las de otras Ligeramente abundantes.
Cualitativa (nominal)
personas de aproximadamente la Más abundantes.
misma edad y del mismo género.
No hago comparaciones.
INFORME ESTADÍSTICO
𝑥≥0
plotdist(EDAD,histo=TRUE,demp=TRUE) plot(AJUSTE.EDAD)
Sistema de hipótesis
VS
Como sabemos para las distribuciones Gamma podemos utilizar la prueba de bondad de ajuste,
con el test de Kolmogorov-Smirnov y obtenemos a través de R Studio:
Conclusión: Según el test de Kolmogorov-Smirnov no se rechaza la hipótesis nula dado que el
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.1227 , entonces él 𝑝 − 𝑣𝑎𝑙𝑜𝑟 es de un 12.27% y es mayor al 10%, por lo tanto la
variable edad se distribuye como una Gamma de parámetros 𝛼 = 48.893418 y 𝛽 = 2.047441.
2. X: Sexo
VARIABLE HISTOGRAMA
X: sexo
X = {femenino ó masculino}
X~Bernoulli(éxito=Femenino)
X~Bernoulli (π)
Frecuencia Porcentaje
π=P(x=éxito)
Femenino 31 62% π=P(x=femenino)
3. X: Estatura en centímetros
VARIABLE HISTOGRAMA
X: estatura en centímetros
plotdist(ESTATURA,histo=TRUE,demp = plot(ajuste.ESTATURA)
TRUE)
Como sabemos que para las distribuciones normales podemos utilizar la prueba de bondad de
ajuste, con el test de Kolmogorov-Smirnov obtenemos:
4. X: peso en kilogramos
VARIABLE HISTOGRAMA
X: peso en kilogramos
plotdist(PESO,histo = TRUE,demp = plot(ajuste.PESO)
TRUE)
Sistema de hipótesis
VS
Sabemos que para las distribuciones Gamma podemos utilizar la prueba de bondad de ajuste, con
el test de Kolmogorov-Smirnov y obtenemos:
Conclusión: podemos decir que por medio del test de Kolmogorov-Smirnov el p-valor=0.8876, y
como p-valor es de un 88.76% mayor al 10%, no se rechaza la hipótesis nula de que X~ gamma
(α=33.6653192, β=0.5309945). Por lo tanto el peso en kilogramos se distribuye gamma con
parámetros α=33.6653192 y β=0.5309945.
5. X: Promedio último semestre (segundo semestre 2019)
Esta variable describe el promedio del segundo semestre de 2019 de los estudiantes de
LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA de la UPTC. Es una variable aleatoria
continua que se distribuye como una normal de acuerdo a los parámetros que toma es la que más
se ajusta a este caso.
VARIABLE HISTOGRAMA
Sistema de hipótesis
VS
𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇 = 3.72, 𝜎 = 0.3243455)
Hasta el momento hemos encontrado dos variables que se distribuyen como normales,
procedemos a realizar:
X: Estatura en centímetros
Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.
X ~Normal (µ, 𝝈)
Sistema de hipótesis
X: Estatura en centímetros
Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.
X ~Normal (µ, 𝝈)
Sistema de hipótesis
Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.
Y ~Normal (µ, 𝝈)
Sistema de hipótesis
Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.
Y ~Normal (µ, 𝝈)
Sistema de hipótesis
X: Estatura en centímetros
Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.
X ~Normal (µ, 𝝈)
Utilizando RStudio
Un IC al 95% para μ :
(162.6405, 167.2795)
X ~Normal (µ, 𝝈)
Utilizando RStudio
Un IC al 95% para μ :
(46.47975, 103.43618)
Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.
Y ~Normal (µ, 𝝈)
Utilizando RStudio
Un IC al 95% para μ :
(3.626886, 3.813114)
Con un 95% de confianza la media del promedio de los Estudiantes de la carrera LME de la UPTC
estará entre 3.626886 y 3.813114.
Y ~Normal (µ, 𝝈)
Utilizando RStudio
Un IC al 95% para μ :
(0.07490486, 0.16669352)
Con un 95% de confianza la varianza del promedio de los Estudiantes de la carrera LME de la
UPTC estará entre 0.07490486 y 0.16669352.
Esta variable describe la cantidad de frutas que consume semanalmente un estudiante de la UPTC
de LME. Es una variable aleatoria que se ajusta a una distribución 𝑋~𝑐𝑎𝑢𝑐ℎ𝑦(𝑥0 =
4.930212 , 𝛾 = 2.094042) de acuerdo a sus parámetros.
VARIABLE HISTOGRAMA
VS
Ya que conocemos que para las distribuciones Cauchy se puede emplear la bondad de ajuste con
el test de Kolmogorov-Smirnov obtenemos:
Entonces la variable número de frutas consumidas semanalmente se distribuye como una Cauchy
con parámetros 𝑥0 = 4.930212 y 𝛾 = 2.094042.
7. X: Número de porciones de verduras consumida semanalmente.
VARIABLE HISTOGRAMA
Sistema de hipótesis
VS
Distribución Logística
Esta variable describe número de comidas consumidas al día por un estudiante de la LME de la
UPTC. Es una variable que se ajusta a una variable normal.
VARIABLE HISTOGRAMA
plotdist(COMIDASCONSUMIDAS,histo plot(ajuste.COMIDASCONSUMIDAS)
= TRUE,demp = TRUE)
Distribución normal
Sistema de hipótesis
VS
Conclusión: Por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye como una normal con parámetros 𝜇 = 2.7, 𝜎 =
1.982423.
VS
Como sabemos que para las distribuciones binomiales negativas podemos utilizar la prueba de
bondad de ajuste con el comando goodfit el resultado del test:
Distribución geométrica:
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑔𝑒𝑜𝑚(𝑝 = 0.2702703)
VS
Para la distribucion geometrica utilizamos la prueba de bondad de ajuste con el comando goodfit
obtenemos el resultado del test:
Conclusión: Entonces la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye geométrica con parámetros 𝑝 = 0.2702703.
Distribución Poisson:
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 2.7)
VS
Ya que conocemos que para las distribuciones Poisson podemos utilizar la prueba de bondad de
ajuste con el comando goodfit obteniendo:
El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 2.7),
por el p-valor menor a 0.05.
Conclusión: por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye como una Poisson con parámetros λ = 2.7.
Distribución exponencial
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.3703704)
VS
Ya que conocemos que para las distribuciones exponenciales podemos utilizar la prueba de bondad
de ajuste con el test de Kolmogorov-Smirnov donde obtenemos:
Conclusión: Entonces la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye exponencial con parámetros 𝜃 = 0.3703704.
Por consiguiente, la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se ajusta a ninguna distribución.
9. X: Tiempo dedicado al consumo de una comida en minutos
Esta variable describe el tiempo en minutos al que se dedica un estudiante de la UPTC de la LME
en consumir sus alimentos. Es una variable que se ajusta a una distribución normal de acuerdo a
sus parámetros.
VARIABLE HISTOGRAMA
plotdist(T.CONSUMOALIMENTOS,histo = plot(ajuste.T.CONSUMOALIMENTOS)
TRUE,demp = TRUE)
Sistema de hipótesis
VS
El resultado demuestra el no ajuste ya que el p-valor es de 4.12 % que es menor al 10% y se rechaza
la hipótesis nula de que 𝑋~𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 23.14, 𝜎 = 9.844816).
Conclusión: Por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye normal con parámetros 𝜇 = 23.14, 𝜎 = 9.844816.
Se probó con otras distribuciones, pero el test de Kolmogorov-Smirnov nos daba valores para p
menores al 10%, por lo tanto esta variable no se ajusta a ninguna distribución de las vistas en clase
y que se le asignaron.
Esta variable describe el número de panes que consume un estudiante de la UPTC de la LME. Es
una variable aleatoria continua que se distribuye como una exponencial que toma con un parámetro
O>0.
VARIABLE HISTOGRAMA
X~exp(𝜃 = 0.5434783)
plotdist(CONSUMODEPANES,histo = plot(ajuste.CONSUMODEPANES)
TRUE,demp = TRUE)
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.5434783)
VS
Esta variable describe las cualidades de cómo son las raciones de comida de un estudiante de la
UPTC de LME en comparación con otras personas de la misma edad y género. Es una distribución
multivariada. En teoría de probabilidad, la distribución multinomial es una generalización de la
distribución binomial.
VARIABLE HISTOGRAMA
Tabla
Ligeramente más 14 %
abundantes 7
No hago comparaciones 24 48 %
Son similares 16 32 %
Más abundantes 3 6%
Total 50 100 %
Conclusión: La mayor parte de los estudiantes no observa ni compara la cantidad de comida que
consumen frente a las demás personas. Pero de la parte de estudiantes que si compara, se observa
que un 32% consume raciones de comida similares, lo que puede indicarnos que la mayor parte de
la población consume una cantidad de comida promedio, cantidad que consideramos saludable.
Además, encontramos que un 14 % y un 6% de los estudiantes consumen más comida de la comida
promedio por ende un 20% de todos los encuestados se considera que tienen mala alimentación,
esto sin tener en cuenta el 48% de nuestra población que indico no hacer comparaciones, lo que
hace que aún más estudiantes del 20% consuman más comida de la adecuada para tener una buena
alineación. Trayendo problemas de obesidad, pesadez, sueño, pereza y otros problemas que afectan
el rendimiento académico de los estudiantes.
Esta variable describe el número de vasos que consume un estudiante de LME de la UPTC. Es
una variable aleatoria que tiene una distribución exponencial ya que es la que más se ajusta de
acuerdo a los parámetros y propiedades que conserva este caso.
VARIABLE HISTOGRAMA
X~exp(𝜃 = 0.3125)
plotdist(CONSUMODEPANES,histo plot(ajuste.VASOSDEAGUA)
= TRUE,demp = TRUE)
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.3125)
VS
Conclusión: Entonces la variable Numero de vasos de agua que bebe al día no se distribuye
exponencial con parámetros 𝜃 = 0.3125.
Para las Variables número de vasos de agua que bebe al día se probaron varias distribuciones
continuas con el test de Kolmogorov-Smirnov como lo son: normal, lognormal, gamma,
exponencial, cauchy, Weibull, logística, ji-cuadrado y t de student, pero el p-valor fue muy
pequeño por lo tanto ninguna de estas distribuciones es la apropiada para estas variables.
13. X: Alimentos que consume en el desayuno
Es una variable que describe la cualidad de alimentos que consume para el desayuno los
estudiantes de la LME de la UPTC. Se distribuye como una variable multivariada.
VARIABLE HISTOGRAMA
TABLA
No suelo desayunar 4
Total 50
Conclusión: El 72% de los estuantes consumen alimentos cómo: café, leche, infusiones, fruta,
cereal, pan y/o huevos indicando un desayuno saludable, un 20% sólo un café o café con pan que
no se considera muy saludable y un preocupante 8% no desayuna lo que implica que el cerebro no
tenga su mejor funcionamiento, rendimiento teniendo en cuenta que son estudiantes y que
requieren de mucha agilidad mental.
14. X: Número de veces a la semana dejas de desayunar, almorzar, cenar y/o
tomar onces por tener más tiempo para estudiar
Describe el número de veces que deja de consumir alimentos por dedicarse a estudiar en la semana.
Esta variable se ajusta a una distribución exponencial de acuerdo a su parámetro α > 0. y condición.
VARIABLE HISTOGRAMA
X~exp(𝜃 = 0.5813954)
Distribución exponencial
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.5813954)
VS
Distribución Poisson
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 1.72)
VS
Ya que conocemos que para las distribuciones Poisson podemos utilizar la prueba de bondad de
ajuste con el comando goodfit obteniendo:
VS
Al realizar la prueba de bondad de ajuste con el comando goodfit el resultado del test:
Conclusión: Por lo que el número de veces a la semana dejas de desayunar, almorzar, cenar y/o
tomar onces por tener más tiempo para estudiar no se distribuye como una binomial negativa de
parámetros 𝑘 = 0.7466979 y 𝛽 = 1.7198037.
Distribución geométrica:
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑔𝑒𝑜𝑚(𝑝 = 0.3676471)
Vs
Para la distribucion geometrica utilizamos la prueba de bondad de ajuste con el comando goodfit
obtenemos el resultado del test:
El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑔𝑒𝑜𝑚(𝑝 =
0.3676471), por el p-valor menor al 0.05.
Por consiguiente, la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se ajusta a ninguna distribución.
variable que describe el número de veces que consume legumbres a la semana un estudiante de la
LICENCIATURA EN MATEMÁTICAS Y ESTADISTICA. Es una variable que se distribuye
como una 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6 ).
VARIABLE HISTOGRAMA
𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6 )
plotdist(LEGUMBRES,histo = plot(ajuste.legumbres)
TRUE,demp = TRUE)
Sistema de hipótesis
𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6)
VS
Para las distribuciones Poisson podemos utilizar la prueba de bondad de ajuste con el comando
goodfit obtenemos:
Conclusión: Según el test para variables discretas utilizando el paquete vcd en RStudio y el
comando goodfit se comprueba se obtiene un p – valor = 0.14295530, y como el p- valor es igual
al 14.29553% y es mayor al 10 %, por lo tanto no hay suficiente evidencia para rechachar la
hipotesis nula de que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6). Por lo tanto la variable número de de veces que
consume legumbres a la semana se distribuye como una Poisson de parametro 𝜆 = 3.6 .
X: Frecuencia con que consume azúcar
Esta variable describe las cualidades del consumo de azúcar de un estudiante de la UPTC de LME.
Es una variable que se distribuye como una multivariada de acuerdo a los parámetros que tiene.
VARIABLE HISTOGRAMA
TABLA
Opciones Frecuencia
Con moderación 24
Total 50
Conclusión: se evidencia un moderado uso del azúcar por parte de los estudiantes, pero un 32%
de los estuantes consumen azúcar en exceso.
Esta variable describe el número de veces que consume pescado a la semana un estudiante de la
UPTC de la LME. Que se distribuye como una Binomial Negativa ya que es el modelo más
adecuado que se ajusta de acuerdo a sus parámetros para este proceso.
Es una variable que se distribuye como una Poisson de acuerdo a los parámetros que toma en este
caso.
VARIABLE HISTOGRAMA
X~Pois(lambda=0.58)
plotdist(consumopescado,histo = plot(ajuste.consumopescado)
TRUE,demp = TRUE)
Sistema de hipótesis
𝑯𝟎 : 𝑥~𝑃𝑜𝑖𝑠(𝜆 = 0.58)
Vs
Como sabemos que para las distribuciones binomiales negativas podemos utilizar la prueba de
bondad de ajuste obtenemos:
Conclusión: Donde él 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.15137201 es grande por lo tanto no se rechaza la
hipótesis nula de que esta variable 𝑥~𝑃𝑜𝑖𝑠(𝜆 = 0.58). por lo tanto, la variable número de veces
que come pescado a la semana se distribuye como una Poisson con parámetro 𝜆 = 0.58 .
La variable describe el número de veces que consume grasas o embutidos a la semana un estudiante
de la UPTC de la LME. Se distribuye como una Binomial Negativa ya que cumple con los
parámetros y el ajuste asignado.
VARIABLE HISTOGRAMA
Vs
Sabiendo que para las distribuciones binomiales negativas podemos utilizar la prueba de bondad
de ajuste con el comando goodfit obteniendo:
Por lo tanto, la variable número de veces a la semana que come grasas (malas) o embutidos se
distribuye binomial negativa con parámetros 𝑘 = 16.824244 y 𝜋 = 2.199839 .
19. X: Cantidad de productos procesados como gaseosas, bebidas
energizantes, galletas, papas fritas, etc., que consume a la semana.
Variable que describe el número de productos procesados que consume a la semana un estudiante
de la UPTC de LME. Es una variable que se distribuye como una exponencial.
VARIABLE HISTOGRAMA
plotdist(PRODUCTOSPROC.,histo = plot(ajuste.PRODUCTOSPROC.)
TRUE,demp = TRUE)
𝑯𝟎 : 𝑋~exp(𝜃 = 0.3731343)
Vs
Como sabemos que para las distribuciones continuas se utiliza el test de Kolmogorov-Smirnov
entonces obtenemos:
Entonces Cantidad de productos procesados como gaseosas, bebidas energizantes, galletas, papas
fritas, etc., que consume a la semana se distribuye como una exponencial con parámetro 𝜃 =
0.3731343.
Esta es una variable que describe el tipo de grasas que utiliza habitualmente un estudiante de la
UPTC de LME. Es una variable que se distribuye como una multinomial de acuerdo a los
parámetros que toma.
VARIABLE HISTOGRAMA
TABLA
Opciones Frecuencia
Otros 2
Total 50
Esta variable describe el número de veces que un estudiante de la LME de la UPTC consume
bebidas alcohólicas a la semana. Tiene una distribución que se ajusta a la distribución lognormal.
VARIABLE HISTOGRAMA
plotdist(BEBIDASALCOHO,histo = plot(ajuste.BEBIDASALCOHO)
TRUE,demp = TRUE)
VS
Por lo tanto la variable número de veces que consume bebidas alcohólicas a la semana se distribuye
como una lognormal con parámetros 𝜇 = 0.8808311 y 𝜎 = 0.3955222.
Esta variable describe las cualidades con que un estudiante de la UPTC de la LME consume y
controla la sal que añade a los platos que come. Es una variable multivariada
VARIABLE HISTOGRAMA
TABLA
Opciones Frecuencia
Conclusión: Como podemos observar la mayoría de estudiantes intentan añadir sal con
moderación lo que nos permite decir que de cierta manera tratan de tener una alimentación
equilibrada.
23. X: Número de veces al día que come por impulsos debido a gula, ansiedad
y/o estrés.
Esta variable describe el número de veces que un estudiante de la UPTC de la LME come por
ansiedad durante el día. Es una variable que se distribuye como una Poisson de acuerdo a los
parámetros que tiene este caso.
VARIABLE HISTOGRAMA
plotdist(ANSIEDAD,histo = plot(ajuste.ANSIEDAD)
TRUE,demp = TRUE)
En RStudio encontramos:
Sistema de hipótesis
𝑯𝟎 : 𝑋~ Pois(𝜆 = 1.541611)
VS
Como sabemos que para la distribución Poisson podemos utilizar la prueba de bondad de ajuste y
obtenemos a través de ella:
Entonces la variable número de veces al día que come por impulsos debido a gula, ansiedad y/o
estrés se distribuye Poisson con parámetro 𝜆 = 1.541611.
PREGUNTAS DE INTERÉS
P(x<=10)
= 0.8753181.
P(x=5)= dlogis(5,4.245309,1.852205)
=0.1295236
P(X=3.5)= dnorm(3.5,3.7200000,0.3243455)
= 0.9772326
P(X<=3)= pexp(3,0.3731343)
= 0.6735253
COMPONENTE ALEATORIO
Para este estudio vamos a tomar a la variable promedio semestral como variable respuesta o
dependiente.
R nos dice que puede ser una posible variable normal con media 37.20 y error estándar de
0.4586938
Graficando lo anterior podemos creer que es una normal
Con el comando en R:
Podemos afirmar que con un nivel de confianza del 95%
No rechazamos nuestra hipótesis nula lo cual nos indica que la variable promedio se distribuye en
una normal
COMPONENTE SISTEMATICO
Teniendo en cuenta las 18 variables cuantitativas de interés que nos da la base de datos, el predictor
lineal (ɳ𝑖 ) queda determinado de la siguiente forma:
ɳ𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝛽3 𝑥𝑖3 + 𝛽4 𝑥𝑖4 + 𝛽5 𝑥𝑖5 + 𝛽6 𝑥𝑖6 + 𝛽7 𝑥𝑖7 + 𝛽8 𝑥𝑖8 + 𝛽9 𝑥𝑖9 + 𝛽10 𝑥𝑖10
+ 𝛽11 𝑥𝑖11 + 𝛽12 𝑥𝑖12 + 𝛽13 𝑥𝑖13
Donde:
𝑥𝑖3 = De las comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día?
𝑥𝑖7 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?
𝑥𝑖12 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?
FUNCIÓN DE ENLACE
La función de enlace para estas variables geográficas presentadas en los datos con respecto a la
variable respuesta (especies endémicas) es la Identidad.
Е[𝑦𝑖 ] = μ𝑖 = ɳ𝑖
Donde 𝑖 = 1, 2, 3, … , 50
Utilizando el programa R se estimaron los parámetros (𝛽) que se tienen en el predictor lineal de
cada una de las doce variables explicativas de los datos el cual nos arroja la estimación de cada
uno, luego el predictor lineal (ɳ𝑖 )queda de la siguiente forma:
𝛽̂0 : 38.35508
𝛽̂1 : -0.15339
𝛽̂2 : -0.14263
𝛽̂3 : 0.28882
𝛽̂4 : -0.04994
𝛽̂5 : -0.18803
𝛽̂6 : 0.42564
𝛽̂7 : -0.25748
𝛽̂8 : 0.52404
𝛽̂9 : 0.21974
𝛽̂10 : 0.22189
𝛽̂11 : -1.47755
𝛽̂12 : -0.64332
𝛽̂0 : el valor esperado del promedio sin tener en cuenta las demás variables.
𝛽̂1 : por cada unidad de cambio en el número de porciones de frutas consumidas en la
semana el promedio disminuirá -0.15 el valor siempre y cuando se mantengan constantes
las otras variables.
𝛽̂2 : el coeficiente -0.14263, negativo, nos indica que por cada porción de fruta el valor
esperado del promedio sufre un decrecimiento en un -0.14263, cuando las demás variables
se mantienen constantes.
𝛽̂3 : Por cada cambio del número de comidas que consume al día el valor esperado del
promedio semestral aumentara en 0.28882 siempre y cuando las demás variables sean
constantes.
𝛽̂4 : Por cada cambio de unidad del tiempo dedicado al consumo de comidas el valor
esperado del promedio disminuirá en -0.04994, siempre y cuando las otras variables se
mantengan constantes.
𝛽̂5 : Por cada aumento en el número de panes consumidos al día el valor esperado del
promedio disminuirá en -0.18803, cuando las demás variables se mantienen constantes.
𝛽̂6 : Por cada aumento en el número de vasos que toma al día el valor esperado del promedio
aumentará 0.42564, siempre y cuando las demás variables se mantengan constantes.
𝛽̂7 : Por cada aumento en el número de veces que no come por estudiar el valor esperado
del promedio disminuirá -0.25748, siempre y cuando las demás variables se mantengan
constantes.
𝛽̂8 : Por cada aumento en el número de veces que come pescado el valor esperado del
promedio aumentara 0.52404, siempre y cuando las demás variables se mantengan
constantes
𝛽̂9 : Por cada aumento en el número de veces que consume grasas o embutidos el valor
esperado del promedio aumentara en 0.21974, siempre y cuando las demás variables se
mantengan constantes.
𝛽̂10 : Por cada aumento en el número de productos procesados consumidos a la semana el
valor esperado aumentará 0.22189, siempre y cuando las demás variables se mantengan
constantes.
𝛽̂11 : Por cada aumento en el número de veces que consume alcohol en la semana el valor
esperado del promedio disminuirá 1.47755, siempre y cuando las demás variables se
mantengan constantes.
𝛽̂12 : Por cada aumento en el número de veces que come por impulso el valor esperado del
promedio disminuirá 0.64332, siempre y cuando las demás variables se mantengan
constantes.
Por medio del programa R-studio, se establecieron para cada 𝛽𝑗 , donde 𝑗 = 0,1, … ,12 un intervalo
de confianza (IC) del 95%. El IC nos permite estimar un rango de valores en el que se encuentra
el Valor del parámetro de cada una de las variables, estos están determinados por:
𝑣𝑠
ℎ𝑎 : 𝛽𝑗 ≠ 0 ∃ 𝑗: 1, … ,12
Total 48
Haciendo el análisis de varianza gracias a la tabla anterior el valor crítico de la distribución F con
11 grados de libertad en el numerador y 37 grados de libertad en el denominador es de 2.044 lo
cual es menor a 2.239. Por lo cual rechazamos 𝐻0 . Es decir que
ℎ𝑎 : 𝛽𝑗 ≠ 0 ∃ 𝑗: 1, … ,12
Es verídico.
Calculando la bondad de ajuste del modelo a través del coeficiente de determinación y coeficiente
de determinación ajustado tendremos que:
𝑆𝐶𝑀 𝐶𝑀𝑅
𝑅2 = = 0.4207 𝑅2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 − = 0.2328
𝑆𝐶𝑇 𝑆𝑆𝑇
𝑁−1
Por lo cual podemos afirmar que hay un pobre ajuste del modelo lo cual nos dice que no se logró
explicar de manera adecuada la variabilidad del modelo con las variables explicativas indicadas.
2. Se ajusta un modelo y se calcula el p-valor del juzgamiento de hipótesis que resulta de incluir
cada variable por separado
3. Seleccionamos el modelo con el p valor más significante el cual sería:
𝑥𝑖3 = De las comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día?
𝑥𝑖5 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?
𝑥𝑖6 = ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas,
etc., consume a la semana?
𝑥𝑖8 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?
Calculando la bondad de ajuste del modelo a través del coeficiente de determinación y coeficiente
de determinación ajustado tendremos que:
𝑆𝐶𝑀 𝐶𝑀𝑅
𝑅2 = = 0.683 𝑅2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 − = 0.4626
𝑆𝐶𝑇 𝑆𝑆𝑇
𝑁−1
COMPONENTE ALEATORIO
Para analizar que distribución de probabilidad tienen los errores se plantea un sistema de hipótesis
para ver si los errores están distribuidos como una normal, se utiliza las gráficas de los residuales,
el test de Kolmogorov-Smirnov y se establece otra hipótesis para hallar la homocedasticidad cada
uno de estos test se realizaron en el programa R. a continuación se muestra la evidencia.
HOMOCEDASTICIDAD
𝑆𝐶𝑀
𝑅2 = = 0.06489
𝑆𝐶𝑇
Lo cual nos quiere decir que hay muy poca relación entre los residuales y los ajustados lo cual es
una buena señal para la normalidad del error.
ℎ𝑎 : 𝜀𝑖 𝑛𝑜 𝑠𝑜𝑛 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑜𝑠
Que da un valor BP de 6.5966 con 8 grados de libertad y un p valor de 0.5413 que es un valor
grande lo cual interpretamos que hay homocedasticidad (no se rechaza la hipótesis nula) en los
residuales.
Las graficas anteriores nos hacen creer que hay normalidad en los residuales y al parecer solo 3
datos no se ajustan debidamente al Q-Q plot
Con el teste d
𝜀𝑖 ~𝑛𝑜𝑟𝑚(0, 𝜎 2 )
AUTOCORRELACIÓN
Para evaluar la autocorrelación entre las variables se plantea un sistema de hipótesis, el cual se
trabajará en el programa R por medio del test de Durbin Watson, a continuación, se muestran las
evidencias.
ℎ0 : 𝑟ℎ0 = 0
𝑣𝑠
ℎ𝑎 : 𝑁𝑜 𝑒𝑠𝑡𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠
COMPONENTE SISTEMATICO
DATOS INUSUALES
Laverage
Para hallar los laverage de nuestros datos se utiliza los siguientes comandos aplicados en el
programa R, a continuación, se muestra los Laverage del modelo
2𝑝 3
Analizando estos datos podemos concluir a partir de la propiedad = 50 = 0.06 > 𝐻𝑖𝑡, los
𝑁
datos Laverage del modelo son los siguientes
OUTLIERS
Para detectar los outliers se utiliza Jackknife en el programa R, en donde se utilizan los
siguientes comandos para hallar el máximo posible outliers, se plantea un sistema de hipótesis
para comprobar si efectivamente es un outliers, el cual se soluciona por medio del test de
Bonferroni.
ℎ0 : 𝐷𝑎𝑡𝑜 46 𝑛𝑜 𝑒𝑠 𝑢𝑛 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑠
𝑣𝑠
ℎ𝑎 : 𝐷𝑎𝑡𝑜 46 𝑒𝑠 𝑢𝑛 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑠
Como el dato de mayor valor residual es el 45 con un tamaño de 2.853 y haciendo el test de
Bonferroni con el comando qt((0.05/(50*2)),41) que significa se calcula el cuantil de una T con
un nivel de significancia del 95% nos arroja un valor de 3.544184 lo cual nos quiere decir que
todos los datos mayores que este son outliers, con esto concluimos que nuestro modelo no tiene
datos outliers.
DATOS INFLUYENTES
Para hallar los datos influyentes se utiliza la distancia cook, la cual se halla con el programa R, a
1
continuación, se muestran los datos influyentes los cuales son mayores a 𝐷𝑖 = 𝑝 𝑟𝑖
Se tiene lo siguiente:
𝑥𝑖1 = ¿Cuántas frutas consume semanalmente?
𝑥𝑖5 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?
𝑥𝑖6 = ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas,
etc., consume a la semana?
𝑥𝑖8 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?
https://www.fen.org.es/blog/habitos-alimentarios/
https://www.fmed.uba.ar/sites/default/files/201903/teorico%20Evaluaci%C3%B3n%20Nutricion
al%202019.pdf
https://www.diariofemenino.com/articulos/dieta/dieta-sana/que-es-la-dieta-balanceada-y-en-que-
consiste/
https://www.significados.com/alimentacion/
https://www.significados.com/nutricion/
https://www.farmaceuticonline.com/es/dieta-funcion-cerebral/
https://definicion.de/rendimiento-academico/
file:///C:/Users/Tuptc/Downloads/SEBASTIAN%20REYES%20ROSA%20ESTHER(FILEmini
mizer).pdf