Está en la página 1de 90

INFORME FINAL PROYECTO INTERSEMESTRAL

“RELACIÓN ENTRE LOS HÁBITOS ALIMENTICIOS Y EL RENDIMIENTO ACADÉMICO


DE ESTUDIANTES DE LA LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA”

JORGE ENRIQUE ALVAREZ VEGA


CARLOS DUVAN RIVERA BARRERA

LINA FERNANDA RUIZ ROZO


ANA IRENE HURTADO HURTADO

ERIKA JOHANA FIGUEROA MOYANO


GRUPO: F

CARMEN HELENA CEPEDA ARAQUE

UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA


LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA

INFERENCIA ESTADÍSTICA
DUITAMA

2020
TABLA DE CONTENIDO
INTRODUCCIÓN ....................................................................................................................................... 6
PLANTEAMIENTO DEL PROBLEMA ........................................................................................................... 7
IDENTIFICACIÓN DEL PROBLEMA ......................................................................................................... 7
JUSTIFICACIÓN..................................................................................................................................... 7
OBJETIVOS ........................................................................................................................................... 8
Objetivo General.............................................................................................................................. 8
Objetivos Específicos ....................................................................................................................... 8
REFERENTES TEÓRICOS ............................................................................................................................ 8
Variables de estudio ............................................................................................................................ 9
MARCO CONCEPTUAL............................................................................................................................ 11
HÁBITOS ALIMENTICIOS..................................................................................................................... 11
VALORACIÓN NUTRICIONAL .............................................................................................................. 11
DIETA BALANCEADA .......................................................................................................................... 11
ALIMENTACIÓN ................................................................................................................................. 11
NUTRICIÓN ........................................................................................................................................ 12
CEREBRO Y ALIMENTACIÓN ............................................................................................................... 12
RENDIMIENTO ACADÉMICO ............................................................................................................... 12
NUTRICIÓN EN EL RENDIMIENTO ACADÉMICO................................................................................... 12
PIRÁMIDE NUTRICIONAL.................................................................................................................... 13
¿Cómo se interpreta? .................................................................................................................... 13
ÍNDICE DE MASA CORPORAL .............................................................................................................. 14
METODOLOGÍA ..................................................................................................................................... 15
TIPO DE ESTUDIO ............................................................................................................................... 15
POBLACIÓN ....................................................................................................................................... 15
MUESTRA .......................................................................................................................................... 15
VARIABLES DE ESTUDIO ..................................................................................................................... 16
RECOLECCIÓN DE DATOS ................................................................................................................... 18
INFORME ESTADÍSTICO.......................................................................................................................... 18
1. X: Edad (en años) ........................................................................................................................... 18
Sistema de hipótesis ...................................................................................................................... 19
2. X: Sexo ........................................................................................................................................... 20
3. X: Estatura en centímetros ............................................................................................................. 21
4. X: peso en kilogramos .................................................................................................................... 22
Sistema de hipótesis ...................................................................................................................... 23
5. X: Promedio último semestre (segundo semestre 2019)................................................................. 24
Sistema de hipótesis ...................................................................................................................... 24
JUZGAMIENTO DE HIPÓTESIS BAJO NORMALIDAD ............................................................................. 25
X: Estatura en centímetros ............................................................................................................. 25
X: Estatura en centímetros ............................................................................................................. 26
Y: Promedio último semestre (segundo semestre 2019) ............................................................. 27
Y: Promedio último semestre (segundo semestre 2019)................................................................. 28
ESTIMACIÓN POR INTERVALOS .......................................................................................................... 29
X: Estatura en centímetros ............................................................................................................. 29
Y: Promedio último semestre (segundo semestre 2019)................................................................. 30
6. X: Número de frutas consumidas semanalmente ........................................................................... 32
Sistema de hipótesis ...................................................................................................................... 33
7. X: Número de porciones de verduras consumida semanalmente............................................... 34
Sistema de hipótesis ...................................................................................................................... 34
Distribución Logística ..................................................................................................................... 35
8. X: Número de comidas entre desayuno, almuerzo y/o cena consumidas diariamente. ............... 36
Distribución normal ....................................................................................................................... 36
Distribución binomial negativa:...................................................................................................... 37
Distribución geométrica:................................................................................................................ 38
Distribución Poisson: ..................................................................................................................... 38
Distribución exponencial................................................................................................................ 39
9. X: Tiempo dedicado al consumo de una comida en minutos ....................................................... 40
Sistema de hipótesis ...................................................................................................................... 40
10. X: Número de panes tradicionales que consume al día ........................................................... 41
Sistema de hipótesis ...................................................................................................................... 42
11. X: Raciones de comida en comparación con las de otras personas de aproximadamente la
misma edad y del mismo género ....................................................................................................... 43
12. X: Numero de vasos de agua que bebe al día .......................................................................... 44
Sistema de hipótesis ...................................................................................................................... 45
13. X: Alimentos que consume en el desayuno ............................................................................. 46
14. X: Número de veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por
tener más tiempo para estudiar ......................................................................................................... 47
Distribución exponencial................................................................................................................ 47
Distribución Poisson ...................................................................................................................... 48
Distribución binomial negativa:...................................................................................................... 49
Distribución geométrica:................................................................................................................ 49
15. X: Número de veces a la semana que come legumbres (lenteja, garbanzo, frijol, etc.) ............ 50
X: Frecuencia con que consume azúcar .............................................................................................. 52
17. X: Número de veces que come pescado a la semana .............................................................. 52
Sistema de hipótesis ...................................................................................................................... 53
18. X: Número de veces a la semana que come grasas (malas) o embutidos ................................. 54
Sistema de hipótesis ...................................................................................................................... 55
19. X: Cantidad de productos procesados como gaseosas, bebidas energizantes, galletas, papas
fritas, etc., que consume a la semana. ............................................................................................... 56
Sistema de hipótesis ...................................................................................................................... 57
20. X: Tipo de aceite y grasas que utiliza habitualmente para cocinar o preparar las ensaladas .... 57
21. X: Número de veces que consume bebidas alcohólicas a la semana........................................ 58
Sistema de hipótesis ...................................................................................................................... 59
22. X: Controla la sal que añade a los platos ................................................................................. 60
23. X: Número de veces al día que come por impulsos debido a gula, ansiedad y/o estrés. .......... 61
Sistema de hipótesis ...................................................................................................................... 62
PREGUNTAS DE INTERÉS .................................................................................................................... 63
MODELO LINEAL .................................................................................................................................... 65
COMPONENTE ALEATORIO ................................................................................................................ 65
COMPONENTE SISTEMATICO ............................................................................................................. 67
FUNCIÓN DE ENLACE ......................................................................................................................... 68
ESTIMACIÓN DE LOS PARÁMETROS ................................................................................................... 68
ESTIMACIÓN POR INTERVALOS PARA LOS 𝜷𝒋 ..................................................................................... 70
JUZGAMIENTO DEL MODELO VÍA HIPOTESIS LINEAL .......................................................................... 72
SELECCIÓN DEL MODELO OPTIMO ..................................................................................................... 74
EVALUACIÓN DEL MODELO................................................................................................................ 81
COMPONENTE ALEATORIO ............................................................................................................ 81
HOMOCEDASTICIDAD .................................................................................................................... 81
NORMALIDAD DE LOS RESIDUALES (LOS ERRORES DEL MODELO) .................................................. 82
AUTOCORRELACIÓN ...................................................................................................................... 83
COMPONENTE SISTEMATICO ......................................................................................................... 83
DATOS INUSUALES ......................................................................................................................... 83
OUTLIERS ....................................................................................................................................... 84
DATOS INFLUYENTES ..................................................................................................................... 85
CONCLUSIONES ..................................................................................................................................... 89
REFERENCIAS BIBLIOGRÁFICAS .............................................................................................................. 90
INTRODUCCIÓN
Este proyecto estadístico está enfocado en ver la relación entre los hábitos alimenticios con el
rendimiento académico de los estudiantes activos de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama en modalidad presencial.
Para esto se utilizó una encuesta que se aplicó virtualmente y los datos se utilizaron para realizar
un informe estadístico sobre la relación entre los hábitos alimenticios con el rendimiento
académico de los estudiantes. En el informe estadístico obtuvimos variables que nos permitieron
identificar si hay relación entre los hábitos alimenticios y el rendimiento académico de los
estudiantes.
Este proyecto se lleva a cabo con ayuda del programa R Studio es un entorno de desarrollo
integrado (IDE) para el lenguaje de programación R, dedicado a la computación estadística y
gráficos, a través de ella encontramos muchos resultados a partir de los datos obtenidos en la
encuesta realizada pero también es necesario instalar en el R Studio los siguientes paquetes:
 readx1: Compilar los datos de Excel al RStudio.
 agricolae: Graficas en RStudio
 grid y vcd: se utilizan para el test de Kolmogorov-Smirnov y Goodfit.
 MASS, survival y fitdistriplus: para comparar la relación que hay entra la gráfica
acumulada con la empírica.
 library(lmtest): librería para hallar test de Breusch-Pagan de homocedasticidad del modelo
 library(stats) y library(faraway): Librerías para cargar la gráfica de los datos grandes de la
variable respuesta en la matriz HAT
Que nos ayudaran para poder cargar las librerías y poder utilizar los test vistos en clase.

Los test utilizando para hacer el juzgamiento de hipótesis sobre el modelo de distribución de cada
variable de estudio con el modelo de bondad de ajuste son:
 Kolmogorov-Smirnov (ks.test): se utiliza para las distribuciones continuas.
 Goodfit: se utiliza para las distribuciones discretas.

En primera instancia se asignó una distribución para cada una de las variables estadísticas con sus
respectivos parámetros.

Después se procedió a determinar si las distribuciones asignadas se ajustan realmente a las


variables cuantitativas realizando sistemas de hipótesis por medio de la bondad de ajuste.
Posteriormente a las variables con distribución normal se les realizó pruebas de hipótesis bajo la
normalidad, también se realiza intervalos de confianza con una determinada confiabilidad.

Finalmente se encontró un modelo lineal el cual nos permitió determinar las variables que influyen
en el rendimiento académico.
PLANTEAMIENTO DEL PROBLEMA

IDENTIFICACIÓN DEL PROBLEMA

Este proyecto tiene como fin saber la relación entre la alimentación y el rendimiento académico
de los estudiantes activos de la carrera LICENCIATURA EN MATEMÁTICAS Y
ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE
COLOMBIA seccional Duitama en modalidad presencial.

El enfoque a este problema es debido a que los estudiantes de dicha universidad pueden estar
teniendo una mala alimentación en su día a día, por diversas causas y esto puede estar afectando
el rendimiento académico de los estudiantes.

JUSTIFICACIÓN

Este proyecto se desarrolla por que se ha observado que muchos estudiantes no se preocupan por
una buena alimentación ni por el horario en el cual lo hacen, ya que están enfocados en el estudio
y muchas otras preocupaciones. Olvidando que es necesario una alimentación saludable que
permita desarrollar la agilidad mental, además mejorar la capacidad de concentración y bienestar
personal, forjando el rendimiento académico se mantenga o mejore por esto se busca saber a través
de este proyecto la influencia que existe entre la mala alimentación y el rendimiento académico en
la carrera LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA que ofrece la UPTC
seccional Duitama en modalidad presencial.
Se cree que un deficiente desempeño académico es consecuencia de una inadecuada alimentación
y nutrición que le limita realizar algunas actividades en el salón, tanto para participar como poner
atención a la clase. Es evidente que muchos de los alumnos se presentan a clases sin haber
desayunado, pero tampoco se alimentan en el transcurso del día, otros tienen la tendencia a
consumir comida “chatarra” durante el día, sin embargo, estos alimentos no ayudan para que los
compañeros se desempeñen bien en las clases, empezando por la cantidad de alimento que se
consume, que es muy poco y no los satisface; ocasionando que sigan con hambre y distraídos.
Siendo todo esto resultado del ritmo acelerado de vida y la limitación de recursos económicos.
OBJETIVOS

Objetivo General

Establecer la relación entre la alimentación y el rendimiento académico de los estudiantes de la


carrera LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA de la UNIVERSIDAD
PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA seccional Duitama en modalidad
presencial.

Objetivos Específicos
 Analizar los hábitos alimenticios de los estudiantes de la LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA (LME) de la UNIVERSIDAD PEDAGÓGICA
Y TECNOLÓGICA DE COLOMBIA (UPTC) seccional Duitama en modalidad
presencial.

 Identificar si los hábitos alimenticios influyen en el rendimiento académico de los


estudiantes de la carrera LME de la seccional Duitama en modalidad presencial.
 Diseñar un instrumento de medición que permita conocer los hábitos alimenticios de
los estudiantes de la LME de la UPTC seccional Duitama.
 Asignar un modelo de probabilidad a cada una de las variables que se consideran en el
proyecto.

 Estimar los parámetros de cada variable del proyecto para poder inferir acerca de los
resultados.
 Juzgar hipótesis para los modelos de probabilidad de las variables correspondientes al
proyecto.

 Modelar la relación entre los malos hábitos alimenticios y el promedio.

REFERENTES TEÓRICOS

Para la presente investigación sobre “la relación de los hábitos alimenticios en el rendimiento
académico de estudiantes de la LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA”,
vamos a tener en cuenta referentes teóricos que nos aportan a la investigación ya sea porque han
realizado estudios de este tipo o porque nos aportan de manera teórica conocimientos directamente
relacionados con el enfoque de la misma.

De acuerdo a la investigación (Influencia de los hábitos alimenticios en el rendimiento académico


escolar) del señor David Martín Castillo (Graduado en Enfermería, 2016, Universidad de Murcia),
con el título de Máster Universitario en Nutrición y Alimentación Humana; nos brinda la siguiente
información que nos ayuda a fundamentar nuestra investigación.
El rendimiento escolar se encuentra determinado por una serie de factores entre los que se
encuentran factores familiares, económicos, culturales, del sistema educativo y sociales. Según el
Dr. Carlos Iglesias Rosado, profesor de la universidad Alfonso X el Sabio de Madrid y miembro
de la Sociedad Española de Dietética y Ciencias de la Alimentación, la malnutrición acaecida en
una edad temprana reduce la tasa de división celular en el cerebro reduciendo la mielinización, por
lo que esta alteración de la nutrición produciría una reducción de la capacidad intelectual. A
medida que se combinan los factores anteriores aumenta la probabilidad de un menor rendimiento
académico, es por ello que este autor destaca el comedor escolar como una herramienta con función
formativa en lo que se refiere a alimentación.

Variables de estudio
 Peso: variable cuantitativa continua se mide en kg.
 Talla: variable cuantitativa continua se mide en cm.
 Índice de masa muscular: variable cuantitativa continua, se mide en kg/ m².
 Pliegues cutáneos a nivel bicipital, tricipital, subescapular y suprailíaco: variable
cuantitativa continua, se mide en mm.
 Circunferencia abdominal: variable cuantitativa continua se mide en cm.
 Parámetros analíticos: los parámetros mostrados a continuación son variables
cuantitativas continuas.
 Además se indican junto a estos los valores de normalidad aceptados para la
realización de este proyecto.
Colesterol: variable cuantitativa continua se mide en mg/dl.

Son algunas de las variables de estudio más comunes y probables a desarrollar debido al complejo
que involucra el hacinamiento poblacional universitario y social en el que se va a desarrollar la
investigación.

Por otro lado, de acuerdo al trabajo de investigación (Estado nutricional y rendimiento académico
en estudiantes de educación media de los colegios IPARM (Universidad Nacional de Colombia-
sede Bogotá) y Pío XII (Municipio de Guatavita)) presentado como requisito parcial para optar al
título de: Magister en Educación de la profesional Doris Amanda Ramírez de Peña de la
Universidad Nacional de Colombia (Facultad de Ciencias Humanas, Instituto de Investigación en
Educación), del año 2014; consideramos la siguiente información como primordial para el
conocimiento y adaptación de nuestra investigación.
En la desnutrición existen diferentes tipos, pero las diversas formas suelen manifestarse de manera
conjunta, por ejemplo, las deficiencias proteínico-calóricas, de yodo, hierro y de vitamina A
(Lorenzana, 1999). Cada tipo de desnutrición resulta de una gama muy diversa de factores: en su
nivel más inmediato, las carencias nutricionales son consecuencia tanto de las enfermedades como
de una ingesta alimentaria inadecuada, lo cual debilita al organismo en diversos grados de
severidad e incluso, en los casos más graves, ocasiona la muerte (Lorenzana, 1999).
Por esta razón, una alimentación saludable debe cubrir las necesidades calóricas del organismo y
asegurar que todos los nutrientes estén en armonía (Izquierdo, Armenteros, Lancés y Martín,
2004). También, debe ser completa en su composición y adecuada a cada individuo, teniendo en
cuenta las condiciones propias de la edad, sexo, estado de salud, nivel de actividad y costumbres
(Organización Mundial de la Salud, 2004).
Además del difícil acceso a los alimentos, hay otros factores que contribuyen a la inseguridad
alimentaria:

 El desempleo e ingresos insuficientes que no permiten adquirir los alimentos necesarios de


forma suficiente.
 El aumento de los costos de la canasta familias, bienes y servicios.
 La migración y desplazamiento forzado del territorio rural a áreas urbanas.
 La globalización de la economía.
 El insuficiente acceso a tierra cultivable para los agricultores.
 La insuficiente producción de alimentos básicos (déficit en el manejo de los recursos
agrícolas).
 La inadecuada comercialización de los alimentos.
 La inadecuada provisión de alimentos (Secretaría Distrital de Integración Social, 2012).

Es indispensable conocer estos factores debido a que no son para nada externos de la presente
investigación debido al estado y situación de la población de estudio y más cuando provienen de
un modelo de educación pública que es protagonizada en un muy alto porcentaje por estratos uno
y dos en este país.
MARCO CONCEPTUAL

HÁBITOS ALIMENTICIOS
Son comportamientos conscientes, colectivos y repetitivos, que conducen a las personas a
seleccionar, consumir y utilizar determinados alimentos o dietas, en respuesta a unas influencias
sociales y culturales.
El proceso de adquisición de los hábitos alimentarios comienza en la familia.
La Infancia es el momento óptimo para adquirir unos buenos hábitos alimentarios. Estos se
adquieren por repetición y de forma casi involuntaria, la familia tiene una gran influencia y esta se
va reduciendo a medida que los niños crecen.

En la adolescencia, los cambios psicológicos y emocionales pueden influir en la dieta, dando


excesiva importancia a la imagen corporal, tienen patrones de consumo diferentes a los habituales:
comidas rápidas, picoteos…

En cambio, en los adultos y en las personas de edad avanzada los hábitos alimentarios son muy
difíciles de cambiar.

VALORACIÓN NUTRICIONAL
Puede ser definida como la interpretación de la información obtenida a partir de estudios
antropométricos, alimentarios, bioquímicos y clínicos. Dicha información es utilizada para
determinar el estado nutricional de individuos o grupos de población en la medida que son
influenciados por el consumo y la utilización de nutrientes.

DIETA BALANCEADA

Hace referencia a un tipo de alimentación que contiene los nutrientes que el organismo necesita
para poder funcionar perfectamente. Estos nutrientes esenciales son las proteínas, los hidratos de
carbono, las vitaminas, los minerales y el agua. una alimentación balanceada permite a la persona
que la sigue tener una mejor calidad de vida con todo lo que eso conlleva.

ALIMENTACIÓN
Es un proceso mediante al cual los seres vivos consumen diferentes tipos de alimentos para obtener
de estos los nutrientes necesarios para sobrevivir y realizar todas las actividades necesarias del día
a día.
NUTRICIÓN
Es el proceso biológico en el que los organismos humanos absorben de los alimentos los nutrientes
necesarios para la vida.
La nutrición es importante porque es fundamental para el funcionamiento y el mantenimiento de
las funciones vitales de los seres vivos, ayuda a mantener el equilibrio homeostático del organismo,
tanto en procesos macro sistémicos, como la digestión o el metabolismo.

CEREBRO Y ALIMENTACIÓN
El cerebro representa sólo el 2% de nuestro peso: sin embargo, necesita alrededor del 20% de la
energía que ingerimos. Si nosotros “somos lo que comemos”, entonces nuestro cerebro también
dependerá de lo que comamos.

Podemos mejorar la salud y las funciones del cerebro a través de la alimentación.


La principal energía que necesita el cerebro para funcionar es la glucosa que proviene de comer
alimentos ricos en carbohidratos, como cereales, legumbres, frutas y vegetales, así como productos
lácteos. Pero, además, necesita otros nutrientes esenciales: vitaminas, minerales, ácidos grasos,
proteínas.

Un exceso o un defecto del nutriente necesario puede afectar al sistema nervioso. Una
alimentación desequilibrada puede producir carencias específicas de algunos de los nutrientes, que
se manifiestan mediante síntomas o sensaciones como apatía, desgana, irritabilidad, nerviosismo,
cansancio, falta de atención, fallos de memoria, de concentración e incluso depresión.

RENDIMIENTO ACADÉMICO
Hace referencia a la evaluación del conocimiento adquirido en el ámbito escolar, terciario o
universitario. Un estudiante con buen rendimiento académico es aquél que obtiene calificaciones
positivas en los exámenes que debe rendir a lo largo de una cursada.
En otras palabras, el rendimiento académico es una medida de las capacidades del alumno, que
expresa lo que éste ha aprendido a lo largo del proceso formativo. También supone la capacidad
del alumno para responder a los estímulos educativos. En este sentido, el rendimiento académico
está vinculado a la aptitud.

NUTRICIÓN EN EL RENDIMIENTO ACADÉMICO


La alimentación durante la adolescencia y juventud entre los 12 y 23 años es muy importante
porque los jóvenes experimentan en esta época un crecimiento acelerado. Una dieta inadecuada
puede llegar a perjudicar tanto el desarrollo físico como el mental, de ahí que la conveniencia de
que el adolecente adquiera paulatinamente unos hábitos alimentarios correctos para prevenir, a
corto y largo plazo, alteraciones derivadas de una alimentación desequilibrada.

PIRÁMIDE NUTRICIONAL
La pirámide nutricional es una herramienta de educación y promoción de salud que se muestra de
manera gráfica y sencilla a través de dibujos o fotografías de los alimentos e indica que cantidades
han de consumirse para seguir una alimentación saludable.

¿Cómo se interpreta?
La forma triangular de la pirámide nutricional nos orienta sobre la frecuencia y las cantidades que
debemos consumir de diferentes alimentos. En los primeros eslabones, se sitúan los alimentos que
más peso han de tener en la alimentación diaria. A medida que vamos subiendo de niveles,
aparecen otros alimentos que hay que consumir en menor cantidad.
En el vértice se sitúan alimentos de consumo opcional y que en caso de consumirse, ha de ser
ocasionalmente.
ÍNDICE DE MASA CORPORAL

El Índice de Masa Corporal es una fórmula matemática que pone en relación el peso y la altura de
una persona, y que se utiliza para saber si ésta se encuentra en unos niveles de peso saludables
según sus características personales. Para ello, el resultado obtenido se puede comparar con unas
tablas creadas por la Organización Mundial de la Salud que establecen, para los distintos niveles
de IMC, si la persona se encuentra por encima o por debajo del nivel deseado, o en un nivel
apropiado.
METODOLOGÍA

TIPO DE ESTUDIO
Se hará un estudio de tipo investigación cuantitativa y cualitativa

La investigación cuantitativa implica el uso de herramientas informáticas, estadísticas, y


matemáticas para obtener resultados. Es concluyente en su propósito ya que trata de cuantificar el
problema y entender qué tan generalizado está mediante la búsqueda de resultados proyectables a
una población mayor.

La investigación cuantitativa es la investigación empírica sistemática de fenómenos observables a


través de técnicas estadísticas, matemáticas o computacionales. El objetivo de la investigación
cuantitativa es desarrollar y emplear modelos matemáticos, teorías e hipótesis relacionadas con los
fenómenos. El proceso de medición es fundamental para la investigación cuantitativa porque
proporciona la conexión fundamental entre la observación empírica y la expresión matemática de
las relaciones cuantitativas.

La investigación cualitativa recopila datos no numéricos. Lo cualitativo es aquello que está


relacionado con la cualidad o con la calidad de algo, es decir, con el modo de ser o con las
propiedades de un objeto, un individuo, una entidad o un estado. La investigación cualitativa
recoge los discursos completos de los sujetos para proceder luego a su interpretación, analizando
las relaciones de significado que se producen en determinada cultura o ideología.

POBLACIÓN
Se va a trabajar con los estudiantes activos de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama.

MUESTRA
Se plantea trabajar con 50 estudiantes de la población previamente indicada.
La muestra se seleccionara por conveniencia entre los estudiantes activos actualmente en las clases
de virtualidad y tengan acceso a internet constantemente, de la carrera LICENCIATURA EN
MATEMÁTICAS Y ESTADÍSTICA que ofrece la UNIVERSIDAD PEDAGÓGICA Y
TECNOLÓGICA DE COLOMBIA seccional Duitama.
VARIABLES DE ESTUDIO

Variable de estudio Tipo de variable Categoría que toma la variable

Edad (en años) Cuantitativa continua Valores positivos

Sexo Cualitativa (nominal) Masculino/Femenino

Estatura (en centímetros) Cuantitativa continua Valores positivos

Peso (en kilogramos) Cuantitativa continua Valores positivos

Promedio último semestre


Cuantitativa continua {0.0, 0.1, 0.3,...,5}
(segundo semestre 2019)

Consumo de frutas por semana. Cuantitativa continua {0,...}

Consumo de porciones de verduras


Cuantitativa continua {0,…}
por semana.

Número de comidas entre


desayuno, almuerzo y/o cena Cuantitativa discreta {0,1,2,3}
consumidas diariamente.

Tiempo dedicado al consumo de


Cuantitativa continua {0,...}
una comida en minutos.

Consumo de pan por día. Cuantitativa continua {0,…}

Son Similares.
Raciones de comida en
comparación con las de otras Ligeramente abundantes.
Cualitativa (nominal)
personas de aproximadamente la Más abundantes.
misma edad y del mismo género.
No hago comparaciones.

Consumo de vasos de agua al día. Cuantitativa continua {0,…}

Huevos, leche, café, infusiones, fruta,


cereal, pan y/o huevos.
Alimentos consumidos en el
Cualitativa (nominal)
desayuno. No desayuno.

Solo café y/o leche con pan.

Número de veces a la semana deja Cuantitativa discreta {0,1,2,3,...}


de desayunar, almorzar, cenar y/o
tomar onces por tener más tiempo
para estudiar.

Número de veces a la semana que


come legumbres (lenteja, Cuantitativa discreta {0,1,2,3,...}
garbanzo, frijol, etc.)

Con bastante frecuencia.


Frecuencia en el consumo de
Cualitativa (nominal) Con moderación.
azúcar.
Trato de no consumir azúcar.

Número de veces que consume


Cuantitativa discreta {0,1,2,3,...}
pescado a la semana.

Número de veces a la semana que


Cuantitativa discreta {0,1,2,3,…}
come grasas (malas) o embutidos.

Cantidad de productos procesados


como gaseosas, bebidas
Cuantitativa continua {0,...}
energizantes, galletas, papas fritas,
etc., que consume a la semana.

Aceite de oliva, girasol, maíz y/o soya.

Tipo de aceite y grasas que utiliza Aceites diferentes como mantequilla,


habitualmente para cocinar o Cualitativa (nominal) margarina y/o manteca.
preparar las ensaladas. No utilizo estos productos.
Otros

Consumo de alcohol. Cuantitativa continua {0,...}

Sí, no suelo añadir más sal.


Control de sal en los platos de
Cualitativa (nominal) Añado sal con moderación.
comida.
No, me excedo añadiendo sal a la comida.

Número de veces al día que come


por impulsos debido a gula, Cuantitativa discreta {0,1,2,3,...}
ansiedad y/o estrés
RECOLECCIÓN DE DATOS
Estos se van a recolectar por medio de una encuesta a una muestra especifica de dicha carrera, esta
encuesta se va a realizar de manera virtual a través de un formulario de Google.

INFORME ESTADÍSTICO

1. X: Edad (en años)

Describe la edad en años de los estudiantes de LICENCIATURA EN MATEMÁTICAS Y


ESTADÍSTICA de la UPTC. Es una variable continua que se ajusta a la Distribución gamma con
espacio paramétrico (𝐵 > 0), 𝛼 > 0 Θ = {k, θ ϵ(0, ∞) × (0, ∞)}
VARIABLE HISTOGRAMA

X: edad (en años)

𝑥≥0

plotdist(EDAD,histo=TRUE,demp=TRUE) plot(AJUSTE.EDAD)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑔𝑎𝑚𝑚𝑎(𝛼 = 48.893418 𝑦 𝛽 = 2.047441)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑔𝑎𝑚𝑚𝑎(𝛼 = 48.893418 𝑦 𝛽 = 2.047441)

Como sabemos para las distribuciones Gamma podemos utilizar la prueba de bondad de ajuste,
con el test de Kolmogorov-Smirnov y obtenemos a través de R Studio:
Conclusión: Según el test de Kolmogorov-Smirnov no se rechaza la hipótesis nula dado que el
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.1227 , entonces él 𝑝 − 𝑣𝑎𝑙𝑜𝑟 es de un 12.27% y es mayor al 10%, por lo tanto la
variable edad se distribuye como una Gamma de parámetros 𝛼 = 48.893418 y 𝛽 = 2.047441.

2. X: Sexo

Esta variable describe el género de los estudiantes de LICENCIATURA EN MATEMÁTICAS Y


ESTADÍSTICA de la UPTC. Es una variable discreta que se distribuye como una Bernoulli.

VARIABLE HISTOGRAMA

X: sexo

X = {femenino ó masculino}

X~Bernoulli(éxito=Femenino)

TABLA RESUMEN DE LA VARIABLE

X~Bernoulli (π)
Frecuencia Porcentaje
π=P(x=éxito)
Femenino 31 62% π=P(x=femenino)

Masculino 19 38% π=(Total femenino)/(Total encuestados)


π=31/50
Total 50 100 %
Conclusión: En la variable sexo de la muestra de 50 personas, encontramos 31 mujeres y 19
hombres, se puede concluir que en LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA
de la UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA seccional Duitama
hay más estudiantes mujeres que hombres.

3. X: Estatura en centímetros

Esta variable describe la estatura en centímetros de los estudiantes de la UPTC de


LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA. Es una variable continua que se
distribuye como una Normal con parámetros 𝜇 = 164.96 y 𝜎 = 8.079505 de acuerdo al ajuste
que se le realizo.

VARIABLE HISTOGRAMA

X: estatura en centímetros

plotdist(ESTATURA,histo=TRUE,demp = plot(ajuste.ESTATURA)
TRUE)
Como sabemos que para las distribuciones normales podemos utilizar la prueba de bondad de
ajuste, con el test de Kolmogorov-Smirnov obtenemos:

Conclusión: Según el test de Kolmogorov-Smirnov no se rechaza la hipótesis nula de que esta


variable se distribuya como una normal dado que el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.7761 , entonces él 𝑝 − 𝑣𝑎𝑙𝑜𝑟
es de un 77.61% y es mayor al 10%. Por lo que la variable estatura en centímetros se distribuye
como una Normal de parámetros 𝜇 = 164.96 y 𝜎 = 8.079505.

4. X: peso en kilogramos

Esta variable describe el peso en kilogramos de los estudiantes de la UPTC de LICENCIATURA


EN MATEMÁTICAS Y ESTADÍSTICA. Se le asignó un modelo de probabilidad de distribución
gamma de acuerdo a los parámetros que tiene este modelo ya que es una generalización del modelo
Exponencial que, en ocasiones se utiliza para modelar variables que describen el tiempo hasta que
se produce p veces un determinado suceso.

VARIABLE HISTOGRAMA

X: peso en kilogramos
plotdist(PESO,histo = TRUE,demp = plot(ajuste.PESO)
TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑔𝑎𝑚𝑚𝑎(𝛼 = 33.6653192, 𝛽 = 0.5309945)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑔𝑎𝑚𝑚𝑎(𝛼 = 33.6653192, 𝛽 = 0.5309945)

Sabemos que para las distribuciones Gamma podemos utilizar la prueba de bondad de ajuste, con
el test de Kolmogorov-Smirnov y obtenemos:

Conclusión: podemos decir que por medio del test de Kolmogorov-Smirnov el p-valor=0.8876, y
como p-valor es de un 88.76% mayor al 10%, no se rechaza la hipótesis nula de que X~ gamma
(α=33.6653192, β=0.5309945). Por lo tanto el peso en kilogramos se distribuye gamma con
parámetros α=33.6653192 y β=0.5309945.
5. X: Promedio último semestre (segundo semestre 2019)

Esta variable describe el promedio del segundo semestre de 2019 de los estudiantes de
LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA de la UPTC. Es una variable aleatoria
continua que se distribuye como una normal de acuerdo a los parámetros que toma es la que más
se ajusta a este caso.

VARIABLE HISTOGRAMA

X: Promedio último semestre (segundo


semestre 2019)

plotdist(promedio,histo = TRUE,demp = plot(ajuste.promedio)


TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇 = 3.72, 𝜎 = 0.3243455)

VS
𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇 = 3.72, 𝜎 = 0.3243455)

A través de la bondad de ajuste con el test de Kolmogorov-Smirnov obtenemos:

Conclusión: La variable promedio último semestre se distribuye como una Normal de


parámetros 𝜇 = 3.72 y 𝜎 = 0.3243455. Ya que Según el test de Kolmogorov-Smirnov no se
rechaza la hipótesis nula de que X~ Normal(μ=3.72,σ=0.3243455) dado que el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 =
0.1332 , y además el p-valor es del 13.32% es un resultado mayor al 10%.

Hasta el momento hemos encontrado dos variables que se distribuyen como normales,
procedemos a realizar:

JUZGAMIENTO DE HIPÓTESIS BAJO NORMALIDAD

X: Estatura en centímetros

Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.

Vamos a hacer el juzgamiento de hipótesis bajo normalidad.

Sobre µ con varianza desconocida

X ~Normal (µ, 𝝈)

Sistema de hipótesis

H0: µ ≥164.96 vs Ha: µ <164.96

Nivel de significancia del 1% y nivel de confiabilidad del 99%


Como p-valor es mayor que el nivel de significancia, no hay suficiente evidencia para rechazar la
hipótesis nula, por lo tanto, la media verdadera de la variable estatura en centímetros es mayor o
igual a 164.96.

X: Estatura en centímetros

Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.

Vamos a hacer el juzgamiento de hipótesis bajo normalidad.

Sobre 𝝈𝟐 con media desconocida

X ~Normal (µ, 𝝈)

Sistema de hipótesis

H0: 𝜎 2 =65.278401 vs Ha: 𝜎 2 ≠ 65.278401

Nivel de significancia del 1% y nivel de confiabilidad del 99%


Como p-valor es mayor que el nivel de significancia, no hay suficiente evidencia para rechazar la
hipótesis nula, por lo tanto, la 𝜎 2 verdadera de la variable estatura en centímetros es igual a
65.278401.

Y: Promedio último semestre (segundo semestre 2019)

Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.

Vamos a hacer el juzgamiento de hipótesis bajo normalidad.

Sobre µ con varianza desconocida

Y ~Normal (µ, 𝝈)

Sistema de hipótesis

H0: µ ≤3.72 vs Ha: µ> 3.72

Nivel de significancia del 1% y nivel de confiabilidad del 99%


Como p-valor es mayor que el nivel de significancia, no hay suficiente evidencia para rechazar la
hipótesis nula, por lo tanto, la media verdadera de la variable promedio último semestre es menor
o igual a 3.72.

Y: Promedio último semestre (segundo semestre 2019)

Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.

Vamos a hacer el juzgamiento de hipótesis bajo normalidad

Sobre 𝝈𝟐 con media desconocida

Y ~Normal (µ, 𝝈)

Sistema de hipótesis

H0: 𝜎 2 ≤ 0.1052 vs Ha: 𝜎 2 > 0.1052

Nivel de significancia del 1% y nivel de confiabilidad del 99%


Como p-valor es mayor que el nivel de significancia, no hay suficiente evidencia para rechazar la
hipótesis nula, por lo tanto, la 𝜎 2 verdadera de la variable promedio último semestre es menor o
igual a 0.1052.

ESTIMACIÓN POR INTERVALOS

X: Estatura en centímetros

Como ya vimos que nuestra variable estatura en centímetros se distribuye como una normal
con media de 164.96 y desviación estándar de 8.079505.

Vamos a hacer estimación por intervalo bajo normalidad.

Intervalo para µ con varianza desconocida

X ~Normal (µ, 𝝈)

 Construyamos el intervalo de confianza con una confiabilidad del 95%

Utilizando RStudio

Un IC al 95% para μ :

(162.6405, 167.2795)

Con un 95% de confianza la estatura promedio de los estudiantes de la carrera LIC. EN


MATEMÁTICAS Y ESTADÍSTICA de la UPTC estará entre 162.6405 y 167.2795 centímetros.
Intervalo para 𝝈𝟐 con media desconocida

X ~Normal (µ, 𝝈)

 Construyamos el intervalo de confianza con una confiabilidad del 95%

Utilizando RStudio

Un IC al 95% para μ :

(46.47975, 103.43618)

Con un 95% de confianza la varianza de la estatura de los Estudiantes de la carrera


LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA (LME) de la UPTC estará entre
46.47975 y 103.43618 centímetros.

Y: Promedio último semestre (segundo semestre 2019)

Como ya vimos que nuestra variable promedio último semestre se distribuye como una
normal con media de 3.72 y desviación estándar de 0.3243455.

Vamos a hacer estimación por intervalo bajo normalidad

Intervalo para µ con varianza desconocida

Y ~Normal (µ, 𝝈)

 Construyamos el intervalo de confianza con una confiabilidad del 95%

Utilizando RStudio
Un IC al 95% para μ :

(3.626886, 3.813114)

Con un 95% de confianza la media del promedio de los Estudiantes de la carrera LME de la UPTC
estará entre 3.626886 y 3.813114.

Intervalo para 𝝈𝟐 con media desconocida

Y ~Normal (µ, 𝝈)

 Construyamos el intervalo de confianza con una confiabilidad del 95%

Utilizando RStudio

Un IC al 95% para μ :

(0.07490486, 0.16669352)
Con un 95% de confianza la varianza del promedio de los Estudiantes de la carrera LME de la
UPTC estará entre 0.07490486 y 0.16669352.

6. X: Número de frutas consumidas semanalmente

Esta variable describe la cantidad de frutas que consume semanalmente un estudiante de la UPTC
de LME. Es una variable aleatoria que se ajusta a una distribución 𝑋~𝑐𝑎𝑢𝑐ℎ𝑦(𝑥0 =
4.930212 , 𝛾 = 2.094042) de acuerdo a sus parámetros.

VARIABLE HISTOGRAMA

X: Número de frutas consumidas


semanalmente.

plotdist(Frutas,histo = TRUE,demp = plot(ajuste.Frutas)


TRUE)
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝐶𝑎𝑢𝑐ℎ𝑦 (𝑥0 = 4.930212 , 𝛾 = 2.094042)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑎𝑢𝑐ℎ𝑦 (𝑥0 = 4.930212 , 𝛾 = 2.094042)

Ya que conocemos que para las distribuciones Cauchy se puede emplear la bondad de ajuste con
el test de Kolmogorov-Smirnov obtenemos:

Conclusión: Según el test de Kolmogorov-Smirnov no se rechaza la hipótesis nula de que


𝑋~𝐶𝑎𝑢𝑐ℎ𝑦 (𝑥0 = 4.930212 , 𝛾 = 2.094042) dado que el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.3611 , y como p-valor
es de un 36.11% es mayor al 10%

Entonces la variable número de frutas consumidas semanalmente se distribuye como una Cauchy
con parámetros 𝑥0 = 4.930212 y 𝛾 = 2.094042.
7. X: Número de porciones de verduras consumida semanalmente.

Esta variable describe la cantidad de porciones de verdura que consume semanalmente un


estudiante de la LME. Es una variable aleatoria continua que se distribuye como una Logística ya
que esta variable determina el número de porciones en un tiempo dado.

VARIABLE HISTOGRAMA

X: Número de porciones de verduras


consumida semanalmente.

plotdist(verduras,histo = TRUE,demp ajuste.verduras


= TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑙𝑜𝑔𝑖𝑠𝑡𝑖𝑐𝑎(𝑎 = 4.245309 , 𝑏 = 1.852205)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑙𝑜𝑔𝑖𝑠𝑡𝑖𝑐𝑎(𝑎 = 4.245309 , 𝑏 = 1.852205)


Para la distribución logística se puede emplear la bondad de ajuste con el test de Kolmogorov-
Smirnov y se obtiene:

Conclusión: La variable porciones de verduras que consumen los estudiantes semanalmente se


distribuye como una Logística de parámetros 𝑎 = 4.245309 y 𝑏 = 1.852205. Ya que según el
test de Kolmogorov-Smirnov no se rechaza la hipótesis nula de que X~logistica(a=4.245309
,b=1.852205) ya que el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.215 , y como el p – valor es de un 21.5% es un resultado
mayor al 10% que es lo requerido.

Distribución Logística

En teoría de la probabilidad y estadística, la distribución logística es una distribución de


probabilidad continua cuya función de distribución es la función logística, que aparece en el
contexto de la regresión logística y determinados tipos de redes neuronales. Se parece a la
distribución normal en su forma, pero tiene colas más pesadas (y, por lo tanto, menor curtosis).
8. X: Número de comidas entre desayuno, almuerzo y/o cena consumidas
diariamente.

Esta variable describe número de comidas consumidas al día por un estudiante de la LME de la
UPTC. Es una variable que se ajusta a una variable normal.

VARIABLE HISTOGRAMA

X: Número de comidas entre desayuno,


almuerzo y/o cena consumidas
diariamente.

plotdist(COMIDASCONSUMIDAS,histo plot(ajuste.COMIDASCONSUMIDAS)
= TRUE,demp = TRUE)

Distribución normal
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 2.7, 𝜎 = 1.982423)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 2.7, 𝜎 = 1.982423)


Para las distribuciones normal podemos utilizar la prueba de bondad de ajuste con el test de
Kolmogorov-Smirnov donde obtenemos:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 2.7, 𝜎 =


1.982423), por el p-valor menor a 0.05.

Conclusión: Por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye como una normal con parámetros 𝜇 = 2.7, 𝜎 =
1.982423.

Distribución binomial negativa:


Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 15.704090, 𝛽 = 2.699967)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 15.704090, 𝛽 = 2.699967)

Como sabemos que para las distribuciones binomiales negativas podemos utilizar la prueba de
bondad de ajuste con el comando goodfit el resultado del test:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 =


15.704090, 𝛽 = 2.699967), por el p – valor menor al 0.05.
Conclusión: Por lo que el número de comidas entre desayuno, almuerzo y/o cena consumidas
diariamente no se distribuye como una binomial negativa de parámetros 𝑘 = 15.704090 y 𝛽 =
2.699967.

Distribución geométrica:
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑔𝑒𝑜𝑚(𝑝 = 0.2702703)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑔𝑒𝑜𝑚(𝑝 = 0.2702703)

Para la distribucion geometrica utilizamos la prueba de bondad de ajuste con el comando goodfit
obtenemos el resultado del test:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑔𝑒𝑜𝑚(𝑝 =


0.2702703), por el p-valor menor al 0.05.

Conclusión: Entonces la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye geométrica con parámetros 𝑝 = 0.2702703.

Distribución Poisson:
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 2.7)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 2.7)

Ya que conocemos que para las distribuciones Poisson podemos utilizar la prueba de bondad de
ajuste con el comando goodfit obteniendo:
El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 2.7),
por el p-valor menor a 0.05.

Conclusión: por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye como una Poisson con parámetros λ = 2.7.

Distribución exponencial
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.3703704)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑒𝑥𝑝(𝜃 = 0.3703704)

Ya que conocemos que para las distribuciones exponenciales podemos utilizar la prueba de bondad
de ajuste con el test de Kolmogorov-Smirnov donde obtenemos:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑒𝑥𝑝(𝜃 = 0.3703704),


por el p-valor menor a 0.05.

Conclusión: Entonces la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye exponencial con parámetros 𝜃 = 0.3703704.

Por consiguiente, la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se ajusta a ninguna distribución.
9. X: Tiempo dedicado al consumo de una comida en minutos

Esta variable describe el tiempo en minutos al que se dedica un estudiante de la UPTC de la LME
en consumir sus alimentos. Es una variable que se ajusta a una distribución normal de acuerdo a
sus parámetros.

VARIABLE HISTOGRAMA

X: Tiempo dedicado al consumo de una


comida en minutos

plotdist(T.CONSUMOALIMENTOS,histo = plot(ajuste.T.CONSUMOALIMENTOS)
TRUE,demp = TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 23.14, 𝜎 = 9.844816)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 23.14, 𝜎 = 9.844816)


Ya que conocemos que para las distribuciones normal podemos utilizar la prueba de bondad de
ajuste con el test de Kolmogorov-Smirnov donde obtenemos:

El resultado demuestra el no ajuste ya que el p-valor es de 4.12 % que es menor al 10% y se rechaza
la hipótesis nula de que 𝑋~𝑛𝑜𝑟𝑚𝑎𝑙(𝜇 = 23.14, 𝜎 = 9.844816).

Conclusión: Por lo que la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se distribuye normal con parámetros 𝜇 = 23.14, 𝜎 = 9.844816.

Se probó con otras distribuciones, pero el test de Kolmogorov-Smirnov nos daba valores para p
menores al 10%, por lo tanto esta variable no se ajusta a ninguna distribución de las vistas en clase
y que se le asignaron.

10. X: Número de panes tradicionales que consume al día

Esta variable describe el número de panes que consume un estudiante de la UPTC de la LME. Es
una variable aleatoria continua que se distribuye como una exponencial que toma con un parámetro
O>0.

VARIABLE HISTOGRAMA

X: Número de panes tradicionales que


consumidos al día

X~exp(𝜃 = 0.5434783)
plotdist(CONSUMODEPANES,histo = plot(ajuste.CONSUMODEPANES)
TRUE,demp = TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.5434783)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑒𝑥𝑝(𝜃 = 0.5434783)

Por la bondad de ajuste con el test de Kolmogorov-Smirnov obtenemos:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑒𝑥𝑝(𝜃 = 0.5434783),


ya que el p-valor es de 0.6302 % que es menor al 10% .

Conclusión: Entonces la variable número de panes tradicionales que consumidos al día

no se distribuye exponencial con parámetros 𝜃 = 0.5434783.


Para las Variables Tiempo dedicado al consumo de comida y Consumo de pan diario se
probaron varias distribuciones continuas con el test de Kolmogorov-Smirnov como lo son:
normal, lognormal, gamma, exponencial, cauchy, Weibull, logística, ji-cuadrado y t de
student, pero el p-valor fue muy muy pequeño por lo tanto ninguna de estas distribuciones
es la apropiada para estas variables.

11. X: Raciones de comida en comparación con las de otras personas de


aproximadamente la misma edad y del mismo género

Esta variable describe las cualidades de cómo son las raciones de comida de un estudiante de la
UPTC de LME en comparación con otras personas de la misma edad y género. Es una distribución
multivariada. En teoría de probabilidad, la distribución multinomial es una generalización de la
distribución binomial.

La distribución binomial es la probabilidad de un número de éxitos en N sucesos de Bernoulli


independientes, con la misma probabilidad de éxito en cada suceso.

VARIABLE HISTOGRAMA

X: Raciones de comida en comparación con las de


otras personas de aproximadamente la misma
edad y del mismo género

Tabla

Opciones Frecuencia Porcentaje

Ligeramente más 14 %
abundantes 7

No hago comparaciones 24 48 %

Son similares 16 32 %
Más abundantes 3 6%

Total 50 100 %

Conclusión: La mayor parte de los estudiantes no observa ni compara la cantidad de comida que
consumen frente a las demás personas. Pero de la parte de estudiantes que si compara, se observa
que un 32% consume raciones de comida similares, lo que puede indicarnos que la mayor parte de
la población consume una cantidad de comida promedio, cantidad que consideramos saludable.
Además, encontramos que un 14 % y un 6% de los estudiantes consumen más comida de la comida
promedio por ende un 20% de todos los encuestados se considera que tienen mala alimentación,
esto sin tener en cuenta el 48% de nuestra población que indico no hacer comparaciones, lo que
hace que aún más estudiantes del 20% consuman más comida de la adecuada para tener una buena
alineación. Trayendo problemas de obesidad, pesadez, sueño, pereza y otros problemas que afectan
el rendimiento académico de los estudiantes.

12. X: Numero de vasos de agua que bebe al día

Esta variable describe el número de vasos que consume un estudiante de LME de la UPTC. Es
una variable aleatoria que tiene una distribución exponencial ya que es la que más se ajusta de
acuerdo a los parámetros y propiedades que conserva este caso.

VARIABLE HISTOGRAMA

X: Número de vasos de agua que


bebe al día

X~exp(𝜃 = 0.3125)

plotdist(CONSUMODEPANES,histo plot(ajuste.VASOSDEAGUA)
= TRUE,demp = TRUE)
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.3125)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑒𝑥𝑝(𝜃 = 0.3125)

Hacemos la prueba de bondad de ajuste con el test de Kolmogorov-Smirnov donde obtenemos:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑒𝑥𝑝(𝜃 = 0.3125),


ya que el p-valor es de 0.5751 % que es menor al 10% .

Conclusión: Entonces la variable Numero de vasos de agua que bebe al día no se distribuye
exponencial con parámetros 𝜃 = 0.3125.

Para las Variables número de vasos de agua que bebe al día se probaron varias distribuciones
continuas con el test de Kolmogorov-Smirnov como lo son: normal, lognormal, gamma,
exponencial, cauchy, Weibull, logística, ji-cuadrado y t de student, pero el p-valor fue muy
pequeño por lo tanto ninguna de estas distribuciones es la apropiada para estas variables.
13. X: Alimentos que consume en el desayuno

Es una variable que describe la cualidad de alimentos que consume para el desayuno los
estudiantes de la LME de la UPTC. Se distribuye como una variable multivariada.

VARIABLE HISTOGRAMA

X: Alimentos que consume en el desayuno

TABLA

¿Qué alimentos consume en


el desayuno? Frecuencia

Alimentos cómo: café, leche,


infusiones, fruta, cereal, pan
y/o huevos 36

No suelo desayunar 4

sólo un café o café con pan 10

Total 50

Conclusión: El 72% de los estuantes consumen alimentos cómo: café, leche, infusiones, fruta,
cereal, pan y/o huevos indicando un desayuno saludable, un 20% sólo un café o café con pan que
no se considera muy saludable y un preocupante 8% no desayuna lo que implica que el cerebro no
tenga su mejor funcionamiento, rendimiento teniendo en cuenta que son estudiantes y que
requieren de mucha agilidad mental.
14. X: Número de veces a la semana dejas de desayunar, almorzar, cenar y/o
tomar onces por tener más tiempo para estudiar

Describe el número de veces que deja de consumir alimentos por dedicarse a estudiar en la semana.
Esta variable se ajusta a una distribución exponencial de acuerdo a su parámetro α > 0. y condición.

VARIABLE HISTOGRAMA

X: Número de veces a la semana dejas de


desayunar, almorzar, cenar y/o tomar
onces por tener más tiempo para estudiar

X~exp(𝜃 = 0.5813954)

plotdist(dejadecomer,histo = TRUE,demp = plot(ajuste.dejadecomer)


TRUE)

Distribución exponencial

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑒𝑥𝑝(𝜃 = 0.5813954)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑒𝑥𝑝(𝜃 = 0.5813954)


Por medio de la bondad de ajuste con el test de Kolmogorov-Smirnov donde obtenemos:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que


𝑋𝑒𝑥𝑝(𝜃 = 0.5813954), por el p-valor menor a 0.05.
Conclusión: Entonces la variable el Número de veces a la semana dejas de desayunar,
almorzar, cenar y/o tomar onces por tener más tiempo para estudiar no se distribuye
exponencial con parámetros 𝜃 = 0.5813954.

Distribución Poisson
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 1.72)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 1.72)

Ya que conocemos que para las distribuciones Poisson podemos utilizar la prueba de bondad de
ajuste con el comando goodfit obteniendo:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ = 1.72),


por el p-valor menor a 0.05.
Conclusión: por lo que la variable número de veces a la semana dejas de desayunar, almorzar,
cenar y/o tomar onces por tener más tiempo para estudiar no se distribuye Poisson con parámetro
λ = 2.7.

Distribución binomial negativa:


Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 0.7466979, 𝛽 = 1.7198037)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 0.7466979, 𝛽 = 1.7198037)

Al realizar la prueba de bondad de ajuste con el comando goodfit el resultado del test:

El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 =


0.7466979, 𝛽 = 1.7198037), por el p – valor menor al 0.05.

Conclusión: Por lo que el número de veces a la semana dejas de desayunar, almorzar, cenar y/o
tomar onces por tener más tiempo para estudiar no se distribuye como una binomial negativa de
parámetros 𝑘 = 0.7466979 y 𝛽 = 1.7198037.

Distribución geométrica:

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑔𝑒𝑜𝑚(𝑝 = 0.3676471)

Vs

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑔𝑒𝑜𝑚(𝑝 = 0.3676471)

Para la distribucion geometrica utilizamos la prueba de bondad de ajuste con el comando goodfit
obtenemos el resultado del test:
El resultado demuestra el no ajuste y se rechaza la hipótesis nula de que 𝑋~𝑔𝑒𝑜𝑚(𝑝 =
0.3676471), por el p-valor menor al 0.05.

Conclusión: Entonces la variable el número de veces a la semana dejas de desayunar, almorzar,


cenar y/o tomar onces por tener más tiempo para estudiar no se distribuye geométrica con
parámetros 𝑝 = 0.3676471.

Por consiguiente, la variable número de comidas entre desayuno, almuerzo y/o cena
consumidas diariamente no se ajusta a ninguna distribución.

15. X: Número de veces a la semana que come legumbres (lenteja, garbanzo,


frijol, etc.)

variable que describe el número de veces que consume legumbres a la semana un estudiante de la
LICENCIATURA EN MATEMÁTICAS Y ESTADISTICA. Es una variable que se distribuye
como una 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6 ).

VARIABLE HISTOGRAMA

X: Número de veces a la semana que


come legumbres (lenteja, garbanzo,
frijol, etc.)

𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6 )
plotdist(LEGUMBRES,histo = plot(ajuste.legumbres)
TRUE,demp = TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6 )

Para las distribuciones Poisson podemos utilizar la prueba de bondad de ajuste con el comando
goodfit obtenemos:

Conclusión: Según el test para variables discretas utilizando el paquete vcd en RStudio y el
comando goodfit se comprueba se obtiene un p – valor = 0.14295530, y como el p- valor es igual
al 14.29553% y es mayor al 10 %, por lo tanto no hay suficiente evidencia para rechachar la
hipotesis nula de que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3.6). Por lo tanto la variable número de de veces que
consume legumbres a la semana se distribuye como una Poisson de parametro 𝜆 = 3.6 .
X: Frecuencia con que consume azúcar

Esta variable describe las cualidades del consumo de azúcar de un estudiante de la UPTC de LME.
Es una variable que se distribuye como una multivariada de acuerdo a los parámetros que tiene.

VARIABLE HISTOGRAMA

X: Frecuencia con que consume azúcar

X={con bastante frecuencia, con moderación,


trato de no consumir nada de azúcar}

TABLA

Opciones Frecuencia

Con bastante frecuencia 16

Con moderación 24

Trato de no consumir nada de


azúcar 10

Total 50

Conclusión: se evidencia un moderado uso del azúcar por parte de los estudiantes, pero un 32%
de los estuantes consumen azúcar en exceso.

17. X: Número de veces que come pescado a la semana

Esta variable describe el número de veces que consume pescado a la semana un estudiante de la
UPTC de la LME. Que se distribuye como una Binomial Negativa ya que es el modelo más
adecuado que se ajusta de acuerdo a sus parámetros para este proceso.
Es una variable que se distribuye como una Poisson de acuerdo a los parámetros que toma en este
caso.

VARIABLE HISTOGRAMA

X: Número de veces que come pescado a


la semana

X~Pois(lambda=0.58)

plotdist(consumopescado,histo = plot(ajuste.consumopescado)
TRUE,demp = TRUE)

Sistema de hipótesis

𝑯𝟎 : 𝑥~𝑃𝑜𝑖𝑠(𝜆 = 0.58)

Vs

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑥~𝑃𝑜𝑖𝑠(𝜆 = 0.58)

Como sabemos que para las distribuciones binomiales negativas podemos utilizar la prueba de
bondad de ajuste obtenemos:
Conclusión: Donde él 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.15137201 es grande por lo tanto no se rechaza la
hipótesis nula de que esta variable 𝑥~𝑃𝑜𝑖𝑠(𝜆 = 0.58). por lo tanto, la variable número de veces
que come pescado a la semana se distribuye como una Poisson con parámetro 𝜆 = 0.58 .

18. X: Número de veces a la semana que come grasas (malas) o embutidos

La variable describe el número de veces que consume grasas o embutidos a la semana un estudiante
de la UPTC de la LME. Se distribuye como una Binomial Negativa ya que cumple con los
parámetros y el ajuste asignado.

VARIABLE HISTOGRAMA

X: Número de veces a la semana que


come grasas (malas) o embutidos

plotdist(GRASAS,histo = TRUE,demp = plot(ajuste.GRASAS)


TRUE)
Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 16.824244, 𝜋 = 2.199839)

Vs

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 16.824244, 𝜋 = 2.199839)

Sabiendo que para las distribuciones binomiales negativas podemos utilizar la prueba de bondad
de ajuste con el comando goodfit obteniendo:

Conclusión: Se obtiene el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.14295530, es grande por lo tanto no se rechaza la


hipótesis nula de que esta variable 𝑋~𝑛𝑏𝑖𝑛𝑜𝑚(𝑘 = 16.824244, 𝜋 = 2.199839).

Por lo tanto, la variable número de veces a la semana que come grasas (malas) o embutidos se
distribuye binomial negativa con parámetros 𝑘 = 16.824244 y 𝜋 = 2.199839 .
19. X: Cantidad de productos procesados como gaseosas, bebidas
energizantes, galletas, papas fritas, etc., que consume a la semana.

Variable que describe el número de productos procesados que consume a la semana un estudiante
de la UPTC de LME. Es una variable que se distribuye como una exponencial.

VARIABLE HISTOGRAMA

X: Cantidad de productos procesados


como gaseosas, bebidas energizantes,
galletas, papas fritas, etc., que consume
a la semana.

plotdist(PRODUCTOSPROC.,histo = plot(ajuste.PRODUCTOSPROC.)
TRUE,demp = TRUE)

En RStudio obtenemos el valor del parámetro:


Sistema de hipótesis

𝑯𝟎 : 𝑋~exp(𝜃 = 0.3731343)

Vs

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 exp(𝜃 = 0.3731343)

Como sabemos que para las distribuciones continuas se utiliza el test de Kolmogorov-Smirnov
entonces obtenemos:

Conclusión: Encontramos el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.1191, el cual se considera grande por ser


aproximadamente el 12% y mayor al 10% por lo que hay suficiente evidencia para determinar que
no se rechaza la hipótesis nula de que esta variable 𝑋~exp(𝜃 = 0.3731343).

Entonces Cantidad de productos procesados como gaseosas, bebidas energizantes, galletas, papas
fritas, etc., que consume a la semana se distribuye como una exponencial con parámetro 𝜃 =
0.3731343.

20. X: Tipo de aceite y grasas que utiliza habitualmente para cocinar o


preparar las ensaladas

Esta es una variable que describe el tipo de grasas que utiliza habitualmente un estudiante de la
UPTC de LME. Es una variable que se distribuye como una multinomial de acuerdo a los
parámetros que toma.
VARIABLE HISTOGRAMA

X: Tipo de aceite y grasas que utiliza


habitualmente para cocinar o preparar las
ensaladas

TABLA

Opciones Frecuencia

Aceite de oliva, girasol, maíz y/o


soya 21

Aceites diferentes, mantequilla,


margarina y/o manteca 24

No utilizo estos productos 3

Otros 2

Total 50

Conclusión: La mayor parte de los estudiantes consume aceites diferentes, mantequilla,


margarina y/o manteca, lo que nos indica que buena parte de los estudiantes consumen productos
poco sanos.

21. X: Número de veces que consume bebidas alcohólicas a la semana

Esta variable describe el número de veces que un estudiante de la LME de la UPTC consume
bebidas alcohólicas a la semana. Tiene una distribución que se ajusta a la distribución lognormal.
VARIABLE HISTOGRAMA

X: Número de veces que consume


bebidas alcohólicas a la semana (no son
lógicos los valores de esta variable, los
que se reflejan en el gráfico)

plotdist(BEBIDASALCOHO,histo = plot(ajuste.BEBIDASALCOHO)
TRUE,demp = TRUE)

En RStudio obtenemos el valor del parámetro:

Meanlog =0.8808311, sdlog =0.3955222


Sistema de hipótesis

𝑯𝟎 : 𝑋~𝑙𝑜𝑔𝑛𝑜𝑟𝑚(𝜇 = 0.8808311, 𝜎 = 0.3955222)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑙𝑜𝑔𝑛𝑜𝑟𝑚(𝜇 = 0.8808311, 𝜎 = 0.3955222)

A traves del test de Kolmogorov-Smirnov obtenemos:


Conclusión: Encontramos el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 1, por lo que hay suficiente evidencia para determinar
que no se rechaza la hipótesis nula de que esta variable 𝑋~𝑙𝑜𝑔𝑛𝑜𝑟𝑚(𝜇 = 0.8808311, 𝜎 =
0.3955222).

Por lo tanto la variable número de veces que consume bebidas alcohólicas a la semana se distribuye
como una lognormal con parámetros 𝜇 = 0.8808311 y 𝜎 = 0.3955222.

22. X: Controla la sal que añade a los platos

Esta variable describe las cualidades con que un estudiante de la UPTC de la LME consume y
controla la sal que añade a los platos que come. Es una variable multivariada

VARIABLE HISTOGRAMA

X: Controla la sal que añade a los platos

TABLA

Opciones Frecuencia

Intento añadir sal con


moderación 34

No, siempre añado sal en


exceso a las comidas 1

Sí, no suelo añadir más sal 15


Total 50

Conclusión: Como podemos observar la mayoría de estudiantes intentan añadir sal con
moderación lo que nos permite decir que de cierta manera tratan de tener una alimentación
equilibrada.

23. X: Número de veces al día que come por impulsos debido a gula, ansiedad
y/o estrés.

Esta variable describe el número de veces que un estudiante de la UPTC de la LME come por
ansiedad durante el día. Es una variable que se distribuye como una Poisson de acuerdo a los
parámetros que tiene este caso.

VARIABLE HISTOGRAMA

X: Número de veces al día que come


por impulsos debido a gula, ansiedad
y/o estrés

plotdist(ANSIEDAD,histo = plot(ajuste.ANSIEDAD)
TRUE,demp = TRUE)
En RStudio encontramos:

Sistema de hipótesis

𝑯𝟎 : 𝑋~ Pois(𝜆 = 1.541611)

VS

𝑯𝒂 : 𝑋 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝑐𝑜𝑚𝑜 𝑋~ Pois(𝜆 = 1.541611)

Como sabemos que para la distribución Poisson podemos utilizar la prueba de bondad de ajuste y
obtenemos a través de ella:

Conclusión: Donde el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.394408, es aproximadamente del 39% por lo tanto no se


rechaza la hipótesis nula de que esta variable 𝑋~ Pois(𝜆 = 1.541611).

Entonces la variable número de veces al día que come por impulsos debido a gula, ansiedad y/o
estrés se distribuye Poisson con parámetro 𝜆 = 1.541611.
PREGUNTAS DE INTERÉS

 ¿cuál es la probabilidad de que de los estudiantes de la Licenciatura en Matemáticas y


Estadística de la UPTC consuman a lo sumo diez frutas a la semana?

X= Estudiantes encuestados de Licenciatura en Matemáticas y Estadística de la UPTC.

P(x<=10)

= pcauchy(q=10,location = 4.930212,scale = 2.094042)

= 0.8753181.

El 87.53% de los estudiantes de Licenciatura en Matemáticas y Estadística de la UPTC


consume a lo sumo 10 frutas a la semana.

 ¿cuál es la probabilidad que de los estudiantes de la UPTC de Licenciatura en matemáticas


y Estadística consuma cinco porciones de verduras durante la semana?

P(x=5)= dlogis(5,4.245309,1.852205)

=0.1295236

El 12.95% de los estudiantes de la UPTC de Licenciatura en matemáticas y Estadística


consume 5 porciones de verduras en la semana.

 ¿Cuál es la probabilidad de que un estudiante al azar de la Licenciatura en Matemáticas y


Estadística de la UPTC tenga un promedio de 3.5?

P(X=3.5)= dnorm(3.5,3.7200000,0.3243455)

= 0.9772326

Si se toma a un estudiante al azar de la Licenciatura en Matemáticas y Estadística de la


UPTC y tenga promedio de 3.5 hay una probabilidad del 97.72%
 ¿Cuál es la probabilidad de que un estudiante de la Licenciatura en Matemáticas y
Estadística de la UPTC consuma por lo menos tres productos procesados en la semana?

P(X<=3)= pexp(3,0.3731343)

= 0.6735253

El 67.35% de los estudiantes de la Licenciatura en Matemáticas y Estadística de la UPTC


consume por lo menos tres productos procesados como lo es embutidos, paquetes, gaseosas
entre otros.
MODELO LINEAL

COMPONENTE ALEATORIO

Para este estudio vamos a tomar a la variable promedio semestral como variable respuesta o
dependiente.

Con el programa R-studio se halló el histograma de la variable,

Luego se usó el siguiente comando

R nos dice que puede ser una posible variable normal con media 37.20 y error estándar de
0.4586938
Graficando lo anterior podemos creer que es una normal

Por último con el test de Shapiro vamos a juzgar lo siguiente:

𝐻0 = 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑒𝑠 𝑢𝑛𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝐻1 = 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑛𝑜 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙

Con el comando en R:
Podemos afirmar que con un nivel de confianza del 95%

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.1914 > 0.05

No rechazamos nuestra hipótesis nula lo cual nos indica que la variable promedio se distribuye en
una normal

COMPONENTE SISTEMATICO

Teniendo en cuenta las 18 variables cuantitativas de interés que nos da la base de datos, el predictor
lineal (ɳ𝑖 ) queda determinado de la siguiente forma:

ɳ𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝛽3 𝑥𝑖3 + 𝛽4 𝑥𝑖4 + 𝛽5 𝑥𝑖5 + 𝛽6 𝑥𝑖6 + 𝛽7 𝑥𝑖7 + 𝛽8 𝑥𝑖8 + 𝛽9 𝑥𝑖9 + 𝛽10 𝑥𝑖10
+ 𝛽11 𝑥𝑖11 + 𝛽12 𝑥𝑖12 + 𝛽13 𝑥𝑖13

Donde:

𝑥𝑖1 = ¿Cuántas frutas consume semanalmente?

𝑥𝑖2 = ¿Cuántas porciones de verduras consume semanalmente?

𝑥𝑖3 = De las comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día?

𝑥𝑖4 = ¿Cuánto tiempo dedica al consumo de una comida en minutos?

𝑥𝑖5 = ¿Cuántos panes tradicionales consume al día?

𝑥𝑖6 = ¿Cuántos vasos de agua bebe al día?

𝑥𝑖7 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?

𝑥𝑖8 = ¿Cuántas veces come pescado a la semana?

𝑥𝑖9 = ¿Cuántas veces a la semana come grasas(malas) o embutidos?


𝑥𝑖10 = ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas,
etc., consume a la semana?

𝑥𝑖11 = ¿Número de veces que consume bebidas alcohólicas a la semana?

𝑥𝑖12 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?

FUNCIÓN DE ENLACE

La función de enlace para estas variables geográficas presentadas en los datos con respecto a la
variable respuesta (especies endémicas) es la Identidad.

Е[𝑦𝑖 ] = μ𝑖 = ɳ𝑖

Donde 𝑖 = 1, 2, 3, … , 50

ESTIMACIÓN DE LOS PARÁMETROS

Utilizando el programa R se estimaron los parámetros (𝛽) que se tienen en el predictor lineal de
cada una de las doce variables explicativas de los datos el cual nos arroja la estimación de cada
uno, luego el predictor lineal (ɳ𝑖 )queda de la siguiente forma:

𝛽̂0 : 38.35508

𝛽̂1 : -0.15339

𝛽̂2 : -0.14263
𝛽̂3 : 0.28882

𝛽̂4 : -0.04994

𝛽̂5 : -0.18803

𝛽̂6 : 0.42564

𝛽̂7 : -0.25748

𝛽̂8 : 0.52404

𝛽̂9 : 0.21974

𝛽̂10 : 0.22189

𝛽̂11 : -1.47755

𝛽̂12 : -0.64332

 𝛽̂0 : el valor esperado del promedio sin tener en cuenta las demás variables.
 𝛽̂1 : por cada unidad de cambio en el número de porciones de frutas consumidas en la
semana el promedio disminuirá -0.15 el valor siempre y cuando se mantengan constantes
las otras variables.
 𝛽̂2 : el coeficiente -0.14263, negativo, nos indica que por cada porción de fruta el valor
esperado del promedio sufre un decrecimiento en un -0.14263, cuando las demás variables
se mantienen constantes.
 𝛽̂3 : Por cada cambio del número de comidas que consume al día el valor esperado del
promedio semestral aumentara en 0.28882 siempre y cuando las demás variables sean
constantes.
 𝛽̂4 : Por cada cambio de unidad del tiempo dedicado al consumo de comidas el valor
esperado del promedio disminuirá en -0.04994, siempre y cuando las otras variables se
mantengan constantes.
 𝛽̂5 : Por cada aumento en el número de panes consumidos al día el valor esperado del
promedio disminuirá en -0.18803, cuando las demás variables se mantienen constantes.
 𝛽̂6 : Por cada aumento en el número de vasos que toma al día el valor esperado del promedio
aumentará 0.42564, siempre y cuando las demás variables se mantengan constantes.
 𝛽̂7 : Por cada aumento en el número de veces que no come por estudiar el valor esperado
del promedio disminuirá -0.25748, siempre y cuando las demás variables se mantengan
constantes.
 𝛽̂8 : Por cada aumento en el número de veces que come pescado el valor esperado del
promedio aumentara 0.52404, siempre y cuando las demás variables se mantengan
constantes
 𝛽̂9 : Por cada aumento en el número de veces que consume grasas o embutidos el valor
esperado del promedio aumentara en 0.21974, siempre y cuando las demás variables se
mantengan constantes.
 𝛽̂10 : Por cada aumento en el número de productos procesados consumidos a la semana el
valor esperado aumentará 0.22189, siempre y cuando las demás variables se mantengan
constantes.
 𝛽̂11 : Por cada aumento en el número de veces que consume alcohol en la semana el valor
esperado del promedio disminuirá 1.47755, siempre y cuando las demás variables se
mantengan constantes.
 𝛽̂12 : Por cada aumento en el número de veces que come por impulso el valor esperado del
promedio disminuirá 0.64332, siempre y cuando las demás variables se mantengan
constantes.

ESTIMACIÓN POR INTERVALOS PARA LOS 𝜷𝒋

Por medio del programa R-studio, se establecieron para cada 𝛽𝑗 , donde 𝑗 = 0,1, … ,12 un intervalo
de confianza (IC) del 95%. El IC nos permite estimar un rango de valores en el que se encuentra
el Valor del parámetro de cada una de las variables, estos están determinados por:

 El parámetro 𝛽0 que es el valor esperado de la variable especies endémicas cuando las


demás no influyen se encuentra en (35.11410197, 42.59605923) con un 95% de certeza.
 El parámetro 𝛽1 se encuentra en intervalo (−0.36084967,0.05406552) con un 95% de
certeza. Este parámetro contiene al cero así que se espera que la variable ¿Cuántas frutas
consume semanalmente? No influya al promedio semestral de los estudiantes de la carrera
de matemáticas y estadística, siempre y cuando las demás variables permanezcan
constantes.
 El parámetro 𝛽2 se encuentra en intervalo (−0.37090093, 0.08563561) con un 95% de
certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántas
porciones de verduras consume semanalmente? No influye como se creía al promedio de
los estudiantes encuestados siempre y cuando las demás variables permanezcan
constantes.

 El parámetro 𝛽3 se encuentra en intervalo (−023079733,0.80844589) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable De las
comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día? No influya
al promedio semestral de los estudiantes de la carrera de matemáticas y estadística,
siempre y cuando las demás variables permanezcan constantes.

 El parámetro 𝛽4 se encuentra en intervalo (−0.15507339,0.05518713) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuánto
tiempo dedica al consumo de una comida en minutos? No influye al promedio semestral
de los estudiantes de la carrera de matemáticas y estadística, siempre y cuando las demás
variables permanezcan constantes.

 El parámetro 𝛽5 se encuentra en intervalo (−0.89953287,0.52346422) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántos
panes tradicionales consume al día? No influye al promedio semestral de los estudiantes
de la carrera de matemáticas y estadística, siempre y cuando las demás variables
permanezcan constantes.
 El parámetro 𝛽6 se encuentra en intervalo (0.07019338,0.78109142) con un 95% de
certeza. No contiene al cero lo que nos hace creer que la variable ¿Cuántos vasos de agua
bebe al día? Influye en el promedio de los estudiantes de la licenciatura en matemáticas y
estadística.
 El parámetro 𝛽7 se encuentra en intervalo (−0.78078216,26581635) con un 95% de
certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántas
veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener más
tiempo para estudiar? no influye al promedio semestral de los estudiantes de la carrera de
matemáticas y estadística, siempre y cuando las demás variables permanezcan constantes.

 El parámetro 𝛽8 se encuentra en intervalo (−0.74112640,1.78920128) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántas
veces come pescado a la semana? no influye al promedio semestral de los estudiantes de
la carrera de matemáticas y estadística, siempre y cuando las demás variables
permanezcan constantes.

 El parámetro 𝛽9 se encuentra en intervalo (−0.37797029,0.81745445) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántas
veces a la semana come grasas(malas) o embutidos? no influye al promedio semestral de
los estudiantes de la carrera de matemáticas y estadística, siempre y cuando las demás
variables permanezcan constantes.

 El parámetro 𝛽10 se encuentra en intervalo (−0.11369156,0.55742147) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántos
productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas, etc.,
consume a la semana? no influye al promedio semestral de los estudiantes de la carrera de
matemáticas y estadística, siempre y cuando las demás variables permanezcan constantes.

 El parámetro 𝛽11 se encuentra en intervalo (−3.13188937,0.17679229) con un 95% de


certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Número de
veces que consume bebidas alcohólicas a la semana? no influye al promedio semestral de
los estudiantes de la carrera de matemáticas y estadística, siempre y cuando las demás
variables permanezcan constantes.
 El parámetro 𝛽12 se encuentra en intervalo (−1.41520650,0.12857462) con un 95% de
certeza. Este intervalo contiene al cero lo que nos hace pensar que la variable ¿Cuántas
veces al día come por impulsos debido a gula, ansiedad y/o estrés? no influye al promedio
semestral de los estudiantes de la carrera de matemáticas y estadística, siempre y cuando
las demás variables permanezcan constantes.

JUZGAMIENTO DEL MODELO VÍA HIPOTESIS LINEAL

1. Construcción de la hipótesis lineal general

ℎ0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 𝛽8 = 𝛽9 = 𝛽10 = 𝛽11 = 𝛽12 = 0

𝑣𝑠

ℎ𝑎 : 𝛽𝑗 ≠ 0 ∃ 𝑗: 1, … ,12

Con el comando en R summary(modelo) obtenemos lo siguiente:


Con un p-valor= 0.03011, lo que nos dice que la probabilidad de cometer un error al rechazar 𝐻0
es de 3.011%, por tanto, rechazamos 𝐻0 luego

𝛽𝑗 ≠ 0; para algún j con j = 1,2,3, 4, … ,12

Hallando la tabla ANOVA

Fuente de Grados de Suma de Cuadrados F


variación libertad cuadrados medios

Modelo 11 221.286 20.1169 2.239

Error 37 304.713 8.235

Total 48
Haciendo el análisis de varianza gracias a la tabla anterior el valor crítico de la distribución F con
11 grados de libertad en el numerador y 37 grados de libertad en el denominador es de 2.044 lo
cual es menor a 2.239. Por lo cual rechazamos 𝐻0 . Es decir que
ℎ𝑎 : 𝛽𝑗 ≠ 0 ∃ 𝑗: 1, … ,12

Es verídico.

Calculando la bondad de ajuste del modelo a través del coeficiente de determinación y coeficiente
de determinación ajustado tendremos que:

𝑆𝐶𝑀 𝐶𝑀𝑅
𝑅2 = = 0.4207 𝑅2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 − = 0.2328
𝑆𝐶𝑇 𝑆𝑆𝑇
𝑁−1

Por lo cual podemos afirmar que hay un pobre ajuste del modelo lo cual nos dice que no se logró
explicar de manera adecuada la variabilidad del modelo con las variables explicativas indicadas.

SELECCIÓN DEL MODELO OPTIMO

Se usó el método “Hacia adelante”

1. Inicia con un modelo vacío (sólo la constante).

2. Se ajusta un modelo y se calcula el p-valor del juzgamiento de hipótesis que resulta de incluir
cada variable por separado
3. Seleccionamos el modelo con el p valor más significante el cual sería:

4. Ahora anidamos el modelo lm(promedio~N° come ansiedad) con el resto de variables


Y siguiendo este proceso logramos encontrar el siguiente modelo
g66<-lm(datos1$`5 Promedio` ~ datos1$`6 No frutas` + datos1$`7 No verduras` + datos1$`8 no
comidas consume` + datos$`12 No vasos` + datos$`14 no come` + datos$`19 No paquetes` +
datos$`21 No bebidas alcoholicas` + datos$`23 No come ansiedad`)

𝜂𝑖 ~𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝛽3 𝑥𝑖3 + 𝛽4 𝑥𝑖4 + 𝛽5 𝑥𝑖5 + 𝛽6 𝑥𝑖6 + 𝛽7 𝑥𝑖7 + 𝛽8 𝑥𝑖8

𝑥𝑖1 = ¿Cuántas frutas consume semanalmente?

𝑥𝑖2 = ¿Cuántas porciones de verduras consume semanalmente?

𝑥𝑖3 = De las comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día?

𝑥𝑖4 = ¿Cuántos vasos de agua bebe al día?

𝑥𝑖5 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?

𝑥𝑖6 = ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas,
etc., consume a la semana?

𝑥𝑖7 = ¿Número de veces que consume bebidas alcohólicas a la semana?

𝑥𝑖8 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?
Calculando la bondad de ajuste del modelo a través del coeficiente de determinación y coeficiente
de determinación ajustado tendremos que:

𝑆𝐶𝑀 𝐶𝑀𝑅
𝑅2 = = 0.683 𝑅2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 − = 0.4626
𝑆𝐶𝑇 𝑆𝑆𝑇
𝑁−1

EVALUACIÓN DEL MODELO

COMPONENTE ALEATORIO

Para analizar que distribución de probabilidad tienen los errores se plantea un sistema de hipótesis
para ver si los errores están distribuidos como una normal, se utiliza las gráficas de los residuales,
el test de Kolmogorov-Smirnov y se establece otra hipótesis para hallar la homocedasticidad cada
uno de estos test se realizaron en el programa R. a continuación se muestra la evidencia.

HOMOCEDASTICIDAD

summary(lm(abs(residuals(g66))~fitted(g66))) haciendo un resumen de un modelo entre los


residuales y los valores ajustados del modelo obtenemos un

𝑆𝐶𝑀
𝑅2 = = 0.06489
𝑆𝐶𝑇

Lo cual nos quiere decir que hay muy poca relación entre los residuales y los ajustados lo cual es
una buena señal para la normalidad del error.

A través del test de Breusch-Pagan se observa lo siguiente


ℎ0 : 𝜀𝑖 𝑠𝑜𝑛 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑜𝑠
𝑣𝑠

ℎ𝑎 : 𝜀𝑖 𝑛𝑜 𝑠𝑜𝑛 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑜𝑠

Que da un valor BP de 6.5966 con 8 grados de libertad y un p valor de 0.5413 que es un valor
grande lo cual interpretamos que hay homocedasticidad (no se rechaza la hipótesis nula) en los
residuales.

NORMALIDAD DE LOS RESIDUALES (LOS ERRORES DEL MODELO)

Las graficas anteriores nos hacen creer que hay normalidad en los residuales y al parecer solo 3
datos no se ajustan debidamente al Q-Q plot

Con el teste d

Test de Kolmogorov Smirnov

ℎ0 : 𝜀𝑖 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒𝑛 𝑐𝑜𝑚𝑜 𝑢𝑛𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑣𝑠
ℎ𝑎 : 𝜀𝑖 𝑛𝑜 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒𝑛 𝑐𝑜𝑚𝑜 𝑢𝑛𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
Con un P-valor de 0.6591 no se rechaza la hipótesis nula lo cual nos permite concluir que
efectivamente los errores se distribuyen como una normal.

𝜀𝑖 ~𝑛𝑜𝑟𝑚(0, 𝜎 2 )

AUTOCORRELACIÓN

Para evaluar la autocorrelación entre las variables se plantea un sistema de hipótesis, el cual se
trabajará en el programa R por medio del test de Durbin Watson, a continuación, se muestran las
evidencias.

ℎ0 : 𝑟ℎ0 = 0
𝑣𝑠
ℎ𝑎 : 𝑁𝑜 𝑒𝑠𝑡𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠

Analizando nuestro test se puede observar que no se presentan problemas de independencia, ya


que nuestro DW=2.3964 por ende se encuentra en el intervalo 1.5<WD<2.5.

COMPONENTE SISTEMATICO
DATOS INUSUALES

 Laverage

Para hallar los laverage de nuestros datos se utiliza los siguientes comandos aplicados en el
programa R, a continuación, se muestra los Laverage del modelo
2𝑝 3
Analizando estos datos podemos concluir a partir de la propiedad = 50 = 0.06 > 𝐻𝑖𝑡, los
𝑁
datos Laverage del modelo son los siguientes

OUTLIERS

Para detectar los outliers se utiliza Jackknife en el programa R, en donde se utilizan los
siguientes comandos para hallar el máximo posible outliers, se plantea un sistema de hipótesis
para comprobar si efectivamente es un outliers, el cual se soluciona por medio del test de
Bonferroni.

ℎ0 : 𝐷𝑎𝑡𝑜 46 𝑛𝑜 𝑒𝑠 𝑢𝑛 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑠
𝑣𝑠
ℎ𝑎 : 𝐷𝑎𝑡𝑜 46 𝑒𝑠 𝑢𝑛 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑠

Utilizando el test de Bonferroni

Como el dato de mayor valor residual es el 45 con un tamaño de 2.853 y haciendo el test de
Bonferroni con el comando qt((0.05/(50*2)),41) que significa se calcula el cuantil de una T con
un nivel de significancia del 95% nos arroja un valor de 3.544184 lo cual nos quiere decir que
todos los datos mayores que este son outliers, con esto concluimos que nuestro modelo no tiene
datos outliers.

DATOS INFLUYENTES

Para hallar los datos influyentes se utiliza la distancia cook, la cual se halla con el programa R, a
1
continuación, se muestran los datos influyentes los cuales son mayores a 𝐷𝑖 = 𝑝 𝑟𝑖

A través de un gráfico parcial de residuales para 𝑥𝑖𝑗 con j= 1,2,3,…,8

Se tiene lo siguiente:
𝑥𝑖1 = ¿Cuántas frutas consume semanalmente?

𝑥𝑖2 = ¿Cuántas porciones de verduras consume semanalmente?


𝑥𝑖3 = De las comidas entre desayuno, almuerzo y/o cena. ¿Cuántas de estas consume al día?

𝑥𝑖4 =¿Cuántos vasos de agua bebe al día?

𝑥𝑖5 = ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces por tener
más tiempo para estudiar?
𝑥𝑖6 = ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas, papas fritas,
etc., consume a la semana?

𝑥𝑖7 = ¿Número de veces que consume bebidas alcohólicas a la semana?

𝑥𝑖8 = ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?

Demostrando así que el componente sistemático es lineal simple.


CONCLUSIONES
 A través del modelo optimo y gracias a que es un modelo bien evaluado para entregar se
pudo establecer que las variables que influyen en el promedio de los estudiantes de la
LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA.
o ¿Cuántas frutas consume semanalmente?
o ¿Cuántas porciones de verduras consume semanalmente?
o De las comidas entre desayuno, almuerzo y/o cena.
o ¿Cuántas de estas consume al día?
o ¿Cuántos vasos de agua bebe al día?
o ¿Cuántas veces a la semana dejas de desayunar, almorzar, cenar y/o tomar onces
por tener más tiempo para estudiar?
o ¿Cuántos productos procesados como gaseosas, bebidas energizantes, galletas,
papas fritas, etc., consume a la semana?
o ¿Número de veces que consume bebidas alcohólicas a la semana?
o ¿Cuántas veces al día come por impulsos debido a gula, ansiedad y/o estrés?
 Se observó que algunos hábitos alimenticios tienen influencia en el promedio de los
estudiantes de la licenciatura de matemáticas y estadística, por ejemplo, el número de vasos
que toma gua al día.
 A través de nuestra encuesta se logró identificar algunos de los factores que influyen en el
rendimiento académico.
REFERENCIAS BIBLIOGRÁFICAS
Aranda, M. Pérez, K. Torres, J. (noviembre de 2013). EL BAJO RENDIMIENTO ACADÉMICO
CONSECUENCIA DE UNA MALA ALIMENTACIÓN, UNIVERSIDAD
AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL “CUAUHTÉMOC” DE LA
ESCUELA PREPARATORIA.

Reyes, S. Trujillo, R. (2015). INFORME DE TESIS. UNIVERSIDAD NACIONAL DE


TRUJILLO FACULTAD DE CIENCIAS SOCIALES ESCUELA DE TRABAJO
SOCIAL, Perú.

Notas de clase distribuciones de probabilidad, inferencia estadística y modelamiento estadístico


del 2020.

https://www.fen.org.es/blog/habitos-alimentarios/

https://www.fmed.uba.ar/sites/default/files/201903/teorico%20Evaluaci%C3%B3n%20Nutricion
al%202019.pdf

https://www.diariofemenino.com/articulos/dieta/dieta-sana/que-es-la-dieta-balanceada-y-en-que-
consiste/

https://www.significados.com/alimentacion/

https://www.significados.com/nutricion/

https://www.farmaceuticonline.com/es/dieta-funcion-cerebral/

https://definicion.de/rendimiento-academico/

file:///C:/Users/Tuptc/Downloads/SEBASTIAN%20REYES%20ROSA%20ESTHER(FILEmini
mizer).pdf

También podría gustarte