Está en la página 1de 9

Guía para: construir un modelo matemático con

estadística y análisis de regresión


¿Cómo se construye una ecuación a partir de datos reales?
Para construir un modelo matemático donde se realizará un análisis de regresión,
primero debemos entender el procedimiento general.
Procedimiento general

9. Objetivo práctico. Consiste en el enunciado que nos estará guiando a todo


lo largo del proceso hasta la obtención de la ecuación, por lo tanto, lo
escribimos a manera de pregunta y debe incluir al menos: La variable de
respuesta y los factores que se consideraran en el estudio.
:. Características de la regresión. Se refiere a la definición de las variables de
entrada y salida que incluiremos en el modelo.
;. Variable de respuesta. Es la variable dependiente (Y) que buscamos
conocer una ecuación que nos describa cómo se comporta. Es importante
diferenciar el nombre de la variable con la unidad de medición, por ejemplo,
para un refresco, la variable de salida (Y) es el contenido de líquido y su
unidad de medición son los mililitros (ml)
<. Factor(es) y rango de valores. Son las variables de entrada o regresoras
(Xʼs) cuyo efecto en la variable de salida deseamos conocer. Debemos, por
lo tanto, conocer el rango de valores entre los cuales será aplicable la
ecuación, debemos tener la seguridad que los valores de las Xʼs, que están
en la muestra cubren todo el rango posible. También, debemos diferenciar el
nombre de la variable, de la unidad de medición.
=. Tamaño de la muestra. Es la cantidad de datos que vamos a recolectar, un
dato está representado por un valor de Y y un valor de cada una da las Xʼs
del modelo. Usualmente las muestras deben ser mayor a 30.
>. Pruebas estadísticas. En este espacio se escribirán las pruebas
estadísticas que vamos a realizar. En este caso, usaremos Análisis de
Regresión.
?. Modelo matemático. Escribir la técnica estadística que usaremos para
construir el modelo matemático. Análisis de regresión, ANOVA, Diseño de
Experimentos, etc.
@. Hipótesis de la prueba. Escribir las pruebas de hipótesis que
demostraremos en el estudio. ANOVA de la regresión, PH de los parámetros,
etc.
A. Realización de las pruebas o recolección de datos. En este espacio
obtendremos todos los datos con los que realizaremos el análisis. Es
importante que observemos los supuestos aleatoriedad de la muestra.
9B. Análisis de regresión. Construcción del modelo. En este paso usaremos el
software para el análisis correspondiente. El software puede ser Excel,
Minitab, Phyton, R, etc. En este caso, usaremos Excel.
99. Estadístico de prueba, regla de decisión y decisión estadística.
9:. Análisis de residuos. Verificar los supuestos de error, predicciones, etc.
9;. Estudios complementarios. Dependiendo del estudio, se requerirán otras
pruebas para obtener mayor información o validar la información de la
ecuación que queremos construir.
9<. Conclusión práctica. Consiste en tener la seguridad de que se ha logrado el
9<.
objetivo, por lo tanto, podemos redactar la respuesta a la pregunta que
elaboramos en el paso 1 de este procedimiento.

Conociendo el procedimiento general para la construcción del modelo


matemático, procedemos a realizar el modelo de regresión. Para ello hay que
seguir los pasos que se indican en la siguiente guía.

Guía para realizar el análisis de regresión de un conjunto de datos:

Siguiendo el procedimiento general para el análisis de regresión tenemos:


1. Objetivo práctico: ¿Existe un modelo matemático que calcule la cantidad de
calorías de un alimento en función de la cantidad de nutrientes que contiene?

2. Características de la regresión:
● Variables de entrada (factores): X's
● Variable de salida (respuesta): Y

3. Variable de respuesta (dependiente):


(Y): Cantidad de calorías (Kcal o Cal)

4. Factor(es) y rango de valores (regresoras):


X1: Cantidad de carbohidratos (gr)
X2: Cantidad de lípidos/grasa (gr)
X3: Cantidad de proteínas (gr)
X4: Cantidad de sodio (gr)

5. Tamaño de la muestra (más de 30): En nuestro caso usaremos los 40 o más


datos registrados para la Actividad 2 corregida.

6. Pruebas estadísticas: Usaremos Análisis de Regresión.

7. Modelo matemático. Una ecuación de regresión con 4 variables regresoras.

8. Hipótesis de la prueba.
● Hipótesis nula (Ho): Las variables de los nutrientes no afectan el modelo
para determinar las calorías.
● Hipótesis alternativa (Ha): Las variables de los nutrientes afectan el modelo
para determinar las calorías.

para determinar las calorías.
● Estadístico de prueba: Lo usamos para calcular el valor de significancia de la
prueba realizada: valor p. En Excel se obtiene con la Tabla de análisis de
varianza ANOVA (Valor crítico de F).
● Región de rechazo (o región crítica): Forma parte de una regla de decisión.
Normalmente asociada a no cometer el error tipo (a)
Usaremos el valor a 0.05, que nos da un 95% de confianza en la prueba.
● Regla de decisión: Si el valor p es menor que el valor a , (p < a) entonces
se rechaza la hipótesis nula Ho. Por lo tanto, el modelo es significativo y
las variables de los nutrientes afectan el modelo para determinar las
calorías.

9. Realización de las pruebas o recolección de datos. Los 40 o más registros


de alimentos/ productos que recolectamos del consumo nutricional desde la
Semana 2.

10. Análisis de regresión. Construcción del modelo:


Usando en Excel el archivo de la Actividad 2 de la semana 2 corregido en la
semana 3:
1. Selecciona la pestaña "Datos".
2. Ve al botón "Análisis de Datos".
3. En la pantalla desplegada con la lista de herramientas, selecciona Regresión y
haz clic en Aceptar.

4. Indica el Rango Y de entrada, la columna Y de las Calorías.

5. Indica el Rango X de entrada, las columnas X's de Carbohidratos, Lípidos.


Proteínas, Sodio. Las columnas deben estar juntas. Selecciona la opción Rótulos.

6. Indica En una hoja nueva en Opciones de Salida. Esto para que no nos borre
información, ya que si se sobrepone en celdas ocupadas, se pierde la información.
Haz clic en Aceptar para ver resultados.

Presenta la hoja con los resultados:

1. El coeficiente de determinación R^2 nos indica que porcentaje de variación del


contenido calórico es explicado por la regresión, para este ejemplo es de 0.9285,
valor cercano a 1, el cual es nuestro objetivo.

2. De la tabla de Análisis de varianza, podemos observar que el Valor crítico de F


(Valor p ) < 0.05 (Valor a), por lo tanto se rechaza la hipótesis nula y concluimos
que el modelo que obtuvimos si es significativo, es decir, una o ciertas variables
de nutrientes afectan a las calorías. Tenemos que investigar cuáles son.

3. Observando las pruebas de significancia de los factores (Probabilidad)


podemos observar que para Sodio(g), su Valor p (0.3064), es mayor al Valor
a de 0.05 por lo tanto, concluimos que ese coeficiente no es significativo. En tu
caso, podría ser otra variable que resulte no significativa, por ejemplo el
Proteína.

4. Por lo tanto, debemos volver a hacer el análisis solo con los tres factores
significativos que son menores a 0.05: carbohidratos, lípidos/grasas, proteína.
Recordemos que esas 3 columnas deben estar juntas.

5. El nuevo análisis presenta otra hoja:


6. Observando estos resultados, tanto el Valor crítico de F como los valores de
Probabilidad de las 3 variables son menores al Valor a de 0.05, por lo tanto, el
modelo y las variables son significativos.

7. Por último, debemos realizar de nuevo el análisis, indicando el Coeficiente Bo


igual a cero (Contante igual a cero) en la ventana de configuración del análisis de
regresión. Esto le indica al modelo que cuando las cantidades de los nutrientes
(variables) sean cero, el resultado de calorías deberá ser cero.

8. Con esto obtenemos los resultados esperados:


9. Observamos que el Coeficiente de determinación R^2 es 0.9708 muy cercano a
1. El Valor crítico F y las probabilidades son menores a 0.05, por lo tanto ahora si
podemos concluir estadísticamente nuestra ecuación de predicción.
10. Sustituyendo los coeficientes obtenidos en la ecuación:

Este modelo matemático permitirá calcular la cantidad de calorías de un alimento


en función de la cantidad de nutrientes que contiene.

IMPORTANTE: Esta ecuación es el resultado del análisis de datos de un


conjunto en particular, por lo tanto, cada uno de nosotros obtendremos una
ecuación diferente con coeficientes (valores) y variables (factores) distintas.

11. Estadístico de prueba, regla de decisión y decisión estadística.


(Integrados en el paso 8).

En la semana 5, seguiremos los pasos 12, 13 y 14 para verificar si la ecuación


es válida siguiendo la Guía para: validación del modelo final construido.

También podría gustarte