Está en la página 1de 8

UNIVERSIDAD NACIONAL DE HUANCAVELICA

ESCUELA DE POSGRADO

GESTION DE SERVICIOS DE LAS TECNOLOGIAS DE


INFORMACION

Título: REGRESIÓN LOGISTICA EN PYTON DE DIABETES.


DOCENTE:
Dr. Henry George Maquera Quispe.
INTEGRANTES:
 Laura Salvatierra, Leonel Christofher
 Jancco Yupanqui, Jhoel Antonio
 Pérez Morales, Oscar Joao
 Vargas Ocola, Yurema Yasmin
 Pérez Curo, Abraham
 Rojas Quispe, Carlos Alberto
 Ramirez Quispe, Romulu

2023
PREDICCION DE DIABETES REGRESIÓN LOGISTICA
EN PYTON
Planteamiento del Problema:

Para el presente trabajo se tendrá datos de personas que tienen esta


enfermedad(diabetes) y se va a realizar un análisis a través de su BMI (Es una
métrica)
Y esta está relacionada al peso de la persona. Esto se calcula en base al peso y de la
estatura de la persona, de esta forma se saca un índice y este será un valor número
que nos ayudará a predecir si una persona puede tener diabetes o no.

El presente ejemplo tiene dos fases la primera de ella es la carga de datos y la


siguiente es el desarrollo del mismo. A continuación, detallaremos los pasos para la
realización de la Predicción con regresión Logística.

1. Como primer paso nosotros cargamos los datos previamente descargada


asimismo se ejecutó las librerías necesarias para realizar el presente ejemplo.

Como podemos observar nos carga los datos, nos muestra una tabla con los datos
necesarios para poder analizar el presente ejercicio. Asimismo, nos muestra las
variables de interés que se detalla a continuación:

 BMI: índice de masa corporal. Es una métrica o KPI basada en el peso y la altura
de cada persona. Un BMI muy alto puede ser indicativo de tener diabetes
 Outcome: si la persona tiene diabetes o no.

2. Como segundo paso se iniciara al desarrollo y eplicacion de como se resolvio el


ejercicio para determinar si una puede tener diabetes o no.

En esta parte nos interesa explorar los datos y explicar el modelo de regresión
logística a este caso de diabetes
2.1 Exploración de Datos:

Para efectos de explicación del presente ejercicio se tomará se va a tomar las


variables que nos interesan a modo de ejemplo

Se pasó a realizar un scatter Plot para la visualización la gráfica de puntos que


se muestra a continuación:

BMI
BAJO

BMI
ALTO

3. FUNCION LOGISTICA:

Ahora empezaremos a analizar la función logística y lo que vamos hacer es ver


cómo se comporta esta función dentro de los datos haciendo pruebas sobre W; B.
Como se puede observar tenemos dos parametros que elegimos de manera
aleatoria como se oberva en el grafico. Asimsmo tenemos la variable X la cual
seria el BMI y tambien tenemos la variable Y la cual es la funcion logistica.
Finalmente tambien tenemos el codigo de la grafica lo cual se muestra a
continuacion.

El grafico nos muestra el valor de la recta para el ejercicio de diabetes, este


valor va variar si se modifican los calores de X o de Y

4. Optimizacion de Parametros:

Si escogemos esos parametros para el modelo, ¿Qué tan buenos son?


Podemos utilizar la siguiente estrategia:

 calcular el valor de la función logística para cada dato


 calcular la función de pérdida (se denota con L o loss)
 calcular el promedio de la pérdida para obtener el costo (se denota con
Jo cost)
 Queremos los valores
 que resulten en un menor costo

Pasaremos a realizar, ver las funciones para los valores de W y de B


que ya se encontro en el presente informe

Al ejecutar el codigo nos arroja que el costo para los dos valores que ya se
encontro los cuales son W y B es 0.5995794663996219.

Esto lo hemos hecho con los parametros que hemos obtenido a ojo por ciento.
Ahora vamos a ser más refinados y calcularlo para muchos parametros a la vez
y luego de ahi mirar el que tenga menor costo.

Para eso hacemos lo siguiente:

 Construimos un dataframe con valores para que varían sobre una


cuadricula o grid
 Creamos una función de python que calcule el costo dados parametros
Aplicamos la función sobre el dataframe con los valores en la uadricula
 Podemos ordenar la tabla resultante para obtener los valores con el
menor costo
 Luego hacemos gráficas para verificar el resultado
Como podemos observar nos arrojó todos los valores de la variable W contra
los valores de B y lo que se realizara a continuación es aplicar la función de
costo.

Al ejecutar todo ellos nos arroja que el parámetro optimo según el proceso
sería el primero que nos muestra la gráfica, lo que vamos a hacer es realizar un
Pivot para visualizar esta información de manera diferente.
Para poder visualizar la data en gráficos 3D se izó uso de unas librerías que se
muestran a continuación.
5. CONCLUCIONES:

 Machine Learning es una oportunidad de crecimiento para las firmas, ya que


les permite automatizar procesos, disminuir la incertidumbre en las decisiones
legales y ofrecer un mejor servicio.
 Machine Learning puede ser una herramienta para establecer nexos dinámicos
entre negocios y clientes
 El presente trabajo nos permitió entender un poco más sobre el análisis de
datos y el procesamiento a través de herramientas muy importantes como
Anaconda.

También podría gustarte