Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiantes:
Edwar David Valverde Montalvo
Yanior Mendoza
E-mail:
edwarvalverde23@yahoo.com
Asesor:
Juan Carlos Briñez de León Ph.D.
Palabras claves
Introducción
¿Existe alguna una herramienta o software adecuado que nos permita leer y decodificar
archivos descargables como Dataset para posterior clasificarla, reordenarla y estructurarla
para nuestros fines?
Esta investigación del problema lo que busca es mejorar nuestras capacidades intelectuales
de análisis de datos, conocer a fondo el software para decodificación de datos y sobre todo
conocer las estrategias para la toma automática de decisiones mediante algoritmo
3
computacional utilizando clasificadores en machine learning, que a su vez, nos permitirán
ser más competitivos,
2. Marco teórico
4
5
6
7
8
9
10
11
Código
from google.colab import drive
drive.mount('/content/drive')
Importando dataset.
import pandas as pd
import numpy as np
12
Modelo_0 = KNeighborsClassifier (5)
Modelo_0.fit(X_train, Y_train)
Y_pred_0 =Modelo_0.predict (X_test)
print("Accuracy KNN",accuracy_score(Y_test, Y_pred_0))
Modelo_1 = GaussianNB()
Modelo_1.fit(X_train, Y_train)
Y_pred =Modelo_1.predict (X_test)
print("Accuracy Bayes",accuracy_score(Y_test, Y_pred))
Modelo_2 = LinearDiscriminantAnalysis()
Modelo_2.fit(X_train, Y_train)
Y_pred_2 =Modelo_2.predict (X_test)
print("Accuracy LDA",accuracy_score(Y_test, Y_pred_2))
Modelo_3 = QuadraticDiscriminantAnalysis()
Modelo_3.fit(X_train, Y_train)
Y_pred_3 =Modelo_3.predict (X_test)
print("Accuracy QDA",accuracy_score(Y_test, Y_pred_3))
Modelo_4 = DecisionTreeClassifier()
Modelo_4.fit(X_train, Y_train)
Y_pred_4 =Modelo_4.predict (X_test)
print("Accuracy Tree",accuracy_score(Y_test, Y_pred_4))
Modelo_5 = SVC()
Modelo_5.fit(X_train, Y_train)
Y_pred_5 =Modelo_5.predict (X_test)
print("Accuracy SVM",accuracy_score(Y_test, Y_pred_5))
#Red neuronal
from sklearn.neural_network import MLPClassifier
Modelo_6 = MLPClassifier(hidden_layer_sizes=(40,10),
learning_rate_init=0.01,max_iter=1000)
# Fit the model
Modelo_6.fit(X_train, Y_train)
Y_pred_6 =Modelo_6.predict (X_test)
print("Accuracy ANN",accuracy_score(Y_test, Y_pred_6))
#Creating a new target
Target=np.ones((1, 8), "float32")
Target[0,0]=float(input('Ingrese edad del paciente entre 0 y 100: ')) #edad
Target[0,1]=float(input('Ingrese ek sexo entre 0 y 1: ')) #sexo
Target[0,2]=float(input('Ingrese Tipo de dolor torácico tipo de dolor torácico
entre 1 y 4: ')) #cp
Target[0,3]=float(input('Ingrese presión arterial en reposo (en mm Hg): '))
#trtbps
Target[0,4]=float(input('Ingrese colestoral en mg/dl obtenido a través del sensor
BMI: ')) #chol
Target[0,5]=float(input('Ingrese azúcar en sangre en ayunas > 120 mg/dl) (1 =
verdadero; 0 = falso): ')) #fbs
Target[0,6]=float(input('Ingrese resultados electrocardiográficos en reposo entre
0 y 2: ')) #rest_ecg
Target[0,7]=float(input('Ingrese frecuencia cardíaca máxima alcanzada entre 20 y
100: ')) # thalach:
13
Target = scaler.transform(Target) #Normalizar los datos
print(" ")
if Prediction_0==0:
print("Según KNN, el paciente tiene menos posibilidades de ataque al Corazón")
else:
print("Según KNN, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_1==0:
print("Según Bayes, el paciente tiene menos posibilidades de ataque al
Corazón")
else:
print("Según Bayes, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_2==0:
print("Según LDA, el paciente tiene menos posibilidades de ataque al Corazón")
else:
print("Según LDA, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_3==0:
print("Según QDA, el paciente tiene menos posibilidades de ataque al Corazón")
else:
print("Según QDA, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_4==0:
print("Según Tree, el paciente tiene menos posibilidades de ataque al Corazón" )
else:
print("Según tree, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_5==0:
print("Según SVM, el paciente tiene menos posibilidades de ataque al Corazón")
14
else:
print("Según SVM, el paciente tiene mas posibilidades de ataque al Corazón")
print(" ")
if Prediction_6==0:
print("Según Redes neuronales, el paciente tiene menos posibilidades de ataque
al Corazón")
else:
print("Según Redes neuronales, el paciente tiene mas posibilidades de ataque al
Corazón")
15
16
Segunda prueba
17
3. Objetivos
Objetivo general
Objetivos específicos
4. Metodología
18
¿Cómo organizarán y analizarán la información?
5. Resultados
6. Conclusiones
Esta propuesta ha sido enfocada en el ámbito de la salud tomando como base un conjunto
de datos proporcionados por Kaggle, en el cual su contenido está formado por datos
clínicos de pacientes que posiblemente pudieron haber sufrido de un ataque cardiaco.
Una vez obtenido el conjunto de datos se procede a realiza un análisis de los datos para ser
procesado. Finalmente se puede concluir que los modelos implementado tienen un
porcentaje de acierto del 93% al momento de predecir si una persona tendrá o no un ataque
cardiaco, resaltando así todo el proceso y el tiempo que se dedicó a este trabajo que al final
puede ser de muchas utilidades en el área de la salud y en otros campos laborales donde se
requiera que el recurso humano necesite predicciones a situaciones de urgencia.
7. Trabajos futuros
19
8. Bibliografía
https://www.kaggle.com/datasets/rashikrahmanpritom/heart-attack-analysis-prediction-
dataset
https://colab.research.google.com/drive/1lA1Qtx4MmXJeclMRxp_s3G0oh9WnowMt
https://drive.google.com/drive/shared-with- me
20