Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESCOM
Trabajo Terminal
TT2011-B014
Presentan:
Directores:
Trabajo Terminal
Presentan:
Directores:
Resumen:
El presente documento se describe de manera general en anlisis, diseo, desarrollo e implementacin del
trabajo terminal que lleva por nombre Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad
en base al estilo de vida cuyo objetivo es desarrollar una herramienta capaz de predecir si una persona es
propensa a contraer la siguientes enfermedades: Diabetes, Sobrepeso y Cncer de colon. Y finalmente
presentar una serie de sugerencias las cuales pueden servir de apoyo para la prevencin de dicha enfermedad.
Palabras clave: Inteligencia artificial, minera de datos, arboles de decisin, sistema experto.
1 hshazel@gmail.com
2 robernetortiz@gmail.com
3 samuel.isthelaw@gmail.com
2
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Por medio del presente, informamos que los alumnos que integran el TRABAJO TERMINAL 2011-B014
titulado "Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de
vida", concluyeron satisfactoriamente su trabajo.
El empastado del Reporte Tcnico Final y el Disco Compacto (CD) fueron revisados ampliamente por
sus servidores y corregidos, cubriendo el alcance y el objetivo planteados en el protocolo original y de
acuerdo a los requisitos establecidos por la Comisin que Usted preside.
ATENTAMENTE
Directores
3
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Advertencia
4
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Agradecimientos
A la Escuela Superior de Cmputo que nos brindo los medios necesarios para
nuestro desarrollo profesional.
5
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
A Dios.
Gracias por haberme bendecido con todos los logros que he cosechado a lo
largo de mi vida y darme la fuerza requerida para poder alcanzar mis objetivos.
A mi madre.
6
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
A mi madre Juanis
Que en todo momento estuvo apoyndome incondicionalemente, por sus
consejos, sus valores, por la motivacin constante que me brindo durante mi
formacin profesional, por qu todo lo que soy se lo debo a ella.
A mi padre Andres
Que me supo dar el ejemplo de salir adelante sin importar lo difcil de la
situacin, a no bajar los brazos y que con sus ejemplos de perseverencia y
constancia me ayudarn a lograr mis objetivos.
A mi hermano Lalo
Que siempre estuvo a mi lado, soportando mis malos ratos y compartiendo los
buenos momentos.
A mis tos y tas que me dieron palabras de aliento. A mis primos, con los que
comparti muchas vivencias en el transcurso de mi carrera, a Oscar y Miguel que
me ayudarn con un sustento econmico para que pudier solventar mis
gastos, as como sus consejos para desarrolarme como persona.
7
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
8
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
ndice
Agradecimientos ....................................................................................................................................... 5
ndice de tablas ....................................................................................................................................... 13
ndice de figuras ...................................................................................................................................... 14
Captulo 1 Introduccin........................................................................................................................... 16
1.1 Objetivo ......................................................................................................................................... 16
1.2 Antecedentes ................................................................................................................................ 16
1.3 Justificacin ................................................................................................................................... 17
1.4 Estructura del documento ............................................................................................................ 18
Captulo 2 Estado del Arte ...................................................................................................................... 19
2.1 Introduccin .................................................................................................................................. 19
2.2 Trabajos Terminales desarrollados en ESCOM ............................................................................. 19
2.3 Sistemas internacionales .............................................................................................................. 20
Captulo 3 Marco terico ........................................................................................................................ 22
3.1 Introduccin .................................................................................................................................. 22
3.2 Minera de Datos ........................................................................................................................... 22
3.2.1 Aplicaciones de la Minera de Datos ...................................................................................... 23
3.2.2 El proceso de Minera de Datos ............................................................................................. 24
3.2.3 Tcnicas de Minera de Datos ................................................................................................ 25
3.2.4 Algoritmos de Minera de Datos ............................................................................................ 26
3.3 rboles de decisin ....................................................................................................................... 26
3.3.1 Algoritmos basados en rboles de decisin........................................................................... 28
3.3.2 Algoritmo ID3 ......................................................................................................................... 28
3.3.3 Entropa .................................................................................................................................. 29
3.3.4 Ganancia................................................................................................................................. 30
3.3.5 Ejemplo de ID3 ....................................................................................................................... 31
Captulo 4 Marco metodolgico ............................................................................................................. 36
4.1 Mtrica 3 ....................................................................................................................................... 36
4.2 Implementacin de la metodologa .............................................................................................. 39
Captulo 5 Planificacin del sistema de informacin (PSI) ...................................................................... 42
5.1 Introduccin .................................................................................................................................. 42
5.2 Inicio del plan del sistema de informacin ................................................................................... 42
5.3 Definicin y organizacin del PSI .................................................................................................. 42
9
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
10
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
11
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
12
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
ndice de tablas
Tabla 1 Datos de ejemplo ID3 ................................................................................................................. 31
Tabla 2 Objetivos y productos de la mtrica 3 ....................................................................................... 39
Tabla 3 Objetivos y productos de la mtrica 3 ya aplicada .................................................................... 41
Tabla 4 Catlogo de requerimientos (nivel 0) ......................................................................................... 46
Tabla 5 Tabla Comparativa general sobre posibles lenguajes de programacin a utilizar. ................... 48
Tabla 6 Sistemas gestores de bases de datos ......................................................................................... 49
Tabla 7 Costo/Beneficio de los lenguajes de programacin ................................................................... 51
Tabla 8 Estudio de riesgos....................................................................................................................... 53
Tabla 9 alternativas seleccionadas para el desarrollo de la aplicacin .................................................. 53
Tabla 10 Costos de la solucin propuesta .............................................................................................. 54
Tabla 11 Participantes en las actividades del proceso EVS..................................................................... 54
Tabla 12 Tcnicas/prcticas utilizadas en las actividades del proceso EVS ............................................ 55
Tabla 13 Reglas de negocio ..................................................................................................................... 59
Tabla 14 Requerimientos funcionales..................................................................................................... 61
Tabla 15 Requerimientos no funcionales ............................................................................................... 62
Tabla 16 Catlogo de excepciones .......................................................................................................... 99
Tabla 17 Catlogo de normas ............................................................................................................... 100
Tabla 18 Atributos de la BD diabetes .................................................................................................... 123
Tabla 19 Atributos de la BD de cncer colorrectal ............................................................................... 124
Tabla 20 Atributos de la BD obesidad ................................................................................................... 125
Tabla 21 Resultados pruebas mdicas diabetes ................................................................................... 139
Tabla 22 Resultados pruebas mdicas cncer colorrectal .................................................................... 139
Tabla 23 Resultados pruebas mdicas obesidad .................................................................................. 139
13
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
ndice de figuras
Figura 1 Proceso de minera de datos..................................................................................................... 22
Figura 2 Pseudocdigo para generar un rbol de decisin .................................................................... 27
Figura 3 Forma grfica de un rbol de decisin ...................................................................................... 27
Figura 4 Pseudocdigo algoritmo ID3 ..................................................................................................... 29
Figura 5 Representacin grfica de la entropa binaria .......................................................................... 30
Figura 6 rbol de decisin del ejemplo ID3 ............................................................................................ 35
Figura 7 Actividades del proceso PSI....................................................................................................... 42
Figura 8 Calendario de actividades ......................................................................................................... 43
Figura 9 Actividades del proceso EVS de mtrica 3 ................................................................................ 44
Figura 10 Diagrama de contexto del sistema ......................................................................................... 45
Figura 11 Esquema preliminar de los mdulos del sistema ................................................................... 47
Figura 12 Grfica que muestra el uso de los sistemas operativos actuales ........................................... 49
Figura 13 Diagrama de flujo de datos ..................................................................................................... 50
Figura 14 Grfico estructural del proceso ASI de Mtrica 3 ................................................................... 57
Figura 15 Diagrama de clases principales del sistema ............................................................................ 85
Figura 16 Diagrama Entidad - Relacin ................................................................................................... 86
Figura 17 Pgina de inicio del sistema .................................................................................................... 87
Figura 18 Pgina de Registro de Usuario ................................................................................................ 88
Figura 19 Pgina de Restablecer contrasea I ........................................................................................ 89
Figura 20 Pgina de Restablecer contrasea II ....................................................................................... 89
Figura 21 Pgina de Restablecer contrasea III ...................................................................................... 90
Figura 22 Pgina de perfil de usuario ..................................................................................................... 91
Figura 23 Pgina de Eliminar Cuenta ...................................................................................................... 91
Figura 24 Pgina de Modificar Datos ...................................................................................................... 92
Figura 25 Cambiar Contrasea ................................................................................................................ 93
Figura 26 Pgina de seleccin de enfermedad ....................................................................................... 93
Figura 27 Pgina de Test ......................................................................................................................... 94
Figura 28 Pgina de visualizar historial ................................................................................................... 95
Figura 29 Pgina de eliminar historial..................................................................................................... 95
Figura 30 Grfico estructural de los procesos DSI de Mtrica 3 ............................................................. 96
Figura 31 Diagrama de despliegue del sistema ...................................................................................... 97
Figura 32 Arquitectura del sistema ......................................................................................................... 98
Figura 33 Diagrama detallado de clases del sistema ............................................................................ 101
Figura 34 Diagrama de Casos de Uso .................................................................................................... 102
Figura 35 Diagrama de secuencia del CU1 - Registrar usuario ............................................................. 103
Figura 36 Diagrama de secuencia del CU2 - Iniciar Sesin ................................................................... 103
Figura 37 Diagrama de secuencia del CU3 - Cerrar Sesin ................................................................... 104
Figura 38 Diagrama de secuencia del CU4 - Visualizar Datos ............................................................... 104
Figura 39 Diagrama de secuencia del CU5 - Modificar Datos de Usuario ............................................ 104
Figura 40 Diagrama de secuencia del CU6 - Restablecer Contrasea .................................................. 105
Figura 41 Diagrama de secuencia del CU7 - Elegir Enfermedad ........................................................... 106
Figura 42 Diagrama de secuencia del CU8, CU9, CU10, CU11 .............................................................. 106
14
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
15
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 1 Introduccin
1.1 Objetivo
El objetivo de este trabajo es establecer la metodologa, los requerimientos, arquitectura y
funcionalidad que incluir el sistema, con el fin de tener los elementos suficientes para poder
desarrollar el mismo, es decir, saber lo que va a hacer el sistema (anlisis) y cmo es que lo va a hacer
(diseo). Adicionalmente, mostramos que efectivamente la construccin es factible bajo
consideraciones de carcter econmico, temporal, tecnolgico y operativo.
1.2 Antecedentes
El ser humano siempre se ha esforzado por vivir lo ms saludablemente posible ya que en el mundo
existe una gran variedad de enfermedades y para ello se han desarrollado muchos mtodos de
prevencin que van desde cuidados en el hogar, como alimentacin e higiene hasta vacunas
desarrolladas por laboratorios especializados.[1]
Computacionalmente se han establecido a lo largo de los aos diferentes tipos de sistemas para el
tratamiento de enfermedades, sin embargo existen escasos sistemas que se dediquen a prevenirlas.
Hoy en da es muy frecuente, sobre todo en las grandes empresas, el manejo de grandes volmenes
de datos y el uso generalizado de herramientas informticas para la extraccin adecuada del
conocimiento que encierra la informacin. Este hecho ha transformado el anlisis de datos
orientndolo hacia determinadas tcnicas especializadas bajo el nombre de minera de datos o Data
Mining.[14]
Los recientes avances tecnolgicos hacen que las capacidades para generar y almacenar datos se
incremente da a da.
Por otra parte, la evolucin de los dispositivos de almacenamiento masivo (en relacin precio
capacidad de almacenamiento), tales como los discos duros que pueden almacenar gigabytes de
informacin a un precio reducido, ha dado lugar a que empresas y organizaciones almacenen todo
tipo de informacin, desde los datos de los clientes y sus transacciones, hasta datos de telemetra,
monitorizacin de sus pacientes, evolucin de los precios en el mercado etc.
El explosivo crecimiento de datos gener, a finales de los 80, la aparicin de un nuevo campo de
investigacin que se denomina KDD (Knowledge Discovery in Database). Bajo estas siglas se esconde,
tal y como sugiere Fayyad et al (1996), el proceso no trivial de descubrimiento de patrones vlidos,
nuevos, potencialmente tiles y comprensibles en grandes volmenes de datos. El proceso de KDD
ha servido para unir investigadores de reas en principio dispersas como Inteligencia Artificial,
Estadstica, Tcnicas de visualizacin, Matemticas, Aprendizaje Automtico o Bases de Datos en la
bsqueda de tcnicas y eficaces que ayuden a encontrar el conocimiento que se encuentra en los
grandes volmenes de datos almacenados por las organizaciones. [15]
16
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
1.3 Justificacin
El ser humano, desde comienzos de su existencia siempre ha buscado prolongar lo ms posible su
vida y la calidad de la misma, aunque muchas veces las personas tienen estilos de vida y
comportamientos que lejos de prolongar y mejorar sus vidas hacen todo lo contrario, generando
padecimientos que afectan gravemente la calidad de vida de quienes los padece e incluso llevan a la
muerte. Muchos padecimientos son prevenibles, y no requieren ms que simples cambios en el estilo
de vida que se lleva.
El primer paso para generar un cambio en el estilo de vida es realizar un anlisis del mismo para ver a
que enfermedades se es propenso, y luego poder hacer los cambios necesarios para evitar desarrollar
la enfermedad, es por eso que se realizar la creacin de esta herramienta de apoyo.
La diabetes mellitus es la principal causa de muerte en mujeres y hombres, representa 16.2% y 11.7%,
respectivamente. [2]
Los tumores malignos, (entre ellos el cncer de colon) 14.6% defunciones femeninas y 11.1%
masculinas. [2]
La obesidad o sobrepeso no se toman en cuenta debido a que no son causas directas de defuncin.
En la vida comn una persona tiene que recurrir a un especialista humano que tenga experiencia
desarrollada en cierta rea, esto es, el especialista tiene conocimientos o habilidades especiales que
la mayora no conoce o de las que no dispone; puede resolver problemas que la mayora no podra
resolver, o los resuelve con mayor eficacia.[4]
El usuario aporta los hechos o informacin a la herramienta y recibe consejos o experiencia como
respuesta.
Durante el desarrollo del trabajo se emplearn todos los conocimientos adquiridos durante el
transcurso de la carrera, siendo las reas de formacin ms importantes:
Ingeniera de Software, Bases de Datos, Inteligencia Artificial, Programacin Orientada a Objetos,
Diseo Web, Finanzas, entre otras.
17
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 2: Estado del arte, indica los proyectos que se encargan de tareas similares al
presentado y otros que manejan mtodos de implementacin similares.
Captulo 3: Marco terico, hace mencin a los conceptos que se implementan dentro del
sistema de informacin.
Captulo 7: Anlisis del sistema de informacin, este captulo describe el anlisis detallado de
los requerimientos del sistema de informacin para su posterior desarrollo.
18
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
2.1 Introduccin
Debido a la evolucin de los sistemas de cmputo en su poder de procesamiento, los seres humanos
cada vez somos ms exigentes en el manejo de informacin, no obstante el manejo de grandes
cantidades de datos da lugar a la extraccin de informacin que no es notable a simple vista
(informacin oculta) para ello surge la idea de sistemas que ayuden en la toma de decisiones en base
a dicha informacin oculta.
Caractersticas:
Caractersticas:
Pre diagnostica enfermedades comunes de los perros y gatos.
El sistema est desarrollado en HTML con aplicaciones Java (Servlets, Javascript, Java Server
Pages, etc.).
Maneja la tcnica de rboles de decisin dentro de la minera de datos.
La base de datos est implementada en MySQL.
El motor de inferencia est programado en Java, y emplea el algoritmo de encadenamiento
hacia adelante.
19
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Caractersticas:
Emplea la tcnica de minera de datos ID3.
Genera recetas mdicas a partir del historial del paciente.
El mdico puede modificar el diagnstico generado por el sistema en base a sus propios
criterios.
Est programado en C#.
La base de datos se encuentra en MySQL.
TT20090065 Sistema web para la generacin y gestin de dietas alimenticias Nutri House.
Caractersticas:
Permite la creacin de planes alimenticios individuales.
Est programado en Visual Studio.
La base de datos est desarrollada en SQLServer
El conocimiento del sistema tiene que ser administrado por un nutrilogo.
Permite llevar el control de citas con los pacientes.
Muestra consejos sobre la alimentacin, as como videos.
Caractersticas:
Predice el riesgo de contraer cncer pulmonar a fumadores de entre los 50 y 75 para los
prximos 10 aos.
Los datos se obtuvieron aleatoriamente a travs de la prueba CARNET (Prueba de eficacia de
caroteno y retinol) que se realiz a 18,172 sujetos.
Las entradas del modelo son: edad, sexo, historial de exposicin a asbestos, historia de
fumador.
20
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Se llev a cabo la calibracin del modelo comparando la prediccin obtenida con una parte de
la base de conocimiento ingresada y finalmente se compararon los resultados para determinar
la eficacia.
My Health Advisor
Es un programa, el cual fue desarrollado por la American Diabetes Association de modelado de la
salud, emplea un modelo llamado Archimedes, que crea una realidad virtual en la que todos los
objetos y eventos importantes del mundo real corresponden a objetos y eventos del mundo virtual
del modelo.
Caractersticas:
21
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
3.1 Introduccin
En este apartado se muestran algunas definiciones que son de gran importancia para la completa
comprensin y entendimiento del sistema, sin embargo no es el propsito profundizar mucho en los
temas puesto que es una gran cantidad de informacin que se obtiene cuando se habla de minera de
datos, sin embargo si se presentan conceptos bsicos e informacin que se considera es de suma
importancia.
22
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Una de las preguntas ms importantes que hay en el mbito de la minera de datos es: En qu se
diferencia dicho proceso en el anlisis que realizan otras disciplinas? Los sistemas tradicionales de
explotacin de datos estn basados fundamentalmente en la existencia de hiptesis o modelos
previos. Una vez formulada la hiptesis, sta es analizada de forma emprica a partir de la informacin
de la base de datos disponible y los resultados obtenidos se interpretan como una posible respuesta
a la hiptesis.
Sin embargo esta metodologa plantea dos problemas. El primero es que el individuo que formula la
hiptesis debe adivinar a ciencia cierta cul es la informacin que necesita. El segundo problema es
que, dada la complejidad de los datos almacenados y sus interrelaciones, la explotacin de datos
dirigida a la verificacin de modelos resulta hoy en da inadecuada en muchos mbitos en la toma de
decisiones.
Por ejemplo en situaciones tales como la salud de un individuo, el rendimiento acadmico de un nio
o la tendencia a comprar un producto, son fenmenos que implican multitud de variables y no existe
un nico modelo que resuelva el problema. Retomando el ejemplo de la salud, frecuentemente
determinadas actividades, consumos o caractersticas genticas favorecen en la aparicin de una
enfermedad. Sin embargo muchas de estas enfermedades carecen de un modelo de apoyo para la
decisin y stas son tomadas sobre la base de la experiencia de un equipo de mdicos.
Por lo tanto, para complementar el anlisis anterior, mencionaremos que se requiere la posibilidad de
poder descubrir de forma inductiva informacin y patrones clave ocultos en los datos, es la
caracterstica principal de la minera de datos. Algunos ejemplos son:
Aspectos climatolgicos: Prediccin de tormentas, sequias etc. Que tengan que ver con la
climatizacin.
Medicina: Encontrar la probabilidad de una respuesta satisfactoria en un tratamiento mdico.
Mercadotecnia: Encontrar clientes susceptibles de responder a ofertas de productos y
servicios por correo, fidelidad de clientes, afinidad de productos, etc.
23
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
El termino proceso implica que la minera de datos es una conjuncin de pasos. Los patrones deben
ser vlidos, con algn grado de incertidumbre y novedosos por lo menos para el sistema y
preferiblemente para el usuario al cual se le deber de reportar alguna clase de beneficio.
Seleccin de objetivos: en esta fase hay que estudiar el problema y determinar cul es la meta
del proyecto. As mismo es deseable formular unas expectativas de xito o fracaso del
proyecto. En esta etapa tambin deben ser planteados los costes y beneficios econmicos de
la realizacin del proyecto en caso de ser terminado con xito as como una estimacin de su
duracin.
Preparacin de los datos: esta etapa del proceso es la que mayor esfuerzo requiere. Esta fase
consta de tres pasos:
a) Seleccin de los datos: se identifican las fuentes de datos internas o externas y se
selecciona el subconjunto de datos necesarios ya sean tablas de una base de datos o
ficheros de texto.
b) Proceso de los datos: una vez identificados los datos a utilizar, hay que estudiarlos
para, por un lado entender el significado de los atributos y, por otro lado, para detectar
errores de integracin, como puede ser el hecho de que haya datos repetidos con
distinto nombre o datos que significan lo mismo pero con diferente formato. Esto
problemas pueden surgir porque los datos vienen de fuentes diferentes, y no todas
almacenan la informacin de la misma manera. Con el proceso lo que se consigue es
tener un conjunto de datos adecuado para el correcto funcionamiento de las fases
posteriores del proceso de minera de datos.
c) Transformacin de los datos: una vez analizado el tipo de problema y el tipo de datos
disponible se selecciona el algoritmo o algoritmos que vamos a aplicar. Como cada
24
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Redes neuronales: Esta tcnica de inteligencia artificial, en los ltimos aos se ha convertido
en uno de los instrumentos de uso frecuente para detectar categoras comunes en los datos,
debido a que son capaces de detectar y aprender complejos patrones, y caractersticas de los
datos. Una de las principales caractersticas de las redes neuronales, es que son capaces de
trabajar con datos incompletos e incluso paradjicos, que dependiendo del problema puede
resultar una ventaja o un inconveniente. Adems esta tcnica posee dos formas de
aprendizaje: supervisado y no supervisado.
Algoritmos genticos: Los algoritmos genticos imitan la evolucin de las especies mediante
la mutacin, reproduccin y seleccin, como tambin proporcionan programas y
optimizaciones que pueden ser usadas en la construccin y entrenamiento de otras
estructuras como es el caso de las redes neuronales. Adems los algoritmos genticos son
inspirados en el principio de la supervivencia de los ms aptos.
25
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Algoritmos de segmentacin: dividen los datos en grupos, o clsteres, de elementos que tienen
propiedades similares.
Algoritmos de anlisis de secuencias: resumen secuencias o episodios frecuentes en los datos, como
un flujo de rutas Web.
Algoritmos de clasificacin: predicen una o ms variables discretas, basndose en otros atributos del
conjunto de datos.
De todos los mtodos de aprendizaje, los sistemas basados en arboles de decisin son los ms fciles
de utilizar y entender. La famosa frase de Divide y vencers podra ser el lema que bien resume el
objetivo de esta tcnica de anlisis. Un rbol de decisin es un conjunto de condiciones organizadas
en una estructura jerrquica, de tal manera que la decisin final a tomar se puede determinar
siguiendo las condiciones que se cumplen desde la raz rbol hasta algunas de sus hojas. Los rboles
de decisin son muy utilizados para expresar muchas actividades como procedimientos mdicos,
legales, comerciales, estratgicos, matemticos, lgicos, etc. Sus aplicaciones bsicas son la
clasificacin y la prediccin.
26
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Una de las grandes ventajas de los rboles de decisin es que, en su forma ms general, las opciones
posibles a partir de una determinada condicin son mutuamente excluyentes. Esto permite analizar
una situacin y, siguiendo el rbol de decisin apropiadamente, llegar a una sola accin o decisin a
tomar. Otra ventaja de los arboles decisin es que permiten tratar a los datos perdidos como
categoras independientes dentro de cada variable.
Las ramas que salen de los nodos, corresponden a los posibles valores de atributo correspondiente.
Un rbol de decisin clasifica un caso, filtrndolo de manera descendiente, hasta encontrar una hoja,
que corresponde a la clasificacin buscada.
27
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Existe una serie de algoritmos desarrollados desde los principios de los 60s para la construccin
de rboles de decisin. CLS (Hunt et al., 1966), ID3 (Quinlan, 1979), CART (Breiman et al., 1984),
ACLS (Niblett et al., 1982), ASSISTANT (Cestnik et al., 1987), C4.5 (Quinlan, 1993), etc.
Muchos de estos desarrollos se han convertido en herramientas comerciales, por ejemplo, Rule-
Master (1984), Ex-Tran (1984), Expert-Ease (1983), y C5/See5 (2000). Por otro lado, la gran
mayora de los ambientes de KDD incluyen alguna versin de ID3 o de CART.
Algunas de las caractersticas de los rboles de decisin son las siguientes:
Esta tcnica presenta algunos inconvenientes; favorece indirectamente a aquellos atributos con
muchos valores los cuales no tienen que ser los ms tiles, genera rboles de decisin a partir de
ejemplos de partida, tiene conflictos con la base de conocimientos donde diferentes soluciones se
alcanzan con variables con los mismos valores asociados con el manejo discreto de los valores de las
variables (rangos para discretizar una variable continua); generan grandes rboles de decisin que no
representan garanta de reglas eficientes, solo sirve para problemas de clasificacin y diagnstico; la
generacin de conclusiones intermedias se encuentra implcito en la generacin de reglas a partir de
la tabla de induccin (no se aprecia discriminacin en arboles de decisin).
La tcnica crea un rbol de decisin para aproximar una funcin objetivo de valores discretos, que es
capaz de aprender de una disyuncin de expresiones, adems de ser resistente al ruido en los datos;
el resultado de este mtodo se puede expresar como un conjunto de reglas Si-entonces, intentando
encontrar el rbol ms sencillo que separa mejor los ejemplos, adems de ser una tcnica recursiva
no se realiza back tracking, este mtodo utiliza la entropa.
28
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Para el desarrollo del mtodo se usan atributos, que son los factores que influencian la clasificacin o
decisin, la seleccin de dichos atributos debe basarse en el conocimiento acumulado por la
experiencia, en el algoritmo cada atributo forma un nodo intermedio en un rbol cuyas hojas o nodos
terminales son las clases o decisiones, las clases son los posibles valores de solucin, al conjunto de
combinaciones de atributos dados lo denotaremos como ejemplos, dado el conjunto de ejemplos ID3
selecciona el atributo que subdivide los ejemplos de la mejor manera.
3.3.3 Entropa
La entropa es la medida de la incertidumbre que hay en un sistema. Es decir, ante una determinada
situacin la probabilidad de que ocurra cada uno de los posibles resultados.
( ) ( ) ( )
Dnde:
p1 es la fraccin de ejemplos positivos en S y p0 es la fraccin de ejemplos negativos.
Se define ( ) .
La entropa es 0 -cero- si todos los miembros de S pertenecen a la misma clase.
Si p1= p0=0.5, es decir ejemplos igualmente mezclados, la entropa es un mximo de 1.
Cuando se trata de mltiples clases con c categoras, la frmula de la entropa se puede generalizar:
( ) ( )
29
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
3.3.4 Ganancia
La ganancia se define como la diferencia entre la entropa de un nodo y uno de sus descendientes, es
una heurstica que sirve para elegir el mejor atributo en cada nodo.
El algoritmo ID3 emplea la ganancia para seleccionar de entre los atributos candidatos a cada paso
mientras el rbol es generado. Se examinan todos los atributos y se escoge el de mxima ganancia, de
esta manera se va formando la ramificacin de forma recursiva.
30
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Nueve objetos son clase Si que consideraremos como positivo p y cinco son clase No que
consideraremos negativo n.
p0=9, n0=5 ( ) ( ) ( ) ( ) ( ) 0.9402
Considerando el atributo cielo con sus tres valores (v=3; soleado, nublado y lluvioso).
Para el primer valor soleado- hay 5 instancias, 2 con clase Si y 3 con clase No. Entonces:
(fracciones de ejemplos: p= positivos y n=negativos)
p1=2, n1=3 ( ) ( ) ( ) ( ) ( ) 0.9709
Para el segundo valor nublado- hay 4 instancias 4 de clase Si y ninguna de clase No.
p2=4, n2=0 ( ) ( ) ( ) ( ) ( ) 0
Para el tercer valor lluvioso- se tienen 5 instancias, 3 de clase Si y 2 de clase No.
p3=3, n3=2 ( ) ( ) ( ) ( ) ( )
Por lo tanto para obtener la ganancia de informacin esperada al revisar este atributo cielo-:
( ) ( ) ( )
( ) ( )
Considerando el atributo temperatura con sus tres valores (v=3; caliente, templada y fra).
Para el primer valor caliente- hay 4 instancias, 2 con clase Si y 2 con clase No.
p1=2, n1=2 ( ) ( ) ( ) ( ) ( )
31
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Por lo tanto para obtener la ganancia de informacin esperada al revisar este atributo temperatura-:
( ) ( ) ( )
( ) ( )
Considerando el atributo humedad con sus dos valores (v=2; alta y normal).
Para el primer valor alta- hay 7 instancias, 3 con clase Si y 4 con clase No.
p1=3, n1=4 ( ) ( ) ( ) ( ) ( )
Por lo tanto para obtener la ganancia de informacin esperada al revisar este atributo humedad-:
( ) ( )
( ) ( )
Considerando el atributo viento con sus dos valores (v=2; fuerte y dbil).
Para el primer valor fuerte- hay 6 instancias, 3 con clase Si y 3 con clase No.
p1=3, n1=3 ( ) ( ) ( ) ( ) ( )
Por lo tanto para obtener la ganancia de informacin esperada al revisar este atributo viento-:
( ) ( )
( ) ( )
32
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Podemos notar que el atributo con mayor nmero de ganancia es el de cielo, entonces se elige dicho
atributo para que sea el nodo raz y a partir de ah empezamos a generar el rbol y sus nodos hojas
sern los tres valores de este atributo (soleado, nublado y lluvioso).
De manera recursiva se desarrolla el mismo procedimiento, ahora para el valor de soleado para los
atributos restantes:
Considerando el atributo temperatura con sus tres valores (v=3; caliente, templada y fra).
Para el primer valor caliente- hay 2 instancias, y las 2 de clase No. Por ende su entropa es de 0.
( )
Para el segundo valor templada- hay 2 instancias 1 de clase Si y 1 de clase No. Como hay la
misma cantidad de clases, la entropa es 1.
( )
Para el tercer valor fra- solo hay 1 instancia de clase Si. Por lo que su entropa es de 1.
( )
Por lo tanto la ganancia de informacin esperada al revisar este atributo temperatura- es:
( ) ( ) ( )
( ) ( )
Considerando el atributo humedad con sus dos valores (v=2; alta y normal).
Para el primer valor alta- hay 3 instancias, y las 3 de clase No. Por ende su entropa es de 0.
( )
Para el segundo valor normal- hay 2 instancias y las 2 de clase Si. Por ende su entropa es de 0.
( )
Por lo tanto la ganancia de informacin esperada al revisar este atributo humedad- es:
( ) ( )
( ) ( )
Considerando el atributo viento con sus dos valores (v=2; fuerte y dbil).
Para el primer valor fuerte- hay 2 instancias, 1 de clase Si y 1 de clase No. Como hay igual
cantidad de instancias de clase la entropa es 1.
( )
Para el segundo valor dbil- hay 3 instancias, 2 de clase Si y una de clase No.
( ) ( ) ( ) ( ) ( )
Por lo tanto la ganancia de informacin esperada al revisar este atributo viento- es:
( ) ( )
( ) ( )
33
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
El mximo en esta ocasin es el atributo humedad que ser la prxima expansin del rbol tomando
los valores alta y normal. Podemos ver que los valores con la restriccin de que el cielo es soleado y la
humedad normal son de clase Si. En el caso de la combinacin cielo soleado y humedad alta los
valores son de clase No. Por lo que la parte recursiva en ese instante cumple con la condicin de
paro del algoritmo ID3.
Ahora regresamos y analizamos el valor nublado, en el cual notamos que todas las instancias son de la
clase Si, por ello esta parte cumple tambin con la condicin de paro del algoritmo ID3.
Posteriormente analizamos el valor lluvioso y como las instancias son de ambas clases, volvemos a
calcular la ganancia de los atributos restante para saber cul ser la prxima expansin del rbol.
Considerando el atributo temperatura con sus tres valores (v=3; caliente, templada y fra).
Para el primer valor caliente- no hay instancias por ende su entropa es de 0.
( )
Para el segundo valor templada- hay 3 instancias 2 de clase Si y 1 de clase No.
( ) ( ) ( ) ( ) ( )
Para el tercer valor fra- hay 2 instancias, 1 de clase Si y una de clase No. Por lo que su entropa
es 1.
( )
Por lo tanto la ganancia de informacin esperada al revisar este atributo temperatura- es:
( ) ( ) ( )
( ) ( )
Considerando el atributo humedad con sus dos valores (v=2; alta y normal).
Para el primer valor alta- hay 2 instancias, 1 de clase Si y 1 de clase No. Por ende su entropa es
de 1. ( )
34
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Considerando el atributo viento con sus dos valores (v=2; fuerte y dbil).
Para el primer valor fuerte- hay 2 instancias, ambas de clase No. Por ende la entropa es de 0.
( )
Para el segundo valor dbil- hay 3 instancias, todas de clase Si. As que la entropa es de 0.
( )
Por lo tanto la ganancia de informacin esperada al revisar este atributo viento- es:
( ) ( )
( ) ( )
En esta iteracin los resultados fueron
Ganancia (temperatura)= .01998
Ganancia (humedad)= .01998
Ganancia (viento)= .9709
El mximo en esta ocasin es el atributo viento que ser la prxima expansin del rbol tomando los
valores fuerte y dbil. Podemos ver que los valores con la restriccin de que el cielo es lluvioso y el
viento dbil son de clase Si. En el caso de la combinacin cielo lluvioso y viento fuerte los valores son
de clase No.
La parte recursiva en ese instante cumple con la condicin de paro del algoritmo ID3, como ya no
hay ms nodos que expandir, finalizamos el algoritmo habiendo obtenido el rbol que se muestra en
la Figura 6.
35
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
4.1 Mtrica 3
Mtrica 3, es la metodologa de soporte al desarrollo de software provista por el Ministerio de
Administraciones Pblicas de Espaa. [17] La misma cubre todos los aspectos correspondientes al
ciclo de vida de un sistema software a travs de los siguientes procesos:
Como resumen de los objetivos de esta metodologa, se transcriben a continuacin los que se
describen en el documento introductorio:
36
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
37
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
38
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Toda metodologa provee un marco terico y directrices prcticas para la consecucin de una
actividad, no obstante, el mayor aporte de una metodologa se logra al adaptar la misma a las
necesidades especficas de cada proyecto segn los siguientes criterios:
a) Tamao del proyecto. El tamao del proyecto permite determinar si se realizarn todas las
actividades y productos de un proceso, de acuerdo al nivel de detalle que requiere.
b) Naturaleza del proyecto. Segn el tipo de proyecto y el dominio del problema, es necesario
identificar qu actividades y productos son los ms adecuados para desarrollar el sistema y
representar la solucin correcta.
39
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Con respecto al tamao del proyecto, el sistema a desarrollar puede considerarse de envergadura
pequea. En trminos generales, las actividades asociadas a productos directamente relacionados al
software tendrn un mayor nivel de detalle y las actividades asociadas al contexto, interfaces,
pruebas y documentacin de soporte, llevarn menor detalle.
En cuanto a la naturaleza y objetivo del proyecto, la Tabla 3 resume en funcin de los productos;
considerando que toda actividad se realiza para producir o completar un producto; la manera en la
que Mtrica 3 se aplicar en el desarrollo del Sistema.
PROCESO RESULTADOS
Planificacin de Sistemas de Debido a la duracin del proyecto y no efectuarse dentro de
Informacin una organizacin, no se aplica ni planificacin estratgica ni
operativa, por lo que se implementa una planeacin a corto
plazo (1 ao) para llevar a cabo el proyecto.
Desarrollo de Sistemas de
Informacin
Estudio de Viabilidad de Contexto del sistema (con la definicin
Sistema de las interfaces en funcin de la solucin)
Impacto en la organizacin
Coste/beneficio de la solucin
Valoracin de riesgos de la solucin
Enfoque del plan de trabajo de la solucin
Planificacin de la solucin
Solucin propuesta:
Descripcin de la solucin
Modelo de descomposicin en subsistemas
Entorno tecnolgico y comunicaciones
Estrategia de implantacin global del sistema
Descripcin de los procesos manuales
Si la alternativa incluye desarrollo:
Modelo de procesos
Modelo de negocio/Modelo de dominio
Anlisis del Sistema de Descripcin general del entorno tecnolgico
Informacin Glosario de trminos
40
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Catlogo de normas
Catlogo de requerimientos
Especificacin de interfaz de usuario
Adems, en Anlisis Estructurado:
Contexto del sistema
Descripcin de interfaz con otros sistemas
Modelo lgico de datos normalizado
Adems, en Anlisis Orientado a Objetos:
Descripcin de subsistemas de anlisis
Descripcin de interfaces entre subsistemas
Modelo de clases de anlisis
Diseo del Sistema de Catlogo de requerimientos (se completa)
Informacin Catlogo de excepciones
Catlogo de normas para el diseo y construccin
Diseo de la arquitectura del sistema
Entorno tecnolgico del sistema
Modelo fsico de datos optimizado
Adems, en Diseo Estructurado:
Diseo de la arquitectura modular
Diseo de interfaz de usuario
Adems, en Diseo Orientado a Objetos:
Diseo de la realizacin de casos de uso
Modelo de clases de diseo
Comportamiento de clases de diseo
Diseo de interfaz de usuario
Construccin del Sistema de Resultado de las pruebas unitarias
Informacin Evaluacin del resultado de las pruebas de integracin
Evaluacin del resultado de las pruebas del sistema
Producto software
Cdigo fuente de los componentes
Procedimientos de operacin y administracin del sistema
Procedimientos de seguridad y control de acceso
Manual de usuario
Especificacin de la formacin a usuarios finales
Cdigo fuente de los componentes de migracin y carga
inicial de datos
Procedimientos de migracin y carga inicial de datos
Evaluacin del resultado de las pruebas de migracin y carga
inicial de datos
Implantacin y Aceptacin del Plan de implantacin del sistema en su totalidad
Sistema Evaluacin de las pruebas de implantacin del sistema por
parte del usuario de operacin
Evaluacin de las pruebas de aceptacin del sistema por
parte del usuario final
Tabla 3 Objetivos y productos de la mtrica 3 ya aplicada
41
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
5.1 Introduccin
El objetivo de un Plan de Sistemas de Informacin es proporcionar un marco estratgico de referencia
para los Sistemas de Informacin de un determinado mbito de la Organizacin. [18]
El resultado del Plan de Sistemas debe, por tanto, orientar las actuaciones en materia de desarrollo de
Sistemas de Informacin con el objetivo bsico de apoyar la estrategia corporativa, elaborando una
arquitectura de informacin y un plan de proyectos informticos para dar apoyo a los objetivos
estratgicos. En la Figura 7 se muestra la lista de actividades del PSI.
Objetivos particulares:
Actualmente existen tcnicas y herramientas de la minera de datos capaces de dar xito al problema
planteado anteriormente, por lo que se ha decidido dar comienzo a la elaboracin del sistema de
informacin.
42
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
servir de apoyo para el equipo de trabajo, el cual consta solo de los 3 integrantes de quipo que se
encargan de desarrollar el sistema de informacin.
En la Figura 8 se muestra el diagrama de Gantt que corresponde a las actividades que se realizaran a
lo largo del proyecto.
Las fases del proyecto corresponden a los procesos propuestos por la metodologa y la escala
temporal utilizada es en semanas y meses, considerando el periodo real de realizacin del proyecto.
La ejecucin del proyecto se lleva a cabo mediante los procesos de desarrollo que a su vez incluye las
fases de anlisis, diseo, desarrollo (codificacin), pruebas e implementacin (pertenecientes a la lista
de procesos de la metodologa Mtrica 3).
43
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 6 Estudio de viabilidad del sistema de informacin (EVS)
En este caso, el Estudio de Viabilidad del sistema no apunta a la definicin del o los proyectos que den
soporte a una problemtica particular en el marco de un Plan de Sistemas, sino a la identificacin de
los requerimientos generales del sistema, su alcance y la valoracin de la situacin actual que sirven
de punto de partida al Anlisis del Sistema de Informacin (ASI).
Las actividades que engloba este proceso se recogen en la Figura 9, en la que se indican las
actividades que pueden ejecutarse en paralelo y las que precisan para su realizacin resultados
originados en actividades anteriores.
Se analizan las posibles restricciones, tanto generales como especficas, que puedan condicionar el estudio y la
planificacin de las alternativas de solucin que se propongan.
44
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
6.1.1 Estudio de la solicitud
Los requerimientos del sistema son los siguientes:
b) La primera tarea que el sistema deber realizar es mostrarle al usuario un cuestionario con
preguntas relevantes a su estilo de vida e historial mdico en base a la enfermedad que se desea
obtener el resultado; y una vez contestado se almacenar en la base de datos.
d) Despus de haberse realizado la prediccin, y en caso de que esta fuera positiva el sistema
generar un reporte con las sugerencias que el usuario puede hacer en su estilo de vida para tratar de
evitar contraer la enfermedad.
e) El sistema almacenar los reportes generados por el usuario para su posterior consulta.
f) El sistema proporcionar una ayuda por medio de una interfaz grfica de usuario.
Formulario Reportes
s Herramienta de
Usuario apoyo en la Administrador
prediccin de
enfermedades
Predicciones. Conocimiento
Consejos.
45
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
6.1.3 Especificacin del alcance del EVS
El propsito del Estudio de Viabilidad del Sistema tiene como objetivo demostrar que el desarrollo del
sistema est fundamentado y es factible en los aspectos operativo, tecnolgico, temporal y legal. En
las secciones siguientes se aborda cada uno de los aspectos antes mencionados con lo cual se
delimitarn las caractersticas y restricciones del sistema para la elaboracin del mismo (lenguaje de
programacin, sistema gestor de base de datos, etc.).
Identificacin de Requerimientos:
ID Descripcin
R1 El sistema indicar al usuario si es propenso a contraer las enfermedades de:
Diabetes Mellitus, Sobrepeso o Cncer Colorrectal.
R2 En caso de obtener una respuesta afirmativa, el sistema generar un reporte
con sugerencias para mejorar el estilo de vida y evitar desarrollar el
padecimiento.
R3 El sistema generar un historial por usuario que contendr los resultados de los
test realizados.
Tabla 4 Catlogo de requerimientos (nivel 0)
46
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
6.4.1 Preseleccin de alternativas de solucin
Ahora que ya definimos los requerimientos a cubrir por el sistema en la seccin 6.3 del EVS
(Identificacin de Requerimientos), hay que considerar los productos de software estndar en el
mercado (los cuales no existen para el sistema que se propone) por lo que se desarrollar uno a la
medida.
Lenguajes de programacin
En la Tabla 5 se hace una comparacin entre los lenguajes de programacin orientados a objetos de
los que tenemos mayor conocimiento, los cuales son C++, Java y C#
47
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Lenguaje de Eficiencia Software libre Es Portable? Interfaz de Usuario
Programaci
n
Java Es lento al momento de Si Si, aunque se Dado que se cuenta con
intervenir la mquina requiere que la la librera AWT para
virtual. Mquina Virtual crear una interfaz
Necesita ms cdigo para este instalada grfica, es complicado
desarrollar e implementar programar cualquier
funciones que no existen en elemento que se
libreras estndar necesite en esta misma.
Microsoft Es eficiente, el tiempo de No nicamente en Usa el estndar de
Visual C# ejecucin es rpido, sistemas Windows aplicaciones de
.NET adems de que la librera (Framework) y en Windows.
de .NET soporta varios Mono (Linux)
tipos de datos (dado que
se asemeja a C)
C++ Es eficiente, el tiempo de S Se requiere de Mediante la biblioteca
ejecucin es rpido, libreras gcc pero multiplataforma Qt es
adems que incluye son muy ligeras y posible crear
programacin orientada a libres. interfaces grficas
objetos, tratamiento de basadas en C++.
excepciones y es derivado
del lenguaje C.
Tabla 5 Tabla Comparativa general sobre posibles lenguajes de programacin a utilizar.
Dado las comparaciones que se realizaron con los diferentes lenguajes de programacin. Se puede
llegar a las siguientes conclusiones.
2) C++ posee caractersticas muy similares a java pero su desventaja radica en cuanto a
conocimiento de la herramienta Qt puesto que no se tiene un estudio a profundidad de la
biblioteca para desarrollar interfaces graficas
3) Microsoft Visual C# .NET debido a que es eficiente y rpido en tiempo de ejecucin y su fcil
manejo y desarrollo de interfaces graficas es un lenguaje de programacin que en conjunto
con sus herramientas se adapta firmemente al desarrollo del proyecto por lo que se ha
decidido su utilizacin para el desarrollo del sistema.
48
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Sistemas Operativos
1.65%
3.41%
2.16%
8.90% Windows 7
Mac OS X
Ubuntu 11.10
45.06%
Mint 12
20.15%
OpenSUSE 12.1
Chrome OS
Fedora 16
18.66%
Para guardar la base de conocimiento y los registros de los diferentes usuarios que ingresarn y harn
uso del sistema se usar una base de datos por lo cual se evalan las siguientes opciones:
SGBD Caractersticas
SQL Server Funciona nicamente sobre Microsoft Windows. Tiene licencia privativa.
Tiene soporte de transacciones, es escalable estable y seguro.
Da soporte a Stored Procedures.
Incluye un potente entorno grfico de desarrollo.
Una desventaja es que nicamente la versin Enterprise maneja compresin de
datos.
MySQL Es software libre en un esquema de licenciamiento dual.
Multiplataforma, multihilo y multiusuario.
Es desarrollado por Oracle.
Oracle Database Es desarrollado por Oracle, se le considera como uno de los sistemas gestores
de bases de datos ms completos, ya que soporta transacciones, es estable,
escalable y multiplataforma. Licencia privativa.
PostgreSQL Es de cdigo abierto, la desventaja es que consume una gran cantidad de
recursos, adems que es ms lento al momento de ejecutar consultas.
49
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Hardware
Tomando en cuenta que se emplear Windows 7 Professional, los requisitos mnimos de hardware
son los siguientes:
a) Procesador a 2 GHz
b) 2 GB de memoria RAM
c) Disco Duro de 160 GB
d) Monitor con resolucin de 800x600
Modelo de Procesos
La Figura 13 muestra la manera en la que el sistema operar, es decir el flujo entre los procesos y las
acciones que realiza nuestro sistema en un modo general.
50
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
6.5 Valoracin de alternativas
Aqu se presenta un anlisis de diagnstico que permite evaluar el impacto de aplicacin de cada
alternativa. Las tareas propuestas por la metodologa son las siguientes:
1) Estudio de la inversin
2) Estudio de los riesgos
3) Planificacin de las alternativas
51
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Estudio de los riesgos
Para cada alternativa se seleccionan los factores de situacin que habr que considerar, relativos
tanto a la incertidumbre como a la complejidad del sistema. Se identifican y valoran los riesgos
asociados y se determinan las medidas a tomar para minimizarlos. A continuacin, se muestra en una
tabla el anlisis de riesgos.
52
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Que un integrante quede Alto Que cada uno apruebe sus materias
fuera de reglamento. debidamente.
Validacin de los Que al momento de Medio Se realizarn pruebas con diversas
datos y pruebas clasificar la informacin personas de distintos perfiles, para
obtengamos resultados validar los resultados del sistema.
errneos Se contar con el apoyo de un
mdico.
Directores de TT Que por causas de fuerza Alto Se tendr una constante
mayor se pierda el contacto comunicacin con ambos
con algn director. directores.
Tras haber analizado todas las alternativas de solucin y tomando en cuenta el convenio entre el
Instituto y Microsoft (MSDNAA), y sabiendo que el uso de las herramientas de desarrollo y sistema
operativo de Microsoft no genera costo alguno, y no se viola ninguna licencia ya que el Trabajo
Terminal que se desarrollar no es para uso comercial se ha decidido la siguiente alternativa de
solucin:
53
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Consumo de cartuchos de tinta: uno cada
cuatro meses (con un precio aproximado de
$350).
Otros (plumas, lpices, etc.)
Aprobacin de la solucin.
Tras reunirse con los directores del presente Trabajo Terminal, se lleg a la aprobacin de las
herramientas y tecnologas propuestas en este Estudio de Viabilidad del Sistema.
Participantes del proceso EVS
EVS Actividad
EVS 1 EVS 2 EVS 3 EVS 4 EVS 5 EVS 6
Analistas X X X X X X
Diseadores X X
Directores X X X
Jefe de X X X X X X
proyecto
Tabla 11 Participantes en las actividades del proceso EVS
La Tabla 11 muestra los Participantes en cada una de las actividades del proceso EVS
Actividades
a) EVS 1 Establecimiento del alcance del sistema
b) EVS 2 Estudio de la situacin actual
c) EVS 3 Definicin de requerimientos del sistema
d) EVS 4 Estudio de alternativas de solucin
e) EVS 5 Valoracin de las alternativas
f) EVS 6 Seleccin de la solucin
54
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Despus de haber llevado a cabo los pasos que nos indica Mtrica v3 para el desarrollo del Estudio de
Viabilidad del Sistema, y de mltiples reuniones con los Directores del Trabajo Terminal, se han
definido las caractersticas que tendr el sistema, de la misma forma las herramientas y tecnologas
con las que se desarrollar.
De esta manera se da por concluido este captulo y el proyecto se considera viable desde el punto de
vista tcnico y operativo.
55
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 7 Anlisis del sistema de informacin (ASI)
7.1 Introduccin
En el presente capitulo se documentar el anlisis detallado de los requerimientos del sistema de
informacin para su posterior desarrollo.
Debido a que los paradigmas a aplicar son el Orientado a Objetos y el estructurado, se realiza la
correspondiente adaptacin a las directrices de la metodologa para la aplicacin de las tcnicas
adecuadas. Las actividades en este proceso son:
LA Figura 14 muestra la relacin de actividades del proceso de Anlisis del Sistema de Informacin,
tanto para desarrollos estructurados como para desarrollos orientados a objetos, distinguiendo las
que se pueden realizar en paralelo de aquellas que han de realizarse secuencialmente.
Cabe mencionar que en el presente trabajo se har uso del desarrollo Orientado a Objetos.
Para poder llevar a cabo estas actividades, es necesario ejecutar las siguientes tareas:
56
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
a) Obtencin de requerimientos
b) Especificaciones de Casos de Uso
c) Anlisis de requerimientos
d) Validacin de requerimientos
57
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Para llevar a cabo dicha actividad se deber:
58
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Reglas de Negocio
RN17 Definicin Las preguntas de los test, siempre tendrn respuesta, pueden ser de opcin
mltiple, o de rangos a elegir.
RN6 Definicin El correo electrnico ser el nombre de usuario para el acceso al sistema.
RN11 Definicin Para el cambio de contrasea se solicitar la actual y la nueva contrasea que
desee el usuario.
RN13 Definicin El sistema tendr una interfaz grfica, a la cual se acceder por medio de un
navegador web.
RN12 Restriccin Los tests debern tener un identificador para manejo interno.
RN15 Restriccin Para hacer uso del sistema es necesario estar registrado y haber iniciado sesin.
RN16 Restriccin El usuario deber contestar obligatoriamente todas las preguntas que se le
presenten en un test.
RN9 Observacin Si el usuario desea dar de baja su cuenta, se le solicitar su contrasea para tal
accin.
RN14 Observacin El sistema contar con un manual de ayuda para facilitar el uso del sistema.
Tabla 13 Reglas de negocio
59
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
7.3.4 Identificacin de los usuarios participantes y finales
En esta tarea se identificarn los distintos usuarios del sistema.
Usuario No Registrado:
Usuario Registrado:
Es el tipo de usuario ms comn dentro del sistema, que previamente se ha registrado para poder
tener acceso. Podr realizar los test, y al que se le generarn las sugerencias.
Administrador:
El usuario administrador es el que llevar el control del sistema: podr eliminar y modificar usuarios,
as como eliminar sus reportes generados.
7.4.1 Introduccin
En este apartado se muestran las principales necesidades de los usuarios las cuales debern ser
cumplidas por el sistema.
Requerimientos funcionales
60
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
proporcion en el momento del registro (perfil de usuario).
RFUR 4 Modificar datos El sistema permitir al usuario actualizar sus datos que
proporcion en el momento del registro.
RFUR 5 Restablecimiento El sistema permitir al usuario recuperar su contrasea en caso
de contrasea de haberla olvidado.
RFUR 6 Eleccin de El sistema contar con un men que permitir al usuario elegir
enfermedad una enfermedad para llevar a cabo el test.
RFUR 7 Realizar test. El sistema generar el test correspondiente que el usuario
deber realizar.
RFUR 8 Clasificacin de la El sistema deber procesar la informacin obtenida por el
informacin usuario (por medio del test) para clasificarla a travs de los
algoritmos correspondientes e indicar si es propenso a contraer
dicha enfermedad.
61
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Requerimientos no funcionales
El objetivo de esta tarea es especificar cada caso de uso identificado en la tarea anterior,
desarrollando el escenario.
62
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema permitir dar de alta un usuario el cual quedar registrado en
la base de datos, para ello deber proporcionar toda la informacin de
registro y aceptar los trminos y condiciones.
Atributos importantes
Id: CU1
Nombre: Registrar Usuario
Actores: Administrador, Usuario no registrado
Propsito: Dar de alta usuarios
Resumen: El sistema permitir dar de alta usuarios que no se encuentren
dentro de la base de datos.
Entradas: Datos completos del usuario.
Salidas: Posible mensaje de error
Precondiciones: Usuario no registrado
Postcondiciones: El usuario podr interactuar con el sistema.
Referencias: RN1, RN3, RN4, RN5, RN7, RN8, RFUNR1
Trayectorias
Trayectoria principal: Principal
1) El usuario ingresa al sistema
63
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Trayectorias
Trayectoria principal: Principal
1) El usuario Ingresa al sistema
64
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Trayectoria alternativa D: Verificar que el usuario este dado de alta en la base de datos
Condicin: El usuario debe cumplir con el Caso de Uso Registrar usuario.
65
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Propsito: Finalizar la actividad de una cuenta
Resumen: El sistema permitir finalizar la sesin.
Entradas: El usuario da clic en el botn cerrar sesin.
Salidas: Mensaje de confirmacin.
Precondiciones: El usuario debe haber iniciado sesin CU2
Postcondiciones: La sesin del usuario quedar cerrada.
Referencias: RFUR2, RN15
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Cerrar Sesin [Trayectoria A].
Descripcin completa El sistema le permitir al usuario visualizar sus datos cuando lo requiera.
Atributos importantes
Id: CU4
Nombre: Visualizar datos
Actores: Usuario registrado
Propsito: Consultar datos de un usuario registrado
Resumen: El sistema permitir al usuario visualizar los datos que proporcion
en el momento del registro
Entradas: Identificador del usuario para realizar bsqueda de sus datos
Salidas: Visualizacin de los datos del usuario
Precondiciones: Usuario registrado, Iniciar sesin
Postcondiciones: Tendr acceso a la visualizacin de sus datos.
Referencias: RN15, CU2, RFUR3
Trayectorias
66
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Trayectoria principal: Principal
1) Accede a ver informacin de perfil [Trayectoria A].
2) Busca al usuario dentro de la base de datos
3) Muestra la pagina Perfil del Usuario con los datos correspondientes
4) Fin de la trayectoria.
Trayectorias
Trayectoria principal: Principal
1) Eu usuario da clic el botn modificar datos [Trayectoria A].
67
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema permitir a los usuarios registrados que han olvidado su
contrasea restablecerla, respondiendo la pregunta secreta para validar
su identidad.
Atributos importantes
Id: CU6
Nombre: Restablecer contrasea
Actores: Usuario registrado
Propsito: Recuperar el acceso a la cuenta de un usuario que ha olvidado su
contrasea.
Resumen: El sistema permitir restablecer la contrasea.
Entradas: Correo electrnico, respuesta de la pregunta secreta, contrasea
nueva, confirmacin de la contrasea nueva.
Salidas: Posible mensaje de error
Precondiciones: Un correo electrnico que exista en la base de datos
Postcondiciones: Una nueva contrasea que cumpla con la RN7, la confirmacin de la
contrasea debe coincidir con el campo de nueva contrasea.
Referencias: RFUR 5, RN7
Trayectorias
Trayectoria principal: Principal.
1) El usuario ingresa al sistema.
68
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
11) Valida que la respuesta de la pregunta secreta coincida con la que tiene
previamente almacenada. [Trayectoria C].
12) Muestra la pgina con los campos para capturar la nueva contrasea y
la confirmacin.
13) Escribe una nueva contrasea.
14) Escribe la confirmacin de la contrasea.
15) Da clic en el botn Aceptar.
69
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
D1. Muestra cuadro de dilogo indicando que la nueva contrasea tiene un error.
D2. Da clic en el botn Aceptar.
D3. Regreso a la trayectoria principal paso 7.
Descripcin completa El sistema contar con un men donde se le permitir al usuario elegir
una enfermedad.
Atributos importantes
Id: CU7
Nombre: Elegir enfermedad
Actores: Usuario registrado
Propsito: Elegir una enfermedad
Resumen: El sistema le permitir al usuario elegir una de las enfermedades
disponibles.
Entradas: La enfermedad seleccionada
Salidas: La pgina del test de dicha enfermedad
Precondiciones: Usuario registrado, Iniciar sesin
Postcondiciones: El usuario podr realizar el correspondiente test
Referencias: RN15, RFUR6
Trayectorias
Trayectoria principal: Principal
1) Accede al men de seleccin de enfermedades. [Trayectoria A]
2) Muestra las opciones disponibles.
3) Selecciona la enfermedad.
70
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
4) Busca la enfermedad seleccionada en la base de datos.
5) Muestra la pgina del test correspondiente a la enfermedad
seleccionada.
6) Fin de la trayectoria.
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn contestar test
2) Muestra pgina del test correspondiente a la enfermedad.
3) Contesta las preguntas visualizadas en la pgina del test [Trayectoria A].
4) Da clic en el botn Siguiente
5) Valida la informacin introducida. [Trayectoria B]
6) Mensaje de confirmacin.
7) Fin de la trayectoria.
71
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
72
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Trayectorias
Trayectoria principal: Principal
1) Responde el test CU8
2) Muestra ventana de test contestado
3) Da clic en el botn Enviar Resultado.
4) Valida la informacin [Trayectoria A].
5) Procesa informacin.
6) Aplica algoritmo de clasificacin (rboles de decisin e ID3)
7) Obtiene resultado
8) Muestra pantalla con resultado obtenido previamente.
9) Fin de la trayectoria.
Descripcin completa El sistema permitir a los Usuarios Registrados que han obtenido un
resultado positivo en el test de la enfermedad seleccionada la
generacin de una lista de sugerencias, indicando lo que el usuario
puede hacer para reducir el riesgo de contraer la enfermedad.
Atributos importantes
Id: CU10
Nombre: Generar sugerencias
Actores: Usuario Registrado
Propsito: Generar sugerencias para intentar reducir el riesgo de contraer
dicha enfermedad.
Resumen: El sistema una vez que se ha contestado cualquier test y cuyo
resultado haya sido positivo, generar una lista de sugerencias con
modificaciones en el estilo de vida.
Entradas: Test completamente resuelto.
Salidas: Lista de sugerencias.
Precondiciones: El usuario debe haber iniciado sesin CU2, El usuario debe haber
contestado un test CU8, el resultado del test debe ser positivo.
Postcondiciones: Se generar la lista de sugerencias.
Referencias: RFUR9, CU2, CU8, RN15
73
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Generar Sugerencias.
Descripcin completa El sistema podr almacenar los resultados de cada test realizado por el
usuario.
Atributos importantes
Id: CU11
Nombre: Almacenar resultados
Actores: Usuario registrado
Propsito: Almacenar el resultado y las sugerencias acerca de la enfermedad
elegida para su posterior consulta
Resumen: El sistema tendr almacenada la informacin de los resultados y
sugerencias
Entradas: Resultado de clasificacin y sugerencias
Salidas: Informacin almacenada dentro de la base de datos
Precondiciones: Haber obtenido un resultado y sugerencias satisfactoriamente
Postcondiciones: El usuario tendr un historial de sus actividades para su posterior
consulta
Referencias: RN15, RFUR10
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Guardar Resultado [Trayectoria A].
74
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema permitir al usuario consultar los resultados los tests que
previamente ha contestado.
Atributos importantes
Id: CU12
Nombre: Consultar resultados previos
Actores: Usuario Registrado
Propsito: La opcin de visualizar los resultados y sugerencias previamente
obtenidos y almacenados en el historial
Resumen: El sistema permitir visualizar los resultados almacenados dentro
del historial de usuario
Entradas: Clic en los datos que desean visualizar
Salidas: Resultados y sugerencias que el usuario quiere consultar
Precondiciones: Haber realizado un test completamente para obtener un resultado
y sugerencias.
Postcondiciones: Los resultados y sugerencias que se desean consultar.
Referencias: RFUR 11, CU2, CU8, RN15
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Historial [Trayectoria A].
75
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema generar un archivo en formato PDF que contendr los datos
del usuario y el resultado obtenido (si es propenso o no a contraer dicha
enfermedad y las sugerencias para intentar evitar contraerla), dicho
archivo estar disponible para su descarga en cualquier momento.
Atributos importantes
Id: CU13
Nombre: Generar archivo de resultados
Actores: Usuario registrado
Propsito: Generar un archivo PDF con los resultados
Resumen: Crear un archivo PDF que contenga el resultado del test y sus
respectivas sugerencias.
Entradas: Resultados del test y las sugerencias generadas
Salidas: Archivo PDF
Precondiciones: Haber realizado test
Postcondiciones: Podr ver en su historial los resultados.
Referencias: RN12,RN13,RN15, RFUR13
Trayectorias
Trayectoria principal: Principal
1) Da clic en Generar PDF [Trayectoria A].
76
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Atributos importantes
Id: CU14
Nombre: Eliminar historial
Actores: Usuario Registrado
Propsito: Eliminar el historial de un usuario registrado.
Resumen: El usuario podr eliminar su historial si as lo desea
Entradas: Clic en el botn Eliminar Historial
Salidas: Mensaje de confirmacin
Precondiciones: Tener informacin dentro del historial
Postcondiciones: La informacin del historial ser eliminada de la BD
Referencias: RN15, RFUR14
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Historial [Trayectoria A].
77
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema permitir a los Usuarios Registrados la eliminacin de su
cuenta, borrndola dentro de la base de datos.
Atributos importantes
Id: CU15
Nombre: Eliminar cuenta
Actores: Usuario Registrado
Propsito: Eliminar una cuenta de la base de datos.
Resumen: El sistema permitir a los usuarios registrados eliminar su propia
cuenta.
Entradas: El usuario da clic en el botn eliminar cuenta.
Salidas: Mensaje de confirmacin.
Precondiciones: El usuario debe haber iniciado sesin CU2.
Postcondiciones: La cuenta del usuario quedar eliminada.
Referencias: RFUR 15, RN15
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Eliminar Cuenta [Trayectoria A].
78
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Atributos importantes
Id: CU16
Nombre: Dar de alta usuarios
Actores: Administrador
Propsito: Dar de alta un usuario
Resumen: Permitirle al administrador poder dar de alta usuarios en el
sistema.
Entradas: Los datos del usuario.
Salidas: Probable mensaje error, o de confirmacin.
Precondiciones: Administrador haya iniciado sesin
Postcondiciones: El usuario dado de alta podr interactuar con el sistema
Referencias: RN1,RN3,RN4,RN5,RN7,RN8,RN15
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Dar de Alta Usuario
6) Mensaje de confirmacin.
7) Fin de la trayectoria.
79
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Atributos importantes
Id: CU17
Nombre: Dar de baja usuarios
Actores: Administrador
Propsito: Dar de baja un usuario
Resumen: Permitirle al administrador poder dar de baja usuarios del sistema.
Entradas: El correo electrnico del usuario, o bien el indentificador.
Salidas: Probable mensaje error, o de confirmacin.
Precondiciones: Administrador haya iniciado sesin
Postcondiciones: El usuario ser eliminado de la base de datos del sistema.
Referencias: RFA2
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Dar de Baja Usuario
7) Mensaje de confirmacin.
8) Fin de la trayectoria.
80
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Condicin: El usuario dio clic en el botn cancelar, o en otro enlace diferente al de dar de baja.
A1. Da clic en el botn Cancelar u otro enlace distinto.
Atributos importantes
Id: CU18
Nombre: Modificar usuarios
Actores: Administrador
Propsito: Modificar libremente los datos del usuario.
Resumen: Permitirle al administrador modificar los datos de un usuario. Poder
restablecer contraseas.
Entradas: El correo electrnico del usuario o el identificador.
Salidas: Muestra de mensaje error o de confirmacin.
Precondiciones: Administrador haya iniciado sesin
Postcondiciones: Modificacin por parte del administrador en los datos del usuario
Referencias: RFA3
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Modificar Usuario.
81
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
82
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Descripcin completa El sistema permitir descargar el archivo generado con los resultados y
las sugerencias obtenidas.
Atributos importantes
Id: CU19
Nombre: Descargar archivo de resultados
Actores: Usuario registrado
Propsito: Descargar el archivo de resultados generados
Resumen: El sistema permitir a los usuarios registrados descargar el archivo
de resultados generados por la clasificacin de informacin
obtenida por medio del test
Entradas: El usuario da clic en el botn descargar archivo
Salidas: Archivo de resultados.
Precondiciones: El usuario debe haber contestado el test y enviar la informacin
para generar los resultados y el documento con los mismos.
Postcondiciones: El usuario tendr el documento de sus resultados en su equipo.
Referencias: RFUR 13, RN15
Trayectorias
Trayectoria principal: Principal
1) Da clic en el botn Descargar archivo.
83
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
a) Usuario
b) Usuario registrado
c) Administrador
d) Conexin BD
e) GUI
f) Test
g) Enfermedad
h) Clasificacin
i) rbol de decisin
j) Nodo
k) Historial
La Figura 15 muestra el diagrama de clases, en el cuela se puede observar la interaccin entre ellas.
84
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
85
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
En este apartado se muestra las imgenes de los prototipos de las interfaces con las que el
usuarriopodr interactuar con el sistema.
86
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Inicio del Sistema
87
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Registro de Usuario
Casos de uso: CU1
Descripcin: Muestra el formulario que solicita al usuario los datos necesarios para poder crear su
cuenta dentro del sistema.
88
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Restablecer Contrasea I
Restablecer Contrasea II
89
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Salidas:
Pregunta secreta del usuario
Entradas:
Respuesta secreta
Comandos:
Restablecer: verifica que la respuesta del usuario coincida con la almacenada en el sistema, si
coinciden muestra el siguiente paso en la pgina de Restablecer contrasea III de lo contrario
despliega el mensaje de error y muestra la misma pgina.
Perfil de Usuario
90
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Eliminar Cuenta
91
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Comandos
Si: elimina la cuenta del usuario. Muestra la pgina de Inicio del sistema.
No: cancela la accin y muestra la pgina de Perfil de usuario.
Modificar Datos
92
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Cambiar Contrasea
Seleccin de enfermedad
93
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Salidas:
Opciones de enfermedad
Entradas:
Enfermedad
Comandos:
Elegir: muestra al usuario la pgina del Test correspondiente.
Test
Visualizar historial
94
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Eliminar historial
Casos de uso: CU12, CU14
Descripcin: Se le permitir al usuario seleccionar los test que desee eliminar.
95
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 8 Diseo del sistema de informacin (DSI)
El objetivo del proceso de Diseo del Sistema de Informacin (DSI) es la definicin de la arquitectura
del sistema y del entorno tecnolgico que le va a dar soporte, junto con la especificacin detallada de
los componentes del sistema de informacin.
96
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
8.1 Definicin de la arquitectura del sistema
Dentro de la presente actividad se identifican los componentes de diseo de la arquitectura de los
subsistemas especficos y los de soporte; en trminos fsicos y lgicos; junto a la descripcin de la
infraestructura tecnolgica.
8.1.1 Arquitectura
En la figura siguiente se muestra una representacin esquemtica del sistema en funcin de las capas
que lo componen:
En la Figura 32 se muestra los componentes del sistema por cada una de las capas.
97
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
98
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
8.1.3 Especificacin de Excepciones
Las excepciones son situaciones que presentan un funcionamiento secundario, un comportamiento
fuera de lo habitual que no se espera que suceda en la ejecucin del sistema, sin embargo es
oportuno considerar las respuestas que se pueden dar a dichas situaciones.
99
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
100
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
101
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
102
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
CU1 - Registrar Usuario
103
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
104
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
105
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
106
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
107
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
CU14 - Eliminar Historial
108
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
CU16 - Dar de Alta Usuarios
109
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
CU18 - Modificar Usuarios
110
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
CU19 Descargar archivo de resultados
111
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
112
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
113
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
8.4 Diseo fsico de los datos
El sistema contar con dos Bases de Datos:
Relacin: USUARIO
Descripcin: Almacena todos los datos relevantes del usuario, si se trata del
administrador el campo admin toma el valor 1.
Campo: Tipo de dato Longitud Constraint Null
idUsuario INT PRIMARY KEY NO
nombre VARCHAR 50 NO
apellidos VARCHAR 50 NO
email VARCHAR 50 NO
sexo VARCHAR 1 NO
fechaNacimiento DATE NO
contrasena VARCHAR 16 NO
admin BOOL NO
Relacin: TEST
Descripcin: Almacena la fecha y hora en que se realiz el test y quin lo hizo.
114
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Campo: Tipo de dato Longitud Constraint Null
idTest INT PRIMARY KEY NO
idUsuario INT FOREIGN KEY NO
Relacin: RESPUESTA
Descripcin: Guarda la respuesta que hizo el usuario a cada pregunta.
Campo: Tipo de dato Longitud Constraint Null
idRespuesta INT PRIMARY KEY NO
respuesta VARCHAR 128 NO
idTest INT FOREIGN KEY NO
idPregunta INT FOREIGN KEY NO
Relacin: PREGUNTA
Descripcin: Almacena las preguntas correspondientes al test de una
enfermedad.
Campo: Tipo de dato Longitud Constraint Null
idPregunta INT PRIMARY KEY NO
pregunta VARCHAR 128 NO
idEnfermedad INT FOREIGN KEY NO
Relacin: ENFERMEDAD
Descripcin: Almacena los nombres y descripcin de las enfermedades.
Campo: Tipo de dato Longitud Constraint Null
idEnfermedad INT PRIMARY KEY NO
nombre VARCHAR 50 NO
descripcion VARCHAR 1024 NO
Relacin: RESULTADO
Descripcin: Almacena el resultado obtenido en el test contestado por el usuario,
el atributo clasificacion toma valor 1 si es positivo o 0 cero si es
negativo.
Campo: Tipo de dato Longitud Constraint Null
idResultado INT PRIMARY KEY NO
hora TIME NO
fecha DATE NO
clasificacion BOOL NO
rutaReporte VARCHAR 128 NO
idTest INT FOREIGN KEY NO
115
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Relacin: RESULTADO_SUGERENCIA
Descripcin: Es una tabla intermedia resultante de la relacin muchos a muchos de la
tabla RESULTADO con SUGERENCIA.
Campo: Tipo de dato Longitud Constraint Null
idResultado INT PRIMARY KEY, FOREIGN KEY NO
idSugerencia INT PRIMARY KEY, FOREIGN KEY NO
Relacin: SUGERENCIA
Descripcin: Almacena las sugerencias asociadas a un resultado.
Campo: Tipo de dato Longitud Constraint Null
idSugerencia INT PRIMARY KEY NO
sugerencia VARCHAR 128 NO
Para la BD BASE_CONOCIMIENTO, se emplearn 3 tablas:
1. Cncer
2. Diabetes
3. Obesidad
La base de datos para la diabetes mellitus se obtuvo del estudio realizado por el Departamento de
Medicina de la Escuela de Medicina en la Universidad de Virginia. [12].
Relacin: DIABETES
Descripcin: Almacena el conocimiento de la enfermedad
Campo: Tipo de dato Longitud Constraint Null
id INT PRIMARY KEY NO
chol DOUBLE SI
stab.glu DOUBLE NO
hdl DOUBLE SI
ratio DOUBLE SI
glyhb DOUBLE SI
location INT NO
age DOUBLE NO
gender INT NO
height DOUBLE SI
weight DOUBLE SI
frame INT SI
bp.1s DOUBLE SI
bp.1d DOUBLE SI
bp.2s DOUBLE SI
bp.2d DOUBLE SI
waist DOUBLE SI
hip DOUBLE SI
time.ppn DOUBLE SI
116
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 9 Construccin del Sistema de Informacin (CSI)
9.1 Introduccin
La construccin del SI tiene como objetivo final la construccin y prueba de los distintos componentes
del SI, a partir de las especificaciones hechas el Diseo del SI.
En este proceso se genera el cdigo de los componentes del Sistema de Informacin, as como el
manual de usuario final del SI, todo esto con el objetivo de asegurar el correcto funcionamiento del
Sistema antes de pasar a la implantacin.
Para ello se realizan diferentes pruebas, como las unitarias, las de integracin y las de sistema.
La Figura 54 muestra las actividades que la metodologa de Mtrica 3 plantea para esta etapa.
En el siguiente captulo se describen las caractersticas y los productos de cada actividad. Aunque no
todas aplican en la realizacin de este SI, debido a la naturaleza del mismo.
117
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
9.2 Actividades del proceso de construccin del SI
Bsicamente es preparar todos los recursos necesarios para codificar y despus elaborar las pruebas,
la disponibilidad de dicho entorno, de los datos, y de las dems herramientas involucradas.
118
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Esta actividad se realiza en paralelo a las actividades de generacin de cdigo de los componentes
procedimientos y ejecucin de las pruebas unitarias.
Se verifica el correcto funcionamiento de las interfaces existentes entre los distintos componentes.
Se comprueba la integracin de todos los componentes (o subsistemas) del SI. Se efecta el anlisis y
la evaluacin de los resultados obtenidos.
Los requisitos de documentacin especifican aspectos relativos a los tipos de documentos a elaborar
y estndares a seguir en la generacin de los mismos:
Formato y soporte en que se desarrollarn
Estructura
Distribucin y mantenimiento de la documentacin.
Hay que tener en cuenta las caractersticas funcionales y tcnicas propias del Sise define el contenido
de la formacin del usuario final del sistema.
119
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
9.3 Preparacin del entorno
Para realizar la construccin del SI se requiere de:
Estas son las herramientas que nos permitirn el desarrollo, codificacin y pruebas del SI.
La mayor parte del tiempo de desarrollo del SI fue dentro de las instalaciones de la Escuela Superior
de Cmputo, pues no proveo de una sala con los servicios de electricidad, internet, y mobiliario.
Base de datos del sistema: que es la que contiene toda la informacin necesaria para el
funcionamiento del sistema. Los datos de los usuarios, los test realizados, las preguntas y sugerencias
para cada una de las enfermedades. El diagrama relacional de esta BD se muestra en la figura 55.
Base de datos de conocimiento: contiene tres tablas, una para cada enfermedad, contiene los
registros de las personas previamente diagnosticadas en dicho padecimiento, en base a ellas se
genera el rbol de decisin haciendo uso del algoritmo ID3. El diagrama relacional de esta BD se
muestra en la figura 56.
En esta BD tambin se encuentran las tablas que contienen las ramificaciones de cada uno de
los rboles de decisin generados por el algoritmo ID3.
120
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
121
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
9.3.2 BD diabetes
La base de datos para la diabetes mellitus se obtuvo del estudio realizado por el Departamento de
Medicina de la Escuela de Medicina en la Universidad de Virginia. [12]
Esta BD viene en valores continuos, sin embargo, para el funcionamiento del algoritmo seleccionado
se discretizaron los valores para los atributos.
En la tabla 18 se muestra la descripcin de los atributos, los valores que estos pueden tomar, y su
descripcin. Esto nos ayuda a generar el cuestionario que se le plantear al usuario.
122
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
1 = pre-hipertenso Pre hipertensin: 120-139 / 80-90
2 = hipertenso Hipertensin: 140-160 / 90-100
ICC El icc es el ndice cintura/cadera. Es la relacin entre la circunferencia
ICC=(cintura/cadera)*100 de la cintura y la cadera de una
0 = bajo (hombre icc<78 mujer icc<71) persona. Los rangos varan entre
1 = normal (hombre icc>=78 && icc<=93 mujer hombres y mujeres.
icc>=71 && icc <=84)
2 = grande (hombre icc>93 mujer icc>84)
Clasificacin 0 = No le dio diabetes
1 = S le dio diabetes
Tabla 18 Atributos de la BD diabetes
Esta BD fue construida con ayuda mdica de doctores de la Escuela Superior de Medicina del IPN la
cual cuenta con un total de 149 registros, 97 de clase 0 y 52 de clase 1.
En la tabla 19 se muestra la descripcin de los atributos, los valores que estos pueden tomar, y su
descripcin. Esto nos ayuda a generar el cuestionario que se le plantear al usuario.
123
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
da Actividad moderada: 4 a 5 das
2 = alta ms de una hora al da por semana.
Actividad alta: 6 o ms das por
semana.
Tabaquismo 0 = no
1 = fumador
Incidencia_familiar 0 = no tiene familiares directos con cncer
colorrectal
1 = s tiene familiares directos que han o
padecen cncer colorrectal
Clasificacin 0 = no desarroll cncer colorrectal
1 = si lo desarroll
Tabla 19 Atributos de la BD de cncer colorrectal
9.3.4 BD obesidad
Esta BD fue construida con ayuda mdica de doctores de la Escuela Superior de Medicina del IPN, de
doctores particulares, as como allegados a los integrantes del equipo que estudian medicina y
enfermera, sta cuenta con un total de 340 registros, 163 de clase 0 y 177 de clase 1.
En la tabla 19 se muestra la descripcin de los atributos, los valores que estos pueden tomar, y su
descripcin. Esto nos ayuda a generar el cuestionario que se le plantear al usuario.
124
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
pueden disminuir la velocidad en
la que el cuerpo quema caloras,
aumentar el apetito o hacer que
el cuerpo retenga ms agua.
Estrs 0 = bajos o nulos niveles de estrs Las tensiones sociales, como las
1 = altos niveles de estrs de hablar en pblico, enfrentarse
a los exmenes, afrontar arduas
jornadas de trabajo entre otras,
pueden incurrir en la ingesta
excesiva de comida y el aumento
de peso
Clasificacin 0 = no es factible el desarrollo de obesidad en este
paciente
1 = si es factible, o incluso ya tiene obesidad o
sobre peso, y tiende a amentar an ms de peso.
Tabla 20 Atributos de la BD obesidad
*Interfaces de usuario
*Generacin de reglas de decisin (Algoritmo ID3)
*Generacin de reportes (PDF)
*Default.aspx
*Registro.aspx
*Password.aspx
*Inicio.aspx
*Perfil.aspx
*Eliminar.aspx
*Enfermedades.aspx
*Diabetes.aspx
*Cancer.aspx
*Obesidad.aspx
*Historial.aspx
*RestablecerPass.aspx
*Privacidad
125
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
*Trminos
*ASP
*HTML
*CSS
*JavaScript
*jQuery
*Ajax
Dado que el SI es un sitio web, se utilizaron plugins de jQuery que permiten el dimensionamiento de
las vistas en dispositivos mviles (IOs,Android).
126
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
La interfaz de las pginas web del sistema se adaptan al tamao del ancho del dispositivo en el que se
visualice, lo que permite que un usuario pueda acceder al SI desde un telfono inteligente con
conexin a internet (IOs, Android, Windows Phone).
En las siguientes imgenes se muestra las pantallas de las interfaces tales como:
*Formulario de registro
*Formulario de acceso al SI (login)
*Men del usuario
*Perfil (ver/modificar datos, cambiar contrasea)
127
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
128
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
129
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
130
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
131
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
132
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
de los datos de entrada (el test realizado por el usuario previamente), y finalmente indicar un
resultado que quedar almacenado dentro de la base de datos.
Para la elaboracin del algoritmo se hizo uso del lenguaje de programacin C# y la herramienta Visual
Studio 2010 de Microsoft.
La idea principal para la elaboracin del ID3 fue la elaboracin de objetos que trabajen como los
nodos del rbol y apuntadores a dichos objetos que trabajen como ramas, sin embargo para los nodos
hijo se tomo en cuenta un apuntador a siguiente como se muestra en la figura 70 ya que un nodo
puede llegar a tener n hijos.
Apuntador siguiente
Nodo
Se realizaron 3 tres clases la clase NodoArbol cuyo funcionamiento es que cada instancia de esta clase
trabaje como los nodos del rbol de decisin.
La clase rbol que se encargar de conjuntar los nodos por medio de ramas para la formacin fsica del
rbol. Esta clase depende de la clase NodoArbol para la creacin del rbol de decisin y los mtodos
133
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
de dicha clase son las que se encargan de agregar y acomodar los nodos dependiendo de cmo se
requiere que se implemente.
La clase ID3 puede considerarse la clase ms importante de todo el sistema ya que es aquella que se
encarga de leer la base de datos de conocimiento y por medio de las ecuaciones del algoritmo ID3
obtiene y construye el rbol de decisin el cual es fundamental para el sistema.
Al implementar el algoritmo ID3 con las bases de conocimiento de cada enfermedad, se obtuvieron
los siguientes resultados, para cada rbol de decisin generado por el mdulo.
134
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
rbol de decisin Diabetes Mellitus tipo 2
135
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
rbol de decisin Cncer colorrectal
136
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
rbol de decisinObesidad
imc = imc_bajo_peso | ingesta_calorica = calorias_baja: no
| ingesta_calorica = calorias_baja: no | ingesta_calorica = calorias_alta: si
| ingesta_calorica = calorias_alta | ingesta_calorica = calorias_normal
| | edad = edad_mayor | | actividad_fisica = actividad_alta: no
| | | estres = con_estres | | actividad_fisica = actividad_normal
| | | | actividad_fisica = actividad_alta: no | | | estres = con_estres
| | | | actividad_fisica = | | | | edad = edad_mayor: si
actividad_normal: si | | | | edad = edad_joven
| | | | actividad_fisica = actividad_nula: si | | | | | farmacos = no_farmacos: no
| | | estres = sin_estres: no | | | | | farmacos = si_farmacos: si
| | edad = edad_joven: no | | | | edad = edad_adulto: si
| | edad = edad_adulto: no | | | estres = sin_estres: no
| ingesta_calorica = calorias_normal: no | | actividad_fisica = actividad_nula: si
imc = imc_normal imc = imc_sobrepeso: si
En este mdulo empleamos la librera PDFSharp que nos permite la generacin de PDFs a partir de
Strings de texto, esta clase recibe como parmetro el identificador del test, y verificando las
respuestas del usuario construye la lista de sugerencias, las cuales estn almacenadas en la tabla
SUGERENCIA de la base de datos, una vez que se tiene el String con todas las sugerencias se imprimen
en el PDF, al igual que la imagen de fondo.
137
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
El mdulo de generacin de PDF se prob solo con la conexin a la BD. Se diseo el formato del
reporte generado, el cual, por facilidad es una imagen de fondo, en la cual solo se incrusta el texto
indicado.
El mdulo de generacin de reglas de decisin de igual manera se prob nicamente con la conexin
a la base de datos.
138
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
9.5.2 Pruebas mdicas
Se realizaron con ayuda mdica pruebas a pacientes de diferentes rangos de edad y de ambos
gneros.
Fueron 5 pruebas por cada enfermedad de las cuales se compararon los resultados obtenidos del
sistema contra la valoracin mdica, dichos datos se muestran en las siguientes tablas.
139
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Los resultados del mdulo generador de decisiones, es decir los rboles, se carg la BD para facilitar
su uso, y el encontrar un resultado.
Para la funcionalidad de los tests, se hicieron todas las validaciones posibles para los valores
recabados en las preguntas de las enfermedades.
140
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
9.9 Usuarios finales
Dadas las caractersticas del SI desarrollado, se ha planteado para que cualquier persona que cuente
con los conocimientos bsicos de computacin y navegacin en internet pueda usarlo.
El SI ser accesible desde una pgina web, sin importar el sistema operativo que el usuario maneje
(Windows, MAC, Linux, etc) y el navegador web que utilice (IE, Chrome, Firefox, Safari, Opera).
Inclusive si lo visualiza desde un dispositivo mvil (IOS, Android, Windows Phone).
El usuario deber tener en consideracin que al hacer uso del SI se necesitarn algunos datos como:
*Correo electrnico
*Datos personales
*Perfil medico bsico (edad, peso, estatura, IMC)
Lo anterior es lo fundamental para que el usuario pueda acceder al SI, tener su cuenta y as disfrutar
de los servicios que brinda.
141
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Captulo 10 Implantacin y aceptacin del sistema (IAS)
10.1 Introduccin
Este proceso tiene como objetivo principal la entrega y aceptacin del sistema en su totalidad.
Las pruebas de implantacin cubren un rango muy amplio, que va desde la comprobacin de
cualquier detalle de diseo interno hasta aspectos tales como las comunicaciones. Se debe
comprobar que el sistema se ajusta a los tiempos de respuesta deseados.
La Mtrica 3 plantea 10 actividades para esta etapa, sin embargo no todas aplican en la realizacin de
este proyecto pues no haremos mantenimiento ni produccin del SI.
a) Forzar el fallo del sistema y verificar si la recuperacin se lleva a cabo de forma apropiada.
b) Seguridad, verificando que los mecanismos de proteccin del sistema cumplen su objetivo.
c) Rendimiento, probando el sistema en cuanto a tiempo de respuesta de ejecucin.
Se genera un informe que contenga la desviacin de los resultados, conforme a los requisitos
establecidos, as como los problemas que queden sin resolver.
142
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
En general son pruebas realizadas por los usuarios finales, se deben plantear todas las deficiencias o
errores que se encuentren, antes de dar por aprobado el SI definitivamente.
Se genera un informe que contenga la desviacin de los resultados, conforme a los requisitos
establecidos, as como los problemas que queden sin resolver.
La cual ofrece paquetes con ciertas tecnologas y herramientas, que se adaptan a las necesidades del
proyecto del cliente. Para nuestro caso optamos por el plan e-Basic plus pues cumple con los
requerimientos que se dieron en la construccin del SI.
143
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
10.4 Pruebas de implantacin
Hasta antes de este punto todos los archivos del proyecto, la Base de Datos y dems componentes, se
trabajaron localmente, sin embargo para la implantacin en lnea del SI, los archivos fueron puestos
en el servidor.
En el caso de SQLServer 2008, permite trabajar con BD alojadas en servidores remotos por medio de
una conexin a Internet.
En la Figura 78 se observa la forma en que el SGBD permite conectarse con un servidor web remoto.
Los datos de acceso necesarios son el nombre del servidor, que es el que proporciona la compaa de
hosting, en este caso es mssql.sinbugs.com.mx y para la autenticacin se requieren el nombre de
usuario y contrasea del administrador del dominio contratado.
144
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Tambin se les dio a prueba a varios usuarios con conocimientos informticos bsicos, y se hizo una
retroalimentacin con sus observaciones, las cuales no implicaban mayores cambios al sistema.
Colocar el algoritmo que genera el rbol de decisin en un servicio web para poder generar
rboles de decisin de ms enfermedades.
Agregar ms enfermedades al sistema.
Realizar una interfaz web que permita cargar las nuevas enfermedades.
Crear tipos de usuario, es decir, poder tener usuarios mdicos que realicen el seguimiento de
los tests que los usuarios contestan.
Permitirle al usuario descargar toda su informacin cuando decida eliminar su cuenta.
Otro punto muy importante que se puede incluir en el presente trabajo es la opcin de
ampliar los cuestionarios correspondientes a las enfermedades (cncer, diabetes y obesidad)
referente al estilo de vida que lleva el usuario, para que de esta manera pueda obtener ms
informacin de cmo es que debe cuidar de si mismo para evitar contraer las enfermedades,
esto es porque pueden existir muchos ms factores de riesgo que implique una mejor y ms
acertada respuesta (esto ya vindolo desde un entorno ms tcnico a la hora de aplicar el
algoritmo).
145
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Conclusiones
La realizacin del presente trabajo involucr la mayor parte de los conocimientos desarrollados
durante todos los semestres de la carrera, en la etapa de la Planificacin del Sistema de Informacin
tuvimos que cronometrar correctamente los tiempos para llegar a terminar el sistema, comenzar a ir
a la Escuela Superior de Medicina de Instituto Politcnico Nacional para pedir el apoyo y la
informacin que requeramos para desarrollar el sistema.
En el Estudio de Viabilidad del Sistema tuvimos un debate sobre la eleccin del lenguaje de
programacin, y posteriormente elegir el IDE de desarrollo, resultando Visual Studio el ms apto,
debido a que es ms rpido trabajando con algoritmos de Inteligencia Artificial comparado con Java,
debido a su mquina virtual, al haber elegido Visual Studio por consiguiente tambin elegimos
Microsoft Windows como plataforma de desarrollo e implementacin, de igual manera en esta etapa
decidimos que lo mejor era realizar un sistema web, debido a que es una herramienta que le permite
a la gente realizar cambios en su salud, entonces lo mejor era ponerlo abierto para todas las personas
que tuvieran computadora con conexin a internet.
En el Diseo del Sistema de Informacin diseamos las clases que nuestro sistema ocupa, la
arquitectura del mismo, tambin sus diagramas de mquina de estados, los cuales son muy
importantes cuando ya se va a construir el sistema. Durante la Construccin del Sistema de
Informacin fue cuando vimos que tan bien planificamos y diseamos el sistema, tambin nos
enfrentamos al reto de que no todos los integrantes del equipo tenan conocimientos de C#, pero al
ser un lenguaje orientado a objetos, no les fue tan complicado adaptarse a este lenguaje de
programacin.
A esta altura del proyecto se tenan problemas para la recoleccin de las bases de datos de
conocimientos, obtener la base de conocimientos de diabetes fue relativamente sencillo, ya que es
una enfermedad de la que hay mucha informacin en internet, y tambin hay muchas bases de datos
de la misma en la web que han sido donadas por diversas instituciones de varias partes del mundo; el
reto estuvo en conseguir las bases de conocimiento referentes a Cncer Colorrectal y Obesidad, ya
que esto requiri un trabajo interdisciplinario entre los integrantes del equipo y diversos
profesionistas del rea mdica, al igual que mucho tiempo y reuniones para recabar la informacin.
Consideramos que el trabajo interdisciplinario es bastante difcil, sobretodo para los estudiantes de
Ingeniera o Matemticas, pero creemos que uno de los objetivos del TT es esto; lograr la efectiva
comunicacin y trabajo mutuo entre diferentes disciplinas, ya que constituye una prctica para
cuando nos incorporemos al mercado laboral prximamente.
El desarrollo de las interfaces grficas constituye otro gran reto para los Ingenieros en Sistemas,
debido a que el usuario siempre espera que esta sea lo ms sencilla posible y que se comporte como
146
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
l quiere, tambin de una forma totalmente transparente para el usuario, y esta vez al tratarse de un
sistema web, la interfaz de igual forma tiene que adaptarse a la variedad de dispositivos mviles y de
escritorio que hoy en da existen, por ese motivo nuestra interfaz grfica fue creada tomando en
cuenta las necesidades de portabilidad del usuario actual ofreciendo el mismo rendimiento y
funcionalidad tanto en la interfaz de escritorio como el la mvil, que a fin de cuentas es la misma,
pero con ayuda de la librera de java script JQuery logramos adaptarla a todos los tamaos de
pantalla actuales, tanto dispositivos iOS, como dispositivos Android, e incluso computadoras de
escritorio con pantallas relativamente grandes que ronden las 21 pulgadas o ms.
En la Implantacin y Aceptacin del Sistema tuvimos que validar que todo lo que habamos hecho en
etapas anteriores cumpla con las normas, requerimientos funcionales, no funcionales, que nuestro
clasificador era eficiente y que tenia un porcentaje de error relativamente bajo, e incluso que
cumplamos las expectativas del usuario.
Durante todo este ao de trabajo sentimos que cubrimos con los objetivos generales y especficos
que planteamos en el protocolo, pero tambin sabemos que podrn haber siempre ms cosas que se
le puedan agregar a nuestro sistema, estas estn especificadas en la seccin trabajo a futuro de este
documento y no son limitativas.
147
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Anexos
Manual de Usuario
Primeros pasos
Vida Saludable es una herramienta en lnea que le permitir saber si Usted es propenso a padecer
Diabetes Mellitus Tipo 2, Cncer Colorrectal u Obesidad.
Para acceder a Vida Saludable Usted lo puede hacer desde su computadora o desde su dispositivo
mvil: tableta o smartphone. Tambin se requiere una conexin a internet y alguno de los siguientes
navegadores:
Ingresando al sistema
Para ingresar al sistema abra su navegador Web, y en la barra de direcciones teclee la siguiente
direccin y presione en ir:
sinbugs.com.mx/TT
148
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
En su computadora el sistema deber verse como la Imagen 1:
149
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Registrndose en el sistema
Antes de poder acceder a Vida Saludable Usted deber crear una cuenta. Para registrarse haga clic en
Registrarme (Imagen 3):
Imagen 3. Registro
150
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
5. Para seleccionar su fecha de nacimiento haga clic en la casilla correspondiente, y se le desplegar un
calendario (Imagen 5) dnde usted podr seleccionarla.
6. Ahora es el turno de ingresar su email, recuerde que debe ser vlido, ya que ser su nombre de usuario
para acceder posteriormente al sistema.
7. Confirme su email (Imagen 6).
8. En el caso de la contrasea deber ser de al menos 8 caracteres y mximo 16, de igual forma la deber
confirmar y finalmente presionar continuar (Imagen 7).
151
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Nota: En caso de que el correo electrnico ya est en uso, el sistema mostrar una notificacin
informndole que debe emplear otro, cmbielo y presione de nuevo en continuar.
Si su registro fue exitoso el sistema le mostrar una ventana de confirmacin, como en la Imagen 8.
Iniciando sesin
Ahora que ya se registr en Vida Saludable, podr ingresar con el email y contrasea que dio de alta
en su registro, si aun no se ha registrado vaya a la seccin Registrndose en el Sistema.
152
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
153
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Es la pantalla de bienvenida una vez que ha iniciado sesin en el sistema (Imagen 11).
154
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Pestaa Perfil
En esta seccin Usted puede cambiar la informacin bsica de su perfil, incluida su contrasea
(Imagen 12).
155
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Si desea cambiar su nombre, apellidos y/o fecha de nacimiento, simplemente haga clic en el dato que
desea cambiar (Imagen 13).
156
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Introduzca el nuevo dato, y haga clic en guardar, el sistema le mostrar una ventana indicndole que
se han hecho los cambios (Imagen 14).
157
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Para cambiar su contrasea en la pestaa de perfil haga clic en la flecha.
Se le pedir su contrasea actual, la nueva y su confirmacin, una vez que haya llenado todos los
campos haga clic en Guardar (Imagen 15). El sistema le mostrar una ventana indicndole que el
cambio de contrasea fue exitoso (Imagen 16).
158
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Pestaa Enfermedades
Esta es la seccin ms importante del sistema, en ella Usted podr contestar cualquiera de los 3 tests
que actualmente el sistema ofrece: Diabetes Mellitus Tipo 2, Cncer Colorrectal u Obesidad, y saber si
Usted es propenso(a) a padecer la enfermedad, obteniendo una serie de sugerencias para cuidar su
salud.
Para desplazarse entre las 3 enfermedades, simplemente haga clic en las flechas laterales.
159
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Diabetes Mellitus Tipo 2
Es la primer enfermedad que se le mostrar (Imagen 17, Imagen 19, Imagen 21).
Para contestar el test haga clic en Realizar test, y a continuacin las preguntas correspondientes al
mismo se le desplegarn (Imagen 18), una vez que haya contestado todas las preguntas haga clic en el
Botn.
160
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Cncer Colorrectal
Para contestar el test haga clic en Realizar test, y a continuacin las preguntas correspondientes al
mismo se le desplegarn (Imagen 20), una vez que haya contestado todas las preguntas haga clic en el
Botn.
161
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Obesidad
162
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Obtencin de sugerencias
163
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Historial
Si desea visualizar algn test que ya haya realizado previamente o borrarlo, vaya a Historial
Se le mostrar la informacin de los tests que ya haya realizado (Imagen 25), y podr verlos haciendo
164
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Botn Cerrar Sesin
Cuando desee salir del sistema simplemente haga clic en Cerrar Sesin, no olvide hacer esto, ya que
si deja su sesin abierta alguien ms podra ver sus datos.
Restablecer Contrasea
Eliminar su cuenta
Si desea eliminar su cuenta y toda la informacin relacionada con la misma, vaya a perfil, y seleccione
la opcin Eliminar Cuenta (Imagen 27).
165
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
166
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Haga clic en Eliminar Cuenta y se le mostrar un mensaje de confirmacin (Imagen 29), si en verdad
desea eliminar su cuenta haga clic en Aceptar.
167
Herramienta de apoyo en la prediccin de diabetes, cncer y obesidad en base al estilo de vida
TT2011-B014
Referencias
[1] Csar Prez, Daniel Santn, Data Mining, Primera edicin Alfa omega Group Editor Mxico julio
2006, 555 pgs.
[2] Instituto Nacional de Estadstica y Geografa. Mujeres y hombres en Mxico 2010, Mxico DF.
2010, Pg. 15.
[3] Giarratano Riley. Sistemas Expertos. Principios y Programacin. Tercera Edicin. Thomson
Learning. Pg. 58.
[4] C. G. Pablo et al. Sistema Mdico Experto para el diagnstico Y Control de Diabetes, IPN, Mxico
DF, 2004 Pg. 6.
[5] http://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/
[6] Minera de datos, FACENA-UNNE, Octubre 2003
*7+ http://www.qualitrain.com.mx/Blog/Page-5.html
*8+ http://www.programacion.com/java/articulo/
[9] Fayyad Usama, G. (1996). From Data Mining to Knowledge Discovery in Databases, Al Magazine,
37-54.
[10] Escolano Ruiz F., Carzola Quevedo M. ngel, Inteligencia Artificial: modelos, tcnicas y reas de
aplicacin. Thompson 2003, pg. 136-140
[11] http://www.genbeta.com/genbeta/mejor-sistema-operativo-de-2011-windows-7
[12] http://lib.stat.cmu.edu/S/Harrell/data/descriptions/diabetes.html
[13]Encuesta Nacional de Salud y Nutricin http://ensanut.insp.mx
[14] http://justindeveloper.wordpress.com/2008/10/21/introduccion-al-data-mining/
[15] http://oa.upm.es/1152/1/PFC_IVAN_ARRIBAS_LOPEZ.pdf
[16] http://www.uib.es/congres/ecopub/papers/edu3/Santin.pdf
[17] http://www2.itba.edu.ar/archivos/secciones/farach-tesisdemagister.pdf
[18] http://manuel.cillero.es/doc/metrica-3/introduccion/procesos-principales/psi
[19] Machine Learning , Tom M. Mitchell, Mc Graw Hill 1997
168