Está en la página 1de 3

INSTITUTO TECNOLÓGICO DEL

ISTMO
INGENIERÍA INFORMÁTICA

ASIGNATURA: MACHINE LEARNING

ESTUDIANTE: MARTIN DIAZ FLORES


No CONTROL: 17190813

DOCENTE: ALBERTO RAMIREZ REGALADO

SEMESTRE: 7°
GRUPO: “S”

HEROICA CIUDAD DE JUCHITÁN DE ZARAGOZA OAXACA.


A 22 DE SEPTIEMBRE DE 2022
Piensa en el siguiente problema: una empresa farmacéutica desea realizar una
aplicación para saber si es viable económicamente invertir en una
investigación para una vacuna en contra del dengue hemorrágico.
Siguiendo los 7 pasos para implementar ML, dictamina que harías en cada uno
de los pasos.

1. ¿De dónde obtendrías los datos? ¿Cómo le harías para recabar los
datos?
Para obtener los datos primero investigaría sobre cuáles son las vacunas que
ya existen y que en su momento se realizó una investigación para poder
crearlas, para ello primero buscaría datasets que tengan información sobre
los síntomas de la enfermedad y también la tasa de muertes de la
enfermedad, así como los casos positivos, al igual que las zonas con más
tasa de muertes, también el presupuesto con el que se contaba, el costo total
de la investigación para la vacuna, el costo de una vacuna, cantidad de
ventas promedio al año y por último si se tuvieron perdidas o ganancias en
el transcurso de tres años. Un dato extra seria hacer una encuesta a las
personas para saber si comprarían la vacuna sin importar el costo.

Si por alguna razón no encuentro datasets me pondría a buscar bases de


datos con precios razonables para no invertir demasiado en solo este
apartado; si no es viable comprar la base de datos lo mejor sería crear mi
propio dataset ajustando las características que necesito e investigar para
obtener la información que requiero. Además, podría intentar el método de
web scraping para obtener los datos de algún servicio que contenga
información que sea útil.
2. ¿Qué datos te serían útiles para conformar el dataset o database?
El dataset tendría las siguientes características (features).
• Vacuna (Enfermedad, Fecha de aparición, Casos positivos, Tasa de
muertes, Zonas mayor afectadas, Presupuesto Investigación, Costo
Investigación, Promedio de ventas al año, Ventas de tres años, Valió
La Pena Si/No)
3. ¿Qué modelo emplearías para resolver este problema?
Dado a que se están utilizando las etiquetas “Si” y “No” es claro que tenemos
un problema de clasificación y es este modelo el cual sería el más
conveniente utilizar.
4,5,6,7. ¿Qué tipo de respuesta esperas al final?
Primeramente, tendría que entrenar a la máquina, como se ha dicho con
anterioridad los registros mínimos para que nuestra maquina nos dé una
respuesta confiable es un mínimo de 1000 registros, así que nuestro dataset
debe contener registros suficientes para poder realizar la tarea de forma
correcta. En este caso el machine learning será supervisado porque yo estaría
verificando si se esta clasificando de manera correcta.
Después seguiría con la evaluación; en este caso le metería 200 o mas registros
para evaluar si tiene un margen de confiabilidad del 90% o más.
Durante la evaluación si tuvimos problemas en el sobreajuste (overfitting) o el
subajuste (underfitting) ajustamos los parámetros para que no haya problemas
en las respuestas de la máquina, es decir, que la respuesta tenga cierto margen
de “libertad” para que no sea tan automatizado y sepa dar una respuesta
mediante su experiencia y no solamente en base a los números que ha
registrado.
Ahora nuestra maquina esta lista para dar respuestas, de acuerdo a los casos
de vacunas creadas anteriormente con los respectivos presupuestos y la capital
con la que se contaba, a mi parecer esto sería la solución, machine learning es
algo nuevo para mí por lo que dudo que mis respuestas estén correctamente
planteadas.

También podría gustarte