Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ACTIVIDADES DESARROLLADAS
1. Seleccionar mínimo 3 aplicaciones de interés para proyecto futuro y argumentar las razones
Bolsa de valores: Predecir tendencias
Me interesa esta aplicación ya que machine learning podemos hacer una que esta aprenda de los
datos una vez que esta aprenda de los datos esta me puede ayudar en el mercado de valores a
predecir cual empresa va a ser la mas rentable e invertir en ella.
Cybersecurity : Deteccion de Malware, Spam
Me interesa esta aplicación ya que siempre habrán personas que busquen la manera de pasar
toda la seguridad día a día están ejecutando ataques por eso con esta aplicación podríamos
predecir estos dichos ataques en distintas áreas y así tener a salvo la información mas relevante.
Reconocimientos de rostros: Seguridad con cámaras para mitigar la delincuencia
Me interesa esta aplicación ya que el tema de la seguridad es algo critico a la hora de desarrollar
un sistema y con la tecnología adecuada podemos asegurar muy bien el acceso a nuestra
información ya que descifrar un rostro para desbloquear o para la parte de medicina todavía no
lo es posible.
2. Describir dataset: cantidad de variables (atributos), cantidad de observaciones (instancias), la salida que
indica (lo que se predice)
• Age: edad de cada observación valido de entre 0 a 110
• Workclass: Tipo de trabajo que desempeña
• Education: Nivel de educación de cada observación
• Marital-status: Situación civil en la que se encuentra actualmente.
• Ocupation: Profesión o trabajo que registra cada observación
• Relationship: Corresponde a que relación o cargas familiares tiene la observación
• Race: raza de cada observación
• Sexo : Femenino o masculino
• Capital-gain: ganancia capital
• Capital-loss: perdida de capital
• Hours-per-week: horas de trabajo por semana
• Native-country: Ciudad de origen de cada observación
• Target: Objetivo del análisis que consiste en determinar si su ganancia es menor o mayor a 50.000
3) Describir dataset: cantidad de variables (atributos), cantidad de observaciones (instancias),
la salida que indica (lo que se predice)
El dataset cuenta con 15 variables o atributos incluyendo la salida, el numero de observaciones es de
32561
La salida del dataset nos indica si los ingresos de cada observación son mayores a 50.0000 o no.
RESULTADOS: (OBTENIDOS)
MATRIZ PROCESADA
Conclusiones:
Con base a machine learning Podemos concluir que con la codificación nos puede ayudar a nuestros datos a darles un valor
de categóricos como queremos q influya en nuestros datos aplicando todas las técnicas necesarias como son la limpieza de
los datos la codificación y el preprocesamiento de nuestro data set para futuras decisiones sobre nuestra información.
Recomendaciones: Se debe limpiar nuestro data set para que este al momento de tomar decisiones estos ruidos no influyan
en nuestra toma de decisiones.