Está en la página 1de 25

Análisis de datos para la

predicción de una fruta o


verdura
PROBLEMA:

Se tiene 60 datos diferentes de frutas y verduras como base


o muestra con características que presenta su valor
nutricional diferentes, con lo cual requiere clasificar una
nueva cantidad de datos diferentes y saber si son frutas o
verduras.
OBJETIVO:

Asociar, Clasificar y seleccionar si es una verdura


o fruta según las características que se presenta
en su valor nutricional.
En caso que sea una fruta:

Ingresamos valores Resultado


En caso de ser una verdura:

Ingresamos valores Resultado


MATERIALES

Orange3-3.26.0
software libre de aprendizaje automático
para Data Mining y análisis predictivo;
escrito en C++ que implementa
algoritmos de minería de datos, así
como operaciones de procesamiento y
representación gráfica de datos.
Funcionalidades de Orange
(Widgets)
- File: Esta pestaña lee datos desde un archivo de entrada o
desde la web, la salida es una tabla. Haciendo doble click se
muestra una ventana con el historial de los archivos abiertos,
el mismo que contiene el directorio, el tamaño y número de
tipos de datos.
- Data Table: Este widget recibe uno o más conjuntos de datos
en su entrada y los presenta como una hoja de cálculo. Los
datos pueden ordenarse por valores de atributo, esta opción
admite la selección manual de instancias de datos.
Funcionalidades de Orange

Test and Score: muestra una tabla con diferentes


medidas de rendimiento del clasificador, como la
precisión de clasificación y el área bajo la curva.

Confusión Matrix: La matriz de confusión muestra la


proporción de número de instancias entre la clase
predicha y la real, y la selección de los elementos.
Funcionalidades de Orange

Tree: Este es un algoritmo simple que divide los


datos en nodos considerando la pureza de la clase.
Está diseñado internamente y puede manejar
conjuntos de datos discretos y continuos. También
puede utilizarse para tareas de clasificación y de
regresión.

Naive Bayes: Es un modelo Bayesiano que se


emplea en los datos. Sólo funciona para tareas de
clasificación.
Funcionalidades de Orange

CN2 Rule Induction: El algoritmo CN2 es una


técnica de clasificación diseñada para la inducción
eficiente de reglas sencillas y comprensibles de
forma “si entonces”, predice incluso en dominios
donde el ruido puede estar presente. Este modelo
funciona solo para clasificar.
KNN: Este widget utiliza el algoritmo KNN que busca
k ejemplos de entrenamiento más cercano en el
espacio y utiliza su promedio como predicción.
Funcionalidades de Orange

Neuronal Network:
Logistic Regression: Este widget genera el modelo
de regresión logística a partir de los datos. Sólo
funciona para tareas de clasificación.
Predictions: Este widget recibe un conjunto de
datos y uno o más predictores (clasificadores),
genera los datos y las predicciones.
Sistema Operativo Windows 10

Memoria RAM 8.00 GB


Procesador Intel Core i5
Almacenamiento SSH 240 GB
Tarjeta de video Nvidea Geforce
Microsoft Office Excel 2016

Microsoft Excel es una hoja de cálculo desarrollada


por Microsoft para Windows, macOS, Android e iOS.
Google sheets

Se trata de un servicio vía web de hojas de cálculo,


realizado en tecnología AJAX. Con ella se puede
realizar la mayoría de las funciones que dejan las
aplicaciones de hojas de cálculos de los programas
ofimáticos, como realizar operaciones entre celdas
con diferentes tipos de funciones (matemáticas,
financieras, lógicas, de fechas, de búsquedas,
estadísticas, con cadenas e informativas), ordenar
columnas, manejar diferentes hojas dentro de cada
fichero, manejas ficheros del tipo xls y csv, etc.
Preparado de datos

Los datos fueros recopilados de internet de la página web


http://orange.biolab.si
Diagrama completo de Orange canvas
(predicción)
Datos con sus respectivos atributos
de las verduras y frutas

Con este URL podemos introducir datos al Orange canvas


https://docs.google.com/spreadsheets/d/1HikBmVTgYjxiCUIdXMYFx2h
SeC38XYj_91WGwh1Xvs/edit#gid=0
Se vería de esta forma
Con estos estos atributos podemos predecir si
son vegetales(verdura) o frutas

Con este URL podemos introducir datos que aun no están


clasificados como verdura o fruta donde el Orange canvas lo
clasificara con sus respectivos algoritmos.
https://docs.google.com/spreadsheets/d/1Q_lMUbPfIXLv89XM4a
R7otHkg5oxAmyZNnv7zVSldcc/edit
Presentación en Orange Canvas
Resultados
Predicción
Predicción
Conclusión

Se predijo con precisión si un producto es


FRUTA o VEGETAL con los algoritmos
Neuronal Network, Logistic Regression, que
son los que tienen una mayor probabilidad de
acertar mediante la predicción.
Conclusión

Se muestra a detalle el desempeño que tienen


los diferentes modelo de algoritmos. para
lograr una predicción más precisa es
recomendable tener mayor cantidad de datos
de prueba.

También podría gustarte