Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes:
Xavier Decker
Johnny Vera
ÍNDICE
INTRODUCCIÓN 3
MARCO TEÓRICO 4
CONCLUSIONES 18
RECOMENDACIONES 18
BIBLIOGRAFÍA 19
2
INTRODUCCIÓN
datos, para adquirir los conocimientos necesarios y poder realizar un correcto uso de su
la data, los cuales pueden llegar a ser utilizados en la toma de decisiones dentro de una
organización.
inteligencia de negocio para de esta forma explicar de la mejor manera el uso de esta
herramienta y promoverla como una de las opciones fiables para la minería de datos.
3
MARCO TEÓRICO
Algoritmo
modelo de solución para determinado tipo de problemas. Este conjunto de acciones son
realizadas en un orden específico para luego llegar a una respuesta. Los algoritmos son
programación, esta es la infraestructura de cualquier solución. Estos deben contar con las
siguientes características:
● Debe producir un resultado. Los datos de salida serán los resultados de efectuar las
instrucciones.
Minería de Datos
La minería de datos surgió con la intención o el objetivo de ayudar a comprender una enorme
cantidad de datos, y que estos, pudieran ser utilizados para extraer conclusiones para
4
contribuir en la mejora y crecimiento de las empresas, sobre todo, por lo que hace a las ventas
o fidelización de clientes.
Exploradores de Datos
Las personas que se dedican al análisis de datos a través de este sistema son conocidos como
cantidades de datos. Su intención es la de aportar información valiosa a las empresas para así,
ayudarlas en la toma de decisiones futuras. Pero debemos tener claro que la elección del
mejor algoritmo para una tarea analítica específica es un desafío, ya que podemos encontrar
muchos patrones distintos, y además, dependerá de los problemas a resolver (Ribas, 2018).
secuencias. Los mineros o exploradores de datos a la hora de llevar a cabo un análisis de Data
3. Determinación del modelo: Primero se debe hacer un análisis estadístico de los datos
5
Algoritmo Naive Bayes
Naive Bayes es una técnica de clasificación y predicción que construye modelos que predicen
la probabilidad de posibles resultados. Naive Bayes utiliza datos históricos para encontrar
Estos modelos son llamados algoritmos “Naive”, o “Inocentes” en español. En ellos se asume
que las variables predictoras son independientes entre sí. En otras palabras, que la presencia
observación
hipótesis se verifica
de observar D
6
De manera explicativa, si tomamos el ejemplo explicado anteriormente donde la información
que tenemos hasta ahora y asumiendo que solo trabajan en la oficina 4 días a la semana, las
Si se menciona otra característica de la persona vista, por ejemplo llevaba una prenda de
Combinando ambas informaciones se puede inferir que a la semana, los dos sujetos de la
que aprendemos sobre el mundo a través de la aproximación, acercándonos cada vez más a la
7
verdad, a medida que recogemos más evidencias. En términos sencillos, el clasificador
ingenuo de Bayes asume que la presencia o ausencia de una característica particular no está
Si consideramos por ejemplo analizar un caso de dos personas en una oficina, Alicia y Bruno,
los eventos y datos históricos son considerados informaciones anteriores, en este caso hay
registros de que Alicia asiste a la oficina 3 días a la semana, mientras que Bruno asiste solo
un dia.
Para resolver una consigna sin información, se puede realizar inferencias mediante
probabilidades, por ejemplo en el presente dia se tiene entendido que alguien de los dos
Este tipo de problemas son fácilmente resueltas mediante la metodología de Naive Bayes, en
donde se clasifican los diferentes escenarios de la data en distintos ambientes, para llegar a la
respuesta más acertada. Los pasos que hay que realizar para poder utilizar el algoritmo Naive
2. Crear una tabla de probabilidad calculando las correspondientes a que ocurran los
diversos eventos.
3. La ecuación Naive Bayes se usa para calcular la probabilidad posterior de cada clase.
Una de las ventajas de aplicar esta metodología es su manera fácil y rápida de predecir clases,
para problemas de clasificación binarios y multiclase. En los casos en que sea apropiada una
8
distribuciones de características condicionales de clase significa que cada distribución puede
ser estimada independientemente como si tuviera una sola dimensión. Esto ayuda con
Sin embargo, cuando el conjunto de datos de prueba tiene una característica que no ha sido
Para el desarrollo del documento se realizará un ejercicio con una base de datos sobre
prefieren de libre uso o de pago, y si estas mismas personas son motivados en la compra de
estos por contar previamente con breves conocimientos en programación. Para esto se debe
9
Uso de la herramienta
1. Creamos el archivo .arff el cual permitirá determinar los valores y columnas de datos
continuación:
10
Parece bastante ilegible, sin embargo, así es como el sistema reconoce y administra el
11
5. Si la carga fue correcta no se mostrará ningún mensaje de error, sin embargo, la
mayor por parte de los errores suele estar en campos mal escritos entre la data
12
2. Resultados del tipo de algoritmo escogido:
13
}
14
Figura 12: Árbol de decisión generado
15
CONCLUSIONES
El teorema de Bayes tiene una aplicacion muy util al momento de querer una respuesta
aproximada sobre una hipótesis no realizada, a través de demás probabilidades alrededor del
en una base de datos con informaciones históricas, de esta forma encuentra patrones en los
resultados y genera predicciones, obteniendo una respuesta cerca de la realidad. Su uso puede
ser implementado para estudios que desean realizar incorporaciones de Machine Learning
RECOMENDACIONES
Como recomendación podría mencionar que para el estudio podría aportar el hecho de incluir
en la selección de datos el rango de edades pues podrá permitir desde qué momento empieza
Pues estas conclusiones podrían reformular las metodología aplicadas en las enseñanzas de
universidad y a su vez como para poder determinar si se sienten satisfecho con el contenido
dictado actualmente o de ser necesario incluir las nuevas herramientas que realmente son
cotizadas en el mercado, y evitar esta necesidad patentada en los datos de tener que invertir
fondos propios para obtener un programa, el cual académicamente de cierta forma podría
16
resultar gratis o por lo menos un descuento.
BIBLIOGRAFÍA
● Ribas. (2018). Qué es el Data Mining o la minería de datos y qué ventajas nos
datos-big-data/
https://medium.com/datos-y-ciencia/algoritmos-naive-bayes-fudamentos-e-
implementaci%C3%B3n-4bcb24b307f
http://ing.unne.edu.ar/pub/informatica/Alg_diag.pdf
https://algoritmosmineriadatos.blogspot.com/2009/12/algoritmo-naive-
bayes.html
https://www.jacobsoft.com.mx/es_mx/clasificador-naive-bayes/
17