Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos.
Alumno:
Bautista Vargas Jorge Damian #14212003
Índice.
Clasificacion 2
Arboles de decision 3
Regresion lineal 5
Representacion del conocimiento 5
Bibliografia 6
1
Clasificación.
Estas clasificaciones son necesarias ya que al agrupar los datos en categorías nos
permite revisar diferentes cosas, por ejemplo, para un banco permite separar los
clientes cumplidos a incumplidos para la obtención de préstamos, así como
encontrar las condiciones en común de los clientes para otorgarles facilidades o
promociones.
2
En la imagen podemos observar como se toma un grupo de datos muestra, que
será nuestra training data para el modelo, de estos datos se crea un algoritmo de
clasificación en el cual se tomarán las reglas, llamadas reglas de clasificación,
para entrar a ese grupo de datos que tendrá una etiqueta que los permitira entrar a
ese nuevo grupo de clasificación de datos.
Con las reglas definidas para el clasificador, tomamos un nuevo grupo de datos para
realizar las pruebas, en este caso podemos observar como con los datos mostrados
podemos empezar a agrupar los datos con la clasificación correcta, en este punto se
puede decir que hemos pasado al segundo paso el cual consiste en la
comprobación de la exactitud, en caso de que el modelo tenga las reglas suficientes
y la exactitud necesaria (comprobandose con más pruebas) podemos definir que
este efectivamente es un grupo clasificador exitoso, en caso contrario se debe
volver al paso y crear un nuevo grupo que busque satisfacer correctamente las
necesidades de la clasificación.
3
En la imagen se puede observar cómo pueden salir diferentes nodos (también
llamados hojas padre) salen pequeños nodos (llamados hojas hijo) que pueden
representar las diferentes características que pueden presentar los atributos, en el
caso de la edad, si es joven se puede concluir que es estudiante, si es mayor se
puede concluir que ya tiene un historial crediticio.
1. Se crea el nodo N.
2. SI las tuplas estan en D son todos de la misma clase C, ENTONCES
3. Regresar N como un nodo con etiqueta (hoja) dentro de la clase C
4. SI atributo esta vacio ENTONCES
5. Regresar N como un nodo hoja en la clase D //Mayoría de votos
6. Aplicamos un nuevo metodo para encontrar el mejor criterio_de_separacion
7. El Nodo N se ejecuta en el metodo criterio_de_separacion
8. SI el criterio_de_separacion es de un valor discreto
9. FOR EACH el resultante “j” de criterio_de_separacion
10. Dejamos que Dj sea el set de la tupla de datos que satisfagan D con
resultante j
11. SI Dj esta vacio ENTONCES
12. La hoja conjunta con la mayoria de la clase D se va con Nodo N
13. ELSE adjunta el nodo regresado por Generar_arbol_decision (Dj, atributo)
a Nodo N
14. ENDFOR
15. Regresar N
4
Regresión lineal: Los modelos de regresión lineal son aquellos que buscar
encontrar una aproximación en la relación de una dependencia de una variable a
otras que son independientes.
Ahora, existen diferente tipos de regresión lineal los cuales son para mencionar
alguna: Regresión lineal simple, regresion lineal multiple, relación lineal multiple,
regresion polinomica y la comparación de curvas experimentales.
5
Bibliografía.
Data mining. Concepts and Techniques, Third Edition, Jiawei Han, Micheline
Kamber, Jian Pei (2012)