Documentos de Académico
Documentos de Profesional
Documentos de Cultura
-
Unidad 2. Minería de Datos
Actividad 2. Características de los Algoritmos
Licenciatura en Matemáticas
1. Contesta las siguientes preguntas dando una descripción concisa y clara sobre lo que significan.
Desde una perspectiva matemática, una base ortonormal es un conjunto de vectores 𝑆 = {𝑢1 , 𝑢2 , … , 𝑢𝑛 }
en ℝ𝑛 si cumple con:
𝑢𝑖 ∙ 𝑢𝑗 = 0 𝑠𝑖 𝑖 ≠ 𝑗
𝑢𝑖 ∙ 𝑢𝑖 = 1
En otras palabras, una base ortonormal es un conjunto de vectores que forman una base ortogonal
(conjunto de vectores que son perpendiculares entre sí) y además la norma de cada uno de ellos es
unitaria.
De algebra lineal, existe un teorema que nos afirma que cualquier base en ℝ𝑛 se puede convertir en una
base ortonormal, al proceso de convertir dicha base a una ortonormal se le conoce como “proceso de
orto normalización de Gram-Schmidt”
Por lo cual
𝑣1 𝑣1 1
𝑢1 ∙ 𝑢1 = ( )∙( )=( ) (𝑣1 ∙ 𝑣1 ) = 1
|𝑣1 | |𝑣1 | |𝑣1 |2
Entonces
𝑣2 ´ = 𝑣2 − (𝑣2 ∙ 𝑢1 )𝑢1
2
Es un vector de la base ortogonal perpendicular a 𝑢1 .
Sea
𝑣2 ´
𝑢2 =
|𝑣2 ´|
Sea
𝑣´𝑘+1
𝑢𝑘+1 =
|𝑣´𝑘+1 |
3
d. Describe brevemente qué es la dimensión VC (Vapnik-Chervonenkis)
Es una medida de la capacidad que poseen los algoritmos de clasificación estadística y se obtienen a partir
de la cardinalidad del mayor conjunto de puntos que el algoritmo puede separar.
¿De cuántas posibles formas podemos trazar una línea que separe en al menos dos conjuntos
distintos estos puntos?
Al trazar las líneas para forma 2 conjuntos distintos, encontramos que lo podemos realizar de 6 formas
distintas (6 líneas). Es importante destacar que no se presenta ninguna separación que contemple al
conjunto vacío, dado que, a criterio del autor de la presente actividad, la pregunta no es lo
suficientemente específica.
4. ¿Qué relación hay entre la pregunta 2 y 3? (Es decir, ¿cómo se explica el faltante entre ambas
respuestas de forma general?)
La cantidad faltante se justifica por las restricciones que se establecen en ambos casos. En la pregunta 2
el problema no es linealmente separable (nótese que no podemos establecer una recta que divida en 2
conjuntos diferentes puntos iguales que se encuentren en vértices opuestos), mientras que las funciones
lógicas si son funciones linealmente separables.
Fuentes
Witten, I. H. (20). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
Caballero, Martín & Riesco. (2019). Big Data con Python. Recolección, almacenamiento y proceso. España:
Alfaomega Grupo Editor.
4
Triolla. (2009). Estadística. México: Pearson Educación.
Devore, J.. (2008). Probabilidad y Estadística para Ingeniería y Ciencias. México: Cengage Learning
Editores.