Aprendizaje supervisado de funciones de distancia: estado del arte

Bac Nguyen Cong, Jorge Luis Rivero Pérez, Carlos Morell

Resumen


La selección de una función de distancia adecuada es fundamental para los algoritmos de aprendizaje basados en instancias. Tal función de distancia dicta el éxito o el fracaso de dichos algoritmos. Recientemente se ha demostrado que, incluso una simple transformación lineal de las características de entrada, puede conducir a mejoras significativas en la clasificación de algoritmos como de k vecinos más cercanos k-Nearest Neighbour (k-NN). En la actualidad, los algoritmos de aprendizaje de la métrica de distancia han mostrado un buen desempeño y se identifican  requisitos básicos: en primer lugar, deben ser lo suficientemente flexibles para soportar la variedad de restricciones utilizadas por los diferentes paradigmas; en segundo lugar, el algoritmo debe ser capaz de aprender una métrica de distancia que generalice bien los datos de prueba no conocidos con anterioridad, el algoritmo debería ser rápido y escalable. Una de las principales aplicaciones de estos algoritmos es su hibridación con algoritmos de aprendizaje basados en instancias, aprendiendo así una métrica de distancia para la aplicación específica y no utilizando una función de distancia general. El presente artículo presenta una panorámica sobre el aprendizaje de la métrica de distancia, y su modelado como un problema de optimización convexa. Luego aborda diferentes enfoques de aprendizaje a partir de la disponibilidad de información en forma de restricciones, enfocándose en el supervisado, y bajo este los enfoques globales y  locales. Además se describen modelos y estrategias de los algoritmos más representativos de cada enfoque.


Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original.
_________________________________________________________________________________________________________

 INDEXACIÓN