Al segmentar de forma no supervisada una colección de datos, el usuario debe tomar múltiples decisiones qué algoritmo aplicar, cómo representar los objetos, en cuantos grupos agrupar éstos, entre otras que condicionan, en gran medida, la calidad de la partición resultante, Desgraciadamente, la naturaleza no supervisada del problema hace difícil (cuando no imposible) tomar estas decisiones de manera fundamentada, a no ser que se disponga de cierto conocimiento del dominio.
En un intento por combatir estas incertidumbres, esta tesis propone una aproximación al problema que minimiza, intencionadamente, la toma de decisiones por parte del usuario. Al contrario, se alienta el uso de tantos sistemas de clasificación no supervisada como sea posible, combinándolos con el fin de obtener la partición final de los datos (o partición de consenso). Cuanto más similar sea ésta a la partición de máxima calidad ofrecida por los sistemas de clasificación sujetos a combinación, mayor será el grado de robustez respecto a las indeterminaciones inherentes a la clasificación no supervisada.
No obstante, la combinación indiscriminada de clasificadores no supervisados plantea dos dificultades principales, que son i) el incremento de la complejidad computacional del proceso de combinación, hasta el punto que su ejecución puede ser inviable si el número de sistemas a combinar es excesivo, y ii) la obtención de particiones de consenso de baja calidad debida a la inclusión de sistemas de clasificación pobres. Con el objetivo de luchar contra estos problemas, esta tesis introduce las arquitecturas de consenso jerárquicas auto-refinables como vía para la obtención de particiones de consenso de buena calidad con bajo coste computacional, tal como confirman los numerosos experimentos realizados.
Con la intención de exportar esta estrategia de clasificación no supervisada robusta a un marco generalista, se propone un conjunto de funciones de consenso basadas en votación para la combinación de clasificadores difusos. Diversos experimentos demuestran que sus prestaciones son comparables o superiores a buena parte del estado del arte.
Nuestras propuestas son aplicables de forma natural a la clasificación robusta de datos multimodales i) un problema de interés actual dada la ubicuidad de la multimedia ii), ya que la existencia de múltiples modalidades plantea indeterminaciones adicionales que dificultan la obtención de particiones robustas. La base de nuestra propuesta es la creación de conjuntos de particiones multimodales, lo que permite el uso natural y simultáneo de técnicas de fusión de modalidades temprana y tardía, dando pie a una aproximación genérica y eficiente a la clasificación multimedia cuyos resultados se analizan a lo largo de múltiples experimentos.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados