Kostiantyn Khabarlak, Larysa Koriashkina
La detección de puntos de referencia faciales densos es un elemento clave del proceso de procesamiento de rostros. En este artículo, examinamos y analizamos algoritmos modernos de detección de puntos de referencia faciales basados en redes neuronales, nos centramos en enfoques que han llevado a un aumento significativo de la calidad en los últimos años en conjuntos de datos con una gran variabilidad de poses y emociones, oclusión facial significativa, todo que son típicos en escenarios del mundo real. Resumimos las mejoras en categorías, proporcionamos una comparación de calidad en conjuntos de datos difíciles y modernos en la naturaleza: 300 Faces in-the-wild (300W), Annotated Facial Landmarks in the Wild (AFLW), Wider Facial Landmarks in-the-wild (WFLW), Caltech Occluded Faces in the Wild (COFW). Además, comparamos la velocidad del algoritmo en procesadores gráficos y centrales de escritorio, dispositivos móviles. Para completar, también tocamos brevemente los métodos establecidos con implementaciones abiertas disponibles. Además, cubrimos aplicaciones y vulnerabilidades de los algoritmos de detección de hitos. Esperamos que las generalizaciones que hagamos conduzcan a más mejoras en el algoritmo.
Dense facial landmark detection is a key element of face processing pipeline. In this paper we survey and analyze modern neural-network-based facial landmark detection algorithms, focus on approaches that have led to a significant increase in quality over the past few years on datasets with large pose and emotion variability, significant face occlusion, all of which are typical in real-world scenarios. We summarize the improvements into categories, provide quality comparison on difficult and modern in-the-wild datasets: 300 Faces in-the-wild (300W), Annotated Facial Landmarks in-the-wild (AFLW), Wider Facial Landmarks in-the-wild (WFLW), Caltech Occluded Faces in-the-wild (COFW). Additionally, we compare algorithm speed on desktop central and graphical processors, mobile devices. For completeness, we also briefly touch on established methods with open implementations available. Besides, we cover applications and vulnerabilities of the landmark detection algorithms. We hope that generalizations that we make will lead to further algorithm improvements.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados