Machine learning of object storage and its application to the evaluation of the luster of Tahitian cultured pearls
L’apprentissage automatique du rangement d’objets et son application à l’évaluation du lustre des perles de culture de Tahiti
Abstract
Machine learning problems are sometimes solved with inappropriate methods, leading to sub-optimal results. Determining which method to apply to solve a machine learning problem is not always easy, on the one hand because it requires correctly identifying the problem to be solved, and on the other hand because even if the problem in question has been correctly identified, there is not necessarily a specific method to solve it.
Les problèmes d’apprentissage automatique sont parfois résolus avec des méthodes inadaptées, menant à des résultats sous optimaux. La détermination de la méthode à appliquer à la résolution d’un problème d’apprentissage automatique n’est pas toujours aisée, d’un côté parce qu’elle nécessite d’identifier correctement le problème à résoudre, et d’un autre côté parce que même si le problème en question a été identifié correctement, il n’existe pas nécessairement de méthode spécifique pour le résoudre.
La présente thèse part du constat selon lequel il n’existe pas d’algorithme d’apprentissage automatique spécifiquement dédié au rangement d’objets (un type particulier de problèmes d’apprentissage ordinal consistant à apprendre un ordre total à partir d’un ensemble de couples d’objets).
Une méthode d’apprentissage automatique destinée à combler ce manque est proposée et implémentée sous forme d’une machine à noyau. Un méta-noyau est développé afin de l’adapter aux bibliothèques standard d’apprentissage automatique.
L’algorithme proposé est appliqué à un cas concret de problème de rangement d’objets, l’évaluation du lustre des perles de Tahiti, et comparé avec quatre autres méthodes. Cet algorithme donne de meilleurs résultats (93,6% ± 3,9% de prévisions correctes sans sélection de caractéristiques, 94,3% ± 3,4% avec sélection de caractéristiques) que les meilleures des autres méthodes testées (91,3% ± 3,4% et 92,6% ± 4,3% sans et avec sélection de caractéristiques), cette amélioration étant significative (p < 0,01 et p = 0.02 respectivement). En outre, cette méthode ne présente pas de différence significative entre les résultats obtenus avec et sans sélection de caractéristiques (valeur-p = 0.33), ce qui peut indiquer que son biais d'apprentissage correspond bien au problème à résoudre et peut ainsi réduire la charge de travail en phase de prétraitement des données.
Origin : Files produced by the author(s)