FAQ

Comment une « marche aléatoire » peut-elle être utile dans les algorithmes d’apprentissage automatique ?

Dans le domaine de l'apprentissage automatique, une approche de « marche aléatoire » peut être appliquée de différentes manières pour aider la technologie à passer au crible les vastes ensembles de données d'entraînement qui constituent la base de la compréhension finale de la machine.

Mathématiquement, une marche aléatoire est quelque chose qui peut être décrit de plusieurs manières techniques différentes. Certains le décrivent comme une collection aléatoire de variables ; d'autres pourraient appeler cela un « processus stochastique ». Quoi qu'il en soit, la marche aléatoire envisage un scénario dans lequel un ensemble de variables emprunte un chemin qui est un modèle basé sur des incréments aléatoires, selon un ensemble entier : par exemple, une marche sur une droite numérique où la variable se déplace de plus ou moins un à chaque étape. .

En tant que telle, une marche aléatoire peut être appliquée aux algorithmes d’apprentissage automatique. Un exemple populaire décrit dans un article de Wired s'applique à certaines théories révolutionnaires sur la façon dont les réseaux neuronaux peuvent fonctionner pour simuler les processus cognitifs humains. Caractérisant une approche de marche aléatoire dans un scénario d'apprentissage automatique en octobre dernier, l'écrivain de Wired Natalie Wolchover attribue une grande partie de la méthodologie aux pionniers de la science des données Naftali Tishby et Ravid Shwartz-Ziv, qui suggèrent une feuille de route pour différentes phases de l'activité d'apprentissage automatique. Plus précisément, Wolchover décrit une « phase de compression » qui est liée au filtrage des caractéristiques ou aspects non pertinents ou semi-pertinents dans un champ d'image en fonction de l'objectif prévu du programme.

L'idée générale est que, au cours d'un processus complexe et en plusieurs étapes, la machine travaille soit à « mémoriser » soit à « oublier » différents éléments du champ d'image pour optimiser les résultats : dans la phase de compression, le programme pourrait être décrit comme une « remise à zéro » in » sur les fonctionnalités importantes à l'exclusion des fonctionnalités périphériques.

Les experts utilisent le terme « descente de gradient stochastique » pour désigner ce type d’activité. Une autre façon de l'expliquer avec une sémantique moins technique est que la programmation réelle de l'algorithme change par degrés ou par itérations, pour « affiner » ce processus d'apprentissage qui se déroule selon des « étapes de marche aléatoires » qui mèneront éventuellement à une certaine forme d'apprentissage. la synthèse.

Le reste de la mécanique est très détaillé, car les ingénieurs s'efforcent de faire passer les processus d'apprentissage automatique à travers la phase de compression et d'autres phases associées. L'idée plus large est que la technologie d'apprentissage automatique évolue de manière dynamique au cours de la durée de vie de son évaluation de grands ensembles de formation : au lieu de regarder différentes cartes flash dans des instances individuelles, la machine examine les mêmes cartes flash plusieurs fois, ou extrait les cartes flash à plusieurs reprises. aléatoire, en les examinant d'une manière changeante, itérative et aléatoire.

L’approche de marche aléatoire ci-dessus n’est pas la seule manière d’appliquer la marche aléatoire à l’apprentissage automatique. Dans tous les cas où une approche aléatoire est nécessaire, la marche aléatoire peut faire partie de la boîte à outils du mathématicien ou du data scientist, afin, là encore, d'affiner le processus d'apprentissage des données et de fournir des résultats supérieurs dans un domaine en pleine émergence.

En général, la marche aléatoire est associée à certaines hypothèses mathématiques et scientifiques. Certaines des explications les plus courantes d’une marche aléatoire sont liées au marché boursier et aux graphiques boursiers individuels. Comme l'a popularisé Burton Malkiel dans « A Random Walk Down Wall Street », certaines de ces hypothèses affirment que l'activité future d'un titre est essentiellement inconnaissable. Cependant, d'autres suggèrent que des modèles de marche aléatoires peuvent être analysés et projetés, et ce n'est pas une coïncidence si les systèmes modernes d'apprentissage automatique sont souvent appliqués à l'analyse boursière et au day trading. La recherche de connaissances dans le domaine technologique est et a toujours été liée à la recherche de connaissances sur l’argent, et l’idée d’appliquer des marches aléatoires à l’apprentissage automatique ne fait pas exception. D’un autre côté, la marche aléatoire en tant que phénomène peut être appliquée à n’importe quel algorithme et à n’importe quelle fin, selon certains des principes mathématiques mentionnés ci-dessus. Les ingénieurs peuvent utiliser un modèle de marche aléatoire pour tester une technologie ML, ou pour l'orienter vers la sélection de fonctionnalités, ou pour d'autres utilisations liées aux gigantesques châteaux aériens byzantins que sont les systèmes ML modernes.