FAQ

Comment les agents apprenants peuvent-ils « apprendre à utiliser le Web » ?

L'un des exemples individuels les plus convaincants de progrès en matière d'apprentissage automatique (ML) et d'intelligence artificielle (IA) implique des « agents d'apprentissage » numériques qui travaillent sur des algorithmes de ML pour réellement naviguer sur le Web et pour utiliser des fonctionnalités spécifiques dans la page de la même manière. façons dont les humains le font.

Grâce à la puissance de processus d’apprentissage automatique plus sophistiqués, les ordinateurs sont désormais capables de « voir » des images et de déchiffrer leur signification. Les ingénieurs ont pu programmer des technologies d’IA avec un niveau de granularité étonnant, dans le sens où les ordinateurs peuvent désormais « lire » du texte sur une page visuelle avec un haut degré d’alphabétisation. Cela nécessite une quantité remarquable de ressources – pour utiliser des entrées de pixels brutes pour permettre à la technologie de percevoir les formes des lettres, des chiffres et des caractères de texte – puis pour utiliser le traitement du langage naturel pour enchaîner ces caractères et proposer des commandes et des réponses.

Cependant, une autre des principales voies d’amélioration des agents d’apprentissage est l’itération. Les programmes sont essentiellement « formés » pour faire ce qu’il faut d’un point de vue humain et affinent leurs capacités en fonction des ensembles de formation.

Un excellent exemple de tous ces progrès peut être trouvé sur la page « Mini World of Bits » d'OpenAI qui parle d'agents d'apprentissage par renforcement qui perçoivent des ensembles de pixels bruts dans une petite page Web et peuvent « produire des actions de clavier et de souris ».

Les utilisateurs Web peuvent voir les technologies qui génèrent ces événements de clavier et de souris avec des mouvements similaires à ceux d'un utilisateur sur de petites pages Web : pour faire fonctionner des listes déroulantes, des cases à cocher avec logique, répondre aux saisies de texte, choisir des couleurs et bien plus encore. OpenAI déclare que « on peut utiliser une quantité illimitée de pré-formation sur les environnements de formation ».

Tout cela montre que l’intelligence artificielle et l’apprentissage automatique progressent rapidement et que cela nécessitera des réponses humaines pour suivre le rythme. Les types de technologies par cœur intégrées aux pages Web pour prouver qu'un utilisateur n'est « pas un robot » devront peut-être être considérablement améliorés afin d'être efficaces, car l'intelligence artificielle échappe essentiellement à certains des stylos que nous avons créés à cet effet. Dans le même temps, il existe un ensemble passionnant d’applications permettant aux agents d’IA d’utiliser le Web de manière significative – depuis un certain temps déjà, les gens parlent d’utiliser l’intelligence artificielle pour améliorer les moteurs de recommandation, ou pour surfer sur le Web pour obtenir des résultats. . Désormais, ces mêmes agents d’intelligence artificielle pourraient également être utilisés pour travailler avec des contrôles sur le Web.