De nos jours, de nombreuses entreprises intègrent des solutions d'apprentissage automatique dans leur ensemble d'outils d'analyse pour améliorer la gestion de la marque, améliorer l'expérience client et accroître l'efficacité opérationnelle. Les modèles d’apprentissage automatique sont au cœur des solutions d’apprentissage automatique. Les modèles sont entraînés à l’aide d’algorithmes mathématiques et de grands ensembles de données pour effectuer des prédictions fiables. Deux exemples courants de prédictions consistent à (1) déterminer si un ensemble de transactions financières indique une fraude ou (2) évaluer le sentiment des consommateurs à l'égard d'un produit, sur la base des informations collectées sur les réseaux sociaux.
Amazon SageMaker est un service entièrement géré qui permet aux développeurs et aux data scientists de créer, former et déployer des modèles d'apprentissage automatique. Dans SageMaker, vous pouvez utiliser des algorithmes prêts à l'emploi ou opter pour une solution plus personnalisée. Les deux choix sont valables et constituent également la base d’une solution d’apprentissage automatique réussie.
(Note de l'éditeur : vous pouvez voir d'autres alternatives à SageMaker ici.)
Les algorithmes prêts à l'emploi de SageMaker incluent des exemples populaires et hautement optimisés pour la classification d'images, le traitement du langage naturel, etc. La liste complète peut être trouvée ici.
- Avantages prêts à l'emploi : Ces algorithmes ont été pré-optimisés (et sont en constante amélioration). Vous pouvez être opérationnel et déployé rapidement. De plus, le réglage automatique des hyper-paramètres AWS est disponible.
- Considérations prêtes à l'emploi : Les améliorations continues mentionnées ci-dessus peuvent ne pas produire des résultats aussi prévisibles que si vous aviez un contrôle total sur la mise en œuvre de vos algorithmes.
Si ces algorithmes ne conviennent pas à votre projet, vous avez trois autres choix : (1) la bibliothèque Apache Spark d'Amazon, (2) du code Python personnalisé (qui utilise TensorFLow ou Apache MXNet) ou (3) « apportez le vôtre » où vous sont essentiellement sans contrainte, mais devront créer une image Docker afin de former et de servir votre modèle (vous pouvez le faire en utilisant les instructions ici).
L’approche « apportez le vôtre » vous offre une totale liberté. Cela peut s'avérer attrayant pour les data scientists qui ont déjà constitué une bibliothèque de code algorithmique personnalisé et/ou propriétaire qui peut ne pas être représenté dans l'ensemble prêt à l'emploi actuel.
- Avantages d'apporter votre propre : Permet un contrôle complet sur l’ensemble du pipeline de science des données ainsi que l’utilisation d’une propriété intellectuelle propriétaire.
- Considérations relatives au transport par soi-même : La dockerisation est nécessaire pour former et servir le modèle résultant. L’intégration des améliorations algorithmiques relève de votre responsabilité.
Quel que soit votre choix d'algorithme, SageMaker sur AWS est une approche à considérer, étant donné l'importance accordée à la facilité d'utilisation du point de vue de la science des données. Si vous avez déjà tenté de migrer un projet d'apprentissage automatique de votre environnement local vers un environnement hébergé, vous serez agréablement surpris de voir à quel point SageMaker le rend transparent. Et si vous partez de zéro, vous êtes déjà plusieurs pas plus près de votre objectif, étant donné tout ce qui est déjà à votre portée.