Former votre modèle de Machine Learning (apprentissage automatique)
Importer vos données dans AutoML Vision et lancer le processus de formation
Préparez vos données pour l’importation
Il est temps de retourner sur notre compte Google Cloud et de poursuivre l’exercice en important nos données de formation dans AutoML Vision.
Le moyen le plus rapide d’ajouter des images étiquetées est de télécharger des dossiers zippés (compressés) séparés contenant des exemples pour chaque étiquette. Dans notre cas, nous avons deux dossiers/étiquettes : « positif » (images avec exemples d’extraction d’ambre) et « négatif » (sans). Vous pouvez également télécharger toutes les images ensemble et les étiqueter manuellement dans l’interface AutoML Vision, mais cela prendrait beaucoup plus de temps.
Importer les données dans AutoML (1)
Téléchargez sur votre disque local les deux dossiers zippés :
Pendant leur téléchargement, ouvrez à nouveau la plateforme Google Cloud via ce lien. Une fois les deux dossiers téléchargés sur votre disque local, suivez les étapes suivantes pour les charger sur AutoML Vision :
Dans l’interface, cliquez sur « Nouvel ensemble de données ».
Renommez votre ensemble de données et donnez-lui un libellé reconnaissable (par exemple, « amber_mining »), sélectionnez « Classification à étiquette simple » (Single-Label Classification) comme objectif de votre modèle, et cliquez sur « Créer un ensemble de données » (Create dataset).
Conservez la sélection « Télécharger des images depuis votre ordinateur » et cliquez sur « Sélectionner des fichiers » (Upload images from your computer/Select Files). Dans le menu qui s’ouvre, sélectionnez « positive.zip » et « negative.zip ». Confirmez votre sélection
Cliquez sur « Parcourir » pour sélectionner une destination sur le stockage en nuage et dans la fenêtre qui s’ouvrira, cliquez sur l’icône en haut à droite pour « Créer un nouveau seau ».
Donnez un nom à votre seau. Pour les besoins de cet exercice, peu importe ce que vous sélectionnez dans les options suivantes. Cliquez sur « Créer », puis sur « Sélectionner » dans la fenêtre suivante.
Importer les données dans AutoML (2)
Nous sommes à présent prêts à télécharger les ensembles de formation:
Assurez-vous que « negative.zip » et « positive.zip » apparaissent dans la boîte grise et cliquez sur « Continuer ». Attendez quelques secondes ou quelques minutes - selon la vitesse de votre connexion - pour que les images soient téléchargées.
Lorsque le téléchargement est terminé, cliquez sur « Images » dans le menu en haut de la page et attendez la fin du processus d’importation - cela peut prendre jusqu’à 30 minutes.
Une fois le processus d’importation terminé, vous serez averti par courrier électronique. Votre plateforme Google Cloud affichera 1 150 images importées, 900 négatives et 250 positives.
Former votre modèle de Machine Learning (apprentissage automatique)
Nous sommes maintenant prêts à lancer le processus de formation. Mais d’abord, parcourez les images et apprenez-en davantage sur notre ensemble de données. Regardez par exemple certaines des images « positives ». Pouvez-vous voir les trous caractéristiques, les traces de l’extraction de l’ambre ? Le cas échéant, votre modèle le peut aussi.
Pour certaines images, il peut être difficile, même pour vous, de prétendre qu’il existe des traces d’extraction d’ambre ou non. Dans la prochaine leçon, nous verrons comment le modèle se comporte sur ces exemples limites. Lorsque vous êtes prêt à procéder, cliquez sur « Formation ».
À ce stade, le modèle vous dit que « vous disposez d’assez d’images pour commencer la formation ». Il vous informe également que « Votre ensemble de données sera automatiquement scindé en trois parties : formation, validation et test ». Voyons ce que cela signifie.
Ensembles de formation, de validation et de test
Nous avons scindé notre ensemble de données en trois ensembles distincts afin de conserver quelques images, de sorte que, après la formation du modèle, nous pourrons en évaluer les performances sur la base des données sur lesquelles il n’a pas été formé - mais pour lesquelles nous connaissons la bonne étiquette.
Si vous ne précisez pas le nombre d’images à conserver dans chaque ensemble, AutoML Vision utilisera 80 % pour la formation, 10 % pour la validation et 10 % pour les tests:
- L’ensemble de formation correspond à ce que votre modèle « voit » et ce dont il apprend initialement.
- L’ensemble de validation fait également partie intégrante du processus de formation, mais il est maintenu séparé pour ajuster les hyperparamètres du modèle, des variables qui spécifient la structure du modèle.
- L’ensemble de tests n’entre en scène qu’aprèsle processus de formation. Nous l’utilisons pour tester la performance de notre modèle sur des données qu’il n’a pas encore vues.
-
-
Maintenir l'engagement des visiteurs grâce à la vidéo sur le Web
LeçonDéveloppez votre relation avec des publics plus jeunes -
Global Fishing Watch : Surveillez les flottes et navires de pêche
LeçonUn guide d’utilisation de l’outil de cartographie de Global Fishing Watch pour surveiller l’activité de pêche mondiale.