Zum Hauptinhalt springen
Zum Dashboard
Sie wissen nicht, wo Sie anfangen sollen? Nehmen Sie an einem kurzen Quiz teil, um personalisierte Empfehlungen zu erhalten.
Lektion 4 von 7
Datenaufbereitung
Hands-on Machine Learning
Was ist maschinelles Lernen?
Google Cloud AutoML Vision
Datenaufbereitung
Trainieren Sie Ihr Machine Learning-Modell
Auswerten und Testen
check_box_outline_blank Hands-on Machine Learning: Take the Quiz
Kurs
0% abgeschlossen
5 Minuten abzuschließen

Datenaufbereitung

image12_3.png
Beurteilen Sie Ihren Anwendungsfall, Quelle und bereiten Sie Ihre Daten vor
image12_3.png

Was sind Trainingsdaten?

image12_3_zA6aI42.png

Wenn Sie Ihr Google Cloud-Konto ordnungsgemäß eingerichtet haben, sind Sie nun bereit für die Übung. In dieser Lektion erfahren Sie, welche Fragen Sie bei der Erfassung der Trainingsdaten stellen sollten und wie Sie diese für die Verwendung von AutoML Vision vorbereiten.


Mit Trainingsdaten meinen wir Beispiele dafür, was unser ML-Modell erkennen und kategorisieren können soll. In unserem Fall bedeutet dies, eine Reihe von Satellitenbildern bereitzustellen und dem Algorithmus mitzuteilen, welche davon Beispiele für den Bernsteinabbau sind und welche nicht.

image12_3_zA6aI42.png

Beginnen Sie mit Ihrem Anwendungsfall

image40_2.png

Gehen Sie beim Zusammenstellen des Datensatzes immer von dem Problem aus, bei dessen Lösung Sie ML um Hilfe bitten. Überlegen Sie sich die folgenden Fragen:

  1. Was ist das Ergebnis, das Sie erreichen wollen?
  2. Welche Arten von Kategorien müssten Sie erkennen, um dieses Ergebnis zu erreichen?
  3. Ist es für Menschen möglich, diese Kategorien zu erkennen? Obwohl AutoML Vision viel mehr Bilder und Kategorien verarbeiten kann als Menschen, hat es auch AutoML Vision schwer, wenn ein Mensch eine bestimmte Kategorie nicht erkennen kann.
  4. Welche Arten von Beispielen würden am besten die Art und den Umfang der Daten widerspiegeln, die Ihr System klassifizieren wird?


Denken Sie über eine Geschichte nach, an der Sie gerade arbeiten. Wie verändern die Antworten auf diese Fragen Ihre Herangehensweise an die Geschichte und ob Sie dafür maschinelles Lernen benötigen?

image40_2.png

Bewerten Sie Ihren Anwendungsfall

image5_3.png

In unserem Fall könnten dies unsere Antworten sein:

  1. Wir wollen, dass unser Modell in der Lage ist, Vorkommen von Bernsteinabbau auf Satellitenbildern, die wir ihm präsentieren werden, zu erkennen.
  2. Wir brauchen nur zwei Kategorien: „JA: dieses Bild enthält Elemente, die mit Mustern übereinstimmen, die normalerweise auf Bernsteinabbauaktivitäten hinweisen“ und „NEIN: dieses Bild enthält keine Elemente, die auf Bernsteinabbau hinweisen“.
  3. Meistens ja: Vorkommen von Bernsteinabbau sind auf Satellitenbildern aufgrund des ausgeprägten pockmark-ähnlichen Musters von Löchern im Boden gut zu erkennen. Aber wir werden in der Testphase sehen, dass es vielleicht nicht immer so einfach ist, wie wir denken.
  4. Unterschiedlicher Hintergrund, unterschiedliche Dichte der Löcher, unterschiedliche Farben. Je vielfältiger die Beispiele in unserem Datensatz sind, desto besser wird der Algorithmus lernen.
image5_3.png

Beschaffen Sie Ihre Daten

image17_3.png

Sobald Sie festgestellt haben, welche Daten Sie benötigen, besteht der nächste Schritt darin, einen Weg zu finden, diese Daten zu beschaffen. In unserem Fall haben wir bereits den von Texty bereitgestellten Datensatz. Aber denken Sie daran, was Ihr eigener Anwendungsfall sein könnte: Wie und wo können Sie die Bilder, die Sie benötigen, finden?


Möglicherweise können Sie sie aus den Sammlungen Ihrer Organisation oder von Dritten beziehen. Stellen Sie in beiden Fällen sicher, dass Sie die Datenschutzbestimmungen in Ihrer Region und an den Standorten, für die Ihr Antrag gilt, überprüfen.


Keine Trainingsdaten werden jemals vollkommen „unvoreingenommen“ sein, aber können Sie Ihre Chancen, ein faires Modell zu erstellen, verbessern, wenn Sie mögliche Quellen der Voreingenommenheit in Ihren Daten sorgfältig prüfen und Schritte unternehmen, um diese zu beseitigen. Lesen Sie unsere Einführung in das maschinelle Lernen, um mehr darüber zu erfahren.

image17_3.png

Bereiten Sie Ihre Daten vor

image50_2.png

Bei der Zusammenstellung der Trainingsdaten sind noch ein paar Dinge zu beachten:


Fügen Sie in jede Kategorie genügend gekennzeichnete Beispiele ein: Das von AutoML Vision geforderte Minimum beträgt 100 Beispiele pro Kennzeichnung. Im Allgemeinen gilt: Je mehr gekennzeichnete Bilder Sie in den Trainingsprozess einbringen können, desto besser wird Ihr Modell sein.

Es ist wichtig, für jede Kategorie etwa gleich viele Trainingsbeispiele aufzunehmen. Wenn Sie eine Fülle von Daten für eine Kennzeichnung haben, verwenden Sie nur einen Teil davon, um zu vermeiden, dass Sie eine sehr unterschiedliche Anzahl von Beispielen pro Kategorie haben.

Finden Sie Bilder, die dem, was Sie das Modell kategorisieren lassen wollen, visuell ähnlich sind. Im Idealfall handelt es sich bei Ihren Trainingsbeispielen um reale Daten, die aus demselben Datensatz stammen, den Sie mit dem Modell klassifizieren möchten.

image50_2.png
Glückwunsch! Sie haben folgende Lektion abgeschlossen: Datenaufbereitung in progress
Recommended for you
Wie würden Sie diese Lektion bewerten?
Ihr Feedback hilft uns dabei, unsere Lektionen zu verbessern.
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?