Recherchieren von Geschichten mit maschinellem Lernen
Wie Sie Maschinelles Lernen für Ihre Berichterstattung nutzen können
Maschinelles Lernen für Recherchen: eine Fallstudie
Im Jahr 2010 begann der Preis für Bernstein auf dem Weltmarkt zu steigen. Aufgrund der großen Nachfrage zogen in den folgenden Jahren bernsteinreiche Teile der Nordwestukraine ausländisches und lokales Interesse auf sich und wurden zum Schauplatz eines illegalen „Bernsteinrausches“, eines neuen „Wilden Westens“.
Hunderte Hektar Wald und landwirtschaftliche Nutzflächen wurden in eine leblose Mondlandschaft verwandelt, wobei die intensivsten Bergbauaktivitäten zwischen 2014 und 2016 stattfanden, aber in den folgenden Jahren fortgesetzt wurden.
Leprosy of the Land, eine Recherche von Texty
Im Jahr 2018 veröffentlichte die ukrainische Datenjournalismus-Agentur Texty die Publikation Leprosy of the Land, eine Recherche, in der sie maschinelle Lerntechniken einsetzte, um Fälle illegalen Bernsteinabbaus in der Ukraine aufzudecken.
Zunächst teilte ein Algorithmus Abschnitte von Satellitenbildern in visuell einheitliche Unterabschnitte auf. Wenn ein Bild also halb grüner Wald und halb schmutziges Feld war, würde es das Bild in diese beiden Unterabschnitte aufteilen.
Ein anderer Algorithmus fand heraus, welche Unterabschnitte den vorhandenen Beispielen des Bernsteinabbaus am ähnlichsten sind, die ein ausgeprägtes pockennarbenartiges Muster von Löchern im Boden aufweisen.
Schließlich untersuchten die Journalisten die Beispiele, die der Algorithmus gefunden hatte, um sicherzugehen, dass das, was er für den Bernsteinabbau hielt, nicht in Wirklichkeit etwas anderes war, wie etwa Entwaldung.
Beispiele für illegalen Bernsteinabbau finden
In diesem Kurs werden wir uns auf die Methoden konzentrieren, die Texty verwendet hat, um einen Algorithmus zu trainieren, der visuelle Beispiele illegalen Bernsteinabbaus in einer riesigen Menge von Satellitenbildern erkennt, die zuvor von einem anderen Algorithmus in Unterabschnitte unterteilt wurden.
Wie in der ersten Lektion erwähnt, bedeutet dies, dass wir mit überwachtem Lernen experimentieren werden. Sie werden lernen, wie der Algorithmus anhand von gekennzeichneten Beispielen lernen kann, das gleiche Muster in Bildern zu erkennen, die er noch nie zuvor gesehen hat.
Sie werden auch lernen, wie Sie den Prozess für Ihre eigenen Geschichten wiederholen können: vom Finden der Beispiele, die Sie brauchen, über das Training eines maschinellen Lernmodells, um zu erkennen, was Sie suchen, bis hin zum Testen und Bewerten des Modells, um sicherzustellen, dass es zuverlässige Ergebnisse liefert.
Ist ML das richtige Tool für dieses Problem?
Aber warum war maschinelles Lernen das richtige Tool, um die Informationen zu finden, die Texty suchte?
Bei der klassischen Programmierung müssen Sie Schritt-für-Schritt-Anweisungen angeben, die der Computer befolgen soll. Mit diesem Ansatz lassen sich zwar eine Vielzahl von Problemen lösen, aber er ist nicht in der Lage, Beispiele des illegalen Bernsteinabbaus in einer riesigen Menge von Satellitenbildern zu erkennen. Es gibt einfach so viele visuelle Elemente, dass der Computer berücksichtigen müsste, dass es unmöglich ist, ein Schritt-für-Schritt-Regelwerk zu erstellen, das der Software beibringen könnte, zwischen echten Beispielen illegalen Bernsteinabbaus und Dingen, die ihm nur ähnlich sehen könnten, zu unterscheide
Glücklicherweise sind maschinelle Lernsysteme gut positioniert, um dieses Problem zu lösen.
Fokus auf den Prozess
Denken Sie daran, dass das, was Sie in diesem Kurs lernen werden - wie man illegalen Bernsteinabbau entdeckt - nur ein Beispiel dafür ist. Nach dem gleichen Verfahren kann maschinelles Lernen für eine Reihe verschiedener journalistischer Aufgaben eingesetzt werden und kann sogar zur Analyse verschiedener Arten von Inhalten, nicht nur von Bildern, verwendet werden. Am Ende des Kurses werden wir einige andere Anwendungsfälle besprechen. Denken Sie beim Durcharbeiten der Übung daran, sich auf den Prozess und nicht auf die spezifische Fallstudie zu konzentrieren.
Nun, bevor wir mit der eigentlichen Übung beginnen, müssen wir einige Minuten für die Besprechung und Einrichtung des Tools aufwenden, das wir in den nächsten Lektionen zu verwenden lernen werden: Google Cloud AutoML Vision.
-
Maschinelles Lernen, Journalismus und Sie
LektionWie das maschinelle Lernen in Ihr persönliches und berufliches Leben eintritt. -
-
Google Tabellen: Visualisierung von Daten
LektionLernen Sie, Visualisierungen zu erstellen, die Ihnen helfen, die Daten zu interpretieren und datenbasierte Geschichten zu erzählen.