Zum Hauptinhalt springen
Zum Dashboard
Sie wissen nicht, wo Sie anfangen sollen? Nehmen Sie an einem kurzen Quiz teil, um personalisierte Empfehlungen zu erhalten.
Lektion 10 von 13
Google Tabellen: Bereinigung von Daten
Datenjournalismus
Berechtigungen: Google-Daten als Quelle
Schnellstart-Anleitung für die Datensatzsuche
Google Trends: die Daten verstehen
Google Data GIF Maker
Google Tabellen: Visualisierung von Daten
Datenquelle: Global Forest Watch
Daten visualisieren: Einführung in Tilegrams
Kurs
0% abgeschlossen
5 Minuten abzuschließen

Google Tabellen: Bereinigung von Daten

CleaningData_Overview_1pa7Mmc.jpg

Vorbereitung Ihrer Daten für die Analyse und Visualisierung.

CleaningData_Overview_1pa7Mmc.jpg

Übersicht über die Lektion

CleaningData_Overview.jpg

Lernen Sie, Daten zur Vorbereitung auf die Visualisierung zu bereinigen.


In der vorherigen Lektion, Google Tabellen: Sammeln von Daten aus dem Internet, haben wir gelernt, wie man eine Tabelle mit importHTML aus dem Web importiert. In dieser Lektion lernen wir, wie man die Daten bereinigt, damit sie für die Analyse und Visualisierung bereit sind.

  1. Daten editierbar machen.
  2. Bearbeitung der Daten. 
  3. Batch-Bearbeitung mit Suchen und Ersetzen.


Weitere Lektionen zum Thema Datenjournalismus finden Sie unter:

newsinitiative.withgoogle.com/training/course/data-journalism


CleaningData_Overview.jpg

Daten editierbar machen.

„Daten bereinigen“ bedeutet, sie verwendbar zu machen: sicherzustellen, dass eine Tabelle intakt, frei von Inkonsistenzen und so strukturiert ist, dass sie vom Computer verstanden werden kann. Das bedeutet, dass wir doppelte Zeilen entfernen, unerwünschte Zeichen löschen und sicherstellen, dass Spalten nur eine Art von Daten enthalten, z. B. Zahlen oder Text, aber nicht beides. Zuerst müssen wir die Daten editierbar machen.


Diese Tabelle zeigt das Ergebnis von importHTML. In dieser Form werden alle Änderungen an der Datenquelle (der Wikipedia-Seite) automatisch hier abgebildet und mindestens stündlich aktualisiert. Wir können jedoch die Werte in den Zellen nicht bearbeiten, um unerwünschte Zeichen zu entfernen. Wir verwenden Inhalte einfügen in Google Tabellen, um einen statischen Snapshot der Daten zu erstellen. Damit verlieren wir die Möglichkeit, die Tabelle automatisch über importHTML zu aktualisieren, aber wir können sie bearbeiten. 


Wählen Sie alle Daten aus, indem Sie mit der linken Maustaste auf das linke obere Rechteck in Ihrem Blatt klicken. Wenn alle Zellen markiert sind, klicken Sie auf Bearbeiten > Kopieren. Wählen Sie Bearbeiten > Inhalte einfügen > Nur Werte einfügen.  Wir sind nun in der Lage, die Tabelle zu bearbeiten. 


Um die Bearbeitung zu erleichtern, frieren wir die Zeile mit den Namen der Spalten ein. Bewegen Sie den Mauszeiger auf die Linie direkt über Zeile 1 über dem grauen Balken. Sie werden feststellen, dass sich der Cursor in einen Handschuh verwandelt. Ziehen Sie den Balken nach unten in Zeile 1 und lassen Sie ihn dort. Nun ist die obere Zeile eingefroren.

Bearbeitung der Daten.

importHTML importiert Restzeichen aus der Wikipedia-Tabelle, die für Menschen nützlich sind, aber nicht für Computer. Entfernen wir sie und machen wir unsere Tabelle sauberer!


Da wir die Spalte F für diese Übung nicht benötigen, klicken wir mit der rechten Maustaste auf den Buchstaben F oben in der Spalte und wählen wir Spalte löschen.


Es gibt einen Buchstaben „F“ neben der Nummer 13 in der Reihe A14 und einen „TS3“ neben der Nummer 4 in der Zelle B27. Wir werden diese Zeichen entfernen, so dass nur noch die Zahlen 13 und 4 übrig bleiben.


Entfernen Sie die zusätzlichen Buchstaben in den Zellen B40 und B48, so dass nur noch 19 und 8 übrig bleiben. Ebenso verfahren Sie in D17, um das vorangestellte „F8“ zu entfernen.

Batch-Bearbeitung mit Suchen und Ersetzen.

Werfen Sie nun einen Blick auf Spalte C. Entfernen Sie die vorangestellten und nachfolgenden * Zeichen in einem Batch, anstatt Zeile für Zeile mit der Funktion Suchen und ersetzen .


Wählen Sie Spalte C, indem Sie mit der linken Maustaste auf den Buchstaben C oben in der Spalte klicken. Wählen Sie Bearbeiten > Suchen und ersetzen.


Geben Sie im ersten Textfeld das Sternchen-Symbol: * ein (das ist das Zeichen, das wir in Spalte C suchen wollen). Lassen Sie das Textfeld Ersetzen durch leer, damit die Sterne durch nichts ersetzt werden, d. h. sie werden gelöscht. 


Stellen Sie sicher, dass im Feld Suchen Bestimmter Bereich steht und der Bereich die gerade ausgewählte Spalte widerspiegelt. Lassen Sie die Kontrollkästchen nicht markiert. 


Wählen Sie Alle ersetzen.Google Tabellen wird die Meldung “*” an 100 Stellen durch “(nichts)” ersetzt  anzeigen. Das bedeutet, dass Sie 100 Zeichen in 50 Zeilen mit wenigen Klicks erfolgreich entfernt haben! 


Wählen Sie Fertig. Wählen Sie Fertig. In der nächsten Lektion werden wir Visualisierungen erstellen und Erkenntnisse aus den Daten gewinnen. 

Herzlichen Glückwunsch!

VisualizingData_overview.jpg

Sie haben die Lektion „Google Tabellen: Bereinigung von Daten“ lernen.

Um Ihre Fähigkeiten im Bereich des digitalen Journalismus weiter auszubauen und auf die Zertifizierung durch die Google News Initiative hinzuarbeiten, besuchen Sie unser Schulungscenter und absolvieren Sie eine weitere Lektion.


Weitere Lektionen zum Thema Datenjournalismus finden Sie unter:

newsinitiative.withgoogle.com/training/course/data-journalism


VisualizingData_overview.jpg
Glückwunsch! Sie haben folgende Lektion abgeschlossen: Google Tabellen: Bereinigung von Daten Ja, der Prozess ist im Gange
Empfehlungen für Sie
Wie würden Sie diese Lektion bewerten?
Ihr Feedback hilft uns dabei, unsere Lektionen zu verbessern.
Verlassen und Fortschritt löschen?
Wenn Sie diese Seite verlassen, geht Ihr Fortschritt in der aktuellen Lektion verloren. Möchten Sie die Seite wirklich verlassen?