Ikhtisar pelajaran
Belajar untuk membersihkan data yang dipersiapkan untuk visualisasi.
Dalam pelajaran sebelumnya, Google Sheets: Mengeruk data dari internet,, kita belajar cara mengimpor tabel dari Web menggunakan importHTML. Dalam pelajaran ini, kita akan belajar cara membersihkan data sehingga siap untuk analisis dan visualisasi.
- Membuat data dapat diedit.
- Mengedit data
- Pengeditan batch dengan Find and replace.
Untuk pelajaran Jurnalisme Data lainnya, kunjungi:
newsinitiative.withgoogle.com/training/course/data-journalism
Membuat data dapat diedit.
“Membersihkan data” berarti membuat data dapat digunakan untuk digunakan: memastikan tabel memiliki integritas, bebas dari ketidakkonsistenan, dan terstruktur sedemikian rupa sehingga dapat mengerti komputer. Itu berarti kita akan menghapus baris duplikat, menghapus karakter yang tidak diinginkan, dan memastikan bahwa kolom hanya menyimpan satu jenis data, misalnya angka atau teks, tetapi tidak keduanya. Pertama-tama, kita harus membuat data dapat diedit.
Tabel ini menunjukkan hasil dari importHTML. Dalam formulir ini, setiap perubahan pada sumber data (halaman Wikipedia) akan secara otomatis tercermin di sini, dan diperbarui setidaknya satu jam sekali. Namun, kita tidak dapat mengedit nilai dalam sel untuk menghapus karakter yang tidak diinginkan. Kita akan menggunakan paste special di Google Sheets untuk membuat snapshot statis data. Dengan begini, kita akan kehilangan kemampuan untuk memperbarui tabel secara otomatis melalui importHTML, tetapi kita akan dapat mengeditnya.
Pilih semua data dengan mengklik kiri di kotak kiri bagian atas sheet Anda. Setelah semua sel disorot, klik Edit > Copy. Pilih Edit > Paste special > Paste values only. Sekarang kita dapat mengedit tabelnya.
Untuk mempermudah pengeditan, kita akan membekukan baris dengan nama kolom. Layangkan kursor mouse ke garis tepat di atas baris 1 di atas bilah abu-abu. Anda akan melihat kursor berubah menjadi sarung tangan. Seret bilah ke bagian bawah baris 1 dan tinggalkan di situ. Sekarang baris paling atas dibekukan.
Mengedit data
iimportHTML akan mengimpor karakter sisa dari tabel Wikipedia yang berguna untuk manusia, tetapi tidak untuk komputer. Mari kita hapus itu dan jadikan tabel kita lebih bersih!
Karena kita tidak memerlukan kolom F untuk latihan ini, klik kanan pada huruf F di bagian atas kolom dan pilih Delete.
Ada huruf "F" di sebelah nomor 13 di baris A14, dan "TS3" di sebelah nomor 4 di sel B27. Kita akan menghapus karakter ini sehingga hanya angka 13 dan 4 yang tersisa.
Hapus huruf tambahan dalam sel B40 dan B48, sehingga hanya 19 dan 8 yang tersisa. Lakukan hal yang sama di D17 untuk menghapus "F8" terdepan.
Pengeditan batch dengan Find and replace.
Sekarang, lihat kolom C. Mari kita hapus karakter *terdepan dan terakhir di batch, alih-alih baris demi baris, menggunakan fitur Find and replace.
Pilih kolom C dengan mengklik kiri pada huruf C di bagian atas kolom. Pilih Edit > Find and replace.
Di kotak teks pertama ketik simbol asterisk: * (itulah karakter yang ingin kita temukan di kolom C). Biarkan Replace with dengan teks kosong agar tanda bintang tidak diganti dengan apa pun, yang artinya itu akan dihapus.
Pastikan opsi Search menyatakan Specific range dan mencerminkan kolom yang baru saja Anda pilih. Biarkan kotak centang tidak dicentang.
Pilih Replace all.Perhatikan Google Sheets akan memberi tahu bahwa Replaced 100 instances of * with (tidak ada). Itu berarti Anda berhasil menghapus 100 karakter dalam 50 baris hanya dengan beberapa klik!
Pilih Done. Tabel kita sekarang bersih dan siap untuk dikerjakan. Dalam pelajaran berikutnya, kita akan menghasilkan visualisasi dan mendapatkan wawasan dari data.
Selamat!
Anda menyelesaikan "Google Sheets: Membersihkan data.”
Untuk terus membangun keterampilan jurnalisme digital Anda dan berupaya menuju sertifikasi Google News Initiative, buka situs web Pusat Pelatihan kami dan ambil pelajaran lainnya:
Untuk pelajaran Jurnalisme Data lainnya, kunjungi:
newsinitiative.withgoogle.com/training/course/data-journalism
-
Google Cloud AutoML Vision
PelajaranPelajari cara menyiapkan AutoML Vision untuk mempersiapkan latihan kursus -
-