Lewati ke konten utama
Buka dashboard
Tidak yakin harus mulai dari mana? Ikuti kuis singkat untuk mendapatkan rekomendasi yang dipersonalisasi.
Pelajaran 11 dari 18
Google Sheets: Mengeruk data dari internet
Data Journalism
Izin: Sumber Google Data.
Panduan Ringkas Pencarian Himpunan Data
Penjelajah Data Publik: Mengakses dunia data.
Google Consumer Surveys: Dapatkan wawasan nyata.
Google Trends: Memahami data.
Google Data GIF Maker
Google Sheets: Memvisualisasikan data
Memvisualisasikan Data: Template Flourish.
Sumber Data: Global Forest Watch
Google Sheets: Membersihkan data
Studio Data: Buat visualisasi data interaktif.
Memvisualisasikan Data: Tilegrams Lanjutan
Google Trends: Meningkatkan hasil pencarian Anda.
Sumber Data: Databot Pemilu.
check_box_outline_blank Data Journalism: Take the Quiz
Kursus
0% selesai
5 menituntuk menyelesaikan

Google Sheets: Mengeruk data dari internet

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg
Buat rangkaian data Anda sendiri menggunakan Google Sheets.
DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg

Ikhtisar pelajaran

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Belajar membuat rangkaian data Anda sendiri menggunakan Google Sheets.


Ada sejumlah besar data tersedia di internet yang dapat Anda gunakan untuk meneliti dan memvisualisasikan cerita. Menemukan data, dan memasukkannya ke dalam format yang dapat Anda kerjakan adalah langkah pertama.



  1. Memulai spreadsheet baru.
  2. Menemukan data yang dapat diandalkan.
  3. Mengimpor data ke Google Sheets.
  4. Pemecahan masalah dan pesan kesalahan. 
  5. Menampilkan data Anda.



Untuk pelajaran Jurnalisme Data lainnya, kunjungi:

https://newsinitiative.withgoogle.com/training/course/data-journalism

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Memulai spreadsheet baru.


Pertama-tama, Anda perlu membuat spreadsheet kosong. Buka sheets.google.com. Di bawah Start a new spreadsheet, klik ikon +.


Untuk memberi nama spreadsheet Anda, klik teks di sudut kiri atas. Mari beri yang ini judul "Highest Grossing Movies."

Menemukan data yang dapat diandalkan.

Dengan sumber data dari situs pemerintah, publikasi ilmiah, Wikipedia, Google Public Data Explorer, dan yang lainnya, Anda dapat mengetahui kisah data tentang hampir semua topik. Dalam pelajaran ini, kita akan berlatih dengan data tentang film.



Buka google.com dan cari highest grossing films. Salah satu tautan pertama adalah entri Wikipedia dengan beberapa tabel. Satu daftar, yang berjudul “the top 50 highest-grossing films of all time” yang mengutip beberapa referensi, jadi kita akan menggunakan yang itu. Selalu periksa untuk memastikan bahwa Anda mengumpulkan data dari sumber yang dapat diandalkan. 


Untuk mengimpor tabel ini ke Google Sheets, salin alamat halaman Wikipedia dengan menyorot URL, klik kanan padanya, dan pilih copy. 

Mengimpor data ke Google Sheets.

Kita akan menggunakan importHTML untuk mengimpor tabel dari Wikipedia ke spreadsheet kita. Formula kuat ini dibangun ke dalam Google Sheets untuk membantu Anda mengimpor tabel atau daftar dari halaman web. Untuk mempelajari lebih lanjut tentang cara importHTML bekerja dan melihat contoh, bacalah halaman dokumentasi Google Sheets.



Alat importHTML membutuhkan tiga parameter untuk berfungsi: 1) URL2) jenis data yang kita kumpulkan, baik berupa tabel maupun daftar3) angka yang mewakili posisi tabel atau daftar dalam kode HTML. Dalam contoh ini, contoh pertama dari tabel akan dinomori sebagai satu, karena tabel yang kita inginkan adalah yang pertama yang muncul dalam HTML. Anda dapat menggunakan coba-coba untuk menemukan posisi tabel (1, 2, 3, dll.) atau mengklik kanan halaman web, pilih  Inspect > Find untuk menemukan tabel dalam kode.


Buka lembar kosong yang Anda buat dan menuju ke sel A1. Jenis:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "tabel", 1)


Perhatikan bahwa URL dan jenis elemen (dalam hal ini, tabel) berada antara tanda kutip  —  ini akan membuat parameternya berwarna hijau. Parameter terakhir adalah angka yang tidak berada dalam tanda kutip dan akan berwarna biru.

Pemecahan masalah dan pesan kesalahan.

ScrapingData_Troubleshooting_and_error_messages.jpg

Jika Anda mendapati GALAT! Pesan, periksa untuk memastikan bahwa tanda kutipnya adalah tanda kutip ganda seperti yang ditunjukkan dalam contoh. 



Jika Anda mendapatkan galat VALUE!, periksa untuk memastikan bahwa Anda tidak memiliki tanda kurung atau tanda kutip tambahan di dalam sel.

ScrapingData_Troubleshooting_and_error_messages.jpg

Menampilkan data Anda.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Setelah rumus ImportHTML Anda benar, tekan enter dan beri Google Sheets beberapa detik. Tabelnya akan memuat semua baris dan kolom terformat. 



Perhatikan bahwa ada beberapa elemen yang perlu dihapus agar kita dapat memvisualisasikan data ini. Kita akan mempelajari ini dalam pelajaran berikutnya, “Google Sheets: Membersihkan data.”

ScrapingData_Displaying_your_data_mcss7kz.jpg

Selamat!

CleaningData_Overview_9zSutWO.jpg

Anda menyelesaikan "Google Sheets: Mengeruk data dari internet.”



Untuk terus membangun keterampilan jurnalisme digital Anda dan berupaya menuju sertifikasi Google News Initiative, buka situs web Pusat Pelatihan kami dan ambil pelajaran lainnya:



Untuk pelajaran Jurnalisme Data lainnya, kunjungi:

newsinitiative.withgoogle.com/training/course/data-journalism


CleaningData_Overview_9zSutWO.jpg
Selamat! Anda baru saja selesai Google Sheets: Mengeruk data dari internet in progress
Recommended for you
Bagaimana saya harus menjawab ini?
Masukan Anda akan membantu kami terus meningkatkan kualitas pelajaran.
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?