Lewati ke konten utama
Buka dashboard
Tidak yakin harus mulai dari mana? Ikuti kuis singkat untuk mendapatkan rekomendasi yang dipersonalisasi.
Pelajaran 4 dari 7
Tanggal persiapan
Hands-on Machine Learning
Apa itu Pembelajaran Mesin?
Menginvestigasi cerita dengan pembelajaran mesin
Google Cloud AutoML Vision
Tanggal persiapan
Latih model Pembelajaran Mesin Anda
Evaluasi dan Uji
check_box_outline_blank Hands-on Machine Learning: Take the Quiz
Kursus
0% selesai
5 menituntuk menyelesaikan

Tanggal persiapan

image12_3.png
Menilai kasus penggunaan dan sumber serta mempersiapkan data Anda
image12_3.png

Apa itu data pelatihan?

image12_3_zA6aI42.png

Jika telah mengatur akun Google Cloud Anda dengan benar, sekarang Anda siap untuk latihan. Dalam pelajaran ini, Anda akan mempelajari pertanyaan apa saja yang harus Anda tanyakan saat mengumpulkan data pelatihan dan cara mempersiapkannya untuk digunakan oleh AutoML Vision.



Dengan data pelatihan, yang kita maksud adalah contoh dari yang kita inginkan untuk model Pembelajaran Mesin kenali dan kategorikan. Dalam kasus kita, hal ini berarti menyediakan sekumpulan citra satelit dan memberi tahu algoritme mana yang merupakan contoh penambangan ambar dan mana yang bukan.


image12_3_zA6aI42.png

Mulailah dengan kasus penggunaan Anda

image40_2.png

Saat menyusun set data, selalu mulai dari masalah yang Anda minta Pembelajaran Mesin untuk membantu Anda selesaikan. Pertimbangkan pertanyaan-pertanyaan berikut:



  1. Hasil apakah yang ingin Anda capai?
  2. Jenis kategori apakah yang perlu Anda kenali untuk mencapai hasil ini?
  3. Dapatkah manusia mengenali kategori tersebut? Meskipun AutoML Vision dapat menangani lebih banyak gambar dan kategori daripada manusia, jika manusia tidak dapat mengenali kategori tertentu, maka AutoML Vision akan mengalami kesulitan juga.
  4. Jenis contoh apa sajakah yang paling mencerminkan jenis dan rentang data yang akan diklasifikasikan sistem Anda?



Pikirkan tentang sebuah cerita yang sedang Anda kerjakan. Bagaimana jawaban atas pertanyaan tersebut mengubah pendekatan Anda terhadap cerita dan apakah Anda memerlukan Pembelajaran Mesin untuk itu?


image40_2.png

Menilai kasus penggunaan Anda

image5_3.png

Dalam kasus kita, ini bisa menjadi jawaban bagi kita:



  1. Kita ingin model dapat mengenali contoh penambangan ambar dalam citra satelit yang akan kita tampilkan.
  2. Kita hanya membutuhkan dua kategori: "YA: gambar ini menyertakan elemen yang konsisten dengan pola yang biasanya menunjukkan aktivitas penambangan ambar" dan "TIDAK: gambar ini tidak menyertakan elemen yang mengarahkan penambangan ambar".
  3. Sebagian besar ya: penambangan ambar cukup dikenali dalam citra satelit karena pola lubang di tanah yang seperti bopeng. Namun kita akan melihat dalam tahap pengujian bahwa itu mungkin tidak selalu semudah yang kita pikirkan.
  4. Latar belakang berbeda, kepadatan lubang berbeda, warna berbeda. Semakin beragam contoh dalam set data kita, semakin baik algoritme belajar.
image5_3.png

Asal data Anda

image17_3.png

Setelah Anda menetapkan data apa saja yang Anda butuhkan, langkah selanjutnya adalah menemukan cara untuk mendapatkannya. Dalam kasus kita, kita sudah memiliki set data yang disediakan oleh Texty. Tapi pikirkan apa yang mungkin menjadi kasus penggunaan Anda sendiri: Bagaimana dan di mana Anda dapat menemukan gambar yang Anda butuhkan?



Anda mungkin dapat memperolehnya dari yang organisasi Anda kumpulkan atau dari pihak ketiga. Dalam kedua kasus tersebut, pastikan untuk meninjau peraturan tentang perlindungan data di wilayah Anda dan lokasi yang aplikasi Anda akan layani.



Tidak ada data pelatihan yang benar-benar 'tidak bias', Anda dapat sangat meningkatkan peluang Anda untuk membangun model Pembelajaran Mesin yang adil jika Anda dengan cermat mempertimbangkan sumber bias potensial dalam data Anda, dan mengambil langkah-langkah untuk mengatasinya. Tinjau Pengantar Pembelajaran Mesin untuk mencari tahu lebih lanjut.


image17_3.png

Siapkan data Anda

image50_2.png

Ada beberapa hal lagi yang perlu diperhatikan saat Anda mengumpulkan data pelatihan:



Sertakan cukup banyak contoh berlabel di setiap kategori: Minimum yang diperlukan oleh AutoML Vision adalah 100 contoh per label. Secara umum, semakin banyak gambar berlabel yang dapat Anda bawa ke proses pelatihan, semakin baik model Anda nantinya.



Penting untuk menyertakan jumlah contoh pelatihan yang hampir sama untuk setiap kategori. Jika Anda memiliki banyak data untuk satu label, gunakan hanya sebagian saja untuk menghindari jumlah contoh yang sangat berbeda per kategori.



Temukan gambar yang secara visual mirip dengan yang Anda rencanakan untuk diminta oleh model untuk dikategorikan. Idealnya, contoh pelatihan Anda adalah data dunia nyata yang diambil dari set data sama yang Anda rencanakan untuk menggunakan model pengklasifikasian.

image50_2.png
Selamat! Anda baru saja selesai Tanggal persiapan in progress
Recommended for you
Bagaimana saya harus menjawab ini?
Masukan Anda akan membantu kami terus meningkatkan kualitas pelajaran.
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?