Evaluasi dan Uji
Cara menafsirkan hasil model Anda dan mengevaluasi kinerjanya
Presisi dan Perolehan
Setelah model dilatih, Anda akan melihat ringkasan performa model dengan skor untuk "Presisi" dan "Perolehan".
Presisi memberi tahu kita berapa proporsi gambar yang diidentifikasi oleh model sebagai positif yang seharusnya dikategorikan seperti itu. Perolehan malah memberi tahu kita berapa proporsi gambar positif aktual yang diidentifikasi dengan benar.
Model kita berkinerja sangat baik di kedua kategori, dengan skor di atas 97%. Mari kita lihat artinya dengan lebih detail.
Evaluasi kinerja model
Klik "Evaluasi" di menu atas dan mari jelajahi antarmukanya. Pertama, hal ini menunjukkan kepada kita skor pada presisi dan perolehan. Dalam kasus kita, skor presisi memberi tahu bahwa 97% gambar uji yang diidentifikasi oleh model sebagai contoh penambangan ambar memang menunjukkan jejak penambangan ambar.
Sebaliknya, skor penarikan memberi tahu kita bahwa 97% dari gambar uji yang menunjukkan contoh penambangan ambar diberi label yang benar oleh model tersebut.
Batas keyakinan adalah tingkat keyakinan yang harus diberikan label oleh model. Semakin rendah nilainya, semakin banyak gambar yang akan diklasifikasikan oleh model, tetapi semakin tinggi risiko kesalahan klasifikasi beberapa gambar.
Jika Anda ingin menggali lebih dalam dan juga menjelajahi kurva presisi-perolehan, ikut tautan di antarmuka untuk mempelajari lebih lanjut.
Positif palsu dan negatif palsu
Selanjutnya, mari kita lihat Matriks Kebingungan. Semakin tinggi skor pada latar belakang biru, semakin baik performa model. Dalam contoh ini, skornya sangat bagus.
Semua gambar yang seharusnya diberi label negatif (tidak ada penambangan ambar) dikenali oleh model dan 82% gambar yang menyertakan jejak penambangan ambar diberi label dengan benar.
Kita tidak memiliki positif palsu - tidak ada gambar yang salah diberi label sebagai contoh penambangan ambar - dan hanya 12% dari negatif palsu: gambar yang menunjukkan jejak penambangan ambar yang gagal dikenali oleh model.
Hal ini bagus untuk tujuan penyelidikan kita tentang penambangan ambar ilegal: lebih baik melewatkan beberapa contoh positif daripada memberikan bukti gambar penambangan ambar yang tidak benar-benar menampilkan itu.
Klik pada filter kiri jika Anda ingin melihat gambar uji mana saja yang diklasifikasikan dengan benar atau salah berdasarkan model.
Belum yakin apakah Anda bisa mempercayai modelnya? Dengan mengklik "Uji & Gunakan", Anda dapat mengupload gambar satelit baru - dengan atau tanpa jejak penambangan kuning - untuk melihat apakah model memberi label dengan benar.
Uji dan latih lagi
Beberapa pertimbangan terakhir sebelum kita selesai:
Anda mungkin ingin tahu bagaimana model tersebut mendapatkan beberapa jawaban yang salah ketika kita telah memberi tahu semua jawaban yang benar untuk memulai. Jika ya, Anda mungkin ingin meninjau pemisahan menjadi set pelatihan, validasi, dan pengujian yang dijelaskan di pelajaran sebelumnya.
Untuk contoh ini, hampir semua gambar diklasifikasikan dengan benar. Namun hal itu tidak selalu terjadi. Jika tidak puas dengan performa model Anda, Anda selalu dapat memperbarui dan menyempurnakan set data, serta memperbaiki dan melatih model tersebut. Anda dapat dengan cermat menganalisis yang salah pada perulangan pertama dan, misalnya, menambahkan lebih banyak gambar yang mirip dengan yang diklasifikasikan salah oleh model ke set pelatihan Anda.
Bagi manusia, belajar adalah proses yang berulang-ulang.
-
-
-
Penjelajah Data Publik: Mengakses dunia data.
PelajaranGunakan kumpulan data berkualitas tinggi untuk membuat visual yang menarik.