บทเรียนที่ 4 จาก 8

เครื่องจักรมีการเรียนรู้อย่างไร

5 นาที บทเรียนที่ต้องศึกษาต่อ

เครื่องจักรมีการเรียนรู้อย่างไร

รายละเอียดเบื้องต้นแบบเป็นขั้นตอนเกี่ยวกับกระบวนการฝึกสอน ML

ดาวน์โหลด Lesson

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

เราได้บอกใบ้ไปบางส่วนแล้วว่าตัวแบบในการทำงานของ AI ต้องผ่าน “การฝึกสอน” เพื่อให้ได้ผลลัพธ์อย่างที่คาดหวังในบทเรียนนี้คุณจะได้เรียนรู้เกี่ยวกับขั้นตอนต่าง ๆ ในกระบวนการฝึกสอนจากกรณีศึกษาเฉพาะด้าน

เป้าหมายคือเพื่อช่วยให้คุณเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องจักร แต่ยังไม่ถึงขนาดที่คุณจะสามารถจำลองกระบวนการนี้ไปใช้ได้ด้วยตัวเอง

ก่อนตัดสินใจใช้ระบบการเรียนรู้ของเครื่องจักร ให้ถามตัวเองก่อนว่า:คำถามใดที่ฉันกำลังต้องการคำตอบและฉันต้องการระบบการเรียนรู้ของเครื่องจักรเพื่อให้ได้สิ่งที่ต้องการหรือไม่

คุณมีคำถามอะไรที่ต้องการคำตอบ

ลองนึกดูว่าจะเป็นอย่างไรหากเว็บไซต์ของคุณเปิดรับความเห็นจากผู้อ่านบทความได้ในทุก ๆ วันมีความคิดเห็นเป็นจำนวนมากถูกโพสต์ไว้ และบางความเห็นอาจค่อนข้างรุนแรง

จะดีแค่ไหนหากระบบอัตโนมัติสามารถจำแนกประเภทความเห็นทั้งหมดที่โพสต์ในระบบของคุณ และสามารถระบุรายการที่ “อาจไม่เหมาะสม” และทำหมายเหตุกำกับไว้สำหรับผู้ดูแลเพื่อให้มีการพิจารณาทบทวนและปรับปรุงคุณภาพของการพูดคุย

และนี่คือปัญหาที่ระบบการเรียนรู้ของเครื่องจักรสามารถเข้ามาช่วยคุณได้และนี่คือสิ่งที่มันถูกใช้งานอยู่ในปัจจุบันดูรายละเอียดเพิ่มเติมได้ที่ Jigsaw's Perspective API

นี่เป็นตัวอย่างที่เราจะใช้เพื่อเรียนรู้เกี่ยวกับการฝึกสอนตัวแบบในการทำงานของระบบการเรียนรู้ของเครื่องจักร นอกจากนี้กระบวนการเดียวกันนี้ยังสามารถต่อยอดไปยังกรณีศึกษาอื่น ๆ ได้อีก

ประเมินรูปแบบการใช้งานของคุณ

ในการนำเสนอตัวแบบเพื่อตรวจหาความเห็นที่อาจไม่เหมาะสม คุณจะต้องมีข้อมูลก่อนในเบื้องต้นซึ่งในกรณีนี้ก็คือตัวอย่างความเห็นที่คุณได้รับจากเว็บไซต์ของคุณแต่ก่อนที่จะจัดทำชุดข้อมูลของคุณ สิ่งที่สำคัญคือการพิจารณาว่าผลลัพธ์แบบใดที่คุณคาดหวัง

แม้แต่กับมนุษย์เอง การะบุว่าความเห็นใดอาจไม่เหมาะสมและไม่ควรเผยแพร่ในระบบออนไลน์อาจชี้ชัดลงไปได้ยากผู้ดูแลระบบสองคนอาจต้องช่วยกันแลกเปลี่ยนความคิดเกี่ยวกับความเห็นที่คิดว่า “ไม่เหมาะสม”คุณไม่สามารถคาดหวังให้อัลกอริทึมในการทำงาน “ทำงานได้อย่างถูกต้อง” เสมอไป

ระบบการเรียนรู้ของเครื่องจักรสามารถจัดการข้อมูลความเห็นเป็ฯจำนวนมากโดยใช้เวลาเพียงไม่กี่วินาที แต่สิ่งสำคัญคือจะต้องไม่ลืมว่านี่เป็นแค่ “การคาดเดา” จากการเรียนรู้ของระบบเท่านั้นบางครั้งระบบอาจให้คำตอบที่ไม่ถูกต้องหรือทำงานผิดพลาดได้

การสืบค้นข้อมูล

ถึงเวลาในการเตรียมชุดข้อมูลของคุณแล้วในกรณีศึกษาของเรา เราได้เรียนรู้ไปแล้วว่าข้อมูลประเภทใดที่เราต้องการ และจะค้นหาได้จากที่ไหน ซึ่งก็คือความเห็นที่โพสต์ในเว็บไซต์ของคุณ

เนื่องจากคุณต้องการรูปแบบการทำงานของระบบการเรียนรู้ของเครื่องจักรเพื่อตรวจหาความเห็นที่ไม่เหมาะสม คุณจะต้องจัดทำข้อมูลตัวอย่างข้อความที่คุณต้องการใช้เพื่อแยกประเภท (ความเห็น) รวมทั้งหมวดหมู่หรือหมายเหตุกำกับเพื่อให้ ML คาดการณ์ (“ไม่เหมาะสม” หรือ “ไม่มีปัญหา”)

สำหรับรูปแบบการใช้งานอื่น ๆ คุณอาจสามารถหาข้อมูลได้ง่ายกว่านี้คุณจะต้องหาข้อมูลเหล่านี้จากคลังข้อมูลของหน่วยงานของคุณหรือจากบุคคลภายนอกไม่ว่าจะในกรณีใด กรุณาศึกษาระเบียบข้อบังคับด้านการปกป้องข้อมูลในพื้นที่และในสถานที่ที่คุณจะใช้งานระบบ

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

หลังจากรวบรวมข้อมูลได้แล้ว และก่อนที่จะป้อนข้อมูลเข้าเครื่อง คุณจะต้องวิเคราะห์ข้อมูลนี้อย่างละเอียดก่อนผลการทำงานของระบบการเรียนรู้ของเครื่องจักรตามรูปแบบที่คุณกำหนดจะดีและสมบูรณ์ก็โดยขึ้นอยู่กับข้อมูลที่คุณจัดไว้ (จะมีกล่าวถึง “ความเป็นธรรม” ในบทเรียนถัดไป)คุณจะต้องทบทวนรูปแบบการใช้งานของคุณว่าอาจส่งผลกระทบต่อบุคคลที่เกี่ยวข้องโดยตัวแบบการทำงานนี้อย่างไร

นอกจากนี้ เพื่อให้สามารถฝึกสอนรูปแบบการทำงานได้อย่างมีประสิทธิภาพ คุณจะต้องมีตัวอย่างกำกับมากเพียงพอและกระจายข้อมูลนี้อย่างเท่าเทียมกันในหมวดหมู่ต่าง ๆและจะต้องจัดหาชุดข้อมูลที่ครอบคลุม โดยพิจารณาจากบริบทและภาษาที่ใช้ เพื่อให้รูปแบบการทำงานนี้ครอบคลุมตัวแปรต่าง ๆ ที่เกี่ยวข้องในการทำงานของคุณ

การเลือกอัลกอริทึม

หลังจากเตรียมชุดข้อมูลเสร็จสิ้น คุณจะต้องเลือกอัลกอริทึมสำหรับระบบการเรียนรู้ของเครื่องจักรที่จะฝึกสอนอัลกอริทึมทุกตัวจะมีวัตถุประสงค์เฉพาะคุณจะต้องเลือกอัลกอริทึมที่เหมาะสมตามผลลัพธ์ที่คุณคาดหวัง

ในบทเรียนก่อนหน้าเราได้เรียนรู้เกี่ยวกับแนวทางต่าง ๆ ที่ใช้ในระบบการเรียนรู้ของเครื่องจักรเนื่องจากกรณีศึกษาของเราจะต้องอาศัยชุดข้อมูลที่มีหมายเหตุกำกับเพื่อให้สามารถแยกประเภทความเห็นที่ “ไม่เหมาะสม” หรือ “ไม่มีปัญหา” ระบบที่เราต้องใช้ในที่นี้จึงเป็นระบบการเรียนรู้แบบมีการกำกับดูแล

Google Cloud AutoML Natural Language คือหนึ่งในอัลกอริทึมที่ช่วยให้คุณสามารถก้าวไปสู่ผลลัพธ์ที่คาดหวังนี้ได้แต่ไม่ว่าคุณจะเลือกอัลกอริทึมใด ให้ปฏิบัติตามคำแนะนำที่ระบุไว้เกี่ยวกับการกำหนดรูปแบบชุดข้อมูลที่จะใช้เพื่อฝึกสอน

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

จากนี้เราจะเข้าสู่ขั้นตอนการฝึกสอนที่ถูกต้องโดยเราจะใช้ข้อมูลนี้เพื่อปรับปรุงความสามารถของตัวแบบในการทำงานไปเรื่อย ๆ สำหรับการคาดการณ์ความเห็นที่ไม่เหมาะสมและความเห็นที่ไม่มีปัญหาให้ต้องกังวลเราจะป้อนข้อมูลส่วนใหญ่ของเราไปยังอัลกอริทึม รอแปป เอาล่ะ ตัวแบบการทำงานของเราผ่านการฝึกสอนเรียบร้อยแล้ว

แต่ทำไมถึงบอกว่าข้อมูล "ส่วนใหญ่”ก็เพื่อให้แน่ใจว่าตัวแบบการทำงานจะเรียนรู้ได้อย่างถูกต้อง โดยคุณจะต้องแจ้งข้อมูลออกเป็นสามส่วนได้แก่

ชุดข้อมูลการฝึกสอนสิ่งที่ตัวแบบของคุณ “จะรับรู้” และทำการเรียนรู้
ชุดข้อมูลยืนยันเป็นอีกกระบวนการฝึกสอนที่แยกออกจากกันเพื่อปรับปรุงไฮเปอร์พารามิเตอร์ต่าง ๆ ซึ่งเป็นตัวแปรเพื่อระบุโครงสร้างของตัวแบบการทำงาน
ชุดข้อมูลทดสอบจะเข้าสู่ขั้นตอนนี้หลังจากการฝึกสอนเราจะใช้ข้อมูลนี้เพื่อทดสอบประสิทธิภาพในการทำงานของตัวแบบกับข้อมูลที่ระบบไม่เคยพบมาก่อน

การประเมินผลลัพธ์

คุณจะทราบได้อย่างไรว่าตัวแบบการทำงานเรียนรู้ในการค้นหาความเห็นที่อาจไม่เหมาะสมได้อย่างถูกต้อง

หลังจากการฝึกสอนเสร็จสิ้น อัลกอริทึมนี้จะระบุข้อมูลเบื้องต้นเกี่ยวกับผลการทำงานของตัวแบบตามที่เราได้กล่าวไปก่อนหน้านี้ คุณไม่สามารถคาดหวังให้ตัวแบบการทำงานทำงานได้อย่างถูกต้อง 100% เสมอไปคุณจะต้องตัดสินเองว่าผลลัพธ์ใดที่ “ดีเพียงพอ” ตามสถานการณ์แวดล้อม

ประเด็นหลักที่คุณต้องพิจารณาคือการประเมินตัวแบบการทำงานของคุณว่าสามารถระบุข้อผิดพลาดได้อย่างถูกต้องและไม่มีจุดบกพร่องที่น่ากังวลใด ๆในกรณีของเรา การแจ้งผลที่ผิดพลาดจะหมายถึงความเห็นที่ไม่เป็นปัญหาแต่ถูกแจ้งว่าไม่เหมาะสมคุณสามารถทำการยกเลิกได้ง่าย ๆ และให้ระบบลองทำงานต่อไปการแจ้งผลว่าความเห็นไม่มีปัญหาที่ผิดพลาดคือกรณีที่มีความเห็นที่ไม่เหมาะสม แต่ระบบไม่สามารถแจ้งเตือนว่าความเห็นดังกล่าวไม่เหมาะสมไม่ใช่เรื่องยากในการทำความเข้าใจว่าความผิดพลาดแบบใดที่คุณไม่ต้องการให้เกิดขึ้นกับตัวแบบการทำงานของคุณ

การประเมินด้านการข่าว

การประเมินผลลัพธ์ของกระบวนการฝึกสอนไม่ได้สิ้นสุดที่การวิเคราะห์ด้านเทคนิคถึงตอนนี้ ปณิธานและแนวทางในการทำงานของนักข่าวจะถูกนำมาใช้เพื่อช่วยคุณในการตัดสินใจว่าจะใช้ข้อมูลจากอัลกอริทึมการทำงานอย่างไร

เริ่มจากการพิจารณาก่อนว่าตอนนี้คุณมีข้อมูลที่ก่อนหน้านี้ไม่มีหรือไม่ และข้อมูลดังกล่าวคุ้มค่าต่อการนำเสนอข่าวหรือไม่ข้อมูลสัมทับกับสมมติฐานเดิมของคุณหรือทำให้คุณได้มุมมองใหม่ที่คุณไม่เคยมองมาก่อนหรือไม่

ตอนนี้คุณน่าจะเข้าใจมากขึ้นเกี่ยวกับการทำงานของระบบการเรียนรู้ของเครื่องจักร และคุณอาจอยากรู้ว่ามันสามารถทำอะไรได้บ้างแต่เรายังไม่พร้อมเข้าสู่เรื่องนี้บทเรียนถัดไปจะเป็นการแนะนำข้อกังวลที่สำคัญที่สุดเกี่ยวกับระบบการเรียนรู้ของเครื่องจักรซึ่งก็คืออคติ

ยินดีด้วย คุณทำสำเร็จแล้ว เครื่องจักรมีการเรียนรู้อย่างไร ใช่ กำลังดำเนินการอยู่

แนะนำสำหรับคุณ

open_in_new

ทำความเข้าใจขนาดและรูปแบบของโฆษณา

บทเรียน

ทำความเข้าใจว่าขนาดและรูปแบบของโฆษณาส่งผลต่อการกำหนดราคาและรายได้อย่างไร

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None
open_in_new

ปรับแต่งขั้นตอนการชำระเงิน

บทเรียน

ปรับปรุง Conversion ในการสมัครสมาชิก

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None
open_in_new

แนวทางต่าง ๆ เกี่ยวกับระบบการเรียนรู้ของเครื่องจักร

บทเรียน

เรียนรู้วิธีการแยกความแตกต่างของระบบการเรียนรู้ของเครื่องจักรแบบต่าง ๆ

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None

คุณจะให้คะแนนบทเรียนนี้อย่างไร

ความคิดเห็นของคุณจะช่วยให้เราปรับปรุงบทเรียนได้อย่างต่อเนื่อง

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

เครื่องจักรมีการเรียนรู้อย่างไร

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

คุณมีคำถามอะไรที่ต้องการคำตอบ

ประเมินรูปแบบการใช้งานของคุณ

การสืบค้นข้อมูล

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

การเลือกอัลกอริทึม

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

การประเมินผลลัพธ์

การประเมินด้านการข่าว

ทำความเข้าใจขนาดและรูปแบบของโฆษณา

ปรับแต่งขั้นตอนการชำระเงิน

แนวทางต่าง ๆ เกี่ยวกับระบบการเรียนรู้ของเครื่องจักร

ฉันกำลังมองหาแหล่งข้อมูลใน

เครื่องจักรมีการเรียนรู้อย่างไร

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

คุณมีคำถามอะไรที่ต้องการคำตอบ

ประเมินรูปแบบการใช้งานของคุณ

การสืบค้นข้อมูล

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

การเลือกอัลกอริทึม

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

การประเมินผลลัพธ์

การประเมินด้านการข่าว

ทำความเข้าใจขนาดและรูปแบบของโฆษณา

ปรับแต่งขั้นตอนการชำระเงิน

แนวทางต่าง ๆ เกี่ยวกับระบบการเรียนรู้ของเครื่องจักร