บทเรียนที่ 4 จาก 8

เครื่องจักรมีการเรียนรู้อย่างไร

5 นาที บทเรียนที่ต้องศึกษาต่อ

เครื่องจักรมีการเรียนรู้อย่างไร

รายละเอียดเบื้องต้นแบบเป็นขั้นตอนเกี่ยวกับกระบวนการฝึกสอน ML

ดาวน์โหลด Lesson

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

เราได้บอกใบ้ไปบางส่วนแล้วว่าตัวแบบในการทำงานของ AI ต้องผ่าน “การฝึกสอน” เพื่อให้ได้ผลลัพธ์อย่างที่คาดหวังในบทเรียนนี้คุณจะได้เรียนรู้เกี่ยวกับขั้นตอนต่าง ๆ ในกระบวนการฝึกสอนจากกรณีศึกษาเฉพาะด้าน

เป้าหมายคือเพื่อช่วยให้คุณเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องจักร แต่ยังไม่ถึงขนาดที่คุณจะสามารถจำลองกระบวนการนี้ไปใช้ได้ด้วยตัวเอง

ก่อนตัดสินใจใช้ระบบการเรียนรู้ของเครื่องจักร ให้ถามตัวเองก่อนว่า:คำถามใดที่ฉันกำลังต้องการคำตอบและฉันต้องการระบบการเรียนรู้ของเครื่องจักรเพื่อให้ได้สิ่งที่ต้องการหรือไม่

คุณมีคำถามอะไรที่ต้องการคำตอบ

ลองนึกดูว่าจะเป็นอย่างไรหากเว็บไซต์ของคุณเปิดรับความเห็นจากผู้อ่านบทความได้ในทุก ๆ วันมีความคิดเห็นเป็นจำนวนมากถูกโพสต์ไว้ และบางความเห็นอาจค่อนข้างรุนแรง

จะดีแค่ไหนหากระบบอัตโนมัติสามารถจำแนกประเภทความเห็นทั้งหมดที่โพสต์ในระบบของคุณ และสามารถระบุรายการที่ “อาจไม่เหมาะสม” และทำหมายเหตุกำกับไว้สำหรับผู้ดูแลเพื่อให้มีการพิจารณาทบทวนและปรับปรุงคุณภาพของการพูดคุย

และนี่คือปัญหาที่ระบบการเรียนรู้ของเครื่องจักรสามารถเข้ามาช่วยคุณได้และนี่คือสิ่งที่มันถูกใช้งานอยู่ในปัจจุบันดูรายละเอียดเพิ่มเติมได้ที่ Jigsaw's Perspective API

นี่เป็นตัวอย่างที่เราจะใช้เพื่อเรียนรู้เกี่ยวกับการฝึกสอนตัวแบบในการทำงานของระบบการเรียนรู้ของเครื่องจักร นอกจากนี้กระบวนการเดียวกันนี้ยังสามารถต่อยอดไปยังกรณีศึกษาอื่น ๆ ได้อีก

ประเมินรูปแบบการใช้งานของคุณ

ในการนำเสนอตัวแบบเพื่อตรวจหาความเห็นที่อาจไม่เหมาะสม คุณจะต้องมีข้อมูลก่อนในเบื้องต้นซึ่งในกรณีนี้ก็คือตัวอย่างความเห็นที่คุณได้รับจากเว็บไซต์ของคุณแต่ก่อนที่จะจัดทำชุดข้อมูลของคุณ สิ่งที่สำคัญคือการพิจารณาว่าผลลัพธ์แบบใดที่คุณคาดหวัง

แม้แต่กับมนุษย์เอง การะบุว่าความเห็นใดอาจไม่เหมาะสมและไม่ควรเผยแพร่ในระบบออนไลน์อาจชี้ชัดลงไปได้ยากผู้ดูแลระบบสองคนอาจต้องช่วยกันแลกเปลี่ยนความคิดเกี่ยวกับความเห็นที่คิดว่า “ไม่เหมาะสม”คุณไม่สามารถคาดหวังให้อัลกอริทึมในการทำงาน “ทำงานได้อย่างถูกต้อง” เสมอไป

ระบบการเรียนรู้ของเครื่องจักรสามารถจัดการข้อมูลความเห็นเป็ฯจำนวนมากโดยใช้เวลาเพียงไม่กี่วินาที แต่สิ่งสำคัญคือจะต้องไม่ลืมว่านี่เป็นแค่ “การคาดเดา” จากการเรียนรู้ของระบบเท่านั้นบางครั้งระบบอาจให้คำตอบที่ไม่ถูกต้องหรือทำงานผิดพลาดได้

การสืบค้นข้อมูล

ถึงเวลาในการเตรียมชุดข้อมูลของคุณแล้วในกรณีศึกษาของเรา เราได้เรียนรู้ไปแล้วว่าข้อมูลประเภทใดที่เราต้องการ และจะค้นหาได้จากที่ไหน ซึ่งก็คือความเห็นที่โพสต์ในเว็บไซต์ของคุณ

เนื่องจากคุณต้องการรูปแบบการทำงานของระบบการเรียนรู้ของเครื่องจักรเพื่อตรวจหาความเห็นที่ไม่เหมาะสม คุณจะต้องจัดทำข้อมูลตัวอย่างข้อความที่คุณต้องการใช้เพื่อแยกประเภท (ความเห็น) รวมทั้งหมวดหมู่หรือหมายเหตุกำกับเพื่อให้ ML คาดการณ์ (“ไม่เหมาะสม” หรือ “ไม่มีปัญหา”)

สำหรับรูปแบบการใช้งานอื่น ๆ คุณอาจสามารถหาข้อมูลได้ง่ายกว่านี้คุณจะต้องหาข้อมูลเหล่านี้จากคลังข้อมูลของหน่วยงานของคุณหรือจากบุคคลภายนอกไม่ว่าจะในกรณีใด กรุณาศึกษาระเบียบข้อบังคับด้านการปกป้องข้อมูลในพื้นที่และในสถานที่ที่คุณจะใช้งานระบบ

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

หลังจากรวบรวมข้อมูลได้แล้ว และก่อนที่จะป้อนข้อมูลเข้าเครื่อง คุณจะต้องวิเคราะห์ข้อมูลนี้อย่างละเอียดก่อนผลการทำงานของระบบการเรียนรู้ของเครื่องจักรตามรูปแบบที่คุณกำหนดจะดีและสมบูรณ์ก็โดยขึ้นอยู่กับข้อมูลที่คุณจัดไว้ (จะมีกล่าวถึง “ความเป็นธรรม” ในบทเรียนถัดไป)คุณจะต้องทบทวนรูปแบบการใช้งานของคุณว่าอาจส่งผลกระทบต่อบุคคลที่เกี่ยวข้องโดยตัวแบบการทำงานนี้อย่างไร

นอกจากนี้ เพื่อให้สามารถฝึกสอนรูปแบบการทำงานได้อย่างมีประสิทธิภาพ คุณจะต้องมีตัวอย่างกำกับมากเพียงพอและกระจายข้อมูลนี้อย่างเท่าเทียมกันในหมวดหมู่ต่าง ๆและจะต้องจัดหาชุดข้อมูลที่ครอบคลุม โดยพิจารณาจากบริบทและภาษาที่ใช้ เพื่อให้รูปแบบการทำงานนี้ครอบคลุมตัวแปรต่าง ๆ ที่เกี่ยวข้องในการทำงานของคุณ

การเลือกอัลกอริทึม

หลังจากเตรียมชุดข้อมูลเสร็จสิ้น คุณจะต้องเลือกอัลกอริทึมสำหรับระบบการเรียนรู้ของเครื่องจักรที่จะฝึกสอนอัลกอริทึมทุกตัวจะมีวัตถุประสงค์เฉพาะคุณจะต้องเลือกอัลกอริทึมที่เหมาะสมตามผลลัพธ์ที่คุณคาดหวัง

ในบทเรียนก่อนหน้าเราได้เรียนรู้เกี่ยวกับแนวทางต่าง ๆ ที่ใช้ในระบบการเรียนรู้ของเครื่องจักรเนื่องจากกรณีศึกษาของเราจะต้องอาศัยชุดข้อมูลที่มีหมายเหตุกำกับเพื่อให้สามารถแยกประเภทความเห็นที่ “ไม่เหมาะสม” หรือ “ไม่มีปัญหา” ระบบที่เราต้องใช้ในที่นี้จึงเป็นระบบการเรียนรู้แบบมีการกำกับดูแล

Google Cloud AutoML Natural Language คือหนึ่งในอัลกอริทึมที่ช่วยให้คุณสามารถก้าวไปสู่ผลลัพธ์ที่คาดหวังนี้ได้แต่ไม่ว่าคุณจะเลือกอัลกอริทึมใด ให้ปฏิบัติตามคำแนะนำที่ระบุไว้เกี่ยวกับการกำหนดรูปแบบชุดข้อมูลที่จะใช้เพื่อฝึกสอน

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

จากนี้เราจะเข้าสู่ขั้นตอนการฝึกสอนที่ถูกต้องโดยเราจะใช้ข้อมูลนี้เพื่อปรับปรุงความสามารถของตัวแบบในการทำงานไปเรื่อย ๆ สำหรับการคาดการณ์ความเห็นที่ไม่เหมาะสมและความเห็นที่ไม่มีปัญหาให้ต้องกังวลเราจะป้อนข้อมูลส่วนใหญ่ของเราไปยังอัลกอริทึม รอแปป เอาล่ะ ตัวแบบการทำงานของเราผ่านการฝึกสอนเรียบร้อยแล้ว

แต่ทำไมถึงบอกว่าข้อมูล "ส่วนใหญ่”ก็เพื่อให้แน่ใจว่าตัวแบบการทำงานจะเรียนรู้ได้อย่างถูกต้อง โดยคุณจะต้องแจ้งข้อมูลออกเป็นสามส่วนได้แก่

ชุดข้อมูลการฝึกสอนสิ่งที่ตัวแบบของคุณ “จะรับรู้” และทำการเรียนรู้
ชุดข้อมูลยืนยันเป็นอีกกระบวนการฝึกสอนที่แยกออกจากกันเพื่อปรับปรุงไฮเปอร์พารามิเตอร์ต่าง ๆ ซึ่งเป็นตัวแปรเพื่อระบุโครงสร้างของตัวแบบการทำงาน
ชุดข้อมูลทดสอบจะเข้าสู่ขั้นตอนนี้หลังจากการฝึกสอนเราจะใช้ข้อมูลนี้เพื่อทดสอบประสิทธิภาพในการทำงานของตัวแบบกับข้อมูลที่ระบบไม่เคยพบมาก่อน

การประเมินผลลัพธ์

คุณจะทราบได้อย่างไรว่าตัวแบบการทำงานเรียนรู้ในการค้นหาความเห็นที่อาจไม่เหมาะสมได้อย่างถูกต้อง

หลังจากการฝึกสอนเสร็จสิ้น อัลกอริทึมนี้จะระบุข้อมูลเบื้องต้นเกี่ยวกับผลการทำงานของตัวแบบตามที่เราได้กล่าวไปก่อนหน้านี้ คุณไม่สามารถคาดหวังให้ตัวแบบการทำงานทำงานได้อย่างถูกต้อง 100% เสมอไปคุณจะต้องตัดสินเองว่าผลลัพธ์ใดที่ “ดีเพียงพอ” ตามสถานการณ์แวดล้อม

ประเด็นหลักที่คุณต้องพิจารณาคือการประเมินตัวแบบการทำงานของคุณว่าสามารถระบุข้อผิดพลาดได้อย่างถูกต้องและไม่มีจุดบกพร่องที่น่ากังวลใด ๆในกรณีของเรา การแจ้งผลที่ผิดพลาดจะหมายถึงความเห็นที่ไม่เป็นปัญหาแต่ถูกแจ้งว่าไม่เหมาะสมคุณสามารถทำการยกเลิกได้ง่าย ๆ และให้ระบบลองทำงานต่อไปการแจ้งผลว่าความเห็นไม่มีปัญหาที่ผิดพลาดคือกรณีที่มีความเห็นที่ไม่เหมาะสม แต่ระบบไม่สามารถแจ้งเตือนว่าความเห็นดังกล่าวไม่เหมาะสมไม่ใช่เรื่องยากในการทำความเข้าใจว่าความผิดพลาดแบบใดที่คุณไม่ต้องการให้เกิดขึ้นกับตัวแบบการทำงานของคุณ

การประเมินด้านการข่าว

การประเมินผลลัพธ์ของกระบวนการฝึกสอนไม่ได้สิ้นสุดที่การวิเคราะห์ด้านเทคนิคถึงตอนนี้ ปณิธานและแนวทางในการทำงานของนักข่าวจะถูกนำมาใช้เพื่อช่วยคุณในการตัดสินใจว่าจะใช้ข้อมูลจากอัลกอริทึมการทำงานอย่างไร

เริ่มจากการพิจารณาก่อนว่าตอนนี้คุณมีข้อมูลที่ก่อนหน้านี้ไม่มีหรือไม่ และข้อมูลดังกล่าวคุ้มค่าต่อการนำเสนอข่าวหรือไม่ข้อมูลสัมทับกับสมมติฐานเดิมของคุณหรือทำให้คุณได้มุมมองใหม่ที่คุณไม่เคยมองมาก่อนหรือไม่

ตอนนี้คุณน่าจะเข้าใจมากขึ้นเกี่ยวกับการทำงานของระบบการเรียนรู้ของเครื่องจักร และคุณอาจอยากรู้ว่ามันสามารถทำอะไรได้บ้างแต่เรายังไม่พร้อมเข้าสู่เรื่องนี้บทเรียนถัดไปจะเป็นการแนะนำข้อกังวลที่สำคัญที่สุดเกี่ยวกับระบบการเรียนรู้ของเครื่องจักรซึ่งก็คืออคติ

ยินดีด้วย คุณทำสำเร็จแล้ว เครื่องจักรมีการเรียนรู้อย่างไร ใช่ กำลังดำเนินการอยู่

แนะนำสำหรับคุณ

open_in_new

วิดีโอ: เครื่องมือของ Google สำหรับผู้ตรวจสอบข้อเท็จจริง

บทเรียน

สำรวจเครื่องมือดิจิทัลที่ออกแบบมาโดยเฉพาะสำหรับผู้ตรวจสอบข้อเท็จจริงและนักข่าว

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None
open_in_new

พื้นฐานของ Google เทรนด์

บทเรียน

หลักสูตรสำหรับผู้เริ่มต้นนี้จะสอนคุณเกี่ยวกับพื้นฐานของ Google Trends โดยใช้เครื่องมือสำรวจ Trends ฟรี

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None
open_in_new

อคติในระบบการเรียนรู้ของเครื่องจักร

บทเรียน

เข้าใจว่าอคติจาก ML คืออะไรและจะหลีกเลี่ยงได้อย่างไร

เริ่มต้น

นำออกจากบัญชี

บันทึกไปยังบัญชี

None

คุณจะให้คะแนนบทเรียนนี้อย่างไร

ความคิดเห็นของคุณจะช่วยให้เราปรับปรุงบทเรียนได้อย่างต่อเนื่อง

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

เครื่องจักรมีการเรียนรู้อย่างไร

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

คุณมีคำถามอะไรที่ต้องการคำตอบ

ประเมินรูปแบบการใช้งานของคุณ

การสืบค้นข้อมูล

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

การเลือกอัลกอริทึม

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

การประเมินผลลัพธ์

การประเมินด้านการข่าว

วิดีโอ: เครื่องมือของ Google สำหรับผู้ตรวจสอบข้อเท็จจริง

พื้นฐานของ Google เทรนด์

อคติในระบบการเรียนรู้ของเครื่องจักร

ฉันกำลังมองหาแหล่งข้อมูลใน

เครื่องจักรมีการเรียนรู้อย่างไร

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

คุณมีคำถามอะไรที่ต้องการคำตอบ

ประเมินรูปแบบการใช้งานของคุณ

การสืบค้นข้อมูล

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

การเลือกอัลกอริทึม

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

การประเมินผลลัพธ์

การประเมินด้านการข่าว

วิดีโอ: เครื่องมือของ Google สำหรับผู้ตรวจสอบข้อเท็จจริง

พื้นฐานของ Google เทรนด์

อคติในระบบการเรียนรู้ของเครื่องจักร