ข้ามไปที่เนื้อหาหลัก
ไปที่หน้าแดชบอร์ด
หากไม่แน่ใจว่าจะเริ่มจากตรงไหน ลองทำแบบทดสอบสั้นๆ เพื่อรับคำแนะนำที่ปรับให้เหมาะกับคุณ
Welcome to the Google News Initiative
The Google News Initiative works with publishers and journalists to fight misinformation, share resources, and build a diverse and innovative news ecosystem.
บทเรียนที่ 4 จาก 8
เครื่องจักรมีการเรียนรู้อย่างไร
5 นาที บทเรียนที่ต้องศึกษาต่อ

เครื่องจักรมีการเรียนรู้อย่างไร

5.4_9oVu9sc.jpg
รายละเอียดเบื้องต้นแบบเป็นขั้นตอนเกี่ยวกับกระบวนการฝึกสอน ML
5.4_9oVu9sc.jpg

นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ

5.1.jpg

เราได้บอกใบ้ไปบางส่วนแล้วว่าตัวแบบในการทำงานของ AI ต้องผ่าน “การฝึกสอน” เพื่อให้ได้ผลลัพธ์อย่างที่คาดหวังในบทเรียนนี้คุณจะได้เรียนรู้เกี่ยวกับขั้นตอนต่าง ๆ ในกระบวนการฝึกสอนจากกรณีศึกษาเฉพาะด้าน


เป้าหมายคือเพื่อช่วยให้คุณเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องจักร แต่ยังไม่ถึงขนาดที่คุณจะสามารถจำลองกระบวนการนี้ไปใช้ได้ด้วยตัวเอง


ก่อนตัดสินใจใช้ระบบการเรียนรู้ของเครื่องจักร ให้ถามตัวเองก่อนว่า:คำถามใดที่ฉันกำลังต้องการคำตอบและฉันต้องการระบบการเรียนรู้ของเครื่องจักรเพื่อให้ได้สิ่งที่ต้องการหรือไม่

5.1.jpg

คุณมีคำถามอะไรที่ต้องการคำตอบ

5.2.jpg

ลองนึกดูว่าจะเป็นอย่างไรหากเว็บไซต์ของคุณเปิดรับความเห็นจากผู้อ่านบทความได้ในทุก ๆ วันมีความคิดเห็นเป็นจำนวนมากถูกโพสต์ไว้ และบางความเห็นอาจค่อนข้างรุนแรง


จะดีแค่ไหนหากระบบอัตโนมัติสามารถจำแนกประเภทความเห็นทั้งหมดที่โพสต์ในระบบของคุณ และสามารถระบุรายการที่ “อาจไม่เหมาะสม” และทำหมายเหตุกำกับไว้สำหรับผู้ดูแลเพื่อให้มีการพิจารณาทบทวนและปรับปรุงคุณภาพของการพูดคุย


และนี่คือปัญหาที่ระบบการเรียนรู้ของเครื่องจักรสามารถเข้ามาช่วยคุณได้และนี่คือสิ่งที่มันถูกใช้งานอยู่ในปัจจุบันดูรายละเอียดเพิ่มเติมได้ที่ Jigsaw's Perspective API


นี่เป็นตัวอย่างที่เราจะใช้เพื่อเรียนรู้เกี่ยวกับการฝึกสอนตัวแบบในการทำงานของระบบการเรียนรู้ของเครื่องจักร นอกจากนี้กระบวนการเดียวกันนี้ยังสามารถต่อยอดไปยังกรณีศึกษาอื่น ๆ ได้อีก

5.2.jpg

ประเมินรูปแบบการใช้งานของคุณ

5.3.jpg

ในการนำเสนอตัวแบบเพื่อตรวจหาความเห็นที่อาจไม่เหมาะสม คุณจะต้องมีข้อมูลก่อนในเบื้องต้นซึ่งในกรณีนี้ก็คือตัวอย่างความเห็นที่คุณได้รับจากเว็บไซต์ของคุณแต่ก่อนที่จะจัดทำชุดข้อมูลของคุณ สิ่งที่สำคัญคือการพิจารณาว่าผลลัพธ์แบบใดที่คุณคาดหวัง

แม้แต่กับมนุษย์เอง การะบุว่าความเห็นใดอาจไม่เหมาะสมและไม่ควรเผยแพร่ในระบบออนไลน์อาจชี้ชัดลงไปได้ยากผู้ดูแลระบบสองคนอาจต้องช่วยกันแลกเปลี่ยนความคิดเกี่ยวกับความเห็นที่คิดว่า “ไม่เหมาะสม”คุณไม่สามารถคาดหวังให้อัลกอริทึมในการทำงาน “ทำงานได้อย่างถูกต้อง” เสมอไป


ระบบการเรียนรู้ของเครื่องจักรสามารถจัดการข้อมูลความเห็นเป็ฯจำนวนมากโดยใช้เวลาเพียงไม่กี่วินาที แต่สิ่งสำคัญคือจะต้องไม่ลืมว่านี่เป็นแค่ “การคาดเดา” จากการเรียนรู้ของระบบเท่านั้นบางครั้งระบบอาจให้คำตอบที่ไม่ถูกต้องหรือทำงานผิดพลาดได้

5.3.jpg

การสืบค้นข้อมูล

5.4.jpg

ถึงเวลาในการเตรียมชุดข้อมูลของคุณแล้วในกรณีศึกษาของเรา เราได้เรียนรู้ไปแล้วว่าข้อมูลประเภทใดที่เราต้องการ และจะค้นหาได้จากที่ไหน ซึ่งก็คือความเห็นที่โพสต์ในเว็บไซต์ของคุณ


เนื่องจากคุณต้องการรูปแบบการทำงานของระบบการเรียนรู้ของเครื่องจักรเพื่อตรวจหาความเห็นที่ไม่เหมาะสม คุณจะต้องจัดทำข้อมูลตัวอย่างข้อความที่คุณต้องการใช้เพื่อแยกประเภท (ความเห็น) รวมทั้งหมวดหมู่หรือหมายเหตุกำกับเพื่อให้ ML คาดการณ์ (“ไม่เหมาะสม” หรือ “ไม่มีปัญหา”)


สำหรับรูปแบบการใช้งานอื่น ๆ คุณอาจสามารถหาข้อมูลได้ง่ายกว่านี้คุณจะต้องหาข้อมูลเหล่านี้จากคลังข้อมูลของหน่วยงานของคุณหรือจากบุคคลภายนอกไม่ว่าจะในกรณีใด กรุณาศึกษาระเบียบข้อบังคับด้านการปกป้องข้อมูลในพื้นที่และในสถานที่ที่คุณจะใช้งานระบบ

5.4.jpg

การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง

5.5.jpg

หลังจากรวบรวมข้อมูลได้แล้ว และก่อนที่จะป้อนข้อมูลเข้าเครื่อง คุณจะต้องวิเคราะห์ข้อมูลนี้อย่างละเอียดก่อนผลการทำงานของระบบการเรียนรู้ของเครื่องจักรตามรูปแบบที่คุณกำหนดจะดีและสมบูรณ์ก็โดยขึ้นอยู่กับข้อมูลที่คุณจัดไว้ (จะมีกล่าวถึง “ความเป็นธรรม” ในบทเรียนถัดไป)คุณจะต้องทบทวนรูปแบบการใช้งานของคุณว่าอาจส่งผลกระทบต่อบุคคลที่เกี่ยวข้องโดยตัวแบบการทำงานนี้อย่างไร


นอกจากนี้ เพื่อให้สามารถฝึกสอนรูปแบบการทำงานได้อย่างมีประสิทธิภาพ คุณจะต้องมีตัวอย่างกำกับมากเพียงพอและกระจายข้อมูลนี้อย่างเท่าเทียมกันในหมวดหมู่ต่าง ๆและจะต้องจัดหาชุดข้อมูลที่ครอบคลุม โดยพิจารณาจากบริบทและภาษาที่ใช้ เพื่อให้รูปแบบการทำงานนี้ครอบคลุมตัวแปรต่าง ๆ ที่เกี่ยวข้องในการทำงานของคุณ

5.5.jpg

การเลือกอัลกอริทึม

5.6.jpg

หลังจากเตรียมชุดข้อมูลเสร็จสิ้น คุณจะต้องเลือกอัลกอริทึมสำหรับระบบการเรียนรู้ของเครื่องจักรที่จะฝึกสอนอัลกอริทึมทุกตัวจะมีวัตถุประสงค์เฉพาะคุณจะต้องเลือกอัลกอริทึมที่เหมาะสมตามผลลัพธ์ที่คุณคาดหวัง


ในบทเรียนก่อนหน้าเราได้เรียนรู้เกี่ยวกับแนวทางต่าง ๆ ที่ใช้ในระบบการเรียนรู้ของเครื่องจักรเนื่องจากกรณีศึกษาของเราจะต้องอาศัยชุดข้อมูลที่มีหมายเหตุกำกับเพื่อให้สามารถแยกประเภทความเห็นที่ “ไม่เหมาะสม” หรือ “ไม่มีปัญหา” ระบบที่เราต้องใช้ในที่นี้จึงเป็นระบบการเรียนรู้แบบมีการกำกับดูแล


Google Cloud AutoML Natural Language คือหนึ่งในอัลกอริทึมที่ช่วยให้คุณสามารถก้าวไปสู่ผลลัพธ์ที่คาดหวังนี้ได้แต่ไม่ว่าคุณจะเลือกอัลกอริทึมใด ให้ปฏิบัติตามคำแนะนำที่ระบุไว้เกี่ยวกับการกำหนดรูปแบบชุดข้อมูลที่จะใช้เพื่อฝึกสอน

5.6.jpg

การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน

5.7.jpg

จากนี้เราจะเข้าสู่ขั้นตอนการฝึกสอนที่ถูกต้องโดยเราจะใช้ข้อมูลนี้เพื่อปรับปรุงความสามารถของตัวแบบในการทำงานไปเรื่อย ๆ สำหรับการคาดการณ์ความเห็นที่ไม่เหมาะสมและความเห็นที่ไม่มีปัญหาให้ต้องกังวลเราจะป้อนข้อมูลส่วนใหญ่ของเราไปยังอัลกอริทึม รอแปป เอาล่ะ ตัวแบบการทำงานของเราผ่านการฝึกสอนเรียบร้อยแล้ว


แต่ทำไมถึงบอกว่าข้อมูล "ส่วนใหญ่”ก็เพื่อให้แน่ใจว่าตัวแบบการทำงานจะเรียนรู้ได้อย่างถูกต้อง โดยคุณจะต้องแจ้งข้อมูลออกเป็นสามส่วนได้แก่


  • ชุดข้อมูลการฝึกสอนสิ่งที่ตัวแบบของคุณ “จะรับรู้” และทำการเรียนรู้
  • ชุดข้อมูลยืนยันเป็นอีกกระบวนการฝึกสอนที่แยกออกจากกันเพื่อปรับปรุงไฮเปอร์พารามิเตอร์ต่าง ๆ ซึ่งเป็นตัวแปรเพื่อระบุโครงสร้างของตัวแบบการทำงาน
  • ชุดข้อมูลทดสอบจะเข้าสู่ขั้นตอนนี้หลังจากการฝึกสอนเราจะใช้ข้อมูลนี้เพื่อทดสอบประสิทธิภาพในการทำงานของตัวแบบกับข้อมูลที่ระบบไม่เคยพบมาก่อน
5.7.jpg

การประเมินผลลัพธ์

5.8.jpg

คุณจะทราบได้อย่างไรว่าตัวแบบการทำงานเรียนรู้ในการค้นหาความเห็นที่อาจไม่เหมาะสมได้อย่างถูกต้อง


หลังจากการฝึกสอนเสร็จสิ้น อัลกอริทึมนี้จะระบุข้อมูลเบื้องต้นเกี่ยวกับผลการทำงานของตัวแบบตามที่เราได้กล่าวไปก่อนหน้านี้ คุณไม่สามารถคาดหวังให้ตัวแบบการทำงานทำงานได้อย่างถูกต้อง 100% เสมอไปคุณจะต้องตัดสินเองว่าผลลัพธ์ใดที่ “ดีเพียงพอ” ตามสถานการณ์แวดล้อม


ประเด็นหลักที่คุณต้องพิจารณาคือการประเมินตัวแบบการทำงานของคุณว่าสามารถระบุข้อผิดพลาดได้อย่างถูกต้องและไม่มีจุดบกพร่องที่น่ากังวลใด ๆในกรณีของเรา การแจ้งผลที่ผิดพลาดจะหมายถึงความเห็นที่ไม่เป็นปัญหาแต่ถูกแจ้งว่าไม่เหมาะสมคุณสามารถทำการยกเลิกได้ง่าย ๆ และให้ระบบลองทำงานต่อไปการแจ้งผลว่าความเห็นไม่มีปัญหาที่ผิดพลาดคือกรณีที่มีความเห็นที่ไม่เหมาะสม แต่ระบบไม่สามารถแจ้งเตือนว่าความเห็นดังกล่าวไม่เหมาะสมไม่ใช่เรื่องยากในการทำความเข้าใจว่าความผิดพลาดแบบใดที่คุณไม่ต้องการให้เกิดขึ้นกับตัวแบบการทำงานของคุณ

5.8.jpg

การประเมินด้านการข่าว

5.9.jpg

การประเมินผลลัพธ์ของกระบวนการฝึกสอนไม่ได้สิ้นสุดที่การวิเคราะห์ด้านเทคนิคถึงตอนนี้ ปณิธานและแนวทางในการทำงานของนักข่าวจะถูกนำมาใช้เพื่อช่วยคุณในการตัดสินใจว่าจะใช้ข้อมูลจากอัลกอริทึมการทำงานอย่างไร


เริ่มจากการพิจารณาก่อนว่าตอนนี้คุณมีข้อมูลที่ก่อนหน้านี้ไม่มีหรือไม่ และข้อมูลดังกล่าวคุ้มค่าต่อการนำเสนอข่าวหรือไม่ข้อมูลสัมทับกับสมมติฐานเดิมของคุณหรือทำให้คุณได้มุมมองใหม่ที่คุณไม่เคยมองมาก่อนหรือไม่


ตอนนี้คุณน่าจะเข้าใจมากขึ้นเกี่ยวกับการทำงานของระบบการเรียนรู้ของเครื่องจักร และคุณอาจอยากรู้ว่ามันสามารถทำอะไรได้บ้างแต่เรายังไม่พร้อมเข้าสู่เรื่องนี้บทเรียนถัดไปจะเป็นการแนะนำข้อกังวลที่สำคัญที่สุดเกี่ยวกับระบบการเรียนรู้ของเครื่องจักรซึ่งก็คืออคติ

5.9.jpg
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?