เครื่องจักรมีการเรียนรู้อย่างไร
รายละเอียดเบื้องต้นแบบเป็นขั้นตอนเกี่ยวกับกระบวนการฝึกสอน ML
นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ
เราได้บอกใบ้ไปบางส่วนแล้วว่าตัวแบบในการทำงานของ AI ต้องผ่าน “การฝึกสอน” เพื่อให้ได้ผลลัพธ์อย่างที่คาดหวังในบทเรียนนี้คุณจะได้เรียนรู้เกี่ยวกับขั้นตอนต่าง ๆ ในกระบวนการฝึกสอนจากกรณีศึกษาเฉพาะด้าน
เป้าหมายคือเพื่อช่วยให้คุณเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องจักร แต่ยังไม่ถึงขนาดที่คุณจะสามารถจำลองกระบวนการนี้ไปใช้ได้ด้วยตัวเอง
ก่อนตัดสินใจใช้ระบบการเรียนรู้ของเครื่องจักร ให้ถามตัวเองก่อนว่า:คำถามใดที่ฉันกำลังต้องการคำตอบและฉันต้องการระบบการเรียนรู้ของเครื่องจักรเพื่อให้ได้สิ่งที่ต้องการหรือไม่
คุณมีคำถามอะไรที่ต้องการคำตอบ
ลองนึกดูว่าจะเป็นอย่างไรหากเว็บไซต์ของคุณเปิดรับความเห็นจากผู้อ่านบทความได้ในทุก ๆ วันมีความคิดเห็นเป็นจำนวนมากถูกโพสต์ไว้ และบางความเห็นอาจค่อนข้างรุนแรง
จะดีแค่ไหนหากระบบอัตโนมัติสามารถจำแนกประเภทความเห็นทั้งหมดที่โพสต์ในระบบของคุณ และสามารถระบุรายการที่ “อาจไม่เหมาะสม” และทำหมายเหตุกำกับไว้สำหรับผู้ดูแลเพื่อให้มีการพิจารณาทบทวนและปรับปรุงคุณภาพของการพูดคุย
และนี่คือปัญหาที่ระบบการเรียนรู้ของเครื่องจักรสามารถเข้ามาช่วยคุณได้และนี่คือสิ่งที่มันถูกใช้งานอยู่ในปัจจุบันดูรายละเอียดเพิ่มเติมได้ที่ Jigsaw's Perspective API
นี่เป็นตัวอย่างที่เราจะใช้เพื่อเรียนรู้เกี่ยวกับการฝึกสอนตัวแบบในการทำงานของระบบการเรียนรู้ของเครื่องจักร นอกจากนี้กระบวนการเดียวกันนี้ยังสามารถต่อยอดไปยังกรณีศึกษาอื่น ๆ ได้อีก
ประเมินรูปแบบการใช้งานของคุณ
ในการนำเสนอตัวแบบเพื่อตรวจหาความเห็นที่อาจไม่เหมาะสม คุณจะต้องมีข้อมูลก่อนในเบื้องต้นซึ่งในกรณีนี้ก็คือตัวอย่างความเห็นที่คุณได้รับจากเว็บไซต์ของคุณแต่ก่อนที่จะจัดทำชุดข้อมูลของคุณ สิ่งที่สำคัญคือการพิจารณาว่าผลลัพธ์แบบใดที่คุณคาดหวัง
แม้แต่กับมนุษย์เอง การะบุว่าความเห็นใดอาจไม่เหมาะสมและไม่ควรเผยแพร่ในระบบออนไลน์อาจชี้ชัดลงไปได้ยากผู้ดูแลระบบสองคนอาจต้องช่วยกันแลกเปลี่ยนความคิดเกี่ยวกับความเห็นที่คิดว่า “ไม่เหมาะสม”คุณไม่สามารถคาดหวังให้อัลกอริทึมในการทำงาน “ทำงานได้อย่างถูกต้อง” เสมอไป
ระบบการเรียนรู้ของเครื่องจักรสามารถจัดการข้อมูลความเห็นเป็ฯจำนวนมากโดยใช้เวลาเพียงไม่กี่วินาที แต่สิ่งสำคัญคือจะต้องไม่ลืมว่านี่เป็นแค่ “การคาดเดา” จากการเรียนรู้ของระบบเท่านั้นบางครั้งระบบอาจให้คำตอบที่ไม่ถูกต้องหรือทำงานผิดพลาดได้
การสืบค้นข้อมูล
ถึงเวลาในการเตรียมชุดข้อมูลของคุณแล้วในกรณีศึกษาของเรา เราได้เรียนรู้ไปแล้วว่าข้อมูลประเภทใดที่เราต้องการ และจะค้นหาได้จากที่ไหน ซึ่งก็คือความเห็นที่โพสต์ในเว็บไซต์ของคุณ
เนื่องจากคุณต้องการรูปแบบการทำงานของระบบการเรียนรู้ของเครื่องจักรเพื่อตรวจหาความเห็นที่ไม่เหมาะสม คุณจะต้องจัดทำข้อมูลตัวอย่างข้อความที่คุณต้องการใช้เพื่อแยกประเภท (ความเห็น) รวมทั้งหมวดหมู่หรือหมายเหตุกำกับเพื่อให้ ML คาดการณ์ (“ไม่เหมาะสม” หรือ “ไม่มีปัญหา”)
สำหรับรูปแบบการใช้งานอื่น ๆ คุณอาจสามารถหาข้อมูลได้ง่ายกว่านี้คุณจะต้องหาข้อมูลเหล่านี้จากคลังข้อมูลของหน่วยงานของคุณหรือจากบุคคลภายนอกไม่ว่าจะในกรณีใด กรุณาศึกษาระเบียบข้อบังคับด้านการปกป้องข้อมูลในพื้นที่และในสถานที่ที่คุณจะใช้งานระบบ
การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง
หลังจากรวบรวมข้อมูลได้แล้ว และก่อนที่จะป้อนข้อมูลเข้าเครื่อง คุณจะต้องวิเคราะห์ข้อมูลนี้อย่างละเอียดก่อนผลการทำงานของระบบการเรียนรู้ของเครื่องจักรตามรูปแบบที่คุณกำหนดจะดีและสมบูรณ์ก็โดยขึ้นอยู่กับข้อมูลที่คุณจัดไว้ (จะมีกล่าวถึง “ความเป็นธรรม” ในบทเรียนถัดไป)คุณจะต้องทบทวนรูปแบบการใช้งานของคุณว่าอาจส่งผลกระทบต่อบุคคลที่เกี่ยวข้องโดยตัวแบบการทำงานนี้อย่างไร
นอกจากนี้ เพื่อให้สามารถฝึกสอนรูปแบบการทำงานได้อย่างมีประสิทธิภาพ คุณจะต้องมีตัวอย่างกำกับมากเพียงพอและกระจายข้อมูลนี้อย่างเท่าเทียมกันในหมวดหมู่ต่าง ๆและจะต้องจัดหาชุดข้อมูลที่ครอบคลุม โดยพิจารณาจากบริบทและภาษาที่ใช้ เพื่อให้รูปแบบการทำงานนี้ครอบคลุมตัวแปรต่าง ๆ ที่เกี่ยวข้องในการทำงานของคุณ
การเลือกอัลกอริทึม
หลังจากเตรียมชุดข้อมูลเสร็จสิ้น คุณจะต้องเลือกอัลกอริทึมสำหรับระบบการเรียนรู้ของเครื่องจักรที่จะฝึกสอนอัลกอริทึมทุกตัวจะมีวัตถุประสงค์เฉพาะคุณจะต้องเลือกอัลกอริทึมที่เหมาะสมตามผลลัพธ์ที่คุณคาดหวัง
ในบทเรียนก่อนหน้าเราได้เรียนรู้เกี่ยวกับแนวทางต่าง ๆ ที่ใช้ในระบบการเรียนรู้ของเครื่องจักรเนื่องจากกรณีศึกษาของเราจะต้องอาศัยชุดข้อมูลที่มีหมายเหตุกำกับเพื่อให้สามารถแยกประเภทความเห็นที่ “ไม่เหมาะสม” หรือ “ไม่มีปัญหา” ระบบที่เราต้องใช้ในที่นี้จึงเป็นระบบการเรียนรู้แบบมีการกำกับดูแล
Google Cloud AutoML Natural Language คือหนึ่งในอัลกอริทึมที่ช่วยให้คุณสามารถก้าวไปสู่ผลลัพธ์ที่คาดหวังนี้ได้แต่ไม่ว่าคุณจะเลือกอัลกอริทึมใด ให้ปฏิบัติตามคำแนะนำที่ระบุไว้เกี่ยวกับการกำหนดรูปแบบชุดข้อมูลที่จะใช้เพื่อฝึกสอน
การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน
จากนี้เราจะเข้าสู่ขั้นตอนการฝึกสอนที่ถูกต้องโดยเราจะใช้ข้อมูลนี้เพื่อปรับปรุงความสามารถของตัวแบบในการทำงานไปเรื่อย ๆ สำหรับการคาดการณ์ความเห็นที่ไม่เหมาะสมและความเห็นที่ไม่มีปัญหาให้ต้องกังวลเราจะป้อนข้อมูลส่วนใหญ่ของเราไปยังอัลกอริทึม รอแปป เอาล่ะ ตัวแบบการทำงานของเราผ่านการฝึกสอนเรียบร้อยแล้ว
แต่ทำไมถึงบอกว่าข้อมูล "ส่วนใหญ่”ก็เพื่อให้แน่ใจว่าตัวแบบการทำงานจะเรียนรู้ได้อย่างถูกต้อง โดยคุณจะต้องแจ้งข้อมูลออกเป็นสามส่วนได้แก่
- ชุดข้อมูลการฝึกสอนสิ่งที่ตัวแบบของคุณ “จะรับรู้” และทำการเรียนรู้
- ชุดข้อมูลยืนยันเป็นอีกกระบวนการฝึกสอนที่แยกออกจากกันเพื่อปรับปรุงไฮเปอร์พารามิเตอร์ต่าง ๆ ซึ่งเป็นตัวแปรเพื่อระบุโครงสร้างของตัวแบบการทำงาน
- ชุดข้อมูลทดสอบจะเข้าสู่ขั้นตอนนี้หลังจากการฝึกสอนเราจะใช้ข้อมูลนี้เพื่อทดสอบประสิทธิภาพในการทำงานของตัวแบบกับข้อมูลที่ระบบไม่เคยพบมาก่อน
การประเมินผลลัพธ์
คุณจะทราบได้อย่างไรว่าตัวแบบการทำงานเรียนรู้ในการค้นหาความเห็นที่อาจไม่เหมาะสมได้อย่างถูกต้อง
หลังจากการฝึกสอนเสร็จสิ้น อัลกอริทึมนี้จะระบุข้อมูลเบื้องต้นเกี่ยวกับผลการทำงานของตัวแบบตามที่เราได้กล่าวไปก่อนหน้านี้ คุณไม่สามารถคาดหวังให้ตัวแบบการทำงานทำงานได้อย่างถูกต้อง 100% เสมอไปคุณจะต้องตัดสินเองว่าผลลัพธ์ใดที่ “ดีเพียงพอ” ตามสถานการณ์แวดล้อม
ประเด็นหลักที่คุณต้องพิจารณาคือการประเมินตัวแบบการทำงานของคุณว่าสามารถระบุข้อผิดพลาดได้อย่างถูกต้องและไม่มีจุดบกพร่องที่น่ากังวลใด ๆในกรณีของเรา การแจ้งผลที่ผิดพลาดจะหมายถึงความเห็นที่ไม่เป็นปัญหาแต่ถูกแจ้งว่าไม่เหมาะสมคุณสามารถทำการยกเลิกได้ง่าย ๆ และให้ระบบลองทำงานต่อไปการแจ้งผลว่าความเห็นไม่มีปัญหาที่ผิดพลาดคือกรณีที่มีความเห็นที่ไม่เหมาะสม แต่ระบบไม่สามารถแจ้งเตือนว่าความเห็นดังกล่าวไม่เหมาะสมไม่ใช่เรื่องยากในการทำความเข้าใจว่าความผิดพลาดแบบใดที่คุณไม่ต้องการให้เกิดขึ้นกับตัวแบบการทำงานของคุณ
การประเมินด้านการข่าว
การประเมินผลลัพธ์ของกระบวนการฝึกสอนไม่ได้สิ้นสุดที่การวิเคราะห์ด้านเทคนิคถึงตอนนี้ ปณิธานและแนวทางในการทำงานของนักข่าวจะถูกนำมาใช้เพื่อช่วยคุณในการตัดสินใจว่าจะใช้ข้อมูลจากอัลกอริทึมการทำงานอย่างไร
เริ่มจากการพิจารณาก่อนว่าตอนนี้คุณมีข้อมูลที่ก่อนหน้านี้ไม่มีหรือไม่ และข้อมูลดังกล่าวคุ้มค่าต่อการนำเสนอข่าวหรือไม่ข้อมูลสัมทับกับสมมติฐานเดิมของคุณหรือทำให้คุณได้มุมมองใหม่ที่คุณไม่เคยมองมาก่อนหรือไม่
ตอนนี้คุณน่าจะเข้าใจมากขึ้นเกี่ยวกับการทำงานของระบบการเรียนรู้ของเครื่องจักร และคุณอาจอยากรู้ว่ามันสามารถทำอะไรได้บ้างแต่เรายังไม่พร้อมเข้าสู่เรื่องนี้บทเรียนถัดไปจะเป็นการแนะนำข้อกังวลที่สำคัญที่สุดเกี่ยวกับระบบการเรียนรู้ของเครื่องจักรซึ่งก็คืออคติ
-
-
Google News Archive: เข้าถึงอดีต
บทเรียนค้นพบการตีพิมพ์แบบดิจิตอลที่ผ่านมาและหนังสือพิมพ์ที่สแกนเก็บไว้ -
How to make them using makestories.io
บทเรียนmakestories.io is a platform specially created to help people make, publish, and monetize Google Web Stories. It’s free, and it can be used with any content management system. Here are the basics of how to get started with makestories.io.