เครื่องจักรมีการเรียนรู้อย่างไร
รายละเอียดเบื้องต้นแบบเป็นขั้นตอนเกี่ยวกับกระบวนการฝึกสอน ML
นำเสนอตัวแบบในการเรียนรู้ของเครื่องจักรของคุณ
เราได้บอกใบ้ไปบางส่วนแล้วว่าตัวแบบในการทำงานของ AI ต้องผ่าน “การฝึกสอน” เพื่อให้ได้ผลลัพธ์อย่างที่คาดหวังในบทเรียนนี้คุณจะได้เรียนรู้เกี่ยวกับขั้นตอนต่าง ๆ ในกระบวนการฝึกสอนจากกรณีศึกษาเฉพาะด้าน
เป้าหมายคือเพื่อช่วยให้คุณเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องจักร แต่ยังไม่ถึงขนาดที่คุณจะสามารถจำลองกระบวนการนี้ไปใช้ได้ด้วยตัวเอง
ก่อนตัดสินใจใช้ระบบการเรียนรู้ของเครื่องจักร ให้ถามตัวเองก่อนว่า:คำถามใดที่ฉันกำลังต้องการคำตอบและฉันต้องการระบบการเรียนรู้ของเครื่องจักรเพื่อให้ได้สิ่งที่ต้องการหรือไม่
คุณมีคำถามอะไรที่ต้องการคำตอบ
ลองนึกดูว่าจะเป็นอย่างไรหากเว็บไซต์ของคุณเปิดรับความเห็นจากผู้อ่านบทความได้ในทุก ๆ วันมีความคิดเห็นเป็นจำนวนมากถูกโพสต์ไว้ และบางความเห็นอาจค่อนข้างรุนแรง
จะดีแค่ไหนหากระบบอัตโนมัติสามารถจำแนกประเภทความเห็นทั้งหมดที่โพสต์ในระบบของคุณ และสามารถระบุรายการที่ “อาจไม่เหมาะสม” และทำหมายเหตุกำกับไว้สำหรับผู้ดูแลเพื่อให้มีการพิจารณาทบทวนและปรับปรุงคุณภาพของการพูดคุย
และนี่คือปัญหาที่ระบบการเรียนรู้ของเครื่องจักรสามารถเข้ามาช่วยคุณได้และนี่คือสิ่งที่มันถูกใช้งานอยู่ในปัจจุบันดูรายละเอียดเพิ่มเติมได้ที่ Jigsaw's Perspective API
นี่เป็นตัวอย่างที่เราจะใช้เพื่อเรียนรู้เกี่ยวกับการฝึกสอนตัวแบบในการทำงานของระบบการเรียนรู้ของเครื่องจักร นอกจากนี้กระบวนการเดียวกันนี้ยังสามารถต่อยอดไปยังกรณีศึกษาอื่น ๆ ได้อีก
ประเมินรูปแบบการใช้งานของคุณ
ในการนำเสนอตัวแบบเพื่อตรวจหาความเห็นที่อาจไม่เหมาะสม คุณจะต้องมีข้อมูลก่อนในเบื้องต้นซึ่งในกรณีนี้ก็คือตัวอย่างความเห็นที่คุณได้รับจากเว็บไซต์ของคุณแต่ก่อนที่จะจัดทำชุดข้อมูลของคุณ สิ่งที่สำคัญคือการพิจารณาว่าผลลัพธ์แบบใดที่คุณคาดหวัง
แม้แต่กับมนุษย์เอง การะบุว่าความเห็นใดอาจไม่เหมาะสมและไม่ควรเผยแพร่ในระบบออนไลน์อาจชี้ชัดลงไปได้ยากผู้ดูแลระบบสองคนอาจต้องช่วยกันแลกเปลี่ยนความคิดเกี่ยวกับความเห็นที่คิดว่า “ไม่เหมาะสม”คุณไม่สามารถคาดหวังให้อัลกอริทึมในการทำงาน “ทำงานได้อย่างถูกต้อง” เสมอไป
ระบบการเรียนรู้ของเครื่องจักรสามารถจัดการข้อมูลความเห็นเป็ฯจำนวนมากโดยใช้เวลาเพียงไม่กี่วินาที แต่สิ่งสำคัญคือจะต้องไม่ลืมว่านี่เป็นแค่ “การคาดเดา” จากการเรียนรู้ของระบบเท่านั้นบางครั้งระบบอาจให้คำตอบที่ไม่ถูกต้องหรือทำงานผิดพลาดได้
การสืบค้นข้อมูล
ถึงเวลาในการเตรียมชุดข้อมูลของคุณแล้วในกรณีศึกษาของเรา เราได้เรียนรู้ไปแล้วว่าข้อมูลประเภทใดที่เราต้องการ และจะค้นหาได้จากที่ไหน ซึ่งก็คือความเห็นที่โพสต์ในเว็บไซต์ของคุณ
เนื่องจากคุณต้องการรูปแบบการทำงานของระบบการเรียนรู้ของเครื่องจักรเพื่อตรวจหาความเห็นที่ไม่เหมาะสม คุณจะต้องจัดทำข้อมูลตัวอย่างข้อความที่คุณต้องการใช้เพื่อแยกประเภท (ความเห็น) รวมทั้งหมวดหมู่หรือหมายเหตุกำกับเพื่อให้ ML คาดการณ์ (“ไม่เหมาะสม” หรือ “ไม่มีปัญหา”)
สำหรับรูปแบบการใช้งานอื่น ๆ คุณอาจสามารถหาข้อมูลได้ง่ายกว่านี้คุณจะต้องหาข้อมูลเหล่านี้จากคลังข้อมูลของหน่วยงานของคุณหรือจากบุคคลภายนอกไม่ว่าจะในกรณีใด กรุณาศึกษาระเบียบข้อบังคับด้านการปกป้องข้อมูลในพื้นที่และในสถานที่ที่คุณจะใช้งานระบบ
การจัดเตรียมข้อมูลของคุณให้เป็นรูปเป็นร่าง
หลังจากรวบรวมข้อมูลได้แล้ว และก่อนที่จะป้อนข้อมูลเข้าเครื่อง คุณจะต้องวิเคราะห์ข้อมูลนี้อย่างละเอียดก่อนผลการทำงานของระบบการเรียนรู้ของเครื่องจักรตามรูปแบบที่คุณกำหนดจะดีและสมบูรณ์ก็โดยขึ้นอยู่กับข้อมูลที่คุณจัดไว้ (จะมีกล่าวถึง “ความเป็นธรรม” ในบทเรียนถัดไป)คุณจะต้องทบทวนรูปแบบการใช้งานของคุณว่าอาจส่งผลกระทบต่อบุคคลที่เกี่ยวข้องโดยตัวแบบการทำงานนี้อย่างไร
นอกจากนี้ เพื่อให้สามารถฝึกสอนรูปแบบการทำงานได้อย่างมีประสิทธิภาพ คุณจะต้องมีตัวอย่างกำกับมากเพียงพอและกระจายข้อมูลนี้อย่างเท่าเทียมกันในหมวดหมู่ต่าง ๆและจะต้องจัดหาชุดข้อมูลที่ครอบคลุม โดยพิจารณาจากบริบทและภาษาที่ใช้ เพื่อให้รูปแบบการทำงานนี้ครอบคลุมตัวแปรต่าง ๆ ที่เกี่ยวข้องในการทำงานของคุณ
การเลือกอัลกอริทึม
หลังจากเตรียมชุดข้อมูลเสร็จสิ้น คุณจะต้องเลือกอัลกอริทึมสำหรับระบบการเรียนรู้ของเครื่องจักรที่จะฝึกสอนอัลกอริทึมทุกตัวจะมีวัตถุประสงค์เฉพาะคุณจะต้องเลือกอัลกอริทึมที่เหมาะสมตามผลลัพธ์ที่คุณคาดหวัง
ในบทเรียนก่อนหน้าเราได้เรียนรู้เกี่ยวกับแนวทางต่าง ๆ ที่ใช้ในระบบการเรียนรู้ของเครื่องจักรเนื่องจากกรณีศึกษาของเราจะต้องอาศัยชุดข้อมูลที่มีหมายเหตุกำกับเพื่อให้สามารถแยกประเภทความเห็นที่ “ไม่เหมาะสม” หรือ “ไม่มีปัญหา” ระบบที่เราต้องใช้ในที่นี้จึงเป็นระบบการเรียนรู้แบบมีการกำกับดูแล
Google Cloud AutoML Natural Language คือหนึ่งในอัลกอริทึมที่ช่วยให้คุณสามารถก้าวไปสู่ผลลัพธ์ที่คาดหวังนี้ได้แต่ไม่ว่าคุณจะเลือกอัลกอริทึมใด ให้ปฏิบัติตามคำแนะนำที่ระบุไว้เกี่ยวกับการกำหนดรูปแบบชุดข้อมูลที่จะใช้เพื่อฝึกสอน
การฝึกสอน การยืนยันและการทดสอบตัวแบบในการทำงาน
จากนี้เราจะเข้าสู่ขั้นตอนการฝึกสอนที่ถูกต้องโดยเราจะใช้ข้อมูลนี้เพื่อปรับปรุงความสามารถของตัวแบบในการทำงานไปเรื่อย ๆ สำหรับการคาดการณ์ความเห็นที่ไม่เหมาะสมและความเห็นที่ไม่มีปัญหาให้ต้องกังวลเราจะป้อนข้อมูลส่วนใหญ่ของเราไปยังอัลกอริทึม รอแปป เอาล่ะ ตัวแบบการทำงานของเราผ่านการฝึกสอนเรียบร้อยแล้ว
แต่ทำไมถึงบอกว่าข้อมูล "ส่วนใหญ่”ก็เพื่อให้แน่ใจว่าตัวแบบการทำงานจะเรียนรู้ได้อย่างถูกต้อง โดยคุณจะต้องแจ้งข้อมูลออกเป็นสามส่วนได้แก่
- ชุดข้อมูลการฝึกสอนสิ่งที่ตัวแบบของคุณ “จะรับรู้” และทำการเรียนรู้
- ชุดข้อมูลยืนยันเป็นอีกกระบวนการฝึกสอนที่แยกออกจากกันเพื่อปรับปรุงไฮเปอร์พารามิเตอร์ต่าง ๆ ซึ่งเป็นตัวแปรเพื่อระบุโครงสร้างของตัวแบบการทำงาน
- ชุดข้อมูลทดสอบจะเข้าสู่ขั้นตอนนี้หลังจากการฝึกสอนเราจะใช้ข้อมูลนี้เพื่อทดสอบประสิทธิภาพในการทำงานของตัวแบบกับข้อมูลที่ระบบไม่เคยพบมาก่อน
การประเมินผลลัพธ์
คุณจะทราบได้อย่างไรว่าตัวแบบการทำงานเรียนรู้ในการค้นหาความเห็นที่อาจไม่เหมาะสมได้อย่างถูกต้อง
หลังจากการฝึกสอนเสร็จสิ้น อัลกอริทึมนี้จะระบุข้อมูลเบื้องต้นเกี่ยวกับผลการทำงานของตัวแบบตามที่เราได้กล่าวไปก่อนหน้านี้ คุณไม่สามารถคาดหวังให้ตัวแบบการทำงานทำงานได้อย่างถูกต้อง 100% เสมอไปคุณจะต้องตัดสินเองว่าผลลัพธ์ใดที่ “ดีเพียงพอ” ตามสถานการณ์แวดล้อม
ประเด็นหลักที่คุณต้องพิจารณาคือการประเมินตัวแบบการทำงานของคุณว่าสามารถระบุข้อผิดพลาดได้อย่างถูกต้องและไม่มีจุดบกพร่องที่น่ากังวลใด ๆในกรณีของเรา การแจ้งผลที่ผิดพลาดจะหมายถึงความเห็นที่ไม่เป็นปัญหาแต่ถูกแจ้งว่าไม่เหมาะสมคุณสามารถทำการยกเลิกได้ง่าย ๆ และให้ระบบลองทำงานต่อไปการแจ้งผลว่าความเห็นไม่มีปัญหาที่ผิดพลาดคือกรณีที่มีความเห็นที่ไม่เหมาะสม แต่ระบบไม่สามารถแจ้งเตือนว่าความเห็นดังกล่าวไม่เหมาะสมไม่ใช่เรื่องยากในการทำความเข้าใจว่าความผิดพลาดแบบใดที่คุณไม่ต้องการให้เกิดขึ้นกับตัวแบบการทำงานของคุณ
การประเมินด้านการข่าว
การประเมินผลลัพธ์ของกระบวนการฝึกสอนไม่ได้สิ้นสุดที่การวิเคราะห์ด้านเทคนิคถึงตอนนี้ ปณิธานและแนวทางในการทำงานของนักข่าวจะถูกนำมาใช้เพื่อช่วยคุณในการตัดสินใจว่าจะใช้ข้อมูลจากอัลกอริทึมการทำงานอย่างไร
เริ่มจากการพิจารณาก่อนว่าตอนนี้คุณมีข้อมูลที่ก่อนหน้านี้ไม่มีหรือไม่ และข้อมูลดังกล่าวคุ้มค่าต่อการนำเสนอข่าวหรือไม่ข้อมูลสัมทับกับสมมติฐานเดิมของคุณหรือทำให้คุณได้มุมมองใหม่ที่คุณไม่เคยมองมาก่อนหรือไม่
ตอนนี้คุณน่าจะเข้าใจมากขึ้นเกี่ยวกับการทำงานของระบบการเรียนรู้ของเครื่องจักร และคุณอาจอยากรู้ว่ามันสามารถทำอะไรได้บ้างแต่เรายังไม่พร้อมเข้าสู่เรื่องนี้บทเรียนถัดไปจะเป็นการแนะนำข้อกังวลที่สำคัญที่สุดเกี่ยวกับระบบการเรียนรู้ของเครื่องจักรซึ่งก็คืออคติ
-
-
-
การยืนยันแบบ 2 ขั้นตอน: ความปลอดภัยที่แน่นหนาสำหรับบัญชี Google ของคุณ
บทเรียนเพิ่มชั้นพิเศษของการป้องกันนอกเหนือจากรหัสผ่านของคุณ