التحقيق في القصص باستخدام التعلم الآلي
كيف يمكنك استخدام التعلم الآلي في تقاريرك
استخدام التعلم الآلي للتحقيق في القصص والقضايا: دراسة حالة
في عام 2010، بدأ سعر الكهرمان في السوق العالمية بالارتفاع. ونظرًا لارتفاع الطلب، في السنوات التالية، جذبت أجزاء من شمال غرب أوكرانيا الغنية بالكهرمان اهتمامًا محليًا وأجنبيًا، وأصبحت مسرحًا لـ "التهافت على الكهرمان" بشكل غير قانوني، "غرب متوحش" الجديد.
تم تحويل مئات الهكتارات من الغابات والأراضي الزراعية إلى أراض ممتلئة بالفجوات بلا حياة، وقد كان نشاط التعدين الأكثر كثافة بين عامي 2014 و2016 واستمر على مدى السنوات التالية.
Leprosy of the Land "جذام الأرض"، تحقيق بواسطة وكالة Texty
في عام 2018، نشرت وكالة صحافة البيانات الأوكرانية Texty التحقيق Leprosy of the Land "جذام الأرض"، وهو تحقيق استخدمت فيه تقنيات التعلم الآلي للكشف عن حالات التعدين غير القانوني للكهرمان في جميع أنحاء أوكرانيا.
أولًا، قسَّمت إحدى الخوارزميات مقاطع صور الأقمار الصناعية إلى مقاطع فرعية موحدة بصريًا. وبالتالي، إذا كانت الصورة تمثل نصف غابة خضراء ونصف حقل ترابي، فإنها ستقسِّم الصورة إلى هذين المقطعين الفرعيين.
وتعرفت خوارزمية أخرى على مقاطع فرعية تشبه إلى حد كبير الأمثلة الحالية لتعدين الكهرمان، والتي لها نمط مميز يشبه الفتحات في الأرض.
أخيرًا، فحص الصحفيون الأمثلة التي عثرت عليها الخوارزمية، للتأكد من أن ما اعتقدت أنه تعدين للكهرمان لم يكن في الواقع شيئًا آخر، مثل إزالة الغابات.
العثور على أمثلة للتعدين غير القانوني للكهرمان
في هذه الدورة، سنركز على الأساليب التي استخدمتها وكالة Texty لتدريب خوارزمية للتعرف على الأمثلة المرئية للتعدين غير القانوني للكهرمان وسط كمية هائلة من صور الأقمار الصناعية، مُقسَّمة مسبقًا إلى مقاطع فرعية بواسطة خوارزمية أخرى.
وكما ذكرنا في الدرس الأول، فإن ذلك يعني أننا سوف نخوض تجربة التعلُّم تحت الإشراف. سوف تتعلم كيف يمكن للخوارزمية أن تتعلم من الأمثلة المُصنَّفة للتعرف على نفس النمط في الصور التي لم تشاهدها من قبل.
وستتعلم أيضًا كيف يمكنك تكرار هذه العملية في قصصك الخاصة: بدءًا من العثور على الأمثلة التي تحتاجها، ومرورًا بتدريب نموذج التعلم الآلي للتعرف على ما تبحث عنه، وانتهاءً باختبار النموذج وتقييمه للتأكد من أنه يقدم نتائج موثوق بها.
هل التعلم الآلي (ML) هو الأداة المناسبة لهذه المشكلة؟
ولكن لماذا كان التعلم الآلي هو الأداة المناسبة للعثور على المعلومات التي كانت وكالة Texty تبحث عنها؟
تتطلب البرمجة التقليدية منك تحديد التعليمات خطوة بخطوة ليتَّبعها الكمبيوتر. هذا النهج يعمل على حل مجموعة متنوعة من المشكلات، إلا أنه لا يرقى إلى مهمة التعرف على أمثلة التعدين غير القانوني للكهرمان وسط كمية هائلة من صور الأقمار الصناعية. هناك عدد كبير جدًا من العناصر المرئية التي سيحتاج الكمبيوتر إلى أخذها بعين الاعتبار بما يُصبح معه من المستحيل التوصل إلى النتائج من خلال مجموعة من القواعد التي يتم إعطاؤها خطوة بخطوة لتُعلِّم البرنامج التمييز بين الأمثلة الحقيقية للتعدين غير القانوني للكهرمان والأشياء التي قد تبدو مجرد أشياء مشابهة.
لحسن الحظ، فإن أنظمة التعلُّم الآلي في وضع جيد يُمكِّنها من حل هذه المشكلة.
ركِّز على الخطوات
ضع في اعتبارك أن ما ستتعلمه في هذه الدورة - كيفية الكشف عن أنشطة التعدين غير القانونية للكهرمان - هو مثال واحد فقط. وباتباع نفس الخطوات، يمكن استخدام التعلم الآلي لتنفيذ عدد من المهام الصحفية المختلفة، ويمكن حتى تطبيقه لتحليل أنواع مختلفة من المحتوى، وليس الصور فقط. وسنراجع بعض حالات الاستخدام الأخرى في نهاية الدورة. أثناء قيامنا بالتمرين، تذَّكر أن تُركِّز على الخطوات أكثر من التركيز على دراسة الحالة المُحدَّدة كمثال هنا.
والآن، قبل أن نبدأ التمرين الفعلي، نحتاج إلى تكريس بضع دقائق للتعرف إلى الأداة التي سنتعلم استخدامها في الدروس التالية: Google Cloud AutoML Vision.