मशीन लर्निंग के साथ लेखों की खोजबीन
अपनी रिपोर्टिंग में मशीन लर्निंग का किस प्रकार उपयोग करें
विवेचनाओं के लिए मशीन लर्निंग : एक केस-अध्ययन
2010 में, वैश्विक बाज़ार में ऐंबर का मूल्य बढ़ना प्रारम्भ हो गया था। उच्च मांग के कारण आने वाले वर्षों में उत्तरी-पश्चिमी यूक्रेन के ऐंबर-सम्पन्न क्षेत्रों ने विदेशी और स्थानीय दिलचस्पी को आकर्षित किया और गैरकानूनी “ऐंबर मांग", नया “वाइल्ड वेस्ट", के रंगमंच बन गए थे।
सैंकड़ों हेक्टेयर के जंगल और कृषि भूमि एक निर्जीव उपग्रह के परिदृश्य में बदल दिये गए थे, और 2014 से 2016 के बीच से आरंभ होकर बाद वाले वर्षों में अत्यंत गहन खनन गतिविधि की गई थी।
Leprosy of the Land (भूमि का कोढ़), Texty द्वारा एक विवेचना
In 2018 में, यूक्रेन डैटा जर्नलिज़्म एजेंसी Texty ने Leprosy of the Land एक विवेचना प्रकाशित की थी जिसमें उसने सम्पूर्ण यूक्रेन में गैरकानूनी ऐंबर खनन मामलों की जांच के लिए मशीन लर्निंग तकनीकों का प्रयोग किया था।
प्रथम, एक एल्गोरिद्म ने सेटलाइट चित्रों के खंडों को दृष्टिगत रूप से एक जैसे उपखंडों में विभाजित किया। अत: यदि किसी चित्र में आधा हरा जंगल और आधा गंदा क्षेत्र है, तो यह उस चित्र को उन दो उपखंडों में विभाजित कर देगा।
एक अन्य एल्गोरिद्म ने खोजा कि कौनसे उपखंड ऐंबर खनन के उन मौजूद उदाहरणों से मेल खाते हैं जिनमें धरती में फुंसी जैसे छिद्रों के विशिष्ट पैटर्न हैं।
अंतत:, यह सुनिश्चित करने कि ऐंबर खनन जैसी दिखने वाली आकृतियाँ वास्तव में वन-कटाई जैसी कुछ अन्य तो नहीं है, पत्रकारों ने मिले एल्गोरिद्म के उदाहरणों की जांच की।
गैरकानूनी ऐंबर खनन के उदाहरण खोजना
इस पाठ्यक्रम में, हम Texty द्वारा एल्गोरिद्म को शिक्षित करने हेतु की गई उन कार्यविधियों पर ध्यान करेंगे जिनके प्रयोग से पहले कई सेटलाइट चित्रों में किसी अन्य एल्गोरिद्म द्वारा उपखंडों में विभाजित किए गए गैरकानूनी ऐंबर खनन दृश्य के उदाहरणों की पहचान की जा सके।
जैसा की प्रथम पाठ में वर्णित है, इसका अर्थ है कि हम पर्यवेक्षण लर्निंग का प्रयोग करेंगे। आप सीख पायेंगे कि कोई एल्गोरिद्म, इसके द्वारा पहले कभी न देखे गए चित्रों में समान पैटर्न की पहचान करने वाले पूर्व में लेबल किये गए पैटर्न से, कैसे सीख सकता है।
आप यह भी सीखेंगे कि आप कैसे अपने स्वयं के लेखों के लिए कार्यविधि को दोहरा सकते हैं : आपकी आवश्यकता के उदाहरणों की खोजने से लेकर, खोजे जाने वाले तत्व को पहचानने हेतु मशीन लर्निंग मॉडल को शिक्षित करने, और फिर मॉडल का परीक्षण और विश्लेषण करने तक, ताकि यह सुनिश्चित किया जा सके कि यह विश्वसनीय परिणाम प्रस्तुत करें।
क्या इस समस्या के लिए ML उचित संसाधन है?
परन्तु Texty द्वारा खोजी जा रही जानकारी को खोजने के लिए मशीन लर्निंग उचित संसाधन क्यों था?
पारम्परिक प्रोग्रामिंग में आपको कम्प्युटर द्वारा अनुसरण किए जाने वाले उत्तरोत्तर निर्देशों का वर्णन करना होगा। यद्यपि यह कार्यविधि कई प्रकार की समस्याओं का निवारण करने का कार्य करती है, यह गैरकानूनी ऐंबर खनन के अत्याधिक सेटलाइट चित्रों को पहचान करने में असमर्थ है। ऐसे कई दिखाऊ तत्व हैं जिन पर कम्प्युटर को यह विचार करना होगा कि सॉफ्टवेयर को गैरकानूनी ऐंबर खनन के वास्तविक उदाहरणों और उस जैसे दिखने वाले तत्वों में अंतर करना सिखाने वाले नियमों के सैट बनाना असंभव है।
सौभाग्यवश, इस समस्या को सुलझाने में मशीन लर्निंग सिस्टम अत्यंत सक्षम हैं।
कार्यविधि पर ध्यान केन्द्रित करें
ध्यान रखें कि आप इस पाठ्यक्रम - गैरकानूनी ऐंबर खनन को कैसे खोजें - से जो सीखेंगे, वह केवल एक उदाहरण है। उसी कार्यविधि का अनुसरण करते हुए मशीन लर्निंग से पत्रकारिता से संबन्धित कई भिन्न कार्य किये जा सकते हैं और चित्रों के साथ-साथ विभिन्न प्रकार की सामग्रियों के विश्लेषण के लिए भी प्रयोग किया जा सकता है। पाठ्यक्रम के अन्त में हम कुछ अन्य प्रयोग किये गए मामलों की समीक्षा करेंगे। इस अभ्यास को करने के दौरान विशिष्ट केस अध्ययन के स्थान पर कार्यविधि पर ध्यान केन्द्रित करना याद रखें।
अब, वास्तविक अभ्यास प्रारम्भ करने से पूर्व, हमें अगले पाठों में सीखे जाने वाले संसाधन को जानने और व्यवस्थित करने हेतु कुछ मिनट समर्पित करने होंगे। Google Cloud AutoML Vision।
-
वीडियो: Pinpoint का इस्तेमाल शुरू करें
लेसनGoogle के रिसर्च टूल, Pinpoint की मदद से हज़ारों दस्तावेज़ों को देखें और उनका विश्लेषण करें. -
-