आप मशीन लर्निंग का उपयोग कैसे कर सकते हैं
समझें कि किन मामलों में ML आपकी समस्या का समाधान हो सकती है।
जब मशीन लर्निंग से मदद मिल सकती है, तब आप कैसा महसूस कर रहे हैं
अब जबकि आपके पास इस बात की बेहतर समझ है कि मशीन लर्निंग क्या है और मॉडल को प्रशिक्षित करने के विभिन्न उपागम क्या हैं, तो शायद आप सोच रहे होंगे कि मशीन लर्निंग आपके दैनिक काम में कैसे मदद कर सकती है। इस पाठ में इसी पर चर्चा की जाएगी।
इस बातचीत को क्वार्ट्ज AI स्टूडियो की तुलना में किसी और अधिक प्रभावी तरीके से तैयार नहीं किया। निम्नलिखित अनुच्छेदों में हम मशीन लर्निंग में मदद करने के दौरान आपके पास हो सकने वाली कुछ स्थितियों और भावनाओं को समझने में आपकी मदद करने के लिए उनके मॉडल (अनुमति के साथ) को उधार लेंगे।
मैं इन सभी दस्तावेज़ों को कैसे पढ़ पाऊँगा?
पत्रकारिता के बारे में मूवी में उन जाँचों को महिमामंडित करने की प्रवृत्ति होती है, जिनमें पत्रकार भ्रष्टाचार की बड़ी स्टोरीज़ को उजागर करने के लिए बिना पवन वाले कमरे में दस्तावेज़ों के बक्से पढ़ते रहते हैं। यदि हम कुछ ही समय में समान परिणाम प्राप्त कर सकें, तो क्या होगा?
मशीन लर्निंग आपको ठीक ऐसा करने में मदद कर सकती है और इसी वजह से दुनिया भर के खोजी पत्रकारों द्वारा पहले ही इसका उपयोग किया जा रहा है।
2019 में अंतर्राष्ट्रीय खोजी पत्रकारों के समूह (IICIJ) को 700,000 से अधिक लीक दस्तावेज़ प्राप्त हुए, जिसे सामूहिक रूप से लुआंडा लीक के रूप में जाना जाता है। उन सभी फाइलों का विश्लेषण करने के लिए, ICIJ ने क्वार्ट्ज के साथ भागीदारी की, जिसकी जाँच टीम ने लीक के कैश में पत्रकारों द्वारा अपेक्षित प्रकार के दस्तावेज़ों को ढूँढ़ने में मदद करने के लिए मशीन लर्निंग मॉडल की रचना की।
मैं यह कैसे पता लगा सकता हूँ कि इस टेक्स्ट के बारे में अनन्य क्या है?
स्टोरी पर काम करते समय रिपोर्टर को एक और तरह की चुनौती मिल सकती है, जो समान प्रकृति के संग्रह वाले दस्तावेज़ों के सेट की तुलना करने की क्षमता है। उदाहरण के लिए, हो सकता है कि कोई राजनीतिक रिपोर्टर यूनियन के भाषणों के एक प्रेज़ीडेंट के राज्य की तुलना एक दशक बाद दूसरे प्रेज़ीडेंट के दशक के दौरान सुनाए गए सभी भाषणों से करना चाहे।
ऐसा है कि यह एक और चुनौती है, जिसे मशीन लर्निंग बहुत अच्छी तरह संभाल सकती है।
2017 में, ProPublica ने समान समय के दौरान प्रकाशित सभी कांग्रेसी प्रेस विज्ञप्तियों की तुलना में अमेरिकी कांग्रेस के अलग-अलग सदस्यों से प्रेस विज्ञप्तियों का विश्लेषण करने के लिए कंप्यूटर मॉडल का उपयोग किया। इससे रिपोर्टर यह जान सके कि कांग्रेस के सदस्यों ने किन विषयों की सबसे अधिक परवाह की, या कम से कम अपने साथियों से उनके बारे में अधिक बात की।
मैं इतनी छवियों का विश्लेषण करने में कैसे सक्षम होऊँगा?
हमारी दुनिया की दिन में खरबों बार तस्वीरें खींची जाती हैं। और यह छवियों की अभूतपूर्व मात्रा में बदलता है, जिनमें पत्रकार को स्टोरीज़ मिल सकती हैं। बस यदि दृश्य जानकारी के डेटाबेस में विशिष्ट विवरण ढूँढ़ने के लिए कंप्यूटर को सिखाने का कोई तरीका होता... आप जानते हैं कि यह कहाँ जा रहा है: मशीन लर्निंग में प्रवेश करें।
यूक्रेनी डेटा पत्रकारिता एजेंसी टेक्टी ने यूक्रेन भर में अवैध एम्बर खदानों का पता लगाने के लिए मशीन लर्निंग का उपयोग किया। विभिन्न एल्गोरिदम को संयोजित करके, वे एम्बर खनन के मौजूदा उदाहरणों पर ML प्रणाली को प्रशिक्षित करने में सक्षम रहे, ताकि यह उपग्रह चित्रों के सेट में नए उदाहरण ढूँढ़ सके।
परिणामी स्टोरी में ऑनलाइन मानचित्र शामिल था, जिसमें दर्शक देश भर में एम्बर खानों की तस्वीरों को ज़ूम कर सकते थे।
मैं इन जैसे और रिकॉर्ड्स कैसे ढूँढ़ सकता हूँ?
शब्द, छवियाँ, और अब संख्याएँ। कई चीज़ें, जिनमें कंप्यूटर इंसानों से बेहतर काम कर सकते हैं, बड़े पैमाने पर संख्यात्मक डेटा को संसाधित करना है। यदि आपके पास विश्लेषण करने के लिए हज़ारों संख्यात्मक रिकॉर्ड्स हैं, विशेष रूप से यदि आप पैटर्न और समानताओं को ढूँढ़ना चाहते हैं, अन्य केस संभाल रहे हैं, जिसमें मशीन लर्निंग मदद कर सकती है।
BuzzFeed News ने 2017 में छिपे जासूसी विमानों पर अपनी स्टोरी के लिए यही किया, जिसने रिपोर्टिंग प्रयोजनों के लिए मशीन लर्निंग लागू करने वाली पत्रकारिता के प्रारंभिक उच्च-स्तरीय उदाहरणों में से एक के रूप में काफ़ी हलचल मचाई।
उन्होंने कंप्यूटर को जासूसी विमान का पता लगाने के लिए प्रशिक्षित किया, ताकि "यादृच्छिक जंगल" एल्गोरिदम उन उड़ान पैटर्न वाले विमानों से गुजर सके, जो एफबीआई और होमलैंड सुरक्षा विभाग द्वारा संचालित विमानों के समान हों।
मशीन लर्निंग आपकी किन समस्याओं में मदद कर सकती है?
एम्बर खान, भ्रष्टाचार घोटाला, जासूसी विमान और संघ के राज्यों के भाषण। जैसा कि आप देख सकते हैं, मशीन लर्निंग डेटा के साथ महत्वपूर्ण स्टोरीज़ ढूँढ़ने और बताने की आपकी क्षमता को बढ़ाकर आपके काम का समर्थन करने में काफ़ी उपयोगी हो सकती है।
हालाँकि, अब तक यह भी स्पष्ट हो जाना चाहिए कि मशीन लर्निंग जादू नहीं है। आप शायद यह भी कह सकते हैं कि यह ऐसा कुछ नहीं कर सकती, जो आप नहीं कर सकते – यदि आपके पास बस हज़ारों अनथक इंटर्न हों, जो आपके लिए काम कर रहे हों।
यह अभी भी पूरी तरह से आपके विचार पर है कि क्या मशीन लर्निंग उस स्टोरी की सहायता करने का सही टूल है, जिसकी आप रिपोर्ट करना चाहते हैं। उस आकलन के बाद, आप जानकारी की अप्रबंधनीय मात्रा के माध्यम से गुजरने में आपकी सहायता करने के लिए मशीन लर्निंग पर भरोसा कर सकते हैं और निष्कर्षों के साथ अपनी पत्रकारिता को सशक्त बना सकते हैं।
-
-
-
Google धरती इंजन का परिचय
लेसनपरिवर्तन, मानचित्र रुझानों का पता लगाने, और पृथ्वी की सतह पर अंतर की मात्रा निर्धारित करने के लिए उपग्रह छवियों और डेटा की बहु-पेटाबाइट लाइब्रेरी का उपयोग करें