सीधे मुख्य कॉन्टेंट पर जाएं
डैशबोर्ड पर जाएं
क्या आपको जानकारी नहीं है कि कहां से शुरू करना है? अपने हिसाब से सुझाव पाने के लिए, छोटे से क्विज़ में हिस्सा लें.
18 में से 12 लेसन
Google शीट्स: डेटा साफ़ करना
Data Journalism
Google डेटा GIF निर्माता
check_box_outline_blank Data Journalism: Take the Quiz
कोर्स
0% पूरा करें
5 मिनट इन लेसन को पूरा करना बाकी है

Google शीट्स: डेटा साफ़ करना

CleaningData_Overview_1pa7Mmc.jpg
विश्लेषण और व विज़ुअलाइज़ेशन के लिए अपना डेटा तैयार करें।
CleaningData_Overview_1pa7Mmc.jpg

पाठ का सिंहावलोकन

CleaningData_Overview.jpg

विज़ुअलाइज़ेशन की तैयारी के लिए डेटा साफ़ करना सीखें।


पिछले पाठ, Google शीट्स: इंटरनेट से डेटा स्क्रैप करना में, हमने सीखा था कि importHTML का इस्तेमाल करके वेब से तालिका कैसे आयात करें। इस पाठ में, हम सीखेंगे कि डेटा को साफ़ कैसे किया जाए, ताकि यह विश्लेषण और विज़ुअलाइज़ेशन के लिए तैयार हो जाए।

  1. डेटा को संपादन-योग्य बनाना।
  2. डेटा संपादित करना। 
  3. ढूँढ़ें और बदलें के साथ बैच संपादन।


अधिक डेटा पत्रकारिता पाठों के लिए, यहाँ जाएँ:

newsinitiative.withgoogle.com/training/course/data-journalism

CleaningData_Overview.jpg

डेटा को संपादन-योग्य बनाना।

"डेटा की सफ़ाई" का मतलब है, इसे काम करने के लिए इस्तेमाल करने योग्य बनाना: सुनिश्चित करना कि तालिका में अखंडता है, यह विसंगतियों से मुक्त है और इस तरह संरचित है कि कंप्यूटर समझ लेगा। इसका मतलब है कि हम डुप्लिकेट पंक्तियों को हटा देंगे, अवांछित वर्णों को हटा देंगे और सुनिश्चित करेंगे कि कॉलम में केवल एक प्रकार का डेटा है, उदाहरण के लिए नंबर या टेक्स्ट, लेकिन दोनों नहीं। सबसे पहले, हमें डेटा को संपादन-योग्य बनाने की ज़रूरत है।



यह तालिका importHTML का परिणाम दिखाती है। इस रूप में, डेटा स्रोत (Wikipedia पृष्ठ) में कोई बदलाव स्वतः यहाँ दिखाई देगा, और यह एक घंटे में कम-से-कम एक बार अपडेट किया जाता है। तथापि, हम अवांछनीय वर्णों को हटाने के लिए सेल में मान संपादित नहीं कर सकते। डेटा का स्टैटिक स्नैपशॉट बनाने के लिए, हम Google शीट्स में पेस्ट स्पेशल का इस्तेमाल करेंगे। इसके साथ, हम importHTML के द्वारा तालिका को स्वचालित रूप से अपडेट करने की क्षमता खो देंगे, लेकिन हम इसे संपादित कर सकेंगे। 


अपनी शीट में ऊपर बाईं आयत में बायाँ क्लिक करके सभी डेटा चुनें। सभी सेल हाइलाइट हो जाने के बाद, संपादित करें > प्रतिलिपि करें पर क्लिक करें। संपादित करें > पेस्ट स्पेशल > केवल मान चिपकाएँ चुनें।  अब हम तालिका को संपादित कर सकते हैं। 


संपादन को आसान बनाने के लिए, हम कॉलम के नाम वाली पंक्ति को फ़्रीज करेंगे। भूरी बार के ऊपर पंक्ति 1 ऊपर लाइन पर माउस कर्सर होवर करें। आप देखेंगे कि कर्सर दस्ताने में बदल गया है। बार को पंक्ति 1 के नीचे खींचें और उसे वहाँ छोड़ दें। अब शीर्ष पंक्ति फ़्रीज़ हो जाएगी।

डेटा संपादित करना।

importHTML Wikipedia तालिका से उन बचे हुए वर्ण को आयात करेगा, जो मानव के लिए उपयोगी हैं, लेकिन कंप्यूटर के लिए नहीं। आइए हम उन्हें हटा दें और अपनी तालिका को साफ़ करें!



चूँकि हमें इस अभ्यास के लिए कॉलम F की ज़रूरत नहीं है, इसलिए कॉलम के शीर्ष पर F वर्ण पर दायाँ-क्लिक करें और हटाएँ चुनें।


पंक्ति A14 में नंबर 13 के आगे वर्ण "F" है, और सेल B27 में नंबर 4 की बगल में "TS3" है। हम इन वर्ण को हटा देंगे, ताकि केवल नंबर 13 और 4 रह जाए।


सेल B40 और B48 में अतिरिक्त वर्णों को हटा दें, ताकि केवल 19 और 8 शेष रहें। लीडिंग "F8" को निकालने के लिए D17 में भी ऐसा ही करें।

ढूँढ़ें और बदलें के साथ बैच संपादन।

अब, स्तंभ C पर नज़र डालें। आइए हम एक-एक पंक्ति के बजाय ढूँढ़ें और बदलें सुविधा का इस्तेमाल करके लीडिंग और ट्रेलिंग * वर्णों को बैच में निकालें।



कॉलम के शीर्ष पर वर्ण C पर बायाँ क्लिक करके कॉलम C चुनें। संपादित करें > ढूँढ़ें और बदलें चुनें।


पहले टेक्स्ट बॉक्स में एस्टेरिक चिह्न टाइप करें: * (यह वह वर्ण है जिसे हम स्तंभ C में खोजना चाहते हैं)। इससे बदलें टेक्स्ट बॉक्स को खाली छोड़ दें, ताकि एस्टेरिक कुछ नहीं से बदल जाए, जिसका मतलब है कि वे हटा दिए जाएँगे। 


सुनिश्चित करें कि खोज विकल्प विशिष्ट रेंज कहता है और रेंज आपके द्वारा अभी-अभी चयनित कॉलम को दर्शाती है। चेकबॉक्स को अनचेक छोड़ दें। 


सभी बदलें चुनें।ध्यान दें कि Google शीट्स आपको बताएगी कि इसने * के साथ 100 मामलों को (कुछ नहीं) से बदल दिया है। इसका मतलब है कि आपने केवल कुछ क्लिक के साथ 50 पंक्तियों में 100 वर्णों को सफलतापूर्वक निकाल दिया है! 


संपन्न चुनें। हमारी तालिका अब साफ़ है और हमारे काम के लिए तैयार है। अगले पाठ में, हम विज़ुअलाइज़ेशन तैयार करेंगे और डेटा से अंतर्दृष्टि प्राप्त करेंगे। 

बधाई!

VisualizingData_overview.jpg

आपने "Google शीट्स: डेटा की सफ़ाई” में सीखेंगे।



अपने डिजिटल पत्रकारिता कौशलों को बढ़ाना जारी रखने और Google समाचार पहल प्रमाणीकरण की दिशा में काम करने के लिए, हमारे प्रशिक्षण केंद्र की वेबसाइट पर जाएँ और अन्य पाठ लें:



अधिक डेटा पत्रकारिता पाठों के लिए, यहाँ जाएँ:

newsinitiative.withgoogle.com/training/course/data-journalism


VisualizingData_overview.jpg
बधाई हो! आपने अभी-अभी इसे पूरा किया Google शीट्स: डेटा साफ़ करना in progress
Recommended for you
आप इस लेसन से किस हद तक संतुष्ट हैं?
आपके सुझाव, राय या शिकायत से, हमें अपने लेसन को और बेहतर बनाने में मदद मिलेगी!
क्या आपको यह पेज छोड़ना है और अपनी प्रोग्रेस का डेटा मिटाना है?
इस पेज को छोड़ने पर, मौजूदा लेसन के लिए आपकी प्रोग्रेस का पूरा डेटा मिट जाएगा. क्या आपको वाकई इस पेज को छोड़कर अपनी प्रोग्रेस का डेटा मिटाना है?