Google शीट्स: इंटरनेट से डेटा स्क्रैप करना
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg](https://storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Google शीट्स का इस्तेमाल करके अपने खुद के डेटा सेट बनाएँ।
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg](https://storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Google शीट्स का इस्तेमाल करके अपने खुद के डेटा सेट बनाना सीखें।
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg](https://storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
इंटरनेट पर भारी मात्रा में डेटा उपलब्ध है, जिसका इस्तेमाल आप स्टोरी का अनुसंधान और कल्पना करने के लिए कर सकते हैं। डेटा खोजना, और इसे उस फ़ॉरमेट में प्राप्त करना, जिसके साथ आप काम कर सकते हैं, पहला चरण है।
- नई स्प्रेडशीट शुरू करना।
- विश्वसनीय डेटा ढूँढ़ना।
- Google शीट्स में डेटा आयात करना।
- समस्या-निवारण और त्रुटि संदेश।
- अपना डेटा प्रदर्शित करना।
अधिक डेटा पत्रकारिता पाठों के लिए, यहाँ जाएँ:
https://newsinitiative.withgoogle.com/training/course/data-journalism
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg](https://storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
नई स्प्रेडशीट शुरू करना।
![Scraping_Data_Starting_a_new_spreadsheet_step1_1PFBxZc.jpg](https://storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step1_.original.jpg)
![Scraping_Data_Starting_a_new_spreadsheet_step2_PvYQht8.jpg](https://storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step2_.original.jpg)
Starting a new spreadsheet.
सबसे पहले, आपको खाली स्प्रेडशीट बनानी होगी। sheets.google.com पर जाएँ। नई स्प्रेडशीट प्रारंभ करें के अंतर्गत, + आइकन पर क्लिक करें।
अपनी स्प्रैडशीट को नाम देने के लिए, ऊपर बाएँ कोने में टेक्स्ट पर क्लिक करें। आइए इसे "हाईएस्ट ग्रॉसिंग मूवीज़" नाम दें।
![Scraping_Data_Starting_a_new_spreadsheet_step1_1PFBxZc.jpg](https://storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step1_.original.jpg)
![Scraping_Data_Starting_a_new_spreadsheet_step2_PvYQht8.jpg](https://storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step2_.original.jpg)
विश्वसनीय डेटा ढूँढ़ना।
![ScrapingData_Finding_reliable_data_step1_4vjqTxu.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step1_4vjqTx.original.jpg)
![ScrapingData_Finding_reliable_data_step2_XP0NWL0.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step2_XP0NWL.original.jpg)
सरकारी साइट, वैज्ञानिक प्रकाशनों, Wikipedia, Google सार्वजनिक डेटा एक्सप्लोरर तथा और अधिक से डेटा सोर्स करके, आप लगभग किसी भी विषय पर डेटा स्टोरी कह सकते हैं। इस पाठ में, हम मूवीज़ के डेटा के साथ अभ्यास करेंगे।
google.com पर जाएँ और सबसे ज़्यादा कमाई करने वाली फ़िल्में खोजें। पहले लिंक में से एक, कई तालिकाओं के साथ Wikipedia प्रविष्टि होना चाहिए। एक सूची, जिसे "सभी समय की शीर्ष 50 सबसे अधिक कमाई वाली फ़िल्में" कहा जाता है, कई संदर्भों का हवाला देती है, इसलिए हम इसका इस्तेमाल करेंगे। हमेशा यह सुनिश्चित करने के लिए जाँच करें कि आप डेटा विश्वसनीय स्रोतों से स्क्रैप कर रहे हैं।
इस तालिका का Google शीट्स में आयात करने के लिए, URL हाइलाइट करके, उस पर दायाँ क्लिक करके, और प्रतिलिपि करें चुनकर, Wikipedia पृष्ठ के पते की प्रतिलिपि करें।
![ScrapingData_Finding_reliable_data_step1_4vjqTxu.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step1_4vjqTx.original.jpg)
![ScrapingData_Finding_reliable_data_step2_XP0NWL0.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step2_XP0NWL.original.jpg)
Google शीट्स में डेटा आयात करना।
![ScrapingData_Importing_data_to_Google_Sheets_step1_mM4p6WL.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step2_IygT0Zy.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step3_gznqq5C.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
हम अपनी स्प्रैडशीट में Wikipedia से तालिका आयात करने के लिए importHTML का इस्तेमाल करेंगे। वेब पृष्ठों से तालिकाएँ या सूचियाँ आयात करने में मदद के लिए, यह शक्तिशाली सूत्र Google शीट्स में अंतर्निर्मित है। इस बारे में अधिक जानने और उदाहरणों को देखने के लिए Google शीट्स प्रलेखन पृष्ठ पढ़ें कि importHTML कैसे काम करता है।
importHTML टूल को काम करने के लिए तीन पैरामीटर की ज़रूरत होती है: 1) URL2) हम जो डेटा एकत्रित कर रहे हैं, उसका प्रकार, तालिका या सूची3) HTML कोड में तालिका या सूची की स्थिति का प्रतिनिधित्व करने वाली संख्या। इस उदाहरण में, तालिका की पहली आवृत्ति को एक के रूप में नंबर किया जाएगा, क्योंकि जो तालिका हम चाहते हैं, वह HTML में दिखाई देने वाली पहली तालिका है। यह जानने के लिए आप परीक्षण और त्रुटि का इस्तेमाल कर सकते हैं या वेबपृष्ठ पर दायाँ क्लिक कर सकते हैं कि तालिका (1, 2, 3, आदि) की स्थिति क्या है, कोड में तालिका का पता लगाने के लिए निरीक्षण करें > खोजें चुनें।
स्वयं द्वारा बनाई गई खाली शीट पर जाएँ और सेल A1 पर जाएँ। प्रकार:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)
ध्यान दें कि URL और तत्व प्रकार (हमारे मामले में, तालिका) उद्धरणों के बीच रखे जाते हैं - यह पैरामीटर को हरा बना देगा। अंतिम पैरामीटर नंबर है, जो उद्धरणों के भीतर नहीं है और यह नीले रंग का होगा।
![ScrapingData_Importing_data_to_Google_Sheets_step1_mM4p6WL.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step2_IygT0Zy.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step3_gznqq5C.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
समस्या-निवारण और त्रुटि संदेश।
![ScrapingData_Troubleshooting_and_error_messages.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Troubleshooting_and_error_messages.original.jpg)
अगर आपको ERROR! संदेश मिलता है, तो यह सुनिश्चित करने के लिए जाँच करें कि उद्धरण दोहरे उद्धरण हैं, जैसा कि उदाहरण में दिखाया गया है।
अगर आपको VALUE! त्रुटि मिलती है, तो यह सुनिश्चित करने के लिए जाँच करें कि आपने सेल में अतिरिक्त कोष्ठक या उद्धरण चिह्न नहीं लगाए।
![ScrapingData_Troubleshooting_and_error_messages.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Troubleshooting_and_error_messages.original.jpg)
अपना डेटा प्रदर्शित करना।
![ScrapingData_Displaying_your_data_mcss7kz.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Displaying_your_data_mcss7kz.original.jpg)
जब आपका importHTML फ़ॉर्मूला सही हो जाए, तो enter दबाएँ और Google शीट्स को कुछ सेकंड दें। सभी पंक्तियों और कॉलम के साथ तालिका को लोड होना चाहिए।
ध्यान दें कि कुछ ऐसे तत्व हैं, जिन्हें हमें हटाने की ज़रूरत होगी, ताकि हम इस डेटा की कल्पना कर सकें। हम इसे अगले पाठ "Google शीट्स: डेटा की सफ़ाई” में सीखेंगे।
![ScrapingData_Displaying_your_data_mcss7kz.jpg](https://storage.googleapis.com/media-newsinitiative/images/ScrapingData_Displaying_your_data_mcss7kz.original.jpg)
बधाई!
![CleaningData_Overview_9zSutWO.jpg](https://storage.googleapis.com/media-newsinitiative/images/CleaningData_Overview_9zSutWO.original.jpg)
आपने "Google शीट्स: इंटरनेट से डेटा स्क्रैप करना" पूरा कर लिया है।
अपने डिजिटल पत्रकारिता कौशलों को बढ़ाना जारी रखने और Google समाचार पहल प्रमाणीकरण की दिशा में काम करने के लिए, हमारे प्रशिक्षण केंद्र की वेबसाइट पर जाएँ और अन्य पाठ लें:
अधिक डेटा पत्रकारिता पाठों के लिए, यहाँ जाएँ:
newsinitiative.withgoogle.com/training/course/data-journalism
![CleaningData_Overview_9zSutWO.jpg](https://storage.googleapis.com/media-newsinitiative/images/CleaningData_Overview_9zSutWO.original.jpg)
-
Pinpoint: A research tool for journalists
लेसनExplore and analyze thousands of documents with Google's research tool, Pinpoint. -
Access Google Finance data in Sheets
लेसनAccess Google Finance data in Google Sheets. Examine closing prices, percentage change or market movement over any timeframe. -
Looking ahead to ML-powered journalism
लेसनKey learnings and recommended resources to deepen your ML knowledge.