Przejdź do głównej treści
Otwórz panel
Nie wiesz, od czego zacząć? Rozwiąż krótki quiz, aby otrzymać spersonalizowane rekomendacje.
Welcome to the Google News Initiative
The Google News Initiative works with publishers and journalists to fight misinformation, share resources, and build a diverse and innovative news ecosystem.
Lekcja 11 z 18
Arkusze Google: Pobieranie danych z internetu
Data Journalism
Public Data Explorer: Klucz do świata danych.
Google Surveys: Zdobądź rzeczywiste dane.
Google Trends: Odczytywanie danych.
Google Data GIF Maker
Arkusze Google: Wizualizacja danych
Wizualizacja danych: Szablony Flourish.
Źródło danych: Global Forest Watch.
Arkusze Google: Czyszczenie danych
Google Trends: Popraw swoje wyniki wyszukiwania.
Źródło danych: Election Databot.
check_box_outline_blank Data Journalism: Take the Quiz
Kurs
0% ukończono
5 minut aby zakończyć

Arkusze Google: Pobieranie danych z internetu

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg
Stwórz własne zestawy danych przy użyciu Arkuszy Google.
DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg

Przegląd lekcji

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Naucz się tworzyć własne zestawy danych przy użyciu Arkuszy Google.


Istnieje ogromna ilość danych dostępnych w Internecie, które można wykorzystać do analiz danych i wizualizacji historii. Pierwszym krokiem jest znalezienie danych i uzyskanie ich w formacie, z którym można pracować.



  1. Tworzenie nowego arkusza kalkulacyjnego.
  2. Znajdowanie wiarygodnych danych.
  3. Importowanie danych do Arkuszy Google.
  4. Rozwiązywanie problemów i komunikaty o błędach. 
  5. Wyświetlanie danych.



Więcej lekcji z zakresu dziennikarstwa opartego na danych można znaleźć na stronie:

https://newsinitiative.withgoogle.com/training/course/data-journalism

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Tworzenie nowego arkusza kalkulacyjnego.




Najpierw musisz utworzyć nowy arkusz kalkulacyjny. Przejdź do sheets.google.com. W sekcji Tworzenie nowego arkusza kalkulacyjnego kliknij ikonę +.


Kliknij tekst w lewym górnym rogu, aby nazwać swój arkusz. Ten nazwijmy „Najbardziej dochodowe filmy”.

Znajdowanie wiarygodnych danych.

Pozyskując dane ze stron rządowych, publikacji naukowych, Wikipedii, Google Public Data Explorer i innych źródeł, możesz opowiadać historie oparte na danych na niemal każdy temat. W tej lekcji będziemy ćwiczyć z danymi dotyczącymi filmów.



Wejdź na stronę google.com i wyszukaj najbardziej dochodowe filmy. Jako jeden z pierwszych linków powinna wyświetlić się strona Wikipedii z wieloma tabelami. Użyjemy listy 50 najbardziej dochodowych filmów wszech czasów, gdyż zawiera wiele odniesień. Upewnij się zawsze, że dane, które pozyskujesz, pochodzą z wiarygodnych źródeł. 


Aby importować tę tabelę do Arkusza Google, skopiuj adres strony Wikipedii – zaznacz adres URL, klikając na niego prawym przyciskiem i wybierz kopiuj. 

Importowanie danych do Arkuszy Google.

Aby importować tabelę z Wikipedii do naszego arkusza, użyjemy formuły importHTML. Ta pomocna formuła jest wbudowana w Arkusze Google, aby ułatwić importowanie tabel lub list ze stron internetowych. Przeczytaj dokumentację Arkuszy Google, aby dowiedzieć się więcej o tym, jak działa funkcja importHTML i zobaczyć przykłady jej wykorzystania.



Żeby funkcja importHTML działała właściwie, należy podać trzy parametry: 1) adres URL2) rodzaj  pobieranych danych, tabela lub lista3) numer określający pozycję tabeli lub listy w kodzie HTML. W tym przykładzie nasza tabela otrzymuje indeks jeden, ponieważ pojawia się w HTML jako pierwsza. Możesz użyć metody prób i błędów, aby znaleźć pozycję tabeli (1, 2, 3 itd.) lub kliknąć prawym przyciskiem myszy na stronie internetowej, wybrać Zbadaj > Znajdź, aby zlokalizować tabelę w kodzie.


Przejdź do pustego arkusza i najedź na komórkę A1. Wpisz:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)


Zauważ, że adres URL i rodzaj elementu (w naszym przypadku tabela) znajdują się pomiędzy cudzysłowami — w ten sposób parametry staną się zielone. Ostatnim parametrem jest liczba nie umieszczona w cudzysłowiu i będzie ona oznaczona kolorem niebieskim.

Rozwiązywanie problemów i komunikaty o błędach.

ScrapingData_Troubleshooting_and_error_messages.jpg

W przypadku komunikatu o BŁĘDZIE! sprawdź, czy użyty cudzysłów jest cudzysłowem podwójnym, jak pokazano w przykładzie. 



Jeśli wystąpił błąd WARTOŚĆ!, sprawdź, czy w komórce nie ma dodatkowych nawiasów lub cudzysłowów.

ScrapingData_Troubleshooting_and_error_messages.jpg

Wyświetlanie danych.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Gdy Twoja funkcja importHTML jest poprawna, naciśnij enter i poczekaj kilka sekund. Tabela powinna się załadować ze wszystkimi sformatowanymi wierszami i kolumnami. 



Jest kilka elementów, które trzeba usunąć, aby zwizualizować dane. Dowiesz się, jak to zrobić w następnej lekcji — „Arkusze Google: Czyszczenie danych.”

ScrapingData_Displaying_your_data_mcss7kz.jpg

Gratulacje!

CleaningData_Overview_9zSutWO.jpg

Ukończyłeś(-aś) lekcję „Arkusze Google: Pobieranie danych z internetu”.



Aby dalej rozwijać swoje umiejętności dziennikarskie i pracować nad certyfikacją Google News Initiative, przejdź na stronę internetową naszego Centrum Szkoleniowego i zacznij kolejną lekcję.



Więcej lekcji z zakresu Dziennikarstwa opartego na danych można znaleźć na stronie:

newsinitiative.withgoogle.com/training/course/data-journalism

CleaningData_Overview_9zSutWO.jpg
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?