Vai ai contenuti principali
Vai alla dashboard
Non sai da dove iniziare? Rispondi a un breve quiz per ricevere consigli personalizzati.
Lezione 11 di 18
Google Sheets: estrazione di dati da Internet
Data Journalism
Public Data Explorer: Accedi a un mondo di dati.
Google Consumer Surveys: ottieni analisi reali.
Google Trends: comprensione dei dati.
Google Data GIF Maker
Google Sheets: visualizzazione dei dati
Visualizzazione dei dati: i modelli di Flourish
Global Forest Watch, una fonte di dati
Google Sheets: pulizia dei dati
Visualizzazione di dati: Tilegram avanzati.
Data Source: Election Databot.
check_box_outline_blank Data Journalism: Take the Quiz
Corso
0% completata
5 minuti per completare

Google Sheets: estrazione di dati da Internet

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg
Crea i tuoi set di dati con Google Sheets.
DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg

Panoramica della lezione

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Impara a creare i tuoi set di dati con Google Sheets.


Su Internet è disponibile un’enorme quantità di dati utilizzabili per ricercare e visualizzare articoli. Il primo passo consiste nel trovare i dati e acquisirli in un formato utilizzabile.



  1. Creazione di un nuovo foglio di calcolo.
  2. Ricerca di dati affidabili.
  3. Importazione di dati in Google Sheets.
  4. Risoluzione dei problemi e messaggi d’errore. 
  5. Visualizzazione dei dati.



Per altre lezioni sul giornalismo dei dati visita:

https://newsinitiative.withgoogle.com/training/course/data-journalism

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Creazione di un nuovo foglio di calcolo.




Per prima cosa si deve creare un foglio di calcolo vuoto. Accedere a sheets.google.com. Fare clic sull’icona “+” in Crea un nuovo foglio di lavoro.


Fare clic sull’angolo superiore sinistro per rinominare il foglio di calcolo. Rinominiamolo “Film con incasso più elevato”.

Ricerca di dati affidabili.

Estraendo i dati da siti governativi, pubblicazioni scientifiche, Wikipedia, Google Public Data Explorer e altri siti ancora, è possibile reperire dati su pressoché qualsiasi argomento. In questa lezione faremo pratica con i dati relativi ai film.



Accedere a google.com e digitare ricerca film con maggiore incasso. Uno dei primi link dovrebbe essere una voce di Wikipedia con molte tabelle. Un elenco, denominato “i primi 50 film con i maggiori incassi di tutti i tempi” cita diversi riferimenti, perciò utilizzeremo questo. Verificare sempre di estrarre i dati da fonti affidabili. 


Per importare questa tabella in Google Sheets copiare l’indirizzo della pagina Wikipedia, evidenziando l’URL, facendo clic su di esso e selezionando Copia. 

Importazione di dati in Google Sheets.

Utilizzeremo “importHTML” per importare la tabella di Wikipedia nel nostro foglio di calcolo. Questa potente formula è integrata in Google Sheets per facilitare l’importazione di tabelle o elenchi da pagine web. Per ulteriori informazioni sul funzionamento di importHTML e vedere degli esempi, leggere le pagine della documentazione di Google Sheets.



Lo strumento importHTML richiede tre parametri per il funzionamento: 1) una URL;2) il tipo di dati che stiamo raccogliendo (tabella o elenco);3) il numero identificativo della tabella o dell’elenco nel codice HTML. In questo esempio la prima istanza di una tabella recherebbe il numero uno in quanto la tabella desiderata è la prima che compare nel codice HTML. Si può procedere per tentativi per trovare la posizione della tabella (1, 2, 3, ecc.) oppure fare clic sulla pagina web, selezionare Ispeziona > Trova per localizzare la tabella nel codice.


Accedere al foglio vuoto appena creato e aprire la cella A1. Digitare:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)


Occorre notare che l’URL e il tipo di elemento (la tabella, nel nostro caso) devono trovarsi tra virgolette (i parametri diventeranno verdi). L’ultimo parametro è un numero, non tra virgolette, e sarà di colore blu.

Risoluzione dei problemi e messaggi d’errore.

ScrapingData_Troubleshooting_and_error_messages.jpg

In caso di una messaggio ERRORE! verificare che le virgolette siano doppie, come illustrato nell’esempio. 



In caso di un errore VALORE! controllare che nella cella non siano presenti parentesi o virgolette extra.

ScrapingData_Troubleshooting_and_error_messages.jpg

Visualizzazione dei dati.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Non appena la formula ImportHTML sarà corretta premere Invio e dare un paio di secondi a Google Sheets. La tabella deve essere caricata con tutte le righe e le colonne formattate. 



Occorre notare che ci sono alcuni elementi che dobbiamo rimuovere per visualizzare questi dati. Apprendere come fare questo nella prossima lezione, “Google Sheets: pulizia dei dati”.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Congratulazioni!

CleaningData_Overview_9zSutWO.jpg

Hai completato “Google Sheets: estrazione di dati da Internet”.



Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere per la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.



Per altre lezioni sul giornalismo dei dati visita:

newsinitiative.withgoogle.com/training/course/data-journalism


CleaningData_Overview_9zSutWO.jpg
Congratulazioni! Hai appena finito Google Sheets: estrazione di dati da Internet in progress
Recommended for you
Come valuteresti questa lezione?
Il tuo feedback ci aiuterà a migliorare costantemente le nostre lezioni.
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?