Vai ai contenuti principali
Vai alla dashboard
Non sai da dove iniziare? Rispondi a un breve quiz per ricevere consigli personalizzati.
Lezione 9 di 13
Google Sheets: estrazione di dati da Internet
Data Journalism
Public Data Explorer: Accedi a un mondo di dati.
Google Trends: comprensione dei dati.
Google Data GIF Maker
Google Sheets: visualizzazione dei dati
Global Forest Watch, una fonte di dati
Google Sheets: pulizia dei dati
Visualizzazione di dati: Tilegram avanzati.
Traiettoria
0% completato
5 minuti per completare

Google Sheets: estrazione di dati da Internet

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg

Crea i tuoi set di dati con Google Sheets.

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg

Impara a creare i tuoi set di dati con Google Sheets.

DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Su Internet è disponibile un’enorme quantità di dati utilizzabili per ricercare e visualizzare articoli. Il primo passo consiste nel trovare i dati e acquisirli in un formato utilizzabile.

  1. Creazione di un nuovo foglio di calcolo.
  2. Ricerca di dati affidabili.
  3. Importazione di dati in Google Sheets.
  4. Risoluzione dei problemi e messaggi d’errore. 
  5. Visualizzazione dei dati.

Per altre lezioni sul giornalismo dei dati visita:

https://newsinitiative.withgoogle.com/training/course/data-journalism


DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg

Creazione di un nuovo foglio di calcolo.

Starting a new spreadsheet.


Per prima cosa si deve creare un foglio di calcolo vuoto. Accedere a sheets.google.com. Fare clic sull’icona “+” in Crea un nuovo foglio di lavoro.


Fare clic sull’angolo superiore sinistro per rinominare il foglio di calcolo. Rinominiamolo “Film con incasso più elevato”.

Ricerca di dati affidabili.

Estraendo i dati da siti governativi, pubblicazioni scientifiche, Wikipedia, Google Public Data Explorer e altri siti ancora, è possibile reperire dati su pressoché qualsiasi argomento. In questa lezione faremo pratica con i dati relativi ai film.



Accedere a google.com e digitare ricerca film con maggiore incasso. Uno dei primi link dovrebbe essere una voce di Wikipedia con molte tabelle. Un elenco, denominato “i primi 50 film con i maggiori incassi di tutti i tempi” cita diversi riferimenti, perciò utilizzeremo questo. Verificare sempre di estrarre i dati da fonti affidabili. 


Per importare questa tabella in Google Sheets copiare l’indirizzo della pagina Wikipedia, evidenziando l’URL, facendo clic su di esso e selezionando Copia. 

Importazione di dati in Google Sheets.

Utilizzeremo “importHTML” per importare la tabella di Wikipedia nel nostro foglio di calcolo. Questa potente formula è integrata in Google Sheets per facilitare l’importazione di tabelle o elenchi da pagine web. Per ulteriori informazioni sul funzionamento di importHTML e vedere degli esempi, leggere le pagine della documentazione di Google Sheets.



Lo strumento importHTML richiede tre parametri per il funzionamento: 1) una URL;2) il tipo di dati che stiamo raccogliendo (tabella o elenco);3) il numero identificativo della tabella o dell’elenco nel codice HTML. In questo esempio la prima istanza di una tabella recherebbe il numero uno in quanto la tabella desiderata è la prima che compare nel codice HTML. Si può procedere per tentativi per trovare la posizione della tabella (1, 2, 3, ecc.) oppure fare clic sulla pagina web, selezionare Ispeziona > Trova per localizzare la tabella nel codice.


Accedere al foglio vuoto appena creato e aprire la cella A1. Digitare:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)


Occorre notare che l’URL e il tipo di elemento (la tabella, nel nostro caso) devono trovarsi tra virgolette (i parametri diventeranno verdi). L’ultimo parametro è un numero, non tra virgolette, e sarà di colore blu.

Risoluzione dei problemi e messaggi d’errore.

ScrapingData_Troubleshooting_and_error_messages.jpg

In caso di una messaggio ERRORE! verificare che le virgolette siano doppie, come illustrato nell’esempio. 


In caso di un errore VALORE! controllare che nella cella non siano presenti parentesi o virgolette extra.

ScrapingData_Troubleshooting_and_error_messages.jpg

Visualizzazione dei dati.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Non appena la formula ImportHTML sarà corretta premere Invio e dare un paio di secondi a Google Sheets. La tabella deve essere caricata con tutte le righe e le colonne formattate.  


Occorre notare che ci sono alcuni elementi che dobbiamo rimuovere per visualizzare questi dati. Apprendere come fare questo nella prossima lezione, “Google Sheets: pulizia dei dati”.

ScrapingData_Displaying_your_data_mcss7kz.jpg

Congratulazioni!

CleaningData_Overview_9zSutWO.jpg

Hai completato “Google Sheets: estrazione di dati da Internet”.


Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere per la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.

Per altre lezioni sul giornalismo dei dati visita:

newsinitiative.withgoogle.com/training/course/data-journalism


CleaningData_Overview_9zSutWO.jpg
Congratulazioni! Hai appena finito Google Sheets: estrazione di dati da Internet Sì, l'operazione è in corso
Consigliati per te
Come valuteresti questa lezione?
Il tuo feedback ci aiuterà a migliorare costantemente le nostre lezioni.
Vuoi uscire e perdere i progressi fatti?
Se esci da questa pagina perderai tutti i progressi fatti nella lezione attuale. Vuoi continuare e perdere i progressi?