Google Sheets: estrazione di dati da Internet
Crea i tuoi set di dati con Google Sheets.
Impara a creare i tuoi set di dati con Google Sheets.
Su Internet è disponibile un’enorme quantità di dati utilizzabili per ricercare e visualizzare articoli. Il primo passo consiste nel trovare i dati e acquisirli in un formato utilizzabile.
- Creazione di un nuovo foglio di calcolo.
- Ricerca di dati affidabili.
- Importazione di dati in Google Sheets.
- Risoluzione dei problemi e messaggi d’errore.
- Visualizzazione dei dati.
Per altre lezioni sul giornalismo dei dati visita:
https://newsinitiative.withgoogle.com/training/course/data-journalism
Creazione di un nuovo foglio di calcolo.
Starting a new spreadsheet.
Per prima cosa si deve creare un foglio di calcolo vuoto. Accedere a sheets.google.com. Fare clic sull’icona “+” in Crea un nuovo foglio di lavoro.
Fare clic sull’angolo superiore sinistro per rinominare il foglio di calcolo. Rinominiamolo “Film con incasso più elevato”.
Ricerca di dati affidabili.
Estraendo i dati da siti governativi, pubblicazioni scientifiche, Wikipedia, Google Public Data Explorer e altri siti ancora, è possibile reperire dati su pressoché qualsiasi argomento. In questa lezione faremo pratica con i dati relativi ai film.
Accedere a google.com e digitare ricerca film con maggiore incasso. Uno dei primi link dovrebbe essere una voce di Wikipedia con molte tabelle. Un elenco, denominato “i primi 50 film con i maggiori incassi di tutti i tempi” cita diversi riferimenti, perciò utilizzeremo questo. Verificare sempre di estrarre i dati da fonti affidabili.
Per importare questa tabella in Google Sheets copiare l’indirizzo della pagina Wikipedia, evidenziando l’URL, facendo clic su di esso e selezionando Copia.
Importazione di dati in Google Sheets.
Utilizzeremo “importHTML” per importare la tabella di Wikipedia nel nostro foglio di calcolo. Questa potente formula è integrata in Google Sheets per facilitare l’importazione di tabelle o elenchi da pagine web. Per ulteriori informazioni sul funzionamento di importHTML e vedere degli esempi, leggere le pagine della documentazione di Google Sheets.
Lo strumento importHTML richiede tre parametri per il funzionamento: 1) una URL;2) il tipo di dati che stiamo raccogliendo (tabella o elenco);3) il numero identificativo della tabella o dell’elenco nel codice HTML. In questo esempio la prima istanza di una tabella recherebbe il numero uno in quanto la tabella desiderata è la prima che compare nel codice HTML. Si può procedere per tentativi per trovare la posizione della tabella (1, 2, 3, ecc.) oppure fare clic sulla pagina web, selezionare Ispeziona > Trova per localizzare la tabella nel codice.
Accedere al foglio vuoto appena creato e aprire la cella A1. Digitare:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)
Occorre notare che l’URL e il tipo di elemento (la tabella, nel nostro caso) devono trovarsi tra virgolette (i parametri diventeranno verdi). L’ultimo parametro è un numero, non tra virgolette, e sarà di colore blu.
Risoluzione dei problemi e messaggi d’errore.
In caso di una messaggio ERRORE! verificare che le virgolette siano doppie, come illustrato nell’esempio.
In caso di un errore VALORE! controllare che nella cella non siano presenti parentesi o virgolette extra.
Visualizzazione dei dati.
Non appena la formula ImportHTML sarà corretta premere Invio e dare un paio di secondi a Google Sheets. La tabella deve essere caricata con tutte le righe e le colonne formattate.
Occorre notare che ci sono alcuni elementi che dobbiamo rimuovere per visualizzare questi dati. Apprendere come fare questo nella prossima lezione, “Google Sheets: pulizia dei dati”.
Congratulazioni!
Hai completato “Google Sheets: estrazione di dati da Internet”.
Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere per la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.
Per altre lezioni sul giornalismo dei dati visita:
newsinitiative.withgoogle.com/training/course/data-journalism
-
Google Translate: tradurre all'impronta.
LezioneParla la lingua di praticamente tutti i paesi del mondo. -
Storytelling con Google Trends
LezioneApprendi come contestualizzare i dati di Google Trends e integrarli nel tuo articolo. -
Indagare con il Machine Learning
LezioneCome utilizzare il Machine Learning per realizzare inchieste