Vai ai contenuti principali
Vai alla dashboard
Non sai da dove iniziare? Rispondi a un breve quiz per ricevere consigli personalizzati.
Welcome to the Google News Initiative
The Google News Initiative works with publishers and journalists to fight misinformation, share resources, and build a diverse and innovative news ecosystem.
Lezione 12 di 18
Google Sheets: pulizia dei dati
Data Journalism
Public Data Explorer: Accedi a un mondo di dati.
Google Consumer Surveys: ottieni analisi reali.
Google Trends: comprensione dei dati.
Google Data GIF Maker
Google Sheets: visualizzazione dei dati
Visualizzazione dei dati: i modelli di Flourish
Global Forest Watch, una fonte di dati
Google Sheets: estrazione di dati da Internet
Visualizzazione di dati: Tilegram avanzati.
Data Source: Election Databot.
check_box_outline_blank Data Journalism: Take the Quiz
Corso
0% completata
5 minuti per completare

Google Sheets: pulizia dei dati

CleaningData_Overview_1pa7Mmc.jpg
Preparazione dei dati per l’analisi e la visualizzazione.
CleaningData_Overview_1pa7Mmc.jpg

Panoramica della lezione

CleaningData_Overview.jpg

Impara a pulire i dati per la preparazione alla visualizzazione.


Nella lezione precedente, Google Sheets: estrazione di dati da Internet, abbiamo imparato a importare una tabella dal web usando importHTML. In questa lezione impareremo a ripulire i dati in modo da prepararli per l’analisi e la visualizzazione.

  1. Rendere i dati modificabili.
  2. Modificare i dati. 
  3. Modifica in batch con “Trova e sostituisci”.



Per altre lezioni sul giornalismo dei dati visita:

newsinitiative.withgoogle.com/training/course/data-journalism

CleaningData_Overview.jpg

Rendere i dati modificabili.

“Pulire i dati” significa renderli utilizzabili per il lavoro: garantire l’integrità della tabella, l’assenza di incoerenze e creare una struttura comprensibile per il computer. Ciò significa che rimuoveremo le righe duplicate, elimineremo i caratteri indesiderati e assicureremo che le colonne contengano un solo tipo di dati (per es. numeri o testo, ma non entrambi). Per prima cosa dobbiamo rende i dati modificabili.



Questa tabella mostra il risultato di importHTML. In questo modulo le eventuali modifiche dei dati sorgente (la pagina Wikipedia) saranno automaticamente riflesse qui e aggiornate almeno una volta all’ora. Tuttavia non possiamo modificare questi valori nelle celle per rimuovere i caratteri indesiderati. Useremo “Incolla speciale” in Google Sheets per creare una copia statica dei dati. Con questo otterremo la possibilità di aggiornare la tabella automaticamente la tabella mediante importHTML, ma saremo anche in grado di modificarlo. 


Selezionare tutti i dati facendo clic con il tasto sinistro del mouse sul rettangolo in alto a sinistra nel foglio. Una volta evidenziato fare clic su Modifica > Copia. Selezionare Modifica > Incolla speciale > Incolla solo i valori.  Adesso possiamo modificare la tabella. 


Per facilitare la modifica congeleremo la riga con i nomi delle colonne. Posizionare il cursore del mouse sulla linea appena sopra la riga 1, sulla barra grigia. Si potrà vedere che il cursore si trasforma in un guanto. Trascinare la barra in fondo alla riga 1 e lasciarla lì. Adesso la riga superiore è congelata.

Modificare i dati.

importHTML importa tutti i caratteri della tabella di Wikipedia che sono utili per le persone ma non per i computer. Possiamo rimuoverli e rendere la nostra tabella più pulita!



Poiché non abbiamo bisogno della colonna F per questo esercizio, fare clic con il tasto destro del mouse sulla lettera F in cima alla colonna e selezionare Elimina.


È presente una lettera “F” vicino al numero 13 nella riga A14 e un “TS3” vicino al numero 4 nella cella B27. Rimuoveremo questi caratteri in modo che restino soltanto i numeri 13 e 4.


Rimuovere le lettere extra nelle celle B40 e B48 in modo che restino solo il 19 e l’8. Fare la stessa cosa nella D17 per rimuovere i caratteri “F8” presenti all’inizio.

Modifica in batch con “Trova e sostituisci”.

Adesso diamo un’occhiata alla colonna C. Rimuoviamo i caratteri iniziali e finali “*” in una sola volta, invece che riga per riga, usando la funzione Trova e sostituisci.



Selezionare la colonna C facendo clic con il tasto sinistro sulla lettera C in cima alla colonna. Selezionare Modifica > Trova e sostituisci.


Nella prima casella di testo digitare il simbolo dell’asterisco: * (è il carattere che vogliamo trovare nella colonna C). Lasciare vuota la casella Trova e sostituisci in modo che gli asterischi siano sostituiti da uno spazio vuoto, cioè siano eliminati. 


Assicurarsi che l’opzione Cerca mostri Intervallo specifico e che tale intervallo rifletta la colonna appena selezionata. Lasciare le caselle di spunta deselezionate. 


Selezionare Sostituisci tutto.Google Sheets visualizzerà il messaggio: Sostituite 100 occorrenze di * con (niente). Ciò significa che con pochi clic sono stati rimossi 100 caratteri in 50 righe! 


Selezionare Finito. Ora la nostra tabella è pulita e pronta per il nostro lavoro. Nella lezione successiva produrremo visualizzazioni e otterremo degli spunti di notizia dai dati. 

Congratulazioni!

VisualizingData_overview.jpg

Hai completato “Google Sheets: pulizia dei dati”.



Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.



Per altre lezioni sul giornalismo dei dati visita:

newsinitiative.withgoogle.com/training/course/data-journalism

VisualizingData_overview.jpg
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?