Google Sheets: pulizia dei dati
Preparazione dei dati per l’analisi e la visualizzazione.
Panoramica della lezione
Impara a pulire i dati per la preparazione alla visualizzazione.
Nella lezione precedente, Google Sheets: estrazione di dati da Internet, abbiamo imparato a importare una tabella dal web usando importHTML. In questa lezione impareremo a ripulire i dati in modo da prepararli per l’analisi e la visualizzazione.
- Rendere i dati modificabili.
- Modificare i dati.
- Modifica in batch con “Trova e sostituisci”.
Per altre lezioni sul giornalismo dei dati visita:
newsinitiative.withgoogle.com/training/course/data-journalism
Rendere i dati modificabili.
“Pulire i dati” significa renderli utilizzabili per il lavoro: garantire l’integrità della tabella, l’assenza di incoerenze e creare una struttura comprensibile per il computer. Ciò significa che rimuoveremo le righe duplicate, elimineremo i caratteri indesiderati e assicureremo che le colonne contengano un solo tipo di dati (per es. numeri o testo, ma non entrambi). Per prima cosa dobbiamo rende i dati modificabili.
Questa tabella mostra il risultato di importHTML. In questo modulo le eventuali modifiche dei dati sorgente (la pagina Wikipedia) saranno automaticamente riflesse qui e aggiornate almeno una volta all’ora. Tuttavia non possiamo modificare questi valori nelle celle per rimuovere i caratteri indesiderati. Useremo “Incolla speciale” in Google Sheets per creare una copia statica dei dati. Con questo otterremo la possibilità di aggiornare la tabella automaticamente la tabella mediante importHTML, ma saremo anche in grado di modificarlo.
Selezionare tutti i dati facendo clic con il tasto sinistro del mouse sul rettangolo in alto a sinistra nel foglio. Una volta evidenziato fare clic su Modifica > Copia. Selezionare Modifica > Incolla speciale > Incolla solo i valori. Adesso possiamo modificare la tabella.
Per facilitare la modifica congeleremo la riga con i nomi delle colonne. Posizionare il cursore del mouse sulla linea appena sopra la riga 1, sulla barra grigia. Si potrà vedere che il cursore si trasforma in un guanto. Trascinare la barra in fondo alla riga 1 e lasciarla lì. Adesso la riga superiore è congelata.
Modificare i dati.
importHTML importa tutti i caratteri della tabella di Wikipedia che sono utili per le persone ma non per i computer. Possiamo rimuoverli e rendere la nostra tabella più pulita!
Poiché non abbiamo bisogno della colonna F per questo esercizio, fare clic con il tasto destro del mouse sulla lettera F in cima alla colonna e selezionare Elimina.
È presente una lettera “F” vicino al numero 13 nella riga A14 e un “TS3” vicino al numero 4 nella cella B27. Rimuoveremo questi caratteri in modo che restino soltanto i numeri 13 e 4.
Rimuovere le lettere extra nelle celle B40 e B48 in modo che restino solo il 19 e l’8. Fare la stessa cosa nella D17 per rimuovere i caratteri “F8” presenti all’inizio.
Modifica in batch con “Trova e sostituisci”.
Adesso diamo un’occhiata alla colonna C. Rimuoviamo i caratteri iniziali e finali “*” in una sola volta, invece che riga per riga, usando la funzione Trova e sostituisci.
Selezionare la colonna C facendo clic con il tasto sinistro sulla lettera C in cima alla colonna. Selezionare Modifica > Trova e sostituisci.
Nella prima casella di testo digitare il simbolo dell’asterisco: * (è il carattere che vogliamo trovare nella colonna C). Lasciare vuota la casella Trova e sostituisci in modo che gli asterischi siano sostituiti da uno spazio vuoto, cioè siano eliminati.
Assicurarsi che l’opzione Cerca mostri Intervallo specifico e che tale intervallo rifletta la colonna appena selezionata. Lasciare le caselle di spunta deselezionate.
Selezionare Sostituisci tutto.Google Sheets visualizzerà il messaggio: Sostituite 100 occorrenze di * con (niente). Ciò significa che con pochi clic sono stati rimossi 100 caratteri in 50 righe!
Selezionare Finito. Ora la nostra tabella è pulita e pronta per il nostro lavoro. Nella lezione successiva produrremo visualizzazioni e otterremo degli spunti di notizia dai dati.
Congratulazioni!
Hai completato “Google Sheets: pulizia dei dati”.
Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.
Per altre lezioni sul giornalismo dei dati visita:
newsinitiative.withgoogle.com/training/course/data-journalism
-
-
Crea il tuo pubblico con News Consumer Insights
LezioneRicevi consigli basati sui dati per il tuo sito -
Aumenta le entrate pubblicitarie con Google Ad Manager
LezioneOttieni il massimo dalle entrate pubblicitarie