Google Sheets: Limpeza de dados
Prepare seus dados para análise e visualização.
Visão global da aula
Aprenda a limpar os dados na preparação para visualização.
Na aula anterior, Google Sheets: Extração de dados da internet, aprendemos como importar uma tabela da internet usando o importHTML. Nesta aula, vamos aprender como limpar os dados para prepará-los para análise e visualização.
- Tornar os dados editáveis.
- Editar os dados.
- Editar em lote com Encontrar e substituir.
Para mais aulas sobre Jornalismo de Dados, visite:
newsinitiative.withgoogle.com/training/course/data-journalism
Tornar os dados editáveis.
“Limpar os dados” significa torná-los utilizáveis para trabalho assegurando-se que a tabela possui integridade, está livre de inconsistências e está estruturada de uma forma que os computadores possam entender. Isto quer dizer que vamos remover linhas duplicadas, deletar caracteres indesejáveis e assegurar que as colunas possuam somente um tipo de dados, por exemplo, números ou texto, mas não ambos. Primeiro, precisamos tornar os dados editáveis.
Esta tabela mostra o resultado de importHTML. Neste formato, qualquer mudança na fonte dos dados (a página da Wikipedia) será automaticamente refletida aqui, sendo atualizada pelo menos uma vez por hora. No entanto, não podemos editar os valores nas células para remover caracteres indesejados. Nós usaremos colar especial no Google Sheets para criar um instantâneo estático dos dados. Assim, perderemos a habilidade de atualizar automaticamente a tabela através do importHTML. mas conseguiremos editá-la.
Selecione todos os dados clicando com o lado esquerdo do mouse no retângulo superior esquerdo na sua planilha. Quando todas as células estiverem selecionadas, clique em Editar > Copiar. Selecione Editar > Copiar especial > Copiar somente valores. Agora podemos editar a tabela.
Para tornar a edição mais fácil, vamos congelar a linha com o nome das colunas. Posicione o cursor do mouse na linha acima da linha 1, sobre a barra cinza. Você notará que o cursor se transformará em uma luva. Arraste a barra para o final da linha 1 e deixe-a aí. Agora a linha está congelada.
Editar os dados.
importHTML importará caracteres sobressalentes da tabela da Wikipedia que são úteis para as pessoas, mas não para os computadores. Vamos removê-los e deixar a nossa tabela mais limpa!
Como não precisamos da coluna F para este exercício, clique como o lado direito do mouse sobre a letra F no topo da coluna e selecione Deletar.
Há uma letra “F” ao lado do número 13 na linha A14, e um “TS3” ao lado do número 4 na célula B27. Vamos remover estes caracteres de forma que permaneçam somente os números 13 e 4.
Remova as letras extras nas células B40 e B48, permanecendo somente os números 19 e 8. Faça o mesmo na célula D17 para remover o “F8” inicial.
Editar em lote com Encontrar e substituir.
Agora, dê uma olhada na coluna C. Vamos remover o caractere * inicial e final em lote, em vez de linha por linha, usando a funcionalidade Encontrar e substituir.
Selecione a coluna C clicando com o lado esquerdo do mouse sobre a letra C no topo da coluna. Selecione Editar > Encontrar e substituir.
Digite o símbolo * na primeira caixa de texto (este é o caractere que queremos encontrar na coluna C). Deixe a caixa de texto Substituir por vazia para que os asteriscos sejam substituídos por nada, o que quer dizer que serão deletados.
Assegure-se que a opção Buscar mostra Intervalo específico e que o intervalo reflete a coluna que você acabou de selecionar. Deixe as caixas de seleção em branco.
Selecione Substituir todos.Note que o Google Sheets informará que 100 ocorrências de * foram substituídas por (nada). Isto quer dizer que você removeu com sucesso 100 caracteres em 50 linhas com apenas uns poucos cliques!
Selecione Concluído. Agora, nossa tabela está limpa e pronta para ser usada. Na próxima aula, desenvolveremos visualizações e tiraremos conclusões sobre os dados.
Parabéns!
Você completou “Google Sheets: Limpeza de dados.”
Para continuar desenvolvendo suas habilidades de jornalismo digital e para trabalhar para conseguir a certificação da Google News Initiative, acesse o nosso site do Centro de Treinamento e faça outra aula:
Para mais aulas sobre Jornalismo de Dados, visite:
newsinitiative.withgoogle.com/training/course/data-journalism
-
Google Fact Check Tools
AulaThese tools allow you to search for stories and images that have already been debunked and lets you add ClaimReview markup to your own fact checks. -
What are Web Stories?
AulaHow the easy-to-use vertical video format is changing the face of digital storytelling and driving the connection between content makers and their fans. -
How to make a good Web Story
AulaCreating a strong, compelling Web Story is as easy as creating an article or a video, and the interactive nature of Web Stories plays to the rapidly shifting desires and demands of online audiences.