Investigando histórias com o machine learning
Como você pode usar o machine learning em suas reportagens
Machine learning para investigações: estudo de caso
Em 2010, o preço do âmbar no mercado global começou a subir. Devido à alta demanda, nos anos seguintes, partes da região noroeste da Ucrânia, rica em âmbar, atraíram interesse estrangeiro e local, e se tornaram o cenário de uma ilegal “corrida do âmbar”, um novo “velho oeste”.
Centenas de hectares de florestas e terras agrícolas se transformaram em um cenário sem vida, sendo que a atividade mais intensa de mineração ocorreu entre 2014 e 2016 – mas prosseguiu durante os anos seguintes.
Leprosy of the Land, uma investigação da Texty
Em 2018, a agência ucraniana de jornalismo de dados Texty publicou Leprosy of the Land, uma investigação na qual usou técnicas de machine learning para detectar casos de mineração ilegal de âmbar em toda a Ucrânia.
Primeiramente, um algoritmo dividiu seções de imagens de satélite em subseções visualmente uniformes. Dessa forma, se uma imagem era metade composta por florestas verdes e metade por campos de terra, ele a dividia em duas subseções.
Outro algoritmo descobria quais subseções mais se assemelhavam aos exemplos existentes de mineração de âmbar, os quais apresentam um padrão distinto com buracos no solo.
Por fim, os jornalistas examinavam os exemplos encontrados pelo algoritmo, para garantir que aquilo que se assemelhava à mineração de âmbar não fosse outra coisa, como desmatamento.
Encontrando exemplos de mineração ilegal de âmbar
Neste curso, vamos nos concentrar nos métodos usados pela Texty para treinar um algoritmo para reconhecer exemplos visuais de mineração ilegal de âmbar em uma enorme quantidade de imagens de satélite – previamente divididas em subseções por outro algoritmo.
Conforme mencionamos na primeira aula, isso significa que vamos fazer experimentos com o aprendizado supervisionado. Você saberá como o algoritmo pode aprender a partir de exemplos rotulados para reconhecer o mesmo padrão em imagens que ele nunca visualizou antes.
Além disso, você aprenderá a replicar o processo para suas próprias histórias: desde encontrar os exemplos de que precisa e treinar um modelo de machine learning para reconhecer o que você procura até testar e avaliar o modelo para garantir que ele forneça resultados confiáveis.
O machine learning é a ferramenta certa para este problema?
Porém, por que o machine learning foi a ferramenta certa para encontrar as informações que a Texty procurava?
A programação clássica exige que você especifique instruções passo a passo para o computador seguir. Embora essa abordagem funcione para resolver uma ampla variedade de problemas, ela não serve à tarefa de reconhecer exemplos de mineração ilegal de âmbar em uma enorme quantidade de imagens de satélite. Simplesmente há tantos elementos visuais que o computador precisaria considerar que é impossível criar um conjunto passo a passo de regras capaz de ensinar o software a distinguir entre exemplos reais de mineração ilegal de âmbar e coisas que podem apenas parecer similares.
Felizmente, os sistemas de machine learning estão bem posicionados para resolver esse problema.
Foco no processo
Lembre-se de que aquilo que você aprenderá neste curso – como identificar a mineração ilegal de âmbar – é apenas um exemplo. Seguindo o mesmo processo, o machine learning pode ser usado para realizar muitas tarefas jornalísticas diferentes, e até mesmo ser aplicado para analisar diferentes tipos de conteúdo – não apenas imagens. Vamos analisar alguns outros casos de uso ao final do curso. Conforme percorremos o exercício, lembre-se de se concentrar no processo, e não no estudo de caso específico.
Agora, antes de começarmos o exercício de fato, precisamos dedicar alguns minutos para conhecer e configurar a ferramenta que aprenderemos a usar nas próximas aulas: Google Cloud AutoML Vision.
-
Use notificações da Web para aumentar seu tráfego
AulaEnvie alertas de notícias para avisar seu público -
-
Imagens Históricas do Google: Google Earth Pro, Maps e Timelapse
AulaDescubra onde uma foto foi tirada e quando foi publicada.