Aula 6 de 7

Avaliação e teste

5 minutos para concluir

Avaliação e teste

Como interpretar o resultado do seu modelo e avaliar seu desempenho

Precisão e recall

Quando o modelo estiver treinado, vocês visualizarão um resumo de seu desempenho com pontuações para “Precisão” e “Recall”.

A precisão nos informa qual proporção das imagens identificadas como positivas pelo modelo deveria efetivamente ter sido categorizada como tal. O recall, por sua vez, informa qual proporção de imagens positivas foi identificada corretamente.

Nosso modelo obteve bom desempenho em ambas as categorias, com pontuações acima de 97%. Vamos ver o que isso significa com mais detalhes.

Avalie o desempenho do modelo

Cliquem em “Avaliar”, no topo do menu, para explorarmos a interface. Primeiro, ela nos mostra novamente as pontuações de precisão e recall. Em nosso caso, a pontuação de precisão nos informa que 97% das imagens do teste que o modelo identificou como exemplos de mineração de âmbar efetivamente mostravam indícios dessa atividade.

Etapa 1
A pontuação de recall, por sua vez, informa que 97% das imagens do teste que mostravam exemplos de mineração de âmbar foram corretamente rotuladas como tal pelo modelo.

Etapa 2
O limite de confiança representa o nível de confiança que o modelo deve possuir para atribuir um rótulo. Quanto menor ele for, mais imagens serão classificadas pelo modelo, mas maior será o risco de classificar algumas imagens incorretamente.

Etapa 3
Se vocês quiserem se aprofundar no assunto e explorar as curvas de precisão-recall, cliquem no link da interface para saber mais.

Falsos positivos e falsos negativos

Em seguir, vamos conferir a Matriz de Confusão. Quanto maiores forem as pontuações no fundo azul, melhor terá sido o desempenho do modelo. Neste exemplo, as pontuações são ótimas.

Etapa 1
Todas as imagens que deveriam ter sido rotuladas como negativas (sem mineração de âmbar) foram reconhecidas pelo modelo, e 82% das imagens que incluíam indícios de mineração de âmbar foram corretamente rotuladas como tal.

Etapa 2
Não temos falsos positivos – nenhuma imagem foi incorretamente rotulada como exemplo de mineração de âmbar. E apenas 12% de falsos negativos: imagens demonstrando indícios de mineração de âmbar que o modelo não foi capaz de reconhecer.

Etapa 3
Isso é positivo para os fins da nossa investigação sobre mineração ilegal de âmbar: é melhor perder alguns exemplos positivos que apresentar como provas imagens de mineração de âmbar que não mostram isso na prática.

Etapa 4
Cliquem nos filtros à esquerda para conferir quais imagens do teste foram correta ou incorretamente classificadas pelo modelo.

Etapa 5
Ainda não estão certos de que podem confiar no modelo? Clicando em “Testar e usar”, vocês podem carregar novas imagens de satélite – com ou sem indícios de mineração de âmbar – para ver se o modelo as rotula corretamente.

Teste e treine novamente

Algumas considerações finais antes de concluirmos:

Vocês podem estar se perguntando como o modelo está fornecendo algumas respostas erradas quando lhe informamos todas as respostas certas inicialmente. Nesse caso, revisem a divisão entre os conjuntos treinamento, validação e teste, descrita na aula anterior.

Para este exemplo, quase todas as imagens foram classificadas corretamente. Mas esse nem sempre será o caso. Se não estiverem satisfeitos com o desempenho de seus modelos, vocês sempre podem atualizar e aprimorar seus conjuntos de dados e treinar os modelos novamente. Vocês podem analisar cuidadosamente o que houve de errado na primeira iteração – e, por exemplo, adicionar aos seus conjuntos de treinamento mais imagens similares àquelas que foram classificadas incorretamente pelo modelo.

Quanto às pessoas, a aprendizagem é um processo iterativo.

Parabéns! Você terminou Avaliação e teste Sim, está em andamento

Recomendado para você

open_in_new

Google Translate: Traduções em movimento.

Aula

Fale o idioma de qualquer lugar do mundo.

Iniciar

Remover da sua conta

Salvar na sua conta

None
open_in_new

Comece a usar o Google Notícias com a Central do Editor

Aula

Envie, gerencie e gere receita com suas notícias no Google.

Iniciar

Remover da sua conta

Salvar na sua conta

None
open_in_new

Como usar as principais métricas da Web para manter o engajamento dos visitantes

Aula

Crie uma ótima experiência do usuário no seu site de notícias

Iniciar

Remover da sua conta

Salvar na sua conta

None

Como você classifica esta aula?

Seu feedback nos ajuda a continuar melhorando as aulas.

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

TITLE

Avaliação e teste

Precisão e recall

Avalie o desempenho do modelo

Falsos positivos e falsos negativos

Teste e treine novamente

Google Translate: Traduções em movimento.

Comece a usar o Google Notícias com a Central do Editor

Como usar as principais métricas da Web para manter o engajamento dos visitantes

Estou procurando recursos em

No Results Found

We couldn't find what you are looking for

Avaliação e teste

Precisão e recall

Avalie o desempenho do modelo

Falsos positivos e falsos negativos

Teste e treine novamente

Google Translate: Traduções em movimento.

Comece a usar o Google Notícias com a Central do Editor

Como usar as principais métricas da Web para manter o engajamento dos visitantes