Investigar historias con aprendizaje automático
Cómo puede utilizar el aprendizaje automático en su trabajo periodístico
Aprendizaje automático para investigaciones: estudio de caso
En 2010, el precio del ámbar en el mercado mundial comenzó a subir. Debido a la gran demanda, en los años siguientes partes del noroeste de Ucrania, ricas en ámbar, atrajeron el interés local y extranjero y se convirtieron en el escenario de una "fiebre del ámbar" ilegal, un nuevo "salvaje oeste".
Cientos de hectáreas de bosques y tierras agrícolas se convirtieron en un paisaje lunar sin vida, y la actividad minera más intensa tuvo lugar entre 2014 y 2016, pero continuó durante los años siguientes.
"Lepra de la Tierra", una investigación de Texty
En 2018, la agencia de periodismo de datos de Ucrania Texty publicó Leprosy of the Landuna, una investigación en la que utilizaron técnicas de aprendizaje automático para detectar casos de extracción ilegal de ámbar en Ucrania.
Primero, un algoritmo dividió secciones de imágenes de satélite en subsecciones visualmente uniformes. Entonces, si una imagen fuera mitad bosque verde y mitad campo de tierra, dividiría la imagen en esas dos subsecciones.
Otro algoritmo encontró qué subsecciones se parecían más a los ejemplos existentes de extracción de ámbar, que tienen un patrón distintivo de agujeros en el suelo similar a una marca de viruela.
Finalmente, los periodistas examinaron los ejemplos que encontró el algoritmo, para asegurarse de que lo que pensaba que parecía una extracción de ámbar no era en realidad otra cosa, como la deforestación.
Encontrar ejemplos de minería ilegal de ámbar
En este curso, nos centraremos en los métodos utilizados por Texty para entrenar un algoritmo que reconozca ejemplos visuales de minería ilegal de ámbar en una gran cantidad de imágenes de satélite, previamente divididas en subsecciones por otro algoritmo.
Como se mencionó en la primera lección, esto significa que experimentaremos con el aprendizaje supervisado. Ahora descubrirá cómo el algoritmo puede aprender de ejemplos etiquetados para reconocer el mismo patrón en imágenes que nunca antes había visto.
También aprenderá cómo puede replicar el proceso para sus propias investigaciones: desde encontrar los ejemplos que necesita, hasta entrenar un modelo de aprendizaje automático para reconocer lo que está buscando, y luego a probar y evaluar el modelo para asegurarse de que proporcione resultados fiables.
¿Es ML la herramienta adecuada para este problema?
Pero, ¿por qué el aprendizaje automático (ML, por sus siglas en inglés) era la herramienta adecuada para encontrar la información que buscaba Texty?
La programación clásica requiere que especifique instrucciones paso a paso para que las siga la computadora. Si bien este enfoque funciona para resolver una amplia variedad de problemas, no está a la altura de la tarea de reconocer ejemplos de extracción ilegal de ámbar en una gran cantidad de imágenes de satélite. Hay tantos elementos visuales que la computadora necesitaría analizar, que es imposible llegar a un conjunto de reglas paso a paso que puedan enseñar al software a distinguir entre ejemplos reales de extracción ilegal de ámbar y cosas que podrían parecer similar a él.
Afortunadamente, los sistemas de aprendizaje automático están resultan de mucha utilidad para resolver este problema.
La importancia del proceso
Tenga en cuenta que lo que aprenderá en este curso, cómo detectar la minería ilegal de ámbar, es solo un ejemplo. Siguiendo el mismo proceso, el aprendizaje automático se puede utilizar para realizar una serie de tareas periodísticas diferentes e incluso se puede aplicar en el análisis diferentes tipos de contenido, no solo imágenes. Revisaremos algunos casos de uso al final del curso. A medida que avanzamos en el ejercicio, recuerde centrarse en el proceso en lugar del estudio de caso específico.
Primero, antes de comenzar el ejercicio en sí, debemos dedicar unos minutos a configurar la herramienta que vamos a utilizar en las próximas lecciones: Google Cloud AutoML Vision.
-
How to make them using makestories.io
Lecciónmakestories.io is a platform specially created to help people make, publish, and monetize Google Web Stories. It’s free, and it can be used with any content management system. Here are the basics of how to get started with makestories.io. -
-
Data Studio: creación de visualizaciones interactivas de datos
LecciónDa vida a tus conjuntos de datos creando poderosas visualizaciones interactivas con un estudio fácil de utilizar.