Ir al contenido principal
Ir al panel
¿No sabes por dónde empezar? Responde un breve cuestionario para obtener recomendaciones personalizadas.
Lección 6 de 8
Sesgos y aprendizaje automático
Introduction to Machine Learning
¿Cómo aprende una máquina?
Aprendizaje automático, periodismo y usted
Looking ahead to ML-powered journalism
check_box_outline_blank Machine Learning: Take the Quiz
Curso
0% completada
5 minutos para completar

Sesgos y aprendizaje automático

79390180-18368d80-7f24-11ea-936e-22c30be1ccda_lnyPSqk.jpg
Comprenda qué son los sesgos en el aprendizaje automático y cómo evitarlos.
79390180-18368d80-7f24-11ea-936e-22c30be1ccda_lnyPSqk.jpg

Equidad en el aprendizaje automatizado

79390180-18368d80-7f24-11ea-936e-22c30be1ccda.jpg

Hasta el momento, este curso ha mostrado de qué modo el aprendizaje automático puede contribuir a su trabajo, desde ahorrarle tiempo dedicado a tareas existentes hasta abrirle nuevas oportunidades. El aprendizaje automático puede hacer mucho por usted, pero presenta ciertas dificultades que no se pueden obviar.

Para abordar tales dificultades, cada vez son más los investigadores y profesionales que se centran en el tema de la "equidad" en el aprendizaje automático. Su principio rector es que el aprendizaje automático debe beneficiar a todos por igual, con independencia de las categorías sociales que estructuren y afecten nuestras vidas.

79390180-18368d80-7f24-11ea-936e-22c30be1ccda.jpg

¿Qué son los sesgos?

6.2.jpg

¿Qué efectos adversos puede tener el uso del aprendizaje automático? El tema se resume en una palabra: sesgos. 

Como humanos, todos tenemos nuestras inclinaciones y estructuras mentales. Son herramientas que nuestro cerebro utiliza para procesar la información que le llega cada día. 


Veamos este ejemplo: cierre los ojos y visualice un calzado. Lo más probable es que haya imaginado una zapatilla deportiva. Quizás un zapato de piel para hombres. Es menos probable que pensase en un zapato de mujer de tacón alto. Incluso sin saber por qué, cada uno de nosotros tiene tendencia a pensar en un tipo de calzado en lugar de pensar en otros. 


Ahora suponga que quiere enseñar a un ordenador a reconocer un zapato. Puede acabar exponiéndolo a su propia parcialidad. Es así como pueden filtrarse sesgos en el aprendizaje automático. Incluso con la mejor de las intenciones, no nos es posible dejar de lado nuestras inclinaciones y parcialidades.

6.2.jpg

Existen tres tipos de parcialidad

6.3_SbkljXh.jpg

Hay tres modos diferentes en que nuestros propios sesgos pueden colarse en la tecnología que creamos y alterar el resultado:


Parcialidad en la interacción

Veamos el ejemplo anterior: si entrenamos un modelo para que reconozca calzado con una serie de datos que mayoritariamente incluyan imágenes de zapatillas deportivas, el sistema no aprenderá a reconocer los zapatos de tacón alto como calzado.

Parcialidad latente

Si usted entrena un sistema de aprendizaje automático sobre el aspecto que tiene un científico utilizando imágenes de científicos famosos del pasado, es probable que su algoritmo solo asocie los científicos con los hombres.


Parcialidad en la selección

Supongamos que está entrenando un modelo para reconocer caras. Si los datos que utiliza para entrenarlo representan excesivamente una población, funcionará mejor para esta población en detrimento de otras, lo que podría derivar en resultados racistas.


¿Qué podemos hacer para evitar estos sesgos?

6.3_SbkljXh.jpg

Formular las preguntas adecuadas para evitar sesgos

6.4.jpg

Como periodista, tiene a su alcance una primera línea de defensa contra los sesgos: los mismos principios éticos y valores que usted aplica cada día en su profesión deben aplicarse al evaluar la equidad de cualquier nueva tecnología que se añada a su caja de herramientas. El aprendizaje automático no constituye la excepción.


En todos los casos, usted debe empezar por considerar si las consecuencias podrían afectar a las oportunidades económicas u otras oportunidades vitales de los individuos. Se trata de algo fundamental, especialmente si los datos que utiliza son información personal sensible.


A menudo, el impacto de la falta de equidad no es obvio de inmediato, sino que requiere preguntas matizadas de carácter social, político y ético sobre cómo su sistema de aprendizaje automático se vio afectado por sesgos.

6.4.jpg

Analizar las principales fuentes de sesgos

6.5_2mBMJ0U.jpg

Si bien no será posible tener datos de entrenamiento perfectamente «imparciales», usted sí puede mejorar enormemente sus oportunidades de construir un modelo justo si analiza cuidadosamente las fuentes potenciales de sesgos en sus datos y adopta las medidas necesarias para evitarlos.


El motivo más común detrás de la parcialidad es cuando sus datos de entrenamiento no son auténticamente representativos de la población sobre la cual su modelo hace predicciones. Debe asegurarse de tener datos suficientes para cada grupo pertinente.


Una clase diferente de parcialidad se manifiesta cuando hay grupos que tienen una representación menos positiva que otros en los datos de entrenamiento. Piense en la posibilidad de revisar sus datos antes de utilizarlos para entrenar un modelo, para verificar si incluye prejuicios que el algoritmo pueda aprender y reproducir.

6.5_2mBMJ0U.jpg

Evitar sesgos: comience con la concienciación

6.6_SmMGAHH.jpg

Los sesgos pueden deberse a muchas causas: datos de entrenamiento parciales, decisiones incorrectas adoptadas durante el desarrollo de un sistema de aprendizaje automático y complejos bucles de retroalimentación que surgen cuando un sistema de aprendizaje automático se despliega en el mundo real.


Entre las preguntas concretas que quizás usted quiera formular para reconocer estos riesgos potenciales se encuentran las siguientes:


  • ¿Con qué finalidad se recopilaron los datos? 
  • ¿Cómo se recopilaron los datos? 
  • ¿Con qué objetivo se utiliza este conjunto de datos y este algoritmo en particular? 
  • ¿Cómo se evaluó el origen de los datos? 
  • ¿Cómo se definió el proceso de análisis de datos antes del propio análisis?


La parcialidad es una cuestión compleja y no existe ninguna solución mágica o perfecta. La solución empieza con la toma de conciencia y con todos nosotros teniendo presentes los riesgos y adoptando las medidas adecuadas para minimizarlos.

6.6_SmMGAHH.jpg
¡Felicitaciones! Ya terminaste Sesgos y aprendizaje automático in progress
Recommended for you
¿Cómo calificarías esta lección?
Tus comentarios nos ayudarán a mejorar continuamente nuestras lecciones.
¿Salir y perder el progreso?
Si sales de esta página, perderás todo el progreso de la lección actual. ¿Confirmas que quieres continuar y perder el progreso?