Uczenie maszynowe a sprawiedliwość
Jak dotąd dowiedziałeś się, jak uczenie maszynowe może usprawnić Twoją pracę – od oszczędzania cennego czasu na bieżących zadaniach do stwarzania nowych możliwości. UM może wiele dla Ciebie zrobić, ale wiąże się to z wyzwaniami, którym nie możesz ignorować.
Aby sprostać tym wyzwaniom, coraz więcej naukowców i praktyków kładzie nacisk na kwestię „sprawiedliwości” w uczeniu maszynowym. Jej naczelną zasadą jest to, że UM powinno przynosić takie same korzyści wszystkim, niezależnie od kategorii społecznych, które strukturyzują i wpływają na nasze życie.
Czym jest stronniczość?
Jakie są negatywne konsekwencje wynikające ze stosowania uczenia maszynowego? Odpowiedź jest krótka: stronniczość.
Ludzie mają swoje uprzedzenia. Są to narzędzia, których nasz mózg używa do radzenia sobie z informacjami, którymi jest codziennie bombardowany.
Przykład: zamknij oczy i wyobraź sobie but. Najprawdopodobniej wyobraziłeś sobie trampka. Może skórzany męski but. Mniej prawdopodobne jest, że myślałeś o damskim bucie na wysokim obcasie. Może nawet nie wiemy dlaczego, ale każdy z nas woli jedne buty od drugich.
Teraz wyobraź sobie, że chcesz nauczyć komputer rozpoznawać buty. W konsekwencji narażasz go na własne uprzedzenia. W ten sposób powstaje stronniczość w uczeniu maszynowym. Nie jesteśmy w stanie całkowicie odseparować się od naszych uprzedzeń, pomimo dobrych chęci.
Rodzaje stronniczości
Istnieją różne sposoby, w jakie nasze własne uprzedzenia mogą przenikać do tworzonej przez nas technologii:
Stronniczość interakcyjna
Weźmy wcześniejszy przykład – jeśli przeszkolimy model do rozpoznawania butów za pomocą zbioru danych, który zawiera głównie zdjęcia trampków, system nie nauczy się rozpoznawać wysokich szpilek jako butów.
Stronniczość ukryta
Jeśli przeszkolisz system UM, aby rozpoznawał naukowca za pomocą zdjęć słynnych naukowców z przeszłości, Twój algorytm prawdopodobnie nauczy się kojarzyć naukowców tylko z mężczyznami.
Stronniczość selektywna
Powiedzmy, że trenujesz modelkę do rozpoznawania twarzy. Jeśli dane, których używasz do jego wyszkolenia, stanowią nadreprezentację danej populacji, będzie on faworyzować tę populację kosztem innych z potencjalnie rasistowskimi konsekwencjami.
Co można zrobić, aby uniknąć tych rodzajów stronniczości?
Zadawanie właściwych pytań w celu uniknięcia stronniczości
Jako dziennikarz dysponujesz narzędziami pierwszej linii obrony przed stronniczością – te same wartości i zasady etyczne, które stosujesz na co dzień w swoim zawodzie, powinny obejmować ocenę sprawiedliwości każdej nowej technologii, którą dodajesz do swojego zestawu narzędzi.
Uczenie maszynowe nie jest wyjątkiem.
Ponadto we wszystkich przypadkach należy najpierw ustalić, czy konsekwencje mogą mieć negatywny wpływ na ekonomiczne lub inne ważne szanse życiowe danej osoby. Jest to szczególnie ważne, gdy dane, z których korzystasz, zawierają poufne dane osobowe.
Główne przyczyny stronniczości
Chociaż żadne dane uczące nigdy nie będą całkowicie „bezstronne”, możesz znacznie zwiększyć swoje szanse na stworzenie sprawiedliwego modelu, jeśli uważnie rozważysz potencjalne źródła stronniczości w swoich danych i podejmiesz odpowiednie działania.
Najczęstszym powodem stronniczości jest to, że dane uczące nie są w pełni reprezentatywne dla populacji, na podstawie której Twój model opracowuje prognozy. Musisz dysponować wystarczającą ilością danych dla każdej odpowiedniej grupy.
Inny rodzaj stronniczości objawia się tym, że niektóre grupy są reprezentowane w danych uczących mniej pozytywnie niż inne. Należy zastanowić się nad sprawdzeniem swoich danych przed wykorzystaniem ich do szkolenia modelu, aby sprawdzić, czy nie zawierają żadnych uprzedzeń, których algorytm mógłby się nauczyć i powielić.
Zapobieganie stronniczości – najważniejsza jest świadomość
Uprzedzenia mogą pojawiać się na wiele sposobów – na podstawie zbiorów danych uczących, w wyniku decyzji podjętych w trakcie tworzenia systemu uczenia maszynowego oraz poprzez złożone sprzężenia zwrotne, które pojawiają się, gdy system UM jest wdrażany w realnym świecie.
Konkretne pytania, które można by zadać w celu rozpoznania potencjalnego ryzyka stronniczości, to m.in:
- W jakim celu gromadzono dane?
- W jaki sposób gromadzono dane?
- Jaki jest cel wykorzystania zbioru danych i tego konkretnego algorytmu?
- Jak oceniono źródło danych?
- Jak został zdefiniowany proces analizy danych przed samą analizą?
Stronniczość to skomplikowana kwestia i nie ma na nią „złotego środka”. Rozwiązaniem jest świadomość oraz zrozumienie ryzyka, a także podjęcie właściwych kroków w celu jego zminimalizowania.
-
Looking ahead to ML-powered journalism
LekcjaKey learnings and recommended resources to deepen your ML knowledge. -
Uczenie maszynowe, dziennikarstwo i Ty
LekcjaJak uczenie maszynowe wpisuje się w Twoje życie osobiste i zawodowe. -
What are Web Stories?
LekcjaHow the easy-to-use vertical video format is changing the face of digital storytelling and driving the connection between content makers and their fans.