Zróżnicowane podejście do uczenia maszynowego
Naucz się rozpoznawać, co charakteryzuje różne rozwiązania w zakresie uczenia maszynowego.
Istnieją różne sposoby uczenia się
Istnieją różne sposoby uczenia się maszyn. Różne podejścia do UM zazwyczaj różnią się rodzajem problemów, które starają się rozwiązać, jak również rodzajem i ilością informacji zwrotnych przekazywanych przez programistę.
Ogólnie rzecz biorąc, uczenie maszynowe możemy podzielić na trzy podobszary:
- uczenie z nadzorem
- uczenie bez nadzoru
- uczenie przez wzmacnianie
Choć kategoryzacja ta jest dość przejrzysta, nie zawsze łatwo jest ustalić konkretną metodę. Sprawdźmy, czym różnią się te trzy kategorie.
Uczenie z nadzorem
Przypuśćmy, że chcesz nauczyć maszynę rozpoznawania psów od kotów. Wprowadzasz dane wejściowe w postaci zdjęć z etykietami jako „kot” lub „pies”. Zapoznając się z przykładami, algorytm nauczy się rozpoznawać, co odróżnia kota od psa i przypisywać właściwą etykietę do każdego nowego zdjęcia, które ma przeanalizować.
Podczas uczenia z nadzorem maszyna uczy się na przykładach z etykietami. Przykłady te są wykorzystywane do uczenia algorytmu, aby automatycznie przyporządkował właściwą etykietę.
W kontekście dziennikarskim uczenie z nadzorem może, na przykład, nauczyć algorytm wykrywania dokumentów, które mogą być przydatne podczas śledztwa. W wielu przypadkach ten rodzaj uczenia okazał się przydatny dla dziennikarzy śledczych, którzy mają do czynienia z dużą ilością dokumentów.
Uczenie bez nadzoru
W przypadku uczenia bez nadzoru maszynie podaje się przykłady bez etykiet. Algorytm musi sam nauczyć się rozpoznawać schematy w danych, na przykład w celu grupowania zapisów, które mają podobne cechy.
Innymi słowy, algorytm uczy się odkrywania pewnej struktury w nieoznakowanych danych, które ma przeanalizować. Ten rodzaj uczenia może posłużyć firmie do lepszego zrozumienia swoich klientów, na przykład poprzez pogrupowanie ich w kategorie, które wskazują podobne zachowania zakupowe.
W dziennikarstwie tego rodzaju techniki wykorzystują dziennikarze śledczy, aby wykryć przypadki uchylania się od płacenia podatków oraz ułatwić dziennikarzom zajmującym się finansowaniem kampanii powiązanie wielu darowizn z jednym darczyńcą.
Uczenie przez wzmacnianie
Trzecia kategoria to uczenie przez wzmacnianie. Podobnie jak w przypadku uczenia bez nadzoru, w uczeniu przez wzmacnianie nie wykorzystuje się danych z etykietami. Polega ono na uczeni się metodą prób i błędów, jakie działania należy podjąć, lub innymi słowy – poprzez popełnianie błędów. Początkowo algorytm działa losowo, badając środowisko, ale z czasem uczy się poprzez nagrody za dokonywanie właściwych wyborów.
Uczenie przez wzmacnianie jest powszechnie stosowane do uczenia maszyn grania w gry, a najbardziej znanym przykładem jest AlphaGo, program komputerowy opracowany przez DeepMind, któremu w 2016 roku udało się pokonać najlepszego gracza na świecie Lee Sedola w chińskiej grze planszowej Go.
Aplikacje dziennikarskie są nadal rzadkością, ale uczenie przez wzmacnianie wykorzystuje się np. do testowania nagłówków.
A głębokie uczenie?
Głębokie uczenie to kolejny rodzaj uczenia się, który w ostatnich latach zyskał sławę dzięki zwiększonej mocy obliczeniowej, o której już wspomnieliśmy. Jest to podkategoria uczenia maszynowego, ale w przeciwieństwie do poprzednio omówionych podejść, głębokie uczenie charakteryzuje „głębia” (stąd nazwa), która odnosi się do złożoności modelu matematycznego.
Złożoność modelu dotyczy wykorzystania wielu warstw analizy, które pozwalają algorytmowi na stopniowe poznawanie coraz bardziej złożonych struktur. Głębokie uczenie opiera się na sztucznych sieciach neuronowych, których budowa inspirowana jest ludzkimi systemami biologicznymi, na przykład przez sposób, w jaki rejestrowana przez oczy informacja wizualna jest przetwarzana przez nasz mózg.
Różne modele uczenia... ale co to oznacza?
Uczenie z nadzorem, bez nadzoru, przez wzmacnianie, sieci neuronowe... pewnie w Twojej głowie panuje teraz chaos.
Ta lekcja nie miała na celu cię zniechęcić. Ważne jest, aby zrozumieć złożoność uczenia maszynowego i poznać jego poddziedziny. Jeśli nie chcesz jednak zgłębiać (gra słów zamierzona) nauki o danych, to wystarczy, że zapamiętasz, że różne problemy wymagają różnych rozwiązań i podejść UM, aby z powodzeniem je rozwiązać.
W następnej lekcji przyjrzymy się sytuacjom, w których uczenie maszynowe może przydać się w Twojej pracy. Następnie poznamy proces, który pozwala maszynie poznać i wprowadzić pojęcie stronniczości oraz kilka wskazówek, jak sobie z nią poradzić.
-
Wizualizacja danych: Wprowadzenie do kartogramów anamorficznych („kafelkowych”).
LekcjaNowy sposób przedstawiania danych na mapie. -
Wyszukiwanie zbiorów danych – przewodnik Szybki start
LekcjaWyszukiwanie milionów zbiorów danych w sieci -
Utrzymywanie zaangażowania odwiedzających dzięki filmom w internecie
LekcjaNawiąż relacje z młodszymi odbiorcami