Google Cloud AutoML Vision
Klasyfikowanie obrazów za pomocą uczenia maszynowego
Jak wspomnieliśmy w poprzedniej lekcji, przygotowując artykuł Ziemia dotknięta trądem, agencja informacyjna Texty zastosowała dwa różne algorytmy.
Pierwszy z nich pozwolił im podzielić fragmenty satelitarnych zdjęć lasów ukraińskich na jednolite wizualnie podsekcje. Następnie potrzebowali drugiego algorytmu, który pozwoliłby im zidentyfikować, które fragmenty tych zdjęć najbardziej przypominają przykłady wydobycia bursztynu z istniejących zdjęć. W tym przypadku należało zastosować tzw. „niestandardowy klasyfikator”.
Nauka z użyciem przykładów opatrzonych etykietami
Niestandardowy klasyfikator to rodzaj modelu uczenia maszynowego, który można zastosować, gdy dany przypadek wymaga sklasyfikowania zbioru badanych obrazów na podstawie wstępnie zdefiniowanych etykiet.
W naszym przypadki etykiety te są proste: „TAK: obraz ten zawiera cechy tożsame z wzorami, które zazwyczaj są typowe dla działań wydobycia bursztynu” oraz „NIE: obraz ten nie zawiera cech, które sugerowałyby obecność działań wydobycia bursztynu”.
Możemy to osiągnąć za pomocą algorytmu Google Cloud AutoML Vision. Nauczymy się używać go do uczenia z nadzorem, tj. będziemy szkolić model uczenia maszynowego, aby stosował odpowiednie etykiety – TAK i NIE – do zbioru danych obrazów, które będziemy mu podawać.
Wybór algorytmu
Cytując słowa Jeremiego Merrilla z Quartz AI Studio z Skróconego kursu klasyfikowania tekstu przy użyciu uczenia maszynowego, „dla dziennikarzy nie ma większego znaczenia, który algorytm wybierzecie – wystarczy, że będzie on wykonywał właściwe zadanie”.
AutoML Vision nie jest jedynym narzędziem, które możemy wykorzystać do osiągnięcia pożądanego celu. Nie jest to nawet algorytm, którego agencja Texty użyła do swojego śledztwa. Powodem, dla którego używamy AutoML Vision w tym kursie, jest jego dostępność: nie trzeba umieć kodować, aby nauczyć się jego obsługi i wytrenować wydajny model na podstawie własnych danych.
Każdego, kto umie kodować i chciałby dowiedzieć się więcej, zapraszamy do przeczytania artykułu Practical Deep Learning for Coders na stronie fast.ai.
Przygotowanie konta Google Cloud
Aby skorzystać z AutoML Vision należy zarejestrować konto Google Cloud. Każdy użytkownik otrzyma po rejestracji pulę środków w ilości 300 USD na rozpoczęcie eksperymentów. Każde ćwiczenie dotyczące szkolenia modelu uczenia maszynowego, takiego jak ten opisany w tym kursie, kosztuje około 20 USD. Cały proces jest opisany poniżej, krok po kroku:
Kliknij pozycję „Try for Free” (Wypróbuj za darmo) w oknie „Get Started with Google Cloud Platform” (Rozpocznij korzystanie z platformy Google Cloud) i wykonuj polecenia, aby utworzyć konto.
Po utworzeniu konta otwórz menu nawigacji widoczne po lewej stronie strony i przejdź na sam dół, gdzie znajdziesz sekcję „Artificial Intelligence” (Sztuczna inteligencja) i pozycję „Vision” (Widzenie). Kliknij pozycję „Dashboard” (Panel sterowania).
Spowoduje to wyświetlenie przestrzeni roboczej zawierające narzędzia Google Cloud dotyczące algorytmów widzenia, w tym także ten, z którego będziemy korzystać w tym ćwiczeniu: „Image Classification” (Klasyfikacja obrazów). Kliknij „Datasets” (Zestaw danych) w menu nawigacyjnym po lewej stronie.
Następnie kliknij „Enable AutoML API” (Włącz interfejs API AutoML). Ten proces może potrwać kilka sekund. Następnie kliknij „Get Started” (Rozpocznij).
Wyświetlony ekran będzie w większości pusty, ponieważ nie zaktualizowano jeszcze żadnego zestawu danych. Zrobimy to w następnej lekcji.
Ruszamy dalej
Teraz jesteśmy gotowi do użycia AutoML Vision. W dalszej części kursu nauczymy się, jak wykorzystać ten algorytm do osiągnięcia pożądanego rezultatu: przeszkolimy model uczenia maszynowego, aby rozpoznać nielegalne wydobycie bursztynu.
Kurs ten powstał we współpracy z agencją Texty i serwisem JournalismAI. Dzięki temu partnerstwu, będziemy mogli wykorzystać próbkę rzeczywistych zdjęć satelitarnych wykorzystywanych przez Texty podczas tworzenia artykułu Ziemia dotknięta trądem.
Zanim przejdziemy dalej, zachęcamy do zapoznania się z resztą oferty uczenia maszynowego oraz SI dostępnej w ramach Google Cloud, w tym m.in. usług naturalnego języka, tłumaczenia, konwersji mowy na tekst i tekstu na mowę.
-
Wyszukiwanie zbiorów danych – przewodnik Szybki start
LekcjaWyszukiwanie milionów zbiorów danych w sieci -
-