メイン コンテンツへスキップする
ダッシュボードに移動
何から始めればよいかわからない方は、簡単なクイズに答えて、パーソナライズされたおすすめを参照してください。
レッスン 5 件 / 7 件
機械学習モデルをトレーニングする
Hands-on Machine Learning
機械学習とは何か?
機械学習で原稿ネタを調査する
Google Cloud AutoML Vision
データの準備
評価とテスト
check_box_outline_blank Hands-on Machine Learning: Take the Quiz
コース
0% 完了
5 分完了する

機械学習モデルをトレーニングする

image13_2.png
AutoML Visionにデータをインポートし、トレーニングプロセスを開始する
image13_2.png

インポート用のデータを準備する

image13_2_x1zLfy0.png

Google Cloud アカウントに戻り、トレーニングデータセットを AutoML Vision にインポートして演習を続けましょう。

ラベル付きの画像を追加する最も簡単な方法は、各ラベルの例を含む個別の zip フォルダをアップロードすることです。この例では、「ポジティブ」(琥珀採掘の例がある画像)と「ネガティブ」(琥珀採掘の例がない画像)の2つのフォルダ/ラベルがあります。すべての画像をまとめてアップロードし、AutoML Visionインターフェイス内で手動でラベルを付けることもできますが、それにはかなり時間がかかります。

image13_2_x1zLfy0.png

AutoML にデータをインポートする(1)

2つの zip フォルダをローカルディスクにダウンロードします。


  • ポジティブな例
  • ネガティブな例

ダウンロード中に、via this link から Google Cloud Platform を再度開きます。2つのフォルダをローカルディスクにダウンロードしたら、次の手順に従って AutoML Vision にアップロードします。



インターフェイスから、「新しいデータセット(New Dataset)」をクリックします。


データセットの名前を認識可能なもの(「amber_mining」など)に変更し、モデルの目的として「シングルラベル分類(Single-Label Classification)」を選択して、「データセットの作成(Create dataset)」をクリックします。


「コンピュータから画像をアップロード(Upload images from your computer)」を選択したまま、「ファイルを選択(Select Files)」をクリックします。表示されるメニューから、「positive.zip」と「negative.zip」の両方を選択します。選択した内容を確認します。


「参照(Browse)」をクリックして Cloud Storage の宛先を選択し、表示されるウィンドウで右上隅のアイコンをクリックして「新しいバケットを作成(Create new bucket)」します。


バケットに名前を付けます。この演習では、次のオプションで何を選択してもかまいません。次のウィンドウで「作成(Create)」をクリックしてから「選択(Select)」をクリックします。

AutoML にデータをインポートする(2)

これで、トレーニングセットのアップロードの準備が整いました。


「negative.zip」と「positive.zip」の両方がグレーのボックスに表示されていることを確認し、「続行(Continue)」をクリックします。画像がアップロードされるまで、接続の速度に応じて、数秒から数分待ちます。


アップロードが完了したら、ページ上部のメニューから「画像(Images)」をクリックし、インポートプロセスが完了するのを待ちます。最大30分かかる場合があります。


インポートプロセスが完了すると、メールで通知されます。Google Cloud Platform には、インポートされた1,150枚の画像、900枚のネガティブと250枚のポジティブが表示されます。

機械学習モデルをトレーニングする

これで、トレーニングプロセスを開始する準備が整いました。ただし、まず初めに画像を参照して、データセットについて詳しく学びます。たとえば、「ポジティブ」の画像のいくつかをチェックしてみましょう。特徴的な穴、琥珀採掘の痕跡が見えますか?あなたがそれを認識できるなら、あなたのモデルもそれを行うことができます。


画像によっては、琥珀採掘の痕跡があるかどうか自分で判断するのが容易でない場合があります。次のレッスンでは、これらの境界線の例でモデルがどのように機能するかを見ていきます。続行する準備ができたら、「トレーニング(Train)」をクリックします。


この時点で、モデルは「トレーニングを開始するのに十分な画像を持っています」と表示します。また、「データセットは自動的にトレーニング、検証、テストセットに自動的に分割されます」と通知されます。 それが何のことなのか見てみましょう。

トレーニング、検証、およびテストセット

image39_2.png

データセットを3つの別々のセットに分割する理由は、いくつかの画像を横に置いておくことで、モデルがトレーニングされた後に、トレーニングされていないが適切なラベルがわかっているデータを使ってその性能を評価できるようにするためです。


各セットに保持する画像の数を指定しない場合、AutoML Vision はトレーニングに80%、検証に10%、テストに10%を使用します。


  • トレーニングセットは、モデルが「見ている」ものであり、最初に学習するものです。
  • 検証セットもトレーニングプロセスの一部ですが、モデルのハイパーパラメーター、つまりモデルの構造を指定する変数を調整するために、個別に保持されます。
  • テストセットは、トレーニングプロセスの後にのみステージに入ります。これを使用して、まだ確認されていないデータでモデルの性能をテストします。
image39_2.png
おめでとうございます!これで終了です。 機械学習モデルをトレーニングする in progress
Recommended for you
このレッスンに対する評価をお聞かせください。
お問い合わせいただいたフィードバックは、レッスンの向上に役立てさせていただきます。
Leave and lose progress?
By leaving this page you will lose all progress on your current lesson. Are you sure you want to continue and lose your progress?