GDEP Solutions, Inc.
  • Home
    • 新着情報一覧
    • NVIDIA NEWS
    • GPU2021 開催概要 >
      • Day1 AI & GPU セッション
      • Day2 イメージングAI
      • Day3 GPUスパコン
      • 講演レポート | Denso
      • 過去開催 >
        • GPU2020
        • GPU2019
  • GPU製品
    • 即納モデル
    • NVIDIA GPU 一覧 >
      • NVIDIA H100
      • NVIDIA A100
      • NVIDIA RTX スペック比較 >
        • NVIDIA RTX A6000
        • NVIDIA RTX A5000
        • NVIDIA RTX A4500
        • NVIDIA RTX A4000
        • NVIDIA RTX A2000
      • Quadro GV100
    • GPUレンタル一覧
    • GPU年定額プラン
    • AI・データサイエンスおすすめ一覧 >
      • NVIDIA DGX H100
      • NVIDIA DGX A100
      • DGX STATION A100
      • HP Z8 G4 Workstation
      • HP ZBook Fury17G7 Mobile Workstation
      • Dell Precision 7920 Tower
      • DeepLearning BOXⅡ
      • DeepLearning STATION
      • NVIDIA EGX サーバー
      • HITACHI SR24000
    • 数値計算・解析おすすめ一覧 >
      • HP Z4 G4 Workstation
      • HP Z8 G4 解析ソフトウェア動作確認済みモデル
      • Supermicro 7049GP
    • NVIDIA A100搭載 Supermicro 740GP
  • ストレージ
    • Synology
    • DDN STORAGE
    • PURESTORAGE
  • HPC
    • HPC Workstation
    • HPCおすすめGPUサーバー
    • HPC SIサービス
    • AXXE-L by XTREME-D
    • NVIDIA HPC SDK
    • プログラム高速化サービス
  • クラウド製品
    • セキュリティ >
      • KernelCare
    • 仮想化 >
      • Login VSI
      • Login PI
    • リモートアクセス >
      • FastX
      • NiceDCV
      • NoMachine
    • ハイブリッドクラウドNAS >
      • Morro Data
    • クラウドストレージ >
      • クラウドストレージ Wasabi
  • GPUコラム / 導入事例
    • GPUプログラミング >
      • 初級編
      • 中級編 >
        • 第4回:MPI+OpenACC実装における計算と通信のオーバーラップ
        • 第3回:拡散現象シミュレーションのおさらい
        • 第2回:簡単なOpenACC + MPI コードで考える
        • 第1回:複数のGPUを使う方法とは?
    • GPU Technology for CG/AI >
      • 深層学習を利用した画像処理・必要なGPU性能
      • トランスフォーマー 最近流行のニューラルネットワーク
      • GAN Inversion による写実的画像生成の制御
      • 深層学習におけるアノテーションコストを抑えるための取り組み Active Learning
      • 深層学習に基づく人物画像の再照明
      • GPUの起源と進化
      • AlphaGo とその後
      • CUDAを用いたシンプルなパストレーシング
      • 流体シミュレーションの応用
      • GPUを用いた高速レンダリング
      • GPUを基盤としたCG/AIの技術進化
    • シリコンバレー発信 New Technology Report >
      • 最新記事から
    • ツブ子が聞く・見る・行く! >
      • 見る!NVIDIA RTX A6000
      • 聞く!NVIDIA DGX A100
      • 見る!NVIDIA A100 Tensor Core GPU
    • 導入事例 >
      • DGX SYSTEMS >
        • NVIDIA DGX A100 | 金沢大学
      • GPU Computing
  • 会社情報
    • ごあいさつ
    • 会社概要
    • アクセスマップ
    • 採用情報
  • お問い合わせ
深層学習におけるアノテーションコストを抑えるための取り組み

​​​"Active Learning" について
青木 義満 先生

​慶應義塾大学 教授
2021年8月

1. 深層学習とアノテーション

近年、画像センシング分野における研究開発の成果は、深層学習の進化により、実社会の様々な場面で利活用されています。

機械学習、特に深層学習においては、ネットワークモデルの学習において、大規模な教師データ(ラベル付きデータ)が必要となります。

例えば、画像のクラス分類タスクにおいては、画像ごとにその意味内容を表すラベルを付与したり、物体検出タスクにおいては、物体を矩形で指定する作業が必要となります。
これらのラベル付きのサンプルを得るためのアノテーション作業は、時間とコストがかかるため、実用上大きな問題となります。

2. アノテーション作業を減らすための工夫

アノテーション作業のコストを減らすための方法として、教師なし学習、半教師あり学習、Active Learningなどの学習手法が近年、注目されています。

教師なし学習や、半教師あり学習はラベル付けされていないサンプルを十分に利用してモデルを学習させることを目的としています。

一方、Active Learningは教師データを作成する際、大量のデータの全てに対してアノテーションをするのではなく、モデルの学習に効果的なサンプルを優先するようにアノテーションを行うことによって、アノテーションの総量を少なく抑えながら教師データの作成とモデルの学習を行うことを目的としています。

ここでは、アノテーション作業を効率化するための、Active Learning研究の取り組みについて、紹介します。

3. Active Learningに関する取り組み事例

Active Learningには大きく3つの潮流があります。
​
  1. モデルの学習に有効なデータを生成するアプローチ(membership query synthesis)
  2. データに対してラベル付するか破棄するかのふるい分けを行うアプローチ(stream-based selective sampling)
  3. ラベル無しデータプールの中からモデルを学習させる上で最も効果が高いサンプルを選択するアプローチ(pool-based sampling)

​これらの中でも図1に示すpool-based samplingは最も一般的な手法となっています。
画像
図1: Pool-based sampling
Pool-based samplingで主流になりつつある方法は敵対的学習を用いた方法です。

この手法ではVAE(Variational Auto Encoder)と呼ばれる方法で画像を低次元表現に一度落とし込み、得られた低次元表現がラベル付きサンプル由来なのか、ラベル無しサンプル由来なのかをDiscriminatorが判別します。

VAEとDiscriminatorを敵対的に学習させることにより、ラベル無しデータプールからモデルがまだ得ていない特徴を持つラベル無しサンプルを選択することができるのです。

この手法は画像特徴からサンプリングを行なっているため、分類やセグメンテーションといったタスクによらないActive Learningを行うことができる利点があります。

一方で、タスクの学習以上に時間がかかるという欠点もあります。

4. 不確実性サンプリング

私たちは、このActive Learningの課題に対し、新たなモデルで推論を行う際に推論結果の不確実性が最も高いデータからラベル付けをしていく、不確実性サンプリング指標を活用したアプローチをしています(図2)。
画像
図2: 提案手法のモデル
まず、少数のラベル付きプールのデータを用いてタスクモデルを一度、学習させます。

その後、学習済みのタスクモデルを用いた不確実指標生成器(図中のUncertainty Indicator Generator)にラベル無しプールのサンプルを入力して、サンプルごとの不確実指標を出力します。

この不確実指標の上位K個を選択し、それらを優先してアノテーションを行います。
モデルで推論を行う際に推論結果の不確実性が最も高いデータを優先してラベル付けするということです。

これは、これにより、最小限のアノテーションコストで高い性能を得ることができます。これは、テスト対策で「複数回解いた分かる問題」よりも「まだ観たことのない問題」を対策した方が成長に繋がるのと同じようなことです。

提案している方法では、ラベル無しプールのサンプルごとの不確実性を[0,1)の連続値を用いて異なる重要度で表すように設計しています。
不確実性指標生成器は、対象モデル(画像分類器、セマンティックセグメンテーションモデル)の予測ベクトルに基づいて不確実性指標を計算します。

具体的には、画像分類の場合、予測は各カテゴリの確率ベクトル、セグメンテーションでは、各画素は確率ベクトルを持ち、予測ベクトルは各確率ベクトルの平均値となります。

​不確実性指標の定式化と計算方法については、ここでは割愛しますので、文献[1]を参照して下さい。

ここでわかりやすい例を示します。

犬,猫,虎の3クラス分類の問題を考えます。

​ラベル無し画像Aに対してタスクモデルが(犬,猫,虎)=(0.6, 0.1, 0.3)と判断し、ラベル無し画像Bに対して(犬,猫,虎)=(0.4, 0.4, 0.2)と判断した場合、この不確実性指標生成器による出力は、前者が0.49, 後者が0.9となり、後者の画像Bの方が不確実性が高いと言えるので、こちらを優先的にアノテーションした方が効率が良いということになります。

5. Active Learningの効果は?

ここでは、画像分類とセマンティックセグメンテーションのタスクで、この手法の効果を確認します。
Active Learningの先行研究であるVAAL[2]、ランダムにサンプリングした際の結果と比較して評価してみました。

画像分類とセマンティックセグメンテーションでは、データセットの全体10%のサンプルをランダムにサンプリングしてラベル付きデータ、残りの90%をラベル無しデータとして実験を開始します。

ラベル付きデータが全体の40%になるまで5%ずつサンプリングを行い、各データセットにおける性能を先行研究、ランダムサンプリングの結果と比較します。

評価指標は、画像分類では正解率(Accuracy)、セマンティックセグメンテーションではmean Intersection Over Union (mIOU)を使用しています。

画像分類ではCIFAR-100[1]を用い、セマンティックセグメンテーションではCityscapes[6]を使いました。

​図3にCIFAR100の結果、図4にCityscapesの結果を示します。
画像
図3: 画像分類タスク(CIFAR100)における結果
画像
図4: セマンティックセグメンテーション(Cityscapes)における結果
15%以降のサンプリングで、VAAL、ランダムサンプリングよりも提案手法は精度が高いことが分かります。

また、実行時間で比較すると提案手法は画像分類で約10分の1、セグメンテーションでは約2分の1の時間になっていることが分かりました。

6. まとめ

ラベル無しプールから最も情報量の多いサンプルを選択するために、タスクモデルの出力結果から最も情報量の多いラベル付けされていないサンプルを導出する不確実性指標生成器によって、使用するラベル付きデータの量を減らすことでアノテーションコストを低下させることができることを示しました。

また、モデルの実行時間も従来手法と比較してCIFAR-100では約10分の1に、Cityscapesでは約2分の1程度に削減可能なことを示しました。

深層学習におけるアノテーションコストを抑える取り組みは、実用上非常に重要なものとなっており、この取り組み以外にも様々な新手法が続々と提案されています。

今後のこの分野の研究の進展に是非、ご注目下さい。
参考文献
[1] Active Learningにおける不確実サンプル選択によるアノテーション効率化
川野恭史,野田祥希,望月凜平,青木義満
第27回画像センシングシンポジウ(SSII2021),IS2-17, June 2021.
[2] Samarth Sinha, Sayna Ebrahimi, and Trevor Darrell. Variational adversarial active learning. arXiv preprint arXiv:1904.00370, 2019.

GPUコラム「GPU Technology for CG/AI」

一覧ページを見る
Picture
GDEPソリューションズ株式会社
東京都文京区本郷三丁目34番3号 本郷第一ビル8階
TEL:03-5802-7050
・NVIDIA認定 Elite Partner [最上位レベル]
・NVIDIA Advanced Technology Program 達成  [DGX 販売資格]
・東京都公安委員会 古物営業許可番号
 第305471905562号
≫ 新着情報
≫ GPU2021開催概要
​
GPU製品
​≫ 即納モデル
≫ NVIDIA GPU一覧
 ≫NVDIA RTX スペック比較

≫ GPUレンタル一覧
≫ GPU年定額プラン
≫ AI・データサイエンスおすすめ
≫ 数値計算・解析おすすめ一覧
≫ NVIDIA A100搭載 SM740GP


​ストレージ
​≫ Synology
≫ DDN STORAGE
≫ PURESTORAGE
​
HPC
≫ HPC Workstation
≫ HPCおすすめGPUサーバー
≫ AXXE-L by XTREME-D
≫ NVIDIA HPC SDK
≫ プログラム高速化サービス
クラウド製品
​≫ セキュリティ
≫ 仮想化
≫ リモートアクセス

≫ ハイブリッドクラウドNAS
≫ クラウドストレージ
​
​GPUコラム
≫ GPUプログラミング入門
≫ GPU Technology for CG/AI
≫ シリコンバレー発信 New Technology Repot
≫ ツブ子が聞く・見る・行く
​

導入事例
≫ DGX SYSTEMS
≫ GPU Computing
会社情報
≫ ごあいさつ
≫ 会社概要
≫ アクセスマップ
≫ 採用情報
​
≫ お問い合わせ
​
≫ 個人情報の取扱いについて
≫ 利用規約

​
≫ メルマガを購読する
グループ会社
Prometech Softwareサイト
©2021 GDEP Solutions,Inc.
  • Home
    • 新着情報一覧
    • NVIDIA NEWS
    • GPU2021 開催概要 >
      • Day1 AI & GPU セッション
      • Day2 イメージングAI
      • Day3 GPUスパコン
      • 講演レポート | Denso
      • 過去開催 >
        • GPU2020
        • GPU2019
  • GPU製品
    • 即納モデル
    • NVIDIA GPU 一覧 >
      • NVIDIA H100
      • NVIDIA A100
      • NVIDIA RTX スペック比較 >
        • NVIDIA RTX A6000
        • NVIDIA RTX A5000
        • NVIDIA RTX A4500
        • NVIDIA RTX A4000
        • NVIDIA RTX A2000
      • Quadro GV100
    • GPUレンタル一覧
    • GPU年定額プラン
    • AI・データサイエンスおすすめ一覧 >
      • NVIDIA DGX H100
      • NVIDIA DGX A100
      • DGX STATION A100
      • HP Z8 G4 Workstation
      • HP ZBook Fury17G7 Mobile Workstation
      • Dell Precision 7920 Tower
      • DeepLearning BOXⅡ
      • DeepLearning STATION
      • NVIDIA EGX サーバー
      • HITACHI SR24000
    • 数値計算・解析おすすめ一覧 >
      • HP Z4 G4 Workstation
      • HP Z8 G4 解析ソフトウェア動作確認済みモデル
      • Supermicro 7049GP
    • NVIDIA A100搭載 Supermicro 740GP
  • ストレージ
    • Synology
    • DDN STORAGE
    • PURESTORAGE
  • HPC
    • HPC Workstation
    • HPCおすすめGPUサーバー
    • HPC SIサービス
    • AXXE-L by XTREME-D
    • NVIDIA HPC SDK
    • プログラム高速化サービス
  • クラウド製品
    • セキュリティ >
      • KernelCare
    • 仮想化 >
      • Login VSI
      • Login PI
    • リモートアクセス >
      • FastX
      • NiceDCV
      • NoMachine
    • ハイブリッドクラウドNAS >
      • Morro Data
    • クラウドストレージ >
      • クラウドストレージ Wasabi
  • GPUコラム / 導入事例
    • GPUプログラミング >
      • 初級編
      • 中級編 >
        • 第4回:MPI+OpenACC実装における計算と通信のオーバーラップ
        • 第3回:拡散現象シミュレーションのおさらい
        • 第2回:簡単なOpenACC + MPI コードで考える
        • 第1回:複数のGPUを使う方法とは?
    • GPU Technology for CG/AI >
      • 深層学習を利用した画像処理・必要なGPU性能
      • トランスフォーマー 最近流行のニューラルネットワーク
      • GAN Inversion による写実的画像生成の制御
      • 深層学習におけるアノテーションコストを抑えるための取り組み Active Learning
      • 深層学習に基づく人物画像の再照明
      • GPUの起源と進化
      • AlphaGo とその後
      • CUDAを用いたシンプルなパストレーシング
      • 流体シミュレーションの応用
      • GPUを用いた高速レンダリング
      • GPUを基盤としたCG/AIの技術進化
    • シリコンバレー発信 New Technology Report >
      • 最新記事から
    • ツブ子が聞く・見る・行く! >
      • 見る!NVIDIA RTX A6000
      • 聞く!NVIDIA DGX A100
      • 見る!NVIDIA A100 Tensor Core GPU
    • 導入事例 >
      • DGX SYSTEMS >
        • NVIDIA DGX A100 | 金沢大学
      • GPU Computing
  • 会社情報
    • ごあいさつ
    • 会社概要
    • アクセスマップ
    • 採用情報
  • お問い合わせ