高精度な教師データを短期間で大量に作成する「自動アノテーションサービス」の提供を開始
2023年01月18日
東芝情報システム株式会社
高精度な教師データを短期間で大量に作成する
「自動アノテーションサービス」の提供を開始
― 東芝情報システム独自技術により高精度な教師データを自動作成、
手作業では非常に時間のかかる教師データ作成を短期間で実現 ―
- 少量の教師例から教師データを自動作成
- ベンチマークで精度 (mIoU※1) 84.7 %を達成
- 1日で9,600枚の教師データを作成可能
東芝情報システム株式会社(本社:神奈川県 川崎市、取締役社長:渡邉 一正、以下 東芝情報システム)は、高精度な教師データを自動作成する「自動アノテーションサービス」の提供を、2023年1月18日より開始します。
自動運転における画像認識をはじめ、さまざまな分野でAIの活用が進む中、AI開発の大部分の時間が、AIの学習に必要な教師データの作成に費やされていると言われています。これは、大量の教師データを、手作業で作成していることが主な原因です。
「自動アノテーションサービス」は、お客様の教師仕様に基づいた教師例と教師対象データをお預かりして、高精度な教師データを自動作成し、短期間でご提供するサービスです。
本サービスは、手作業による教師データ作成の中でも特に時間を要する、画像のセマンティックセグメンテーションを対象としています。ポイントは以下のとおりです。
- 少量の教師例から教師データを自動作成
-
画像のセグメンテーション手法を複数組み合わせ、高精度な教師データを作成することができる、東芝情報システム独自の自動アノテーションプラットフォームを開発しました。このプラットフォームは自動アノテーションに必要となる事前学習を行っており、お客様からお預かりした少量の教師例を追加学習させることで、お客様仕様に合わせた高精度な教師データを自動作成します。
- ベンチマークで精度 (mIoU※1) 84.7 %を達成
-
以下に示す、18クラスを認識する自動運転向け教師データ作成のベンチマークを実施しました。自動アノテーションプラットフォームに、お客様からお預かりする教師例とみなした5,000枚を追加学習させ、教師データを自動作成したところ、精度(mIoU) 84.7% という高精度を実現しています。
さらなる精度の改善にも「自動アノテーションサービス」で作成する教師データをご活用いただくことで、手作業の修正量を大きく削減することができます。
ベンチマークで作成した教師データを、後述の「『自動アノテーションサービス』で作成した教師データ例」に示します。遠方の車種、重なり合った物体、植生の複雑な境界などを、高い精度で認識、識別しています。
<認識対象の18クラス>
乗用車、トラック、バイクや自転車、車道、歩行者、空、車線、歩道、縁石、ガードレール、道路標識、植生、電柱、建物、障害物、駐車場、自車、その他(認識対象では無い物) - 1日で9,600枚の教師データを作成可能
-
前述のベンチマークでは、1日 (24時間)で9,600枚の教師データが作成可能です※2。
手作業で作成した場合は、1日 (8時間)で16枚の教師データしか作成できない※3ことから、99%以上の作成時間削減を実現します。
東芝情報システムは、自動運転における画像認識など、画像のセマンティックセグメンテーションについて、質の高い大量の教師データを必要とするお客様に「自動アノテーションサービス」を提供し、お客様のAI開発の期間短縮に貢献します。さらに、画像のセマンティックセグメンテーション以外の教師データについても「自動アノテーションサービス」を対応させ、さまざまなAI開発に携わるお客様の事業発展に貢献していきます。
※1mIoU (mean Intersection over Union) は、画像認識で活用されている精度指標の1つ。対象画像に対してセマンティックセグメンテーションが正しく行われていると、高い数値となる。
※2以下の実行環境による実測値
CPU : AMD EPYC Rome 7402 / CPU数 2個 / CPUメモリ 256GB
GPU : GeForce RTX 3090 / GPU数 1個 / GPUメモリ 24GB
※3教師データを1名の作業者による手作業で作成した場合(自社調べ)
- 「自動アノテーションサービス」の提供イメージ
-
- 「自動アノテーションサービス」で作成した教師データ例
-
自動運転を想定した車載向けベンチマークによる、セマンティックセグメンテーション例※4
※4教師対象データとして、A2D2(Audi Autonomous Driving Dataset)を使用。
- 東芝情報システム株式会社について
-
東芝グループの一員として、組込みソフトウェア開発とLSI設計の分野で、お客様のニーズに最適なソリューションを提供しています。
- 東芝情報システム株式会社のエンベデッドシステムソリューション事業について
-
組込みソフトウェア分野において長年培ってきた豊富な経験と実績をベースに、アプリケーション領域からプラットフォーム領域までの幅広い開発と、多彩なIP商品やサービスを提供し、お客様の製品開発をトータルにサポートします。
- 関連サイト
-
「自動アノテーションサービス」の紹介ページ
- 報道関係からのお問い合わせ先
-
東芝情報システム株式会社 経営企画部 広報・広告担当
電話番号:080-9466-7524
- お客様からのお問い合わせ先
-
東芝情報システム株式会社 エンベデッドソリューション事業部 営業第一部
電話番号:044-246-8320
※本ニュースリリースに記載されている会社名、製品名は、各社の商標、または、登録商標として使用している場合があります。