アノテーション自動化ツールで高精度な教師データを短期間で大量に自動作成

AI開発における機械学習は、質の高い教師データを大量に用意することが求められます。
「大量の教師データが必要だけどリソースが不足している」「安く効率的に教師データを作りたい」「PoC検証を加速させたい」
東芝情報システムの自動アノテーションサービスは独自のAI技術を用いて、このようなお客様のニーズにお応えします。画像アノテーションにおいて、短時間かつコストを抑えたデータの提供が可能となり、お客様のAI開発に要する期間短縮と効率化に貢献します。
AI開発におけるアノテーション
アノテーションとは?
アノテーション(annotation)は英語で「注釈」という意味で、語句に補足的な説明を加えることです。
AI開発におけるアノテーションとは、AIに学習させたいデータに意味付け(タグ/ラベル付け)を行い、正解データを作成する作業のことをいいます。AIモデルが学習するための基礎データとなり、モデルに正しく機械学習させるために必要不可欠な工程です。アノテーションの質はそのAIモデルの性能をも左右する、重要な作業となります。
アノテーションを自動化するメリット
メリット1 コストの削減

大量の教師データを作成するには、多くの人手を必要とします。自動化することにより、手作業にかかっていた人件費が削減できます。取り扱うデータ量が多いほどコストの削減効果は高くなります。
メリット2 AI開発の効率化

教師データ作成を自動化することで、短期間で品質にバラツキのない大量の学習データを用意することができ、結果的にAI開発の効率化に貢献します。
アノテーションについて、このようなお悩みありませんか?
品質にバラツキが発生
手作業によるアノテーションだと類似のシーンであっても品質にバラツキが発生してしまう。
作成量が膨大
AIモデルの性能を上げるため、大量の学習データが必要になっている。
時間がかかりすぎる
アノテーションに時間がかかってしまい、AIモデルの開発に十分な時間を確保できない。
自動アノテーションサービスでお客様のお悩みを解決!
自動アノテーションサービスは、お客様の教示仕様に基づいた少量の学習データセットと教師対象画像データをお預りして、東芝情報システム独自のAI技術を用いたツールを使い、画像アノテーション用の高精度な教師データを短期間で大量に提供するエンジニアリングサービスです。

自動アノテーションツール・サービスの3つの特長
1.当社独自のAIモデルを構築し、自動アノテーションツールを開発
- 当社独自のAI自動アノテーションツールを開発
- 教示仕様に基づいた少量の学習データセットを追加学習することで、高精度な教師データを自動作成

2.セマンティックセグメンテーションとバウンディングボックスをサポート
- 手作業では、非常に時間を要するセマンティックセグメンテーションを自動化
- さまざまな用途、シーンで活用されるバウンディングボックスを自動化

3.自動で作成した教師データは、世界最高水準の精度と生産性
- 自動で作成した教師データは世界最高水準の高精度を実現
mIoU:85.2%(※1)、mAP:53%(※2) - 24時間で15,000枚程度の教師データを自動作成。手作業と比較し、99.8%の時間を短縮
(※1)セマンティックセグメンテーションの平均精度(mIoU):85.2%
(※2)バウンディングボックスの平均精度(mAP):53.0%

高精度な教師データを自動作成「自動アノテーションサービス」紹介動画
東芝情報システム「自動アノテーションサービス」の強み
複数の分野で培ってきたAI開発経験による高度な技術力
車載、デジタル家電、FA、医療等の分野で培ってきた画像圧縮・復号、グラフィック、物体検知、距離計測等の高度な画像処理・画像認識技術を保有しています。
高度な画像処理・画像認識、AI技術を導入したIPソフトウェアの販売、サポート実績
東芝製画像処理LSI(Visconti)、NVIDIA等で動作可能な画像認識ミドルウェアや単眼カメラ距離計測ライブラリ等のIPソフトウェアの販売、サポート実績があります。
アノテーションだけではない、画像AI開発全体もサポート
車載LSI開発を通して得た豊富な経験と知見から、画像AI開発において教師データ作成以外の工程も対応することが可能です。
例えば、AIモデルの選定、開発、チューニング、訓練したモデルの性能改善など、画像AI開発プロセス全体でのお客様のお困りごともサポートします。お気軽にご相談ください。

実績のご紹介 ~アノテーションサービス会社への自動アノテーションツールの提供
2023年11月、当社は、AI(Artificial Intelligence)の機械学習に使用する教師データ作成のアノテーションサービスにおいて、TTピーエム株式会社との協業を発表しました。このサービスでは、AIの質を決める高品質な教師データを短時間で大量に作成できる自動アノテーションツールを提供しています。

関連ニュースリリース:AIアノテーションサービスで協業
関連リンク: TTピーエム アノテーションサービス Webサイト
自動アノテーションサービスの利用シーン
車載(自動運転等)

車載向けの路面認識にセグメンテーションで対応
セキュリティ

監視カメラ人物検知向けにバウンディングボックスで対応
医療

病理画像の細胞認識にセグメンテーションで対応
サービス提供イメージ

お客様の教示仕様に基づいた学習データセットと教師対象画像データをお預かりして、手作業では困難な高精度な教師データを独自のAI技術を活用した自動アノテーションツールを使用し短期間で大量に作成します。
自動アノテーションサービスで作成した教師データ例
セマンティックセグメンテーション
自動運転を想定した車載向けベンチマークによる、セマンティックセグメンテーション例です。一般的に難しいとされる、遠方の車種、重なり合った物体、植生の複雑な境界などを、高い精度で認識、識別できます。
例1

例2

例3

バウンディングボックス
さまざまなシーンを想定したバウンディングボックス例です。一般的に難しいとされる、人の足元の精度、 重なり合った物体、見切れた対象物などを、高い精度で認識、識別できます。
例1

例2

例3

自動アノテーションサービス よくある質問
自動アノテーションサービスの提供形態を教えてください。
サービスの提供形態には2つのパターンがあります。詳細は、お問い合わせください。
①当社が自動アノテーションツールを使用し、作業を請負うエンジニアリングサービス
②お客様が自動アノテーションツールをライセンス導入する(オンプレミス、クラウド)
自動アノテーションツールをライセンス導入し、オンプレミスで運用するときに必要なマシン環境を教えてください。
推論実行についてはGPU搭載のマシンが必要です。セマンティックセグメンテーションはGPU(メモリ24GB以上)が1つ、バウンディングボックスはGPU(メモリ12GB以上)が1つ必要となります。
学習実行についてはセマンティックセグメンテーション、バウンディングボックス共にGPU(メモリ24GB以上)が4つを推奨しています。
赤外線画像、魚眼カメラに対しても対応は可能ですか?
赤外線画像、魚眼カメラ共に対応可能で、RGB画像同様にご使用いただけます。
自動アノテーションの対象として、インスタンスセグメンテーション等は対応可能ですか?
インスタンスセグメンテーション、パノプティックセグメンテーション、キーポイントについては、今後実装予定となります。
トライアルで使用することは可能ですか?
トライアルでご使用いただくことが可能です。詳細は、お問い合わせください。
自動アノテーションサービス お問い合わせ・資料請求
自動アノテーションサービスに関する検討用資料のご案内や、導入相談、お見積り依頼などのお問い合わせをお受けしております。

自動アノテーションサービス 詳細資料
AI開発でのアノテーション作業の課題を解決する「自動アノテーションサービス」についてご紹介した資料です。
「自動アノテーションサービス」の導入相談やお問い合わせをお受けしております。