タクミノメ

画像認識PoCを短期間で行いたい

画像認識AI構築のPoC(概念実証)フェーズを、約1ヶ月でご支援いたします。

画像認識PoCフェーズご支援3つの特長

豊富なノウハウと実績で確立されたALBERTの画像認識技術により、約1ヶ月でPoC(概念実証)フェーズをご支援します。経験豊富なデータサイエンティストがアルゴリズムを構築し、精度評価の報告会を実施、精度評価レポートとアルゴリズムのファイルをご納品します。

豊富なアルゴリズム

主要なネットワーク(*1)全14種類の中から、利用企業様のデータにフィットする最適なネットワークを選定。

  • *1 ディープニューラルネットのネットワーク構造のことであり、画像分類ではAlexNet, VGG, SqueezeNet, ResNet, DarkNet等8種類、物体検出はYOLOv2、YOLOv3、RetinaNetの3種類、セグメンテーションはGCNを3種類実装しています。

経験豊富なアナリストがサポート

データが十分にない場合のデータ拡張(*2)や、識別性能に大きな影響を与えるハイパーパラメータ(*3)の設定は経験豊富なALBERTのデータサイエンティストが実施。

  • *2 学習データを増幅させる技術であり、画像の平行移動、回転、上下左右反転などを行ないアルゴリズムの汎用性を向上させます。
  • *3 アルゴリズムの学習時に設定するバッチサイズ、学習率などのパラメータのこと。

注視領域の可視化により
ブラックボックス化を回避

AIアルゴリズムが画像中のどの部分を見て識別しているのかを可視化(*4)。従来ブラックボックスと言われていたディープラーニングの識別基準を直感的に把握。

  • *4 現在、画像分類・物体検出・マルチラベル分類で対応可能です。

画像認識PoCフェーズご支援提供サービス

画像認識に必要とされる主要な4つのタスク、画像分類物体検出領域検出マルチラベル分類を提供します。

画像分類Classification

「画像の主要な被写体が
何であるのか」を識別。

物体検出Detection

「画像のどこに何があるのか」を
矩形として検出し、識別。

領域検出Segmentation

「画像のどこに何があるのか」を
ピクセル単位で識別。

マルチラベル分類Multi Label Classification

「1枚の画像に対して複数の被写体が
何であるか」を識別しラベル付け。

人の「目」による判断工程を、AI技術を活用した画像認識に代替することで、扱う情報量を増加、判断の質も向上させます。また、有スキル者の高齢化に伴う人手不足やスキル継承などの課題を解決します。

画像認識PoCフェーズご支援ご支援の流れ

豊富なノウハウを詰め込んだALBERTの画像認識技術でご支援します。PoCフェーズでは、データをご提供いただいてからわずか1ヶ月でレポートとアルゴリズムのファイルを納品

※アルゴリズムのファイルは、データサイエンティストが最も精度が高いと判定したアルゴリズムについて、社内でのデモンストレーション等にご活用いただける形式でご納品いたします。

チューニング・システム化までご希望の場合はこちら

ご準備いただく教師データ詳細
タスクの種類 画像データ メタデータ アルゴリズム構築に必要な条件
画像分類
  • ・画像ファイル
    (jpeg形式推奨)
  • ・画像ファイル名とクラス名が対応づけられたcsvファイル
  • ・1クラスにつき数百枚以上。
  • ・対象オブジェクトを目視で判断できる程度の解像度。
  • ・対象オブジェクトが画像中心部にある。
物体検出
  • ・画像ファイル
    (jpeg形式推奨)
  • ・各矩形のクラス名、左上のX座標、左上のY座標、幅、高さが記録されたcsv形式の矩形情報ファイル
  • ・画像ファイル名と矩形情報ファイル名が対応づけられたcsvファイル
  • ・1クラスにつき数百枚以上。
  • ・対象オブジェクトを目視で判断できる程度の解像度。
領域検出
  • ・画像ファイル
    (jpeg形式推奨)
  • ・各クラスに整数値を対応させたグレースケールの領域情報ファイル(png形式推奨)
  • ・画像ファイル名と領域情報ファイル名が対応づけられたcsvファイル
  • ・領域情報ファイルの整数値とクラス名が対応づけられたcsvファイル
  • ・1クラスにつき数百枚以上。
  • ・対象オブジェクトを目視で判断できる程度の解像度。
マルチラベル分類
  • ・画像ファイル
    (jpeg形式推奨)
  • ・画像ファイル名とラベル名が対応づけられたcsvファイル
  • ・1ラベルにつき数百枚以上。
  • ・対象オブジェクトを目視で判断できる程度の解像度。

※上記以外のデータ形式の場合でもご相談可能です。お気軽にお問い合わせください。

納品レポートイメージ

画像分類Classification

画像分類を行なった際に提供するアウトプットイメージです。

正誤例

評価用画像に学習済みアルゴリズムを当てはめ、分類の正誤例を表示します。具体的事例を確認できるので、どのような画像は識別しやすく、どのような画像は識別しにくいかが直感的に把握できます。

注視領域

識別アルゴリズムが画像中のどの部分を見て識別しているかを可視化します。この可視化技術により、従来ブラックボックスと言われていたディープラーニングの識別基準を直感的に把握できます。

混同行列

混同行列とは予測クラスと正解クラスのクロス表です。アルゴリズムの識別性能を評価するために便利であり、”○○クラス”と予測したもののうち本当にそのクラスであった割合はどのくらいか、あるいは別のクラスであった割合はどのくらいかがわかります。

ROC曲線/AUC

ROC*1とは各クラスに対する識別性能を評価するための曲線であり、その形状が左上に膨らむほど識別性能が高いことを表します。ROC下の面積はAUC*2と呼ばれており、識別性能を評価する指標です。AUCは0から1までの値をとり、値が1に近いほど識別性能が高いと言えます。

  • *1 ROC(Receiver Operating Characteristic;受信者動作特性)
  • *2 AUC(Area Under the Curve)

物体検出Detection

物体検出を行なった際に提供するアウトプットイメージです。

物体検出例

評価用画像に学習済みアルゴリズムを当てはめ、物体検出の結果を矩形で表示すると同時に、クラス分類の結果もラベル表示します。具体的事例を確認できるので、どのような画像は識別しやすく、どのような画像は識別しにくいかが直感的に把握できます。

注視領域

識別アルゴリズムが画像中のどの部分を見て識別しているかを可視化します。この可視化技術により、従来ブラックボックスと言われていたディープラーニングの識別基準を直感的に把握できます。

精度判定

IoU*が一定値以上の領域を対象にprecisionとrecallを評価します。precisionは「 “○○クラス”と予測したもののうち実際にそのクラスであった割合」であり、recallは「実際に”○○クラス”であったもののうち、そのクラスであると予測できたものの割合」です。precisionとrecallともに0から1までの値をとり、値が1に近いほど識別性能が高いと言えます。

  • *  IoU(Intersection Over Union)

領域検出Segmentation

領域検出を行なった際に提供するアウトプットイメージです。

領域検出例

評価用画像に学習済みアルゴリズムを当てはめ、セグメンテーション結果を表示します。具体的事例を確認できるので、どのような画像は識別しやすく、どのような画像は識別しにくいかが直感的に把握できます。

識別性能評価

IoUとは正解領域と予測領域の重なり具合を表す指標であり、アルゴリズムの識別性能の評価に用いられます。IoUは0から1までの値をとり、値が1に近いほど識別性能が高いと言えます。

マルチラベル分類Multi Label Classification

マルチラベル分類を行なった際に提供するアウトプットイメージです。

注視領域ラベル識別例

識別アルゴリズムが画像中のどの部分を見てラベルを識別しているかを可視化します。この可視化技術により、従来ブラックボックスと言われていたディープラーニングの識別基準を直感的に把握できます。

画像認識PoCフェーズご支援料金

ご利用企業様のご要望・活用シーンに合わせてPoCフェーズをご支援いたします。

¥2,000,0001タスク

※画像分類、物体検出、領域検出、マルチラベル分類の各タスクから選択いただきます。