画像認識AIサービスの「顔認識」性能を比較 Google「Cloud Vision API」やMicrosoft「Face API」など6サービスの特徴を分析

人工知能に特化したWebメディア「Ledge.ai」にて、画像認識AIの顔認識における性能検証実験が行われています。実験に使用されたのは、次の6つの画像認識AIです。

Clarifai: アメリカのスタートアップ企業、Clarifaiが提供するAPI。静止画だけでなく動画の解析を行うことができるだけでなく、物体のクラス分類やポートレート写真としての評価など多機能です。
IBM Watson Visual Recognition API: IBMが提供するAPI。GUI上で自前データを用いて、オリジナルの画像認識AIを作成できます。
Microsoft Face API: Microsoftが提供するAPI。2つの画像の類似度を解析したり、これを応用して似た顔の検索やグルーピングなどが可能です。
Google Cloud Vision API: Googleが提供するAPI。検索エンジンを運用する企業ならではの、似た画像をWebから探してくるといった機能があります。
Amazon Rekognition: Amazonが提供するAPI。静止画に加え動画でも顔認識が可能で、認識した顔を動画内で追跡することもできます。
Face Detect API: 中国のユニコーン企業、Megviiが提供するAPI。そもそも中国は、「監視社会」と呼ばれており、画像認識・コンピュータービジョン分野では世界的にみても先進国です。顔認識APIの主な機能として、「顔を見つけ出す」顔検出機能と「顔から欲しい情報を読み取る」顔認識機能があります。

今回の実験では、画像内に複数人いる場合の顔検出数によって「顔を見つけ出す」機能を、一人の顔の解析で抽出された情報によって「顔から欲しい情報を読み取る」機能を検証しています。

顔検出機能の検証では、一番多く顔を検出できたのが「Amazon Rekognition」、その次に「Face Detect API」でした。

一方で、「Watson Visual Recognition API」は画像の端に写っている顔を検出することができたり、「Cloud Vision API」や「Amazon Rekognition」は顔のパーツまで推定したりと、独自の機能が特徴的なAPIもあります。

顔認識機能の検証では、「Watson Visual Recognition API」が画像に写った人物の年齢をもっとも誤差なく解析できました。

メガネの有無については「Face API」が一番正確に解析できています。また、「Face Detect API」は人物の外形をマスクとして検出する機能があり、人物画像の加工でおおいに活用できそうです。

これらの結果から、各々のAPIで得意分野があり、すべての情報を高い精度で返すのは難しいということがわかります。

そのためAIの活用においては、課題に合わせたモデルやネットワークの構築が非常に重要と言えるでしょう。

また記事の中では、「重要な認識として押さえておきたいのは、“AI”とは大量のデータから特徴を学習して近似解を導き出すものであること。」と語られています。

つまり、精度が上がらないからといって諦めるのではなく、繰り返し学習させていくことが、AIの活用に不可欠と言えます。

なお、APIbankでも同じ写真を使って画像認識APIを比較しています。
顔認識だけでなく画像にうつっているものの分析を比較したものになりますが、検証をしてみた画像では「Google Cloud Vision」が合っていたのだろう、と思われる結果となりました。

RECOMMENDこちらの記事も人気です。