Microsoftの「Computer Vision API」を利用すれば、写真の中身を認識、テキスト化し、これをファイル名として置換するという工程を自動処理できるそうです。Ledge.aiでは、この方法が紹介されています。
Microsoft AzureのComputer Vision APIが、他の画像認識AIと異なるのは文章作成機能をもっている点。
一般の画像認識AIでは、花が映っている写真を解析すると、「花」という単語と花である確率が出力されますが、Computer Vision APIでは「緑の葉を持つ赤い花」という文章を生成することが出来ます。(ただし、現在はまだ日本語には対応していないとのこと。翻訳APIなどを組み合わせることで日本語にも対応できる可能性があります。)
紹介されている事例では、画像の中でメインとなる被写体のみならず写っているものすべてを認識するだけでなく、人物の服装(スーツやネクタイなど)も認識できています。
一方、提灯などといった、文化的な画像、抽象的な画像は固有名称を認識するのは難しいようです。
この方法は、画像のファイル名変更をはじめalt属性の自動入力など、Webクリエイターの作業効率アップに大きな恩恵をもたらしてくれそうです。
今回は画像の解析結果からファイル名をAIが付ける、という作業でMicrosoftのComputer Vision APIを活用しましたが、使い道はいくらでもありますよね。
ちょっと考えてみるだけでも
・生成された文章で状況がわかるので、監視カメラに
・HTMLのalt属性を自動で入れて、目が見えない人へのアクセシビリティ対策
・身近なところでいえば、SNSに投稿する写真の「無題」を無くす
というように、今までは人間が時間をかけておこなっていた作業を、システムで代替できることはたくさんあると思います。
手作業30分がAIでたったの6分に。写真管理をMicrosoftの画像認識AIで自動化したらすごかった | Ledge.ai(レッジ)