大規模Vision and Languageモデルを用いた汎用外観検査モデル

2023年12月20日
国立大学法人東海国立大学機構 岐阜大学

世界初、2枚の画像だけで品質検査ができる汎用外観検査AIを開発 大規模Vision and Languageモデルを用いた汎用外観検査モデル

【本研究のポイント】
・少量データだけで品質検査ができる汎用外観検査AIを開発。
・画像と言語で多様な検査対象を学習したAIに検査対象を「例示」する枠組みを実現。
・外観検査AIの導入コスト、導入時間の大幅削減。
・言語と画像を理解するAIで高精度な外観検査を実現。

【概要】
 岐阜大学工学部加藤邦人教授のチームは、大規模視覚言語AIを基に、少ないデータから高度な判定を行う汎用外観検査AIを開発しました。このAIは、異なる種類の製品に対しても一つのAIで検査を行うことが可能です。本研究では、従来よりも大幅に導入コスト、導入時間を削減できるという特長を持っています。
 本研究成果は、日本時間2023年12月8日に外観検査の自動化ワークショップViEW2023で発表され、小田原賞(優秀論文賞)を受賞しました。

【研究背景・成果】
 あらゆる製品の生産現場においては、製品品質の確保と生産効率の向上が求められています。しかし、従来のAI自動検査方法では個々の製品に特化したデータが多量に必要で、AIの導入が難しい状況でした。また、AIによる外観検査では、判断根拠がわからないという説明性の問題がありました。一方、生成AIをはじめ、近年のAI技術の発展で、言語と画像を高度に理解し、広い一般知識を持ったAIが登場しました。しかし、これらは外観検査という特殊な知識は持っていませんでした。
 そこで、大量の外観検査画像とその説明文を学習したAIを開発しました。さらに、In-Context Learning技術 1)を用いて、少ない例示だけで検査対象に特化した知識を付加することに成功しました。また、大規模Vision and Languageモデル 2)を用いたことで、不良と判定した理由を言語として出力することが可能となりました。これにより、AI外観検査における説明性の問題は大きく改善されました。

【今後の展開】
 現在は、特定の検査に限って本研究の有効性が確認されています。今後はさらに大量のデータで学習し、モデルの改良による精度向上や汎用化、より複雑な例示を可能とするよう改良を行っていきます。これにより、手軽に、短時間で高精度な外観検査システムを構築できるようになります。

【画像:https://kyodonewsprwire.jp/img/202312204587-O5-BPRk3Pyd

【用語解説】
1)大規模Vision and Languageモデル:
 大規模言語モデル(自然言語認識)と画像認識モデルを持ったAI。
2)In-Context Learning (ICL):
 少数の例から学習を行い、未知のデータに対して推論を行う手法。

【論文情報】
雑誌名:ビジョン技術の実利用ワークショップ ViEW2023
論文タイトル:大規模視覚言語モデルのIn-Context Learningによる少量データからの外観検査
著者:山田 悠正,尾下 拓未,中塚 俊介,加藤 邦人,上野 詩翔(岐阜大),相澤 宏旭(広島大),林 良和(岐阜大)

【研究者プロフィール】
1996 年中京大学大学院情報科学研究科修士課程修了.
同年,同院博士課程入学.
現在,岐阜大学工学部教授.
博士(情報・認知科学).
2011 年メリーランド大学コンピュータビジョンラボラトリFaculty Staff.
画像処理,コンピュータビジョン,特に深層学習とその応用の研究に従事.
岐阜大学高等研究院人工知能研究推進センターセンター長

情報提供元: PRワイヤー
記事名:「 世界初、2枚の画像だけで品質検査ができる汎用外観検査AIを開発