いざ技と知の金脈へ!
次世代テクノロジーを求むイノベーター向けメディア

今まで実現困難だったAIモデルを"脳波で"構築!

今まで実現困難だったAIモデルを

 業務へのAIモデルの導入を検討していたけれど、「形状のバラつきが大きく、安定したアノテーションが困難...」「人によって判断の基準が違い、基準を作るのが難しい...」「AIモデルの精度が上がらない...」といった理由で諦めたことはありませんか? 

 こうした問題は、"脳波"を使って曖昧な判断を形式化し、より精度の高いAIモデルを構築することで解決できます。本記事では「脳波を使ったAIモデルの構築」について、実際のユースケースも踏まえた今後の技術展望などをご紹介します。

:本記事は、20231112月開催の「MET2023」の講演を基に制作したものです。

【講演者】

AI-06_01.png

製造業におけるAI市場の動向 & 外観検査AI開発の流れと現状の課題

 今回は「脳波を活用したAIモデル構築と現場での実装・運用」と題し、検査工程におけるエキスパートのノウハウにAIと脳波を融合するという、非常にユニークな技術をご紹介します。

 本題に入る前に、市場規模を把握しておきましょう。富士キメラ総研社の調べによれば、2027年度の国内全体におけるAIビジネス市場は、約2兆円になると言われています。また、産業別のAI導入実績を見ると、2023年までは融資の判断や取引監視のために活用していた金融業が最多でした。しかし、2024年度からは製造業が市場をけん引していくと予測されており、特に機器検査AIや外観検査AIといった、生産工程支援における投資の加速が見込まれています。今回はこのうち、外観検査に焦点を当ててお話します。

 外観検査を利用するケースには、出荷前の傷の検査・部品の配置チェック・製造の状態に応じた等級分けなどがあり、これらの画像データを機械学習しながらAIモデルを作るのが主流です。しかし、AIの開発過程には「データのラベリングが大変で、学習後のモデル精度がなかなか上がらない」「モデルの更新が手間」など、さまざまな苦労が待ち受けており、一筋縄ではいきません。

AI-06_02.png


 外観検査AIモデルの構築は、図のような流れで進むのが一般的です。

AI-06_03.png


 最初のステップは、タスクに応じて数百枚から数万枚という膨大な画像データの収集から始まります。そして、次のアノテーションのステップで、その画像11枚を人力でラベリングします。

 モデルの学習検証を行うステップでは、データの種類に合わせて最適なモデルの選定を行います。ただし、ここでモデルが決まっても、一連の作業を一度で完結できるとは限りません。それどころか、多くのケースでは再学習のための追加データ取得や、ラベルの修正が必要となります。

 さらに、学習が成功して実装運用のフェーズに移っても、絶えず性能を維持するためにモデルをモニタリングする必要があります。また、ラインの環境が変わったり材料や製品そのものが変化したりすると、それに合わせた微調整が求められ、追加のデータ取得も行わなければなりません。

 長期的なAIモデルの維持には、収集データの質に対するこだわりと、未来のデータも継続して取得する意識や仕組みの構築が不可欠です。そのため、昨今ではモデルセントリックな考え方よりも、データセントリックな考え方を重視する動きもあります。

AI-06_04.png


 事実、人工知能の権威であるAndrew Ng氏は、「モデルセントリックなアプローチよりもデータセントリックなアプローチの方が、さまざまなシーンにおいて精度が高い」という研究データを発表しています。具体的には、画像分類を行う基本的なモデルベースラインに対し、「モデルを変更して再学習したとき」と、「モデルは固定でデータの質を高めて再学習したとき」の精度の違いを比較した結果、後者の方が最大16.9%も精度が向上したそうです。

 では、どうすれば質の高いデータを担保しつつ、高い精度のモデルを維持できるのでしょうか。そのカギとなるのが、近年注目を集めている人間参加型のAI開発です。海外で「Human-In-The-Loop」と呼ばれるこの取り組みは、AIの判定精度を高めることを目的に、人間がAIに正しい答えを教えてあげることが特徴です。

AI-06_05.png


 Human-In-The-Loopでは、作ったAIモデルから出力された結果が適切かどうかを見るスキームが発生します。これは、従来のAIモデル作成には流れにはなかった点です。このとき、AIの判定結果が正解であればそのままで問題ありませんが、間違っている場合は人間がその結果に対し、チェック・アノテーション・フィードバックを行います。

 「アクティブラーニング」と呼ばれるこの手法は、人間がテスト勉強をする際、過去に間違えた問題や知らない問題に優先的に取り込む構図と似ており、AIの迅速かつ効果的な再学習を可能にします。効率よく成績を上げるために、苦手分野の対策を繰り返すという観点では人間もAIも同様であり、アクティブラーニングのループを絶え間なく回すことで、より高精度で持続可能なモデル運用が実現するのです。そして、このスキームの活用は、冒頭に挙げたいくつかの課題解決につながります。

脳波を活用したAIモデルの構築とは

 Human-In-The-Loopを効率よく回すためのポイントは、脳波です。では、そもそも脳波とは何なのでしょうか。

AI-06_06.png

▲セッションでは、ここでデモ動画を使った説明が行われました。


 こちらはヨーロッパの空港で行われている、手荷物検査場での脳波AI活用の様子です。彼は脳波を測定するデバイスを頭にかぶり、マウスやキーボードの操作はせずに、目の前に表示される荷物の画像を見て「危険」または「安全」と頭の中で分類しています。実際の画面では、システムが彼の脳波を学習・分析しながら、彼が危険と判断した画像が抽出される仕組みになっています。

 このように目視で行う検査は個人の判断基準に頼らざるを得ず、結果にバラつきが生じます。また、その判断基準も言語化は難しいものですが、これを脳波で表現すれば、波形による違いで特徴を捉えることができます。下の図は、画像を見た人間が、脳の視覚野で視覚情報を処理するときの脳波反応を示したものです。

AI-06_07.png


 先ほどのケースでは、安全な荷物を「ノンターゲット画像」、危険な荷物を「ターゲット画像」と分類していました。結果、前者の画像を見ているときは青い線のように一定の振幅の脳波反応が出ているのに対し、後者の場合では赤い線のように非常に特徴のある振幅が出ていることが分かります。

 このように脳波を活用したアノテーションは、赤い線のような脳波反応が出ていたときの画像がターゲット画像であると断定します。そして、それを教師データとしてディープラーニングで学習させることで、最終的には自動で荷物を分類できるAIモデルを構築します。

AI-06_08.png


 図の左にあるのは、先ほどの検査官が危険と判断した画像群です。これら11枚に対し、どの程度危険だと感じたのかを示す「エキスパト確信度」を脳波から判断し、ソフトラベル を付与できるのは、脳波を使った取り組みの非常にユニークなポイントです。また、ソフトラベルのスコアが高いものはニューラルネットワークの中で重み付けを強くしたり、確信度が半端なものは対象者が迷った画像ということで、重みを下げて学習への影響度を下げたりできます。

 こうしてエキスパートの感覚に近いかたちで学習させた脳波AIモデルは、彼らのもつ感覚に近い判断基準をもちあわせます。さらに、課題になりがちなモデルの更新も脳波システムを活用すれば、効率よく質のよいデータを集めながら行えます。

AI-06_09.png


 この画像は、奥に座っている3人のエキスパートがAIモデルが出力したスコアの低い画像結果に対し、脳波を使ったアノテーションを行っているところです。このとき、検査官同士で結果が一致しなかったグレーゾーンの画像は青いシャツを着た監督感に送られ、彼が主導でPCを操作して最終的な分類を行います。Human-In-The-LoopのなかでAIを活用することで、非常に効率よく精度の高いAIモデルを作れるというわけです。

AI学習に脳波を活用するメリット -ソフトラベル-

 学習の浅い段階のAIは、人間のように高い精度でモノを見分けることができず、柔軟性もありません。これを解決するにはさまざまな例外を学習させる必要があり、そのカギとなるのがソフトラベルです。

AI-06_10.png

 たとえばこの3枚の画像は、いずれもAIモデルが「この画像は花である」と判定したものです。一番左はハイビスカスで正解ですが、真ん中や右は、本当に花と判定されるべきでしょうか。おそらく人間であれば、左から順に、ハイビスカス・チョウチョ・女の子というふうに何の疑いもなく分類するでしょう。このような状態のモデルに花を正しく判断させるため、これらの画像をそれぞれ同じ重み付けで等しく学習させるべきかといえば、そうではないと思います。

 この場合、「真ん中と右の画像がどうして花と判断すべきではないのか」「人間は各画像をどの程度の確信度で花と判断するのか」という、人間の感覚的な部分を定量的にAIモデルにフィードバックして返してあげることが必要です。具体的には、ハイビスカスは確信度が高く、真ん中と右の画像については確信度が低いという情報を与えてあげることで、AIは文脈上の例外を学習できます。よい塩梅で人間の曖昧さを学習させることで、AIが人に近い判断を下せるようになる。これがソフトラベルの価値の本質です。

 もう1つ例を挙げます。下のトマトの画像では、「左側が赤くて甘そうであり、右側が青くて渋そう」というのは皆さんも一目瞭然かと思います。また、仮に「甘そう(1)」か「渋そう(0)」の二択しかない場合、左から4つの黄色い枠で囲われたものは「甘い」、同様に右から3つのものは「渋そう」と判断する方が多いはずです。しかし、中間の「?」が書かれたものは、一体どちらに振り分けるべきでしょうか。

AI-06_11.PNG


 ソフトラベルは確信度をベースに、こうした人間の曖昧さを定量化し、微妙な違いを表現できます。さらに、AIが判定した結果に対し、複数人の感覚をAIモデルにフィードバックすることも可能です。

AI-06_12.PNG


 たとえば、AIがトマトの甘さのスコアを0.88と出力したとします。しかし、同じ画像を4人のエキスパートに見せた結果、バラバラな回答になることは容易に想像できます。そのため、バラつきの平均化や、もっとも信頼のおけるエキスパートのスコアを採用するなどの対応が必要です。そして、それを数値化することでAIに定量的なフィードバックを行えば、AIがより人間の感覚に近い判断ができるようになるというわけです。

AI-06_13.png


 ソフトラベルには、AIモデルの精度と安定性を向上させる効果もあります。事実、精度に関しては、脳波のソフトラベルありのほうが、なしに比べて高いという結果が出ています。

 安定性も同様です。下の表は、脳波なしと脳波ありのモデルをそれぞれ5個ずつ作り、5回ずつクロスバリデーション(交差検証)の評価をした結果です。髭線の一番下、底の部分が最小値で、一番上の部分が最大値となりますが、脳波ありのモデルの方が最大値と最小値の差が小さくなっています。つまり、モデルの判定結果のバラつきが少なく、安定していたということです。

AI-06_14.png


 このようなことが起こる理由は、ソフトラベルが過学習の予防となる「正則化手法」として機能するからです。過学習が生じると、訓練用のデータに寄り過ぎて未知のデータにうまく対応できなくなります。しかし、ソフトラベルを活用すればマニュアルのアノテーションに比べてスコアがソフトに分布するため、そうした事態が起きづらくなるのです。

AI-06_15.png


 また、画像の学習枚数を短縮できることもメリットです。下の図には、マニュアルアノテーションによる学習と、脳波のソフトラベルを活用した学習をそれぞれ行った際、AIが一定の精度に達するまでに要した画像の枚数を示しました。結果、前者はAUC0.90の精度を達成するまでに100枚の画像を要したのに対し、後者はわずか35枚で済みました。つまり、脳波のソフトラベルを活用した学習の方が効率がよく、それにともなう開発コストの削減が見込めるということです。

AI-06_16.png

ユースケース

 ここでは、脳波AIを活用した画像分類のユースケースをご紹介します。

空港の手荷物検査では、担当者の負担軽減や見逃し防止、AIの再学習にかかる工数削減などの効果がありました。

AI-06_17.png


 こちらは、ある電子部品機器メーカー様との取り組みです。こちらは精密機器の洗浄プロセスでベテランが仕上がりの良さを判断するという工程があり、脳波によって良い仕上がりのモデルを作るというプロジェクトを実施しました。製品の品質維持はもちろん、洗浄液の削減という環境保護におけるメリットも得ることができました。

AI-06_18.png


 ブラジルで農業を営む、Embrapa社と実施したプロジェクトもあります。彼らは葉っぱの見た目から病気予測をするAIアプリを、開発していたのですが、その精度が一定のところで頭打ちしてしまい、追加データを数万枚アノテーションして再学習させることに非常に頭を悩ませていました。そこに脳波AIを提案したことで、彼らは効率的に質の良い学習データを集めながら、高い精度のAIモデルを作ることに成功しました。

AI-06_19.png


 下記は、都内の病院と進めた医療関係のPoCです。この病院では放射線診断医という、CTX線を扱うお医者様が常に忙しく、普段の診療でラベリングできてない画像が数十億枚にのぼっていました。これを効率よくアノテーションするための手法として、脳波を使っていただきました。

AI-06_20.png


 最後は、鉄鋼メーカー様のユースケースです。こちらでは、ベテランの方が実施していた原料の品質検査を効率化すべく脳波AIを使ったところ、検査の自動化と1ヶ月あたりの検査件数の向上が実現しました。

AI-06_21.png


まとめ

 今回は脳波AIの技術的な仕組みやユースケースについてお話してきました。最後に、脳波AIを活用する3つのメリットをおさらいします。

 1つ目は、 曖昧な画像も確信度スコアを用いて精密にラベリングできるので、結果的に教師ラベルの質が向上するという点。2つ目は、過学習を予防するソフトラベル効果により、モデルの精度と安定性、向上を実現できる点。3つ目は、Human-In-The-Loopにおける能動学習で、脳波の仕組みを使うことで、非常に効率的にモデルの追加学習・更新ができる点です。

 こうした脳波AIの技術をご自身の業務の中で使えそうなシーンがあれば、ぜひお問い合わせいただければと思っております。ありがとうございました。