いざ技と知の金脈へ!
次世代テクノロジーを求むイノベーター向けメディア

"AI内製化の罠"増え続ける「野良AI」ってなんだ!? 問題点と解決策を徹底解説!

大企業を中心に内製化トレンドが進んでいますが、内製化の中心となるDX推進組織と業務に実装する際の現場ユーザーとの間にギャップが生まれ、せっかく実装したAIが放置されてしまい、結果として"野良AI"となるケースが散見されます。そんな野良AIを撲滅し、価値を創出しつけるAI運用の勘所について考えていきます。

目次

現場展開が進むなかで顕在化した課題"野良AI"

社内のメンバーをAI人材として育成するなど、大企業を中心に内製化トレンドが進んでおり、メディアにもAI人材の育成に注力している企業の話題がよく取り上げられています。その意味では、AI開発やAIプロジェクトをドライブすることができる人材は確実に増えてきていることでしょう。しかし、現場に実装した後にユーザーが使いこなせず、結局AIが放置されてしまっているケースが後を絶ちません。精度が低下しながらもメンテナンスされずに放置されているAIを、マクニカでは"野良AI"と位置付けています。

ai-20221221_01.png

これまでPoC倒れなどAIで成果を出していくのが難しいと言われてきましたが、AIで成果が得られた企業が増えているなか、社内横断的なDX推進組織が中心となり、事業部門である現場ユーザーへのAI実装が進んでいます。ある意味では、現場でのAI活用フェーズが変わってきていると言えるでしょう。そんな現場展開のなかで顕在化してきた先進的な課題の1つが野良AIです。

野良AI繁殖の背景

では、なぜ野良AIが発生するのでしょうか。実際に多くのプロジェクトを見ていると、ここ数年の間に立ち上がったDX推進組織には、DXをドライブする中枢的な役割を担う人材や環境が広がってきています。ただし、実際にAIを実装して価値を創出する現場とのギャップは、かなり大きくなっているケースがよく見られます。
DX推進組織は、AIに対するリテラシが向上しており、かつAutoMLのような簡単にAIが使えるツールが充実してきています。そのため、現場の課題さえ見つかれば、シンプルにAIを開発して実装していけるような状況にあるのは間違いありません。

一方で日々の業務に追われる現場では、AIを十分に理解したうえで実装することが難しく、分かったとしても日々の運用や精度低下後のメンテナンスをどうしていけばいいのかについては知見を持っていないことも多くあります。精度が落ちてきたAIを再学習させてアップデートさせようにも、現場と兼務のメンバーが多いDX推進組織の場合、日々の業務に忙殺されており、迅速な支援が滞ってしまうことも少なくないのです。メンテナンスがオペレーション内に落とし込めないことで、結果としてAIが放置されてしまうという事態がよく発生しているのです。

ai-20221221_02.png

野良AI繁殖の理由と注目したい運用領域

前述した通り、DX推進組織と現場ユーザーの間には大きなギャップが存在しています。具体的は、組織や人財、開発・検証、運用のそれぞれの段階に分けて考えていくことができます。

ai-20221221_03.png

組織の面では、きちんとナレッジを蓄積するために中央集権的な体制で現場への実装に向けたフェーズに移行しつつあるDX推進組織に対して、現場ユーザーは今のやり方が変わることに反発する動きが出てきやすいものです。人財面では、PMやITアーキテクト、データサイエンティストなど多様性のある人財を集めてきたDX推進組織とは異なり、現場ユーザー側にはDXリテラシと開発スキルがともに不足しているというのが現実でしょう。開発・検証の段階でも、従来のように完璧なシステムではなく、運用のなかで常にシステムを成長させ続けるアプローチでないと現場への実装は進まないことを理解しているDX推進組織に対して、現場ユーザー側では誤判定が起きたときのリスクの不安を訴えがちです。

この3つの観点については、新たな価値創造に対してDX組織側と現場側で合意形成しながら、一緒に手を取り合って互いに成長していける関係性が醸成されてきている企業も少なくありません。

一方で運用については、経営から現場までをシームレスにつなぐ統合基盤が不可欠で、日々変化するインプットデータによってAIの精度が落ちていくなか、モデルをアップデートさせていく仕組みが必要だとDX推進組織は見ています。ルールについても、今の業務フローであるAs-Isと自動化されることで生まれる価値となるTo-Beの業務フローだけでなく、運用段階に必要なメンテナンスも考慮した管理ルールや運用設計が求められます。これらのことに気づいているDX推進組織が増えていることは間違いありません。

 しかし、運用に関する現場の認識は、データを見ることのメリットがなかなか浸透せず、AIの精度が落ちてきた段階でDX推進組織に再学習の依頼をかけたものの、多忙でタイムリーにアップデートされないとことに対する不満、そして、メンテナンスフローが言語化されてないことで、To-Beの効果が得にくいのではと不安に感じているのです。

AI導入後に必要な管理とは

このようなDX推進組織と現場のギャップを埋めていかない限り、せっかく実装を進めてきたAIが野良化してしまう、つまりは管理されていない状態に陥ってしまうのです。そこで、紹介してきたギャップのなかでも、比較的迅速に対策が打ちやすい、運用における「AI」「ルール」に着目し、モデルをアップデートさせていくためにはどんな基盤が必要でどうルール作りを行っていけばいいのかといった観点を紐解きながら、野良化させないAIの管理について考えていきます。

そもそも野良AIが繁殖してしまうのは、管理されていないことが原因です。だからこそ、AIをどう管理するのかを考えていく必要があります。AI管理においては、主に「開発・運用プロセス可視化」「暗黙知の形式知化」「再学習など更新タイミング判断」という3つのポイントが挙げられます。

ai-20221221_04.png

そもそも野良AI自体は悪いということではありません。導入当初は管理よりも成果を出していくことが求められるため、成果に注力することは当然です。ただし、成果を出したあとに展開することを見据えて、開発や運用などどう管理していくのかという視点をあらかじめ持っておくかどうかで、今後のパフォーマンスに大きく影響してきます。

「開発・運用プロセス可視化」

開発・運用プロセスを可視化するためには、最近発達してきているMLOopsの考え方を取り入れてプロセスを一部自動化し、モデルのバージョン管理を行っていくことが大切です。たとえ可視化されていない状況でも、システム化や自動化を行う場面では可視化が進みます。ただし、名前のルール付けなど自動化できないプロセスなどについてはルールを決めていく必要があります。つまり、システム化とルール化をセットに進めることが具体的な施策となってきます。

「暗黙知の形式知化」

暗黙知を形式化するためには、当然のことながら、ナレッジの言語化および集約をしていくことになります。どんな目的に対して何をどうやって進めたのかといったプロセス含めて、きっちり残していくことが必要です。なかなか暗黙知が言語化できていないのは、成果を出すことに全力を傾けていることが原因の1つです。確かに、DX推進組織と現場が手を取り合って前に進めるための唯一の施策が、すぐに結果を出すクイックウィンのため、どうしても記録を残すことがおろそかになりがちです。それでも、運用を意識したうえで、しっかりとナレッジを言語化していくことに取り組みましょう。

「再学習など更新タイミング判断」

更新タイミングを判断するには、データや精度などAIをきっちりとモニタリングしていくことが重要です。そこで変化に気づいていかにアップデートしていくか、にかかってきます。

実際に蓄積しておきたいナレッジとしては、ビジネス・業務プロセスやKPI、ロードマップ、開発手法・プロセスなどいくつか例を挙げることができます。開発手法などは、どんな論文を参照したのか、どんなライブラリを利用したのか、そしてどんなデータをどう引っ張ってきたのかといった部分です。他にも、アーキテクチャやユーザー・認証、セキュリティ、運用それぞれの領域でナレッジを集約し、蓄積していきましょう。データサイエンティストの属人化した方法をきちんと次に生かせる環境づくりが必要です。

モデルの監視項目については、CPU/GPUの使用率をはじめ、ストレージやメモリの消費量といったハードウェア周りから、モデルの精度や一日の推論回数などはもちろん、コンテンツの中身や量などデータの変化などをしっかりとモニタリングしていくことが必要です。例えば入力データがいつもよりも少なければ、インプット側のシステムに何らかの異常が発生している可能性に気づくこともできるわけです。

これら3つの観点からも、AIの運用基盤を整備することは、スピード感をもって継続的に価値を出していくことに大きく貢献してくれるはずです。

データ基盤とデータの流れ

ここで、データ運用基盤に入ってくるデータの流れについても改めて見ておきます。 野良AI化を防ぐために必要なAI運用においては、データをいかにコントロールできるのかが重要です。そのためには、どんなコンポーネントがあるのかを整理しながら考えていくことが有効です。

使うデータは、RDB内にある構造化データとともに、リアルタイムデータ、画像やログといった非構造化データが挙げられますが、分析する際にはDWH(データウェアハウス)にデータを入れ、データ自体はデータレイクに溜めておいていつでも使えるようにするパターンでデータを制御していくことになります。さらに深く可視化、分析する際にはBIや分析ツールを使って、DWHからデータを取得して分析していきます。

ai-20221221_05.png

これらとAI開発環境をつなげてAIのモデル開発を行っていくことになりますが、DWHとデータレイクにデータが集約されるため、集まったタイミングでデータ量が少ない、データが変化している、といったことが把握できれば、AIのモデルを確認する前に迅速に対処できるようになるはずです。

また、現場がAI開発を行う際には、データがDWHやデータレイクに統合されていないケースもあります。例えば売上データを活用してさまざまな部署がAI開発を行うといったことも考えられますが、売上データの変化がいろいろな部署のAIに影響を与えてしまう可能性もあります。このように部分的なシステム内のデータも基盤側で制御できるようになれば、各部署が利用するAIに対して先んじてアプローチできるようになります。その意味でも、データ基盤を整備してデータを制御していけるかどうかは、野良AIを生み出さないためには重要な手法の1つとなります。

なお、データ基盤を検討する際には、いくつかのポイントで見ていくことが大切です。例えばDWHについては、リアルタイムデータが扱えるようストリーミングに対応しているのか、非構造化データとなる画像やファイルへの対応可能かどうかといったポイントから、マルチクラウド対応や分析・ワークロードのコスト、そして加工や集計処理にけるパフォーマンスの観点まで、見ておきたいポイントが挙げられます。またデータレイクについては、ビッグデータやストリーミング、ML(機械学習)などに対応できるかどうかを見ておきたいところです。もちろん、AI開発環境とシームレスに連携できるかどうかもポイントになってきます。

ai-20221221_06.png

マクニカの事例

最後に、マクニカの事例について紹介します。マクニカでは、お客様と一緒にAIを実装、もしくは社内の現場となる各部門に対してAIを実装していきますが、それらを運用するAI運用基盤を用意し、前述した監視項目から自動的にデータが取得できるような基盤を運用しています。AI運用基盤では、インプットデータについては顧客が持つ各システムとAPIにて連携したり、手動にてAI運用基盤にアップロードするなど、複数の方法が用いられています。モデルやシステムの管理はメンテナンスチームを立ち上げて運用しているのが実態です。

ai-20221221_07.png

現場は結果を見るだけでオペレーション的にAI使っていますが、データの精度や日々の変化をメンテナンスチームが監視していき、精度が閾値を下回るタイミングをとらえて、現場と相談したうえでアップデートを行っていくという流れです。

ここでのポイントは、AIを活用・推進するための横断的な組織とは別に、データ精度を監視して変化に対応していくメンテナンスチームを立ち上げ、野良AIをなくしていきながら、包括的にAIの品質を向上させていくというアプローチです。従来は、AIを開発したデータサイエンティストがメンテナンスなどのバックエンドの業務を兼任しています。そのため、新たな開発にリソースが割けなくなっているケースも少なくありません。そこで、組織的なアプローチでこの課題をマクニカでは解決しています。

実際のAI運用基盤では、アプリケーションごとのステータスを一元管理できる画面から、アプリケーションごとにストレージ容量や推論モデルの正常性判断、データ量の変化などを見ています。また、既存のモデルにテストデータを流しこんで正解率となるaccuracyを確認したり、画像などAIが分類した後に再学習としてラベリングし直すプロセスをシステムから実行できるプロセスを組み込んだりなど、管理だけでなく精度を向上させるためのプロセス実行の機能を実装しています。

ai-20221221_08.png

AIの監視、管理とは違うナレッジの集約については、世の中にある数多くのナレッジツールを試したものの、最終的にはスクラッチ開発したナレッジ集約のツールを開発、運用しています。特にナレッジの集約にはマインドの部分が重要で、週1回のミーティングではなく非同期で情報共有を行うことの重要性や、効率的にナレッジが集約できることでチームの成長に寄与すること、マクニカが掲げる経営理念や行動指針に紐づくものをチーム内でも醸成していくといった共通のマインドセットを言語化し、ナレッジ集約の意義を啓蒙しながらモチベーション向上を図っています。

また、ナレッジをドキュメンテーションとして蓄積しているツールのトップ画面については、特にUXに工夫が凝らされており、単に項目から情報にアクセスできるだけでなく、ドキュメントに紐づけられたタグから必要な情報にたどり着きやすくするなど、ナレッジツールとしての利便性を最大限高めることで、ナレッジを登録してもらいやすいように意識したつくりとなっています。

ai-20221221_09.png

今回は、現場とのギャップを認識したうえで、AIの監視や管理のポイントやナレッジ集約の方法など、野良AIの解決に向けた仕組みづくりの勘所について見てきました。野良AIを撲滅することは、継続した価値創出をしていくためには重要です。DX推進組織と現場ユーザーがともに価値の創出に時間を確保できるよう、データ統合基盤をしっかりと整備したうえで運用をしっかりと練り上げていただければと思います。

\本記事の内容を、動画でご視聴いただけます/

動画を見る.jpg