世界をリードしうる感性×AIの可能性
日常生活のさまざまな場面で活用されているAI。技術開発やプラットフォームを活用したデータ分析など海外のIT企業が優位にAI活用を進めているのが現状ですが、日本において強みとなるのが感性データの活用です。"さらさら""ワクワク"など状態や動きなどを音で表現するオノマトペを母国語に持つ日本だからこそ、世界をリードする新たなAI活用を実現する可能性を秘めています。本記事では、そんな感性×AIの可能性について国立大学法人電気通信大学 副学長であり、人工知能先端研究センター教授の坂本真樹氏の講演内容をお届けします。
目次
- 日本におけるAI活用の今
- 日本におけるAI活用の強みは"感性"である
- 感性を表現するためのオノマトペ数値化システム
- 感性データとしてのオノマトペが日本ならではの商品・サービスを生み出す源泉に
- 社会実装が進む感性データのビジネス活用
日本におけるAI活用の今
第4次産業革命のキーテクノロジーの1つとなっているAI。日本においても内閣府を中心に人工知能技術戦略を策定し、積極的にAI活用を推進しています。なかでも、AI戦略の重要な柱の1つに挙げられるのが教育改革です。小中高校における教育環境を整備することでリテラシーを醸成し、文系学生であってもAIの応用力を身につけることができる応用基礎、そして先鋭的な人材を発掘し伸ばしていくためのエキスパートなど、さまざまな領域での取り組みを通じて教育改革を強力に推し進めています。
この教育改革に注力する理由の一つは、AIを活用するための人材が不足しているためです。総務省が公表した平成30年(2018年)版 情報通信白書によれは、AIの導入にあたって、学習に必要なデータの収集・整理が不十分という課題とともに、AIの導入を先導する組織や人材の不足がAI活用における課題が大きな比率を占めています。
Society 5.0の実現を通じて世界規模の課題解決に貢献し、日本の社会課題の克服や産業競争力の向上を目指すためには、これらAI導入における課題を克服していくことが重要になっています。
日本におけるAI活用の強みは"感性"である
AI活用において、米国をはじめとした海外のIT企業が基礎研究や技術開発、AI人材の育成などさまざまな領域で先行している印象がありますが、AI活用における日本の強みはどんなところにあるのでしょうか。
経産省が公表しているAIにおけるデータサイクル全体で見た場合、データ取得のフェーズで見ると、モバイルOSやデバイスなどについては海外に分があり、人工知能の技術開発やその活用、数理・医療分野などの基礎研究などAIを用いた分析についても、海外に比べると日本の強みになっているとは言えません。
AIにおけるデータサイクル全体のなかで、感性という視点でみると日本の強みが出てきます。具体的には、ロボットやセンサなどの世界シェアが高く、現場の暗黙知である質の高い教師データが取得できること。そして注目しているのが、社会実装や産業化のフェーズにおいて、高品質なモノを理解・評価できる消費者がいることです。
高品質なモノを理解・評価できるとは、具体的にどういうことなのでしょうか。一般的に、五感を通じて見る、触れる、味わうなど、さまざまな情報を得ていますが、そこから"この商品はやわらかそうなので欲しい"といった感性で価値を判断しています。特に日本語は、感じたことを表現する言葉を持っています。例えば生地に触れた時に「ふわふわ」とか「ざらざら」といった言葉、いわゆるオノマトペで表現できるのが日本語の持つ特徴の1つで、この言葉には双方向性があります。「カサカサで肌触りが良くない」という言葉から、相手がどう思っているのかをなんとなく判断できるわけです。そんな風に表現できることが、人間が持つ感性の能力にあたります。この感性の能力をAIに持たせる研究を坂本教授は行っています。
感性を表現するためのオノマトペ数値化システム
このような感性データをAIに学習させるのは非常に大変です。例えば猫を見たときに、"これは猫である"という物体認識としての答えがあり、正解不正解が存在するのが通常の機械学習データです。しかし、その猫を見てどう感じるかという感性データは"けばけばしてむせそう""ふわふわして好き""もふもふであたたかい"など、表現に個人差があり、正解不正解が存在ません。感性での価値判断は、主観的で個人差があり、正解不正解がなく回答が無限に存在しているのです。
多くの企業がこのような感性データを取得する場合、形容詞を付与した形で商品に対する印象についてのアンケートを行い、得られたデータをもとに統計解析や主成分分析、回帰分析などを実施していきます。この手法では、分析のためにたくさん回答してもらう必要があり、アンケートを回答する被験者の負荷が大きく、被験者の評価が尺度の種類と幅によって制約を受けるなど、いくつか課題が出てきます。そこで、この感性データを取得するために、擬音語・擬態語の総称であるオノマトペで表現してもらうことを行っています。
直感的にオノマトペで表現することはとても重要です。人は自分が持っている言葉でしか感じたことを表すことができない、つまり、人は言葉で感じたことをカテゴリ化しているのです。また"さらさら""ざらざら"といったオノマトペは、構成する音韻と快・不快などの感覚イメージとの間に強い結びつきがあります。これを分析することで、材質の質感や感性的な印象まで把握することができるのです。つまり、感覚カテゴリを表現しているオノマトペの音韻を分析することで、直接調べることが難しい主観的な質感を理解し、快・不快を含む感覚カテゴリを体系化できるわけです。
そこで、触覚や味覚などを通じて、音に感覚が結びつくことを触覚や味覚などを通じて実験を行っています。この実験では、触覚や味覚を通じて得られたオノマトペから、母音や子音といった必要な音素を抽出し、感覚的なイメージと関連が強いとされる第一母音と第一子音を分析。その結果、快・不快それぞれを感じたときに表現するオノマトペに違いがあることが見つかりました。
サイエンスの分野における研究をコンピュータで処理できるようにシステム化することも行っています。それが、音と感覚の結びつきを活用したオノマトペ数値化システムです。2008年に学生の卒論の一環として制作が始まったオノマトペ数値化システムですが、今では100を超える尺度でオノマトペの音から得られる感覚が数値化できるようになっています。
このオノマトペ数値化システムによって、直感的な言葉から感覚や感性を多次元で数値化でき、この結果を商品開発などに生かせるようになりました。項目数が多く、感覚を分析的に回答してもらうのが大変だった既存のアンケート調査での課題を解決する仕組みとなっています。
感性データとしてのオノマトペが日本ならではの商品・サービスを生み出す源泉に
現在では、もとオノマトペの音から感覚を数値化する仕組みだけでなく、オノマトペそのものを新たに生成するAIを作り出すことに成功しています。また、オノマトペを自動生成する仕組みについては、当初はシンプルなモデルを作りましたが、画像から質感を示すオノマトペを自動生成する深層学習モデルづくりにも挑戦しています。1枚の画像データから得られた質感のイメージを全て正解データとして学習し、その傾向を表現することが可能になっています。
このように目新しく(新奇性)直感的に分かるオノマトペは、新たな価値を生み出す力を持っていると考えています。"もふもふ"はパンのやわらかい部分を表現したオノマトペとして世の中に出てきたものというのが調査から分かっていますが、それが動物の毛の暖かい感情の表現に使ったことで爆発的に広がっていきました。つまり、新しいオノマトペができたときに、新しい質感の気づきが社会に与えられたわけです。その結果"印象のよい、もふもふ感のある商品をつくれば売れる"という新商品開発にもつながってきます。
新商品が市場に投入されると新たな価値が顕在化し、さらなる新商品開発を促していくサイクルを生み出します。うまく循環させることができたら、欧米では作れないような日本ならではの商品やサービスが開発できるのではと考えています。
実は感性に着目したものづくりについては、日本においても国としてプロジェクト化されており、新学術領域の研究としてすでに10年以上にわたって研究が進められています。具体的には、物理的な特徴から人が感じたものをどう表現するのかを収集して質感のデータベースを構築し、社会実装レシピを生み出していくという新しい質感の発見を促す研究です。
また、画像もとにした質感のシミュレーターを使うことで、より質感を高めたものとして生成された実在しない画像から、新たに物性や材料に変換するなど、現実的なものづくりにまで落としていけるような研究も進んでいるのです。
社会実装が進む感性データのビジネス活用
そんな感性を持つAIを利用することで、ビジネスの可能性も広がってきています。1つの例として挙げられるのが、空間のスマート化です。具体的には、利用者の快適性や生産性、健康などを増進する空間づくりをAIで実現するアプローチです。2017年より国のプロジェクトで進められ、会話の空気・感性を読むAIで空間を制御していくという試みです。会話のデータと心拍などの生体情報からどう感じているのかを分析し、音楽や香り、照明など空間の情報を一緒に組み合わせ、ストレス軽減や知的生産性向上などにつながる環境をAIが学習していくものです。現在も研究は進められており、実際に感性AI空間 FUWAKIRAとして企業のオフィスに導入されています。
最近では画像を自動生成するAIが話題になっていますが、欧米ではアプローチされていないような感性に着目した手法で、文章生成を行う仕組みも出てきています。画像を読み込ませると、画像の雰囲気を瞬時に歌詞としての文章が生成されるもので、VTuber fuwariが文章生成のAIを用いて歌詞を作っていくようなコラボレーションも実現しています。感性AIが生成してきた歌詞をもとに、fuwariが最終的に歌詞として完成させていく流れとなっており、人とAIのコラボを推進しているのです。
海外でもAI作曲など開発が盛んですが、アニメ大国日本の強みを生かしたVTuberを盛り上げていき、海外とは異なるアプローチでAIを広めていくのは面白い試みだと考えています。
今はAIを使えば画像も文章も生成できますが、大事なのは出てきたものが"これはいいな"と感性に刺さるかどうか。AIを活用した音楽を世界に先駆けてヒットさせるべく、2022年4月27日にソロデビューシングル「夜舞うfuwari」をリリースさせるなど、感性AIの新たな可能性を模索し続けています。
AI活用における日本の強みとして紹介した感性×AIの世界。世界と戦っていくためのAI活用の新たなアプロ―として、ぜひ注目いただければ幸いです。