テクノロジーの現場からみた「生成AIの近未来」

オピニオン

テクノロジーの現場からみた「生成AIの近未来」

更新： 2023年12月1日

2022年11月末に登場した対話型AIをきっかけに生成AIが大きな注目を集め、この「私たちの未来を変えるかもしれないテクノロジー」について、期待や不安・懸念・疑問が入り混じりながらも、今や国内外・産官学を問わずあらゆる組織・個人で検討や導入が進んでいる。

この１年、私自身も利用者かつ開発者として生成AIに関わるルール整備やシステム開発といった様々な活動を推進してきた。その中で、責任ある一企業人としてこの新しいテクノロジーによってもたらされる利益とリスクの狭間で試行錯誤を重ねてきた結果、少しずつではあるものの生成AIとの向き合い方が見えてきた。

対話型AIシステムのアーキテクチャからみる生成AI活用の勘所

現在（2023年11月時点）では、生成AIとは膨大な学習データと著しく多量の内部パラメータで構築された大規模言語モデル（LLM）によって、テキスト（自然言語・コード）、音声、画像、ベクトルなどを生成できる人工知能、と解釈されるのが一般的であると思う。加えて生成AIは従来のテクノロジーとは一線を画するものとする説明を目にすることが多く、私自身もこのように説明している。

一方で、生成AIを活用した対話型AIシステムのアーキテクチャに目を向けてみると、意外にシンプルな仕組みであることに気付く。以下、例を挙げてみよう。対話型AIを使ってみた際に、少し前の過去の会話まで意識したインタラクティブな会話が成立していることに衝撃を覚えた方も多くいらっしゃることと思われる。実は内部で利用されているLLMそのものは静的なモデルであるため、人間のように過去の会話を記憶・理解しているわけではない。対話型AIがあたかも会話を記憶・理解しているかのように振る舞うその裏側には、LLMとは別の工夫が存在しているのだ。

その工夫とは、新たなメッセージを入力する都度、過去の会話履歴の全量を一緒にLLMに入力するというものである。対話型AIとの一連の会話を例に説明すると、人間との会話履歴はLLMとは別のプログラムで管理されており、このプログラムが過去の会話履歴と新たなメッセージを結合した一連の履歴付きメッセージを「記憶する機能のないLLM」に都度入力する。これにより対話型AIは一連の流れを考慮したかのような回答を生成するので、利用者（人間）はAIとの会話が成立しているように感じるのである。

この対話型AIの「インタラクティブな会話」の仕組みを、誤解を恐れずに整理すると、

① 入出力データを記録・管理・加工する機能 → 従来型のテクノロジー
② 単純にインプットに対するアウトプットを生成する機能 → 生成AI（LLM）

という２つのテクノロジーで構成されているわけだ。

今年（2023年に）世間を賑わせた対話型AIについて特筆すべきは、従来型のテクノロジーを組み合わせて付加価値を組み込んだ「１つの生成AIサービス」として、生成AIを人間馴染みのよいかたちで世間に送り出した点にある。このような仕組みとアプローチを理解しておくことは、まさに我々のビジネスにおける生成AI活用においても、見逃してはならない勘所となるのではないだろうか。

近未来の生成AI 仮説

一方で今後の生成AIの発展の方向性は、多くの方々にとって関心事であると思う。市場動向をウォッチしている限りでは、ほぼ全てのテクノロジーベンダーが生成AIへの取り組みを発表していることから、SaaSやパッケージなどのソリューションに生成AIが一機能として組み込まれるのは間違いない。そのため今、自ら積極的に取り組むべき領域と、ベンダーによるアップデートを待つべき領域の見極めについては、判断が分かれるところと思う。

一つ確かなのは、自社でスクラッチ開発を重ねてきたレガシーシステムだけは、自ら取り組まない限り生成AIをはじめとした新しいテクノロジーの恩恵を受けないことだろう。なぜならば古いテクノロジーによって構成されているレガシーシステムは、クラウド上で提供される最新のテクノロジーと通信することすらままならないからだ。判断に迷ったら、まずはレガシーという負の遺産を清算しておくか、せめて既存システムと最新テクノロジーの連携を可能とする環境（API連携基盤など）を整備しておくことが良い選択かもしれない。

話を「近未来の生成AI」に戻すと、これまでテキストに画像が追加されたように生成AIが取り扱えるデータの種類は、現在進行形で増加している。今後もあらゆる情報を対象としてデータバリエーションの増加は継続し、これに乗じる形で生成AIの機能とそれを支える周辺機能（証跡取得機能や署名機能などのデータ管理・保護に関する機能や、AI同士の連携機能のような新しい機能など）も多様性を獲得し、拡充していくはずである。

現在はText-to-Textな汎用言語モデルが注目を集めているが、AIの基となるデータが充実してくると、将来的には目的特化型の専門的なAIが登場し、それら複数種のAI(例えば、情報を生成するAIと、生成した情報のリスクを評価するAIなど)が相互に作用してシナジーを発揮することが可能な、多種・多層構造のAIアーキテクチャが考慮されたエンタープライズシステムが主流になるだろう。ここまで辿り着けば、現在はその機能の一部が個々に存在している生成AIを発展させ繋ぎあわせていくことで、例えば以下のような機能やサービスが遠くない未来に実現されていくのではないか。

AIを経由してすぐに接続されるシステム（データマッピングやデータ変換へのAI応用）
サイバー・フィジカル空間を横断した対人サポートロボット（AIとロボティクスの融合）
個々人単位に最適化されるコンテンツやサービス（教育コンテンツ・UI、ヘルスケアなど）
言語化可能なルール・プロセスに基づいた「手続き」の自動化（AIがシステム機能をも代替）
（様々な権利問題などを解決した上での）過去の偉人の再現復活講演サービス、など

そしてさらにその先の将来、ビジネスないしは社会全体にAIの活用が浸透した暁には、従来から用いられてきた「統合や標準化」はその役目を終え、「AIを核とした自動化」へとアーキテクチャのトレンドが変遷し、そこからまた新しいビジネスモデルが生まれていくという、そんな日が来るかもしれない。

免責事項：上記は個人の意見（オピニオン）です。

PwC コンサルティング合同会社
テクノロジー＆デジタルコンサルティング
New Technology & Architecture ソリューション担当
ディレクター吉田大吾