This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AIエージェントはLLM / チャットボットではありません
概要
チャットボットは時代遅れであり、LLMだけでは不十分です — 未来は理解、推論、行動を組み合わせて、リアルワールドシステム全体で複雑なタスクを自律的に完了する真のAIエージェントに属しています。
1年後、世界はチャットボットをファックス機のように記憶するだろう:何かより良いものへの道のりの中でのぎこちない一歩だ。どのCOOにチャットボットの展開について尋ねても、同じように礼儀正しく肩をすくめるだろう。「使いづらい、高コスト、FAQに答えるのに失敗する。まだ人間が必要だ。」 私たちは皆、その経験をしています。重要な荷物の配達時間や住所を調整しようとします。チャットボットは丁寧に返信し、あなたのリクエストを記録したことを伝え、今は人間のカスタマーサポート担当者に実行を任せると言います。それ以上の行動は何もありません。あなたは苛立ちを感じます。 現実はこうです:チャットボットの時代は終わりました。それにしがみつく企業は、時間、お金、才能を失うことになります。新たな種類の自律型AIエージェントが登場しており、二つのアプローチの間の隔たりが、どの企業が先に進み、どの企業が顧客サービスの煉獄に閉じ込められるかを決定します。
私たちがゾンビチャットボットに困ってしまった理由 初期のチャットボットは自動化の最前線になるはずでした。しかし、彼らは皆が最も嫌いな顧客体験になってしまいました。なぜでしょうか?それは、彼らが何も理解するために作られていなかったからです。 彼らは最初からルールベースでした。ハードコーディングされたスクリプト、線形の意思決定ツリー、「これがあれば、あれがある」といったフローが急速に複雑化します。正確なフレーズを言えば、彼らは反応します。少しでも逸脱すれば、無視されるか、最初に戻されます。マナーの良いIVRメニューのようです。指数関数的な分岐が、従来のチャットボットが20の一般的なユースケースを超えて維持不可能にする要因であり、ROIを提供することさえ難しくしています。 問題は単に悪いUXではなく、構造的なものです。ルールベースのシステムは一般化できません。あらかじめ定義された入力やシナリオにのみ応じることができます。何かが変わる瞬間—ポリシーの更新、新しい価格階層、顧客が少し異なる方法で有効な質問をする—全体の流れが崩壊します。 次に何が起こるのか?人間へのエスカレーション。何度も何度も。 その間、フロントラインスタッフはボットが完了できなかった同じ繰り返しの作業を行わざるを得ず、手動で配送記録を更新し、ドライバーに電話をかけ、更新を記録していますが、ダッシュボードは「成功したインタラクション」と報告しています。一体誰のために働いているのでしょうか? 今日、ほとんどの企業の「AIチャットボット」の展開は、名ばかりの意思決定ツリーに過ぎません。見た目の改善 — より親しみやすいトーン、ブランドのアバター — では根本的な現実を変えることはできません:これらは脆弱で浅く、すぐに行き詰まってしまいます。 しかし、これらのボットは銀の弾丸として売られました。そのため、企業は新しいリリースがついにループを閉じることを期待して投資を続けました。しかし、そうはなりませんでした。できませんでした。なぜなら、アーキテクチャは自律的な理解や行動のために構築されたのではなく、チケットを回避するために構築されたからです。 そのため、ほとんどのチャットボットのKPIは表面的なものです:CSAT、ハンドオフ率、セッションの長さ。「実際に問題を解決しましたか?」と尋ねると、ダッシュボードは静かになります。 チャットボットのメトリクスを祝うとき、実際には移動距離のためのトレッドミルを祝っていることになります。簡単に言えば:たくさんの動きがあるが、行く場所はない。
次に登場したLLM — 話す者、ではなく行動する者 GPTとその仲間たちが登場しました。突然、ボットが会話を持つことができるようになりました。彼らはスラングを理解しました。彼らは曖昧さを処理しました。彼らは物事を記憶し、長いコンテキストメモリを持っています。 それは魔法のように感じました。そして、それは真の前進でした。初めて、AIは大規模に人間のような応答を生成できるようになりました。AIは知的です。 しかし、ここに落とし穴があります:LLMは素晴らしい即興者ですが、オペレーターではありません。 彼らには構造化された目標がありません。彼らはタスクが完了したと「知る」ことができません。彼らは足場なしにビジネスルールに信頼性を持ってアクセスしたり、更新したり、施行したりすることができません。彼らが生み出すのは言葉です — 魅力的で明確であり、時には役に立ちますが、めったに責任を持つことはありません。 LLMがあなたのリクエストを提出したと言ったとき、それはまだ提出していません。言語からアクションへの橋渡しをするオーケストレーションレイヤーでラップされていない限り、それはただの話に過ぎません。 したがって、LLMは業界を前進させましたが、実行のギャップは解決しませんでした。彼らは新たな誤った期待のクラスを生み出しました。今や、ユーザーは単にボットに対して不満を抱くだけでなく、賢く聞こえるが実際には助けられないAIに混乱しています。 その混乱が私たちをここに導いています:AIワークフローとAIエージェントへ。
AIエージェントとは何か AIワークフローは、事前に定められたステップでコマンドを実行するLLMです。しかし、実世界では、ステップを事前に予測することができないことがよくあります。 そこにAIエージェントが登場します。それは外部ツールと統合されたLLMであり、深く推論することができ、アクセスできるすべてを使用して、人間が行うのに何倍も長くかかる複雑な問題を解決します。 AIエージェントは、これを3つの層を組み合わせることによって実現します。 まず、意図を解釈するための会話レイヤーがあり、これはしばしばLLMです(はい、LLMは便利ですが、LLMをデフォルトで「AIソリューション」と呼ぶのは、ダイヤルアップモデムをWiFi)と呼ぶのと同じです。次に、何が起こるべきかを決定するすべてのルール、ポリシー、およびタスク計画を概説する推論レイヤーがあります。そして最後に、CRM、ERP、決済レール、音声システム、およびクローゼットに隠れているあらゆるレガシーモンスターへの安全なコネクタを備えた実行レイヤーがあります。 どの層を取り除いても塔は崩れます。それらを一緒に保つと、システムは「返信」から「解決」へと移行します。 荷物の再配達が必要な顧客のシナリオを再訪しましょう。 従来、チャットボットは最初のステップ—チケット処理を完了することができます。LLMは次のステップに進む手助けをするかもしれません。しかし、その後は人間が介入する必要があります。彼らは決定を下し、その後手動で返信を入力します。これは痛みを伴います。今やAIエージェントは、完全なワークフローを積極的に実行し、自律的な決定を下し、バックエンドシステムと対話し、監査目的のために活動を記録します。すべては、絶対に必要な場合を除いて、人間の介入なしで行われます。
*画像クレジット:*Jurin AI
エージェントは、30秒で他の部門を行ったり来たりすることになる作業を行います。それは、最初から最後までそのタスクを所有します。
すべてを「エージェント」と呼ぶのはやめましょう
「AIエージェント」という用語は注目を集めていますが、すべての良いバズワードと同様に、薄く広がっています。チャットボットとAPIを持つすべてのベンダーが今や「エージェント」を提供していると主張しています。中には、自分のLLMが5回の会話であなたの名前を覚えているだけで、その言葉を使うものもいます。
この誤用は単なるブランディングのフラフではなく、実際の混乱を引き起こします。それは、購入者に、決して提供するように設計されていないツールから結果を期待するように訓練します。これは、誤った期待を生み出すことで採用を遅らせ、続いて本当の失望を引き起こします。最悪なのは、企業が革新を進めていると自分たちを納得させることができることであり、実際には同じ古いサービスデスクに新しいUIを追加しただけなのです。
しかし、AIの変革は現実です。 真のAIエージェントは、単に会話が豊かになるだけではありません。彼らはより責任感を持っています。彼らは深く統合され、責任を持って行動し、追跡可能でビジネスにとって重要な成果を提供します。彼らは単なるインターフェースではなく、インフラストラクチャーです。
そして、私たちはまだ始まったばかりです。
情報の未来:アプリからAIエージェントへ 長年にわたり、私たちは機械の論理に適応してきました。メニューをクリックし、インターフェースを暗記し、タスクを完了するために5つのタブを同時に操作してきました。検索は賢くなり、アプリは洗練されましたが、負担はユーザーに残りました。
AIエージェントがそれをひっくり返す。
システムがどのように機能するかを学ぶように求めるのではなく、システムはあなたがどのように働くかを学びます — 自然な会話を通じて。
旅行を予約したいですか?プライベートAIコンシェルジュとチャットするだけです: 「アルプスでのハイキング旅行を計画する、9月上旬、人が少ない場所で。」 そしてそれは起こります。フライト、ホテル、地元のガイド — 自分では絶対に見つけられない隠れた宝石まで。90年代のウェブサイトや、悪いUXの鈍いモバイルアプリはありません。ただ、物事を進める会話があるだけです。
これは、あなたが操作するアプリから、あなたの代わりに操作するエージェントへの移行です。
そして、それは旅行だけにとどまりません。エージェントは、私たちがすべてとどのように相互作用するかを再構築します — ロジスティクス、調達、コンプライアンス、人事。静かに脆弱なツールや断片的なワークフローを、推論し、行動し、時間と共に改善できる知的システムで変革しています。
これはエージェント的な未来です:タスクが瞬時に音声またはテキストによって完了される場所、AIが理解し、行動し、提供する — あなた自身のエグゼクティブアシスタントです。
それはSFのビジョンではありません。あと1年から2年の距離です。そして、私たちはすでにJurin AIでそれに向けて構築しています。
エージェントAIの時代が到来しましたが、私たちはまだ表面をかすったに過ぎません。これほど興奮したことはありません。