マルチフィデリティ・エージェントシミュレーションは、意思決定の重要度に応じて計算量を変えることで人間行動モデルをスケールします。ルーティンはルール、中程度の場面はヒューリスティック、重要な場面はLLMエージェントが扱います。
重要ポイント
- すべてのtickでLLMを使わず、重要度で認知処理を振り分けます。
- 文脈が変わったときだけエージェントを起動します。
- フィデリティレベルでシミュレーション時間と実時間レイテンシを分離します。
LLMエージェントシミュレーションのスケール問題
すべてのエージェントがすべての時間ステップで推論すると、LLM駆動のシミュレーションは破綻します。小さな世界はデモでは一貫して見えても、長いタイムラインでは遅延、コスト、状態ドリフトが発生します。
問題は、LLMのレイテンシがシミュレーション時間と一致しないことです。シミュレーション上の1時間には多くの小さな行動が含まれますが、言語、社会的判断、戦略的計画が必要なのは一部だけです。
マルチフィデリティとは
マルチフィデリティシミュレーションは、場面ごとに実行モードを変えます。低フィデリティは決定的ルール、中フィデリティはヒューリスティックや確率遷移、高フィデリティは曖昧で社会的または重要な判断にLLMを使います。
これによりシステムは安価で制御しやすくなります。ルーティンは高速に進み、重要な判断には豊かな認知が使われます。
- 低フィデリティ: スケジュール、減衰、日常的移動、単純な状態変化。
- 中フィデリティ: セグメントヒューリスティック、確率重み、行動priors。
- 高フィデリティ: 交渉、反論、説得、衝突、計画。
一貫性を保つ時間拡張
時間拡張はspeed factorでシミュレーション時間を速くしたり遅くしたりします。リスクは、エージェントが重要な文脈を飛ばし、記憶と合わない判断をすることです。
信頼できる設計ではチェックポイントを使います。静かな期間を圧縮し、何が変わったかを要約し、判断、相互作用、驚きがある場面だけを展開します。
実践的なルーティング方針
有用な方針は重要度から始まります。各イベントは新規性、感情的重み、戦略的関連性、目標や関係への影響でスコア化されます。
スコアが低ければルールが処理し、中程度ならヒューリスティックが状態を更新します。高ければLLMが関連記憶、世界状態、行動制約を受け取り計画します。
- イベントを新規性、関連性、感情強度、リスクで評価します。
- 低シグナル期間を記憶サマリーに圧縮します。
- 将来行動を変える判断だけLLMを呼びます。
- ルーティング判断をログ化してデバッグ可能にします。