首页深度解析前瞻 AI资讯开源项目 AI产品论文研究 AI安全 AI实践 AI技能 AI出海

论文研究 2天前 • 更新于 2天前 57

边距：多代理基础模型协调的运行时置信度校准

Foundation model代理在多代理部署中越来越多，协调器需要决定信任哪个代理的响应。传统的做法是根据代理自我报告的信心加权处理，但最近的研究显示基础模型信心系统性失准，在困难任务上与准确性呈反比关系。设计时校准方法（如温度规整、Platt校准、直方图分箱）无法解决这一问题，因为它们对保留数

85

热度

90

质量

70

影响力

深度分析

背景与问题

在复杂任务环境中，多代理系统的协调器必须依赖于各代理信心来做出决策。传统的做法是通过加权不同代理的信心来进行决策，然而，基础模型的信心往往失准且难以修正。特别是在处理困难的任务时，基于自我报告的信心进行选择可能会导致错误的决策。

核心内容

针对上述问题，研究人员提出了一种名为MARGIN的方法。该方法能够在运行时根据任务流在线学习每个代理在不同信心区间的个性化校准因子，而不需要访问模型本身、保留数据或重新训练。具体而言，MARGIN使用对称加权指数移动平均，并结合了贝叶斯收缩融合来实现这种校准。

MARGIN通过以下步骤进行：

使用对称加权指数移动平均（Symmetric Exponentially Weighted Moving Averages, SEWMA） 来计算每个代理在不同信心区间的性能估计。
利用Bayesian收缩融合（Blending with Bayesian Shrinkage） 调整这些估计值，以更好地适应任务流中的变化。

实验结果显示，在19个基础模型、8个基准测试和超过50,000次观测中，MARGIN的表现优于传统的设计时基线方法。具体而言，它在分布迁移下的校准误差降低了3-6倍。

意义与影响

MARGIN的成功实现为多代理系统中的信任决策提供了一种新的解决方案。通过在线学习个性化校准因子，该方法能够在模型信心失准的情况下准确地识别出最可靠的代理，并显著提高了成对决策的准确性。此外，MARGIN的方法无需访问模型本身、保留数据或重新训练，使得其实现更加灵活和高效。

六个正式命题进一步探讨了MARGIN方法在非战略行为代理中的收敛性、追踪速度以及最优更新策略等方面的特点，并通过实验证明了这些预测的有效性。这一工作不仅为多代理系统的设计提供了重要的理论依据和技术支持，还为解决实际应用中信任决策的挑战提供了新的思路和工具。

免责声明：以上内容由 AI 生成，仅供参考。

多模态 Agent 对话系统对齐

阅读原文 →

相关文章

I/O 2026：欢迎来到智能体驱动的Gemini时代。

我们将在亚太地区启动谷歌DeepMind加速器计划，以应对环境风险。

人工智能搜索的新纪元

推出 Gemini Omni