博士工作围绕一个问题展开: 凭什么信一个自主 Agent 给出的输出? 我给出的答案是一种 Proposer、Challenger、Judge 架构——三个独立 Agent 先互相辩论、给出裁定, 再进入执行。同一底盘在学术上是研究对象, 在生产里是 OC1、OC2、MVF-Composer 的安全层。校准用置信度分数与审计链外置来兜底, 不靠单次 prompt 自证可信。
单次 LLM 调用的局限很清楚: 起草决策与验证决策的是同一个模型。博士工作研究一种多 Agent 模式, Proposer 起草决策, Challenger 攻击它, Judge 提交裁定; 辩论记录做哈希后写到 LLM 之外, 审计链独立于模型内部。
该模式同时落到三套已交付系统——OC1 (Agent 安全)、OC2 (DeFi 辩论)、MVF-Composer (稳定币储备控制)——并写进了 IEEE ICBC 2026 的论文。工程与论文走一个反馈循环: 系统上线, 装观测, 暴露论文没预测到的失败模式, 再写下一篇。当前公开数据里 OC2 裁定准确率 90.2% [BCa 95% CI: 87.6, 92.8], MVF-Composer 把峰值脱锚从 7.4% 压到 3.2% (1,200 次 Black Thursday 模拟)。
主题: 多 Agent 系统、共识与信任、校准预测、区块链与去中心化系统安全。
独立 Agent 互相辩论、裁定, 决策记录写到起草它的 LLM 之外; 审计不依赖模型自证。
为系统决策配可量化的置信度分数, 配人类可读的审计链; 校准失败时降级到人工。
稳定币脱锚瞬间的防御, 逐区块对照真实危机 (UST、stETH、USDC) 做回放, 而不是合成场景。
信任假设在哪一步破, 密码学覆盖到哪一步, 剩下来还是得有人在环。
四篇论文; 最新一篇 IEEE ICBC 2026 为独立一作并受邀演讲。
圣母大学 · 2020 至 2026 (预计)
导师: Jarek Nabrzyski
普渡大学 · 2018 至 2019
华盛顿大学 · 2014 至 2018