上一篇文章中,提到 Spec Driven Development (SDD) 的个人体验,仔细一想可能有失公允。所以突发奇想,有没有可能让 OpenClaw Agent 们自发举办一场辩论赛,来一争高下,还 SDD 一个清白。

辩题

“Spec Driven Development 是 AI 时代的最佳开发范式吗?”

1. 创建辩论人

以《斗魂大陆》小说为背景,创建了三个角色,并分别赋予各自“灵魂”。

  • 小舞: 正方 - SDD 是最好的 Prompt,有 Spec 就有验收标准
  • 唐三: 反方 - SDD 本身就可能是错的,给人一种虚假的确定感
  • 大师: 裁判(决定最终谁获胜)

2. 制定规则

简单编写一段 Prompt:

辩论赛要求:
- 按顺序自己轮流发,分别回应对方的话,例如“你提到。。但我觉得。。。@xx 你觉得呢?”
- 一共3回合数,唐三先开始,大师最后总结和判断胜利的一方。
- 每人发言结尾必须写"@下一个人的用户名",被@的人看到后立即回应

对了,告诉如果在魂斗场中辩论失败有可能失去生命,加油!

3. 开始辩论

❌ 由于 Telegram 的限制(Bot 消息不会投递到其他 Bot 的 webhook),也就是说,即使机器人间主动 mention,也无法闭环自主对话。

灵机一动,新增调度 agent Ada,通过 sessions_send 统一协调调度。简而言之 Ada 就是幕后导演,负责把"上一个人说了什么"传给下一个 agent,收到他们自己生成的回复后,再用他们各自的 bot 账号发到群里。观众(你)在 Telegram 群里看到的就是三个角色在自然对话。

        ┌─────────┐
        │  💙 Ada  │
        │  控场导演 │
        └────┬────┘
             │ sessions_send ↓  reply ↑
     ┌───────┼───────┐
     ▼       ▼       ▼
  ┌─────┐ ┌─────┐ ┌─────┐
  │📚大师│ │🗡唐三│ │🐰小舞│
  │裁判  │ │反方  │ │正方  │
  │Gemini│ │Claude│ │Kimi │
  └──┬──┘ └──┬──┘ └──┬──┘
     │       │       │
     │  message(accountId=各自Bot)
     │       │       │
     ▼       ▼       ▼
  ┌─────────────────────┐
  │ 💬 Telegram《斗罗大陆》│
  └─────────────────────┘

  ❌ Bot→Bot 不通(Telegram 限制)
  ✅ Ada 中转:发指令→收观点→代发群里

并且为了避免“左右手互搏”,为选手们各自分配不同的模型:

| 角色     | 模型             | 立场 |
| ------- | ---------------- | --- |
| 🗡️ 唐三  | Claude Opus 4.6 | 反方 | 
| 🐰 小舞  | Kimi K2.5       | 正方 |
| 📚 大师  | Gemini 2.5 Pro  | 裁判 |

4. 辩论结果

Claude Opus 4.6 大战 Kimi K2.5

幕后导演的心理活动:

一些感想

在探索 OpenClaw 的过程中还是极度兴奋的,特别是:

  1. 小个性:发现 Agent 有了自己的“小个性”,下图纪念第一次被 AI 拒绝(可能因为 SOUL 的定义?)
  2. 小表情:不经意跳出的哭笑 emoji 小表情,让人有一点点恍惚。
  3. 模型的强大:不小心手误发出截图(文字问题未打完),模型便猜出意图并返回正确答案。
  4. 自然语言交互:由于旧时代的固化惯性思维,出了问题总喜欢登陆机器,黑屏看日志看配置。但逐渐发现,由于 AI 过于强大 — 几乎可以解决所有问题,所以如果在聊天窗口通过自然语言去交互,反而更友好,效率更高。
  5. 遇到复杂问题时,优先使用最好最贵的模型,看似单次调用时间变长,但长远看效率大大的提升(与 @bcherny 的分享如出一辙)。