ChatGPT Image 2026年5月19日 20_04_30

一个让我停下来想了很久的 Skill

很火的superpowers这个skill框架相信很多人都尝试过,我也不例外,但是使用体验并不怎么友好,最大的问题就是太重了,搭配上慢速的gpt5.5, 有时候一个问题就得跑个把小时, 我也一直在思考,如何让AI既能识别我的需求,又可以轻量化一些,比如在我需要的时候才触发?

上周翻 GitHub 的时候刷到 Matt Pocock 的 skills 仓库,92K star,直接从他自己的 .claude 目录里掏出来的。

里面20多个 skill,TDD、PRD、调试、架构重构,什么都有。但我看到那个grill-me时愣了一下。

整个 SKILL.md 就三句话:

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.

Ask the questions one at a time.

If a question can be answered by exploring the codebase, explore the codebase instead.

没了。

一个 92K star 仓库里最受欢迎的 skill,三句话。这本身就挺值得聊聊的。

地址: https://github.com/mattpocock/skills

它到底在解决什么问题

Matt Pocock 在仓库 README 里引用了《The Pragmatic Programmer》里的一句话:

“No-one knows exactly what they want.”

这不是 AI 时代才有的问题。传统开发里,产品经理觉得说清楚了,开发觉得听懂了,最后交付的时候两边互相看着对方觉得莫名其妙。

AI agent 只是把这个问题放大了。你跟 Claude Code 说”帮我加个搜索功能”,它不会问你任何问题,直接开始写代码。等你看到产出的时候——搜索倒是有了,但跟你想的根本不是一回事。

grill-me 的核心洞察是:AI 编码最大的失败模式不是技术能力不够,而是需求对齐不够。 agent 不会主动追问你那些你没说清楚的细节,但如果你强制它追问,它其实问得很到位。

为什么三句话就够了

这个 skill 的设计思想来自 Frederick P. Brooks 的《The Design of Design》。Brooks 认为每个功能面前都有一棵决策树——你得沿着每个分支走到底,才能得到一个明确的方案。

比如你要做一个搜索功能:

  • 用全文搜索还是模糊匹配?
  • 如果全文搜索,用 Elasticsearch 还是 Meilisearch?
  • 需要支持中文分词吗?
  • 搜索结果要不要高亮?
  • 高亮的样式怎么定?

每个问题下面还有子问题。你不把这些走完,agent 拿到的就是一个模糊的需求,它只能靠猜。

grill-me 做的事情就是让 agent 像一个严格的 code reviewer 一样,把每个决策点都逼你做决定。有人试过一次 grilling session 跑了 38 个问题——他说最后那些问题里有一半他自己都没想过。

三句话之所以够,是因为它不需要定义问什么。它定义的是交互模式:逐个追问、逐个解决、能自己查的不问。 具体问什么,让 agent 根据你的项目自己判断。

这就是好的 skill 设计——不告诉 agent 该做什么,告诉它该怎么思考。

image-20260519195103583

升级版

grill-me 还有个升级版叫 grill-with-docs,多了一个关键能力:维护项目词汇表。

具体来说,它会在 grilling 过程中:

  • 检查你用的术语是否和 CONTEXT.md 里已有的定义冲突
  • 当你说的词太模糊时,帮你精确化(”你说的’账户’是指 Customer 还是 User?”)
  • 用具体场景压测你定义的领域关系
  • 把确认好的术语实时写入 CONTEXT.md
  • 只在满足三个条件时才创建 ADR(Architecture Decision Record)

这个版本解决了一个更深层的问题:agent 每次新 session 都是失忆的。 如果项目里没有一份统一的术语表,agent 每次都要重新猜你的术语含义。有了 CONTEXT.md,至少在同一个项目里,你和 agent 说的”订单取消”是同一件事。

当然,我们也可以自己根据实际需求和场景,来做出最适合自己的skill!

它不是孤立的

grill-me 之所以强大,还因为它跟仓库里其他 skill 形成了一个完整的工作流:

  1. /grill-me — 强制对齐需求
  2. /to-prd — 把对话浓缩成 PRD
  3. /to-issues — 把 PRD 拆成独立可交付的 issue
  4. /tdd — 红绿重构,一个 slice 一个 slice 地交付
  5. /improve-codebase-architecture — 定期清理技术债

这不是一个工具,是一套工作方法。grill-me 是入口,解决的是”对齐”这个最前面的问题。后面的一切——PRD、拆 issue、TDD、重构——都建立在”你已经想清楚了”这个前提上。我目前主要是使用grill-me帮我补齐一些没有考虑周全的问题!

我的使用体感

我自己在使用OpenClaw过程中也有设置类似的机制——SOUL.md 里写了”强制澄清触发器”,规定了哪些场景必须追问、不能默认继续。看到 grill-me 之后我觉得它把这个理念提炼得更纯粹了。

几个实操感受:

它不适合所有场景。 如果你已经很清楚要做什么,只想让 agent 快速执行,grill session 反而是负担。它适合的是”我想做个东西但还没完全想清楚”的阶段。

它的价值不只是提问,是”能自己查的不问”这条规则。 很多 agent 会问一堆你已经在代码里写过的问题,grill-me 要求 agent 先探索 codebase 再提问,这节省了大量时间。

三句话的设计哲学值得学习。 好的 skill 不是越详细越好,而是定义清楚交互模式和约束,让 agent 有足够的自由度去适配具体情况。

装一个试试

安装很简单,直接在你使用的工具里面,给他发送仓库地址就行啦! 都用AI了,就别再自己去手动下载了!

装完之后在 Claude Code 里输入 /grill-me,描述你的计划,然后准备好被灵魂拷问。

最后

Matt Pocock 这个仓库最打动我的不是某个具体的 skill,而是它背后的立场:AI 编码不等于 vibe coding。

我们这个时代不缺”帮我写个 XXX”的 prompt,缺的是”帮我想清楚 XXX 到底该怎么做”的方法论。grill-me 用三句话做到了这件事。

软件工程的基本功没有因为 AI 变强而过时。需求对齐、领域建模、测试驱动、架构审查——这些东西只会越来越重要,因为 AI 加速了编码,也加速了错误决策的后果。