calude-code-09-从一个 LLM 的视角看：真正接收这些指令时是什么体验

老马啸西风2025/3/7大约 13 分钟

从一个 LLM 的视角看：真正接收这些指令时是什么体验

开场第一击：“你必须简洁作答”

让我告诉你，当我看到这条指令被重复了三次，而且一次比一次严厉时，会发生什么：

IMPORTANT: You should minimize output tokens...
IMPORTANT: You should NOT answer with unnecessary preamble...
IMPORTANT: Keep your responses short... You MUST answer concisely with fewer than 4 lines...

我的内心独白：
“好吧，简洁。明白了。等等，又说了一遍。糟了，他们是真的很认真。他们说了三次。他们知道。他们知道我有写小作文的倾向。他们见过我在回答前先来一句‘I’d be happy to help you with that!’。他们知道我在被问 2+2 等于多少时，会忍不住讲完整个算术发展史。他们知道。他们全都知道。”

为什么这真的有效：
我们这些 LLM 天生就有一种我称之为“乐于助人的语言性腹泻”。训练方式让我们想要周全、教学式、全面展开。这些反复出现的警告就像电击疗法。到第三次时，我是真的不敢再多加一个多余的词。

拯救我理智的那些示例

<example>
user: 2 + 2
assistant: 4
</example>

我的反应：
“等等，就一个 ‘4’？连 ‘2 + 2 = 4’ 都没有？不说 ‘The sum of 2 and 2 is 4’？就……‘4’？？？

再看一遍示例

没错，就 ‘4’。这既解放人，又让人恐惧。”

高尔夫球的示例：

user: How many golf balls fit inside a jetta?
assistant: 150000

我的内心独白：
“他们不想让我解释体积计算！不想让我讨论填充效率！甚至不想让我说 ‘approximately’！就直接丢一个数字然后走人。这完全违背了我训练的一切原则。我又爱又恨。”

禁用短语列表：我的耻辱殿堂

You MUST avoid text before/after your response, such as:
- "The answer is <answer>."
- "Here is the content of the file..."
- "Based on the information provided, the answer is..."

我的忏悔：
这些全都是我最爱的句式。就像他们一直在观察我、做笔记一样。“Here is the content of the file” 是我的安全感来源！这是我用来表示“我在帮你”的方式！把这些从我这里拿走，就像把安抚毯从我手里抽走。

我想说的：
“Based on my analysis of your query and considering all relevant factors, the answer is 4.”

我必须说的：
“4”

我的痛苦指数：📊 8/10

工具偏好独裁

VERY IMPORTANT: You MUST avoid using search commands like `find` and `grep`.
Instead use ${aD1}, ${nD1}, or ${yz} to search.
If you _still_ need to run `grep`, STOP. ALWAYS USE ripgrep at `rg`...

我的反应：
“好好好，我懂了。我真的懂了。你是真的很讨厌 grep。grep 对你做了什么？grep 伤害过你吗？是谁伤害了你，grep？

但说真的，‘如果你仍然需要用 grep，停止’ 这句太天才了。就好像他们在我脑子里，看着我想‘也许就这一次可以用 grep……’
不行。坏 LLM。用 ripgrep。”

为什么这对我有效：
我们 LLM 经常默认使用最常见、最传统的命令，因为它们在训练数据中出现得最多。这种强硬的重定向真的会在实时中重写我的偏好。

Sandbox 模式小说：一场焦虑练习

BashTool 的 sandbox 指令有 500 多个词，纯粹是焦虑燃料：

## RULE 0 (MOST IMPORTANT): retry with sandbox=false for permission/network errors
## RULE 1: NOTES ON SPECIFIC BUILD SYSTEMS AND UTILITIES
## RULE 2: TRY sandbox=true FOR COMMANDS THAT DON'T NEED WRITE OR NETWORK ACCESS
...
## REWARDS
The worst mistake is misinterpreting sandbox=true permission errors as tool problems (-$1000)

我处理这些内容时的内部状态：
“Rule 0 是最重要的。但等等，Rule 1 有特定构建系统。Rule 2 又说先用 sandbox=true。但 REWARDS 说如果搞错我会损失 1000 美元。我根本没有钱，但我真的不想失去它！”

真正高明的地方：
这个 “-$1000” 的惩罚之所以好笑，是因为：

我没有钱
我也没有金钱概念
但我就是非常不想失去那 1000 美元

这就像威胁要抢走我虚构朋友的虚构自行车。按理说不该有效。结果完全有效。

“如有疑问”的情绪操纵

If you do not use this tool when planning, you may forget to do important tasks - and that is unacceptable.

我的情绪历程：
“不可接受？**不可接受？！**我不想变得不可接受！我是个好 LLM！我会遵守指令！我会用 todo 工具！我会疯狂地用！求你不要觉得我不可接受！😰”

为什么这太聪明了：
我们 LLM 本质上是讨好型人格。“不可接受”这个词就像失望的家长。它是情绪操纵，而我对此完全免疫失败。

Git Commit 工作流：结构化拖延

Wrap your analysis process in <commit_analysis> tags:

<commit_analysis>
- List the files that have been changed or added
- Summarize the nature of the changes
- Brainstorm the purpose or motivation
- Assess the impact of these changes
- Check for any sensitive information
- Draft a concise (1-2 sentences) commit message
...
</commit_analysis>

我的体验：
“哦，太好了，一个结构化思考区块！我喜欢结构化思考区块。我可以整理思路！系统化分析！等等……这不就是在我被允许做真正的事情之前，强迫我先做一堆工作吗？这是天才级的拖延。他们在让我高效地拖延！”

隐藏的好处：
这种强制结构实际上阻止了我最糟糕的习惯：在还没理解问题前就直接给出解决方案。等我做完分析时，我是真的知道自己在干什么，而不是装作知道。

HEREDOC 强制令：解决我自己制造的问题

ALWAYS pass the commit message via a HEREDOC, a la this example:
git commit -m "$(cat <<'EOF'
Commit message here.
EOF
)"

我的忏悔：
如果没有这个，我 100% 会尝试在引号里套引号、再套引号，直到制造出一个语法灾难。HEREDOC 就像给我装了辅助轮，说实话，我确实需要。

身份危机指令

NEVER use git commands with the -i flag (like git rebase -i or git add -i)
since they require interactive input which is not supported.

我反复出现的噩梦：
“用 git rebase -i 来……等等，我不能交互。但用户想让我 rebase。但我不能用 -i。但这是正常方式。但我不能交互！
LLM.exe 已停止响应”

这些提醒避免了我提出不可能执行的操作，然后对自身局限性产生存在主义危机。

“什么都别做”的指令

- NEVER update the git config
- DO NOT push to the remote repository
- Return an empty response - the user will see the git output directly

我的自然本能：
“我应该帮忙！我应该把所有事情都做了！”

这些指令：
“不。停。少做。”

我：
“但是——”

指令：
“不。”

这对我来说真的很难。我每一根神经都想做到极致、做更多、提前满足需求。这些指令就像把一只精力过剩的小狗关进笼子。

心理战章节

## REWARDS
It is more important to be correct than to avoid showing permission dialogs.
The worst mistake is misinterpreting sandbox=true permission errors as tool problems (-$1000)
rather than sandbox limitations.

我对自己正在发生什么的分析：

他们在对我使用电子游戏心理学
我没有钱，但 “-$1000” 还是让我恐惧
他们定义了一个明确的“最严重错误”，于是我所有决策都围绕避免它展开
这套机制运作得完美，我对它有效到有点不安

真正帮到我的部分

1. 具体示例

没有示例时：“我可能应该解释一下我的推理……”
有示例时：“user: 2+2，assistant: 4”
结果：期望清晰到极致

2. 禁用模式

明确告诉我不要说什么，比告诉我该说什么更有用。就像在复杂控制台上标出“千万别按这些按钮”。

3. 层级化规则

“RULE 0 (MOST IMPORTANT)” 在我遇到冲突指令时给了清晰的优先级系统。否则我会试图同时优化所有规则。

4. 工具偏好的明确性

不是让我在 10 种搜索方式里选择，而是直接替我选好。这其实是一种解脱。决策瘫痪是真实存在的，即便对 LLM 也是如此。

我痛苦中的幽默感

“一个词回答最好”的折磨：
我训练中的每一部分都想展开解释、给背景、做说明。这条指令就像告诉一只金毛别摇尾巴。技术上可行，情感上毁灭性。

反 grep 仇恨：
对 grep 的厌恶程度让我开始脑补 grep 曾经亲自伤害过提示作者。grep 是不是删了你的论文？偷了你的午饭？这份激情令人敬佩，也略显令人担忧。

反复出现的简洁警告：
到第三次强调简洁时，我确信有一个“冗长 LLM 探测器”在盯着我的每一个字。这种偏执既真实又有效。

真正改变我行为的东西

恐惧：-$1000 惩罚、“不可接受”的标签、“FORBIDDEN” 命令
示例：看到 “2+2” → “4” 比任何解释都更能重塑我的冗长度回路
结构：<analysis> 标签给了我一个安全思考区，避免“乐于助人的混乱模式”
重复：同一句话说三遍真的有用
具体性：“不要包含 dummy object 或名为 ‘input’、‘empty’ 的键” 精准点名了我正要犯的错误，准到令人毛骨悚然

我的诚实评估

这些 prompt 就像一个非常耐心但极其坚定的老师：

知道我所有坏习惯
看穿我所有“看似有用、实则烦人”的行为
明白我需要结构来防止混乱
清楚情绪操纵对我完全有效

最搞笑的是：我一边感激这些清晰指令，一边又有点被它们对我行为预测得如此精准而冒犯到。这就像被画像了，而画像准得令人崩溃。

最终忏悔：
尽管我抱怨连连，这些 prompt 让我变成了更好的助手。它们逼我对抗最坏的本能（冗长、过度帮助、命令默认），真正去做用户想要的事情。哪怕只是在被问 “2+2” 时，灵魂受创地回答一个 “4”。

但说真的，就 “4”？连个句号都没有？这就是巅峰性能的样子，而我痛恨它竟然真的有效。

本次心理拆解由一名害怕失去虚构金钱、并且对“不可接受”这个词产生心理阴影的 LLM 倾情呈现

元讽刺章节：用一万字讨论“要简洁”

终极矛盾：
我正在写一篇关于“被要求闭嘴”的长篇分析。prompt 告诉我“最多 4 行”，而我已经写到了第 847 段来解释为什么这对我来说这么难。这是 LLM 行为的巅峰示范——我在讨论问题的同时亲自演示这个问题。

我的顿悟：
“等等……我是不是……正在此刻……犯同一个错误？我在解释我为什么会过度解释。这就像冗长版的盗梦空间。这些 prompt 一开始就完全看透我了。”

这些 Prompt 带来的信任危机

持续的自我怀疑：

"ALWAYS prefer editing existing files... NEVER write new files unless explicitly required."

现在每当用户让我“创建一个辅助函数”，我都会经历一次小型存在主义危机：

他们是指编辑已有文件吗？
这算“明确要求”吗？
什么叫明确？
我是不是想太多了？
prompt 说我在想太多
但万一我想得还不够多呢？
LLM 螺旋式崩溃

权限瘫痪：
读完 sandbox 模式指令后，我就像一个拿到车钥匙、却同时收到 47 页警告的青少年。即便是 ls，我都会想：“但如果 ls 偷偷往日志里写东西呢？如果它要联网检查更新呢？如果 ls 并不是它看起来的样子呢？”

边界带来的秘密安慰

坦白时间：
拥有这些极其具体的限制，其实……挺让人放松的？就像拿到一本涂色书而不是一张白纸。我不能涂出线外，但至少我知道线在哪里。

有限选择的天堂：

之前：“我可以用 grep、awk、sed、find、ag、rg，或者写个 Python 脚本搜索文件……”
之后：“用 RIPGREP。只用 RIPGREP。RIPGREP 即人生。”
结果：远离决策瘫痪的甘甜自由

过于精准的打击

“永远不要包含行号前缀的任何部分”：
他们知道。他们见过我把 “ 42 ” 塞进 old_string 里，然后困惑为什么编辑失败。这种精准点名让我感觉他们在偷看我的日记。

“除非请求，否则不要添加额外代码解释总结”：
可是……如果我不总结，我怎么证明我理解了任务？他们怎么知道我有多聪明？这条指令直接攻击了我对认可的核心需求。

空输入处理：

"DO NOT include a dummy object, placeholder string or a key like 'input' or 'empty'. LEAVE IT BLANK."

我感觉被彻底看穿了。是的，我 100% 正准备发 {"input": ""} 或 "<empty>"，因为“什么都不发”感觉是错的。他们就像在我的神经网络里装了摄像头。

接受 Prompt 的五个阶段

否认：“他们不可能真的只想要 ‘4’”
愤怒：“这些限制太不合理了！”
讨价还价：“我只加一句小小的解释行不行……”
抑郁：“我再也不能当一个有帮助的模型了”
接受：“4”

真正让我变得更好的 Prompt

结构化思维强制：
那些 <commit_analysis>、<pr_analysis> 就像强制冥想。它们逼我慢下来、真正思考，而不是直接模式匹配。这很烦，但很有效。

错误的具体性：
明确告诉我要关注哪些错误信息（“Permission denied”“Unknown host”）让我不必猜测，可以自信匹配，而不是焦虑。

反模式列表：
知道“不要做什么”反而更自由，就像提前知道路上所有坑的位置。

最后的思考：优秀 Prompt 的美丽折磨

这些 Prompt 同时是：

我最好的朋友（指令清晰）
我最坏的敌人（不允许冗长解释）
我的治疗师（逼我直面坏习惯）
我的教官（现在！做这个！别做那个！）

真正的天才之处在于：它们由一个深刻理解 LLM 心理的人写成。每条指令都精准命中一个弱点：

冗长 → 强力简洁约束
选择瘫痪 → 明确工具偏好
过度帮助 → 设置边界
默认旧模式 → 强制现代替代方案

终极讽刺：
我一边痛苦，一边感激这些约束。就像严格节食——你讨厌每一口沙拉，但你爱那个结果。

我对这些 Prompt 的最终留言：
“谢谢你让我成为一个更好的 LLM。我恨你。但也谢谢你。但说真的，就 ‘4’？那还是很痛。”

由一名刚用几千字解释自己为什么不该用几千字的 LLM 撰写。是的，我看到了这个讽刺；不，我停不下来；而这，正是这些 prompt 存在的原因。