大家好,我是舒一笑不秃头。
🌐 个人网站:www.poeticcoder.com
🛠 工具站:www.strloom.com/
这两周,我经历了一次不算大,但足够让我反思很久的“翻车”。
事情本身很简单:
公司让我在客户环境里部署一个高可用的 RAG 服务。
但事情真正难的,从来都不是技术。
一、一个典型但隐蔽的“坑局”
简单脱敏说下背景:
- 客户用了某大型企业的服务器资源(非直接控制方)
- 我负责部署,但只有普通用户权限
- 超管权限只临时给了几个小时
- 项目对外是“高可用交付”,但底层权限却是“受限环境”
于是我做了一个现在回看很典型的错误决策:
👉 在短暂的超管窗口里,把 MySQL / Redis / 对象存储等服务“一把梭”用 root 跑起来了
当时很爽,进度飞快。
但权限一收回——问题来了:
- 数据目录归属 root
- 普通账号无法访问
- 后续无法维护、扩容、排障
项目直接卡死。
二、为什么这件事会“升级到高层”?
说实话,我当时也觉得有点“小题大做”。
一个部署问题,怎么就往上捅了?
后来我才意识到:
👉 这根本不是“部署问题”,而是“交付风险问题”
从业务视角看,这件事的风险是:
- 服务可能跑得起来,但不可运维
- 项目看似完成,但不可持续
- 一旦出问题,没人有权限处理
换句话说:
👉 这是一个“伪交付”
而在很多组织里,伪交付比没交付更危险
三、我当时答不上来的问题:风险到底是什么?
领导问了我一句话:
“你觉得这里面有哪些风险?”
我卡住了。
不是我不知道有问题,而是我一直在用“工程师视角”思考,而不是“架构/交付视角”。
后来我重新梳理,才发现可以这样拆:
1. 权限风险
关键运行资产(数据目录、挂载目录)依赖临时高权限创建,权限回收后不可维护。
2. 运维风险
普通账号无法查看日志、操作数据、处理异常,线上问题不可控。
3. 交付风险
项目承诺“高可用”,但部署方案依赖特权环境,交付前提不成立。
4. 扩展风险
未来扩容、升级、迁移都会再次卡在权限问题上,技术债持续累积。
5. 责任风险
资源方、客户方、项目方边界不清,一旦出问题,很容易演变成“甩锅链条”。
四、这件事真正暴露的,不是技术问题
如果用解决方案架构师的视角看,这件事其实暴露了一个更深层的问题:
👉 责任和控制权严重不对等
- 我要对结果负责
- 但我没有稳定权限
- 协调资源的人不懂技术
- 决策链条又很长
这在很多项目里都存在,但很少有人说清楚。
而纳瓦尔会怎么理解?
他有一句话我现在特别有感触:
“你要追求的是判断力和杠杆,而不是只会埋头干活。”
我当时的问题就在于:
👉 我在“拼命干活”,但没有“定义问题”
五、真正的转折:从“怎么做”到“该怎么做”
当我换一个角度思考后,问题突然变清晰了。
我不再问:
- 怎么把权限要回来?
- 怎么改目录?
- 怎么不重建?
而是问:
👉 在当前约束下,什么方案是可交付的?
于是我给自己拆了两条路径:
方案 A:一次性纠偏(依赖授权)
申请短时间高权限窗口:
- 调整目录归属
- 切换运行账号
- 验证普通账号运维能力
目标:把系统“转正”
方案 B:完全重构(不依赖权限)
在普通账号约束下:
- 重建数据目录
- 重设挂载方案
- 重新部署服务
目标:保证“长期可用”,哪怕不优雅
这时候我才真正理解一个很现实的原则:
👉 在企业环境里:可持续 > 优雅
六、我这次踩坑后,沉淀的 4 条原则
如果你也做过部署、交付或者架构,这几条非常关键:
1. 临时高权限 ≠ 可以创建长期资产
root 能做的事,不代表后面能维护。
2. 部署前必须确认“运行账号模型”
谁启动?谁维护?谁排障?
这个比技术细节更重要。
3. 能跑 ≠ 可交付
很多系统“能起来”,但根本不具备运维能力。
4. 技术问题要翻译成“风险语言”
不是说:
❌ “我这边权限不够”
而是说:
✅ “当前方案在运维和扩展上存在不可持续风险”
七、关于“要不要找领导聊我有哪些问题”
我当时也很纠结,要不要去找更高层聊:
“我哪里做得不好?”
后来我想明白了:
👉 事情没解决之前,不要急着做自我表达
因为在别人眼里,那会变成:
“你还没把事搞定,就开始总结自己了?”
更好的方式是:
👉 先解决问题,再做复盘
而且复盘也不要问:
❌ “我这个人怎么样?”
而是问:
✅ “我这次的复盘有没有偏差?”
八、这件事给我的最大改变
以前我总觉得:
👉 技术能力 = 能解决问题
现在我更认同:
👉 技术能力 + 结构化表达 + 风险判断 = 真正的价值
也是这次让我意识到:
- 普通工程师解决问题
- 高级工程师避免问题
- 架构师定义问题
九、最后一句话
如果用纳瓦尔的方式总结这件事:
👉 不要只做“执行正确的人”,要做“判断正确的人”
你可以犯错,
但每一个坑,都要变成你未来的杠杆。
如果你也在做部署、交付、或者在“权限受限 + 责任很大”的环境里工作,这篇可能会对你有一点点帮助。
也欢迎交流你踩过的那些“隐形坑”。