「周一早上,一個(gè)工程師在休年假,午飯前三個(gè)工作流全卡住了。」
這不是什么創(chuàng)業(yè)公司翻車現(xiàn)場(chǎng),是技術(shù)團(tuán)隊(duì)最熟悉的隱形炸彈。Slack 里堆滿「 quick question 」(快速提問),站會(huì)變成 scavenger hunt (尋寶游戲)——到處找上下文。到周三,團(tuán)隊(duì)終于想明白:?jiǎn)栴}不是產(chǎn)出不夠,是 critical knowledge (關(guān)鍵知識(shí))全鎖在一個(gè)人腦子里。
![]()
被誤認(rèn)的「優(yōu)秀」
大多數(shù)領(lǐng)導(dǎo)層看到這種情況,不會(huì)叫停。他們會(huì)換一套說辭:
「她是我們最強(qiáng)的工程師。」
「他對(duì)平臺(tái)的理解沒人比得上。」
「出事了找他。」
作者承認(rèn)自己職業(yè)生涯里全說過,也全為此付過代價(jià)。卡住的從來不是 coding skill (編碼能力),是 missing map data (缺失的地圖數(shù)據(jù))——某些決策為什么存在、隱藏依賴藏在哪里、哪些改動(dòng)看起來安全實(shí)則 downstream (下游)爆炸。
團(tuán)隊(duì)有才華,系統(tǒng)很脆弱。
讀過《鳳凰項(xiàng)目》的人知道這叫 the Brent Effect (布倫特效應(yīng)):一個(gè)不可替代的人被綁上每條 critical path (關(guān)鍵路徑),領(lǐng)導(dǎo)把 heroic saves (英雄式救火)當(dāng)成系統(tǒng)健康,一切正常直到這人消失。
不同年代,同一部電影,只是 dashboard (儀表盤)更好看了。
核心圖: Brent 效應(yīng)的運(yùn)行機(jī)制
Brent 效應(yīng)不是性格缺陷,是 operating model choice (運(yùn)營模式選擇)。你設(shè)計(jì)的是 local efficiency (局部效率),醒來發(fā)現(xiàn)的是 global fragility (全局脆弱性)。
危險(xiǎn)之處在于形成過程毫無異常。起初一切正常: ticket (工單)還在流轉(zhuǎn), release (發(fā)布)還在出去,領(lǐng)導(dǎo)看到的 dashboard 還是綠的。唯一早期信號(hào)是行為層面的——風(fēng)險(xiǎn)出現(xiàn)時(shí)所有人都知道該 @ 誰,但沒人問為什么這個(gè)模式反復(fù)出現(xiàn)。
大多數(shù)團(tuán)隊(duì)追蹤 cycle time (周期時(shí)間)、 deployment frequency (部署頻率)、 incident count (故障數(shù))。很好,繼續(xù)追蹤。但如果不追蹤 skill and context distribution (技能與上下文分布),你就漏掉了能 invalidate (使失效)以上全部三項(xiàng)的風(fēng)險(xiǎn)。
作者現(xiàn)在用一個(gè)簡(jiǎn)單評(píng)分應(yīng)對(duì)關(guān)鍵域,不是因?yàn)榉謹(jǐn)?shù)有多酷,而是因?yàn)椤肝覀儜?yīng)該多交叉培訓(xùn)」這種 hand-wavy (含糊的)對(duì)話從來熬不過季度末壓力。
五維評(píng)分表:找到你的單點(diǎn)故障
選一個(gè) critical service (關(guān)鍵服務(wù))或 workflow (工作流),五個(gè)維度各打 0-2 分。目標(biāo)不是完美,是暴露 roadmap (路線圖)依賴了哪根神經(jīng)。
維度一: Coverage (覆蓋度)
多少工程師能在沒有常規(guī)負(fù)責(zé)人的情況下安全修改這個(gè)區(qū)域?
0 分:只有一個(gè)人
1 分:2-3 人,但需要大量同步
2 分:4 人及以上,能獨(dú)立推進(jìn)
維度二: Recovery (恢復(fù)能力)
on-call (值班人員)能否在不升級(jí)給同一個(gè)人的情況下恢復(fù)核心流程?
0 分:必須找特定人
1 分:能處理常見 case ,復(fù)雜情況仍需升級(jí)
2 分: runbook (操作手冊(cè))完備,常規(guī)場(chǎng)景全覆蓋
維度三: Decision Traceability (決策可追溯性)
工程師能找到?jīng)Q策背后的原因嗎?
0 分:代碼注釋和文檔都沒有,只能問人
1 分:部分文檔化,關(guān)鍵決策有記錄
2 分:架構(gòu)決策記錄( ADR )完整,上下文可回溯
維度四: Onboarding Transfer Speed (新人上手速度)
新工程師 30 天內(nèi)能 ship meaningful change (交付有意義的改動(dòng))嗎?
0 分:3 個(gè)月以上才能獨(dú)立貢獻(xiàn)
1 分:1-2 個(gè)月,需要大量指導(dǎo)
2 分:30 天內(nèi)能合并首個(gè)體量適中的 PR
維度五: Ownership Rotation Health (負(fù)責(zé)人輪換健康度)
過去 2 個(gè)季度負(fù)責(zé)人輪換過嗎?
0 分:同一人持有超過 6 個(gè)月
1 分:名義上輪換,實(shí)際仍依賴原負(fù)責(zé)人
2 分:真正完成知識(shí)轉(zhuǎn)移,新負(fù)責(zé)人獨(dú)立決策
總分 10 分。關(guān)鍵規(guī)則:按 domain (領(lǐng)域)打分,不是按 team (團(tuán)隊(duì))。團(tuán)隊(duì)整體看起來健康,可能某個(gè)支付流程、某個(gè)集成接口、某個(gè)部署路徑仍然命懸一線。目標(biāo)不是漂亮的平均分,是找到那根 thread (細(xì)線)。
為什么團(tuán)隊(duì)打分沒用
作者特別強(qiáng)調(diào) score by domain, not by team (按領(lǐng)域打分,不是按團(tuán)隊(duì))。這個(gè)區(qū)分極其關(guān)鍵。
團(tuán)隊(duì)層面的指標(biāo)太容易偽裝健康。10 個(gè)工程師的支付團(tuán)隊(duì),平均 coverage 可能 1.5 分看起來還行——但拆到具體領(lǐng)域:核心賬務(wù)模塊 0 分(只有老張能動(dòng)),對(duì)賬接口 0 分(只有小李懂),退款流程 1 分(兩人能處理簡(jiǎn)單 case )。三個(gè) 0-1 分的領(lǐng)域,恰好是季度末大促最可能出事的環(huán)節(jié)。
平均分的幻覺讓領(lǐng)導(dǎo)層誤判風(fēng)險(xiǎn)分布。綠色 dashboard 背后,是三個(gè)「 quick question 」就能阻塞全隊(duì)的單點(diǎn)。
另一個(gè)常見陷阱:名義輪換,實(shí)際沒轉(zhuǎn)。 Ownership 在組織架構(gòu)圖上換了人,但新負(fù)責(zé)人每個(gè)決策都要 Slack 原負(fù)責(zé)人, on-call 遇到非常規(guī)情況直接電話轟炸。這種「?jìng)屋啌Q」打 1 分都算客氣,實(shí)際風(fēng)險(xiǎn)接近 0 分。
從「英雄敘事」到「系統(tǒng)免疫」
Brent 效應(yīng)的深層悖論:它往往由「優(yōu)秀」喂養(yǎng)而成。
那個(gè)總能救火的人,獲得更多關(guān)鍵項(xiàng)目;更多關(guān)鍵項(xiàng)目,加深系統(tǒng)對(duì)他的依賴;更深的依賴,制造更多需要救火的場(chǎng)景。循環(huán)強(qiáng)化,直到 PTO 成為 stress test (壓力測(cè)試)。
打破循環(huán)需要刻意設(shè)計(jì)。不是「找個(gè)備份」,是重新設(shè)計(jì)知識(shí)分布的激勵(lì)機(jī)制。
具體做法:把 coverage 和 rotation 納入績(jī)效評(píng)估。不是懲罰那個(gè)被依賴的人,是獎(jiǎng)勵(lì)主動(dòng)拆解依賴的行為——寫文檔、做分享、帶新人、推動(dòng)重構(gòu)降低認(rèn)知門檻。讓「讓我變得不再必要」成為晉升信號(hào),而非職業(yè)風(fēng)險(xiǎn)。
另一個(gè)杠桿:強(qiáng)制 PTO 測(cè)試。不是鼓勵(lì)休假,是觀察休假期間的真實(shí)系統(tǒng)表現(xiàn)。哪些流程卡住、哪些決策無人敢做、哪些「 quick question 」反復(fù)出現(xiàn)——這些才是優(yōu)先級(jí)最高的技術(shù)債。
你的下一步
這周五下午,花 20 分鐘做這個(gè)實(shí)驗(yàn):打開你們最 critical 的三個(gè)服務(wù),用五維表打分。不用追求完美數(shù)據(jù),誠實(shí)即可。
如果某個(gè)領(lǐng)域總分 ≤3 ,恭喜你找到了季度末的隱藏炸彈。下周的站會(huì),別聊 feature 進(jìn)度了,聊聊怎么把那個(gè) 0 分改成 1 分。
最簡(jiǎn)單的起點(diǎn):讓那個(gè)「不可替代」的人這周開始寫「如果明天我消失」文檔——不是完整的架構(gòu)設(shè)計(jì),是三張便簽:我最常被問的三個(gè)問題、我最后悔的三個(gè)技術(shù)決策、我最害怕有人觸碰的三塊代碼。
知識(shí)分布的衡量,從今天開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.