編者按:績效評估和薪酬分配,這是所有公司,無論是大公司還是初創企業都要面對的問題,也是一個永恆的挑戰。如何才能做好績效評估?究竟有沒有一個完美的績效評估體系?A16Z合伙人Steven Sinofsky通過分析績效評估的5個現實、10個屬性的基礎上給出了3點應對之道。
左:Wally,關於你的績效評估有個壞消息
中:大家的表現都一樣。但是我得按照鐘形曲線進行排名。
右:(Wally念道)員工上廁所後不洗手 (經理)我得找點缺點讓你排名靠後點。這有支筆,籤字吧。
Michael Lynch 寫了一篇極好的文章,儘管多少有點令人沮喪,他談的是對Google績效評估和晉升流程的個人體驗。關於這個話題又有了好些討論,所以我想得更新一下2013年的這篇文章了。
關於大型公司和成功企業的績效評價和管理的文章最近不少。Amazon採用的是OLR,也就是組織和領導力評估(organization and leadership reviews),目標是對組織裡面效率最低的10%採取適當行動。Yahoo則引入了著名的QPR,也就是季度績效評估,以「未達目標」或者「偶爾未達目標」等來對人員進行評價。當然,我們並不認為這是技術圈獨有的,每到年底華爾街的機構都要進行年度的獎金發放流程,鑑於牽涉到的金額數量巨大,這個過程裡面充斥著各種的功能失調。甚至美國空軍也有也有一個有關反饋和評估的傳奇流程。
就像很多的公司流程一樣,當公司做得「好」時,這個流程就是對的、神奇的。當公司做得不那麼「好」時,則每一個流程要麼是現狀的症狀,要麼是其根源。
這篇文章審視的是大型組織績效考核的挑戰。其主要目的是幫助分享一些現實情況,也就是孤立地看的話,為如此敏感的話題設計和實現一個系統是一個巨大挑戰。如果你把組織的環境(股價、公眾認知、收入或利潤、本地人才競爭等)疊加上去的話,則任何系統在一段時間內都會被視為蠻橫或者公平或者粗暴,然後當環境改變時又會擺向另一頭。就像很多的公司流程一樣,當公司做得「好」時,這個流程就是對的神奇的。當公司做得不那麼「好」時,則每一個流程要麼是現狀的症狀,要麼是其根源。
就像很多人也許希望把績效管理看成是數字進而可完美量化一樣,其實它也像是我們設計和開發的產品,只不過是環境和社會科學的產品。我們想要定量、確定性和簡單性,但環境很關鍵卻是不固定且是定性的。我們渴望公平,這是相對的,但又堅持以事實為依據,而這個又是絕對的。
儘管對簡單性有著不懈的追求,但就像機票、車票或者免稅代碼一樣,以為可以真正實現並維護好簡單性是幼稚的想法。但這個挑戰並不能改變簡單性這個普遍共享的目標(相信我,人力對複雜系統的喜好程度不會超過其他人),但從實踐上來講這種純粹性是無法實現的。將任何系統與某些理想系統相比只會拉大渴望與實現之間的鴻溝進而加劇對系統的沮喪甚至是恐懼。
如果這個話題簡單的話,在Amazon美國書籍網站上查詢「績效評估」時就不會有2500多本書的查詢結果了。更糟的是,暢銷書都是那些有關如何寫評語、如何操控系統、如何給老闆留下好印象,或者如何在僱員表現不佳告訴對方你做得很好的書。只有把那個列表拖到很後面的位置才能找到嘗試對評估系統進行定義的書,甚至那些書裡面處處也都是警告。我個人的觀點是這個主題最好的一本書是《衡量與管理組織的績效(Measuring and Managing Performance in Organizations)》。裡面講的不是完美的評估體系,而是通常在衡量員工時會遇到哪些陷阱和誤區。我很喜歡這本書,因為它提醒了你有關衡量的一切,包括「三思而後行(measure twice, cut once)」、「衡量可以改變的」以及「衡量什麼就能提高什麼」等等。
註:我不是HR專業人士,對「績效評估」、「績效管理」或者「績效評價」之類的微妙差別並不感興趣。我認識並尊重它們之間的差異,但出於討論的目的我傾向於混用這些術語。同時我也意識到結伴上大家在執行這樣一套體系的時候往往不區分這些詞之間在學術上的細微差別。同時我也不是律師,所以我在這裡說的話在你的業務領域(地理位置、公司規模、業務板塊)在法律上未必允許。最後,這篇文章講的不是任何過去過去或現在的實踐,如有雷同純屬巧合。本文說的有些事情可能會引起爭議或者在某些人看來根本就是錯誤的。
5個現實
績效評估有若干現實:
績效體系融績效、晉升/頭銜、獎金與組織預算於一體。不管你怎麼看,一個人都無法按孤立的預算進行評估並提供報酬。公司作為整體對人力方面需要支付多少有自己的預算(工資、獎金、股票、晉升等)。這套體系絕大部分機械或量化的努力決定的並不是個人的績效,而是在預算範圍內如何分配給每個人。儘管大家總想把職業發展和薪酬區分開來,但一旦個人看到自己的薪酬或者經理必須給出評分時就沒法分開了。當你試圖把這些元素(為了「公平」起見)分離時,你就會貶低了那些個人最不關心的東西的價值,但是通常大家在職業生涯的不同階段會關心不同的東西,所以這就變成了一種猜謎遊戲,很難知道什麼才是一個人想要的獎勵(讓預算發揮最大影響)。任何有關如何更公平、更靈活、提供更加絕對的評價,或者將績效與薪酬分開的建議最後都得想辦法跟預算掛鈎。預算的存在推動了體系的存在。總會有預算(限制),別被「外快」給糊弄了,因為這只是個預算技巧罷了。任何群體無論大小都有績效分配問題。到了一定時候,一群致力於類似模板的人在績效上面就會體現出不同的分布。最早的時候我們上學時會從作業看到這種不同。在工作場所有無數變量會影響到任何個人的表現,但這種可變性是存在的。在理想系統裡面,你是可以將所有的變量與一些先天的「純貢獻」或「純技能」隔離開來從而對某人進行評估。但現實當中你是沒有辦法這麼做的,所以這種分配其實是摻雜了很多績效相關的變量因素的。一個變量驅動的績效分配典型的例子就是工作的「重要性」,對此個人是沒有話語權的,更糟的是重要性變了他們可能也不知道。如果什麼事情失去了重要性或者因為某些外部原因變成關鍵,就總會影響到績效。在一個績效有m個標籤的體系裡,除了拿到最高獎勵的人,其他的人都認為自己離更高一級的人是「那麼的接近」。在學校,老師會把考試成績分成不同的字母或數字等級。在職場,績效體系一般也會按照一定的等級或者評分分配到每個人身上。就像物理實驗裡面的力曲線一樣,這套體系說只有一定比例的人能拿到最高績效評定,類似地團隊中也會有一定比例的人只能拿到最低分數。結果是組織幾乎每個人都相信自己離下一級非常接近,就像你看著考試評級以為自己只用多得一分就能提高一個等級。由於人性使然,幾乎任何一個此類體系都必定遵循一個推論,那就是經理可能會暗示或者被管理的人可能會聽到自己的評分距離下一個等級是多麼的接近。所以推論是:「每個人都以為自己高於平均水平」。在任何群體集合之中,幾乎所有群體都認為自己的貢獻比其他的群體大。在一家有著很多群體的公司裡,經理往往相信自己的群體按照相關衡量整體上表現要更加出色,不應該這樣分配或者應該拿到更大的預算。群體往往認為自己的工作更艱苦、更有戰略性,或者就是更有價值,但又低估別的群體的貢獻。一旦群體意識到預算固定,一些群體就會想設法爭取到更大的預算,而這就會對整體預算構成挑戰。其手段包括改變績效分布的方式(增加高分檔人數)或者乾脆提高組內人員的薪酬。如果是這樣的話組織就必須就群體的整體績效(相對於彼此,這是很噁心的,跟個人績效相對彼此的衡量方式很像)如何進行衡量提供指南。針對初創企業可以得出一條推論:「我們只招最好的人,所以我們全都超過平均水平。」衡量不是絕對而是相對的。要想衡量績效必須有參照物。銷售是「最容易」的,因為你有銷售額度,然後你的酬金只是超過配額多少的衡量手段。這種簡單性掩飾了圍繞著額度設定進行的械鬥以及獎金表的制定過程,但這仍然是個相對的指標。大多數產品都會有一些更模糊的目標,比如「完成該產品」或者「推銷該產品」。公司越大這些目標越重要,但是個人的日常活動直接相關性越弱(「如果我解決了這個bug是不是就可以達成這筆銷售?」)。在大公司,目標設定(「OKR」)變得日益徒勞,因為「完成我的工作」似乎要跟別人發生關係,而他們的工作幾乎簡直沒辦法寫出來。而寫績效評估大部分都聚焦在目標設定上,不幸的是,編目標的技巧你隨時都可以炫耀。所有這些相對於聚焦在敏捷性上的評估方式是相當大的轉變,提前數月描述成功會是什麼樣幾乎就是經營有方的對立面。因此,衡量自己相對於同行的做事表現要可靠得多,但不好的是大目標都落到最高管理層身上了。所以這個話題主要是談大公司的——在初創企業或者小公司,行動都轉化為銷售、營銷、產品以及客戶等非常直接的東西上面。
那些把年度績效評定視為了解員工工作表現如何或者跟員工分享反饋的地方的人完全搞錯了——這個過程當中根本不應該有什麼意外。
10個屬性
一旦你接受了這些現實就會意識到某類系統的確如此。這種系統的目標就是要找出該付給大家多少錢——公司就得幹這事兒。至於什麼職業管理、反饋等等,其實都不是大家在查看自己「分數」的那一刻關注的東西。這肯定也不是想辦法讓自己的團隊符合系統規則的經理所關注的事情。
那些把年度績效評定視為了解員工工作表現如何或者跟員工分享反饋的地方的人完全搞錯了——這個過程當中根本不應該有什麼意外。如果其中有什麼意外,那一定是個沒有任何系統能修復的錯誤。對於績效來說,沒有任何東西能夠取代具體的、可行動且持續的反饋。如果你得到的不是這個那就得去問問了。
與此同時,你也不可能每天/周對自己的工作表現進行打分。這是因為你的表現要有參照物,但是那個參照物又不是一天就能確定的。找到合適的比較物無論對個人還是經理都是一個挑戰,因為要避免給雙方帶來意外,這是一個負擔。就像你希望經理要溝通得當一樣,個人也必須用心傾聽。
安插一個合適的系統來分配薪酬是個巨大挑戰。對公司、團隊、經理以及個人利害攸關的東西太多了。諷刺的是,因為會對大家生活產生實質性影響的利害攸關實在太多,所以這套流程走下來需要好幾個月並且比組織的外向型工作還要消耗更多的腦子的情況不在少數。更加諷刺的是,你越是想把流程往HR的關注點去靠,它跟工作脫節的程度就越大,給人的壓力就越大。其結果是,績效管理消耗了大型組織太多的時間和精力。
因為這個,公司的每個人都對這套體系積累了足夠多的怨氣,人人都有對它進行改進的主意。就像公司在打廣告時會徵求大家的意見一樣——因為我們整天都看廣告並且會買東西——在績效評估的事情上我們也都要工作並且被考核,所以我們都能提供對這套體系的洞察和看法。跟對現有體系的各種奇聞異事心懷不滿相比,從頭設計一套體系就很不一樣了。
鑑於厲害攸關的東西太多,而且對於如何改進這套體系人人都有想法,實際的事實是非常複雜的。你可以編撰一套規則出來,但是大家實施規則的方式你是寫不出來的。你可以剬迭代,追加越來越多的規則,越來越多的檢查和平衡,但最終一套已經花費太多時間的流程會變成令人崩潰的負擔。甚至在此之後,從統計上來說也會有很多人不會滿意。到頭來,經過幾個周期等大家都有經驗之後,績效評估體系本身就變成了一場龐大的、會牽涉到金錢、士氣、職業生涯等利害的多人遊戲。
因此,任何系統最好的辦法是定義變量,並且要認識到,按照定義,無論做出什麼樣的選擇、無論在系統內工作的是什麼人都不會是完美的。如果某人認為其結果不是朝著好的方向傾斜的話,他可以視為在作弊。或者一個人也可以視之為做對的事情,如果他認為結果是朝著正確的方向傾斜的話。
我自己的經驗,是這裡面太複雜了,想完整編纂出一套體系來是毫無意義的。相反,每個人只需用開放的心態和現實的眼光去審視其挑戰性程度,然後在整個對話過程中反覆掂量這些變量即可。如果光考慮其中一個而排除掉其他的,這套體系最終就會崩潰。
在建立一套績效評估體系時,以下是必須考慮的10個最常見的屬性:
確定團隊規模。「類似」員工(工作職能、資歷、精通程度、責任)數需要有個臨界值,達到這個臨界值任何體系才有可能。如果人員不到100的話任何體系都不會真正見效。與此同時,人數達到100的話就有了足夠大的樣本數量可看出績效的差異性。在認為唯一公平的評估方式是熟悉他們的工作的員工與一個需要很多數據點的體系之間總是會有衝突的。實際上,大概會有1到5個人對某人的工作非常熟悉,不過換種說法任何一位經理大概都能熟悉5到50人的工作。到了一定時候這套體系需要每一級管理層都要基於不完整信息交流來對人進行公正的評估。團隊規模也很重要,因為小小的「取整」工作也會變得非常棘手。想像一下如果你需要找出10%的人,而你的團隊只有15個人是什麼情況。你顯然要麼選1個要麼選2個人(如果這10%是「壞」的話就取1,如果是「好」的話就選2)。然後想像規模變成15000人。那麼篩選的就不是1500人,而是1000或者2000人。這種取整相對預算來說不是太摳就是太貴了。最佳實踐:把系統根據資歷和角色按100人分組。綜合考慮資歷、工作職能以及項目並不能創建出一個同等群體。想定義一個剛畢業的新員工相對於一位工作已經10年的老手的貢獻,或者設計師相對於QA工程師的,經理相對非經理的,或者前端相對於運營工具的貢獻,這些都是極其困難的。當整個評估流程順著管理鏈往上走時總是會出現這種功能紊亂,總是會出現偏見——曝光率最高的人、工資最高的人或者工作、最稀缺的人才、比較了解的工作等等,一般是這些才獲得溝通的時間。在這一點上沒有什麼東西是天生邪惡的,但是如果那些溝通的結果是這些維度上的人獲得更高的評價/薪酬的話,事情就會迅速變得棘手起來。如果這些群體規模達不到上面一點的要求的話,處理起來就比較有挑戰性了,你得找到必要的平衡。最佳實踐:儘可能在項目團隊內基於資歷和工作職能定義同等群體。針對目標衡量。基於預定義的目標來設定評估和薪酬系統是完全有可能的。這麼做有兩件事情是一定的。首先,無論你認為評估流程可以節省多少時間,你都需要預先花時間走一個精心設計的目標設定流程。其次,任何複雜度的任何努力都沒有辦法設定獨立的目標,所以一旦不能實現目標,事情就變成了記錄什麼地方出了問題。一旦每個人都意識到自己的薪酬要取決於其他人時,整個工作流程就被烏雲籠罩,被無休止的責任、期望設定等跟實際工作沒有關係的討論佔據了。更糟的是,管理層總是會說:「目標是你定的,所以你應該搞定它。」評估流程中再也沒有比實際設定目標但是目標又是包含了各種複雜構成更具挑戰性的了——如果這是一個需要創意的目標,則敏捷性、pivot(轉型)和學習都會是過程的一部分。最佳實踐:讓各人和經理達成可培養技能的熟練感以及項目成功感的目標,同時把評估聚焦在對更大使命的相對(量化的)貢獻度上面。理解跨組織的績效。績效評估總是相對的,但是跨組織的績效確定需要的對比是那種評估對橙子之比,哪怕對比的是職能類似的組織(比如工程)。如果一支團隊剛剛做完一個版本而另一支剛剛開始一個新版本的工作,或者一支團隊做的時原有業務而另一支做的是新業務,又或者一支團隊沒有競爭對手而另一支跟別人打得頭破血流,一支有很多銷售支持而另一支沒有等等,很多情況下都沒有明顯的「比較」不同團隊的手段,但你又需要在不同程度上進行這種比較。此外評估到了某個時候相對比較的基礎可能會發生極大變化——比方說,在某個管理層面對多個團隊的完成情況的考核角度可能根本就不是那些團隊成員在日常工作中國能夠發揮影響的。最佳實踐:不要讓不同組織陷入到為了薪酬互相爭奪的情況,應該通過共同規劃和執行相同的目標來培養跨團隊協作的氛圍。維護一個融評分和獎勵於一體的體系。一般情況是評分體系有一套,獎勵體系又一套。有人認為這是必要的。有人認為這純屬多餘。有人非常關心其中一套,但只有對另一套非常滿意或者非常不滿意的時候才會這樣。其實可以形成一套讓這兩者完美關聯到一起的體系,這樣的話他們就可以說分設兩套是多餘的了。一套相關性很弱的體系倒不如讓它脫鉤,因為無論是牽涉到的個人還是經理聽到的都是他們想聽的或者說一套做一套。與此同時,我們都習慣於「分數」,而9.67%的獎金感覺就不像是分數,因為你不知道它的相對意義是什麼(所以即便大家想要按絕對來打分,要不了多久他們就想知道自己的相對位置在哪裡)。最佳實踐:評價要清晰,讓各人知道自己相對於同等群體站在什麼位置,薪酬也要基於此來分配,經理要非常熟悉工作,能夠在一定的既定評價範圍內調整薪酬分配。寫績效評估不是斷案。Amazon上面幾乎所有關於績效評估的書關注的都是些評估的藝術。你的績效評估不是審判,寫出有力或者有創意的報告並不能決定過去1年/月/季度的成敗。對於希望讓自己的績效亮麗的個人如此,更重要的是對於希望彌補缺乏反饋/行動的經理來說更是如此。績效評估過程最糟糕的時刻是當員工仔細分析經理的點評並且試圖反駁或者當經理拿出一堆舉證某事的新例子(事情發生的時候經理當時卻沒有說)時。最佳實踐:降低這份文檔本身作用,明確它不是該流程的決策工具。排名和標定是不一樣的。關於「員工排名」的概念說的已經夠多了,也就是給一個群體的每個成員一個排名分數的過程。這樣的流程永遠永遠都是非常糟糕的流程。這樣一套體系根本就不會有那種程度的精確性。你怎麼去解釋一支百人團隊中排名第63和排名第64之間有什麼區別?標定的做法則是上述在同等群體額度成員之間的相對績效。這群人的規模和數量是固定的,只要人員規模充分幾乎可以確定能夠避免對邊界情況無休止的討論。最佳實踐:定義績效組將團隊成員劃入,但是就不要再跟其他組別一起進行大排名了。鼓勵卓越團隊。大多數經理都認為自己的團隊是卓越團隊,而且是唯一卓越的一個。表現出色已經被被招進團隊。表現不佳的不管當時時怎麼進來的自然也會被踢走。結果表明如此。實施績效評估系統變得越來越難,因為組織變得越來越強大越來越高效。理論上應該是這樣的。與此同時,這鐘情況不可能一直都這樣(甚至進了新球員的球隊也不可能在整個賽季都一帆風順)。在一個動態的系統裡面會有些年是某支團隊表現非常出色而有的年份就不怎麼樣,但是從絕對意義上你是沒法知道的。績效評價最僵化的元素就是假設特定的團隊或者個人已經達到了高峰,他們就是表現卓越的,因此這套體系已經不再適用了。不管這個團隊是100人的工程師還是火力全開的執行團隊,說這套體系不再適用是很誘人的。但如果這套體系不適用的話其實你就沒有體系。也許你的組織會有「終身職位」的概念,或者你的工作職能主要是按照基於量化指標的配額提供薪酬——這些都是採用不同體系的辦法。最佳實踐:做一套適用所有人的體系,或者做多套體系,制定清晰的規則規定哪些人適用哪一套體系。允許例外就會製造出一個以例外為基礎的流程。當團隊把所有可能的約束都加進去並且嘗試對一個人的績效進行最終評定時,往往會有感受到所有規則的痛苦之傾向,然後就去建立一個例外的模型。比方說,你可以或有個10%的組但是允許有1%的例外。這樣就總是會得到了一個9%或者11%的組,結果要取決於增加例外或者排出例外哪個更好。如果經理有權給排名低的人額外的錢同時少給排名高的人一點錢的話,大多數人都會感受到這種自相矛盾的信息。所有這些例外會迅速滲透到組織和個人,最終例外就會成為流程的正常部分。最佳實踐:如果制訂了一套體系,那就堅持原則,不鼓勵有特例。全方位擁抱多元化。在績效評價和獎金的發放方面,甚至在同等群體裡面出現千篇一律的傾向太常見了。這些都可以通過任意數量的職業特點(這些特點可以視為風格或者實際表現特質)表現出來。這方面我聽過的最早故事之一講的是一名經理,他喜歡讓大家為增加功能制訂比較激進的目標。不幸的是缺乏衡量工作質量的手段。團隊的其他成員會同時關注功能和質量。相對於bug數量很高的那個人落後組的成員感覺自己很不利(因為前者只有數量沒有質量)。與此同時,這種團隊往往是做出了很多功能但是收尾工作很長的那種。績效評估的完成時間不一樣,這個故事的結局也會不一樣。可能這兩種工作風格都可以接受,但是不欣賞「穩紮穩打」的風格就是經理接受風格多元化的失敗。同樣地,個人特質也總會有安靜與大聲,口頭與書面等等之別。最佳實踐:任何強大且可持續的團隊在各個維度上都是多元化的。
3個應對技巧
關於適用於組織的績效評估和薪酬分配辦法還有很多東西可以說。說過的東西裡面有太多都是負面的,而且都是一種我們 vs 你們佔主導的口吻,或者更糟,就認為這一切都是經理的錯。就像商業的很多事情一樣,其實很多時候都沒有合適的答案或者完美的辦法。如果有的話,那就會有一套人人都會使用且時時適用的的績效體系了。事實上並沒有這樣的體系。
有人建議這個問題唯一的解決辦法是給出一個薪酬預算然後讓一定層級的經理負責。也就是經理根據自己的標準來確定團隊每個成員的薪酬。這也是一套體系——沒有體系本身就是體系。實際上這不是一套體系而是多套體系,每位經理一套。每一個群體都會達成某種滿足團隊需求的金錢分配和評價辦法。會有花生奶油團隊,會有「發大紅包」的團隊等等。甚至還會有利用這套體系作為招聘工具的團隊。
儘管這樣的體系被說了很多壞話,但是有一套可視、有一些框架以及一定的跨組織一致性的體系對組織整體是會帶來很多好處的。即便存在挑戰,但這些好處依然可以累積。
文章最後給大家(個人和經理)提供三個生存技巧,我們來看看似乎不公平、不透明或者瘋狂的績效流程應該如何應對:
沒人掌握所有的數據。個人喜歡提醒管理層自己並不掌握特定員工的所有數據。經理則喜歡提醒大家自己比任何個人看到的數據點都要多。HR喜歡提醒大家他們掌握了業界的競爭性薪酬數據。高管提醒大家自己有很多團隊的數據。歸根結底,沒人掌握流程的全貌。這意味著每個人都是在信息不完備的情況下做事的。但這並不意味著大家都做得不好。分享成功,分擔責任。無論在什麼樣的背景下發生了什麼,當大家一起分享成功分擔責任時人人皆可受益。哪怕體系不完美,如果你做得好的話一定要考慮一下別人有什麼貢獻並且儘可能公開感謝對方。如果你認為自己得到了不好結果,不要把責任往別人身上推或者指責別人,多從自己身上找找原因把事情做好。一切都會好起來的。既然沒有一個體系是完美的,很容易就會以為一個數據點的不完整是個永恆的難題。情況會出問題。我們談得不太多,但是一些人有時候會得到比自己應得的高得多的排名和報酬。是的,事後有些人可能會因為發現自己不值這麼高的評價而內疚一陣子。不過在知識經濟裡,最後勝出的一定是人才。經理沒有理由總是針對偶爾犯過一次錯誤的人才(因為經理自己也經歷過類似的事情)。在一套複雜而不完美的體系裡面工作是需要受紀律並付出努力的——這其實是每個人在職業生涯當中都要掌握的技能之一。無論是項目規劃、績效管理、戰略選擇、管理流程等等,這些都是社會科學,都會受到背景、錯誤率的影響,更重要的是都需要學習和迭代。
原文連結:
編譯組出品。郝鵬程編輯。