九月初,一篇「困在系統裡的騎手」的
文章,展現了外賣行業險象環生的現狀。
當前,激烈的競爭環境正推動外賣平臺不斷改進算法和騎手績效考核方式。社會在收穫良好顧客體驗、較低配送成本和極高配送效率的同時,也付出了騎手權益和行人安全降低的代價。
作為致力於大數據、運籌學,以及人工智慧方法在智慧城市領域應用的學者和研究者,我們期望,用更科學的運營流程和算法邏輯,構築健康、溫暖、高效、可持續且具有社會責任的外賣生態體系。
篇幅所限,本文僅介紹我們認為最重要且實際可行的方法。方案從平臺運營和政府監管兩方面展開。平臺運營部分,聚焦騎手激勵機制、運營流程和算法及供需調節機制等;政府監管部分,聚焦明晰勞資關係、加強資質審核和運營監督、明確平臺責任,以及市場競爭與政府干預等。
針對每項內容,【洞察】部分介紹了經管等相關學科原理,或數據科學、人工智慧和優化算法的可能技術實現路線,以供參考,直接跳過閱讀不影響理解全文。
2020年初秋的上海,在寫字樓和食肆之間穿行的騎手們。澎湃新聞記者 周平浪 圖
一、騎手激勵機制設計在外賣騎手困境的討論中,改善激勵和獎懲機制是關注焦點。面對無法避免的外賣訂單配送超時,平臺可考慮引入「超時容錯機制」,訂單的「預計送達時間」設置和顯示為時間段(如,「17:20-17:25到達」),並根據商家備餐狀態和騎手配送情況動態調整、提前向顧客提醒可能的超時送達,而非精確到具體時刻(如,「預計17:23到達」),甚至故意將顧客端顯示的「預計送達時間」設定為早於騎手端。
【洞察】技術層面,即便採用先進的深度學習算法,模型學習的結果也只是關於「預計送達時間」(Estimated Time of Arrival,簡稱ETA)的統計分布,不能做到對每個樣本的預測值都有絕對準確的「信心」。ETA參數的區間估計結果(「17:20-17:25」)比點估計結果(「17:23」)更可信,後者不能告訴顧客真實送達時間與差距,而前者可反映真實送達時間所處的大致可信範圍 (confidence interval)。平臺可考慮將「超時率」劃分多個區間、設計更有彈性的階梯式超時獎懲規則:超時率分成多個區間段,例如,[0%, 5%]、(5%, 10%] 以及10%以上,如果騎手超時率處於第一個區間段,則績效水平不受影響;如超時率處於第二個區間段,則績效水平將受到適當輕微的負面影響;如超時率處於更高區間,則績效水平將受到顯著增強的負面影響。
【洞察】當前,騎手超時率通常不得高於3%,否則包括騎手、站長甚至區域經理等都將面臨績效懲罰。從激勵機制設計的本質而言,無論預計送達時間容錯機制還是彈性超時獎懲機制,都是在期望構建基於騎手工作績效(即超時程度或「超時率」)的非線性激勵機制。平臺還可考慮建立「騎手配送超時互助保險」機制:可由騎手自主選擇是否加入,即騎手選擇接單時,還可選擇是否願為這筆訂單繳納較低金額的超時保險費,這筆費用成為騎手互助的保險金額池。如果騎手因任何原因無法按時送達訂單,可由金額池向騎手提供經濟補償。金額池內餘額最後都退還給騎手。
【洞察】保險是管理風險的常見工具。在電子商務平臺上,保險公司會向第三方賣家推出以商品買家為被保險人的「退換貨運費險」,以降低可能的退換貨運費給買家造成的損失。現在平臺衝單獎勵活動和考核時間一般是一天某個時段。平臺可考慮以「天」為單位獎勵,或將懲罰考核周期適當延長至「星期」甚至「月」。通過實踐找出最佳考核周期,以降低騎手對短期高頻考核的焦慮,提高系統整體效率。
【洞察】基於時間段的衝單獎勵,看似有助於滿足尖峰時段旺盛需求。但共享經濟商業模式的實證研究表明,理性的服務提供者為儘可能獲得活動期高衝單獎勵,可能選擇在活動期開始前策略性停止工作,以等待高峰期到來,這種「前瞻」(forward-looking)行為將導致平臺在高峰期到來之前運力供給下降,給整個系統運行效率造成負面影響。平臺應建立基於綜合服務質量、配送效率和安全保障等多屬性的多層次騎手績效評估體系。當前,系統為騎手設置的積分等級體系,直接基於完單量、準時率或顧客評價獎勵積分,可提升騎手的安全保障、違章記錄及公益活動等有助於建設外賣生態體系的多個屬性的重要性。
評估體系可嘗試根據政府部門監管法規和平臺發展目標為不同評估指標設定優先級,其中,遵守交通安全法規應為外賣配送的基本要求。
【洞察】在多層次多屬性績效評估體系的設計過程中,在第一層,遵守交通安全法規是外賣配送的基本要求,那麼,「違章率」的優先級需要最高,一定考核期內,如果騎手「違章率」超過閾值,將被「一票否決」,不會進入下一層次的績效評估;在第二層,維持並提升市場佔用率可能是當前平臺運營關鍵目標,「完單量」的優先級可定為次高,在對「完單量」合理劃分不同等級的獎勵區間後,各騎手再根據實際「完單量」進入相應評估區間;最後,在特定的、基於「完單量」的評估區間內,機制綜合服務質量和顧客評價等屬性設定獎勵金額。當前系統採取的是顧客給商家或騎手的單向評分方式。平臺可建立「多向」評分反饋系統,其中,顧客給商家和騎手分別評分,顧客對商家的菜品進行反饋,對騎手的派送服務進行反饋;騎手也可選擇給商家評分,反饋商家出餐及時性等信息;更進一步地,騎手還可給顧客評分,反饋訂單交付難度和顧客接單態度等信息。
與此同時,平臺根據商家、顧客和騎手的權利義務,並綜合天氣、路況和其他不可控因素等,設定公平合理的判責系統。
【洞察】實際商業場景中,如,網約車市場,乘客可給司機評分,司機也可對乘客評分。建立多方評分反饋系統(multi-lateral rating systems)的核心目的是增強在線市場中各參與方之間的信任度,降低各參與方的信息不對稱,從而「驅逐」低質量的參與方,降低交易成本。平臺可在實時餐館推薦系統的設計中採用更多與應用場景相關、反映實時供需情況和騎手空間分布數據。例如,針對某商家,如過往一小時騎手等待時間較短、當前周邊分布騎手較多、店內正等待取餐的騎手較少、正準備的訂單數量較少等,在其它屬性相近的條件下,則該商家在推薦排序算法的結果中可被優先推薦。
推薦系統還可根據實時已有訂單的餐館和騎手位置進行拼單推薦,實現外賣「順風車」。比如,如果一位騎手正在顧客周邊商家等待取單,且預估取餐時間較長,那麼,即使該商家不是距顧客最近或價格最低,推薦系統也可一定程度上提高其權重和優先級。
【洞察】在當前實現的推薦系統中,算法輸入的應用場景數據至少由三大類組成:一是用戶畫像,如,性別、常駐地、價格偏好、食物偏好等;二是食物畫像,包含商家、外賣、團單(即團購訂單),其中,商家特徵包含商家價格、商家好評數、商家地理位置等,外賣特徵包含平均價格、配送時間和銷量等,團單特徵包含適用人數和返購率等;三是場景畫像,包含用戶當前所在地、時間、定位附近商圈、基於用戶的上下文場景信息等。預計送達時間預測算法可融合來自騎手的手機GPS實時定位數據、手機運動傳感器移動數據、安卓作業系統特定應用程式搜集的活動識別數據等
多源異質數據集,識別騎手在不同時刻所處的活動狀態以及狀態改變的時間點。這有助於提升訂單交付時間的預測準確性,尤其是和樓層高度、小區配送和顧客交付相關的時間。為明確商家和騎手的責任,並方便顧客對商家和騎手進行公平評分,平臺應分別預測、顯示和評估「商家出餐時間」和「騎手送餐時間」。
【洞察】外賣配送場景中,預計送達時間(ETA)是用戶成功下單時刻到騎手將外賣送達顧客手中的送達時間預測結果。可分解為壓單時間(從商家接單到騎手接單)、到店時間(從騎手接單到騎手到店)、取餐時間(從騎手到店到騎手取餐)、送餐時間(從騎手取餐到到達用戶)以及交付時間(從到達用戶到完成送達),此過程還包含出餐時間(從商家接單到商家出餐)。派單算法應考慮騎手之間的訂單負載均衡,避免出現個別騎手承載過重的配送任務、而有些騎手被閒置的局面。同時,算法還應考慮騎手對區域的熟悉程度和配送經驗等。
【洞察】實時派單算法是智能配送系統中的重要組成部分。當前實時派單問題被描述為以離散馬爾可夫決策過程(Markov Decision Process)為核心的動態隨機優化問題,目標是一段時間內的顧客體驗(如,準時率)和騎手效率(如,單均行駛距離或單均消耗時間)等指標最優,算法需計算動態到達的訂單分配給騎手的策略以及每個騎手後續的節點訪問順序(即路徑規劃, routing optimization)。與派單算法緊密關聯的是路徑規划算法,算法應引入與實際路況更貼近的特徵,如,單行道、限行、機動車道和非機動車道,及交通管制和擁堵等,並根據實時信息調整。
【洞察】針對騎手路徑規劃,平臺需建立基於有向圖的實時動態路徑規劃模型,輸入該模型的可行路徑集合(set of feasible routes)需根據離線信息縮小,如,許多單行道、限行路線和過街天橋不允許電動車經過的路線,應作為強約束從集合中剔除;另外,該集合還需根據實時信息進行調整,例如,出現嚴重交通擁堵或臨時交通管制的路線也應被剔除。平臺端對算法參數及時審核併合理設置,是解決騎手困境的關鍵,應重點關注。
這個問題源於平臺在預測訂單「預計送達時間」(ETA)探索實踐中的模型迭代過程:在
實際ETA預估場景下,算法的損失函數設計是以「整體的預估結果能夠儘量前傾」為目的,且對遲到部分會增加數值懲罰,這意味著算法在不斷「逼迫」騎手縮短實際送達時間,而騎手每次成功避免超時的歷史記錄都會讓算法「學習」到可能更短的送達時間,即便是通過闖紅燈、逆行等違反交通規則的方式實現的。基於此邏輯,這些數據會進一步提高算法對騎手送達時間的「期待」,使算法朝縮短送達時間的方向進行要求和優化。
對此,平臺應通過對實際送達時間等算法的參數進行審核和調整以終止上述惡性循環,即賦予算法「底線思維」。遵守交通法規和維護行人安全是底線,是數據預處理環節進行歷史數據清洗和校正必須考量的因素,是數學模型中的「硬約束條件」,也是優化算法剔除不可行路徑中必須滿足的規則。這也意味著,訂單送達時間應存在一個合理的、無法通過算法優化而逾越的下限。否則,不管採用何種激勵機制和評分體系,缺乏「底線思維」的算法流程,會一直將騎手困在系統中。
平臺端-基礎設施建設針對最後100米配送,平臺可嘗試自建或聯合第三方物流公司建設
外賣取餐櫃。位置可為辦公場所、寫字樓、醫院及高校,顧客可選擇線上下單、線下取餐。
【洞察】取餐櫃選址將影響線上下單、線下取餐(buy-online-pick-up-in-facility)的便利性,平臺可進行兩階段的取餐櫃網絡設計優化:第一階段,平臺可結合各區域的人口社會統計、經濟發展、歷史完單及配送時長等多維度數據,建立機器學習模型和計量經濟學模型,以預測各區域潛在需求和建立取餐櫃對需求的影響;第二階段,平臺可建立取餐櫃設施選址(facility location optimization)和騎手服務區劃分(service region allocation optimization)的多階段隨機規劃模型(multi-stage stochastic programming),聯合優化取餐櫃位置和騎手派單服務策略。此外,在需求量較大的辦公樓、小區、學校和醫院等,平臺可考慮配備專職終端派送人員。終端配送人員對小區周邊和電梯設備更熟悉,有助於降低因騎手對環境陌生而造成的顧客等待時間,也能實現對局部區域的訂單統一管理和配送、從而避免騎手重複勞動。
【洞察】配備專職終端人員,在提昇平臺整體運營效率的同時,也會增加平臺運營成本,需進行深入的成本-效益分析。分析框架可將配送過程視為一個排隊系統 (queueing system) ,在指定場所配備專職終端配送人員,將增加固定人力成本,但值得關注的是,根據排隊論,騎手每單平均派送時間和顧客等待時間等系統的服務質量指標之間存在強烈非線形關係,這意味著,通過配備專職終端人員以適當降低騎手在這些場所的派送時間可能顯著提高系統服務質量指標,從而使得帶來的配送效益可能高於額外的人力成本。未來,平臺還可推廣機器人和無人機配送。平臺可通過相關核心技術的資本投入和技術積累,轉型為高科技公司。實際上,美團已嘗試無人車和無人機配送:2月疫情期間,外賣平臺利用無人配送車為北京順義幾個小區居民做訂單配送,截至9月初,平臺已累計使用無人車配送6000多用戶實際訂單,覆蓋該站點超過80%的訂單需求;目前平臺也在深圳等地進行
無人機運營測試。
【洞察】考慮到無人車成本方面的優勢和靈活性方面的不足,平臺可基於實際配送場景、市場供需狀態以及交通路況,採用馬爾可夫決策過程,聯合優化無人車和騎手之間的分配比例與配送路線。三、供需調節機制平臺可根據配送距離和配送時段等因素,合理設計基礎派送價格和騎手補貼;另外,平臺也可針對突變的供需情況,實時調整騎手配送費用,緩解供需不平衡。平臺可針對每筆訂單實行基於配送區域、下單時間或送達時間的動態定價,並對願意等待的顧客提供願等打折。
【洞察】基於區域和時間段的時空動態定價(dynamic & surging pricing)通常可分為「乘積溢價」(multiplicative surge)和「加和溢價」(additive surge)兩類:在特定區域和時段內,前者指在基礎價格上乘以一定倍數(如,1.5倍),美國網約車平臺Uber早期使用該類溢價策略;而後者指在基礎價格上加上與距離無關的常數(如,10元),這是Uber當前採用的最新溢價策略。研究表明,在供需動態變化環境下,相比乘積溢價策略,加和溢價策略是激勵相容 (incentive-compatible) 的定價機制。這為外賣平臺設計基於配送費的實時動態定價策略提供了方向。為彌補實時動態定價在區分顧客對等待時間的實際需求和時間敏感性方面的不足,平臺可建立靈活的用戶充值帳戶:高峰期時段,如果需要外賣儘快送到,顧客可向個人在平臺上的帳戶充入額外金額,這些資金不會流入騎手或平臺,只是在低峰期時段點餐使用。
【洞察】顧客在尖峰時段的充值行為,將傳遞出其對派送等待時間較敏感的信號,作為系統派單算法的依據,並且,顧客在低峰期使用帳戶餘額訂餐,可激發低峰時段的整體需求,充分利用閒散的備餐和配送資源,平滑市場需求。針對網約車的研究表明,一定條件下,合理設計用戶充值帳戶機制 (integrated reward scheme with surge pricing) 可實現多方共贏,提升顧客、司機和平臺的整體社會福利。增加兼職和眾包騎手平臺提升兼職和眾包騎手的運力佔比,有助於提高運力調整的空間和彈性,更有效地調節市場的供需平衡。
【洞察】平臺騎手分為專送全職和眾包兼職,前者工作時間固定並接受系統派單,後者靈活決定工作時間並可有限次拒絕派單。為提升整體運力供給,尤其是滿足尖峰時段的配送需求,平臺通常用現金獎勵方式補貼騎手。實證研究表明,網約車市場中,平臺補貼將從勞動者是否選擇工作和工作時長兩個維度影響勞動力供給,而且,兼職勞動者的收入供給彈性 (supply elasticity) 更高。(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)