乾貨| Amazon數據分析面試題: A/B測試類問題該如何回答?

2021-01-07 網易

  

  A/B測試是數據分析面試題的常客

  不僅數據分析

  產品經理、運營、研發、算法、設計師都會用到

  今天Uni醬通過分析Amazon的面試真題

  梳理答題流程

  今日重磅福利

  

  全部推文福利,每周統一發送至Uni會員郵箱

  1

  A/B測試為什麼這麼火?

  A/B測試,不僅數據分析師用到,產品經理、研發、算法、設計師和運營也經常會用到。

  2008年歐巴馬競選美國總統的時候,有一個網際網路團隊專門負責競選相關活動的線上產品。這個團隊當時做了一個非常成功的實驗:通過對6個不同風格的主頁進行A/B測試,最優的版本將網站註冊轉化率提升了 40.6%,而這40.6%的新增用戶直接帶來了額外的5,700萬美金募捐資金!

  

  *圖片來源:網絡

  什麼是A/B測試?

  簡要來說,即是在產品(或某功能)正式上線前,有兩個即將面對用戶的版本,通過小範圍的發布得到不同反饋。比如針對某功能,評估如停留時長、跳出率等數據指標;針對某個產品,評估如DAU、下載量等數據指標。最終選擇用戶行為或收益更佳的版本。

  為什麼要用A/B測試呢?

  很多倡導數據驅動的產品,會通過大量的A/B測試實驗設置和相應的數據分析來了解業務的進展,再做決策,可以節省費用提高效率。

  下面我們就通過Amazon的面試真題來看看,回答A/B測試題的流程和具體步驟。

  2

  Amazon數據分析A/B測試面試題

  面試真題:你的團隊推薦了一個通過在網站上增加一個新的產品類別來提高收益的新方法,但是管理層擔心這個方法的有效性。你會怎麼做?

  第一步:提出假設

  在這個案例中,我們要測試「在網站上添加運動產品類別是否會增加收入?」

  為了更好地驗證、測試這個假設,我們需要將其分為兩個部分:

  

  在提出你的零假設和備擇 假設時,建議遵循 PICOT 格式

  

  在這個案例中,一個強有力的假設為:

  

  假設細分:

  

  對象(Population):訪問過"Amazon.com"網站的個人

  

  幹預(Intervention):運動產品的新產品類別

  

  對照(Comparison):瀏覽原網站布局的訪客

  

  結果(Outcome):購買率

  

  時間(Time):結束訪問Amazon.com的時間

  

  2

  第二步:建立隨機策略

  在面試中,有一個問題出現的頻率非常高,那就是:

  如何實現隨機?

  在這個面試題中,我們有兩種方式回答這個問題:

  

  第一種方案更適合這個具體案例,因為如果我們允許訪問者自行選擇是否加入測試,很可能會削弱A/B測試的有效性。

  3

  第三步:設置指標

  在指標設置這裡,涉及兩個非常重要的概念:敏感性(Sensitivity)和魯棒性(Robustness)。

  指標應該選擇我們關係的變化(敏感性),而剔除我們不關心的變化(魯棒性)。

  比如:均值(Mean)對異常值敏感,並且受這些觀察結果的影響很大。而中位數(Median)不那麼敏感,如果我們僅影響一部分用戶,即使是很大一部分,中位數也可能不會改變。

  4

  第四步:選擇樣本量

  通常,測試只會選取一部分人進行,並且我們要去確定這一部分人的數量,這樣做是因為萬一實驗不成功,不會對所有用戶帶來負面影響。保守來說,實驗一般涉及5%或更少的用戶群,之後才逐步推廣。

  如何確定測試中的曝光百分比?為此,需要回答以下三個問題:

  

  可用來測試的總人數是多少?

  

  估計對用戶體驗和業務的影響

  

  對開發團隊來說,測試和調試錯誤的難度如何?

  

  關於樣本量,在面試中可能會遇到以下問題:

  

  5

  進行測試

  進行測試,對比結果,是否丟棄零假設。在進行實驗並且收集了數據後,就要確定實驗組和對照組之間的差異是否是統計顯著的。如下幾步可用於確定:

  

  首先,需要設定你的 α值,出現 1 類錯誤的概率;

  

  通常 α 的值設定為 5% 或 0.05 ;

  

  其次,需要利用上面的公式計算 t-統計量進而得出概率值(p 值);

  

  最後,對比 p 值和 α 。如果 p 值大於 α ,不丟棄空假設。

  

  3

  A/B 測試常用理論基礎

  正交實驗

  廣泛使用多層實驗關係,使每一層都用同樣多的流量去做實驗,並且使各層實驗之間的結果不互相干擾。

  互斥實驗

  即實驗1中用到的流量,實驗2不能用。否則擔心各實驗間結果互相干擾,當然,它也有壞處,那就是實驗內容增多,每層實驗所分的流量變少。所以在大公司裡,不同功能上線前,經常發生各自部門搶流量來做實驗的事。

  中心極限定理

  大量相互獨立的隨機變量,其均值(或和)的分布以正態分布為極限。

  置信區間和顯著性

  它展現了這個均值範圍包含總體參數的概率,這個概率稱為置信水平。

  所以若我們在後期數據跟蹤與指標評估中,發現某些數值的顯著性明顯,那就得好好審視。

  

  由UniCareer獨家整理髮布, 如需轉載請註明來源

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 技術乾貨 | 如何選擇上班路線最省時間?從A/B測試數學原理說起
    但是,這裡有三個非常重要的關鍵點,是大家有必要進一步理解其數學理論原理的原因:1問題1怎樣驗證兩個組的用戶的行為是無偏差、完全相同的2問題2當兩個組的用戶行為不完全相同時(例如分組不夠隨機或者組內用戶數量較小時),該如何設計AB測試以實現期望的驗證結果3問題3當用戶基礎行為受其他因素影響發生整體變化了呢?
  • 「面試乾貨」組織活動類問題,該怎麼答?
    -文末附事業備考寶典-題型特點1.題目設問形式組織活動類問題在設問形式上最常見的形式為「如何開展」、「怎麼做」。【真題連結】單位安排你負責對全市範圍內外來務工人員的生活條件進行一次摸底調查,請問在工作 中應該注意哪些問題?你會如何去做?
  • 我回答過被淘汰
    我們去一家公司面試,如果問你工作,對公司的期望這些問題,你可能提前預習過,能侃侃而談,勝券在握,可要是讓你回答「如何把2元的礦泉水賣到100元」,「如何把梳子賣給和尚?」這些智力題,你就支支吾吾的卡殼了。一「卡殼」發揮的效果也會不好,最後只能被心儀的公司「等電話通知」了。
  • 死亡的第四類Amazon—假面騎士AmazonSigma(西格瑪)
    【假面騎士Amazon 西格瑪(Sigma)】死亡的騎士,假面騎士Amazon 西格瑪(Sigma)是《假面騎士Amazons》中登場的敵對角色,西格瑪都是屬於死過一次後被人為地改造而成的騎士或者amazon(阿媽粽)。前原淳生前為驅除班的人。前原淳是通過使用複製的仁叔的Amazons驅動器而使用變身。
  • 新媒體運營面試常見問題及回答技巧 面試中個人優缺點回答技巧
    面試才是重頭戲,面試官在面試時會問各種各樣的問題,從而確定誰是最佳人選。今天就給大家分享一些新媒體運營面試常見的面試問題及如何回答的技巧。  1,請你先簡單的做個自我介紹  這個問題雖然是面試所有崗位都會問的問題,但是每個行業及崗位的回答技巧是不一樣的。那麼面試新媒體運營崗位時應該如何自我介紹呢?
  • 春日裡的貼心乾貨 | 如何提高硬度測試的準確性
    春日裡的貼心乾貨:如何提高硬度測試的準確性三月伊始,正是數九歌中「八九燕來」的好時節。無論是南方太陽躲貓貓的陰冷,還是北方輕霾散繞的小無奈,都擋不住春芽萌發的生機勃勃。想起接下來的日子,會有春山綠柳花紅可賞,亦有春筍香椿馬蘭頭可嘗,是不是幸福感滿滿當當?
  • 數據結構java面試題及答案
    解決數組問題的關鍵是,你要對數組這種數據結構有一個深刻的認識,同時還要了解基本的程序流程如循環、遞歸以及基本的操作符。下面是一些經常問到和數組相關的面試題,你可以拿來練習:1、在一個給定的從1到100的整型數組中,如何快速找到缺失的數字?2、如何找到一個給定的整型數組中的重複數字?
  • 面試時如何回答「你為什麼選擇我們公司」這個問題?
    面試時被問到『你為什麼選擇我們公司』的時候,我們首先該想的不是問題的本身。而應該跳出問題本身來思考: 企業為什麼會問到這個問題?他們問這個問題的背後是想要獲取什麼信息?如果我們先把這幾個問題弄明白了,我們自然而然知道該如何合適的回答讓面試官滿意的答案。
  • 商業智能和數據分析之間的區別
    根據計劃審查組織的進度,並對該計劃進行正確的調整,需要衡量您如何朝著這些目標前進。   然而,分析的一個大問題是它們是100%後見之明並且在很短期內。這並不是說它們沒有用處或重要,因為它們可以根據過去的表現或現有客戶的行為幫助企業指向正確的方向。就像藝術家開始添加顏色之前的繪畫草圖一樣。
  • 回答讀者問題集錦(三)
    有些大家提出的問題,是很多老師都問過的。剛好我閃過一個想法,就是定期匯總比較典型,問得比較多的問題,弄一個回答問題集錦。這樣通過大家一起討論,也可以共同提高水平。距離上一次回答讀者問題集錦(二)的時間已經很長了,可能大家的水平真的越來越高了,提的問越來越少了。希望有一天大家基本上對公眾號的文章都看懂了,那這個時候大家的水平就已經很高了。
  • 面試必問考題,你知道該如何回答嗎?教你定製專屬「黃金回答」
    作為求職者,如何在回流的「找工作」潮中殺出一條血路呢?如何讓面試官在成百上千的求職者中相中你呢?在日常生活中的大部分面試,其實都是有規律可循的。很多事業單位的面試基礎問題都大致相同,可總能分出高低來,究竟如何回答面試問題才能脫穎而出?
  • 單元測試 vs 集成測試,你該怎麼選?
    在我看來,集成測試和單元測試是健壯軟體的基石。因此,今天讓我們看看單元測試與集成測試之間的區別,以及你什麼時候該選擇哪種測試。什麼是一個單元?一個單元是邏輯上分離的最小代碼塊單元測試是一種孤立地測試儘可能小的代碼片段的測試。那麼,什麼是一個單元?術語「單元」來自數學。數字 1 被認為是單元,因為它是最小的自然數。它是最小的正整數。
  • 如何在Prime Day免費獲得Amazon Prime
    如果您看到一個顯示「開始30天免費試用」的按鈕,請單擊該按鈕進行註冊。如果按鈕說「開始使用」,那麼你最近已經去過井了太多次了,你將不得不等待再次獲得免費試用。方法二:Prime學生6個月免費試用亞馬遜有一個學生計劃,提供持續六個月的免費試用和Prime會員正常價格的50%。
  • 有問題的問題,應該如何沒問題的回答
    而令人大跌眼鏡的是,在律師事務所收到的不計其數的回答中,只有一個7歲小男孩約翰的回答「扔最胖的人,因為他最重。」勉強算得上正確答案。於是,約翰一個人繼承了億萬英鎊的遺產。這個故事是根據歷史上一個真實事件改編的,你可能看過類似的案例,已經提前知道了問題的答案,但你是否知道為什麼只有一個七歲的孩子才能做出正確回答呢?
  • 拼多多2020屆數據分析面試題合集
    拼多多2020屆數據分析面試題總共分為學霸批、尋夢批、正式批三批,面試題合集並沒有按照批次進行整理,畢竟也沒啥規律可循。回答的很不好,不會回答這種問題,區別很多...你認為一個數據挖掘或數據分析的流程是怎樣的,有什麼需要注意的重點?場景題:1.上海有多少量公交車?
  • 【乾貨】汙水處理常見泡沫、浮渣問題及解決對策之26-55問
    北極星水處理網訊:上一期為大家盤點了汙水處理中常見問題及解決對策之泡沫、浮渣類問題中的1-25問,今天為大家分享26-55問。問題26:為什麼二沉池面帶有腥味且未進水有泡沫?回答:如果生化池也有腥味的話,基本是汙泥濃度較高,氣溫也高,所以,在二沉池上可以感受到腥味。
  • AWS發布新一代Amazon Aurora Serverless
    AWS還宣布了Babelfish for AuroraPostgreSQL,作為Amazon Aurora的一項新功能,該功能讓客戶在幾乎無需更改代碼的情況下,直接在Amazon Aurora PostgreSQL上運行SQL Server應用程式。
  • 乾貨 | BD是什麼?我來告訴你
    BD測試通常採用由特殊熱敏指示油墨印刷出BD圖的測試卡或測試紙來顯示測試結果,若BD圖變色均勻徹底,表示該滅菌器抽真空效果和蒸汽穿透效果良好。BD測試一般是在空載情況下進行的。最好還是選擇與滅菌參數對應的BD測試包。
  • 人工智慧測試:關於無人車測試的案例研究
    在享受人工智慧的帶來的各種便利的同時,也帶來一些疑問:如何保證人工智慧機器按照人類設計的思路來正確運行?無人駕駛車輛是否會在某些極端環境中失控照成事故?廚房機器人是否會把房子點燃?基於以上,我們迫切的需要對人工智慧的可靠性進行規範的測試和衡量。