八一八那些移動廣告作弊流量的淺潛規則

2021-02-15 艾奇SEM

點擊關注▲艾奇SEM

知識 | 經驗 | 資訊 | 資料 四大版塊

從SEM到網際網路整合營銷

作者:歐陽辰

來源:互聯居(ID:ConnectHome)

流量作弊瀰漫在網際網路廣告行業中,已經成為公開的秘密。

黑格爾的哲學命題」存在即合理「,往往被人濫用,其原意是「合理即合符某種規律」,通過黑格爾辯證法,不存在不變的東西,這個命題也可以解釋成「凡是存在的,都是應該會滅亡的」。 不知道虛假流量什麼時候會滅亡,那時這篇文章就失去意義了,不過既然這篇文章現在存在,那麼就是合理的(rational)。

今天的話題集中在移動流量作弊上面,作弊(反作弊)形式和技術與PC作弊不盡相同。PC的用戶標識通常使用瀏覽器的Cookie;而移動的標識通常是IDFA(蘋果),Google Ads ID(海外Android),IMEI(國內Android)。移動App有更多信號(機會)辨別真偽,PC瀏覽器的限制會比較多。

這篇文章就膚淺介紹一下虛假流量後的一些潛規律,很多分析都很淺顯,因此叫做淺潛規則

一、虛假流量的術語

本文聊的作弊流量,有好多種說法,側重點也不盡相同。

作弊流量(Fraud Traffic) :大白話,容易明白,就是騙人的流量

非人為流量(No-Human Traffic ): 這種流量特指一些Bot流量,機器模擬的;對於一些劫持的流量,有些灰色地帶,因此不夠準確。

非激勵正常流量(No-Incentive Traffic):有些流量雖然是人為流量,但常常是由某種誘惑而來(例如不合理頁面設計,獎券,紅包,遊戲點卡等),因此激勵流量通常轉化效果比較差。

無效流量(Invalid Traffic) :為了規避過於敏感的作弊(Fraud)而使用的術語,這樣不容易得罪人,無效流量中既有故意為之,也有無意為之的。

異常流量(Abnormal Traffic) :類似於無效流量,強調流量的異常性。

這些術語之間並沒有太多包含關係(或沒必要嚴格細分),更多的是用在不同的場景和角色。例如,有些研發人員關注No-Human Traffic(Bot Traffic) ;有些效果監測的公司更加關注計費的流量,因此願意使用invalid traffic;早期,這些流量都稱為Fraud Traffic,因此作弊流量也是一種常用說法。

二、移動廣告的業務模式圖

有錢的就地方就是作弊,常在河邊走,哪有不溼鞋?看看錢是如何流動的就可以理解其中利益關係。錢流的上遊是付錢的主,下遊的機構總想放大收入,那麼在付錢主的所能容忍範圍內最大化收入就是各個環節優化的目標。這是一個在限制條件下,單優化目標的問題。

常見流量作弊的動機:

1、媒體:製造虛假流量,提升收入

2、廣告代理/銷售:運營虛假流量,保證合同,提升收入

3、交易平臺:對虛假Supply審查不嚴格,提升收入

4、用戶:為獲得激勵(紅包,點卡等)而產生低(無)效果流量

5、廣告主:惡意消耗競爭對手的預算

三、移動廣告目前的虛假流量比例

由於虛假流量過於複雜和敏感,大家在報數的時候都是非常謹慎小心的。儘管如此,最後大家報的數字千差萬別,因此無法考證各個數據的置信度,大家參考一下就好。

1、ANA( Association of National Advertisers): 「聲譽差的交易平臺作弊流量達到25-50%,聲譽好的通常低於10%」。

2、AppFlyer:2016年,AppLift的報告指出34%的移動流量為有風險的虛假流量(Risk of fraud, 22%可疑,12%高風險) 。Android虛假流量比例大於iOS,系統版本約高,虛假比例越低。

3、秒針:2016年垂直網站與網盟媒體異常流量佔比最高。其中,垂直類媒體曝光異常大幅增至 24.93%,點擊異常中網盟類媒體最為明顯,佔比高達 71.07%。

4、AdMaster :2016年全年無效流量整體佔比為30.2%;下半年出現小幅度惡化現象,無效流量增加3.7%;

四、移動虛假流量的分類

虛假流量有很多種分類,各種分類都會有灰色的領域,下面我試圖用作弊的基本原理方式來分類,而且主要是針對移動的場景。更加全面和系統的分類,可以參考劉鵬老師的《網際網路廣告作弊十八般武藝》。

另外一種分類可以按照設備和人為的四象限分類:

五、移動反虛假流量的模型

在討論如何對付移動虛假流量的方法之前,我們先看看移動作弊的一些主要黑技術,做到知己知彼。

移動作弊中涉及很多黑技術,其中包括一下一些:

模擬器:BlueStacks, AndyWin, GenyMotion 

Spoofer: 不斷的修改機器的IP , IMEI, MAC等

Proxy: 網關,修改ISP, IP, UA , 設備類型等

蘋果: 沒有模擬器,主要通過硬體和軟體模擬

激勵流量(incent Traffic ): 真實人流量,但是轉化率差的流量

    ...

對於如何防範移動虛假流量,這確實是一個複雜的問題。並非沒有防範作弊的高端技術,也不是因為這個問題不夠嚴重,最主要的原因有三個。

例如,最近友盟+在法院起訴某家App刷量公司,理由是影響了友盟統計計算的正確性和公正性。目前法院並沒有判定,我也不得知其訴訟的合理性。打個比方,有一個刷牆公司把路上所有廣告牌都刷成某家公司,然後有一個品牌影響力排名公司去控告這個刷牆公司,嚴重影響了它的品牌排名公正性。總感覺這個邏輯,不算太對。我也確實非常討厭App刷量公司,但是從哪個角度去批判和懲罰他們,確實值得法律法規上更多的討論。

不聊倫理和法規,聊聊技術吧,我覺得技術上可以按照如下模型來對付虛假流量,這裡特指移動端。

硬體:手機擁有更多的硬體信息,因此通過硬體信息進行虛假流量的防範,可以防範通過非手機(即Bot,伺服器等)的虛假流量。雖然,現在手機系統提供了有一些標準函數可以獲得硬體信息,例如IMEI,MAC等,但這些函數很容易被一些通用軟體工具所攻破。另外,這個硬體標識的信息,也無法在伺服器端得到有效校驗。因此,在虛假流量的鬥爭中,第一步往往就是識別流量的來源,是真實手機,還是模擬器,伺服器模擬等工具。

規則策略:規則往往是最簡單有效的防範機制,例如,對於第一次訪問全新流量,將虛假流量的可能性設置為高。對於每天多餘X次的有規律訪問,堅決抵制等等。規則有很多很多,不斷的增加,修改,發展到最後,規則的匹配次序也成了一門藝術了。對於一些初級的造假者,往往會落到這些規則中。

機器學習:機器學習就是通過一些訓練數據集合訓練出一個分類器,對於一些特徵,訓練出一些權重信息,而後用於流量的分類識別上。做虛假識別的團隊很多時候在這個方向會越做越深,使用更多的特徵,使用更多數據,使用更加及時的數據,嘗試更多的模型。這個領域工作很「苦」,做嚴格了,收入可能受影像,做寬鬆了,廣告主投訴ROI下降,這種平衡有點裡外不是人。

智勇雙全:有些作弊並非一定通過死板的技術手段完成的,其實有很多五花八門的方法。舉例來說,通過加大對於媒體的懲罰力度,可以提高媒體的作弊成本,從而降低作弊率。另外,還有一種有趣的反作弊方法,叫做Honey Ad(有時也叫Bluff Ad),這些廣告有些特點(例如,預期點擊率很低),通過觀察點擊率是否和預期一樣,可以判斷流量是否是機器流量(機器流量無法判斷這些廣告的貼點)。

六、識別虛假流量的技術流派

這一部分主要是集中在通過機器學習的辦法辨識虛假流量的技術,有一大部分內容可以在相關的論文中找到。

6.1 分類方法

大部分算法工程師在處理虛假流量都是從分類技術開始的,構造一個分類器,找各種各樣的特徵,找到一些虛假流量的(例如轉化率異常)訓練數據。這種方法對於對於虛假流量的樣本非常依賴,不同的樣本很容易訓練出不同的模型,容易過渡擬合。 對於新的虛假流量模式,不容易及時發現。

常見的有邏輯回歸和貝葉斯方法,可以參考如下論文

《Measuring and Fingerprinting Click-Spam in Ad Networks》Vacha Dave etc. 

6.2 異常檢查(Anomaly-Based Detection) 

學術上有很多論文,討論通過聚類的方案識別異常流量,在移動端,可以通過跟蹤某一個用戶標識的歷史行為,各種上網行為,廣告請求行為,瀏覽行為,特別是跨媒體的使用情況,以辨別這個流量是否是正常手機的使用軌跡。

基於歷史信息和行業平均水平進行異常分析

基於時間的變化,發現一些突變點

這一技術在金融和交易的反欺詐,用的非常多,技術也非常繁多

常用方法可以聚類,分類或者內容分析;

6.3 APP的廣告作弊的自動化檢查

市面上有很多APP,那些APP是製作虛假流量的來源?有沒有什麼自動的檢查方法? 微軟有一篇論文就是介紹這方面的工作,通過自動運行APP,分析APP的廣告情況:太多廣告,廣告大小過小,重疊廣告等等。

2014,《DECAF: Detecting and Characterizing Ad Fraud in Mobile Apps》

6.4. 審計(Audit) 

審計是一種傳統的反欺詐方法,也是有效的,對於調查一些刷量問題也是有直接幫助的。

當有些在某些媒體(publisher) 點擊發生點擊

廣告平臺/廣告主向媒體發送一些審計的請求,確認之前受到的點擊的有效性(時間點,基本信息),而後進行對比。

6.5 偽廣告驗證(Honey Ads) 

廣告平臺發送一些小比例的廣告,例如一些信息提示,按道理,這些提示內容並沒有讓用戶Click的意圖。

如果這些偽廣告的點擊率,仍然很高,像其它的廣告點擊率一樣高,說明這些流量有問題。

6.6 設備ID的真偽辨別

在行動裝置上,對於設備ID的辨別可以極大的幫助識別虛假流量。有兩件事需要確認,第一,這個ID是有效的ID,第二,這個廣告請求確實是來自這個ID所在的設備。 

行動裝置ID也比較多,國內安卓以IMEI的MD5/SHA256為主;IMEI通常也會帶有製造商的一些基礎信息。 

如何確定這個ID是來源於真實的設備,這就需要利用硬體的技術,或則通過歷史數據的一些分析來看。例如有一個IMEI ,請求的IP來源忽悠不定,上午的IP在鄭州,下午在杭州和南寧等,或則不熟悉的地方,那麼這些廣告請求中,通常有虛假的成分。因此,對ID進行辨別,對常見ID可以採用輔助的技術進行識別,包括訪問頻率,IP範圍,瀏覽行為,搜索行為,APP事情情況等等,訪問時間等,而且可以通過數據鏈的方式來判定請求的真實性。

6.7 分享一些反欺詐的論文

這裡推薦老東家的一篇論文,《Click Fraud Detection: Adversarial Pattern Recognition over 5 Years at Microsoft》,這篇文章介紹了微軟2014年之前的一些心路總結,從RuleBitmap 到 Model Fighting,如何定義Metric (Value per Click)。我有幸與部分作者一起工作,期間真心感到反欺詐的工作的無冕之艱辛。

我收集了一些Papers,有興趣的同學可以到我的主頁上下載 

 http://www.ouyangchen.com/download

七、反作弊技術公司

1)  Integral Ad Science 

2009年成立的反作弊公司,保護品牌安全等,這家公司和尼爾森有很多合作, 詳情可見integralads.com

2)Solve Media 

專業提供CAPTCHA( "Completely Automated Public Turing test to tell Computers and Humans Apart")的服務,也就是驗證是否是人操作,而不是機器訪問。

3.Double Verify 

主要從事視頻的可見性的檢測,它和Facebook和Youtube都有合作,經過MRC的認真。

4. Forensiq

專業處理虛假流量的技術公司,在投前,投中,投後都能夠提供解決方案。 

八、最後不得不說的話

打擊異常流量,是一件苦勞總是多於功勞的事情,處理不利常常遭到廣告主的投訴以及平臺的信譽度下降,如果過於激進,廣告主消耗可能會顯著減少,交易平臺流水也會減少。反欺詐算法的同學通常需要保守各種算法規則的秘密,很多時候,一些新的規則上線,也不能大肆宣揚,只能暗中觀察效果,與非正常流量開始一波又一波的拉鋸戰鬥。

最後,為長期打擊反欺詐的同學鼓掌加油!

了解DSP廣告 | DSP主流平臺評測報告 | 遊戲APP推廣經驗 | DSP素材質量 | 手遊DSP投放報告 | 移動DSP攻略 | 移動DSP是啥 | DSP策略經驗分享 | 百度移動DSP | 開屏廣告 | UC頭條 | 今日頭條廣告投放機制與優化建議 | 今日頭條投放策略 | 今日頭條電商行業案例報告| 如何成為頭條廣告大神 | 今日頭條後臺操作說明 | 粉絲通優化實戰案例 | 原來你是這樣的粉絲通 | 粉絲通推廣效果分析 | 信息流廣告數據分析邏輯體系 | 粉絲通運營經驗 | 有道智選 | 頭條廣告創意優化技巧 | 成為DSP優化師

相關焦點

  • 移動廣告作弊流量的淺潛規則
    流量作弊瀰漫在網際網路廣告行業中,已經成為公開的秘密。不知道虛假流量什麼時候會滅亡,那時這篇文章就失去意義了,不過既然這篇文章現在存在,那麼就是合理的(rational)。今天的話題集中在移動流量作弊上面,作弊(反作弊)形式和技術與PC作弊不盡相同。PC的用戶標識通常使用瀏覽器的Cookie;而移動的標識通常是IDFA(蘋果),Google Ads ID(海外Android),IMEI(國內Android)。
  • 八一八近期有些泛濫的移動廣告作弊流量
    >流量作弊瀰漫在網際網路廣告行業中,已經成為公開的秘密。不知道虛假流量什麼時候會滅亡,那時這篇文章就失去意義了,不過既然這篇文章現在存在,那麼就是合理的(rational)。今天的話題集中在移動流量作弊上面,作弊(反作弊)形式和技術與PC作弊不盡相同。PC的用戶標識通常使用瀏覽器的Cookie;而移動的標識通常是IDFA(蘋果),Google Ads ID(海外Android),IMEI(國內Android)。移
  • Adjust CTO 深度剖析移動作弊: 打擊作弊需從定義開始(一)
    Adjust對防作弊行為有著獨特的見解。我們將諸如SDK 偽造(SDK Spoofing)之類的作弊行為 視為「方法」,即作弊者實施盜竊的手段。究其根本,移動廣告作弊只會發生於兩類已建立的結構(或「類型」)中的一種。也許這個觀點對一些人而言比較陌生,或並不重要。
  • 德國移動廣告分析公司adjust的反作弊之路
    這個產業鏈原本是正常的,但有很大的漏洞可鑽,其中一個主要問題就是刷量等作弊現象嚴重。經常出現的問題是,廣告主在得到了合乎要求的流量和安裝數據之後,卻得不到相應的投放回報,投放效率始終低下,出現這樣的情況,廣告主的廣告費多半是被通過刷量作弊給騙走了。
  • 揭秘網際網路廣告流量作弊
    在當下信息爆炸的網際網路時代,流量在一定程度上反映出網絡產品的用戶數量和受歡迎程度,成為判斷網絡產品的市場價值和市場影響力的重要因素。正是因為流量在網際網路世界具有至關重要的價值,不法分子便打起了刷流量的主意,企圖通過技術操作虛刷流量非法獲利,閆小軍就是其中一人。
  • 技術揭秘 | 網際網路廣告黑產盛行,如何反作弊?
    廣告作為網際網路公司商業變現最為直接快捷的途徑,廣告作弊已經形成了一個有完整鏈條的黑產行業。如何通過技術手段識別並防範廣告作弊?本文通過介紹常見的廣告計費模式和虛假流量的獲益形式和發生機制,分析廣告點擊反作弊的核心問題,分享相關的反作弊實踐經驗,詳解反作弊技術體系及核心算法。  本文作者:黎偉斌(德策),張紅春(樊遲),孟曉楠(瀟楠),周洋(賈讓)。
  • 機器人替你看廣告?秒針系統發布報告揭開異常流量的面具……
    這份數據來自全域測量及商業智能分析解決方案提供商秒針系統最新發布的《2019年度中國異常流量報告》,該《報告》基於客觀、準確的監測數據,全面揭示了中國數字營銷行業欺詐現狀。除了以往的PC、移動網際網路品牌廣告,報告還首次對NEW TV、線下戶外、網站留資、社交平臺及KOL等終端及媒體形式的異常情況進行了分析。
  • 廣告監測科普專欄Vol. 3|網際網路廣告異常流量二三事
    包括以下幾種:機器人和爬蟲或其他偽裝成合法用戶的流量數據非瀏覽器用戶代理或其他形式的未知瀏覽器帶來的流量超出頻次、時間間隔等目標設定的流量數據通過隱藏/堆疊/覆蓋或其他方式導致用戶無機會看到正常廣告內容的流量已知的來自數據中心的流量(指明顯具有非人類訪問廣告所在的特定網絡IP或IP段所產生的流量來源)預獲取或瀏覽器預覽的廣告流量已知的來自高危或作弊來源的流量基本信息缺失或不一致的流量(
  • 你真的了解廣告SDK嗎?| AdHub SDK
    作為目前主流的廣告變現接入方式,SDK對各類廣告形式的支持情況成為影響移動開發者收入、操作等的關鍵因素之一,同時因SDK安全性高和效果較好。SDK作弊成本較高前文提到廣告主是廣告鏈條裡最大的受害者,各種作弊手段在竊取廣告主的預算,可謂防不勝防。同時我們也必須認清一個事實,市場推廣往往是多平臺渠道並發操作,作弊很難徹底規避。但我們可以通過不斷提高作弊者的作弊成本來進行作弊防護以還數據本真。
  • 刷錢 作弊與被作弊 賺錢與整人
    聯繫客服說我要買帳號,買前要先驗號,遠程進後臺一看,公眾號涉嫌惡意點擊流量主廣告被禁1個月。懂了,月收入6000塊是刷的。國外lead項目,月賺萬刀的大神不少,他們註冊國外的廣告聯盟,從聯盟獲取廣告代碼放到自己的網站,惡意點擊廣告代碼賺錢。
  • 360聯盟:移動廣告聯盟業務啟動
    4月20日,360公司的商業流量推廣平臺360聯盟,在雲南大理舉辦以「尋盟未來、共創滇峰」為主題的分享峰會。360聯盟總監楊苗攜團隊與百餘名業內人士齊聚峰會,在峰會上正式啟動移動廣告聯盟業務,並對聯盟的現在和未來進行了分享和探討。
  • 程序化廣告購買+社會化媒體營銷,能帶給移動營銷怎樣的展望?
    我們通過技術手段對接到想要的媒體載體上,即通過DSP對接到Ad Exchange平臺,然後通過DMP資料庫找到想要的受眾群體,最終利用SSP把廣告投放落地,廣告主以競價形式買到自己想要的廣告流量。這其中有一個叫ATD的平臺,陽獅、奧美這樣的4A公司最近也在做這樣的平臺,與DSP對接,幫助廣告主實現程序化購買。
  • 重磅|熱雲數據TrackingIO防作弊衛士2.0版本全新上線
    移動營銷的快速發展,為移動廣告主帶來了巨大的收益,也滋生了各類作弊行為,對廣告主的推廣預算以及後續的推廣策略造成嚴重的損害。所謂移動應用廣告作弊是指在移動應用廣告推廣中,通過非法的技術手段偽造或劫持目標推廣應用的增量,並從中獲利的行為。隨著技術的發展和市場的變化,廣告作弊的方式將更具隱蔽性,越來越多的廣告主蒙受其害,對於作弊行為的甄別和防護刻不容緩。
  • 都說移動廣告市場被假流量玩壞了,但這家美國公司要公開透明地反欺詐
    從惡意廣告,到垃圾流量,無論是對於在國內還是想要出海的公司,各種形式的廣告欺詐都是一個越來越嚴重的問題。據美國研究機構Forrester Research預估,由於廣告欺詐而浪費的廣告費用將在2021年達到109億美元。這種情況之所以會出現,一個原因就在於廣告主和廣告平臺雙方缺少一個共同的終端查看數據,二者很難合作預防欺詐行為。
  • 網際網路中的海市蜃樓: 流量造假是如何扭曲、蠶食網絡營銷業的?
    流量造假的進階形態:移動端數據欺詐  隨著網際網路的形態發生變化,內容分發在網絡營銷產業中的地位與日俱增。當數據從門戶網站分流至社交平臺,從網頁端轉移至移動端之後,流量造假的形態也發生了重重迭代。 垃圾點擊
  • 怎麼選擇移動廣告聯盟,暢多網絡教你玩賺推廣
    什麼是廣告聯盟?廣告聯盟=廣告中介,它相當於是線下的介紹所,把所有站長們的網站整合起來,然後在把所有的廣告主整合起來,而自已去當一個中介,在中間收一點服務費用,眾觀以來,很多的網際網路巨頭都是這一種玩法比如:阿里巴巴、拼多多、淘小鋪、美團等......他們應用到的營銷策略,免費、資源整合。
  • 怎麼選擇移動廣告聯盟 暢多網絡教你玩賺推廣
    什麼是廣告聯盟?廣告聯盟=廣告中介,它相當於是線下的介紹所,把所有站長們的網站整合起來,然後在把所有的廣告主整合起來,而自已去當一個中介,在中間收一點服務費用,眾觀以來,很多的網際網路巨頭都是這一種玩法比如:阿里巴巴、拼多多、淘小鋪、美團等......  他們應用到的營銷策略,免費、資源整合。
  • 中國移動:無限流量卡每月流量上限100G,網友:這還是無限流量麼
    近日,一位來自溫州的移動用戶表示,日前其通過中國移動官方的「咪咕愛看」App完成各種任務獲得了 「咪咕愛看」App專用流量95.98GB,然而沒有想到是,這些流量還有3.39GB時卻無法使用。更離譜的是,自身套餐中還用13GB之多的通用流量也不能使用。
  • Adjust 發布年度全球移動數據基準報告
    ——印度尼西亞、巴西和韓國成為增長最快的應用市場報告顯示,應用在安裝後的第一周就會平均失去 79% 的用戶調查結果顯示,廣告欺詐依然是移動營銷商所面臨的重大問題,電子商務、約會和銀行應用是作弊的重災區北京
  • 天才槍手:天才大型作弊案的背後,是什麼改變了初心和正義
    這應該是我看過的第二部泰國電影,第一部是《初戀這件小事》,一個青春片一個關於作弊和犯罪的片子,好像沒什麼聯繫,但我總覺得他們都很真實,至少在演員的選角上,都很貼近人物形象,沒有為了一個流量的名頭特地去請一些大咖。