技術揭秘 | 網際網路廣告黑產盛行,如何反作弊?

2021-01-07 網易

  

  導讀:有人的地方就有江湖。廣告作為網際網路公司商業變現最為直接快捷的途徑,廣告作弊已經形成了一個有完整鏈條的黑產行業。如何通過技術手段識別並防範廣告作弊?本文通過介紹常見的廣告計費模式和虛假流量的獲益形式和發生機制,分析廣告點擊反作弊的核心問題,分享相關的反作弊實踐經驗,詳解反作弊技術體系及核心算法。

  本文作者:黎偉斌(德策),張紅春(樊遲),孟曉楠(瀟楠),周洋(賈讓)。

  背景

  世界廣告主聯盟WFA表示[1]「若不採取措施,2025 年虛假廣告花費將高達 500 億美元,僅次於毒品交易金額,成為世界第二大非法營收」。

  網際網路行業發展的幾十年來,已經滲透到生活的方方面面,各種網際網路公司層出不窮。網際網路公司的商業變現途徑已經發展出引流、電商、遊戲等多種流派,但是廣告變現作為一種最快捷和直接的變現途徑,依然佔據著整個行業的大半壁江山。國際國內的各大網際網路公司如:Google、Facebook、百度、阿里、騰訊、字節跳動、各大門戶或視頻網站,廣告收入佔其總收入的比例都非常高。有人的地方就有江湖,有江湖的地方就有紛爭。網際網路廣告也引申出了作弊與反作弊的紛爭。網際網路廣告作弊已經成為了一個有完整鏈條的行業,而反作弊部門也成為了各大依靠廣告變現公司的標配。

  一 常見廣告計費模式

  一個網絡媒體(網站)會包含數十個甚至成千上萬個頁面,網絡廣告所投放的位置和價格就牽涉到特定的頁面以及瀏覽人數的多寡。這好比平面媒體(如報紙)的「版位」、「發行量」,或者電波媒體(如電視)的「時段」、「收視率」的概念。網絡媒體常見的廣告收費模式[2]有CPM、CPC、CPA、CPT、CPS、CPI, 下圖是各種廣告計費模式的邏輯和作用:

  

  1 CPM

  英文全稱Cost Per Thousand Impression,也稱每千次展示的成本。CPM是一種展示付費廣告,只要展示了廣告主的廣告內容,廣告主就為此付費。由於展示了廣告就可以收費,不關心用戶是否有後續互動轉化,因此這種廣告的費用也是比較便宜的。按此計費的廣告一般是以展示為目的,如開屏廣告。

  2 CPC

  英文全稱Cost Per Click。CPC是一種點擊付費廣告,根據廣告被點擊的次數收費。每一次點擊計一次費, 因此即使向1000個訪問者展示了你的lander頁面,但是只有1個人點擊了你的lander,也只按照1次點擊進行計費,因此可以說CPC這種模式在廣告測試的初級階段使用較為合適,為確定對你的產品感興趣的目標人群的流量而付費,可以在測試的早期快速收集廣告數據,儘快定位出目標人群畫像,為下一步擴量的投放做準備。最常見的如搜尋引擎關鍵詞廣告採用這種定價模式,比較典型的有Google的AdSense、百度鳳巢競價廣告以及淘寶的直通車廣告。

  就是每一次點擊計一次費,但有些聯盟是有明確規定的,每個ip在一段規定的時間內只扣費一次,這樣的方法可以增加作弊的難度。但是此類方法就有不少人覺得不公平,比如雖然瀏覽者沒有點擊,但是他已經看到了廣告,對於這些看到廣告卻沒有點擊的流量來說,廣告成了白忙活。

  3 CPA

  英文全稱Cost Per Action。CPA是一種按廣告投放實際效果計價方式的廣告,而不限廣告投放量。CPA的計價方式對於網站而言有一定的風險,但若廣告投放成功,其收益也比CPM的計價方式要大得多。因為CPC有可能存在欺騙性(比如典型的機器人刷點擊),所以就產生了CPA。比較常見的CPA計費方式的廣告有註冊帳號、電商場景的加購物車或者收藏、微信的關注公眾號等。

  4 CPT

  英文全稱Cost Per Time。CPT是一種以時間來計費的廣告,國內很多的網站都是按照「一個月多少錢」這種固定收費模式來收費的,這種廣告形式很粗糙,無法保障客戶的利益。但是對網站來說CPT的確是一種很省心的廣告,能給網站帶來穩定的收入。

  CPT是品牌廣告的報價方式,這種收費模式簡單易用,廣告主自主選擇的空間大。但是CPT沿用幾年,廣告主漸漸發現這種收費形式缺乏說服力。對客戶和網站都不公平,無法保障廣告客戶的利益。由於各大媒體尚未能實時地公布其每天的不同頁面的日訪問量和日不重複訪客數,因此,廣告主在衡量廣告投放效果時只能根據媒體公布的數據進行估算,這種評估方法難以體現網際網路廣告所應有的精確性和實時性,而只是根據經驗估算出廣告所能傳達到的用戶數量及相應所需付出的費用。同時一個越來越明顯的趨勢是隨著媒體頁面訪問量的不斷變化提高,媒體缺乏有力的第三方數據向廣告主證明這種頁面訪問量增長的準確可靠性,只能被動地每半年或每一年調整一次價格,以提高自己的收人。

  電商網站主頁中間位置的鑽展和門戶網站的包月廣告都屬於這種CPT廣告。適合垂直行業平臺展示廣告位,類似地鐵廣告、電梯廣告等戶外廣告也是這種類型,通常按周、月進行銷售。

  5 CPS

  英文全稱Cost Per Sales。CPS是一種以實際銷售產品數量來計算廣告費用的廣告,這種廣告更多的適合購物類、導購類、網址導航類的網站,需要精準的流量才能帶來轉化。

  這種模式的好處是相對容易得到廣告主的認同,只需要在完成一單訂單後才會支付相應的廣告費用,不好的地方是在現有條件下,會導致廣告資源的浪費,例如一個網站投放了CPS廣告,10000個訪客中可能會有100個人對產品感興趣,而100個人中間只有10個人最後完成了購買的轉化,但另外9900個流浪其實就浪費了。所以大型媒體一般不會採用這種結算方式,採用此類方式的媒體一般處於長尾端利基產品進行廣告投放。因為推廣效果能夠比較準確的計量與評估,對於廣告主而言,CPC、CPA、CPS方式比CPM、CPT模式更加有利。

  6 CPI

  英文全稱Cost per install。按每次裝機付費,是移動端APP推廣常用的計費模式。

  二 虛假流量的獲益形式和發生機制

  1 廣告投放流程

  下圖是廣告投放流程[1]:

  

  2 獲益方式

  廣告作為網際網路最主要的盈利模式,利益誘惑下部分流量提供方會有作弊動機。下圖[1]是幾種常用廣告計費模式對應的獲益方式。

  

  3 發生機制

  機器作弊[1]成本低,特徵集中,容易識別;人工作弊成本高,作弊者要想獲利也會表現會一定的集中性,需要深入分析數據挖掘異常特徵,從而識別作弊。

  

  三 廣告點擊反作弊核心問題

  世界廣告主聯盟WFA表示[1]「若不採取措施,2025 年虛假廣告花費將高達 500 億美元,僅次於毒品交易金額,成為世界第二大非法營收」。

  網際網路行業發展的幾十年來,已經滲透到生活的方方面面,各種網際網路公司層出不窮。網際網路公司的商業變現途徑已經發展出引流、電商、遊戲等多種流派,但是廣告變現作為一種最快捷和直接的變現途徑,依然佔據著整個行業的大半壁江山。國際國內的各大網際網路公司如:Google、Facebook、百度、阿里、字節跳動、各大門戶或視頻網站,廣告收入佔其總收入的比例都非常高。有人的地方就有江湖,有江湖的地方就有紛爭。網際網路廣告也引申出了作弊與反作弊的紛爭。網際網路廣告作弊已經成為了一個有完整鏈條的行業,而反作弊部門也成為了各大依靠廣告變現公司的標配。

  虛假流量的存在,讓數字廣告行業遭受前所未有的信任危機。具體危害主要表現在:

  

  

  

  下述探討按CPC計費的廣告點擊反作弊。

  1 無效點擊定義

  點擊反作弊的工作目標是把流量中存在的「無效點擊」過濾掉。對於「無效點擊」的定義,維基百科上的定義如下:

  

Click fraud occurs in pay per click online advertising when a person, automated script or computer program imitates a legitimate user of a web browser clicking on an ad, for the purpose of generating an improper charge per click.

  簡單來說無效點擊是指在CPC計費的廣告系統中,以人工或者機器手段蓄意造成的非以轉化為目的的廣告點擊行為。

  2 廣告點擊業務的運轉邏輯

  下圖[3]是廣告投放過程涉及的4個角色,他們的基本功能和訴求如下:

  

  

  

  

  

  

  下表介紹了上面5個角色的在廣告產業鏈中「提供的服務、利益訴求、作弊動機」。這些作弊者是黑產中的一部分,另外一些專業黑產為上述作弊者提供專業的作弊服務(比如養的批量帳號,比如提供可以修改點擊者環境信息的作弊器),以收取服務費。

  

  3 反作弊的意義

  

  

  廣告點擊反作弊表面上是過濾了點擊,減少了營收。實際上是過濾廣告主認為不該扣費的點擊,保障廣告主的正常投放廣告,提升廣告主對平臺的信任度,為廣告業務的發展保駕護航。

  正如CRO的使命中所說「反作弊的使命是讓消費者安心,讓業務方/商家與合作夥伴省心,讓監管單位放心,讓作惡者灰心」。

  4 反作弊的難點

  業務視角的難點

  很贊同大家提的反作弊要儘量做到「上醫治未病」、「遏制劣幣驅逐良幣」以及反作弊要做到「水不驚魚不跳」、「沒有人知道我的存在就是我做得好的一個表現」。這是對平臺發展、買家和賣家體驗的義無反顧的責任,做得不好的時候別人很快就知道我的存在了,但是做到「風平浪靜」的時候怎麼證明是反作弊的貢獻呢?準確過濾的作弊量一定程度上反映問題。客戶的體驗和信任度也反應反作弊的價值。

  技術視角的難點

  

  

  

  5 作弊動機

  在整個行業中每個角色在整個鏈條中利益訴求不盡相同,其作弊動機也不一樣,接下來我們單獨分析每個角色的作弊動機及利益所在:

  

  

  6 作弊類型

  

  

  

  7 評價反作弊效果的方法

  以下對比我們與阿里媽媽、百度鳳巢的主要評價指標,主要評價指標均是準確和召回兩個視角。召回視角比較相似:都是客戶感知,客戶賠付次數和賠付金額。以下對比準確視角的指標。

  我們評價過濾準確的方法

  準確視角:新策略上線前,計算其近似準確率的邏輯為「大盤點擊的轉化率/新策略單獨識別點擊的轉化率」大於 X,值越大越準確,具體閾值根據業務統計數據和人工評測確定

  阿里媽媽評價過濾準確的方法

  準確視角:藉助淘系閉環轉化效果,估算準確率置信區間。

  百度鳳巢評價過濾準確的方法

  準確視角:人工抽樣,可視化的評測各個維度的統計分布特徵,然後計算準確率。

  我們與阿里媽媽均是電商業務,有轉化數據,比較適合用轉化率指標。百度鳳巢代表的其他無轉化指標的廣告系統,適合人工評測。

  另外關於轉化率可以根據業務定義,比如騰訊APP推廣反作弊系統會讓各個APP設定轉化指標,如留存、激以及電商場景的收藏、加購物車等。

  四 反作弊技術體系

  反作弊非常重要的一點是數據分析,本文暫不展開。下述技術已經應用到多個業務的廣告點擊反作弊中,下述技術不僅適用於按CPC計費的廣告點擊反作弊,多數技術也適用於其他計費模式(CPM/CPA/CPS/CPI)的反作弊。

  1 技術體系大圖

  

  數據層

  線上系統使用了用戶歷史多天的站內全鏈路行為數據,和最近的曝光、點擊數據。行為反映用戶的意圖,在行為序列模型TextCNN、BiLSTM、Bert和GraphSage裡都用到了用戶的歷史行為序列。

  算法層&應用層

  如前面所述,作弊和反作弊都在不斷迭代升級。目前的算法主要集中在人工經驗規則、統計策略、機器學習和深度學習模型、圖模型。

  下述簡單介紹算法迭代的過程,詳細介紹請參考後面核心算法部分。

  

  

  

  

  架構層

  廣告點擊涉及到錢,時效性要求高,所以必須有實時反作弊;但是實時策略只能看到當前點擊之前的數據,不能看到點擊之後的數據,可能存在少量判斷不準的情況。故我們增加了小時級別的離線模型,使用更多數據提升準確率和召回率。

  

  運營平臺

  

  

  

  2 規則與模型對比

  新型作弊大規模出現時,非常影響客戶體驗,進而影響業務發展,規則適合解決這種緊急出現的大規模作弊;且規則容易實時部署;且規則可解釋性強,早期的反作弊中使用較多,正因為這個原因,微軟的廣告反作弊系統2016年主要還是規則;再者反作弊場景天然缺少作弊樣本,也是規則受歡迎的一個原因。但由於規則過於依賴人的經驗,且維度單一,容易被作弊者繞過,在作弊退去時可能因為準確率變低而誤過;另外一個規則解決一類作弊的話,後期會出現規則過多,維護成本高。另外統計規則為了保證準確率段首較大。

  當規則和人工經驗多了會積累作弊樣本,這時候將規則作為模型的特徵訓練模型,讓模型自己學作弊的特點以召回作弊。由於模型使用特徵較多,準確率更高,且一定程度上解決規則的段首問題。

  

  3 樣本工程

  

  

  

  

  

  4 特徵工程

  一般來說,真實流量一般自然 (真實的流量在各個維度中表現一定是自然的)與多樣(網民的喜好各不相同,行為一定也是多樣的)。而對於虛假流量,常表現出一定的目的性(虛假流量的產生一定和某個特定的目的有關)和規律性(特定的目的導致虛假流量一定有特殊的規律)。

  由於虛假流量與真實流量在具體訪問行為有較大差異,圍繞用戶行為可從以下幾方面識別出虛假流量。

  模型的特徵值或者規則是由下述的「維度*特徵*類型」組合而成的,其中類型是通用的,支持配置。

  維度

  常用維度:時間&地域維度、終端類型、作業系統、聯網方式、瀏覽器、設備介質、IP、廣告主帳號、refer、query集中等。

  下面以時間維度&地域維度舉例:正常的流量訪問分布在一天中的各個時段、地理分布較為均勻(區域性投放或者活動除外)、訪問趨勢較為平緩。而虛假流量出現時間段特殊、來源區域集中、趨勢突增的情況。因此,通過流量產生的時間、地理位置、訪問趨勢變化都可以成為判斷虛假流量的參考方式。

  同理用戶的終端類型、作業系統、聯網方式、瀏覽器、設備介質、IP、廣告主帳號、refer、query集中等屬性,同樣可以成為判斷虛假流量的參考標準。

  特徵

  1)產品參與度

  具體包括平均訪問深度、平均訪問時長、用戶行為路徑、滑鼠點擊位置等。

  

  

  

  

  2)轉化情況

  很多作弊流量可以模仿人類行為,成功繞過平均訪問深度和停留時長這些宏觀指標,但是要模仿一個業務轉化就比較難了,如果宏觀指標表現很好,業務轉化很少的話,就需要提高警覺。當廣告主被惡意攻擊時,其點擊擊率會突然變高或者推廣時長突然變低。

  類型

  以下的策略類型均可配置「特徵」和「維度」。

  

  

  

  

  

  

  

  

  5 主動發現作弊

  主動發現作弊是為了在客戶申訴前發現並召回作弊,以提升客戶體驗,但其實也已經出現作弊了。

  

  

  

  

  6 核心算法

  識別機器作弊(點)

  識別個人簡單作弊(線)

  在作弊者升級到人工作弊後,我們會升級到計數、比例、分布等統計策略和行為序列模型。我們稱之為線上反作弊。

  下圖是我們發現的網站某行業出現的一類攻擊,作弊者只訪問A、B、C、G共4類頁面,因為他的目的就是點廣告。正常用戶訪問頁面很豐富。還會訪問D、E、F、H等頁面,想諮詢買東西。

  我們將用戶近7天在網站的訪問頁面序列作為特徵,識別本次點擊是否是作弊點擊。先通過Word2Vec對每個頁面進行文本向量化編碼。然後模型預測向量序列是否是作弊點擊。

  

  1)TextCNN

  TextCNN[9]是利用卷積神經網絡對文本進行分類的算法,輸入是詞向量,最後一層full connected網絡輸出預測結果。

  卷積神經網絡的核心思想是捕捉局部特徵,對於文本來說,局部特徵就是由若干單詞組成的滑動窗口。卷積神經網絡的優勢在於能夠自動地對特徵進行組合和篩選,獲得不同抽象層次的語義信息。如圖所示:

  

  下圖的輸入是一個用預訓練好的詞向量(Word2Vec)方法得到的一個Embedding layer。詞向量的維度是固定的,相對於原來的One-Hot編碼要小,同時在新的詞向量空間語義上相近或者語法相近的單詞會更加接近。兩個維度,橫軸是單詞、縱軸是詞向量的維度(固定的)。我們的場景的模型結構圖如下:

  

  2)BiLSTM+Attention

  我們也嘗試了BiLSTM+Attention[10],即雙向LSTM挖掘行為序列上下文關聯信息。LSTM依據之前時刻的時序信息來預測下一時刻的輸出,但在有些問題中,當前時刻的輸出不僅和之前的狀態有關,還可能和未來的狀態有關係。Bi-LSTM可以看成是兩層神經網絡,第一層從左邊作為系列的起始輸入,在文本處理上可以理解成從句子的開頭開始輸入,而第二層則是從右邊作為系列的起始輸入,在文本處理上可以理解成從句子的最後一個詞語作為輸入,反向做與第一層一樣的處理處理。最後對得到的兩個結果進行處理。在我們的場景中即理解為正常點擊的用戶行為序列和作弊點擊的用戶行為序列從左往右和從右往左都有較大的區分性。LSTM雖然能獲取歷史信息,但是不能突然重要信息,為了更好的篩選歷史信息中的重要信息,增加了Attention。

  

  3)Bert

  BERT (Bidirectional Encoder Representations from Transformers)模型是谷歌提出的基於雙向Transformer[11]構建的語言模型。通過海量語料預訓練,得到序列當前最全面的局部和全局特徵表示。

  

  BERT[12]網絡結構如上圖所示,Bert的內部結構是多個transformer 的encoder,從上圖可以看出Bert是雙向結構的,transformer 的encoder如下圖所示。encoder包含一個Multi-Head Attention層和一個前饋神經網絡,self-attention能幫助當前節點既關注當前的詞又能獲取到上下文的語義,Multi-Head Attention擴展了模型集中於不同位置的能力。

  我們選擇BERT-Base,Uncased模型。在做文本分類項目時,只需要修改run_classifier.py文件的數據預處理類。

  

  4)三者效果對比

  

  

  識別個人高級作弊(面)

  在我們識別上述作弊後,接著作弊者又升級高級的人工作弊,模擬人的點擊,儘可能的各種特徵上不集中,但是畢竟作弊者要達到收益的話,需要有一定的作弊量,而他們不知道正常點擊的真實分布,自然的會在一些維度上出現異常,故我們反作弊算法升級到無監督相對熵模型,再後面有樣本了升級到有監督的GBDT和Wide&Deep,均是從多個維度和特徵上識別作弊。我們稱之為面上反作弊。

  1)相對熵

  下圖是正常點擊和疑似作弊點擊的訪問時長的分布。在我們沒有其中的作弊點擊標籤時,我們使用相對熵識別作弊點擊。

  

  我們先計算N個特徵的異常分,再計算M個維度的異常分,最後求和。

  實際使用中,我們發現相對熵的一個缺點是新出現的作弊會帶偏基準,從而導致誤識別。由於相對熵模型是把線上策略識別為正常點擊的做基準,當新型作弊出現時,我們不能及時識別,會將其當做基準,從而基準不準確。另外就是相對熵在識別時的候選樣本不能包含大規模機器攻擊,它們也會帶偏分布。即使用時待識別樣本中需要剔除規則識別的特徵非常集中的點擊。

  2)Wide&Deep

  Wide&Deep[13]通過分別提取wide特徵和deep特徵,再將其融合在一起訓練,我們場景下模型結構如下圖所示。

  wide是指高維特徵和特徵組合的LR。LR高效、容易規模化(scalable)、可解釋性強。出現的特徵組合如果被不斷加強,對模型的判斷起到記憶作用。但是相反的泛化性弱。deep則是利用神經網絡自由組合映射特徵,泛化性強。deep部分本質上挖掘一些樣本特徵的更通用的特點然後用於判斷,但是有過度泛化的風險。算法通過兩種特徵的組合去平衡記憶(memorization)和泛化( generalization)。為了進一步提升高級人工作弊的召回率,減少統計規則的段首漏過,使用前面的一些規則和有監督模型挖掘的轉化率較低的比較準確的作弊樣本作為訓練樣本,線上統計規則作為模型的特徵,訓練Wide&Deep模型識別作弊。

  我們的場景中的特徵有:ip、memberid、refer等維度的計數、比例、分布、distinct等類型特徵。

  

  識別團夥作弊(體)

  我們也發現一些團夥攻擊廣告主,特徵表現為先是一個cookie換不同ip,再是ip下換多個cookie和utdid。每個設備介質點擊次數較少,繞開了前面的統計策略,也有些點的多的段首漏識別了。而由於我們的CPC較高,客戶感知無效點擊較明顯。我們先是升級聯通圖解決同行攻擊和點自己的作弊,再升級圖神經網絡GraphSage等模型識別作弊團夥。我們稱之為體反作弊。

  圖神經網絡[14][15][16]GraphSage[17]的異構網絡適合我們的場景。下圖是GraphSage兩層從鄰居聚合特徵信息的示意圖:

  

  在我們的場景中,ip、utdid、cookie等介質組成的異構圖神經網絡,下圖中紅色框的seller是為了示意被一個團夥換介質攻擊,實際構圖中沒有seller。即將強/弱介質連接的團夥的特徵進行聚合。

  

  頂點和邊特徵:介質近30天的作弊信息和站內行為數據。

  

附錄 [1]神策數據:數字廣告投放中虛假流量的排查與判定 [2]https://wiki.mbalib.com/wiki/%E5%B8%B8%E8%A7%81%E5%B9%BF%E5%91%8A%E6%94%B6%E8%B4%B9%E6%A8%A1%E5%BC%8F%E5%A4%A7%E5%85%A8 [3]https://www.weiyangx.com/335277.html [4]Nitesh VC, Kevin WB, Lawrence OH, Kegelmeyer W. SMOTE: synthetic minority over-sampling technique. J Artif Intellig Res. 2002;16:321–57. [5]Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. In NeurIPS, 2014. [6]Fiore U , Santis A D , Perla F , et al. Using Generative Adversarial Networks for Improving Classification Effectiveness in Credit Card Fraud Detection[J]. Information Sciences, 2017:S0020025517311519. [7] https://mp.weixin.qq.com/s/w7SbAHxZsmHqFtTG8ZAXNg.異常檢測的N種方法,阿里工程師都盤出來了 [8]https://www.alibabacloud.com/blog/alibaba-engineers-have-worked-out-loads-of-methods-to-detect-anomalies_595452.Alibaba Engineers Have Worked out Loads of Methods to Detect Anomalies By Li Weibin, Hu Yi, and Wang Hao. [9]Yoon Kim. Convolutional neural networks for sentence classification. In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 1746–1751, Doha, Qatar, Oct. 2014. Association for Computational Linguistics. [10]. Sepp Hochreiter and Jurgen Schmidhuber. 1997. Long short-term memory. Neural computation, 9(8):1735–1780. [11].Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Advances in neural information processing systems. 2017: 5998-6008. [12].Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018. [13].Cheng H T, Koc L, Harmsen J, et al. Wide & Deep Learning for Recommender Systems, ACM Computing Surveys. 2016 [14]. Jie Zhou, Ganqu Cui, Zhengyan Zhang, Cheng Yang, Zhiyuan Liu, and Maosong Sun. Graph neural networks: A review of methods and applications. CoRR, abs/1812.08434, 2018. [15]. Z. Wu, S. Pan, F. Chen, G. Long, C. Zhang, and P. S. Yu. A comprehensive survey on graph neural networks. arXiv preprint arXiv:1901.00596, 2019. [16]. Ziwei Zhang, Peng Cui, and Wenwu Zhu. 2018. Deep learning on graphs: A survey. arXiv preprint arXiv:1812.04202 (2018). [17]. Will Hamilton, Zhitao Ying, and Jure Leskovec. Inductive representation learning on large graphs. In Advances in Neural Information Processing Systems, pages 1025–1035, 2017.

  

  有一臺雲伺服器可以做什麼?阿里雲開發者成長計劃通過真實的雲環境、6大業務場景和專業指導,幫助開發者深入體驗學習雲開發技術,全面掌握雲上技能。新用戶還可優惠專享輕量應用伺服器,1核2G 5M,內置WordPress等8種主流環境,輕鬆滿足學習需要!

相關焦點

  • 騰訊燈塔&秒針系統:2018廣告反欺詐白皮書(附下載) | 網際網路數據...
    騰訊燈塔攜手秒針系統共同發布《2018廣告反欺詐白皮書》(以下簡稱為「白皮書」),從數字廣告作弊整體現狀、作弊技術構成和反作弊解決方案與安全建議三方面展開了全面專業的剖析。《2018廣告反欺詐白皮書》發布是騰訊燈塔與秒針系統的再度合作,在2017年白皮書的基礎上,進一步披露了目前廣告營銷市場黑產產業鏈情況,深入剖析了作弊產業鏈深層的技術構成,並有的放矢提出了有效的反作弊解決方案和安全建議,幫助廣告主預防遭遇廣告作弊的侵害,推動數字營銷生態透明化、規範化發展。同時,騰訊燈塔推出「燈塔智能反作弊引擎」對黑產予以堅決打擊,用平臺的力量淨化廣告營銷生態環境。
  • 騰訊燈塔&秒針系統:2018廣告反欺詐白皮書(附下載)
    騰訊燈塔攜手秒針系統共同發布《2018廣告反欺詐白皮書》(以下簡稱為「白皮書」),從數字廣告作弊整體現狀、作弊技術構成和反作弊解決方案與安全建議三方面展開了全面專業的剖析。《2018廣告反欺詐白皮書》發布是騰訊燈塔與秒針系統的再度合作,在2017年白皮書的基礎上,進一步披露了目前廣告營銷市場黑產產業鏈情況,深入剖析了作弊產業鏈深層的技術構成,並有的放矢提出了有效的反作弊解決方案和安全建議,幫助廣告主預防遭遇廣告作弊的侵害,推動數字營銷生態透明化、規範化發展。同時,騰訊燈塔推出「燈塔智能反作弊引擎」對黑產予以堅決打擊,用平臺的力量淨化廣告營銷生態環境。
  • 2018上半年網際網路黑產研究報告,日掠奪千萬的「搶錢」產業鏈
    作者:騰訊安全來源:Freebuf2018年,伴隨移動應用的影響力超過電腦應用,主要網際網路黑產也遷移到手機平臺。騰訊安全反詐騙實驗室觀測數據表明,以持續多年的暗扣費黑產、惡意移動廣告黑產、手機應用分發黑產、App推廣刷量黑產為典型,這些移動端的網際網路黑產,給用戶和軟體開發者帶來了巨大的經濟損失。
  • 移動廣告作弊流量的淺潛規則
    另外一種分類可以按照設備和人為的四象限分類移動反虛假流量的模型在討論如何對付移動虛假流量的方法之前,我們先看看移動作弊的一些主要黑技術,做到知己知彼。移動作弊中涉及很多黑技術,其中包括一下一些:模擬器:BlueStacks, AndyWin, GenyMotion Spoofer: 不斷的修改機器的IP , IMEI, MAC等Proxy: 網關,修改ISP, IP, UA , 設備類型等蘋果: 沒有模擬器,主要通過硬體和軟體模擬激勵流量(incent Traffic
  • 八一八近期有些泛濫的移動廣告作弊流量
    作者:歐陽辰來源:互聯居(ID:ConnectHome)流量作弊瀰漫在網際網路廣告行業中,已經成為公開的秘密。五、移動反虛假流量的模型在討論如何對付移動虛假流量的方法之前,我們先看看移動作弊的一些主要黑技術,做到知己知彼。
  • 八一八那些移動廣告作弊流量的淺潛規則
    作者:歐陽辰來源:互聯居(ID:ConnectHome)流量作弊瀰漫在網際網路廣告行業中,已經成為公開的秘密。五、移動反虛假流量的模型在討論如何對付移動虛假流量的方法之前,我們先看看移動作弊的一些主要黑技術,做到知己知彼。
  • 對話電通安吉斯副總裁陳家駒:企業如何破解虛假廣告刷量難題?
    今年5月,騰訊安全聯合國內領先的廣告代理方電通安吉斯共同發布《2020中國廣告真實性數據觀察》,揭秘流量造假、刷量等惡性事件,總結廣告行業流量驗真和優化的前沿方案。廣告流量作弊黑產是怎麼回事,給行業造成了哪些影響?品牌和平臺方該如何甄別並防範流量欺詐行為?如何利用網際網路技術過濾虛假流量、助力品牌主實現營銷質量優化?
  • 揭秘網際網路廣告流量作弊
    在當下信息爆炸的網際網路時代,流量在一定程度上反映出網絡產品的用戶數量和受歡迎程度,成為判斷網絡產品的市場價值和市場影響力的重要因素。正是因為流量在網際網路世界具有至關重要的價值,不法分子便打起了刷流量的主意,企圖通過技術操作虛刷流量非法獲利,閆小軍就是其中一人。
  • 假靳東事件背後,抖音封禁18萬個黑灰產帳號
    抖音安全中心負責人帥帥透露,假靳東背後,有一批黑灰產團隊在操控假名人帳號,他們的目的,是希望「養號」,之後做直播帶貨變現。目前,抖音打擊仿冒名人轉型行動中,封禁黑產作弊帳號18萬多個。「哪裡有流量,黑產就往哪跑。」抖音安全中心總監周冉稱,目前短視頻裡還有色情導流、羊毛黨、殺豬盤、網絡詐騙導流等黑灰產團夥。
  • 【最全乾貨】黑產套路多,全棧式實時反欺詐,看這一篇就夠了 - 信息...
    典型欺詐風險包括支付盜刷、惡意退款、渠道流量作弊、虛假用戶拉新、機器搶券、違法違規內容、欺詐廣告導流、內容盜爬等;隨著越來越多傳統行業走向「網際網路+」,數美與黑產的較量又進一步從社交、電商、遊戲、視頻、在線旅遊、在線教育等延伸到了銀行、保險、證券、地產、航旅、新零售等領域。
  • 協力同心,讓網際網路數據造假無處遁形
    流量和資本兩大核心力量使得我國網際網路飛速發展的同時,也滋生出巨大的流量作弊黑灰產業,侵蝕著產業鏈條的各方利益,對整個數字營銷生態的健康發展造成了不可忽視的惡劣影響。據第三方數據監測機構統計,2018年中國網際網路廣告全年異常流量佔比約30%,中國品牌廣告市場因異常流量造成的損失高達二百多億元人民幣。
  • 抖音開展「啄木鳥2019」行動打擊黑產 封禁作弊帳號超127萬
    近幾年,隨著短視頻行業的快速發展,黑灰產業的不法分子,也看到了短視頻平臺上的巨大利益,尤其是刷量作弊行為,在短視頻平臺上存在著巨大的利益驅動力。目前,網際網路黑灰產業的發展已形成了完整的產業鏈,在各環節中呈現智能化、規模化、平臺化及產業化等特點。
  • 假靳東事件背後 抖音封禁18萬個黑灰產帳號
    抖音安全中心負責人帥帥透露,假靳東背後,有一批黑灰產團隊在操控假名人帳號,他們的目的,是希望「養號」,之後做直播帶貨變現。目前,抖音打擊仿冒名人轉型行動中,封禁黑產作弊帳號18萬多個。今年直播帶貨火爆後,黑產團夥開始利用冒充假名人吸引粉絲關注。截止目前,抖音打擊仿冒名人轉型行動中,封禁黑產作弊帳號18萬多個,重置仿冒資料用戶6萬餘個,處理問題視頻400多萬條。
  • 不為人知的戰鬥:網際網路平臺的黑灰產狙擊戰
    在用戶看不到的地方,各大平臺早就於暗處展開了一場不為人知的黑灰產狙擊戰。詐騙,從電信到網際網路如果說移動網際網路發展的A面,是信息改變生活、信息創造價值。那麼伴隨著技術帶來的美好生活改變,外界也不得不注意到隱藏在暗處不為人知的B面——嚴峻的信息安全問題。「你好,在嗎?」
  • 「寵粉」送禮、貸款投資、「殺豬盤」……網絡黑產套路如何破解?
    其中,有著技術優勢的網際網路企業發揮著重要作用,建議進一步完善相關法律法規,對網絡黑產具體行為進行定性,推動網際網路行業在貫徹協同和自律原則基礎上實現協同治理,為打擊網絡黑產提供法治保障。除了「寵粉」送禮,貸款投資、假冒客服、點讚刷單、「殺豬盤」、仿冒名人帳號也是網際網路上常見的詐騙行為和流程。而且,這些詐騙行為普遍形成黑色產業鏈。新技術的高速發展給網絡黑產提供了極大便利。抖音安全風控專家張曦盛介紹說,黑灰產團隊利用新技術、新手段對平臺的攻擊滲透行為,效率要超過傳統攻擊的100倍,甚至更高。
  • 暗網交易規模數千億 銀行如何打贏團夥化、組織化和流程化的黑灰產?
    不過,在手機銀行新版本配合著新的數位化營銷手段面向用戶的同時,黑灰產的鏈條也已經悄悄伸向銀行業,並在轉型路上埋下陷阱。另外,7月17日,中國銀保監會制定並發布了《商業銀行網際網路貸款管理暫行辦法》(以下簡稱《辦法》),該《辦法》的出臺在對商業銀行的網際網路貸款業務和金融信息系統建設產生深遠影響的同時,也對商業銀行的線上風控和線上反欺詐提出了更高要求。
  • 谷歌顯示廣告主管:我們與廣告主是雙贏合作
    點銳:注重用戶 在廣告主跟網站主之間搭建橋梁在「網際網路+」的時代,流量成為網際網路企業勝負的關鍵,但流量入口基本把控在BAT手上,「如何從中分一杯羹」成為每個中小企業都不得不認真思考的問題。點銳廣告的負責人嚴正表示:「我們的理念就是利用自身的經驗、技術等核心優勢,在廣告主跟網站主之間搭建一座十分高效的橋梁,達到廣告主跟網站主共贏。」面對現有的問題,嘗試從不同的角度去解決它,這是許多成功的創業者堅持創業之途的「燈塔」,點銳移動廣告平臺也秉持著這份初關閉火狐Cookie者:傷及廣告主?不在乎!
  • 起底「網絡黑產」的源頭與鏈條
    網際網路不斷迭代和翻新的技術以及信息傳播方式不斷發生的革命性變化,使傳統黑產獲得了更廣泛的受眾和更強大的市場支持,為傳統意義上的黑產插上了翅膀,使其獲得了更廣泛的受眾和更強大的市場支持。同時,網際網路技術、服務為色情、詐騙、賭博等傳統黑色產業更深入切入到社會網絡當中創造了條件。
  • 廣告監測科普專欄Vol. 3|網際網路廣告異常流量二三事
    廣告營銷行業流傳著一個著名的「哥德巴赫猜想」——「我知道我的廣告費有一半被浪費掉了,但我不知道是哪一半」( 來自零售領域的營銷大師約翰沃納梅克)。隨著技術的發展,廣告費被浪費掉的原因,至少有部分原因是可以被找到的,這就是今天我們要講的「異常流量」。異常流量是數字營銷行業的頑疾,主要體現在:近些年,網際網路廣告異常流量持續增長。
  • 為打擊網絡黑產提供法治保障
    其中,有著技術優勢的網際網路企業發揮著重要作用,建議進一步完善相關法律法規,對網絡黑產具體行為進行定性,推動網際網路行業在貫徹協同和自律原則基礎上實現協同治理,為打擊網絡黑產提供法治保障。可操控上百臺手機刷贊進入「寵粉」的微信群、QQ群,就有人免費送遊戲皮膚、手機……這樣的好事,不是餡餅,而是陷阱。