科普 | 了解網絡廣告作弊,先須深度了解IP位址那些事(上篇)

2021-02-23 RTBChina

今天,就來跟大家聊聊關於IP其他的方方面面。IP位址的所有研究,其實可以歸到三個問題上:

1、這個IP在哪兒?

2、這個IP是什麼?

3、這個IP幹了什麼?

看似簡單的問題,但每個都需要投入巨大深入研究的代價。同盾科技在IP畫像研發過程中,我們接觸了國內外很多出色的IP位址數據服務商,也經過諸多的測試與調研,最終我們選擇了最優的平臺,作為我們的基礎數據供應商,在這些數據的基礎上,產生出了更加豐富的信息,最終投入到各個風控場景中進行使用。

PS:

高能預警:本期文章中會有大量專業名詞出現,儘量通俗易懂地闡述給大家,可自備詞典;

關於IP的一些冷知識:

IP位址(本文中特指IPv4地址),是用於標識網絡和主機的一種邏輯標識。依託於強大的TCP/IP協議,使得我們可以憑藉一個IP位址,就訪問網際網路上的所有資源。

IP位址本質上,只是一個32位的無符號整型(unsigned int),範圍從0 ~ 2^32 ,總計約43億個IP位址。為了便於使用,一般使用字符串形式的IP位址,也就是我們平常用到的192.168.0.1這種形式。實際上,就是把整數,每8個二進位位轉換成對應的十進位整數,以點分隔的形式使用。

比如,192.168.0.1和3232235521是等價的。  

全球共有五個區域網際網路註冊機構(RIR),分別是:

美洲網際網路號碼註冊管理機構(American Registry for Internet Numbers,ARIN);

歐洲IP網絡資源協調中心(RIPE Network Coordination Centre,RIPE NCC);

亞太網絡信息中心(Asia-Pacific Network Information Centre,APNIC);

拉丁美洲及加勒比地區網際網路地址註冊管理機構(Latin American and Caribbean Internet Address Registry,LACNIC);

非洲網絡信息中心(African Network Information Centre,AfriNIC)。

IP位址的劃分,有RIR機構來進行統籌管理。負責亞洲地區IP位址分配的,就是APNIC,總部位於澳大利亞墨爾本。

各大RIR機構都提供了關於IP位址劃分的登記信息,即whois記錄。可以在各大RIR機構提供的whois查詢頁面上查看,或者使用whois命令查詢:

whois信息中,會顯示IP位址所屬的網段,以及申請使用和維護這個網段的運營商。比如,上面的信息中顯示,153.35.93.31隸屬於江蘇省聯通。

某些黑客題材的電影中往往會出現使用whois直接查詢得到了一個IP的位置,非常精確地定位到了一幢建築物裡。

這張截圖來自於2015年上映的《BlackHat》,滿滿的槽點,都是導演YY出來的。  

(導演:怪我咯?)

正餐之前,給大家稍加科普一下,下面我們就要進入主菜了。讓我們逐一來解惑文章開篇提到的三個問題。

NO.1 這個IP在哪兒?

前面提到IP的whois信息,其中包含了申請使用該IP的運營商信息,並且在網段描述信息中,會包含國籍和省份信息。

但是這樣遠遠不夠,風控場景中,我們需要更加精確的結果,需要知道這個IP具體在哪個城市、哪個鄉鎮,甚至希望能夠精確到某一條街道或者小區。

  

曾有人問:我們的IP位址庫是否能夠提供這樣的結果?可以確定用戶在某個網吧、寫字樓甚至某個小區?

那上面這樣的IP資料庫是如何產生的呢?

俗稱「人海戰術」。您可別不相信,直到今天,依然有眾多的網友在為這個IP庫提供數據更新,上報IP位址的確切位置。但我們無從考證這個位置信息是否真實準確,如果不能報保證數據的準確性,在風控決策中同盾是不會去使用的。

一種IP位址定位手段,是通過海量Traceroute信息來分析。

理論上,如果我能夠得到所有IP相互之間Traceroute的信息,就可以繪製出整個網際網路的鏈路圖。

  

(上圖來自於IPIP.NET提供的BestTrace工具)

每一次traceroute,都會返回詳細的網絡鏈路信息。積累了足夠多的鏈路信息之後,就可以直觀地看出,很多鏈路都經過了同一個IP,那麼這個IP就是骨幹節點或者區域的骨幹節點。先確定出哪些節點是CN2骨幹節點,進一步確定省級骨幹節點,再逐一識別市縣區級的骨幹節點,最後得到全國範圍內的網絡分布。

以下是CAIDA的一份報告,使用了類似的原理,但統計的最小單位是AS(自治域)

  

圈的邊緣,就是探測節點,中間的紅色部分,就是全球網際網路的骨幹節點。原理雖然簡單,但實現起來卻沒那麼容易。

首先,你得有足夠數量的節點來探測、收集traceroute鏈路數據。其次,要有可靠的技術手段來及時分析探測到的結果,匯總形成IP位址資料庫。據了解,DigitalElemet也用了類似的方式進行探測,在全球範圍內一共部署了超過8萬個探測節點。

根據這種網絡鏈路探測的出的定位結果,業內又稱之為「網絡位置」。就是從網際網路的結構上來說,我們最終確定了一個IP,被分配到了某個地方的運營商手裡。

但是我們又遇到了很多其他的情況,給大家舉幾個簡單的例子。

117.61.31.0 江蘇省 南京市 電信

通過分析這個IP關聯的所有定位數據,得到了如下的分布:

  

這種情況,我們稱為「流量回源」。當用戶在使用南京電信的手機卡上網時,無論用戶身處哪裡,他的流量都會回到南京電信,再轉發出去,所以從IP上看,都會顯示為一個南京的IP。

上面的定位信息分布,可以在RTBAsia的IP位址實驗室中獲取https://ip.rtbasia.com/

153.35.93.32 江蘇省 南京市 聯通

  

各種渠道的信息表明,這個IP確實分配到了南京聯通,結果定位點全部落在了北京市的範圍內。如果我們根據IP的定位結果來判斷用戶當前的位置,得到的結果肯定就錯了。

難道前面提供的信息錯了?其實是由於國內運營商對IP位址的劃分和使用不透明,甚至特殊形式的租賃,導致北京的用戶,分配到了一個南京的IP。

IP位址跨城市覆蓋,覆蓋範圍非常大,用戶位置和網絡位置不在同一個城市甚至不在同一個省,都會影響到結果,無法準確給出判斷。

另一方面,隨著行動裝置的普及,在用戶允許的情況下,可以通過行動裝置採集到設備上的GPS信息。前面大家看到的兩張定位分布圖,就是分析一個IP在歷史上關聯過的所有GPS定位繪製出來的。每一個紅點,都表示曾經有一個用戶這裡出現過。再通過聚類和GPS反向解析,就可以預測一個IP下的用戶,可能出現的地理位置。這個結果,我們又稱之為「行為位置」。

這種分析方法看起來效果非常不錯,但是卻面臨兩個很重要的問題。

其一是,今年來設備作弊的方式層出不窮,如果沒有有效的手段來保證數據的準確性和可靠性,最終得出的結果也會有偏差。

比如下面這裡例子,定位點非常規整地分布在一個矩形區域內,而且覆蓋到了海面上,做了深入的分析之後才發現這個IP下面有大量的作弊行為:

  

另一方面,依靠定位點分布來分析IP的定位,需要長時間積累GPS數據。人口密集的地方,這個數據積累可以只要一天,二線城市需要一周,三線城市就需要至少一個月了。此前還遇到一個位於塔克拉瑪幹沙漠中的基站IP,至今還沒有過與之關聯的GPS信息。如果某一天,IP位址被重新分配了,劃分到另外一個城市去使用,就需要等上一周甚至一個月的時間,才能重新校正結果。而網絡鏈路的分析可以很快感知到。

實際的使用中,我們會把這兩種方式結合到一起。並不是說,兩個定位結果中,有一個錯了。兩個都是正確答案,只是某些情況下,有一個答案並不適合風控場景。

網際網路,就像物流系統一樣。我們分析IP的位置,和分析一個快遞小哥負責派送的區域原理是一樣。沒有哪個快遞小哥只給一戶人家送貨,IP也一樣,我們最終只能確定這個IP後面的用戶,可能出現的地理位置區域。隨著技術的提升,數據的積累,我們能夠不斷縮小這個範圍,達到最貼近真實的結果。

本次與大家分享的內容到此為止,大家可以反覆多次閱讀,很多專業描述其實也沒有那麼難懂,期望可以幫助到有需要的朋友們。另外兩個問題的分享,敬請期待IP下半部的分享!

Via:同盾科技

相關焦點

  • 小白網絡知識科普,新手網絡賺錢需要了解的100個知識點
    認知偏差永遠都存在,比如同為90後的你和我,網絡知識我也許比你懂,但是在其他方面你又比我擅長。現在有些00後都已經出來找工作了,這些年輕人對網際網路知識了解的更少。所以還是要學一些東西,有些基礎知識還是要了解一下,不然我們做項目的時候,很多內容都看不懂,理解不了。
  • 做網絡推廣必須知道為什麼換ip,怎麼換?
    每臺電腦或手機,在撥號上網連通網絡的一瞬間,會分配得到一個ip地址,這個ip地址就相當於是我們的身份證,我們在登錄QQ的時候,騰訊會記錄我們登錄的ip地址,登錄其他網站的時候,也會記錄我們的ip地址。那麼很多時候我們做推廣,需要切換不同的帳號去發送廣告,可以理解為第一個身份幹完壞事了,我們要換第二個身份繼續幹的話,這個時候如果你沒換ip地址,那不管你換幾個號,都是徒勞的。在講下面的點之前再強調一次,ip地址是撥號成功的一瞬間分配得到的!先搞清楚ip地址是怎麼來的再看下文!
  • 如何查找本地IP、網絡IP、對方IP位址的方法
    1、如何查看本機ip地址,首先介紹下,查看電腦在區域網裡的ip地址首先,右擊「網上鄰居」,選擇「屬性」;然後,在打開的窗口中找到「本地連接」,右擊,選擇「屬性」;第三,在彈出的對話框中,選擇「Internet協議」,點擊「屬性」。
  • IP查詢MAC地址
    通過ip查詢對方的MAC地址。這裡先簡單給大家科普一下ip和mac的概念:IP:人們為了通信方便給每一臺計算機都事先分配一個類似電話號碼一樣的標識地址,即Ip地址。 根據TCp/Ip協議,Ip地址由32位二進位數組成,而且在INTERNET範圍內是唯一的。
  • 【科普】為什麼ip地址通常以192.168開頭?
    我們做運維的,與ip地址接觸最多,無論是運維的哪方面,都需要跟ip地址打交道,通常我們也會經常聽到公網、內網?那什麼是公網ip地址呢?什麼是私網ip地址呢?為什麼我們常見到的ip地址以192.168開頭呢?我們今天來了解下。內、外網是相對於防火牆而言的,在防火牆內部叫做內網,反之就是外網。在一定程度上外網等同於公網,內網等同於私網。
  • 如何判斷兩個IP位址是否在同一個網段?
    在了解ip地址的網段之前,我們先來了解子網掩碼,很多對網絡了解不深的朋友都對子網掩碼有些迷惑, 不了解它是用來幹什麼的?子網掩碼不能單獨存在,它必須結合IP位址一起使用。子網掩碼只有一個作用,就是將某個IP位址劃分成網絡地址和主機地址兩部分。說的通俗的話,就是用來分割子網和區分那些ip是同一個網段的,那些不是同一網段的。
  • ip地址基礎入門知識,如何計算ip地址
    P地址屬於網絡方面的知識,但是對於弱電人員來說,又不得不了解一些基礎內容,比如路由器無法連接、交換機通信等等,如果對網絡ip地址有一定的了解,對處一些基本的故障完全可以的
  • 關於ip、域名那些你不知道的事(內容很豐富的哦~)
    ip,一個很熟悉而又陌生的英文縮寫詞。沒有ip我們上不了網,上網之前我們也要先設置ip地址,那麼什麼是ip地址呢?怎樣查看自己的ip地址呢?
  • 電腦ip地址如何查詢 電腦ip地址查詢方法
    電腦ip地址如何查詢 電腦ip地址查詢方法在網際網路在網際網路世界,每臺計算機都有屬於自己的ip地址,電腦的ip
  • IP位址枯竭的後悔藥:網絡地址轉換(NAT)
    我們先看看下面這張圖:通過www.ip138.com上查到的「本機IP」與從系統屬性中查到的IP竟然不一致。到底哪個結果是對的呢?這裡先不公布答案,我們帶著這個問題開始我們今天的內容。每一臺連接到網絡中的網卡,都需要有一個IP,有了IP網卡才可以在網絡中收發信息。
  • 弱電工程中IP位址分配的三種方法,全面解析IP位址分配
    什麼是私網ip地址呢?為什麼我們常見到的ip地址以192.168開頭呢?還有就是一個網段只能容納254個攝像機,但是我現在項目比較大,都有300多個攝像機了,該咋分配IP位址呢?我們今天統統來了解一下。首先關於內、外網的定義:內、外網是相對於防火牆而言的,在防火牆內部叫做內網,反之就是外網。
  • 深入了解網絡通信原理
    同一個vlan同一個網段的ip地址能夠直接互通,那麼同一個vlan不同的網段能不能互通呢?
  • 弱電網絡基礎知識,分分鐘通俗了解網關、DNS、子網掩碼、MAC地址、DHCP
    網關實質上是一個網絡通向其他網絡的IP位址,網關在網段內的可用ip中選一個,不過,一般用的是第1個和最後一個。三、MAC地址講到MAC地址,就不得不提ip地址,這裡順便把ip地址也說下。IP與MAC雖然現在已經ipv6了,但我們基本用的大多數還是ipv4協議,所謂ip就是你電腦整個網絡的編號。其他電腦想訪問電腦就得需要這個編號。但是這個編號很多情況下是一直在變化的。唯一不變的是你的MAC地址:物理地址。
  • 計算機網絡中,這些IP位址你知道嗎?
    之前我們發布了很多一系列的網絡技術知識,有朋友反映有沒有更基礎的,那我們就從ip地址開始說起。
  • 如何判斷兩個IP位址是否在同一個網段?什麼是子網掩碼?
    在了解ip地址的網段之前,我們先來了解子網掩碼,很多對網絡了解不深的朋友都對子網掩碼有些迷惑, 不了解它是用來幹什麼的?子網掩碼不能單獨存在,它必須結合IP位址一起使用。子網掩碼只有一個作用,就是將某個IP位址劃分成網絡地址和主機地址兩部分。說的通俗的話,就是用來分割子網和區分那些ip是同一個網段的,那些不是同一網段的。
  • 如何解決網絡中IP位址發生衝突故障?
    ip衝突我們在做網絡項目及監控項目時經常會遇到,這個問題我們在弱電VIP技術群中多次討論到,太常見了,這裡面是以實例的方式講解了如何防止交換機衝突,我們一起來了解下。隨著網絡的廣泛應用,使網絡規模不斷擴大,相應的IP位址分配也在不斷增多,IP位址衝突現象與日俱增,在一定程度上影響了網絡的正常運行。
  • 超過254個ip地址如何設置子網掩碼?
    在了解ip地址的網段之前,我們先來了解子網掩碼,很多對網絡了解不深的朋友都對子網掩碼有些迷惑, 不了解它是用來幹什麼的?子網掩碼不能單獨存在,它必須結合IP位址一起使用。子網掩碼只有一個作用,就是將某個IP位址劃分成網絡地址和主機地址兩部分。
  • 代理IP與代理IP池
    上篇文章中,企通查為大家介紹了幾種常見的反爬蟲策略思路,封禁訪問者IP就是其中一種很常見的反爬機制。 網絡爬蟲幾乎所有的數據都能夠偽造,但唯有一項卻不能造假,那就是IP位址。因此很多網站為了防爬蟲,會制定一系列規則去封殺IP,對每個IP做頻次控制,當IP位址被封禁後,IP發出的請求就將不能得到正確的響應,這個辦法雖簡單粗暴,卻又十分有效。
  • 圖解:IP位址網絡知識
    網絡故障、路由器無法連接、交換機通信等等,如果對網絡ip地址有一定的了解,對處理一些基本的故障完全可以的。
  • win7系統提示網絡ip地址衝突的解決方法
    有深度官網win7旗艦版系統的用戶報告說,當在公司使用電腦的區域網時,只要打開計算機,就會出現網絡錯誤信息。