來源 | TechFlow(ID:techflow2019)不知道大家有沒有過這樣的經歷,有時候我們聊天聊到了某個商品,沒過多久,一些電商類APP就推薦了相關商品。比如有一次我和老婆剛聊了某個話題,知乎沒過幾分鐘就給了一個彈窗,如何看待XX……我當時的第一反應是很驚訝,覺得有點不可思議,就好像發現自家的機器人會說話一樣。但轉念就有點不爽,覺得這貨是不是在偷聽我說話。後來打開APP一查,果然,知乎這貨不知道什麼時候
申請了麥克風的權限。再一看,其實並不止知乎,擁有麥克風權限的還有很多。我去網上一搜,關鍵詞
知乎 偷聽能搜出來很多,不止有知乎,還有一些其他著名的APP。很多人帶節奏,還有一些無良公眾號寫文章,說這些巨頭公司正在侵犯用戶的隱私,在「耳奸」用戶。還有些人暢想未來,說這些公司可以通過偷窺用戶的喜好給用戶定製他們看到的信息,從而操控人們的思想……雖然這些話有些危言聳聽,但是是不是可以實錘這些APP偷偷摸摸搞一些小動作呢?冷靜下來稍微一想,我就放棄了這個想法。其實原因也很簡單,我們可以從作業系統和算法兩個角度得到同樣的結論。
作業系統從作業系統層面來說,不管你代碼怎麼寫的,
所有的程序肯定都是要受到作業系統調度的。不論是線程也好、進程也罷,莫不如此。我們假設某一個APP偷偷設計了一個小動作,在後臺錄音監聽用戶的日常。但是錄音並不是代碼運行就可以完成的,
它需要調取硬體——麥克風。也就是說必須要獲取麥克風的權限,這一步是非常敏感的操作,現在的手機系統都對此做了非常強的限制,如果在後臺錄音,一定會有明顯的狀態提示。拿蘋果舉例,會是這樣:看到左上角的紅點了嗎,只要是後臺的進程開啟了錄音,那麼一定會有這個提示。因為獲取麥克風錄音這是一個系統級的服務,應用程式自己是沒有驅動也沒有辦法訪問麥克風的,必須要通過調用作業系統提供的接口,這一步是無論如何繞不過去的。安卓我不是非常清楚,但是據說也有相關的限制。只要我們親自試一下,很容易發現,這是不可能辦到的。除非這些APP廠商有能力把蘋果的系統給黑了,這顯然也是不現實的。因為
這些APP在提交APP store的時候都會有嚴格的審核和檢測,並不是廠商想怎麼實現功能就怎麼實現的,有很多的限制條件。另外一點就是電池的電量,對於手機來說,像是
攝像頭、麥克風這些硬體都是非常耗電的。大家如果打過長時間的微信電話應該都有體會,這些APP在後臺偷聽其實和我們打微信電話是一樣的,都需要大量耗電,錄音超過半個小時一定會開始發熱,這也是不可能不被我們注意到的。並且對於蘋果用戶來說,蘋果的系統的多進程其實很多時候是偽後臺。當一個進程掛起在後臺超過一定時間就會直接被作業系統kill,我們雖然看起來它還在後臺,但其實早就不在運行了。據說安卓這兩年也加強了後臺進程的管理,但是具體的執行情況我不是很了解,畢竟也沒怎麼使用過,大家如果知道可以在評論區留言補充。所以到這裡,我們從作業系統這一條路就直接把APP偷聽的可能性給堵死了,另外我們也可以從算法層面分析一下這麼做的得失。
算法層面在很多不懂行的人眼裡,算法無所不能,人工智慧那是真的智能,就真的和有一個人住在手機裡偷聽一樣。顯然那是不現實的,算法也好,機器學習深度學習的模型也罷,本質上也是程序。只要是程序不管看起來多智能,本質上仍然是遵循已經制定好的模式。我這麼說大家可能get不到,我們不妨來思考這麼一個問題,從麥克風讀入的聲音數據,怎麼轉化成APP所需要的數據呢?直接從語音進行分析是比較困難的,常規的做法都是
先通過語音識別算法轉成文本,之後再對文本進行內容分析。因為我們文本分析的算法和手段都比較多,而直接分析語音則比較困難。並且我們語音分析現在也已經比較成熟了,國內頂尖的是科大訊飛, 大家可以試試科大訊飛的訊飛輸入法裡面的語音轉文字的功能,識別速度和準確率都還不錯。但問題是如果是偷偷錄音的話,是很難保證收音效果的,不用想肯定充滿了雜音。在這種情況下是很難保證語音識別之後的文本質量,退一步來說即使不存在這個問題,所有的文字都能識別準確,但是
其中有價值的內容太少了。因為我們生活中大部分說的話都是閒言碎語,有價值的含量並不高。比如就拿電商APP來說好了,我們日常用語當中又有多少是我們感興趣的商品意圖呢?這些意圖又怎麼識別呢?這些都是問題。即使能夠識別,又該怎麼計算呢?是在用戶本地計算嗎,還是上傳到雲端呢?本地計算顯然是不行的,因為深度學習模型的運算量不小,只靠手機的性能十有八九是不夠的。如果傳到雲端呢?語音文件算法不算很大,但是日積月累消耗的流量也是不小的,用戶真的不會察覺嗎?以目前業內的情況來說,
算法對於用戶興趣的識別準確率遠遠沒有大家想像的高。再加上噪音的折損,髒數據的幹擾,最終得到的準確率是非常非常低的,低到幾乎完全不能用的地步。你們要是不信去買個天貓精靈回來試試看就知道了,天貓精靈在我家已經被我叫做笨貓精靈了,它完全意識不到還應對得很開心。而且這些APP完全根本不需要用這樣下作的方法就可以知道我們是誰,我們對什麼內容感興趣。比如淘寶有你所有的消費記錄,還有你的地理位置信息,知道你在哪裡你的消費能力怎麼樣。甚至還可以從你的行為上推斷出你有沒有車有沒有房,你在哪裡上班。這些信息獲取的渠道都是正當合法的,既然通過合法的信息就能猜到你大概喜歡什麼樣的,又何必去鋌而走險呢?
風險雖然我們分析已經有了結論,但是仍然免不了問一句,假使以後科技發展,使得我們對於用戶的語音識別以及興趣識別可以做得更加準確,會產生這樣的情況嗎?其實也是不會的,這裡面的道理也很好理解。對於大公司而言,對於用戶的數據的保密程度是非常高的,
比大家想得還要嚴格。之前在阿里的時候,就連自己的數據都是不能隨意查的,除非有正當的工作需要,否則被發現了都是要承擔責任的。之所以會這麼嚴格,一方面是
國家社會的要求,另外一方面這和公司自己的利益也是一致的。一旦偷聽這種事情曝光,帶來的負面影響對公司的股價以及形象的傷害是非常非常大的,像是阿里這樣的公司,股價一有波動至少是數十億美元的損失。別說偷聽猜不透我們的喜好,即使能猜透又能帶來多少的利潤呢?雙十一、雙十二搞搞促銷不香嗎?正當的錢都掙不過來,為什麼要走歪路?當今網際網路的大公司都是掌控著媒體的力量的,真要敢這麼搞,不是給競爭對手送炮彈嗎?所以你看說起來有鼻子有眼,但其實根本經不住推敲和分析,生活中這樣的事情很多,稍不留心很容易就被忽悠了。希望大家生活中遇到事情的時候能多想一想,不要被別有用心的人忽悠了。
更多精彩推薦
☞JavaScript 爆紅後,微軟為何還要開發 TypeScript?
☞李開復對話彭特蘭:AI 不是單打獨鬥,應避免 AI 冷戰!
☞如何應對雲原生之旅中的安全挑戰?
☞自拍卡通化,拯救動畫師,StyleGAN再次玩出新花樣
☞還不懂Redis?看完這個故事就明白了!
☞區塊鏈+生鮮:杜絕「偷梁換柱」和「以次充好」