機器學習,讓你了解這世界上最晦暗的戰亂和貧困

2021-01-10 雷鋒網

整個人類似乎發展地很好:網際網路經濟、奧林匹克運動會、火箭發射、太空漫遊......

然而這樣繁榮的圖景並不是人類的全部,世界上還依然充滿了貧困和戰亂。就像這個在敘利亞戰亂剛剛遭遇空襲的5歲小男孩Omran Daqneesh,出人意料地安靜、麻木和茫然,不哭不鬧地擦掉自己臉上的血,而誰又知道他經歷了怎樣的殘酷!

人們樂於分享幸福與富裕,而戰亂和貧困地區人的日常和生活水平,我們很難得知。儘管有那麼多國際機構聲稱要去要去幫助,去改變,然而由於無法了解基本信息,很難對症下藥。

他們的夜晚連燈光都沒有

長久以來,研究人員會有一個評估某一地區的發展程度的指標:夜晚燈光的亮度和密度。但是這個方法有個局限,那就是它只能看到亮著的地區,而對於那些夜晚的黑暗之地,我們只能判斷它們大致是貧困的,而究竟貧困到什麼程度,就不得而知。

「非洲最窮的地方,是我們最關心的。但在晚上,那裡幾乎全部都是黑暗之地。」史丹福大學的電子工程與計算機科學博士Neal Jean說道。

兩個村莊,一個靠近湖邊,一個靠近森林,在燈光分布圖裡都可能是全暗的,但是它們臨近不同的自然資源,富裕程度不一樣。

而且,一般來說,了解一個地區的經濟水平,需要進行調研,而這一方法在戰亂和衝突地區是無法展開的,而恰巧這些地區就是世上最窮之地。

為什麼要知道哪裡是最窮的?

國際組織和當地政府決策者最在乎這些數據。比如,一個公益性國際組織要對不發達地區進行資金援助,資金是有限的,他們就需要確切知道哪些地區的需求最懇切,所謂「把錢花在刀刃上」。

對於政策制定者而言,了解本國個地區的經濟發展狀況是一項必須進行的工作,因為這樣才能制定出針對性的發展方案。但事實是什麼呢?世界銀行數據顯示,在2000-20010年的十年時間裡,59個非洲國家中,有39個國家只進行了不到2次的貧困水平調查

新的方法:更聰明、更便宜

史丹福大學的這撥以Jean為領導的研究人員,他們採取的是現在很流行的卷積神經網絡的機器學習算法,所用的數據分白天的和晚上的,白天的數據來自衛星拍攝的地球高清圖像,夜晚的數據就是燈光分布圖。

整個的算法分兩步。第一步叫做「遷移學習」(Transfer Learning),研究人員把五個國家的白天和夜晚的數據「餵給"系統,包括奈及利亞、坦尚尼亞、烏幹達、馬拉威、盧安達這五個非洲國家。計算機需要學習衛星照片上的物體與夜晚燈光亮度的關係。

比如系統可以學習到:一片湖區和一片森林,他們在晚上應當是黑暗的,這與該地區是否貧困並無關聯;但是,一個房屋聚集的村莊,理應夜晚亮度比較高,如果這片區域是黑暗的,那麼極有可能就是貧困地區。

通過這樣的學習,系統將貧困地區的數據都提取出來。接下來,就進行第二步,叫做「嶺回歸模型」(Ridge Regression Model)。研究人員將經過真實調查的數據指標再次「餵給」系統,比如世界銀行生活水平測量研究等。

這次,系統會把未經過調查統計的地區的大致貧困程度預測出來。比如,系統已經知道一個10戶房屋的村莊A的夜晚大致燈光亮度,而調查報告裡有一個與A村地理位置相近,而且燈光亮度相似的10戶村莊B的信息,報告顯示B村的家庭收入水平是1.9美元/天。那麼系統通過交叉對比,就可以判斷出A村與B村有著相似的經濟水平。

這個分兩步走的算法系統比單一的依靠燈光預測的方法更為準確,在具體的實驗裡,其準確率達到81%-99%。

另外,由於該系統使用的數據都是來自公共機構,比如衛星圖像和燈光分布圖就是來自NASA,而調查報告來自於美國政府和國際組織,所以整個系統的花費並不昂貴,可供有需要的公眾和機構免費使用。

Jean表示,系統目前數據只是來自非洲的五個國家,下一步的工作就是用其他國家的數據來訓練,以繪製出全球貧困地圖,幫助政府和機構更好地減輕世界貧困。

Via Spectrum 

延伸閱讀:

你所使用的手機,可能沾滿了來自非洲勞工的鮮血

計算機系統裡的偏見和歧視:除了殺死,還有其他方法


雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 你了解機器學習中的線性回歸嗎
    你了解機器學習中的線性回歸嗎 AI科技大本營 發表於 2020-02-24 14:03:34 機器學習中的線性回歸是一種來源於經典統計學的有監督學習技術。
  • 五分鐘了解機器學習十大算法
    今天,我們將簡要介紹 10 種最流行的機器學習算法,這樣你就可以適應這個激動人心的機器學習世界了!讓我們言歸正傳!1. 線性回歸線性回歸(Linear Regression)可能是最流行的機器學習算法。線性回歸就是要找一條直線,並且讓這條直線儘可能地擬合散點圖中的數據點。它試圖通過將直線方程與該數據擬合來表示自變量(x 值)和數值結果(y 值)。
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    學會如何學習這門課程能教你的人生中最重要的技能之一,就是學會如何學習。它會教你一些技巧和方法,確保你能記住你所學到的東西,並幫助你在現實生活中應用它們。因為擁有正確的學習方法是學習任何東西的一個重要先決條件,這就是為什麼它被列為序號0,因為它為下面的每一門課程奠定了基礎。
  • 想了解機器學習?你需要知道的十個基礎算法
    由於大數據是目前科技行業最熱門的趨勢,基於大量的數據機器學習在提前預測和做出建議方面有巨大的潛力。一些有關機器學習常見的例子有:Netflix基於你以前看過的電影再給你做出影片的推薦,或者亞馬遜根據你以前買過的書籍再給你進行圖書推薦。如果想了解更多有關機器學習的知識,要從哪裡開始呢?作者第一次入門是在哥本哈根海外交流時選了一門有關人工智慧的課程。
  • 萬字乾貨 | 一文助你了解機器學習
    本文將通過大量案例和通俗易懂的「人話」,講述機器學習建模邏輯和使用場景,讓非數據科學專業的職場人都可以快速了解機器學習是什麼,能做什麼,如何用!《中國人工智慧發展報告2018》顯示:專利上,中國已經成為全球人工智慧專利布局最多的國家,數量略微領先於美國和日本;產業上,中國的人工智慧企業數量排在全球第二,北京是全球人工智慧企業最集中的城市。
  • 五分鐘向長輩解釋機器學習,這樣最通俗!
    全文共2746字,預計學習時長5分鐘什麼是機器學習呢?如果是對此一竅不通的長輩來問你這個問題,你該如何回答?本文將用最簡單的詞彙來嘗試解釋這一話題,包括每個人都應該知道的最主要也是最重要的部分。比如說,你知道怎麼在Facebook上發布照片吧。當你發布照片時,Facebook會提醒你標記一些可能在照片中出現了的人。如果你不了解Facebook,那麼再舉一個更常見的例子,你在瀏覽Netflix時,網頁會推薦一些可能喜歡的劇集或電影。其實,這就有點機器學習的意味了。
  • 亞洲年薪最「高」的國家:人均年收入30萬,卻經常戰亂不斷!
    雖然在近幾年我們經常能聽到以色列戰亂的消息,可你不知道,這裡人均GDp卻能收入4.3萬美元(30萬人民幣 可這也是最尷尬的地方,因為他們和巴勒斯共享一個首都,這讓人覺得新奇,因為很少看到兩個國家共享一個城市的情況發生
  • 2020年 Top 20 機器學習和數據科學網站
    最進步、最前沿、最激動人心的……數據科學和機器學習是當今極具吸引力和熱門、熱門、超熱門話題的領域。但要跟上這些領域的所有進展和動向,你需要付出很多努力——研究、閱讀、檢查所有信息、新聞、指南和其他東西。這項任務遠不是一個簡單的解決辦法。現在,你可以偶然發現一些地方有生動的標題和有前途的標題,但它們足夠有用嗎?
  • 世界上最特殊的3隻手,最有「靈性」一隻在中國,還有兩隻在哪?
    一個小故事,帶你了解這大千世界,假如有您的關注點讚,將是對作者最大的鼓勵(本文版權歸作者所有)每個人都對這世界上的萬物非常的好奇,很多人在聽說某個地方有神奇的景象和神奇的事物都會馬上想要去看看這個東西是怎麼神奇的,對神奇且特殊的建築也是會吸引非常多的遊客前去觀賞
  • 機器學習未來十年:你需要把握的趨勢和熱點
    看前沿:你需要掌握的機器學習技術近年來,有很多新型的機器學習技術受到人們的廣泛關注,也在解決實際問題中,提供了有效的方案。這裡,我們簡單介紹一下深度學習、強化學習、對抗學習、對偶學習、遷移學習、分布式學習、以及元學習。
  • 這個國家太「慘了」,擁有世界最肥沃的土地,卻依舊非常貧困
    今天小編就向大家介紹的這一個地方,非常的貧困,但是卻擁有著世界上非常肥沃的一塊土地,這是為什麼呢?請聽小編慢慢講來。說到非洲這一個地方,相信帶給大家的第一印象都是非洲是一個非常貧困的地區,就連最基礎的溫飽問題,他們都難以解決,更不必說經濟發展了。
  • 量子機器學習入門科普:解讀量子力學和機器學習的共生關係
    在這篇文章中,計算機科學碩士Reena Shaw將用通俗的語言和形象的比喻帶你入門量子機器學習。△ 本文作者Reena Shaw在2017年的微軟Ignite大會上,微軟CEO Satya Nadella用玉米迷宮的形象比喻解釋了經典計算機和量子計算機之間的差異——為了找到迷宮的出口,經典計算機先開啟一條搜索路徑,遇到障礙物後會沿原路返回。
  • 從零開始的人工智慧和機器學習,該從哪裡入手呢?
    他的GitHub中包含了曾經做過的所有項目,LinkedIn中也包含了許多,還跟他人交流了他在YouTube和Medium上文章所學的知識。他從沒給Max Kelsen遞過簡歷,但他們卻說:「我們看到了你在LinkedIn上的個人資料。」「你的學習歷程就是一份簡歷。」
  • 可解釋的機器學習
    想像你是一個數據科學家,你想要在業餘時間根據你朋友在facebook和twitter上發布的信息,來預估你朋友假期要去度假的地方。如果你預測對了,你朋友一定嘆為觀止,覺得你是錦鯉附身。如果你猜錯了也沒啥,只不過有點影響身為數據科學家的口碑而已。但如果你和其他人打了賭,就賭這個朋友暑假會去哪裡,這時候預測錯誤的成本就有點高了。
  • 於曉華等:機器學習和農業政策研究範式的革新
    傳統農業政策側重關注糧食安全以及農民收入和貧困問題。這兩者在現在的中國已經基本得到解決 (於曉華等, 2012;Yu, 2018;於曉華, 2018) 。  現在農業和農村發展遇到一系列新的問題:農業生產成本上升、農業競爭力下降、進口和庫存暴增、農業生產的生態環境壓力巨大、農村老齡化迅速推進、鄉村人口不斷衰落。
  • 機器學習和信號處理 | Feel 你的情緒、想法和感受
    Chryssoula 說,這款應用「激勵我在提升自我、改善消極想法和消除恐懼的方式上變得有針對性和有分析能力」。 這款應用還會推薦幾種鍛鍊方式中的一種。例如,用戶可能需要回憶他們上次治療的關鍵信息,並描述他們計劃如何在日常生活中使用這些信息。 Feel 項目持續 16 周。
  • 世界上最優秀的十大民族,這是歷史篩選的結果
    西斯拉夫人主要居住在波蘭、捷克、斯洛伐克三國,東斯拉夫人主要聚居在俄羅斯、白俄羅斯和烏克蘭等地,而南斯拉夫人居住在前南斯拉夫境內,主要包括塞爾維亞、馬其頓、波赫、黑山、克羅埃西亞、斯洛維尼亞等7個國家。日耳曼族,這個民族的特性是能徵善戰,但也敗而不屈。兩次大戰,都是戰敗國,但都沒倒下,爬起來又繼續努力,德國已成為世界第三的發達國家。
  • 機器學習算法一覽(附python和R代碼)
    這篇文章有可能是我寫的所有文章裡最有價值的一篇。 寫這篇文章的目的,就是希望它可以讓有志於從事數據科學和機器學習的諸位在學習算法的路上少走些路。我會在文章中舉例一些機器學習的問題,你們也可以在思考解決這些問題的過程中得到啟發。我也會寫下對於各種機器學習算法的一些個人理解,並且提供R和Python的執行代碼。
  • 習近平扶貧論述對馬克思主義反貧困理論的原創性貢獻及其歷史世界...
    (三)習近平扶貧論述從攜手消除貧困、共建人類命運共同體的高度指明了全球減貧合作的方向,豐富發展了馬克思主義世界歷史理論「中國是世界上最大的發展中國家,一直是世界減貧事業的積極倡導者和有力推動者。改革開放以來,中國人民積極探索、頑強奮鬥,走出了一條中國特色減貧道路。」[10]151「消除貧困是人類的共同使命。
  • 2018年,機器學習和人工智慧領域最重要的突破是什麼?
    Quora鼎鼎有名的大V認為,AI炒作和AI威脅論在今年都降溫,並且不會有AI寒冬,升溫的是各種開源框架,2019年的AI,你認為會是怎樣? 2018年,機器學習和人工智慧領域最重要的突破是什麼? (這裡給你留出充分思考的時間。)