人工智慧要落地?你要先了解什麼是監督式學習

2021-02-19 聯想創投加速器

作者:聯想香港讀數據團隊

機器學習小姬

本文僅代表作者個人觀點

還記得當年向我人生中第一位也是最重要的一位人工智慧導師討教學問,問其人工智慧到底有什麼價值?她回答說,只希望人工智慧能夠讓我們的生活變得更加便捷。自此便把這一目標作為我從事人工智慧事業的方向。

——筆者題記

當時萬萬沒有想到,人工智慧竟然演變到如此熱炒的詞彙。不管是資本市場驅動也好,還是實體行業病急亂投醫也罷,為人工智慧買單的人來說對於其抱有無限期望,希望這一技術能夠解決一切商業上最棘手的問題。

所謂,期望越大失望也就越大,失望後對這個技術嗤之以鼻的話那就又走向了另外一個極端。

相信很多人都是從AlphaGo,無人駕駛才開始關注這個行業的,然而借用一個前輩所說的話,大家都覺得AlphaGo和無人駕駛是人工智慧,然而大家從來都沒有想過自己天天用的百度,逛的淘寶,背後支持他們的便是人工智慧技術,而這些已經落地了的,沒有那麼炫酷的應用場景才是人工智慧為我們帶來的價值,才是真正為我們生活帶來的改變。


相信不久的將來,當市場回歸理性,其中一些應用場景也落地並且能夠為我們的生活提供些許的便捷,這個技術也有它的價值了。

從網際網路公司看監督式機器學習


不少讀者發現,最先成功的應用場景便是網際網路公司了,這是什麼原因呢?因為他們擁有幾個先天條件的優勢:

1. 用戶產生的數以億記的搜索數據,購買數據和分享數據等,這些數據滿足了一個最重要的條件,就是數據量大且種類多;

2. 這些公司的商業目標明確,用戶喜歡點擊他們就賺廣告費,用戶喜歡購買他們就有直接收益;

3. 他們能夠迅速獲得並積累大量有關用戶是否喜歡的反饋,且這些反饋和他們的商業目標直接掛鈎。

這些問題都屬於同一類人工智慧問題,我們稱之為監督式機器學習問題。監督式機器學習直觀上理解就是學習出輸入數據(我們稱之為特徵)與目標之間的關係從而做出預測。而監督式機器學習問題是我認為目前較為成熟,落地可能性最大,擴展性最強的一個方向。嗯,有點類似經濟適用男的感覺,不夠酷但是靠譜!

從監督式學習的引用場景看AI如何落地

而一個商業問題是否成功適用監督式機器學習技術要看三個方面:1. 數據多:不僅數量級大,且要種類多;雖然數據量和特徵的數量因問題不同要求不一樣,但通常來講,數據量一般要從幾萬到幾十萬,特徵一般從幾十個到上百個;2. 一個明確的預測目標,最好這個預測目標能和商業價值直接掛鈎;3. 對於這個預測目標,需要歷史的真實答案的積累,也就是監督的意思。

接下來,筆者分別從三個行業,來依次介紹現在已經成功應用監督式機器學習的場景,這些商業案例均摘自KAGGLE。對於每個案例,筆者都會從a. 特徵,b. 問題目標,c. 真實答案,d. 價值這四個維度進行簡要說明。

主要技術為監督學習技術,必要條件一定需要需評估物品的風險估值,且有一定的歷史數據積累。商業價值在於,採用傳統方法評估耗時耗力,而此預判可以幫助他們減輕一些風險較低的物品評估,而將評估重心放在風險較高的物品上,確定其是否被保。

案例介紹:利寶互助保險公司(Liberty Mutual)

對於擁有百年歷史的利寶互助保險公司來說,他們有個業務就是很多客戶想給他們的房屋投保,而他們需要根據他們的房屋情況來判斷其風險狀況來確定是否投保。他們需要實地考察房屋狀況,如地基,屋簷,窗戶等。現在他們想通過已知的一些其他特徵變量,在房屋實地考察前,預先判斷這個房屋的風險,從而對於高風險房屋進行額外的考察。那這個問題的價值就是當一個新的房屋且擁有之前的那些特徵變量時,系統則可以給出這個房屋的風險分數。

a. 特徵:關於房屋狀況的一些變量,約30幾個

b. 問題目標:預測一個房屋的風險程度。

c. 真實答案:歷史上積累了很多房屋的風險分數(分數越大則代表風險越大),大約10萬條

d. 價值:當一個新的房屋且擁有之前的那些特徵變量時,系統則可以給出這個房屋的風險分數。

醫生們通常通過圖像和專家規則去進行一些疾病的診斷。但由於資源的缺乏或者人工判斷的耗時性,導致很多病情不能及時的跟進或者拖延治療。近期由於深度學習在於圖像識別上面的卓越表現,為醫療行業的診斷打開了一扇全新的大門。機器可以通過在大量真實的案例中學習,從而對一些疾病能夠得到與醫生同樣優越的準確性,且不失其穩定性。這樣能夠解放醫生,從而讓醫療資源集中在那些需要面對面治療的病例上。

案例介紹:糖尿病性視網膜病變

通過患者的視網膜圖片來進行診斷,將診斷結果分為沒有,輕微,中度,嚴重,和增殖性糖尿病性視網膜病變(DR)。


a. 特徵:視網膜圖片

b. 問題目標:跟據圖片進行診斷,分為沒有,輕微,中度,嚴重,和增殖性DR

c. 真實答案:他們累積了很多歷史上有記錄的視網膜病例判定結果

d. 價值:能夠系統判斷症狀,對於不確定的再進行醫術判斷

由於製造業的複雜性和生產過程中的千差萬別,給我們帶來了豐富的機會去參與其中,不管從原料需求還是生產錯誤檢測。製造業不同於其他行業,其數據具有量級較少但種類多且複雜的特點,同時業務邏輯複雜,對於監督式機器學習的落地提出了挑戰。

案例介紹:卡特皮勒公司(Caterpiller)

卡特皮勒公司為全球各地銷售各種各樣的大型建築和採礦設備,而每臺機器依賴於一套複雜的管道系統來維持正常的裝載等功能。卡特皮勒公司依賴於一系列的供應商去生產這些管道配件。現在他們希望能夠預測這些供應商針對每一個管道配件的報價,希望能夠找到影響管道報價的

a. 特徵:擁有管道數據,規格參數等

b. 目標:預測供應商針對管道配件的報價

c.  真實答案:約有6w多條真實報價記錄

d.  價值:掌握上遊的報價情況,可以進行庫存合理分配和優化

以上的案例描述只是對人工智慧可以做的事情的一個初探,對於其邊界條件的定義也不是一蹴而就的。路漫漫其修遠兮,吾將上下而求索。只要從業者抱著務實謹慎的態度,我相信人工智慧這項技術確實能夠為我們的生活帶來便捷!

本文授權轉載自【一個比特】,並會精選優秀文章做持續報導,【一個比特】由聯想香港大數據香港團隊成立,是聯想加速器重要的智庫及支持團隊之一,致力於以專業的態度解析大數據,以開放的視角做大數據商業化.目前,聯想加速器第二期已經開始招募,

方向為AR,VR,大數據,人工智慧,機器人,

技術驅動型的早期創業團隊。

 聯想加速器將提供:種子+天使投資、

三個月免費辦公場地、

聯想資源和業務協同、

全生命周期服務 +定期公開課、

下一輪優質投資對接等服務。

關注官網  http://accelerator.lenovo.com

點擊閱讀原文開始報名!



相關焦點

  • 科普 | 什麼是監督式學習、無監督式學習、半監督式學習和增強學習?
    深度學習也是如此。基於可用數據的類型和正在研究的問題,科學家將選擇特定的學習模型來訓練算法。在監督式學習模型中,算法基於有標記的數據集進行學習,同時數據集提供答案,算法可利用該答案來評估其在訓練數據方面的準確性。相比之下,無監督式模型使用的是無標記數據,算法需要自行提取特徵和規律來理解這些數據。
  • 【機器學習】監督式和非監督式機器學習算法
  • 3分鐘看懂深度學習,強化學習,監督式學習,非監督學習都是什麼鬼
    第四範式授權轉載深度學習監督式學習非監督式學習強化學習到底都是什麼鬼呢?
  • 想了解人工智慧,需要學習什麼內容
    人工智慧是一個較為典型的交叉學科領域,涉及到哲學、數學、計算機、控制學、經濟學、神經學和語言學等學科,所以人工智慧本身的知識量還是非常龐大的。基礎比較薄弱的初學者可以一邊學習人工智慧知識,一邊補學相關內容,並不是一定要從數學開始學起。
  • 北森雲計算:HR領域的人工智慧,你要了解這些
    舉例來講,在E-learning上學習,是通關式的學習,還是強制、管控式的?Y時代的員工討厭管控,他們希望自動自發地學習,如果把學習過程設計成遊戲化的(遊戲化不僅指一款軟體,還指內部很多工作流程),他們願意玩、參與,然後就能獲取他們的數據,就能對他們進行評估,及時給出反饋,從而促進他們更有效地學習。
  • 投資人、創業者眼中的人工智慧:一個畢業生上來先要30萬年薪……
    客戶最終要的是一個解決方案,它買單的是你能夠給我帶來什麼價值,而不是說我還要另外去花錢結合你這個算法解決什麼問題。今年10月份我們參加的中國風能大會CWP大會,我們CTO在大會提出了全自動葉片巡檢這一概念,收到了眾多葉片巡檢廠的歡迎。
  • 醫療人工智慧要實現規模化落地 需注重技術的轉化應用
    打開APP 醫療人工智慧要實現規模化落地 需注重技術的轉化應用 電子發燒友 發表於 2018-12-18 14:56:18
  • FRM current issues中的「監督式學習」是個啥?
    今年FRM二級current issues7篇金融熱點文章中有5個都是FINTECH主題,其中關於大數據、機器學習、人工智慧等等的分量也是逐年增加。上期咱們比較了機器學習中關於深入學習與強化學習的異同,今天接著來解讀一下機器學習的另外兩種類型:監督學習(supervised learning)和非監督學習(unsupervised learning)。
  • 機器學習教父 Tom Mitchell :人工智慧將成為自適應學習的驅動式...
    我今天主要想跟大家談幾點想法,內容主要關於人工智慧可以如何與自適應學習產生聯繫。YouTube 上截取的這幾張圖片告訴我們什麼是自適應學習。在自適應體系中,老師會不斷地評估學生的能力、發現他們的不足點、給他們設立目標、發掘他們的學習需求,甚至根據他們的學習速度來提供更好的建議。
  • 從概念到應用,全面了解強化學習
    雖然是周末,也保持充電,今天來看看強化學習,不過不是要用它來玩遊戲,而是覺得它在製造業,庫存,電商,廣告,推薦,金融,醫療等與我們生活息息相關的領域也有很好的應用,當然要了解一下了。讓我們以小孩學習走路來做個形象的例子:小孩想要走路,但在這之前,他需要先站起來,站起來之後還要保持平衡,接下來還要先邁出一條腿,是左腿還是右腿,邁出一步後還要邁出下一步。
  • 大家都在說的人工智慧,你真的了解嗎?
    藥明康德/報導   在過去的十年中,人工智慧和機器學習在各個領域都掀起了一陣熱潮,和人工智慧相關的應用也一直在快速發展中。然而,人工智慧對於很多人來講,還是一個比較模糊的概念。究竟什麼是人工智慧和機器學習,二者之間又有什麼區別?
  • 如何使用 Python學習機器學習
    但人工智慧最美好的境界莫過於人機之間的互動以及相輔相成,以 AlphaGO 為例,雖然人類在圍棋領域輸給人機器,但也從機器的思考方式去重新思考了圍棋的真諦和有別於人類的思考方式。「就因為某樣東西思考的方式跟你不一樣,就代表它沒在思考嗎?」
  • 學人工智慧,必須要先學好數學嗎?
    學人工智慧要先學數學嗎?其實,我們現代的科技發展都需要學數學。數學確切地說,不屬於自然科學,它是一種語言,描述世界的一種語言,是對自然界事務的歸納和總結。像我們學物理,就必須要先學數學。牛頓發明微積分就是為了表達他的牛頓三定律。
  • AI+教育代理是噱頭還是機遇,要了解其如何定義、實現人工智慧
    熱捧之下,有不少人擔心人工智慧的泡沫成分。但事實勝於雄辯,AI+教育依託科技的力量,正在逐步落地走向實際應用。新東方OK智慧教育通過智能化的教學和學習終端,以及教育全場景化的解決方案,給出了AI+教育的代理方向。
  • 了解人工智慧,這15本書你一定要讀
    編者按:當下,無論是技術專家還是企業領導者都對人工智慧表現出愈來愈濃厚的興趣。許多企業已經開始將人工智慧應用到工作流程和業務之中,人工智慧技術的應用也在許多產業領域引發了顛覆式的效果。但是,對於人工智慧可以做什麼、應該做什麼以及怎樣才能幫到我們這些問題,每個人都存在一定的困惑。
  • 一篇文章分辨人工智慧、機器學習與深度學習
    人工智慧?機器學習?深度學習?安全界用辭令人困惑,了解主要用語真正的意義,方可在信息安全的世界中遊走自如。在熱情的市場營銷人員口中,「人工智慧」、「機器學習」 和 「深度學習」 的定義變得模糊,明確性讓位於增加銷量的需要。
  • VR難落地 建模成本太高?京東要讓人工智慧來加速
    構建京東全品類3D資料庫,全面啟動3D商品展示模式,成為「天工」計劃的首個落地戰略。一、VR照進現實 遇見人工智慧3D模型是VR體驗中不可或缺的要素,旨在創造無限接近真實的體驗。可以說,所有沉浸式360度的場景構建,都需要大量物體的高清3D模型。但在實際應用層面,通常採用的人工建模方式面臨耗時長、成本高、發展慢、產能低等障礙,很難適應VR產業的規模化批量需求。
  • 2020年人工智慧落地發展趨勢
    趨勢一:Fintech/Regtech AI落地過程中,AI平臺逐步成為事實標準AI平臺,在很多地方又稱為AI中臺/數據科學平臺/機器學習平臺/人工智慧平臺,主要涵蓋的功能除了傳統統計分析軟體包含的功能以外,還包括大數據、分布式計算平臺、NLP、CV等能力。
  • 深度學習大神Yann LeCun:我曾見證過一個偉大的賭局,當時神經網絡...
    在 AlphaGo 勝利光芒的照耀下,各個國家、企業都開始圍繞人工智慧(AI)展開激烈的競爭,生怕慢一步,就會錯過即將到來的全新科技曙光。但 Yann LeCun 卻說,「這條路我們無法預測有多遠要走,可能要越過崇山峻岭,翻過第一個山頭後,還有無數的山頭等待著被徵服。」Yann LeCun是誰?
  • 李開復青島「入夥」:人工智慧時代背景下的創新創業,我們要了解這...
    而且,很多產品它不再只是先做好了產品再賣出去,你可以甚至用今天的網上的各種方法,來了解用戶想要什麼,之後再來製造你想要做的。比如說元氣森林作為一個產品,它就可以用各種不同的廣告和排列組合,了解用戶想要什麼,之後才去做那個他已經確信可以賣得最好的產品。