近幾年AI技術得到了顯著發展,但「技術的最後一公裡」,即企業運用AI並讓其產生價值卻滯後了。
本文作者辛迪·戈登(Cindy Gordon)曾擔任埃森哲高管,現為AI SaaS公司SalesChoice 創始人兼CEO,在與一些企業高管和業內專家交流後發現,她發現不少公司在投資AI方面仍然缺乏信心。
她會對董事會和執行長提問:建立成功的AI戰略計劃和旅程路線圖需要採取哪些步驟,您認為結果如何?您的AI投資在哪裡,您是否對它們進行了盤存或審計?計算科學家、數據科學家和AI科學家之間有什麼區別?他們的數字素養技能是否足以領導和指導組織前進?
不同企業在運營執行上存在非常大的差距。
她認為,要解鎖AI的最後一公裡,董事會和執行長必須加快建立統一的智囊團(一套根植於數字和AI技術的統一的領導技能),以加快組織現代化進程。
為此,Cindy Gordon在《福布斯》上發布了一系列博客《Building AI Leadership Brain Trust Blog Series》,以董事會和董事CEO為目標讀者,詳細盤點了企業投資AI所需要的40種技能,分為4個部分:戰略技巧、商業技能、情商/社交技能、技術能力。
每篇博客都探討了一組技能,或者深入探討了其中一個技能領域。其中「技術能力」部分10個素養包括:研究方法素養;敏捷方法素養;以用戶為中心的設計素養;數據分析素養;數字素養(雲、SaaS、計算機等);數學素養;統計素養;科學(計算科學、複雜性科學、物理)素養;人工智慧(AI)和機器學習(ML)素養;可持續發展素養。
本篇深入探討了「研究方法素養」。
AI數據科學家最重要的技能之一就是重視研究的嚴謹性,以建立強大而值得信賴的AI模型。所謂研究方法,就是用於收集數據或證據進行分析以發現新信息或更好地理解主題的策略、過程或技術。研究方法也分為多種類型,使用不同的工具進行數據收集、數據準備、數據建模。
AI設計和開發中存在的一個主要問題是沒有外部審閱者通過關鍵的審閱/檢查/質量保證來嚴格定義操作流程。儘管現在上傳數據集並對其應用現成的AI算法相對容易,這並不意味著研究方法中使用的方法/設計是可靠的。
高管需要確保其AI和數據科學團隊能夠使用優質的實驗設計研究方法。
首先,什麼是實驗設計?
實驗設計是指在實驗中如何將數據分配給不同的組,設計類型包括重複測量、獨立分組和配對設計,AI或數據科學家必須決定如何將其樣本分配給不同的實驗組。實驗設計意味著創建一套程序來測試假設,並且沿著實驗設計的工作步驟創建文檔是非常重要的。
確保企業具有在AI和數據科學項目中記錄的熟練研究方法的必需步驟是什麼?
以下是作者基於在為不同行業的眾多客戶設計和構建複雜的AI模型方面的經驗的列表:
第一步 : 定義研究問題 , 列出 需要 解決的最大問題 或 挑戰是什麼?
確保研究問題用清晰簡潔的業務術語書寫,以便被理解。清晰明確地定義解決此問題/挑戰的好處/價值,以及如果解決此問題/挑戰對您的組織意味著什麼?將企業的實踐案例固定在客戶實踐案例中總是投資AI項目的一個很好的入門方法,特別是對於處於AI部署早期階段的企業。
儘可能多地了解投資回報率(ROI)和成本節省假設,並請一位財務專家來幫助驗證業務邏輯。在這一階段,最重要的目標是確保團隊對AI投資有信心,高管的支持對於這一研究至關重要。不要輕視這一點——「人們會支持他們共同創造的東西。」
第二步 : 寫下研究假設 , 指導研究實驗
寫一個好的假設,假設研究變量(數據)之間的預期關係,並清楚地陳述變量(數據)之間的關係。假設應當簡短而切合實際,描述研究變量(數據)之間關係的研究假設應儘可能直接和明確。
好的研究假設的關鍵屬性是:具有經驗性且易於觀察。黑匣子AI的風險之一是無法理解/解釋結果,這增加了人類理解觀察的風險;普遍性。可以解釋普遍現象,而不是單個現象;合理性。不能違背邏輯;確定性。可以確保對概念進行仔細而清晰的定義(換句話說,如果其他研究人員選擇了文檔,他們將具有足夠的知識來繼續進行研究實驗);可檢驗性。
第三步:確定實驗方法或處理方法,以指導研究。
這是人工智慧 /數據科學家研究人員最重要的技能之一,因為了解AI的不同方法和應用才能知道它們在解決特定用例中最有價值的地方,再了解不同數據集大小的算法類型,將使得模型開發更加可靠。
通常情況下,機器學習(ML)是最有效的AI方法。有監督和無監督的機器學習方法在解決不同問題上都有其價值。
關鍵在於,人工智慧數據科學家必須了解兩者之間的差異,以及如何應用不同的方法,從而實現最有效的結果。常見的情況是,公司選擇了一種人工智慧方法,而沒有探索其他方法。但如果他們建立了次優的人工智慧模型,如果在研究和設計過程中更早地參與更多的研究實驗和第三方審查,那麼就能夠減少更多的風險。
為研究提供充足的時間,是人工智慧數據科學家高效完成工作的前提條件。這通常與業內相反,比如在北美文化中,追逐速度已經成為一種口號。但是在中國,企業家願意在一件事情上投入十年以上的時間,更持有長期主義的耐心。
第四步:收集數據,並確保數據經過清洗,不存在數據偏差。
通常做法是,讓所在的組織做好準備,確保其擁有強大的數據管理實踐能力,這是AI和數據科學團隊高效運作的基礎。
據行業研究預估,AI數據科學家將六成到八成的時間花在數據準備需求上。這種巨大的時間浪費導致他們沒有足夠的時間去創建、訓練和評估模型,更別說將模型搬到生產上了。
這些挑戰是顯而易見的,大多數組織根本沒有為數據科學家和其他非IT角色建立高級數據分析團隊。數據資產往往不容易獲得,集成的機器學習軟體工具也不容易獲得,從而影響了可持續性和成功機率。
依靠傳統ETL方法來滿足實時需求不再是當下所需,因此需要將所有數據轉移到雲端,並投資先進的機器學習軟體工具。
當中,有三種方法能夠幫助高級管理人員加快數據準備操作實踐。
一是應用自動化數據流程,以滿足數據準備需求。例如,投資於數據集中的自動性別識別、簡易數據標籤工具包、數據準備工具,以輕鬆匹配數據或刪除重複數據,篩選數據偏差,或數據不足,以預先執行足夠的測試。確保數據準備工具包能夠實現強大的過濾、剖析、特徵識別、搜索以及數據結構化和模型準備。
二是投資支持自助服務協作環境的機器學習軟體,以幫助支持跨職能工作團隊,共享計劃、見解,並改善知識流和不同數據管道的共享性,以加快、驗證數據準備和數據審查實踐。
三是快速地遷移到雲端。為了實現人工智慧數據訪問,要將戰略數據源遷移到雲端,以提高分析和決策的訪問便利性,否則,高管們必須更有耐心地處理複雜的內部數據存儲,而這些數據存儲並不在數據湖或雲基礎設施中。在數據準備方法上花費大量時間本就是一個令人深省的現實。但是,如果高管們希望擁有一個世界級的AI運營基礎設施來進行高級分析,就必須在這個領域實現跨越式發展。
第五步:選擇你的AI方法來執行研究實驗。
一旦準備好數據,就需要考慮在數據集上選用哪些合適的AI方法。AI分析技術有很多類型,例如啟發式、支持向量機、神經網絡、馬爾可夫決策過程和自然語言處理(NLP)都是高管們需要了解的AI分析方法類型。
第六步:分析、解釋和展示研究結果。
這個技能領域可以說是最重要的溝通基礎,其中,「假設」通過清晰的總結觀察來實現,提供基於事實的見解來支持所要解決的問題。
在這一步中,關鍵是要排序和記錄所有的模型版本、模型方法,以證明分析方法的嚴謹性,以找到最優化的模型來預測可靠、可信的結果,並從中做出決策。
當中,數據科學家往往需要業務戰略專家和溝通專家的支持,用業務語言寫出能引起高級管理人員共鳴的研究結果,以及他們能欣賞、理解和認同的價值實現結果。一個數據科學家往往缺乏商業溝通的寫作技巧,所以加強所需的支持技能是確保知識不流失的關鍵。
總之,確保AI和數據科學團隊能夠開發成功的實驗,並應用迭代方法非常重要。保持研究實驗的緊湊性和簡單性,將增加維持對AI建模實驗持續投資的信心。
沒有什麼比在可執行操作中測試概念,並通過構建概念驗證證明更好的了。關鍵的是,從一開始就大膽思考,讓AI實驗能夠遵循遠見卓識,不斷監控實驗的發展,推進組織的長期發展願景。
董事會董事和執行長通常不擅長AI研究方法,因此建議他們升級知識,因為AI本身就是高質量的研究實驗。這意味著公司必須專注於發展強大的數據文化並投資於現代化的數據管理工具包,以確保他們的組織能夠從AI項目中獲得安全的結果。
由於很少有公司成功地將AI模型轉化為可持續的運營實踐,因此董事會和執行長更有理由要求第三方對其人工智慧和數據科學運營實踐進行審查。
就像董事會和執行長必須了解供應鏈管理(SCM)運營實踐和客戶關係管理(CRM)運營實踐一樣。是時候讓他們加速了解AI分析管理實踐(AIAMP)和機器學習實踐了。
人工智慧的浪潮現在已經到來,它正在迅速衝刷所有的業務流程,當務之急是確保董事會和執行長不要被潮流衝昏頭腦,也不要被後浪拍打,為巨大的變革做好充分的準備。
機器之能 面向正在進行數位化轉型及智能化升級的各領域產業方,為他們提供高質量信息、研究洞見、資料庫、技術供應商調研及對接等服務,幫助他們更好的理解並應用技術。產業方對以上服務有任何需求,都可聯繫我們。
zhaoyunfeng@jiqizhixin.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.