2020年是足以被載入史冊的一年。
在經歷了炒作、狂熱、泡沫之後的人工智慧,在全球新冠疫情的肆虐下,與產業發生了前所未有的緊密結合。
我們看到疫情之下,遠程測溫、口罩識別、雲辦公、雲課堂,無接觸配送服務的大量湧現,AI在醫療、教育、交通、工業、非接觸服務等領域快速響應,在疫情之中扮演了關鍵角色,提高了抗疫戰爭的整體效率。
而後疫情時代,國家出臺新基建計劃賦予AI全新的使命與角色,通過傳統產業與AI的深度融合,助力實體經濟向數位化智能化轉型,催生新的業態。在國家政策支持和抗疫壓力的雙重牽引下,各行各業已經充分認識到加速數位化、網絡化、智能化轉型已是必然趨勢。
2020年已臨近尾聲,即將到來的2021年以及近未來,將成為全球經濟重建和社會轉型的重要時期,而其中人工智慧必將成為核心驅動力。在此背景下,未來人工智慧產業將如何發展?會帶來哪些機遇與挑戰?企業如何才能更好地抓住機遇實現智能化轉型?
或許重新梳理2020年人工智慧產業的發展與變化能夠找到問題的答案。
近日,騰訊研究院發布了《2020騰訊人工智慧白皮書》對人工智慧在產業趨勢、技術發展、抗疫應用、行業賦能、制度保障等方面進行了深度總結和梳理。
接下來帶著對人工智慧產業發展的疑問和好奇心,我們一起來解讀這份報告。
泛智能時代開啟人工智慧技術與產業發展正在邁向「泛在智能」時代,未來中國不再有純粹的傳統產業,每個產業或多或少都將開啟數位化進程。人工智慧已「泛」起巨浪,人人都將席捲在這巨浪之中。
透過2020年人工智慧產業變革,白皮書得出了這樣的結論。
所謂泛在,即廣泛存在。「泛在智能」,一是泛於基礎設施建設,在「新基建」的春風下,智能技術將逐漸轉變為像網絡、電力一樣的基礎服務設施。如圖,2015年國家產業政策首次提及人工智慧,隨著政策的不斷升級,為人工智慧產業發展提供了極為有利的條件和機遇。
未來作為新一輪產業變革的核心驅動力,人工智慧算法、算力、數據三位一體的基礎設施可面向全行業全領域提供通用的AI能力,促進社會經濟轉型升級。
二是泛于越來越多元的應用場景和更大規模的受用,更多的傳統產業或慢或快接入智能技術,與技術公司共同探索未來新模式,同時人們會在生活裡感受到無所不在的智能應用,技術的普惠精神進一步得到體現。
當然,在泛化過程中必然會遇到同樣廣泛的問題,對此白皮書中指出,與其他數位技術之間更加緊密的連接能夠為人工智慧提供更有利的技術支持,另外,安全和制度保障同樣不可或缺,三個層次相互作用相互作用,將共同加速人工智慧在更廣維度的擴展。
浪潮之下,AI技術的升級與落地「泛在智能」的「智」來源於人工智慧技術的不斷升級和成熟。本輪以機器學習,尤其是深度學習為主題人工智慧浪潮被認為是當前人類所面對的最為重要社會變革技術之一。
機器學習機器學習是門「全能」的基礎學科,它涉及統計學、神經網絡、優化理論、腦科學等眾多領域。同時,它在現實生活中的應用場景也十分廣泛。作為人工智慧領域的底層技術,機器學習也是騰訊AI Lab多年來的研究重點,其研究主題覆蓋強化學習、自動機器學習、深度圖學習、小樣本學習等多個方向。
其中,強化學習的研究大多立足於遊戲環境,如圍棋、電子遊戲《王者榮耀》和《星際爭霸》等,並且已經通過與頂級玩家比拼的方式取得了多個亮眼的裡程碑。
業界普遍認為,若AI能在複雜的遊戲環境中,學會人一樣實時感知、分析系、理解、推理、決策到行動,就可能在多變、複雜的真實環境中發揮更大的作用。因此,世界頂級科技公司均在推進此類研究,如Google、DeepMind、Facebook以及OpenAI等。除此之外,騰訊AI Lab還在探索該技術在現實應用場景中的落地,如農業方面。
雖然機器學習的研究和應用,已經取得了很好的進展。但是還有若干問題制約其影響力的發揮,特別是在真實世界的應用方面。白皮書中指出,機器學習後續需要攻克的方向還包括兩點:
提升小樣本學習效率:大量帶標籤的訓練數據是決定機器學習模型性能的關鍵。但現實場景中,一些數據的標籤很難獲得。怎樣用少量的數據,仍然可以訓練出良好模型,是一個亟待研究的問題。
發展離線強化學習:強化學習在遊戲中取得驚人效果得益於遊戲模擬其可以實時產生大量的與模型交互的數據。但在現實場景中,我們只能得到少量的人工交互數據,或者從模擬器所得的大量虛擬交互數據。怎麼利用這些數據做好離線強化學習,目前尚無良好的解決方案。
計算機視覺2018年,計算機視覺技術佔中國人工智慧市場規模的34.9%,位居第一,在投融資規模中更是一枝獨秀。隨著近幾年技術的不斷成熟,其市場規模進一步擴張。根據艾媒數據顯示,2018年中國計算機視覺市場規模為155億元,較2017年增多了87億元,複合增速超100%。
市場對於技術的推進作用是巨大的,目前,計算機視覺已經在人臉識別、工業視覺、OCR以及內容理解等領域獲得重大突破,面對不同場景需求,計算視覺準確度不斷提升。
但隨著技術落地速度的加快,落地領域的拓寬,為了促進技術和社會應用的深度融合,白皮書指出,計算機視覺還需要在以下方面得到進一步突破。
一是技術融通,加強高階認知智能開發。人工智慧技術正從語音、文字、視覺等單模態智能朝著多模塊智能發展,如何從端到端打通各個模態之間的關係形成可以真正多維度交互的智能機器,增強對功能屬性、物理關係、因果邏輯、動機預測等的認知進行邏輯推斷,讓感知智能升級為認知智能。
二是進一步提升對抗攻擊和防禦技術能力。包括深入研發隱蔽性較強的可以用於物理場景的攻擊方式;提升攻擊的遷移性,即較高的攻擊成功率能夠遷移到不同的深度模型上;研究有較強通用性的防禦方法,提升模型對於不同攻擊方式的防禦能力。
三是辨別深度合成,鑑偽技術遏制AI濫用。大量人臉編輯檢測算法在人臉鑑偽上取得良好性能,一定程度上遏制了AI技術的濫用。但整體而言,目前的檢測算法尚處於初級極端,存在不少局限性,數據集質量有待提升,可解釋性、可遷移性等多個問題有待深入,以得到一個通用、高效、高精度的人臉編輯檢測框架。
語音技術的市場規模僅次於視覺技術。相應的,語音應用市場也在高速增長。
2018年達到了159.7億元,近五年的年均複合增長率預計將達34.32%,2023年國內市場規模將達到664億元。目前語音技術已廣泛服務於通信、家庭服務、家電等多個行業,典型應用包括智能客服、智能穿戴、以及智能家居等。
業內專家認為,語音技術的鏈條日臻完善,邊界在逐漸擴大,現有研究中,更加注重端到端的建模方法,以及領域的通用性。回溯近幾年發展,可以看出在多模態需求的不斷擴大下,語音技術實現了從單模態到多模態的交互、語音環境適應性也在持續提升。
未來,多模態、多場景需求如何得到更好的滿足,白皮書指出需要從技術、業務兩個方向進行努力。
技術方面:解釋更多的「複雜性」
魯棒性仍需提升,在對多種領域變化(如表達方式、噪聲環境、通道失真)的魯棒性方面與人類水平相比,進一步逼近。
語音及歌聲合成,包括語言合成風格應更加多元、歌聲合成效果更加自然動聽。
多模態交互,主要是多模態融合能力提升,以便適用於不同交互方式與應用場景的多元需求。
成本與效率問題,需要更靈活輕量的採集與生成,通過少量的、少標註的語料去更快、更高質量的完成各類語音任務。
業務方面:場景應用與數據反饋相結合
自然語言處理自然語言處理是人工智慧重點技術之一。比爾蓋茨曾說「語言理解是人工智慧皇冠」上的掌上明珠,誰掌握了更高級的自然語言處理技術,說就能在日益激烈的人工智慧軍備賽中佔得先機。
目前,自然語言處理技術助力需要研發的方向,包括以下幾點:
文本理解精度提升:如問答系統中對知識庫的構建和查詢、搜尋引擎對查詢詞的理解和擴展,信息流推薦中關於內容的理解和分類,電商用戶評論的情感理解和判斷等。
機器翻譯準確性增強:特別是長文本翻譯、篇章翻譯、特殊領域文本翻譯等。
對話系統的智能化:用於智能音箱中,使其具備更精準的回答、定製風格與人設、完成更多的任務;或者用應用於心理諮詢、智能客服、在線教育、虛擬主播、彈幕回復等更多業務場景中。
文本生成的實用性:實際業務需求中有著各式的文本生成任務,如對聯生成、詩詞生成、歌詞生成、句子改寫、體育比賽或遊戲競解說詞生成等。
近幾年,在神經網絡技術和深度學學習的推動下,自然語言處理技術得到了大幅度的提升。例如從word2vec模型、到Elmo,再到Google提出的BERT模型,文本理解和語言表示被推向了一個新高度;從seq2seq+attention框架在機器翻譯得到巨大進展,到GPT-2/GPT-3模型的提出等等。白皮書中指出,著眼未來的技術研發,還需要從以下幾個方向做進一步探索:
提升文本理解的精度及深度
人提高文本生成質量
增強帝梓元和多語種場景的應用效果
探索更豐富的語義表達方式
強化知識表達泛化能力
優化語言生成的對話的度量
新冠疫情的爆發,讓我們看到了人工智慧技術在醫療、城市治理、服務業、製造業等領域的潛在價值,同時也加速了人工智慧在各行業的應用和落地。
在醫療行業中,人工智慧技術被廣泛應用於醫療影像、醫藥篩選、遠程問診等多個場景下,有效緩解了醫療資源的壓力。如在醫學影像方面,AI圖像識別幫助患者更快完成檢查流程,更早獲得診斷結果;幫助醫生大幅縮短讀片時間,提升工作效率降低誤診率;幫助醫院提升醫院的整體診療水平,降低人工成本與壓力。
此外,基於圖像識別、計算機視覺、自然語言處理等技術,AI在藥物研發和遠程問診中也發揮了重要作用。透過這場疫情,報告指出,未來人工智慧將與醫療行業深度融合,進一步推動傳統醫療機構運作方式的變革。具體來說,主要體現在以下幾個方面:
公共衛生應急體系建設:運用大數據、人工智慧、雲計算等數位技術,在疫情監測分析、病毒溯源、防控救治、資源調配等方面發揮支撐作用。
個人健康管理:通過深度學習等技術對海量健康數據進行分析,實時動態監測用戶健康狀態,從而提供精準的健康監測方案。
基層醫療衛生機構:人工智慧將服務於早篩、診斷、臨床等多個應用場景,助力縮小城鄉醫療水平差異,解決基層醫護人員不足、醫療水平不足的問題。
藥物研發:人工智慧將服務於藥物研發,以縮短藥物篩選周期,提升其生產、銷售、使用的全鏈價值。此外,它還將用於藥物智能銷售、精準用藥,促進個性化診療的發展
醫療保險類服務:可用於風險控制、醫保控費、福利管理等領域發揮數位化、智能化作用,促進醫療生態圈中的多方協同。
AI+城市治理疫情之下城市治理暴露出短板,也讓人工智慧在智慧政務、疫情監控、社區防疫等方面幫助城市治理突破了原有的治理模式,使智慧城市建設加速前行。例如:
在社區防疫方面:騰訊優圖聯合騰訊海納推出體溫篩查功能。針對封閉式小區出入口,開放式重點區域,騰訊優圖AI識別技術可輔助社區人員在線申請電子出入證;同時集成該技術的熱成像攝像頭、熱成像門禁等設備,可實現身份是被、測量體溫等餘預警記錄上報。
此外,在車輛初入管理和行為預警、預警疫情風險、人群聚集警告、健康告知與申報承諾等多個方面,騰訊AI都可以有效地發揮作用。
在智慧政務方面:騰訊推出「防疫健康碼」,民眾通過微信小程序申請覆蓋自身健康信息的二維碼,獲得電子出行憑證。在保證疫情期間安全復工復產發揮了關鍵作用。除了自然語言處理、計算機視覺技術在其中的應用外,人機互動的語音交互幾乎是也發揮了重要作用,如騰訊推出的「AI政務聯絡機器人」,可與轄區居民聯絡,完成政務信息的傳遞工作。
在監控疫情方面:計算機視覺技術在紅外體溫檢測和人群遷徙態勢感知中得到了廣泛應用。AI全自動紅外測溫儀利用普通攝像機識別並鎖定人臉,而後通過紅外測溫儀採集紅外數據,並計算出人體溫度,具備非接觸、大面積、快篩查的優點。
隨著人工智慧技術與5G、雲計算、大數據等新一代技術的深度融合,未來AI將進一步推動智慧城市的發展與升級,如:
政府決策更加科學化:人工智慧技術在疫情監控、風險分析預警等方面的優勢,將輔助政府優化決策。
城市管理更加可視化:計算機視覺技術在防疫中的可視化方式,讓城市管理更加直觀。
社會服務更加智能化:主要體現在政務機器人的出現和應用,隨著技術的逐漸成熟,人機互動將不僅局限於語音交互、腦機交互、情感交互也將逐步成熟落地。
疫情之下,無人零售、無人值守、物流運輸等商業的非接觸式服務需求大漲,迫切需要AI技術進行業務支撐。「零售+AI」正在從單點走向聚合,通過智能物資調配,智能營銷推薦、智能配送實現全產業鏈「非接觸」配置。主要體現在以下幾個方面:
一是打通線上線下終端:對於零售商而言,通過線上線下渠道的整合,將二者的優勢相結合實現最大化,是未來發展的最佳路徑。深度合成技術可以提升線上購物體驗,品牌可以使用虛擬模特展示服飾效果,或者鼓勵消費者自己進行數字建模,預覽服裝上身效果。
二是優化商品管理:庫存水平和生產壓力之間的矛盾逐漸成為零售企業的商品管理方面的一大難題。基於AI技術構造門店商圈客流畫像和偏好合理調配門店商品,根據顧客購物動線和停留檢測,優化商品陳列,提高坪效,基於深度學習對門店和商品銷量做出預測,從而合理籌備庫存和分配庫存。
三是更加有效的用戶分析:線上端,通過各種渠道進行用戶觸達,再利用AI技術完成商圈洞察、社區洞察、人群畫像、品牌輿情等用戶分析,形成線上分析矩陣;線下端,AI通過把握客戶從進店到離開的全過程,對顧客進行實時分析、可為每一位消費這構建全方位數字畫像。
四是更快速、精準地物流配送:通過深度學習等技術,AI建立高效的供應鏈系統,形成基於消費者、門店銷售、客戶一體化的智能供應鏈智能管理體系,把用戶端潛在需求的判斷聯動到供應鏈、物流倉儲系統,實現供應鏈管理智能化。
五是智能客服系統:人工智慧對於這類工作的適用性極高,在購物過程中開展智能客服,從售前到售後的各個環節,可極大提升服務效率和滿意度。
總的來看,人工智慧技術使打通線上線下,連接單點智能場景成為可能,用消費新體驗來釋放新興消費的潛力,讓實物消費和服務消費得到回補,成為消費市場的新增長點。
自動駕駛商業化加速在新基建和新冠疫情的雙重推動下,越來越多的國內外廠商開始試水自動駕駛領域,相關行業應用案例也在不斷湧現。目前,自動駕駛汽車已經在外賣和物資配送、物流、城市消殺作業等方面發揮作用。
此外,自動駕駛出租汽車、自動駕駛卡車和物流車、固定路線運營、最後一公裡配送等商業化場景也在國內外落地。
白皮書指出,AI將在自動駕駛領域,尤其是仿真測試平臺發揮關鍵作用。自動駕駛技術的發展離不開測試,需要通過大量測試來驗證技術的安全性和成熟度。
但就目前而言,一方面監管政策對測試牌照、測試道路等有著嚴格的限制;另一方面實際道路測試還面臨著測試成本問題。這些都不利於自動駕駛技術的發展迭代。
由於實際道路測試的諸多現實,仿真技術和仿真測試將成為推動自動駕駛行業發展的新引擎。目前國內外自動駕駛廠商都在加大布局仿真平臺的建設。
數字內容創新換臉、人臉合成、語音合成、視頻合成、數字虛擬人等諸多「深度合成」技術的應用,為數字內容帶來了重塑。深度合成依賴於人工智慧技術,可以從大量數據中自主學習深度學習算法。隨著其技術的不斷發展,目前的主要研究方向包括:
深度學習合成技術朝著綜合性的方向發展:綜合運用人臉替換、人臉再現、人臉合成、語音合成等技術製作更複雜的視頻合成。
面部合成之外的全身合成:可用於學習源人物的舞蹈動作映射到目標人物之上。
3D合成成為下一階段的重點。如虛擬歌手、主播、教師等。
基於以上研究,深度合成技術在泛娛樂和數字內容領域的應用創新也將會持續湧現。就目前而言,其主要應用場景包括:
一是為影視創作和製作開拓新空間。
二是帶來全新的娛樂方式:如FaceAPP、ZAO等圖像、視頻合成應用,可以讓實現風格遷移,讓用戶通過人臉融合,「虛擬地參與」電影演出等。
三是升級電商體驗和內容營銷:通過深度合成技術讓用戶體驗「虛擬試裝」,用AI虛擬形象代替網紅模特等。
四是帶來更多的數字虛擬人:數字虛擬人融合了人臉合成、語音合成、自然語言處理等多種AI能力。目前業內已開始大力開發遊戲直播、演唱等領域的AI虛擬形象。
雖然深度合成技術在內容創意、營銷、社交、娛樂等諸多領域有廣泛的應用場景。但其技術的發展也帶了了「偽造」和「欺騙」的可能。面對新技術可能產生的負面挑戰,政府和監管者應當包容審慎,避免阻礙技術有益的、創新性的應用。
加強制度保障,構建可持續發展的AI圍繞人工智慧實用性和倫理問題的爭議從未停息。例如疫情期間,健康碼、面部測溫等多次引起大眾有關隱私和效率問題的討論。從長期發展來看,技術和市場固然重要,但現階段更需要構建人工智慧治理體系,保障其健康和可持續發展。
報告中指出,未來對AI技術的良好治理需要注重考慮三點:
構建多層次的治理體系,採取敏捷靈活的治理方式。多層次的治理體系比單一維度的立法和監管更能適應人工智慧快速發展迭代、日益複雜化的特徵。此外,為避免過於嚴格和過於細緻的法律要求,可以採取事後監管、事後追責等輕監管的方式。
立法和監管需要充分考慮國際競爭、技術的經濟社會價值等視角,推行先行先試。在全球競爭中心日益轉向人工智慧等新技術的大背景下,過早或過度的監管都可能削弱已過在AI領域的競爭力。另外,前沿科技領域有必要出臺更包容的新技術政策和立法,推行先行先試,給與適度寬鬆的發展空間。
推動人工智慧治理的跨學科參與和國際合作。AI研究與發展需要吸納不同種族、性別、文化和社會經濟階層以及不同領域人員的思考和顧慮。監管也需要採取多利益相關方共同參與的模式,廣泛聽取行業主體、專家和公眾意見。在全球化背景下,可持續發展的AI需要各國在AI技術、產業、倫理、治理等方面加強合作,構建包容、安全可持續發展的AI。
騰訊助力AI產業發展,開啟公益挑戰賽透過報告我們可以看到,人工智慧已經走過了技術爆發的階段,正在逐漸深入到產業,走進我們生活的方方面面。
在AI與產業深度融合的關鍵時期,AI公司們不再是以往的旁觀者,而是出演關鍵角色。多年來,騰訊優圖實驗室堅持技術研究和產業落地兩條腿走路,在不斷打磨算法的同時,探索AI的落地場景和應用價值。
近日,騰訊優圖再次攜手聯合國兒童基金會、深圳市信息無障礙研究會、桃花源生態保護基金會,共同發起了騰訊Light·公益創新挑戰賽。
本次比賽以「AI,讓美好現在發生」為主題,分別以未成年人網絡保護、「適老化」無障礙設計、野生動植物保護三大公益場景為賽題,邀請參賽者使用AI技術打造公益小程序,助力解決三大賽道的痛點問題。
過去幾年,騰訊優圖在科技公益方面已經做了很多探索嘗試。談及未來的科技公益的探索與落地,吳運聲表示,未來優圖將開放積累多年的AI能力,也希望更多的開發者和公益界的有志之士加入進來,努力用技術去做一些改變。
雷鋒網雷鋒網(公眾號:雷鋒網)雷鋒網
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。