微軟人工智慧公開課概覽 | 雷鋒網公開課

2021-01-08 雷鋒網

人工智慧無疑是當前最為熱門的科技概念。作為科技界的領軍企業,微軟在人工智慧領域耕耘已久。早在25年前微軟研究院建立時,人工智慧就已經成為整個微軟的戰略目標。微軟為此傾注了許多精力和資源,並取得了亮眼的成績,但它還有著更加宏偉的願景:將人工智慧帶給每個人,從開發者到數據科學家,從技術愛好者到學生。

本次公開課,雷鋒網(公眾號:雷鋒網)邀請到了微軟亞洲研究院掌門人洪小文博士,為大家分享《微軟人工智慧公開課》第一章節——《微軟人工智慧概覽》中的精彩內容,介紹微軟在人工智慧領域的最新研究成果以及微軟的AI服務如何賦能開發者。

整套《微軟人工智慧公開課》已在微軟虛擬學院全面上線,感興趣的朋友可以點擊連結(https://aka.ms/MicrosoftAIMOOC)跳轉學習。

據雷鋒網了解,《微軟人工智慧公開課》分為三大塊,呈金字塔結構,最底層針對所有的開發者,涵蓋認知服務Cognitive Service以及Bot Framework。中間層針對數據科學家,包括Azure Machine Learning、HDInsight、Stream Analyst等。最頂層則瞄準需要開發自己算法的研究者,主要工具有 Microsoft Cognitive Toolkit、Azure Data Science VM等,同時也支持其他框架,比如 TensorFlow、Caffee等。

嘉賓介紹


洪小文博士,現任微軟全球資深副總裁,微軟亞太研發集團主席,兼微軟亞洲研究院院長,全面負責推動微軟在亞太地區的科研及產品開發戰略,加強微軟與中國和亞太地區學術界的合作。

洪小文博士是電氣電子工程師學會院士(IEEE Fellow),微軟傑出首席科學家和國際公認的語音識別專家。洪博士在國際著名學術刊物及大會上發表過百餘篇學術論文。

以下為雷鋒網對嘉賓分享內容的實錄精編。人工智慧概述

很多人都在問,我們研究人工智慧的目的是什麼。微軟的答案是:讓我們的應用和服務能夠擁有像人類一樣認識世界的能力,在視覺、語音、語言、知識等維度得到拓展,帶來更好的用戶體驗。

還有很多人問,人工智慧該如何分類,究竟哪幾部分算人工智慧。人工智慧技術紛繁複雜,但微軟認為可以歸結為三大類:

大數據&機器學習

認知計算能力

對話即服務的體驗

以智慧型手機為例,我們與智慧型手機的交互是通過不斷點擊屏幕上的菜單來實現的;用戶需要耗費很多時間學習菜單中每個選項代表的意義。認知服務可以讓我們與機器的交互變得更加簡單直接,機器也能更好地了解用戶的意圖,不必浪費太多的溝通時間。

微軟AI的發展歷程

微軟在AI領域耕耘已久。1991年,微軟AI基礎研究院成立,致力於打造一個能夠聽懂、看懂和理解人類以及世間萬物的電腦。2007年,微軟語音部門從研究部門正式轉為產品部門,開啟了AI的產品化道路。到2014年,在天津的一個活動中,微軟系統已經能夠將英文演講實時翻譯為中文了。緊接著,2015年微軟亞洲研究院的計算機視覺系統首次在ImageNet上打敗了人類。這套計算機視覺系統對超過2000種物體進行辨認,失誤率僅為3.5%,而人類的失誤率為5.5%。當時這套神經網絡共有152層,如今已經發展到了上千層。

但對於微軟來說,人類與人工智慧的關係不是誰打敗誰。事實上,AI將成為人類最好的工具,能夠拓展人類的智能,讓人類完成更多的事情。一般我們理解的AI是Artificial Intelligence(人工智慧),但也可以將其闡釋為Augmented Intelligence(增強智能)。未來人類與機器密切合作,就能實現我們理想中的Superman。微軟的願景就是,通過API等方式讓AI這項看似高大上的技術平民化。有了微軟的認知服務API,開發者無需自己做人臉識別、年紀識別和物種識別,只要使用相應的API,就能輕鬆調用這些功能,在其熟悉的領域開發應用。

微軟認知服務API

微軟的認知服務API主要可以歸結為5大類:

視覺:從面部感官到感覺,讓對話機器人了解圖像、視頻和情緒。

語音:把語音轉換為文本,或把文本轉化為語音,了解用戶的意圖,翻譯語言,過濾噪聲以及識別說話者。

語言:教對話機器人理解複雜的自然語言指令,解析複雜的文本以及理解用戶情緒。

知識:從網絡、學術界,或者用戶自己的數據積累中融合豐富的知識。

搜索:通過必應API的強大功能,訪問數十億網頁、圖片、視頻和新聞。




微軟此前和一個非營利組織達成合作,共同尋找失蹤兒童,其中就用到了視覺服務中的人臉識別。利用算法和深度學習,系統可以了解一個人的外貌。雖然人類在成長過程中外貌會不斷變化,但系統可以從數學的角度找到比例等不變的特徵,從而將其辨認出來。

微軟的人臉識別API,除了可以檢測圖片中的人臉,識別其屬性;還能實現人臉驗證、相似人臉搜索、人臉分組、人臉辨識等功能。此外,情緒識別也是人臉識別的重要應用之一。微軟的情緒識別API並非簡單反饋對象的情緒好壞,而是返回一個分值,供開發者進行判斷。

微軟的語音API目前已經具備了聽和說的能力,支持多國語言以及多種方言。此外,聲紋識別也是語音識別中非常重要的部分。通過聲紋識別,系統可以辨認出說話人是誰,這對提升語音識別的準確率非常關鍵。尤其是在嘈雜的環境中,如果系統可以辨認出用戶,那麼就可以對背景聲和其他人的語音進行屏蔽,實現更好的語音識別效果。

語言和語音的關係非常緊密,語音只解決了「聽到」的問題,能夠辨認出句子中的每一個字;但要「聽懂」,了解這些句子背後的涵義,就需要用到語言能力。語言能力建立在語音的基礎之上。以往很多所謂的自然交互都是通過關鍵字判斷來實現的。比如,用戶輸入「幫我看看是否有違章」,系統自動檢測到關鍵字「違章」,就能得知用戶想要查詢違章記錄。而藉助深度學習的語義理解,即使用戶輸入的信息中不包含關鍵字「違章」——比如輸入「幫我看看是否有違法停車」「我昨天闖紅燈了,怎麼辦」,系統也能理解用戶的真實意圖。

「知識」能力的應用場景很多,其中最具代表性的是學校,比如尋找論文等。此外,很多企業也運用到了「知識」的能力,比如利用用戶產生的數據,通過深度學習,向用戶提供個性化的產品和服務。

機器人寫歌

將多個微軟的人工智慧API整合到一起,可以開發出非常有趣的應用。比如一個叫做songbot的應用,它可以識別圖片中的內容,自動獲取關鍵字進行歌詞創作,並將作品唱給你聽。

以上圖為例,系統掃描圖片後自動獲取到「小鳥」「飛翔」「自由」「夢想」和「天空」等關鍵詞,這部分用到了視覺的能力。songbot通過學習多達20萬首歌,基於自然語言能力,理解了歌詞的結構和組織。因此獲得關鍵詞後,可以利用機器學習重新創作歌詞,最後利用語音合成技術把它唱出來。

微軟人工智慧公開課

為了讓開發者、數據科學家、技術愛好者和學生能夠充分利用微軟的人工智慧API,開發出更強大的應用,拓展全人類的智慧,微軟特地推出了《微軟人工智慧公開課》,邀請各個領域的專家為不同知識程度的人工智慧從業人員及愛好者提供針對性的專業輔導。該課程可以通過登陸微軟虛擬學院輕鬆獲取。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 機器人聊天的秘密|雷鋒網公開課
    這類技術在現實場景中的應用有大家比較熟知的微軟小冰與百度度秘。錘子手機中 Bigbang 功能也是基於語義理解技術中的語義分析功能進行的創新。本期公開課請到了開放域聊天和 chatbot 頂尖專家——三角獸科技的 CTO 亓超,為大家揭開機器人聊天的秘密。
  • 客服機器人中的深度語義技術與應用探索(附視頻+PPT)| 雷鋒網公開課
    雷鋒網「新智造」按:幾年之間,蘋果、微軟、Google、百度、阿里等巨頭都推出了以聊天為形式的機器人,應用在情感陪護、虛擬助理、客服、售後等場景中,同時也有諸多初創公司、投資機構殺入這一行業。但在實際使用中,用戶經常發現,機器人並沒有想像中那麼智能,它能識別文字和語音,但卻「不懂你」。這其中的關鍵便涉及到自然語言處理中的」深度語義技術「。針對這個問題,本期雷鋒網(公眾號:雷鋒網)硬創公開課邀請到小i機器人創新中心的研究院陳培華為大家具體講解,在客服機器人領域的深度語義技術和應用探索。
  • 乾貨:製造業中的機械智能(內附完整PPT)|雷鋒網公開課
    (公眾號:雷鋒網)硬創公開課的分享,由雷鋒網機器人垂直欄目「新智造(公眾號:新智造)」整理。承擔EPFL機器人實踐課(碩士課程)的教學,指導碩士畢業論文與機器人學期項目。長期從事機器人靈巧手抓取規劃與智能控制,主要研究圍繞在將先進機器學習算法應用於複雜機械系統的控制與設計之中。什麼是機械智能
  • 關於醫療大腦、知識圖譜與智能診斷,這是最全的解讀 | 雷鋒網公開課
    雷鋒網按:本文整理自康夫子創始人張超在雷鋒網硬創公開課上的演講,主題為「智能診斷與醫療大腦」。張超:康夫子創始人,前百度自然語言處理部資深研發工程師、文本知識挖掘方向負責人;知識圖譜、實體建模方面專家;畢業於電子科技大學計算數學專業、新加坡國大多媒體搜索實驗室研究助理。以下為公開課內容:雷鋒網(公眾號:雷鋒網):簡單介紹一下康夫子所做的事。
  • | 雷鋒網公開課
    如果你也想加入我們的榜單之中,請聯繫:2020@leiphone.com。雷鋒網按:本文整理自圖普科技李明強在雷鋒網硬創公開課上的演講。李明強是圖普科技創始人& CEO。原騰訊T4技術專家,騰訊資深項目經理,QQ郵箱項目負責人,微信立項創始人之一。
  • 微軟亞洲研究院秦濤:對偶學習的對稱之美 | 雷鋒網公開課總結
    但這樣的前提存在兩個主要的局限性。首先是人工標記數據的成本很高;其次是大規模標記數據獲取的難度較大。為了解決這一問題,在 NIPS 2016 上,微軟亞洲研究院提出了「一種新的機器學習範式」——對偶學習,利用任務互為對偶的特點從無標註的數據中進行學習。它的訓練原理是怎樣,具體有哪些應用前景,近期又有著怎樣的進展?
  • 開發者入門必讀:最值得看的十大機器學習公開課
    總結起來,這門課對數學、統計、IT 基礎薄弱的童鞋十分友好。其實很多機器學習入門課,都是假定學生已修完這一門,於是重點對其進行補充——講解這門課程中吳恩達老師未涉及、或是涉及不深的話題。因此,對於機器學習 「一張白紙」的童鞋,雷鋒網(公眾號:雷鋒網)強烈推薦從這門課起步,然後選擇其他入門課程進階,以在腦海中建立起更全面的知識體系。
  • | 雷鋒網公開課
    如何在合理成本下打造一個最為強大、合適的 SIEM 系統,是許多安全人員頭疼的問題。雷鋒網(公眾號:雷鋒網)有幸邀請到了擁有十年安全產品經驗的百度安全專家兜哥,為大家講解如何使用開源軟體搭建企業的SIEM系統。
  • 用了3個月HTC Vive,我們有這9個發現 | 雷鋒網公開課
    雷鋒網按:本文是來自「硬創公開課Online |  HTC Vive」的分享紀要。註:Q來自雷鋒網和雷鋒網讀者,A是Nada。一、6888元是一個嘗鮮價Q:怎麼看待HTC Vive 6888元的定價,是否過高(有人認為初代的Vive會是炮灰)?A:定價方面,如果再低,可能也沒法增加銷量。
  • 數據驅動人工智慧的實踐 | 雷鋒網公開課
    不管是說風口還是機遇,AI對科技產業創新的力量不言而喻,而在該領域積累了相關技術實力的研究者、企業創新者也希望趕上時代的列車。本次雷鋒網(公眾號:雷鋒網)AI金融專場硬創公開課第一期,我們邀請到百度金融首席數據科學家丁磊博士,來分享他關於人工智慧技術在商業領域的深度思考。
  • 螞蟻金服:雙十一背後,人工智慧怎樣「精打細算」 | 雷鋒網公開課
    以下是本次公開課的分享內容,雷鋒網(公眾號:雷鋒網)整理。這個團隊對公司各事業群的產品及平臺提供了人工智慧支持,支撐了各項業務,比如風險控制、信貸決策、保險定價、服務推薦、客戶服務等。人工智慧技術與螞蟻金服的前端、中臺和後臺有哪些結合點?最成熟、也是最典型的研發,是智能客服,上線後刨去成本,給公司節省了一億元。這主要指的是人力成本。
  • | 雷鋒網公開課 |...
    雷鋒網(公眾號:雷鋒網)2月27日報導,創新源於跨界融合。本次雷鋒網AI金融評論欄目(公號:aijinrongpinglun)公開課AI金融專場之第二期,我們邀請到了財鯨智能投顧聯合創始人王蓁博士分享見解。對於每一個細分領域的應用實踐,王博士都從「案例與要點對比」、「中美對比」以及「未來發展模樣預測」三個層面展開講述。
  • 雷鋒網教育雲峰會震撼來襲!
    在新基建勃發的背景下,雷鋒網為了把握教育科技發展的時代脈搏,闡明新基建與教育改革、教育數位化的關係,秉承「用技術洞見未來」的目標,重磅邀請了數位教育科技領域最具代表性的企業嘉賓,以系列公開課的方式,為雷鋒網讀者搭建了一個學習和交流的平臺,同時我們也創建了公開課教育垂直社群,將「最In」的技術乾貨和思維觀點零距離傳遞給每一位觀眾。
  • +張奕:人工智慧在消費級視頻場景中的應用丨雷鋒網公開課(附PPT)
    雷鋒網按:視頻直播行業在前幾年迎來了井噴式爆發,隨著人工智慧技術的逐漸成熟,視頻的解決方案也在不斷完善,例如大數據、智能追蹤、直播互動、廣告精準推薦等,這些都在潛移默化中提升視頻的用戶體驗,並且也給視頻行業帶來了新的商業模式。
  • 從聲學模型算法總結 2016 年語音識別的重大進步丨雷鋒網公開課
    本期雷鋒網硬創公開課特邀供職於阿里巴巴 iDST 的語音專家薛少飛博士,從學術的角度回顧過去一段時間裡語音識別技術的發展狀況。嘉賓介紹:本期雷鋒網(公眾號:雷鋒網)硬創公開課的分享主要包括三大部分:2011 年底,微軟研究院的俞棟、鄧力兩位老師又把 DNN 技術應用在了大詞彙量連續語音識別任務上,大大降低了語音識別錯誤率。從此以後基於DNN 聲學模型技術的研究變得異常火熱。微軟去年 10 月發布的 Switchboard 語音識別測試中,更是取得了 5.9%的詞錯誤率,第一次實現了和人類一樣的識別水平,這是一個歷史性突破。
  • SLAM,讓機器人知行合一 | 雷鋒網公開課
    月,雷鋒網將在深圳舉辦一場盛況空前,且有全球影響力的人工智慧與機器人峰會(CCF-GAIR)。屆屆時雷鋒網(公眾號:雷鋒網)將發布「人工智慧&機器人Top25創新企業榜」榜單。目前,我們正在拜訪人工智慧、機器人領域的相關公司,從中篩選最終入選榜單的公司名單。如果你也想加入我們的榜單之中,請聯繫:2020@leiphone.com。
  • 聊聊車企與碳纖維的那些事兒 | 雷鋒網公開課
    (公眾號:雷鋒網)硬創公開課的分享,由雷鋒網旗下欄目「新智駕」整理。本期公開課要點:汽車輕量化的意義;碳纖維複合材料的現狀;汽車廠商如何獲取碳纖維複合材料;複合材料對傳統汽車四大工藝的顛覆。這是電動汽車,尤其對自動駕駛和智能電動汽車而言的四個基本點。目前,傳統的燃油車規模非常龐大,電動車佔有率非常少。想實現碳排放的標準,傳統汽車的發展路線是怎樣的?傳統汽車可以通過三個路徑來實現:車身輕量化;發動機小型化;最可行、經濟化的應該是混合動力。
  • 沃爾瑪準備開發自有人工智慧網絡;Levis推出在線「虛擬造型師...
    據雷鋒網了解,Levis的智慧機器人由mode.ai公司提供技術支持,而它只是Levis通過技術革新來提升購物體驗、驅動銷售增長的一個小舉動。此前,Levis還曾強調過運用技術革新來提高庫存管理效率的重要性,並表示公司一直在於英特爾(Intel)等公司合作,希望通過先進的技術來提高庫存的精準度。
  • 地圖中的語義理解 | 雷鋒網公開課
    月,雷鋒網將在深圳舉辦一場盛況空前,且有全球影響力的人工智慧與機器人創新大會。屆屆時雷鋒網(公眾號:雷鋒網)將發布「人工智慧&機器人Top25創新企業榜」榜單。目前,我們正在拜訪人工智慧、機器人領域的相關公司,從中篩選最終入選榜單的公司名單。如果你也想加入我們的榜單之中,請聯繫:2020@leiphone.com。編者按:本文整理自搜狗公司王硯峰在雷鋒網硬創公開課上的演講。
  • 微軟——讓人工智慧為公益服務
    2018年 3 月 26日,北京 —— 以「公益,與Al同行」為主題的「2018微軟非營利組織信息日(NPO IT Day)」活動在微軟中國總部舉行,包括獅子會、友成企業家扶貧基金會、紅丹丹等78家130多名國內非營利組織代表到場,共同探討了將人工智慧技術與公益事業相互結合、予力他人創造美好生活的無限可能。