微軟新專利:包含魚眼鏡頭和麥克風陣列的AI設備

2020-12-13 中國日報網

近年來微軟不斷強調人工智慧的重要性,甚至預測其各種應用將會在未來幾年為全球GDP增長貢獻5萬億美元。在過去數月裡微軟已經增強了和很多合作夥伴的合作關係,共同探索和推動AI領域的發展。本月微軟提交申請的一項專利被美國商標和專利局(USPTO)收錄,展示帶有單個魚眼攝像頭和多個麥克風陣列的人工智慧系統。魚眼攝像頭具備特殊的鏡頭可以監控360度全景。

儘管該技術並不新鮮,但微軟計劃以不同的方式和其他周圍環境傳感設備配合使用。這種環境捕獲系統通常具有多個攝像機以擴展其視野。這需要複雜的設計,並且還需要額外的硬體來融合多個視頻數據流。

因此,微軟已經提出了一種面向上方的魚眼攝像頭,可以與這些設備一起使用,還有一個麥克風陣列。這將解決與捕獲移動物體相關的困難,或者關注單個物體在多個目標之間的移動。

在這項專利中描述了很多硬體相關的技術,例如大多數麥克風會以圓形或六邊形圖案放置,而魚眼攝像頭則位於麥克風陣列附近,以便於以最佳方式捕捉數據。

根據專利中所描述的模型,該設備還有進一步的應用。例如識別說話人的語音內容,意味著該技術可以和Cortana進行合併。Microsoft指出,所描述的設置可以使數字助理能夠記錄與其環境相關的更豐富的信息,同時相對容易地識別並採取從用戶接收的更高質量的聲音和視頻提示。

來源:環球網

相關焦點

  • 微軟研究院展示虛擬麥克風陣列技術 藉助多設備實現高精度語音轉錄
    在《蝙蝠俠》系列的《黑暗騎士》影片中,布魯斯·韋恩通過攻擊數百萬部手機,打造了一套基於麥克風陣列的龐大監聽網絡(SONAR)。不過本周,微軟研究院展示了一項類似的技術,它就是 Project Denmark 。
  • 微軟智能音箱新專利曝光 可解決混響問題
    來源:新浪VR5月26日消息,據外媒patentlyapple報導,微軟一項關於智能音箱設計的新專利獲得美國專利商標局授權。專利文件顯示,聲控智能音箱是與語音識別系統相結合的音箱,其麥克風的陣列可以是圓形的,以允許形成傳入語音命令的遠場波。但實際使用環境通常不是開放空間,會造成聲學二次重疊信號,微軟的新專利正可以解決這一問題。
  • 微軟iPhone底座專利 可與Win10設備連接互動
    2019年12月下旬,美國專利局發布了一項專利申請,展示了微軟用於連接Windows 10設備的iPhone擴展塢。 我們發現,這項專利申請的標題是「用戶外圍設備」,由微軟在7月提交,美國專利局於2019年12月公布了這項專利。
  • 樂鑫發布 AI 語音麥克風陣列開發板 ESP32-Korvo
    樂鑫信息科技發布 AI 語音麥克風陣列開發板 ESP32-Korvo 。這是一款針對物聯網嵌入式設備的 AI 語音開發板,基於樂鑫的旗艦晶片 ESP32,搭載多麥克風陣列,能夠實現高性能、低功耗的遠場語音喚醒和命令詞識別功能。本文引用地址:http://www.eepw.com.cn/article/202004/411927.htm近年來,隨著人工智慧和物聯網的興起,語音逐漸成為我們與智能設備交互的一種典型方式。
  • 麥克風陣列的概念簡介
    1 麥克風陣列        麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音信號進行空間採樣的一種裝置,採集到的信號包含了其空間位置信息。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。
  • 語音交互:先從麥克風陣列聊起
    想要了解語音交互,第一步是了解麥克風陣列,本文從概念、分類、作用幾個方面對麥克風陣列展開了說明,與大家分享。語音交互從亞馬遜音箱(Echo)誕生的那一刻,就逐步走進了人們的視野,越來越多的人開始接觸到語音交互的設備。從電視裡的機器人,到家裡的音箱,最後到手上的手機,語音交互變得觸手可及。
  • 大牛講堂 | 語音專題第一講,麥克風陣列的語音信號處理技術
    2011年11月畢業於英國愛丁堡大學通信與信號處理專業,曾任諾基亞,聯想,微軟高級音頻工程師。現在Horizon-Robotics負責語音相關硬體系統設計,涉及遠場高靈敏度麥克風陣列設計,高精度音頻硬體編解碼器評估驗證,遠場語音前處理算法的評估驗證,涉及聲源定位,波束形成,盲信號分離,回聲抑制及平穩降噪等相關技術算法。
  • 詳解麥克風陣列的基本原理、結構組成及聲學效果
    陣列(Array):數學定義——有限個相同資料形態之元素組成之集合麥克風陣列具有對遠場幹擾噪聲很強的抑制作用,應用於便攜IT設備如PDA、GPS、NB、手機等在較大噪聲環境中使用時表現出較好的效果。小型麥克風陣列由一組麥克風單元在一個小範圍內按照一定空間分布組合而成,由於它在噪聲環境下具有良好的信號採集性,因此越來越受到聲學應用領域的關注。
  • 麥克風陣列的基本原理、結構組成及聲學效果簡介
    陣列(Array):數學定義——有限個相同資料形態之元素組成之集合 麥克風陣列具有對遠場幹擾噪聲很強的抑制作用,應用於便攜IT設備如PDA、GPS、NB、手機等在較大噪聲環境中使用時表現出較好的效果。一、波束的形成麥克風陣列是指按一定距離排列放置的一組麥克風,通過聲波抵達陣列中每個麥克風之間的微小時差的相互作用,麥克風陣列可以得到比單個的麥克風更好地指向性。在麥克風陣列的設計中首要的改進是引入了波束成形、陣列指向性與波束寬度的概念。
  • 微軟新平面透鏡技術專利發布,讓HoloLens實現輕量化
    微軟在日前公布的新專利採用了平面透鏡技術,可以讓HoloLens的構造更加輕薄。 值得欣慰的是,目前微軟已經找到了新的解決方案,並且向世界智慧財產權組織提交了專利。雖然HoloLens的頭號問題是視場過窄,而另一則問題是因內置一系列傳感器而導致的設備過於笨重,給用戶體驗帶來不好的感受。其中之一有Kinect一樣的深度傳感器。這種元件通過過紅外投影儀和紅外攝像頭來實現環境的飛行時間深度感知。微軟需要精簡設備內部的組件來實現輕量化。
  • 魚眼鏡頭使用入門指南:魚眼鏡頭應該怎麼用(附後期魚眼效果)!
    使用魚眼鏡頭拍攝的照片可以獲得非常極寬的拍攝角度,通常是在180度。它們在風景,極限運動和藝術攝影中非常受歡迎。魚眼鏡頭提供了任何其他類型鏡頭無法提供的獨特創意視角。什麼是魚眼鏡頭魚眼鏡頭是廣角鏡頭中的一種,它的透視效果非常強,可以將直線扭曲成曲線。
  • 關於五麥克風環形陣列的分析
    自2015年3月和8月,訊飛相繼對外發布四麥、二麥麥克風陣列解決方案。今天在深圳阿基米網際網路公社舉辦的「訊飛核心技術開發日——麥入雲端,引領智能交互新主義」沙龍活動中,更重磅發布了打破語音交互瓶頸的利器——4+1環形五麥克風陣列,再次引領智能交互新主義!
  • 聊一聊麥克風陣列技術:語音交互應該選用怎樣的方案?深度
    但是好多朋友私信諮詢,因此這裡想稍微深入談談麥克風陣列技術,以及智能語音交互設備到底應該選用怎樣的方案。什麼是麥克風陣列技術?學術上有個概念是「傳聲器陣列」,主要由一定數目的聲學傳感器組成,用來對聲場的空間特性進行採樣並處理的系統。
  • 聊一聊麥克風陣列技術:語音交互應該選用怎樣的方案?|深度
    這種差異我們在文章《對比Amazon Echo,Google Home為何只採用了2個麥克風?》做了探討。但是好多朋友私信諮詢,因此這裡想稍微深入談談麥克風陣列技術,以及智能語音交互設備到底應該選用怎樣的方案。什麼是麥克風陣列技術?
  • 關於聲智科技Spartan-6系列麥克風陣列介紹
    隨著語音交互行業發展的如火如荼,全球領先的可編程邏輯解決方案供應商賽靈思也開始布局語音交互市場,此次聯合聲智科技發布了Spartan-6系列麥克風陣列。 最先上線的SAI_MICA_60C_UI 遠場語音交互通用型麥克風陣列,搭載賽靈思Spartan-6系列FPGA晶片、採用6顆高靈敏度遠場拾音專用麥克風,通用USB埠輸出以及高集成度模塊化設計,是北京聲智科技有限公司以十多年聲學技術積累,融合人工智慧技術,面向企業用戶和技術發燒友發布的,一款可靈活快速集成的遠場語音交互解決方案。
  • 玩轉魚眼鏡頭,畸變也可以很美
    這是我用iphone8在同樣的場景下拍攝的兩張照片,圖1使用了一個卡色238°的魚眼鏡頭。你更喜歡哪一張的效果呢?什麼是魚眼鏡頭所謂的魚眼鏡頭是指一種焦距為16mm或更短的並且視角接近或超過180°的鏡頭。為使鏡頭達到最大的攝影視角,這種攝影鏡頭的前鏡片直徑很短且呈拋物狀向鏡頭前部凸出,與魚的眼睛頗為相似,這也是「魚眼鏡頭」名稱的來歷。
  • 一文帶你全面熟悉智能語音之麥克風陣列技術的原理
    而麥克風陣列融合了語音信號的空時信息,可以同時提取聲源並抑制噪聲。   目前科大訊飛已經實現了基於線性陣列、平面陣列以及空間立體陣列的波束形成和降噪技術,效果均達到業界一流水平。——聲源定位(Source Localization)   現實中,聲源的位置是不斷變化的,這對於麥克風收音來說,是個障礙。麥克風陣列則可以進行聲源定位,聲源定位技術是指使用麥克風陣列來計算目標說話人的角度和距離,從而實現對目標說話人的跟蹤以及後續的語音定向拾取,是人機互動、音視頻會議等領域非常重要的前處理技術。
  • 微軟新專利描述了Surface Neo的觸控和筆輸入功能
    本文轉自【cnBeta.COM】;隨著微軟即將推出雙屏設備,該公司也在完善設備的不同方面。根據一項新專利顯示,微軟正在努力改進Surface Neo的觸摸和筆輸入功能。該專利於2019年11月26日提交,並於今天公布。
  • 微軟WP聲控專利曝光 或被Xbox 720採用-微軟,Xbox 720,語音控制...
    上周,美國專利商標局(PTO)公布了微軟的一項新專利,其內容涉及語音操控Windows Phone來進行拍照、錄像以及圖片的保存與刪除。專利說明顯示,微軟計劃在未來的Windows Phone當中加入更強的語音功能來實現對於攝像頭的控制,用戶可以通過簡短的語音指令來使手機進行拍照、錄像,並能夠進行拍攝後的保存於刪除操作。
  • 基於麥克風陣列的聲源跟蹤系統
    聲源目標跟蹤技術可以應用在視頻錄製、安防監控、鳴笛抓拍等場景中,在這些場景中,針對目標對象的語音信號,可以應用陣列信號處理的知識,將麥克風按照特定陣列放置在空域中,利用空間不同位置點的聲源對麥克風陣列響應的時延相位誤差,對聲源進行測向,實現低成本的聲源定位跟蹤功能。