神奇!微軟推出了一款App:可以幫你讀出全世界-微軟,App,AI,語音...

2020-12-08 快科技

對於一些視力缺陷者來說,日常生活的衣食住行中會存在相當多的麻煩。而現在,微軟推出了一款名叫Seeing AI的應用,可將視覺世界變成一種可聽見的語音體驗,這款應用或許能夠為他們提供一定的幫助。

Seeing AI 支持人物、短文、文本、條形碼以及場景的識別,用戶只需要拿住iPhone設備在四周移動,應用會通過神經網絡技術,將這些信息轉化為語音,讓用戶可以「聽到」周圍的環境情況,從而為視力缺陷者進行服務,Seeing AI大大方便了視力障礙者的日常生活


iOS下載地址:點此

人物及周圍環境的掃描

對人物的識別是微軟利用圖像識別工具提供更深入的圖片解釋。識別人物之後,Seeing AI 不僅可以判斷此人的性別以及大概的年齡,甚至可以對此人的外貌以及面部表情進行表述。

看看下圖Seeing AI對小哥的描述:一位滿頭黑髮表情自然的男士,識別結果還是很準確的。

此外,使用Seeing AI對周圍環境進行掃描,還能了解到周圍有多少人,這些人所在的位置以及與你的距離,當然還可知道這些人的面部表情。

Seeing AI還有一個新奇之處,你可以教Seeing AI去識別某個特定的人物。進入「臉部識別」功能,對某個人物的臉部進行三次拍攝,並做相應的姓名標註即可完成該人物信息的錄入,當你再次識別此人時,Seeing AI就會說出他的名字。

短文內容的自動識別

短文識別功能簡單來講就是哪裡看不清拍哪裡,這個功能結合了圖像識別技術與自然語言處理技術,將文本信息轉化為語音信息。這一功能可以幫助視障人士獲得對圖像的準確描述,還可能幫助那些需要圖像信息卻無法直接看到圖像的人——比如正在開車的司機。

在測試的過程中挖 App 君發現,在Seeing AI在「朗讀」文本的過程中,如果攝像頭捕捉到了更加清晰的文本圖像,那麼Seeing AI會從頭開始「翻譯」這段文本。

經過測試會發現Seeing AI識別效果很好,在識別讀出內容的過程中幾乎沒有錯誤。但在語言系統方面有些遺憾,應用目前只可以識別英文和阿拉伯數字,並不支持中文及其他語言的識別。

文件和條形碼的探測

文件識別的操作相對複雜一些,將攝像頭對準文本,Seeing AI 會引導你的手機放置,直到所選取的文本周圍出現邊緣,聽到「Hold steady」的聲音,然後拍攝進行文本識別。在文本識別之後,還可以使用 VoiceOver 功能對文本進行操作。

將手機攝像頭對準條形碼則可以對其進行識別,在掃碼的一瞬間會聽到嗶嗶的聲音,條形碼檢測成功後,Seeing AI 會說出產品的名稱。如果你想了解更多有關產品的信息,則可選擇點擊右下角的按鈕進行詳細的了解。

複雜場景的描述

場景的識別是讓計算機用更加人性化的方式去描述圖像,Seeing AI 會對識別的場景進行詳細的描述。比如下圖,Seeing AI 不僅會告訴你這是一臺筆記本電腦,它還會告訴你這臺電腦是以打開的狀態放置在桌上這樣詳細的描述。

不過場景識別的功能目前還處於測試階段,所以場景識別的結果並不總是正確的,相信微軟之後會完善這個功能。

小結

Seeing AI實現了「語音世界的魔法」,利用手機攝像頭將文字、人物、商品、場景等信息轉化為語音,讓更多的弱視群體儘可能的「獨立」,有助於為視障人士營造更公平的環境,與正常生活縮小差距。Seeing AI 的出現會在一定程度上讓更多的人利用人工智慧技術來造福人類。

Seeing AI 的部分應用可在離線狀態下使用,但是在語音方面暫時只支持英文系統,對該應用感興趣的小夥伴可以前去美區App Store下載體驗。

相關焦點

  • 微軟語音 AI 技術與微軟聽聽文檔小程序實踐|AI ProCon 2019
    語音AI技術跟移動開發是非常有關係的。大家平時開車時不方便用手輸入,可以用語音輸入,開車時想聽一些東西,完全可以用文字轉語音的技術去聽這些內容。基於這些考慮,微軟語音AI和微軟聽聽小程序合作做了些嘗試,今天給大家分享這裡面的故事。
  • 微軟Groove音樂APP關閉,卸載後你不妨試試這幾款APP
    對於微軟Groove想來我們都不陌生,不過這款APP始終讓廣大用戶愛不起來,無論是安卓版還是ios版本它的體驗並不是很好。日前,微軟發布通知,從6月1日開始,面向安卓和ios平臺的音樂服務APP將不再提供下載,另外在今年12月1日,面向ios和安卓的音樂服務將會徹底停止,這也意味著,微軟已經從網際網路音樂市場徹底抽身。那麼面對微軟Groove音樂APP的關閉,我們又將如何選擇適合自己的音樂APP呢?下面列出幾款,大家不妨來試試。
  • 翻譯利器:微軟新應用可轉換50種語言
    微軟(Microsoft)近日推出新應用Translator,支持安卓和iOS系統,可將您的文本和語音輸入翻譯成50種不同的語言。除了手機,這款應用還支持Apple Watch和Android Wear穿戴設備。
  • 微軟推出機器學習系統Brainwave,超低延遲、堪稱實時AI
    【AI星球(微信ID:ai_xingqiu)】8月23日報導(編譯:福爾摩望)微軟今天推出了一款可以支持高速、低延遲機器學習模型的系統,也預示著微軟開始在專用AI硬體領域嶄露頭角。
  • 微軟新出的 To-Do 應用,能替代奇妙清單嗎?| 領客專欄 · 電腦玩物
    之前收購 Wunderlist 的微軟,這兩天推出了叫做 Microsoft To-Do 的全新雲端待辦清單工具,有跨平臺的網頁、手機 app 與電腦軟體,擷取了 Wunderlist 的部分特色,加入了號稱「智慧建議」的功能。
  • 小娜走了,微軟小冰又來了,語音助手到底有沒有用
    )是全球第一款智能語音助手。Cortana不僅能幫用戶完成打開第三方應用、查找文件、收發郵件等日常應用,還可以唱唱歌,念念古詩,這樣「智能」的語音助手在當時無疑是黑科技級別的產品,比兩年後問世時還答非所問的Siri聰明太多。 Cortana的名字源於微軟旗下《光環》系列遊戲(「Halo」)的女主角,在遊戲中,Cortana就是一位陪伴主角的人工智慧。
  • 微軟專為Win10設備推出定製版SIM卡和應用
    微軟專為Win10設備推出定製版SIM卡和Cellular data應用  據悉,微軟SIM卡允許用戶在沒有合約束縛的前提下,用上各大運營商的行動網路。目前微軟正在測試讓裝載Windows 10的設備連接手機網絡商的無線蜂窩數據軟體——Cellular data應用。  目前Cellular Data app已經在Windows網上商店上線,專為特定的Windows 10設備設計,並且需要Microsoft SIM卡。
  • 真·黑科技:原來微軟是這樣把 Hololens 的全息交互畫面拍攝出來的...
    真·黑科技:原來微軟是這樣把 Hololens 的全息交互畫面拍攝出來的 如果你看過微軟去年 10 月份的發布會,你一定會對 Surface Studio 正式發布之前的
  • App Store 首頁推薦,這款 App 能幫你科學防曬 - UVLens #iOS #...
    原標題:App Store 首頁推薦,這款 App 能幫你科學防曬 - UVLens #iOS #Android 作者:林菁 廣州的這一個夏天,高溫伴隨著悶熱,簡直能把人蒸熟。
  • AI Frontiers | 微軟首席 AI 科學家鄧力演講:口語對話系統的分類...
    年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。在某種程度上,我們可以把對話系統看作:對話系統=語音識別+基於文字(text-based,或翻譯為「語義理解」)的系統語音識別向基於文字的對話系統,提供了一些低延遲的文字輸入。因此你可以把它們放在一起(認為它們對等),這是較傳統的觀點。
  • 以app為切入口 人工智慧正悄悄浸入花木行業
    近日,筆者通過採訪整理國內外植物識別app資料發現,人工智慧可在植物界發揮更多作用,未來整個行業或將出現更多跨界合作,而整體產銷能否得到巨大改善,是最引發業界關注的。人工智慧霸屏,花木產業被相中2016年4月,植物識別app「花伴侶」上線,緊跟著3月份世界圍棋冠軍李世乭慘敗AlphaGo的熱度,人工智慧又壓了一子在植物界。
  • 微軟「原聲」實時語音翻譯軟體亮相
    今年早些時候,我們報導過微軟正在研發的一款「原聲」語音翻譯軟體,它能把用戶說的話翻譯成其他語言播放出來,同時保留用戶本身的口音、音色和語調,聽上去就像用戶親口說的一樣。今天,微軟發布了該軟體的最新演示視頻,微軟首席研究官瑞克•拉希德(Rick Rashid)在視頻中利用該軟體大秀還算標準的中國普通話。
  • 微軟小英:讓人工智慧幫你學英語—新聞—科學網
    為了幫助更多人將英語學習融入日常,近日,微軟亞洲研究院和微軟網際網路工程院合力根據中國用戶的語言學習特點,推出了一款名為「微軟小英」的英語口語練習應用,幫助用戶徹底擺脫「Are you OK?」的尷尬場景。 「微軟小英」是一款融合了語音識別、口語評測,自然語言處理、語音合成等人工智慧技術而實現的智能人機互動服務,現已通過微信服務號的形式上線。
  • 能識人能斷字,微軟發布的這款App將手機鏡頭變成盲人的眼睛
    【獵雲網(微信號:ilieyun)】7月19日報導(編譯:海倩)近日,微軟推出了一款用於該應用能夠通過掃描文件或條形碼來讀出內容,告訴用戶手中的帳單或者握著的其他東西。此外,它還可以辨別人們見過的面孔,識讀他們的表情,甚至能描述用戶面前發生的一切。顯然,Seeing AI要想真正成為視障者的得力助手,微軟仍有大量的工作需要去做。微軟公司也很清楚這一點。因此,該應用啟動時首先呈現給用戶的便是一則警告:Seeing AI並不總是完全正確的。
  • 微軟的應用程式《Sketch 360》可以讓你快速原型化VR場景
    微軟的應用程式和服務孵化器看起來正在通過其最新項目《Sketch 360》再次成為熱門話題。新的應用程式《Sketch 360》是一個新的繪圖應用程式,它似乎利用了Windows 10和其他第三方對3D創作的支持。
  • 微軟機器人軟體「小娜」蘇州造
    「你不開心的時候,她可以安慰你;遇到難題時,她可以幫你出主意。」微軟(亞洲)網際網路工程院蘇州分院副院長閆勃說,「想看電影了,你只要說出影片名字,就能幫你在預訂網站下單,你只需要點一下最終的確認鍵。這款名叫「小娜」的仿真人智慧機器人應用軟體,由於語音識別功能強大、人機互動十分貼心,去年剛一發布就受到市場熱捧。昨天,微軟(亞洲)網際網路工程院蘇州分院舉行了開放日活動,並向外界宣布:「小娜」的「娘家」就在蘇州。在手機屏幕上點開一個圓形的應用,就會彈出一個可愛的「娃娃臉」,你就可以和她聊天了。「你不開心的時候,她可以安慰你;遇到難題時,她可以幫你出主意。」
  • 微軟抄襲 AppGet 始末,開源普法任重道遠
    AppGet 是一款開源的 Windows 軟體包管理工具,它可以在 Windows PC 上自動安裝軟體。作者 Keivan Beigi 是一名居住在加拿大溫哥華的軟體工程師。去年 7 月,微軟 App 事業部產品經理 Andrew Clinick 開始主動接觸 Keivan,表達了微軟對於 AppGet 的興趣,並表示可以給 Keivan 提供在微軟的職位,共同開發 Windows 系統的軟體包管理項目。期間,Andrew 多次與 Keivan 以交換意見為由進行面試溝通,獲取了 AppGet 的開發思路。
  • 微軟戰Google 軟體一對一 - 網易學院
    搜索微軟推MSN搜索完整版 搶攻Google   全球軟體巨頭微軟周日推出了桌面搜索工具的正式版本,將在競爭日趨激烈的搜索市場上與Google等對手一較高低。05年度主流桌面搜索軟體橫向評測   「如果你還在為選擇那款桌面搜索軟體猶豫的話,那就花一些時間參考一下2005年度主流桌面搜索軟體橫向評測,選擇一款適合您需求的軟體,在以後的使用中會得到非常大的便利
  • .| 微軟首席 AI 科學家鄧力演講:口語對話系統的分類及三代演變
    年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。在某種程度上,我們可以把對話系統看作:對話系統=語音識別+基於文字(text-based,或翻譯為「語義理解」)的系統語音識別向基於文字的對話系統,提供了一些低延遲的文字輸入。因此你可以把它們放在一起(認為它們對等),這是較傳統的觀點。
  • 美圖秀秀聯手微軟小冰,推出史上最強人工智慧賀卡
    近日,美圖秀秀聯手人工智慧微軟小冰,共同推出了人工智慧聖誕賀卡,兩個逆天黑科技就這樣相遇,滿滿心意不需太費力就能一鍵定製。也許很多人還在困惑於怎樣才能挑選精美的賀卡,怎樣才能突出獨特的心意,怎樣才能讓祝福表達得真誠溫暖,而有了美圖機器人Andy幫你製圖,微軟小冰幫你寫祝福詩句,再用小冰獨有的軟萌語音讀出來,在這兩個炫酷AI搭檔的幫助下,暖暖心意加上十足科技感,一張史上最強有聲聖誕賀卡就此誕生。