提到人工智慧,如果你只想起下圍棋的話就太弱了。除了下圍棋,人工智慧正在越來越多的方面幫助人們,例如,在微軟,人工智慧正在幫助盲人「看見」這個世界。
上周三,微軟首次公布其 Seeing AI 應用,儘管仍在開發之中,但看起來既驚人又靠譜。
通過使用手機攝像頭和一副配備攝像頭的智能眼鏡,Seeing AI 應用能夠辨認你周邊的環境,物體,甚至情緒,以幫助盲人更好地理解身邊正在發生的事情。
Seeing AI 展示視頻
首先來認識下薩基博·薩科(Saqib Shaikh)
Saqib Shaikh 是Seeing AI 團隊的核心成員。七歲時,Saqib Shaikh 七歲失去了視力。之後,Shaikh 在盲人學校中接觸到了計算機的相關知識,這啟發了這位少年成為程式設計師。10年前,Shaikh 加入了微軟,成為一名軟體工程師。
在大學時期,他就一直夢想著能夠開發一款能夠隨時隨地告訴你身邊正在發生什麼事情的應用。
利用微軟人工智慧 API,Shaikh 和他的同事開發了這款結合手機以及 Pivothead 智能眼鏡的應用:Seeing AI 。只需要輕輕滑動眼鏡鏡腿,你就能「看到」眼前景象。
(註:Pivothead 是一家創建於 2010 年的智能眼鏡創業公司。)
作為軟體工程師,薩科也參與了Seeing AI 項目的開發與測試。
在 Build 2016 大會上公開的 Seeing AI 視頻中。薩科帶著 Pivothead 智能眼鏡時,滑動鏡腿就可以拍下眼前看到的景象。
微軟 AI 說到:「我想這是一個男人正在玩滑板,跳到空中」
在與人談話時,這款應用能讓盲人像普通人一樣參與講話。通過滑動鏡腿拍照,Seeing AI 不僅能夠告訴你人們有沒有在聽你說話,還可以描述你身旁的人的大致年齡和性別,甚至是他們的情緒。
「我看到兩張臉:40歲的男人臉上帶著驚訝的表情,20歲的女人看起來很開心」
不僅如此,這款應用還能精確地閱讀文本。
只需要通過應用對文本拍照即可,應用還會引導以確保你拍下你正在「看」的完整文本。
例如,微軟 AI 會指導到:「將攝像頭移到右下角並且離文件遠一些」
一旦你拍下照片,微軟 AI 就會辨認文本。它甚至還能先略過標題以確保萬一你並不想知道餐廳菜單上的每一個項目。
薩科在視頻最後表示,「多年之前,這是科幻小說才有的場景。我不曾想到這會變成現實。但人工智慧的發展速度令人難以置信,我非常激動自己可以感受到這些。作為工程師,我們一直站在巨人的肩膀上,推進我們多年來的研究。這個項目的背後,就是微軟多年的研究努力。對我來說,這是一步步將夢想變成現實,而這只是一個開始。」
素材來源:TechInsider
原文作者:Dave Smith
編譯:雷科技(公眾號:leitech)