微軟新AI項目為文檔和電子郵件的圖像添加字幕

2020-11-20 電子發燒友

微軟新AI項目為文檔和電子郵件的圖像添加字幕

人工智慧實驗室 發表於 2020-11-18 10:54:16

  微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟體讀取圖像。

  微軟的研究人員在有關預印本存儲庫arXiv的論文中解釋了他們的機器學習模型的原理。

  該模型使用可視語音詞彙預訓練(VIVO),它利用大量成對的圖像標籤數據來學習視覺詞彙。然後,使用帶有適當字幕的圖像的第二個數據以幫助教AI如何最好地描述圖片。

  「理想情況下,每個人都應在文檔,網絡,社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內容並參與對話。但是,可惜,人們卻沒有。」微軟AI平臺小組的軟體工程經理Saqib Shaikh說。

  總體而言,研究人員希望AI能夠提供Microsoft現有字幕系統兩倍的性能。

  為了對新AI的性能進行基準測試,研究人員將其納入了「無上限」挑戰。在撰寫本文時,Microsoft的AI現在在其排行榜上排名第一。

  「無上限的挑戰實際上是如何描述您在訓練數據中沒有看到的那些新穎的物體?」微軟研究實驗室的首席研究經理王麗娟評論道。

  希望使用Microsoft自動字幕AI來構建應用程式的開發人員已經可以這樣做,因為Azure Cognitive Services的Computer Vision軟體包中提供了該功能。

  微軟令人印象深刻的SeeingAI應用程式將使用新的AI進行更新,該應用程式使用計算機視覺描述視力障礙者的周圍環境。

  「圖像字幕是可以實現廣泛服務的核心計算機視覺功能之一,」Azure AI認知服務的CTO黃表示。

  黃繼續說:「我們AI的這一突破以Azure為平臺,以服務於更多客戶。」 「這不僅是研究上的突破;在Azure上將突破轉化為生產所需的時間也是突破。」

  改進的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責任編輯:YYX

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • Zoom或推出電子郵件和日曆應用程式,與谷歌和微軟競爭
    打開APP Zoom或推出電子郵件和日曆應用程式,與谷歌和微軟競爭 TechWeb.com.cn 發表於 2020-12-24 11:11:17
  • 谷歌Gmail 現已支持用戶直接編輯微軟 Office 文檔
    首頁 > 見聞 > 關鍵詞 > 谷歌最新資訊 > 正文 谷歌 Gmail 現已支持用戶直接編輯微軟 Office 文檔
  • Zoom可能推出電子郵件服務和日曆應用程式 與谷歌和微軟競爭
    【TechWeb】12月24日消息,據國外媒體報導,視頻會議軟體公司Zoom可能會推出電子郵件服務和日曆應用程式,與谷歌和微軟展開競爭。由於新冠病毒大流行帶來的遠程工作空前激增,視頻會議需求也隨之大增,而其中最大的受益者之一就是Zoom。現在,Zoom是一個非常受歡迎的視頻會議平臺,被許多組織和教育機構使用。
  • 如何在iPhone和iPad上將電子郵件轉換為PDF
    如果要將電子郵件的內容保存在收件箱之外,則選擇的最佳文件格式可能是PDF,因為它已被廣泛使用,並且可以在所有平臺上共享和查看,包括Windows PC,Mac,iOS和Android設備。大多數第三方電子郵件客戶端都有自己的功能,可以將電子郵件列印為PDF,因此該方法在很大程度上取決於您使用的應用程式。但是,如果您使用庫存郵件應用程式,則這些說明將非常適合您。如何在iPhone和iPad上將電子郵件轉換為PDF本指南此部分中的屏幕截圖是在iPhone上拍攝的,但在iPad上的步驟相同。
  • 打官司必備:如何收集整理電子郵件、錄音錄像、手機簡訊和照片作為索賠證據材料
    第五,總承包單位在使用電子郵件與業主進行溝通後,要及時將電子郵件列印出來,並按時間順序進行整理排序,保持連貫性,為將來的建設工程索賠打好證據基礎。第六,總承包單位在列印電子郵件時,要注意郵件截圖的完整性,確保列印出的電子郵件能夠完整顯示電子郵件的收發人、正文和所有附件。以word形式列印出來的總承包單位給業主發送的函件或會議記錄,不能單獨作為證據使用。
  • Zoom試圖用電子郵件和日曆應用程式來對抗谷歌微軟
    Zoom已經在開發一項電子郵件網絡服務,可能會在明年推出測試版,而它的日曆服務將是一個較長期的目標。 進軍電子郵件和日曆應用程式可能有助於Zoom對衝未來的風險,在2021年及以後,人們真的會在新冠肺炎疫苗分發給全球人口後重返工作崗位。 進軍電子郵件和日曆應用程式,有可能使Zoom成為一個更具企業生產力的平臺,從而與微軟Office 365和谷歌Workspace競爭。
  • [圖]Gmail現允許用戶直接編輯郵件附件中的Office文檔
    谷歌增強了對微軟 Office 辦公軟體的兼容性支持,允許用戶直接在 Gmail 的附件中編輯 Office 文件。
  • 微軟正為Win10 Edge/Chrome添加新的拼寫檢查器
    來源:IT之家微軟一直積極參與Chromium項目的開發,該項目為Edge、Chrome、Vivaldi和其他Web瀏覽器提供支持。微軟的貢獻使所有Chromium瀏覽器受益,包括Chromium 版 Edge和Google Chrome。
  • Zoom可能會推出電子郵件服務和日曆應用 與谷歌和微軟直接競爭
    據The Information的一份新報告顯示,現在該公司正在尋求拓展工作場所視頻聊天之外的新領域,特別是電子郵件和日曆服務。該公司已經在開發電子郵件產品,報告稱這將是一個網絡電子郵件服務,Zoom可能最早在明年開始測試。日曆應用的上線時間似乎更遠一些,目前還不清楚是否已經開始開發。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    安全生產監控方案 視頻分析邊緣計算盒 EM-BOX 全新升級,上新5項分析功能除安全帽佩戴合規檢測、煙火檢測、電子圍欄外,支持技能增加:陌生人檢測、攀高檢測、睡崗檢測、離崗檢測、人流過密預警。充分利舊現有攝像頭,即插即用,提供可視化管理平臺,支持二次開發。
  • 影視 | 乾貨篇 | PR批量添加字幕的方法
    轉自:樊老師的公眾帳號製作微電影音樂MV的時候呢,有字幕呢,就會顯得整體很高大上。但是pr添加部分字幕還可以,如果需要添加大量的歌詞應該怎麼辦呢?請看下面的文章。借用ps來批量導入歌詞。    ,市面上針對Premiere的字幕軟體價格昂貴且性價比不高,所以在這裡給大家介紹一個僅使用PS為Premiere批量生成字幕的好辦法,此方法的優勢在於快速省力以及後期修改的便捷性,一個TXT文本文檔即可批量輸出我們的字幕,而且只需要使用PS的批處理工具即可對字幕進行批量修改(後續將繼續推出批量修改字幕的教程),因此此方法十分適和大批量對白字幕的添加,比如課件、影視劇、紀錄片等等。
  • Pr字幕的製作
    當要給視頻作品添加大量字幕時,常規的字幕製作方法就顯得比較笨拙,而且非常耗時、耗力,這時就需要我們結合PS進行批量添加字幕。以下介紹具體操作方法:(1)新建一個文本文檔,將要批量添加的字幕保存在文本文檔中。注意在文本文檔中輸入字幕時,一定要一句一行,裡面不要有任何的標點符號。每行字符一定不要超過12個,如果字幕過長可分兩行。
  • 微軟針對iOS發布Word/Excel/PPT三合一APP
    繼安卓版之後,微軟還為iOS用戶推出了Word/Excel/PPT三合一APP,這也意味著手機用戶基本上都能用到它了。整體上來說,這款App的功能跟之前的安卓版基本保持一致,而提供的功能中包含了: 用於處理文檔、電子表格和演示文稿的最廣泛使用的工具,全部來自一個應用。 實時創建、編輯以及與其他人協作處理Office文檔。
  • Office 365 官宣更名為 Microsoft 365,AI 雲新功能搶先預覽
    :微軟昨日宣布,4 月 21 日,Office 365 將升級為 Microsoft 365。除了「365」的名稱變化之外,微軟也推出新的 Office 功能,幫助用戶「成為更好的作家、演示者、設計師、財務經理,並加強與生活的聯繫。」微軟還計劃為之後新增消費者推出 Microsoft 家庭安全應用程式和 Microsoft Teams。下面是具體新增功能介紹。
  • Zoom可能會推出電子郵件服務和日曆應用
    DoNews 12月24日消息(記者 程夢玲)據The Information的一份新報告顯示,視頻會議軟體公司Zoom可能會推出電子郵件服務和日曆應用程式,與谷歌和微軟展開競爭。報告稱電子郵件產品將是一個網絡電子郵件服務,Zoom可能最早在明年開始測試。
  • Zoom可能推出電子郵件服務和日曆應用程式
    據國外媒體報導,視頻會議軟體公司Zoom可能會推出電子郵件服務和日曆應用程式,與谷歌和微軟展開競爭。   由於新冠病毒大流行帶來的遠程工作空前激增,視頻會議需求也隨之大增,而其中最大的受益者之一就是Zoom。  現在,Zoom是一個非常受歡迎的視頻會議平臺,被許多組織和教育機構使用。
  • 如何給視頻添加音效和字幕?
    介紹一個好用的音效網站和給視頻添加字幕的兩種方法。上面兩個視頻是清明節前拍、假期裡剪的。主題都是介紹小程序新出的一項實用功能:「好友拼單」,有點像群收款但更為方便些,如果你還不知道可以用用看。為視頻配音大體剪完就可以開始配 BGM,想說一點,最好不要剪到認為完美為止才去配 BGM,因為通常配 BGM 需要踩點,和視頻節奏對上,也意味著需要再次對視頻做調整。
  • ai2021中文破解版 直裝版
    為該軟體系列的最新版本。相較於之前幾個版本,全新的2021版本帶來了許多升級和優化,改進了重新著色功能,現在可以直接使用顏色主題拾取器從任意圖稿或圖像中選取一種調色板,並不僅能將其應用於用戶的設計作品中進行使用,還支持利用顏色庫中預定義的顏色。增強了雲文檔,不僅支持用戶隨時訪問之前存儲的雲文檔版本,還能將photoshop雲文檔嵌入到ai文檔中進行使用,從而即可更好的幫助用戶應用於圖稿。
  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」
    和其他預訓練語言模型(PLM)一樣,DeBERTa旨在學習通用語言表示形式,適應各種下遊NLU任務。DeBERTa使用三種新技術——分離的注意力機制、增強的掩碼解碼器和一種用於微調的虛擬對抗訓練方法。改進了以前的最新PLM(如BERT、RoBERTa、UniLM)。這項研究是由微軟研究團隊的4位華人學者完成。
  • 紙質轉電子文檔 湖南湘潭投產我國人工智慧高速掃描機器人
    電子文檔是以計算機碟片、固態硬碟、磁碟和光碟等化學磁性物理材料為載體的文字、圖片材料。依賴計算機系統存取並可在通信網絡上傳輸。它主要包括電子文書、電子郵件、電子報表、電子圖紙、紙質文本文檔的電子版本等等。