Google新型的AI語音錄製應用程式

2020-12-23 智能甄選

Google投入大量資源用於AI和機器學習研究,以期為未來提供產品和服務。因此,無論是與計算攝影還是電子郵件建議功能有關,Google始終在這方面保持活躍。最近,Google還推出了著名的「 Google Recorder」。您可能想知道市場上有幾種錄音機應用程式,為什麼要這麼做呢?但是我們都知道,如果它來自谷歌,那麼它必須成為頂級產品的競爭者!

在進一步探索之前,讓我們看看Google是否閱讀了比賽!而且,是的,我們可以立即看到Google在基於AI的研究和發布方面做得很好。

最近啟動的Google Recorder應用程式是其中一種應用程式,該應用程式已經由機器學習算法提供了支持,該算法以無與倫比的準確率轉錄音頻。似乎Google並沒有經歷過Google Clips的失敗,但是此應用程式具有使它取得驚人成功的那些功能。目前,它可以在Google的旗艦移動品牌Pixel 4上使用,但應用程式開發人員也在進行進一步研究,以使其在Android平臺上可用。

讓我們更深入地挖掘吧!

但是首先,什麼是機器學習?

它是人工智慧的組成部分,它具有兩個功能,即學習和適應。因此,它將機器學習算法注入到程序中,這些程序可以從大量數據中學習並根據數據進行調整。

還是不清楚?

好吧,讓我們為您輕鬆些。

機器學習是一種理論,其中電腦程式無需任何人工幹預即可學習,解密和適應。機器學習處理成千上萬的數據(也稱為大數據),它根據給定的算法使用並使其有意義。

我們還看一些事實來闡明機器學習

到2024年,全球機器學習預計將從2017年的$ 1.58B降至$ 20.83B

從2017年到2024年的7年期間,複合年增長率預計將增長44.06%

根據Tractica,到2025年,AI收入還將從2018年的$ 10.1B增至$ 126B。

有關Google Recorder的更多信息

Google錄音機是實時運行的,是一款可以記錄音頻並對其進行解密,將其轉換為文本並具有編輯功能的應用程式。最好的部分是,它也可以離線運行,從而使其在競爭對手中脫穎而出。實際上,由於它是自動的,因此用戶甚至不必給出單獨的命令來轉錄。

您必須了解的有關Google Recorder的6件事

1.擁抱邊緣優先模型設計

公司提出了移動優先的設計理念,以開發其應用程式,以提供豐富的移動體驗,隨後又開發了桌面版本。我們知道,基於機器學習的應用程式在雲上運行,考慮到安全問題,這會使應用程式變慢且風險更高。但是Google錄音機是使用RNN-T換能器模型開發的,這就是Google語音錄音應用程式堅固的原因。

它使用單個神經網絡,被認為最適合解碼錯誤。如果公司希望開發具有更長保存期限的應用程式,那麼它就必須擺脫傳統的思想流派。

2.更好的技術堆棧

該應用程式是使用Swift和TensorFlow一起創建的。事實證明,這是一次很好的協作,因為它已轉化為更快的應用程式開發時間和增強的性能。Swift和TensorFlow已經為他們完成了竅門,對於未來的ML應用程式來說,這似乎也是一個不錯的建議。

3.轉錄功能

現在,我們都知道該應用程式會在音頻記錄的轉錄瞬間生成。解釋後的文本可以很容易地被掃描。這意味著,如果您要查找特定的單詞,則只需搜索該單詞,而無需面對收聽整個音頻的困難。Google語音記錄應用程式的解釋器或轉錄功能使它脫穎而出。

設備上的語音識別模型使該應用最多可以轉錄幾個小時的提取音頻文件。如此記錄的單詞被繪製到記錄的時間線上。當用戶點擊轉錄片段中的特定單詞時,音頻將從該點開始播放。

4.理解聲音

備受關注的扭曲神經網絡已用於將不同的聲音連接到顏色。用戶可以聽不同的聲音,例如狗叫聲或鳴叫聲,並根據聲音的強度在波形中分配顏色。

只需看一下,用戶就能看到聲音。它還審核各種聲音,並在960ms的時間內每50ms啟動一次。這將幫助用戶查明開始和結束時間,以消除錯誤。Google記錄器還具有一個滑動窗口,該窗口提供S形分數矢量作為輸出。

5.標題和標籤建議

錄製完成後,該應用程式還會根據音頻的性質提供有關標題和標籤的建議。語法的含義和術語的出現有助於它做到這一點。這些術語作為實體分開並大寫。

在預定算法的幫助下,它可以將語音的各個部分按下,並根據內容的質量進行評分。最終選擇的單詞將成為文本的標題或標籤。

6.用戶隱私

如前所述,如果ML是在雲平臺上構建的,則應用程式性能會降低,並且用戶數據將不受保護。機器學習推論數據時,它將在每個人都可以訪問的雲平臺上提供大數據。您的個人信息也會受到威脅,但是Google知道您的隱私很重要。

您記錄和保存的數據可以是家庭會議或重要的律師對話。通過使其脫機使用,開放平臺無法利用它。您無需將數據傳輸到雲。

到目前為止,一切都很好!

我已經介紹了很多有關備受讚譽的Google記錄器,我們作為用戶必須了解為什麼機器學習是一件大事,需要以Google的方式完成。

現在是人類使用AI和ML作為工具而不是與之競爭的時候了。如果研究朝著正確的方向發展,那麼前途一片光明。

相關焦點

  • 谷歌助手開啟語音控制Android應用程式,涵蓋30餘款APP
    據多家外媒報導,谷歌公司在周四宣布,Android用戶可以使用谷歌助手語音命令,在兼容的第三方應用程式中運行任務。在Android應用程式中,使用語音命令「Hey谷歌」不僅可以打開,還可以執行特定的任務。
  • 谷歌推出錄音程序Recorder,智能處理海量音頻信息
    為了解決這一問題,讓人們更為便捷地檢索錄音中感興趣的信息,谷歌為Pixel開發了一個名為Recorder的應用,將移動端機器學習的最新進展應用於對聲音、對話的記錄和轉寫、檢測和識別特定類型的音頻(包括語音、音樂、掌聲、口哨、音樂等等)並為錄音信息編制了有效的索引,從而幫助用戶可以快速地尋找到感興趣的錄音片段。
  • Google Rivet:語音識別和AI提升孩子閱讀技能
    [PConline資訊]關於行動裝置和應用程式對於孩子的正面和負面影響仍存在爭論,有些家長將其當做更好的學習工具,而有些家長則視其為洪水猛獸。不過顯然谷歌更支持前者,該公司神秘的研發部門Area120以此為目的推出了名為Rivet的應用程式。
  • 蘋果正在關閉其音樂備忘錄錄音應用程式
    每當您下載應用程式時,創建該應用程式的開發人員就有可能有一天將您最喜歡的體驗之一作為日落。不幸的是,這就是Apple Music Memos軟體的命運。本周,該公司將該應用程式更新為1.0.7版。巧合的是,這是Apple一年多來第一次更新Music Memos,此新版本的唯一目的是促進應用程式的關閉。
  • Google Pixel 增加了一項 AI 功能,變得更加貼心了
    雷鋒網消息,2019 年 8 月 2 日,Google 官方博客宣布,Google 正在為 Pixel 增加一款應用程式,使用戶能夠在不說話的前提下,就能夠將位置信息傳遞給醫療、火災或警方急救人員。據 Google 官方介紹,在這個應用程式上,會有「醫療」、「火警」、「警察」三個按鈕,點擊按鈕,就會激活一個文本到語音的功能,該功能會讀出一條信息,告訴接線員來電者正在使用一項自動服務,描述來電者需要的幫助種類以及來電者的當前位置(來自手機 GPS 定位)。
  • 推薦使用的9個Apple Watch應用程式
    上周是Apple Watch的五周年紀念日,很明顯,這款原本是為你的手腕安裝上大量第三方應用程式的iPhone設備,已經變成了一個有用的健身追蹤器。它的自帶應用程式比你下載的任何應用程式都要有用。儘管亞馬遜、ebay、Target和TripAdvisor等公司都不再支持Apple Watch應用程式,但這並不重要——我們有手機、平板電腦和筆記本電腦來查看這些應用程式。真正重要的是內置的活動跟蹤器、簡訊和手機應用程式——我們希望手錶上有這些東西,可以方便快捷地瀏覽。
  • Oculus Santa Cruz被曝光支持MR功能;三星投資3D頭像製作公司Loom.ai
    微軟推出兩款新應用程式,旨在為企業帶來實用的底層功能。該應用程式通過HoloLens從工作人員那裡獲得第一人稱視角影像,並允許協助者實時遠程對視圖進行注釋。而實時增強的注釋不僅僅是簡單的畫中畫標記,它能夠正確的「附加」在現實世界視圖中。圖像也可以插入到場景中。
  • 語音AI革命十年,不忍看,不敢看!_詳細解讀_最新資訊_熱點事件_36氪
    2015年:SOUNDHOUND推出HOUNDIFY平臺 普通消費者可能會將SoundHound與音樂識別應用程式相關聯,但該公司的Houndify平臺正在為越來越多的公司提供品牌語音助手。在Houndify出道不久後,公司籌集了1億美元的資金,這為公司的快速增長提供了動力,也顯示了語音技術方面的競爭空間是多麼巨大,無論虛擬助理的名字是什麼。
  • Google環聊,以下是聊天,語音和Fi的功能
    目前,聊天與環聊共存,後者也與Google Fi和Google語音集成在一起,您也可以在Gmail中使用聊天功能。有時確實感覺Google可以為每個人單獨設置一個消息傳遞策略和應用程式,但目標是使每個人都在同一平臺上,即使他們以不同的方式與之交互。
  • 「Imaging Edge」應用程式更新發布
    從專業遙控拍攝到即時傳輸,從影像瀏覽到後期增強處理,進一步加強索尼相機與電腦的連接,提高拍攝和作品創作的效率及圖像質量的軟體套件「ImagingEdge」索尼智能影像應用程式最新版本
  • 蘋果和谷歌宣布Apple TV應用程式將登陸谷歌安卓電視平臺Google TV
    據報導,蘋果和谷歌宣布,Apple TV 應用程式將登陸谷歌安卓電視平臺 Google TV。Roku 和亞馬遜的 Fire TV 是目前最大的兩個流媒體平臺,雖然它們都支持上述服務中的大部分服務,但 Roku 仍然不支持 HBO Max 的官方應用程式,亞馬遜也沒有 Peacock 應用程式。
  • Google語音可能是免費的而VoxOx可能會提供更多功能
    英國電信的Ribbit雲計算部門於11月3日將其Web電話應用程式以Ribbit Mobile的形式帶入了行動裝置市場,該服務使用戶可以管理從其計算機到手機的呼叫和消息。如果聽起來像Google Voice和VoxOx之類的服務,那是因為它很相似。
  • Siri和Google Now,哪個語音助手更強?
    兩個語音助手與各自系統的集成度都非常高,用戶只需要動動嘴,就可以完成比較複雜的操作。但是就技術角度來看,蘋果的Siri和Google的Google Now,哪個更強?科技作者Kontra給我們的答案是:不分伯仲。科技作者Kontra於本周一發表文章指出了蘋果Siri語音助手和Google Now的各自優勢所在。對於人工智慧語音助手來講,語境是決定其成敗的關鍵。
  • 你甚至不知道的Apple Watch最好的應用程式都在哪!
    其實很多用戶並不知道,Apple Watch的原生應用程式比你下載的任何應用程式都要有用得多。儘管亞馬遜(Amazon)、eBay、Target和TripAdvisor等公司都不再支持Apple Watch應用程式,但這並不重要,因為我們有手機、平板電腦和筆記本電腦來檢查這些應用程式。
  • Mac冷知識:Mac究竟內置了多少應用程式?
    Mac 簡單高效、強大好用,macOS 這一作業系統和自帶的大量優秀應用程式功不可沒。它為 Mac 特別打造,採用了軟硬體協同設計,能幫助用戶得心應手地處理各種事情,不管你是設計師、開發者,還是日常工作、學習,macOS 和強大的自帶應用程式都能滿足你的所有需求。
  • 德國小哥用AI拍大片!GPT-2寫臺詞、StyleGAN做特效、Replica來配音
    GPT-2語言模型的colab版本,可以從下面的網址進入:  https://colab.research.google.com/github/mrm8488/shared_colab_notebooks/blob/master/GPT2_with_JS_UI.ipynb
  • 如期而至 | Google Play 2020 年度最佳榜單公開!(應用篇)
    你可以錄製簡短的語音備忘錄,也就是「 bean」,然後你的朋友們錄製的語音在這裡也叫作「 bean」。當你的「 bean」跟你朋友的「 bean」混合到一起後,每天早上起床後,你都可以打開「Cappuccino 」APP,來收聽屬於你的獨家卡布奇諾了。*關注「最美應用」,後臺回復「2123」獲取應用下載地址。
  • 淺談語音情感識別技術在互金質檢領域的應用
    隨著以上三種數據(文本、圖像、語音)的數位化,又使得存儲於三種數據形式的情感可以通過相關的數據挖掘技術進行自動檢測識別。對於基於文本和圖像的情感檢測,拍拍貸都已經做過相關研究和應用。本文主要對基於語音的情感識別技術和應用進行簡要的介紹。
  • Google glass推獨享音樂程序 體驗更佳
    谷歌眼鏡將會新增Play Music應用程式和All Access功能,用戶只需說出通過語音就可暫停或者切換至下一首音樂。Google glass推獨享音樂程序 體驗更佳(圖引自engadget)    另外,之前安裝過谷歌Play Music2的用戶需要先下載之前版本才能使用。
  • 桌面寵物語音對話下載_桌面寵物語音對話手機版下載【官方安卓版...
    《桌面寵物語音對話》這是一款可以和寵物對話聊天遊戲,可以設置顯示即任何界面,或者只在主界面顯示,你摸摸它它會有很多不一樣的心情給你反饋,還可以和寵物語音對話聊天哦!