高端玩家！樹莓派 + Node.js 實現語音機器人 🤖

2020-11-06 流浪的思維

volute 是什麼?

volute(蝸殼)是一個使用 Raspberry Pi+Node.js 製作的語音機器人.

什麼是樹莓派?

樹莓派（英語：Raspberry Pi）是基於 Linux 的單片機電腦，由英國樹莓派基金會開發，目的是以低價硬體及自由軟體促進學校的基本計算機科學教育。

樹莓派每一代均使用博通（Broadcom）出產的 ARM 架構處理器，如今生產的機型內存在 2GB 和 8GB 之間，主要使用 SD 卡或者 TF 卡作為存儲媒體，配備 USB 接口、HDMI 的視頻輸出（支持聲音輸出）和 RCA 端子輸出，內置 Ethernet/WLAN/Bluetooth 網絡連結的方式（依據型號決定），並且可使用多種作業系統。產品線型號分為 A 型、B 型、Zero 型和 ComputeModule 計算卡。

簡單的說,這是一臺可以放到口袋裡的電腦!!

什麼是 Node.js?

原先 Javascript 只能依賴瀏覽器環境執行.Node.js 的誕生,讓我們可以在伺服器端使用 Javascript.Node.js 是一個能執行 Javascript 的環境,一個事件驅動 I/O 的服務端 Javascript 環境,基於 Google 的 V8 引擎.

什麼是人機對話系統 ?

人機對話（Human-Machine Conversation）是指讓機器理解和運用自然語言實現人機通信的技術。

對話系統大致可分為 5 個基本模塊：語音識別（ASR）、自然語音理解（NLU）、對話管理（DM）、自然語言生成（NLG）、語音合成（TTS）。

語音識別（ASR）:完成語音到文本的轉換，將用戶說話的聲音轉化為語音。
自然語言理解（NLU）:完成對文本的語義解析，提取關鍵信息，進行意圖識別與實體識別。
對話管理（DM）:負責對話狀態維護、資料庫查詢、上下文管理等。
自然語言生成（NLG）:生成相應的自然語言文本。
語音合成（TTS）:將生成的文本轉換為語音。

材料準備

樹莓派 4B 主板
樹莓派 5V3A TYPE C 接口
微型 USB 麥克風
迷你音箱
16G TF 卡
川宇讀卡器
杜邦線,外殼,散熱片...

樹莓派系統安裝及基礎配置

新的樹莓派不像你買的 Macbook 一樣開機就能用,想要順利體驗樹莓派,還得一步一步來~

燒錄作業系統

樹莓派沒有硬碟結構,僅有一個 micro SD 卡插槽用於存儲,因此要把作業系統裝到 micro SD 卡中。

樹莓派支持許多作業系統,這裡選擇的是官方推薦的 Raspbian，這是一款基於 Debian Linux 的樹莓派專用系統，適用於樹莓派所有的型號。

安裝系統我用的是 Raspberry Pi Imager 工具為樹莓派燒錄系統鏡像。

基礎配置

要對樹莓派進行配置,首先要啟動系統,可以將樹莓派連接顯示器和鍵盤滑鼠即可看到系統桌面,我使用的是另一種方法:

使用 IP Scanner 工具掃描出 Raspberry Pi 的 IP

掃描出 IP 後使用 VNC Viewer 工具連接進系統

也可以直接 ssh 連接,然後通過 raspi-config 命令進行配置

配置網絡/解析度/語言/輸入輸出音頻等參數

volute 實現思路

任務調度服務

熱詞喚醒 Snowboy

語音助手需要像市面上的設備一樣，需要喚醒。如果沒有喚醒步驟，一直做監聽的話，對存儲資源和網絡連接的需求是非常大的。

Snowboy 是一款高度可定製的喚醒詞檢測引擎(Hotwords Detection Library)，可以用於實時嵌入式系統，通過訓練熱詞之後，可以離線運行，並且功耗很低。當前，它可以運行在 Raspberry Pi、（Ubuntu）Linux 和 Mac OS X 系統上。

語音聽寫科大訊飛 API

語音轉文字使用的是訊飛開放平臺的語音聽寫服務.它可以將短音頻（≤60 秒）精準識別成文字，除中文普通話和英文外，支持 25 種方言和 12 個語種，實時返回結果，達到邊說邊返回的效果。

require("dotenv").config();const fs = require("fs");const WebSocket = require("ws");const { resolve } = require("path");const { createAuthParams } = require("../utils/auth");class XunFeiIAT { constructor({ onReply }) { super(); // websocket 連接 this.ws = null; // 返回結果,解析後的消息文字 this.message = ""; this.onReply = onReply; // 需要進行轉換的輸入流語音文件 this.inputFile = resolve(__dirname, "../assets/input.wav"); // 接口入參 this.params = { host: "iat-api.xfyun.cn", path: "/v2/iat", apiKey: process.env.XUNFEI_API_KEY, secret: process.env.XUNFEI_SECRET, }; } // 生成websocket連接 generateWsUrl() { const { host, path } = this.params; // 接口鑑權,參數加密 const params = createAuthParams(this.params); return `ws://${host}${path}?${params}`; } // 初始化 init() { const reqUrl = this.generateWsUrl(); this.ws = new WebSocket(reqUrl); this.initWsEvent(); } // 初始化websocket事件 initWsEvent() { this.ws.on("open", this.onOpen.bind(this)); this.ws.on("error", this.onError); this.ws.on("close", this.onClose); this.ws.on("message", this.onMessage.bind(this)); } /** * websocket open事件,觸發表示已成功建立連接 */ onOpen() { console.log("open"); this.onPush(this.inputFile); } onPush(file) { this.pushAudioFile(file); } // websocket 消息接收回調 onMessage(data) { const payload = JSON.parse(data); if (payload.data && payload.data.result) { // 拼接消息結果 this.message += payload.data.result.ws.reduce( (acc, item) => acc + item.cw.map((cw) => cw.w), "" ); // status 2表示結束 if (payload.data.status === 2) { this.onReply(this.message); } } } // websocket 關閉事件 onClose() { console.log("close"); } // websocket 錯誤事件 onError(error) { console.log(error); } /** * 解析語音文件,將語音以二進位流的形式傳送給後端 */ pushAudioFile(audioFile) { this.message = ""; // 發送需要的載體參數 const audioPayload = (statusCode, audioBase64) => ({ common: statusCode === 0 ? { app_id: "5f6cab72", } : undefined, business: statusCode === 0 ? { language: "zh_cn", domain: "iat", ptt: 0, } : undefined, data: { status: statusCode, format: "audio/L16;rate=16000", encoding: "raw", audio: audioBase64, }, }); const chunkSize = 9000; // 創建buffer,用於存儲二進位數據 const buffer = Buffer.alloc(chunkSize); // 打開語音文件 fs.open(audioFile, "r", (err, fd) => { if (err) { throw err; } let i = 0; // 以二進位流的形式遞歸發送 function readNextChunk() { fs.read(fd, buffer, 0, chunkSize, null, (errr, nread) => { if (errr) { throw errr; } // nread表示文件流已讀完,發送傳輸結束標識(status=2) if (nread === 0) { this.ws.send( JSON.stringify({ data: { status: 2 }, }) ); return fs.close(fd, (err) => { if (err) { throw err; } }); } let data; if (nread < chunkSize) { data = buffer.slice(0, nread); } else { data = buffer; } const audioBase64 = data.toString("base64"); const payload = audioPayload(i >= 1 ? 1 : 0, audioBase64); this.ws.send(JSON.stringify(payload)); i++; readNextChunk.call(this); }); } readNextChunk.call(this); }); }}module.exports = XunFeiIAT;

聊天機器人圖靈機器人 API

圖靈機器人 API V2.0 是基於圖靈機器人平臺語義理解、深度學習等核心技術，為廣大開發者和企業提供的在線服務和開發接口。

目前 API 接口可調用聊天對話、語料庫、技能三大模塊的語料：

聊天對話是指平臺免費提供的近 10 億條公有對話語料，滿足用戶對話娛樂需求；

語料庫是指用戶在平臺上傳的私有語料，僅供個人查看使用，幫助用戶最便捷的搭建專業領域次的語料。

技能服務是指平臺打包的 26 種實用服務技能。涵蓋生活、出行、購物等多個領域，一站式滿足用戶需求。

require("dotenv").config();const axios = require("axios");// 太簡單了..懶得解釋 const TulingBotService = { requestUrl: "http://openapi.tuling123.com/openapi/api/v2", start(text) { return new Promise((resolve) => { axios .post(this.requestUrl, { reqType: 0, perception: { inputText: { text, }, }, userInfo: { apiKey: process.env.TULING_BOT_API_KEY, userId: process.env.TULING_BOT_USER_ID, }, }) .then((res) => { // console.log(JSON.stringify(res.data, null, 2)); resolve(res.data.results[0].values.text); }); }); },};module.exports = TulingBotService;

語音合成科大訊飛 API

語音合成流式接口將文字信息轉化為聲音信息，同時提供了眾多極具特色的發音人（音庫）供您選擇。

該語音能力是通過 Websocket API 的方式給開發者提供一個通用的接口。Websocket API 具備流式傳輸能力，適用於需要流式數據傳輸的 AI 服務場景。相較於 SDK，API 具有輕量、跨語言的特點；相較於 HTTP API，Websocket API 協議有原生支持跨域的優勢。

require("dotenv").config();const fs = require("fs");const WebSocket = require("ws");const { resolve } = require("path");const { createAuthParams } = require("../utils/auth");class XunFeiTTS { constructor({ text, onDone }) { super(); this.ws = null; // 要轉換的文字 this.text = text; this.onDone = onDone; // 轉換後的語音文件 this.outputFile = resolve(__dirname, "../assets/output.wav"); // 接口入參 this.params = { host: "tts-api.xfyun.cn", path: "/v2/tts", appid: process.env.XUNFEI_APP_ID, apiKey: process.env.XUNFEI_API_KEY, secret: process.env.XUNFEI_SECRET, }; } // 生成websocket連接 generateWsUrl() { const { host, path } = this.params; const params = createAuthParams(this.params); return `ws://${host}${path}?${params}`; } // 初始化 init() { const reqUrl = this.generateWsUrl(); console.log(reqUrl); this.ws = new WebSocket(reqUrl); this.initWsEvent(); } // 初始化websocket事件 initWsEvent() { this.ws.on("open", this.onOpen.bind(this)); this.ws.on("error", this.onError); this.ws.on("close", this.onClose); this.ws.on("message", this.onMessage.bind(this)); } /** * websocket open事件,觸發表示已成功建立連接 */ onOpen() { console.log("open"); this.onSend(); if (fs.existsSync(this.outputFile)) { fs.unlinkSync(this.outputFile); } } // 發送要轉換的參數信息 onSend() { const frame = { // 填充common common: { app_id: this.params.appid, }, // 填充business business: { aue: "raw", auf: "audio/L16;rate=16000", vcn: "xiaoyan", tte: "UTF8", }, // 填充data data: { text: Buffer.from(this.text).toString("base64"), status: 2, }, }; this.ws.send(JSON.stringify(frame)); } // 保存轉換後的語音結果 onSave(data) { fs.writeFileSync(this.outputFile, data, { flag: "a" }); } // websocket 消息接收回調 onMessage(data, err) { if (err) return; const res = JSON.parse(data); if (res.code !== 0) { this.ws.close(); return; } // 接收消息結果並進行保存 const audio = res.data.audio; const audioBuf = Buffer.from(audio, "base64"); this.onSave(audioBuf); if (res.code == 0 && res.data.status == 2) { this.ws.close(); this.onDone(); } } onClose() { console.log("close"); } onError(error) { console.log(error); }}module.exports = XunFeiTTS;

效果演示

對話.m4a來自前端試煉00:0000:11

深圳天氣.m4a來自前端試煉00:0000:16

順口溜.m4a來自前端試煉00:0000:20

連結
https://mp.weixin.qq.com/s/x96yNp-RylWvTe1zcE2-IA

高端玩家！樹莓派 + Node.js 實現語音機器人 🤖

volute 是什麼?

什麼是樹莓派?

什麼是 Node.js?

什麼是人機對話系統 ?

材料準備

樹莓派系統安裝及基礎配置

燒錄作業系統

基礎配置

volute 實現思路

任務調度服務

熱詞喚醒 Snowboy

語音聽寫科大訊飛 API

聊天機器人圖靈機器人 API

語音合成科大訊飛 API

效果演示

相關焦點

使用樹莓派打造家庭監控系統

學 Rust，免費拿樹莓派

nodejs mqtt 智能售貨機系統物聯網控制系統源碼分享

3D 列印的樹莓派蜘蛛機器人

如此魔改樹莓派?工程師的腦洞不服不行!

[圖+視頻]用Raspberry Pi(樹莓派)打造的R2-D2星戰機器人

在樹莓派上實現人臉識別

用樹莓派做蜘蛛機器人,還是3D列印的!

全開源PicoRio對標銷量超3000萬件的樹莓派

4步實現樹莓派人臉識別、拍照與推送

全開源PicoRio對標銷量超3000萬件的樹莓派

全球樹莓派DIY也瘋狂:超級電腦、手機與平板動手做

啥都學點之使用nvm安裝Node.js並實現Node.js多版本管理

centos7編程實踐:安裝nodejs

如何安裝Node.js

教你動手做:3D列印的樹莓派蜘蛛機器人

在樹莓派上玩 Steam 遊戲的方法

歡迎來到AI的世界:從樹莓派,Arduino 到 HEXA | 了解機器人開發必看

萬能的樹莓派:各種奇葩DIY

高端玩家！樹莓派 + Node.js 實現語音機器人 🤖

volute 是什麼?

什麼是樹莓派?

什麼是 Node.js?

什麼是人機對話系統 ?

材料準備

樹莓派系統安裝及基礎配置

燒錄作業系統

基礎配置

volute 實現思路

任務調度服務

熱詞喚醒 Snowboy

語音聽寫 科大訊飛 API

聊天機器人 圖靈機器人 API

語音合成 科大訊飛 API

效果演示

相關焦點

使用樹莓派打造家庭監控系統

學 Rust，免費拿樹莓派

nodejs mqtt 智能售貨機系統物聯網控制系統源碼分享

3D 列印的樹莓派蜘蛛機器人

如此魔改樹莓派?工程師的腦洞不服不行!

[圖+視頻]用Raspberry Pi(樹莓派)打造的R2-D2星戰機器人

在樹莓派上實現人臉識別

用樹莓派做蜘蛛機器人,還是3D列印的!

全開源PicoRio對標銷量超3000萬件的樹莓派

4步實現樹莓派人臉識別、拍照與推送

全開源PicoRio對標銷量超3000萬件的樹莓派

全球樹莓派DIY也瘋狂:超級電腦、手機與平板動手做

啥都學點之使用nvm安裝Node.js並實現Node.js多版本管理

centos7編程實踐:安裝nodejs

如何安裝Node.js

教你動手做:3D列印的樹莓派蜘蛛機器人

在樹莓派上玩 Steam 遊戲的方法

歡迎來到AI的世界:從樹莓派,Arduino 到 HEXA | 了解機器人開發必看

萬能的樹莓派:各種奇葩DIY

語音聽寫科大訊飛 API

聊天機器人圖靈機器人 API

語音合成科大訊飛 API