「專利解密」知存科技的新型語音處理芯片是如何工作的?
作者:米樂發布時間:2025-02-16
集微網消息,8月6日,北京知存科技有限公司(以下簡稱“知存科技”)宣布完成近億元的A輪融資,此輪融資由中芯聚源領投,普華資本、招商局創投、三峽鑫泰、科訊創投、燕緣雄芯跟投。
據悉,知存科技成立于2017年,主要研發NOR Flash存算一體AI芯片,主要針對語音識別和視覺識別兩個領域,目前正在進行Demo芯片的測試,運算效率為15TOPS/W,預計半年內進入量產階段。
語音芯片是指可以接收、處理、存儲和/或播放語音信號的IC(集成電路)。隨著集成電路技術的不斷發展,語音芯片對語音信號的處理功能也日漸豐富。例如,語音芯片可以實現對語音檢測、識別、合成等功能。目前,人工智能的興起,為語音處理技術賦予了更多的技術手段也對語音芯片的運算、存儲能力提出了新的挑戰。因此,有必要提供一種運算、存儲性能更適應的語音芯片。
就在去年18年12月29日,知存科技申請了一項名為“一種語音處理芯片、系統與方法”的發明專利(申請號:201811654163.6),申請人為北京知存科技有限公司。
根據目前公開的專利資料,讓我們一起來解讀一下這項語音處理芯片中的技術吧。
如上圖所示為語音處理系統的示意圖。語音處理系統可以處理人聲檢測、關鍵詞喚醒、命令識別、語音識別、聲紋識別和語音合成等。語音處理系統包括語音采集裝置、網絡、語音處理裝置和存儲設備。其中,語音信號采集裝置,語音處理裝置和存儲設備通過網絡相互通信連接。
語音信號采集裝置可以采集至少一個語音信號米樂m6網址。采集語音信號的方法可以包括:直接獲取已有音頻、利用音頻處理軟件捕獲截取聲音、利用麥克風錄制聲音等。語音信號采集裝置可以同時采集多個語音信號,并可以將所采集的語音信號分別進行存儲。

網絡可以促進信息和數據的交換。系統中的一個或多個部件(例如,語音采集裝置、語音處理裝置和存儲設備)可以通過網絡向系統中的其他部件發送信息和數據。
語音處理裝置可以對語音信號進行處理。語音處理可以包括人聲檢測、關鍵詞喚醒、命令識別、語音識別、聲紋識別和語音合成等。
在了解了系統的組成部分之后,我們再來看看該系統是如何工作的。
如上圖所示為語音處理的流程圖。首先,語音處理裝置可以接收語音信號,語音信號表征至少一段語音,語音處理裝置可以經由網絡接收來自語音信號采集裝置和存儲設備的語音信號。
其次,語音處理裝置可以對語音信號進行預處理,得到預處理后的語音信號。該預處理可以包括濾波、采樣、平滑、模擬/數字轉化和快速傅里葉變換等中的至少一種或多種米樂M6。語音處理裝置可以保存預處理后的語音信號,并將其發送至閃存芯片進行下一步處理。
最后,語音處理裝置可以控制閃存芯片對預處理后的語音信號進行運算,得到運算結果。其中,閃存芯片包括閃存陣列,閃存陣列用于在計算模式下對接收的數據進行計算,在編程模式下對參與計算的參數進行調整。
可以看到該語音處理芯片設計十分簡潔,利用不多的幾個模塊就實現了語音處理功能。這樣的語音處理芯片在我們的日常生活中也有很多的應用之處,例如不斷興起的物聯網技術中與用戶進行語音交互的部分,就可以利用這樣的技術。期待該技術能夠對我們的生活帶來更多的驚喜和便利。(校對/Jurnan)