[liantaiwei]語音識别芯片所涉及的技術分析——聯泰威電子

[liantaiwei]語音識别芯片所涉及的技術分析——聯泰威電子

2018-06-16handler1142


語音識别芯片也叫(jiào)語音識别IC,與傳統的語音芯片相比,語音識别芯片最大的特點就(jiù)是能(néng)夠語音識别,它能(néng)讓機器聽懂人類的語音,并且可以根據命令執行各種(zhǒng)動作,如眨眼睛、動嘴巴(智能(néng)娃娃)。除此之外,語音識别芯片還(hái)具有高品質、高壓縮率錄音放音功能(néng),可實現人機對(duì)話。


語音識别芯片所涉及的技術包括:信号處理、模式識别、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能(néng)等等。

圖片

語音識别分類


按照使用者的限制而言,語音識别芯片可以分爲特定人語音識别芯片和非特定人語音識别芯片。

特定人語音識别芯片是針對(duì)指定人的語音識别,其他人的話不識别,須先把使用者的語音參考樣(yàng)本存入當成(chéng)比對(duì)的資料庫,即特定人語音識别在使用前必須要進(jìn)行語音訓練,一般按照機器提示訓練2遍語音詞條即可使用。

非特定人語音識别是不用針對(duì)指定的人的識别技術,不分年齡、性别,隻要說(shuō)相同語言就(jiù)可以,應用模式是在産品定型前按照确定的十幾個語音交互詞條,采集200人左右的聲音樣(yàng)本,經(jīng)過(guò)PC算法處理得到交互詞條的語音模型和特征數據庫,然後(hòu)燒錄到芯片上。應用這(zhè)種(zhǒng)芯片的機器(智能(néng)娃娃、電子寵物、兒童電腦)就(jiù)具有交互功能(néng)了。


非特定人語音識别應用有的是基于音素的算法,這(zhè)種(zhǒng)模式下不需要采集很多人的聲音樣(yàng)本就(jiù)可以做交互識别,但是缺點是識别率不高,識别性能(néng)不穩定。

語音識别基本原理


嵌入式語音識别系統都(dōu)采用了模式匹配的原理。錄入的語音信号首先經(jīng)過(guò)預處理,包括語音信号的采樣(yàng)、反混疊濾波、語音增強,接下來是特征提取,用以從語音信号波形中提取一組或幾組能(néng)夠描述語音信号特征的參數。


特征提取之後(hòu)的數據一般分爲兩(liǎng)個步驟,第一步是系統"學(xué)習"或"訓練"階段,這(zhè)一階段的任務是構建參考模式庫,詞表中每個詞對(duì)應一個參考模式,它由這(zhè)個詞重複發(fā)音多遍,再經(jīng)特征提取和某種(zhǒng)訓練中得到。


第二是"識别"或"測試"階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模闆之間的失真測度,最匹配的就(jiù)是識别結果。

深圳市西城微科電子有限公司(聯泰威電子有限公司)位于深圳市福田區,是以軟件開(kāi)發(fā)和芯片代理爲主營業務的科技型企業。公司從2005年開(kāi)始從事(shì)芯片代理及方案開(kāi)發(fā),對(duì)單片機和标準芯片的選型有著(zhe)豐富的經(jīng)驗,可以爲客戶提供最佳的産品和最優質的服務。

公司代理合泰、芯海、紘康、松翰、華潤、晟矽微電、敏芯等國(guó)際知名品牌公司的産品,可以爲客戶提供:8位/32位MCU、LCD/LED/VFD驅動、EEPROM存儲器、電源管理、時(shí)鍾電路、低功耗運放、觸摸按鍵等一系列标準IC與技術支持。公司緻力于不同領域電子産品的研發(fā),可以爲客戶提供自信的藍牙秤方案、藍牙四電極/八電極交流測脂方案、藍牙直流測脂方案、藍牙PM2.5方案、藍牙心率檢測方案、藍牙電量檢測方案、普通電子秤方案、胎壓計方案、血壓計方案、紅外耳溫槍方案、電子體溫計方案、LED電源驅動、觸控開(kāi)關、充電器、移動電源、報警器、單車表、計步器、熱電偶、電池電量儀等産品的相關成(chéng)熟方案。

公司有著(zhe)各種(zhǒng)電子方案的深厚開(kāi)發(fā)經(jīng)驗,歡迎廣大客戶定制開(kāi)發(fā)方案。公司以市場需求爲導向(xiàng),客戶需求爲己任,盡可能(néng)的爲客戶提供最新的市場資訊,最佳的産品與做優質的服務,以争取和客戶取得雙赢,實現永續經(jīng)營爲追求之目标。


圖片