国产成人av毛片奶水,秋霞午夜理论理论福利无码,韩国理论电影午夜三级在线观看

你的位置：首頁 > RF/微波 > 正文

MEMS麥克風(fēng)在語音激活設(shè)計(jì)中如何輔助聲音檢測和關(guān)鍵詞識別

發(fā)布時(shí)間：2020-06-11 責(zé)任編輯：lina

【導(dǎo)讀】隨著用戶越來越依賴語音作為用戶界面，設(shè)計(jì)人員面臨著多重挑戰(zhàn)，既要以盡可能小的功耗和響應(yīng)時(shí)間來實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語音界面 (VUI)，又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。

隨著用戶越來越依賴語音作為用戶界面，設(shè)計(jì)人員面臨著多重挑戰(zhàn)，既要以盡可能小的功耗和響應(yīng)時(shí)間來實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語音界面 (VUI)，又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。為了幫助設(shè)計(jì)人員達(dá)到這些目標(biāo)，多家供應(yīng)商推出了一種先進(jìn)的微機(jī)電系統(tǒng) (MEMS) 麥克風(fēng)，這種麥克風(fēng)具有多個(gè)性能特征，有助于實(shí)現(xiàn)強(qiáng)大的喚醒詞檢測和 VUI 語音指令處理。

MEMS 麥克風(fēng)（也稱為硅麥克風(fēng)）已普遍在智能手機(jī)、智能手表、無線耳塞、汽車、智能電視以及遙控器中使用。這在很大程度上歸功于大獲成功的個(gè)人語音助手（例如亞馬遜的 Alexa、谷歌語音助手和蘋果的 Siri）。這些助手會(huì)收聽特定的語音指令，使用喚醒詞識別算法從周圍環(huán)境中提取語音指令。設(shè)計(jì)人員的訣竅是：以經(jīng)濟(jì)高效地的方式快速實(shí)現(xiàn)這種提取功能，同時(shí)盡管存在環(huán)境噪聲，也要提高可靠性、準(zhǔn)確性和遠(yuǎn)場語音采集能力。

本文將討論影響 VUI 設(shè)計(jì)的 MEMS 麥克風(fēng)的關(guān)鍵特性，包括信噪比 (SNR)、動(dòng)態(tài)范圍、靈敏度和啟動(dòng)時(shí)間。然后介紹來自 TDK InvenSense、CUI Devices、STMicroelectronics 和 Vesper Technologies 的硬件和軟件解決方案，并展示如何將其應(yīng)用于語音激活設(shè)計(jì)中。

MEMS 麥克風(fēng)如何工作

一個(gè) MEMS 麥克風(fēng)封裝中通常包含兩個(gè)組件：將聲波轉(zhuǎn)換為電信號的 MEMS 膜，以及用作阻抗轉(zhuǎn)換器向音頻信號鏈提供可用模擬輸出的放大器。如果需要數(shù)字輸出，還可在其芯片上再集成一個(gè)組件——模數(shù)轉(zhuǎn)換器 (ADC)。

MEMS麥克風(fēng)在語音激活設(shè)計(jì)中如何輔助聲音檢測和關(guān)鍵詞識別

圖 1：MEMS 麥克風(fēng)的基本結(jié)構(gòu)顯示了其兩個(gè)關(guān)鍵構(gòu)建塊：MEMS 變動(dòng)器和信號處理鏈（位于 ASIC 中）。（圖片來源：CUI Devices）

除了支持具有模擬或數(shù)字輸出的微型麥克風(fēng)外，MEMS 技術(shù)還實(shí)現(xiàn)了出色的相位匹配和漂移性能。

MEMS 麥克風(fēng)的關(guān)鍵特性

對于語音控制設(shè)備設(shè)計(jì)人員而言，需要在 MEMS 麥克風(fēng)中查找的關(guān)鍵參數(shù)如下：

• 信噪比 (SNR)：這是參考信號電平與麥克風(fēng)輸出信號的噪聲電平之比。SNR 測量值包括麥克風(fēng)元件和 MEMS 麥克風(fēng)封裝中集成的任何其他設(shè)備（例如 IC）產(chǎn)生的噪聲。

靈敏度：響應(yīng) 1千赫 (kHz) 正弦波時(shí)的模擬或數(shù)字輸出值，其聲壓級 (SPL) 為 94 分貝 (dB) 或1 帕斯卡 (Pa)，后者為壓力測量值。

• 靈敏度公差：任何給定的單只麥克風(fēng)的靈敏度范圍。嚴(yán)格的靈敏度公差可在使用多個(gè)麥克風(fēng)時(shí)確保一致性。

• 動(dòng)態(tài)范圍：麥克風(fēng)線性響應(yīng)的最大和最小聲壓級的差異測量。

• 頻率響應(yīng)：麥克風(fēng)能夠工作的頻率范圍。

• 啟動(dòng)時(shí)間：響應(yīng)觸發(fā)事件時(shí)麥克風(fēng)被喚醒并輸出有效信號的速度。

諸如遙控器、電視和智能揚(yáng)聲器之類的語音控制設(shè)備通常工作在高環(huán)境噪聲下。同樣，在遠(yuǎn)場操作中，用戶可能在附近或距離 1 至 10 米 (m) 的地方。這些情況使麥克風(fēng)的動(dòng)態(tài)范圍、靈敏度和 SNR 變得如此重要。在陣列中使用多個(gè)麥克風(fēng)的應(yīng)用中，靈敏度公差至關(guān)重要。

雖然可以規(guī)定每個(gè)麥克風(fēng)具有一定的靈敏度水平，但細(xì)微的結(jié)構(gòu)變化可能會(huì)導(dǎo)致各種變更。但是，由于 MEMS 麥克風(fēng)是使用嚴(yán)格控制的半導(dǎo)體制造工藝開發(fā)，因此具有匹配嚴(yán)格的靈敏度公差，這是任何麥克風(fēng)陣列進(jìn)行有效數(shù)據(jù)處理所需的（圖 2）。

圖 2：陣列中使用的麥克風(fēng)必須嚴(yán)格匹配才能實(shí)現(xiàn)所需的信號處理性能。（圖片來源：CUI Devices）

為使支持 VUI 的設(shè)計(jì)能越來越多地采用麥克風(fēng)陣列，緊公差的輔助作用極其重要。在麥克風(fēng)陣列中，由兩個(gè)或多個(gè)麥克風(fēng)收集信號，然后在組合信號并形成合成信號之前，分別處理來自每個(gè)麥克風(fēng)的信號（放大、延遲或?yàn)V波）。在麥克風(fēng)陣列中，可以使用多個(gè)輸入來確定方向響應(yīng)（也稱為波束形成），以濾除不需要的噪聲；與此同時(shí)，重點(diǎn)關(guān)注在來自更期望的方向上的聲音。

MEMS 麥克風(fēng)的啟動(dòng)時(shí)間對于捕獲全部關(guān)鍵詞并確保其準(zhǔn)確性也至關(guān)重要。為了節(jié)電，支持 VUI 的設(shè)備保持低功耗狀態(tài)；但是，如果麥克風(fēng)響應(yīng)喚醒觸發(fā)的啟動(dòng)時(shí)間短，則會(huì)影響 VUI 喚醒時(shí)間，進(jìn)而影響喚醒詞檢測性能以及功耗。

只要在選擇麥克風(fēng)時(shí)考慮到這些特性，那么在具有高環(huán)境噪聲或者用戶遠(yuǎn)距離講話，或者這兩種情形都存在的情況下，后續(xù)的語音處理算法便能夠更好地執(zhí)行用戶語音提取功能。

模擬與數(shù)字 MEMS 麥克風(fēng)接口

正如有關(guān) MEMS 麥克風(fēng)工作原理的部分所述，MEMS 麥克風(fēng)輸出可以采用模擬或者數(shù)字形式。模擬 MEMS 麥克風(fēng)使用內(nèi)部放大器將麥克風(fēng)的輸出信號驅(qū)動(dòng)至具有低輸出阻抗的合理高電平。這提供了一個(gè)連接音頻處理器的直接接口。對于 VUI，設(shè)計(jì)人員需要確保相關(guān)處理器具有板載 ADC，或者設(shè)計(jì)人員能夠選擇 ADC 以滿足其特定要求。后者會(huì)增加復(fù)雜性和成本。

借助數(shù)字 MEMS 麥克風(fēng)，麥克風(fēng)輸出可直接應(yīng)用于通常的微控制器或數(shù)字信號處理器 (DSP) 的數(shù)字電路。用于電噪聲環(huán)境的 VUI 設(shè)計(jì)更傾向于數(shù)字麥克風(fēng)，因?yàn)榕c模擬輸出信號相比，數(shù)字輸出信號具有更高的抗噪能力。

此外，數(shù)字 MEMS 麥克風(fēng)通常采用脈沖密度調(diào)制 (PDM) 將模擬信號電壓轉(zhuǎn)換為包含相應(yīng)密度的邏輯高信號的單比特?cái)?shù)字流。這樣可以進(jìn)一步抵御射頻干擾 (RFI) 和電磁干擾 (EMI)。這對于大型麥克風(fēng)陣列和諸如支持語音的車輛信息娛樂系統(tǒng)之類的實(shí)際大型系統(tǒng)尤其重要。

關(guān)于靈敏度，就模擬麥克風(fēng)而言，是采用以分貝為單位的聲壓級相對于 1 伏 (dB/V) 進(jìn)行測量的。對于數(shù)字麥克風(fēng)，通常以相對于滿刻度分貝值為單位進(jìn)行測量 (dB FS) 。

VUI 的 MEMS 麥克風(fēng)解決方案

TDK InvenSense 的 ICS-40740 模擬 MEMS 麥克風(fēng)滿足了 VUI 應(yīng)用的許多關(guān)鍵麥克風(fēng)性能要求。該器件包含一個(gè) MEMS 麥克風(fēng)元件、一個(gè)阻抗轉(zhuǎn)換器和一個(gè)差分輸出放大器，采用小型 4.00 x 3.00 x 1.20 毫米 (mm) 的表面貼裝封裝。該器件采用 1.5 伏電源供電，工作時(shí)僅消耗 165 微安 (µA) 電流（圖 3）。

圖 3：ICS-40740 模擬 MEMS 麥克風(fēng)滿足智能揚(yáng)聲器和可穿戴設(shè)備（例如降噪耳機(jī)）的尺寸和功率預(yù)算要求。（圖片來源： TDK InvenSense）

該器件的 SNR 為 70 dBA（A 加權(quán)分貝），并與 108.5 dB 的寬動(dòng)態(tài)范圍相耦合，即使在高環(huán)境噪聲和遠(yuǎn)場條件下也能檢測到語音信號。此外，該器件具有 80 赫茲 (Hz) 到 20 kHz 的寬工作頻率響應(yīng)范圍，132.5 dB 的線性響應(yīng)性能和 ±1 dB 靈敏度公差。后者使其對于麥克風(fēng)陣列非常有用。

ICS-40740 的封裝小、功耗低，使其適用于圍繞智能揚(yáng)聲器和諸如降噪耳機(jī)等可穿戴設(shè)備構(gòu)建的物聯(lián)網(wǎng) (IoT) 應(yīng)用程序。

Vesper Technologies 的 VM3000 是一款全向、底部端口壓電式數(shù)字 MEMS 麥克風(fēng)，具有不到 200 微秒 (µs) 的超快速啟動(dòng)時(shí)間，使其被快速喚醒，足以捕獲完整的喚醒詞（圖4）。

圖4：VM3000 壓電式數(shù)字 MEMS 麥克風(fēng)具有不到 200 µs 的超快速啟動(dòng)時(shí)間，使其能夠足被快速喚醒，足以捕獲完整的喚醒詞。（圖片來源：Vesper Technologies）

在壓電式 MEMS 麥克風(fēng)中，當(dāng)聲波撞擊壓電懸臂時(shí)，將使懸臂移動(dòng)并產(chǎn)生電壓。該電壓由一個(gè)功耗非常低的比較器電路檢測，該電路會(huì)將喚醒信號發(fā)送到音頻系統(tǒng)。

由于壓電式 MEMS 麥克風(fēng)不需要偏置電壓，因此 VM3000 在被喚醒詞指令啟動(dòng)前幾乎無功耗。而且，這種麥克風(fēng)僅需 0.35 µA 電流即可保持休眠模式，并且能夠在不到 100 µs 的時(shí)間內(nèi)切換到性能模式。超低功耗休眠模式與快速模式切換相結(jié)合，還能確保在喚醒音頻設(shè)備時(shí)不會(huì)丟失任何信息。

VM3000 數(shù)字麥克風(fēng)幾乎可以與任何音頻芯片配對，其輸出特點(diǎn)是在一條數(shù)據(jù)線上復(fù)用兩個(gè)麥克風(fēng)。該麥克風(fēng)在 1 kHz 信號下的典型 SNR 為 63 dB，具有 122 dB SPL 聲學(xué)過載點(diǎn) (AOP)。

VM3000 采用 3.5 x 2.65 x 1.3 mm 封裝，并通過集成 ADC 節(jié)省物料清單 (BOM)。此外，VM3000 使用單層壓電晶體，使其不受靈敏度漂移的影響，并可防止灰塵、水、濕氣和其他環(huán)境顆粒的侵害。

諸如 VM3000 之類的壓電式 MEMS 麥克風(fēng)無需使用保護(hù)網(wǎng)或薄膜覆蓋多個(gè)麥克風(fēng)，從而簡化了陣列的音頻設(shè)計(jì)。如保護(hù)網(wǎng)或保護(hù)膜等為防止受環(huán)境污染而覆蓋聲學(xué)孔的保護(hù)元件，可導(dǎo)致 MEMS 麥克風(fēng)靈敏度下降。

VM3000 也相對容易實(shí)現(xiàn)，因?yàn)樗梢灾迸c CODEC 或其他處理器連接（圖 5）。主系統(tǒng)（CODEC 等）提供主時(shí)鐘 CLK，該時(shí)鐘定義了 DATA 線上的比特速率。

圖5：VM3000 可以直接與外部處理器連接，并且可將兩個(gè)麥克風(fēng)連接到一條 DATA 線上。（圖片來源：Vesper Technologies）

有趣的是，兩個(gè)麥克風(fēng)可以通過一條 DATA 線連接。這是因?yàn)閿?shù)據(jù)是在由 L/R Select 引腳定義的時(shí)鐘 (CLK) 上升沿或下降沿設(shè)置的，而 L/R Select = GND（頂部）在時(shí)鐘下降沿設(shè)置數(shù)據(jù)，L/R Select = VDD（底部）在時(shí)鐘上升沿設(shè)置數(shù)據(jù)。然后，CODEC 或處理器可以根據(jù)比特流與 CLK 邊沿的對齊方式將其分離。

入門：MEMS 麥克風(fēng)評估套件

為了評估關(guān)鍵參數(shù)并簡化使用 MEMS 麥克風(fēng)的音頻系統(tǒng)的設(shè)計(jì)，供應(yīng)商提供了參考板和軟件開發(fā)套件。例如，Vesper 提供了 S-VM3000-C 評估板，其中包括一個(gè) VM3000 數(shù)字 MEMS 麥克風(fēng)和一個(gè) 0.1 微法拉 (µF) 的電源旁路電容器以及一個(gè)邊緣連接器。

同樣，TDK InvenSense 為其 ICS-40740 模擬 MEMS 傳感器提供 EV_ICS-40740-FX 評估板，可讓設(shè)計(jì)人員快速、高效地分析差分模擬輸出麥克風(fēng)的性能。除 MEMS 麥克風(fēng)外，該開發(fā)套件唯一的其他組件便是 0.1 µF 電源旁路電容器。

CUI Devices 同時(shí)提供模擬和數(shù)字 MEMS 麥克風(fēng)，其 DEVKIT-MEMS-001 開發(fā)套件用于原型開發(fā)和測試（圖 6）。該評估板有四個(gè)獨(dú)立的麥克風(fēng)評估電路。

圖 6：DEVKIT-MEMS-001 有四個(gè)可拆卸麥克風(fēng)評估電路：其中兩個(gè)用于模擬輸出，另兩個(gè)用于數(shù)字輸出。（圖片來源：CUI Devices）

該評估板上有兩個(gè)模擬 MEMS 麥克風(fēng)：底部音孔 CMM-2718AB-38308-TR 和頂部音孔 CMM-2718AT-42308-TR；兩個(gè)數(shù)字 MEMS 麥克風(fēng)：底部音孔 CMM-4030DB-26354-TR 和頂部音孔 CMM-4030DT-26354-TR。頂部和底部音孔用于模擬和數(shù)字輸出麥克風(fēng)，以提高設(shè)計(jì)靈活性。

比較這兩個(gè)模擬設(shè)備，CMM-2718AB-38308-TR 的靈敏度為 -38 dB，SNR 為 65 dBA。CM-2718AT-43208-TR 的靈敏度為 -42 dB，SNR 為 60 dBA。兩者的頻率范圍均為 100 Hz 至 10 kHz，并從 2 V 電源軌汲取 80 µA 電流。

對于兩個(gè)數(shù)字麥克風(fēng)，CMM-4030DB-26354-TR 的靈敏度為 -26 dB FS，SNR 為 64 dBA。CMM-4030DT-26354-TR 的靈敏度為 -26 dB FS，SNR 為 65 dBA。兩者均使用 1 位 PDM 數(shù)據(jù)格式，在 100 Hz 至 10 kHz 頻率范圍內(nèi)工作，并從 2 V 電源汲取 0.54 毫安 (mA) 電流。

總結(jié)

通過仔細(xì)研究 MEMS 麥克風(fēng)（模擬和數(shù)字），可以發(fā)現(xiàn)其系統(tǒng)級性能優(yōu)勢，以及它們?nèi)绾螌κ冀K開啟的語音接口設(shè)計(jì)進(jìn)行補(bǔ)充。最新的 MEMS 麥克風(fēng)采用新穎的技術(shù)來延長電池壽命，改善遠(yuǎn)場音頻質(zhì)量并能抵御環(huán)境污染。提高關(guān)鍵詞的準(zhǔn)確性是另一個(gè)主要的設(shè)計(jì)考慮因素，它與 SNR、靈敏度容差和啟動(dòng)時(shí)間等參數(shù)密切相關(guān)。所有這些都已在最新設(shè)備中得到解決，能更好地適應(yīng) VUI 設(shè)計(jì)。

免責(zé)聲明：本文為轉(zhuǎn)載文章，轉(zhuǎn)載此文目的在于傳遞更多信息，版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題，請聯(lián)系小編進(jìn)行處理。

要采購麥克風(fēng)么，點(diǎn)這里了解一下價(jià)格!

上一篇：如何最大限度降低?uk穩(wěn)壓器的輻射？

下一篇：節(jié)點(diǎn)BusOff恢復(fù)過程分析與測試

特別推薦

技術(shù)文章更多>>

技術(shù)白皮書下載更多>>

熱門搜索

MEMS麥克風(fēng)在語音激活設(shè)計(jì)中如何輔助聲音檢測和關(guān)鍵詞識別

友情鏈接(QQ：317243736)