ご不明な点がございましたら、下記までご連絡ください。(86-755)-84811973

TWS ヘッドセットの通話ノイズ低減技術

TWS ヘッドセット デジタル信号 ADM
TWS (真のワイヤレス ステレオ) ヘッドセット市場の継続的な成長に伴い。製品体験に対するユーザーのニーズも、単純なクイックリンクからより高い水準にアップグレードされています。たとえば、今年の時点で、クリアな通話を特徴とする TWS ヘッドセットが多数市場に登場しています。
非常に騒がしい環境でもクリアな音声通信を可能にするために、内耳と外部マイクからの信号を組み合わせてインテリジェントな環境適応型サブバンド ミキサー テクノロジーを実装するスキームを生成することは可能でしょうか。実際、国内外のアルゴリズム企業の中にはこれに取り組んでおり、一定の成果を上げているところもあります。
もちろん、多くのソリューション企業は現在、エッジ AI (これもその 1 つ) などの通話ノイズ低減ソリューションに特に重点を置いていますが、実際には、既存の通話ノイズ低減ソリューションにより最適化されているため、この部分は削除されています。まずは基本的な部分から、通話ノイズリダクションで何ができるのかを紹介します。
全体として、通話ノイズの低減はアップリンク (アップリンク) とダウンリンク (ダウンリンク) の同期に依存します。大まかにマイクアレイ/AEC/NS/EQ/AGC/DRCの論理関係は以下の通りです。
ADM (Adaptive Directional Microphone Array) は、2 つの無指向性マイクのみを使用して指向性マイクまたはノイズ キャンセリング マイクを作成するデジタル信号処理テクノロジです。ADM は、適切な信号品質を維持しながら、さまざまな環境で最適なノイズ減衰を提供するために、方向特性を自動的に変更します。適応プロセスは高速で、強力な周波数選択性を備えており、複数の干渉を同時に除去できます。
ADM は、優れた指向特性に加えて、従来の音響指向性マイクロホンよりも風雑音の影響を受けやすくなっています。ADM テクノロジーにより、「エンドファイア」と「ブロードファイア」という 2 種類のマイク構成が可能になります。
エンドファイア構成では、信号源 (ユーザーの口) は軸 (2 つのマイクを結ぶ線) 上にあります。ブロードサイド構成では、水平軸上の直線をターゲットとします。
Endfire 構成では、ADM には 2 つの動作モードがあります。「遠い話」と「近い話」。ファーパス モードでは、ADM は最適な指向性マイクとして機能し、前面からの信号を維持しながら背面と側面からの信号を減衰します。接話モードでは、ADM が最良のノイズ キャンセリング マイクとして機能し、遠くの音を効果的に除去します。音響設計が比較的自由であるため、ADM は携帯電話に最適であり、遠端スピーカーと近端スピーカー間の「ソフト」スイッチングが可能です。ただし、このタイプのデザインがイヤホン、特に TWS イヤホンに使用される場合、ユーザーが正しく装着しているかどうかによって制限が大きくなります。airpods と同様に、著者は地下鉄で多くの人が「あらゆる種類の奇妙な」装着方法をしていることを観察しており、その一部はユーザーの耳です。形状や着用習慣によっては、アルゴリズムが必ずしも理想的な状況で機能するとは限りません。
音響エコーキャンセラー (AEC)
二重(同時双方向)通信において信号の一部が元の信号に戻ることを「エコー」といいます。長距離のアナログ通信システムやほぼすべてのデジタル通信システムでは、たとえ小さなエコー信号であっても、重大な往復遅延により干渉が発生する可能性があります。
音声通信端末では、スピーカーとマイク間の音響結合により音響エコーが発生します。非可逆ボコーダやトランスコーディングなどの非線形処理が通信チャネルに適用されるため、音響エコーはデバイス内でローカルに処理 (キャンセル) する必要があります。
ノイズサプレッサー(NS)
ノイズ抑制技術は、単一チャネル音声信号の定常ノイズと過渡ノイズを低減し、信号対雑音比を改善し、音声明瞭度を向上させ、聴覚疲労を軽減します。
もちろん、この部分には BF (ビームフォーミング) や PF (ポストフィルター) やその他の調整方法など、多くの具体的な方法があります。一般に、AEC、NS、BF、および PF は通話ノイズ リダクションの中核部分です。確かに、各アルゴリズム ソリューション プロバイダーには異なる利点と欠点があります。
一般的な音声通信システムでは、音声信号のレベルは、ユーザーとマイクの間の距離や通信チャネルの特性によって大きく変動する可能性があります。
ダイナミック レンジ圧縮 (DRC) は、信号レベルを均一化する最も簡単な方法です。圧縮では、弱い音声セグメントを十分に保持しながら、強い音声セグメントを削減 (圧縮) することにより、信号のダイナミック レンジが減少します。したがって、信号全体が特別に増幅され、弱い信号がよりよく聞こえるようになります。
AGC テクノロジーは、音声信号が弱い場合にはデジタル的に信号ゲイン (増幅) を増加させ、音声信号が強い場合には信号を圧縮します。騒がしい場所では、人々はより大きな声で話す傾向があります。これにより、マイク チャンネルのゲインが自動的に小さな値に設定され、対象となる音声を最適なレベルに保ちながら周囲の騒音を低減します。また、静かな環境では、人々は比較的静かに話すので、その声はアルゴリズムによってあまりノイズなく増幅されます。


投稿時間: 2022 年 6 月 7 日