オーディオはZoom Roomの最も重要な要素です。
オーディオなしでは、ミーティングは成立しません。この記事では、Zoom Roomの設計において、オーディオ面で特に重要なコンセプトと機能について説明します。
オーディオ処理技術についての詳しい説明の前に、音響とオーディオのコンセプトの記事をぜひお読みください。まずルームの音響を整えてから、そのオーディオ体験を忠実にキャプチャできる方法を見つけていきます。
言葉が発せられると、その言葉は多くの段階を経て、離れた場所にいる参加者に届きます。この伝達経路には次の要素が含まれています。
オーディオは、空気を通って伝わり、耳に届いたときに知覚される振動です。ビデオカンファレンスでは、この過程にいくつかのステップが加わります。オーディオを拾うマイクが、私たちの耳に相当します。Zoom Roomがそのオーディオを受け取り、必要に応じて処理してからインターネットで送信します。送られたオーディオはスピーカーによって音の波に戻され、聞き手に届きます。この伝達経路にあるすべてのステップが、聞き手の耳でそのオーディオが知覚される状態を左右します。
デジタル信号プロセッサ(DSP)は、ソフトウェアベースのオーディオプロセッサです。目的に合わせてオーディオを最適化するためのハードウェアを備えている場合もあります。Zoom Roomのオーディオ処理には2つの方法があります。Zoom Roomでは、以下の2つのアプローチでオーディオを処理します。
入出力デバイスが同じである場合(Logitech Rally System、Logitech Meetup、Aver VB342、Polycom Trio、ラックマウント方式のDSPなど)、オーディオ体験の最適化に必要なオーディオロジックはそのデバイスによってすべて処理されます。この場合、ZoomはDSPを処理しないため、Zoom Roomのノイズ抑制を無効にする必要があります。
選択されるとZoom SAPを自動的に無効にするように設計されているデバイスもあります。初期設定後に調整が行われた場合、Zoom SAPが自動的に有効になる場合もありますが、これは望ましくありません。
外部DSPの設計については、以下を参照してください。
<span style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>Zoom Roomsのエコー除去の概要は次のとおりです。
スピーカー出力に統合されていないミキサーやその他のマイクソースを使用するときでも、外部デバイスを必要とせずに処理を行えます。最適化処理はZoomがすべて行い、適応処理によってルームの状態を把握してオーディオを最も良い状態にします。Zoomは、特定のアプリケーションで複数の独立したオーディオチャネルを聞き取り、各オーディオチャネルに処理を適用して、最適化されたエクスペリエンスを実現できます。Zoomのエコー除去を有効にするには、Zoom Roomsコントローラで、[設定]、[マイク] を順にタップして、[エコー除去] トグルをタップします。
入力デバイスと出力デバイスが異なっている場合は、この設定は自動的に選択されます。つまり、マイクがデバイスのスピーカーを識別できなかった場合、この機能を有効にして、エコー除去とオーディオを最適化します。
ルームのノイズと残響の抑制には、別のZoomオーディオ設定も用意されています。残響が非常に大きくてノイズも多い部屋では、この機能を使っても残響が残る場合もありますが、問題を軽減するために実行される処理によって、許容できるレベルまで抑制できる場合もあります。
<span style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>ZRコントローラで、 [<strong style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>設定] をタップし、次に<span style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'> [<strong style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>マイク]、<span style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>[<strong style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>ノイズ抑制] <span style='font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Helvetica, Arial, sans-serif;'>とタップします。
次に [自動]、[高]、または [オフ] を選択します。
注: たとえば、内蔵のスピーカーなどの別のスピーカーを選択してから、マイクに一致するスピーカーに戻ると、この設定が必要でないときに有効になる可能性があります。
Zoom DSPの設計については、以下を参照してください。
次に、Zoom Rooms環境のテストに使用できるユーティリティーをご紹介します。少なくとも数人のメンバーとテストを行って部屋の音や各マイクをチェックし、パフォーマンスを確認することをおすすめします。
入力と出力が機能していることを確認できたので、次に、ソフトウェアオーディオ処理が正しく設定されていることを確認します。
Zoom Roomsオーディオの日常点検もお読みください。
テストが成功したら、他のメンバーとテストコールを行って、ルームのパフォーマンスを確認します。テストコールのフィードバックを参考にして、必要であれば、ファームウェアのチェック、DSPサイトファイルの調整、マイクの配置の調整、マイクの追加などを行います。
Zoom Roomの信号処理には、次の4つの主要な項目があります。
冷暖房装置や電源ハム音などの定常ノイズを抑制します。DSPが定常ノイズを特定し、信号で繰り返す減衰周波数によってノイズを抑制します。定常ノイズが減衰すると、発言が邪魔されることなくシステムに伝達されるため、より理解しやすくなります。
注: ノイズ低減は、交通騒音、紙やタイピングの音、そして最も重要な残響の抑制は行いません。残響の多いルームでは、ルーム内の参加者の耳だけでなく、マイクも残響を拾います。
AECとは、通信相手のスピーカーを介して通信相手のマイクで聞こえている自分の声を除去する機能です。下の図には、2つのエンドポイントでの概念が示されています。
AECが適切に機能している場合、通話中に自分の声のエコーは聞こえません。機能していない場合は、相手側エンドポイントのマイクが拾って送り返してくる、自分の声のエコーが聞こえます。
注: 問題が発生しているのは、エコーが聞こえない側のエンドポイントです。
自動ゲインコントロール(AGC)は、状況に応じてシステムに最適なボリュームを提供するために利用されます。対象となるのは、人の声の大きさのばらつきです。声の大きい人もいれば、声の小さい人もいます。どちらかのタイプの人がメインの音源である場合、音量は上下どちらかに調節されます。これはZoomのDSPでは自動的に行われます。外部DSPの機能とする場合は、有効にして構成する必要があります。
イコライゼーション(EQ)は、不要な周波数を排除して、必要な周波数をブーストします。人間の声は約250Hzから約6,000Hzの範囲にあり、人間の聴覚範囲である約20Hzから20,000Hzの間にあります。つまり、20〜250Hzと6000〜20,000Hzの音は、排除されない限り私たちの耳で認識されますが、その音は、私たちが聞きたい人間の声ではないということです。
したがって、人間の耳が最も敏感である、2,000~4,000Hzの範囲をブーストして、伝わりやすさを高めることをおすすめします。対象とする周波数範囲を注意深く選ぶことによって、伝わりやすさがさらに向上します。
ルームの改善に利用できる別の手法には「スクープ」があります。スクープは、空間で発生する周波数や、特定のピッチの不要な残響に対して行われます。このような周波数をスクープすることによって、空間でのパフォーマンスが向上します。低 / 中周波をスクープすると、ルームの残響を抑制できる可能性があります。