Zoom Rooms オーディオ ガイダンス


概要

オーディオは Zoom ルームの最も重要な要素です。

オーディオなしでは、ミーティングは成立しません。 この記事では、Zoom ルームの設計において、オーディオ面で特に重要なコンセプトと機能について説明します。

オーディオ処理技術についての詳しい説明の前に、音響とオーディオのコンセプトの記事をぜひお読みください。 まずルームの音響を整えてから、そのオーディオ体験を忠実にキャプチャできる方法を見つけていきます。

言葉が発せられると、その言葉は多くの段階を経て、離れた場所にいる参加者に届きます。 この伝達経路には次の要素が含まれています。

  1. 音響の良いルーム(話し手)
    • 残響の抑制
    • 環境ノイズの低減
  2. マイクの品質と音源からの距離
  3. 入力処理品質
  4. ネットワーク接続 - エンコード
  5. ネットワーク接続 - デコード
  6. 出力処理品質
  7. スピーカーの品質
  8. 音響の良いルーム(聞き手)

この記事の内容:

オーディオとは?

オーディオは、空気を通って伝わり、耳に届いたときに知覚される振動です。 ビデオ会議では、この過程にいくつかのステップが加わります。 オーディオを拾うマイクが、私たちの耳に相当します。 Zoom Room がそのオーディオを受け取り、必要に応じて処理してからインターネットで送信します。 送られたオーディオはスピーカーによって音の波に戻され、聞き手に届きます。 この伝達経路にあるすべてのステップが、聞き手の耳でそのオーディオが知覚される状態を左右します。

オーディオ処理方法

デジタル信号プロセッサ(DSP)は、ソフトウェア ベースのオーディオ プロセッサです。目的に合わせてオーディオを最適化するためのハードウェアを備えている場合もあります。Zoom Rooms のオーディオ処理には、2 つの方法があります。 2 つのアプローチは以下のとおりです。

  1. Zoom のソフトウェア オーディオ処理を有効にします。外部マイクとスピーカーを独立させ、互いに認識させません。
  2. DSP を Zoom 外部に配置し、マイクとスピーカーの間のすべての処理と対応が Zoom 外部で実行されます。Zoom のソフトウェア オーディオ処理は無効にします。

外部 DSP

入出力デバイスが同じである場合(Logitech Rally System、Logitech Meetup、Aver VB342、Polycom Trio、ラックマウント方式の DSP など)、オーディオ体験の最適化に必要なオーディオ ロジックはそのデバイスによってすべて処理されます。 この場合、Zoom は DSP を処理しないため、ソフトウェア オーディオ処理設定は無効にする必要があります。

選択されると Zoom SAP を自動的に無効にするように設計されているデバイスもあります。 初期設定後に調整が行われた場合、Zoom SAP が 自動的に有効になる場合もありますが、これは望ましくありません。

外部 DSP の設計については、以下を参照してください。

Zoom Rooms ソフトウェアのオーディオ処理

以下は、Zoom Rooms ソフトウェア オーディオ処理の概要です。

スピーカー出力に統合されていないミキサーやその他のマイクソースを使用するときでも、外部デバイスを必要とせずに処理を行えます。 最適化処理は Zoom がすべて行い、適応処理によってルームの状態を把握してオーディオを最も良い状態にします。 Zoomは、アプリケーションにおける複数の独立したオーディオ チャンネルを検出し、各オーディオ チャンネルに処理を実行してオーディオ体験を最適化します。 Zoom ソフトウェア オーディオ処理を有効にするには、Zoom ルーム コントローラで、[設定]、[マイク] を順にタップして、[ソフトウェア オーディオ処理] トグルをタップします。

Screen_Shot_2019-03-15_at_10.46.21_AM.png

入力デバイスと出力デバイスが異なっている場合は、この設定は自動的に選択されます。つまり、マイクがデバイスのスピーカーを識別できなかった場合、この機能が有効化されて、エコー キャンセレーションとオーディオ最適化を行います。

ルームのノイズと残響の抑制には、別の Zoom SAP も用意されています。 残響が非常に大きくてノイズも多い部屋では、この機能を使っても残響が残る場合もありますが、問題を軽減するために実行される処理によって、許容できるレベルまで抑制できる場合もあります。

ZRコントローラの [設定] をタップし、[マイク][高度なノイズ抑制] を順にタップします。

Screen_Shot_2020-01-06_at_11.05.51_AM.png

[]、[]、または [無効] を選択します。

Screen_Shot_2020-01-06_at_11.06.01_AM.png

: たとえば、内蔵のスピーカーなどの別のスピーカーを選択してから、マイクに一致するスピーカーに戻ると、この設定が必要でないときに有効になる可能性があります。

Zoom DSP の設計については、以下を参照してください。

テスト

次に、Zoom Rooms 環境のテストに使用できるユーティリティーをご紹介します。 少なくとも数人のメンバーとテストを行って部屋の音や各マイクをチェックし、パフォーマンスを確認することをおすすめします。

スピーカーのテスト

  1. [設定] から [スピーカー] に移動します。
  2. [スピーカーのテスト]Screen_Shot_2019-03-15_at_12.41.15_PM.png をタップします。 出力が機能していることを確認するために、Zoom がスピーカーから音声を流します。

マイクのテスト

  1. [設定] から [マイク] に移動します。
  2. [マイクのテスト]をタップします。Screen_Shot_2019-03-19_at_3.24.07_PM.png
  3. 録音と再生を交互に行う処理が開始して、ルーム内のマイクから音声が流れます。

オーディオ エコー テスト

入力と出力が機能していることを確認できたので、次に、ソフトウェア オーディオ処理が正しく設定されていることを確認します。 [設定] から [ルーム]に移動します。

[オーディオ エコーテストを開始] をタップします。

Zoom Room コントローラとディスプレイに進行状況バーが表示されます。 [キャンセル] をタップすると、いつでもテストを終了できます。

テストが完了すると、Zoom Room コントローラとディスプレイにテスト結果が表示されます。

Zoom Rooms オーディオの日常点検もお読みください。

テストが成功したら、他のメンバーとテストコールを行って、ルームのパフォーマンスを確認します。 テストコールのフィードバックを参考にして、必要であれば、ファームウェアのチェック、DSP サイトファイルの調整、マイクの配置の調整、マイクの追加などを行います。

信号処理の種類

Zoom Room の信号処理には、次の 4 つの主要な項目があります。

  1. ノイズ リダクション
  2. 音響エコー キャンセレーション
  3. 自動ゲイン コントロール
  4. イコライゼーション

ノイズ リダクション

冷暖房装置や電源ハム音などの定常ノイズを抑制します。 DSP が、定常ノイズを特定し、信号で繰り返す減衰周波数によってノイズを抑制します。 定常ノイズが減衰すると、発言が邪魔されることなくシステムに伝達されるため、より理解しやすくなります。

: ノイズ リダクションは、交通騒音、紙やタイピングの音、そして最も重要な残響の抑制は行いません。 残響の多いルームでは、ルーム内の参加者の耳だけでなく、マイクも残響を拾います。

音響エコー キャンセレーション(AEC)

AECとは、通信相手のスピーカーを介して通信相手のマイクで聞こえている自分の声を除去する機能です。 下の図には、2 つのエンドポイントでの概念が示されています。

AEC.png

AEC が適切に機能している場合、通話中に自分の声のエコーは聞こえません。 機能していない場合は、相手側エンドポイントのマイクが拾って送り返してくる、自分の声のエコーが聞こえます。

: 問題が発生しているのは、エコーが聞こえない側のエンドポイントです。

自動ゲイン コントロール

自動ゲイン コントロール(AGC)は、状況に応じてシステムに最適なボリュームを提供するために利用されます。 対象となるのは、人の声の大きさのばらつきです。 声の大きい人もいれば、声の小さい人もいます。 どちらかのタイプの人がメインの音源である場合、音量は上下どちらかに調節されます。 これは Zoom の DSP では自動的に行われます。外部 DSP の機能とする場合は、有効にして構成する必要があります。

イコライゼーション

イコライゼーション(EQ)は、不要な周波数を排除して、必要な周波数をブーストします。 人間の声は約 250 Hzから約 6,000 Hzの範囲にあり、人間の聴覚範囲である約 20 Hz から 20,000 Hz の間にあります。 つまり、20〜250 Hz と 6000〜20,000 Hz の音は、排除されない限り私たちの耳で認識されますが、その音は、私たちが聞きたい人間の声ではないということです。

したがって、人間の耳が最も敏感である、2,000~4,000 Hz の範囲をブーストして、伝わりやすさを高めることをおすすめします。 対象とする周波数範囲を注意深く選ぶことによって、伝わりやすさがさらに向上します。

ルームの改善に利用できる別の手法には「スクープ」があります。スクープは、空間で発生する周波数や、特定のピッチの不要な残響に対して行われます。 このような周波数をスクープすることによって、空間でのパフォーマンスが向上します。 低 / 中周波をスクープすると、ルームの残響を抑制できる可能性があります。