VoIPアプリケーションソフトウェアの適応機能が主観品質に及ぼす影響


文献まとめ

ネットワーク遅延の研究

まえがき

  • VoIP(Voice over IP)
  • 通信媒体のインターネットは通信のQoSは保証しない
    • 遅延
      • 背景付加トラヒックの影響
    • パケット廃棄
      • 輻輳の増大から、ノードのバッファがオーバーフロー
  • 音声品質がVoIP普及の技術課題
    • VoIPアプリケーションによる通信品質変動対策
      • 揺らぎ吸収バッファ
      • FEC*1
  • 本論文は、VoIPアプリケーション機能の有効性の定量化および評価を行った
    • 仮想的なネットワーク模擬装置を作成
      • 従来の単純な遅延や廃棄の環境実施では現実的でない
      • ネットワークシミュレーションに基づいて模擬した
    • 様々なNW条件(背景負荷とノードバッファ容量をパラメータとした条件)で評価
      • FECは全てのNW条件で有効だった
      • PR*2(パケット再現)は、限られたNW条件で有効
      • FECとPRを併用すると、主観品質を低下させるおそれ

VoIPアプリケーションの適応機能

  • RAT*3の条件
    • インターネット電話として利用されているVoIPアプリケーション
    • 結局は、FECとPRのあるなしの組み合わせ

RATにおける音声データの流れ

  • 送信側処理
    • Uniteze
      • 入力音声を固定長の音声ユニットに分割
    • 符号化器Encoder(PCM)
      • 音声ユニットを符号化ユニットに変換
    • Packetize
      • 音声パケットを作成し、ネットワークへ送信
      • 符号化ユニットを組み合わせて、RTPヘッダを付けて音声パケットを作成
  • 受信側処理
    • Devide
      • 届いた音声パケットを符号化ユニットに分解
    • Playout buffer
      • 各ユニットを再生予定時刻を決定しながら格納する
      • RTPヘッダに記録された送信時刻より再生時刻は決定される
    • Decoder
      • 再生時刻となった符号化ユニットを複合する
      • 音声ユニットが混合され、出力装置から音声が再生される

揺らぎ吸収バッファ

  • ネットワーク遅延時間により、パケットの到着間隔が揺らぐ
    • 中継ノードバッファの混雑状況
    • パケットの通過経路
  • Playout buffer
    • 到着間隔の揺らぎを吸収するバッファ
    • 受信側での複合処理を保留し、時間関係を再構成
      • 保留時間よりも送れて到着したユニット(延着ユニット)は紛失したとする

FEC

  • 送信側のパケット紛失対策
  • Media Specific FEC
    • RATが採用している
  • しくみ
    • 音声ユニットをエンコードする際に2種類の符号化器を使う
      • Encoder(PCM):高品質な符号化ユニットPu
      • Encoder(DVI):少し冗長な符号化ユニットDu
    • パケットは4つずつの組み合わせで送られる
      • DVIでのパケットが連続2つ
      • PCMでのパケットがそれに続く連続2つ
    • 次のパケットはそれから半分ずれた番号で送られる
      • DVIでの前のパケットでPCMで送られてた連続2つの番号
      • PCMでのそれに続く連続2つの番号
      • 1つ目のパケット:Du1,Du2,Pu3,Pu4
      • 2つ目のパケット:Du3,Du4,Pu5,Pu5
    • 受信側で状況に合わせて受信するパケットを選択
      • DuもPuも届いたら高品質なPuを優先
      • Puが紛失した場合は、同じ番号のDuから復元する

PR

  • 受信側で、ネットワークに負荷をかけない為のパケット復元方法
    • SS*4
      • 紛失音声ユニットを無音で代用することで再生間隔を維持する
    • PR*5
      • 紛失した音声ユニットは、直後の音声ユニットをコピーする
      • 最大連続4つ分までコピー
      • コピーで付加されたユニットを隠蔽ユニット*6と呼ぶ
  • PRの音声明瞭度がSSより約15ポイント優れていた
    • 他の文献で廃棄率20%の実験下において

評価用ネットワークの模擬方法

  • 仮想的に、評価用ネットワークにおける音声通信を再現した
  • 直接音声をネットワークへ流すのではなく、擬似音声パケットで再現
    • 音声の成分を調べてパケットの再現のためのデータを取る
    • そのデータを元にパケットを再現し、ネットワークで流す

音声主観品質評価方法

  • 片方向試験で、RATの適応機能が音声品質に及ぼす影響を測定する
  • 電話系の総合品質評価に用いられる主観品質評価法
  • 音声の名称
    • 送受信
      • 試験音声:送信する音声
      • 受信音声:受信した音声
    • 評価
      • 標準音声:標準形にする受信音声
      • 評価音声:評価系における受信音声
  • 評価尺度
    • 絶対品質尺度ACR
      • 標準音声を普段の電話の品質と比較し、その平均(MOS)を取る(A-MOS)
    • 妨害品質尺度DCR
      • 評価音声が標準音声に対しどの程度劣化しているかの平均をとった(D-MOS)
      • DCRという比較により、人によっての滑舌や聴力による評価の不確かさが解消される

実験結果

  • NW条件とRAT条件の組み合わせで音声主観品質評価実験を行う
  • 3つの観点で評価

ネットワーク通信品質の評価

  • 擬似音声パケットの遅延と紛失率にて評価する
  • 受信後処理のPRは関係ないので、RAT条件のFECに注目

アプリケーション適応機能の評価

  • RATが処理した音声ユニット数で適応機能による効果を計測
  • 受信ユニット
    • やはりPRの影響は無いのでFECのあるなしで評価
    • 受信ユニット数は遅延よりパケット紛失による影響が大きい
  • 再生ユニット
    • 受信ユニット数と適応機能の効果で決まる
    • FECよりPRの抑制効果が高かった
      • FECは冗長なユニットだけで修復する
      • PRは1つのユニットから最大4個の隠蔽ユニットを作成する
      • FECとPRを2つとも適用すればより理想的な数字になった
  • 延着ユニット
    • 受信ユニット数から再生ユニット数の差
      • 再生時刻に間に合わず廃棄した延着ユニットの数

音声主観品質の評価

  • PRによる音声品質への影響
    • PRは音声品質の劣化抑制に、常に有効であるといえない
  • FECによる音声品質への影響
    • FECは音声品質の劣化抑制に有効で、PRより効果的
  • PRとFECの併用による音声品質の影響
    • PR単体、FEC単体よりも劣化してしまった

むすび

  • 従来の模擬ネットワークは、処理能力限界付近の不安定な状況を作るのは難しかった
    • 独自の模擬装置を用いて、適応機能の有効性を定量化した
  • NW条件
    • 背景負荷を上げると、ネットワーク処理能力の限界付近かつ通信品質が不安定
  • RAT条件
    • PR
      • 利点:再生ユニット数で評価すると有効に機能
      • 欠点:効果的に利用できるNW条件は限られる
    • FEC
      • 利点:全てのNW条件で劣化を抑制し、PRより効果的
      • 欠点:ネットワーク処理能力の限界付近で遅延の平均や標準偏差が増大
    • PRとFECの併用
      • 通信品質が不安定なNW条件において、単独利用よりも劣化する
  • 通信品質によって、機能の効果が異なる事が分かった
  • 今後の課題
    • VoIPアプリケーションがネットワーク状態によって自立的に機能の組み合わせを制御
      • RTPの制御パケットであるRTCPを使ってネットワーク状態を監視

*1 Forward Error Correction
*2 Packet Repetition
*3 Robust Audio Tool
*4 Silence Substitution
*5 Packet Repetition
*6 Concealed unit