マルチチャンネルオーディオのデジタル転送

マルチチャンネルオーディオのデジタル転送

はじめに

最近、mLANという物がある事を知りました(公式サイト)。この「mLAN」とは、ヤマハが提唱している、IEEE1394(別称: Fire Wire、iLink)インターフェースを使ったデジタルオーディオ/MIDIデータの伝送技術の事で、IEEE1394の転送速度を使った多チャンネルのオーディオデータの転送、1本のケーブルで送受信可能、対応機器をデイジーチェーンで接続可能、などといった特徴があります(公式ページのデータより)。
これを見て、ちょっと思う事があったのでPCゲーマー的な視点から色々書き綴っておきます。間違った情報が含まれている可能性が高いので、ここに書かれている情報はあまりアテにしない方がいいかもしれません(笑)。なお、挿入されている図は簡単なイメージです。

S/PDIF

現在一般に普及しているデジタルオーディオ伝送インターフェースといえば、S/PDIFが思いつきます。CDやMD、DVD用の機器に付いてる光端子を使った転送、と言えばお分かりになるかと思います(同軸接続もありますが)。S/PDIFは、1本のケーブルで通常ステレオ(2チャンネル)のデジタルオーディオデータを転送する事ができます。また、転送方向は一方向のみ(入力、出力が分かれる)となります。
現在、一般的にデジタルオーディオ用のインターフェースといえばこのS/PDIFが主流なわけですが、これには一つ困った問題があります。2チャンネルより多くの音声チャンネルを持つオーディオデータを転送しようとした場合、そのままではS/PDIFで転送できないために(理由はよく知りません。転送するための規格が無いから?)、Dolby Digital等のマルチチャンネルのオーディオ形式に圧縮変換する仕組み(エンコーダ/変換はエンコード)が必要になる、ということです。
逆に、エンコードされたオーディオデータを音声として鳴らすにはそれを解釈する仕組み(デコーダ/解釈はデコード)が必要となります。もし転送先(主にアンプになると思いますので、このページではアンプを前提とします)がそのデコーダを持っていなければ、音声を鳴らす事ができないということになります。DVDの音声の標準規格がDolby Digitalであるため、マルチチャンネル対応のアンプは普通Dolby Ditigalのデコーダを持っています。最近はそれ以外のDTS、AAC等のデコーダを持つ製品も多いようですが。
つまりマルチチャンネルの音声を、S/PDIF接続したアンプからマルチチャンネルで鳴らしたいのであれば、そのアンプが持つデコーダに対応したオーディオ形式にエンコードする必要があるということになります。

リアルタイムエンコード

DVDの場合、Dolby Digital等の既にエンコードされたオーディオデータが収録されているため、そのオーディオデータを直接、デコーダを持つアンプにS/PDIFで転送すればスピーカーから出力する事ができます(図1参照)。DVDは、再生時のある時間における音声は必ず決まった音が鳴りますし、決まったスピーカーから音が出るので、こうやって最初からエンコードされたものを用意しておくことができます。

図1
図1

では、ゲームのようにリアルタイムで変化する音声をデジタル出力したい場合はどうなるのでしょうか?リアルタイムの変化とは、例えばFPS(First Person Shooting: Quake、Halo等の一人称視点のゲーム)の場合、右前から音声が鳴っている状態で(ゲーム内で)後ろを振り向くと、今度は左後ろから音声が鳴るといったことや、(ゲーム内の)音源との距離によって音量が変化する、などといったことです。
先程の説明から、S/PDIF接続した一般的なアンプでマルチチャンネルの音声を鳴らすためには、アンプが持つデコーダに対応したオーディオ形式にエンコードする必要があるとお分かりいただけたのではないかと思います。つまり、S/PDIF接続を用いてゲームの音声をマルチチャンネルで鳴らそうと思うのであれば、変化する音声をリアルタイムにそれら(と言っても、実際の所現在はDolby Digitalしか無いのですが)のオーディオ形式にエンコードする必要があるわけです(図2参照)。ちなみにBGMやムービー等で、あらかじめエンコードされたオーディオデータが用意されている物もあるようですが、当然それはここには含みません。
余談ですが、マルチチャンネルオーディオ形式は基本的に不可逆圧縮が施されているため、エンコードした際に音質が劣化する、という弊害があります。

図2
図2

では、そのオーディオデータをリアルタイムエンコードする仕組みはどの程度普及しているのでしょうか?
実はさっぱり普及していません。ゲーム以外の用途が存在するのかどうか知りませんのでゲームのみに限定しますが、ここでは現在使用されているゲーム機とPCゲームの二つを挙げて話をさせていただきます。

ゲーム機におけるマルチチャンネル出力

まずゲーム機の方から話しましょう。
リアルタイムエンコードの仕組みを持っているゲーム機は、現在の所X-BOXだけです。X-BOXは音声をリアルタイムにDolby Digitalへエンコードする仕組み(Dolby Interactive Content Encoder)を持っていますので、一般のアンプとS/PDIF接続することでマルチチャンネル出力が可能です。対応ゲームであれば、マルチチャンネル環境を整えることでプレイ時に他のゲームには無いサラウンド感が得られるはずです(もっとも、自分は聞いた事無いので知りませんが(笑))。
Play Station 2は、この仕組みを持っていません。光端子を持っていますがこれはDVD等の既にエンコードされているオーディオデータを出力するためのものです。よって、ゲームの音声をマルチチャンネルで出力するということはできません。BGMやムービー等でマルチチャンネルオーディオが使用されている場合は恩恵が得られることもあると思いますが(もっとも実際にそんなゲームがあるのかどうかは知りませんが)。
GameCubeは…よく知りませんが、確かDVD再生機能を持っていなかったと思いますので、デジタル出力自体存在しない、ということでいいのでしょうか?パナソニック製の方には光端子が存在するようですが、リアルタイムエンコードといった話は聞かないので、これもPS2と同等の物でしょう。というか、本家にデジタル出力が存在しないようなので、これを使ったゲームの存在の可能性がPS2以上に低いでしょうね(笑)。

PCゲームにおけるマルチチャンネル出力

次にPCゲームの話をします。そしてこれがこの話の本命です。
マルチチャンネルに対応したPCゲームでは、多くの場合音声を4チャンネル(左前、右前、左後、右後)で出力します。これは現在PCゲームの音声に使われるAPI規格(プログラムの仕組み、具体的にはEAX、DirectSound)がそうなっているから…だと思っていたのですが、最近はさらに多くの出力を持つサウンドカードがあるので、もしかしたら元々の音声を4チャンネルにミックスダウンしていただけなのかもしれません。ただ、対応した機器の多くが4チャンネルまでをサポートしているということで、乱暴なようですがここでは4チャンネルを前提とさせていただきます。
現在、3Dゲームの多くがこのAPIを用いたマルチチャンネル出力に対応しています。それだけ聞くと、ゲーム機以上にリアルタイムエンコードが広まっているように思えるかもしれませんが、実際の所は全くと言っていいほど普及していません。そしてそれが、初心者PCゲーマーをほぼ確実に混乱に陥れる要素となってしまっています。
マルチチャンネルでPCゲームを楽しもうと思う場合、普通はサウンドカードが必要となります。現在販売されているいくつかのサウンドカードは、前述のマルチチャンネルに対応しています。しかし、それはリアルタイムエンコードを実装しているということを意味しているわけではありません。一般的なサウンドカードはS/PDIF端子を持っているため、ここからゲームの音声もマルチチャンネルで出力できると勘違いされる方が多いようですが、できません(これが混乱に陥る要因となっています)。どういうことかと言うと、デジタル出力ではなくアナログ出力のみが行える、ということです。つまり、普通のサウンドカードでPCゲームの音声をマルチチャンネル出力するには、デジタル音声をアナログ音声に変換してアナログ端子から出力する意外に方法は無い、ということになります。
PCゲームのマルチチャンネルに対応したサウンドカードには通常、前2チャンネル用と、後2チャンネル用の二つのアナログ出力端子があります。この端子にそれぞれステレオスピーカーを繋げると計4チャンネルとなり、ゲームをマルチチャンネルで遊ぶ事ができるようになる、という寸法です(ちなみに、昔この環境で遊んでいたことがありますが、各スピーカーの音量を整える必要がある、それぞれのスピーカーの電源の取り回しが面倒、前後で同じスピーカーを揃えないと音質が異なってしまう、といった問題点がありますので、あまりお勧めはしません)。この4チャンネルのアナログ入力に対応したアンプもありますが、特殊な入力であるためCreative社の製品かYAMAHA社TSS-1ぐらいしかありません(図3参照)。何故特殊なのかと言えば、音声から低音を抜き出してサブウーハーに割り当てることができるからです。逆に、一般的な5.1チャンネルのアナログ入力を持つアンプに接続した場合、サブウーハーから音声を出力することができないために音質が期待できなくなってしまいます。ただし、5.1チャンネル以上のアナログ出力を持つサウンドカードの場合は、サブウーハーチャンネルの出力に低音を割り振ってくれる…と思います、多分。その場合はサブウーハーチャンネルをアナログ接続することで、サブウーハーからの出力が可能となります。

図3
図3

しかし、実際にリアルタイムエンコードが実装されている物もあります。それは、nVIDIA社製のチップセット、nForce が乗ったマザーボードに搭載されている SoundStorm というサウンド機能です。これは、X-BOXと同様「Dolby Interactive Content Encoder」の技術が使用され、音声をリアルタイムにDolby Digitalに変換してS/PDIF出力することが可能となっています。よって、一般のアンプとS/PDIF接続することでもマルチチャンネル再生が可能です。しかし、これはマザーボードに搭載されているサウンド機能で、この技術を用いたサウンドカードは未だ発売されていません。しかし、2003年10月にnVIDIA社はこの技術を使ったサウンドチップの開発を発表したため(ソース)、近いうちにこの機能を備えたサウンドカードが出てくるでしょう、多分。
ちなみに、Dolby Digital へのリアルタイムエンコードを行う場合、音声から低音を抜き出してサブウーハーチャンネルに割り当て、(Dolby Digital は1~5.1チャンネルまで可能らしいので)4.1チャンネルでエンコードするか、もしくはセンターチャンネルに補完した音声を割り振って5.1チャンネルでエンコードするのではないかと思うのですが、実際使ったことが無いのでよく分かりません…。

PCにおけるその他のデジタル接続

ではnVidia社の製品を使用する以外に、リアルタイムに変化する音声をデジタル出力する方法は無いのでしょうか?普通のサウンドカードに備わっているS/PDIF出力端子は前述したようにDVDに収録されているような既にエンコードされたオーディオデータを出力するための物です。可能性として、リアルタイムで変化する音声を「ソフトウェアで」リアルタイムに(サウンドカードのS/PDIFから出力でき(パススルーに対応して)、かつ転送先がデコーダを持つ)マルチチャンネルオーディオ形式に変換して、S/PDIF端子から出力するといった形が考えられます。しかし、少なくとも自分はそんなソフトを知らないですし、もしそれを使ったとしても、常に一定のCPUパワーを消費し続けるわけで、3Dゲームの様なたくさんの処理を必要とするゲームで使用するにはあまり現実的とは言い難いのではないかと思います(もっとも、どれだけパワーを消費するのかは分かりませんが)。技術的には多分可能でしょうけど。
実はS/PDIFを用いる以外に一般的な機器でゲームの音声をデジタル出力する方法が、自分の知る限り一応2つあります。「一応」としたのは、特定の機器を用いることになる、すなわち既存のアンプ等を活用できないということです。それでは本末転倒という気もしますが、一応参考までに紹介させていただきます。

一つ目は、USB接続を用いる方法。Creative社YAMAHA社等が作っているUSB接続のマルチチャンネル対応のオーディオ機器では、PCゲームの音声をマルチチャンネルで鳴らすことができます。S/PDIFを介さずに各チャンネルのオーディオデータを直接USBで送り込むので、マルチチャンネルオーディオ形式へエンコードする必要が無くなるためです。同様の理由から、DVD等のエンコードされた音声の場合、オーディオデータを直接その機器に送り込むと機器側にデコーダが必要となりますが、一度PC側でデコードしてから機器に送り込めば、(チャンネル数やインターフェースの帯域の上限を超えない限り)どんなオーディオ形式でも鳴らす事が出来る、すなわち機器に依存せずに再生が行えるというメリットもあります(イメージ的に近いのは図5)。ただし、PC側にデコーダ(DVD再生ソフト等)がインストールされている必要がありますし、どんな機器でも必ずそのような出力が行えるのかどうかは知りません。Creative社のSound Blaster Extigyでは機器側でデコードすることを推奨しているようです。話が逸れましたが、このUSB接続のタイプは、恐らくPCゲームにはかなり有用な選択肢なのではないでしょうか。
ただし、USBはコンピュータによって制御されるインターフェースであるため、オーディオデータは直接USB端子から出力されます。サウンドカードを介して音声を加工して出力する、といったサウンドカードとの併用はできません。要するにUSBオーディオ機器は、外付けサウンドカードと言ってもいいでしょう。よって、ゲームにおける音声のエフェクトはソフト側で処理するか、もしくは機器側にエフェクト処理機能が必要となります。

二つ目は、デジタルDIN接続を用いる方法。デジタルDINという言葉を聞き慣れている人はあまりいないのではないかと思います。何故ならば、これはCreative社の作り出した独自のデジタルオーディオ伝送技術だからです。そして、このデジタルDIN端子を持っている製品はCreative社以外にありません。つまり、Creative社のサウンドカードとスピーカーを揃えないと使えない物であり、汎用性はありません。このような理由から、あまり有用な選択肢とは言い難いです。しかしこのデジタルDINは、PCゲームの4チャンネルの音声をエンコードせずに直接転送できますし、S/PDIFと同様に使用することもできます。PCゲームを遊ぶ人の中には、PCゲームの音声がCreative社の製品を規準に作られている事が多い、ということからサウンドカードとスピーカーをCreative社製で揃える人もそれなりにいるのではないかと思います。そういった人には、なかなか有用な物となり得るでしょう。
余談ですが、これを使ってS/PDIF接続が可能です。サウンドカード側にミニプラグ→ピンプラグ変換アダプタを差し込んで同軸端子を持つアンプと接続をすると、同軸のS/PDIFとして接続できます。ただし、当然ゲーム音声のマルチチャンネル出力には使えません。

mLANへの期待

上記のように、PCゲームの音声をマルチチャンネルで出力するには多少特殊な環境が必要になることはお分かりになるかと思います。何故このような状況が発生しているのかと言えば、その理由はS/PDIF規格にあると言えます。S/PDIF規格がエンコードされたマルチチャンネルオーディオデータ、あるいは2チャンネルのオーディオデータしか流せないために(くどいようですが、理由は知りません)、このような不便な状況が生まれてしまっていると考えられます。

そこで私は、冒頭に述べたmLANに期待しているわけです。
公式ページの資料を見る限りでは、複数チャンネルの音声を直接流す事ができるようです。すなわち、mLANの環境が整えられればゲームにおけるリアルタイムに変化する音声を、マルチチャンネルオーディオ形式にエンコードすることなくアンプに送ることができるようになり、上記で述べてきたようなゲームにおける音声のマルチチャンネル出力の問題が一気に解消できると考えられます(図4参照)。

図4
図4

そうなった場合、何もゲームのみにメリットがあるわけではありません。1つ例を示します。地上デジタル放送をマルチチャンネル音声で楽しみたいと考えるとします。その音声を、現在使用しているアンプにS/PDIF接続して鳴らしたいとします。オーディオ、DVD再生機器等からデジタル出力された音声を1つのアンプで一括で扱いたいと考える人も多いでしょう。ところが、地上デジタル放送はAACという形式のオーディオ形式が使われているため、アンプがAACデコーダを搭載している必要があります。もしアンプがAACデコーダを搭載していないのならばアンプを交換するか、もしくは普通はチューナーがデコーダを搭載していると思われますので、アンプとアナログで接続するか、ということになると思います(アンプにアナログ入力が無ければその時点でアウトですが)。まぁ普通はこのアナログ接続でも構わないと思いますが、ケーブルが増えて邪魔になったり、音声の劣化が起こるといったことも考えられます。それに何より、このページの主旨に反しています(笑)。
ところが、mLANで接続した場合、USB接続の所で述べた事と同様に、チューナー側でデコードしたマルチチャンネルのデジタル音声を、アナログに変換することなくデジタルのままアンプに転送できるようになります(図5参照)。このメリットは何かと言えば、ケーブル一本でアンプと接続できるので扱いが楽、アンプ側に搭載されているデコーダを気にする必要が無い、といった事が挙げられます。特に後者は重要で、極端な話アンプ側は一切のデコーダを必要とせず、再生機器側だけがデコーダを搭載していればいい、ということになります。これはコストダウンにも繋がりますし、一般人の余計な混乱を一切招きません。

図5
図5

またそれ以外のメリットとして、IEEE1394はUSBと異なりコンピュータで制御しなくても使用できるインターフェースであるため、サウンドカードにIEEE1394端子が付くことで、ゲームの音声をサウンドカードを介してエフェクトを施して出力するといった事が可能になるとも考えられます。

(注意:ここの記述は技術的裏付けに基づく記述ではなく、理屈から考えた自分の予測ですので、もしかしたら間違っているかもしれません。)

最後に

では、mLANは現状でどの程度普及しているのでしょうか?ハッキリ言って、知りません(笑)。少なくとも、自分はこの目で見た事は無いです。調べてみると、一部の音楽制作用の機器には使用されているようですが、一般的なアンプ等の機器にはまだ使用されていないようです。
mLANが今後どのように展開していくのかは分かりませんし、もしかしたら今後一般に広く普及することは無いのかもしれません。しかし、S/PDIF接続による各種の弊害を見る限りでは、エンコードせずにマルチチャンネルのオーディオデータを転送するインターフェースが普及する事が望ましいと考えられます。それを実現できる規格が存在する以上、現在のPCゲームのマルチチャンネル環境に不満を抱く一個人としては、それが普及することを願ってやみません。


追記 [2004/1/8]
140Mbpsの高速無線LAN転送技術、発表
この記事の

CD音質のマルチチャンネル音楽転送やDVD画質のビデオ転送がワイヤレスで可能になるという

という記述を読んで、LANを通じてデジタルオーディオ転送が行われるようになったりすることもあるのかなぁ、と思ってみたり。遅延が大きくと思われるので、別の意味でゲームには使えないような気がしますが。

追記 [2004/2/14]
後から知ったのですが、mLANと同じIEEE1394を用いたデジタルオーディオ転送技術には、パイオニア社アドバンスド・レゾリューション・デジタル・オーディオ・インターフェイスデノン社DENON LINKといったものもあるそうです。多分探せば他にもあるのでしょう。何にしろ、IEEE1394のデジタルオーディオ転送規格を統一して汎用的に使えるようにしてもらいたいところ。


参考:

Web

書籍

  • DOS/V magazine 2003年 8/15号