追加資料

現在位置のナビ

トップコンピュータの国雑記帳趣味趣味音響第13回1bit研究会 →追加資料

説明

『第13回1ビット研究会』で研究発表したあと、その内容が地味に話題になっている場所があるようです。 地味でないところとして、WEB上の『AV Watch』でも2016年7月11日に取り上げていただきました。 研究発表では、40分の持ち時間にいろいろネタを詰め込んだので技術的な(特に実装についての)話をしていません。 『AV Watch』では、藤本さんが丁寧にわかりやすく解説してくださっています。 でも文字数の制限で、語りつくせていないこともいくつかあります。 ここでは私の研究に興味を持った方へ向けて、実装の話と今後の展開予定を説明します。

発表したシステムの音質

『AV Watch』には、試作品がHiFiだったと好意的に書かれています。 Webmasterの個人的な評価ですが、安い部品を使っても売値2〜3万円のミニコンポを凌駕する音質が出ていると思います。 特にD級アンプの特性で、安物アナログアンプと比較して低音がしっかり出ています。 しっかりとは、音量が減衰していないことと、はっきりくっきり表現している(ドラムスの音が『ボン、ボン』となまらない)ことの2点です。 Webmasterには、オーディオ分野でいろいろ教えていただいている師匠がいます。 師匠の最新オーディオシステムと比較試聴したところ、低域は同等クラスに聴こえましたが、高域の解像感ではっきり負けています。 おそらくPWM変調している箇所で出力データの精度が44.1kHzfs10bit相当に落ちていることが原因と考えます。 また本システムに限らないことですが、D級アンプはスピーカーの個性を明確にする傾向があるように感じています。 本システムを評価する途中で、Webmasterは限界を感じた一部のスピーカーに引退してもらいました。 そのほとんどが部品代1万円未満の自作スピーカーです。

理論的に詰め切れていない点

発表内容を聴かれた方、研究者向けスライドを見た方はご存知ですが、今回作成したシステムがなぜ良い音になったのか、理論的に説明しきれていません。 仮説は立てたものの、数値として表現できていないのです。 『8xオーバーサンプリングを高精度で行ったことが有利に働いた』というのは、まだ仮説段階です。 もしかしたら、352.8kHzにオーバーサンプリングしたあとで、デジタルデータのままPWM変換していることが有利に働いているのかもしれませんし、他に理由が隠れているのかもしれません。

この点は、今後も考察とシミュレーションを行う予定でいます。 そもそも、オーバーサンプリング精度を他方式と数値比較するためのシミュレーションプログラムは10回位書き直しました。 書きなおして実行するたびに、各方式のS/N比が10dB以上変動しています。 変動原因の一部はWebmasterのバグだと思いますが、データの処理方法を少し変えただけでS/Nの数値は大きく変わりました。 入力の44.1kHzfsデータをFIRに入れるときでも、同じデータが8回続く階段波形にするか、1回データが入って残り7回分を0にするかでもS/Nは大きく変わります。 掛け算の結果を特定のビット長に丸める時に、切り捨てにするのか四捨五入(2進数なので0捨1入ですが)なのかでも数dB違います。 あと、負の数の四捨五入の方向とか。 そもそも市販DACチップの内部処理が細かく公開されていないので、だいたいの傾向がつかめるだけで、決定的なシミュレーション比較は不可能かもしれません。

今回の発表では、自画自賛にならないように他方式が最大S/N比になる計算方式を用いています。 それが、方式間の差異を小さくしてしまった理由かもしれません。

理論と実装の違い

発表内容は、理論を中心に説明しました。 『CDDAをもっと高音質で再生可能と思われる』という話です。 発表会でデモンストレーションした第5試作は、実装上の制限で理論値の性能上限に達していません。 32bit浮動小数点数でFIR演算した結果を、352.8kHzfsの65段階PWMで再生しています。 65段階PWMは、およそ6bit精度と表現できます。 つまり、352.8kHzfsの6bit PCMに変換していると言っても間違いではありません。

素朴に考えると、LPFを固定してサンプリング周波数が2倍になると、元のサンプリング周波数でデータ長を1bit増やした(解像度が2倍になった)のと同じ効果をもちます。 CDDAでは、最小信号は0x0001で表現できます。 サンプリング周波数88.2kHzfsで0x0000と0x0001を交互に出力してLPFを通せば、見かけ上振幅値0.5を表現できます。 本方式では8xオーバーサンプリングしているので、0x0001が1個と0x0000 7個で0.125が表現でき解像度8倍(+3bit)の効果です。 さらにノイズシェーピングもかけています。シミュレーションでは約60dBのS/N比が出ていました。 65段階の6bitと8xオーバーサンプリングの+3bitとノイズシェーピングの+1bitで10bit相当(すなわち60dB)という表現になります。

コストの話

本方式にかかるハードウェアコストですが、いくつか異なる前提の数値が発表されているので、この場で整理します。 まず、3種類に分類します。

補助資料に書いた第5試作品のコストは、1台試作した時のコストでした。 AV Watchに書いてある『FPGAで本方式を実現するときのコスト』は、1台試作するために、メーカーの評価基板を入手することを想定して数万円と伝えました。 量産すれば当然安くなります。 それでも従来のDACチップと比較すると、DACチップとして1桁高価になるでしょう。 また、某メーカーがBluetooth接続のポータブルスピーカーを作るために使っているリソースが使えれば、本方式など一式3万円のミニコンポとして1年後には発売できると思います。 必要なリソースを具体的に表現すると、以下です。

過去の試行錯誤

発表会場に持ち込んだ10W+10Wのアンプは、第5試作品です。 ここまでの試行錯誤を説明します。

HTML_TH(試作番号)HTML_TH(2016年8月22日現在の状況)HTML_TH(説明)
第1試作部品を抜かれた基板が残る ΔΣを直接増幅してヘッドフォン駆動を試みたがS/N悪し
第2試作残っていない 絶縁トランスを使ったが、HiFiにならず
第3試作残っていない CMOSロジックIC出力を絶縁トランスに通したが、HiFiにならず
第4試作複数の機材がWebmasterの手元で動作中 CMOSロジックIC出力を複数束ねてスピーカーを駆動してみた。 PWM周波数を352.8kHzに落としてみた
第5試作Webmasterが出先でデモンストレーションするときに使用 第4試作の増幅段をTiの10W+10W D級アンプに交換してみた
第6試作データのUSB伝送速度が足りない 第4試作のUSBマイコンをPsoC5LP kitに交換してみた
第7試作アナログ出力が安定しない D級増幅ではなく、工業用高速ラダー抵抗DACを使ってみた
第8試作評価中 ネット通販で購入したラダー抵抗のDAC基板にソフトウェア・オーバーサンプリングしたデータを入れてみた 回路の制限のため入力サンプリング周波数は176.2kHz

最初の発想は、ΔΣを簡単に出力できないものだろうかという疑問でした。 AV Watchに掲載されている写真が、第1試作の回路です。 マイコン基板とクロックは別基板で再利用してしまったので、外されています。 マイコン基板からは、DAC LSIに送るのと同じΔΣ信号が2ch出ています。 増幅回路はラッチする必要がないので、データタイミングを示すクロックは出していません。 外のOPアンプは、アナログビデオ用の高速(MHz帯域)、大出力(数百mA)の品種を使いました。 OPアンプは2回路入りのもので、1個はマイコンが出力する3.3Vパルス2ch分を電流増幅するために使用します。 出力レベルはデジタルなので、電圧をフルスイングさせています。 もう1個のOPアンプでは、3.3V電源の半分の基準電圧を作って、ヘッドフォン出力の仮想GNDにしています。 マイコン基板の端子から出てくるのは、PWMパルスです。外付けのLPF回路を通します。 LPF回路は3種類試作しました。 聴感上は、どのLPFを使っても大差ありません。 LPF回路の出力をボリュームで分圧してヘッドフォンに送っています。 ヘッドフォンで聴いてみて、フォルティッシモはまともに再生できたのですが、ピアニッシモがノイズに埋もれてしまいました。 いかにもあとづけしたような電解コンデンサがマイコン基板上にあるのは、ノイズ対策のあとです。

第2試作の基板はもう残っていません。 第1試作で、OPアンプを使った仮想GNDが悪かったのかと思い、PWMパルスを絶縁トランスに通してGND共通化をおこないました。 絶縁トランスに安物を使ったのがいけなかったのか、とてもHiFiとは呼べない音になったので、この方式は却下です。

第3試作の基板も残っていません。 OPアンプを使った増幅がいけないのかと思い、第2試作のOPアンプの代わりに74AC04をつかってみました。 絶縁トランスはそのままで、やはりHiFiにはなりませんでした。

第4試作でようやく成功しました。 改良点は、ハードウェアとソフトウェアの両方です。 ピアニッシモでのノイズの原因は、LPFから電源へ帰還するエネルギーが電源電圧を不安定にしているせいではないかと考えました。 スイッチングの周波数をΔΣの2.8MHzではなく一般的なD級アンプに合わせて352.8kHzまで落としてしてあります。 48kHzの整数倍ではなく44.1kHzの整数倍を選んだのは、再生目的のCD , SACDデータと整数比にしたほうが実装の都合が良いからです。 ハードウェアは、ヘッドフォン駆動をいったんあきらめスピーカーをBTL駆動することにしました。 ちょうど、『本田潤 D級/ディジタル・アンプの設計と製作 CQ出版社』を読んでいて、1Wアンプの製作記事を参考にしました。 電流増幅にロジックICの出力を束ねる発想を利用しました。 参考文献では74AC04を使っていますが、私は74AC245を使いました。 量産するつもりはないので、部品代が(数十円×9個分)上がってもかまわないのと、入力端子同士、出力端子同士が隣り合っているチップの方が配線作業が楽だったものですから。

第5試作はデモンストレーション目的で作成しました Webmasterの自宅で10Wフルに鳴らすと、近所迷惑になります。 あちこちに出掛けてデモンストレーションするときだけ、10Wぐらい欲しいという目的のみで作っています。 単純に第4試作の電流増幅回路を、TiのD級アンプ評価基板に置き換えてあります。 74AC245を束ねた第4試作は、ΔΣの2.8MHzでスイッチングさせることができますが、Tiのチップでは数百kHzのスイッチングが上限です。 電源を安定化していなくて、ACアダプタのスイッチング出力を直接入れているので、出音はそれなりです。

第6試作はまだ稼働していません 第5試作までに使用したUSBマイコンは、1枚5000円を超えます。 また2016年現在、入手困難になりました。 そこで、PSoC5LPを使った第6試作を始めたのですが、FullSpeedのUSBで5.6Mbpsを伝送する性能が出せず頓挫しています。

第7試作もまだ稼働していません D級増幅ではなく、工業用のマルチビットDACを使って音声出力を試みていますが、DAC出力をGND中心のアナログ電圧に変換する回路が不安定で対策中です。

第8試作は、2016年8月2日現在動作していて評価中です。 CDDAを44.1kHzfs16bitで流し込むのと、ソフトウェアで8xオーバーサンプリングしてから流し込むのを比較すると、若干高域が変わります。 Webmasterの手持ちアンプでは、違いがほとんどわかりません。Line出力を、ヘッドフォンなりスピーカーへ増幅して再生するのですが、増幅段に高級HiFiオーディオを必要としています。 ソフトウェアもまだまだ改良中です。 例えばTDA1545Aというラダー抵抗のDACは、ラダー部分の精度が11bitしかなく、32個の電流源を制御して16bit精度出しているそうです。 この部分をノイズシェーピングでカバーしようと考えているのですが、まだよい効果が出ていません。 おそらくチップ内部のラダー抵抗と電流源の挙動を正しく想像できていないのだと考えます。

第8試作の基板写真

今後の展開

おかげさまで、オーディオファンの方から「自分のところでも中田式D/A変換を試したい」というリクエストをいただくようになりました。 現在、ゆっくりではありますが、作業中です。 今後の予定を書きます。

  1. 8xオーバーサンプリングを計算させるコンピューター部分のコストダウン
  2. Webmasterの自作オーディオ仲間に試作品を提供予定
  3. オーディオショップ店頭などをお借りしてデモンストレーション
  4. ほそぼそと販売
おそらく、最後まで行かないうちに海外から同種技術が輸入されるだろうと予想しています。

あと、CDDA再生が一段落したら、ΔΣ再生も再挑戦してみたいです。 第3試作までは、ΔΣを直接増幅しようとして電源電圧が変動したらしく、ピアニッシモでノイズがのりました。 ヘッドフォンやスピーカーの直接駆動を諦めてLine出力で出すとか、増幅の時にΔΣを別信号に変調するアイディアを試そうと考えています。

2016年8月22日追記

オーバーサンプリング部分のコストダウンをしなければならないと思いつつ、D/A変換をいろいろ試しています。 DIYINHKの基板を改造して352.8kHzfsを入れてみたいですし、第4試作と第5試作のPWM変調精度を格段に向上できそうなLSIを買ってしまいました。 8月中に何か報告できるかもしれません。

オーディオ界にショックをもたらした(かもしれない)『中田バズーカ』は、本家日銀総裁と違ってしっかりした理論的裏付けのもとに実装で確認してから報告しています。 第2弾、第3弾も準備中ですので、ご期待下さい。

ここが変だよオーディオ広告

2016年8月1日、Webmasterが買い物にでかけた量販店のオーディオコーナーでとんでもない広告を見かけました。 以下のキャッチコピーです。 「CDもハイレゾ相当の音質で楽しめるコンポ」だそうです。 このメーカーの主張は、『CDよりも良い音が出るのがハイレゾだ』という理屈ではなかったでしょうか? 同メーカーのポータブルオーディオでは、「より原音に近いサウンドへ。CDを超える高音質を実現するハイレゾ音源」とうたっています。

Webmasterは最近強く感じているのですが、『オーディオに限らず広告代理店の作るキャッチコピーの理屈が破綻していることが多い』ようです。 電車内部に貼られた宣伝でも、うんちくの前半部分と後半部分で主張が矛盾しているものを見かけるのですが、書いている方も読んでいる方も気づかないのでしょうか。 上記のメーカーの広告の中には優れたものもあって、高音質による感動を宣伝するのに『ゾクゾクする』と表現したものを見かけました。 『うまい表現だ』と思います。

この会社の広報は、仕事していないんでしょうか。 それとも、わかっていてわざとやっているのでしょうか。

オーディオメーカーの言い訳

補助資料の『中田とオーディオ』にある『世界初その3への反応』スライドで、接触したオーディオメーカーの反応が3者3様だった話を書きました。 このうち『自社技術に過剰な自信を持っていて、中田の話に聞く耳を持たない』メーカーが、一時期怪しい発言をしていました。 「自分たちも、同じ技術を以前研究したことがある」だそうです。でも1週間位で、その主張を引っ込めました。

以下は、Webmasterの想像です。 ハイレゾについて問いただされた時の言い訳にうまい理屈をこねることができなかったので、「自分たちも以前研究していた」と苦し紛れに言ったのではないでしょうか。

ただ、北アメリカやヨーロッパで、「ハイレゾが高音質実現の手段でないことを本当は知っていました テヘペロ」などと言うと、「お前ら、嘘と知りつつハイレゾ機器を売っていたのか?」という話になってVolks Wagenの排気ガス偽装と同じ騒動になります。 そこで、日本国内専用の一時的言い訳にしていたのでしょう。

東アジアの3国(日本、中国、韓国)では、文化的背景から理屈よりも感情論が優先されます。 ある程度は仕方のないことだと思いますが、ビジネスがグローバル化している現代に、ドメスティックな表現を多用するのは避けたほうが良いのではないでしょうか。 海外出張した時に、困りませんか?

ついでに書くと2016年5月27日には、三重サミットの成果として首脳宣言が採択されました。 一見すると諸問題の解決に動いている印象を持てるのですが、『適時に』『各国の状況に配慮して』『追求する』『努力する』など、曖昧な表現に終止しています。 5W1H(いつ、どこで、なぜ、だれが、どのように、なにをするか)を具体的に書いていないので、実質的には何も言っていないのと同じです。 首脳宣言の草稿を書いた日本の官僚は、『美辞麗句を盛り込みつつ問題点から逃げることができたうまい作文だ』と自画自賛しているのかもしれませんが、日本以外の参加各国は『内容が無いよう』と感じているものと想像します。

おまけ

2016年8月22日 追記

ちょっと前に気になることがありました。

あるグループで仕事をしていた人たちですが、落ち度もないのに経営者から敵視されて干されそうになったんです。マネージャーこみで打ち合わせして、契約更新をやめて別の仕事を探そうかという流れになりました。

ところがグループ内に仕事の出来無い所帯持ちがいて、「別の職場の収入では一家が食べていけない」と奥さんに諭されたらしく、自分だけ自己中な経営者側に寝返ってしまいました。 グループで契約終了を円満に迎えるのは経営者も合意していたはずなのに、経営者が激怒してしまい話は大きくこじれてしまいました。

仕事ができない人間が会社にしがみつこうとする動機は十分に理解できるのですが、そもそも経営者の私利私欲のために現場の人間がハードワークと少ない報酬で仕事してきた結果、グループ内のほとんどが結婚できていないのです。 落ち度もなく、真面目に成果を出してきた人間が金持ちのわがままに振り回されてしまうのが、今の日本ですよね。

いやソフトウェア開発現場の話ですけど、他にも似たような事例があるんですか?

2016年8月2日 初出

2016年8月22日 追記


back button 趣味趣味音響へ