素晴らしいオーディオの神話:なぜ32ビットDACが必要ないのか

著者: Randy Alexander
作成日: 1 4月 2021
更新日: 1 J 2024
Anonim
【後編 】32bit float 音割れしない録音ゲイン調整不要 最強はどれだ?ZOOM F6 TASCAM タスカム Portacapture X8
ビデオ: 【後編 】32bit float 音割れしない録音ゲイン調整不要 最強はどれだ?ZOOM F6 TASCAM タスカム Portacapture X8

コンテンツ


お気づきかもしれませんが、スマートフォン業界では、最新の主力スマートフォンに「スタジオ品質」のオーディオチップを搭載するという新しい傾向があります。 192kHzオーディオをサポートする32ビットDAC(デジタル-アナログコンバーター)は確かにスペックシートに表示されますが、オーディオコレクションのサイズを大きくしてもメリットはありません。

ここで、このビット深度とサンプルレートの誇示が、消費者の不足やオーディオ愛好家の知識さえも活用しているオーディオ業界のもう1つの例である理由を説明します。オタクの帽子をかぶってください。プロオーディオのインとアウトを説明するために、いくつかの真剣に技術的なポイントに取り組んでいます。うまくいけば、マーケティングの誇大広告のほとんどを無視する理由もお見せします。

聞こえますか?

始める前に、この最初のセグメントでは、デジタルオーディオの2つの主要な概念であるビット深度とサンプルレートに関する必要な背景情報を提供します。

サンプルレートとは、信号の振幅情報を取得または再現する頻度を指します。基本的に、特定の時点でそれについてさらに学ぶために、波形を多くの小さな部分に切り分けます。ナイキストの定理は、キャプチャまたは再現できる最高の周波数はサンプルレートのちょうど半分であると述べています。これは、周波数を正確に知るために波形の上部と下部の振幅(2つのサンプルが必要)が必要なので、想像するのは非常に簡単です。

サンプルレート(上)を上げると、1秒あたりのサンプル数が増えますが、ビット深度(下)を大きくすると、サンプルを記録できる値が増えます。

音声については、私たちが聞くことができるものだけに関心があり、大部分の人々の聴覚は20kHzの直前で減衰します。ナイキストの定理について知ったので、44.1kHzと48kHzが一般的なサンプリング周波数である理由を理解できます。これは、それらが聞こえる最大周波数の2倍をわずかに超えているためです。スタジオ品質の96kHzおよび192kHz規格の採用は、より高い周波数のデータのキャプチャとは関係がなく、それは無意味です。しかし、私たちはすぐにそれについてさらに掘り下げていきます。


時間の経過に伴う振幅を見ると、ビット深度は単に、この振幅データを保存するために利用可能な解像度またはポイント数を指します。たとえば、8ビットは256の異なるポイントに丸めることができ、16ビットの結果は65,534ポイントになり、32ビットのデータは4,294,967,294データポイントになります。明らかに、これによりファイルのサイズが大幅に増加します。

振幅精度の観点からビット深度をすぐに考えるのは簡単かもしれませんが、ここで理解するより重要な概念は、ノイズと歪みの概念です。非常に低い解像度では、より低い振幅情報の塊を見逃したり、波形のトップをカットしたりする可能性があり、不正確さと歪み(量子化エラー)が発生します。興味深いことに、低解像度のファイルを再生する場合、これはノイズのように聞こえることがよくあります。これは、キャプチャおよび再生可能な最小信号のサイズを効果的に拡大したためです。これは、ノイズ源を波形に追加するのとまったく同じです。つまり、ビット深度を下げるとノイズフロアも下がります。最下位ビットがノイズフロアを表すバイナリサンプルの観点からこれを考えることも役立ちます。

そのため、ビット深度を大きくするとノイズフロアが大きくなりますが、現実の世界での実用性には限界があります。残念ながら、至る所にバックグラウンドノイズがあります。バスが通りを通り過ぎるというわけではありません。ケーブルからヘッドフォン、アンプのトランジスター、そして頭の中の耳まで、現実の世界での最大信号対雑音比は約124dBであり、およそ21ビットのデータになります。ジャーゴンバスター:

DAC- D / Aコンバーターは、デジタルオーディオデータを取得し、それをアナログ信号に変換してヘッドフォンまたはスピーカーに送信します。

サンプルレート- ヘルツ(Hz)で測定され、これは毎秒キャプチャされるデジタルデータサンプルの数です。

SNR- 信号対雑音比は、目的の信号とバックグラウンドシステムノイズの差です。デジタルシステムでは、これはビット深度に直接リンクされています。


比較のために、16ビットのキャプチャは96.33dBのS / N比(信号とバックグラウンドノイズの差)を提供し、24ビットは144.49dBを提供し、ハードウェアキャプチャと人間の知覚の限界を超えています。したがって、実際には、32ビットDACは最大で21ビットの有用なデータしか出力できず、他のビットは回路ノイズによってマスクされます。しかし実際には、他のほとんどの回路要素が独自のノイズを導入するため、最も手頃な価格の機器は100〜110dBのSNRで最高に達します。明らかに、32ビットファイルは既にかなり冗長に見えます。

デジタルオーディオの基本を理解したので、さらに技術的なポイントに進みましょう。

天国への階段

オーディオの理解と誤解を取り巻く問題のほとんどは、教育リソースや企業が視覚的な合図を使用して利点を説明しようとする方法に関連しています。おそらく、すべてのオーディオは、サンプルレートのビット深度および長方形の見た目のラインの一連の階段として表されています。これは、滑らかな外観のアナログ波形と比較した場合、確かにあまりよく見えません。したがって、より正確な出力波形を表すために、より細かく「滑らかな」階段を簡単に切り取ることができます。

これは一般に簡単に売れるかもしれませんが、この一般的な「階段」精度の類推は大きな誤解であり、デジタルオーディオが実際にどのように機能するかを理解できません。それを無視します。

ただし、この視覚的表現は、オーディオの仕組みを誤って表しています。複雑に見えるかもしれませんが、数学的にはナイキスト周波数以下のデータ(サンプリングレートの半分)は完全にキャプチャされ、完全に再現できます。滑らかな正弦波ではなく方形波として表されることが多いナイキスト周波数でさえ、これを想像してください。特定の時点での振幅の正確なデータがあります。私たち人間は、サンプル間のスペースを誤って見ていることがよくありますが、デジタルシステムは同じようには動作しません。

ビット深度はしばしば精度にリンクされますが、実際にはシステムのノイズ性能を定義します。言い換えれば、最小の検出可能または再現可能な信号。

再生に関しては、「ゼロ次ホールド」DACの概念を理解しやすいため、これは少し複雑になります。DACは設定されたサンプルレートで値を単純に切り替え、階段状の結果を生成します。これは、実際にはオーディオDACの仕組みを公平に表したものではありませんが、ここにいる間は、この例を使用して、これらの階段について心配する必要はないことを証明できます。

注意すべき重要な事実は、すべての波形が複数の正弦波、基本周波数、および高調波倍数の追加成分の合計として表現できることです。三角波(または階段)は、振幅が小さくなる奇数次の高調波で構成されます。したがって、サンプルレートで非常に小さなステップが多数発生している場合、追加の高調波成分が追加されていると言えますが、可聴(ナイキスト)周波数の2倍で、おそらくそれを超える数倍の高調波で発生しているため、とにかくそれらを聞くことができません。さらに、これは、いくつかのコンポーネントを使用して簡単に除外できます。

DACサンプルを分離すると、目的の信号がDACサンプルレートで追加の波形とともに完全に表現されていることが簡単にわかります。

これが事実であれば、簡単な実験でこれを観察できるはずです。基本的なゼロ次ホールドDACから直接出力を取得し、非常にシンプルな2nd サンプルレートの半分に設定されたローパスフィルターを注文します。ここでは、実際にオシロスコープで出力を確認できるように、実際には6ビットの信号のみを使用しています。 16ビットまたは24ビットのオーディオファイルでは、フィルタリングの前後で信号のノイズがはるかに少なくなります。

かなり粗雑な例ですが、これは、この乱雑な階段の中でオーディオデータが完全に再現されるという点を証明しています。

そして、まるで魔法のように、階段のステップはほぼ完全に消え、正弦波出力を妨げないローパスフィルターを使用するだけで、出力は「滑らかになります」。実際には、私たちがやったことは、あなたがとにかく聞いていないであろう信号の部分をフィルタリングすることです。基本的に無料である追加の4つのコンポーネント(2つのコンデンサと2つの抵抗器は5ペンス未満のコスト)にとって、それは悪い結果ではありませんが、実際には、このノイズをさらに低減するために使用できるより洗練された手法があります。さらに良いことに、これらはほとんどの高品質DACに標準として含まれています。

より現実的な例を扱うと、オーディオで使用するDACは、アップサンプリングとも呼ばれる補間フィルターも備えています。補間は、2つのサンプル間の中間点を計算するための非常に単純な方法です。そのため、DACは実際にこの「スムージング」の多くを実際に行っており、サンプルレートを2倍または4倍にするよりもはるかに多くのことを行っています。さらに良いのは、余分なファイルスペースを占有しないことです。

DACに一般的に見られる補間フィルターは、その価値のあるDACで、高いサンプリングレートでファイルを持ち歩くよりもはるかに優れたソリューションです。

これを行う方法は非常に複雑になる可能性がありますが、基本的に、オーディオファイルのサンプル周波数が示すよりもはるかに頻繁にDACが出力値を変更します。これにより、サンプリング周波数のはるか外側に聞こえない階段状の高調波が押し出され、リップルの少ない、より低速で容易に達成可能なフィルターを使用できるため、実際に聞きたいビットが保存されます。

聞き取れないこのコンテンツを削除したい理由に興味がある場合、単純な理由は、この余分なデータを信号チェーンのさらに下流、たとえばアンプで再生するとエネルギーが無駄になることです。さらに、システム内の他のコンポーネントに応じて、このより高い周波数の「超音波」コンテンツは、限られた帯域幅のコンポーネントで相互変調歪みの量を実際に増やす可能性があります。したがって、実際に超音波コンテンツがそれらのファイル内に含まれている場合、192 kHzファイルはおそらく害よりも多くの害を引き起こすでしょう。

さらに証拠が必要な場合は、Circus Logic CS4272(上の写真)を使用して高品質のDACからの出力も表示します。 CS4272は、補間セクションと急峻な出力フィルターを内蔵しています。このテストのために行っていることは、マイクロコントローラを使用して、48kHzでDACに2つの16ビット高サンプルと低サンプルを供給し、24kHzで可能な最大の出力波形を与えることです。他のフィルタリングコンポーネントは使用されていません。この出力はDACから直接送られます。

このスタジオグレードのDACコンポーネントからの24kHzの出力信号(上)は、通常のマーケティング資料に関連付けられた矩形波のようには見えません。サンプルレート(Fs)は、オシロスコープの下部に表示されます。

出力正弦波(上)が周波数クロック(下)の速度のちょうど半分であることに注意してください。目立つ階段はありません。この非常に高い周波数の波形は、完全な正弦波のように見えますが、マーケティング資料や出力データをちょっと見ただけでわかるようなブロック状の方形波ではありません。これは、サンプルが2つしかない場合でも、ナイキスト理論は実際には完全に機能し、追加の高調波成分がなくても、大きなビット深度やサンプルレートなしで純粋な正弦波を再現できることを示しています。

32ビットおよび192 kHzについての真実

ほとんどの場合と同様に、すべての専門用語の背後に隠された真実があり、32ビットの192 kHzオーディオは実用的であり、手のひらの上ではありません。これらのデジタル属性は、スタジオ環境にいるときに実際に役立ちます。したがって、「スタジオ品質のオーディオをモバイルに」と主張していますが、完成したトラックをポケットに入れたい場合、これらのルールは適用されません。

まず、サンプルレートから始めましょう。高解像度のオーディオでよく聞かれる利点の1つは、聞くことはできないが音楽に影響を与える超音波データの保持です。ゴミ、ほとんどの楽器は聴覚の周波数制限よりもかなり前に外れます。マイクを使用してスペースをキャプチャすると、最大で約20kHzがロールオフします。たとえできたとしても、あなたの耳はそれを検出できません。

典型的な人間の聴覚感度は3kHzでピークに達し、16kHzの後に急速にロールオフし始めます。

ただし、192 kHzサンプリングは、データをサンプリングするときのノイズ(そのキーワード)を減らすのに非常に役立ち、重要な入力フィルターのより単純な構築を可能にし、高速デジタル効果にも重要です。可聴スペクトルを超えるオーバーサンプリングにより、信号を平均化してノイズフロアを下げることができます。最近のほとんどの優れたADC(アナログデジタルコンバーター)には、64ビット以上のオーバーサンプリングが組み込まれていることがわかります。

また、すべてのADCはナイキスト制限を超える周波数を除去する必要があります。そうしないと、高い周波数が可聴スペクトルに「折りたたまれ」、恐ろしい音のエイリアシングが発生します。 20 kHzのフィルターコーナー周波数と最大サンプルレートの間に大きなギャップがあると、理論上のフィルターが必要とするほど急で安定したものにならない現実のフィルターに適応しやすくなります。 DAC側でも同じことが言えますが、前に説明したように、相互変調はこのノイズを非常に効果的に高い周波数まで押し上げ、フィルタリングを容易にします。

フィルターが急峻になるほど、通過帯域のリップルが大きくなります。サンプルレートを上げると、「遅い」フィルターを使用できるようになり、可聴通過帯域でフラットな周波数応答を維持できます。

デジタルドメインでは、スタジオのミキシングプロセスでよく使用されるフィルターに同様のルールが適用されます。サンプルレートが高いほど、適切に機能するために追加のデータを必要とする、より急峻で高速に動作するフィルタが可能になります。あなたが実際に聞くことができるものだけに興味があるので、これは再生とDACに関しては必要ありません。

32ビットに移行すると、これまでにリモートで複雑な数学をコーディングしようとした人は、整数データと浮動小数点データの両方でビット深度の重要性を理解するでしょう。既に説明したように、ビット数が多いほどノイズが少なくなります。これは、丸め誤差のためにデジタル領域で信号の除算または減算を開始し、乗算または加算時のクリッピングエラーを避けるために重要になります。

追加のビット深度は、スタジオのオーディオソフトウェア内などの数学演算を実行するときに信号の整合性を維持するために重要です。しかし、マスタリングが終了したら、この余分なデータを捨てることができます。

以下に例を示します。4ビットのサンプルを取得し、現在のサンプルが13で、バイナリで1101であるとします。これを4で除算しようとすると、0011または単に3が残ります。余分な0.25を失ったため、追加の計算を行ったり、信号をアナログ波形に戻しようとするとエラーになります。

これらの丸め誤差は、非常に小さな歪みまたはノイズとして現れ、多数の数学関数にわたって蓄積する可能性があります。ただし、この4ビットサンプルを追加の情報ビットで拡張して、ファクションまたは小数点として使用する場合、余分なデータポイントのおかげで、ずっと長く分割、加算、および倍数を続けることができます。そのため、現実の世界では、16ビットまたは24ビットでサンプリングしてから、このデータを再び処理のために32ビット形式に変換すると、ノイズと歪みを節約できます。既に述べたように、32ビットは非常に多くの精度のポイントです。

さて、同様に認識すべき重要なことは、アナログドメインに戻ったときにこの余分なヘッドルームは必要ないということです。既に説明したように、約20ビットのデータ(-120dBのノイズ)は検出可能な絶対最大値であるため、「聴力」という事実にもかかわらず、音質に影響を与えることなくより適切なファイルサイズに戻すことができます。おそらく、この失われたデータを嘆きます。

ただし、より低いビット深度に移動する場合、いくつかの丸めエラーが必ず発生するため、これらのエラーは常にランダムに発生するわけではないため、非常に少量の余分な歪みが常に発生します。 24ビットオーディオではアナログノイズフロアをはるかに超えているため、これは問題ではありませんが、16ビットファイルでは「ディザリング」と呼ばれる手法でこの問題をきれいに解決します。

切り捨てとディザリングによって生じる歪みの比較例。

これは、オーディオサンプルの最下位ビットをランダム化し、歪みエラーを排除しますが、周波数全体に広がる非常に静かなランダムバックグラウンドノイズを導入することによって行われます。ノイズを導入すると、カウンターが直観的に見えるかもしれませんが、実際には、ランダム性のために可聴歪みの量が減少します。さらに、人間の耳の周波数応答を乱す特殊なノイズ形状のディザリングパターンを使用すると、16ビットディザリングされたオーディオは、知覚限界である120dBに非常に近い知覚ノイズフロアを実際に保持できます。

スタジオでは32ビットデータと192kHzのサンプルレートに顕著な利点がありますが、同じルールは再生には適用されません。

簡単に言えば、スタジオがこの高解像度のコンテンツでハードドライブを詰まらせるようにすれば、高品質の再生に関しては不要なデータをすべて必要としないだけです。

要約

まだ私と一緒にいるのであれば、この記事を、スマートフォンのオーディオコンポーネントを改善する努力を完全に却下したと解釈しないでください。数え切れないほどの数は無用である可能性がありますが、モバイル市場では依然として高品質のコンポーネントと優れた回路設計が優れた開発ですが、メーカーが正しいことに注意を向ける必要があります。たとえば、LG V10の32ビットDACは素晴らしいサウンドに聞こえますが、それを利用するために膨大なオーディオファイルサイズを気にする必要はありません。

低インピーダンスのヘッドフォンを駆動し、DACからジャックまでの低ノイズフロアを維持し、歪みを最小限に抑える機能は、理論的にサポートされているビット深度またはサンプルレートよりもスマートフォンオーディオにとって非常に重要な特性です。将来これらのポイントをより詳細に掘り下げるために。

FAAの従業員は米国の空域を管理しており、無人機の法規制は安全のために設計されており、世界中の多くの国でエミュレートまたはエコーされています。空を安全に保つために、彼らは7日間のトピックを共有しました。これらは飛行方法に関するガイドラインではありませんでしたが、現時点では、安全な飛行のためのベストプラクティスだけでなく、私たち全員が従わなければならない法律や規則があることを私たち全員が確実に確認す...

更新、2019年10月11日(10:10 AM ET):OnePluは、OnePlu 7T Proの発売中にステージ上でAndroid 10の更新計画を明らかにした後、発言を少し明確にすることにしました。公式コミュニティフォーラムへの投稿で、Oxygen OのリーダーであるManu J.は、Android 10の展開と、それがいつ期待できるかについて、さらに詳細に述べました。...

今日飛んだ