Androidのハイレゾオーディオ:本当に重要なこと
Androidのハイレゾオーディオについての率直なガイド。ハイレゾの本当の意味、違いが聴こえるかどうか、本物の高解像度再生を得る方法を解説します。
ハイレゾオーディオとは?
ハイレゾオーディオとは、CD品質を超えるすべてのデジタルオーディオのことです。CDは16ビットオーディオを44,100 Hzで提供し、約96 dBのダイナミックレンジと22,050 Hz(ナイキスト限界)の周波数上限に変換されます。これらの数値を超えるもの — より高いビット深度、より高いサンプルレート、またはその両方 — がハイレゾとして認定されます。
日本オーディオ協会と米国家電協会は2014年にこれを正式に定義し、ハイレゾオーディオを「CD品質を超える音楽ソースからマスタリングされた録音の音の全範囲を再現できるロスレスオーディオ」としました。実際には、24ビットおよび/または48 kHz以上のサンプルレートのファイルにこのラベルが適用されます。
最も一般的なハイレゾフォーマットは以下の通りです:
| フォーマット | 一般的なスペック | ファイルサイズ(1分あたり、ステレオ) | 備考 |
|---|---|---|---|
| FLAC 24/96 | 24ビット、96 kHz | 約35 MB | ほとんどのリスナーにとってのスイートスポット |
| FLAC 24/192 | 24ビット、192 kHz | 約70 MB | リスニングでは収穫逓減 |
| FLAC 24/384 | 24ビット、384 kHz | 約140 MB | 非常にまれ、主にアーカイブ用 |
| ALAC 24/96 | 24ビット、96 kHz | 約35 MB | Appleのロスレス相当 |
| DSD64 | 1ビット、2.8 MHz | 約50 MB | DSD再生ガイドを参照 |
| DSD128 | 1ビット、5.6 MHz | 約100 MB | より高レートのDSDバリアント |
| WAV 24/96 | 24ビット、96 kHz | 約35 MB | 非圧縮、限定的なメタデータ |
業界の認証ロゴ — JASの「Hi-Res Audio」ゴールデンステッカーなど — はこれらの閾値を満たすハードウェアやファイルに表示されます。しかし、認証ステッカーはコンテンツが実際により高い解像度の恩恵を受けているかどうかについては何も教えてくれません。それにはより深い分析が必要です。
科学的見解:聴こえるのか?
ここがほとんどのオーディオ出版物が及び腰になるところです。科学は明確ですが、誰もそれを聞きたがりません。
ナイキストの定理
1949年に証明されたナイキスト-シャノンのサンプリング定理は、最高周波数の2倍のサンプルレートがあれば、連続信号を完全に再構成するのに十分であると述べています。近似的にではなく、完全に。44,100 Hzのサンプルレートは22,050 Hzまでのすべてを数学的精度で捉えます。
これは議論の余地がありません — 数学です。しかし、それでもインターネット上で議論されるのを止めることはできません。
人間の聴覚の限界
人間の聴覚の教科書的な範囲は20 Hzから20,000 Hzですが、その上限は健康な若い耳に適用されます。30歳までに、ほとんどの人は16〜17 kHz以上が聴こえなくなります。50歳になると、多くの場合14 kHz以下になります。
つまり、CD品質のオーディオ(44.1 kHz、22.05 kHzまでキャプチャ)はすでにほとんどの成人が知覚できるものを超えています。96 kHzのファイルは48 kHzまでの周波数をキャプチャします — コウモリやイルカしか鑑賞できない領域です。
ではなぜハイレゾが存在するのか?
いくつかの正当な理由があります:
ビット深度はサンプルレートよりも重要です。16ビットから24ビットへの移行により、理論上のダイナミックレンジが96 dBから144 dBに増加します。どの録音やリスニング環境も実際にその全範囲を使用するわけではありませんが、余分なヘッドルームはマスタリングエンジニアにより多くの作業空間を与えます。24ビットで配信される音楽は、16ビットCDリリースよりもより慎重に、より少ない圧縮でマスタリングされている可能性があります。
サンプルレートは時間領域でわずかなメリットがあります。一部の研究者は、20 kHz以上の個々の周波数は聴こえないものの、低い周波数との相互作用が耳が知覚する微妙な時間的手がかりを生み出す可能性があると主張しています。証拠はまちまちで、効果は — あるとしても — 小さなものです。
本当の変数はマスターです。優れたマスタリングの24/96リリースがCD版よりも良い音がすることが多いのは、サンプルレートのためではなく、ハイレゾ版が異なる、多くの場合より丁寧なマスターを受けているためです。マスタリングの違いを取り除き、制御された盲検テストでは、リスナーは16/44.1と24/96を確実に区別できないことが一貫して示されています。
アップサンプルされた偽物の問題
一部の配信業者はCD品質のマスター(16ビット/44.1 kHz)を24ビット/96 kHz以上にアップサンプルし、「ハイレゾ」として販売しています。ファイルのサンプルレートは高くなっていますが、高い周波数情報がもともと存在しなかったため、周波数コンテンツは22 kHzで止まります。CDと同じ音がする、より大きなファイルにお金を払っていることになります。
これは仮定の話ではありません。定期的に起こっており、本物のハイレゾリリースだと思って実際にお金を費やした場合は率直に言って腹立たしいことです。分析ツールなしには完全に見えません。
私たちはまさにこの問題を解決するためにEchoboxのスペクトル分析エンジンを構築しました。すべてのトラックの実際の周波数コンテンツを調べ、ハイレゾ信頼性評価で分類します。96 kHzを主張するファイルの周波数が22 kHzでロールオフしている場合 — アップサンプルされた44.1 kHzソースの特徴的な兆候 — Echoboxは「アップサンプルの可能性あり」とフラグを立てます。これはトラックレベルとアルバムレベルの両方で機能するため、ライブラリ全体を偽物について監査できます。
分類には4096ポイントのウィンドウ分析によるFFTベースの帯域幅推定を使用し、トラック全体で検出された帯域幅の95パーセンタイルを調べます。測定されたカットオフ周波数を既知のナイキスト上限(44.1 kHzソースの場合は22.05 kHz、48 kHzソースの場合は24 kHz)と比較して判定を行います。スペクトルコンテンツが実際に高い周波数まで延びているトラックは「アップサンプリングの証拠なし」とマークされます。
ほとんどのAndroidプレーヤーが間違える理由
本物のハイレゾファイルがあっても、Androidで再生するのは思ったより難しいです。犯人はまたしてもAudioFlingerです。
隠れたリサンプリング問題
Androidのオーディオシステムは固定の内部サンプルレートで動作します — 通常48,000 Hz。AudioFlingerを通過するすべてのオーディオはこのレートに一致する必要があります。一致しない場合、AudioFlingerは静かにリサンプリングします。
大切に保存した96 kHz FLACは、ヘッドフォンに届く前にAndroid内部で48 kHzにダウンサンプリングされます。プレーヤーアプリは画面に「96 kHz」と表示するかもしれませんが、実際の出力は48 kHzです。測定しない限り知る由もありません。
スマートフォンの内蔵DACの場合、これは避けられません。ハードウェアは48 kHz用に設計されており、どのアプリもそれを変更できません。変換はオペレーティングシステム内で行われ、Androidの内蔵リサンプラーは年々改善されていますが(多くのデバイスでSpeexベースのアルゴリズムを使用)、ソース素材に関係なく適用される画一的なソリューションです。
USB DACソリューション
AudioFlingerの固定レート制限を回避する方法はUSB DACです。外部DACを接続すると、Androidのオーディオシステムはスマートフォン内部の48 kHzではなく、DACのネイティブレートで動作する可能性があります。
キーワードは「可能性がある」です。AndroidはまだAudioFlingerを介して接続を仲介しています。アプリがサンプルレートをリクエストし、AndroidがUSBオーディオドライバーとネゴシエーションし、ドライバーがそのレートをサポートするかしないかを返します。アプリは実際に付与されたレートを確認して適応します。
ここではサンプルレートネゴシエーションが重要です。適切に設計されたプレーヤーはデバイスの最適なレートを探り、再生中のファイルに適切な出力レートをリクエストし、実際に受信したものを確認します。設計の悪いプレーヤーは48 kHzで出力するだけで、Androidに何が起こっても任せます。
本物のハイレゾ再生を得る方法
Androidスマートフォンには3つのオーディオ出力経路があります。それぞれハイレゾ対応能力が異なります。
USB DAC(ハイレゾに最適)
USB-C(またはUSB-Cからマイクロ USB へのアダプター)経由で接続されたUSB DACは、Androidデバイスから本物のハイレゾ出力を得る唯一の方法です。優れたUSB DACは384 kHzまでのサンプルレートと32ビットまでのビット深度をサポートしています。
対応プレーヤーとビットパーフェクトモードを有効にすると、信号経路は次のようになります:ファイルデコーダー、ファイルのネイティブサンプルレートで直接USB DACに送信、リサンプリングなし、DSP処理なし。これがAndroidで許容される「ファイルの中身がDACに届くもの」に最も近い状態です。
詳しくはビットパーフェクト再生ガイドをご覧ください。
有線ヘッドフォン(制限あり)
3.5mmジャック(まだある機種の場合)またはUSB-Cオーディオ出力はスマートフォンの内蔵DACを使用しており、ほとんどのデバイスで48 kHzに固定されています。ハイレゾファイルはダウンサンプリングされます。リスニングの品質は十分です — 48 kHzは人間の聴覚の限界を超えています — しかし厳密な意味での「ハイレゾ」出力は得られません。
Bluetooth(最も制限あり)
Bluetoothオーディオコーデックは、ソースファイルの品質に関係なく独自の制限を課します:
| コーデック | 最大ビットレート | 最大サンプルレート | 最大ビット深度 | 備考 |
|---|---|---|---|---|
| SBC | 345 kbps | 48 kHz | 16ビット | ユニバーサルフォールバック、ロッシー |
| AAC | 256 kbps | 44.1 kHz | 16ビット | Appleエコシステム標準、ロッシー |
| aptX | 384 kbps | 48 kHz | 16ビット | Qualcomm、ロッシー |
| aptX HD | 576 kbps | 48 kHz | 24ビット | より良い、それでもロッシー |
| LDAC | 990 kbps | 96 kHz | 24ビット | Sony、BT経由でハイレゾに最も近い |
最高品質設定のLDACでも24ビット/96 kHzが上限で、ロッシー圧縮が適用されます。LDAC経由で送信された192 kHz FLACファイルはダウンサンプリングされ圧縮されます。非常に良い音はしますが、ハイレゾ出力ではありません。
ワイヤレスオーディオ品質の詳細については、Bluetoothオーディオコーデックガイドをご覧ください。
Echoboxのハイレゾオーディオ処理
私たちはAndroidで高解像度オーディオを正しく処理するために、Echoboxを一から構築しました。プラットフォームの各制限に対処しています。
ネイティブサンプルレートでのネイティブデコード
Echoboxはオーディオファイルをフルのネイティブサンプルレートとビット深度でデコードします。24ビット/192 kHz FLACは32ビット浮動小数点(24ビットの完全な精度を余裕を持って保持)で192,000 Hzにデコードされます。切り捨てなし、早期のダウンサンプリングなし。
すべての内部処理は32ビット浮動小数点で行われ、約144 dBのダイナミックレンジを提供します — どの24ビットソース素材の精度も超えています。ファイルが16ビットMP3でも24ビット/384 kHz FLACでも、内部表現はすべてを保持します。
インテリジェントなサンプルレートネゴシエーション
USB DACが接続されている場合、Echoboxはデバイスの最適なサンプルレートを探り、再生中のファイルに適切なレートをリクエストし、Androidが実際に付与したレートを確認します。ファイルのレートが付与されたデバイスレートと異なる場合、Echoboxは256タップFIRフィルター(DSDのような大きな比率の変換には512〜1024タップ)を使用したsinc補間アルゴリズムで独自の高品質リサンプリングを実行します。
私たちはAndroidの内蔵コンバーターにあなたのオーディオを委ねません。私たちのリサンプラーはBlackmanHarrisウィンドウと0.95カットオフ周波数を使用し、効率のために512フレームのチャンクで処理します。
ビットパーフェクトモードを有効にすると、Echoboxはさらに踏み込みます:DACからトラックの正確なネイティブサンプルレートをリクエストし、すべての内部DSP(ボリュームコントロール、EQ、ReplayGain、リミッター)をバイパスします。DACがそのレートをサポートすれば、真のビットパーフェクト出力が得られます。サポートしない場合、Echoboxは信号を静かに劣化させるのではなく、不一致を報告します。
信号経路診断
Echoboxはオーディオに何が起こっているかを正確に表示します。信号経路表示はトラックのネイティブサンプルレート、エンジンの出力レート、リサンプリングが行われているかどうか、DACが実際に受信しているものを明らかにします。推測なし、「信頼してください」の主張なし — チェーン全体を確認できます。
アップサンプルされた偽物の検出
上記で説明したように、私たちのオーディオ分析エンジンはライブラリのすべてのトラックに対してFFTベースのスペクトル分析を実行します。コンテンツの実際の周波数帯域幅を測定し、ファイルのサンプルレートが示唆するものと比較します。コンテンツがコンテナと一致しないファイルにはフラグが付けられます。
これはアルバムレベルでも機能します。「24/96ハイレゾ」として販売されているアルバム全体の周波数コンテンツが22 kHzでロールオフしていることが判明した場合、すべてのトラックが分類され、アルバムサマリーにその結果が反映されます。ハイレゾダウンロードにお金を費やした人は誰でも、支払った分が得られたかどうかを知る権利があると私たちは考えます。
実際にはどういうことか
ほとんどの人への正直な推奨は次の通りです:好きな音楽を入手可能な最高品質で購入してください、ただしUSB DACと信号を損なわずに届けてくれるプレーヤーがない限り、ハイレゾにプレミアムを支払う必要はありません。良いマスタリングのCD品質ファイルと良いマスタリングの24/96ファイルの違いは、せいぜい微妙であり — 「ハイレゾ」版が単なるアップサンプルの場合、最悪存在しません。最も重要なのはマスタリングです。良いマスタリングのCD品質ファイルは、マスタリングの悪いハイレゾファイルを毎回上回ります。フォーマットはスタジオでの配慮に比べれば二次的です。ハイレゾを選ぶなら、支払った分が得られているか確認する方法が必要であり、余分な解像度が耳に届く前に静かに捨てられないプレーヤーが必要です。それが私たちがEchoboxで解決しようとした問題であり、スペクトル分析、信号経路診断、ビットパーフェクトモードをアプリの核心に組み込んだ理由です。
関連トピックについては、AndroidでのDSD再生、ビットパーフェクト再生、FLAC再生、Bluetoothオーディオコーデック、オーディオ品質メトリクス、スペクトルアナライザーの使い方のガイドをご覧ください。