高解析度音频 Android 高解析度音频播放器 高分辨率音频

Android 上的高解析度音频:真正重要的是什么

关于 Android 高解析度音频的务实指南。了解高解析度的真正含义、你是否能听出区别,以及如何获得真正的高分辨率播放。

· 11 分钟阅读

什么算高解析度音频?

高解析度音频是指任何超过 CD 品质的数字音频。CD 提供 16 位、44,100 Hz 的音频,这对应约 96 dB 的动态范围和 22,050 Hz(奈奎斯特极限)的频率上限。任何超过这些数字的——更高的位深度、更高的采样率,或两者兼有——都算作高解析度。

日本音频协会和消费电子协会在 2014 年对此进行了正式定义,将高解析度音频定义为”能够再现从优于 CD 品质音源母带处理的录音全频范围的无损音频”。在实际中,这个标签适用于 24 位和/或 48 kHz 及以上采样率的文件。

以下是你最常遇到的高解析度格式:

格式典型规格文件大小(每分钟,立体声)备注
FLAC 24/9624 位,96 kHz~35 MB大多数听众的最佳选择
FLAC 24/19224 位,192 kHz~70 MB对聆听而言收益递减
FLAC 24/38424 位,384 kHz~140 MB极其罕见,主要用于存档
ALAC 24/9624 位,96 kHz~35 MBApple 的无损等价物
DSD641 位,2.8 MHz~50 MB参见我们的 DSD 播放指南
DSD1281 位,5.6 MHz~100 MB更高速率的 DSD 变体
WAV 24/9624 位,96 kHz~35 MB未压缩,元数据有限

行业认证标志——如日本音频协会的”Hi-Res Audio”金色贴纸——出现在符合这些标准的硬件和文件上。但认证贴纸并不能告诉你内容是否真正受益于更高的分辨率。这需要更深入的探查。

科学事实:你能听出来吗?

这是大多数音频媒体失去勇气的地方。科学是明确的,即使没人想听。

奈奎斯特定理

奈奎斯特-香农采样定理于 1949 年被证明,它指出最高频率 2 倍的采样率足以完美重建连续信号。不是近似。而是完美。44,100 Hz 的采样率以数学精度捕获高达 22,050 Hz 的所有内容。

这没有争议——这是数学。但这并不能阻止人们在网上争论它。

人类听觉极限

人类听觉的教科书范围是 20 Hz 到 20,000 Hz,但那个上限适用于健康的年轻耳朵。到 30 岁时,大多数人听不到 16-17 kHz 以上的声音。到 50 岁时,通常低于 14 kHz。

所以 CD 品质音频(44.1 kHz,捕获高达 22.05 kHz)已经超过了大多数成年人能感知的范围。96 kHz 的文件捕获高达 48 kHz 的频率——只有蝙蝠和海豚才会欣赏的范围。

那为什么高解析度存在?

有几个合理的原因:

位深度比采样率更重要。从 16 位到 24 位的跳跃将理论动态范围从 96 dB 增加到 144 dB。虽然没有录音或聆听环境真正使用那个完整范围,但额外的余量给了母带工程师更多的工作空间。以 24 位交付的音乐可能比 16 位 CD 版本以更多的关注和更少的压缩进行母带处理。

采样率在时域中有边际好处。一些研究人员认为,虽然单个 20 kHz 以上的频率不可听,但它们与较低频率的相互作用可以产生耳朵能感知的微妙时间线索。证据是混合的,效果——如果存在的话——很小。

真正的变量是母带。精心母带处理的 24/96 版本通常听起来比其 CD 对应版本更好,不是因为采样率,而是因为高解析度版本接受了不同的、通常更精心的母带处理。剥去母带差异,受控盲听测试始终表明听众无法可靠地区分 16/44.1 和 24/96。

升采样假货问题

一些发行商将 CD 品质的母带(16 位/44.1 kHz)升采样到 24 位/96 kHz 或更高,然后作为”高解析度”出售。文件有更高的采样率,但频率内容停在 22 kHz,因为一开始就不存在任何更高频率的信息。你花钱买了一个更大的文件,听起来与 CD 完全相同。

这不是一个假设性的担忧。它经常发生,如果你花了真金白银买了你以为是真正高解析度版本的东西,这坦率地说令人愤怒。没有分析工具的话,它完全不可见。

我们专门为解决这个问题构建了 Echobox 的频谱分析引擎。它检查每首曲目的实际频率内容,并以高解析度置信度评级进行分类。如果一个声称 96 kHz 的文件在 22 kHz 处有频率滚降——这是升采样 44.1 kHz 源的明显迹象——Echobox 会将其标记为”可能已升采样”。这在曲目和专辑级别都有效,因此你可以审核整个音乐库中的假货。

该分类使用基于 FFT 的带宽估计,采用 4096 点窗口分析,查看整首曲目中检测到的带宽的第 95 百分位。它将测量的截止频率与已知的奈奎斯特上限(44.1 kHz 源为 22.05 kHz,48 kHz 源为 24 kHz)进行比较以做出判断。频谱内容真正扩展到更高频率的曲目被标记为”无升采样证据”。

为什么大多数 Android 播放器做错了

即使你有真正的高解析度文件,在 Android 上播放也比应该的要困难。罪魁祸首再次是 AudioFlinger。

隐藏的重采样问题

Android 的音频系统以固定的内部采样率运行——通常是 48,000 Hz。通过 AudioFlinger 的每段音频都必须匹配这个速率。如果不匹配,AudioFlinger 会悄悄地重采样它。

你精心保存的 96 kHz FLAC 在到达耳机之前就在 Android 内部被降采样到 48 kHz。播放器应用可能在屏幕上显示”96 kHz”,但实际输出是 48 kHz。除非你测量,否则你永远不会知道。

对于手机内置的 DAC 来说,这是不可避免的。硬件是为 48 kHz 设计的,没有应用可以改变这一点。转换发生在操作系统内部,虽然 Android 的内置重采样器多年来有所改进(它在许多设备上使用基于 Speex 的算法),但它是一种适用于所有情况的解决方案,不考虑源素材。

USB DAC 解决方案

绕过 AudioFlinger 固定速率限制的方法是 USB DAC。当你连接外部 DAC 时,Android 的音频系统可能以 DAC 的原生速率而不是手机内部的 48 kHz 运行。

关键词是”可能”。Android 仍然通过 AudioFlinger 来协调连接。应用请求一个采样率,Android 与 USB 音频驱动程序协商,驱动程序要么支持该速率,要么不支持。然后应用检查实际授予的速率并进行调整。

采样率协商在这里至关重要。设计良好的播放器会探测设备的最佳速率,为正在播放的文件请求适当的输出速率,并验证实际接收到的速率。设计不良的播放器不管怎样都以 48 kHz 输出,让 Android 处理后续的一切。

如何获得真正的高解析度播放

Android 手机上有三种音频输出路径。每种都有不同的高解析度能力。

USB DAC(最适合高解析度)

通过 USB-C(或较旧 DAC 的 USB-C 转 micro-USB 适配器)连接的 USB DAC 是从 Android 设备获得真正高解析度输出的唯一方式。好的 USB DAC 支持高达 384 kHz 的采样率和 32 位的位深度。

使用有能力的播放器并启用逐位精确模式,信号路径是:文件解码器,以文件的原生采样率直接到 USB DAC,无重采样,无 DSP 处理。这是 Android 允许的最接近”文件里有什么就到达 DAC 什么”的方案。

要更深入了解这是如何工作的,请参阅我们的逐位精确播放指南

有线耳机(有限)

3.5mm 耳机插孔(如果手机还有的话)或 USB-C 音频输出使用手机内置的 DAC,在大多数设备上固定为 48 kHz。高解析度文件将被降采样。听起来品质完全没问题——48 kHz 超过了人类听觉极限——但严格来说你并没有获得”高解析度”输出。

蓝牙(最受限)

蓝牙音频编解码器对源文件品质施加了自身的限制:

编解码器最大比特率最大采样率最大位深度备注
SBC345 kbps48 kHz16 位通用后备,有损
AAC256 kbps44.1 kHz16 位Apple 生态系统标准,有损
aptX384 kbps48 kHz16 位Qualcomm,有损
aptX HD576 kbps48 kHz24 位更好,仍然有损
LDAC990 kbps96 kHz24 位Sony,蓝牙上最接近高解析度

即使 LDAC 在最高品质设置下也上限为 24 位/96 kHz 并应用有损压缩。通过 LDAC 发送的 192 kHz FLAC 文件会被降采样和压缩。它仍然可以听起来非常好,但这不是高解析度输出。

有关无线音频品质的更多信息,请参阅我们的蓝牙音频编解码器指南

Echobox 如何处理高解析度音频

我们从零开始构建 Echobox,以在 Android 上正确处理高分辨率音频,解决该平台的每一个限制。

以原始采样率原生解码

Echobox 以文件的完整原生采样率和位深度解码音频。24 位/192 kHz 的 FLAC 被解码为 32 位浮点(以保留完整的 24 位精度且有余量)在 192,000 Hz 下。没有截断,没有提前降采样。

所有内部处理都以 32 位浮点进行,提供约 144 dB 的动态范围——超过任何 24 位源素材的精度。无论你的文件是 16 位 MP3 还是 24 位/384 kHz FLAC,内部表示都保留了一切。

智能采样率协商

当连接 USB DAC 时,Echobox 探测设备的最佳采样率,为正在播放的文件请求适当的速率,并验证 Android 实际授予的速率。如果文件速率与授予的设备速率不同,Echobox 使用带有 256 抽头 FIR 滤波器的 sinc 插值算法执行自己的高品质重采样(对于 DSD 等大比率转换使用 512-1024 抽头)。

我们不会将你的音频交给 Android 的内置转换器处理。我们的重采样器使用截止频率为 0.95 的 BlackmanHarris 窗函数,以 512 帧的块进行高效处理。

启用逐位精确模式后,Echobox 更进一步:它向 DAC 请求曲目的精确原生采样率,并绕过所有内部 DSP(音量控制、均衡器、ReplayGain、限制器)。如果 DAC 支持该速率,你将获得真正的逐位精确输出。如果不支持,Echobox 会报告不匹配,而不是悄悄降低信号品质。

信号路径诊断

Echobox 向你精确展示音频正在发生什么。信号路径显示揭示了曲目的原生采样率、引擎输出速率、是否正在重采样,以及 DAC 实际接收到什么。没有猜测,没有”相信我们”的说辞——你可以验证整个链路。

升采样假货检测

如上所述,我们的音频分析引擎对你音乐库中的每首曲目执行基于 FFT 的频谱分析。它测量内容的实际频率带宽,并与文件采样率暗示的带宽进行比较。内容与容器不匹配的文件会被标记。

这在专辑级别也有效。如果一张标榜为”24/96 高解析度”的整张专辑的频率内容在 22 kHz 处滚降,每首曲目都会被分类,专辑摘要会反映这一发现。我们认为,任何花钱买高解析度下载的人都有权知道他们是否得到了所付款项对应的东西。

这在实际中意味着什么

对大多数人来说,诚实的建议是:以最佳可用品质购买你喜爱的音乐,但除非你有 USB DAC 和真正能完整传递信号的播放器,否则不要为高解析度支付溢价。精心母带处理的 CD 品质文件和精心母带处理的 24/96 文件之间的差异,在最好的情况下是微妙的——在最坏的情况下,如果”高解析度”版本只是升采样,则完全不存在。最重要的是母带处理。精心母带处理的 CD 品质文件每次都会胜过糟糕母带处理的高解析度文件。格式是次要的,工作室中的用心才是关键。如果你确实选择高解析度,你需要一种方法来验证你得到了你所支付的东西,你需要一个不会在音频到达你的耳朵之前悄悄丢弃额外分辨率的播放器。这就是我们创建 Echobox 要解决的问题,也是为什么我们将频谱分析、信号路径诊断和逐位精确模式构建到应用的核心,而不是将它们视为事后想到的功能。

有关相关话题,请参阅我们关于 Android 上的 DSD 播放逐位精确播放FLAC 播放蓝牙音频编解码器音频品质指标使用频谱分析器的指南。


相关指南


试试 Echobox

体验这些指南所描述的内容 — 在 Android 上精准播放。

每个里程碑一封邮件。没有噪音。