把”录了一段音频,存什么格式”这个看似简单的选择拆开,会发现 MP3、WAV、AAC、M4A、FLAC 各有自己的设计目标和适用场景。这篇讲清五种格式的差异、什么时候选哪个、有损链式转码的累积损失。
五种格式速查
| 格式 | 类型 | 典型码率 | 1 分钟体积 | 兼容性 | 设计目标 |
|---|---|---|---|---|---|
| MP3 | 有损 | 128–320 kbps | 1–2.5 MB | ★★★★★ 最广 | 大众化压缩,1993 年标准 |
| AAC(.aac) | 有损 | 96–256 kbps | 0.7–2 MB | ★★★ | MP3 改进版,2000 年起 |
| M4A | 容器 + AAC | 同 AAC | 同 AAC | ★★★★ | 苹果生态首选 |
| WAV(PCM) | 无压缩 | 1411 kbps(CD) | ~10 MB | ★★★★★ | 录制 / 中间格式 |
| FLAC | 无损压缩 | 600–1000 kbps | ~5 MB | ★★★ | 高保真存档 |
容器(container)vs 编码(codec)
这是最容易混淆的概念:
| 容器 | 可装编码 | 例子 |
|---|---|---|
.mp3 | 只能装 MP3 | 一对一 |
.aac | 裸 AAC 流 | 一对一,无元数据 |
.m4a / .mp4 | AAC / ALAC / MP3 / Opus | 一对多 |
.wav | PCM / ADPCM / 极少其他 | 几乎一对一 |
.flac | 只装 FLAC | 一对一 |
.ogg | Vorbis / Opus / FLAC | 一对多 |
实际意义:.m4a 文件可能装 AAC(最常见)也可能装 ALAC(苹果无损)——光看扩展名分不清,得看内部 codec。
为什么 AAC 比 MP3 好
| 维度 | MP3 | AAC |
|---|---|---|
| 标准化年份 | 1993 | 1997 |
| 滤波器组 | 固定 576/192 块 | 自适应 1024/128 块 |
| 心理声学模型 | 简单 | 精细,含频谱掩蔽 |
| 联合立体声 | M/S | M/S + IS(强度立体声) |
| 同等听感码率 | 192 kbps | 128 kbps |
| 专利 | 已过期 | 仍有部分授权要求 |
结论:同码率下 AAC 大约对应 MP3 的 1.5x 等效音质——AAC 128 ≈ MP3 192。
码率怎么选
| 码率 | MP3 适用 | AAC 适用 | 说明 |
|---|---|---|---|
| 64 kbps | ❌ 太糊 | ✅ 讲话类可用 | 电话级 |
| 96 kbps | ⚠ 听得出有损 | ✅ 讲话类好 | 播客最低 |
| 128 kbps | ✅ 一般场景 | ✅ 流行音乐 | 大多数邮件附件 |
| 192 kbps | ✅ 流行音乐 | ✅ 高保真 | 本工具默认 |
| 256 kbps | ✅ 高保真 | ✅ “透明”音质 | iTunes 默认 |
| 320 kbps | ✅ MP3 上限 | — | 老 MP3 党最爱 |
经验:
- 讲话类 96k 够、128k 充足
- 流行音乐 192k 够、256k 几乎透明
- 古典 / 极动态范围内容 256k 起
- 320k 是 MP3 物理上限,AAC 同体积更高音质
采样率别瞎改
| 场景 | 采样率 | 备注 |
|---|---|---|
| 电话 | 8 kHz | 上限 4kHz,能听清说话 |
| 语音助手 / 录音笔 | 16 kHz | 上限 8kHz |
| 视频音轨 | 48 kHz | 影视行业标准 |
| 音乐 / CD | 44.1 kHz | CD 时代沿用 |
| 高分辨率音频 | 96 / 192 kHz | 后期处理留余量 |
奈奎斯特定理:能记录的最高频率 = 采样率 / 2。人耳上限 ~20kHz,所以 44.1kHz 足够覆盖整个听觉范围。
别做的事:
- 把 16kHz 录音”上采样”到 48kHz——不会增加任何信息
- 把 44.1kHz 音乐降到 8kHz——高频全丢
本工具行为:保留原文件采样率,不改。
有损链式转码会变多差
| 经历 | 听感损失 | 仪器 SNR 下降 |
|---|---|---|
| 原始 → MP3 192k | 几乎察觉不到 | < 1dB |
| 第 2 代(再次转码) | 高频微薄 | 3–6dB |
| 第 5 代 | 镲片金属感、糊 | 10–15dB |
| 第 10 代 | 明显失真 | 20dB+ |
| 第 20 代以上 | 不堪入耳 | 失去意义 |
避免方法:
- 保留原始无损文件(WAV / FLAC / 录音笔原始)
- 编辑回到无损源
- 只在最终发布时一次性导有损
- 不可避免要编辑 MP3 时,保持 ≥ 256kbps 减缓损失
当前工具的真实边界
| 维度 | 实际能力 |
|---|---|
| 输入格式 | MP3 / WAV / M4A / AAC / FLAC / OGG / OPUS / WMA / AIFF / ALAC |
| 输出格式 | MP3 / WAV / AAC / M4A / FLAC |
| 码率 | 128k / 192k / 320k(无损格式无此选项) |
| 采样率 | 保留原文件,不改 |
| 声道 | 保留原文件(单声道 / 立体声不变) |
| 元数据(封面 / ID3) | 不保证保留 |
不支持:
- 输出 Opus(输入支持,输出会转成 MP3/AAC)
- 24-bit/96kHz 高保真上采样
- 通道转换(立体声 ↔ 单声道)
- 自定义采样率
选型决策树
要不要兼容老设备?
├─ 是 → MP3
└─ 否 → 苹果生态?
├─ 是 → M4A
└─ 否 → 体积优先?
├─ 是 → AAC
└─ 否 → 无损?
├─ 是 → 编辑用 WAV / 存档用 FLAC
└─ 否 → AAC 192k
几个常见的”伪问题”
“FLAC 比 WAV 音质好” —— 错。两者都无损,FLAC 只是更小。
“320k MP3 是无损” —— 错。320k 是 MP3 物理上限,但仍是有损(靠心理声学模型丢弃听不见的频率)。
“采样率越高越好” —— 部分错。听众级音频 44.1/48 kHz 已经覆盖人耳上限,96 kHz 是给后期处理留余量。
“AAC 是苹果专属” —— 错。AAC 是 ISO 标准(MPEG-4 Part 3),所有现代设备都支持,只是苹果生态首选。
一句话总结
MP3 兼容性最广、AAC 同码率更好、M4A 是 AAC 装 MP4 容器、WAV 无压缩、FLAC 无损压缩;讲话类 AAC 96k 起、音乐 192k 起、高保真存档 FLAC、链式转码会累积损失但每代降幅减小。