音频格式怎么选:MP3 / WAV / AAC / M4A / FLAC 各有什么用

· 约 4 分钟 🔄 音频格式转换

把”录了一段音频,存什么格式”这个看似简单的选择拆开,会发现 MP3、WAV、AAC、M4A、FLAC 各有自己的设计目标和适用场景。这篇讲清五种格式的差异、什么时候选哪个、有损链式转码的累积损失。

五种格式速查

格式类型典型码率1 分钟体积兼容性设计目标
MP3有损128–320 kbps1–2.5 MB★★★★★ 最广大众化压缩,1993 年标准
AAC(.aac)有损96–256 kbps0.7–2 MB★★★MP3 改进版,2000 年起
M4A容器 + AAC同 AAC同 AAC★★★★苹果生态首选
WAV(PCM)无压缩1411 kbps(CD)~10 MB★★★★★录制 / 中间格式
FLAC无损压缩600–1000 kbps~5 MB★★★高保真存档

容器(container)vs 编码(codec)

这是最容易混淆的概念:

容器可装编码例子
.mp3只能装 MP3一对一
.aac裸 AAC 流一对一,无元数据
.m4a / .mp4AAC / ALAC / MP3 / Opus一对多
.wavPCM / ADPCM / 极少其他几乎一对一
.flac只装 FLAC一对一
.oggVorbis / Opus / FLAC一对多

实际意义.m4a 文件可能装 AAC(最常见)也可能装 ALAC(苹果无损)——光看扩展名分不清,得看内部 codec。

为什么 AAC 比 MP3 好

维度MP3AAC
标准化年份19931997
滤波器组固定 576/192 块自适应 1024/128 块
心理声学模型简单精细,含频谱掩蔽
联合立体声M/SM/S + IS(强度立体声)
同等听感码率192 kbps128 kbps
专利已过期仍有部分授权要求

结论:同码率下 AAC 大约对应 MP3 的 1.5x 等效音质——AAC 128 ≈ MP3 192。

码率怎么选

码率MP3 适用AAC 适用说明
64 kbps❌ 太糊✅ 讲话类可用电话级
96 kbps⚠ 听得出有损✅ 讲话类好播客最低
128 kbps✅ 一般场景✅ 流行音乐大多数邮件附件
192 kbps✅ 流行音乐✅ 高保真本工具默认
256 kbps✅ 高保真✅ “透明”音质iTunes 默认
320 kbps✅ MP3 上限老 MP3 党最爱

经验

  • 讲话类 96k 够、128k 充足
  • 流行音乐 192k 够、256k 几乎透明
  • 古典 / 极动态范围内容 256k 起
  • 320k 是 MP3 物理上限,AAC 同体积更高音质

采样率别瞎改

场景采样率备注
电话8 kHz上限 4kHz,能听清说话
语音助手 / 录音笔16 kHz上限 8kHz
视频音轨48 kHz影视行业标准
音乐 / CD44.1 kHzCD 时代沿用
高分辨率音频96 / 192 kHz后期处理留余量

奈奎斯特定理:能记录的最高频率 = 采样率 / 2。人耳上限 ~20kHz,所以 44.1kHz 足够覆盖整个听觉范围。

别做的事

  • 把 16kHz 录音”上采样”到 48kHz——不会增加任何信息
  • 把 44.1kHz 音乐降到 8kHz——高频全丢

本工具行为:保留原文件采样率,不改。

有损链式转码会变多差

经历听感损失仪器 SNR 下降
原始 → MP3 192k几乎察觉不到< 1dB
第 2 代(再次转码)高频微薄3–6dB
第 5 代镲片金属感、糊10–15dB
第 10 代明显失真20dB+
第 20 代以上不堪入耳失去意义

避免方法

  1. 保留原始无损文件(WAV / FLAC / 录音笔原始)
  2. 编辑回到无损源
  3. 只在最终发布时一次性导有损
  4. 不可避免要编辑 MP3 时,保持 ≥ 256kbps 减缓损失

当前工具的真实边界

维度实际能力
输入格式MP3 / WAV / M4A / AAC / FLAC / OGG / OPUS / WMA / AIFF / ALAC
输出格式MP3 / WAV / AAC / M4A / FLAC
码率128k / 192k / 320k(无损格式无此选项)
采样率保留原文件,不改
声道保留原文件(单声道 / 立体声不变)
元数据(封面 / ID3)不保证保留

不支持

  • 输出 Opus(输入支持,输出会转成 MP3/AAC)
  • 24-bit/96kHz 高保真上采样
  • 通道转换(立体声 ↔ 单声道)
  • 自定义采样率

选型决策树

要不要兼容老设备?
  ├─ 是 → MP3
  └─ 否 → 苹果生态?
            ├─ 是 → M4A
            └─ 否 → 体积优先?
                      ├─ 是 → AAC
                      └─ 否 → 无损?
                                ├─ 是 → 编辑用 WAV / 存档用 FLAC
                                └─ 否 → AAC 192k

几个常见的”伪问题”

“FLAC 比 WAV 音质好” —— 错。两者都无损,FLAC 只是更小。

“320k MP3 是无损” —— 错。320k 是 MP3 物理上限,但仍是有损(靠心理声学模型丢弃听不见的频率)。

“采样率越高越好” —— 部分错。听众级音频 44.1/48 kHz 已经覆盖人耳上限,96 kHz 是给后期处理留余量。

“AAC 是苹果专属” —— 错。AAC 是 ISO 标准(MPEG-4 Part 3),所有现代设备都支持,只是苹果生态首选。

一句话总结

MP3 兼容性最广、AAC 同码率更好、M4A 是 AAC 装 MP4 容器、WAV 无压缩、FLAC 无损压缩;讲话类 AAC 96k 起、音乐 192k 起、高保真存档 FLAC、链式转码会累积损失但每代降幅减小。

❓ 常见问题

"M4A 和 AAC 是同一个东西吗?"

编码相同,容器不同。AAC(Advanced Audio Coding)是编码格式——决定音频数据怎么压缩;M4A 是容器格式——MP4 容器包装 AAC 音频流。类比:AAC 像 MP4 视频里的 H.264 编码流,M4A = "只装音频的 MP4"。实际差异:(1) .aac 文件——裸 AAC 流,没有元数据头,体积最小但兼容性差,部分老播放器不识别;(2) .m4a 文件——AAC 装在 MP4 容器,支持封面图 / 章节 / 元数据,苹果生态首选(iTunes 默认用 M4A 而不是 AAC)。实务:选输出格式时——发邮件 / 上传公众号选 MP3(兼容性最好);苹果设备生态用 M4A;只要纯音频流给嵌入式设备处理用 AAC;高保真存档选 FLAC。

同样 192kbps,MP3 和 AAC 哪个好听?

同码率下 AAC 普遍优于 MP3。原因:AAC 是 1997 年的标准(MP3 是 1993 年),用了更先进的滤波器组(MDCT 块大小 1024/128 自适应,MP3 固定 576/192)、更精确的心理声学模型、改进的联合立体声编码。实测(盲听测试经验):(1) 128kbps AAC ≈ 192kbps MP3 的音质(节省 1/3 体积同等听感);(2) 96kbps AAC 已经可用于讲话类音频;(3) 64kbps MP3 听起来明显糊,64kbps AAC 还能接受。为什么 MP3 还在用:(1) 历史惯性——所有播放器、嵌入式设备、汽车音响都支持;(2) 专利已过期(2017 年)——免费用,AAC 仍有专利限制;(3) 体积差距对今天的存储不再重要。实务:(1) 兼容性优先 → MP3 192k;(2) 体积 / 音质优先 → AAC(M4A 容器)192k;(3) 一定要小 → AAC 128k 比 MP3 192k 还小且差不多。

WAV 文件 1 分钟 10MB,FLAC 也号称无损为什么只有 5MB?

WAV 是"无压缩",FLAC 是"无损压缩"——两者都不丢信息但体积差近一倍。(1) WAV (PCM)——直接存原始采样值,44.1kHz × 16-bit × 2 声道 = 1411kbps,1 分钟约 10MB(实际看采样率 / 位深);(2) FLAC——用线性预测(LPC)+ 残差编码 + Rice 编码,体积压到 50–60%,但完全可逆,解压回的样本和原始 bit 级一致。类比:WAV 像把每个像素的 RGB 值原样存进文件;FLAC 像 PNG(无损压缩)。码率对比:(1) WAV 16-bit/44.1kHz:1411 kbps;(2) FLAC 同源:约 700–900 kbps(看内容);(3) FLAC 24-bit/96kHz(高保真):约 2500–3500 kbps(仍比无压缩 4608 kbps 小)。为什么不全用 FLAC:(1) 兼容性——很多老设备 / DAW 直接读 WAV 不读 FLAC;(2) 编辑软件需要解压,重复保存反复解压压缩慢;(3) 存档场景空间不是问题。

"采样率"和"码率"是同一回事吗?

完全不是。(1) 采样率(Sample Rate)——每秒采样多少次,单位 Hz。决定能记录的最高频率(奈奎斯特定理:最高频 = 采样率 / 2)。常见值:8kHz(电话)/ 16kHz(语音)/ 44.1kHz(CD)/ 48kHz(视频)/ 96kHz(专业);(2) 码率(Bit Rate)——每秒占多少 bit,单位 kbps。决定文件大小,对有损格式还决定压缩质量。关系:WAV 等无压缩格式的码率 = 采样率 × 位深 × 声道数;MP3/AAC 等有损格式的码率独立设定,编码器用心理声学模型决定哪些频率丢弃。实务:(1) 讲话类内容 16kHz 采样足够(声带基频 < 300Hz,泛音 < 4kHz);(2) 音乐至少 44.1kHz;(3) 96kHz 主要给后期处理留余量,最终听众听不出 48kHz 与 96kHz 的差别。本工具默认:保持原文件采样率,只改格式和码率。

把 MP3 转成 WAV 能"恢复"音质吗?

不能,WAV 化的有损 MP3 还是有损。MP3 编码时丢弃的频率永远丢了——再转 WAV 只是把已经有损的样本存到无压缩容器里。类比:把 JPEG 转 PNG 后还是 JPEG 的画质,PNG 容器只是不让它继续劣化。正确用 WAV 的场景:(1) 录制阶段——原始录音直接存 WAV 避免任何压缩;(2) 后期处理中间格式——剪辑、调音过程中存 WAV 避免重复有损;(3) 最终存档——纯音乐高保真。错误用法:(1) MP3 转 WAV 期望提升音质——徒劳;(2) MP3 → WAV → MP3 期望保持原 MP3 音质——会有第二次有损损失。实务:(1) 拿到 MP3 想做编辑,直接编 MP3 即可;(2) 录新内容存 WAV,最后导成发布格式(MP3 / AAC);(3) 想从 MP3 还原"无损"——找原始未压缩源文件,没有就接受现状。

反复转码(MP3 → AAC → MP3)会变多差?

有损链式转码每次都损失,但损失按代差减小。每一次有损编码:(1) 心理声学模型重新计算;(2) 可能丢弃和上一代不同的频率分量;(3) 引入新的量化噪声。实测经验:(1) 第 1 次转码——原始 → MP3 192k:人耳几乎听不出(盲听 < 5% 准确率分辨);(2) 第 2 次转码——MP3 → AAC → MP3:高频开始变薄,仪器测得 SNR 下降 3-6dB;(3) 第 5 次转码——出现明显糊感、镲片"金属感";(4) 第 10 次以上——明显失真。避免链式损失:(1) 保留原始未压缩文件(WAV/FLAC)作为母带;(2) 任何编辑回到母带,再导成需要的有损格式;(3) 不得已只能编辑 MP3 时——保持高码率(≥ 256k)减缓损失;(4) 不要"为了改格式而转码"——原文件能用就别动。例外:低码率压成高码率不会变好,反而是无意义的体积膨胀。

OGG / Opus 是什么?为什么本工具不支持输出?

OGG 是容器,Opus 是编码——目前最先进的有损音频编码之一。(1) OGG(Vorbis)——开源免专利,Wiki / Wikipedia 早期主推;(2) Opus——2012 年标准化,专为低延迟设计,同码率下显著优于 MP3 / AAC,尤其在 64k 以下码率优势巨大。为什么没普及:(1) 兼容性——iOS / macOS 原生不支持 .opus 文件(需要装播放器);(2) 流媒体平台没主推(Spotify 实际后台用的就是 Ogg Vorbis,但下载格式仍 MP3);(3) WhatsApp / Discord 内部用 Opus 但用户感知不到。本工具不输出 Opus 的原因:(1) ffmpeg.wasm 体积有限,每加一个编码器涨数 MB;(2) 输出 Opus 但目标用户的设备播放不出反而坑;(3) 输入支持 OGG / Opus(用户已有的 Opus 文件可以转成 MP3 / AAC)。实务:(1) 录制语音消息内部用 Opus(已自动);(2) 自己存档别用 Opus,兼容差;(3) 想要超低码率体积小用 AAC 64k 替代。

蓝牙耳机听 SBC、AAC、LDAC 有什么差别?转码能改这个吗?

蓝牙编码是"传输环节"的事,和你的源文件格式无关。蓝牙不能直接传 PCM/MP3——必须用蓝牙音频协议(A2DP)支持的编码:(1) SBC(强制支持)——音质一般,所有蓝牙耳机都支持;(2) AAC——苹果生态默认,安卓部分支持;(3) aptX / aptX HD / aptX Adaptive——高通授权,安卓常见;(4) LDAC——索尼推,最高 990kbps,伪 Hi-Res;(5) LHDC——华为生态。实际链路:MP3 → 系统解码 → PCM → 蓝牙编码(SBC/AAC/LDAC) → 耳机解码。所以:(1) 你的源文件用 FLAC 还是 MP3,到了蓝牙耳机端音质上限取决于蓝牙编码而不是源文件;(2) 用 LDAC 听 320k MP3 比用 SBC 听 FLAC 还好;(3) 想要无损蓝牙——目前只有华为 L2HC、苹果 AirPods Pro 2 + USB-C iPhone 15 + Apple Music 无损能做到。实务:消费级听歌纠结源文件 320k vs FLAC 没意义,蓝牙环节早被压成有损了。

🔄 打开 音频格式转换 MP3/WAV/AAC/M4A/FLAC 互转·可选码率·浏览器本地处理不上传