⭐ 觉得好用?收藏备用,下次直接打开
🔊
点击或拖拽音频到这里
输入:MP3 / WAV / M4A / AAC / FLAC / OGG · 输出:MP3 / WAV / AAC / M4A / FLAC · 全部本地处理
首次使用时会下载 ~32MB 编解码核心(同会话只下一次)

音量调整 在浏览器本地用 ffmpeg.wasm 改变音频的音量:可以手动加 / 减 dB(带防爆音限幅器),也可以按 LUFS 响度标准化(按播客 / 流媒体 / 广播标准统一响度),输出 MP3 / WAV / AAC / M4A / FLAC,全程不上传服务器。

怎么调最快

  1. 拖一个音频文件进来(MP3 / WAV / M4A / AAC / FLAC / OGG / OPUS 都支持)。
  2. 调整方式
    • 手动增益:拖动滑块或点 ±3 / ±6 / ±10dB 预设,放大时务必勾选限幅器
    • 响度标准化:选 −16(播客)/ −14(流媒体)/ −23(广播)/ 自定义
  3. 选输出格式(默认 MP3 192k)。
  4. 开始处理,完成后预览试听并下载。

dB 速查

dB 调整效果
+10 dB振幅 ×3.16(明显变响)
+6 dB振幅 ×2(一倍)
+3 dB振幅 ×1.41(明显但不大)
0 dB不变
−3 dB振幅 ×0.71
−6 dB振幅 ×0.5(一半)
−10 dB振幅 ×0.32(明显变小)

人耳”觉得响度翻倍”大约对应 +10 dB

LUFS 标准速查

用途LUFS平台
电视广播−23EBU R128 标准
播客−16Apple Podcasts
流媒体−14Spotify / YouTube / Tidal
网络视频−14YouTube 默认
电影院−24 ~ −27动态范围最大

不知道选哪个就 播客 −16,几乎所有平台都能接受。

关于音质

  • 手动增益 + 限幅:限幅器只在接近 0dBFS 时介入,对中等音量片段无影响
  • 响度标准化(loudnorm):单次扫描算法,内置 TP=−1.5dBTP 的真峰限制,自动避免削波
  • 都是有损过程(重新编码),输入输出都用 WAV / FLAC 才能完全保留处理质量

要做大量音量统一(一整张专辑、一整季播客),建议保留 WAV 母带,每个文件分别处理后再统一压缩到 MP3。

隐私与离线

ffmpeg.wasm 在 WebAssembly 沙箱 里运行,音频字节从加载到输出全程不离开浏览器。首次需联网下载约 32MB 编解码核心,缓存后即可断网使用。

📍使用场景

  • 录音太小听不清手机录的会议、采访音量过小,整体抬高 +6dB ~ +10dB,开限幅器防止削波。
  • 播客发布前对齐响度Apple Podcasts / Spotify 都按 LUFS 调音量,发布前用响度标准化拉到 −16 LUFS(播客标准),听感和别的节目一致。
  • 音量参差不齐的合辑从不同来源攒的歌单,每首音量差很大听着难受,逐首做 −14 LUFS 标准化(流媒体标准),统一音量。
  • 视频背景音乐压低视频里的 BGM 太抢人声,把音乐文件 −10dB 后再合到视频里。

常见问题

"手动增益"和"响度标准化"有什么区别?

手动增益简单粗暴——所有时刻的振幅都乘以一个固定值(dB 是对数单位,+6dB ≈ 振幅×2,+10dB ≈ 振幅×3.16)。适用:知道要"大一点 / 小一点",或多个文件需要相同的固定调整量。响度标准化是智能算法(EBU R128 / ITU-R BS.1770)——分析整段音频的"听感响度"再调整,让多个文件听起来一样响。适用:跨多个来源的文件统一音量、按平台标准发布。

LUFS 是什么?为什么不用 dB?

LUFS(Loudness Units Full Scale)是基于人耳听感的响度单位,把"听起来有多响"量化。两段同样 −3dBFS 峰值的音频,一段是密集的人声、一段是间隔很久的鼓点,LUFS 会差很多——人耳认为前者更响。专业平台都用 LUFS 而不是 dB,因为它更准确反映用户听感。LUFS 越接近 0 越响:电影院 −24 LUFS,电视广播 −23 LUFS,流媒体 −14 LUFS,播客 −16 LUFS。

播客 / 流媒体 / 广播预设具体用哪个?

播客 −16 LUFS:Apple Podcasts、Google Podcasts 推荐值,对话类内容标准。流媒体 −14 LUFS:Spotify、YouTube、Tidal 默认。比 −16 略响,适合音乐类。广播 −23 LUFS:欧洲电视广播 EBU R128 标准,比前两者明显安静——对动态范围要求高的电影、纪录片用。自定义:知道目标平台规范的可以填具体值。不知道选哪个就播客 −16,对话和音乐都能用。

什么是"防爆音限幅器"?什么时候该开?

"爆音"指振幅超出 ±1.0 后被截断(削波 clipping),听起来像"嘶啦"或"咔哒"。限幅器会在接近最大值时温和压缩,防止爆音。手动增益放大时(+dB)务必开——比如 +10dB 后大概率会有片段超出范围。缩小时(−dB)可以关。响度标准化模式不需要勾——loudnorm 算法内部已经包含峰值控制(TP=−1.5dBTP)。

MP3 输入处理后再输出 MP3 会损失音质吗?

会有一次重新编码的损失——本工具会解码 → 调音量 → 重新编码,二次有损不可避免。要保留母带音质,输入和输出都用 WAV / FLAC。如果原料就是 MP3,那么继续输出 MP3(同码率以上)听感差异通常很小。响度标准化对码率敏感一些,建议至少 192k。

"标准化"会让安静的部分也变响吗?

不会。响度标准化只是整体上下平移,保留原本的动态范围——安静的部分仍然安静、响亮的部分仍然响亮,只是整段的"平均响度"被调到目标值。如果你想让安静的部分也变响(比如录音里说话音量忽大忽小),需要的是动态压缩 / dynaudnorm,那是另一种处理(本工具暂不支持,建议桌面版 Audacity)。

能边调边听吗?

手动增益模式可以——左侧播放器接了 Web Audio 实时增益节点,滑块拖动、限幅器开关都即时反映到正在播放的声音里,不用每次点"开始处理"再听响度标准化模式做不到——loudnorm 算法需要先扫整段音频才能算出该加多少 dB,无法实时预览,左侧会自动旁路到原音频,需要点"开始处理"后在结果区试听。处理完成后结果区还有一个独立播放器,可以和原音频对比。

为什么首次处理要下载 ~32MB?

本工具用 ffmpeg.wasm(FFmpeg 的 WebAssembly 移植版)在浏览器沙箱里完成解码-处理-编码,编解码核心约 32MB。首次下载后浏览器缓存,同会话不重复下载、关掉再开通常也命中缓存。所有字节在本地 CPU 跑,不上传服务器。