⭐ 觉得好用？收藏备用，下次直接打开

🎧

播客后期：剪辑/合并/响度标准化

Q: 播客 LUFS 到底该用 -14 还是 -16？

按发布平台选。Apple Podcasts: -16 LUFS（官方推荐，2019 起强制响度标准化，源 LUFS 高于 -16 会被压低）。Spotify Podcast: -16 LUFS（与 Apple 一致）。YouTube 视频含音频: -14 LUFS（音乐类平台标准更响）。广播 EBU R128 标准: -23 LUFS（电视广播专用）。播客主流走 -16 LUFS 通用——发 Apple / Spotify / 喜马拉雅都没问题。

Q: 嘉宾用手机录的音和主播用专业麦克风的音怎么合并？

两者响度 / 频响 / 噪声底差异极大——直接合并听感非常分裂。修正流程：(1) 先分别 LUFS 标准化每段到 -16 LUFS（音量调整），让听感响度对齐；(2) 嘉宾段如果有明显环境噪声，单独做降噪后再合并（本站暂无在线降噪工具，可用桌面 Audacity 的 Noise Reduction）；(3) 频响差异严重时（手机录音偏闷）可以在桌面 DAW 加均衡器，本站工具不覆盖。

Q: 长录音怎么找口误位置剪辑？

3 个方法：(1) 录制时遇到口误当场拍手 3 下——后期看波形拍手是 3 个尖峰，肉眼可见，剪掉之前的口误段；(2) 录制时用一个 IDE-like 实时转录工具（如飞书会议自动转录、Whisper 实时），后期对照文字找位置；(3) 音频剪辑 工具支持 0.5x – 2x 试听，2x 快听一遍找疑点。专业做法是配合桌面 Audacity / Reaper，本站工具适合中小工作量。

Q: 合并后总时长不对怎么办？

常见 2 个原因：(1) 某些 MP3 文件头尾含 LAME 编码器静音 padding（约 0.04 秒/段），合并 10 段就累计 0.4 秒——concat demuxer 会保留这些 padding。解法：合并前用 音频格式转换 重编码到 AAC（去掉 MP3 padding）。(2) 某些片段是 VBR（变码率）且时长元数据不准——重编码到 CBR 或 AAC 即修复。

Q: 可以用本站做实时直播录制吗？

不能——本站所有工具是后期处理工具，不做实时录制 / 直播推流。录制建议：用 OBS Studio（免费、开源、跨平台）录制；多人远程录制用 Zoom / 飞书会议 / Riverside（专业播客录制平台），本地保存原始音轨后再到本站做后期。典型链路：OBS / Zoom 录原始 → 本站 音频合并 + 音量调整 + 音频淡入淡出 → 发布到 Apple Podcasts。

多段素材 → 拼接 → 删卡顿口误 → LUFS 标准化 → 淡入淡出收尾：单集播客的浏览器后期流程

📅 发布于 2026-05-16

播客后期看起来复杂——其实就是”拼 → 剪 → 调 → 淡”四步，每步对应一个工具。重点是顺序不能乱：先合并再剪辑、剪辑完才做 LUFS、最后才加淡入淡出。

为什么这个顺序：合并要走流复制必须先一次做完；剪辑切口需要看完整时间轴；LUFS 是基于整段平均能量计算，分段做会算错；淡入淡出是最后的”润色”。

本地处理：所有工具用 ffmpeg.wasm + Web Audio API，30–60 分钟单集音频处理在 8GB 内存设备稳定。素材字节不离开你的设备——对未发布素材、嘉宾隐私尤其重要。

🛠 工具链（4 步）

1 🔗 音频合并

把多段录音（开场白、主体、片尾、广告）按顺序无缝拼接为一个文件。**关键**：所有片段先统一到同一采样率/声道/编码格式，否则会触发重编码（有损）。

💡 同格式同参数走 concat demuxer 流复制无损 + 毫秒级；不一致先用 [音频格式转换](/tools/audio-convert/) 统一到目标参数（如 48kHz / 立体声 / AAC 192kbps）。详见 [音频合并的格式统一策略](/tutorials/audio-merge-format-unify-and-gap-strategy/)。
2 ✂️ 音频剪辑可选

切掉卡顿、口误、广告插入位置。用波形定位静音段和重音段，按毫秒精确切。

💡 长录音建议先合并再剪——可以跨片段统一时间轴。切口在静音段 50–100ms 处最自然；硬切在响亮元音会有 click 杂音。
3 🔊 音量调整

LUFS 标准化是发布到播客平台的硬性要求——**Apple Podcasts / Spotify Podcast 推荐 -16 LUFS**（YouTube 视频是 -14 LUFS，广播是 -23 LUFS）。

💡 不要用 Peak / RMS 标准化做播客——平台都按 LUFS 衡量响度，源文件 LUFS 不达标会被算法二次调整、听感被搞乱。详见 [Peak/RMS/LUFS 区别和平台标准](/tutorials/audio-volume-peak-rms-lufs-and-platforms/)。
4 🌅 音频淡入淡出可选

头淡入 1–2 秒避免突兀开场，尾淡出 2–3 秒自然收尾——对单集首尾几乎是必备。

💡 中间过场不要乱加淡入淡出，听感会很奇怪。详见 [淡入淡出时长怎么选](/tutorials/audio-fade-duration-curve-and-click-prevention/)。

👤 适合谁用

单人播客 需要把多段录音拼成完整一集
双人对谈 嘉宾轨与主播轨录制后合并
视频会议录音 转单集播客发布
广播节目 老节目重发要做 LUFS 适配 Apple Podcasts
有声书 章节合并 + 响度标准化 + 章节首尾淡入淡出
课程音频 多段课程拼成完整一节 + LUFS 适配
广告插播 把广告音频拼到主体音频指定位置

⚠️ 顺序与踩坑

合并前必须统一采样率/声道

把 44.1kHz 单声道开场白 + 48kHz 立体声主体 + 22kHz 单声道片尾直接合并 → 听感断层（不同片段音色/响度差异明显）+ 工具被迫重编码全部片段（有损）。正确：先用音频格式转换把所有片段统一到 48kHz / 立体声 / AAC 192kbps 或 WAV 24bit（播客标准），再合并走流复制无损。一次设好以后所有素材都按这个录。

LUFS 不是简单"调大音量"

LUFS 标准化不是把音量整体加 X dB——它是按 K 权重滤波算出听感响度后做动态调整：响亮段降一些、安静段提一些，让整体平均响度精确到目标值。直接用 Peak/RMS 提升音量会把高峰拉到爆音线（削波 → 失真），LUFS 标准化内置 True Peak 限幅器自动保护。本站音量调整选 LUFS 模式 → 输入目标值（-16 / -14 / -23）一键达成。

不要在每段中间加淡入淡出

淡入淡出只用在整体首尾。如果你 audio-merge 合并 5 段，每段加 1 秒淡入 + 1 秒淡出，最终听感是"5 次起伏"——像电台 BGM 切换。正确做法：合并时所有片段无淡入淡出原样拼接，最终成品再在头尾各加一次 1–2 秒淡入淡出。中间过渡如果不自然，是片段衔接处响度差异问题，应该用响度匹配（合并前 LUFS 标准化每段）解决，不是用淡入淡出遮盖。

单集时长别超 1 小时再做整体处理

播客单集 30–60 分钟是常规；超过 1 小时本地浏览器处理可能慢（ffmpeg.wasm 单线程跑长 PCM）。实操：单集 1.5 小时以上先按章节切（音频分割按时长 / 按时间点），每章节独立做剪辑 + LUFS，最后合并——速度比"整段处理"快 2–3 倍。每段并行可以同时开多个标签页跑。

发布前一定 listen-through 完整跑一遍

所有处理跑完后用耳机+音箱都听一遍完整版——LUFS 标准化偶尔会把某些极弱的段（如思考停顿、嘉宾远离麦克风）拉得太大（噪声底响起来）。这是算法工作机制，没法完全避免。修正：找到这些段单独用音频剪辑切掉 / 替换为静音 / 重新录制；或者整集重做 LUFS（取消标准化、用更保守的 -18 LUFS 目标）。

同样是淡入淡出，10ms 和 3s 是两种完全不同用途——前者是消除 click 爆音的工程手段，后者是营造情绪的艺术手法。这篇拆解 afade 的工作原理、为什么线性曲线听起来不自然、不同时长对应什么场景、什么时候根本不需要淡入淡出。

2026-05-11

音频合并：拼接前必须统一采样率/声道，concat demuxer vs filter 怎么选

直接把多个 MP3 拼起来失败、拼起来后第二段开始变成噪声、段间衔接太突兀——这些都是因为采样率 / 声道 / 编码不一致；这篇讲清 ffmpeg 两种拼接方式、为什么本工具自动重采样、段间静音 / 交叉淡化的取舍

2026-05-07

音频剪辑：精确裁切的帧对齐、起点 click 和淡入淡出衔接

把一段录音的开头结尾杂音剪掉，看似简单——但 MP3 / AAC 是帧编码，切点不一定能精确到样本，起点没做淡入会有 click 声；这篇讲清流复制 vs 重编码的精度差异、为什么裁完开头会"啪"一声、什么时候配合淡入淡出工具、和"分割"工具的区别

2026-05-07

音量调整不是简单"放大"：Peak / RMS / LUFS 和平台响度标准

同一段音频在不同平台听起来一边响一边闷，是因为现代流媒体都按 LUFS 自动归一化；这篇讲清峰值 / RMS / LUFS 三个度量、播客 −16 / Spotify −14 / 广播 −23 的来历、放大 6dB 是几倍能量、什么时候要开限幅器

2026-05-07

❓ 常见问题

播客 LUFS 到底该用 -14 还是 -16？

按发布平台选。Apple Podcasts: -16 LUFS（官方推荐，2019 起强制响度标准化，源 LUFS 高于 -16 会被压低）。Spotify Podcast: -16 LUFS（与 Apple 一致）。YouTube 视频含音频: -14 LUFS（音乐类平台标准更响）。广播 EBU R128 标准: -23 LUFS（电视广播专用）。播客主流走 -16 LUFS 通用——发 Apple / Spotify / 喜马拉雅都没问题。

嘉宾用手机录的音和主播用专业麦克风的音怎么合并？

两者响度 / 频响 / 噪声底差异极大——直接合并听感非常分裂。修正流程：(1) 先分别 LUFS 标准化每段到 -16 LUFS（音量调整），让听感响度对齐；(2) 嘉宾段如果有明显环境噪声，单独做降噪后再合并（本站暂无在线降噪工具，可用桌面 Audacity 的 Noise Reduction）；(3) 频响差异严重时（手机录音偏闷）可以在桌面 DAW 加均衡器，本站工具不覆盖。

长录音怎么找口误位置剪辑？

3 个方法：(1) 录制时遇到口误当场拍手 3 下——后期看波形拍手是 3 个尖峰，肉眼可见，剪掉之前的口误段；(2) 录制时用一个 IDE-like 实时转录工具（如飞书会议自动转录、Whisper 实时），后期对照文字找位置；(3) 音频剪辑工具支持 0.5x – 2x 试听，2x 快听一遍找疑点。专业做法是配合桌面 Audacity / Reaper，本站工具适合中小工作量。

合并后总时长不对怎么办？

常见 2 个原因：(1) 某些 MP3 文件头尾含 LAME 编码器静音 padding（约 0.04 秒/段），合并 10 段就累计 0.4 秒——concat demuxer 会保留这些 padding。解法：合并前用音频格式转换重编码到 AAC（去掉 MP3 padding）。(2) 某些片段是 VBR（变码率）且时长元数据不准——重编码到 CBR 或 AAC 即修复。

可以用本站做实时直播录制吗？

不能——本站所有工具是后期处理工具，不做实时录制 / 直播推流。录制建议：用 OBS Studio（免费、开源、跨平台）录制；多人远程录制用 Zoom / 飞书会议 / Riverside（专业播客录制平台），本地保存原始音轨后再到本站做后期。典型链路：OBS / Zoom 录原始 → 本站音频合并 + 音量调整 + 音频淡入淡出 → 发布到 Apple Podcasts。

🛠 工具链（4 步）

👤 适合谁用

⚠️ 顺序与踩坑

📚 相关教程精选

❓ 常见问题