音频变速 在浏览器本地用 ffmpeg.wasm 调整音频速度,音调保持不变——加速后人声还是原嗓音、音乐还是原调子,不会出现”卡带快进”那种尖锐感。最常见用途:课程加速、慢速听歌词、播客通勤段速通。
| 场景 | 推荐倍速 | 备注 |
|---|---|---|
| 课程加速 | 1.25x – 1.5x | 听清又能省时间,最常用区间 |
| 播客通勤段 | 1.5x – 2x | 主持人语速自然减半,地铁一段路刚好听完 |
| 听书 / 有声小说 | 1.1x – 1.5x | 朗读节奏更舒服 |
| 慢速听歌词 | 0.75x – 0.5x | 听清每个音节,外语学习神器 |
| 快速浏览长录音 | 2x – 3x | 找重点片段,>2x 后失真明显 |
ffmpeg.wasm 在 WebAssembly 沙箱 里运行,音频字节从加载到输出全程不离开浏览器。首次需联网下载约 32MB 编解码核心,缓存后即可断网使用。
不会。本工具用 ffmpeg 的 atempo 滤波器做时间拉伸(time-stretching),只改时长不改音调——加速后说话还是原来的嗓音、音乐还是原来的调子,跟浏览器原生 playbackRate 那种"快进就尖、慢放就低沉"的卡带效果完全不同。这也是听课加速、播客通勤段最适合的处理方式。
能,实时。滑块拖动、预设按钮点击都即时反映在左侧正在播放的声音里——不用每次点"开始处理"再听。注意:左侧实时预览用的是浏览器原生 playbackRate,会同时改变音调(音调随之变化);而点"开始处理"后输出的文件用 ffmpeg atempo 处理,只变速不变调。两者听起来略有差别,最终输出以处理后的文件为准,预览只用来粗略对比节奏感。
内部用 ffmpeg atempo 滤波器,单级支持 0.5–2.0,超出范围本工具自动多级拼接(比如 4x = atempo=2.0,atempo=2.0;0.25x = atempo=0.5,atempo=0.5)。0.25x – 4x 是听感可接受的极限——再慢就糊成噪声、再快就跳音剧烈。常用区间是 0.75x – 2x,>2x 适合"扫一眼"型快速浏览,<0.5x 适合精读外语。
会有相位涂抹——atempo 是基于重叠加窗算法(OLA),大幅变速时会产生轻微的"模糊"和"颗粒感"。0.75x – 1.5x 区间听感几乎无差别;1.5x – 2x 人声仍清晰但乐器混响会糊一些;>2x 或 <0.5x 失真明显,仅适合需要"听个大概"的场景。要更高质量的极端变速,桌面工具(Audacity 的 SoundTouch 或 Adobe Audition 的 Stretch)有更好的算法。
能。滑块步长 0.05x,可以微调到 1.05、1.15、1.85 这种非整数。摘要会显示"当前 1.15x,处理后时长约 X:XX"。点预设按钮(0.5 / 0.75 / 1 / 1.25 / 1.5 / 2 / 3x)一键回到常用倍速。
会有一次重编码损失——ffmpeg 解码 → atempo 处理 → 重新编码,流程不可避免。变速本身的算法损失见上一条。要完全保留处理质量,输入和输出都用 WAV 或 FLAC。MP3 / AAC 输入再输出 MP3 / AAC 时存在二次有损压缩,但听感差异通常很小。
能。本工具接受任何浏览器 <audio> 能读元数据的格式:MP3 / WAV / M4A / AAC / FLAC / OGG / OPUS。WMA / AIFF / ALAC 取决于浏览器版本——新版 Chrome / Edge 多数能读,Safari 对 ALAC 友好。读不出元数据会在 8 秒内提示,不会卡死。
本工具用 ffmpeg.wasm(FFmpeg 的 WebAssembly 移植版)在浏览器沙箱里完成解码-处理-编码,编解码核心约 32MB。首次下载后浏览器缓存,同会话不重复下载、关掉再开通常也命中缓存。所有字节在本地 CPU 跑,不上传服务器。