⭐ 觉得好用?收藏备用,下次直接打开
🎬

音频/视频

视频压缩 / 提取音频 / 音频剪辑 / 格式转换 / 合并分割 / 音量标准化 / 变速 / 淡入淡出 / 字幕

这一组工具覆盖音频视频的常见处理需求:视频压缩、视频提取音频、音频剪辑/合并/分割、音频格式转换、音量调整、变速、淡入淡出、字幕格式转换。

本地处理:所有工具在浏览器内完成。视频/音频字节不离开你的设备——音频/视频用 ffmpeg.wasm(FFmpeg 的 WebAssembly 移植版)解码-编码,编解码核心约 32MB(首次下载后浏览器自动缓存)。这对个人录音、课程素材、播客原始素材、未发布视频尤其重要。

性能预期:1080p 30fps 30 分钟以内的视频在 8GB 内存设备上稳定处理;超长或 4K 视频建议分段处理,或先用桌面 ffmpeg 预压一遍。音频文件体积小,几乎不会触发性能瓶颈。

格式速查:视频统一选 MP4(H.264/AAC)兼容性最好;音频日常听用 MP3AAC,要二次剪辑用 WAV,长期归档用 FLAC。不知道选什么就转 MP4 / MP3。

图片相关工具(压缩、格式转换、抠图、水印、九宫格、证件照二维码)已经独立到 图片分类

🎬
📚 看完整工作流指南:音频/视频处理工作流指南
按真实场景找工具组合,4 大高频音频/视频处理 pipeline 的串联指南(4 条 pipeline)

全部工具(12)

📚 相关教程精选

查看全部 →
微信/抖音/B站/YouTube 视频上传规格完全对照 2026
各平台格式限制、大小上限、分辨率建议一览——上传前对照参数,避免反复转码
2026-05-05
视频压缩三杠杆:先看码率,再看分辨率,最后才动帧率
视频体积不是只靠“压一压”就能解决,真正该先动的是码率;分辨率第二,帧率最容易压过头
2026-05-01
从视频里抽音频:容器与编码的差异、流复制 vs 重编码
MP4 视频里"抽音频"看似简单,但选 MP3 还是 M4A、要不要无损、为什么有时候输出文件比预期大——这些都和"容器与编码的关系"有关;这篇讲清流复制(copy)和重编码(re-encode)的取舍、各容器的音轨格式、什么时候选哪个
2026-05-07
音频格式怎么选:MP3 / WAV / AAC / M4A / FLAC 各有什么用
同一段录音存成 MP3 1MB、WAV 10MB、FLAC 5MB——选错格式可能要么爆体积、要么破音质,要么播放器打不开;这篇讲清五种格式的设计目标、码率上限、容器与编码的差异、有损链式转码的累积失真
2026-05-07
音量调整不是简单"放大":Peak / RMS / LUFS 和平台响度标准
同一段音频在不同平台听起来一边响一边闷,是因为现代流媒体都按 LUFS 自动归一化;这篇讲清峰值 / RMS / LUFS 三个度量、播客 −16 / Spotify −14 / 广播 −23 的来历、放大 6dB 是几倍能量、什么时候要开限幅器
2026-05-07
字幕格式全解:SRT / ASS / VTT / LRC 怎么选,平台兼容踩坑指南
字幕转完播放器不显示、样式丢失、中文乱码——大部分问题来自格式不对或编码错了,这篇讲清四种格式的结构差异和平台矩阵
2026-05-05

❓ 常见问题

音频/视频工具支持哪些格式?为什么我的 MKV 打不开?

最稳的视频输入是 MP4 / MOV / WebM——浏览器原生 <video> 元素能直接读元数据。MKV / AVI / FLV / WMV 等老格式即使扩展名对,也常因为浏览器读不出元数据而失败,工具会在 8 秒内识别失败并提示,不会卡死。若必须处理这些格式,先用 HandBrake、剪映等桌面工具转成 MP4 再来。视频压缩 输出统一为 MP4(H.264/AAC),兼容所有浏览器、手机、剪辑软件和社交平台。音频侧 MP3 / WAV / AAC / M4A / FLAC / OGG 都直读。

音频/视频处理也是本地的吗?为什么首次要下载 ~32MB?

全部本地。音频/视频工具用 ffmpeg.wasm(FFmpeg 的 WebAssembly 移植版)在浏览器沙箱里直接解码-编码,编解码核心约 32MB,首次使用下载一次后浏览器自动缓存,同会话不重复下载,关掉再打开通常也命中缓存。所有处理在本地 CPU 跑,字节不上传服务器。代价是处理时占 CPU,500MB+ 大文件可能让风扇高转、电池快放,建议接电源处理。

视频压缩 vs 视频提取音频 怎么选?

只想要更小的视频文件视频压缩,调码率/分辨率/帧率,输出还是视频(MP4),可保留或移除音轨。只要声音、不要画面(课程录音、播客、留 BGM、做铃声)→ 视频提取音频,输出 MP3 / WAV / AAC 纯音频文件,体积是视频的 1/10–1/20,还能指定时间段截取。两者都用 ffmpeg.wasm,处理速度看视频时长和电脑性能。

MP3 / WAV / AAC / M4A / FLAC 怎么选?

按目的选。日常听、要小体积 → MP3(128–192kbps 够听,所有设备兼容)或 AAC / M4A(同码率比 MP3 略好,iOS/苹果生态原生)。要保留二次剪辑、混音 → WAV(无损 PCM,体积大但任何 DAW 都能精确切)。要长期归档、追求无损但又比 WAV 省空间 → FLAC(无损压缩,约 WAV 一半体积)。详见 音频格式怎么选

音量调整为什么有 Peak / RMS / LUFS 三种?

Peak(峰值) 看的是瞬间最大幅度,防止"爆音"(削波)必看;RMS(均方根) 是一段时间内的平均能量,反映"听感响度";LUFS(响度单位) 是带 K 权重滤波后的综合响度,所有现代流媒体平台用这个做响度标准化。普通用途调音量看 Peak(不爆即可);要发 YouTube / Spotify / 播客平台一定要看 LUFS——音量调整 内置 LUFS 标准化目标值(-14 / -16 / -23 LUFS)一键达标。

音频合并/分割能"无损"吗?

同格式同参数才能无损——concat demuxer 直接拼接码流不需要重编码(毫秒级完成、零质量损失)。只要源文件之间采样率、声道数、码率、编码器版本任一不同,就必须走 filter_complex 重编码,会有一次有损过程。本站 音频合并 会自动检测:参数一致直接 concat;不一致先统一到目标参数再 concat,并明确提示一次。

字幕 SRT / ASS / VTT / LRC 区别?

字幕在不同播放器/平台的容器要求不同:本地播放器、社交视频用 SRT(最通用、纯文本);做特效字幕(弹幕底色、字体特效、卡拉 OK 染色)必须 ASS;网页 <video> 嵌入用 VTT(HTML5 原生支持);歌词同步用 LRC(音乐播放器专用)。字幕格式转换 互转并自动修复 GBK / Big5 乱码、清样式标签。

想找图片处理工具?

图片相关(压缩、格式转换、抠图、水印、九宫格、证件照、二维码)见 图片分类——图片用 Canvas / jSquash / AI 抠图,和音频/视频的 ffmpeg.wasm 是两套技术栈。