PDF 对比工具 把两份 PDF 逐页渲染为图像,按像素比对并用红色高亮差异区域。所有处理在浏览器本地完成,文件不上传——这对合同、设计稿、内部文档这类敏感场景很关键,市面上多数在线 PDF 对比工具都需要上传到云端处理。
| 对比方式 | 能发现什么 | 不适合 |
|---|---|---|
| 像素对比(本工具) | 文字、字体、颜色、位置、图片任何视觉变化 | 想知道”具体改了哪个字” |
| 文字流对比 | 词级别的精确改动 | 排版调整、图片替换 |
| PDF 结构对比 | 对象级别的元数据变化 | 视觉无关的合并/优化 |
视觉对比的强项是 “看到差异” 而不是”理解差异”——它告诉你”这块红框里有改动”,由你自己判断改了什么。
每页给出三种状态徽章:
顶部”仅看差异页”开关可隐藏所有相同页,方便快速定位变更——长合同改版尤其好用。
像素对比直接比图像,能发现任何视觉差异——文字改动、字体替换、颜色变化、元素移位、图片替换都能看出来;缺点是字体渲染的微小亚像素差异也可能被判为"差异"。文字对比只比文本流,能精准告诉你"X 词改成 Y",但完全无视排版/图片/颜色变化。本工具是像素对比,适合"我想看视觉上有没有变",不适合"我想知道具体哪个字改了"。
多半是字体渲染噪点。PDF 渲染到 canvas 时,子像素抗锯齿会让相邻像素值差几个单位。本工具已做两层防御:(1) 阈值过滤掉小差异;(2) 差异占比 <0.05% 直接判"相同"。如果仍误报,把敏感度调到"低"即可。注意:扫描件即使来源同一张纸,每次扫描的微小角度/曝光差异都会真实存在像素级差异。
自动按 A 的画布尺寸缩放 B,再做像素比对。注意:这意味着如果 A 是 A4、B 是 Letter(较短较宽),比对结果会有"边缘整圈差异"——这是缩放导致的几何错位,不是真实改动。这种情况建议先用"PDF 页面编辑"统一页面尺寸再对比,或心里把边缘那圈红色忽略掉。
按最大页数展示。前面共有的页正常对比;A 多出来的页标"A 独有"、B 多出来的页标"B 独有",都按"差异页"计入统计。这个能直接看出"对方插入/删除了哪几页",常见于合同补充条款或报告新增章节场景。
实测 30 页以内 2× 清晰度无压力。当前实现是全部页一次性渲染,超过 50 页或选 3× 清晰度会占用较多浏览器内存(每页 RGBA 数据约 6-20MB)。如果对比的是大文件,建议先用"PDF 拆分"截取要对比的章节范围。文件全程在浏览器内存处理,不上传服务器。
默认"中"适合 95% 场景。"低"适合扫描件、不同打印机输出、不同 PDF 引擎生成的文档(容差大、噪点少);"高"适合"想抓出极细微改动"的场景,比如同一软件导出的两版设计稿,能看出 1-2 像素的位移。三档对应的阈值分别是 60 / 35 / 18(RGB 单通道最大差)。