PDF 真的"可编辑"吗？矢量页可改、扫描页只能盖图层的本质区别

Q: 为什么我下载的合同 PDF，用 PDF 编辑器改一个字会变成奇怪的字体？

字体没嵌入或者编辑器找不到原字体。PDF 编辑文字的本质：(1) 编辑器读取你点击的位置的"文本对象"——含字体、字号、坐标；(2) 你删除或修改字符；(3) 编辑器需要用相同字体重新渲染。问题：原 PDF 里只嵌入了"已用到的字符子集"（subset），你新输入的字符可能不在子集里，编辑器只好用替代字体。解决：(1) 用 Adobe Acrobat（最强字体处理）；(2) 编辑前在 Acrobat "属性 → 字体" 检查字体是否完整嵌入；(3) 如果只嵌入了子集，在 Acrobat "选项 → 编辑文字" 时勾选"允许添加新字符"——但中文 PDF 这一步经常失败；(4) 彻底解决：用 Word 打开原 .docx 改完重新导出 PDF，比直接编辑稳得多。

Q: 扫描的 PDF 能改文字吗？看起来工具里能编辑啊

严格说不能"改"，只能"盖"。扫描 PDF 的"文字"本质是图像里的像素——没有文本对象可以编辑。所谓的"编辑"操作：(1) 用白色矩形盖住原来的文字；(2) 在白色矩形上打新文字（这个新文字是真正的文本对象）。视觉效果：(1) 局部看起来字改了；(2) 仔细看会发现：背景颜色、字体、字号与原文不一致；(3) 打印出来会有"补丁"痕迹。OCR 辅助：先 OCR 把图像转成可识别文字层，叠加在图像上——视觉上仍是图，但 PDF 阅读器可以选中文字。OCR 后的"文字层"可以编辑，但编辑后图像不变——视觉上仍是原扫描图，搜索时找到的是 OCR 文字层。实务：扫描 PDF 改字几乎都是"作弊"，重要文档（合同、证件）别这么做——任何扫描鉴定都能识别。

Q: PDF 旋转 / 删页 / 重排页面这些"页面级"操作，会改变内容质量吗？

几乎不会，本质是元数据修改。PDF 是按页存储的——每一页是一个"对象树"，旋转 / 删除 / 重排只是改了"页面索引"或"页面属性"，不重新编码内容。性能优秀的操作：(1) 删除页面 —— 删除 PDF 内对应页面对象，文件变小；(2) 旋转页面 —— 修改页面 /Rotate 属性（0/90/180/270），内容像素不动；(3) 重排页面 —— 修改 PDF 内"页面顺序数组"；(4) 提取页面 —— 复制页面对象到新 PDF。有损操作：(1) 合并 PDF 时如果工具重新编码 → 可能压缩；(2) 加水印 / 注释 → 给页面对象加新内容（但原内容不变）；(3) "另存为" 而不是"保存" → 工具可能重新生成整个文件。实务：用 pdftk / qpdf / Adobe Acrobat 做页面级操作完全无损；用 Preview 等"另存"操作可能小幅压缩。

Q: PDF 加密了能编辑吗？解密的边界在哪？

两种加密两种处理。PDF 有两种密码：(1) 打开密码——没密码连看都看不了；(2) 权限密码（owner password）——能打开但限制操作（不能复制、不能打印、不能编辑）。打开密码：必须知道密码才能解密——破解需要暴力穷举或字典攻击，强密码（10+ 位含特殊字符）实际不可破。权限密码：技术上限制可以绕过——多数 PDF 编辑器（Foxit / WPS / 国产工具）都能识别"已加密但能打开"，提供"忽略权限限制" 或"另存为去除限制"。法律边界：(1) 自己加密的 PDF 忘了密码——技术处理可接受；(2) 他人发给你的 PDF 含权限密码（如电子发票限打印）—— 绕过可能违法；(3) 商业 / 版权材料带 DRM——绕过几乎肯定违法。实务：编辑前先看 Acrobat "属性 → 安全性" 显示加密状态——如果是"无加密" 直接编辑；"用户密码" 需要输入；"权限密码" 看是否合法绕过。

Q: PDF 表单（filled form）和普通 PDF 编辑区别是什么？

表单是 PDF 内置功能，无需 Acrobat 也能填。PDF 表单（AcroForm 或 XFA）—— 创建 PDF 时设计了"输入框"，对应位置可以填字、勾选、签名。填写流程：(1) 用 Adobe Reader / 浏览器内置 PDF 阅读器 / 多数 PDF 工具打开 → 看到输入框点击即可输入；(2) 保存 PDF → 输入内容固化或可继续修改（看创建者设置）。与"PDF 编辑"区别：(1) 表单：在预设输入框里填内容，不改其他位置——非常稳；(2) 编辑：尝试修改任意文字，需要字体支持，容易破坏排版。不能填的常见原因：(1) PDF 不是表单，而是普通 PDF——只能用 PDF 编辑器在指定位置加文字；(2) XFA 表单（XML based）—— 只有 Adobe Reader / Acrobat 完美支持，浏览器和其他工具不支持。实务：合同 / 申请表的 PDF，先看是不是表单（点击应该有输入框）—— 是 → 直接填；不是 → 找原 .docx 让对方填。

Q: PDF 拆分大文件、合并多个 PDF，最好的工具是什么？

优先级。专业级（推荐）：(1) pdftk 命令行——拆分 / 合并 / 加密 / 解密一站式，无损；(2) qpdf 命令行——更现代，支持加密 / 线性化；(3) Adobe Acrobat 桌面——所有操作 GUI 化；(4) PDF24 桌面（免费 GUI）——拆合 OK，但批量处理慢。轻量级：(1) macOS Preview——拖拽缩略图实现拆合，简单但可能小压缩；(2) 浏览器内置工具——多数浏览器只能预览不能拆合。在线工具（注意隐私）：iLovePDF / SmallPDF / PDF24 在线版——上传到对方服务器处理，敏感文档不要用。命令行示例：pdftk input.pdf cat 1-5 output part1.pdf（提取 1-5 页）、pdftk a.pdf b.pdf cat output merged.pdf（合并）。实务：(1) 合同 / 财务 / 证件 → 本地工具（pdftk / Acrobat）；(2) 个人非敏感 → 在线工具方便；(3) 大量批处理 → 写脚本调用 pdftk / qpdf。

Q: PDF 缩略图 / 大纲 / 书签是什么？怎么改？

三种导航元数据。缩略图——点开 PDF 阅读器侧边栏看到的页面预览，PDF 创建时可以选择嵌入或不嵌入（嵌入会增加体积）。大纲（outline）/ 书签——可点击的目录树，点击跳转到对应页面 + 位置。注释 / 高亮——批注、便笺、高亮、下划线等。修改方式：(1) 缩略图——通常自动生成，无需手动改；(2) 书签——Acrobat 侧边栏"书签" 面板可以增删改；用 Word 导出 PDF 时勾选"将标题转为书签"自动生成；(3) 注释——任何 PDF 阅读器都能加，注释保存在 PDF 里。陷阱：(1) 用 macOS Preview 加书签经常丢失（导出格式兼容问题）；(2) 多个 PDF 合并后书签可能错乱——pdftk / Acrobat 合并时建议手动重新整理；(3) 加密 PDF 的书签可能无法编辑——先解密再改。

Q: 修改 PDF 后文件变大很多，正常吗？

多数情况是工具重新编码导致的。原 PDF 用了高压缩（如 JPEG2000 / JBIG2 / 字体子集）——编辑工具不一定支持这些算法，保存时降级为通用编码（DEFLATE / DCT），体积膨胀。典型涨幅：(1) 矢量文字 PDF 改个字 → 原 100KB 改后 200KB（字体重新嵌入）；(2) 扫描 PDF 加水印 → 原 5MB 改后 8MB（图像重新编码）；(3) 重排页面 → 几乎不变（pdftk）或小幅增加（重新生成 xref）。优化：(1) 编辑后用 PDF 压缩工具二次处理；(2) 用 qpdf --linearize 优化结构（不损质量）；(3) Adobe Acrobat 的"减小文件大小" / "PDF 优化器"；(4) 命令行 gs -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook 重压缩到合理体积。陷阱：(1) 加密 PDF 编辑后必须重新加密——可能体积变化大；(2) 多次编辑 + 保存 → 每次叠加修改记录，文件持续增长，建议偶尔"另存为新文件"清理。

2026-04-26 · 约 7 分钟 📝 PDF 页面编辑

PDF 是个奇怪的格式——它叫 “Portable Document Format”，但很多人误以为它是”可编辑文档”。实际上 PDF 的设计目标就是最终展示格式——保证”我看到的就是你看到的”，不是为了再编辑。所以 PDF 编辑总是带着各种限制和坑。

PDF 内容的两种本质

矢量 PDF（Word 导出 / LaTeX / Adobe InDesign 等创建）
  ↓
内容由"对象"组成：
  - 文本对象（字符 + 字体 + 坐标）
  - 矢量图形（路径、填充、描边）
  - 嵌入图像（JPEG / PNG）
  - 字体（Type1 / TrueType / CFF）
  ↓
理论上可以"逐对象编辑"


扫描 PDF（拍照 / 扫描仪 / 手机扫描 App 创建）
  ↓
内容本质是一张张图片包装在 PDF 容器里：
  - 整页 = 1 张大图（JPEG / JPEG2000 编码）
  - 没有文本对象
  - 没有矢量元素
  ↓
"编辑"只能：
  - 在图层上盖新内容
  - 旋转 / 删除整页（页面级操作）

判断方法：

鼠标能选中文字吗？能 → 矢量；不能 → 扫描
放大 400% 锐利吗？锐利 → 矢量；糊 → 扫描
文件大小？百 KB 级 → 矢量；MB 级 → 扫描

”编辑”分四个层级，难度递增

层级	操作	难度	矢量 PDF	扫描 PDF
1. 页面级	旋转、删除、重排、提取	★	✓ 完美	✓ 完美
2. 注释级	高亮、批注、签名、加图章	★★	✓ 完美	✓ 完美
3. 表单级	填写预设的输入框	★★	✓（如果是表单）	✗（除非 OCR + 表单化）
4. 内容级	修改文字、移动元素、改图	★★★★	△ 看字体	✗ 几乎不可能

绝大多数”PDF 编辑”需求都在 1-3 级——这些操作很可靠。第 4 级”修改文字”才是各种坑的来源。

页面级编辑：最稳的操作

典型工具：

工具	平台	类型	备注
pdftk	命令行	免费	老牌、稳定，但不维护了
qpdf	命令行	免费	pdftk 现代替代品
Adobe Acrobat	Win/Mac	付费	全功能
PDF24	Win/在线	免费	桌面版无水印
Preview	macOS	系统内置	拖拽缩略图操作

命令示例（pdftk）：

# 提取 1-5 页
pdftk input.pdf cat 1-5 output part1.pdf

# 删除第 3 页
pdftk input.pdf cat 1-2 4-end output result.pdf

# 反转页面顺序
pdftk input.pdf cat end-1 output reversed.pdf

# 旋转所有页面 90 度（顺时针）
pdftk input.pdf cat 1-endeast output rotated.pdf

# 合并多个 PDF
pdftk a.pdf b.pdf c.pdf cat output merged.pdf

# 拆分每页一个文件
pdftk input.pdf burst output page_%02d.pdf

qpdf 等价命令：

qpdf --pages input.pdf 1-5 -- output.pdf       # 提取页面
qpdf --rotate=+90:1-3 input.pdf output.pdf     # 旋转 1-3 页
qpdf --empty --pages a.pdf b.pdf -- merged.pdf # 合并

这些操作几乎无损——只改 xref 索引和页面属性，不重新编码内容。

注释级编辑：在 PDF 上”贴东西”

PDF 注释（annotation）是单独的对象层，叠加在原内容上：

高亮、下划线、删除线
文字框、便笺
图章、签名
形状（矩形 / 圆形 / 线条）
附件（嵌入文件）

特点：

不修改原内容，可随时删除
多人协作场景下注释保留作者 / 时间
“扁平化”操作可以把注释合并到内容（不可撤销）
加密的 PDF 可能限制注释（看权限密码设置）

典型工具：所有主流 PDF 阅读器都支持基本注释（Adobe Reader / 浏览器 / Preview / Foxit）。

陷阱：

在浏览器内 PDF 阅读器加注释，下载时可能丢失——浏览器 PDF 阅读器多数只能预览不能保存修改
印章 / 签名通常以图片形式嵌入，分辨率低 → 打印模糊
跨工具注释兼容性参差 — Foxit 加的注释 Acrobat 能看，反之亦然，但小众工具可能丢

表单填写：最舒服的”编辑”

PDF 表单（AcroForm）是创建者预设的可填写字段：

文本输入框
复选框 / 单选框
下拉菜单
签名字段

判断方法：打开 PDF，鼠标移到空白区域——鼠标变成 I-beam 输入光标就是表单字段。

填写流程：

任何 PDF 阅读器（Adobe Reader / Foxit / Preview / 浏览器）打开
点击字段 → 输入
保存（Ctrl+S）→ 内容固化或可继续修改（看创建者设置）

XFA 表单的特殊问题：

XFA = XML Forms Architecture（Adobe 早期推的复杂表单技术）
现在被弃用，但很多旧政府表单仍是 XFA
只有 Adobe Reader / Acrobat 能完美打开——浏览器、Preview、Foxit 多数显示不全或无法填写
解决：装 Adobe Reader 桌面版（免费）

内容级编辑：最容易踩坑

矢量 PDF 改文字——理论可行，实际看运气：

正常流程：
1. 编辑器读取你点击位置的文本对象
2. 你删除原字符 / 输入新字符
3. 编辑器用相同字体重新渲染

常见失败点：
- 字体未嵌入 → 用替代字体 → 视觉差异明显
- 字体只嵌入子集 → 你输入的新字符不在子集 → 缺字
- 段落布局自动重排 → 后续段落位移
- 跨页文本框 → 改一处影响后续页
- 中文 / 日韩字体特别脆弱

Adobe Acrobat 的”编辑文字”功能最强，但仍可能：

修改后字体微调，原本规整的对齐被破坏
列表 / 编号 / 表格的内部锚点错乱
中文 PDF 编辑后字距异常

最佳实践：

优先找原 .docx / .pptx 修改后重新导出
必须直接编辑 PDF → 用 Adobe Acrobat（不是其他工具）
改完仔细对比修改前后的视觉
重要文档（合同 / 法律文书）→ 改完让对方重新签字盖章

扫描 PDF 改文字——本质是”作弊”：

扫描 PDF 没有文本对象 → 只能盖图层

操作流程：
1. 用白色矩形 / 与背景同色矩形盖住原文字
2. 在矩形上加新文字
3. 保存

视觉问题：
- 字体几乎不可能与扫描的原字体一致
- 颜色、字号、字距对不上
- 打印 / 放大看会发现"补丁"
- 任何鉴定能看出修改痕迹

警告：扫描 PDF 改字几乎都是合同 / 证件造假场景。法律风险大于技术好奇。

OCR：扫描 PDF 的”半可编辑”路径

OCR（光学字符识别）能把扫描 PDF 的图像转成带文字层的 PDF：

视觉上仍是原扫描图
鼠标选中能选到 OCR 识别的文字
全文搜索能找到文字
但编辑文字层不会改变图像

典型流程：

用 Adobe Acrobat / ABBYY FineReader / Tesseract 对扫描 PDF 跑 OCR
输出带文字层的 PDF
用 PDF 阅读器选中文字、复制、搜索

OCR 后能”编辑”吗：

修改 OCR 文字层不会改变图像 → 看不到变化
必须用扫描 PDF 编辑器（盖图层模式）才能视觉上改字
OCR 主要用途是搜索 / 复制，不是修改

加密 PDF：能不能编辑

PDF 有两种密码：

类型	作用	破解难度
打开密码（user password）	没密码打不开	强密码不可破
权限密码（owner password）	能开但限制操作	多数工具可绕过

权限密码限制的操作：

不能复制内容
不能打印（或低分辨率打印）
不能编辑
不能加注释
不能填表

绕过权限密码：

用 Foxit / WPS / 部分国产 PDF 工具——多数能识别”虽加密但允许打开”，自动忽略权限限制
命令行 qpdf --decrypt input.pdf output.pdf —— 直接去除密码
Adobe Acrobat 显式要求 owner password 才能去除限制

法律边界：

自己加密忘了密码 → 处理无问题
他人发的 PDF 带权限密码（电子发票、政府文件）→ 绕过可能违反规定
商业版权材料 + DRM → 几乎肯定违法
工作场景前问清楚是否合规

文件膨胀：编辑后体积变大

原因和量级：

操作	体积变化	原因
删除页	略微减小	减少了页面对象
旋转	几乎不变	只改属性
重排页	几乎不变	只改索引
合并 PDF	累加	多文件相加
加水印 / 注释	略增（KB 级）	加了对象
改文字	中（10-50% 增）	字体重新嵌入
加密 / 解密	几乎不变	改算法但内容不变
另存为	可能变大	工具重新编码
多次编辑后	累积增长	修改历史叠加

优化：

# qpdf 重新结构化（不损质量）
qpdf --linearize input.pdf output.pdf

# Ghostscript 重压（轻度）
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 \
   -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH \
   -sOutputFile=out.pdf in.pdf

# Adobe Acrobat：文件 → 减小文件大小

实务决策树

我要"编辑" PDF，怎么做？

├─ 是页面级操作（旋转 / 删页 / 重排）？
│  └─ 用 Preview / pdftk / qpdf — 完美
│
├─ 是注释 / 签名 / 高亮？
│  └─ 任何 PDF 阅读器都行
│
├─ 是填表？
│  ├─ AcroForm → Adobe Reader / 浏览器都可以
│  └─ XFA → 必须 Adobe Reader
│
├─ 是改文字？
│  ├─ 矢量 PDF → 优先找原 .docx，否则 Adobe Acrobat
│  ├─ 扫描 PDF → 慎重（合同 / 证件别改）
│  └─ 只是搜索 → 跑 OCR 就够，不用改
│
└─ 是合并 / 拆分？
   ├─ 本地敏感 → pdftk / qpdf / Acrobat
   └─ 非敏感 → 在线工具方便

实战清单

✅ 必做：

编辑前判断是矢量还是扫描
重要 PDF 编辑前先备份
改文字优先找原文档
用 Adobe Acrobat 处理矢量 PDF 文字
页面级操作用 pdftk / qpdf 命令行（最稳）

❌ 避免：

用在线工具处理敏感 PDF
扫描合同改字（法律 / 道德双重风险）
多次”另存为”导致文件臃肿
用浏览器 PDF 阅读器期望保存修改
强行编辑加密 PDF（先合规去除密码）

PDF 编辑的真相是——PDF 不是为编辑设计的。能不编辑就别编辑，必须编辑就用最专业的工具，最重要的：找回原文档总是比编辑 PDF 稳。

❓ 常见问题

为什么我下载的合同 PDF，用 PDF 编辑器改一个字会变成奇怪的字体？

字体没嵌入或者编辑器找不到原字体。PDF 编辑文字的本质：(1) 编辑器读取你点击的位置的"文本对象"——含字体、字号、坐标；(2) 你删除或修改字符；(3) 编辑器需要用相同字体重新渲染。问题：原 PDF 里只嵌入了"已用到的字符子集"（subset），你新输入的字符可能不在子集里，编辑器只好用替代字体。解决：(1) 用 Adobe Acrobat（最强字体处理）；(2) 编辑前在 Acrobat "属性 → 字体" 检查字体是否完整嵌入；(3) 如果只嵌入了子集，在 Acrobat "选项 → 编辑文字" 时勾选"允许添加新字符"——但中文 PDF 这一步经常失败；(4) 彻底解决：用 Word 打开原 .docx 改完重新导出 PDF，比直接编辑稳得多。

扫描的 PDF 能改文字吗？看起来工具里能编辑啊

严格说不能"改"，只能"盖"。扫描 PDF 的"文字"本质是图像里的像素——没有文本对象可以编辑。所谓的"编辑"操作：(1) 用白色矩形盖住原来的文字；(2) 在白色矩形上打新文字（这个新文字是真正的文本对象）。视觉效果：(1) 局部看起来字改了；(2) 仔细看会发现：背景颜色、字体、字号与原文不一致；(3) 打印出来会有"补丁"痕迹。OCR 辅助：先 OCR 把图像转成可识别文字层，叠加在图像上——视觉上仍是图，但 PDF 阅读器可以选中文字。OCR 后的"文字层"可以编辑，但编辑后图像不变——视觉上仍是原扫描图，搜索时找到的是 OCR 文字层。实务：扫描 PDF 改字几乎都是"作弊"，重要文档（合同、证件）别这么做——任何扫描鉴定都能识别。

PDF 旋转 / 删页 / 重排页面这些"页面级"操作，会改变内容质量吗？

几乎不会，本质是元数据修改。PDF 是按页存储的——每一页是一个"对象树"，旋转 / 删除 / 重排只是改了"页面索引"或"页面属性"，不重新编码内容。性能优秀的操作：(1) 删除页面 —— 删除 PDF 内对应页面对象，文件变小；(2) 旋转页面 —— 修改页面 /Rotate 属性（0/90/180/270），内容像素不动；(3) 重排页面 —— 修改 PDF 内"页面顺序数组"；(4) 提取页面 —— 复制页面对象到新 PDF。有损操作：(1) 合并 PDF 时如果工具重新编码 → 可能压缩；(2) 加水印 / 注释 → 给页面对象加新内容（但原内容不变）；(3) "另存为" 而不是"保存" → 工具可能重新生成整个文件。实务：用 pdftk / qpdf / Adobe Acrobat 做页面级操作完全无损；用 Preview 等"另存"操作可能小幅压缩。

PDF 加密了能编辑吗？解密的边界在哪？

两种加密两种处理。PDF 有两种密码：(1) 打开密码——没密码连看都看不了；(2) 权限密码（owner password）——能打开但限制操作（不能复制、不能打印、不能编辑）。打开密码：必须知道密码才能解密——破解需要暴力穷举或字典攻击，强密码（10+ 位含特殊字符）实际不可破。权限密码：技术上限制可以绕过——多数 PDF 编辑器（Foxit / WPS / 国产工具）都能识别"已加密但能打开"，提供"忽略权限限制" 或"另存为去除限制"。法律边界：(1) 自己加密的 PDF 忘了密码——技术处理可接受；(2) 他人发给你的 PDF 含权限密码（如电子发票限打印）—— 绕过可能违法；(3) 商业 / 版权材料带 DRM——绕过几乎肯定违法。实务：编辑前先看 Acrobat "属性 → 安全性" 显示加密状态——如果是"无加密" 直接编辑；"用户密码" 需要输入；"权限密码" 看是否合法绕过。

PDF 表单（filled form）和普通 PDF 编辑区别是什么？

表单是 PDF 内置功能，无需 Acrobat 也能填。PDF 表单（AcroForm 或 XFA）—— 创建 PDF 时设计了"输入框"，对应位置可以填字、勾选、签名。填写流程：(1) 用 Adobe Reader / 浏览器内置 PDF 阅读器 / 多数 PDF 工具打开 → 看到输入框点击即可输入；(2) 保存 PDF → 输入内容固化或可继续修改（看创建者设置）。与"PDF 编辑"区别：(1) 表单：在预设输入框里填内容，不改其他位置——非常稳；(2) 编辑：尝试修改任意文字，需要字体支持，容易破坏排版。不能填的常见原因：(1) PDF 不是表单，而是普通 PDF——只能用 PDF 编辑器在指定位置加文字；(2) XFA 表单（XML based）—— 只有 Adobe Reader / Acrobat 完美支持，浏览器和其他工具不支持。实务：合同 / 申请表的 PDF，先看是不是表单（点击应该有输入框）—— 是 → 直接填；不是 → 找原 .docx 让对方填。

PDF 拆分大文件、合并多个 PDF，最好的工具是什么？

优先级。专业级（推荐）：(1) pdftk 命令行——拆分 / 合并 / 加密 / 解密一站式，无损；(2) qpdf 命令行——更现代，支持加密 / 线性化；(3) Adobe Acrobat 桌面——所有操作 GUI 化；(4) PDF24 桌面（免费 GUI）——拆合 OK，但批量处理慢。轻量级：(1) macOS Preview——拖拽缩略图实现拆合，简单但可能小压缩；(2) 浏览器内置工具——多数浏览器只能预览不能拆合。在线工具（注意隐私）：iLovePDF / SmallPDF / PDF24 在线版——上传到对方服务器处理，敏感文档不要用。命令行示例：pdftk input.pdf cat 1-5 output part1.pdf（提取 1-5 页）、pdftk a.pdf b.pdf cat output merged.pdf（合并）。实务：(1) 合同 / 财务 / 证件 → 本地工具（pdftk / Acrobat）；(2) 个人非敏感 → 在线工具方便；(3) 大量批处理 → 写脚本调用 pdftk / qpdf。

PDF 缩略图 / 大纲 / 书签是什么？怎么改？

三种导航元数据。缩略图——点开 PDF 阅读器侧边栏看到的页面预览，PDF 创建时可以选择嵌入或不嵌入（嵌入会增加体积）。大纲（outline）/ 书签——可点击的目录树，点击跳转到对应页面 + 位置。注释 / 高亮——批注、便笺、高亮、下划线等。修改方式：(1) 缩略图——通常自动生成，无需手动改；(2) 书签——Acrobat 侧边栏"书签" 面板可以增删改；用 Word 导出 PDF 时勾选"将标题转为书签"自动生成；(3) 注释——任何 PDF 阅读器都能加，注释保存在 PDF 里。陷阱：(1) 用 macOS Preview 加书签经常丢失（导出格式兼容问题）；(2) 多个 PDF 合并后书签可能错乱——pdftk / Acrobat 合并时建议手动重新整理；(3) 加密 PDF 的书签可能无法编辑——先解密再改。

修改 PDF 后文件变大很多，正常吗？

多数情况是工具重新编码导致的。原 PDF 用了高压缩（如 JPEG2000 / JBIG2 / 字体子集）——编辑工具不一定支持这些算法，保存时降级为通用编码（DEFLATE / DCT），体积膨胀。典型涨幅：(1) 矢量文字 PDF 改个字 → 原 100KB 改后 200KB（字体重新嵌入）；(2) 扫描 PDF 加水印 → 原 5MB 改后 8MB（图像重新编码）；(3) 重排页面 → 几乎不变（pdftk）或小幅增加（重新生成 xref）。优化：(1) 编辑后用 PDF 压缩工具二次处理；(2) 用 qpdf --linearize 优化结构（不损质量）；(3) Adobe Acrobat 的"减小文件大小" / "PDF 优化器"；(4) 命令行 gs -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook 重压缩到合理体积。陷阱：(1) 加密 PDF 编辑后必须重新加密——可能体积变化大；(2) 多次编辑 + 保存 → 每次叠加修改记录，文件持续增长，建议偶尔"另存为新文件"清理。