atob 报 "InvalidCharacterError" 是什么意思？

字符串里含非 Base64 字符——常见是空格、换行、Tab、中文，或来自 URL-safe 变种的 - _。先 s.replace(/[\s\r\n]/g, '') 去空白，再 .replace(/-/g, '+').replace(/_/g, '/') 转回标准变种。还不行就检查是不是整串被 URL encode 过一次（%3D、%2B 都应先 decodeURIComponent 还原）。

解码出来的内容前面一段乱码，是什么？

大概率是没剥 data URL 前缀。data:image/png;base64,iVBORw... 整串喂给解码器会把 data:image/png;base64, 也当成数据。手动 s.split(',')[1] 取逗号后面那段再解。

Python 解码报 "Incorrect padding" 怎么办？

末尾 = 丢了——可能经过 URL 传参时 = 被 URL encode 成 %3D 再被错误清理，或 URL-safe 变种本就不带 =。补齐方法：s += '=' * (-len(s) % 4)，让长度到 4 的倍数。base64.urlsafe_b64decode 对 URL-safe 变种宽容一些，但 padding 仍要凑齐。

Base64 字符串放在 JSON 里需要转义吗？

标准 Base64 字符 A-Z a-z 0-9 + / = 都不是 JSON 特殊字符，不需要转义。但要注意：字符串里不能有换行。很多库编码长数据时按 MIME 传统每 76 字符插 \n（RFC 2045），塞进 JSON 会报解析错误。序列化前先 .replace(/\n/g, '')，或编码时关闭自动换行。

Base64 解码失败的 6 个原因

“这个 Base64 为什么解不出来？“99% 是下面 6 种情况之一。把字符串拿到手先按这张表过一遍，比肉眼盯着猜快十倍。

1. 夹带空白字符

最常见的原因。换行、空格、Tab 混进 Base64 字符串，三种来源：

MIME 传统：邮件编码每 76 字符插一个换行（RFC 2045）
复制粘贴：从终端或日志里复制，粘贴时带了换行或末尾空格
JSON 格式化工具：有的会给长字符串自动折行显示

解码前统一清一下：

s = s.replace(/[\s\r\n]/g, '');

2. URL-safe 变种没转换

URL-safe Base64（RFC 4648 §5）用 - 代替 +、_ 代替 /，末尾可能没 =。标准解码器不认这两个字符：

标准：      abc+/d=
URL-safe：  abc-_d

JWT、OAuth state、Webhook 签名常用 URL-safe 形式。转回标准：

s = s.replace(/-/g, '+').replace(/_/g, '/');
while (s.length % 4) s += '=';   // 补 padding

Python 可以直接用 base64.urlsafe_b64decode，省去手动转换（但仍需 padding 凑齐）。

3. Padding（`=`）被吃掉

Base64 输出长度必为 4 的倍数，不足用 = 补齐。三种典型丢失场景：

URL 里的 = 被 URL encode 成 %3D，中间有人”觉得 %3D 丑”手动清理，一起把 = 也去了
URL-safe 变种有时约定不带 =（JWT 就是这样）
数据库 VARCHAR 长度不够字段被截断

补齐：

// JS
while (s.length % 4) s += '=';
// Python
s += '=' * (-len(s) % 4)

4. data URL 前缀没剥掉

图片常见：

data:image/png;base64,iVBORw0KGgoAAAANSU...

只有逗号之后的部分是 Base64。整串直接喂解码器会失败或得到乱码：

const pureBase64 = dataUrl.includes(',')
  ? dataUrl.split(',')[1]
  : dataUrl;

反过来，服务端给前端生成 <img src> 时要记得加上前缀，否则浏览器加载不出来。

5. 字符串被 URL encode 了

把 Base64 当 URL query 参数传时，前端做了 encodeURIComponent——+ → %2B、/ → %2F、= → %3D。后端拿到的是：

iVBORw0KGoA%2BAANSU...

含 % 就是没 decode。先：

const raw = decodeURIComponent(queryValue);
// 再做 Base64 解码

少数情况是中间链路 decode 了一次，但前端又 encode 了两次（发送 encode + URL 自动 encode），要 decode 两次才对。用抓包工具看服务端收到的原始字节能快速定位。

6. 字符集编码错误

Base64 解出来的是字节数组，不是字符串。当文本用还得指定字符集：

const bytes = atob(s);
const text = new TextDecoder('utf-8').decode(
  Uint8Array.from(bytes, c => c.charCodeAt(0))
);

对方是 GBK、Shift-JIS 的内容，用 UTF-8 decode 必然乱码。TextDecoder('gbk') 浏览器可用；Node.js 需要 iconv-lite。

直接 atob(s) 不转码得到的是 “binary string”——每个字符对应一个字节的 Latin-1 解释，拿去做中文显示一定错。

速查决策树

解码失败
├─ InvalidCharacter            → 有 - _（URL-safe）或空白？→ 清理
├─ Incorrect padding           → 补 = 到 4 倍数
├─ 解出来有乱码前缀            → 是不是没剥 data: 前缀？
├─ 解出来有一堆 % 百分号        → URL-encoded，先 decodeURIComponent
├─ 解出来字节对但文字看不懂     → 字符集（UTF-8 / GBK）选错
└─ 全部确认过仍失败            → 源头是不是根本没做 Base64 编码

一个”宽容解码”的调试函数

调试阶段定位问题时可以走一个容错版本：

function decodeLoose(s) {
  s = String(s).trim();
  if (/%[0-9A-F]{2}/i.test(s)) s = decodeURIComponent(s);
  if (s.startsWith('data:')) s = s.split(',')[1] || '';
  s = s.replace(/-/g, '+').replace(/_/g, '/');
  s = s.replace(/[\s\r\n]/g, '');
  while (s.length % 4) s += '=';
  return atob(s);
}

生产不建议这么宽松——容错会掩盖上游的数据格式问题。调试时用它定位到是哪一步错，再把那一步的正确流程修好才是终态。

Base64 本身很简单，解码问题几乎都是中间链路加的料——先把每一步拿到的原始字符串打印出来看，对照上面 6 种情况逐个排除，90% 的问题就能定位。

Base64 解码失败的 6 个原因

1. 夹带空白字符

2. URL-safe 变种没转换

3. Padding（`=`）被吃掉

4. data URL 前缀没剥掉

5. 字符串被 URL encode 了

6. 字符集编码错误

速查决策树

一个”宽容解码”的调试函数

❓ 常见问题

📖 同一工具的其他教程

1. 夹带空白字符

2. URL-safe 变种没转换

3. Padding（=）被吃掉

4. data URL 前缀没剥掉

5. 字符串被 URL encode 了

6. 字符集编码错误

速查决策树

一个”宽容解码”的调试函数

❓ 常见问题

📖 同一工具的其他教程

3. Padding（`=`）被吃掉