手机拍照的图片 OCR 效果差，怎么改善？

拍摄时记住四个字：稳、近、正、亮。稳——双手握稳手机，或把文件放桌上俯拍，避免抖动模糊；近——让文字占满大部分画面，不要拍整张桌子；正——手机尽量与纸面平行，减少透视变形；亮——自然光或充足照明，避免阴影遮住文字。拍完后检查：单个汉字笔画清晰、没有大面积阴影、文字占画面 60% 以上——满足这三条，识别率通常会明显提升。

印刷体和手写体识别率差多少？

差距很大——现代 OCR 对印刷体准确率可达 98%+，手写体通常 70–90%（取决于笔迹规整程度）。印刷体（报纸、书籍、打印文件）字体标准、间距规则，对 OCR 最友好；手写正楷识别率较高，约 80–90%；行草书或个人风格强的手写识别率可能低至 50–70% 甚至更低。提升手写识别率的方法：确保图片清晰（手写体更依赖笔画细节）、使用专门针对手写训练的 OCR 模型（通用 OCR 对手写优化有限）。

竖排文字、表格、双栏排版能识别吗？

能识别，但准确率和排版还原度有差异。竖排文字：多数 OCR 支持，但识别后需要自行调整阅读顺序；表格：单元格内文字识别准确率较高，但合并单元格和边框的结构还原较难；双栏排版（学术论文、杂志）：OCR 常把两栏混排成一段，阅读顺序乱。改善方法：先用图片编辑工具把复杂版面裁切成单栏或单表格，分别识别后合并——比直接识别整页效果好很多。

图片分辨率要多少才够 OCR 用？

文字 OCR 建议分辨率在 150 DPI 以上，最佳是 300 DPI。手机拍照通常远超这个要求，问题往往不在分辨率而在模糊和畸变。扫描件 DPI 建议：普通文字 150–200 DPI，小字或精密文件 300 DPI。实际判断方法：把图片放大到 100% 看单个文字——字母笔画边缘清晰、没有明显马赛克感，基本够用。DPI 够但识别率低，优先排查是否存在模糊、歪斜或低对比度问题。

JPEG 格式的图片 OCR 效果比 PNG 差吗？

轻度 JPEG 压缩（质量 80% 以上）对 OCR 影响很小，重度压缩（质量低于 50%）会显著降低识别率。JPEG 压缩在文字边缘和高频细节处产生"块状伪影"，这些伪影会干扰字符识别——低质量 JPEG 里的"田"可能被识别成"由"。如果原图 JPEG 压缩严重（文字边缘能看到模糊块），识别前可先做锐化处理。截图（电脑屏幕截取）通常是 PNG，文字渲染清晰，是 OCR 效果最好的来源之一。

OCR 识别率低的 5 个原因：预处理比算法更重要

OCR 识别率低，用户第一反应往往是”算法不行”——换个工具试试。但实际上，90% 的识别失败是图片质量问题，而不是 OCR 引擎问题。同样一张图，换个拍摄角度、加个对比度，识别率从 60% 能提升到 95%+。

五个主要原因

原因 1：图像模糊

最常见，影响最大。

模糊的来源：

手持拍摄抖动（最常见）
文件没有平铺，纸张弯曲导致局部失焦
手机对焦在背景，文字区域在焦外
光照不足，手机提高 ISO，引入噪点模糊

判断方式：放大到 100% 看单个汉字，笔画边缘如果是”软的”而不是清晰的线条，就说明有模糊。

修复：重新拍摄，手机放在桌面或靠稳，点触屏幕文字区域手动对焦。

原因 2：图像歪斜（倾斜角度）

文字不是水平的，OCR 识别时需要先纠正倾斜，纠正不准就会影响结果。

倾斜角度	影响程度
1–3°	轻微，多数 OCR 自动处理
5–10°	明显，识别准确率下降 10–20%
15°+	严重，部分字符无法识别

修复：拍摄时调整角度，或上传前用图片工具旋转/裁切。

原因 3：对比度不足

字迹颜色和背景颜色太接近，OCR 无法区分文字和底色。

常见场景：

浅色墨水写在白纸上（铅笔、浅蓝色钢笔）
彩色印刷背景上的文字（杂志广告、红色/绿色底色）
阴影遮住部分文字区域

对比度足够的情况（OCR 友好）：
  黑色文字 + 白色背景
  深蓝文字 + 浅灰背景

对比度不足（OCR 困难）：
  浅灰文字 + 白色背景
  绿色文字 + 蓝色背景
  阴影覆盖区域（局部对比度变低）

修复：拍摄前换自然光或补光，避免单侧光源造成阴影；识别前用图片编辑软件提高对比度或转黑白。

原因 4：透视变形

手持手机不垂直于纸面拍摄，导致文字出现梯形畸变。

这个问题肉眼不易察觉——远近端文字大小不一，字符形状被压缩，OCR 的字符形状匹配准确率下降。

修复：拍摄时手机镜头尽量正对文件，或使用”文件扫描”类 App（如扫描全能王），它们会自动做透视矫正。

原因 5：文件本身质量低

复印件的复印件：每复印一次清晰度都下降，多代复印后文字边缘变粗、笔画粘连
传真件：分辨率通常只有 200 DPI，比印刷品低很多
老旧档案：纸张泛黄，墨迹褪色，字迹本身已模糊

这类情况 OCR 识别准确率上限就低，建议降低期望或人工校对。

预处理方法速查

不需要专业图像处理软件，手机自带工具和免费网页工具就能完成基本预处理：

问题	预处理方法	工具
歪斜	旋转 / 裁切	手机相册编辑、图片裁剪
低对比度	提高对比度、转灰度	手机相册”调整”功能
阴影	提高阴影区亮度	手机相册、Snapseed
背景干扰	裁切只保留文字区域	图片裁剪
透视变形	透视矫正	扫描全能王、Adobe Scan

预处理的优先顺序：

1. 重新拍摄（最有效，优先于后期处理）
2. 旋转纠斜
3. 裁切到文字区域
4. 提高对比度 / 转黑白
5. 锐化（最后一步，锐化前要先完成前几步）

不同来源的识别率预期

图片来源	预期识别率	主要限制
电脑截图（屏幕文字）	95–99%	几乎无限制
扫描件（300 DPI）	95–98%	原件质量
手机正面俯拍（文件放桌上）	90–97%	光线均匀度
手持拍摄（一般）	75–92%	模糊、歪斜、透视
复印件 / 传真件	70–88%	原件分辨率损失
手写正楷	80–90%	字体规整度
行草 / 个人手写	50–75%	字形偏差

配套工具

OCR 文字识别 — 上传预处理后的图片，识别效果更好
图片裁剪 — 裁切掉文字区域以外的背景
图片格式转换 — JPEG 转 PNG 减少压缩伪影后再识别