简繁转换工具 支持简体↔繁体双向转换,可选台湾正体或香港繁体两种地区方言,并可启用词汇本地化(“信息” → “資訊”)。基于开源 OpenCC 字典数据。
简繁三种关系:
| 关系 | 示例 | 说明 |
|---|---|---|
| 一对一 | 國 ↔ 国、語 ↔ 语 | 大多数字 |
| 多对一(简↔繁) | 後/后 → 后、髮/发 → 发、面/麵 → 面 | 简化时合并的字 |
| 区域差异 | 台繁 资讯 / 港繁 資訊 / 简体 信息 | 用词不同 |
两层转换:
重要提醒:简→繁→简 几乎一定丢信息。因为简体合并了多个繁体字,转回简体时无法还原。所以正式场合:
因为简繁是多对一映射。例如简体"发"对应繁体"發"(送出)和"髮"(头发);简体"后"对应"后"(皇后)和"後"(前后)。简→繁需要根据上下文判断,繁→简则简单合并。所以"先转繁再转简"几乎一定会出错(如"皇后→皇后→皇後")。详见教程 `simplified-traditional-irreversible`。
字形不同:台湾用"國語常用字"、香港用"常用字字形表",部分字的部件位置略异(如"骨"的内部结构)。用词不同:台湾用"软件 → 軟體"、"网络 → 網路"、"打印机 → 印表機";香港用"软件 → 軟件"、"网络 → 網絡"、"打印机 → 打印機"。本工具支持选择"台湾正体"或"香港繁体"分别处理。
算词汇本地化,不是字符转换。简繁字符是"信"↔"信"(同字),但简体的"信息" 在台湾叫"資訊"、香港叫"資訊"或"信息"(混用)。字符转换只换字(信→信),词汇本地化还要换词(信息→資訊)。本工具支持两层模式:仅转字、转字+换词。
可以转主流标准内的字(GB 18030 / Big5 / HKSCS 覆盖)。生僻字、异体字、古文专字(如"卍"、"丿")多数现代输入法和字库不支持,转换工具按字典库映射,超出库的字保留原样。古籍研究建议用专业工具(如汉典、CHISE)。
1956 年《汉字简化方案》合并了音义相同或通用字——"後/后" 都简化为"后"、"髮/发" 都简化为"发"、"麵/面" 都简化为"面"。目的是减少汉字数量,初衷合理但代价是简→繁不可逆。台湾、香港至今未推行简化,所以保留全部繁体字。
可以。OCR 出来的文字是普通字符串,转换工具不区分来源。但 OCR 可能把字识别错(如"己"识别为"已"),这种错误转换工具修不了。建议:OCR 后先人工校对一遍,再做简繁转换。