“我的头发很长” 翻译成繁体,你觉得是 “我的頭髮很長” 还是 “我的頭發很長”?正确是前者。因为简体的”发”对应繁体的”髮”(头发)和”發”(发射)两个字,简转繁时要根据上下文判断。
为什么会”一简对多繁”
1950 年代的汉字简化有几种方式:
- 同音合并:发(髮/發)、后(后/後)、干(干/幹/乾)
- 形近合并:云(云/雲)、出(出/齣)
- 草书楷化:书(書)、长(長)
- 简化部件:网(網)、门(門)
前两种是不可逆的——简体丢失了繁体的区分信息,机器转换只能靠词典和上下文猜。后两种是一一对应的,能完美转换。
最常踩坑的 20 个字
| 简体 | 繁体(场景) |
|---|---|
| 发 | 髮(头发) / 發(发射、发财) |
| 后 | 后(皇后、太后) / 後(後面、以後) |
| 干 | 干(干预) / 幹(树干、能幹) / 乾(乾燥、餅乾) |
| 里 | 里(公里、乡里) / 裏(裏面、心裏) |
| 余 | 余(我——古文第一人称) / 餘(剩餘、其餘) |
| 几 | 几(茶几) / 幾(幾個、幾乎) |
| 尽 | 尽(同”儘”,量力)/ 盡(盡力、盡頭) |
| 台 | 台(三台——星名/天臺)/ 臺(臺灣、舞臺)/ 檯(檯燈)/ 颱(颱風) |
| 云 | 云(人云亦云——说) / 雲(白雲、雲朵) |
| 面 | 面(面部、面對) / 麵(麵條、麵粉) |
| 只 | 只(只有、只是) / 隻(一隻、獨隻) |
| 谷 | 谷(山谷) / 穀(穀物、五穀) |
| 历 | 歷(歷史、經歷) / 曆(曆法、日曆、農曆) |
| 志 | 志(志向、志願) / 誌(日誌、雜誌) |
| 系 | 系(系統、關係) / 係(聯係、確係) / 繫(繫鞋帶、維繫) |
| 症 | 症 / 癥(癥結) |
| 钟 | 鐘(時鐘、鐘聲) / 鍾(鍾情、情有獨鍾) |
| 复 | 復(恢復、反復) / 複(複雜、重複) |
| 板 | 板(木板、老板) / 闆(老闆——港台用法) |
| 仆 | 仆(前仆后继——倒下)/ 僕(僕人、公僕) |
台湾 vs 香港:字形细节差异
同样是繁体,台湾(正体中文)和香港(繁体中文)在部分字形上有别:
- 台湾:“裡”(里)、“為”(为)、“戶”(户)
- 香港:“裏”、“為”、“戸”
差异不大,但专业出版要区分。工具通常提供”转台湾繁体”和”转香港繁体”两个选项。
一简转多繁:机器是怎么判断的
靠词典匹配 + 上下文概率。比如”头发”后接”很长”大概率是髮;“发现”后接”问题”大概率是發。
但孤立单字无法准确转换。所以:
- “发” → 机器输出可能是”發”(更常用)或”髮”(更少见)
- 需要人工复核:专业翻译依然是两道——机器转 + 人工校
不可逆的后果
繁转简可以完美还原(多对一是确定的);简转繁永远可能出错,错了还不容易发现。这是为什么繁体地区用户看到简体的”太后发言”会一瞬间想到”太后髮言”——虽然他知道是”發言”,但脑中需要多一道处理。
繁简互转 + 地区字形
一键简转繁/繁转简,可选目标地区(大陆简体 / 台湾正体 / 香港繁体),对易错字会标记多义警告,便于人工复核。