简繁转换工具能把”网络”变成”網絡”,但变不出台湾人常用的”網路”。简繁是字符层面的转换,用词差异是词汇层面的——三地(大陆 / 台湾 / 香港)70+ 年的隔离演化出大量同义异词。这篇汇总常见的科技、生活、译名差异,帮你避免”自动转换后台湾人一眼看出是大陆人写的”。
简繁转换 vs 用词转换的本质区别
简繁转换(字符级):
网络 → 網絡
软件 → 軟件
视频 → 視頻
但这些"繁体"在台湾不是常用词
用词转换(词汇级):
网络 → 網路(台)/ 網絡(港)
软件 → 軟體(台)/ 軟件(港)
视频 → 影片(台)/ 視頻(港)
需要词汇映射 + 上下文判断
三大类常见差异
1. 科技 / 计算机词汇
| 大陆 | 台湾 | 香港 |
|---|---|---|
| 软件 | 軟體 | 軟件 |
| 硬件 | 硬體 | 硬件 |
| 程序 | 程式 | 程式 |
| 代码 | 程式碼 | 程式碼 |
| 函数 | 函式 | 函式 |
| 变量 | 變數 | 變數 |
| 接口 | 介面 | 介面 |
| 数组 | 陣列 | 陣列 |
| 数据 | 資料 | 數據 |
| 数据库 | 資料庫 | 資料庫 |
| 服务器 | 伺服器 | 伺服器 |
| 网络 | 網路 | 網絡 |
| 网站 | 網站 | 網站 |
| 域名 | 網域 | 網域 |
| 视频 | 影片 | 視頻 |
| 音频 | 音訊 | 音頻 |
| 图像 | 圖像 | 圖像 |
| 激光 | 雷射 | 鐳射 |
| 打印 | 列印 | 打印 |
| 打印机 | 印表機 | 打印機 |
| U 盘 | 隨身碟 | USB 手指 |
| 硬盘 | 硬碟 | 硬碟 |
| 屏幕 | 螢幕 | 螢幕 / 屏幕 |
| 鼠标 | 滑鼠 | 滑鼠 / 老鼠 |
| 用户 | 使用者 | 用戶 |
| 缺省 | 預設 | 預設 |
| 默认 | 預設 | 預設 |
| 文件 | 檔案 | 檔案 / 文件 |
2. 生活类词汇
| 大陆 | 台湾 | 香港 |
|---|---|---|
| 出租车 | 計程車 | 的士 |
| 公交车 | 公車 | 巴士 |
| 地铁 | 捷運 | 港鐵 / 地鐵 |
| 方便面 | 泡麵 | 即食麵 |
| 酸奶 | 優酪乳 | 乳酪 |
| 冰淇淋 | 冰淇淋 | 雪糕 |
| 西红柿 | 番茄 | 番茄 |
| 菠萝 | 鳳梨 | 菠蘿 |
| 土豆 | 馬鈴薯 | 薯仔 |
| 空调 | 冷氣 | 冷氣 |
| 冰箱 | 冰箱 | 雪櫃 |
| 公司 | 公司 | 公司 |
| 老板 | 老闆 | 老闆 |
| 服务员 | 服務生 | 侍應 |
| 警察 | 警察 | 警員 |
| 高考 | 學測 / 指考 | 文憑試 (DSE) |
| 高中 | 高中 | 中學 |
| 大学 | 大學 | 大學 |
| 房子 | 房子 / 房屋 | 屋 |
| 房价 | 房價 | 樓價 |
陷阱:
- 台湾的”土豆”= 花生!马铃薯叫”馬鈴薯”
- 菠萝 / 鳳梨:台湾严格区分两个品种
3. 译名(人名 / 地名 / 品牌)
| 英文原文 | 大陆 | 台湾 | 香港 |
|---|---|---|---|
| Trump | 特朗普 | 川普 | 特朗普 |
| Putin | 普京 | 普丁 | 普京 |
| Obama | 奥巴马 | 歐巴馬 | 奧巴馬 |
| Biden | 拜登 | 拜登 | 拜登 |
| Sydney | 悉尼 | 雪梨 | 悉尼 |
| Italy | 意大利 | 義大利 | 意大利 |
| Saudi Arabia | 沙特阿拉伯 | 沙烏地阿拉伯 | 沙特阿拉伯 |
| New Zealand | 新西兰 | 紐西蘭 | 紐西蘭 |
| Star Wars | 星球大战 | 星際大戰 | 星球大戰 |
| Lord of the Rings | 指环王 | 魔戒 | 魔戒 |
| Toy Story | 玩具总动员 | 玩具總動員 | 反斗奇兵 |
| Frozen | 冰雪奇缘 | 冰雪奇緣 | 魔雪奇緣 |
一字多繁的处理
简体的某些字在繁体中对应多个字符,需要看上下文:
| 简 | 繁体(按上下文) |
|---|---|
| 后 | 後(后面)/ 后(皇后) |
| 里 | 裡 / 裏(里面)/ 里(公里) |
| 干 | 幹(干部 / 干净)/ 乾(干燥)/ 干(公干) |
| 发 | 髮(头发)/ 發(发明) |
| 历 | 歷(历史)/ 曆(日历) |
| 系 | 係(关系)/ 系(系统) |
| 复 | 復(复习)/ 複(复杂) |
| 余 | 餘(多余)/ 余(姓氏 / 余 = 我) |
| 谷 | 穀(粮食)/ 谷(山谷) |
| 准 | 準(准备)/ 准(批准) |
| 板 | 板(木板)/ 闆(老闆) |
| 钟 | 鐘(时钟)/ 鍾(姓氏) |
| 表 | 表(表格)/ 錶(手錶) |
自动转换工具的处理:
- OpenCC 用词典 + 上下文规则
- 简单字典映射 → 必然出错
- AI 翻译(Google Translate / DeepL)→ 准确率高
港式繁体 vs 台湾繁体
虽然都是繁体,但字形和用字习惯有差异:
| 大陆简 | 台湾繁(正體) | 香港繁(繁體) |
|---|---|---|
| 里 | 裡 | 裏 |
| 线 | 線 | 綫 |
| 群 | 群 | 群(老式:羣) |
| 内 | 內 | 内 |
| 才 | 才 | 才(部分场景:纔) |
| 强 | 強 | 強(部分:彊) |
用字偏好:
- 台湾:裡、線、嫉妒
- 香港:裏、綫、妒忌
实务:
- 简单 s2t 转换 → “通用繁体”,可能不符合任何一地习惯
- s2tw(简到台繁):使用 OpenCC 的
s2twp配置 - s2hk(简到港繁):使用 OpenCC 的
s2hk配置
粤语:另一个语言系统
香港正式书面用标准繁体中文(接近台湾),但口语用粤语:
口语词汇(粤语独有):
冇 = 没有
嘅 = 的
咗 = 了
乜 = 什么
嘢 = 东西
而家 = 现在
食 = 吃
饮 = 喝
拎 = 拿
我哋 = 我们
佢 = 他 / 她
啲 = 一些
使用场景:
- 正式(公文 / 报纸):标准繁体 + 港式用词
- 半正式(电视新闻):标准繁体或粤语
- 口语(电影字幕 / 聊天):粤语词汇
实务:
- 翻译给香港用户面向大众(电影 / 流行文化)→ 用粤语
- 正式商务 / 政府 → 标准繁体 + 港式用词
- 多数情况用标准繁体即可
翻译工具链
OpenCC(开源标准)
# 简到繁(通用)
opencc -i input.txt -o output.txt -c s2t.json
# 简到台繁(含台湾用词)
opencc -i input.txt -o output.txt -c s2twp.json
# 简到港繁
opencc -i input.txt -o output.txt -c s2hk.json
Python 集成:
import opencc
converter = opencc.OpenCC('s2twp') # 简到台繁 + 用词
result = converter.convert("这个软件很好用")
# "這個軟體很好用"
商业 / AI 工具
- Google Translate(基于 NMT,准确率高)
- DeepL(部分语言对支持中文)
- 微软翻译
- ChatGPT / Claude(可指定目标变体)
实战工作流
1. 简体 → 繁体翻译
简体源文档
↓
OpenCC 自动转换(s2twp / s2hk)
↓
本地母语审校
↓
关键词 / 译名核对
↓
最终交付
2. 软件 / 网站本地化
源代码 i18n
↓
zh-CN / zh-TW / zh-HK 三套
↓
专业本地化平台(Crowdin / Lokalise)
↓
本地母语翻译者
↓
QA 审校
3. 译名表维护
关键术语映射表:
software → 软件 / 軟體 / 軟件
network → 网络 / 網路 / 網絡
database → 数据库 / 資料庫 / 資料庫
laser → 激光 / 雷射 / 鐳射
持续更新(新术语)
常见错误
❌ 把通用繁体当成台湾繁体
- s2t 简单转换 → 字形是繁体但词汇还是大陆词汇
- 台湾用户:“这是大陆人翻的”
❌ 完全用粤语口语翻译政府文件
- 香港正式场合用标准繁体
- 粤语只用于大众文化
❌ 不区分多义字
- 头发 → 头髮 ❌(应该是 頭髮)
- 因为”发”对应”髮”和”發”两个字
❌ 音译用错地区版本
- “悉尼”在台湾应是”雪梨”
- 不能简单用大陆版本
✅ 正确做法
- 用 s2twp / s2hk 区分台港
- 维护词汇映射表
- 母语审校
实战清单
✅ 必做:
- 区分简繁转换 vs 用词转换
- 用 OpenCC 的地区配置(s2twp / s2hk)
- 维护术语 / 译名映射表
- 母语审校(特别是关键文档)
- 多义字按上下文判断
❌ 避免:
- 简单 s2t 当作完整翻译
- 用大陆词汇 + 繁体字符(一眼穿帮)
- 跨地区使用译名(特朗普 vs 川普)
- 忽略文化偏好(菠萝 vs 鳳梨)
- 把粤语当所有香港文本
简繁转换是必要但不充分——加上用词映射、文化审校、地区区分,才能让中文文档真正”本地化”。