背单词最大的浪费,是顺序错了:抱着一本按字母排序的单词书,从 abandon 背到 zucchini,结果一半时间花在你这辈子未必用到的罕用词上,真正高频的常用词反而和生僻词混在一起没被重点对待。
更高效的做法是按真实使用频率背——先把最常遇到的词吃透,再往低频段推进。COCA 词频表生成就是干这件事:选一个频段,它按 COCA 真实词频排出单词表,附音标和中文释义,一键导成 Anki 卡或扇贝词库。
为什么按频率背 > 按字母背 / 按教辅书背
| 维度 | 字母序单词书 | 教辅大纲词表 | COCA 频段词表 |
|---|---|---|---|
| 排序依据 | 拼写首字母 | 考纲编排 | 真实使用频率 |
| 高频词优先 | 否,打散在各字母 | 部分 | 是,先背最常遇到的 |
| 能否只补薄弱段 | 难 | 难 | 容易,自填区间 |
| 数据可复现 | — | 各版本不一 | COCA 公开可验证 |
核心逻辑:一个词排得越靠前,你未来遇到它的次数越多,先背它的回报越高。把前 3000 个高频词吃透,就能覆盖日常英语里绝大多数词次——这是字母序和很多教辅书做不到的”优先级排序”。
预设是”累计前 N 词”,不是”某一段”
这是最该先搞清的一点。点”高考""四级”这些预设,填进去的是累计前 N 个高频词:
| 预设 | 对应范围 | 说明 |
|---|---|---|
| 高考 | 前 3500 | 从第 1 名到 3500 名全部 |
| 四级 | 前 5000 | 从第 1 名到 5000 名全部 |
所以直接点”四级”会给你前 5000 个词,不是”四级独有的那一段”。如果你已经掌握了高考 3500,只想补 3500-5000 这一段,就别用预设——手动把”从”改成 3500、“到”改成 5000。预设只是快捷填值,真正的范围由”从 # 到 #“决定,完全可以自定义。
频段难度对照
每个频段对应的大致难度(经验映射、非官方分级,与 COCA 词频查询 口径一致):
| 频段(COCA 排名) | 难度定位 |
|---|---|
| ≤ 1000 | 高频核心 |
| ≤ 1500 | 初中 |
| ≤ 3500 | 高考 |
| ≤ 5000 | 四级 |
| ≤ 7000 | 六级 |
| ≤ 10000 | 雅思 6.5+ / 托福 90+ |
| ≤ 14000 | 母语高中 / GRE |
| 更高 | 罕用 |
词性筛选:做专项练习用
只勾”动词”或”形容词”,就能从某个频段里筛出某一类词,适合:
- 写作选词专项——集中看高级动词 / 形容词,扩充表达
- 词性辨析——名词、动词分开背,减少混淆
注意一词多性的处理:只要命中任一所选词性就保留。study 既是名词又是动词,勾”动词”它也会出现。词性标记来自 COCA 释义的粗标注,个别词可能不全——做严格专项时建议结合释义再确认。
lemma 原形:背了原形就覆盖变形
导出的是原形(lemma)词表——COCA 表只收原形,running、boxes、higher、quickly 这些派生形态不单独占位,对应的 run、box、high、quick 才在表内。专有名词、地名、品牌也不收。
这其实是优点:背一个原形 = 顺带掌握它的所有常见变形。背了 run,running / ran / runs 自然就会,不必为每个变形单独建卡。背的时候自行扩展即可。
顺带解释一个常见疑问:选”全部”为什么只有约 17600 词、不是 20000?因为原始表里同一原形会因大小写或多词性重复出现,整理时按原形去重合并,剩约 17600 个独立词,但最高排名仍接近 20000——所以编号有跳号是正常的,不是漏词。
三种导出,对应不同去处
| 导出方式 | 内容 | 用在哪 |
|---|---|---|
| 导出 CSV(Anki) | 两列:正面 = 单词,背面 = 音标 + 释义 + 词频 | 导入 Anki 批量成卡 |
| 复制单词 | 每行一个原形,纯列表 | 粘进扇贝 / 不背单词 / 欧路词典等 App |
| 导出 TXT | 带音标释义的文本 | 自己在 Excel / 文本里二次加工 |
Anki 导入:菜单”文件 → 导入”,分隔符选逗号,字段映射成”正面 / 背面”,几千词几秒建好。导入前先在 Anki 选好牌组和卡片类型。
扇贝 / 不背单词等 App:用”复制单词”拿到的每行一词纯列表,正是这些 App”导入单词列表 / 自建词库”功能要的格式,直接粘进去即可。
完整的背词闭环
按频段出词表只是其中一环,配合这几个工具效率更高:
- 先用 英语词汇量测试 测出自己开始崩的频段,确定背词起点——别从第 1 个词从头背,从你薄弱的那段开始。
- 用本工具把那一段(如”从 8000 到 10000”)导出成 Anki 卡,集中突破。
- 平时读英文撞到生词,用 COCA 词频查询 查它排第几,决定值不值得单独加卡。
- 读完整篇文章想系统补它的难词,用 英文文章难度分析 导出超纲生词清单。
背单词不该是”从头啃一本书”,而是按优先级、按需补缺:高频段先吃透,薄弱段单独攻,导成卡片用间隔重复巩固。把顺序理顺,同样的时间能记住的有用词会多得多。