共 97 篇 · JSON / Base64 / JWT / Hash / 正则 / Cron / URL / Markdown

想看 文本与开发 的工具集合?→ 文本与开发工具集

其他分类: 导航资源 / PDF 工具 / 图片 / 音频/视频 / 中文语言 / 生活与杂务 / 财务与计算 / CSS 生成器 / 益智游戏 ;返回 全部教程

⭐ 觉得好用?收藏备用,下次直接打开
私有通讯协议帧逆向:字节序、CRC 变体与变长字段完全指南
一篇讲透读不懂 HEX 报文的三大根源——大端小端与浮点字交换(ABCD/CDAB)、CRC 多项式与 RefIn/RefOut 参数、报文里藏的变长长度字段,附手撕一帧 Modbus-RTU 的完整字节分析。
🧩 HEX 协议帧编解码 2026-06-19
docker run 转 docker-compose:参数对照表与那些转不过去的坑
把一长串 docker run 沉淀成可版本化的 docker-compose.yml,大多数参数能一一对应,但 --rm、--gpus、-P、--mount、depends_on 这些没有直接等价物。本文给出完整映射对照表,并讲清哪些要手动处理。
🐳 docker run ↔ compose 2026-06-18
不装 Office 也能在线编辑 Excel:浏览器改 xlsx 的几种方式和取舍
没装 Excel/WPS 也要改个 xlsx,有好几条路。本文对比在线云服务和本地浏览器工具在隐私、保真上的差异,讲清纯前端方案能保住什么、保不住什么,以及 CSV 乱码、公式跨引擎差异这些常见坑。
📊 Excel 在线编辑 2026-06-18
.gitignore 不生效?已提交的文件怎么忽略?规则与排查一文讲清
加了 .gitignore 文件却还是被 Git 跟踪,多半是踩了"只对未跟踪文件生效"这个坑。本文讲清 git rm --cached 的正确做法、gitignore 语法速查、否定规则的父目录陷阱,以及全局 gitignore 配置。
🚫 .gitignore 生成器 2026-06-18
雪花算法(Snowflake ID)原理:64 位怎么拆、时钟回拨怎么办
雪花 ID 把一个 64 位整数切成时间戳、机器位、序列号几段,既全局唯一又大致有序。本文讲清它的位结构、为什么能按时间递增、起始纪元的作用、时钟回拨这个致命问题怎么应对,以及各平台布局差异。
❄️ Snowflake ID 解析 2026-06-18
文本里看不见的字符在搞鬼:用 ASCII 码表定位 CRLF、Tab、BOM 与控制符
两段"明明一样"的字符串就是不相等、CSV 导入多出一列、Git 满屏 LF/CRLF 警告、shell 脚本报 bad interpreter——元凶往往是肉眼看不见的控制字符。这篇讲清换行符 CRLF 与 LF、Tab 与空格、BOM、NUL 等不可见字符的来历与危害,并用 ASCII 码表把它们一个个揪出来。
🔡 ASCII 码表 2026-05-31
前后端字段命名风格老对不上:snake_case 与 camelCase 批量互转和团队约定
后端返回 user_name、前端要 userName、数据库字段又是另一套——命名风格在各层之间来回翻译是联调高频的体力活。这篇讲清各层为什么命名约定不同、一个标识符"分词"的规则(含 URL/ID 缩写怎么处理),并用命名转换工具把整列数据库字段一键批量转成 12 种风格,附一套落地的团队命名约定。
🔤 命名转换 2026-05-31
SSH 报 "Permissions 0644 too open"、网站 403——Linux 权限 755/644 一文讲透
SSH 私钥被拒登录提示权限太开放、上传到服务器的网站突然 403、脚本说 Permission denied——这些几乎都是 Linux 文件权限没配对。这篇从 rwx 与数字的换算讲起,说清私钥为何必须 600、目录和文件的 755/644 差在哪个执行位、setuid/sticky 是什么,以及为什么别动不动 chmod 777。
🔓 chmod 计算器 2026-05-31
2FA 验证码总是对不上?TOTP 时间步、SHA 算法与 Base32 密钥三类坑排查
自己实现两步验证、或换手机想恢复 Google Authenticator 时,最常见的崩溃是"算出来的 6 位码和服务端就是对不上"。这篇讲清 TOTP 是怎么用密钥和时间算出动态码的,再按设备时间、算法/位数/周期、Base32 密钥格式三类高频原因逐一排查,并说明备份密钥如何手动出码与跨设备恢复。
🔐 TOTP 验证码 2026-05-31
跨时区会议怎么约才不算错时间:夏令时、半小时时区与日界线三大坑
约跨国/远程会议最容易栽在三个看不见的坑——夏令时换季让时差临时变一小时、印度伊朗这类半小时时区、以及对方那边已经是第二天。这篇讲清这三类陷阱的成因,并用世界时钟的会议规划条 5 步定出对所有人都不在深夜的会议时间,附一套不会被误解的邀请话术。
🌍 世界时钟 2026-05-31
读懂别人写的"天书正则":用 AST 中文解释面板拆解前后瞻断言 (lookahead / lookbehind)
接手一段 (?<=\$)\d+(?=\.\d{2})(?!\d) 这样的正则,光看符号根本不知道它在干嘛。这篇用 Regex Pro 的 AST 解释面板逐节点拆开四种断言(正/负向先行、正/负向后行)的语义、它们"匹配位置而不消耗字符"的本质、以及为什么断言能做到普通分组做不到的"提取却不吞掉边界"
🔍 Regex Pro 2026-05-30
不开 Excel、不写脚本:用正则捕获组把日志直接算成数据(求和 / 均值 / 分位 + 分组聚合)
regex101 只告诉你"匹配到了几条",但运维和排障真正想要的是"这些接口平均耗时多少、P99 是多少、哪个接口最慢"。这篇讲 Regex Pro 独有的「统计」面板:把捕获组当成数据列,对命中做求和 / 均值 / 分位聚合,再按某个组分组算每组的次数和均值——一条正则把非结构化日志变成可读的数据表
🔍 Regex Pro 2026-05-30
替换里的大小写魔法:用 \U \L \u \l 一键在 snake_case / camelCase / PascalCase / CONSTANT 之间互转
标准 JS 的 String.replace 没法在替换时把捕获组转大小写,所以网上都说"命名风格转换必须写回调函数"。但 Regex Pro 的替换面板支持 sed / regex101 风格的 \U \L \E \u \l 大小写修饰符——这篇给出 snake↔camel↔Pascal↔CONSTANT↔kebab 的整套替换模板,以及导出到代码时这套语法不通用、必须改写的关键提醒
🔍 Regex Pro 2026-05-30
常用正则速查:邮箱 / 手机号 / 身份证 / URL / IPv4 的真实写法、校验边界与必踩误区
网上抄来的"邮箱正则""手机号正则"十有八九要么漏匹配要么误放行。这篇把 Regex Pro 内置的 13 个示例(邮箱·手机号·身份证·URL·IPv4·UUID·日期·HEX·SemVer·强密码·HTML 标签·中文姓名)逐个拆开:每条给出能跑的 pattern、它的覆盖边界、以及"正则到此为止、剩下必须靠程序校验"的那条线
🔍 Regex Pro 2026-05-30
在浏览器里 grep 几十 MB 的大日志:Regex Pro 文件流式扫描模式实战
几十 MB 的日志拖进编辑器要么卡死要么直接崩,VS Code 全局搜索也未必扛得住。这篇讲 Regex Pro 的文件流式扫描:拖一个大文件进去、正则在 Web Worker 里分块跑、grep 风格带上下文行展示命中、全程不冻页面——以及它和"小文本直接编辑"模式的边界、隐私与持久化的取舍
🔍 Regex Pro 2026-05-30
正则为什么会把 CPU 跑满:灾难性回溯 (ReDoS) 的识别、Bench 基准测试与超时兜底
一条看着人畜无害的正则,遇到特定输入会让 CPU 100% 卡死几秒甚至几分钟——这就是 ReDoS。这篇讲清灾难性回溯的成因(嵌套量词 + 重叠分支)、三类高危模式的长相、如何用 Regex Pro 的 ⏱ Bench 跑分位数实测耗时、以及生产环境必须叠加的超时与降级兜底
🔍 Regex Pro 2026-05-30
正则替换模板深度指南:$1 / $<name> / $& / $` / $' 全套占位符与 JS·Python·Java 跨语言迁移
写出能跑的正则只是一半,把它"替换出想要的结果"才是日常 80% 的需求;这篇把 JavaScript 的 6 种替换占位符语义、常见替换模板(日期、命名分组、CSV 字段、蛇形转驼峰)、JS/Python/Java/Go 的语法差异、以及为什么"多次替换"经常翻车一次性讲清
🔍 Regex Pro 2026-05-26
LaTeX 公式贴到 Word / 公众号 / 知乎的完整工作流:KaTeX 渲染原理、MathML 变可编辑公式、parse error 自查清单
写论文、写公众号、写知乎答案时数学公式怎么贴最干净?KaTeX 和 MathJax 区别在哪、MathML 贴 Word 真能变可编辑公式、公众号不支持 LaTeX 怎么办、parse error 最常见的三类语法坑、分享链接到底安不安全——这篇从 LaTeX 源码到目标平台的全路径一次讲清
Σ LaTeX 公式编辑器 2026-05-24
前端 Mock 假数据完整指南:30+ 字段、JSON/CSV/SQL 四种输出、身份证 Luhn 校验位为什么是真的、什么场景绝对不能用
后端没好前端先 Mock,假数据生成的核心问题是"假得像真的"——但太像真的会越界。这篇拆开 30+ 字段类型怎么选、四种输出格式贴谁、身份证号 GB 11643 校验为啥能通过验证器、自定义正则覆盖哪些场景、哪些用法已经接近违法
🎲 Mock 数据生成器 2026-05-24
用 EXIF 拍摄时间批量重命名照片——从 IMG_xxxx 到 2024-03-15_142307 的实战流程
手机/相机/无人机混导出来一堆 IMG_4321.JPG、DSC_0987.NEF、PXL_20240315.jpg,时间线全乱。这篇拆开 EXIF DateTimeOriginal 与文件修改时间的差别、HEIC/RAW/PNG 的兼容性、时区与跨机型时间偏移怎么修、没有 EXIF 的截图怎么兜底、原地改名 vs ZIP 下载怎么选——一次让杂乱图库按拍摄时间整齐排列
🔠 文件批量重命名 2026-05-21
IPv6 地址类型实战速查——fe80、2400、fd00、::ffff 分别在网络的哪一层出现
IPv4 看一眼 192.168 就知道是内网,IPv6 一长串 2400:da00:...:: 反而不会读了。这篇按"地址段对应什么场景"反向梳理 6 个核心前缀——::1 回环、fe80:: 链路本地、fc00::/7 ULA 私有、2000::/3 公网 GUA、ff00::/8 组播、::ffff: IPv4-mapped——再讲清 IPv6 缩写规则、为什么家里有公网 IPv6 但 ping 不通、SLAAC 和 DHCPv6 差别
🌐 IP 工具箱 2026-05-21
Cron 表达式写得没错任务却不跑——9 类"配置正确但不触发"的真实原因与排查路径
5 个字段都对、用 cron 在线工具验证过下次执行时间也对,但服务器上 crontab -l 看一切正常,定时任务就是不跑。多半不是表达式错,而是用户身份、PATH、shell、输出重定向、文件换行符之一掉了链子。这篇按"先看日志、再看环境、最后看语义"三段拆开 9 类典型问题,给到定位 + 修复
⏰ Cron 2026-05-17
1900 个 emoji 和 300 个特殊符号怎么找得快——中文搜索词库设计、跨平台字体差异、双击收藏避坑
输入法翻页找 emoji 慢又不准,电脑/手机/不同 App 之间 emoji 长得还不一样。这篇拆开 1914 个 Unicode emoji 全集 + 13 类 307 个特殊符号的中文搜索词库怎么设计、跨平台显示为什么差异不可消除、双击收藏的 localStorage 机制、什么时候用 emoji vs 用符号 vs 用文本——一次让你从"翻面板"升级到"想到即输入"
😀 Emoji 与符号 2026-05-17
用 Markdown 写思维导图:markmap 语法速成、富文本支持边界,与 mermaid mindmap 的 4 点真实差距
写 README 的方式直接出思维导图是 markmap 最大的卖点——标题分层级、列表列要点,几秒生成。但富文本里数学公式、代码高亮的离线限制、与 mermaid mindmap 的语法差异、折叠展开的导出行为都有坑。这篇把语法速成、富文本边界、对比 mermaid、导出陷阱讲清楚
🧠 思维导图 2026-05-17
Mermaid 14 种图表怎么选 + 90% 渲染报错的真实原因,从首行类型名到中文标点全排查
Mermaid 一段代码生成流程图、时序图、ER 图,但新手十次有九次卡在"渲染失败"红字上。这篇把 14 种图表的选用场景串成决策树,再拆开新手最常踩的 6 类报错——首行类型名拼写、中文标点、未转义括号、版本语法差异、箭头风格混用、保留字冲突——给到对照修复方案
🧜 Mermaid 图表 2026-05-17
网文 TXT 转 EPUB:章节识别为什么会翻车,正则、卷篇、番外的全套修复方案
TXT 转出来的 EPUB 目录全是"整本一章"或者多了几百个奇怪条目?多半是章节正则没覆盖到。这篇拆开默认正则覆盖的 7 种命名、卷/篇/部层级处理、序章/楔子/番外的特殊处理、笔趣阁广告和正文前目录页的自动剔除,并给出 5 种典型坏样本的修复方法
📚 TXT 转 EPUB 2026-05-17
JWT 签发实战:refresh 轮换、滑动会话与强制注销
JWT 无状态等于"签出去的 token 收不回来"——这篇按一次登录的完整生命周期,讲清 refresh 轮换、token family、重放检测、滑动会话、多设备登出的工程实现
🪪 JWT 签发 2026-05-15
用正则铁路图调试:5 种从图上一眼看出来的坑
铁路图把正则变成可视化流程图——但它的价值不在"好看",而在帮你**一眼看出潜藏的 bug**。这篇拆解 5 种从图上立刻能识别的反模式:嵌套量词回溯灾难、漏 anchor、过度宽容、贪婪/惰性陷阱、前后瞻看不出消耗——以及什么时候图也救不了你。
🛤️ 正则铁路图 2026-05-11
DuckDB SQL 方言速查:QUALIFY / GROUP BY ALL / EXCLUDE / lambda 等 PostgreSQL 没有的语法
DuckDB 在 PostgreSQL 兼容基础上加了一堆"写起来就回不去"的语法糖——QUALIFY 替代窗口函数子查询、GROUP BY ALL 不用列名、SELECT * EXCLUDE 排除几列、列表 lambda、UNNEST 展开。这篇按实操场景列出 12 个最值得记的扩展,每个配 SQL 例子。
🦆 DuckDB SQL 工作台 2026-05-08
DuckDB vs SQLite vs Pandas:列存 + 向量化为什么聚合快 100 倍 + 选型决策树
DuckDB、SQLite、Pandas 表面上都能查表跑聚合,但底层架构完全不同——DuckDB 是列存 + 向量化的 OLAP 引擎,SQLite 是行存 + 单行迭代的 OLTP,Pandas 是内存 DataFrame。这篇拆解三者的真实差异、性能数量级,以及什么场景该选哪个。
🦆 DuckDB SQL 工作台 2026-05-08
NDJSON / JSONL 全解:什么时候比 JSON 数组好用 + 5 个实操踩坑
NDJSON(每行一个 JSON 对象)是日志、数据管道、LLM 训练集的事实标准。这篇拆解它和 JSON 数组的本质差异、流式解析的实现、字段集合不一致的处理,以及行内换行 / BOM / 空行三个最容易翻车的细节。
≡ NDJSON / JSONL 2026-05-08
SQLite vs PostgreSQL / MySQL:什么时候该选 SQLite + 真实并发瓶颈在哪
SQLite 是世界上部署最广的数据库(手机、浏览器、Notion、ChatGPT 都在用),但很多人误以为它只能做"小项目玩具"。这篇拆解 SQLite 的真实生产能力、并发瓶颈出现在哪、什么场景该选 SQLite 而不是 Postgres / MySQL。
🗄️ SQLite 在线编辑 2026-05-08
SQLite 上生产必调的 6 个 PRAGMA:WAL 模式、cache_size、synchronous 实操
SQLite 默认配置是 1990 年代为软盘和单进程优化的,直接上生产慢且易撞 "database is locked"。这篇拆解 journal_mode=WAL、synchronous=NORMAL、cache_size、mmap_size、temp_store、busy_timeout 6 个必调项,以及 WAL checkpoint 机制和锁冲突的根因。
🗄️ SQLite 在线编辑 2026-05-08
文件批量重命名:正则捕获组、序号补零和命名规范
用正则 \1 \2 重排文件名字段、给序号统一补零、按日期前缀排序——三个核心操作和五个常见场景
🔠 文件批量重命名 2026-05-05
HEX 与文本互转:字节、UTF-8 编码和开发者实用场景
为什么一个汉字在 HEX 里是 6 个字符?BOM 是什么?调试协议、查文件格式、检查乱码根源——这些场景都需要读懂 HEX
📝 HEX ↔ 文本 2026-05-05
SVG 坐标系实战:viewBox、viewport 和图标主题色的完整解法
为什么 SVG 缩放后变形?width height 和 viewBox 到底哪个控制尺寸?图标颜色怎么用 CSS 改——三个问题一次说清
🖋 SVG 编辑预览 2026-05-05
XML 实战速查:和 JSON 的本质差异、命名空间和 XPath 10 条常用表达式
为什么 XML 没被 JSON 完全取代?namespace 乱码怎么读?XPath 查节点比写循环快十倍——开发者必知的三个 XML 实用知识点
</> XML 工具 2026-05-05
SAN、CN、通配符:浏览器到底按什么规则匹配证书
CN 字段在 Chrome 58 起被忽略,SAN 是唯一标准;`*.example.com` 不匹配 `example.com` 也不匹配 `a.b.example.com`;IP 证书必须放 iPAddress SAN。RFC 6125 的实际行为速查
🔏 证书解析 2026-05-03
CIDR 子网划分 5 分钟讲清:/24、/27、/30 心算与 AWS VPC 切法
CIDR 前缀长度 ↔ 子网掩码 ↔ 主机数 三角换算的速算法、为什么 /31 在点对点链路有特殊待遇、AWS VPC 推荐的 /16 + /24 切分模板
🌐 IP 工具箱 2026-05-03
文件秒传与去重背后的 hash 选型:MD5 够吗、分块怎么切、碰撞要不要怕
百度网盘"秒传"、Git/Dropbox/IPFS 的去重、rsync 的增量同步全靠 hash。整文件 vs 固定分块 vs 内容定义切块(CDC)、加密 vs 非加密 hash、碰撞概率的真实数字
#️⃣ Hash 2026-05-03
BSON 比 JSON 多了什么:ObjectId 时间戳 / Decimal128 / Long 精度
MongoDB 不用 JSON 的工程理由 + 几个 BSON 专属类型的实际价值 + JS 端处理的精度陷阱
🍃 BSON / MongoDB 2026-05-02
中文 Web 字体瘦身:把 15 MB 思源黑体压到 8 KB
子集化原理 + 完整 @font-face 配置 + font-display / unicode-range / FOUT vs FOIT —— 一个标题用一个特殊字体的工业级流程
🅰 字体子集化 2026-05-02
文件魔数速查:前 8 字节决定一切
PNG 89 50 4E 47 / JPEG FF D8 FF / PDF 25 50 44 46 —— 30 个常见格式的魔数表 + 怎么用 Hex 工具一眼认文件
🔬 Hex 二进制查看 2026-05-02
HAR 瀑布图怎么读:用 timing 拆出首屏阻塞和慢接口
blocked / dns / connect / ssl / send / wait / receive 七段 timing 各代表什么——读懂这条线就知道慢在哪一段,能不能修
🌐 HAR 文件分析 2026-05-02
Parquet vs CSV:列存到底快在哪 / 该不该把 CSV 改成 Parquet
列裁剪 / 谓词下推 / 字典编码 / RLE —— 把 10 GB CSV 压成 1.2 GB Parquet 的不是魔法,是四个组合技
📑 Parquet 预览 2026-05-02
抓包看 TLS 握手:SNI / ALPN / 证书 / Alert 一条线读出来
拿到一份 pcap 别再去翻 Wireshark 树状视图——握手失败的根因 80% 在 ClientHello 和 Alert 里,按这条线索三秒就能定位
🦈 PCAP 抓包查看 2026-05-02
没有 .proto 也能解 protobuf:wire format 内部机制完整解读
varint / ZigZag / length-delimited 三种编码原理 + 为什么 protobuf 字段顺序不影响兼容性 + 怎么手算每个字节
🧬 Protobuf 解码 2026-05-02
用铁路图拆解真实世界的正则:密码 / URL / SemVer / 邮箱
字符串看不懂的复杂正则,画成铁路图后嵌套量词、分支、零宽断言一目了然——四个工业级例子带你练熟读图肌肉
🛤️ 正则铁路图 2026-05-02
浏览器里直接跑 DuckDB SQL:分析 Parquet / CSV / Excel 不用装环境
拖入 Parquet / CSV / Excel 文件,浏览器里直接写 SQL 跑 JOIN、聚合、窗口函数——DuckDB-Wasm 把整套 OLAP 引擎搬进了 V8,pandas 装不动 / Excel 透视表点不过来时这是更短的一条路。
🦆 DuckDB SQL 工作台 2026-05-01
Excel 多 sheet 跨表 JOIN 怎么做:用 SQL 替代 VLOOKUP / Power Query
VLOOKUP 嵌套到第三层就难维护,Power Query 操作链记不住——把 .xlsx 拖进浏览器写 SQL,多 sheet 之间 JOIN / UNION / 聚合一行搞定,不用装 pandas、不用上传服务器。
🦆 DuckDB SQL 工作台 2026-05-01
JSON 推断 Schema 的局限:少量样本能告诉你什么、告诉不了什么
required 该不该都设?null 是缺失还是有效值?enum 几个候选才算 enum?这篇讲清自动推断的边界与人工补刀的优先级
⇢ JSON 转 Schema 2026-04-27
JWT 签名算法选型:HS256、RS256、ES256、PS256 到底用哪个
HMAC 共享密钥还是非对称公私钥?椭圆曲线比 RSA 快多少?密钥多长才够?这篇按场景给出选型决策树
🪪 JWT 签发 2026-04-27
JWT 验签的四个坑:alg confusion、kid 注入、JWKS 拉取、时钟漂移
验签代码看似几行,攻击面却很广——这篇拆解四个最常见的 JWT 验签漏洞,并给出每一个的正确防御写法
✅ JWT 验签 2026-04-27
UUID v4 vs v7:数据库主键到底该选哪个
v4 随机性好但索引性能差,v7 自带时序但暴露生成时间——这篇按数据库引擎、QPS、隐私需求给出 UUID 主键选型决策
🆔 UUID 生成 2026-04-27
X.509 证书字段全解读:SAN、CN、密钥用途、证书链到底各管什么
浏览器为什么不再认 CN?SAN 怎么写?根证书 vs 中间证书 vs 叶子证书的关系?这篇把 X.509 的关键字段一次讲透
🔏 证书解析 2026-04-27
大文件 Base64 的真实代价:+33% 体积、内存爆炸、Data URL 限制
Base64 不是为大文件设计的——10MB 文件编完吃掉 40MB+ 内存,Data URL 在浏览器里有 2MB 软限制,别滥用
📁 文件/图片 Base64 2026-04-26
301 vs 302 vs 307 vs 308:HTTP 跳转该用哪个?永久、临时与方法保留的真实差别
301/308 永久、302/307 临时只是表层;真正的分水岭是"客户端能不能换 method"——POST 跳转里这事会让用户重复下单或丢数据
📡 HTTP 状态码 / MIME 速查 2026-04-26
IP 地址完整路径:公网、内网、NAT、IPv6 怎么协作
为什么家里电脑 IP 是 192.168.1.X,公司是 10.X,校园是 172.X——三个段、CIDR、NAT 与 IPv6 一次讲透
🌐 IP 工具箱 2026-04-26
JSON ↔ Schema ↔ TypeScript 三向转换:null、optional、oneOf 怎么对应
从样本 JSON 推 Schema、从 Schema 生 TS 类型——三种语言对"可空""可选""联合类型"的表达方式互不重合,自动转换会丢信息或多生成
TS JSON Schema 转 TS 2026-04-26
JWT 该存哪里?localStorage、Cookie、HttpOnly Cookie + 刷新令牌策略
JWT 存 localStorage 怕 XSS、存 Cookie 怕 CSRF、HttpOnly 又不能 JS 访问——三种方案各有取舍;这篇讲清场景化选型 + 刷新令牌的设计
🎟️ JWT 解析 2026-04-26
LLM 长上下文的成本工程:prefix cache、chunk 检索、压缩策略
100 万 token 上下文听着诱人,实际成本可能压垮预算——这篇讲清 prefix cache 命中率、RAG chunk 设计、上下文压缩三种降本手段
🧠 LLM Token 计数 2026-04-26
Markdown 方言对比:CommonMark / GFM / 微信 / 飞书 / 语雀的语法差异
同一份 Markdown 在 GitHub 渲染正常、微信公众号缩进失效、飞书表格变形——不是工具 bug,是各平台用了不同的 Markdown 方言
✍️ Markdown 编辑器 2026-04-26
Markdown 转公众号的四个排版坑:白名单样式、代码块、图片、中英空格
公众号编辑器把外部样式裁得只剩一半——粘贴前看清这四个高频翻车点,省掉来回调整
📰 Markdown 转公众号 2026-04-26
OG 图 1200×630 由来 + 微信/Twitter/LinkedIn/Slack 抓取规则差异
同一个 OG 图,发到微信被压缩成 5:4、发到 Twitter 自动裁中间、LinkedIn 不识别 og:image:secure_url——理解每个平台的抓取规则和缓存机制,才能让链接预览图真的按你想要的样子显示
🃏 OG 卡片预览 2026-04-26
正则方言差异:PCRE / POSIX / JavaScript / Python 的不兼容点
同一个正则在 grep 里能用、在 JS 里报错——不是工具 bug,是 PCRE / POSIX / ECMAScript / PCRE2 等多套规范并存;这篇讲清各方言的关键差异
🔎 正则测试 2026-04-26
拿到 .db 文件之后:浏览器里看懂 SQLite 的最短路径
不装本地工具、不上传服务器,用浏览器打开 .db / .sqlite / .sqlite3 文件——从识别格式、扫 schema、写查询、改数据,到导出 CSV/JSON 给同事的完整流程。
🗄️ SQLite 在线编辑 2026-04-26
2038 年问题:32 位 Unix 时间戳何时溢出,64 位迁移到哪了
2038 年 1 月 19 日 03:14:08 UTC,32 位有符号 int 存的 Unix 时间戳会溢出变成 1901 年——这不是远期问题,已经在金融、嵌入式系统造成事故
🕐 时间戳 2026-04-26
URL 解析的隐藏规则:path 和 query 编码不一样、IDN 中文域名、fragment 不发服务器
encodeURI vs encodeURIComponent 不是哪个"更安全"——它们对应 URL 不同部分;中文域名走 punycode、hash 永远不上服务器
🧩 URL 参数解析 2026-04-26
URL 在 HTML / JS / SQL 中的多重编码:XSS、注入防御实战
同一个用户输入在 URL、HTML 属性、JS 字符串、SQL 查询中需要不同编码——单层 escape 防不住多层注入;这篇讲清编码场景与防御
🔗 URL 编解码 2026-04-26
User-Agent 不再可靠:UA 冻结、Client Hints 与设备识别的边界
浏览器都在冻结 UA 字符串,反爬识别越来越靠 Client Hints 和指纹;理解边界才不会写出"明天就失效"的判断逻辑
🕵️ User-Agent 解析 2026-04-26
字数统计为什么各家算的不一样:Word、公众号、小红书、X 各算各的
同一段文字 Word 显示 1200 字、公众号显示 1850 字、小红书显示 980 字——三种口径各按各的标准,写作前先看目标平台
📃 字数统计 2026-04-26
YAML / CSV / XML 互转的三个坑:缩进、引号、命名空间
三种格式底层模型差异巨大——CSV 是二维表、YAML 是树、XML 既是树又是文档;强行互转会丢东西
↹ YAML/CSV/XML 互转 2026-04-26
ZIP 打包跨平台坑:中文文件名乱码、压缩比、密码强度怎么选
ZIP 在 Windows 上正常的中文名到 Mac/Linux 变乱码——不是工具 bug,是 ZIP 格式默认 GBK 编码、UTF-8 标志位很多老压缩软件不写
🗂️ ZIP 打包 2026-04-26
ZIP / 7z / RAR 解压的三大坑:加密强度、中文乱码、格式取舍
ZipCrypto 加密形同虚设、中文文件名乱码源于 GBK 历史包袱、tar.gz 和 7z 的取舍各有场景
📂 在线解压 2026-04-26
解压陷阱:Zip Slip 路径穿越攻击与 ZIP Bomb 防御
解压代码"看着没问题"——但恶意 ZIP 可以写到 /etc/passwd 或解压成 4.5PB 把磁盘填爆;这篇讲清两类攻击和工程级防御
📂 在线解压 2026-04-26
并交差集在数据核对中的三种用法
对两份名单算差异不用写 SQL——按行去重 + 集合运算 10 秒出结果
🧹 文本去重 2026-04-25
encodeURIComponent vs encodeURI 到底选哪个
空格变 + 还是 %20、& 要不要转、中文怎么办——URL 编码三大函数一次讲清
🔗 URL 编解码 2026-04-23
LLM Tokenizer 原理:为什么中文输入比英文贵一倍
BPE 分词、中文一字两 token、emoji 占 3 token——按 token 计费时这些差异就是真金白银
🧠 LLM Token 计数 2026-04-23
Prettier 能做的和做不到的——7 类问题格式化救不了
重复的 object key、未使用的变量、语义错误的 JSX——Prettier 只管排版,这些得 ESLint/TS 编译器管
🪄 代码格式化 2026-04-23
ZipCrypto vs AES-256:为什么 ZipCrypto 几秒被爆破,AES-256 才是真加密
ZipCrypto vs AES-256 全面对比——1989 年的 ZipCrypto 在已知明文攻击下形同虚设,加密 ZIP 必须选 AES-256;附两者速度、兼容性、密码强度速查表
🔐 加密 ZIP 2026-04-23
JSON 对比:语义 diff 和行 diff 差在哪
key 顺序、数组有无序、数值和字符串——用文本 diff 对 JSON 为什么漏报和误报
⇄ JSON 对比 2026-04-22
JSON Schema Draft 7 / 2019-09 / 2020-12 差异迁移
$ref 规则改了、依赖关键字拆分、数组校验换语法——升级 Schema 要避开的坑
✓ JSON Schema 校验 2026-04-22
JWT 签名不是加密——Token 里装的全是明文
alg:none 绕过、HS256/RS256 混淆、payload 明文可读……JWT 四个最常见的误解一次讲清
🎟️ JWT 解析 2026-04-22
Unicode 同形字钓鱼:看起来一样的域名和账号
西里尔 а 不是拉丁 a、全角空格 vs 半角、NFC/NFD 不同——肉眼识别不了,程序看得清
🔣 Unicode 编解码 2026-04-22
Base64 解码失败的 6 个原因
padding 丢了、换行混进去、URL 转义搞错……从报错反推问题,一次排清
🔠 Base64 2026-04-21
Cron 时区陷阱与 DST 漂移
跨时区部署后定时任务全跑错点?DST 切换的那一小时会漏执行还是重复执行?一次讲清
⏰ Cron 2026-04-21
HMAC 是什么?API 签名从这里开始
为什么 API 要用 HMAC 签名而不是直接 SHA256?长度扩展攻击、时序攻击、重放——一次讲清
#️⃣ Hash 2026-04-21
JSON 格式 7 个必踩的坑
尾逗号、单引号、注释、数字精度、BOM……解析失败 90% 是这些,每个都给修复方案
{} JSON 工具 2026-04-21
10 个常用的 JSONPath 查询模式
从 $.a.b 到过滤表达式,覆盖接口调试、日志排查 90% 场景,每个模式都附 JS 写法对照
{} JSON 工具 2026-04-21
正则回溯灾难:一行表达式拖垮服务
为什么 `(a+)+b` 在长字符串上卡几分钟?回溯原理、ReDoS 攻击与修复手法
🔎 正则测试 2026-04-21
5 分钟看懂 Cron 表达式
从 5 个字段到通配符,一次讲清 Linux/Spring/Quartz 三种格式的区别
⏰ Cron 2026-04-18
10 个最常用的正则表达式
邮箱、手机号、身份证、URL……日常校验直接复制就能用,附每个表达式的坑
🔎 正则测试 2026-04-17
MD5、SHA-1、SHA-256 怎么选?
哈希算法速度、碰撞风险、适用场景一次说清——不是越长越好
#️⃣ Hash 2026-04-12
Base64 不是加密:它到底是什么?
原理、为什么会膨胀 33%、data URL 是什么——10 分钟搞懂 Base64
🔠 Base64 2026-04-10
Unix 时间戳的时区坑:你以为的"现在"不是真的"现在"
时间戳本身无时区,为什么两个时区的人看到的时间不一样?
🕐 时间戳 2026-04-08
SOS 不是 Save Our Ship 的缩写:摩斯电码的冷知识
1840 年代的编码为什么活过了 4G 时代?海事、航空、间谍至今还在用
📡 摩斯电码 2026-03-15
git diff 为什么这么快?Myers 算法原理
从暴力 O(n²) 到 O((n+m)d),1986 年的算法至今没被超越
🔀 文本对比 2026-02-25