文件批量重命名:正则捕获组、序号补零和命名规范
用正则 \1 \2 重排文件名字段、给序号统一补零、按日期前缀排序——三个核心操作和五个常见场景
🔠 文件批量重命名 2026-05-05
HEX 与文本互转:字节、UTF-8 编码和开发者实用场景
为什么一个汉字在 HEX 里是 6 个字符?BOM 是什么?调试协议、查文件格式、检查乱码根源——这些场景都需要读懂 HEX
📝 HEX ↔ 文本 2026-05-05
SVG 坐标系实战:viewBox、viewport 和图标主题色的完整解法
为什么 SVG 缩放后变形?width height 和 viewBox 到底哪个控制尺寸?图标颜色怎么用 CSS 改——三个问题一次说清
🖋 SVG 编辑预览 2026-05-05
XML 实战速查:和 JSON 的本质差异、命名空间和 XPath 10 条常用表达式
为什么 XML 没被 JSON 完全取代?namespace 乱码怎么读?XPath 查节点比写循环快十倍——开发者必知的三个 XML 实用知识点
</> XML 工具 2026-05-05
SAN、CN、通配符:浏览器到底按什么规则匹配证书
CN 字段在 Chrome 58 起被忽略,SAN 是唯一标准;`*.example.com` 不匹配 `example.com` 也不匹配 `a.b.example.com`;IP 证书必须放 iPAddress SAN。RFC 6125 的实际行为速查
🔏 证书解析 2026-05-03
CIDR 子网划分 5 分钟讲清:/24、/27、/30 心算与 AWS VPC 切法
CIDR 前缀长度 ↔ 子网掩码 ↔ 主机数 三角换算的速算法、为什么 /31 在点对点链路有特殊待遇、AWS VPC 推荐的 /16 + /24 切分模板
🌐 IP 工具箱 2026-05-03
文件秒传与去重背后的 hash 选型:MD5 够吗、分块怎么切、碰撞要不要怕
百度网盘"秒传"、Git/Dropbox/IPFS 的去重、rsync 的增量同步全靠 hash。整文件 vs 固定分块 vs 内容定义切块(CDC)、加密 vs 非加密 hash、碰撞概率的真实数字
#️⃣ Hash 2026-05-03
BSON 比 JSON 多了什么:ObjectId 时间戳 / Decimal128 / Long 精度
MongoDB 不用 JSON 的工程理由 + 几个 BSON 专属类型的实际价值 + JS 端处理的精度陷阱
🍃 BSON / MongoDB 2026-05-02
中文 Web 字体瘦身:把 15 MB 思源黑体压到 8 KB
子集化原理 + 完整 @font-face 配置 + font-display / unicode-range / FOUT vs FOIT —— 一个标题用一个特殊字体的工业级流程
🅰 字体子集化 2026-05-02
文件魔数速查:前 8 字节决定一切
PNG 89 50 4E 47 / JPEG FF D8 FF / PDF 25 50 44 46 —— 30 个常见格式的魔数表 + 怎么用 Hex 工具一眼认文件
🔬 Hex 二进制查看 2026-05-02
HAR 瀑布图怎么读:用 timing 拆出首屏阻塞和慢接口
blocked / dns / connect / ssl / send / wait / receive 七段 timing 各代表什么——读懂这条线就知道慢在哪一段,能不能修
🌐 HAR 文件分析 2026-05-02
Parquet vs CSV:列存到底快在哪 / 该不该把 CSV 改成 Parquet
列裁剪 / 谓词下推 / 字典编码 / RLE —— 把 10 GB CSV 压成 1.2 GB Parquet 的不是魔法,是四个组合技
📑 Parquet 预览 2026-05-02
抓包看 TLS 握手:SNI / ALPN / 证书 / Alert 一条线读出来
拿到一份 pcap 别再去翻 Wireshark 树状视图——握手失败的根因 80% 在 ClientHello 和 Alert 里,按这条线索三秒就能定位
🦈 PCAP 抓包查看 2026-05-02
没有 .proto 也能解 protobuf:wire format 内部机制完整解读
varint / ZigZag / length-delimited 三种编码原理 + 为什么 protobuf 字段顺序不影响兼容性 + 怎么手算每个字节
🧬 Protobuf 解码 2026-05-02
用铁路图拆解真实世界的正则:密码 / URL / SemVer / 邮箱
字符串看不懂的复杂正则,画成铁路图后嵌套量词、分支、零宽断言一目了然——四个工业级例子带你练熟读图肌肉
🛤️ 正则铁路图 2026-05-02
浏览器里直接跑 DuckDB SQL:分析 Parquet / CSV / Excel 不用装环境
拖入 Parquet / CSV / Excel 文件,浏览器里直接写 SQL 跑 JOIN、聚合、窗口函数——DuckDB-Wasm 把整套 OLAP 引擎搬进了 V8,pandas 装不动 / Excel 透视表点不过来时这是更短的一条路。
🦆 DuckDB SQL 工作台 2026-05-01
Excel 多 sheet 跨表 JOIN 怎么做:用 SQL 替代 VLOOKUP / Power Query
VLOOKUP 嵌套到第三层就难维护,Power Query 操作链记不住——把 .xlsx 拖进浏览器写 SQL,多 sheet 之间 JOIN / UNION / 聚合一行搞定,不用装 pandas、不用上传服务器。
🦆 DuckDB SQL 工作台 2026-05-01
JSON 推断 Schema 的局限:少量样本能告诉你什么、告诉不了什么
required 该不该都设?null 是缺失还是有效值?enum 几个候选才算 enum?这篇讲清自动推断的边界与人工补刀的优先级
⇢ JSON 转 Schema 2026-04-27
JWT 签名算法选型:HS256、RS256、ES256、PS256 到底用哪个
HMAC 共享密钥还是非对称公私钥?椭圆曲线比 RSA 快多少?密钥多长才够?这篇按场景给出选型决策树
🪪 JWT 签发 2026-04-27
JWT 验签的四个坑:alg confusion、kid 注入、JWKS 拉取、时钟漂移
验签代码看似几行,攻击面却很广——这篇拆解四个最常见的 JWT 验签漏洞,并给出每一个的正确防御写法
✅ JWT 验签 2026-04-27
UUID v4 vs v7:数据库主键到底该选哪个
v4 随机性好但索引性能差,v7 自带时序但暴露生成时间——这篇按数据库引擎、QPS、隐私需求给出 UUID 主键选型决策
🆔 UUID 生成 2026-04-27
X.509 证书字段全解读:SAN、CN、密钥用途、证书链到底各管什么
浏览器为什么不再认 CN?SAN 怎么写?根证书 vs 中间证书 vs 叶子证书的关系?这篇把 X.509 的关键字段一次讲透
🔏 证书解析 2026-04-27
大文件 Base64 的真实代价:+33% 体积、内存爆炸、Data URL 限制
Base64 不是为大文件设计的——10MB 文件编完吃掉 40MB+ 内存,Data URL 在浏览器里有 2MB 软限制,别滥用
📁 文件/图片 Base64 2026-04-26
301 vs 302 vs 307 vs 308:HTTP 跳转该用哪个?永久、临时与方法保留的真实差别
301/308 永久、302/307 临时只是表层;真正的分水岭是"客户端能不能换 method"——POST 跳转里这事会让用户重复下单或丢数据
📡 HTTP 状态码 / MIME 速查 2026-04-26
IP 地址完整路径:公网、内网、NAT、IPv6 怎么协作
为什么家里电脑 IP 是 192.168.1.X,公司是 10.X,校园是 172.X——三个段、CIDR、NAT 与 IPv6 一次讲透
🌐 IP 工具箱 2026-04-26
JSON ↔ Schema ↔ TypeScript 三向转换:null、optional、oneOf 怎么对应
从样本 JSON 推 Schema、从 Schema 生 TS 类型——三种语言对"可空""可选""联合类型"的表达方式互不重合,自动转换会丢信息或多生成
TS JSON Schema 转 TS 2026-04-26
JWT 该存哪里?localStorage、Cookie、HttpOnly Cookie + 刷新令牌策略
JWT 存 localStorage 怕 XSS、存 Cookie 怕 CSRF、HttpOnly 又不能 JS 访问——三种方案各有取舍;这篇讲清场景化选型 + 刷新令牌的设计
🎟️ JWT 解析 2026-04-26
LLM 长上下文的成本工程:prefix cache、chunk 检索、压缩策略
100 万 token 上下文听着诱人,实际成本可能压垮预算——这篇讲清 prefix cache 命中率、RAG chunk 设计、上下文压缩三种降本手段
🧠 LLM Token 计数 2026-04-26
Markdown 方言对比:CommonMark / GFM / 微信 / 飞书 / 语雀的语法差异
同一份 Markdown 在 GitHub 渲染正常、微信公众号缩进失效、飞书表格变形——不是工具 bug,是各平台用了不同的 Markdown 方言
✍️ Markdown 编辑器 2026-04-26
Markdown 转公众号的四个排版坑:白名单样式、代码块、图片、中英空格
公众号编辑器把外部样式裁得只剩一半——粘贴前看清这四个高频翻车点,省掉来回调整
📰 Markdown 转公众号 2026-04-26
OG 图 1200×630 由来 + 微信/Twitter/LinkedIn/Slack 抓取规则差异
同一个 OG 图,发到微信被压缩成 5:4、发到 Twitter 自动裁中间、LinkedIn 不识别 og:image:secure_url——理解每个平台的抓取规则和缓存机制,才能让链接预览图真的按你想要的样子显示
🃏 OG 卡片预览 2026-04-26
正则方言差异:PCRE / POSIX / JavaScript / Python 的不兼容点
同一个正则在 grep 里能用、在 JS 里报错——不是工具 bug,是 PCRE / POSIX / ECMAScript / PCRE2 等多套规范并存;这篇讲清各方言的关键差异
🔎 正则测试 2026-04-26
拿到 .db 文件之后:浏览器里看懂 SQLite 的最短路径
不装本地工具、不上传服务器,用浏览器打开 .db / .sqlite / .sqlite3 文件——从识别格式、扫 schema、写查询、改数据,到导出 CSV/JSON 给同事的完整流程。
🗄️ SQLite 在线编辑 2026-04-26
2038 年问题:32 位 Unix 时间戳何时溢出,64 位迁移到哪了
2038 年 1 月 19 日 03:14:08 UTC,32 位有符号 int 存的 Unix 时间戳会溢出变成 1901 年——这不是远期问题,已经在金融、嵌入式系统造成事故
🕐 时间戳 2026-04-26
URL 解析的隐藏规则:path 和 query 编码不一样、IDN 中文域名、fragment 不发服务器
encodeURI vs encodeURIComponent 不是哪个"更安全"——它们对应 URL 不同部分;中文域名走 punycode、hash 永远不上服务器
🧩 URL 参数解析 2026-04-26
URL 在 HTML / JS / SQL 中的多重编码:XSS、注入防御实战
同一个用户输入在 URL、HTML 属性、JS 字符串、SQL 查询中需要不同编码——单层 escape 防不住多层注入;这篇讲清编码场景与防御
🔗 URL 编解码 2026-04-26
User-Agent 不再可靠:UA 冻结、Client Hints 与设备识别的边界
浏览器都在冻结 UA 字符串,反爬识别越来越靠 Client Hints 和指纹;理解边界才不会写出"明天就失效"的判断逻辑
🕵️ User-Agent 解析 2026-04-26
字数统计为什么各家算的不一样:Word、公众号、小红书、X 各算各的
同一段文字 Word 显示 1200 字、公众号显示 1850 字、小红书显示 980 字——三种口径各按各的标准,写作前先看目标平台
📃 字数统计 2026-04-26
YAML / CSV / XML 互转的三个坑:缩进、引号、命名空间
三种格式底层模型差异巨大——CSV 是二维表、YAML 是树、XML 既是树又是文档;强行互转会丢东西
↹ YAML/CSV/XML 互转 2026-04-26
ZIP 打包跨平台坑:中文文件名乱码、压缩比、密码强度怎么选
ZIP 在 Windows 上正常的中文名到 Mac/Linux 变乱码——不是工具 bug,是 ZIP 格式默认 GBK 编码、UTF-8 标志位很多老压缩软件不写
🗂️ ZIP 打包 2026-04-26
ZIP / 7z / RAR 解压的三大坑:加密强度、中文乱码、格式取舍
ZipCrypto 加密形同虚设、中文文件名乱码源于 GBK 历史包袱、tar.gz 和 7z 的取舍各有场景
📂 在线解压 2026-04-26
解压陷阱:Zip Slip 路径穿越攻击与 ZIP Bomb 防御
解压代码"看着没问题"——但恶意 ZIP 可以写到 /etc/passwd 或解压成 4.5PB 把磁盘填爆;这篇讲清两类攻击和工程级防御
📂 在线解压 2026-04-26
并交差集在数据核对中的三种用法
对两份名单算差异不用写 SQL——按行去重 + 集合运算 10 秒出结果
🧹 文本去重 2026-04-25
encodeURIComponent vs encodeURI 到底选哪个
空格变 + 还是 %20、& 要不要转、中文怎么办——URL 编码三大函数一次讲清
🔗 URL 编解码 2026-04-23
LLM Tokenizer 原理:为什么中文输入比英文贵一倍
BPE 分词、中文一字两 token、emoji 占 3 token——按 token 计费时这些差异就是真金白银
🧠 LLM Token 计数 2026-04-23
Prettier 能做的和做不到的——7 类问题格式化救不了
重复的 object key、未使用的变量、语义错误的 JSX——Prettier 只管排版,这些得 ESLint/TS 编译器管
🪄 代码格式化 2026-04-23
ZipCrypto vs AES-256:为什么 ZipCrypto 几秒被爆破,AES-256 才是真加密
ZipCrypto vs AES-256 全面对比——1989 年的 ZipCrypto 在已知明文攻击下形同虚设,加密 ZIP 必须选 AES-256;附两者速度、兼容性、密码强度速查表
🔐 加密 ZIP 2026-04-23
JSON 对比:语义 diff 和行 diff 差在哪
key 顺序、数组有无序、数值和字符串——用文本 diff 对 JSON 为什么漏报和误报
⇄ JSON 对比 2026-04-22
JSON Schema Draft 7 / 2019-09 / 2020-12 差异迁移
$ref 规则改了、依赖关键字拆分、数组校验换语法——升级 Schema 要避开的坑
✓ JSON Schema 校验 2026-04-22
JWT 签名不是加密——Token 里装的全是明文
alg:none 绕过、HS256/RS256 混淆、payload 明文可读……JWT 四个最常见的误解一次讲清
🎟️ JWT 解析 2026-04-22
Unicode 同形字钓鱼:看起来一样的域名和账号
西里尔 а 不是拉丁 a、全角空格 vs 半角、NFC/NFD 不同——肉眼识别不了,程序看得清
🔣 Unicode 编解码 2026-04-22
Base64 解码失败的 6 个原因
padding 丢了、换行混进去、URL 转义搞错……从报错反推问题,一次排清
🔠 Base64 2026-04-21
Cron 时区陷阱与 DST 漂移
跨时区部署后定时任务全跑错点?DST 切换的那一小时会漏执行还是重复执行?一次讲清
⏰ Cron 2026-04-21
HMAC 是什么?API 签名从这里开始
为什么 API 要用 HMAC 签名而不是直接 SHA256?长度扩展攻击、时序攻击、重放——一次讲清
#️⃣ Hash 2026-04-21
JSON 格式 7 个必踩的坑
尾逗号、单引号、注释、数字精度、BOM……解析失败 90% 是这些,每个都给修复方案
{} JSON 工具 2026-04-21
10 个常用的 JSONPath 查询模式
从 $.a.b 到过滤表达式,覆盖接口调试、日志排查 90% 场景,每个模式都附 JS 写法对照
{} JSON 工具 2026-04-21
正则回溯灾难:一行表达式拖垮服务
为什么 `(a+)+b` 在长字符串上卡几分钟?回溯原理、ReDoS 攻击与修复手法
🔎 正则测试 2026-04-21
5 分钟看懂 Cron 表达式
从 5 个字段到通配符,一次讲清 Linux/Spring/Quartz 三种格式的区别
⏰ Cron 2026-04-18
10 个最常用的正则表达式
邮箱、手机号、身份证、URL……日常校验直接复制就能用,附每个表达式的坑
🔎 正则测试 2026-04-17
MD5、SHA-1、SHA-256 怎么选?
哈希算法速度、碰撞风险、适用场景一次说清——不是越长越好
#️⃣ Hash 2026-04-12
Base64 不是加密:它到底是什么?
原理、为什么会膨胀 33%、data URL 是什么——10 分钟搞懂 Base64
🔠 Base64 2026-04-10
Unix 时间戳的时区坑:你以为的"现在"不是真的"现在"
时间戳本身无时区,为什么两个时区的人看到的时间不一样?
🕐 时间戳 2026-04-08
SOS 不是 Save Our Ship 的缩写:摩斯电码的冷知识
1840 年代的编码为什么活过了 4G 时代?海事、航空、间谍至今还在用
📡 摩斯电码 2026-03-15
git diff 为什么这么快?Myers 算法原理
从暴力 O(n²) 到 O((n+m)d),1986 年的算法至今没被超越
🔀 文本对比 2026-02-25