Question 1

为什么要等几秒才能用？

Accepted Answer

首次加载时浏览器要下载并实例化 DuckDB-Wasm——包含 35 MB 左右的 wasm 引擎和 700 KB 的 worker 脚本，加载时间取决于网络（一般 3-10 秒）。加载完后整个 SQL 引擎就跑在浏览器里，后续所有查询都是本地执行没有任何网络请求。文件本身不上传：用 db.registerFileBuffer() 注册到 DuckDB 的虚拟文件系统里，引擎读你浏览器内存里的字节，跟传统 ODBC/HTTP 数据库连接完全不一样。

Question 2

支持哪些文件类型？

Accepted Answer

Parquet（.parquet/.pq）、CSV（.csv）、TSV（.tsv）、JSON（.json）、NDJSON / JSONL（.ndjson/.jsonl）、Excel（.xlsx/.xls）。每个文件用 CTAS 物化成 DuckDB 基础表（CREATE TABLE x AS SELECT * FROM read_parquet/read_csv_auto/read_json_auto），所以 UPDATE / INSERT / DELETE 都能直接对它们跑。表名从文件名生成（小写、非字母数字下划线 → _），同名会自动加后缀；Excel 多 sheet 文件每个 sheet 成一张表 <文件名>_。

Question 3

文件多大能跑？

Accepted Answer

1-2 GB 以内比较舒服。DuckDB-Wasm 跑在浏览器主线程的 worker 里，受 V8 单页堆约束（一般 2-4 GB）。Parquet 因为列存 + 压缩通常比 CSV 友好得多——10 GB 的 CSV 可能跑不动，但同等数据的 Parquet 1-2 GB 通常没问题。对超大文件的实战建议：先 LIMIT / WHERE 过滤再聚合，让 DuckDB 的列裁剪和谓词下推帮你省内存。

Question 4

它是真 DuckDB 吗？SQL 语法跟 Postgres 兼容吗？

Accepted Answer

是真 DuckDB，官方 @duckdb/duckdb-wasm 包，跟 CLI 同源，只是编译目标是 WebAssembly。语法层面 DuckDB 高度兼容 PostgreSQL：常用的 CTE / 窗口函数 / QUALIFY / GROUP BY ALL / LIMIT BY / LIST_AGG / lambda 都有；JSON 列用 -> ->> 访问；时间用 INTERVAL / DATE_TRUNC；类型转换用 ::TYPE。不兼容的地方主要是某些 Postgres 特有的系统视图和存储过程，做数据分析几乎用不上。

Question 5

能跑 INSERT / UPDATE / 自建表吗？

Accepted Answer

能，DuckDB-Wasm 在内存里有完整的写入支持。你可以 CREATE TABLE foo AS SELECT ...、INSERT INTO foo VALUES (...)、UPDATE foo SET ...、DELETE FROM foo WHERE ...，但所有结果都在浏览器内存里，关闭页面 / 重置 / 刷新都会丢。本工具自动检测 DML/DDL，把改过的表标记为「未保存」并在顶部弹出提示条，每张表可以一键导出 Parquet / CSV / JSON / Excel 四种格式之一，避免数据丢失。查询结果同样支持四种格式导出。

Question 6

多文件 JOIN 怎么写？

Accepted Answer

把两个文件分别拖进来后会得到两个表名（比如 events 和 users），直接写 SELECT u.name, COUNT(*) FROM events e JOIN users u ON e.user_id = u.id GROUP BY 1 ORDER BY 2 DESC LIMIT 20，跟普通数据库一样。列名补全：在 SELECT 后面输入 表名. 编辑器会弹出该表的所有列，按 Tab 补全；表名本身在 FROM 后输入时也会补全。

Question 7

这工具和 Parquet 预览器有什么区别？

Accepted Answer

Parquet 预览器专注「快速看一眼」：拖进去 3 秒看到 schema、统计、前 N 行，包体积小（hyparquet 约 50 KB），首次打开秒开。SQL 工作台（本工具）面向「真分析 + 改数据」：完整 SQL 引擎、多文件 JOIN、聚合/窗口函数/CTE、DML/DDL、多格式导出都能跑，但首次加载 35 MB wasm 需要几秒。只看一眼用预览器，做分析或改数据用本工具。预览器底部的「相关工具」会自动跳到本工具。

为什么浏览器里跑 DuckDB

隐私设计

一屏完成

多文件 JOIN

配套工具

📍使用场景

❓常见问题