数据空间 (Data Spaces)
数据空间 (DuckLake) 是 Datadata 平台提供的数据托管服务,基于 DuckDB 引擎,让你可以在平台上直接创建和管理数据表。
什么是数据空间
数据空间是平台托管的数据存储,具有以下特点:
- 基于 DuckDB 引擎
- 直接通过 API 或 AI Skills 进行表的创建、写入和删除
- 可以与外部数据源一起参与跨源关联查询
创建数据空间
- 在 Studio 侧边栏点击 数据源
- 点击 新建数据源 → 新建数据空间
- 填写数据空间名称
- 创建完成
管理数据空间中的表
通过 API 可以执行以下操作:
| 操作 | API 权限 | 说明 |
|---|---|---|
| 创建表 | data-spaces:write | 在数据空间中建表 |
| 批量插入数据 | data-spaces:write | 向表中写入数据 |
| 删除表 | data-spaces:write | 删除已有表 |
| 查询数据 | data-spaces:read | 读取数据空间中的数据 |
使用场景
- 数据清洗 — 将 CSV 等文件上传后,通过 DQL 脚本进行清洗和转换
- 中间结果存储 — 保存数据处理的中间结果供后续分析
- 数据集成 — 将来自不同数据源的数据整合到统一的数据空间