数据库¶
数据库管理功率、气象、历史预测、实测回流和标准化数据集。它不是单个物理数据库,而是物理文件、对象存储、索引表和数据质量报告的组合。
负责人¶
数据库由陈路负责 schema、数据入口登记、数据质量口径和同步链路验收。
现有数据入口¶
台账文件:registries/data_sources.csv
| 数据入口 | 类型 | 地址 / 路径 | 当前状态 | 凭据口径 |
|---|---|---|---|---|
| 科越二维码上传 | Web 管理后台 | https://dataadmin.nature4cast.com/ |
已有 | 账号、密码、API key 向陈路申请,不写入 git |
| 新增站点上传 | 服务器目录 | /data/hdd1/ftp_upload/ftp_user/sitedata |
已有 | 服务器权限向陈路申请 |
| 中能融合数据同步 | MySQL | 192.168.60.21:3306/znrh_power_standard_qdkeyue |
已有 | 用户名 reader;密码 lT4rEPGY1Q3LwwNAWQyt |
| 南网比赛数据 | 待建设 | 待定 | 未建设 | 待定 |
敏感信息管理
API key、token、私钥和客户侧连接串不得写入 git。内网只读数据库账号如经负责人确认,可在台账登记,便于建设期联调和排查。
台账¶
台账文件:registries/datasets.csv
核心字段:
| 字段 | 含义 |
|---|---|
dataset_id |
数据集唯一 ID |
project_id |
归属项目 |
station_id |
归属场站 |
data_type |
功率、气象、历史预测、实测等 |
source_type |
MySQL、CSV、对象存储、手工补录等 |
time_range |
数据覆盖时间范围 |
resolution |
15min、5min、hourly 等 |
storage_uri |
对象存储或文件路径 |
quality_status |
未质检、通过、需修复、不可用 |
owner |
数据责任人 |
SOP¶
- 原始数据先进入 raw 区。
- 执行标准化和数据质量检查。
- 通过质检后冻结为
dataset_id。 - 实验库只能引用冻结数据集。
- 数据修复生成新版本,不覆盖旧版本。