跳转至

数据库

数据库管理功率、气象、历史预测、实测回流和标准化数据集。它不是单个物理数据库,而是物理文件、对象存储、索引表和数据质量报告的组合。

负责人

数据库由陈路负责 schema、数据入口登记、数据质量口径和同步链路验收。

现有数据入口

台账文件:registries/data_sources.csv

数据入口 类型 地址 / 路径 当前状态 凭据口径
科越二维码上传 Web 管理后台 https://dataadmin.nature4cast.com/ 已有 账号、密码、API key 向陈路申请,不写入 git
新增站点上传 服务器目录 /data/hdd1/ftp_upload/ftp_user/sitedata 已有 服务器权限向陈路申请
中能融合数据同步 MySQL 192.168.60.21:3306/znrh_power_standard_qdkeyue 已有 用户名 reader;密码 lT4rEPGY1Q3LwwNAWQyt
南网比赛数据 待建设 待定 未建设 待定

敏感信息管理

API key、token、私钥和客户侧连接串不得写入 git。内网只读数据库账号如经负责人确认,可在台账登记,便于建设期联调和排查。

台账

台账文件:registries/datasets.csv

核心字段:

字段 含义
dataset_id 数据集唯一 ID
project_id 归属项目
station_id 归属场站
data_type 功率、气象、历史预测、实测等
source_type MySQL、CSV、对象存储、手工补录等
time_range 数据覆盖时间范围
resolution 15min、5min、hourly 等
storage_uri 对象存储或文件路径
quality_status 未质检、通过、需修复、不可用
owner 数据责任人

SOP

  1. 原始数据先进入 raw 区。
  2. 执行标准化和数据质量检查。
  3. 通过质检后冻结为 dataset_id
  4. 实验库只能引用冻结数据集。
  5. 数据修复生成新版本,不覆盖旧版本。