跳到主要内容

拓扑与流程

本文档描述矿工节点的三容器部署拓扑和启动流程。

架构概览

矿工节点使用由 miner-cli 生成的三容器拓扑:

各容器职责:

  • 推理运行时:服务模型并暴露 OpenAI 兼容端点
  • dcgm-exporter:提供 GPU 指标
  • miner-agent:读取运行时和指标状态,把签名后的注册、心跳和挑战数据发送给平台

Agent 职责

miner-agent 不负责管理模型进程生命周期。它的核心职责包括:

  • ${MINER_HOME}/config.json 加载或生成身份
  • 注册节点
  • 按固定间隔发送签名心跳
  • 在控制面要求时拉取并回答挑战
  • 通过 /metrics 探测运行时
  • dcgm-exporter 读取 GPU 指标
  • 暴露本地健康、就绪、身份和控制 API
自定义身份

如需自定义身份,需挂载 ${MINER_HOME} 目录并自定义 config.json 文件。

启动流程

就绪检查

/readyz 在以下场景返回 503

  • 节点尚未注册
  • 3 * MINER_HEARTBEAT_INTERVAL_SECONDS 内没有成功心跳
  • 仍有待处理挑战
备注

这个就绪检查描述的是 agent 控制面状态,不等同于模型是否有足够业务容量。

相关文档