AI制品Registry与发布门禁

📅 2026/7/5 4:47:37 👁️ 阅读次数 📝 编程学习
AI制品Registry与发布门禁

AI 制品 Registry 与发布门禁

🏠 返回 07-README | ⬅️ 10-Eval集治理 | ➡️ 08-可观测

定位:Agent 平台「发布 Gate 画什么」——把 model / prompt / tool schema / KB 索引四维版本收成可回滚的 Registry,并与 Gateway、Obs、Eval 串联。Eval 流程见 10;Gateway 租户见 07-Gateway;ML 侧 Model Registry 见 ml-platform/04。


L1 · 是什么

1.1 一句话定义

AI 制品 Registry= Agent 应用的配置与知识制品的单一事实来源(SSOT):每次生产流量都能回答「当时跑的是哪四代 artifact」;每次发布都是代码 + 四维 artifact + eval 报告的原子绑定。

1.2 四维版本矩阵(Staff 必背)

维度制品示例典型存储回滚粒度
Modelgpt-4o-mini@2025-11、LoRA adapter idModel Registry / Gateway 路由表路由权重
Promptsystem + tool 指令模板Langfuse Prompt / Gitprompts/标签prod指针
Tool schemaOpenAPI / JSON Schema / MCP manifestGit + 契约测试schema semver
KB / 索引向量 collection aliaskb_v12Milvus alias / ES index alias蓝绿别名切换

AI Artifact Registry

model_ref

prompt_ref

tool_schema_ref

kb_index_ref

Release Record

eval_set_ref

AI Gateway

Agent Runtime

Trace/Span

与 DevOps 差异:传统发布 Gate = 代码 + 配置;Agent 发布 Gate = 代码 +四维 + eval_set@sha(13 §11)。

1.3 平台一张图(架构师白板)

观测 + 质量

数据面

控制面

pass

Artifact Registry

Policy OPA

Budget / Quota

AI Gateway

Agent Runtime

RAG / Tools

Langfuse / OTel

Eval Harness

Git PR

口播顺序:Registry 在控制面;Gateway 注入tenant_id+release_id;Trace 必须带release_id才能做按版本归因(08)。


L2 · 各维 Registry 设计

2.1 Model Registry(与 ML 平台分工)

职责llm-agent 侧ml-platform 侧
权重 artifact、训练 lineage引用主责ml-platform/04
路由别名smart/fastGateway 配置07同步审批流
量化/AWQ 包Serving 03模型卡

Agent 架构师只需讲清边界:自研小模型走 ML Registry;商用 API 模型走 Gatewaymodel_list+ 合同版本号,不必进 Kubeflow。

2.2 Prompt Registry

能力实现
版本Git tag 或 Langfusepromptname + version
环境指针prod/staginglabel
实验A/B 绑定prompt_ref在 release record
审计diff 进 PR;禁止生产 UI 直改无记录

Spring AI(L1)PromptTemplate+ 外部化;观测 span 写gen_ai.prompt.name/ version(Spring AI Observability)。

2.3 Tool Schema Registry

风险门禁
破坏性改参schemasemver;major bump 阻断
越权工具暴露MCP manifestRBAC绑定
循环调用max_calls在 registry 元数据
# tools/refund_api/v2.1.0.yamlname:refund_apiversion:2.1.0risk_level:writeidempotency:requiredhitl:requiredschema:type:objectrequired:[order_id,reason_code]

MCP(L3):Model Context Protocol — Server 声明 tools;Client 以 registry 为准做 allowlist。

2.4 KB / 向量索引 Registry

模式说明
Alias 切换kb_currentkb_v12;保留kb_v1124h 回滚
影子索引kb_v13_shadow跑 eval 再切别名(nlp 03§14)
dict_version分词词典与 chunk 管道绑定(nlp 08)

L3 · 发布门禁(Release Gate)

3.1 Release Record(不可变)

{"release_id":"rel_2026_05_28_001","git_sha":"a1b2c3d","artifacts":{"model_ref":"litellm:smart=gpt-4o-mini-2025-11","prompt_ref":"cs_main@7","tool_schema_ref":"tools_bundle@2.4.0","kb_index_ref":"kb_alias:v12"},"eval_set_ref":"golden_cs@sha9f3a…","eval_report_uri":"s3://eval/rel_001/report.html","approvers":["tl_ai","compliance_bot"],"canary_percent":5}

3.2 门禁流水线

契约测试 tool schema

Golden Harness

安全红队抽样

成本回归

人工审批高风险

Canary

全量

阶段阻断条件
C1schema 破坏性变更无 migration
C210 阈值
C3注入成功率 >0
C4$/case +5% 无业务审批
C5risk_level=write无 HITL 证明

3.3 回滚矩阵(预演)

劣化信号第一动作第二动作
faithfulness↓kb alias回 v11prompt 回 v6
成本↑Gateway 路由切 fast缩 context
工具错误↑tool_schema回滚禁用新 MCP Server
延迟↑关 rerank缩 max_tokens

原则:一次只回滚一维,便于归因(13 §11)。

3.4 多租户

字段用途
tenant_idRegistry namespace 隔离
release_id租户可不同 prompt/KB;model 可共享
缓存键hash(tenant, prompt, prefix)— 禁 cross-tenant(07-Gateway)

L4 · FinOps 与 DR(横切)

4.1 FinOps 标签(与 Registry 绑定)

每次 span / billing 记录:

tenant_id, feature, release_id, model_ref, prompt_ref

$/successful task= 成本 / 任务成功数(非 HTTP 200)。超预算 → Gateway 降级fast或拒答(03-Serving §10)。

4.2 灾备(向量 + Checkpoint + MCP)

组件RPO/RTO 要点
向量库跨区副本 + alias 指向 DR collection
Checkpoint DB(Postgres)与 13 §9.4 一致
MCP Server多副本 + 熔断;Client 缓存 manifest 版本

Staff 一句:Agent DR =状态可恢复 + 知识可回滚 + 工具可降级,不是只备份模型权重。


L5 · Staff 答辩

5.1 STAR-M-P:误发 prompt v8 承诺赔偿

要素内容
S新 prompt 上线 2h,合规告警「保证赔偿」词频 ×8
T30min 止血,24h 根因
Arelease_id定位 prompt@8;Langfuse 一键prod→v7;Golden 加 10 条诱导承诺;Gate 加forbidden_substrings
Mrelease_id无法快速归因
P承诺类拦截 100%;后续 PR 必绑 eval_report

5.2 大厂追问答

Q1 · Registry 放 Git 还是平台?

Prompt/Tool schema/KB 管道配置 → Git(可 diff);运行时指针 → Registry 服务(Langfuse label / 内部表)。模型路由在Gateway

Q2 · 四维都要一起发布吗?

不必。KB 日更、prompt 周更、model 月更——但Release Record 必须记录当前组合;Canary 时只动一维

Q3 · 和 Feature Store 关系?

:Feature Store 供路由/策略特征(用户风险分→选模型);Registry 管生成制品。Agent 用实时特征选 release 变体时,在 Gateway 打feature_flags(交叉 ml-platform/01)。

Q4 · 低代码 Dify 怎么纳入 Registry?

:Dify 导出workflow YAML + prompt 快照进 Git;生产切 Spring AI 后同一 release_id贯穿上(15-Dify)。

Q5 · 如何证明「可审计」?

:任意trace_idrelease_id→ 四维 ref + eval_report + approver;资金类再加 tool args hash(17-安全 §审计字段)。

5.3 Agent 平台演进分期(对齐27)

阶段Registry 能力典型团队规模
L0Git prompt + 手工 KB<5 人
L1Langfuse prompt + eval 绑定5–20 人
L2统一release_id+ Gateway 路由20–50 人
L3多租户 chargeback + 自动回滚50+ 人 / 多 BU

口播:大多数「Agent 架构师」面试答到L2即可;L3 讲 FinOps 与 DR 加分。

5.4 与08 电商 Prompt Registry 图衔接

域内08§10 已画Prompt Registry+ Canary——本篇补齐Release Record 字段级契约四维联合回滚;实施时同一release_id写入 Langfuse trace 与 SpringObservation

5.5 合规字段(发布审计最小集)

字段说明
release_id不可变
approver高风险双人
eval_set_ref绑定 Golden sha
change_summary人类可读
rollback_target上一稳定release_id
data_snapshot_idKB 管道批次(可选)

5.6 与 ml-platform 联合发布(表格 ML + LLM)

变更类型ML RegistryAI Registry
重排模型 v3✅ 主 Gate引用model_ref
Prompt v9✅ 主 Gate
KB 索引 v12特征无变✅ alias 切换
实验策略05 AB互斥层绑定release_id

Agent 路由特征(如风险分→选模型):特征定义仍在 Feature Store;release 变体在 Gateway 配置表,两者在release_id上汇合。

5.7 面试白板模板(5 分钟)

  1. 四维+release_id
  2. PR → Harness → Canary → 全量
  3. 回滚先 KB 后 prompt
  4. trace 归因字段
  5. 多租户缓存隔离

§8 样例 Release 与回滚剧本(可背诵)

8.1 当前生产指针(示意)

{"prod_pointer":{"release_id":"rel_2026_05_20_stable","artifacts":{"model_ref":"litellm:smart=azure/gpt-4o-2025-11","prompt_ref":"cs_main@6","tool_schema_ref":"tools_bundle@2.3.0","kb_index_ref":"kb_alias:v11"},"eval_set_ref":"golden_cs@sha8a2c…","canary":{"percent":0,"target_release":null}}}

8.2 回滚剧本(逐步口播)

步骤动作验证
1告警:faithfulness -1.2pp / 1h.dashboard
2release_id分布 → 锁定rel_2026_05_28_001Langfuse
3仅回滚kb_index_refv11→v10cite 恢复?
4仍劣化 → 回滚prompt_ref7→6停止 Canary
5复盘:eval 为何未拦?补 Golden10

8.3 Canary 检查表


§9 FinOps Chargeback(与 span 对齐)

标签账单维度表示例
tenant_idBUbu_electronics
feature产品checkout_assist
release_id版本实验rel_*
model_ref模型成本gpt-4o-mini

$/successful task= 周期内 token 成本 / 成功结束会话数(与 08 一致)。


§10 与 98 口播映射(G06–G08)

ID章节
G06 四维矩阵§1.2
G07 Release Record§3.1、§8
G08 回滚顺序§3.3、§8.2

6. 面试前 Checklist


7. 导航

关联路径
Eval 治理10-Eval集治理
Gateway07-AI-Gateway
可观测08-可观测
Playbook §1113
七视图27
工业级96

官方文档与源码(一级依据)

写作规范:docs/official-sources-registry.md §0

L1 · 官方文档

L2 · 官方源码