【TEE从入门到精通及实战】95 TEE与LLM推理的全栈安全架构：从理论模板到生产级加固

📅 2026/7/2 14:46:28 👁️ 阅读次数 📝 编程学习

95 TEE与LLM推理的全栈安全架构：从理论模板到生产级加固

去年秋天，我帮一家金融科技公司做技术咨询。他们的核心业务是在TEE内运行一个GPT-2级别的LLM，用于实时风险评估。

团队已经按照我上一篇给出的全栈模板部署了完整方案，所有代码都跑通了，远程认证也通过了。但在一次安全审计中，我们发现了一个致命问题：内存侧信道攻击。

攻击者通过监控TEE内存页的访问模式，可以推断出模型推理过程中的某些中间结果——比如，当模型生成“高风险”这个词时，某个特定内存区域的访问频率显著升高。

更可怕的是，这种攻击不需要突破TEE的硬件边界，只需要和TEE运行在同一台物理机上，利用共享的CPU缓存即可完成。

团队负责人当时脸都白了：“我们以为只要代码跑在TEE里就安全了，没想到还有这种玩法。”

我拍了拍他的肩膀说：“你踩的坑，我十年前就踩过。今天咱们就把这个洞堵上。”

很多开发者——包括我早期——都以为只要把代码和数据放进TEE（如Intel SGX或AMD SEV），就万事大吉了。但TEE只保证了执行环境的机密性和完整性，它并不防御侧信道攻击。