智东西12月8日消息,今日,Meta宣布推出Purple Llama项目,提供开放的信任与安全工具和评估,旨在为开发人员提供公平竞争的环境。作为项目的第一步,Meta发布了CyberSec Eval,这是一套用于大模型网络安全安全评估的基准。Meta还发布了Llama Guard,这是一个用于输入/输出过滤的安全分类器,优化了部署的便利性。
Meta解释了该项目为什么是“紫色”:要真正解决生成式AI带来的挑战,需要同时采取攻击(红队)和防御(蓝队)两种姿态。紫色团队由红队和蓝队共同负责,是一种评估和降低潜在风险的合作方式。




7


