Meta推出AI安全项目Purple Llama

智东西12月8日消息，今日，Meta宣布推出Purple Llama项目，提供开放的信任与安全工具和评估，旨在为开发人员提供公平竞争的环境。作为项目的第一步，Meta发布了CyberSec Eval，这是一套用于大模型网络安全安全评估的基准。Meta还发布了Llama Guard，这是一个用于输入/输出过滤的安全分类器，优化了部署的便利性。

Meta解释了该项目为什么是“紫色”：要真正解决生成式AI带来的挑战，需要同时采取攻击（红队）和防御（蓝队）两种姿态。紫色团队由红队和蓝队共同负责，是一种评估和降低潜在风险的合作方式。