OpenAI发布CriticGPT：用GPT-4给GPT-4找错误

智东西6月28日消息，OpenAI今日凌晨发布了一款基于GPT-4训练的代码审查模型CriticGPT，用于审查找到ChatGPT代码输出中的错误，表现比没用此工具的人要好60%。OpenAI开始将类似CriticGPT模型集成到其RLHF标注流水线中，为其训练师提供明确的AI帮助。

CriticGPT的建议并不总是正确的，但与相比没有AI帮助，它们有助于发现更多问题，并比模型单独工作时更少的幻觉错误。在OpenAI的实验中，第二个随机训练师在超过60%的时间里更喜欢来自Human+CriticGPT团队的批评，而不是来自未经AI帮助的人的批评。

论文地址：https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf