智东西6月28日消息,OpenAI今日凌晨发布了一款基于GPT-4训练的代码审查模型CriticGPT,用于审查找到ChatGPT代码输出中的错误,表现比没用此工具的人要好60%。OpenAI开始将类似CriticGPT模型集成到其RLHF标注流水线中,为其训练师提供明确的AI帮助。

CriticGPT的建议并不总是正确的,但与相比没有AI帮助,它们有助于发现更多问题,并比模型单独工作时更少的幻觉错误。在OpenAI的实验中,第二个随机训练师在超过60%的时间里更喜欢来自Human+CriticGPT团队的批评,而不是来自未经AI帮助的人的批评。
论文地址:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf