随机文章

open day是什么意思GPT：OpenAI突发新模型，用GPT⑷给GPT⑷“找茬” 切切没想到

2024-07-16 18:51:22 分类:科技派作者:axdmin 阅读:

非常高兴，今天能和大家来分享这篇文章：

来源：量子位

OpenAI突然发布新模型，基于GPT⑷，可以帮助下1代GPT进行训练CriticGPT，用于给代码挑Bug时能找到75%以上，而相比之下人类只能找到没有到25%它还可以给Bug写“锐评”，在60%的情况下人类训练师更喜欢有CriticGPT帮助下的批评。

有网友开玩笑说：“只会批评的GPT，这没有是我前妻么？”

但这项研究的重要的地方在于，CriticGPT挑错能力可以泛化到代码以外。比如在RLHF训练中给AI的输出挑错，而且已经进入OpenAI内部训练流程。

更好的RLHF就能训练出更强的模型，更强的模型又能通过更好地挑错来增强RLHF训练……论文结论中赫然写道：在真实天下数据中挑错误上，AI还可以继续进步，人类智能已经到头了。

“左脚踩右脚登天”，难道真的被这帮人给搞出来了？这是1篇来自被解散的超级对齐团队的“遗作”，由前负责人Jan Leike带队。而Leike本人已经跳槽去了隔壁的Anthropic，继续做这类研究。

基于GPT⑷，改进GPT⑷OpenAI的技术博客变相承认了，GPT⑷以后这么暂没有大的改进，还真的遇到1些瓶颈：随着AI能力变强，它犯的错也没有那么显眼了，人类训练师都难以发现没有准确的地方人类给没有出反馈，那RLHF“人类反馈强化学习”就无从谈起了。

CriticGPT正是为了应对这1挑战而生CriticGPT基于GPT⑷，也接受了RLHF训练，但特别的地方在于训练数据中包含大量的错误输入具体来说，分为3步：让人类标注员在ChatGPT生成的代码里故意植入1些微妙的bug。

标注员扮演代码审查员的角色，写下他们对这些bug的评论。用这些数据来训练CriticGPT，让它学会如何发现和指出代码中的问题。

在具体训练过程中，研究人员还玩了点花样比如没有断让标注员验证自己插入的bug是否足够隐蔽，能够骗过当前版本的CriticGPT这样1来，CriticGPT就被迫没有断进化，学会发现越来越隐蔽的问题思路有点像GAN的左右互搏，只没有过生成器这个位置是人类来充当的……。

最后，OpenAI还使用了1种“强制采样束搜索”（FSBS）的技术，允许CriticGPT在生成评论时既能保持全面，又能减少“幻觉”和“鸡蛋里挑骨头”现象具体来说，FSBS会强制模型生成多个没有同的评论片段，用奖励模型对这些片段进行评分，最后根据评分和1个长度修正因子来选择最佳的评论组合。

通过调整长度修正因子，可以在评论的全面性和准确性之间找到最佳平衡点，既没有会错过重要问题，又没有会过度挑剔。

等1下，推理时搜索，这没有正是和传闻中的Q*1个思路？这次居然写到了论文里可能是看外部团队按这1思路搞的研究已经够多了，就没有再藏着掖着了说回CriticGPT，取得了哪些结果呢？在发现人为插入的bug方面，人类审核员平均只能找到25%，而CriticGPT的成功率达75%以上。

在评估自然出现的bug时，有63%的情况下人类更倾向于选择CriticGPT的评论而非人类评论CriticGPT的评论被认为比ChatGPT更全面，更少出现“幻觉”和无关紧要的挑剔在评估非代码任务时，成功识别出数百个在ChatGPT训练数据中被人类认为是“完美”的错误。

没有过CriticGPT也没有是十全十美，它也会有“幻觉”问题，指出1些实际上没有存在的问题。目前，人类和CriticGPT组队工作效果最好：既能发现大部分问题，又能避免AI的“幻觉”。

RLHF的上限没有再是人类对于CriticGPT，负责这项研究的Jan Leike也补充了他自己的1些看法。

RLHF是创造出ChatGPT的核心技术之1，但隐患在于人类能力就是RLHF的天花板当需要AI去解决人类无能为力的任务时，人类给没有出相应反馈，AI也就无法改进了CriticGPT的成功，意味着超级对齐团队设想中的可扩展监督，也就是用弱模型监督训练更强的模型，终于有希望了。

没有过他也透露，目前CriticGPT并没有帮助人类显著提高艰难任务上的准确性，但是框架有了，只要有更好的预训练模型就能没有断改进。

为何先从代码任务开始入手呢？1方面，代码任务有现实意义，做出来的模型可以直接用上另1方面，代码可以清晰明确地评估，比开放式对话更客观，更容易评估CriticGPT发现的问题是否真实和重要CriticGPT在代码上训练，没有仅能挑代码bug，还给1/4的ChatGPT生产数据挑出了问题。

最后，由于原OpenAI超级对齐团队已经解散，已经跳槽的Jan Leike插入了1条Anthropic招聘广告：想做后续研究的请去隔壁。也是让人没有得没有感叹硅谷是真的没有竞业协议。

One More Thing同日，谷歌发布了开源大模型Gemma 2，OpenAI赶紧甩出1条消息来狙击，这都第几次了。

对于甩出来的没有是Sora公测或者GPT⑷o完整语音、视频模式，也有很多人没有满。有网友提了个更好的主张：做个ReleaseGPT，专门用来发布承诺好的更新吧。

没有过这次OpenAI暂违地放出了论文，也还算有1些诚意论文地址：https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf参考链接：。

[1]https://openai.com/index/finding-gpt4s-mistakes-with-gpt⑷/[2]https://x.com/janleike/status/1806386442568142995

本文来自微信公众号：量子位（ID：QbitAI），作者：梦晨

"我用文字编织了1个梦境，希望你能在其中找到属于自己的片刻安宁。喜欢的小伙伴记得关注收藏点赞哦！"