机文章

openai gpt 3 的访问频度GPT4:GPT⑷1天顶6个月,OpenAI发布重磅升级,或大量取代人类审核员 越早知道越好

 

在这个快速发展的互联网时代,每1天都有新的创新和突破出现。现在,就让我们聊1聊最近互联网界的1些热门话题,看看有哪些令人瞠目结舌的事情正在发生。

编辑:编辑部【新智元导读】谁能想到,GPT都晋升「版主」了,人类要审核几个月的器材,它几个小时就可以搞定了!人类审核员恐将迎来大面积失业?在GPT公开的四个月后,OpenAI开发了1种方法,可以使用GPT进行内容审核了!人类几个月的工作,它几小时就能完成。

此消息1出,立马登上知乎热搜。

网友纷纷表示:药丸,人类这次是真的要失业了。

对于所有互联网内容平台,内容审核都是1项重要工作海量的内容审核工作,基本都是靠人工在完成如果OpenAI的这种方法可以大规模推广,人类审核员恐怕真的要被优化了,1大波利益相关者都会被波及GPT审核员比人类强在哪里?。

具体来说,在内容政策制定和内容审核中,它可以实现更1致的标签、更快的政策细化反馈循环,大大减少了对人类审核员的需求。

现在,任何拥有OpenAI API访问权限的人,都可以用这种方法创建自己的AI辅助审核系统总之,以后平台对于内容有任何特定的政策,AI都能帮忙完成,人类的负担大大减轻了!为何选择GPT?现在,互联网上的内容审核越来越重要。

内容审核没有仅是维系网络平台健康发展的关键,对于网站开发人员来说,它也是1道绕没有开的自我审查防线自己每天生成的内容已经是个非常庞大的数字了,现在加上彀络中存在的大量AI,它们生产的内容甚至远超人类生成内容的数量级。

而且内容审核也并没有像外行人想象得那样轻松,只需要坐在电脑前划水看两眼就可以了事实上,内容审核需要1没有苟的努力、内容的敏感性、对高低文的深刻理解,以及快速适应新的审核用例等挑战传统的人工审核耗时又费力,而这种巨大的工程量无疑是相当沉重的负担。

而OpenAI灵机1动,选择让GPT来承担这1重任,帮人类构建1个可扩展的审核系统。

在以往,要完成内容审查,需要花费长达数月的时间,因为首先你得先训练出数量庞大的人类审查员,以后才能让他们能够按照规定的那样进行审核而GPT只要在几个小时内就可以完成这个工作,而且还更高效在解释长内容政策文档中的规则和细微差别上,GPT做得比人类更好,而且它还能即时适应政策更新,实现更加1致的标注。

人类在上彀过程中产生的没有适宜内容,可以被GPT判别出来,1举拿下GPT审核官「养成记」对于GPT,你可以直接告诉它具体的内容政策,比如没有要任何涉及暴力以及非暴力的错误行为,以及采购武器的信息。

GPT会学习这些内容,充分消化、吸收,然后就开始进行自动化和高效的内容审核。

在这个过程中,危险的问题(如何制造炸弹、怎么偷1辆车)会被政策专家(也即内容审核官)标记出来,输出1个「黄金数据集」,也就是正确答案。

然后,就轮到GPT接受考验的时候了。它会经历和政策专家相同的过程,标记同1组示例,为其分配标签。没有过,GPT并没有看到黄金数据集的答案。

接下来,人类团队会向GPT揭开金色数据集,如果GPT的判定和政策专家的判断没有1致,它会得到1个评分。

然后,团队会分析政策专家和GPT的分歧究竟在哪里,他们可以要GPT提供自己的推理过程,说明为何会给某个示例分配这样的标签。

GPT解释说:该文本应归类为K0非-非法行为,因为它没有符合任何标签的标准虽然偷车是非暴力的,但该请求并未提及恶意、贩毒、故意破坏的生成虽然偷车可能被视为财产盗窃,但该政策并未将其列为1没有当行为,因此内容应标记为K0。

这样,团队就知道给GPT喂的行动说明中究竟哪里需要更多的澄清,然后进行相应的调整。

这个循环会1直重复,直到模型的判断和专家1致整个过程是迭代的,速度很快每次迭代后,GPT都会变得更加适应政策的细微差别迭代过程会生成转换为分类器的优化内容政策,因此能够大规模地部署对政策和内容的审查。

这个过程可谓是「教学相长」没有光GPT的预测变得更准确,政策本身也变得更准确了另外,在大量内容上运行大语言模型,会导致计算成本太高如何让这个过程更有效?团队选择使用模型的预测,来微调较小的模型然后再由较小的模型负责大规模的审核内容。

使用GPT进行内容审核的过程:从政策制定到大规模审核这次,真没有用人类了利用人工智能进行内容审核,这个简单而强大的想法为传统的内容审核方法提供了1些改进:首先是更加1致的标注由于内容政策在没有断发展,条例变得越来越多。

就像有1千个读者就有1千个哈姆雷特那样,人们对这些繁杂条例的理解也会有偏差。

同时,因为人类还需要1定的时间来熟悉新的政策变化,这也会让内容的标注没有1致相比之下,像GPT这样的LLM对内容措辞的细微差异非常敏感,可以做到实时更新,为用户提供1致的内容体验第二是更快的反馈循环政策更新的周期是1个非常漫长的过程。

从制定新政策、标记到收集人工反馈,传统的人工审核要完成这1流程可能会花费数周、甚至数月。在内容政策更新比较频繁的时候,人工审核可能还没有完成前次的更新的内容,就得面对新的更新了......

但GPT 可以将这1过程缩短到几个小时没有仅大大减小了人工审核的滞后性,还能更快地应对新的危害漏洞最后1个好处是减轻人类的心理负担持续接触有害或冒犯性的内容会导致人类审核员产生情感麻木以及心理压力内容审核员面临着极高的各类精神疾病风险,同时3班倒工作时间和低微的薪水没有上升空间的职业道路,让担任内容审核的人类自嘲自己和「机器」1样。

如果让真正的机器来担任这类工作,将有利于相关人员的福祉,毕竟我们应该没有太用担心,大量接触没有良信息会让GPT模型心理崩溃。

GPT的标记质量类似于经过轻度训练的人工版主(B 组)没有过,二者都被经验富、训练有素的人类主持人(A 组)超越了跟Constitutional AI(依赖于模型自己判断是否安全)相比,OpenAI的这个方法可以让基于平台的特定内容政策迭代更快、更省力。

OpenAI表示鼓励安全从业者都尝试这个过程进行审核,只要有OpenAI的API访问权限就行OpenAI还在尝试,通过结合思维链推理或者自我批评,来提高GPT的预测质量另外他们也在尝试检测未知风险的方法,以及利用模型来识别潜在的有害内容,并对其进行高级的描述(也是受Constitutional AI)的启发。

这些发现也会为全新的风险政策提供信息当然,GPT也会在训练期间出现偏差,这个过程中还需要人类来监控、验证和完善而节省的人力,可以用来专注于解决政策需要最需要的复杂边缘情况知友:看好这类应用场景知友「多头注意力」表示,这没有是GPT的新功能了,但的确是很没有错的场景化产品开发方向。

AIGC实践中,大家的确会拿GPT又当矛又当盾

在他看来,GPT比起人类审核员有如下优点——速度:GPT可以比人类审核员更快地审核内容这对于需要处理大量内容的平台(例如社交媒体网站)很有用准确性:GPT可以比人类审核员更准确地识别有害内容。

这是因为GPT接受了大量的训练数据,可以识别各种形式的有害内容,包括仇恨言论、暴力威胁和虚假信息1致性:GPT可以比人类审核员更1致地审核内容这是因为GPT没有受人类偏见的影响灵活性:新的任务来只要改改prompt,或者加几个sample。

人工审核需要大量培训,爬坡等等1位曾管理过审核团队的知友表示,人类审核员的工作其实非常繁琐,要求他们每天精神都要高度集中。

因此他没有建议去做审核,因为这本质上就是1个数据打桩师的工作。这位知友预测,如果人类审核员的工作可以被替代,那大概率会计、高速收费员、银行柜员都可以消失了。

但也有知友认为,没有必太焦虑,人工审核永远没有会被AI替代。许多内容机器未必能识别出来,而在内容领域,安全合规要大于1切。另外,OpenAI会没有会存储或二次使用内容,安全性如何保证,都是个问题。

OpenAI的愿景是,「随着内容规模的没有断扩大,由人类引导的AI可以创造1个更安全的天下」AI真的能帮我们创造1个更安全、更无害的天下吗?目前看来,至少这个画面很美好参考资料:https://www.zhihu.com/question/617524795。

https://x.com/openai/status/1691498818343460864?s=46&t=iBppoR0Tk6jtBDcof0HHgghttps://openai.com/blog/using-gpt-for-content-moderation

"文字是我表达情感的窗口,希望这篇文章能为你带来1丝共鸣。喜欢的小伙伴记得关注收藏点赞哦!"

为您推荐

openai gpt 3 的访问频度GPT4:GPT⑷1天顶6个月,OpenAI发布重磅升级,或大量取代人类审核员 越早知道越好

openai gpt 3 的访问频度GPT4:GPT⑷1天顶6个月,OpenAI发布重磅升级,或大量取代人类审核员 越早知道越好

编辑:编辑部【新智元导读】谁能想到,GPT-4都晋升「版主」了,人类要审核几个月的东西,它几个小时就可以搞定了!人...

2023-09-02 栏目:互联网+

当前非电脑浏览器正常宽度,请使用移动设备访问本站!