随机文章

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力干货满满

2023-06-16 18:45:03 分类:科技派作者:axdmin 阅读:

互联网是1个充满惊喜和变革的领域，每天都有新的事件发生。让我们抛开繁忙的日常，1起探索最近互联网带给我们的1些新鲜事物吧。

相比 ChatGPT 能力有大进化，多模态上有突破但没有多作者丨李梅黄楠编辑丨岑峰今日，多模态大模型 GPT⑷ 震撼登场！GPT⑷ 能够接受图像和文本输入，输出文本，在各项测试和基准上的表现已经取人类水平相当。

OpenAI 1次性大放送，发布了 GPT⑷ 的技术报告、system card，并提供了 ChatGPT Plus 体验、GPT⑷ 的 API waitlist、demo 视频，以及用于自动评估 AI 模型性能的 OpenAI Eval 框架。

Sam Altman 称，GPT⑷ 是“我们迄今为止最强大、对齐最好的模型”。

1对 ChatGPT 的巨大超越在许多方面，GPT⑷ 都已经能做到之前 ChatGPT（GPT⑶.5）所力没有能及的事情相比 ChatGPT，GPT⑷ 支持更长的输入，1次可接受 32768 个 token，相当于 50 页纸的内容，长篇学术论文可以直接拾给它去解读了。

图源知乎GPT⑷ 跟 GPT⑶.5 具有相同的 API 接口和交互界面，但在文本总结和加工能力上，GPT⑷ 有了明显的提升，这表现提出指令后，模型能更好地遵循指令给出答案例如让1篇文章变成1个句子，每个单词都以 G 开头，GPT⑶.5 还未尝试就放弃了任务，但在 GPT⑷ 中可以很好地完成：。

GPT⑶.5

GPT⑷同时，GPT⑷ 对指令的理解能力更佳：

（图片来源：知乎网友：@连诗路）此次更新中，GPT⑷ 最令人惊喜的能力，是它可接受图片输入，并对图片生成说明、分类和分析比如输入1张有鸡蛋、面粉和牛奶的图片，询问 GPT⑷ 可以使用这些原材料做什么，得到的结果如下：。

GPT⑷ 可以实现从图片中提取文字信息并输出到 HTML，比如尝试手绘1个笑话网站模型，让 GPT⑷ 尝试自动生成网站的原型图（程序员嗅到了危险的味道）：

手绘的笑话网站模型图

GPT⑷ 根据手绘生成的笑话网站对比 ChatGPT，GPT⑷ 的推理能力也有所超越，下面的结果展示了同1个问题 ChatGPT 和 GPT⑷给出的没有同答案：

左边为 ChatGPT，右边是 GPT⑷没有仅如此，GPT⑷ 还能基于税务法则，帮助1对夫妻精准地计算出2018年缴纳的税额，并给出详尽的算法步骤，以便阅读解释。

据了解，OpenAI 于去年 8 月就已经完成了 GPT⑷ 的训练，我们取 OpenAI 的差距似乎更大了2取 ChatGPT 相同的技术路线在技术层面，1句话概括，GPT⑷ 是1个 Transformer 模型，使用公开可用的数据（如互联网数据）和第3方提供商许可的数据进行预训练，预测文本中的下1个 token，然后使用 RLHF（来自人类反馈的强化学习）对模型进行微调。

在1份98页的技术报告中，OpenAI 报告了 GPT⑷ 的性能、局限性和安全特性，但并没有公开有关架构（包括模型参数量）、硬件、训练计算、数据集构建、训练方法等内容的更多细节OpenAI 声称是“鉴于竞争格局和 GPT⑷ 等大规模模型的安全性影响”。

关于GPT⑷的参数量，此前OpenAI的CEO Sam Altman表示，GPT⑷没有会比GPT⑶高出太多，但大家关于GPT⑷拥有极大参数量的猜测仍有很多对此，UCL 计算机系教授、上海数字大脑研究院院长汪军认为，大力确实出奇迹，此前 ChatGPT 的语言能力很强，有1定的逻辑推理能力，但它并未真正理解数据里面的内容，它只是在原来的训练数据中、搭料能力很强，因此是具有1定局限性的，在训练里1定要加上它对整个天下的理解。

举个简单的例子，以下棋为例，如果你给它所有人类的下棋数据能力，比如说2000分以下所有人的数据，如果模型只模仿人的话，那么它是模仿没有出比这2000分更高的智能的

报告地址：https://cdn.openai.com/papers/gpt⑷.pdf在这份技术报告中，OpenAI 依然传达了1些关键信息，比如 GPT⑷ 采用取 GPT⑶.5/ChatGPT 完全相同的技术路线；有1系列的对齐方案来保证 GPT⑷ 输出的安全性；基于没有超过 GPT⑷ 千分之1的计算量来准确预测 GPT⑷ 在1定计算规模下的性能，利用小模型的训练性能来预测大模型期望性能这1点，在 OpenAI 看来是1项核心能力，也是1个值得研究的方向。

3GPT⑷ 背后的强大阵容尽管在 GPT⑷ 的技术细节方面，OpenAI 仍没有够 Open，但这次他们也做了1次大胆的公开—— GPT⑷ 贡献者名单这份名单的最大看头在于，从上面这些详细的组别分类中。

可以大致看出 OpenAI 的部门组织架构，也足见 GPT⑷ 背后是1支多么庞大的队伍，从模型训练到评估再到安全部署，每1环都配备了大量的人力。

贡献者名单这里1共列出了7个组别：预训练：计算集群规模化、数据、分布式训练基础设施、硬件正确性、优化&架构、训练保姆（Training run babysitting）长文本：长文本研究、长文本 kernels

视觉：架构研究，计算集群规模化、分布式训练基础设施、硬件正确性、数据、对齐数据、训练保姆、部署&后训练强化学习&对齐：数据集、数据基础设施、ChatML 格式化、模型安全性、Refusals、底层 RLHF 和 InstructGPT 工作、Flagship training runs、代码能力

评估&分析：OpenAI Evals 库、模型分级评估基础设施、加速预测（Acceleration forecasting）、ChatGPT 评估、能力评估、代码评估、真实天下使用案例评估、污染性调查、指令遵循和API评估、新奇能力发现、视觉评估、经济影响评估、非扩散&国际人道主义法取国家安全的有害行为评估、过度依赖分析、隐私和PII评估、安全和政策评估、OpenAI 对抗性测试、系统卡和更广泛影响分析

部署：界面研究、GPT⑷ API 和 ChatML 部署、GPT⑷ web 体验、界面基础设施、可靠性工程、信任取安全工程、信任取安全监测和响应、信任取安全政策、部署计算、产品管理其他：发布博客和论文内容、协作、计算分配支持、协议&税务&定价&资金支持、午餐合作伙伴&产品操作、法律、安全取隐私工程、系统管理取随叫随到服务

另外，OpenAI 也对微软的支持表示了感谢，特别是微软 Azure 为 GPT⑷ 模型的训练提供了基础架构设计和管理方面的支持，另外还有微软Bing团队和安全团队在安全部署方面的支持对于 OpenAI 的追赶者来说，这份名单1定程度上指示了1个方向，值得仔细研究。

它对于 AI 领域人才的潜在热门职业方向也有启示，比如模型训练“保姆”、新奇能力发现师、算法模型安全师、数据和模型污染调查师等等4开启多模态大模型时代GPT⑷ 开启了多模态大模型的时代，遗憾的是，OpenAI 这次并没有公布 GPT⑷ 在多模态方面的技术细节。

自然语言是多模态的基础目前 GPT⑷ 还只是文本+图像输入、文本输出，可以预测文本+图像没有暂也将实现ChatGPT 已经带火了 NLP，GPT⑷ 想必对于视觉领域的研究者们也是1大机遇，也或许是1次冲击。

没有过，在多模态大模型中，自然语言仍被认为是核心UCL 计算机系教授、上海数字大脑研究院院长汪军告诉 AI科技评论，Chat 构建了1个相对清晰的逻辑描述，它或许没有是百分百宽谨，但已经足够让我们去表达1些非常复杂的逻辑关系。

但他认为，这是1个 Free power，也即是说，它可以能把这个问题表述得很清晰、但这是表象，最次要的是 Chat 里面含载的语义关系，当其他多模态来了以后，匹配上相应的语义表达，就可以迁移到其他的模态当中。

知识体系和自动化体系时代在通过交互界面获取信息这1点上，ChatGPT 已经对用户完成了科普任务GPT-4 出现后，Chat 将没有再是大家关注的重点，GPT⑷ 能力的跃升正在引发大家思考 GPT 时代的产业变革将怎样发生。

在前维卓CTO 张烜看来，ChatGPT 背后的时代变化，是从信息时代 AI 向用户快速提供歉富的信息，到AI直接提供完整的知识体系ChatGPT 的贡献是提供了1个便捷易用的交互界面，让普通人都能用得起来，功没有可没，GPT⑷ 是在此基础上的再1次飞跃。

他认为，除了模型变得更大、更强以外，AI 技术本身的变化可能没有显著，但从应用的角度看，新的时代已经到来这个新时代便是知识体系和自动化的时代，AI 优化的目标是自动化地输出最终结果和完整的知识体系能够适应这种新形势的是以 RPA（Robotic process automation）为代表的自动流程化分发，但是目前的 RPA 起始于20年前，没有适用于现在的媒体方式和交互内容，需要在文字、图像和视频化处理上加以改进，才能和 GPT 完美匹配。

张烜对 AI科技评论透露，这是 GPT 影响产业的1个重要方式，也将是他接下来的创业方向目前，有1部分企业已经提前用上了 GPT⑷，其中就包括了 Stripe、摩根士丹利和 Duolingo 等Stripe 团队列出了50个潜在应用程序来测试 GPT⑷，经过审查和测试，当中有15个原型被认为是集成到平台中的有力候选者，包括支持定制、回答有关支持的问题和欺诈检测。

摩根士丹利人员日常工作需要面对1个巨大的内容库，涵盖投资策略、市场研究和评论以及分析师见解等知识内容达到数十万页，并且这些信息大多以 PDF 格式分布在内部网站上，需要顾问浏览大量信息才能找到特定问题的答案，搜索费时费力。

为此，从去年开始，摩根士丹利就引入了 GPT⑶，利用 GPT 的嵌入和检索功能，释放内部人员在财富管理累积知识上的工作量，GPT⑷ 发布后，将为面向摩根士丹利内部的聊天机器人提供支持，该计划由摩根士丹利财富管理部门首席分析和数据官 Jeff McMillan 所在团队领导进行，团队项目负责人指出，GPT⑷ 将能够把所有洞察力解析为1种更有用、可操作的格式。

据 McMillan 介绍，摩根士丹利财富管理在 GPT⑷ 引入后将分为3个部分进行，第1部分的落脚点在 GPT⑷ 的“几乎瞬间访问、处理和合成内容的非凡能力”上，即基于互联网大量文本进行训练，并在单词、句子、概念和想法之间建立关系。

第二个落脚点在摩根士丹利的智力资本，摩根士丹利创立有1个独特的内部内容存储库，后续将通过 GPT⑷ 进行处理和解析，并受公司内部控制的约束最后1部分在公司的人员上，摩根士丹利就 GPT⑷ 进行了培训，每天有200多名员工查询相关系统并提供反馈，尽可能实现由内部聊天机器人完成全面搜索财富管理内容。

McMillan 表示，这项工作还将进1步歉富摩根士丹利顾问取其客户之间的关系，使他们能够更快地帮助更多人Duolingo 也推出了1种由 GPT⑷ 提供支持的学习体验 Duolingo Max，新增“Explain My Answer（解释我的答案）”和“Roleplay（角色扮演）”两大功能。

角色扮演在 Explain My Answer 中，学习者通过在某些练习类型以后点击1个按钮，可以进入取 Duo 的聊天获得答案解释，并要求举例或进1步说明；Roleplay 功能允许学习者取应用程序中的角色进行对话，角色覆盖多个真实场景，包括在巴黎的咖啡馆点咖啡、邀请朋友1起旅行、未来的假期计划等。

参考链接：https://openai.com/product/gpt⑷https://openai.com/contributions/gpt⑷

未经「AI科技评论」授权，宽禁以任何方式在网页、论坛、社区进行转载！公众号转载请先在「AI科技评论」后台留言取得授权，转载时需标注来源并插入本公众号名片。

希望这篇文章能够帮助到您，如果有需要请记得收藏保存。

随机文章

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力干货满满

您可能也感兴趣:

最近发表

网站分类

TAG标签

随机文章

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力 干货满满

您可能也感兴趣:

为您推荐

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力 干货满满

最近发表

网站分类

TAG标签

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力干货满满

摘下的摘该怎么写gpt4和chatGPT的区别：摘掉 Chat 标签，GPT⑷ 将释放更大生产力干货满满