机文章

gpt支持什么系统gpt4收费标准:GPT⑷强势来袭:支持最长50页文本、识图能力强,API价格是原来的60倍,多模态是大语言模型的未来? 1篇读懂

 

近期,互联网行业再次掀起了1股创新浪潮,让我们1起揭开这个新时代的面纱,看看互联网天下有哪些令人振奋的事情正在发生。

每经记者:文巧 每经编辑:谭玉涵北京时间月3月15日凌晨,距ChatGPT发布没有到4个月,OpenAI公司再次发布了1个王炸级别消息——正式公布多模态预训练大模型GPT本应于周四发布的GPT提前了1天多的时间揭开神秘面纱,也让许多人感到猝没有及防。

OpenAI创始人Sam Altman在推特上直言没有讳地称其为该公司“迄今为止功能最强大、最1致的模型”很快,GPT上线仅几分钟后,大批新的订阅用户涌入,OpenAI的付款系统被挤爆了目前,GPT仅限ChatGPT的Plus订阅用户使用,其他用户需要排队申请内测。

率先体验了GPT的IT从业人员Wang告诉《每日经济新闻》记者,“推理能力非常赞”没有过,他认为,和人类比(GPT生成的内容)还是较弱,“我倾向于认为,它应该没有元创新能力”门庭若市的GPT相比,谷歌的门前就显得异常冷清了。

当天,谷歌发布了1支预告片,演示了整合其AI功能的Work Space功能,但在GPT的光环之下黯然失色记者注意到,在GPT中,支持图像理解的功能是1个最大的飞跃基于此,GPT的API也区分了输入端(即文本和图像形式的prompt)和输出端(生成文本),分别进行收费,。

而GPT输出端的最高价格大约是GPT.5 Turbo的60倍实际上,科技巨头间围绕多模态模型的较量也已经展开,微软、谷歌、Meta、Deepmind都发布了自己的多模态模型未来,多模态模型或将成为AI领域的兵家必争之地。

“我们认为这是这场AI军备竞赛中,GPT技术升级的又1重要步骤截至目前,微软的技术仍远高于谷歌”Wedbush董事总经理Daniel Ives告诉每经记者6个月心血打造,GPT强在哪里?在推特上,Sam Altman透露,GPT的初始训练已经完成了很长1段时间,但他和他的团队花了很长时间和大量的工作才准备好发布它。

据OpenAI,团队花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训,对GPT进行迭代调整,从而在真实性、可控性等方面取得了有史以来最好的结果根据OpenAI的GPT文档,这1次的GPT1

多模态语言模型,能接受图像和文本输入,再输出正确的文本回复相较于ChatGPT基于的GPT.5模型,它拥有强大的识图能力,文字输入限制提升,准确性显著提高,风格上也有了变化,例如能够生成歌词和创意文本。

有推特用户表示,他仅花了60秒钟的时间就用GPT重建了1个名为“Pong”的游戏。“我没有在乎这是没有是通用AI,但GPT1项令人难以置信的变革性技术。事情彻底变了。”

图片来源:推特有用户直接让GPT续写红楼梦,结果有模有样。

图片来源:某社交媒体1位IT从业人员Wang已经率先体验了GPT的强大功能,他告诉《每日经济新闻》记者,“简单试了1下,推理能力非常赞”他认为,在1定程度上,GPT的回答已经并非基于网上信息的整合,而是有1些真正的推理能力了。

记者在多个AIGC讨论群组中注意到,相比于GPT.5,GPT在许多问题上的回答确实游刃有余,也能识别问题中的错误信息。

图片来源:微信群值得注意的是,在GPT模型中,支持图像理解的功能是1个最大的飞跃上周,微软德国的CEO在接受访问时透露,即将发布的GPT将支持视频,尽管这次的发布并未展现出支持视频的功能,但这个新的功能已经让许多人感叹,“这1波直接王炸!”、“能革OpenAI命的只有OpenAI!”。

在OpenAI公布的展示视频中,Open AI的联合创始人兼总裁Greg Brockman仅仅提供了1个Html页面的草稿,GPT仅用10秒时间就直接生成了这个页面的代码。

图片来源:OpenAI视频截图此外,另1个备受关注的飞跃式提升是,GPT提供了更长的文字输入限制OpenAI显示,GPT分为两个版本,1个支持的最长Token为8192,另1个支持的最长Token是32768(大约50页文本)。

这分别是此前ChatGPT高低文长度的2倍和8倍图片来源:OpenAIAPI价格是原先的60倍,为何?在发布了GPT模型以后,OpenAI直接将ChatGPT升级成了GPT版,并且还1口气发布了GPT的API接口。

记者注意到,相较于OpenAI此前公布的GPT.5 Turbo版本的API,GPT的API价格有了明显的提升由于GPT提供了图像理解功能,其区分了输入端(即文本和图像形式的prompt)和输出端(生成文本)。

在GPT 8K版本中,输入端的价格为每1000个Token (约750个单词)0.03美元,输出端的价格为每1000个Token 0.06美元;在GPT 32K版本中,输入端为每1000个Token 0.06美元,输出端为每1000个Token 0.12美元。

相比之下,3月1日发布的GPT.5 Turbo 的API价格仅为每1000个Token 0.002美元此前小我创业者王绍在接受每经记者采访时曾表示,基本上是每1000个汉字大约3分钱的成本若按此计算,GPT 32K版本的输出端价格达到了每1000个汉字大约1.8元,是GPT.5 Turbo的60倍,明显成本大幅增加。

图片来源:OpenAI每经记者在相关讨论群中也注意到,许多开发者对此议论纷纷。

图片来源:微信截图GPT的价格为什么上涨如此之多?我们首先得回到GPT最大的改变——多模态模型多模态系统1直是AI领域的发展范式,单个系统将包含各种数据类型(如文本、语音、图像或视频)输入和输出的能力。

1位产品经理在他的微信公众号上评价称,GPT才是真正的多模态模型,这意味着在预训练过程中图像就是重要的1环,它能够真正理解图像,并非简单利用1些图文工具实现模型对图像的转换,这也是GPT的真正的魅力所在。

Wang告诉每经记者,相比之前只支持文本的模型来说,多模态模型肯定会提升在算力、训练方面的成本2月27日,微软发布了KOSMOS多模态语言模型,支持进行图像内容的理解并对话据该论文,在多模态模型的训练过程中,没有止会用到文本数据,还包括任意交错的文本和图像、图像标题数据。

这样1来,训练难度肯定有所增加如此看来,GPT的API价格上涨也说得通了多模态是大型语言模型的未来?GPT当然还远没有能称之为完美“它早期的GPT模型有类似的局限性:它没有完全可靠、高低文窗口有限,并且没有能从过往经验中进行自主学习。

”OpenAI如此说道没有过,OpenAI 也表示在特定领域做出了改进GPT.5 相比,GPT总体上响应“没有允许内容”请求的可能性降低了82%,并且以符合公司政策的形式响应敏感请求(如医疗建议和任何自我伤害有关的事情)概率增加29%。

在Wang看来,“和人类比(GPT生成的内容)还是较弱的,我倾向于认为,它应该没有元创新能力”他进1步解释说,元创新能力即从无到有创造1个概念出来,而非把几个器材拼凑起来的创新在GPT这个多模态模型发布后,微软也证实,其基于ChatGPT的新版必应正是基于GPT模型而运行。

此外,OpenAI还公布了1些早期的应用者其中包括 Stripe,它使用 GPT 扫描商业网站并向客户支持人员提供摘要;Duolingo将 GPT 构建到新的语言学习订阅层中;摩根士丹利正在创建1个由 GPT 驱动的系统,将从公司文件中检索信息并将其提供给金融分析师;可汗学院则正在利用 GPT 构建某种自动化导师。

每经记者注意到,多模态模型或将成为未来的兵家必争之地在前述微软的论文中,科学家们这样写道,“语言、多模式感知、动作和天下建模的大融合是通向通用AI的关键1步……作为智能的基本组成部分,在知识获取方面,多模态感知,是实现通用AI的必要条件。

”上述论文也提到,多模态语言模型提供了1些新的用途和可能性例如,它能够自然地支持1般模式的多回合交互和多模式下的对话实际上,科技巨头间围绕多模态模型的较量也已经展开沿着类似的思路,谷歌发布了PaLM-E,这是1Kosmos非常相似的多模态模型;类似的多模态模型还有Meta的LLaMA、 Omnivore、FLAVA、CM3 和 Data2vec,都是采用多模式方法来解决没有同的任务,如语音、视觉、文本,甚至 3D;此外,DeepMind也于2022 年 11 月发布了Gato多模态模型。

(每经记者蔡鼎亦对文本有所贡献)每日经济新闻

如果您觉得这篇文章对您有所帮助,请在下方留下您的评论,让更多人看到。

为您推荐

gpt支持什么系统gpt4收费标准:GPT⑷强势来袭:支持最长50页文本、识图能力强,API价格是原来的60倍,多模态是大语言模型的未来? 1篇读懂

gpt支持什么系统gpt4收费标准:GPT⑷强势来袭:支持最长50页文本、识图能力强,API价格是原来的60倍,多模态是大语言模型的未来? 1篇读懂

每经记者:文巧 每经编辑:谭玉涵北京时间月3月15日凌晨,距ChatGPT发布不到4个月,OpenAI公司再次发布了一个王炸级...

2023-06-16 栏目:科技派

当前非电脑浏览器正常宽度,请使用移动设备访问本站!