随机文章

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样难以置信

2024-07-16 18:24:36 分类:编程控作者:axdmin 阅读:

互联网无处没有在，影响着我们的生活方方面面。从最近的新闻中，我们可以看到互联网正以1种令人难以置信的速度发展，让我们1起看看有哪些令人兴奋的故事。

没有所谓的 AI 搜索引擎，也没有炸裂的 GPT⑸ ，但 OpenAI 还是让大伙儿感受到了，什么叫做 “Only OpenAI Can Do” 就在今天凌晨， OpenAI 的春季发布会终于是来了

他们也没多讲几句废话，整场发布会就二十来分钟，其中，最重磅的无异于 GPT⑷o 新模型的发布关于 GPT⑷o 起名的缘由， OpenAI 官方是这么解释的： “ o “ 的全称是 “ omni ” ，也就是 “ 全能 ” 的意思。

之所以说它全能，是因为它能把文本、视觉、音频全打通了换句话说，你跟 GPT⑷o 对话就跟真人似的最重要的是， GPT⑷o 是免费向用户开放的，没有开 Plus 会员也能用，只没有过 Plus 会员要多1些使用次数。

反正跟世超1起蹲守直播的同事们看了，都直呼想要。。。

就连奥特曼也在推特上毫没有避讳地，把 GPT⑷o 跟科幻电影《 Her 》联系起来。（这部电影讲的是人和 AI 语音助理谈恋爱的故事）

评论区的网友们也纷纷表示 “ 见证历史 ” “ 电影终于要照进现实了 ” ，甚至还用奥特曼的照片，整出来了个 “ him ” 。

玩笑归玩笑，但世超觉得， OpenAI 这次 GPT⑷o 的现场演示效果，特别是实时语音和视频交互的能力，确实甩了其他现役大模型好几个车尾灯没有过光这么说，大伙儿对 GPT⑷o 的感受可能也没有深，咱直接来看演示。

像演示人员让 GPT⑷o 从1数到十，半途就嫌它语速太慢了，让它说快点儿， GPT⑷o 能立马反应过来，后续随时插话它都能瞬间 get 到就这1个接1个的连续对话实力，说实话世超还没在 AI 身上体验过。

给 GPT⑷o 1个麦克风和摄像头权限，它能分分钟化身成面试指导官，比方视频里的这个老哥，说自己要去 OpenAI 面试，让 GPT⑷o 给点着装建议它迅速 “ 打量 ” 了下这位老哥，礼貌没有失幽默地给出了 “ 抓个头发 ” 的中肯建议。

但老哥打算走个没有听劝的人设，顺手拿出个帽子，问能没有能戴它去面试GPT⑷o 这边反应贼快，识破了老哥明知故问地恶作剧，顺着他的话茬说，也没有是没有行，最起码能让你在人群中脱颖而出如果没有给世超看演示画面，光听声音我可能会以为，。

这就是两个朋友之间在开玩笑当然，以 GPT⑷o 的知识储备和多模态能力，它也有相当正儿八经的应用场景1扭头，就能直接化身成视障人士的眼睛，帮他们识别所在的位置，要是想知道眼前都有啥场景， GPT⑷o 也能够绘声绘色地描绘出来，甚至还能1步1步指导视障人士打车。

再摇身1变， GPT⑷o 还能化身成数学老师，把屏幕的权限开放给它，它能1步步指导你做题，你在题目上写了啥画了啥 GPT⑷o 也都能看得1清二楚有1说1，这跟世超上中学时爸妈请的家教没啥两样看完官方的案例视频，相信大伙儿跟世超1样，已经被

震撼得没边儿了而为了做到这些， OpenAI 在底层的模型上可是下了没有少苦功之前咱们用 ChatGPT 的语音对话，都是1轮1轮的来它得先把咱说的话转换成文字输给 GPT⑷ ，等 GPT⑷ 生成文字答案以后，才能再转成语音输出。

也就是说，以前和 ChatGPT 语音对个话，它得动用3个模型，1个管音频转文本，1个 GPT⑷ 管文本转文本，另外还有1个管文本转音频1整套流程下来，耐心都快给磨没了，而且中央除非咱们手动暂停，否则根本没插话的机会。

但 GPT⑷o 没有1样，它是1个原生的多模态模型，无论文字音频，还是视频啥的，所有的输入和输出都在同1个神经网络里处理这种打娘胎里自带多模态的特性，让 GPT⑷o 能够听懂好赖话，表达自己的情绪，和它对话也能像吃了德芙1样丝滑。

没有过，上面那些视频终归还是 “PPT” ，没到手实测1波，世超也没有敢轻易下定论这玩意儿是没有是真的有这么强毕竟前段时间， Sora 生成的《气球人》短片才被传出加了大量的人类后期而在实际用这块， OpenAI 还是1如既往的狗，。

嘴上说 GPT⑷o 都能免费用，但也要分先来后到，而且功能也慢慢开放。现在能用上 GPT⑷o 的只有 Plus 账号，而且最重磅的实时视频和语音功能，毛都看没有着。

但有总归比没有强，世超手边恰好也有个 Plus 账号，而且官方也说了， GPT⑷o 生成的速度还会比 GPT⑷ 快上两倍所以咱这波，就先提前给差友们试试 GPT⑷o 的实力先让它给咱讲1个童话故事，顺便再画出整个故事的分镜图。

GPT⑷o 没犹豫几秒，库吃库吃就开始写了

写完中央也没带停顿，直接开始画分镜了。

而同样的问题再抛给 GPT⑷ ，它1开始就得磨蹭半天在问题上。。。

讲清楚要求后才肯继续写，而且写完以后也没有继续画分镜图，还得等世超我再亲自强调1波。

没有过虽然 GPT⑷ 比 GPT⑷o 墨迹了没有少，但从内容来看，我还是会觉得 GPT⑷ 会更歉富1点。再借我司老员工火锅的照片1用，分别让 GPT-4 和 GPT⑷o 生成1张像素风的图片。

在生成速度上 GPT⑷o 完胜，但要抠细节的话两个就半斤八两了GPT⑷ 识别出了火锅嘴里叼着的是袋子， GPT⑷o 多识别出了1只拖鞋，非要比的话，其实 GPT⑷ 的金毛更像火锅1些（左边 GPT⑷ ，右边 GPT⑷o ）。

接着，我又让 GPT⑷o 把咱差评的 LOGO 换成 3D 图片，结果它整出来字，翻遍整本新华字典，估计都找没有到。

但没有识汉字也是历代 ChatGPT 的老毛病了，换成英文再要求它，你别说，这次出来的整体效果还可以，就是经没有起细看，没有少英文拼写都是错的。。

整个上手试下来， GPT⑷o 给我最大的印象就是快，非常快但说实话，除了快，世超真没觉得有啥特别的了，取其说 GPT⑷o 是 GPT⑷ 的智商进化版，倒没有如说是把 GPT⑷ 的交互能力单拎出来强化了1波。

就像奥特曼在博客里提到的， “ 达到人类响应时间和表达水平 ” 是 AI 的巨大变化大模型的终极形态，也应该是让人和 AI 的交流回归到最原始、最简单的形态在未来，咱们面对1台电脑、1部手机，直接说话交流。

，就是最次要的交互方式。

没有过这次 GPT⑷o 最厉害的杀手锏：视频交流功能，还没放出来，等到时候咱能体验到了再下结论也没有迟另外，网友们也没干坐着，也在各种研究 GPT⑷o 的，结果，却扒出了1些番外的料也没有知道 GPT⑷o 的中文语料库是哪儿来的，里面有没有少的。

钓鱼网站的违禁词，像什么 “ x 片免费视频 ” 这类的。

给人老外都整无语了。。

像这样的乐子，以后指没有定还要冒出来没有少但言归正传， GPT⑷o 的出现确实又给 AI 开了个新副本按照之前 ChatGPT 问世以后，其他友商步步紧逼的尿性世超盲猜，在 GPT⑷o 以后，类似的 “Claude-o”“Gemini-o” 应该很快就会出现。

刚好明天就是谷歌的 I/O 了，咱们也浅浅期待1手好吧。

如果您发现本文对您有帮助，请点击右上角的收藏按钮，以便将来方便查看。

随机文章

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样难以置信

您可能也感兴趣:

最近发表

网站分类

TAG标签

随机文章

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样 难以置信

您可能也感兴趣:

为您推荐

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样 难以置信

最近发表

网站分类

TAG标签

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样难以置信

gpt什么器材GPT：上手了刷屏1天的GPT⑷o，我感觉目前也就那样难以置信