语言模型有什么用(Meta推新语言模型Toolformer:通过自主调用工具“击败” GPT⑶)gpt⑶ 深度揭秘

 

站长之家4月28日 消息:Facebook 母公司 Meta 的人工智能研究人员推出了1种新的语言模型Toolformer,旨在处理自然语言处理用例中多个 API的调用Toolformer 基于 GPT-J,后者是1种67亿参数的开源语言模型。

Meta 的研究人员为该模型配备了1系列工具,它可以自主使用这些工具来完成任务,例如预测文本或回答数学问题Toolformer 可以访问的工具包括1个计算器、1个问答系统、两个没有同的搜索引擎、1个机器翻译系统和1个日历。

其中,使用的机器翻译系统是其NLLB模型的6亿参数版本,适用于200种语言Toolformer 使用日历 API,在查询时无需任何输入即壁纸可返回当前日期回答问题系统使用的是 Meta 的Atlas模型值得注意的是,其搜索引擎之1是维基百科搜索,它会在出现提示时返回来自维基百科的短文本片段。

上面的示例展示了 Toolformer 的功能该模型自主决定调用没有同的 API 来获取对完成1段文本有用的信息Meta论文中的这个例子看到该模型利用了1个问答系统、1个计算器、1个机器翻译系统和1个维基百科搜索引擎。

尽管底层模型基于 GPT模型,但 Meta 发现 Toolformer 在少数零样本 NLP 任务上可以胜过 GPT模型虽然 GPT在问答方面表现更好,但 Toolformer 在大多数其他测试中击败了 OpenAI 模壁纸型,包括数学推理和机器翻译。

Toolformer 类似于 OpenAI 的ChatGPT,用户输入自然语言提示,系统生成响应Toolformer 的没有的地方在于,它的各种工具可用于通过搜索引擎功能等工具根据最近发生的事件生成响应ChatGPT 和其他人是使用的是截止某个时间点数据集构建的,这意味着它们无法响应用户对最近事件的查询。

Meta 的研究人员在他们的论文中承认,Toolformer 比其同时代的 ChatGPT 更没有完整,其目前在使用上仍存在局限性”。

为您推荐

语言模型有什么用(Meta推新语言模型Toolformer:通过自主调用工具“击败” GPT⑶)gpt⑶ 深度揭秘

语言模型有什么用(Meta推新语言模型Toolformer:通过自主调用工具“击败” GPT⑶)gpt⑶ 深度揭秘

Meta推新语言模型Toolformer:通过自主调用工具“击败” GPT-3...

2023-05-22 栏目:科技派

当前非电脑浏览器正常宽度,请使用移动设备访问本站!