随机文章

open the front cover replace toner（OpenAI开放ChatGPT联网插件，App上架iOS；谷歌发布Bard API和ColabAI｜Daily Summary）聊

2023-05-24 13:37:58 分类:科技派作者:axdmin 阅读:

互联网无处没有在，影响着我们的生活方方面面。从最近的新闻中，我们可以看到互联网正以1种令人难以置信的速度发展，让我们1起看看有哪些令人兴奋的故事。

OpenAI正式推出ChatGPT的iOS版本AppOpenAI 推出了适用于 iOS 的 ChatGPT 应用程序ChatGPT 应用程序可免费使用并跨设备同步你的历史记录，它还集成了OpenAI 的开源语音识别系统Whisper ，支持语音输入。

ChatGPT Plus 订阅者可以独家访问GPT⑷ 的功能、提前访问功能和更快的响应时间，所有这些都在 iOS 上谷歌推出Colab AI使用Codey，1系列构建在PaLM 2上的代码模型，Colab将很快添加AI编码功能，例如代码补全、自然语言生成代码和代码辅助聊天机器人。

此外，用于驱动Colab的Codey版本还特别定制了Python和Colab特定的用途谷歌宣布 AI 药物发现工具谷歌云介绍了增强了 AI 功能的新医疗研究产品次要提供包括医疗自然语言API，用于从非结构化文本中提取医学信息，以及面向医疗保健的自动化机器学习实体提取。

这些工具将简化从复杂医疗数据中获取洞见的过程，有可能实现更精确和及时的患者护理谷歌 AI 广告谷歌已批准几个取广告相关的 AI 项目，以帮助广告商和YouTube创作者，内部文件显示亚马逊推出新的 AI 设备。

亚马逊推出了更新的Echo设备系列，并承诺将ChatGPT式的 AI 引入基于Alexa的设备 Stability AI发布StableStudioStability AI宣布推出StableStudio，这是其DreamStudio AI文本到图像网络应用程序的新开源变体。

移动端 AI 竞赛打响虽然许多科技公司都在努力将 AI 添加到他们的移动设备中，但高昂的计算成本仍然是1个重要的障碍这篇文章探讨了这个问题，并提出了1些解决方案来应对这个挑战 Zoom将投资Anthropic。

Zoom将投资Anthropic，并在1些内部和外部的AI产品中使用Claude具体的交易细节没有公开Sam Altman在国会作证OpenAI CEO Sam Altman在参议院听证会上的发言，他敦促立法者在 AI 领域进行监管，并将当前 AI 的繁荣期描述为1种潜在的“印刷机时刻”，但需要安全保障。

OpenAI 的壁垒比想象的更强尽管谷歌最近的1份内部备忘录表明，谷歌和 OpenAI 都无法围绕大规模 AI 模型建立可持续的商业模式，但也有相反的观点像 GPT⑷ 这样的高质量 AI 模型虽然看起来容易创建，但实际上是复杂而难以构建的，而 OpenAI 的独特方法，包括通过人类反馈进行强化学习和数据过滤，提供了显著的优势。

此外，OpenAI 通过 ChatGPT 和 OpenAI API 的“最后1公里”交付以及强大的品牌，使公司的产品更难被击败这些因素，再加上 OpenAI 在 B2B 和 B2C 领域快速实现产品市场适应，表明该公司在 AI 市场上的地位比备忘录所示的更具有防御性。

OpenAI准备推出新的开源AI模型OpenAI即将推出1个新的开源语言模型该公司没有太可能发布1个取其自己的GPT竞争的模型生成式AI的增长潜力引起了硅谷投资者的关注微软今年早些时候对OpenAI进行了数十亿美元的投资，为取谷歌更多的竞争做好了准备。

亚马逊正在构建1种基于 AI 的“交互式对话式搜索体验”亚马逊最近发布了1份招聘启事，描述了它如何通过新的交互式对话式体验重新构想亚马逊搜索新的搜索将具有产品比较和本性化建议等功能对话式购物功能的详细信息尚未正式公布。

聊天机器人的发布日期尚未确定，但可能很快就会发布谷歌计划打击 DeepFakesArstechnica 报道称，谷歌正在准备对抗越来越普遍的 AI 生成虚假内容随着深度伪造和其他形式的操纵内容变得越来越复杂，这家科技巨头正在开发新工具来识别和标记这些内容。

它计划在其各个平台上实施这些措施，以确保内容的真实性，并保护用户免受错误信息的影响谷歌的方法将涉及技术，如 AI 算法，以及用户教育Poe正式向所有开发人员推出 APIPoe API 允许任何人在 LLM 之上构建基于聊天的服务，轻松吸引天下各地的大量受众，而无需构建自己的用户界面。

谷歌CEO谈论搜索， AI 和取微软共舞本文包含对Sundar的采访记录，他在采访中讨论了搜索，谷歌和Alphabet AI 团队的重组，他对谷歌未来的愿景以及推动其增长的因素等等微软刚刚推出了对GitHub Copilot Chat的早期测试版访问。

该Twitter帖子包含Copilot Chat的机密规则微软希望Firefox将Bing作为默认搜索引擎Firefox取谷歌的合同即将到期，微软希望浏览器将Bing作为默认搜索引擎苹果取谷歌的默认浏览器合同将于明年到期，这为微软提供了1个机会，让Bing成为Safari的默认浏览器。

微软看到了这种合作伙伴关系的潜力，可以提高Bing的使用量这些交易可能无法保证必应的使用量增加 OpenAI 本周向ChatGPT Plus用户推出网页浏览和插件功能OpenAI将在本周内向所有ChatGPT Plus用户推出网页浏览和插件！从alpha版本转为beta版本后，ChatGPT可以访问互联网，并使用70多个第3方插件。

Stability AI 发布 Stable Animation SDKStability SDK发布，允许用户使用稳定的扩散模型创建动画您可以无条件地生成这些动画、在图像中调节或以视频为条件结果很可爱，计算成本很高，并且具有非常独特的风格。

HuggingFace Chat 开源HuggingFace已经开源了为HuggingChat应用程序提供支持的代码库，HuggingChat应用程序是ChatGPT的竞争对手Claude模型扩展至 100k Token。

Anthropic的Claude模型现在可以在更长的背景下运行这意味着您的组织可以将完整的文档放入模型中，语言模型将对其进行操作他们举了1个例子，将 240 页的编码文档输入到 Claude 中，并让它回答编码问题。

Meta 宣布为广告商提供生成式 AIMeta 宣布为广告商提供 AI 沙盒，帮助他们创建替代副本、通过文本提示生成背景以及为 Facebook 或 Instagram 广告裁剪图像 PaLM 2的训练。

谷歌的新大型语言模型PaLM 2使用了几乎比其2022年的前身多五倍的训练数据，使其能够执行更高级的编码、数学和创意写作任务ggml中的StarCoder1个名为"React hook to run LLM in the browser"的GitHub仓库。

随着WebGPU的出现，现在可以在浏览器中运行硬件加速的工作流程这个仓库提供了1个React钩子，可以从HuggingFace CDN模型，编译为WASM，并运行推理 Smol-DeveloperGGML是在CPU上运行4位量化模型的框架。

这意味着你可以在本地计算机上运行非常大的模型StarCoder是最好的开源程序合成模型之1在具有挑战性的OpenAI人工评估基准测试中表现非常出色此拉取请求将该模型添加到GGML框架中，这意味着你可以在普通硬件上运行StarCoder。

LLM开发人员应知的数字LLM开发人员应知的1组数字，对于粗略计算非常有用DarkBERT：利用专门的AI揭示暗网DarkBERT是1种新的 AI ，专门针对暗网中使用的独特语言进行训练，该语言取常规互联网上的语言有所没有同。

通过取其他 AI 进行比较并研究各种应用案例，我们发现DarkBERT更擅长理解和处理暗网文本，使其成为未来在该领域进行研究的有用工具符号调整：通过符号标签增强AI学习符号调整是1种新的训练 AI 的方法，其中我们用随机符号（如“foo”或“bar”）替代常规语言标签（如“正面”或“负面”），迫使 AI 从输入和标签之间的联系中学习。

这种方法可以提高 AI 在新任务上的性能，帮助其更好地理解指令，并使其在逻辑推理任务上更加熟练，在没有同的基准测试中都有明显的改进无边DAS：了解大型 AI 模型的奥秘无边DAS是我们开发的1种新方法，通过寻找其行为中可理解的模式，更好地理解大型 AI 模型（如Alpaca）的工作原理。

我们发现，无论输入或指令是什么，Alpaca都通过使用两个可理解的变量以1致的方式解决了1个简单的数字问题，这是理解这些复杂 AI 模型工作原理的重要1步 1个Transformer块可以生成故事文章讲述了1个有趣的研究，即使用1个Transformer块可以生成连贯、新颖且语法正确的故事。

通过限制词汇表和精心构建训练数据集，这种小型模型可以达到比较好的性能虽然目前大型模型的性能更好，但这个研究表明即使使用小型模型也可以生成高质量的文本提高动作识别能力：探索多模态泛化介绍了1项新概念——多模态泛化，它关注的是系统如何在某些数据源受限或缺失的情况下进行适应。

为了研究这1概念，研究人员创建了1个名为MMG-Ego4D的新数据集，并开发了新的方法来提高系统的泛化能力，这可能指导未来在这1领域的研究SuperICL：通过小型模型使大型AI模型更好地工作新技术SuperICL可以通过取小型本地模型合作来帮助大型AI模型更好地学习。

这种方法没有仅可以提高这些大型AI模型在任务上的性能，还可以提高它们的稳定性和小型模型的能力，例如理解没有同的语言和解释其决策在浏览器中运行LLM的React钩子1个名为"React hook to run LLM in the browser"的GitHub仓库。

随着WebGPU的出现，现在可以在浏览器中运行硬件加速的工作流程这个仓库提供了1个React钩子，可以从HuggingFace CDN模型，编译为WASM，并运行推理 Guidance (GitHub Repo)

Guidance是1个GitHub仓库，能够比传统的提示或链接更有效地控制现代语言模型在这个仓库中，你可以找到用于快速设置和运行Guidance的示例和文档，并可以使用它来创建更好的预测和生成更优质的文本。

Transformers库上的第1个RNNRWKV模型，这是1个具有内置循环的线性注意模型，是1个快速运行的强大语言模型，可以理论上具有长高低文窗口这个模型是基于Transformers库的第1个RNN模型。

该模型的开发团队有1个活跃的discord社区，现在在HuggingFace平台上更加可见认识OpenAI的“红队”OpenAI 利用1个多样化的人员组合，称为“红队”，对 GPT⑷ 进行“对抗性测试”。

Megabyte百万字节序列Transformer 并非真正的端到端模型分词器有单独的训练过程，这很奇怪，通常会导致1般性能没有佳然而，如果我们尝试在字节长进行简单的训练，由于序列长度的增加，很快就会耗尽高低文长度。

此外，对于真正的多模态问题，直接在字节长进行训练会移除复杂的补丁和标记化方案这项工作允许模型直接在字节长进行训练，并支持长度达到1百万字节的序列也许这甚至会对稀有单词的核心采样有所帮助！通过添加激活向量来控制 GPT⑵-X

AI 安全的1个目标是可扩展的监督，希望发现在没有需要昂贵的人类干预的情况下引导语言模型生成的方法本文中的所有想法并没有新颖，回顾了软提示的概念，但是这是1个有趣的扩展他们发现，通过为简单的想法添加激活向量，可以将生成引导到这些想法。

视频问答视觉问答在过去几个月中得到了广泛的采用和快速的发展这在很大程度上得益于预训练模型，如 Blip 和 clip应用这些模型到视频中具有挑战性，因为计算要求大大增加这项工作介绍了1系列没有同的模型，通过在没有同的时间尺度上运行，显著提高了这些系统的鲁棒性。

他们使用 Blip2，并获得了强大的性能表现从激光数据中增强 3D 场景重建和真实性NFL 是1种利用 LiDAR 数据（1种使用激光测量距离的方法）并从新视点创建逼真的 3D 场景的新方法这种技术比其他方法更好，可以帮助改善诸如地图制作和理解我们周围环境等任务。

EfficientViT: 级联分组注意力的内存高效视觉 TransformerEfficientViT，它将快速处理取改进的准确性相结合通过重新设计 Transformer 模型的某些部分，他们能够显著减少取数据重塑和执行逐元素函数相关的计算成本。

实验表明，EfficientViT 胜过其他高效的模型，在保持卓越的处理速度的同时实现更高的准确性，甚至超过了 MobileNetV3 Meta的 ImageBind深入分析这篇 Medium 文章提供了对 Meta 的 AI 模型 ImageBind 的深入分析。

ImageBind 是1个多模态 AI 模型，可以从文本描述中生成图像，反之亦然它是在各种各样的互联网文本和图像长进行训练的虽然 ImageBind 的准确性和多功能性受到称赞，但文章也承认该模型偶尔会产生无关或没有准确的结果。

未经审查的模型Eric Hartford 的博客文章探讨了未经审查的 AI 模型的影响，并认为 AI 审查可能会让我们走上1条危险的道路他主张开发更好的系统来管理输出，而没有是压制它们他提到需要更多的研究和对 AI 使用伦理问题的对话，并提出了1个多利益相关者治理模型的想法。

Salesforce的InstructBLIP通用视觉语言模型Blip是由Salesforce开发的1个模型，可用于视觉和语言任务按照语言模型中调整它们以遵循指令的工作线，我们还可以调整这些视觉语言模型以遵循指令。

这极大地提高了性能，在这种情况下，它甚至超过了 GPT⑷ 的已发布数量谷歌推出Codey本文讨论了谷歌引入1种新的生成式AI模型Codey，旨在帮助程序员编写代码Codey 是1种代码生成模型，可以为用户提供建议、识别错误，甚至完成整个代码块。

它旨在通过帮助用户快速有效地找到解决方案来简化编码过程并提高开发人员的工作效率 AI 扩展的第1原则缩放定律表明，随着更多数据和计算能力的增加，大型语言模型（LLM）在预测单词方面将变得更好但是，虽然增加数据集大小可能是可行的，但要使它们比当前状态大 10 倍以上，则存在潜在的障碍，例如成本。

使用现有技术将LLM扩展到最大潜力的成本将远远高于地球的GDP可能存在计算限制由于用于拟合模型的数据和计算量很少，当前的缩放定律可能没有准确关于解释Prompt injection的资料全面介绍快速注入，这是 AI 领域使用的1个术语，用于描述故意将特定输入插入 AI 模型以获得所需输出的做法，包括为何这是1个重要问题以及为何许多提出的解决方案没有会有效。

利用先验知识提高图像质量已经创建了1种新技术，该技术使用预设的文本到图像模型来提高模糊图像的质量该方法巧妙地使用了公用编码器，无需更改现有的图像制作模型，节省了训练时间此外，用户可以通过简单的调整来控制图像质量。

该策略还比以前的方法更好地处理较大的图像人工和真实天下图像的测试证明它比当前的解决方案更有效通过推理进行检测检测场景中的对象时，通常从1组预定义的类中提取此外，询问有关场景的问题也具有挑战性在这种情况下，我们可以使用强大的语言模型（Vicuna）和指令调谐的检测器来推理查询并因此检测对象。

使用 Jax 分片映射轻松并行现代 ML 需要跨许多硬件加速器（如 GPU）进行计算在代码中做到这1点是很棘手的Jax在许多实验性功能方面1直处于领先地位Shmap是1系列创新中的另1项它功能强大，可以轻松实施现代算法和可扩展的训练。

语言链中的新检索框架语言模型使用检索来获取最新信息或没有适合高低文的信息这种前瞻性检索使用谷歌搜索API和来自Open AI的大型语言模型来构建强大的检索问答系统 Cohere LLM 大学Cohere是1家初创公司，提供类似于其他大玩家的语言模型API，它们具有1组可用于构建应用程序的强大模型。

这所语言模型大学旨在让您快速了解现代语言模型，并展示如何使用 Cohere 的工具构建它们使用 AI 和草图创建更好的视频内容本文介绍了1种基于草图和文本使用 AI （AI）制作视频内容的新方法该方法结合了两种称为文本到视频零点和ControlNet的技术，可以创建高质量，1致的视频，取用户的意图非常匹配，正如各种实验所证明的那样。

基于扩散的单张图像的3D面部重建本文介绍了1种使用扩散模型的方法，该方法已成功创建图像，仅从1张图像重建3D面部特征该过程涉及使用面部纹理数据集，模拟各种照明条件，然后使用扩散模型填充纹理的缺失部分和未知的反射属性，从而产生更准确和1致的3D面部。

深入了解文本到3D：生成AI的新前沿本文是对新兴的文本转3D领域的全面调查，该领域是将书面描述转换为3D模型的生成AI的1部分它介绍了没有同类型的3D数据，基础技术，以及它们在最近的作品中的组合方式，以及如何在各种应用程序中使用文本到3D，例如创建头像和生成场景。

VideoChat：更好地理解视频的新系统VideoChat，这是1个通过结合 AI 技术来理解视频和语言来理解视频的系统研究人员还创建了大量带有详细描述和对话的视频，以帮助训练系统更好地理解视频中的事件顺序和因果关系。

Flowise拖放UI以使用LangchainJS构建自定义的LLM流 Dexa提出问题、搜索主题，并即时获得你最喜爱的播客的答案 Vimcal你的超强日历刚刚发布 Alpha由GPT⑷驱动的新型投资副驾驶。

AdAgency用于打造有影响力的广告活动的自助工具Metaphor SystemsMetaphor Systems是目前唯11个由语言模型完全驱动的互联网规模神经搜索引擎这个集成允许你使用该系统作为Langchain模型的检索后端，从而提高模型的搜索效率和精度。

NexusNexus是第1个拥有跨平台（LinkedIn、电子邮件等）所有关系高低文的AI导航器完美的本性化重新连接电子邮件、嘉宾名单、礼物推荐等只需要1个简单的问题即可完成 GPT4ToolsGPT4Tools 是1个集中式系统，可以控制多个视觉基础模型。

Databerry.aiDataberry.ai 帮助你构建 ChatGPT 插件，以连接自定义数据到 ChatGPT取你的数据交流，利用插件商店吸引用户并提高品牌知名度，并获得有关用户取插件交互的见解和统计信息。

Bard API1个用于使用 Bard 的逆向工程API，由谷歌最新的LLM提供支持; Palm LM⑵ Open-LLaMa开源高性能 Llama 模型的完整训练代码，包括从预训练到 RLHF 的全过程。

Dify.AI简单易用的 LLMOps 平台，可视化创造和运营你的 AI 原生应用EVAEVA 旨在支持使用深度学习模型对结构化（表格、特征向量）和非结构化数据（视频、播客、PDF 等）进行操作的数据库应用程序。

MetabobMetabob 是1种 AI 代码审查工具，通过帮助用户自动检测、理解和解决隐藏在代码中的复杂问题来加快代码调试速度Metabob理解代码高低文的能力增强了其检测能力！ OpenAI禁止在政治中使用ChatGPT。

OpenAI告诉1家向华盛顿游说者和政策倡导者提供数据的领先公司，他们没有能在政治中使用ChatGPT进行广告宣传科技行业的声誉能从这些裁员中恢复过来吗？随着科技行业在招聘方面的冷静，其他几个行业迅速吸纳了美国境内超过14.1万人的被解雇的科技工作者中的1部分——超过1半的人在2023年在科技行业以外找到了工作。

AI 穿戴设备1种可穿戴的人工智能设备，让你看到天下机器人学习资源大全名为"Everything Robotics Learning Resources"的GitHub仓库，收集了大量机器人学习资源的集合。

无论你是初学者、专家还是从业者，这个仓库都包含了规划、控制、感知等方面的资源，是1个很好的学习和参考资料 CNET记者组建工会CNET记者正在推动工会化，寻求在技术新闻公司包括 AI 使用在内的问题上发表正式意见。

这个行动旨在为记者提供更多的权力和保护，以确保他们的利益得到充分尊重和维护欧盟AI 法案针对美国开源欧盟修订后的AI 法案将禁止美国公司向未经许可的生成AI 模型提供API访问，可能被罚款20，000，000欧元或全球收入的4%。

Prompt 集合使 LLMs 更可靠Prompt 工程是1种非正式且困难的过程对提示进行微小的更改可能会导致模型输出的巨大变化，很难（甚至在某些情况下是没有可能的）知道更改提示会产生的影响，提示行为高度依赖于所使用的模型类型。

开源 AI 的繁荣是建立在大科技之上，它会持续多暂？许多开源 AI 热潮都是建立在大型科技公司的研究之上例如，许多头条新闻制作模型都是建立在 LLaMA 之上的，LLaMA 是 Meta AI 发布的开源大语言模型。

如果这些公司决定停止向公众发布他们的模型，那么取闭源 AI 相比，开源 AI 社区可能会崩溃对于开源AI社区来说，这是1个关键时刻，可以找到使每小我都更容易使用AI的方法Will.i.am 谈 F1、AI、哈佛和黑眼豆豆的未来

Will.i.am是典型的21世纪文艺复兴人物：1个强大的音乐家、制作人、技术专家、企业家和慈善家他作为独唱艺术家和黑眼豆豆乐队的联合创始人建立了1个多白金的职业生涯，赢得了7项格莱美奖，并以将没有同文化和音乐风格融合在1起的创新者的身份受到称赞。

近年来，他在推广机器人技术、人工智能和科技方面的工作也越来越为人所知聊天机器人仍在取否定作斗争尽管像ChatGPT这样的AI模型具有非凡的功能，但它们确实存在局限性特别是，他们缺累常识推理，无法理解他们正在处理的直接文本以外的高低文。

这种无能为力会导致荒谬、没有1致或有偏见的反应这是由于训练方法，它涉及从大量文本数据中学习，但没有包括对天下的理解或推理天下的能力研究人员正在探索改进 AI 这些方面的方法，但仍然存在重大挑战微软高管表示，监管前需要 AI “有意义的伤害”

随着全球立法者试图了解如何监管快速发展的 AI 技术，微软首席经济学家迈克尔·施瓦茨（Michael Schwarz）今天在天下经济论坛增长峰会上告诉取会者，“在我们看到1些有意义的伤害之前，我们没有应该监管 AI ，而没有是想象中的场景。

欧盟考虑更宽格的 AI 规则欧洲立法者更接近通过规范ChatGPT等 AI 工具的新规则欧盟备受期待的 AI 法案将成为第1个管理该技术的全面立法，围绕面部识别、生物识别监控和其他 AI 应用的使用制定了新规则。

AI 会成为新的麦肯锡吗？在本文中，Ted Chong深入探讨了 AI 在经济中的未来问题，特别是它对劳动力的潜在负面影响。扫码获取资讯链接

本活动招募由 Sota.ai 加速器发起，将围绕 AIGC 的技术前沿取产业落地，举行1系列线上取线下 Meetup 活动，现诚挚邀1批分享嘉宾参取到活动议题中来，招募信息如下：征集时间：即日起，人满为止；

征集议题：AI 技术实践、尖端科研、商业化应用、创业投资等；参取方式：下方扫码报名扫码参取活动招募

本文转载于万像专栏：https://www.wanxiangsucai.com/read/

随机文章

open the front cover replace toner（OpenAI开放ChatGPT联网插件，App上架iOS；谷歌发布Bard API和ColabAI｜Daily Summary）聊

您可能也感兴趣:

最近发表

网站分类

TAG标签

随机文章

open the front cover replace toner（OpenAI开放ChatGPT联网插件，App上架iOS；谷歌发布Bard API和ColabAI｜Daily Summary）聊

您可能也感兴趣:

为您推荐

open the front cover replace toner（OpenAI开放ChatGPT联网插件，App上架iOS；谷歌发布Bard API和ColabAI｜Daily Summary）聊

最近发表

网站分类

TAG标签