Llama 3没能逼出GPT-5!OpenAI怒“卷”To B战场,新企业级 AI 功能重磅推出!

Meta 是本周当之无愧的AI巨星!刚刚推出的 Llama 3 凭借着强大的性能和开源生态的优势在 LLM 排行榜上迅速跃升。

按理说,Llama 3在开源的状态下做到了 GPT-3.7 的水平,必然会显得用户(尤其是企业用户,他们更具备独立部署Llama 3的能力)花钱买来的 GPT-4 没那么香了。网友于是纷纷拱火,“鼓励”OpenAI 交出 GPT-5,才能继续稳坐大模型王位。

不单单是网友,就连 OpenAI 的研究员也有点坐不住了,跑到X上发了一条含义暧昧的推文。

图片

这下网友更加焦急地推测,性能强悍的 Llama 3 可能会扰乱 GPT-5 的发布时间表,甚至提前到4.22日。直到周四,OpenAI的新动作才姗姗来迟。

图片

OpenAI 重磅推出了其扩展的 API 客户的企业级功能,进一步丰富其助手 API,并引入旨在增强安全性和行政控制以及更有效管理成本的新工具。

OpenAI对它寄予厚望:“当你与开发者和企业谈论 AI 模型的有意义工作时,OpenAI 仍然领先,”OpenAI API 产品负责人 Olivier Godement说。

不过,OpenAI这一迂回作战的策略,到底是让很多人始料不及。“油盐不进”的网友回复道,“你是不是把GPT-5拼错了”?   

图片

不过,就像小扎曾在采访里坦言,Meta会开源模型,但不会开源产品。过硬的产品才是一家企业真正的技术壁垒和现金牛。一味烧钱的时代过去了,现在的AI主旋律是探索更多的商业价值。

OpenAI在此时高调宣布升级企业级产品,足可见其在To B赛道厮杀的决心。那么这款新升级的API的能力是否能让企业心动到为其买单呢?

1.私有链接和加强的安全功能

在重要的安全升级中,新的API产品引入了私有链接,这种安全方法允许 Microsoft 的 Azure 云服务和 OpenAI 之间进行直接通信,这有助于最小化通过 API 发送的客户数据和查询的“对开放互联网的暴露”。

这一新增功能补充了现有的安全栈,包括 SOC 2 Type II 认证、单点登录(SSO)、静态 AES-256 数据加密、传输中的 TLS 1.2 加密和基于角色的访问控制。   

此外,OpenAI 引入了原生的多因素认证(MFA)以加强访问控制,以符合日益增长的合规性需求。对于需要 HIPAA 合规性的医疗保健公司,OpenAI 继续提供商业伙伴协议,并为符合条件的 API 客户提供零数据保留政策。

2.升级的助手 API,可处理 500 倍更多的文件

OpenAI 提供的一个较少宣传但最重要的企业产品是其助手 API。它允许企业部署他们训练的定制微调模型,并通过检索增强生成(RAG)调用特定文档,并提供相应的会话助手。

例如,电子商务公司 Klarna 今年早些时候夸赞其使用 OpenAI 助手 API 制作的 AI 助手,能够完成 700 名全职人类代理的工作,重复查询减少了 25%,解决时间几乎减少了 82%(从 11 分钟减少到 2 分钟)。

OpenAI 现已升级助手 API,包括新的“file_search”功能,增强文件检索能力,每个助手可以处理多达 10,000 个文件。

这代表了比以前限制的 20 个文件增加了 50 倍,并增加了并行查询、改进的重新排名和查询重写等附加功能。

此外,API 现在支持流式传输,以实时会话响应——这意味着像 GPT-4 Turbo 或 GPT-3.5 Turbo 这样的 AI 模型将尽可能快地返回输出,而不是等待完整响应的生成。

它进一步集成了新的“vector_store”对象以更好地管理文件,并提供更细粒度的令牌使用控制,以帮助有效管理成本。

3.新功能“项目”,可控制人员对特定任务的访问

一个名为“Projects”的新功能提供了改进的行政监督,允许组织在项目级别中管理角色和 API 密钥。

此功能允许企业客户限定权限、控制可用模型,并设置基于使用的限额以避免意外成本——这些增强功能承诺显著简化项目管理。

本质上,他们可以将一个微调版本的 AI 模型甚至一个普通的模型隔离到特定的任务或文档集,并允许特定的人员在每个任务上工作。

因此,如果你的企业有一个团队正在处理一组面向公众的文档,另一个团队正在处理一组机密或内部文档,你可以在 OpenAI 的 API 内为每个分配一个单独的项目,两者可以使用 AI 模型分别工作,而不会混合或危及后者。

“随着越来越多的组织甚至单独的开发者部署 AI,他们希望在受限的盒子里做事,”OpenAI 的产品团队成员 Miqdad Jaffer 在昨天与 外媒 VentureBeat 进行的相同视频电话采访中说。“‘项目’让你做的是将你的资源、你的成员隔离到一个小型的个性化项目中。你得到了单独的使用报告。你有能力控制访问、安全、延迟、吞吐量和成本,一个组织确实可以以非常安全的方式构建。如果你是一个单独的开发者,你可以毫无顾虑地部署数百个项目。”    

最后一点对于同时咨询或处理多个客户的开发团队特别有帮助。

4.还有一些新的升级

为了进一步帮助组织以经济方式扩展其 AI 运营,OpenAI 引入了新的成本管理功能。

这些包括为每分钟保持一致水平的令牌使用量的客户提供折扣率,并通过新的 Batch API 为异步工作负载提供成本降低 50%,该 API 还具有更高的速率限制,并承诺在 24 小时内提供结果。

然而,要使用它,客户必须在单个请求中一起发送他们的令牌批次——他们想要 AI 模型分析的输入,无论是提示还是文件——并愿意等待最多 24 小时以从 OpenAI 的 AI 模型接收响应。

虽然这看起来像是很长时间,但 OpenAI 的高管告诉 VentureBeat,返回可以快至 10-20 分钟。

它还旨在为不需要 AI 模型即时响应的客户和企业设计,比如一个调查记者研究长篇特写文章,想要发送一堆政府文件让 OpenAI 的 GPT-4 Turbo 筛选并挑选出选定的细节。

或者,一个企业准备一份报告,查看其过去几周的财务表现,而不是几天或几分钟内到期。

随着 OpenAI 继续增强其产品,专注于企业级安全、行政控制和成本管理,更新表明该公司有兴趣为企业直接提供更“即插即用”的体验,以应对 Llama 3 的升空和像 Mistral 这样可能需要企业方面进行更多设置的开放模型的崛起。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/645798.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

flash-linear-attention中的Chunkwise并行算法的理解

这里提一下,我维护的几三个记录个人学习笔记以及社区中其它大佬们的优秀博客链接的仓库都获得了不少star,感谢读者们的认可,我也会继续在开源社区多做贡献。github主页:https://github.com/BBuf ,欢迎来踩 0x0. 前言 …

老外卖27刀每月的教程已经更新

用了两天半的时间,边学习,边整理了一份老外的视频教程,涉及Facebook,YouTube,tiktok等大的流量平台,有案例,有分析,有如何做。 这个教程是老外讲的,没有什么玄乎的塑造价…

mysql 函数 GROUP_CONCAT 踩坑记录,日志:Row 244 was cut by GROUP_CONCAT()

mysql 函数 GROUP_CONCAT 踩坑记录,报错:Row 244 was cut by GROUP_CONCAT 结论:个人建议还是放在内存中拼接吧~db日志信息:Row 244 was cut by GROUP_CONCAT())根本原因:拼接的字符串长度超过 group_concat_max_len […

【LLM多模态】多模态LLM在图表处理的应用

note 在真实场景下,我们进行测试,多模态大模型在处理显著文本时表现尚可,但在处理细粒度文本时往往效果并不太好,why? ​具体原因如下: 首先,视觉编码器的分辨率对于多模态大模型的性能影响较大&#x…

Jenkins 还可以支持钉钉消息通知?一个插件带你搞定!

Jenkins 作为最流行的开源持续集成平台,其强大的拓展功能一直备受测试人员及开发人员的青睐。大家都知道我们可以在 Jenkins 中安装 Email 插件支持构建之后通过邮件将结果及时通知到相关人员。 但其实 Jenkins 还可以支持钉钉消息通知,其主要通过 Ding…

IIC通信(STM32)

一、IIC概念 1、两根通信线:SCL(Serial Clock)、SDA(Serial Data) 同步,半双工 2、带数据应答 3、支持总线挂载多设备(一主多从、多主多从)一般使用一主多从。一主多从的…

clone方法总结Java

Java中Object类当中有许多方法,如图所示: clone方法就是其中一种,分为浅拷贝,深拷贝举一个例子: 浅拷贝: 在Person类当中右键鼠标然后,选中Generate: 然后重写clone方法 protecte…

Linux-应用编程学习笔记(三、文件属性和目录)

一、文件类型 1、普通文件(ls -l 文件,权限前边第一个"-"代表普通文件;stat 文件) 文本文件:ASCII字符 二进制文件:数字0/1 2、目录文件(‘’d):文件夹 3…

每日两题 / 79. 单词搜索 39. 组合总和(LeetCode热题100)

79. 单词搜索 - 力扣(LeetCode) 遍历board,遇到字符等于word的第一个字符时,进行dfs回溯 设置访问数组,标记已经走过的坐标 每次dfs时,往四个方向走,若当前字符不匹配则回溯,记得消…

【深度学习】paddlets,时序数据预测

文章目录 一、环境二、题目1三、题目2四、题目3五、函数参数 资料: https://paddlets.readthedocs.io/zh-cn/latest/source/api/paddlets.models.base.html#paddlets.models.base.BaseModel.recursive_predict https://aistudio.baidu.com/projectdetail/5866171?…

记一次MySQL执行修改语句超时问题

异常问题 原因分析 这个问题发生在开发环境,怀疑是提交事务时终止项目运行,没有提交该事务,造成死锁 调试该事务时时间太长,为什么说有这个原因呢,因为通过查找日志显示 The client was disconnected by the server …

$subcribe的使用

$subcribe的使用 只要是store都有$subscribe函数,是订阅的意思,可以监测到store中数据的变化 使用$subscribe函数可以实现刷新不丢失,将数据保存到浏览器的本地存储中,每次进入页面都使用localStorage的数据填充页面

【credit_based流控机制】

credit_based流控机制 1 credit_based way1.1 Principle1.3 DFD1.4 Module1.4.1 Interface1.4.2 Code Block 在网络芯片处理大流量报文中,一般主要是两种机制:1.valid–ready反压(backpressure)机制;2.credit信用机制; credit机制…

电商API接口(api商品数据)【电商商品实时数据采集API接口】

众多品牌选择电商API实时数据采集接口进行采购,主要是出于以下几个重要原因: 第一,高效便捷。比价工具通过自动化的方式获取价格信息,避免了繁琐的人工操作,大大节省了时间和精力。 第二,精准比较。API比价…

常见的CSS布局

1 左侧固定宽度&#xff0c;右侧自适应宽度的两列布局实现 HTML: <div className"outer"><div className"left">固定宽度</div><div className"right">自适应宽度</div></div> 方法1&#xff1a;左侧div设…

美发店服务预约会员小程序的作用是什么

美发店不同于美容美甲&#xff0c;男女都是必需且年龄层几乎不限&#xff0c;商家在市场拓展时只要方法得当相对比较容易&#xff0c;当今客户适应于线上信息获取、咨询及实际内容开展&#xff0c;商家也需要赋能和提升自身服务效率&#xff0c;合理化管理。 运用【雨科】平台…

C语言基础(六)

C语言基础 指针与一维数组总结 * p、* (p)、&#xff08;\*p&#xff09;、* p、*(p)、*p区别和用法运算优先级p与p区别*p与 *&#xff08;p&#xff09;与&#xff08;*p&#xff09;*p与 *&#xff08;p&#xff09;与 *p 指针常量与一维数组的关系指针变量与一维数组的关系数…

002 仿muduo库实现高性能服务器组件_整体框架

​&#x1f308;个人主页&#xff1a;Fan_558 &#x1f525; 系列专栏&#xff1a;仿muduo &#x1f339;关注我&#x1f4aa;&#x1f3fb;带你学更多知识 文章目录 前言项目框架小结 前言 本文不会包含任何项目模块的代码&#xff0c;旨在向你介绍项目具体分为哪几个模块&am…

文档档案管理系统整体建设方案书(实际项目原件word2024)

1.系统概述 1.1.需求描述 1.2.需求分析 1.3.重难点分析 1.4.重难点解决措施 2.系统架构设计 2.1.系统架构图 2.2.关键技术 数据备份技术 3.系统功能设计 3.1.功能清单列表 3.2.基础数据管理 3.3.位置管理 3.4.文档使用 3.5.文档管理 软件全套资料包获取方式①&#xff1a;软件项…

揭秘 淘宝死店采集私信筛选,号称日赚500+

淘宝死店采集工具为电子商务创业者揭示了一个领域的新机遇&#xff0c;通过提供一系列深入分析和资源挖掘的功能&#xff0c;展现了从失败中寻找成功之道的独特方法论。以下是如何通过这种工具寻找电商平台中的隐含机会的几个关键方面&#xff1a; 分析失败的深层原因&#x…