• 博客
  • 关于我们
  • 加入我们
  • 产品信息

新闻专题:OpenAI 最新产品更新

fiisual

2025/1/10

本文主要分享ChatGPT在去年12月发布的新功能,内文中分为5大面向来进行整理与讨论。新模型与方案的发布:推出全新o1-Previous 版本,提供更高的计算及处理问题的能力;开发者优化:透过与学界与专家合作的方式提高模型在特定领域上的分析能力;创新与功能提升:Sora指令式生产影片 & Canvas 一页式整合聊天与生成内容区;ChatGPT 功能新增:提升网页搜寻能力, 透过电话方式联系AI, 专案管理能力;与苹果的合作:与siri合作的apple intelligence;更多其他功能:原生应用程式及语音模式等。OpenAI在此次的推出后展现了AI更多的能力,未来需要更加思考如何在维持公司营利与人类技术革新的平衡。

ChatGPT 于去年 12月4日 惊喜宣布 OpenAI 将从 5 号开始,计划连续 12 天向大众发布、演示OpenAI 即将推出的新功能。消息一出引发大众关注,尤以先前市场上所传出之 o1 新模型的正式推出最令人引颈期盼。由于发布产品与功能众多,我们将分为以下 5 大方向进行整理与论述。

Open AI 新功能5大面向介绍。

新模型与方案的发布

5 日,OpenAI 惊喜释出 o1 模型正式版本,以取代先前于 9 月推出 o1-Previous。大众平常运用的GPT-4 系列着重于文字理解与生成,o1 则在此基础上,进一步强调图像的分析处理及推理能力的优化。根据内部测试结果,o1 相较于预览版减少了 34% 的重大错误,整体运行速度也加快了 50% 左右,展现其优越性能。此外,OpenAI 也顺势推出 o1 Pro,为 o1 的进阶版本,得以提供更高的计算能力,处理专业领域及深度学习模型之中复杂的问题。

同时,OpenAI 新增了 ChatGPT Pro,为全新的订阅方式。过往用户仅有免费以及 Plus 两方案可以选择,Pro 方案之下,用户每月只需支付 200 美元,便可无限制的存取及使用旗下 o1、GPT-4o、进阶语音功能等,以及目前最聪明的模型-o1 Pro,获取各领域中更精确、可靠的回应。此方案主要针对 ChatGPT 的重度使用者,特别是学术研究者、程式开发人员等,满足他们对于 AI 的高度需求,OpenAI 也表示将持续优化 Pro 方案的功能。

开发者优化

OpenAI 开始实施模型的「强化微调研究计划」其正在征集开发人员和机器学习工程师等,训练客制化的专业模型。简单而言,就是期望透过学界、业界专家精准的使用回馈,增强模型于特定领域的推理能力,提高于该领域分析的正确性与应用深度。这样的计划可以加速专业模型深入产业应用,针对像是金融保险、法律、工程等产业,OpenAI 表示已有一定程度的发展,将协助提高研发、分析方面的价值。

除了上述提到的模型客制化,OpenAI 也优化了开发者端的工具,包括:

  • OpenAI o1 推理技术加入API支援,用于简化客户服务、供应链决策、预测财务趋势等。目标使用者为使用层级 5、熟悉深度应用技术的开发者,本次新增包括函数呼叫、结构化输出等功能。
  • 即时 API 的改进创造了低延迟、自然的对话体验,同时整合 WebRTC 技术并降低价格。
  • 偏好微调得以针对用户及开发人员的偏好,调整模型资料输出入的方式,提高灵活性。
  • 除了现有的 Python、Node.js 等,新增 Go 与 Java SDK 开发工具包,扩大 API 的开发范围。

创新与功能提升

Sora

本次发布的其中一大亮点为 Sora,其能自动分析用户指令,产出符合使用者需求的影片,目前仅提供 ChatGPT Plus 以及 Pro 会员使用。OpenAI 于本次正式发布了 Sora 并展示其功能,除了本次的最大创新-允许用户输入场景叙述,由AI创造影片(Prompt)外,其余编辑功能包含:影片混合(Remix)、重新剪辑(Re-cut)、无缝循环(Loop)、融合(Blend)、故事版(Storyboard)等,大多仅需由用户下达文字指令即可达成,使影片编辑的功能更加平易近人。

Sora 之所以众所瞩目,是其具突破性的将生成式 AI 技术延伸到影音,同时推动生成式 AI 朝向通用人工智慧(Artificial General Intelligence, AGI)迈进,未来可能影响剪辑软体,甚至是剪辑师、动画师等的职业需求。不过,外界普遍的担忧为隐私性、肖像权及版权方面的问题。OpenAI 于报告中表示其训练管道多元,同时也与专家合作,避免成为有心人士创造违法影片的管道。然而,先前OpenAI 曾因使用未经授权的文字作品训练 ChatGPT 而遭《纽约时报》起诉,本次针对 Sora 的训练技术来源,OpenAI 也未揭露使用内容。在外界对于隐私性担忧存在的情形下,距离深入产业与大众应用可能仍需一段时间。

Canvas

ChatGPT 编辑器 Canvas 新功能示意图。

第四天,OpenAI 发布了近似于编辑器的 Canvas 功能,并开放给所有用户。过往,不论是在撰写文章或编辑 Python 程式时,用户往往需针对不同动作与 ChatGPT 进行来回问答,并于另一编辑页面将所得资讯逐次拼贴、排序成完整文章或编码。在 Canvas 页面中,左侧为 ChatGPT 聊天界面,右边结果生成区,使用者可于左侧界面输入指令,ChatGPT 便会依照要求于右侧生成结果。此功能不仅省去了用户整理资讯的时间,ChatGPT 更是可以针对上下文产出更精确的结果。

除此之外,ChatGPT 还可以依照用户需求对结果进行最后润饰,并针对幼儿园到研究生等不同程度的读者进行用字与编排上的调整。不过,目前市场上的文字专业编辑软体如:notion,已推出内嵌式的 AI,提供用户编辑上的辅助;主打编程专用的 AI 软体 Cursor,由于拥有完整程式库的上下文,在表现上效率更高。Canvas 相对而言仍在初期发展阶段,具体应用上的竞争力仍需进一步提升。

ChatGPT功能新增

1. 搜寻功能

本次的一大亮点为 OpenAI 于 ChatGPT 之下新增了搜寻功能,其不仅可以在 ChatGPT 网页上进行搜索,更大的亮点为用户可以下载 Chrome 扩充功能,直接透过浏览器网址列进行搜寻。OpenAI 积极与各大新闻和数据提供者合作,直奔消息来源的策略也强化了整体资讯的可信度。此功能的推出,首当其冲的冲击对象为目前拥有全球超越九成市占的搜寻引擎巨头 Google,因其更直觉的搜寻方式有望改变整体网路搜寻的运作。目前 Google 的超过 50% 的收益来源为庞大人流之下带来的广告收益,使用者未来可能的偏好转变将撼动 Google 业务上的垄断地位。

2. 1-800 ChatGPT热线

ChatGPT的美国用户可以拨通1-800热线(1-800-242-8478),全球用户则可透过 WhatsApp 发送讯息与 ChatGPT 的 AI 助理取得联系。此功能的一大亮点为其超越了网路的限制,即使在网路讯号不佳的情况下,也可以得到 AI 即时的帮助。不过,目前大众上对于该功能的安全性表示怀疑,因 Google 曾于 2007 年推出 Google-411 语音辨识服务,当时的 Google 副总裁 Marissa Mayer 就曾直接表明服务的推出是为了采集样本,以提高语音输出的准确性。虽然 OpenAI 保证不会利用大众与 AI 的通话进行大型语言训练,却难消市场的担忧。此外,基于安全考量,通话的内容均有可能被审查,强化了整体隐私性的疑虑。

3. 专案管理功能

OpenAI 为 ChatGPT 新增了专案功能,用户可以依特定主题为对话建立有组织的资料夹,同时上传相关文件,创造自订的 AI 资料库,ChatGPT 即可从海量资料中抓出关键论点进行分析。此功能旨在强化使用者与 ChatGPT 对话中上下文的连贯逻辑,方便使用者进行主题性的研究。本功能与 Google 所推出之 Notebook LM 相似,均拥有 AI 辅助思考以及档案上传等功能。两者皆处于起步阶段,目前功能应用上看来也各有优缺,竞争的关键将会落在逻辑推理的能力上。

与苹果的合作

ChatGPT 与苹果合作示意图。

9日,OpenAI 展示了 Apple Intelligence 将如何应用 ChatGPT,成为横跨 iOS、MacOS 系统的智能助手。其与先前苹果于秋季发布会中展示的功能相似,主要亮点为 siri 的应用广度、深度提升。相比于 ChatGPT 以文字输入,苹果用户可维持过往使用 siri 的习惯,透过语音提供指令,再传输给ChatGPT 进行分析并反应,由 siri 协助在手机上完成。应用情境如:当朋友与用户以讯息分享某位歌手发行的新专辑消息时,用户只需一声令下「播放」,ChatGPT 便能分析现在情境而开启音乐软体播放该专辑。互动性拉高的同时,资讯的揭露与指令的实践也更加快速直觉。另一亮点为视觉化的应用,ChatGPT 可以透过相机,针对镜头所见提供用户资讯,应用具象化下也提高了先前苹果于iPhone16之「相机快捷键」亮点

11 日,苹果顺势推出 iOS 18.2,以支援 OpenAI 提供的新功能。先前,大众对于 Apple Intelligence的具体应用前景持保留态度,甚至于 Q3 财报推出后引发投资人疑虑。本次功能的正式推出,对于苹果而言无疑是给予市场一颗定心丸,也令大众开始期待后续应用上的优化。然而,尽管这些功能提高苹果用户的便利性,但在即时且深入剖析用户使用习惯、模式的过程中,却带来一定隐私性上的顾虑。尤其苹果是相当强调资安的品牌,与 ChatGPT 的合作或许会降低部分用户对于隐私保护的信心。

更多其他功能

第十一天,OpenAI 推出了适用于 MacOS 与 Windows 上的原生桌面应用程式,同时新增语音模式,简化用户输入指令的流程与障碍。OpenAI 也扩大了第三方应用程式的整合,包含多个终端、文字编辑 App 以及整合式开发环境(IDE)ChatGPT将超越问与答,如同秘书、助理般与用户一同协作,并提供主动、即时的使用支持。受益最大的为开发者,因其能与编程环境融合,根据要求及上下文撰写代码、进行错误排查等,显著提高编写效率。

除了上述提到的功能之外,本次发布中 OpenAI 也推出 Santa Mode 限定功能,用户可以于圣诞节期间在 ChatGPT 上与圣诞老人聊天。OpenAI 亦于最后一天宣示将持续与法律学界专家合作,旨在强化对于用户指令与文字输入的识别推理,以防遭到恶意人士滥用,提高整体安全性。

总结

综合上述,将新增之ChatGPT模型与应用,对应方案整理如下:

模型/应用FreePlusProTeam
GPT-4oV(有限)V(有更大额度)VV(有更大额度)
o1-miniV(有限)VV(有限)
o1V(有限)VV(有限)
o1 ProV
SoraV(有限)V
CanvasVVVV
搜寻功能VVVV
专案管理功能VVV

OpenAI 此次新品的推出,再次颠覆大家对于 AI 的应用想像,也显示出 OpenAI 不仅希望 AI 能协助解决民众生活、工作之中遇到的问题,更期望AI能朝向具备有独立思辨能力的助理演进,与人类交换意见、相互学习

目前,AI 平均智商正逐渐逼近人类(人类智商约落在90到110之间)未来 AI 的加速革新,将重塑人类获取资讯的模式,聪明的 AI 甚至可能大幅取代部分产业劳力需求。此外,若需获得 AI 更多帮助,大众必须向 AI 揭露更多个人资讯,隐私风险加大。长远而言,不仅会引发道德法律层面等社会问题,更担心人类会被 AI 反噬。

如同外界猜测般,OpenAI 27 日透过官方部落格中宣布,预计于 2025 年将原先营利化的部门转型为德拉瓦州公益公司(Delaware Public benefit Corporation)以公司使命以及股东利益作为优先目标,同时维系非营利部门的发展。OpenAI 原先为创造广泛受益且安全的 AGI 所设,选择采用非营利的特殊方式经营即是为了确保人工智慧于适当的范围内开发。有了财务面的支撑,OpenAI 得以拥有更多资金投入研究,相反地也有了利益诱因。因此,在转型为营利事业后,该如何维持公司营利与人类技术革新的平衡,将会是 OpenAI 最大的难题,也是政府、大众需持续关注的方向。

如果你想认识更多OpenAI ,也可以参考这篇噢! 新闻专题:OpenAI 营利化转型

Blog Post Ad

其他标签