跟上人工智能和技术的快速发展似乎非常困难。每周或每月都会有新的东西掉落,现在你又在这里学习新东西了!
这次是 GPT-5。
GPT-4 于 2023 年 5 月发布,从那时起,每个人都在等待 GPT-5 的发布。陈思琪3月27日发推文称,“gpt5计划于今年12月完成训练。然而,OpenAI首席执行官Sam Altman在四月份的一次麻省理工学院活动中澄清了这一声明,当时被问及GPT-5时说“我们在一段时间内不会也不会”。
所以这澄清了这一点。然而,一些专家建议 OpenAI 在 4.5 年第三季度/第四季度发布 GPT-4.5,这是介于 GPT-4 和 GPT-5 之间的中间版本。一直在对当前模型进行改进,这可能是 GPT-4.5 的潜在版本。许多人说 GPT-4.5 具有多模式能力潜力,这已经在 4 年 2023 月的 GPT-4 开发人员直播中得到了证明。
尽管人们对 GPT-5 寄予厚望,但 GPT-4 仍然需要消除一些折痕。例如,GPT-4 的推理时间非常高,而且运行起来计算成本很高。还有其他挑战,例如访问 GPT-4 API。
尽管还有工作要做,但我们可以说的是,每个 GPT 版本都突破了 AI 技术及其能力的界限。AI 爱好者很高兴探索 GPT-5 的突破性功能。
那么我们可以从 GPT-5 中获得哪些功能呢?让我们来了解一下。
减少幻觉
这都是关于信任的,这是大多数用户不相信人工智能模型的主要原因。例如,在所有九个类别的内部事实评估中,GPT-4 的得分比 GPT-3.5 高 40%,如下图所示。这意味着与 GPT-4 相比,GPT-4 不太可能对不允许的内容做出响应,而产生事实回复的可能性要高出 40%。
随着新版本将继续改进当前的挑战,据说 GPT-5 会将幻觉降低到 10% 以下,使 LLM 更值得信赖。
图片来自OpenAI
计算效率
如前所述,GPT-4 的计算成本非常高,每个代币 0.03 美元。这与 GPT-3.5 的成本 0.0002 美元相比。这是一个很大的区别。在一万亿参数数据集和基础设施上训练的 GPT-4 反映了成本。
而谷歌的PaLM 2模型只训练了3400亿个参数,并且具有高效的性能。如果OpenAI计划与谷歌的PaLM 2竞争,他们将需要研究降低成本和GPT-4参数大小的方法 - 同时能够保持性能。
另一个需要研究的方面是更好的推理时间,即深度学习模型预测新数据所需的时间。GPT-4 中的功能和插件越多,计算效率就越高。开发人员已经在向OpenAI抱怨GPT-4 API经常停止响应,这迫使他们使用GPT-3.5。
考虑到所有这些因素,我们可以期待OpenAI通过更小,更便宜,更高效的GPT-5版本来克服这些挑战。
多感官
在 GPT-4 发布之前,很多人都对它的多模式功能感到疯狂。虽然它还没有被添加到 GPT-4 中,但这就是 GPT-5 可能出现并成为节目明星并真正使其成为多模式的地方。
我们不仅可以期望它处理图像和文本,还可以处理音频、视频、温度等。Sam Altman在接受采访时表示:“我很高兴看到当我们可以做视频时会发生什么,世界上有很多视频内容。有很多东西比文本更容易通过视频学习。
增加可用于使对话更加动态和交互的数据类型。多模式能力将是与通用人工智能(AGI)的最快联系。
长期记忆
GPT-4 的最大代币长度为 32,000 个代币,令人印象深刻。但是随着世界发布一个又一个模型,我们有像Story Writer这样的模型可以输出65,000个代币。
为了跟上当前的竞争,我们可以期待 GPT-5 引入更长的上下文长度,允许用户拥有可以记住他们的角色和历史多年的 AI 朋友。
改进上下文理解
作为一个大型语言模型(LLM),我们可以期待的第一件事是改进和增强理解上下文的能力。如果我们将其与上面关于长期记忆的观点合并,GPT-5 有可能在长时间的对话中保持上下文。作为用户,您将获得更多符合您要求的迎合和有意义的响应。
随之而来的是对语言的更高级理解,自然语言的主要组成部分是情感。GPT-5 中上下文理解的潜在功能可以使其更具同理心并产生适当的回复以继续参与对话。
包装起来
关于 GPT-5 的潜在功能还有更多需要了解的内容,在接近发布之前,我们将无法找到更多信息。本文基于 GPT-4 和 GPT-3.5 当前面临的挑战,以及 OpenAI 如何利用这些障碍来克服和生成高性能的 GPT-5 版本。