这个标题通俗易懂,同时符合中文的口语表达习惯,准确地传达了文章的核心内容。
使用 DALLE-3 创建,
SaaS的世界正站在一场巨大变革的边缘。随着人工智能,尤其是大型语言模型(LLM)的迅速进步,AI代理正成为重新定义SaaS平台运作方式、提供价值以及与用户互动的变革性工具。到2025年,我们预计AI代理不仅将增强现有系统,还将推动全新商业模式的形成。
最近,垂直AI代理(Vertical AI代理)的概念获得了极大的关注,可能引发比传统SaaS更具革命性的范式转变。正如YC的《Lightcone》播客中所强调的,这些专为特定行业和应用场景深度集成设计的代理,正准备开启一个全新的商业机会领域。预计这一领域将诞生数百家价值数十亿美元的公司,垂直AI代理可能比SaaS更上一个量级。
萨蒂亚·纳德拉,微软首席执行官,提出了一个前瞻性的看法,即AI代理将如何重塑SaaS领域,预测企业应用的设计和使用方式将发生根本性的变化。在最近的B2G播客访谈中,他说,传统的SaaS结构——本质上是由业务逻辑驱动的CRUD(创建、读取、更新、删除)数据库——可能在基于代理型AI的时代瓦解。
在这篇文章中,我将尝试深入了解人工智能智能体的世界,并探讨以下内容:
什么是AI代理呢?
• 从单一的智能代理系统发展到多智能代理系统。
• 用于设计和部署人工智能代理的平台工具。
人与代理的交互界面将如何演变?
为什么AI智能代理有可能颠覆SaaS市场
什么是AI助手?AI代理是驱动于人工智能的软件程序,一般来说,基于基础模型,旨在自主执行特定任务。这些代理不仅情境感知,目标导向,还能够通过与环境或用户的互动学习。
可以把AI代理想象成虚拟助手,但它们远比普通虚拟助手更专业和强大。它们可以自动执行重复性任务,分析数据并做出决策,也可以与用户和系统互动以实现预定目标。为了实现自主性,它们将配备例如函数调用、记忆功能、上网搜索,或在外部系统执行增删改查操作等工具和能力。
比如说,一个在 SaaS CRM 平台上的 AI 代理可以独立处理客户互动,安排后续跟进,并为销售团队提供销售预测分析。
AI代理的构成本质上,一个AI代理是基于一个基础模型构建的,通常是大型语言模型(LLMs),例如GPT4、Claude、Gemini等,或者适用于特定任务的小型低成本语言模型(SLMs)。系统提示定义代理的目的及输出格式。为了使代理在上下文中相关,它会连接到外部知识库或数据源,用准确且特定领域的信息来支持其回应。一种常见的集成方法是检索增强生成(RAG)模式,它结合了外部数据的检索和生成能力。除了基础理解之外,代理还配备了一套工具——专门的能力和技能,使其能够自主执行任务。协调所有这些组件的是一个编排器,它是将代理功能连在一起的黏合剂。编排器处理来自用户的输入,管理内部操作,并向用户或涉及多代理互动系统的其他代理提供连贯的结果。最后,一个可选的用户体验将暴露代理的能力给最终用户,如有必要。在多代理系统中,一些代理仅与系统内的其他代理通信,而其他代理则直接与用户互动。
代理架构(来自微软ignite 2024)
从单一智能体到多智能体AI系统在2025年,我们将会见证从单一代理AI向多代理系统的显著转变。
• 单一代理系统:这些是专注于特定任务的人工智能模型,例如智能聊天机器人。虽然在单一场景中有效,但它们在处理复杂且相互关联的工作流程时存在局限性。单一代理系统通常需要人在回路中提供持续反馈。
• 多代理系统:这些涉及一个AI代理网络,它们合作来解决问题或实现需要多种专业知识的目标。想象一个团队合作,内部进行交流,相互指正,相互促进,提高各自的表现,以解决一个给定的任务,相比之下,只有一个代理,它只能从与其交流的人那里获得反馈。
例如,在一个项目管理的SaaS平台中,一个AI代理可能优先处理任务,另一个可能预测项目中的风险,还有一个可能负责资源分配——所有这些都在协同工作。这些系统模仿了人类团队的模式,每个代理都有其独特的专长。
多智能体系统特别吸引人,因为它们能够迅速应对新挑战,分配任务,甚至相互协商以达成最佳结果。
多智能体系统旨在尽量减少人类干预,只在必要或设计时仅在必要时请求人类的监督和/或批准。
用于构建和设计AI代理的平台与工具
人工智能代理的迅速增加已经被那些使它们的设计、训练和部署变得更易于使用的平台所推动。这些平台通常提供:
1. 预训练的AI模型:即用的预训练模型,已经准备好随时部署到云端。
2. 自定义能力:用于微调AI代理的工具,以满足独特的业务需求。
3. 评估:用于评估AI代理的质量和安全,及其在环境互动中的交流工具。
4. 集成:API和连接器,以实现将AI代理无缝集成到现有的SaaS平台。
5. 多代理框架:高级平台,提供多代理协作所需的模板和协议。这类框架能够在系统中模拟多代理之间的行为。
以下是一些值得关注的新兴平台和工具包括:
语义内核: 由微软开发的一款轻量级、开源开发套件,可以帮助您轻松构建AI代理,并将最新的AI模型集成到您的C#、Python或Java代码中。它作为高效的中间件,快速交付企业级解决方案。
LangChain: 类似于语义内核的 LangChain 是一个用于构建由语言模型驱动的应用的开源工具包,常用于设计对话代理(例如,聊天机器人)。它提供了 JavaScript 和 Python 的 SDK 编程用。
OpenAI的助理API:借助GPT-4和后续版本,开发人员可以构建越来越复杂的代理,并将它们部署到他们的应用程序或者ChatGPT平台中。
OpenAI的Swarm:由Open AI团队开发的一个教育工具包,旨在研究轻量级且易用的多代理系统编排,该框架探索用于研究与模拟用途的多代理系统编排。
AutoGen:由微软研究院开发的一个多代理对话框架,简化了构建LLM工作流,使其能够跨领域实现多样应用。它提供了优化的LLM推理API,以提升性能并降低成本,使其成为创建高效灵活AI解决方案的强大工具。AutoGen还提供了“AutoGen Studio”以提供无代码/低代码体验的多代理构建。
[Vercel的AI SDK(https://sdk.vercel.ai/docs/ai-sdk-core/agents)]:一款免费的开源库,它提供了使用TypeScript和Node.JS构建AI驱动产品所需的工具,这些产品可以轻松集成到Next.JS的Web应用中。
AutoGPT: 开源框架,用于开发自主的多代理系统,带命令行界面。
TinyTroupe: 一个微软开发的有趣开源项目,提供基于语言模型的多代理人格模拟,旨在增强想象能力并提供商业洞察力。
无代码/低代码 SaaS-AI 建造者
专门的工具,让非技术人员可以轻松构建、部署和配置 AI 代理。
Azure AI工坊(https://ai.azure.com/)是一个稳健的平台,用于构建、部署和管理使用多种模型和服务的AI驱动应用。它提供了一个新的助手构建器(目前处于公开预览阶段),用于在Azure中构建和部署智能代理。
微软 Copilot 工作台 允许您使用低代码平台和生成式 AI 创建并自定义 Microsoft 365 及其他平台的 AI 助理。
这些平台正让AI开发更加民主化,使各种规模的企业都能使用AI代理的能力。
人机交互界面会怎样发展?要成功,AI代理需要无缝地融入工作流程并且用户友好。这个时候,人机界面(HAI)就发挥作用了。
对话界面
对话式AI将会改变用户与SaaS平台互动的方式。用户不再需要手动通过菜单或表单,而是可以直接键入或说出请求,例如“创建上个月销售的报告”或“项目X现在是什么状态?”。AI代理会理解您的询问,明白您的意图,并执行相关命令。这减少了麻烦,使用户能够更快地完成任务,且更省心。此外,这些对话代理将更加情境感知,能够在多个对话中保持上下文理解,从而提升用户体验。
主动型代理(Proactive Agents):这些AI代理不再等待输入,而是会预测需求并主动采取行动,比如提出优化建议或提醒团队注意异常。
个性化的界面:AI代理程序将通过学习用户的习惯、偏好和需求来定制每位用户的SaaS界面,以适应每位用户。平台不再采用一刀切的方法,而是根据每位用户的个人需求进行动态调整。例如,一个项目管理的SaaS平台可能会根据团队成员的角色显示不同的仪表板布局——经理可以看到高层概览,而开发人员则可能会看到更详细的任务和时间线。随着时间的推移,AI会根据每位用户的使用模式建议个性化的快捷方式、工具或工作流程,使界面感觉更加贴合个人并使用更加便捷。
增强现实(AR)
增强现实可以显著改善SaaS界面,特别是在设计、可视化和协作方面。想象一下,在数据可视化SaaS应用中,一个AI代理可以在用户的真实环境中叠加3D模型或图表,或使用AR在团队协作中投影虚拟的工作空间。例如,在建筑设计SaaS应用中,用户可以实时查看和操作建筑平面图,并预览这些变化在真实环境中的效果。结合AI的AR可以创造出一种沉浸式的体验,让用户以更直观且有意义的方式与复杂数据或设计互动。一个设计良好的HAI可以弥合高级AI能力和最终用户可访问性之间的差距,确保AI代理补充而非取代人类的专业知识。
去中心化的界面,即用户不必局限于一个应用程序内互动
与其让用户仅在一个应用程序内互动,AI代理可以在不同的生态系统之间搭建桥梁。例如,在微软团队中进行对话时,AI代理可以通过无缝地访问SaaS功能来帮助用户获取客户数据或生成报告,而无需离开当前平台。这种去中心化的设置可以提高用户的使用便捷性,用户无需依赖单一平台或应用程序即可完成任务。
UX 布局变动
SaaS 平台的用户体验和布局将经历重大变革,以适应对话界面的整合。传统的 UI 元素将被更流畅、个性化的设计取代,无缝嵌入对话界面中。这种转变将简化交互,减少对静态菜单和表单的依赖,从而创造一个更加动态直观、符合个人需求的用户体验。
在设计人机交互界面时,必须考虑多个因素以确保有效且无缝的互动。应明确界定代理的目标和用户的偏好,并予以尊重,并且应有机制让用户提供反馈以使改进更加有效。为了提高用户理解,界面应帮助用户验证代理的操作,展示一致的行为,并根据上下文调整细节的深度。过去的互动应有助于代理的沟通,以建立信任和连贯性。沟通应涵盖代理当前的行为、未来的意图及其结果,包括是否达到了目标及其任何副作用。设计这样的界面还需要解决向用户传达信息和从用户理解指令方面的挑战,以确保一致性和积极的用户体验,从而提升用户满意度。
来源:《人机交互中的挑战与问题》,微软研究院
即将到来的变化
在2025年,AI可能会在深层次上扰乱软件即服务(SaaS),可能的方式包括:
1. 运营效率:自动化重复任务可以提供实时洞察信息,从而让人工代理能专注于更有策略性的工作。
2. 大规模个性化:借助AI代理的学习和适应能力,SaaS平台将能够为每个用户提供高度个性化的体验。
3. 新的商业模式:AI作为服务(AIaaS)将会出现,企业可以租赁专门用于特定任务的AI代理。
4. 竞争差异化:采用多代理系统和高级HAI技术的公司将在SaaS市场中获得显著优势。
总结。
AI代理不仅仅只是工具,它们是合作者、放大器和颠覆者。这体现了我们工作和创新的“超级代理时代”。随着我们进入2025年,那些拥抱这一转型的企业将蓬勃发展,而那些仍然依赖于传统SaaS模式的企业可能难以跟上时代步伐。问题不再是AI代理和多代理AI系统是否会颠覆SaaS市场,而是组织是否为这场革命做好了准备。