解释:
这个标题简洁明了地概括了文章的主要内容。使用了“2025年企业技术十大趋势”来明确主题和时间框架,同时加上“(上)”表明这只是一个系列文章的一部分。标题中提到的“平台工程和AI代理领跑”直接点出了文章中提到的两个主要趋势,吸引读者关注。这样的标题符合中文的口语表达习惯,也容易让读者理解文章的主要内容和重点。
在预测2025年企业软件技术领域中最重要的十大技术时,有三个关键要求。
- 它必须是真实的:只有在生产环境中证明了其价值的技术才能被认为是真正的,并列入此列表。
- 它必须是可访问的:若要成为趋势,技术必须能被广泛的企业所使用。仅由少数大型机构使用的技术不符合条件。
- 它必须具有强大的商业影响:顶级技术趋势需要在商业层面产生显著影响。这通常意味着提高人类生产力、应用和基础设施的稳定性、性能或可扩展性。
以下是1到5。接下来的6到10名包含在本文的第二部分第二部分。
1. 平台工程学是业务成功的关键所在开发者为企业在市场上取得优势而创造新功能和特性。平台工程师的任务是确保应用开发者可以将大部分时间用来高效编码,为此他们提供了一个自助访问所有所需API的开发平台。
平台工程直接通过减少开发人员日常繁重任务来提高开发人员生产力。虽然平台工程已经存在近十年,许多企业在2024年加大了对这一领域的投资。正如通常所见,这是由于市场压力要求降低运营成本,更频繁地发布,提高可操作性,及时提供更有价值的产品功能。
图1:开发平台的核心组成部分及相关人员
平台工程是一门复杂的技术,它专注于自动化和集成众多复杂的应用开发生命周期中的流程和工具(见图1)。理想的开发者平台提供自服务访问,包括但不限于内置监控和可观察性、密钥管理(密钥保管)、容器编排和管理、镜像处理、持续集成与部署、API管理以及安全扫描,以实现最高生产效率。运维团队通过自动化计算、存储、网络和数据库资源来支撑开发者自服务功能,这些自动化资源是开发者自服务的基础。
2025年聚焦的重点基于Enterprise Strategy Group(企业策略集团)最近的研究,由于内部专业知识不足、自动化缺口以及工具的局限性,成为了阻碍平台工程采用的最大瓶颈(如图2所示)。这些是企业在2025年需要解决的三大挑战,以能够充分利用开发平台,作为加速开发者生产力提升的手段。企业需要在三个核心领域集中关注,以解决这些挑战并实现下一代平台工程的潜力。
- 组织必须通过合作伙伴关系、提升技能、跨职能团队以及招聘专业人才来投资建立深厚的平台工程专业能力。
- 缩小自动化差距需要集中精力识别可以自动化的高价值流程,并优先考虑可以减少手动操作的端到端流程。
- 解决工具限制包括选择符合组织需求的开发工具,并扩展或集成现有解决方案以弥补功能不足。
通过在2025年专注于这三个重点领域,企业可以更好地利用开发平台加速创新,并提高开发者生产力,从而为成功做好准备。
图2:平台工程采用的制约因素包括专业技能、自动化和工具(来源:Enterprise Strategy Group, 2024)
业务影响程度:10/10 — 非常高应用程序开发者往往只有半天的时间在高效编程,另一半时间则被系统维护、处理技术债务问题、更新工单和项目管理工具、每天的晨会、管理第三方集成、生产支持工作、编写基础设施相关的代码等任务所占用。平台工程旨在减少或消除这些繁琐的任务,这不仅释放了开发人员的时间,也大大减少了他们的挫败感和不满。归根结底,平台工程对于确保产品开发的可扩展性至关重要,因为它旨在优化开发人员的效率,同时保持较低的运营成本。
2. 任务导向型AI:AI小能手们一起协作搞定任务在AI的蜜月期结束之后,组织现在正在寻找能够快速实现可量化价值的实际应用场景。这需要简化AI工具,并注重透明度、可解释性和整体治理。一旦这些工作完成,“AI的时代”才能真正到来。代理将成为帮助AI可持续展示其价值的关键角色。
AI的价值在于提高人类的生产效率并促进基于数据的决策制定。因此,一个AI模型并不需要在所有基准测试中都名列前茅,更重要的是它能够设定明确的目标,让AI能够可靠且独立地达成这些目标。
图3:AI代理们合作完成一个复杂任务。
当大型语言模型(LLM)在提供具体任务的背景信息和明确指令时表现最佳时,创建所谓的AI代理,专门负责完成特定任务是有意义的。这些代理可以由“团队负责人”(见图4)协调,“团队负责人”是层级结构中更高层级的代理,负责监督各代理之间的互动。根据这一原则,可以有多级代理和“团队负责人”。图4中的代码展示了基于phidata的优秀开源代理框架定义的“团队负责人”。
以下代码无法独立运行,仅用于展示团队负责人代理可能的样子。你需要自己定义这三个团队成员代理。
team_lead = Agent(
name="团队负责人",
model=OpenAIChat(id="gpt-4o"),
team=[software_developer_agent, tester_agent, bug_fixer_agent],
instructions=[
"协调工作流:首先让软件开发代理编写代码,然后让测试代理进行测试,然后让修复bug的代理如果有任何问题出现,修复它们。",
"输出最终软件状态的摘要。"
],
show_tool_calls=True,
debug_mode=True,
save_to_file=True,
)
代理框架可以应用的场景非常广泛,几乎难以一一列举。想让代理帮你创建一个方便的新闻摘要,包含你最喜欢的所有新闻网站、博客和其他出版物的内容吗?或者再让一个代理将摘要转换成每日仪表板,供你在网页上查看?为什么不增加一个专门负责反馈学习的代理呢?
2025年我们应该关注什么到2025年,组织需要专注于让代理工作流更容易被不同技术水平的广泛人群所创建、增强、管理和使用。简化AI代理的使用不仅仅是添加一个图形用户界面,让用户自己组装代理和工作流,而是涉及更多方面。真正的挑战在于从安全、合规、成本效率和准确性等多个角度持续创建和执行防护措施,以实现复杂代理工作流的集中治理。
业务影响评分:10/10 极高让人工智能代理团队供人类员工使用,将使技术员和非技术员能够逐步自动化许多目前每天需要花费时间和精力处理的繁琐任务,使他们能够避免在日常工作中经常遇到的繁重任务。
3. 人人都能用的 K8sKubernetes 的可扩展性非常强,但对于操作员和 DevOps 团队来说,适应这种完全基于策略(声明式)的方法却并不简单,因为所有“硬编码”的内容都限制了未来的可扩展性。软件和云供应商需要继续努力提供简单、预集成且易于配置的 Kubernetes 集群。
开发人员常常把大量的时间花在部署、配置和管理应用程序及其周围Kubernetes服务和基础设施上。比如说,在将应用程序部署到像AWS EKS这样的托管Kubernetes服务时,开发人员需要处理与网络和安全、存储和数据、监控和可观测性相关的各种云服务的集成问题。图表4提供了一些基本见解,说明即使是基本的Kubernetes环境也相当复杂,这使得传统的IT团队难以从基于虚拟机的基础设施转换到使用容器和Kubernetes集群进行调度的环境。
图4:图表展示使用托管型Kubernetes集群(通过Amazon EKS)的复杂度,用于持续集成和持续交付。
Nate Ceres 和 Sean McKenna,两位都在微软担任资深产品营销经理,在盐湖城举办的 KubeCon 2024 会议上,他们进行了 1 分 27 秒的对话,讨论了这个挑战。
简而言之,奈特和肖恩明白他们需要简化Kubernetes集群的供应、集成、运维、安全和成本管理,以使更多组织能够运行Kubernetes应用。
杰弗里·格雷戈在OVH Cloud担任总经理,谈到解决“Kubernetes 学习曲线陡峭”的重要性,通过为经验较少的组织提供可以消费的完全托管的Kubernetes集群,从而减少开发者需要担心的服务数量。
2025年我们应该关注哪些方面到2025年,基于Kubernetes的云服务和Kubernetes平台供应商需要使更广泛的用户群体更容易地部署和管理Kubernetes集群环境。这需要提供一系列预集成程度和灵活性不同的Kubernetes解决方案。
业务影响:8/10,相当高Kubernetes 是实现政策驱动的应用环境可扩展性的标准途径。无法有效利用 Kubernetes 常常限制组织的灵活性、运营能力及可扩展性。
4. 实时统一的数据访问到了2025年,GraphQL平台将会兴起,提供一个单一的数据查询端点,供开发者查询组织内外的各种数据源。这要求平台工程师们提升并提供一个可以使用的通用GraphQL接口。
图5:基于GraphQL的数据平台让开发人员可以在一个请求中完成以前复杂的查询。
孤立的数据源迫使开发人员不得不使用多个REST API、直接数据库查询或其他协议来获取数据。开发人员需要手动处理每个来源的数据获取、转换和聚合过程。他们依赖API后端来获取所需的数据,并需要向不同的API端点发起多次请求以执行查询。这可能导致在查询运行过程中数据发生变化,从而产生数据不一致。调试这些不一致并管理这一碎片化的REST API环境的整体复杂性,对于开发人员来说可能会迅速变得耗时。
图 6:代码量减少50%到75%(仅使用一个GraphQL查询生成的例子,由GPT o1生成)
GraphQL 查询相比 REST API 查询的好处:- 单一的 REST 端点:客户端不再需要发出多个请求,而是将所有操作整合到
/aggregated-users
。 - 隐藏的复杂性:所有数据获取工作(包括两个外部 API 和一个数据库查询)以及聚合逻辑都保留在服务器。
- 减少冗余操作:客户端只需调用一个端点即可获得合并的数据,而无需再处理多个请求和合并数据。
建立统一的AI层不仅能够提升开发人员的生产力之外,还能集中应用安全策略、基于角色的访问控制,并监控和管理这些API。
Apollo GraphQL的产品营销副总裁(VP)Subrata Chakrabarti在2024年Salt Lake City举行的KubeCon会议上谈论了GraphQL能为应用开发者带来的好处。
2025年我们应关注哪里2025年,以下是组织需要特别注意的五个领域:
- 创建一个通用的GraphQL网关,整合来自多个来源(如REST API、数据库以及外部服务)的数据,通过一个中心化的GraphQL端点提供。
- 投资平台工程,以便能够将新的GraphQL层的身份验证、授权及合规流程集中起来。
- 在服务器端进行数据抓取、转换和聚合的编排,而不是让开发人员自己编写代码来完成这项任务。
- 提供实时功能支持,允许开发人员订阅自定义的数据流。
- 集中管理和监控GraphQL层,以确保其弹性并优化资源分配。
GraphQL 数据平台是开发平台的扩展,因此它们拥有相同的目标:节省开发人员的时间成本。同时,GraphQL 平台为部署大语言模型提供了非常好的基础,因为它们将数据访问统一到一个查询层,并能够灵活地检索大语言模型所需的内容——最终简化了整个组织中 AI 驱动解决方案的开发、测试和维护流程。
5. 裸机、虚拟机、应用容器和 WASM 容器将共存于市场到2025年,我们预计组织将共同努力,实现应用程序环境在管理和操作上的一致性,无论这些环境是在云端运行还是在本地环境中运行,也不论应用程序是部署在虚拟机(VM)还是容器化上。这将导致应用程序栈的整合,从而大大减少冗余的管理和工具的需求。
通过不同团队管理传统的虚拟机和容器已经成为了许多组织的一个主要痛点。这通常被不同团队分别负责的云基础设施和公司内部基础设施所加剧。这意味着对于每一种不同的部署方式,通常会有不同的管理工具、监控平台、安全和合规工具以及自动化工具。
图7:Kubernetes操作管理涉及的角色与传统的以VM为中心的管理相比(来源:GPT 4)。
Kalyan Ramanathan,Portworx 的市场部副总裁,以及 Prashant Rathi,Portworx 的产品营销负责人,讨论了企业数据服务统一化的需求,以高效且一致地交付数据库、备份与恢复、灾难恢复、数据归档、数据洞察、数据整合、数据目录管理等。将一组一致的数据服务应用于任何应用,无论这些应用是在物理服务器、虚拟机、应用容器还是 WASM 容器上运行,都可以大大简化运营复杂性,提高数据一致性,节省成本,并提升安全性和合规性。
Kalyan Ramanathan 和 Prashant Rathi 来自 Portrx,他们谈到了统一的企业数据服务(Unified Enterprise Data Services)。
丹·塞鲁利(丹·塞鲁利的LinkedIn个人资料:https://www.linkedin.com/in/danciruli/),Nutanix的产品负责人,谈到了他们新推出的Nutanix Enterprise AI(Nutanix Enterprise AI博客文章:https://www.nutanix.com/blog/introducing-nutanix-enterprise-ai),这个平台简化了在虚拟化和容器化应用中实现AI功能的过程。
Dan Ceruli 来自 Nutanix,他介绍了 Nutanix 的新企业 AI 平台。
业务影响:8分/10在同一平台上运行裸机工作负载、虚拟机、应用容器和WebAssembly容器可以带来许多关键优势。
- 减少运营孤岛有助于人员、工具和流程的整合。
- 一致的数据服务有助于实现可预测性能,提高数据完整性,并增强资源利用率。
- 拥有一个统一的管理平面可以让开发人员和运维人员节省出时间专注于创新,从而不再需要处理冗余任务。
- DevOps 团队可以为每个项目选择最佳的部署目标,而不会增加运营复杂度。
- 统一的运营平台简化了 AI 能力的实施,因为显著减少了集成需求。
在2025年,组织将投入平台操作的统一、标准化以及自动化,使表达更自然流畅。
- 选择一组通用的工具来监控、可观测性(Observability)、编排和自动化裸机、基于虚拟机、基于容器和基于WASM的容器的工作负载变得至关重要。
- 组织将专注于在整个类型的应用程序堆栈中建立集中化的安全性和合规性政策。
- 关注标准流程和工具链将使应用程序现代化简化,而无需从遗留平台迁移的压力。
- 开发者将需要统一的流水线(Pipeline)和一个跨不同环境工作的统一自助服务目录。
- 人工智能和机器学习将被用来优化资源分配并确保统一环境的弹性和稳定性。
所有这些流行技术都专注于使组织能够更快、更频繁、以更低的成本交付更好的软件。同时,整体趋势是向整合和简化运营发展。通过精简工具和流程,公司释放人力来处理基础设施和应用生命周期管理中关键的政策驱动自动化——最终增强敏捷性、可靠性和安全性。因此,团队可以将更多的精力投入到创新和价值创造中,而不是沉迷于重复的手动任务。
本文的第二部分可以在这里查看 简化软件开发。