作者们:Harold ,Geoffrey ,Mathieu ,Sennen ,Flavien ,Jonathan ,Xavier ,Thomas ,Amine ,Bruno ,Dmitry 和Michaël 。
一些Criteos在展位上
该大会特设了主旨演讲、技术分会场以及专为从事云原生技术领域专业人员设计的交流机会。参与者了解了Kubernetes等开源项目最新的发展动态,同时学习了部署和管理云原生应用的最佳方法。
今年再次作为大会的赞助商,我们有机会在展位上与参会者互动,并享受在Kahoot上举办有趣的现场问答的乐趣。并且感谢每一位停下来与我们的Criteos互动的人。
人们正在参加我们的在线问答游戏
Criteos的要点如下今年大会在巴黎举行,我们从办公室派遣了多名我们公司的Criteo员工参加。现在,让我们来回顾他们对大会的见解和笔记。
霍华德·多斯特多年来,我对observability这一主题一直很感兴趣。我期待看到OpenTelemetry(OTel)社区中人们的使用情况和发展。我发现从RUM到前端可观测性与OpenTelemetry 讲得最有趣,它介绍了如何在浏览器端使用OTel进行Instrumentation并收集RUM/网页关键指标数据。
普尔维提到了很多例子,其中一些是我长期以来的感受。监测工具不必是永久的。你不一定总是需要心率监测器,也不一定需要持续监测所有遥测数据。我鼓励大家花点时间看看她的演讲。
在服务器后端追踪浏览器行为
杰弗里·布赛尔KubeCon的规模再次给我留下深刻印象,参会人数超过12000人,同时进行大约18个分会场的讨论。看到这么大的社区聚在一起真是令人兴奋。我们能非常明显地感受到AI的影响,很多演讲围绕MLOps和如何在Kubernetes中编排机器学习管道展开。今年我最大的遗憾是没有听到很多关于实际经验分享的演讲。
关于演讲,我特别感兴趣的是 超越默认设置:利用CPU亲和性优化工作负载集的性能。这个演讲介绍了NRI(节点资源接口)气球插件的功能。这个插件允许将容器分配到CPU池(称为气球)中。这些气球可以动态调整以优化CPU的分配。
在Criteo,性能和低延迟非常重要,因此控制我们的工作负载运行在哪些CPU上是必不可少的。具有超过100个CPU的服务器越来越常见。虽然Kubernetes提供了拓扑管理器来帮助Pod与物理核心和NUMA节点对齐,但它在灵活性和控制方面略显不足。某些工作负载利用NUMA亲和性或在不同物理核心上运行会表现得更好。NRI Balloon支持高度配置,例如:
preferCloseToDevices
该选项允许任务更靠近设备(例如,网络卡)调度preferSpreadOnPhysicalCores
该选项在物理核心上均匀分配(防止同一超线程过度使用)。
zh: 马休·博吉坎
Kubecon Paris 是一次让我兴奋地深入了解 Kubernetes 及其不断扩展的生态系统的机会。会议场地一片热闹,参会者们充满热情,我也是其中的一员,我们深入探讨了最新的趋势和创新,这些都在塑造着容器编排领域。
有几个演讲给我留下了深刻的印象。其中一个特别引人注目的会话展示了Kubernetes的下一波进步,揭示了一系列新功能,有望彻底改变容器编排。从增强扩展性到改进工作负载管理,这些发展承诺将提升Kubernetes的能力到一个新的高度。我想到了就地资源扩容,你现在可以直接调整Pod的资源(CPU和内存),而无需重启Pod。
另一个突出点是关注可观察性,这是一个对我来说非常重要的话题,因为我是一名在可观测性团队工作的SRE。多个会议探讨了专为Kubernetes环境定制的可观察性工具的新兴领域。从分布式跟踪到指标收集,这些工具为Kubernetes集群的性能和健康提供了前所未有的洞察,使像我这样的SRE能够确保基础设施的可靠性和效率。
当我回顾在巴黎 Kubecon 上获得的丰富知识时,我兴奋地将这些见解带回我们的可观测团队。会议中展出的新功能无疑将塑造我们即将开始的项目的方向,指导我们努力增强系统的可观测性。
Sennen Ekouaghe我真的非常喜欢KubeCon,尤其是这是我第一次参加的大会,所以我特别兴奋。这为我提供了一个绝佳的机会去与供应商交流,了解他们的工作,这些工作可能对我们的团队有帮助。当然,演讲也是活动的一大亮点。在活动期间,我在一个展位上与一位介绍我一种新的配置语言叫做Nickel的人进行了富有成效的讨论。不过,演讲的质量参差不齐。有些演讲缺乏技术深度,未能兑现内容承诺,或者未能为其他公司的实际情况提供实用的收获。
在我与供应商伙伴的互动中,有两个话题特别引人注意,可能适合我们内部深入探讨。
- 促进 Kubernetes 集群中故障工作量(特别是 pods)的故障排查:这是一个重要的方面,找到有效的解决方案可以大大提升我们的运营效率。
- 应用程序的持续性能分析:这对于缺乏 .NET 那样的强大支持的 Criteo 常用语言可能非常有价值。
除了队友提到的那些演讲,我也很喜欢以下这几场演讲。
从 CNI 新手到 CNI 大师:使用 CNI 进行 Kubernetes 网络教程 (幻灯片 + 视频)
此次演讲提供了一个很好的入门介绍,关于容器网络接口(CNI)的角色。它展示了如何轻松地创建一个 CNI 插件,并处理常见问题。这种实战方法使其成为理解和使用 CNI 的绝佳资源。
构建一个大规模多云多区域的SaaS平台,使用Kubernetes控制器来实现
(PPT + 观看视频)
我喜欢他们把实际的集群和全局管理层面分离开来。通过这样做,他们使得根据管理层面处理的配置重建集群更简单。
讨论涵盖了他们为全球层设计所做的选择,这些选择受到了 Kubernetes 控制器设计的启发。他们的解决方案采用了关系型存储作为支撑,展现了周到的架构设计。
最后,他们解决了处理对账数据的问题——本质上是管理大量事件的过程——在集群重启过程中所面临的挑战。
总体来说,KubeCon 是非常充实的经验,我期待在工作中运用这些技术分享中的见解。
zh: 弗拉维安·奎斯内尔
在此次KubeCon上,提供了许多Criteo感兴趣的议题的相关素材。
关于可持续性,我们希望减少工作负载的足迹。这可以通过正确设置每个Pod/容器来实现,例如,利用垂直Pod自动调整(可以是强制模式或推荐模式),或者根据负载变化动态调整Pod副本数量,例如,依靠Kubernetes的事件驱动自动伸缩。具体来说,在减少Kubernetes控制平面的足迹时,可以通过kpc、cluster或open cluster management等项目嵌套Kubernetes集群,从而减少专用节点的数量。
关于混合云和多云管理,有许多通用的服务网格实现(例如 Cilium),也有一些更专门化的框架(如 k8gb),用于在地理位置分散的 Kubernetes 集群之间进行负载均衡。
从隐私保护的角度来看,这个保密容器项目在处理数据的过程中显得很有潜力。
最后,已经有很多讨论,提出通过定义和强制执行治理规则(比如Kyverno),加强配置设置,部署威胁检测工具,或者更进一步使用蜜罐(如Kwok,即Kubernetes中没有kubelet
的版本)来观察攻击者的活动,以提高安全水平。
现在是时候整理这一切,与他们讨论,并计划优先安排未来的工作。
乔纳森·阿米耶兹
我主要关注与我日常工作相关的网络和运营领域。
我发现 “No ‘Soup’ for You! 通过 eBPF 对主机进程的网络策略进行强制执行” 特别有趣。演讲者讨论了现代容器网络解决方案如 Cilium 在 Kubernetes 集群中实现了对数据路径的有效操控和管理。然而,这些功能不适用于运行在主机网络上的容器或普通的主机进程,因为它们都被归为单一身份。演讲的重点在于展示如何为主机网络命名空间分配 Cilium 身份,从而实现对其流量的单独控制。
有两个演讲引起了我的注意,分别是“连接着跨越数十个集群的数百万个容器” Datadog的演讲 和 “CRD 与专用 etcd 作为存储后端:驯服高周转集群的教训” Isovalent的演讲。第一个演讲探讨了在存在多个相互依赖的集群时,设计具有最少层次的跨集群流量设计。第二个演讲探讨了在扩展 Cilium 到大型 Kubernetes 集群时面临的挑战。这些主题与我们在 Criteo 当前的重点工作相吻合,使这些见解特别有价值。
除了参加演讲之外,我还与来自各个项目和公司的代表进行了讨论。这些交流对我们提升我们基础设施的自动化和可靠性的工作来说是非常宝贵的。
夏维尔·米利奥
在 Kubecon,你可以遇到三种类型的人:
硬核粉丝,或者至少是技术宅
如何识别他们
他们穿的是去年大会的旧T恤。
如何开始对话
直接走到他们面前,以思考的态度问:“我们怎样才能调整调度器,在集群资源紧张的情况下优化启动时间?”
有一个大型的技术演讲会。第一个难题是需要决定优先参加哪些演讲,因为有很多活动同时进行。这两场演讲分别是:其中最吸引人的是两场演讲。
我一开始对WASM有一点怀疑,但通过与观众的交流,我的看法和兴趣已经有所改变。现在,是时候考虑能否将其中的一些方法运用到我们的实际案例中了。
zh: 终端用户
如何识别它们
它们通常会背着一袋好东西,比如吃的喝的。
如何展开对话:
排队买咖啡或上厕所时,更容易开始对话。你可以问他们工作的公司、来自哪个国家呢,或者他们知道什么时候能吃饭吗?
与最终用户交谈是我另一个很棒的经历,无论是偶然遇到某人还是在Criteo展台交流。我们遇到了几家具有不同架构但面临类似问题的公司,在尝试服务客户时。
zh: 销售员
如何识别他们
他们前臂上有“我爱AI”的纹身;他们会偷偷扫描你的证件,并大声宣称道:“最近的一名客户仅通过使用我们的产品就将(产品上市时间/成本资源)减少了超过78%!”
如何进行对话
别这样 😉
应对那些过度热情的销售人员推销产品的场面,真是一场挺有趣的体验。
更严重的是,我担心会出现诸如“Kubernetes将解决你所有问题”的说法(添加破折号以保持语句的流畅性),但实际上更像是“三思而后行。”(使用更符合中文表达习惯的成语)。实际上,更像是这样:“在启动之前仔细思考。”(使用“启动”来替代“开始”,使句子在技术背景下更贴切。)
很高兴看到Kubernetes(Kūnbǐngyǔ)形成了一个庞大的生态系统,几乎可以应对用户想象中的所有使用场景,并提供了各种解决方案的选择。
汤玛斯·朗格
这是我参加 Kubecon 的第二年,我对演讲的多样性和聚集在一起公开讨论这个技术栈的人数之多仍然感到惊喜不已。
我喜欢逛各个展位,找到新的软件和开源项目,和维护者交流,讨论Kubernetes上的问题解决方法。
我也参加了一些会议,其中很多会议和我们团队遇到的问题很契合。Criteo 正在将其 Kubernetes 集群中的 CNI 迁移到 Cilium,这引发了关于整体架构决策的许多问题,以确保我们的堆栈能够正确扩展。在这样的背景下,[CRD 与 Cilium 的专用 Etcd 存储后端的对比] 和 连接跨越数十个集群的数百万个容器 的演讲特别有启发性。
像往常一样,我满载着想法从CloudNative活动离开,非常期待在这个生态系统中继续我的旅程,并在Criteo进一步发展。
阿明·法莱克这是我参加的第一个KubeCon,活动的规模给我留下了深刻的印象。我喜欢演讲被分成了不同的轨道,这使得选择我感兴趣的演讲变得容易,我主要关注的是性能优化、安全和故障排除。
我最终参加的几个演讲包括:
- 教程:混沌释放教程工作坊: 有趣的互动故障排除会话,与观众互动,但主持人在进行实验过程中遇到了多个未预料到的实时问题。
- 超越默认:利用CPU亲和性提升工作负载性能: 一个很棒的演讲,深入讲解了NRI气球策略配置及其结果的介绍。
-
选择你的冒险之旅:安全之战: 我参加过的最好的互动演示,关于如何配置一个生产就绪用例以实现安全部署,内容非常吸引人。
-
多年间节省数百万的技巧: BlackRock 在减少云部署浪费资源方面提供了一些有趣的反馈。不过,这场演讲多少有点标题党,因为实际节省的成本只是理论上的,而且成本估算的方法非常基础。
- 教程 CTF(夺旗): 非常棒的一个活动,我们搭建了一个集群,目标是利用它的配置漏洞,渗透进去并获取一个秘密文件或数据包。
整体来说活动还不错,不过我注意到了几点需要注意的地方。
- 大部分内容偏向市场营销,而不是技术。
- 我参加的所有演讲似乎都采用了云部署(通常是EKS),但没有找到任何类似Criteo本地安装的案例或演讲。
通过这次经历,我学到了很多关于Kubernetes的知识,虽然我更喜欢更深入的技术讲解。我了解到其他公司是如何使用Kubernetes的以及他们目前遇到的挑战和解决方案,这对我自己的学习和研究方向有很大的帮助。
布鲁诺·比亚奇
我在 KubeCon 的第一次体验时,惊喜地发现这个活动规模之大,以及有多少赞助商在支持 Kubernetes 社区。
我在展位间闲逛,发现了大量围绕Kubernetes开发的工具,并参加了几场研讨会。一个共同的主题浮现出来:AI不仅现在无处不在,未来也将继续无处不在,尤其是在集群管理和维护中检测及预防问题方面。根据演讲者所说,AI甚至影响了摩尔定律,使其乘数因子在每18个月的基础上增加10倍。此外,它还带来了在Kubernetes集群中处理GPU的管理和整合问题的挑战。
在安全和认证领域,正在研发结合了passkeys的解决方案,让认证比以往更快。
RUST 语言 越来越受欢迎,凭借其在编译时强制实施的强类型系统和内存安全保障,解决了许多现有语言中存在的问题。
德米特里·科谢列夫(俄罗斯人)这是我第一次参加KubeCon,我特别推荐两场我觉得非常有趣的演讲,内容精彩且表达清晰。
迈凯尔·桑切斯这是我第一次参加KubeCon活动,我必须说,我被它的规模震惊了!成千上万的与会者交流想法,分享经验,并展示项目。在活动期间,我发现了一些新兴趋势。
⚙️ Kubernetes 与机器学习/大数据工作流之间存在明显的趋同。许多讨论集中在 Spark 运行在 Kubernetes 上作为机器学习工作流首选平台的话题上。这尤其有趣的是,它与我们在数据中心中实现数据存储层(HDFS)、计算引擎(Spark)和资源管理器(YARN)之间解耦的战略相一致。
🤖 Gen-AI的影响无处不在,KubeCon也不例外。许多演讲探讨了如何在Kubernetes中高效管理GPU资源,这可能反映了公司对控制每月云支出的担忧,😃
🔍 Kubernetes 和 Wasm 结合起来具有巨大的潜力,可以带来更小的镜像和更快的启动时间等好处。这是一项值得关注的发展,未来一段时间内值得关注。是否可以将低延迟的实时竞价服务以 Wasm 应用的形式运行?
总之,KubeCon + CloudNativeCon Europe 2024 提供了难以置信的经历和宝贵的机会给我们的团队,让团队能够与众多专家交流,并通过参与的会议和研讨会获得广泛的知识。
一些在展台上的Criteos同事
我们衷心感谢组织者在精心组织这次大型活动中的杰出工作。为参与者和赞助商提供的顺畅体验真是非常值得称赞。能参与这次活动是一种荣幸,我们期待着未来的活动。