我有一个小的日常计算工作,从 BigQuery 导入数据,使用 Python 数值计算库(pandas、numpy)来处理然后将结果写入外部表(另一个项目中的 Firestore 或 MySQL)
在 GCP 上部署它的推荐方法是什么?
我们的 devops 建议我们不要仅仅为了批处理作业而创建单个 vm。他们不希望自己管理 VM 基础架构,并且应该有支持批处理作业的服务。他们坚持让我使用 Dataflow。但我认为 Dataflow 的分布式特性有点矫枉过正。
非常感谢,
2019 年 10 月 14 日更新:
我正在考虑将批处理作业 docker 化并部署到 K8 集群。缺点是集群应该托管多个作业以值得设置和维护工作。有人可以就这种方法的可行性和适用性给我建议吗?
2019 年 10 月 15 日更新:
感谢 Alex Titov 在https://googlecloud-community.slack.com/archives/C0G6VB4UE/p1571032864020000发表评论。根据他的建议,我将把我的工作分解成多个小的 Cloud Functions 组件,并通过 Cloud Scheduler 和/或 Cloud Composer 将它们作为管道链接在一起。
心有法竹
守候你守候我
千万里不及你
随时随地看视频慕课网APP
相关分类