所以我的问题是,我在 Airflow 中构建 ETL 管道,但首先在 Jupyter 笔记本中真正开发和测试提取、转换和加载功能。因此,我最终总是在 Airflow Python 操作员代码和 Jupyter 笔记本之间来回复制粘贴,效率非常低!我的直觉告诉我,所有这一切都可以自动化。
基本上,我想在 Jupyter 中编写我的提取、转换和加载函数,并让它们保留在那里,同时仍在 Airflow 中运行管道并显示提取、转换和加载任务,并进行重试和 Airflow 提供的所有好东西提供开箱即用的功能。
Papermill 能够对笔记本进行参数化,但我真的想不出这对我的情况有什么帮助。有人可以帮我把这些点联系起来吗?🙏🏻
慕侠2389804
HUWWW
ibeautiful
慕的地6264312
相关分类