资讯

近日,调度系统迁移工具 Air2phin 宣布开源。借助 Air2phin,用户可 2 步将调度系统从 Airflow 迁移至 Apache DolphinScheduler,为有调度系统迁移需要的用户带来极大便利。 Air2phin 是什么? Air2phin 是一个最近宣布开源的调度系统迁移工具,旨在将 Apache Airflow DAGs 文件转换 ...
Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 查询功能,用于查询的 SQL 语句会被转化为 MapReduce 作业,然后提交到 Hadoop 上运行。 特点: 简单、容易上手 (提供了类似 sql 的查询语言 hql),使得精通 sql 但是不了解 ...
Airflow 是一个使用 Python 语言编写的 Data Pipeline 调度和监控工作流的平台。 Airflow 是通过 DAG(Directed acyclic graph 有向无环图)来管理任务流程的任务调度工具,不需要知道业务数据的具体内容,设置任务的依赖关系即可实现任务调度。 这个平台拥有和 Hive、Presto ...
它是DAG定义文件 上面的Airflow Python脚本实际上只是一个配置文件,用代码来指定DAG结构,这一点可以让你的思路清晰一些(可能不是每个人都觉得很直观)。定义的任务会在不同的上下文中运行,并且上下文与脚本有关。不同的任务在不同的时间点运行在不同的工作节点上,这意味着脚本不适用于 ...
这是自1852年以来养蜂业最具革新意义的发明,已经在Indiegogo上面获得将近600万美元众筹款,远远超出他们定的7万美元目标。一个蜂箱,将不同的蜜蜂分装完毕后几乎不需要任何动作,扳动把手就可以获得新鲜的蜂蜜。 在过去,这对于大多数养蜂人是不可想象的。