This documentation is for an unreleased version of Apache Flink. We recommend you use the latest stable version.
程序打包和分布式运行 #
正如之前所描述的,Flink 程序可以使用 remote environment
在集群上执行。或者,程序可以被打包成 JAR 文件(Java Archives)执行。如果使用命令行的方式执行程序,将程序打包是必需的。
打包程序 #
为了能够通过命令行或 web 界面执行打包的 JAR 文件,程序必须使用通过 StreamExecutionEnvironment.getExecutionEnvironment()
获取的 environment。当 JAR 被提交到命令行或 web 界面后,该 environment 会扮演集群环境的角色。如果调用 Flink 程序的方式与上述接口不同,该 environment 会扮演本地环境的角色。
打包程序只要简单地将所有相关的类导出为 JAR 文件,JAR 文件的 manifest 必须指向包含程序入口点(拥有公共 main
方法)的类。实现的最简单方法是将 main-class 写入 manifest 中(比如 main-class: org.apache.flinkexample.MyProgram
)。main-class 属性与 Java 虚拟机通过指令 java -jar pathToTheJarFile
执行 JAR 文件时寻找 main 方法的类是相同的。大多数 IDE 提供了在导出 JAR 文件时自动包含该属性的功能。
总结 #
调用打包后程序的完整流程包括两步:
-
搜索 JAR 文件 manifest 中的 main-class 或 program-class 属性。如果两个属性同时存在,program-class 属性会优先于 main-class 属性。对于 JAR manifest 中两个属性都不存在的情况,命令行和 web 界面支持手动传入入口点类名参数。
-
系统接着调用该类的 main 方法。