提交应用命令格式
./bin/spark-submit \
--class <main-class> \
--master <master-url> \
--deploy-mode <deploy-mode> \
--conf <key>=<value> \
... # 其他配置参数
<application-jar> \
[application arguments]
上述参数说明
--master指定提交的集群,可为local[n]本地模式,以 n 个线程运行spark://master:port提交到 Spark Standalone 集群mesos://master:port提交到 Mesos 集群YARN提交到 Yarn 集群,也可以写为yarn-client或yarn-cluster,这样就不再需要指定--deploy-mode参数
--deploy-mode指定 Driver 的运行方式,可为clusterDriver 运行在集群中clientDriver 运行在客户端
其他配置参数说明
--executor-memory指定 Executor 的 JVM 堆大小,例:--executor-memory 20G--total-executor-coreExecutor 可以使用的总 CPU 核数,例:--total-executor-core 100--supervise确保当 Driver 以非零值退出时,重启 Driver--num-executors指定 Executor 的数量,例:--num-executors 10--executor-cores指定 Executor 的虚拟核数,例:--executor-cores 2--driver-memory指定 Driver 的 JVM 堆大小--driver-cores指定 Driver 的虚拟核数--jars指定需要引入的第三方包