IntelliJ IDEA
 
获取 IntelliJ IDEA

在集群上创建并运行 Spark 应用程序

最后修改时间:2023 年 9 月 7 日

本教程涵盖了使用 Spark 的基本场景:我们将创建一个简单的应用程序,使用 Gradle 构建它,将其上传到 AWS EMR 集群,并监控 Spark 和 Hadoop YARN 中的作业。

我们将执行以下步骤:

  1. 使用 Spark 项目向导从头开始创建新的 Spark 项目。该向导允许您选择构建工具(SBT、Maven 或 Gradle)和 JDK,并确保您拥有所有必需的 Spark 依赖项。

  2. 将 Spark 应用程序提交到 AWS EMR。我们将使用一个特殊的装订线图标,它创建一个随时可用的运行配置。

  3. Spark监控中监控应用程序

  4. 从 Hadoop YARN 资源管理器打开 Spark 作业