设为首页 加入收藏

TOP

Spark集群 + Akka + Kafka + Scala 开发(1) : 配置开发环境(一)
2017-10-10 12:11:24 】 浏览:9188
Tags:Spark 集群 Akka Kafka Scala 开发 配置 环境

目标

  • 配置一个spark standalone集群 + akka + kafka + scala的开发环境。
  • 创建一个基于spark的scala工程,并在spark standalone的集群环境中运行。
  • 创建一个基于spark+akka的scala工程,并在spark standalone的集群环境中运行。
  • 创建一个基于spark+kafka的scala工程,并在spark standalone的集群环境中运行。

集群框架图

本图主要是说明各个组件可以发布到不同的逻辑机器上。

G Spark Cluster + AKKA + KAFKA akka_client AKKA Client akka_server AKKA Server (Spark) akka_client->akka_server spark_master Spark Master akka_server->spark_master spark_slave1 Spark Slave spark_master->spark_slave1 spark_slave2 Spark Slave spark_master->spark_slave2 spark_slave3 Spark Slave spark_master->spark_slave3 kafka_producer1 Kafka Producer kafka_cluster Kafka Cluster kafka_producer1->kafka_cluster kafka_producer2 Kafka Producer kafka_producer2->kafka_cluster kafka_producer3 Kafka Producer kafka_producer3->kafka_cluster kafka_consumer1 Kafka consumer (Spark) kafka_cluster->kafka_consumer1 kafka_consumer2 Kafka consumer (Spark) kafka_cluster->kafka_consumer2 kafka_consumer3 Kafka consumer (Spark) kafka_cluster->kafka_consumer3 kafka_consumer1->spark_master kafka_consumer2->spark_master kafka_consumer3->spark_master

本文主要是为了配置一个用于开发和测试的环境,所以将所有组件都部署到了一台机器上。

预装的软件配置

Software Version Location Comment
CentOS 7.2.1511
JDK Oracle JDK 1.8 x64 /opt/java
Spark 2.0.0 /opt/spark
Akka 2.4.10 /opt/akka
Kafka 0.8.2.1 /opt/kafka
Scala 2.11.8 /opt/scala
sbt 0.13.12 开发环境

配置环境变量

  • 编辑 ~/.bash_profile
    加上下面的语句:
export JAVA_HOME=/opt/java
export SCALA_HOME=/opt/scala
export SPARK_HOME=/opt/spark
export KAFKA_HOME=/opt/kafka
export AKKA_HOME=/opt/akka
export PATH=$PATH:$JAVA_HOME/bin:$SPARK_HOME/bin:$SCALA_HOME/bin:$KAFKA_HOME/bin
  • 应用配置
    使上面的配置起效。
source ~/.bash_profile

下载并安装必要的软件

tar --directory /opt -xzf jdk-8u102-linux-x64.tar.gz
mv /opt/jdk-8u102 /opt/java
  • Spark 2.0.0

Download URL: http://spark.apache.org/downloads.html
下载spark-2.0.0-bin-hadoop2.7.tgz
解压到目录/opt下,把目录名改成/opt/spark

wget http://d3kbcqa49mib13.cloudfront.net/spark-2.0.0-bin-hadoop2.7.tgz
tar --directory /opt -xzf spark-2.0.0-bin-hadoop2.7.tgz
mv /opt/spark-2.0.0-bin-hadoop2.7 /opt/spark
  • Scala

Download URL: http://www.scala-lang.org/download/
下载scala-2.11.8.tgz
解压到目录/opt下,把目录名改成/opt/scala

wget http://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.tgz
tar --directory /opt -xzf scala-2.11.8.tgz
mv /opt/scala-2.11.8 /opt/scala
  • AKKA
    Download URL: http://akka.io/downloads/
    下载Standalone Distribution: akka_2.11-2.4.10.zip
    解压到目录/opt下,把目录名改成/opt/akka
wget http://downloads.typesafe.com/akka/akka_2.11-2.4.10.zip
upzip -q akka_2.11-2.4.10.zip -d /opt 
mv /opt/akka_2.11-2.4.10 /opt/akka
  • KAFKA

    由于我们将会使用Spark内置的Stream KAFKA功能,这个功能现在绑定了KAFKA 8.x.
    如果你不用这个功能开发,而是写一个Kafka的Comsumer,可以下载最新的版本。

Download URL: http://kafka.apache.org/downloads.html
下载: kafka_2.11

首页 上一页 1 2 3 下一页 尾页 1/3/3
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Spark集群 + Akka + Kafka + Scal.. 下一篇Spark集群 + Akka + Kafka + Scal..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目