E-MapReduce 自建Hadoop数据迁移到阿里云E-MapReduce

By | 2021年4月23日

客户在IDC或者公有云环境自建Hadoop集群,数据集中保存在HDFS文件系统用于数据分析任务。客户在决定上云之后,会将自建Hadoop集群的数据迁移到阿里云自建Hadoop集群或者EMR集群。本实践方案提供安全和低成本的HDFS数据迁移方案。

适用场景

本实践方案提供如下场景的最佳实践: 基于IPSec VPN隧道 + DistCp(Hadoop原生工具),将数据迁移到阿里云EMR集群,目标存储包括HDFS,阿里云OSS和阿里云EMR的Jindo。

方案优势

  • 安全性

    基于IPSec VPN/专线的方式进行数据安全传输。

  • 低成本

    在阿里云创建Hadoop类型的EMR集群和自建Hadoop集群相比有一定成本优势,同时阿里云EMR可以使用OSS作为底层存储空间,进一步降低成本。

架构图

hadoop

方案详情

请参见阿里云自建Hadoop数据迁移到阿里云E-MapReduce

请关注公众号获取更多资料

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注