设为首页 加入收藏

TOP

【大数据学习】之 SparkSQL概述
2019-03-20 01:14:35 】 浏览:53
Tags:数据 学习 SparkSQL 概述

Spark SQL概念和用途

看官网介绍,Spark SQL是Apache Spark用于处理结构化数据的模块。

一、集成

SQL查询与Spark程序无缝混合。Spark SQL允许您使用SQL或熟悉的DataFrame APISpark程序中查询结构化数据。可用于JavaScalaPythonR.

二、统一数据访问

以相同的方式连接到任何数据源。DataFramesSQL提供了访问各种数据源的常用方法,包括HiveAvroParquetORCJSON和JDBC。您甚至可以跨这些来源加入数据。

三、Hive数据集成

在现有仓库上运行SQLHiveQL查询。Spark SQL支持HiveQL语法以及Hive SerDesUDF,允许您访问现有的Hive仓库。

四、标准连接

通过JDBCODBC连接。服务器模式为商业智能工具提供行业标准JDBCODBC连接。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇python使用hdfs3模块对hdfs进行操.. 下一篇大数据学习笔记(四)-spark 安装..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目