SparkSQL执行时参数优化 - 数据库编程 - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 基础 -> 数据库编程

TOP

SparkSQL执行时参数优化

2019-04-02 22:08:36 【大中小】浏览:176次

Tags：SparkSQL 行时参数优化

近期接手了不少大数据表任务调度补数据的工作,补数时发现资源消耗异常的大且运行速度却不怎么给力.

发现根本原因在于sparkSQL配置有诸多问题,解决后总结出来就当抛砖引玉了.

以下为SparkSQL调优相关设置

//1.下列Hive参数对Spark同样起作用。
set hive.exec.dynamic.partition=true; // 是否允许动态生成分区
set hive.exec.dynamic.partition.mode=nonstrict; // 是否容忍指定分区全部动态生成
set hive.exec.max.dynamic.partitions = 100; // 动态生成的最多分区数

//3.executor能力
set spark.executor.memory; // executor用于缓存数据、代码执行的堆内存以及JVM运行时需要的内存
set spark.yarn.executor.memoryOverhead; //Spark运行还需要一些堆外内存，直接向系统申请，如数据传输时的netty等。
set spark.sql.windowExec.buffer.spill.threshold; //当用户的SQL中包含窗口函数时，并不会把一个窗口中的所有数据全部读进内存，而是维护一个缓存池，当池中的数据条数大于该参数表示的阈值时，spark将数据写到磁盘
set spark.executor.cores; //单个executor上可以同时运行的task数


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：MySQL数据库、数据表的基本操作及..	下一篇：MySQL 安全登陆工具 mysql_config..

最新文章

如何在Ubuntu 18.04上安装和配置Red..

Redis 配置文件redis.conf 示例详解

redis集群设计方案及原理

SpringBoot集成Redis的三种方式

Redis的几种应用实战

热门文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Hot 文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Python

813

Django框架系列目录

650

创建Anaconda虚拟Pyt

1247

Python获取主目录的

884

Python中跨越多个文

538

chatgpt使用python写

735

一条爬虫抓取一个小

606

Python教程：sys.std

667

Python教程(13)——P

851

Docker安装配置Jupyt

734

【matplotlib基础】-

C 语言

532

C语言入坑总结

623

C数据结构-线性表之顺序表

1386

Programming abstractions in..

548

C语言内存布局

833

最全的李慧芹APUE-标准IO笔记

745

alog一个日志库

600

1.1.初识STM32及新建工程

799

codeblock安装及汉化教程

617

东方博宜OJ1000 熟悉一下Onli..

1345

关于指针与引用传递的效率问题

C++基础

1217

KMP 字符串匹配学习笔记

896

2.10 PE结构：重建重定位表结..

573

【Qt6】列表模型——抽象基类

696

2.12 PE结构：实现PE字节注入

622

561

2.14 PE结构：地址之间的转换

613

4.1 应用层Hook挂钩原理分析

974

使用Vulkan-Loader将ncnn代码..

635

4.3 IAT Hook 挂钩技术

546

C++ 学习笔记、01 | 开发简单..

大数据基础

1013

多线程：线程的同步

574

vertica-->kafka-

896

651

解决android studio

587

Kafka史上最详细原理

616

Error while fetchin

755

【Kafka】安装与快速

490

650

flume读取日志数据写

640

Authentication plug

linux编程基础

711

如何在Python中过滤字符串列表

723

如何在Python中读写文件

740

初识Lambda表达式

795

深入理解Python中的列表推导..

1024

如何在Python中执行外部命令

1080

设计模式之单例模式理解

593

跟我学Python GUI编程系列 - ..

1358

21道并发编程面试题

607

深入理解 Hadoop 序列化

979

CAS无锁机制深入理解

C/C++面试题目

1217

KMP 字符串匹配学习

573

【Qt6】列表模型——

896

2.10 PE结构：重建重

622

696

2.12 PE结构：实现PE

561

2.14 PE结构：地址之

974

使用Vulkan-Loader将

613

4.1 应用层Hook挂钩

635

4.3 IAT Hook 挂钩技

546

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3