spark上的一些常用命令（一） - 数据库编程 - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 基础 -> 数据库编程

TOP

spark上的一些常用命令（一）

2019-09-17 18:41:55 【大中小】浏览:22次

Tags：spark 一些常用命令

1. 加速跑

spark-sql --name uername --num-executors 21 --driver-memory 8G --executor-memory 8G

2. 上传数据

建表

create table xxx_yyy ( userid varchar(200))

上传数据

load data local inpath '/home/spark/xxx.txt' into xxx_yyy
##inpath后面跟路径名，into后面跟表名

3. 导出数据

hive -e "select * from temp.user_temp;" > /home/spark/temp/daochu.txt
##通过hive的导出，代码尽量从中间表出，短代码没问题，但是越长越会出现问题。

4. 建表语句

create table table_name 
(
    column1 double  comment '字段注释1',
    column2 double  comment '字段注释2'
)partitioned by (data_date string)
row format delimited
fields terminated by '\t'
stored as textfile
;
---创建新表

insert overwrite table table_name partition(data_date)

drop table if exists table_name;
create table if not exists table_name as .....
---更好的建表方式

5. MAC上的数据加密打包工作

##STEP 1
首先开启终端机（Terminal），使用 cd 指令切换到要压缩的档案所在目录，如果放在桌面上就是：
cd Desktop
##STEP 2
##使用 zip 指令配合 -e 参数制作加密的压缩档：
zip -e daobao.zip daobaowenjian.txt
##其中 daobaowenjian.txt 就是要加密压缩的档案，而 daobao.zip 就是输出的压缩档档名。



##在压缩前，要先输入密码：
##如果要压缩整个资料夹，就把上面的 filetoprotect.txt 替换成资料夹，再加上 -r即可，例如：
zip -er ~20180115.zip ~/20180115/
zip -er 20180115.zip  20180115

6. VIM的常用快捷键

7. UDF的使用

add jar /home/script_job/jar/hive-udf-1.0.jar;
create temporary function month_end as 'com.xxx.hive_udf.EndDayOfMonth';

8. MAC上用终端快速链接跳板机访问spark

vi ~/.bash_profile

alias work="ssh user_name@172.0.0.0"
##保存后可在终端直接输入work进行访问


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：DBA_OBJECTS	下一篇：ubuntu18.10手动安装mysql5.5

最新文章

如何在Ubuntu 18.04上安装和配置Red..

Redis 配置文件redis.conf 示例详解

redis集群设计方案及原理

SpringBoot集成Redis的三种方式

Redis的几种应用实战

热门文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Hot 文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Python

821

Django框架系列目录

656

创建Anaconda虚拟Pyt

1255

Python获取主目录的

893

Python中跨越多个文

544

chatgpt使用python写

745

一条爬虫抓取一个小

617

Python教程：sys.std

674

Python教程(13)——P

860

Docker安装配置Jupyt

741

【matplotlib基础】-

C 语言

544

C语言入坑总结

631

C数据结构-线性表之顺序表

1394

Programming abstractions in..

558

C语言内存布局

842

最全的李慧芹APUE-标准IO笔记

751

alog一个日志库

606

1.1.初识STM32及新建工程

809

codeblock安装及汉化教程

625

东方博宜OJ1000 熟悉一下Onli..

1353

关于指针与引用传递的效率问题

C++基础

1225

KMP 字符串匹配学习笔记

904

2.10 PE结构：重建重定位表结..

578

【Qt6】列表模型——抽象基类

703

2.12 PE结构：实现PE字节注入

630

569

2.14 PE结构：地址之间的转换

622

4.1 应用层Hook挂钩原理分析

980

使用Vulkan-Loader将ncnn代码..

644

4.3 IAT Hook 挂钩技术

551

C++ 学习笔记、01 | 开发简单..

大数据基础

1021

多线程：线程的同步

580

vertica-->kafka-

904

660

解决android studio

596

Kafka史上最详细原理

623

Error while fetchin

764

【Kafka】安装与快速

496

659

flume读取日志数据写

650

Authentication plug

linux编程基础

722

如何在Python中过滤字符串列表

729

如何在Python中读写文件

749

初识Lambda表达式

809

深入理解Python中的列表推导..

1029

如何在Python中执行外部命令

1089

设计模式之单例模式理解

603

跟我学Python GUI编程系列 - ..

1367

21道并发编程面试题

616

深入理解 Hadoop 序列化

986

CAS无锁机制深入理解

C/C++面试题目

1225

KMP 字符串匹配学习

578

【Qt6】列表模型——

904

2.10 PE结构：重建重

630

703

2.12 PE结构：实现PE

569

2.14 PE结构：地址之

980

使用Vulkan-Loader将

622

4.1 应用层Hook挂钩

644

4.3 IAT Hook 挂钩技

551

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3