设为首页 加入收藏

TOP

使用嵌套子查询优化hive的SQL
2018-12-06 01:07:42 】 浏览:264
Tags:使用 套子 查询 优化 hive SQL
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/kwu_ganymede/article/details/49095613
[Author]: kwu


使用子查询优化hive的SQL


在1亿条数据中执行一条简单的语句,查询只访问主站一次的用户数量:

  1. selectcount(*)ascntfromtrackloggroupbycookieidhavingcnt=1;
查询反应很慢,半小时都未出结果


使用嵌套子查询优化hive-SQL
  1. selectcount(t.cookieid)from(selectcount(cookieid)ascnt,cookieidfromtrackloggroupbycookieidhavingcnt=1)t;

执行效率明显提高,同时Spark-SQL也完美支持这种子查询




】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Hive解析带有数组的Json字符串 下一篇【hive】String to Date 转化大全

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目