<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-314  評論-209  文章-0  trackbacks-0
    Spark1.4發(fā)布,支持了窗口分析函數(shù)(window functions)。
    在離線平臺中,90%以上的離線分析任務(wù)都是使用Hive實現(xiàn),其中必然會使用很多窗口分析函數(shù),如果SparkSQL支持窗口分析函數(shù),

    那么對于后面Hive向SparkSQL中的遷移的工作量會大大降低,使用方式如下:


    1、初始化數(shù)據(jù)

    創(chuàng)建表

    [sql] view plain copy
    1. create table window_test2 (url string, rate int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';  


    準備測試數(shù)據(jù)
    [plain] view plain copy
    1. url1,12  
    2. url2,11  
    3. url1,23  
    4. url2,25  
    5. url1,58  
    6. url3,11  
    7. url2,25  
    8. url3,58  
    9. url2,11  

    加載數(shù)據(jù):

    [sql] view plain copy
    1. load  data local  inpath  '/opt/bin/short_opt/windows2.data' overwrite into table window_test2 ;  



    2、窗口函數(shù)測試

    查詢所有數(shù)據(jù)

    [sql] view plain copy
    1. select * from window_test2;  
    +-------+-------+
    |  url  | rate  |
    +-------+-------+
    | url1  | 12    |
    | url2  | 11    |
    | url1  | 23    |
    | url2  | 25    |
    | url1  | 58    |
    | url3  | 11    |
    | url2  | 25    |
    | url3  | 58    |
    | url2  | 11    |
    +-------+-------+


    分組排序:
    [sql] view plain copy
    1. select url,rate,row_number() over(partition by url order by rate descas r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 58    | 1  |
    | url1  | 23    | 2  |
    | url1  | 12    | 3  |
    | url2  | 25    | 1  |
    | url2  | 25    | 2  |
    | url2  | 11    | 3  |
    | url2  | 11    | 4  |
    | url3  | 58    | 1  |
    | url3  | 11    | 2  |
    +-------+-------+----+


    分組統(tǒng)計sum
    [sql] view plain copy
    1. select url,rate,sum(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-----+
    |  url  | rate  |  r  |
    +-------+-------+-----+
    | url1  | 12    | 93  |
    | url1  | 23    | 93  |
    | url1  | 58    | 93  |
    | url2  | 11    | 72  |
    | url2  | 25    | 72  |
    | url2  | 25    | 72  |
    | url2  | 11    | 72  |
    | url3  | 11    | 69  |
    | url3  | 58    | 69  |
    +-------+-------+-----+



    分組統(tǒng)計avg
    [sql] view plain copy
    1. select url,rate,avg(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | 31.0  |
    | url1  | 23    | 31.0  |
    | url1  | 58    | 31.0  |
    | url2  | 25    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 25    | 18.0  |
    | url3  | 11    | 34.5  |
    | url3  | 58    | 34.5  |
    +-------+-------+-------+


    分組統(tǒng)計count
    [sql] view plain copy
    1. select url,rate,count(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 12    | 3  |
    | url1  | 23    | 3  |
    | url1  | 58    | 3  |
    | url2  | 11    | 4  |
    | url2  | 25    | 4  |
    | url2  | 25    | 4  |
    | url2  | 11    | 4  |
    | url3  | 11    | 2  |
    | url3  | 58    | 2  |
    +-------+-------+----+



    分組lag
    [sql] view plain copy
    1. select url,rate,lag(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | NULL  |
    | url1  | 23    | 12    |
    | url1  | 58    | 23    |
    | url2  | 25    | NULL  |
    | url2  | 11    | 25    |
    | url2  | 11    | 11    |
    | url2  | 25    | 11    |
    | url3  | 11    | NULL  |
    | url3  | 58    | 11    |
    +-------+-------+-------+



    3、spark-1.4以后,支持所有的窗口函數(shù)了,有利用于hive作業(yè)向spark-sql來轉(zhuǎn)換。
    posted on 2017-10-23 22:04 xzc 閱讀(694) 評論(0)  編輯  收藏 所屬分類: hadoop
    主站蜘蛛池模板: 国产亚洲av片在线观看18女人| 福利免费观看午夜体检区| 久久精品国产亚洲av麻豆色欲| 婷婷亚洲天堂影院| 免费无码又黄又爽又刺激| 日韩在线视频免费| 亚洲精品午夜国产va久久| 亚洲欧洲一区二区| 久久精品国产亚洲综合色| 亚洲成?v人片天堂网无码| 国产极品美女高潮抽搐免费网站| 黄色免费网站网址| 久久久久久国产精品免费无码| 中文在线观看永久免费| 国产福利免费视频 | 亚洲中文字幕日产乱码高清app| 一级毛片在播放免费| 亚洲精品无码永久中文字幕| 免费看搞黄视频网站| 亚洲日本va一区二区三区| 亚洲精品成人a在线观看| 国产精品免费一级在线观看| 日韩一区二区a片免费观看| 蜜臀98精品国产免费观看| 99精品视频在线免费观看| 免费国产叼嘿视频大全网站| 3344在线看片免费| 97在线视频免费| 亚洲免费综合色在线视频| 国产成人高清精品免费软件| 免费的一级黄色片| 国产精品V亚洲精品V日韩精品 | 91亚洲国产成人久久精品网址| 亚洲免费福利视频| 一个人看的www免费高清| 国产午夜免费高清久久影院| 青娱分类视频精品免费2| 全部免费a级毛片| 亚洲日本乱码一区二区在线二产线| 亚洲最大天堂无码精品区| j8又粗又长又硬又爽免费视频|