<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-314  評論-209  文章-0  trackbacks-0
    Spark1.4發布,支持了窗口分析函數(window functions)。
    在離線平臺中,90%以上的離線分析任務都是使用Hive實現,其中必然會使用很多窗口分析函數,如果SparkSQL支持窗口分析函數,

    那么對于后面Hive向SparkSQL中的遷移的工作量會大大降低,使用方式如下:


    1、初始化數據

    創建表

    [sql] view plain copy
    1. create table window_test2 (url string, rate int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';  


    準備測試數據
    [plain] view plain copy
    1. url1,12  
    2. url2,11  
    3. url1,23  
    4. url2,25  
    5. url1,58  
    6. url3,11  
    7. url2,25  
    8. url3,58  
    9. url2,11  

    加載數據:

    [sql] view plain copy
    1. load  data local  inpath  '/opt/bin/short_opt/windows2.data' overwrite into table window_test2 ;  



    2、窗口函數測試

    查詢所有數據

    [sql] view plain copy
    1. select * from window_test2;  
    +-------+-------+
    |  url  | rate  |
    +-------+-------+
    | url1  | 12    |
    | url2  | 11    |
    | url1  | 23    |
    | url2  | 25    |
    | url1  | 58    |
    | url3  | 11    |
    | url2  | 25    |
    | url3  | 58    |
    | url2  | 11    |
    +-------+-------+


    分組排序:
    [sql] view plain copy
    1. select url,rate,row_number() over(partition by url order by rate descas r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 58    | 1  |
    | url1  | 23    | 2  |
    | url1  | 12    | 3  |
    | url2  | 25    | 1  |
    | url2  | 25    | 2  |
    | url2  | 11    | 3  |
    | url2  | 11    | 4  |
    | url3  | 58    | 1  |
    | url3  | 11    | 2  |
    +-------+-------+----+


    分組統計sum
    [sql] view plain copy
    1. select url,rate,sum(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-----+
    |  url  | rate  |  r  |
    +-------+-------+-----+
    | url1  | 12    | 93  |
    | url1  | 23    | 93  |
    | url1  | 58    | 93  |
    | url2  | 11    | 72  |
    | url2  | 25    | 72  |
    | url2  | 25    | 72  |
    | url2  | 11    | 72  |
    | url3  | 11    | 69  |
    | url3  | 58    | 69  |
    +-------+-------+-----+



    分組統計avg
    [sql] view plain copy
    1. select url,rate,avg(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | 31.0  |
    | url1  | 23    | 31.0  |
    | url1  | 58    | 31.0  |
    | url2  | 25    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 25    | 18.0  |
    | url3  | 11    | 34.5  |
    | url3  | 58    | 34.5  |
    +-------+-------+-------+


    分組統計count
    [sql] view plain copy
    1. select url,rate,count(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 12    | 3  |
    | url1  | 23    | 3  |
    | url1  | 58    | 3  |
    | url2  | 11    | 4  |
    | url2  | 25    | 4  |
    | url2  | 25    | 4  |
    | url2  | 11    | 4  |
    | url3  | 11    | 2  |
    | url3  | 58    | 2  |
    +-------+-------+----+



    分組lag
    [sql] view plain copy
    1. select url,rate,lag(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | NULL  |
    | url1  | 23    | 12    |
    | url1  | 58    | 23    |
    | url2  | 25    | NULL  |
    | url2  | 11    | 25    |
    | url2  | 11    | 11    |
    | url2  | 25    | 11    |
    | url3  | 11    | NULL  |
    | url3  | 58    | 11    |
    +-------+-------+-------+



    3、spark-1.4以后,支持所有的窗口函數了,有利用于hive作業向spark-sql來轉換。
    posted on 2017-10-23 22:04 xzc 閱讀(695) 評論(0)  編輯  收藏 所屬分類: hadoop
    主站蜘蛛池模板: 亚洲精品视频免费在线观看| 久久亚洲AV无码精品色午夜 | 免费一级毛片在级播放| 91精品国产免费久久国语蜜臀| 青草青草视频2免费观看| 亚洲性色AV日韩在线观看 | 精品熟女少妇a∨免费久久| 久久久久久av无码免费看大片| 亚洲av午夜电影在线观看| 亚洲免费人成视频观看| 亚洲av日韩综合一区在线观看| 亚洲精品无码你懂的网站| 四虎影视免费永久在线观看 | 亚洲AV无码一区二区三区网址 | 7723日本高清完整版免费| 无码av免费一区二区三区| 日本高清不卡aⅴ免费网站| 人与动性xxxxx免费| 思思久久99热免费精品6| 蜜桃传媒一区二区亚洲AV| 亚洲熟妇AV一区二区三区宅男| 亚洲综合色7777情网站777| 亚洲理论片在线观看| 亚洲精品国产成人| 亚洲综合久久久久久中文字幕| 亚洲伊人久久大香线蕉苏妲己| 亚洲免费在线视频| 77777_亚洲午夜久久多人| 在线观看亚洲人成网站| 337p欧洲亚洲大胆艺术| 亚洲春黄在线观看| 亚洲婷婷第一狠人综合精品| 亚洲av无码一区二区三区观看| 77777午夜亚洲| 亚洲av成人片在线观看| 国产精品日本亚洲777| 黄色网址大全免费| 成人片黄网站色大片免费观看cn| 精品熟女少妇aⅴ免费久久| 成全在线观看免费观看大全| 久久免费动漫品精老司机 |