返回類型 | 函數(shù) | 說明 |
int | length(string A) | 返回字符串的長度 |
string | reverse(string A) | 返回倒序字符串 |
string | concat(string A, string B…) | 連接多個字符串,合并為一個字符串,可以接受任意數(shù)量的輸入字符串 |
string | concat_ws(string SEP, string A, string B…) | 鏈接多個字符串,字符串之間以指定的分隔符分開。 |
string | substr(string A, int start) substring(string A, int start) | 從文本字符串中指定的起始位置后的字符。 |
string | substr(string A, int start, int len) substring(string A, int start, int len) | 從文本字符串中指定的位置指定長度的字符。 |
string | upper(string A) ucase(string A) | 將文本字符串轉(zhuǎn)換成字母全部大寫形式 |
string | lower(string A) lcase(string A) | 將文本字符串轉(zhuǎn)換成字母全部小寫形式 |
string | trim(string A) | 刪除字符串兩端的空格,字符之間的空格保留 |
string | ltrim(string A) | 刪除字符串左邊的空格,其他的空格保留 |
string | rtrim(string A) | 刪除字符串右邊的空格,其他的空格保留 |
string | regexp_replace(string A, string B, string C) | 字符串A中的B字符被C字符替代 |
string | regexp_extract(string subject, string pattern, int index) | 通過下標(biāo)返回正則表達(dá)式指定的部分。regexp_extract(‘foothebar’, ‘foo(.*?)(bar)’, 2) returns ‘bar.’ |
string | parse_url(string urlString, string partToExtract [, string keyToExtract]) | 返回URL指定的部分。parse_url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1′, ‘HOST’) 返回:’facebook.com’ |
string | get_json_object(string json_string, string path) | select a.timestamp, get_json_object(a.appevents, ‘$.eventid’), get_json_object(a.appenvets, ‘$.eventname’) from log a; |
string | space(int n) | 返回指定數(shù)量的空格 |
string | repeat(string str, int n) | 重復(fù)N次字符串 |
int | ascii(string str) | 返回字符串中首字符的數(shù)字值 |
string | lpad(string str, int len, string pad) | 返回指定長度的字符串,給定字符串長度小于指定長度時,由指定字符從左側(cè)填補(bǔ)。 |
string | rpad(string str, int len, string pad) | 返回指定長度的字符串,給定字符串長度小于指定長度時,由指定字符從右側(cè)填補(bǔ)。 |
array | split(string str, string pat) | 將字符串轉(zhuǎn)換為數(shù)組。 |
int | find_in_set(string str, string strList) | 返回字符串str第一次在strlist出現(xiàn)的位置。如果任一參數(shù)為NULL,返回NULL;如果第一個參數(shù)包含逗號,返回0。 |
array<array<string>> | sentences(string str, string lang, string locale) | 將字符串中內(nèi)容按語句分組,每個單詞間以逗號分隔,最后返回數(shù)組。 例如sentences(‘Hello there! How are you?’) 返回:( (“Hello”, “there”), (“How”, “are”, “you”) ) |
array<struct<string,double>> | ngrams(array<array<string>>, int N, int K, int pf) | SELECT ngrams(sentences(lower(tweet)), 2, 100 [, 1000]) FROM twitter; |
array<struct<string,double>> | context_ngrams(array<array<string>>, array<string>, int K, int pf) | SELECT context_ngrams(sentences(lower(tweet)), array(null,null), 100, [, 1000]) FROM twitter; |