如果單純地使用sort按行進行排序比較簡單,
但是使用sort按多個列值排列,同時使用tab作為分隔符,而且對于某些列需要進行逆序排列,這樣sort命令寫起來就比較麻煩了
比如下面的文件內容,使用[TAB]進行分割:
Group-ID Category-ID Text Frequency ---------------------------------------------- 200 1000 oranges 10 200 900 bananas 5 200 1000 pears 8 200 1000 lemons 10 200 900 figs 4 190 700 grapes 17 |
下面使用這些列進行排序(列4在列3之前進行排序,而且列4是逆序排列)
* Group ID (integer) * Category ID (integer) * Frequency “sorted in reverse order” (integer) * Text (alpha-numeric) |
排序后的結果應該為:
Group-ID Category-ID Text Frequency ---------------------------------------------- 190 700 grapes 17 200 900 bananas 5 200 900 figs 4 200 1000 lemons 10 200 1000 oranges 10 200 1000 pears 8 |
可以直接使用sort命令來解決這個問題:
sort -t $'\t' -k 1n,1 -k 2n,2 -k4rn,4 -k3,3 <my-file>
解釋如下:
-t $'\t':指定TAB為分隔符
-k 1, 1: 按照第一列的值進行排序,如果只有一個1的話,相當于告訴sort從第一列開始直接到行尾排列
n:代表是數字順序,默認情況下市字典序,如10<2
r: reverse 逆序排列,默認情況下市正序排列
所以最后的命令:sort -t $'\t' -k 1n,1 -k 2n,2 -k4rn,4 -k3,3 my-file