<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    Natural

     

    文本處理命令:sort、uniq

    sort命令

      sort命令的功能是對文件中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對數據庫格式的文件內容進行各種排序操作的。實際上,sort命令可以被認為是一個非常強大的數據管理工具,用來管理內容類似數據庫記錄的文件。

      Sort命令將逐行對文件中的內容進行排序,如果兩行的首字符相同,該命令將繼續比較這兩行的下一字符,如果還相同,將繼續進行比較。

      語法:

      sort [選項] 文件

      說明:sort命令對指定文件中所有的行進行排序,并將結果顯示在標準輸出上。如不指定輸入文件或使用“- ”,則表示排序內容來自標準輸入。

      sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字符序列。缺省情況下以整行為關鍵字按ASCII字符順序進行排序。

      改變缺省設置的選項主要有:

      - m 若給定文件已排好序,合并文件。

      - c 檢查給定文件是否已排好序,如果它們沒有都排好序,則打印一個出錯信息,并以狀態值1退出。

      - u 對排序后認為相同的行只留其中一行。

      - o 輸出文件 將排序輸出寫到輸出文件中而不是標準輸出,如果輸出文件是輸入文件之一,sort先將該文件的內容寫入一個臨時文件,然后再排序和寫輸出結果。

      改變缺省排序規則的選項主要有:

      - d 按字典順序排序,比較時僅字母、數字、空格和制表符有意義。

      - f 將小寫字母與大寫字母同等對待。

      - I 忽略非打印字符。

      - M 作為月份比較:“JAN”<“FEB”<¼ <“DEC”。

      - r 按逆序輸出排序結果。

     ?。玴osl - pos2 指定一個或幾個字段作為排序關鍵字,字段位置從posl開始,到pos2為止(包括posl,不包括pos2)。如不指定pos2,則關鍵字為從posl到行尾。字段和字符的位置從0開始。

      - b 在每行中尋找排序關鍵字時忽略前導的空白(空格和制表符)。

      - t separator 指定字符separator作為字段分隔符。

      下面通過幾個例子來講述sort的使用。


      用sort命令對text文件中各行排序后輸出其結果。請注意,在原文件的第二、三行上的第一個單詞完全相同,該命令將從它們的第二個單詞vegetables與fruit的首字符處繼續進行比較。

      $ cat text

      vegetable soup

      fresh vegetables

      fresh fruit

      lowfat milk

      $ sort text

      fresh fruit
     
      fresh vegetables

      lowfat milk

      vegetable soup

      用戶可以保存排序后的文件內容,或把排序后的文件內容輸出至打印機。下例中用戶把排序后的文件內容保存到名為result的文件中。

      $ sort text>result


      以第2個字段作為排序關鍵字對文件example的內容進行排序。

      $ sort +1-2 example


      對于file1和file2文件內容反向排序,結果放在outfile中,利用第2個字段的第一個字符作為排序關鍵字。

      $ sort -r -o outfile +1.0 -1.1 example


      sort排序常用于在管道中與其他命令連用,組合完成比較復雜的功能,如利用管道將當前工作目錄中的文件送給sort進行排序,排序關鍵字是第6個至第8個字段。

      $ ls - l | sort +5 - 7

      sort命令也可以對標準輸入進行操作。例如,如果您想把幾個文件文本行合并,并對合并后的文本行進行排序,您可以首先用命令cat把多個文件合并, 然后用管道操作把合并后的文本行輸入給命令sort,sort命令將輸出這些合并及排序后的文本行。在下面的例子中,文件veglist與文件 fruitlist的文本行經過合并與排序后被保存到文件clist中。

      $ cat veglist fruitlist | sort > clist


    uniq命令

      文件經過處理后在它的輸出文件中可能會出現重復的行。例如,使用cat命令將兩個文件合并后,再使用sort命令進行排序,就可能出現重復行。這時可以使用uniq命令將這些重復行從輸出文件中刪除,只留下每條記錄的唯一樣本。

      語法:uniq [選項] 文件

      說明:這個命令讀取輸入文件,并比較相鄰的行。在正常情況下,第二個及以后更多個重復行將被刪去,行比較是根據所用字符集的排序序列進行的。該命令加工后的結果寫到輸出文件中。輸入文件和輸出文件必須不同。如果輸入文件用“- ”表示,則從標準輸入讀取。

      該命令各選項含義如下:、

      - c 顯示輸出中,在每行行首加上本行在文件中出現的次數。它可取代- u和- d選項。

      - d 只顯示重復行。

      - u 只顯示文件中不重復的各行。

      - n 前n個字段與每個字段前的空白一起被忽略。一個字段是一個非空格、非制表符的字符串,彼此由制表符和空格隔開(字段從0開始編號)。

      +n 前n個字符被忽略,之前的字符被跳過(字符從0開始編號)。

      - f n 與- n相同,這里n是字段數。

      - s n 與+n相同,這里n是字符數。

      例如:

      1. 顯示文件example中不重復的行。

      uniq - u example

      2. 顯示文件example中不重復的行,從第2個字段的第2個字符開始做比較。

      uniq - u - 1 +1 example


    摘自:
    http://www.linuxsir.org/bbs/showthread.php?s=&threadid=5110

    posted on 2012-02-14 11:29 此號已被刪 閱讀(247) 評論(0)  編輯  收藏 所屬分類: Linux

    導航

    統計

    常用鏈接

    留言簿(8)

    隨筆分類(83)

    隨筆檔案(78)

    文章檔案(2)

    相冊

    收藏夾(7)

    最新隨筆

    搜索

    積分與排名

    最新評論

    閱讀排行榜

    評論排行榜

    主站蜘蛛池模板: 亚洲影视一区二区| 久久精品亚洲一区二区三区浴池 | 毛片a级毛片免费播放100| 亚洲精品视频在线| 免费91麻豆精品国产自产在线观看| 免费人成在线观看网站视频| jizzjizz亚洲日本少妇| 国产视频精品免费| 粉色视频在线观看www免费| 免费激情视频网站| 欧美色欧美亚洲另类二区| 免费一级特黄特色大片在线 | 亚洲mv国产精品mv日本mv| 99在线精品免费视频九九视| 国产精品亚洲一区二区麻豆| 永久免费AV无码网站在线观看| 亚洲AV电影天堂男人的天堂| 亚洲免费视频一区二区三区| 中文字幕在线视频免费观看 | 亚洲成人免费在线观看| 在线观看免费人成视频色| 亚洲AV无码一区二区一二区| 免费人成在线观看网站视频| 国产成人免费ā片在线观看老同学| 久久久无码精品亚洲日韩蜜桃 | 久久久久亚洲国产| 国产成人精品123区免费视频| 一级毛片免费在线播放| 亚洲国产精品无码AAA片| 最近免费中文字幕高清大全| 亚洲最大的成人网站| 亚洲人成网站色在线入口| 中文字幕日本人妻久久久免费| 久久久久亚洲精品无码蜜桃| 成人在线免费观看| 野花视频在线官网免费1| 亚洲精品亚洲人成人网| 青娱乐免费视频在线观看| 黄色a三级免费看| 亚洲精品美女视频| 免费一看一级毛片全播放|