<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    莊周夢蝶

    生活、程序、未來
       :: 首頁 ::  ::  :: 聚合  :: 管理

    深入下Ruby中的String

    Posted on 2007-09-12 09:43 dennis 閱讀(1930) 評論(0)  編輯  收藏 所屬分類: 動態語言my open-source源碼解讀
        Ruby語言中的String是mutable的,不像java、C#中的String是immutable的。比如
           str1="abc"
           str2="abc"
    在java中,對于字面量的字符串,jvm內部維持一張表,因此如果在java中,str1和str2是同一個String對象。而在Ruby中,str1和str2是完全不同的對象。同樣,在java中對于String對象的操作都將產生一個新的對象,而Ruby則是操縱同一個對象,比如:
           str="abc"
           str.concat("cdf")
    此時str就是"abccdf"。Ruby對String是怎么處理的呢?我們只談談c ruby中的實現,有興趣的先看看這篇文章《管窺Ruby——對象基礎》。在ruby.h中我們可以看到String對象的結構,Ruby中的對象(包括類也是對象)都是一個一個的struct,String也不能例外:
    struct RString {
        struct RBasic basic;
        long len;
        char *ptr;
        union {
          long capa;
          VALUE shared;
        } aux;
    };
    //ruby.h

        顯然,len是String的長度;ptr是一個char類型的指針,指向實際的字符串;然后是一個聯合,這個稍后再說。如果你看看ruby.h可以發現,幾乎所有定義的對象結構都有一個struct RBasic。顯然,struct RBasic包含由所有對象結構體共享的一些重要信息的。看看RBasic:

    struct RBasic {
     unsigned long flags;
     VALUE klass;
    };
    其中的flags是一個多用途的標記,大多數情況下用于記錄結構體的類型,ruby.h中預定義了一些列的宏,比如T_STRING(表示struct RString),T_ARRAY(表示struct RArray)等。Klass是一個VALUE類型,VALUE也是unsigned long,可以地將它當成指針(一個指針4字節,綽綽有余了),它指向的是一個Ruby對象,這里以后再深入。
        那么聯合aux中的capa和shared是干什么用的呢?因為Ruby的String是可變的,可變意味著len可以改變,我們需要每次都根據len的變換來增減內存(使用c中的realloc()函數),這顯然是一個很大的開銷,解決辦法就是預留一定的空間,ptr指向的內存大小略大于len,這樣就不需要頻繁調用realloc了,aux.capa就是一個長度,包含額外的內存大小。那么aux.shared是干什么的呢?這是一個VALUE類型,說明它是指向某個對象。aux.shared其實是用于加快字符串的創建速度,在一個循環中:
    while true do  # 無限重復
    a = "str" # 以“str”為內容創建字符串,賦值給a
    a.concat("ing") # 為a所指向的對象添加“ing”
    p(a) # 顯示“string”
    end
    每次都重新創建一個"str"對象,內部就是重復創建一個char[],這是相當奢侈,aux.shared就是用于共享char[],
    以字面量創建的字符串會共享一個char[],當要發生變化時,將字符串復制到一個非共享的內存中,變化針對這
    個新拷貝進行,這就是所謂的“copy-on-write"技術。解釋了String的內部構造,貌似還沒有介紹String是怎么
    實現mutable,我們寫一個Ruby擴展測試下,我們想寫這樣一個Ruby類:
    class Test
    def test
    str="str"
    str.concat("ing")
    end
    end
    對應的c語言代碼就是:
    #include<stdio.h>
    #include 
    "ruby.h"

    static VALUE t_test(VALUE self)
    {
      VALUE str;
      str
    =rb_str_new2("str");
      printf(
    "before concat: str:%p, str.aux.shared:%p, str.ptr:%s"n",str,
           (RSTRING(str)->aux).shared,RSTRING(str)->ptr);
      rb_str_cat2(str,
    "ing");
      printf(
    "after concat: str:%p, str.aux.shared:%p, str.ptr:%s"n",
           str,(RSTRING(str)->aux).shared,RSTRING(str)->ptr);
      
    return self;
    }
    VALUE cTest;
    void Init_string_hack(){
      cTest
    =rb_define_class("Test",rb_cObject);
      rb_define_method(cTest,
    "test",t_test,0);

    }
    //string_hack.c
       rb_define_class函數定義了一個類Test,rb_define_method將t_test方法以test的名稱添加到Test類。在
    t_test中,通過rb_str_new2每次生成一個RString結構,然后通過rb_str_cat2將str與"ing"連接起來,添加
    了一些打印用于跟蹤。利用mkmf產生Makefile,寫一個extconf.rb
    require 'mkmf'
    create_makefile("string_hack");
    執行ruby extconf.rb,將產生一個Makefile,執行make,生成一個string_hack.so的鏈接庫。擴展寫完了,通過
    ruby調用:
    require 'string_hack"
    t=Test.new
    (1..3).each{|i| t.test}
    輸出:
    before concat: str:0x40098a40, str.aux.shared:0x3, str.ptr:str
    after concat: str:0x40098a40, str.aux.shared:0x8, str.ptr:string
    before concat: str:0x40098a2c, str.aux.shared:0x3, str.ptr:str
    after concat: str:0x40098a2c, str.aux.shared:0x8, str.ptr:string
    before concat: str:0x40098a18, str.aux.shared:0x3, str.ptr:str
    after concat: str:0x40098a18, str.aux.shared:0x8, str.ptr:string
    從結果可以看出,在str concat之前之后,str指向的位置沒有改變,改變的僅僅是str中ptr指向的字符串的值
    ,看看rb_str_cat2函數的實現就一目了然了:
    VALUE rb_str_cat(str, ptr, len)
        VALUE str;
        const char *ptr;
        long len;
    {
        if (len < 0) {
            rb_raise(rb_eArgError, "negative string size (or size too big)");
        }
        if (FL_TEST(str, STR_ASSOC)) {
            rb_str_modify(str);
            REALLOC_N(RSTRING(str)->ptr, char, RSTRING(str)->len+len);
            memcpy(RSTRING(str)->ptr + RSTRING(str)->len, ptr, len);
            RSTRING(str)->len += len;
            RSTRING(str)->ptr[RSTRING(str)->len] = '"0'; /* sentinel */
            return str;
        }
        return rb_str_buf_cat(str, ptr, len);
    }
    VALUE rb_str_cat2(str, ptr)
        VALUE str;
        const char *ptr;
    {
        return rb_str_cat(str, ptr, strlen(ptr));
    }
    //string.c



    主站蜘蛛池模板: 亚洲色一色噜一噜噜噜| 午夜亚洲av永久无码精品| 先锋影音资源片午夜在线观看视频免费播放| GOGOGO高清免费看韩国| 亚洲免费在线视频| 精品国产亚洲一区二区三区| 亚洲精品视频免费看| 久久久久亚洲国产AV麻豆| 本免费AV无码专区一区| 久久久久国产精品免费免费搜索| 国产高清在线免费视频| 亚洲国产一二三精品无码| 国产一精品一av一免费爽爽| 在线播放高清国语自产拍免费 | 久久精品国产亚洲网站| 亚洲日本va在线观看| 久久er国产精品免费观看8| 亚洲人色婷婷成人网站在线观看| 亚洲精品综合在线影院| 天黑黑影院在线观看视频高清免费| 青青青国产免费一夜七次郎| 亚洲成熟xxxxx电影| 亚洲AV成人无码网站| 一本色道久久88亚洲综合| 国产免费久久久久久无码| 亚洲大片在线观看| 波多野结衣在线免费视频 | 亚洲精品国产V片在线观看 | 一级特黄a大片免费| 在线看免费观看AV深夜影院| 亚洲精品无码专区在线| 国产成人福利免费视频| 亚洲国产成人久久综合| 久久不见久久见中文字幕免费 | 国产亚洲3p无码一区二区| 亚洲免费黄色网址| 久久夜色精品国产噜噜噜亚洲AV| aaa毛片视频免费观看| 亚洲毛片在线免费观看| 国产一级淫片视频免费看| 99亚洲男女激情在线观看|