bit、byte、位、字節(jié)、漢字的關(guān)系
1 bit = 1 二進(jìn)制數(shù)據(jù)
1 byte = 8 bit
1 字母 = 1 byte = 8 bit
1 漢字 = 2 byte = 16 bit
1. bit:位
一個(gè)二進(jìn)制數(shù)據(jù)0或1,是1bit;
2. byte:字節(jié)
存儲(chǔ)空間的基本計(jì)量單位,如:MySQL中定義 VARCHAR(45) 即是指 45個(gè)字節(jié);
1 byte = 8 bit
3. 一個(gè)英文字符占一個(gè)字節(jié);
1 字母 = 1 byte = 8 bit
4. 一個(gè)漢字占2個(gè)字節(jié);
1 漢字 = 2 byte = 16 bit
5. 標(biāo)點(diǎn)符號(hào)
A>. 漢字輸入狀態(tài)下,默認(rèn)為全角輸入方式;
B>. 英文輸入狀態(tài)下,默認(rèn)為半角輸入方式;
C>. 全角輸入方式下,標(biāo)點(diǎn)符號(hào)占2字節(jié);
D>. 半角輸入方式下,標(biāo)點(diǎn)符號(hào)占1字節(jié);
故:漢字輸入狀態(tài)下的字符,占2個(gè)字節(jié) (但不排除,自己更改了默認(rèn)設(shè)置);
英文輸入狀態(tài)下的字符,占1個(gè)字節(jié) (但不排除,自己更改了默認(rèn)設(shè)置);
老美在發(fā)明電腦時(shí),肯定以自己的英文字母--即他們自認(rèn)為的字符為最小的存儲(chǔ)計(jì)量單位,于是也就有了不規(guī)范的1字符=1byte, 豈不知還有我們偉大的漢字計(jì)量單位,NND,一個(gè)漢字也是一個(gè)字符,我們的1漢字字符就等于2byte,后來(lái),他們可能意識(shí)到這個(gè)尷尬的問(wèn)題,于是又標(biāo)榜為:一個(gè)字母為一個(gè)標(biāo)準(zhǔn)字符,去球吧,誰(shuí)整天沒(méi)事說(shuō)個(gè)字符還“標(biāo)準(zhǔn)字符”,所以啊,個(gè)人認(rèn)為:字符,不能用于標(biāo)準(zhǔn)的計(jì)量單位。
--------------------------------
補(bǔ)充:
計(jì)算機(jī)對(duì)各國(guó)語(yǔ)言的支持度,可分為以下三個(gè)階段,如圖:

更詳細(xì)參考:http://www.regexlab.com/zh/encoding.htm 。
<End>