首先來說一下rownum與rowid含義:
顧名思義rownum就是行數(shù)/行號,而rowid就是編碼/編號/唯一識別號,所以他是類似“AAAR8gAAEAAAAErAAK”的編號,注意他是沒有先后順序的,也就是說他和數(shù)據(jù)入庫時間沒有任何關(guān)系,打個比方:他就像磁盤、內(nèi)存存儲數(shù)據(jù)用的是16進制的地址一樣。
他們都是偽列,可以理解成表中的一個列只是他們并不是你創(chuàng)建的。同樣是偽列區(qū)別是什么呢?
rowid是你錄入數(shù)據(jù)時有數(shù)據(jù)庫自動為這條記錄添加的唯一的18位編號是一個物理編號用于找到這條記錄(順便說一句這也是為什么數(shù)據(jù)優(yōu)調(diào)的時候強
調(diào)盡量使用rowid的原因),他是不會隨著查詢而改變的 除非在表發(fā)生移動(比如表空間變化,數(shù)據(jù)導入/導出以后),才會發(fā)生變化。
rownum是根據(jù)sql查詢后得到的結(jié)果自動加上去的,但是他卻不受到sql中order
by排序的影響,因為他和rowid的順序一樣是系統(tǒng)按照記錄插入時的順序給記錄排的號(順序的、無跳躍)。 但是如果你想讓rownum和order
by一樣的順序 那么可以使用子查詢,形如:select rownum,t.* from (select * from 表空間名 order by
字段名) t
這樣的話rownum就是根據(jù)該字段進行排序的編號了,為什么會這樣呢,本人理解:rownum是根據(jù)表記錄輸出的行號,與篩選語句、排序語句都無關(guān)所以
當用子查詢時等于生成了一個表于是就按照這張表從1開始排序了。 同樣,也可以用下面要提得到的分析函數(shù)中的row_number()
over(order by 需要排序的字段名)。
值得一提的是MSSQL是沒有rownum和rowid的。
下面說說分析函數(shù)row_number()、rank()、dense_rank()
ROW_NUMBER():
Row_number函數(shù)返回一個唯一的值,當碰到相同數(shù)據(jù)時,排名按照記錄集中記錄的順序依次遞增。 row_number()和rownum差不多,功能更強一點(可以在各個分組內(nèi)從1開時排序),因為row_number()是分析函數(shù)而rownum是偽列所以row_number()一定要over而rownum不能over。
RANK():
Rank函數(shù)返回一個唯一的值,除非遇到相同的數(shù)據(jù),此時所有相同數(shù)據(jù)的排名是一樣的,同時會在最后一條相同記錄和下一條不同記錄的排名之間空出排名。rank()是跳躍排序,有兩個第二名時接下來就是第四名(同樣是在各個分組內(nèi))。
DENSE_RANK():
Dense_rank函數(shù)返回一個唯一的值,除非當碰到相同數(shù)據(jù),此時所有相同數(shù)據(jù)的排名都是一樣的。
dense_rank()是連續(xù)排序,有兩個第二名時仍然跟著第三名。他和row_number的區(qū)別在于row_number是沒有重復值的。
一,什么是偽列RowID?
1,首先是一種數(shù)據(jù)類型,唯一標識一條記錄物理位置的一個id,基于64位編碼的18個字符顯示。
2,未存儲在表中,可以從表中查詢,但不支持插入,更新,刪除它們的值。
二,RowID的用途
1,在開發(fā)中使用頻率應該是挺多的,特別在一些update語句中使用更加頻繁。所以oracle ERP中大部份的視圖都會加入rowid這個字段。
在一些cursor定義時也少不了加入rowid。但往往我們在開發(fā)過程中,由于連接的表很多,再加上程序的復制,有時忽略了rowid對應的是那一個表中rowid,所以有時過程出錯,
往往發(fā)上很多時間去查錯,最后查出來既然是update時帶的rowid并非此表的rowid,所以在發(fā)現(xiàn)很多次的錯誤時,重視rowid起來了,開發(fā)中一定要注意rowid的匹配
2,能以做快的方式訪問表中的一行。
3,能顯示表的行是如何存儲的。
4,作為表中唯一標識。
三,RowID的組成
rowid確定了每條記錄是在Oracle中的哪一個數(shù)據(jù)對象,數(shù)據(jù)文件、塊、行上。
ROWID 的格式如下:
數(shù)據(jù)對象編號 文件編號 塊編號 行編號
OOOOOO FFF BBBBBB RRR
由 data_object_id# + rfile# + block# + row# 組成,占用10個bytes的空間,
32bit的 data_object_id#,
10 bit 的 rfile#,
22bit 的 block#,
16 bit 的 row#.
所以每個表空間不能超過1023個 數(shù)據(jù)文件。
四,RowID的應用
1,查找和刪除重復記錄
當試圖對庫表中的某一列或幾列創(chuàng)建唯一索引時,
系統(tǒng)提示 ORA-01452 :不能創(chuàng)建唯一索引,發(fā)現(xiàn)重復記錄。
/*conn scott/tiger
Create table empa as select * from emp;
插入重復記錄
insert into empa select * from emp where empno = 7369;
insert into empa select * from emp where empno = 7839;
insert into empa select * from emp where empno = 7934;
*/
查找重復記錄的幾種方法:
查找大量重復記錄
select empno from empa group by empno having count(*) >1;
Select * From empa Where ROWID Not In(Select Min(ROWID) From empa Group By empno);
查找少量重復記錄
select * from empa a where rowid<>(select max(rowid) from empa where empno=a.empno );
刪除重復記錄的幾種方法:
(1).適用于有大量重復記錄的情況(列上建有索引的時候,用以下語句效率會很高):
Delete empa Where empno In (Select empno From empa Group By empno Having Count(*) > 1)
And ROWID Not In (Select Min(ROWID) From empa Group By empno Having Count(*) > 1);
Delete empa Where ROWID Not In(Select Min(ROWID) From empa Group By empno);
(2).適用于有少量重復記錄的情況(注意,對于有大量重復記錄的情況,用以下語句效率會很低):
Delete empa a where rowid<>(select max(rowid) from empa where empno=a.empno );
---------------------------------------------------------------------------------------------------------------------------------------------------
注意:rownum從1開始;
rownum按照記錄插入時的順序給記錄排序,所以有order by的子句時一定要注意啊!
使用時rownum,order by字段是否為主鍵有什么影響?
子查詢中rownum rn,而rn用到外查詢中到底是怎樣的序列?
若id主鍵是按照從小到大的順序插入的,select語句沒有g(shù)roup by 和order by的子句時,rownum的順序和id順序基本一致。
對于 Oracle 的 rownum
問題,很多資料都說不支持>,>=,=,between...and,只能用以上符號(<、<=、!=),并非說用>,&
gt;=,=,between..and
時會提示SQL語法錯誤,而是經(jīng)常是查不出一條記錄來,還會出現(xiàn)似乎是莫名其妙的結(jié)果來,其實您只要理解好了這個 rownum
偽列的意義就不應該感到驚奇,同樣是偽列,rownum 與 rowid 可有些不一樣,下面以例子說明
假設某個表 t1(c1) 有 20 條記錄
如果用 select rownum,c1 from t1 where rownum < 10, 只要是用小于號,查出來的結(jié)果很容易地與一般理解在概念上能達成一致,應該不會有任何疑問的。
可如果用 select rownum,c1 from t1 where rownum
> 10
(如果寫下這樣的查詢語句,這時候在您的頭腦中應該是想得到表中后面10條記錄),你就會發(fā)現(xiàn),顯示出來的結(jié)果要讓您失望了,也許您還會懷疑是不誰刪了一
些記錄,然后查看記錄數(shù),仍然是 20 條啊?那問題是出在哪呢?
先好好理解 rownum
的意義吧。因為ROWNUM是對結(jié)果集加的一個偽列,即先查到結(jié)果集之后再加上去的一個列 (強調(diào):先要有結(jié)果集)。簡單的說 rownum
是對符合條件結(jié)果的序列號。它總是從1開始排起的。所以你選出的結(jié)果不可能沒有1,而有其他大于1的值。所以您沒辦法期望得到下面的結(jié)果集:
11 aaaaaaaa
12 bbbbbbb
13 ccccccc
.................
rownum >10 沒有記錄,因為第一條不滿足去掉的話,第二條的ROWNUM又成了1,所以永遠沒有滿足條件的記錄。或者可以這樣理解:
ROWNUM是一個序列,是oracle數(shù)據(jù)庫從數(shù)據(jù)文件或緩沖區(qū)中讀取數(shù)據(jù)的順序。它取得第
一條記錄則rownum值為1,第二條為2,依次類推。如果你用>,>=,=,between...and這些條件,因為從緩沖區(qū)或數(shù)據(jù)文件
中得到的第一條記錄的rownum為1,則被刪除,接著取下條,可是它的rownum還是1,又被刪除,依次類推,便沒有了數(shù)據(jù)。
有了以上從不同方面建立起來的對 rownum 的概念,那我們可以來認識使用 rownum 的幾種現(xiàn)像
1. select rownum,c1 from t1 where rownum != 10 為何是返回前9條數(shù)據(jù)呢?它與 select rownum,c1 from tablename where rownum < 10 返回的結(jié)果集是一樣的呢?
因為是在查詢到結(jié)果集后,顯示完第 9 條記錄后,之后的記錄也都是 !=
10,或者 >=10,所以只顯示前面9條記錄。也可以這樣理解,rownum 為9后的記錄的 rownum為10,因條件為
!=10,所以去掉,其后記錄補上,rownum又是10,也去掉,如果下去也就只會顯示前面9條記錄了。
2. 為什么 rownum >1 時查不到一條記錄,而 rownum >0 或 rownum >=1 卻總顯示所有的記錄?
因為 rownum 是在查詢到的結(jié)果集后加上去的,它總是從1開始。
3. 為什么 between 1 and 10 或者 between 0 and 10 能查到結(jié)果,而用 between 2 and 10 卻得不到結(jié)果?
原因同上一樣,因為 rownum 總是從 1 開始。從上可以看出,任何時候想把 rownum = 1 這條記錄拋棄是不對的,它在結(jié)果集中是不可或缺的,少了rownum=1 就像空中樓閣一般不能存在,所以你的 rownum 條件要包含到 1 。
但如果就是想要用 rownum > 10 這種條件的話話就要用嵌套語句,把 rownum 先生成,然后對他進行查詢。
select *
from (selet rownum as rn,t1.* from a where ...)
where rn >10
一般代碼中對結(jié)果集進行分頁就是這么干的。
另外:rowid 與 rownum
雖都被稱為偽列,但它們的存在方式是不一樣的,rowid
可以說是物理存在的,表示記錄在表空間中的唯一位置ID,在DB中唯一。只要記錄沒被搬動過,rowid是不變的。rowid
相對于表來說又像表中的一般列,所以以 rowid 為條件就不會有 rownum那些情況發(fā)生。
另外還要注意:rownum不能以任何基表的名稱作為前綴。
對于rownum來說它是oracle系統(tǒng)順序分配為從查詢返回的行的編號,返回的第一行分配的是1,第二行是2,依此類推,這個偽字段可以用于限制查詢返回的總行數(shù),且rownum不能以任何表的名稱作為前綴。
(1) rownum 對于等于某值的查詢條件
如果希望找到學生表中第一條學生的信息,可以使用rownum=1作為條件。但是想找到學生表
中第二條學生的信息,使用rownum=2結(jié)果查不到數(shù)據(jù)。因為rownum都是從1開始,但是1以上的自然數(shù)在rownum做等于判斷是時認為都是
false條件,所以無法查到rownum = n(n>1的自然數(shù))。
SQL> select rownum,id,name from student where rownum=1;(可以用在限制返回記錄條數(shù)的地方,保證不出錯,如:隱式游標)
SQL> select rownum,id,name from student where rownum =2;
ROWNUM ID NAME
(2)rownum對于大于某值的查詢條件
如果想找到從第二行記錄以后的記錄,當使用rownum>2是查不出記錄的,原因是由于rownum是一個總是從1開始的偽列,Oracle 認為rownum> n(n>1的自然數(shù))這種條件依舊不成立,所以查不到記錄。
查找到第二行以后的記錄可使用以下的子查詢方法來解決。注意子查詢中的rownum必須要有別名,否則還是不會查出記錄來,這是因為rownum不是某個表的列,如果不起別名的話,無法知道rownum是子查詢的列還是主查詢的列。
SQL>select * from(select rownum no ,id,name from student) where no>2;
NO ID NAME
---------- ------ ---------------------------------------------------
3 200003 李三
4 200004 趙四
(3)rownum對于小于某值的查詢條件
rownum對于rownum<n((n>1的自然數(shù))的條件認為是成立的,所以可以找到記錄。
SQL> select rownum,id,name from student where rownum <3;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200001 張一
2 200002 王二
查詢rownum在某區(qū)間的數(shù)據(jù),必須使用子查詢。例如要查詢rownum在第二行到第三行之
間的數(shù)據(jù),包括第二行和第三行數(shù)據(jù),那么我們只能寫以下語句,先讓它返回小于等于三的記錄行,然后在主查詢中判斷新的rownum的別名列大于等于二的記
錄行。但是這樣的操作會在大數(shù)據(jù)集中影響速度。
SQL> select * from (select rownum no,id,name from student where rownum<=3 ) where no >=2;
NO ID NAME
---------- ------ ---------------------------------------------------
2 200002 王二
3 200003 李三
(4)rownum和排序
Oracle中的rownum的是在取數(shù)據(jù)的時候產(chǎn)生的序號,所以想對指定排序的數(shù)據(jù)去指定的rowmun行數(shù)據(jù)就必須注意了。
SQL> select rownum ,id,name from student order by name;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
3 200003 李三
2 200002 王二
1 200001 張一
4 200004 趙四
可以看出,rownum并不是按照name列來生成的序號。系統(tǒng)是按照記錄插入時的順序給記錄排的號,rowid也是順序分配的。為了解決這個問題,必須使用子查詢;
SQL> select rownum ,id,name from (select * from student order by name);
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 張一
4 200004 趙四
這樣就成了按name排序,并且用rownum標出正確序號(有小到大)
筆者在工作中有一上百萬條記錄的表,在jsp頁面中需對該表進行分頁顯示,便考慮用rownum來作,下面是具體方法(每頁顯示20條):
“select * from tabname where rownum<20
order by name" 但卻發(fā)現(xiàn)oracle卻不能按自己的意愿來執(zhí)行,而是先隨便取20條記錄,然后再order
by,后經(jīng)咨詢oracle,說rownum確實就這樣,想用的話,只能用子查詢來實現(xiàn)先排序,后rownum,方法如下:
"select * from (select * from tabname order by name) where rownum<20",但這樣一來,效率會低很多。
后經(jīng)筆者試驗,只需在order by 的字段上加主鍵或索引即可讓oracle先按該字段排序,然后再rownum;方法不變: “select * from tabname where rownum<20 order by name"
取得某列中第N大的行
select column_name from
(select table_name.*,dense_rank() over (order by column desc) rank from table_name)
where rank = &N;
假如要返回前5條記錄:
select * from tablename where rownum<6;(或是rownum <= 5 或是rownum != 6)
假如要返回第5-9條記錄:
select * from tablename
where …
and rownum<10
minus
select * from tablename
where …
and rownum<5
order by name
選出結(jié)果后用name排序顯示結(jié)果。(先選再排序)
注意:只能用以上符號(<、<=、!=)。
select * from tablename where rownum != 10;返回的是前9條記錄。
不能用:>,>=,=,Between...and。由于rownum是一個總是從1開始的偽列,Oracle 認為這種條件不成立。
另外,這個方法更快:
select * from (
select rownum r,a from yourtable
where rownum <= 20
order by name )
where r > 10
這樣取出第11-20條記錄!(先選再排序再選)
要先排序再選則須用select嵌套:內(nèi)層排序外層選。
rownum是隨著結(jié)果集生成的,一旦生成,就不會變化了;同時,生成的結(jié)果是依次遞加的,沒有1就永遠不會有2!
rownum 是在查詢集合產(chǎn)生的過程中產(chǎn)生的偽列,并且如果where條件中存在 rownum 條件的話,則:
1: 假如判定條件是常量,則:
只能 rownum = 1, <= 大于1 的自然數(shù), = 大于1 的數(shù)是沒有結(jié)果的;大于一個數(shù)也是沒有結(jié)果的
即 當出現(xiàn)一個 rownum 不滿足條件的時候則 查詢結(jié)束 this is stop key(一個不滿足,系統(tǒng)將該記錄過濾掉,則下一條記錄的rownum還是這個,所以后面的就不再有滿足記錄,this is stop key);
2: 假如判定值不是常量,則:
若條件是 = var , 則只有當 var 為1 的時候才滿足條件,這個時候不存在 stop key ,必須進行full scan ,對每個滿足其他where條件的數(shù)據(jù)進行判定,選出一行后才能去選rownum=2的行……
以下摘自《中國IT實驗室》
1.在oracle中實現(xiàn)select top n
由于oracle不支持select top語句,所以在oracle中經(jīng)常是用order by跟rownum的組合來實現(xiàn)select top n的查詢。
簡單地說,實現(xiàn)方法如下所示:
select 列名1...列名n from
(select 列名1...列名n from 表名 order by 列名1...列名n)
where rownum<=n(抽出記錄數(shù))
order by rownum asc
下面舉個例子簡單說明一下。
顧客表customer(id,name)有如下數(shù)據(jù):
ID NAME
01 first
02 Second
03 third
04 forth
05 fifth
06 sixth
07 seventh
08 eighth
09 ninth
10 last
則按NAME的字母順抽出前三個顧客的SQL語句如下所示:
select * from
(select * from customer order by name)
where rownum<=3
order by rownum asc
輸出結(jié)果為:
ID NAME
08 eighth
05 fifth
01 first