SQL分頁(yè) SQL server 分頁(yè)查詢 SQL server大數(shù)據(jù)量分頁(yè)
發(fā)表時(shí)間:2023-09-13 來(lái)源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]軟件等級(jí):更新時(shí)間:2016-11-11版本號(hào):v5.7.10 MySQL Server x64官方正式版免費(fèi)下載立即下載 SQL分頁(yè) SQL server 分頁(yè)查詢 SQL server大數(shù)據(jù)量分頁(yè)在我們建立的應(yīng)用程序,或是網(wǎng)頁(yè)時(shí)查詢數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)是必不可少的,但是遇到讀取大量數(shù)據(jù)...
SQL分頁(yè) SQL server 分頁(yè)查詢 SQL server大數(shù)據(jù)量分頁(yè)
在我們建立的應(yīng)用程序,或是網(wǎng)頁(yè)時(shí)查詢數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)是必不可少的,但是遇到讀取大量數(shù)據(jù)時(shí),這時(shí)就會(huì)造成數(shù)據(jù)庫(kù)死鎖,如果是用分頁(yè)查詢的話,就可以減少數(shù)據(jù)庫(kù)的壓力。
最早較好地實(shí)現(xiàn)這種根據(jù)頁(yè)面大小和頁(yè)碼來(lái)提取數(shù)據(jù)的方法大概就是“俄羅斯存儲(chǔ)過(guò)程”。這個(gè)存儲(chǔ)過(guò)程用了游標(biāo),由于游標(biāo)的局限性,所以這個(gè)方法并沒(méi)有得到大家的普遍認(rèn)可。
后來(lái),網(wǎng)上有人改造了此存儲(chǔ)過(guò)程,下面的存儲(chǔ)過(guò)程就是結(jié)合我們的辦公自動(dòng)化實(shí)例寫的分頁(yè)存儲(chǔ)過(guò)程:
CREATE procedure pagination1(@pagesize int, --頁(yè)面大小,如每頁(yè)存儲(chǔ)20條記錄@pageindex int --當(dāng)前頁(yè)碼)asset nocount onbegindeclare @indextable table(id int identity(1,1),nid int) --定義表變量declare @PageLowerBound int --定義此頁(yè)的底碼declare @PageUpperBound int --定義此頁(yè)的頂碼set @PageLowerBound=(@pageindex-1)*@pagesizeset @PageUpperBound=@PageLowerBound+@pagesizeset rowcount @PageUpperBoundinsert into @indextable(nid) select gid from TGongwen where fariqi >dateadd(day,-365,getdate()) order by fariqi descselect O.gid,O.mid,O.title,O.fadanwei,O.fariqi from TGongwen O,@indextable t where O.gid=t.nid and t.id>@PageLowerBound and t.id<=@PageUpperBound order by t.id
endset nocount off
以上存儲(chǔ)過(guò)程運(yùn)用了SQL SERVER的最新技術(shù)――表變量。應(yīng)該說(shuō)這個(gè)存儲(chǔ)過(guò)程也是一個(gè)非常優(yōu)秀的分頁(yè)存儲(chǔ)過(guò)程。當(dāng)然,在這個(gè)過(guò)程中,您也可以把其中的表變量寫成臨時(shí)表:CREATE TABLE #Temp。但很明顯,在SQL SERVER中,用臨時(shí)表是沒(méi)有用表變量快的。所以筆者剛開(kāi)始使用這個(gè)存儲(chǔ)過(guò)程時(shí),感覺(jué)非常的不錯(cuò),速度也比原來(lái)的ADO的好。但后來(lái),我又發(fā)現(xiàn)了比此方法更好的方法。
筆者曾在網(wǎng)上看到了一篇小短文《從數(shù)據(jù)表中取出第n條到第m條的記錄的方法》,全文如下:
從publish 表中取出第 n 條到第 m 條的記錄: SELECT TOP m-n+1 * FROM publish WHERE (id NOT IN (SELECT TOP n-1 id FROM publish)) id 為publish 表的關(guān)鍵字
我當(dāng)時(shí)看到這篇文章的時(shí)候,真的是精神為之一振,覺(jué)得思路非常得好。等到后來(lái),我在作辦公自動(dòng)化系統(tǒng)(ASP.NET+ C#+SQL SERVER)的時(shí)候,忽然想起了這篇文章,我想如果把這個(gè)語(yǔ)句改造一下,這就可能是一個(gè)非常好的分頁(yè)存儲(chǔ)過(guò)程。于是我就滿網(wǎng)上找這篇文章,沒(méi)想到,文章還沒(méi)找到,卻找到了一篇根據(jù)此語(yǔ)句寫的一個(gè)分頁(yè)存儲(chǔ)過(guò)程,這個(gè)存儲(chǔ)過(guò)程也是目前較為流行的一種分頁(yè)存儲(chǔ)過(guò)程,我很后悔沒(méi)有爭(zhēng)先把這段文字改造成存儲(chǔ)過(guò)程:
CREATE PROCEDURE pagination2(@SQL nVARCHAR(4000), --不帶排序語(yǔ)句的SQL語(yǔ)句@Page int, --頁(yè)碼@RecsPerPage int, --每頁(yè)容納的記錄數(shù)@ID VARCHAR(255), --需要排序的不重復(fù)的ID號(hào)@Sort VARCHAR(255) --排序字段及規(guī)則)ASDECLARE @Str nVARCHAR(4000)SET @Str=''SELECT TOP ''+CAST(@RecsPerPage AS VARCHAR(20))+'' * FROM (''+@SQL+'') T WHERE T.''+@ID+''NOT IN (SELECT TOP ''+CAST((@RecsPerPage*(@Page-1)) AS VARCHAR(20))+'' ''+@ID+'' FROM (''+@SQL+'') T9 ORDER BY ''+@Sort+'') ORDER BY ''+@SortPRINT @StrEXEC sp_ExecuteSql @StrGO
其實(shí),以上語(yǔ)句可以簡(jiǎn)化為:
SELECT TOP 頁(yè)大小 *FROM Table1 WHERE (ID NOT IN (SELECT TOP 頁(yè)大小*頁(yè)數(shù) id FROM 表 ORDER BY id))ORDER BY ID
但這個(gè)存儲(chǔ)過(guò)程有一個(gè)致命的缺點(diǎn),就是它含有NOT IN字樣。雖然我可以把它改造為:
SELECT TOP 頁(yè)大小 *FROM Table1 WHERE not exists(select * from (select top (頁(yè)大小*頁(yè)數(shù)) * from table1 order by id) b where b.id=a.id )order by id
即,用not exists來(lái)代替not in,但我們前面已經(jīng)談過(guò)了,二者的執(zhí)行效率實(shí)際上是沒(méi)有區(qū)別的。既便如此,用TOP 結(jié)合NOT IN的這個(gè)方法還是比用游標(biāo)要來(lái)得快一些。
雖然用not exists并不能挽救上個(gè)存儲(chǔ)過(guò)程的效率,但使用SQL SERVER中的TOP關(guān)鍵字卻是一個(gè)非常明智的選擇。因?yàn)榉猪?yè)優(yōu)化的最終目的就是避免產(chǎn)生過(guò)大的記錄集,而我們?cè)谇懊嬉惨呀?jīng)提到了TOP的優(yōu)勢(shì),通過(guò)TOP 即可實(shí)現(xiàn)對(duì)數(shù)據(jù)量的控制。
在分頁(yè)算法中,影響我們查詢速度的關(guān)鍵因素有兩點(diǎn):TOP和NOT IN。TOP可以提高我們的查詢速度,而NOT IN會(huì)減慢我們的查詢速度,所以要提高我們整個(gè)分頁(yè)算法的速度,就要徹底改造NOT IN,同其他方法來(lái)替代它。
我們知道,幾乎任何字段,我們都可以通過(guò)max(字段)或min(字段)來(lái)提取某個(gè)字段中的最大或最小值,所以如果這個(gè)字段不重復(fù),那么就可以利用這些不重復(fù)的字段的max或min作為分水嶺,使其成為分頁(yè)算法中分開(kāi)每頁(yè)的參照物。在這里,我們可以用操作符“>”或“<”號(hào)來(lái)完成這個(gè)使命,使查詢語(yǔ)句符合SARG形式。如:
Select top 10 * from table1 where id>200
于是就有了如下分頁(yè)方案:
select top 頁(yè)大小 *from table1 where id>(select max (id) from (select top ((頁(yè)碼-1)*頁(yè)大小) id from table1 order by id) as T) order by id
在選擇即不重復(fù)值,又容易分辨大小的列時(shí),我們通常會(huì)選擇主鍵。下表列出了筆者用有著1000萬(wàn)數(shù)據(jù)的辦公自動(dòng)化系統(tǒng)中的表,在以GID(GID是主鍵,但并不是聚集索引。)為排序列、提取gid,fariqi,title字段,分別以第1、10、100、500、1000、1萬(wàn)、10萬(wàn)、25萬(wàn)、50萬(wàn)頁(yè)為例,測(cè)試以上三種分頁(yè)方案的執(zhí)行速度:(單位:毫秒)
頁(yè)碼 |
方案1 |
方案2 |
方案3 |
1 |
60 |
30 |
76 |
10 |
46 |
16 |
63 |
100 |
1076 |
720 |
130 |
500 |
540 |
12943 |
83 |
1000 |
17110 |
470 |
250 |
10000 |
24796 |
4500 |
140 |
100000 |
38326 |
42283 |
1553 |
250000 |
28140 |
128720 |
2330 |
500000 |
121686 |
127846 |
7168 |
從上表中,我們可以看出,三種存儲(chǔ)過(guò)程在執(zhí)行100頁(yè)以下的分頁(yè)命令時(shí),都是可以信任的,速度都很好。但第一種方案在執(zhí)行分頁(yè)1000頁(yè)以上后,速度就降了下來(lái)。第二種方案大約是在執(zhí)行分頁(yè)1萬(wàn)頁(yè)以上后速度開(kāi)始降了下來(lái)。而第三種方案卻始終沒(méi)有大的降勢(shì),后勁仍然很足。
在確定了第三種分頁(yè)方案后,我們可以據(jù)此寫一個(gè)存儲(chǔ)過(guò)程。大家知道SQL SERVER的存儲(chǔ)過(guò)程是事先編譯好的SQL語(yǔ)句,它的執(zhí)行效率要比通過(guò)WEB頁(yè)面?zhèn)鱽?lái)的SQL語(yǔ)句的執(zhí)行效率要高。下面的存儲(chǔ)過(guò)程不僅含有分頁(yè)方案,還會(huì)根據(jù)頁(yè)面?zhèn)鱽?lái)的參數(shù)來(lái)確定是否進(jìn)行數(shù)據(jù)總數(shù)統(tǒng)計(jì)。
獲取指定頁(yè)的數(shù)據(jù):
CREATE PROCEDURE pagination3@tblName varchar(255), -- 表名@strGetFields varchar(1000) = ''*'', -- 需要返回的列 @fldName varchar(255)='''', -- 排序的字段名@PageSize int = 10, -- 頁(yè)尺寸@PageIndex int = 1, -- 頁(yè)碼@doCount bit = 0, -- 返回記錄總數(shù), 非 0 值則返回@OrderType bit = 0, -- 設(shè)置排序類型, 非 0 值則降序@strWhere varchar(1500) = '''' -- 查詢條件 (注意: 不要加 where)ASdeclare @strSQL varchar(5000) -- 主語(yǔ)句declare @strTmp varchar(110) -- 臨時(shí)變量declare @strOrder varchar(400) -- 排序類型if @doCount != 0beginif @strWhere !=''''set @strSQL = "select count(*) as Total from [" + @tblName + "] where "+@strWhereelseset @strSQL = "select count(*) as Total from [" + @tblName + "]"end
以上代碼的意思是如果@doCount傳遞過(guò)來(lái)的不是0,就執(zhí)行總數(shù)統(tǒng)計(jì)。以下的所有代碼都是@doCount為0的情況:
elsebeginif @OrderType != 0beginset @strTmp = "<(select min"set @strOrder = " order by [" + @fldName +"] desc"
如果@OrderType不是0,就執(zhí)行降序,這句很重要!
endelsebeginset @strTmp = ">(select max"set @strOrder = " order by [" + @fldName +"] asc"endif @PageIndex = 1beginif @strWhere != '''' set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ "from [" + @tblName + "] where " + @strWhere + " " + @strOrderelseset @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from ["+ @tblName + "] "+ @strOrder
如果是第一頁(yè)就執(zhí)行以上代碼,這樣會(huì)加快執(zhí)行速度
endelsebegin
以下代碼賦予了@strSQL以真正執(zhí)行的SQL代碼
set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from ["+ @tblName + "] where [" + @fldName + "]" + @strTmp + "(["+ @fldName + "]) from (select top " + str((@PageIndex-1)*@PageSize) + " ["+ @fldName + "] from [" + @tblName + "]" + @strOrder + ") as tblTmp)"+ @strOrderif @strWhere != ''''set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from ["+ @tblName + "] where [" + @fldName + "]" + @strTmp + "(["+ @fldName + "]) from (select top " + str((@PageIndex-1)*@PageSize) + " ["+ @fldName + "] from [" + @tblName + "] where " + @strWhere + " "+ @strOrder + ") as tblTmp) and " + @strWhere + " " + @strOrderend end exec (@strSQL)GO上面的這個(gè)存儲(chǔ)過(guò)程是一個(gè)通用的存儲(chǔ)過(guò)程,其注釋已寫在其中了。 在大數(shù)據(jù)量的情況下,
特別是在查詢最后幾頁(yè)的時(shí)候,查詢時(shí)間一般不會(huì)超過(guò)9秒;而用其他存儲(chǔ)過(guò)程,在實(shí)踐中就會(huì)
導(dǎo)致超時(shí),所以這個(gè)存儲(chǔ)過(guò)程非常適用于大容量數(shù)據(jù)庫(kù)的查詢。 筆者希望能夠通過(guò)對(duì)以上存
儲(chǔ)過(guò)程的解析,能給大家?guī)?lái)一定的啟示,并給工作帶來(lái)一定的效率提升,同時(shí)希望同行提出
更優(yōu)秀的實(shí)時(shí)數(shù)據(jù)分頁(yè)算法。
以上的這第三種存儲(chǔ)過(guò)程在小數(shù)據(jù)量的情況下,有如下現(xiàn)象:
1、分頁(yè)速度一般維持在1秒和3秒之間。
2、在查詢最后一頁(yè)時(shí),速度一般為5秒至8秒,哪怕分頁(yè)總數(shù)只有3頁(yè)或30萬(wàn)頁(yè)。
雖然在超大容量情況下,這個(gè)分頁(yè)的實(shí)現(xiàn)過(guò)程是很快的,但在分前幾頁(yè)時(shí),這個(gè)1-3秒的速度比起第一種甚至沒(méi)有經(jīng)過(guò)優(yōu)化的分頁(yè)方法速度還要慢,借用戶的話說(shuō)就是“還沒(méi)有ACCESS數(shù)據(jù)庫(kù)速度快”,這個(gè)認(rèn)識(shí)足以導(dǎo)致用戶放棄使用您開(kāi)發(fā)的系統(tǒng)。
筆者就此分析了一下,原來(lái)產(chǎn)生這種現(xiàn)象的癥結(jié)是如此的簡(jiǎn)單,但又如此的重要:排序的字段不是聚集索引!
筆者只所以把“查詢優(yōu)化”和“分頁(yè)算法”這兩個(gè)聯(lián)系不是很大的論題放在一起,就是因?yàn)槎叨夹枰粋(gè)非常重要的東西――聚集索引。
在前面的討論中我們已經(jīng)提到了,聚集索引有兩個(gè)最大的優(yōu)勢(shì):
1、以最快的速度縮小查詢范圍。
2、以最快的速度進(jìn)行字段排序。
第1條多用在查詢優(yōu)化時(shí),而第2條多用在進(jìn)行分頁(yè)時(shí)的數(shù)據(jù)排序。
而聚集索引在每個(gè)表內(nèi)又只能建立一個(gè),這使得聚集索引顯得更加的重要。聚集索引的挑選可以說(shuō)是實(shí)現(xiàn)“查詢優(yōu)化”和“高效分頁(yè)”的最關(guān)鍵因素。
但要既使聚集索引列既符合查詢列的需要,又符合排序列的需要,這通常是一個(gè)矛盾。筆者前面“索引”的討論中,將fariqi,即用戶發(fā)文日期作為了聚集索引的起始列,日期的精確度為“日”。這種作法的優(yōu)點(diǎn),前面已經(jīng)提到了,在進(jìn)行劃時(shí)間段的快速查詢中,比用ID主鍵列有很大的優(yōu)勢(shì)。
但在分頁(yè)時(shí),由于這個(gè)聚集索引列存在著重復(fù)記錄,所以無(wú)法使用max或min來(lái)最為分頁(yè)的參照物,進(jìn)而無(wú)法實(shí)現(xiàn)更為高效的排序。而如果將ID主鍵列作為聚集索引,那么聚集索引除了用以排序之外,沒(méi)有任何用處,實(shí)際上是浪費(fèi)了聚集索引這個(gè)寶貴的資源。
為解決這個(gè)矛盾,筆者后來(lái)又添加了一個(gè)日期列,其默認(rèn)值為getdate()。用戶在寫入記錄時(shí),這個(gè)列自動(dòng)寫入當(dāng)時(shí)的時(shí)間,時(shí)間精確到毫秒。即使這樣,為了避免可能性很小的重合,還要在此列上創(chuàng)建UNIQUE約束。將此日期列作為聚集索引列。
有了這個(gè)時(shí)間型聚集索引列之后,用戶就既可以用這個(gè)列查找用戶在插入數(shù)據(jù)時(shí)的某個(gè)時(shí)間段的查詢,又可以作為唯一列來(lái)實(shí)現(xiàn)max或min,成為分頁(yè)算法的參照物。
經(jīng)過(guò)這樣的優(yōu)化,筆者發(fā)現(xiàn),無(wú)論是大數(shù)據(jù)量的情況下還是小數(shù)據(jù)量的情況下,分頁(yè)速度一般都是幾十毫秒,甚至0毫秒。而用日期段縮小范圍的查詢速度比原來(lái)也沒(méi)有任何遲鈍。聚集索引是如此的重要和珍貴,所以筆者總結(jié)了一下,一定要將聚集索引建立在:
常見(jiàn)的網(wǎng)絡(luò)操作系統(tǒng)有UNIX、Netware、Windows NT、Linux等,網(wǎng)絡(luò)軟件的漏洞及缺陷被利用,使網(wǎng)絡(luò)遭到入侵和破壞。