CowNew開源團隊網站 http://www.cownew.com
論壇 http://www.cownew.com/newpeng/
轉載請注明此版權信息
我準備給JDBMonitor增加一個性能監測報表的功能。用戶在“報表條件”中填寫要統計的起始時間、結束時間和單位時間后,點擊查詢。程序從DataBaseDBListener記錄的表T_LOG_SQLLog中進行統計并顯示報表。例如:用戶在起始時間中輸入”2006-5-30 18:00:00”,結束時間輸入”2006-6-1 12:00:00”,時間單位選擇“5分鐘”,點擊“查詢”。程序將把T_LOG_SQLLog中FbeginTime大于等于”2006-5-30 18:00:00”,小于等于”2006-6-1 12:00:00”的記錄過濾出來。然后統計每5分鐘記錄的條數(也就是數據庫執行的次數),以時間序列圖的形式顯示成報表。
比如:
fid?????? ftime
1?2006-05-05 10:00:00.000
2?2006-05-05 10:00:01.000
3?2006-05-05 10:00:10.000
4?2006-05-05 10:01:10.000
5?2006-05-05 10:01:20.000
這樣的數據屬于離散的數據,因為數據庫的執行時間是不確定的,要把它們按統計它們的出現次數常常需要使用數據挖掘的東西。數據挖掘通常都是不同的數據庫有不同的實現的,JDBMonitor是跨數據庫的,因此肯定不能使用這些數據庫特有的東西。現在也有一些開源的跨數據庫的數據挖掘引擎,但是其尺寸巨大無比,都要50M以上。JDBMonitor是一個小的工具,為了方便部署和使用,JDBMontior的一個基本原則就是盡量避免使用JDK之外的類,所以肯定不能使用它們。我經過仔細思考,發現可以通過如下技巧來解決:
select count(sub.f) as exeCount,min(sub.FBeginTime) as FTime from(
select cast(DateDiff(ss,?,FBeginTime)/? as int) as f,FBeginTime from T_LOG_SQLLog
)as sub
where 1=1
and FBeginTime>=?
and FBeginTime<=?
group by sub.f
order by sub.f ASC
其中第一、三個參數傳遞用戶選擇的時間段的起始時間,第二個參數是用戶選擇的計時間隔(以秒為單位),參數四是用戶選擇的時間段的結束時間。
我采用的是整除的技巧來實現的這個效果。
其中FBeginTime是SQL語句執行的開始時間(在這里我們就把它看作SQL語句的執行時間),cast(DateDiff(ss,?,FBeginTime)/? as int) as f的意思就是計算SQL語句的執行時間到選擇的時間段的起始時間之間的秒間隔數,然后再整除用戶選擇的計時間隔(以秒為單位)。經過整除以后同一個時間段內的數據就相同了,然后我們一個groupby,然后一個count(sub.f),這樣各個時間段sql的執行次數就出來了。
以上邊的數據為例,假如我輸入的起始時間是2006-05-05 10:00:00.000,結束時間是2006-05-05 10:02:00.000。
那么select cast(DateDiff(ss,?,FBeginTime)/? as int) as f,FBeginTime from T_LOG_SQLLog的結果集就是:
f? FBeginTime
0 2006-05-05 10:00:00.000?
0 2006-05-05 10:00:01.000?
0 2006-05-05 10:00:10.000
1 2006-05-05 10:01:00.000
1 2006-05-05 10:01:00.000?
然后,以f為分組條件進行匯總,并統計f的count,這樣各個時間段sql的執行次數就出來了:
3 2006-05-05 10:00:00.000?
2 2006-05-05 10:01:00.000?
當然不同的數據庫的計算日期時間差和截取整數的方式是略有差異的,我這里用的是mssqlserver的語法。