最近想學(xué)習(xí)BI,因?yàn)樽约鹤龅囊粋€(gè)項(xiàng)目用到了大量Oracle 分析函數(shù),而烴使用使用OLAP技術(shù),系統(tǒng)目前數(shù)據(jù)量少,速度相對來說可以。每天數(shù)據(jù)量這么大,誰能保證積累了兩年的數(shù)據(jù)后,運(yùn)算速度還有這么快呢。這讓我不得不思考我在做的項(xiàng)目與BI的差別,BI這概念之前只聽說過沒深入了解更沒有用過相應(yīng)的工具。一開始自己就想到開源的BI工具,就開始下載,找入門文檔。兩天之后讓我發(fā)現(xiàn)這行不通,連概念都不理解,僅有工具是不行的。我們需要理解它的定義、歷史、作用,才能開始學(xué)習(xí)它,才需要用過工具。
1、BI的定議:
BI(Business Intelligence) 是一種運(yùn)用了數(shù)據(jù)倉庫、在線分析和數(shù)據(jù)挖掘等技術(shù)來處理和分析數(shù)據(jù)的嶄新技術(shù),目的是為企業(yè)決策者提供決策支持。
從定義上我們要明白BI運(yùn)行的基礎(chǔ)是 :數(shù)據(jù)倉庫,和聯(lián)機(jī)分析 ,數(shù)據(jù)挖掘
目的:提供決策支持
2、BI分類
信息類 BI 應(yīng)用
指由原始數(shù)據(jù)加工而來的數(shù)據(jù)查詢、報(bào)表圖表、多維分析、數(shù)據(jù)可視化等應(yīng)用,這些
應(yīng)用的共同特點(diǎn)是:將數(shù)據(jù)轉(zhuǎn)換為決策者可接受的信息,展現(xiàn)給決策者。例如將銀行交易數(shù)據(jù)加工為銀行財(cái)務(wù)報(bào)表。
知識類 BI 應(yīng)用
指通過數(shù)據(jù)挖掘技術(shù)和工具,將數(shù)據(jù)中隱含的關(guān)系發(fā)掘出來,利用計(jì)算機(jī)直接將數(shù)據(jù)加工為知識,展現(xiàn)給決策者。
3、BI的應(yīng)用模式
A、初級模式
數(shù)據(jù)查詢和生成報(bào)表,這是BI的初級應(yīng)用模式
B、
1、BI 高級應(yīng)用模式
OLAP ,即聯(lián)機(jī)分析處理,是 BI 帶來的一種全新的數(shù)據(jù)觀察方式,是 BI 的核心技術(shù) 之一。
2、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的目的是通過計(jì)算機(jī)對大量數(shù)據(jù)進(jìn)行分析,找出數(shù)據(jù)之間潛藏的規(guī)律和知識,并以可理解的方式展現(xiàn)給用戶。數(shù)據(jù)挖掘是最高級的 BI 應(yīng)用,因?yàn)樗艽娌糠秩四X功能。
數(shù)據(jù)挖掘的三大要素是:
技術(shù)和算法:目前常用的數(shù)據(jù)挖掘技術(shù)包括——
自動(dòng)類別偵測(Auto Cluster Detection)
決策樹(Decision Trees)
神經(jīng)網(wǎng)絡(luò)(Neural Networks)
數(shù)據(jù):由于數(shù)據(jù)挖掘是一個(gè)在已知中挖掘未知的過程,
因此需要大量數(shù)據(jù)的積累作為數(shù)據(jù)源,數(shù)據(jù)積累
量越大,數(shù)據(jù)挖掘工具就會有更多的參考點(diǎn)。
預(yù)測模型:也就是將需要進(jìn)行數(shù)據(jù)挖掘的業(yè)務(wù)邏輯由
計(jì)算機(jī)模擬出來,這也是數(shù)據(jù)挖掘的主要任務(wù)。
4、 底座——數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)倉庫(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。以上是數(shù)據(jù)倉庫的官方定義。
5、總結(jié):
要想學(xué)好BI,以上知識點(diǎn)是基礎(chǔ)。必須把基礎(chǔ)學(xué)習(xí)才能深切的理解BI,理解客戶在這主面真正意義上的需求。