最近想學習BI,因為自己做的一個項目用到了大量Oracle 分析函數,而烴使用使用OLAP技術,系統目前數據量少,速度相對來說可以。每天數據量這么大,誰能保證積累了兩年的數據后,運算速度還有這么快呢。這讓我不得不思考我在做的項目與BI的差別,BI這概念之前只聽說過沒深入了解更沒有用過相應的工具。一開始自己就想到開源的BI工具,就開始下載,找入門文檔。兩天之后讓我發現這行不通,連概念都不理解,僅有工具是不行的。我們需要理解它的定義、歷史、作用,才能開始學習它,才需要用過工具。
1、BI的定議:
BI(Business Intelligence) 是一種運用了數據倉庫、在線分析和數據挖掘等技術來處理和分析數據的嶄新技術,目的是為企業決策者提供決策支持。
從定義上我們要明白BI運行的基礎是 :數據倉庫,和聯機分析 ,數據挖掘
目的:提供決策支持
2、BI分類
信息類 BI 應用
指由原始數據加工而來的數據查詢、報表圖表、多維分析、數據可視化等應用,這些
應用的共同特點是:將數據轉換為決策者可接受的信息,展現給決策者。例如將銀行交易數據加工為銀行財務報表。
知識類 BI 應用
指通過數據挖掘技術和工具,將數據中隱含的關系發掘出來,利用計算機直接將數據加工為知識,展現給決策者。
3、BI的應用模式
A、初級模式
數據查詢和生成報表,這是BI的初級應用模式
B、
1、BI 高級應用模式
OLAP ,即聯機分析處理,是 BI 帶來的一種全新的數據觀察方式,是 BI 的核心技術 之一。
2、數據挖掘
數據挖掘的目的是通過計算機對大量數據進行分析,找出數據之間潛藏的規律和知識,并以可理解的方式展現給用戶。數據挖掘是最高級的 BI 應用,因為它能代替部分人腦功能。
數據挖掘的三大要素是:
技術和算法:目前常用的數據挖掘技術包括——
自動類別偵測(Auto Cluster Detection)
決策樹(Decision Trees)
神經網絡(Neural Networks)
數據:由于數據挖掘是一個在已知中挖掘未知的過程,
因此需要大量數據的積累作為數據源,數據積累
量越大,數據挖掘工具就會有更多的參考點。
預測模型:也就是將需要進行數據挖掘的業務邏輯由
計算機模擬出來,這也是數據挖掘的主要任務。
4、 底座——數據倉庫技術
數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策。以上是數據倉庫的官方定義。
5、總結:
要想學好BI,以上知識點是基礎。必須把基礎學習才能深切的理解BI,理解客戶在這主面真正意義上的需求。
posted on 2008-04-17 12:55
有貓相伴的日子 閱讀(2514)
評論(3) 編輯 收藏 所屬分類:
BI