??xml version="1.0" encoding="utf-8" standalone="yes"?>
]]>
]]>
]]>
2009-12-20
作者:彭明?/span>
本文中的Q何部分都不得以Q何手DQ何Ş式进行复制与传播
随着企业竞争的日益激烈,企业信息化的成ؓ了关键因素,企业对计机pȝ的需求越来越高,如:企业内部的ERP理pȝ、决{分析系l,对外的销售及支付、客h务系l等pȝ来多Q大型企业的情况ؓ复杂Q单独做好一个系l或几个pȝ再也无法适应企业信息化徏讄发展。本文要谈的是特大型企业应用Q这cM业的特点是垄断、用系l的员工上万、地域分布广差异大,对系l的功能和性能上有着极高的要求,本文从目前的企业现状、企业架构两个方面说明?/span>
q?span style="font-size: 12pt; font-family: 宋体; mso-font-kerning: 1.0pt; mso-bidi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA">?/span>目前大多C业的现状Q这cM业管理层ơ太多,机构和部门之间的利益及关pL较微妙。采购的成品的Y件系l也很难适应企业多元化的应用Q因此大部分企业会选择自主开发或Ҏ品系l本地化的大攚w。这cȝ软gpȝ基本是ؓ某个机构或部门服务的Q因此系l之间层ơ和定位比较混ؕ。主要表Cؓ以下问题Q?/span>
1?/span>各个pȝ设计之初怺割裂Q除了特D业务功能上的需要基本没有什么联p,后期很难实现数据׃n?/span>
2?/span>各个pȝ基础数据冗余Q每个都有自q基础数据Q如Q组l架构、员工、品等信息。基数据的变化和更新涉及所有系l,q且无法做到旉上的l一和数据的一致性。给pȝ之间调用需要留下很多隐患?/span>
3?/span>pȝ之间的模块冗余,cM的模块且功能不一致。如Q员工信息管理,产品信息理、报表等。如Q销售系l的销售报表与财务的销售报表、客户关pȝl的销售报表不一_由此产生的歧义对于特大型企业是不允许的?/span>
4?/span>pȝ对外接口混ؕQ系l设计最初就是独立的Q没有对外系l提供接口。后来由于业务需要时添加,造成接口不规范、重复、繁杂,q缺监控存在安全漏z?/span>
5?/span>pȝ难以q度整合。基于以上问题企业会做一些整合,虽然有portal和sso{登录和界面上的用户操作整合Q但是功能和数据上的q度整合没有做到?/span>
q类企业业务和管理上相对规范Q能l一采购成品的ERP软gpȝQ企业的大部分业务需求都能通过ERPpȝ完成。这cM业应用架构是?ERPpȝZ心,在一D|间内数据比较l一Q各个模块之间协调一致。这在系l徏讑ֈ期比较好Q随着企业的发展原有ERPpȝ不能满新的业务需求时Q系l升U比较困难。不得不另外开发独立的其他pȝQ久而久之又形成了多个系l百花齐N以控制的局面?/span>
数据服务Z心的企业架构是以企业的数据ؓ核心。不企业如何发展的Q他的系l如何升U改造,数据永远是企业的核心。数据服务ؓ中心是要徏立统一的核心数据、统一的业务规则、统一的服务接口、统一的安全管理、提供高效准的数据、提供复用的功能、提供良好的扩展性,q与前端业务pȝ无缝衔接实现q度的整合。设计采?#8220;数据Z心、服务ؓ依托、SOA、ESB为技术手D?#8221;的思\?/span>
初步建立数据Z心的企业架构Q首先实现数据的l一和系l功能的一致性,满企业日常生q行的需要?/span>
1?/span>真正实现数据l一理Q基数据和公共数据最大程度被复用Q有效解决了多个pȝ基础数据的不一致性,为系l间的调用和数据的决{分析打下良好基?/span>
2?/span>真正实现服务层与操作层的分离,数据服务lg以SOA的方式将服务发布到ESB,为操作层和其他服务组件调用提供接口。数据服务组件是企业基础业务及核心业务功能的高度抽象及实玎ͼ数据服务解决了系l间业务功能的不一致性?/span>
3?/span>企业数据ȝESBQ是q接各个数据服务lg和服务层与操作层的桥梁,负责服务注册发布、服务查找调用、服务安全控制。应为ESB设计好统一接口协议和服务协议,保证每个pȝ和服务组件之间都可以无缝Cq和兼容。ESB使多个系l和服务之间的层ơ更加清晎ͼ降低了他们之间的耦合度,便于服务的扩展?/span>
4?nbsp;前端pȝ主要功能是ؓ用户提供良好的界面,提供个性化ҎQ便于用户录入数据及数据展现。同时又为数据层提供高质量的业务数据。作为操作层的前端系l通过ESB能调用Q何组件提供的数据服务Q因此前端系l的功能可以做得非常强大?/span>
完整架构增加了安全控制层Q抽象出更高E度的企业门P核心服务增加了更多的技术服务组件。同时也部v了地方服务器?/span>
1?/span>更多的技术服务组件是Z满特大型企业的Ҏ据挖掘分析、科学计的要求。如Q异步批量服务、云计算服务{?/span>
2?/span>安全控制层的安全控制有别?/span>ESB的安全控Ӟ安全控制层主要控制在用户层面Qƈ能根据接口提供的信息自动完成用户dQ创Z话o牌?/span>ESB服务会根据o牌信息,控制该用戯问的数据权限及操作权限?/span>
3?/span>企业门户不仅仅是l一用户d或菜单界面的整合。首先企业门h合了所有的业务pȝQ就象一套系l能完成所有的企业日常办公Q如Q采购、生产、库存、销售、收付款、邮件?/span>OA{。其ơ企业门h供富客户端满_杂操作的业务Q如Q生产制造系l,数据决策分析pȝ、邮件系l、多媒体pȝ?/span>
4?/span>地方U服务器解决两类问题Q一个是Ҏ据缓存减网l带宽,数据交换服务能自动完成与数据中心服务的数据同步,其是大型只ȝ的数据,如:多媒体数据、报表、邮件等Q另一个是允许各地部v自己的特色业务系l,满各地多元化的个性需求?/span>
数据׃n一直是企业兛_的,如何满不同pȝ、不同h个性需求又要保证数据安全一直是最大的N。数据共享有三个层面的问题需要解冻I
1?/span>h的数据格式。是指请求发hҎ受方q回数据l果的样式要求,如:Excel、PDF、XML、数据对象以及他们的填充样式。这个问题可以双斚w先定义好格式的约定或模板Q由发vҎ供自定义的模板来解决Q再由接受方数据按照模板填充ƈq回?/span>
2?/span>h的数据内宏V是指请求发hҎ受方q回哪些数据Q以及数据颗_度的要求,如:某个机构的销售数据(按照天、品、子机构{维度)、某个部门的损益数据Q按照天、科目、h员等l度Q。这个问题可以双斚w先定义一套语a或脚本,由发h提供h数据的脚本,再由接受方解析脚本返回数据?/span>
3?/span>数据安全控制。是指请求接受方Ҏ发v方的w䆾q回他所能看到的数据Q或者说发vҎ否能得到h的数据。这个问题是由根据企业架构中安全数据lg服务来解冟?/span>
也许您用q?/span>cognos{数据挖掘工P但我很遗憄告诉您那只是一个功能强大的自定义报表展现工兗?/span>
数据挖掘Q?/span>DMQ?/span>Data MiningQ就是从大量的、不完全的、有噪声的、模p的、随机的数据中,提取隐含在其中的、h们事先不知道的,但又是潜在的有用信息和知识的q程。还有很多和q一术语相近的术语,如从数据库中发现知识Q?/span>KDDQ、数据分析、知识抽取、商业智能、决{分析等?/span> q里最重要的不仅是面向特定数据库的单检索查询调用,而且要对q些数据q行微观或宏观的l计、分析、综合和推理Q企囑֏C仉的相互关联,甚至利用已有的数据对未来的活动进行预?/span>
1、关pL据库Q日常运行的业务pȝ拥有大量的数据库
2、数据仓?/span>
3、事务数据库Q把一个或几个事务数据库集中到一个只ȝ数据挖掘?/span>
4、高U数据库及高U数据库的应用:CADI间数据库、文本数据库、空间数据库、多媒体数据库等
?/span> |
特征 |
数据挖掘法 |
集成 |
分布计算模型 |
数据模型 |
W一?/span> |
数据挖掘作ؓ一个独立的应用 |
支持一个或者多个算?/span> |
独立的系l?/span> |
单个机器 |
向量数据 |
W二?/span> |
和数据库以及数据仓库集成 |
多个法Q能够挖掘一ơ不能放q内存的数据 |
数据理pȝQ包括数据库和数据仓?/span> |
局部区域的计算机集?/span> |
有些pȝ支持对象、文本和q箋的媒体数?/span> |
W三?/span> |
和预a模型pȝ集成 |
多个法 |
数据理和预a模型pȝ |
Internet/Extranet|络计算 |
支持半结构化数据?/span>Web数据 |
W四?/span> |
和移动数?/span>/各种计算数据联合 |
多个法 |
数据理、预a模型、移动系l?/span> |
Ud和各U计设?/span> |
普遍存在的计模?/span> |
1、分cd析:主要用于预测模型Q通过数据库中的某些数据得到另外的数据为目标。分cȝ法通过判断数据记录的属性与已知训练数据中风险程度的关系l出预言l果
2、聚cd析:聚类用于从数据集中找出相似的数据q组成不同的l。与前面的预模型不同,聚类中没有明昄目标变量作ؓ数据的属性存在。聚cȝ法通过数据判?#8220;隐藏属?#8221;
3、关联规则:目的在于生成部分数据的概要,L数据子集间的兌关系或者一些数据与其数据之间的z关系
4、h工神l网l?/span>
5、遗传算?/span>
6、模p集和模p逻辑
7、可视化Ҏ
1、问题定义:明确实际工作Ҏ据挖掘的需求、通过对各U学习算法的Ҏ而确定可用的学习法
2、数据收集和预处理:数据准备、数据集成、数据清z、数据变换、数据简?/span>
3、数据挖掘算法执行:定挖掘d后,p军_使用什么样的算法。选择实现法有两个考虑因素Q一是不同的数据有不同的特点Q因此需要与之相关的法来挖掘;二是用户或实际运行系l的要求
4、结果的解释和评伎ͼ数据挖掘阶段发现出来的模?/span>,l过评估Q可能存在冗余和无关的模式,需要将其剔除。也有可能模式不满用户要求Q这旉要整个过E回退到前一阶段
数据挖掘?/span>OLAP都属于分析型工具Q数据挖掘是一U挖掘型工具Q它能自动地发现隐藏在数据中的模式,作出预测性分析的分析工具Q它的分析过E是自动的。用户不必提出确切的问题。数据挖掘所处的位置较深
OLAP是自上而下、不断深入的分析工具Qƈ以可视化的方式呈现给用户?/span>OLAP更多依靠用户输入问题和假设,但用户先入ؓȝ局限性可能会限制问题和假讄范围Q从而媄响最l的l论?/span>OLAP位于较浅的层?/span>
管数据挖掘?/span>OLAP存在着上面的差异,但二者相辅相?br />
Open View 决策分析q_会在2010-2011q推?/span>