Google和BI有什么关p?q个站在风口尖上的公司Q用一个“火”字来Ş容似乎ƈ不ؓq。将BI跟它扯上关系Q似乎有些攀高亲的意思。不q,现在BI实已经和搜索技术联pv来,而后者正是Google的特ѝ对于BI厂商Q在产品中融入搜索的功能g也是一个潮,例如BO在之前发布的某品版本中q重强调了它的模糊搜烦功能?/p>
交融
搜烦、文本挖掘,q些技术是怼的,特别是后者中出现了“挖掘”的字样Q很明显和数据挖掘这个术语关联到一块。以前曾l听一个公总l他们的文本挖掘产品Q主要特点就是订阅关键字Q然后从各新ȝ站中采集到相关的内容。此处的“相关”,按照q个产品的说法,q单的文字匚wQ还考虑到语义。例如搜索BIQ也能够相q的Q诸如“商业智能”、“商务智能”都U_搜烦范围。ƈ且还具备一些关联性分析之cȝ东东Q例如关键词主要出现的位|,和哪些词一起出现的频率。这U技术应用在竞争情报分析上面q是挺有的。现在,搜烦引擎大多也在提供cM的功能,比如Google有alertQ也是通过订阅关键字,q回相关的网链?癑ֺ也有q样的东东。但昄Q他们的特点在于搜烦Q也是信息采集阶段Q分析的功能q是不够强?/p>
如果对q种非结构化的信息处理和传统数据仓库中ETL相比Q搜索就相当于“E”的位置Q它负责抽取。而网l上的各U新闅R文档,也就成了数据源。如果要寚wl构化信息进行分析,q是得{换成l构化的Q也是说必要l过转换Q甚臌载的步骤?/p>
q种需求似乎也正在出现Q最q一D|_听到客户需要这么一个东东——能够搜索本地文档的工具。这些文档包括mail、pdf、word文档{等。一听到q样的需求,马上联想C是Google desktop提供的功能吗?正好自己机器上装了,便演CZ把,果然不错。但q需要改q的是,能够有权限控Ӟ让不同的用户能够搜烦C同别的文档。另外,当然q能不能将q个界面整合到自qportal当中M?/p>
除了搜烦技术,dq底的时候,Google曄C一家做Web分析的公?Urchin)Qƈ且将它作ZU免费的服务攑֜|上。一开始,只要有Google账号的都可以自动甌服务Q后来改成审批申请了。这Ҏ(gu)务可以ؓ|站监控量Q从哪里来,往哪里去,以及讉Kơ数{等Q提供一些可视化报表来展现。分析部分是非常单的Q只是普通的报表展现。后台则是要求你在网上嵌入一D代码,可以采集到网站的讉K信息。当q项免费服务推出的时候,那些原来在这个领域中(现在成ؓGoogle的竞争对?的公司,惛_非常恼火吧?/p>
再看看数据分析一块,最常用的数据分析工h什?Excel是吧,或者称之ؓ一Uspreadsheet产品。现在google也有cM的玩意儿。比如,Google?sh)子表格的速度很值得注意。据_在输入数据到工作表的时候,几乎不会遇到M的耽搁。即便是重新计算负蝲公式工作表,也只会遇到轻微的停滞。所以,如果只是Z单数学或理型列表Q那么Google?sh)子表格产品的确很容易被看作是一个完易用的工具。不q,其功能还是比较简单,多是些公式计算的功能,q没有达到微软Excel那样复杂的程度,譬如作图׃行。但也有其本w的特点Q因为是在网l上面的Q因此Googleg更可以׃nspreadsheet?/p>
我们可以看到QGoogleq些产品和服务,多半q是围绕搜烦q项核心技术,说得虚一些,都可以叫做信息采集。配一些简单的分析功能Q倒能形成比较完整的服务,但如果要说专业,q算不上。因此,Google也选择了和专业BI厂商合作Q譬如它的企业搜烦产品OneboxQ就已经和Cognos、SAS展开合作?/p>
BI的内容不。这些大家伙们其实也都是比较专注的,其中单独的模块都能Ş成独特的产品Q譬如元数据、数据质量,更别提这一块信息采集了。只是国内的q种市场q没有细分,“专注”对于公司来说确实是一个不的考验?/p>
搜烦带给BI什?/strong>
几个月前Q国内某论坛上曾有h辩论Q数据仓库和搜烦技术哪个更牛一些。有位朋友说Q国内某个公司用搜烦p决了数据仓库要解决的事情。这L争论Q当然不需要去参加Q除非想L杠?/p>
q两个领域的有些地方交叉,但我q是认ؓQ搜索可以ؓ数据仓库提供非结构化数据的抽取和理功能Q但对于后箋的分析,那还是BI的事情。当Ӟ现在搜烦也讲I自然语a的搜?据说q也是Google李开复挖q去的原??/p>
老实_我看不到搜烦能够lBI带来什么明昄好处。因为它的强——对非结构化数据的处理,gq没有那么迫切的需?当然也不能否认那些大厂商创造需求的能力)?/p>
如果说用搜烦技术可以让企业领导、分析h员根据记忆中模糊的印象去查找一个指标倹{一份报告,实有用。但在大多情况下Q领导更习惯于下达一个命令让手下人去告诉它那个搜索结果。而对于分析h员来_如果他不知道那些指标的位|,那几乎就意味着不能胜Q他的本职工作了?/p>
当然Q如果那些指标、报告的数量多到需要用搜烦技术才能找得出来,那这个数据仓库已l发展到什么阶D就不知道了。但昄Q目前从国内来看Q几乎没有什么企业能够有q样的数据仓库。那么难道不能早作打,先将搜烦引擎做好?我想q是费旉Q毕竟搜索不是一U基设施。你惻I当初Web发展h的时候,哪里有搜索引擎这个概念呢?只有当信息量太大、太复杂了,才有它的诞生?/p>