搜索引擎是網(wǎng)絡(luò)時(shí)代應(yīng)用最廣,作用最大的應(yīng)用軟件之一,是資訊來源的主要通道,搜索引擎是網(wǎng)絡(luò)的主要交匯點(diǎn),網(wǎng)站的網(wǎng)頁(yè)所包含的資訊和服務(wù)是構(gòu)成網(wǎng)絡(luò)海洋的水滴,一滴滴不計(jì)其數(shù)的水滴由搜索引擎這個(gè)主要交匯點(diǎn)、通過瀏覽器這個(gè)管道匯聚成為網(wǎng)絡(luò)的海洋。微軟首席軟件設(shè)計(jì)師Ray Ozzie在給其員工一份備忘錄中表示,微軟公司正在接受一種新的認(rèn)知。“在過去10年中,PC時(shí)代已經(jīng)讓位給另一個(gè)時(shí)代,WEB時(shí)代。不僅可以通過瀏覽器獲得WEB體驗(yàn),通過其他不同的設(shè)備也可以獲得WEB體驗(yàn),例如電腦、電話、媒體播放器、游戲機(jī)、機(jī)頂盒和電視、汽車等等。”在備忘錄中,Ozzie描述了三項(xiàng)原則,以指引該公司進(jìn)入這個(gè)新的時(shí)代。其中的主要概念是,“WEB是我們的社會(huì)網(wǎng)格和設(shè)備網(wǎng)絡(luò)的樞紐”。
手機(jī)的移動(dòng)搜索:通常指的是建立在WAP應(yīng)用之上的資訊搜索,搜索的對(duì)象為WAP網(wǎng)站上的內(nèi)容和服務(wù)。如百度的移動(dòng)搜索:據(jù)報(bào)道,百度將同多家中國(guó)主要電信運(yùn)營(yíng)商合作,共同為即將在中國(guó)推出的3G服務(wù)開發(fā)手機(jī)搜索應(yīng)用,以此迎擊Google的手機(jī)計(jì)劃。用戶可以通過百度WAP門戶(wap.baidu.com)訪問一系列服務(wù),包括網(wǎng)絡(luò)搜索、新聞、手機(jī)博客、地圖、圖片、字典、以及股票信息等等。在中國(guó)互聯(lián)網(wǎng)搜索市場(chǎng),百度已經(jīng)占據(jù)了絕對(duì)的領(lǐng)先優(yōu)勢(shì),遙遙領(lǐng)先于Google。百度在中國(guó)手機(jī)搜索領(lǐng)域,得益于兩年半之前通過WAP系統(tǒng)推出的數(shù)據(jù)服務(wù),百度同樣是市場(chǎng)領(lǐng)先者,雖然在Google與中國(guó)移動(dòng)客戶搜索形成的強(qiáng)制性使用Google后數(shù)量上落后,但在模式和內(nèi)容的多樣性上百度還是居于領(lǐng)先地位。用戶可以通過百度WAP門戶(wap.baidu.com)訪問一系列服務(wù),包括網(wǎng)絡(luò)搜索、新聞、手機(jī)博客、地圖、圖片、字典、以及股票信息等等。由此可見,WAP門戶在百度3G計(jì)劃中占據(jù)了十分重要的位置。
手機(jī)的WEB搜索:指的是建立在WEB應(yīng)用之上的資訊搜索,搜索的對(duì)象為WEB網(wǎng)站上的內(nèi)容。Google手機(jī)搜索的WEB觀,“移動(dòng)搜索和整合搜索都是可以搜索整個(gè)互聯(lián)網(wǎng)的,并不是局限于一部分的”這里的移動(dòng)搜索,事實(shí)上指的是手機(jī)的WEB搜索。
第一代搜索引擎,是以雅虎為代表的目錄式搜索引擎,他實(shí)際上是一個(gè)導(dǎo)航網(wǎng)站,隨著信息量的海量增長(zhǎng),導(dǎo)航網(wǎng)站的搜索方式已經(jīng)明顯地?zé)o法滿足用戶對(duì)搜索引擎的要求,隨之而來的,是以“關(guān)鍵詞”搜索技術(shù)為代表的第二代搜索引擎的誕生,“關(guān)鍵詞”搜索創(chuàng)新性地提出了頁(yè)面重要性分析技術(shù)pageranking技術(shù)和超鏈分析技術(shù)等,將最重要的頁(yè)面優(yōu)先呈現(xiàn)給用戶。代表產(chǎn)品就是Google,在方法上它并不對(duì)文獻(xiàn)本身按目錄進(jìn)行分類,而是從文獻(xiàn)中識(shí)別出“關(guān)鍵字”來,然后建立倒排索引,從而造就了Google帝國(guó)。第二代搜索引擎設(shè)計(jì)的三大要素:
1、資訊的獲取,也就是通過搜索引擎派出去的網(wǎng)絡(luò)蜘蛛(即WEB Spider)在網(wǎng)海之中有計(jì)劃地對(duì)散存在各處的網(wǎng)頁(yè)完成對(duì)網(wǎng)頁(yè)內(nèi)容的抓取,由他決定了那些資訊可進(jìn)入搜索引擎的數(shù)據(jù)庫(kù)中,其主要指標(biāo)為:抓取的速度、抓取的深度和抓取的廣度。
2、資訊的處理:抓來的海量資訊如何排序?按什么原則?用什么方法?如何分類?3、向搜索引擎用戶提供反饋結(jié)果,按關(guān)鍵詞和排序算法把結(jié)果按一定規(guī)則形成的優(yōu)先級(jí)在網(wǎng)頁(yè)上顯示用戶查詢結(jié)果,這里也涉及效率問題,即用快速檢索算法,用最短的時(shí)間讓用戶看到結(jié)果。衡量一個(gè)搜索引擎的好壞主要是搜索精度指標(biāo)和數(shù)據(jù)處理的效率,讓用戶用最短的時(shí)間,最便捷的方式獲得他所需要的最新的資訊。
隨著時(shí)間的推移,網(wǎng)上資訊的指數(shù)式增長(zhǎng),綜合搜索引擎,如Google、百度等,在海量資訊的面前,遇到了一個(gè)很大的麻煩--搜索精度嚴(yán)重不足,表現(xiàn)在用戶在使用綜合搜索引擎時(shí)面對(duì)數(shù)以百萬(wàn)計(jì)的答案茫然不知所措,量變終于又造成了質(zhì)變,關(guān)鍵詞搜索模式開始遇到了一個(gè)致命的問題——搜索的精度問題無(wú)法解決,有人統(tǒng)計(jì)過,使用Google搜索實(shí)現(xiàn)用戶查知所需資訊的時(shí)間平均為6分鐘,如何解決這個(gè)問題,成為現(xiàn)實(shí)中的實(shí)際需求,因此,各搜索引擎無(wú)不把如何解決這一問題作為自己的目標(biāo),因?yàn)樗麄兩钪?,解決了用戶的問題,就等于造就了自己。
目前各搜索引擎的解決方案,都是基于增加細(xì)化分類來實(shí)現(xiàn)這一目的,其原理可用以下分式來表示:
搜索精度=符合條件的資訊總量/細(xì)化分類之?dāng)?shù)目
每增加一個(gè)細(xì)化分類,就能使精度提高一倍。
這種方式雖然能起到一定的效果,但由于分子過大,而分母無(wú)法過分的增加,否則將會(huì)造成分細(xì)過多,從而引發(fā)另一個(gè)不便之處,所以,還是不能從根本上解決問題。綜合搜索引擎對(duì)此一籌莫展,始終無(wú)法解決搜索精度的問題,問題的出現(xiàn)和用戶的需求,摧生了垂直搜索引擎,所以,在這個(gè)問題的解決方案中,根據(jù)市場(chǎng)細(xì)分原理,催生了垂直搜索,垂直型搜索引擎由此應(yīng)然而生,他們面向的分類對(duì)象五花八門,粗粗一看,通過市場(chǎng)細(xì)分,有效地縮小了公式中的分子,似乎解決了綜合搜索引擎搜索精度不足的問題,這一結(jié)果讓垂直搜索引擎的創(chuàng)建者們興奮不已;他們?cè)贕oogle帝國(guó)的鼻子底下大搖大擺的公然分享Google的世襲領(lǐng)地,而Google則鞭長(zhǎng)莫及,無(wú)可奈何,帝國(guó),也必須尊守藍(lán)切斯特法則,在垂直引擎的差異化戰(zhàn)略面前,既然無(wú)法以同化戰(zhàn)略進(jìn)行出擊,也就只能看著市場(chǎng)在流失,其中的關(guān)鍵,在于技術(shù),沒有技術(shù)上的創(chuàng)新來解決精度搜索問題,垂直搜索就自有生存之道。
雖然利用差異化,垂直搜索引擎瓜分了綜合搜索引擎的一部分市場(chǎng),但垂直搜索卻遇到了一個(gè)自己沒想到的問題――自己居然要抽自己的嘴巴:市場(chǎng)分得越細(xì),搜索精度自然高會(huì)越高,所需要的不同的搜索引擎就會(huì)越多,搜索引擎過多,一個(gè)嚴(yán)重的問題隨之而生并隱藏的水面之下,這里存在一個(gè)邏輯誤區(qū),或者將之稱為怪圈,垂直搜索引擎把市場(chǎng)分得越細(xì),其搜索精度自然就越高,同時(shí)垂直搜索引擎的數(shù)量也就越多,為數(shù)眾多的垂直型搜索引擎是在一定的程度上解決了精度問題,可是,誰(shuí)能指望用戶記住這n多的垂直搜索引擎呢?對(duì)用戶來說,要找到他所需要的垂直搜索引擎或許會(huì)比他在精度不足的綜合搜索引擎上尋找結(jié)果更加麻煩。
搜索引擎的搜索精度,是搜索引擎的命脈,沒有那一位用戶喜歡從一大堆垃圾資訊中尋找自己想要的結(jié)果,這個(gè)關(guān)鍵的情況,終于被百度發(fā)現(xiàn)并加以利用了,百度于是決定以中文分詞技術(shù)作為突破口,以高超的中文分詞技術(shù)為基礎(chǔ),不足部分再以人工修正為輔助,這一方案大大提高了百度搜索在分詞上的準(zhǔn)確性,使得用戶在使用百度進(jìn)行關(guān)鍵詞搜索時(shí),百度搜索引擎所返回的其垃圾資訊大為減少,百度以此為主攻突擊方向,向Google發(fā)起了全面進(jìn)攻,果然不出百度之所料,迎合用戶的需求,就是成功的基礎(chǔ),百度很快的就突破了Google的防線,在百度的中文分詞突擊集群的攻勢(shì)面前,Google則是束手無(wú)策、潰不成軍,結(jié)果,在中文搜索領(lǐng)域里,百度憑著其優(yōu)良的中文分詞效果一舉擊敗了不可一世的Google,百度并趁勢(shì)擴(kuò)大戰(zhàn)果,以MP3搜索等輔助垂直搜索為領(lǐng)域,建立起了自己的一個(gè)防御體系并乘勝追擊以擴(kuò)大戰(zhàn)果,這是搜索引擎大戰(zhàn)中一個(gè)關(guān)于搜索精度取勝的典型案例。
隨著3G手機(jī)網(wǎng)絡(luò)時(shí)代的到來,手機(jī)網(wǎng)絡(luò)時(shí)代讓手機(jī)搜索成為了搜索領(lǐng)域的重心,在手機(jī)上使用的搜索引擎匆匆登場(chǎng),Google預(yù)言3年后手機(jī)搜索將超計(jì)算機(jī)搜索,由于與中國(guó)移動(dòng)結(jié)成了聯(lián)盟,到2011年,它處理的來自中國(guó)手機(jī)用戶的搜索請(qǐng)求將超過計(jì)算機(jī)用戶,Google中國(guó)區(qū)總裁李開復(fù)在接受彭博電視(Bloomberg Television)采訪時(shí)表示,在一些季度中,我們的手機(jī)搜索次數(shù)會(huì)翻一番,而PC搜索次數(shù)翻一番通常需要一年時(shí)間。他說:在未來3年后,手機(jī)搜索將超過計(jì)算機(jī)搜索,Google宣布將著重手機(jī)搜索市場(chǎng)的布局,而其為Nokia、BlackBerry和Windows Mobile手機(jī)設(shè)計(jì)的專用搜索功能,號(hào)稱可讓手機(jī)搜索速度加快40%,Google也宣稱,新軟件已增加20%的手機(jī)上網(wǎng)比率。
就目前的情況上來看,手機(jī)的搜索引擎大體分為兩類主流模式,一類是以電腦綜合搜索為模式的簡(jiǎn)單移植,即把電腦綜合搜索引擎幾乎是原封不動(dòng)的搬到手機(jī)上,是建立在面向整個(gè)互聯(lián)網(wǎng)基礎(chǔ)上的手機(jī)WEB搜索引擎,另一類是以垂直搜索為模式,在對(duì)象上以面向WAP為應(yīng)用為基礎(chǔ),稱之為移動(dòng)搜索引擎(又叫無(wú)線搜索引擎),即他搜索的元素基于WAP的整個(gè)應(yīng)用?,F(xiàn)在的第二代搜索引擎技術(shù)在電腦搜索上已經(jīng)落后,使得將搜索模式移植到手機(jī)上將更加困難,在電腦搜索中所遇到的問題在手機(jī)的應(yīng)用上仍然會(huì)遇到,而在電腦搜索中并不存在的問題在手機(jī)搜索上卻會(huì)出現(xiàn)。對(duì)于WEB搜索,手機(jī)搜索與電腦搜索是有很大的區(qū)別的,主要是兩個(gè)原因所造成的,一個(gè)是手機(jī)的屏幕遠(yuǎn)遠(yuǎn)小于電腦屏幕,這意味著他在一屏之內(nèi)只能顯示很少的內(nèi)容,即:在電腦搜索上,一頁(yè)所顯示十條搜索結(jié)果的現(xiàn)狀,搬到手機(jī)后,他一屏只能顯示一到兩條結(jié)果(視不同大小的手機(jī)屏幕而定),對(duì)于一般的低端小屏幕手機(jī),恐怕連一條搜索結(jié)果在一屏之內(nèi)都顯示不完,故要把在電腦搜索領(lǐng)域的海量顯示結(jié)果,在手機(jī)屏幕將其展現(xiàn)出來的結(jié)局,將使用戶查找所需條目更為困難,要另一個(gè)原因是手機(jī)主流操作還是鍵盤操作,大多數(shù)手機(jī)沒有鼠標(biāo)功能,要在手機(jī)的數(shù)字鍵盤上單指進(jìn)行操作,使得在操作上極為不便,所以,基于以上原因,綜合搜索引擎往手機(jī)上簡(jiǎn)單移植的模式明顯是有重大缺陷的,只能不得已而為之的權(quán)宜之計(jì)――總比沒有搜索引擎要好。讓我們?cè)倏纯匆苿?dòng)搜索在手機(jī)上的應(yīng)用,現(xiàn)在的移動(dòng)搜索,主要面向的是WAP的服務(wù)性垂直搜索,由于相對(duì)于WEB的內(nèi)容搜索而言,WAP的服務(wù)性搜索的內(nèi)容極少,還免強(qiáng)能用,但當(dāng)3G迫使其轉(zhuǎn)向WEB時(shí),其缺陷立即暴露出來了,即便是采用垂直搜索的模式來對(duì)WEB進(jìn)行內(nèi)容搜索,所得出的海量搜索結(jié)果也將對(duì)其產(chǎn)生致命的硬傷,而垂直搜索的另一個(gè)硬傷――多到讓人無(wú)法記住的垂直搜索引擎之間的切換,對(duì)于操作不便的手機(jī)來說,比電腦垂直搜索更為致命。
手機(jī)用戶對(duì)搜索引擎的需求方式上的特點(diǎn),用戶用手機(jī)上網(wǎng)時(shí),他的目的與用電腦上網(wǎng)時(shí)在多數(shù)情況下是有所不同的,其具體表現(xiàn)在用手機(jī)查資料的時(shí)候少,查資訊的時(shí)候多,造成這種現(xiàn)象的原因是:大多數(shù)人用手機(jī)來進(jìn)行工作的時(shí)間少,用來放松和解決日常生活問題的時(shí)間多,這種判斷雖然有助于解決手機(jī)搜索設(shè)計(jì)上的部分問題,如Google的手機(jī)整合搜索的例子,李開復(fù)是這樣來描述Google的整合搜索的:“我們的整合搜索就是這樣的目的,整合搜索的概念就是將各種不同的信息的來源無(wú)論是圖片還是地圖、餐館的信息還是網(wǎng)頁(yè)進(jìn)行很好的排序,當(dāng)您喜歡看一個(gè)圖片的時(shí)候,例如搜鳥巢的時(shí)候,圖片在前面,周杰倫的時(shí)候,歌曲在前面,搜長(zhǎng)江七號(hào)的時(shí)候影評(píng)信息排在前面。移動(dòng)搜索和整合搜索都是可以搜索整個(gè)互聯(lián)網(wǎng)的,并不是局限于一部分的,他們的排序會(huì)根據(jù)用戶的習(xí)慣不同,所以也許,在移動(dòng)搜索中,地圖或者是找尋商店、餐館是移動(dòng)用戶有興趣的,他們會(huì)被自動(dòng)的排在前面,今天移動(dòng)搜索的內(nèi)容和使用率不是最高,有的排序做的不是很完美的,用戶繼續(xù)使用,我們的排序越做越好的前提之下,我們相信移動(dòng)搜索和PC搜索有同樣廣大的潛在的結(jié)果,會(huì)根據(jù)你個(gè)人或者是地理位置或過去的習(xí)慣做更加合理的排序,長(zhǎng)期來說,移動(dòng)搜索有更大精確排序的空間,因?yàn)橐苿?dòng)搜索知道你的地理位置也知道過去的習(xí)慣存在手機(jī)上,當(dāng)未來有一天可以利用這些信息的時(shí)候,可以針對(duì)性的將很好的準(zhǔn)確的結(jié)果推薦給你,例如在廣州的某一條街上搜索午餐,就會(huì)將附近的餐廳進(jìn)行排序,例如知道你喜歡吃粵菜還是四川菜,就會(huì)長(zhǎng)期的將你喜歡吃的菜排在前面,因此長(zhǎng)期來看移動(dòng)搜索是看好的。”類似的模式在實(shí)踐中還是有重大缺陷的――當(dāng)用戶需要使用手機(jī)進(jìn)行工作性搜索時(shí)怎么辦?如果用戶使用Google的整合搜索在街道A想請(qǐng)女朋友在街道B吃一餐飯那豈不是要糟?但不管怎么說,這些創(chuàng)意,雖然不能說是成功地解決了目前所面臨的問題,但他至少能開拓人們的視野。
問題已然出現(xiàn),但解決方案又在哪里呢?未來的搜索引擎之路該如何走?解決問題的方向又在哪里呢?百度的創(chuàng)始人李彥宏認(rèn)為,未來搜索引擎的發(fā)展方向是類似于“百度知道”,但事實(shí)將會(huì)是這樣的嗎?就本質(zhì)而言,雖然“百度知道”或許真的能解決一部分人想得到的結(jié)果,但他明顯超出了搜索引擎的概念,所謂搜索引擎,只是一種檢索的方式,而“百度知道”卻是在制造和提供內(nèi)容,所以,有理由認(rèn)為用“百度知道”來解決搜索引擎所遇到的搜索精度嚴(yán)重不足的問題并不是一個(gè)好的主意。而Google認(rèn)為,未來搜索引擎的發(fā)展方向是“人工智能”,顯然,似乎Google對(duì)搜索引擎的理解更接近正解,然而問題是現(xiàn)有的人工智能技術(shù)遠(yuǎn)未成熟,在技術(shù)上無(wú)法提供Google想要實(shí)現(xiàn)這一目標(biāo)的手段,如何才能實(shí)現(xiàn)人工智能?什么時(shí)候人類才能對(duì)計(jì)算機(jī)人工智能取得實(shí)質(zhì)上的突破呢?就在搜索引擎在電腦搜索領(lǐng)域里如何解決網(wǎng)資訊頁(yè)海量增長(zhǎng)所面臨的問題還找不到北的時(shí)候,手機(jī)網(wǎng)絡(luò)時(shí)代的到來,對(duì)手機(jī)WEB搜索提出了實(shí)實(shí)在在的需求,這一情況,讓原來就沒準(zhǔn)備好的搜索引擎促不及防,而這種情況,對(duì)用戶來說是一種不幸,但對(duì)于企業(yè)來說是一種大幸,一個(gè)建立在用戶不幸之中的大幸,誰(shuí)能解決這些用戶的不幸,誰(shuí)將成為3G時(shí)代最大的殺手。
轉(zhuǎn):http://tech.ddvip.com/2008-08/121827234052448.html
posted on 2008-12-31 14:33
cheng 閱讀(548)
評(píng)論(0) 編輯 收藏 所屬分類:
通信業(yè)務(wù)