<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    2天對lucene以及搜素引擎的一些了解

    說起搜索引擎或許大家都并不陌生。
    google 百度大家都用過的。
    但是你是否對其實現有個概念呢?
    昨天開始自己慢慢弄lucene,對其也有一點的了解了。
    至少不再是剛入門什么也不懂的那種了。
    一下是自己的理解:
    搜索引擎實現功能應該大體分為2部分。
    一、建立索引。雖然自己現在做的很有限,只是在文本文件下或是內存中建立的,而其信息的采集可以是自己的數據庫中的,這個大家可以結合自己的數據庫jdbc編程。完全可以實現的,還有一個就高深一點的。來自網絡中的網頁,Google baidu的信息采集都是用爬蟲工具的。它如何實現的自己還不是很知道,以后這個在研究。反正就是把采集到的信息進行處理,使其在電腦中存在一個檢索。
    二、通過檢索電腦檢索信息,而達到搜索的用法。這中檢索機制自己還沒有深入研究,畢竟只學習了2天。

    ps:網絡爬蟲占用帶寬的,網上說Google爬蟲做的很好,似乎強大過百度的,Google的爬蟲不會再同一個IP中存在2個以上的爬蟲。

    posted on 2009-03-08 11:13 duduli 閱讀(289) 評論(0)  編輯  收藏 所屬分類: java

    <2009年3月>
    22232425262728
    1234567
    891011121314
    15161718192021
    22232425262728
    2930311234

    導航

    統計

    公告

    welcome to my place.

    常用鏈接

    留言簿(5)

    我參與的團隊

    隨筆分類

    隨筆檔案

    新聞分類

    石頭JAVA擺地攤兒

    搜索

    積分與排名

    最新評論

    閱讀排行榜

    評論排行榜

    @duduli
    主站蜘蛛池模板: 亚洲AV无码国产一区二区三区| 亚洲精品456在线播放| 亚洲AV无码成人精品区狼人影院| h片在线免费观看| 亚洲激情视频网站| 日本免费xxxx| 精品亚洲成在人线AV无码| 一二三四在线观看免费高清中文在线观看| 亚洲国产精品第一区二区| 18禁美女裸体免费网站| 亚洲制服在线观看| 免费无码又爽又刺激高潮的视频| 亚洲色欲色欱wwW在线| 免费一级特黄特色大片在线观看| 少妇亚洲免费精品| 亚洲国产精品无码久久SM| 一区二区三区在线免费看| 亚洲国产午夜精品理论片| 全免费A级毛片免费看网站| 久久精品熟女亚洲av麻豆| 亚洲国产日韩在线观频| 中文字幕免费在线播放| 亚洲人成电影在线天堂| 免费无码AV片在线观看软件| 日韩欧美亚洲国产精品字幕久久久| 免费在线看片网站| 久久精品视频免费播放| 亚洲激情视频图片| 亚洲国产激情一区二区三区| 日本免费电影一区二区| jiz zz在亚洲| 亚洲综合色视频在线观看| 亚洲一区二区在线免费观看| 亚洲国产综合AV在线观看| 中文字幕久久亚洲一区 | 午夜时刻免费入口| 一级成人生活片免费看| 亚洲小说图片视频| 亚洲精品麻豆av| 成人黄色免费网址| 一级做a爰全过程免费视频毛片|