Krabber是用于抽取網(wǎng)頁中HTML信息的工具。最為重要的是,Krabber可以執(zhí)行網(wǎng)頁中的JavaScript,并網(wǎng)頁在JavaScript執(zhí)行后的,被修改的HTML返回回來,提供給Java程序調(diào)用,以便能夠更好的支持Web 2.0環(huán)境下的網(wǎng)頁信息抓取。
啊列啊列,經(jīng)過了超長時間的掙扎,終于做好了第一個可以運(yùn)行的版本。參與項(xiàng)目開發(fā)的同學(xué)從對C++與Java完全不了解到逐漸的熟悉并開始進(jìn)步,實(shí)在是相當(dāng)不容易啊,贊一個。我本科的時候要是有這個水平,沒準(zhǔn)現(xiàn)在就牛X了。
比較慚愧的是,由于涉足開源領(lǐng)域的經(jīng)驗(yàn)不足,沒有很好的整理文檔以及代碼。目前Krabber已經(jīng)可以下載了,可以嘗試著在Windows下用VS編譯一下,看看能不能行。另外可以運(yùn)行的EXE也應(yīng)該會快回上傳上來。
另外昨天開會的時候同學(xué)們表示,我們小組的博客好像不太容易看懂。這個沒辦法啦,沒有時間做網(wǎng)站和找主機(jī),只能用博客充當(dāng)在線內(nèi)容編輯器了。大家在看我們的博客的時候請把它當(dāng)成網(wǎng)站來看,相關(guān)的鏈接都在博客正文中黃色的標(biāo)題下面,至于博客正文周邊的連接就無視好了……
Krabber在http://www.tkk7.com/senior/archive/2009/05/10/269916.html
(by : 雞叔 : senior, sakaekutitubasa@gmail.com)