選用了jobo.
heritrix ,代碼不是很整潔。
j-spider ,也不合用。

WebRobot.createFromXML("dir");就可以使用jobo.xml 來配置了。
regfilter 只能配置 allow="false";看源碼沒有問題,今后有時間要解決。





西津渡