前兩天朋友說用python做采集比較方便,有現成的包可以用。
今天查資料的時候看到ruby在數據處理和采集方面也有著較強的功能。
應用比較多的有
spridr
hpricot
nokogiri
http://nokogiri.org/
網頁交互程序
Watir
http://bbs.locoy.com/archiver/tid-30408.html
http://www.tsnpc.com/use-watir-for-page-scraping/
Mechanize
http://www.javaeye.com/topic/299699
詳細的以后應用到再去學習