真的很久很久沒有寫過文章了,唉,慚愧啊!寒暄的說話就不多說了,直入主題。有人問過我,如何制作一些論壇的自動發言機器人?我說,這很簡單啊,(如果沒有圖片驗證碼的話!)在Java里,有些URL,URLConnection的類啊,這些類可以訪問一個URL獲取數據,可以發送Request,你就可以結合一些類做一個自動發言的了,但用Post發送表單的話,就沒有直接的,比較麻煩,如果還要處理Cookie的話,之后我想了想,想到了可以用Jakarta Commons 下面的開源項目啊,有一個項目名叫“HttpClient”的,這個就是用Java寫的Http客戶端,可以說是一個簡單功能的瀏覽器吧,只是不能解析HTML標簽,寫這個解析可不是易事。既然我們是寫個自動訪問網站的程序,就不用解析顯示HTML啦。朋友說能寫個招聘網站的自動刷新簡歷的程序就好了,那就用51job為例吧。
首先,你得去下載HttpClient的包。
http://jakarta.apache.org/commons/httpclient
代碼不多,我們就先來看看代碼吧:
1 import java.io.*;
2 import org.apache.commons.httpclient.*;
3 import org.apache.commons.httpclient.methods.*;
4
5 public class HttpTest {
6
7 /**
8 * @param args
9 * @throws Exception
10 */
11 public static void main(String[] args) {
12 //先建立一個客戶端實例,將模擬一個瀏覽器
13 HttpClient client = new HttpClient();
14
15 //這個是URL地址,我經過分析51job網站登錄后的跳轉到的地址,并分析得它在JavaScript里提交的URL的參數,不同網站就自已分析了,這個就是登錄后刷新簡歷的URL地址
16 String url = "http://my.51job.com/my/Pop_RefreshResume.php?en=0&ReSumeID=88888888&Read=0&ID=88888888";
17
18 //之后再建立一個Post方法請求,提交刷新簡歷的表單,因為提交的參數較多,所以用Post請求好了
19 PostMethod method = new PostMethod(url);
20
21 //下面的就是將要提交的表單的數據填入PostMethod對象里面,以name , value 對加入!
22 method.addParameter("HPNation", "086");
23 method.addParameter("HPCity","020");
24 method.addParameter("HPNumber","88888888");
25 method.addParameter("FPNation","086");
26 method.addParameter("FPCity","020");
27 method.addParameter("FPNumber","88888888");
28 method.addParameter("FPExtension","000");
29 method.addParameter("MPNation","086");
30 method.addParameter("Mobile","13888888888");
31 method.addParameter("EmailAdd","888@888.com");
32 method.addParameter("ReSumeID","88888888");
33
34 //這里是建立請求時服務器需要用到的Cookie。
35 Cookie cookie = new Cookie(".51job.com","51job","ccry%3D.0%252FZKBaMTmj82%26%7C%26cconfirmkey%3DcpwWgp7FC9FZM%26%7C%26cresumeid%3D88888888%26%7C%26cresumeids88888888d888826%7C8408ilstatus%3D2%26%7C%26cnickname826cenglis8cautologin%3D","/",null,false);
36
37 //將設置好的Cookie加入模擬的客戶端里。當請求發生時,就會將Cookie寫進請求頭里了
38 client.getState().addCookie(cookie);
39 int i=0;
40
41 //開始死循環
42 while(true){
43 try{
44 //這里是要求客戶端發送一個請求。直接將PostMethod請求出去。
45 client.executeMethod(method);
46
47 //下面是獲取返回的結果
48 InputStream in = method.getResponseBodyAsStream();
49 ByteArrayOutputStream baos = new ByteArrayOutputStream();
50 byte[] buff = new byte[1024];
51 int len = -1;
52 while((len=in.read(buff))!=-1){
53 baos.write(buff, 0, len);
54 }
55 String result = new String(baos.toByteArray());
56
57 //釋放資源
58 in.close();
59 baos.close();
60
61 //在51job里,刷新簡歷成功的話,會返回一些JavaScript代碼,里面有個alert()輸出“簡歷已刷新”的信息的,你分析結果,如果有這句話,則成功刷新了。之后就讓線程睡眠1分鐘后循環刷新!
62 if(result.indexOf("簡歷已刷新")!=-1){
63 System.out.println("簡歷已刷新! " + ++i);
64 }else{
65 System.out.println("刷新失敗!");
66 }
67 Thread.sleep(60000);
68 }catch(Exception ex){
69 System.out.println("******** Error! ********");
70 try{
71 //出現錯誤時,再等待20秒后再重新進行刷新。
72 Thread.sleep(20000);
73 }catch(Exception e){
74 System.out.println("******** Thread Error! ********");
75 }
76 }
77 }
78 }
79
80 }
我們再來看看,其實很簡單,我們來說明一下。HttpClient將很多Http協議底層的東西都封裝了,這樣很方便使用,如果自已用Socket寫的話,還有處理很多信息,Http協議的三次握手等等的操作,很是麻煩。現在用HttpClient就一步到位了。但要注意一下,51job里面的簡歷刷新是要先登錄后才可以進行的,而熟悉Web開發的人員都知道,登錄后服務器就會記錄下你的Session,而Session也是基于Cookie的,所以Session ID是以Cookie的方式記錄在客戶機的,這樣每次請求都要將該Cookie發送到服務器驗證,這樣才可以保證Web的狀態。所以,你可以在瀏覽器里先登錄一次。之后找出該網站的Cookie文件,將里面的內容復制出來放上上面代碼的Cookie類里面。你也可以用這個HttpClient寫一個登錄的請求,之后再從ResponseHeader里獲取Cookie。至于表單里的信息,就按自已需要填寫就行了。就是模擬一個瀏覽器,將你的簡歷刷新的表單模擬出來再發送。
在下面,我給出一本電子書給大家下載參考:《Jakarta Commons Cookbook.chm》
[down=attachments/month_0803/020083401424.chm]點擊下載此文件[/down]
posted on 2008-07-29 13:09
姜大叔 閱讀(1736)
評論(2) 編輯 收藏 所屬分類:
Java