一、術語session

  在我的經驗里,session這個詞被濫用的程度大概僅次于transaction,更加有趣的是transaction和session在某些語境下的含義是相同的。

  session,中文經常翻譯為會話,其本來的含義是指有始有終的一系列動作/消息,比如打電話時從拿起電話撥號到掛斷電話這中間的一系列過程 能稱之為一個session。有時候我們能看到這樣的話“在一個瀏覽器會話期間,...”,這里的會話一詞用的就是其本義,是指從一個瀏覽器窗口打開到關 閉這個期間①。最混亂的是“用戶(客戶端)在一次會話期間”這樣一句話,他可能指用戶的一系列動作(一般情況下是同某個具體目的相關的一系列動作,比如從 登錄到選購商品到結賬登出這樣一個網上購物的過程,有時候也被稱為一個transaction),然而有時候也可能僅僅是指一次連接,也有可能是指含義 ①,其中的差別只能靠上下文來推斷②。

  然而當session一詞和網絡協議相關聯時,他又往往隱含了“面向連接”和/或“保持狀態”這樣兩個含義,“面向連接”指的是在通信雙方在通 信之前要先建立一個通信的渠道,比如打電話,直到對方接了電話通信才能開始,和此相對的是寫信,在你把信發出去的時候你并不能確認對方的地址是否正確,通 信渠道不一定能建立,但對發信人來說,通信已開始了。“保持狀態”則是指通信的一方能夠把一系列的消息關聯起來,使得消息之間能互相依賴,比如一個服務員 能夠認出再次光臨的老顧客并且記得上次這個顧客還欠店里一塊錢。這一類的例子有“一個TCP session”或“一個POP3 session”③。

  而到了web服務器蓬勃發展的時代,session在web研發語境下的語義又有了新的擴展,他的含義是指一類用來在客戶端和服務器之間保持狀 態的解決方案④。有時候session也用來指這種解決方案的存儲結構,如“把xxx保存在session里”⑤。由于各種用于web研發的語言在一定程 度上都提供了對這種解決方案的支持,所以在某種特定語言的語境下,session也被用來指代該語言的解決方案,比如經常把Java里提供的 javax.servlet.http.HttpSession簡稱為session⑥。

  鑒于這種混亂已不可改動,本文中session一詞的運用也會根據上下文有不同的含義,請大家注意分辨。

  在本文中,使用中文“瀏覽器會話期間”來表達含義①,使用“session機制”來表達含義④,使用“session”表達含義⑤,使用具體的“HttpSession”來表達含義⑥

  二、HTTP協議和狀態保持

  HTTP協議本身是無狀態的,這和HTTP協議本來的目的是相符的,客戶端只需要簡單的向服務器請求下載某些文件,無論是客戶端還是服務器都沒 有必要紀錄彼此過去的行為,每一次請求之間都是獨立的,好比一個顧客和一個自動售貨機或一個普通的(非會員制)大賣場之間的關系相同。

  然而聰明(或貪心?)的人們非常快發現如果能夠提供一些按需生成的動態信息會使web變得更加有用,就像給有線電視加上點播功能相同。這種需求 一方面迫使HTML逐步添加了表單、腳本、DOM等客戶端行為,另一方面在服務器端則出現了CGI規范以響應客戶端的動態請求,作為傳輸載體的HTTP協 議也添加了文件上載、cookie這些特性。其中cookie的作用就是為了解決HTTP協議無狀態的缺陷所作出的努力。至于后來出現的session機 制則是又一種在客戶端和服務器之間保持狀態的解決方案。

  讓我們用幾個例子來描述一下cookie和session機制之間的差別和聯系。筆者原來常去的一家咖啡店有喝5杯咖啡免費贈一杯咖啡的優惠,然而一次性消費5杯咖啡的機會微乎其微,這時就需要某種方式來紀錄某位顧客的消費數量。想象一下其實也無外乎下面的幾種方案:

  1、該店的店員非常厲害,能記住每位顧客的消費數量,只要顧客一走進咖啡店,店員就知道該怎么對待了。這種做法就是協議本身支持狀態。

  2、發給顧客一張卡片,上面記錄著消費的數量,一般更有個有效期限。每次消費時,如果顧客出示這張卡片,則此次消費就會和以前或以后的消費相聯系起來。這種做法就是在客戶端保持狀態。

  3、發給顧客一張會員卡,除了卡號之外什么信息也不紀錄,每次消費時,如果顧客出示該卡片,則店員在店里的紀錄本上找到這個卡號對應的紀錄添加一些消費信息。這種做法就是在服務器端保持狀態。

  由于HTTP協議是無狀態的,而出于種種考慮也不希望使之成為有狀態的,因此,后面兩種方案就成為現實的選擇。具體來說cookie機制采用的 是在客戶端保持狀態的方案,而session機制采用的是在服務器端保持狀態的方案。同時我們也看到,由于采用服務器端保持狀態的方案在客戶端也需要保存 一個標識,所以session機制可能需要借助于cookie機制來達到保存標識的目的,但實際上他更有其他選擇。

  三、理解cookie機制

  cookie機制的基本原理就如上面的例子相同簡單,不過更有幾個問題需要解決:“會員卡”怎么分發;“會員卡”的內容;及客戶怎么使用“會員卡”。

  正統的cookie分發是通過擴展HTTP協議來實現的,服務器通過在HTTP的響應頭中加上一行特別的指示以提示瀏覽器按照指示生成相應的cookie。然而純粹的客戶端腳本如JavaScript或VBScript也能生成cookie。

  而cookie的使用是由瀏覽器按照一定的原則在后臺自動發送給服務器的。瀏覽器檢查所有存儲的cookie,如果某個cookie所聲明的作 用范圍大于等于將要請求的資源所在的位置,則把該cookie附在請求資源的HTTP請求頭上發送給服務器。意思是麥當勞的會員卡只能在麥當勞的店里出 示,如果某家分店還發行了自己的會員卡,那么進這家店的時候除了要出示麥當勞的會員卡,還要出示這家店的會員卡。

  cookie的內容主要包括:名字,值,過期時間,路徑和域。

  其中域能指定某一個域比如.google.com,相當于總店招牌,比如寶潔公司,也能指定一個域下的具體某臺機器比如www.google.com或froogle.google.com,能用飄柔來做比。

  路徑就是跟在域名后面的URL路徑,比如/或/foo等等,能用某飄柔專柜做比。

  路徑和域合在一起就構成了cookie的作用范圍。

  如果不設置過期時間,則表示這個cookie的生命期為瀏覽器會話期間,只要關閉瀏覽器窗口,cookie就消失了。這種生命期為瀏覽器會話期 的cookie被稱為會話cookie。會話cookie一般不存儲在硬盤上而是保存在內存里,當然這種行為并不是規范規定的。如果設置了過期時間,瀏覽 器就會把cookie保存到硬盤上,關閉后再次打開瀏覽器,這些cookie仍然有效直到超過設定的過期時間。

  存儲在硬盤上的cookie能在不同的瀏覽器進程間共享,比如兩個IE窗口。而對于保存在內存里的cookie,不同的瀏覽器有不同的處理方 式。對于IE,在一個打開的窗口上按Ctrl-N(或從文件菜單)打開的窗口能和原窗口共享,而使用其他方式新開的IE進程則不能共享已打開的窗口的內存 cookie;對于Mozilla Firefox0.8,所有的進程和標簽頁都能共享同樣的cookie。一般來說是用javascript的window.open打開的窗口會和原窗口 共享內存cookie。瀏覽器對于會話cookie的這種只認cookie不認人的處理方式經常給采用session機制的web應用程式研發者造成非常 大的困擾。

  下面就是個goolge設置cookie的響應頭的例子

HTTP/1.1 302 Found
Location: http://www.google.com/intl/zh-CN/
Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:S=KaeaCFPo49RiA_d8; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
Content-Type: text/html

Session詳解

  這是使用HTTPLook這個HTTP Sniffer軟件來俘獲的HTTP通訊紀錄的一部分

Session詳解


瀏覽器在再次訪問goolge的資源時自動向外發送cookie

Session詳解

  使用Firefox能非常容易的觀察現有的cookie的值

  使用HTTPLook配合Firefox能非常容易的理解cookie的工作原理。

Session詳解


IE也能設置在接受cookie前詢問

Session詳解

  這是個詢問接受cookie的對話框。

  四、理解session機制

 session機制是一種服務器端的機制,服務器使用一種類似于散列表的結構(也可能就是使用散列表)來保存信息。

  當程式需要為某個客戶端的請求創建一個session的時候,服務器首先檢查這個客戶端的請求里是否已包含了一個session標識 - 稱為session id,如果已包含一個session id則說明以前已為此客戶端創建過session,服務器就按照session id把這個session檢索出來使用(如果檢索不到,可能會新建一個),如果客戶端請求不包含session id,則為此客戶端創建一個session并且生成一個和此session相關聯的session id,session id的值應該是個既不會重復,又不容易被找到規律以仿造的字符串,這個session id將被在本次響應中返回給客戶端保存。

  保存這個session id的方式能采用cookie,這樣在交互過程中瀏覽器能自動的按照規則把這個標識發揮給服務器。一般這個cookie的名字都是類似于 SEEESIONID,而。比如weblogic對于web應用程式生成的 cookie,JSESSIONID=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764, 他的名字就是JSESSIONID。

  由于cookie能被人為的禁止,必須有其他機制以便在cookie被禁止時仍然能夠把session id傳遞回服務器。經常被使用的一種技術叫做URL重寫,就是把session id直接附加在URL路徑的后面,附加方式也有兩種,一種是作為URL路徑的附加信息,表現形式為http://..... /xxx;jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 另一種是作為查詢字符串附加在URL后面,表現形式為http://..... /xxx?jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764
這兩種方式對于用戶來說是沒有差別的,只是服務器在解析的時候處理的方式不同,采用第一種方式也有利于把session id的信息和正常程式參數區分開來。

  為了在整個交互過程中始終保持狀態,就必須在每個客戶端可能請求的路徑后面都包含這個session id。

  另一種技術叫做表單隱藏字段。就是服務器會自動修改表單,添加一個隱藏字段,以便在表單提交時能夠把session id傳遞回服務器。比如下面的表單

<form name="testform" action="/xxx">
<input type="text">
</form>

  在被傳遞給客戶端之前將被改寫成

<form name="testform" action="/xxx">
<input type="hidden" name="jsessionid" value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764">
<input type="text">
</form>

  這種技術目前已較少應用,筆者接觸過的非常古老的iPlanet6(SunONE應用服務器的前身)就使用了這種技術。實際上這種技術能簡單的用對action應用URL重寫來代替。

  在談論session機制的時候,常常聽到這樣一種誤解“只要關閉瀏覽器,session就消失了”。其實能想象一下會員卡的例子,除非顧客主 動對店家提出銷卡,否則店家絕對不會輕易刪除顧客的資料。對session來說也是相同的,除非程式通知服務器刪除一個session,否則服務器會一直 保留,程式一般都是在用戶做log off的時候發個指令去刪除session。然而瀏覽器從來不會主動在關閉之前通知服務器他將要關閉,因此服務器根本不會有機會知道瀏覽器已關閉,之所以 會有這種錯覺,是部分session機制都使用會話cookie來保存session id,而關閉瀏覽器后這個session id就消失了,再次連接服務器時也就無法找到原來的session。如果服務器設置的cookie被保存到硬盤上,或使用某種手段改寫瀏覽器發出的 HTTP請求頭,把原來的session id發送給服務器,則再次打開瀏覽器仍然能夠找到原來的session。

  恰恰是由于關閉瀏覽器不會導致session被刪除,迫使服務器為seesion設置了一個失效時間,當距離客戶端上一次使用session的時間超過這個失效時間時,服務器就能認為客戶端已停止了活動,才會把session刪除以節省存儲空間。

  五、理解javax.servlet.http.HttpSession

  HttpSession是Java平臺對session機制的實現規范,因為他僅僅是個接口,具體到每個web應用服務器的提供商,除了對規范支持之外,仍然會有一些規范里沒有規定的細微差異。這里我們以BEA的Weblogic Server8.1作為例子來演示。

  首先,Weblogic Server提供了一系列的參數來控制他的HttpSession的實現,包括使用cookie的開關選項,使用URL重寫的開關選項,session持 久化的設置,session失效時間的設置,及針對cookie的各種設置,比如設置cookie的名字、路徑、域,cookie的生存時間等。

  一般情況下,session都是存儲在內存里,當服務器進程被停止或重啟的時候,內存里的session也會被清空,如果設置了session 的持久化特性,服務器就會把session保存到硬盤上,當服務器進程重新啟動或這些信息將能夠被再次使用,Weblogic Server支持的持久性方式包括文件、數據庫、客戶端cookie保存和復制。

  復制嚴格說來不算持久化保存,因為session實際上還是保存在內存里,不過同樣的信息被復制到各個cluster內的服務器進程中,這樣即使某個服務器進程停止工作也仍然能從其他進程中取得session。

  cookie生存時間的設置則會影響瀏覽器生成的cookie是否是個會話cookie。默認是使用會話cookie。有興趣的能用他來試驗我們在第四節里提到的那個誤解。

  cookie的路徑對于web應用程式來說是個非常重要的選項,Weblogic Server對這個選項的默認處理方式使得他和其他服務器有明顯的差別。后面我們會專題討論。

  關于session的設置參考[5] http://e-docs.bea.com/wls/docs70/webapp/weblogic_xml.html#1036869

  六、HttpSession常見問題

  (在本小節中session的含義為⑤和⑥的混合)

  1、session在何時被創建

  一個常見的誤解是以為session在有客戶端訪問時就被創建,然而事實是直到某server端程式調用 HttpServletRequest.getSession(true)這樣的語句時才被創建,注意如果JSP沒有顯示的使用 <%@page session="false"%> 關閉session,則JSP文件在編譯成Servlet時將會自動加上這樣一條語句HttpSession session = HttpServletRequest.getSession(true);這也是JSP中隱含的session對象的來歷。

  由于session會消耗內存資源,因此,如果不打算使用session,應該在所有的JSP中關閉他。

  2、session何時被刪除

  綜合前面的討論,session在下列情況下被刪除a.程式調用HttpSession.invalidate();或b.距離上一次收到客戶端發送的session id時間間隔超過了session的超時設置;或c.服務器進程被停止(非持久session)

  3、怎么做到在瀏覽器關閉時刪除session

  嚴格的講,做不到這一點。能做一點努力的辦法是在所有的客戶端頁面里使用javascript代碼window.oncolose來監視瀏覽器的關閉動作,然后向服務器發送一個請求來刪除session。不過對于瀏覽器崩潰或強行殺死進程這些非常規手段仍然無能為力。

  4、有個HttpSessionListener是怎么回事

  你能創建這樣的listener去監視session的創建和銷毀事件,使得在發生這樣的事件時你能做一些相應的工作。注意是session的 創建和銷毀動作觸發listener,而不是相反。類似的和HttpSession有關的listener更有 HttpSessionBindingListener,HttpSessionActivationListener和 HttpSessionAttributeListener。

  5、存放在session中的對象必須是可序列化的嗎

  不是必需的。需求對象可序列化只是為了session能夠在集群中被復制或能夠持久保存或在必要時server能夠暫時把session交換出 內存。在Weblogic Server的session中放置一個不可序列化的對象在控制臺上會收到一個警告。我所用過的某個iPlanet版本如果session中有不可序列化 的對象,在session銷毀時會有一個Exception,非常奇怪。

  6、怎么才能正確的應付客戶端禁止cookie的可能性

  對所有的URL使用URL重寫,包括超鏈接,form的action,和重定向的URL,具體做法參見[6]
http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770

  7、開兩個瀏覽器窗口訪問應用程式會使用同一個session還是不同的session

  參見第三小節對cookie的討論,對session來說是只認id不認人,因此不同的瀏覽器,不同的窗口打開方式及不同的cookie存儲方式都會對這個問題的答案有影響。

  8、怎么防止用戶打開兩個瀏覽器窗口操作導致的session混亂

  這個問題和防止表單多次提交是類似的,能通過設置客戶端的令牌來解決。就是在服務器每次生成一個不同的id返回給客戶端,同時保存在 session里,客戶端提交表單時必須把這個id也返回服務器,程式首先比較返回的id和保存在session里的值是否一致,如果不一致則說明本次操 作已被提交過了。能參看《J2EE核心模式》關于表示層模式的部分。需要注意的是對于使用javascript window.open打開的窗口,一般不設置這個id,或使用獨立的id,以防主窗口無法操作,建議不要再window.open打開的窗口里做修改操 作,這樣就能不用設置。

  9、為什么在Weblogic Server中改動session的值后要重新調用一次session.setValue
做這個動作主要是為了在集群環境中提示Weblogic Server session中的值發生了改動,需要向其他服務器進程復制新的session值。

  10、為什么session不見了

  排除session正常失效的因素之外,服務器本身的可能性應該是微乎其微的,雖然筆者在iPlanet6SP1加若干補丁的Solaris版 本上倒也遇見過;瀏覽器插件的可能性次之,筆者也遇見過3721插件造成的問題;理論上防火墻或代理服務器在cookie處理上也有可能會出現問題。

  出現這一問題的大部分原因都是程式的錯誤,最常見的就是在一個應用程式中去訪問另外一個應用程式。我們在下一節討論這個問題。

  七、跨應用程式的session共享

常常有這樣的情況,一個大項目被 分割成若干小項目研發,為了能夠互不干擾,需求每個小項目作為一個獨立的web應用程式研發,可是到了最后忽然發現某幾個小項目之間需要共享一些信息,或 想使用session來實現SSO(single sign on),在session中保存login的用戶信息,最自然的需求是應用程式間能夠訪問彼此的session。

  然而按照Servlet規范,session的作用范圍應該僅僅限于當前應用程式下,不同的應用程式之間是不能夠互相訪問對方的session 的。各個應用服務器從實際效果上都遵守了這一規范,不過實現的細節卻可能各有不同,因此解決跨應用程式session共享的方法也各不相同。

  首先來看一下Tomcat是怎么實現web應用程式之間session的隔離的,從Tomcat設置的cookie路徑來看,他對不同的應用程 式設置的cookie路徑是不同的,這樣不同的應用程式所用的session id是不同的,因此即使在同一個瀏覽器窗口里訪問不同的應用程式,發送給服務器的session id也能是不同的。

Session詳解 Session詳解

  根據這個特性,我們能推測Tomcat中session的內存結構大致如下。

Session詳解

  筆者以前用過的iPlanet也采用的是同樣的方式,估計SunONE和iPlanet之間不會有太大的差別。對于這種方式的服務器,解決的思 路非常簡單,實際實行起來也不難。要么讓所有的應用程式共享一個session id,要么讓應用程式能夠獲得其他應用程式的session id。

  iPlanet中有一種非常簡單的方法來實現共享一個session id,那就是把各個應用程式的cookie路徑都設為/(實際上應該是/NASApp,對于應用程式來講他的作用相當于根)。

<session-info>
<path>/NASApp</path>
</session-info>

  需要注意的是,操作共享的session應該遵循一些編程約定,比如在session attribute名字的前面加上應用程式的前綴,使得setAttribute("name", "neo")變成setAttribute("app1.name", "neo"),以防止命名空間沖突,導致互相覆蓋。


在Tomcat中則沒有這么方便的選擇。在Tomcat版本3上,我們還能有一些手段來共享session。對于版本4以上的 Tomcat,目前筆者尚未發現簡單的辦法。只能借助于第三方的力量,比如使用文件、數據庫、JMS或客戶端cookie,URL參數或隱藏字段等手段。

  我們再看一下Weblogic Server是怎么處理session的。

Session詳解

Session詳解

  從截屏畫面上能看到Weblogic Server對所有的應用程式設置的cookie的路徑都是/,這是不是意味著在Weblogic Server中默認的就能共享session了呢?然而一個小實驗即可證實即使不同的應用程式使用的是同一個session,各個應用程式仍然只能訪問自 己所設置的那些屬性。這說明Weblogic Server中的session的內存結構可能如下

Session詳解

  對于這樣一種結構,在session機制本身上來解決session共享的問題應該是不可能的了。除了借助于第三方的力量,比如使用文件、數據 庫、JMS或客戶端cookie,URL參數或隱藏字段等手段,更有一種較為方便的做法,就是把一個應用程式的session放到 ServletContext中,這樣另外一個應用程式就能從ServletContext中取得前一個應用程式的引用。示例代碼如下,

  應用程式A

context.setAttribute("appA", session);

  應用程式B

contextA = context.getContext("/appA");
HttpSession sessionA = (HttpSession)contextA.getAttribute("appA");

  值得注意的是這種用法不可移植,因為根據ServletContext的JavaDoc,應用服務器能處于安全的原因對于context.getContext("/appA");返回空值,以上做法在Weblogic Server 8.1中通過。

  那么Weblogic Server為什么要把所有的應用程式的cookie路徑都設為/呢?原來是為了SSO,凡是共享這個session的應用程式都能共享認證的信息。一個 簡單的實驗就能證實這一點,修改首先登錄的那個應用程式的描述符weblogic.xml,把cookie路徑修改為/appA訪問另外一個應用程式會重 新需求登錄,即使是反過來,先訪問cookie路徑為/的應用程式,再訪問修改過路徑的這個,雖然不再提示登錄,不過登錄的用戶信息也會丟失。注意做這個 實驗時認證方式應該使用FORM,因為瀏覽器和web服務器對basic認證方式有其他的處理方式,第二次請求的認證不是通過session來實現的。具 體請參看[7] secion 14.8 Authorization,你能修改所附的示例程式來做這些試驗。

  八、總結

  session機制本身并不復雜,然而其實現和設置上的靈活性卻使得具體情況復雜多變。這也需求我們不能把僅僅某一次的經驗或某一個瀏覽器,服務器的經驗當作普遍適用的經驗,而是始終需要具體情況具體分析。

  關于作者:

  郎云鵬(dev2dev ID: hippiewolf),軟件工程師,從事J2EE研發
電子郵件:langyunpeng@yahoo.com.cn
地址:大連軟件園路31號科技大廈A座大連博涵咨詢服務有限公司