先說這次事故吧.總結的一句話:每上一個新的產品,都必須要有相應的運營監控模塊.
作為程序員,可以偶爾會埋怨:就算是天才寫的代碼,也會有漏洞,老板怎么能要求自己寫的代碼不犯錯誤.
是的,無論是誰,都會犯錯誤.就算是建造核電站,核發電設施也會出現故障,發生泄露.
對于這些關系國計民生的系統,與錢相關的支付系統,尤其是容忍不得半點錯誤.這就是一對矛盾,一方面
錯誤不可避免,另一方面,錯有不允許發生.作為管理者,在這個過程中應該怎么處置呢?
可以從現實的系統中得到提示,看看核電站的建設,里三層,外三層的防護罩,值班人員24小時的監控,各種監控
設備.從這里我們得到啟發,在支付系統中,一樣需要這樣的防護錯誤:安全驗證不能存在單點故障,也需要里三
層,外三層的防護罩;其次,任何新開發上線的產品,還必須同時開發對應的監控程序,如果沒有監控程序,哪怕產
品已經全部測試通過也不能上線.
網絡支付系統所處的環境比起銀行等金融機構只會更加惡劣,第一,人員沒有銀行的專業;第二:設備沒有銀行的
好;第三:用戶要比銀行的用戶"專業",第四:要比銀行的系統更加開放.在這樣的情況下,系統所面臨的安全挑戰,
不僅來自惡意的用戶,也會有來自沒有經驗的開發人員,不穩定的設備.以及各種用戶千奇百怪的使用方法.如果
想依靠只身的技術實力來一刀切的解決掉這些問題,那無疑是天方夜譚.大家都是在這個過程中不斷的摸索,總結
經驗教訓.
但是,有一條是不變的:機制是永恒的,實現的策略是可以不斷變化的.面對安全的問題,我們的機制就是:加強監控,
把損失減到最小.而策略則會根據不同產品提出不同的監控方法.但如果一個新產品,沒有按照這個機制去做,那么,
總有一天,會為它付出代價.