最近有2個月放空,沒有沉淀一些技術上的內容,反而是調整一個工作狀態,把更多的時間還原到了生活和娛樂中。當然,就目前來看,這種適當的放空收到了奇效,當時考慮業務的前景時非常的不明朗,甚至對數據質量本身的要求極度偏激,導致對團隊的成員有偏見。不過在適當的休息后,這種感覺沒有了,取而代之的是清晰的業務方向和思路。
為什么會這樣,我想這個和我最近癡迷橄欖球NFL有關(怎么這個句式特別像廣告呢)。年初的超級碗全場錄像把橄欖球運動拉入了我的視野,隨著2014-2015NFL新賽季的開始,我也開始關注NFL,美式橄欖球是項非常棒的運動,為什么這么說?運動本身有幾個特點非常吸引人:1)高強度身體對抗——無疑這是一項男人的運動,比賽中最常見的就是身體接觸。2)規則和體系非常合理,橄欖球的進攻防守規則是非常合理的,進攻組司職攻城略地,而防守組負責守衛家園,這個對于原始的戰爭游戲模擬的非常到位。3)策略和戰術要求極高,橄欖球進攻和防守戰術非常多樣化,進攻端可以采用地面沖球和傳球,傳球的話又可以分遠距離、中距離和近距離傳球,傳球的對象,也可以是外接或者跑衛,外接的跑動路線……說不完啊。4)數據擬合準確,當然這是讓我最癡迷NFL的原因,美式橄欖球把數據運用到了極致,對于球員的指標衡量非常的準確形象。
比起拳擊那樣的攻擊與防御,它顯得安全了很多;比起網球、乒乓球這樣的球類運動,就相當的刺激荷爾蒙;比起足球和籃球這樣的流行運動,橄欖球的規則和完整的體系以及無可出其右的策略性,是最吸引人的。當然足球的魅力在于團隊配合可以打得非常精彩,同時個人英雄的出現也可以拯救世界,但是足球里衡量運動員綜合素質的指標體系實在是不夠好。我個人認為像橄欖球和棒球(NFL和MLB)是最好的數據決策運動體系,好笑的是這都是美國人為之瘋狂的運動,而在世界上其他國家卻知之甚少。
結合橄欖球運動和數據體系構建,確實給了數據從業人員很大靈感,玩NFL Fantasy的玩家都知道每周的Pick’Em可以來預測比賽,要知道一周15場比賽完全猜對的人非常非常多,為什么?因為數據刻畫形象且透明,也就是說,我們做預測,不在于算法有多牛逼,而在于指標是否足夠好,模型是否足夠清晰的能刻畫業務本身。這是我一直在做數據挖掘強調的,但是仍然有太多太多的人糾結在算法中不能自拔……NFL有一套自己的rating算法來評估球員的素質,當然這在FM游戲里也有,但是我個人認為NFL的計算更合理,因為橄欖球運動目標性非常強,沒有像足球那樣過多的回傳和組織,橄欖球單箭頭的向前就是最好的約束條件,這為數據可操作性提供了基本保障,我個人是這么認為的。另外NFL聯盟的運作也類似一個數據體系,聯盟約定工資帽,不會出現過分的強弱隊之分,一個隊伍都是明星大牌,工資帽不允許啊,所以NFL的32支球隊,大體水平相當(當然有弱隊和強隊,這里說的大體相當是指在一場NFL比賽預測中,沒有那么明顯的勝負趨勢,優勢微弱=屬性連續、分布完美)。另外不同的戰術相生相克,在場上隨時可以通過暫停來及時調整,這是小步快跑實時運算的等價比喻,足球比賽一開場就至少踢45分鐘,這是典型的批處理,教練有個意圖都是大聲喊,也不見得球員遵循,但是橄欖球就完全不同,每次攻守基本都是戰術的完整體現。說起時間,因為足球籃球是連續比賽,而棒球和橄欖球則是分檔進攻,這其中的區別體現在數據的可分析性以及一次操作的影響性分析上,其實是很明顯的。足球的連續比賽,導致我們在分析一次進攻的成功因素時,需要考慮的變量非常的多,因為時間窗口太大——45分鐘,而橄欖球是階段性的,一次成功的推進,一定是經歷一個開球-傳球或跑球這樣的流程,這明顯是規格化的產物,誰告訴你足球進球一定要是本方守門員大腳開球到前鋒射門呢?所以對于橄欖球這種階段性運動,一次分析可以根據本身的進攻和防守階段被拆成很多的細片,在細片上完成分析,這也符合分析的規律——樣本干凈且完整。這有點像分布式計算,橄欖球天生分布式,而足球只能一把搞到內存里做完全分析……
胡亂扯了一通NFL的東西,美式橄欖球運動是項極度體現智慧的運動,結合數據去玩Fantasy,更覺得其樂無窮。
回頭有空,再詳細舉例NFL的數據故事。沒準也還聊聊手游和數據的事。