6.2.09

防守數據與 MOSCITO

今天去看了一下台大盃。去看的原因包括四強有一堆熟人,副盃也有不少認識的,還有反正我在那附近等等。最後 BTU 包辦前三,算是個好結果吧。不過那不是我的重點。重點是,在決賽轉播裡,協助講評的 Walddk2(Roland Wald)對 by(滷教授 aka terrorist aka 楊柏因-*)提出的一個問題。

*關於為什麼我用這種順序寫,呃…很神奇的是,用滷教授 google,結果第一個就是前面那個連結… And this really impressed me.



事情是這樣,南家拿 4-5-2-2 大概 12 HCP 開了 1NT,讓 Wald 很不解。滷教授(該制度 — Terrorist's MOSCITO — 設計者)解釋這個叫品代表兩門高花 4-4 以上,與其他牌型無關。Wald 接著問了:「那用這個制度,平均牌要怎麼叫?」滷教授的回答是:

你不用叫出平均牌,只需要叫出高花張數。





我在回家的路上,突然發現這段對話很有意思。一般制度在規劃開叫品時,常都是先定義「平均牌」,接著定義平均牌的範圍,為各範圍選擇叫品(「無王範圍」),接著再規劃不平均牌叫品。另一方面 Terrorist's MOSCITO — Major-Oriented Strong Club with Intrepid Two Openers,滷教授為其下的副標題 — 則完全捨棄了這個概念,完全以高花長度作為開叫品選擇依據。如同黃光輝今天介紹這個制度時用的說法 — a system of another age — 這個設計完全不同於其他系統,甚至超前許多。

前陣子 Anakin 寫了一篇文章,《不要盡信防守數據》。防守數據的問題在哪裡?Anakin 在最後面提到一個我個人認為很重要的部份,就是原始數據不同。與進攻數據不同,防守數據的紀錄有很多主觀部份。來,就是你跟你,說說看這一球算不算「強勁平飛球」 — 呃,我看還是先搞定「平飛球」的部份好了,強勁就先放一邊。至於球場校正,不要鬧了,連打擊用的球場係數(park factor)都還每一家算出來都不一樣咧,這東西我實在是不太敢碰。

我想的是,防守數據的原始資料一個困難性,可能就來自於我們一直嘗試用和進攻數據一樣的方式來處理。就如同我們用平均牌與否來分類叫品,然後以大牌點為平均牌分級,再想辦法把其他的牌歸類進去。然後我們就發現不平均牌有很多特性是大牌點沒辦法處理的,所以就發明了短門計點、長門計點、資產法、失張計算法等等一卡車輔助,但是就是沒辦法很準確地給予準則。當然這有部份是因為人的記憶力有限,只能處理一般性的牌值估計法,但即使使用複雜牌值估計模組的電腦,還是比不上頂尖高手用經驗「看」出來的牌值。

另一方面,MOSCITO 用的方法就很大部份消除了這個問題。接力點(RP)與高花張數取向的設計讓它的叫品很大部份背離傳統叫法,但是對於(尤其高階)的牌值判斷,因為同伴可以在極規範地詢問牌型和大牌後「擺」出你的牌,所以可以不需要兩方不斷主觀「判斷」自己的牌力。

對應到棒球的主題上,或許如果我們真的希望消除防守能力判斷的主觀性,那我們就必須用一種全新的觀點來看待棒球。安打和推進之類的進攻導向數據近來已經被很大部份去除,而更進一步,我們是不是可以重新定義「平飛」、「強勁」之類詞在棒球上的數據意義,甚至像進攻數據一般找到類似 PERA、甚至 DPIS 這種,可以用更底層能力(安打、或被全壘打率、甚至滾飛比)表示表層現象(失分)的關係式?我想這會是防守數據繼續發展下去,可能會前往的方向。

然而,橋牌和棒球有個很明顯的不同 — 如果橋牌是數學,那麼棒球就是自然科學。橋牌作為 52 張牌與有限叫品的集合,即使叫品與牌張排列組合極多,在本質上,橋牌分析仍然是固定的,只要去作,絕對可以找到內部模式的東西。另一方面,棒球受到太多外在環境,以及從事者的影響,所以沒有辦法像橋牌一般永遠存在「白盒」型的過程。棒球數據永遠是與小樣本的奮鬥,而如果我們希望有這種底層關係的突破,除了運氣,就只能希望有天才(們)能想出更新的關係,提出更新的假說,並成功得到大家的認同。當然,物理學出了牛頓,而他的理論終究也被證明有誤,但至少我們能獲得一個一致的準則。

而在那之前,我們與其盡信防守數據,甚至進攻數據 — 我們都承認,即使進攻數據,在衡量低階與不平衡競賽環境時,仍然大多不可靠 — 不如更相信自己的眼睛。人類是奇妙的,就像牌值判斷,電腦花了很多時間做出的分析,經常比不上強者球探或教練的一句話,更能解釋球員的長處,或者問題。但球探教練的問題,仍然和牌值判斷一樣,是主觀。我們沒有辦法完整解釋自己的「感覺」,所以這種判斷難以傳授,需要靠經驗;而因為難以傳達,所以有太多的魚目混珠之徒,讓我們即使能夠學習,也根本難以判斷到底該向哪些人學習。

那麼我們該怎麼做?開發出據邏輯性、能解釋我們看到現象的語言,仍然是唯一解答。但這就等於找到我們之前談的「底層關係」了。所以我們需要數據。數據並非用以解釋棒球的一切,而是我們為了解釋自己看到的現象,所以進行的嘗試。所以即使這條路非常困難,我們還是得走下去。即使例如小樣本之類的種種問題可能永遠無法解決,我們還是得盡力在這些限制之下,想辦法「猜」出事情的解釋。即使每個人的解釋都不同而爭論不休,我們還是要繼續爭論下去,直到我們能得到我們能夠接受的一致解答。

沒有留言:

張貼留言