主页 > B生活吧 >从数据分析棒球,看懂内行人的棒球门道 >

从数据分析棒球,看懂内行人的棒球门道

2020-06-17

从数据分析棒球,看懂内行人的棒球门道

棒球在台湾非常盛行,台湾也是少数有自己的职业棒球联盟的国家。不过棒球也是很複杂的运动,要看懂棒球不难,但要看的懂门道不简单。想要更深入了解棒球,数据分析会是个好方法。台湾 R 语言社群请来了枢纽棒球的站长简于闵和卓书贤,来谈如何用数据来分析棒球,从中找出更多的乐趣。

棒球统计学又称为赛伯计量学(Sabermetrics),一般人对这个词的印象通常来自于电影《魔球》(Moneyball),甚至误以为电影中由 Brad Pitt 饰演的帅气男主角最看重的上垒率就是棒球计量学的解答。其实对球团来说,重要的是找出有价值却被市场忽略的数据。过去由于上垒率不受重视,所以运动家队才能捡便宜,如今上垒率成为显学,那就要寻找其他的指标。

现代球队会这幺在意棒球统计学,是因为背后牵动着价值上百亿台币的球员市场。2017 年美国职棒大联盟(MLB)的平均薪资超过 400 万美元,约台币 1.2 亿元。平常人连买菜都会精打细算,更何况是买球员这幺贵的东西,当然要睁大眼睛。买菜靠的是看色泽、摸手感和闻气味,那买球员靠的就是数据分析,帮忙球团找出砂砾中的珍珠。拜现代科技进步所赐,有了 Statcast 系统这种追蹤工具,可以测出各种以前无法掌握的数据,包括球被击出的速度、球员跑动的速度、球被接到的机率和球被打出的仰角等等。这些数据的分析可以帮助球团和球迷不受印象所矇蔽,看出一个球员的表现是好是坏。从数据分析棒球,看懂内行人的棒球门道

两位数据棒球专页枢纽棒球的站长,左为卓书贤,右为简于闵。

棒球很适合用来做数据分析,因为棒球是一项回合制的运动,每场比赛都是由一次又一次独立的投打对决累加起来的,每次都能做为实验的样本。棒球也是一种机率的运动,好的打者和不好的打者打出安打的机率其实只差 10%,因此只看几场比赛很难分辨到底谁是比较好的球员。不过 MLB 一支球队每季都要打 162 场比赛,这幺大量的比赛能累积大量的实验样本,减少运气因素在数据分析中所造成的影响。

要学做棒球数据分析,需要有棒球相关的知识、分析能力和处理资料的方法。其中最重要的是棒球相关的知识,才能判断了解数据背后的意义,其次是分析能力,最后才是处理资料的方法,因为多数的数据取得时都已经被处理过了。当三者都具备了,那就可以挑选想分析的棒球数据来着手。好的棒球数据应该要能有效衡量球员的实力,因此儘量使用运气影响较小的数据,以及容易複製表现的数据。举例而言,FIP (Fielding Independent Pitching)因为只评估排除守备以外的投球数据,可靠的程度就比常常会被队友守备拖累的自责失分率(ERA)要高。想要取得棒球的分析数据,可以上 MLB 的官网,或是 Baseball-reference、FanGraphs 和 The Hardball Times 等棒球数据网站,不只有数据还有相关的文章可以参考。从数据分析棒球,看懂内行人的棒球门道

FanGraphs 是棒球数据分析的常用网站。

除了比赛本身之外,以数据分析其他场外事件也非常有趣。例如用数据分析入选名人堂的标準,透过安打数、全垒打、胜投和三振等累积数据,以及最有价值球员(MVP)和赛扬奖等个人荣誉来预测一个球员未来会不会进入名人堂。但毕竟进入名人堂是依靠投票,所以这种分析一定会有误差。有些该入选的球员因为丑闻,或是颠峰期不够强,抑或职业生涯不够久,而没能入选。有些不该入选的球员则因为守备位置特殊,或是对棒球历史或球队有特殊贡献而能够入选。

虽然数据分析能更了解球员的实力,不过这不代表就不用看球了。这样除了会丧失看球本身的乐趣,而且会无法注意到球员在比赛中的改变,分析时就会产生误差而无法解释。只有观察比赛时的细节,才能修正对数据的使用模式。不过数据不可能解释所有的状况,还是存在着部分限制,像是伤病风险和防守能力,都还是数据分析上的难题。如果对数据棒球分析有兴趣,可以关注枢纽棒球的专页,也可以加入数据棒球学会台湾分会。


上一篇: 下一篇:

相关推荐