•  スポーツ報知のWebサイト限定コラムがスタートしました。最前線で取材する記者が、紙面では書き切れなかった裏話や、今話題となっている旬な出来事を深く掘り下げてお届けします。皆さんを「ほーっ!」とうならせるようなコラムを目指して日々配信しますので、どうぞお楽しみください。

米国学生の高度な野球分析発表に驚き…オープンデータのMLBと開く“格差”

2018年3月19日16時0分  スポーツ報知
  • 会場入り口に設置された看板

 3月9日から3日間、米アリゾナ州フェニックスで米国野球学会(SABR)が主催する野球データ分析の研究発表大会「SABR Analytics Conference」が開かれた。大会に初めて出席し感じたのは、オープンデータのMLBと原則非公開の日本球界の日米“格差”だった。(メディア局コンテンツ編集部 田中孝憲 @CFgmb)

 データに特化したこの大会は12年から始まり今回で7回目。ホテルの大会場を貸し切り、朝の8時半から夕方までみっちりと、研究者らの発表や元選手や球団アナリストらによるディスカッションが行われた。

 フェニックスは、MLBのキャンプ地の一つ。車を30分~1時間も走らせれば、大谷翔平のエンゼルス、イチローのマリナーズ、ダルビッシュのカブス、前田健太のドジャース、牧田和久のパドレスなど計15チームがスプリング・トレーニングに励んでいる。日本に置き換えると、キャンプ中の沖縄や宮崎で野球の研究発表会が行われているイメージだ。

 さて、3日間のイベントの中で個人的に最も驚いたのは、研究者やアナリストの最新事例発表ではなく、実はこの大会のもう一つの目玉である学生による発表会だった。数学や統計学、コンピュータサイエンスを学んでいるという学生たちは、大会の1週間前に「4選手の最適な打球角度」というテーマを与えられ、5人1組で課題に挑んだ。

 この同一テーマの発表会に、全米から集まった23チーム(同一校から複数の出場あり)が出場し、4会場同時にプレゼンが行われた。学生らは統計ソフト「R」を使うのは当たり前。その上で、仮説を立てて分析し、グラフで可視化し、最適な打球角度を求めた発表を約30分で行った。単なる分析だけでなく、モデル式を提示したグループもあった。

 このプレゼンを支えたのは彼ら自身の分析力の高さもあるが、最も重要なのはMLBの「StatCast」で集められ「Baseball Savant」(https://baseballsavant.mlb.com/statcast_search)で公開されているデータが使われたということだ。日本でも弾道測定器「トラックマン」を使い各球団でデータを集めているが、球団内や分析会社のみで使われ、一般に公開されることはほぼない。

 もちろん米国でも分析方法は各球団の秘中の秘。これは日本も同じだ。

 米国でも非開示のデータもあるが、投手のリリースポイントやボールの通過位置、打球速度や角度、飛距離などの数値は公開されている。商用利用でなければ誰でも自由に使えるのだ。

 オープンデータのメリットとは何か。それは先行研究が豊富に生まれることだ。そうすると、さらに別の人が研究を進歩させることができる。そして「アナリストになりたい」と志す学生たちのための講座が大学で開かれ、身につけた技術を武器に球団入りを狙うこともできる。

 実際今季、MLB関連会社でデータ分析をしていたインターン女子学生が、カージナルスにアナリストして入団している。その学生によれば、アナリストとして球団入りするためには人的つながりだけでなくデータベースを操作する「SQL」や「R」の習得を挙げている。

 学生によるコンペは、データアナリストとしての登竜門でもある。米球界関係者が多く出席しており“就活”に直接つながっていく。2日目のイベント終了後には、参加者全員で懇親会も行われ活発な交流が行われた。

 データは、革新を生む。NPB球団には球界の未来のためにぜひとも、一定の枠内でいいのでデータを開示してもらいたい。もちろんMLBのデータでも研究は可能だが、NPBの選手たちを分析できれば親近感が湧くだろう。日本独自の指標も生まれるかもしれない。情報が閉ざされた現状では、日米の差が広がる一方だ。

 私は今回、社命や取材ではなく、完全プライベートでこの大会を訪問した。米国ではどんなことをやっているのか、この目で見たかったからだ。日本からは他にもメディア関係者や研究者、大学院生や現地で学んでいる大学生らの姿があった。

 また懐かしいところでは、1998年に阪神に在籍した投手のダグラス・クリーク氏(49)の姿もあった。理系高学歴で知られた元左腕は、最新の野球事情を勉強するために大会に出席したという。「カクリ(郭李)サン、ワダ(和田豊)サン…」などと当時のメンバーを口にしてくれた。

 会議では、日本で11球団に導入された「トラックマン」データに注目する声も出た。MLB球団は、NPB選手のデータを参照することができる。もしかすると、NPB球団よりもMLB球団の方が、日本選手の意外な能力を発見するかもしれない。

 なお、大会の模様は公式サイト(https://sabr.org/analytics)で要約や音声が公開されている。

 ◆MLBのデータ活用紹介を学ぶ入口

 「ビッグデータ・ベースボール 20年連続負け越し球団ピッツバーグ・パイレーツを甦らせた数学の魔法」(トラヴィス・ソーチック著、桑田健訳。角川書店)

 ブログ「FANGRAPHS」https://www.fangraphs.com/

 ブログ「Exploring Baseball Data with R」 https://baseballwithr.wordpress.com/

コラム
今日のスポーツ報知(東京版)