統計データから分析する「スイーパー・キーパー」~Jリーグを例に~
こんにちは、ディ アハト編集部です。本ニュースレターをお読みくださりありがとうございます。第97回は、以前もディ アハトに登場したアナリストのマーク・P・ランバート氏による、ゴールキーパーの分析記事をお届けします。ぜひお楽しみください!
また、購読登録いただきますとディ アハトの新着記事を毎回メールにてお送りいたします。ご登録は無料で、ディ アハト編集部以外からのメールが届くことはございません。新着記事を見逃さないよう、ぜひ下記ボタンよりご登録いただけると幸いです。
※本記事は、2024年5月にマーク・P・ランバート氏によって作成された以下の記事を翻訳・編集したものとなります。
私がデータを違った角度から解釈するというアプローチを楽しむようになって、数ヵ月が経過した。既に使われている指標ではなく、素材となる生のデータを調べることで自らの指標を作る方法だ。そのようなアプローチに移行した理由の一つは、これまで提供された指標では足りないと感じているからだ。特にゴールキーパーのデータについては、その傾向が強い。
この記事では、イベントデータから自らの指標を作るプロセスを説明する。この指標によって、理想的にはパフォーマンスだけでなく選手の「役割」についての理解も深まることを望んでいる。今回は、この指標について説明していこう。私はこの指標をスイーパーキーパーのパススコア(Goalkeeper Sweeper Pass Score :GSPS)と名付けた。
◇GSPSとは何か?
スイーパーキーパーのパススコアは、スイーパー的なアクションに続く行動の重要性を評価しようという目的で、作り出された。私はゴールキーパーが積極的に飛び出した後、その次のプレーでパスを成功させることで、守備の局面から攻撃に移行するスキルを測りたいと考えた。
この指標は0~100までの数値となり、数字が大きいほどアクションの回数が多く、そのアクションに続くパスの成功率が高い。私のデータベースを使用することで、これらの指標は他のゴールキーパーと比較しながら選手を評価するのに役立つ。
なぜ、GSPSが必要になるのだろうか?
これまで不思議に思っていたが、ゴールキーパーのデータは「シュートストップ」に偏っている。確かにゴールキーパーのメインの仕事ではあるが、ボールを前進する攻撃の起点としてもゴールキーパーは重要なポジションだ。だからこそ、私はゴールキーパーの中でも守備範囲の広い「スイーパーキーパー」がそのプレーで攻撃に貢献していることを示す指標を探し、その特定のアクションをデータから判別しようとした。
これによって、我々はスイーパータイプと呼ばれるキーパーの積極的なプレーがどのようにボールの前進に関連しており、ゴールキーパーがそういうプレーを得意とするかどうかを、データから判別できるようになるわけだ。
データベース
この指標のベースとなっているのは、Optaのデータだ。FBRefも興味深いデータソースだが、今回はOptaのイベントデータを使っている。まず、データ分析の基礎となるのがこのデータだ。
上の画像が、イベントデータのイメージだ。こうしたデータベースを活用することで、必要なアクションを判別することが可能になる。スイーパー的なアクションや、またその後に続くアクションの成功率だ。
Wyscout、FBRef、Statsbomb、Optaのようなデータベースは有益だが、特にイベントデータを活用することで自分の指標を作る上での自由度はアップする。だからこそ、私はOptaのデータを使用している。
データの説明
これで、データベースは確定した。次のステップとなるのは、データを調べながら使いたい要素を抽出していくことだ。この分析のために、確認したデータが以下となる。
-
スイーパーアクション:データにおいて、ゴールキーパーに絞ったスイーパーアクションを抜粋したもの
-
パス位置データ:スイーパーアクションがパスである場合、その位置データ
-
パス:精度とパス本数、パスの成功率
◇GSPSのメソッド
では、どのようにデータをスコアに換算していくのだろうか?それには4つのステップがあり、求めているデータを反映させることが重要である。
最初のステップは、イベントデータから指標を作るために必要なデータをフィルタリングすることだ。まず、スイーパーアクションのデータに漏れがないことを確認しなければならない。そしてアクション後のアクションやパスについても、データをフィルタリングする。それによって、先ずは必要なデータが出揃うはずだ。
2番目のステップは、指標において「同じ価値」になるようにスコアの割り当てを行うことだ。実際は複数の要素が、それぞれ別の数的な価値を持っている。0-1や0-100のように指標の幅を決める時、すべての要素が同じ種類の変数である必要がある。そのために、私は数学的偏差を使用することに決めた。パーセンタイル順位を使うパターンもあるが、外れ値による影響を避けるためには数学的偏差が優れている。この内容は過去に、下の記事でも説明した。
私たちは、平均を求めている。平均は0であり、負の偏差は平均未満の選手を示し、正の偏差は平均以上の選手を示す。後者は、質の高い選手を発見することに役立つ。すべての指標に対してZ-スコア(正規分布していることを前提に、ある集団の中の相対的な位置を表す)を計算することで、私たちはGSPSのスコアを計算するための堅実な基盤を手にする。
そして3番目のステップは、GSPSを計算することだ。次のベン・グリフィス氏が執筆した記事を読めば、もう少し細かく学ぶことが可能だ氏
スコアを作成する際に、調和平均、算術平均、幾何平均について調べなければならない。それらは何だろうか?
調和平均、算術平均、幾何平均の違い
ベン氏の説明によれば、調和平均と算術平均こそ、私が使用しているメトリクスの平均値を計算するのに適切な方法だ。
したがって、私には2つの異なるオプションが与えられる。フィルターを使用して算術平均を選択するか、または平均値を見つけるために計算を変更する必要がありる。この場合、私はフィルターを使用して算術平均を作成することを選択した。様々なメトリクス(スイーパーアクション、パス、成功したパス)をZ-スコアに変換し、その後で平均値を計算する方法だ。
算術平均を使用すると、私が求める結果を得られる。すなわち、スイーパーアクションから前進する能力を示す、0から100までのスコアだ。
下記の表では、Jリーグにおいてスイーパーアクションで最も成功したゴールキーパーのスコアが示されている。スコアは、実際にアクションに参加した選手を0から100までの得点で表現している。スコアに含まれるすべての指標で、最も高得点を獲得したプレーヤーのスコアが100になっている。
上記のプレーヤーは、縦パスから最も成功を収めており、したがってゴールキーパーとしてのスイーパー的なアクションからチームを前進させている。これは彼らの鋭い読みと、洞察力を示すデータになるだろう。
<訳者補足>
前述のGSPSにおいて、スコア100を記録したJリーグの守護神たちの2024シーズンのデータとプロフィールを、簡単に抜粋しています。
マテウス(東京ヴェルディ)
白坂 楓馬(横浜・F・マリノス)
※出場試合数が少なく、控えGKということもありデータのn数が少ない影響もありそうです。積極的に飛び出すタイプだとは思うのですが、ACL決勝では痛恨のミスもありました。
松本 健太(柏レイソル)
谷 晃生(町田ゼルビア)
※積極的な飛び出しでエリア外で相手のボールを奪うようなプレー動画があったため、併せて紹介しています。
上福元 直人(川崎フロンターレ)
※併用されながら使われており、データのn数が少ない影響もありそうです。京都時代の動画ですが、難しいところで飛び出しながら相手のシュートコースを狭めるプレーがあり紹介します。
実験的な取り組みとしてGKの新指標が作られ、偶然にもJ1リーグの分析を行っていたため本記事を翻訳させていただいた。フットボールのデータ分析は急速に進んでおり、恐ろしいことに「普段は観戦していないJリーグ」をヨーロッパのアナリストがデータ分析することも可能となっている。
当然ながら実際に観戦しなければ判らないことも少なくはないのだが、それでもデータが簡単に入手可能な時代になったことで、とても興味深い世界の扉が開かれたのではないだろうか。
文:マーク・P・ランバート(@lambertsmarc)
著者プロフィール:ヨーロッパでアナリスト・コンサルタントとして活躍しており、セットプレー分析や統計データの活用を得意としている。自らのブログ「Outswinger FC」でも積極的に情報発信を行っている。
訳:結城康平(@yuukikouhei)
マーク・P・ランバート氏の過去記事はこちら↓
ディ アハト第97回「統計データから分析する「スイーパー・キーパー」~Jリーグを例に~」、お楽しみいただけましたか?
記事の感想については、TwitterなどのSNSでシェアいただけると励みになります。今後ともコンテンツの充実に努めますので、何卒よろしくお願い申し上げます。
また、ディ アハト公式Twitterでは、新着記事だけでなく次回予告や関連情報についてもつぶやいております。ぜひフォローくださいませ!
ディ アハト編集部
すでに登録済みの方は こちら