プレーごとの貢献度を定量化する~Expected Threat~
こんにちは、ディ アハト編集部です。本ニュースレターをお読みくださりありがとうございます。第33回は、プレーの貢献度を測る指標 “Expected Threat” についての翻訳記事をお届けします。ぜひお楽しみください!
また、購読登録いただきますとディ アハトの新着記事を毎回メールにてお送りいたします。ご登録は無料で、ディ アハト編集部以外からのメールが届くことはございません。新着記事や限定コンテンツを見逃さないよう、ぜひ下記ボタンよりご登録いただけると幸いです。
※本記事は2019年2月にシン氏によって作成された以下の記事をもとに翻訳・編集したものとなります。
Packed with interactive visualizations, this post introduces a new way of analyzing buildup play. Very excited to finally share this – hope you like it!
◇ゴールに大きく貢献したのは誰?
きっかけとなったのは、アーセナルがバーンリー相手に3-1で勝利を収めた2018年12月の試合だった。
この試合の先制点は、アーセナルが右サイドの華麗なパス回しからメスト・エジルがバーンリーの守備陣を切り裂くスルーパスをコラシナツへと出し、彼のタイミングぴったりの折り返しをオーバメヤンがきっちり決めた形だった。
記録としてはこのゴールをアシストしたのはコラシナツになる。だが、映像を見ればわかる通り、このゴールにおけるエジルの貢献は無視されるべきではない。では彼の得点への寄与の度合いをどのように測るべきか?
このゴールを生み出す過程における、エジルとコラシナツの貢献を両方とも測定することができ、かつ適切な分配の割合を示せるような指標は何かないだろうか?
当然ながらアシスト数だけでは、この場面におけるエジルの貢献度は測れない。エジルのアシスト数は0という記録になるからだ。では、xGチェーンやxGビルドアップといったxG(ゴール期待値)を利用した指標はどうだろうか?これらを使えば、シュートに直接的に関わっていない選手の貢献も考慮される。しかし、これらの指標では「得点に携わった選手全員に平等にxG(今回のケースではシュート地点のxGである0.13)が分割された値」が割り当てられる。つまり、この得点が生まれるまでのパス回しに参加したメイトランド=ナイルズやラカゼット、コラシナツ、エジルに均等にxGが与えられることになるので、真の貢献度合いを反映した指標とは言い難い。
また、上記以外の方法にも、ビルドアップの各アクションにおけるxGを算出しその差を貢献度の指標として用いることも考えられる。だが、チャンスを導くパスが必ずしもxGの値の高い場所=「シュートを打つのに良い場所」に出るとは限らない。例えば今回のケースでは、コラシナツがエジルからのパスを受けた位置はゴールに対して角度があり、そこまでシュートに適した場所ではない。よってこの2人のアクションのxGの差を求めても、その値はそこまで大きな貢献度を表すものにはならないだろう。エジルのパスは直接ゴールに貢献するというよりも、むしろ「チャンスメイクに効果的なポジションまでコラシナツを動かした」という点に価値がある。xGの差は、そういった点を考慮した指標として用いることは難しそうだ。
◇より良い指標を求めて
前述のような既存の指標では測れない部分を埋めるために、以下の条件を満たす指標が必要だ。
-
ビルドアップにおける「パス」や「ドリブル」といった、それぞれのアクションを個別に評価できるもの
-
イベントデータ(ボールに関連する各アクションのデータ)に基づくもの(トラッキングデータは入手が難しいため)
-
対象となるプレーの前後の結果や展開に関係なく評価できるもの(例えばエジルのパスが最終的に得点に繋がらなかったとしても、そのパスの価値は変わらないはずだ)
-
ボールをxGの高いエリアだけではなく「危険なエリア」、すなわち「xGの高いエリアにボールを供給しやすいエリア」に運ぶことも評価できるもの
もちろん、これらすべてを満たす絶対的に正しいモデルは存在しない。常にモデルの複雑さと正確さはトレードオフの関係にある。だが今回の記事では、ビルドアップの分析に用いることが可能な1つのアプローチを提案してみたいと思う。
◇前提条件の整理
まず、上記の条件をおさらいしつつ、貢献度を測る指標には何が必要なのか考えてみよう。
条件1:それぞれのアクションを個別に評価できるようにするには、一連のビルドアップの流れにおいて、各アクションの貢献度合いに応じたスコアを割り当てる必要がある。
そして、それらは条件2:イベントデータに基づいており、なおかつ条件3:測定対象となるアクションの結果からは独立しているものでなければならない。つまりアクションAからBによってボールを移動させた場合、このアクションのスコアは単にBからAの値を引いたものになる。このような、各アクションの範囲外の値に関係なくその価値を算出できる形にすべきだろう。
さらに、条件4:xGから独立した形でボールの位置の危険度を考慮した指標が必要となる。xGは基本的にその位置からシュート打つことを前提としており、1種類のアクション(シュート)しか考慮しない指標だ。よって、シュートが入りにくい位置であれば値は低く出る。しかし、直接シュートは狙いづらい(=xGの値が低い)がチャンスに繋がりやすいエリアというのは多く存在する。そのため、シュートだけでなく複数のアクションを考慮した指標でなくてはならない。
さて、ここまでは条件を整理し、指標を測るためのモデルの仮定を明確にした。そして見えてきた課題は、「ピッチ上のすべての位置に、脅威となり得る度合いを示す値(それがどれだけ攻撃において有利な位置であるか)を割り振れるか?」ということになる。
実際の所、ピッチ上の各地点に何らかの値を割り振るという手法はそこまで斬新なものではないし、サッカー界以外の場面でも(物理学など)よく活用されている。また、サッカーでこの手法を用いる場合は、点Aから点Bまでボールが移動した際のボールの質(浮き球のパスか、あるいはどのような経路でドリブル突破したかなど)は考慮できない。そのため、実際の現象と比べると若干の誤差は生まれてしまう。とはいえ、トラッキングデータの入手の困難さとモデルの複雑化を避けるため、この問題に関しては妥協することとする。
◇ボール保持時の選択肢
「ビルドアップ」をよりシンプルな言葉で言い表してみよう。ピッチ上のどこかの地点でチームがボールを保持しているとき、3つの選択肢がある。①違う地点にパスをする、②違う地点までドリブルでボールを運ぶ、あるいは③シュートを打つ(そしてこれは一定の確率で得点へとつながる)だ。
そしてビルドアップにおいてはこれら3つのアクションが、最終的に得点を挙げるかボールを失うまで続くこととなる。
ビルドアップをこのように定義すると、「すべてのエリアからのシュートの割合」および「シュートではないボールを動かすプレーの割合」と「その場合にボールがどの地点にどれくらいの割合で到達するか」、といったデータを算出することができる。
元記事より抜粋(元記事では、ピッチ上の全エリアのデータを確認することができる)
上の画像がその例だ。2017/18シーズンのプレミアリーグでは平均して、オレンジの四角形で示されたエリアから30%の確率でシュートが打たれ、2%がそのままゴールになった。その一方、70%の場合はボールがこのエリアから動かされた。緑に着色された部分とその濃淡は、左右の横パス、そして左後ろへのパスの割合が高いことを示している。
元記事より抜粋(元記事では、ピッチ上の全エリアのデータを確認することができる)
一方で、センターサークル付近からシュートを打つ選手はわずか1%であり、ほとんどの場合、選手はパスやドリブルでボールを動かすアクションを選択していることがわかる。
すなわちこの図のある座標(x, y)において、以下の4つのデータが含まれている。
-
m(x, y):ボールを動かす確率(パス・ドリブル両方を含む、上の図の右側に表示される)
-
s(x, y):シュートの確率(上の図の右側に表示される)
-
T(x, y):ボールを動かす場合のボールの到達地点ごとの確率(上の図の緑色の濃淡で示される)
-
g(x, y):得点確率(単純化されたゴール期待値、上の図の右側に表示される)
なお、定義上ボール保持者の選択肢はシュートかボールの移動の2択のみとしているためm(x, y)+s(x, y)=100%となる。また、より単純化するためこのモデルでは失敗に終わったパスやドリブルは考慮せず、成功したアクションのみを集計していることを了承されたい。
◇ “Expected Threat” の算出
今、あなたがピッチ上のある地点A(xa, ya)に立ってボールを保持していると仮定しよう。あなたには2つの選択肢、「シュート」と「ボールを移動させる」がある。あなたはs(xa, ya)の確率でシュートを選択する。ここからシュートを打てば、地点Aにおける得点確率g(xa, ya)だけの得点可能性が期待される。一方m(xa, ya)の確率で、ドリブルやパスを用いてボールを動かすだろう。どこへボールを動かすかは確率T(xa, ya)に依存しており、動かしたその先であなたはまた「シュート」と「ボールを移動させる」の2択を選ぶことになるというわけだ。
では地点A(xa, ya)において、あなたは相手チームにどれだけ脅威となり得るのだろうか?あなたがその地点にいることでチームが得られる価値はどの程度だろうか?この座標で期待できる価値、相手に与え得る脅威の度合いを示す指標 “Expected Threat”(xT)を求めていこう。
まず過去の統計をもとに、各ゾーン(今回は便宜上ピッチを16マス×12マスの計192分割とした)においてボールが動くエリアとその確率を比例的に割り振った。同様に、すべての分割されたマスに対して、選手がシュートを打つ確率とその場合の得点確率も算出できる。
そして2つの選択肢の確率とそれぞれの結果の期待値を掛け合わせ、それらすべての値を合計する。すると、そのゾーンからボールが移動を繰り返した先で得点・チャンスに繋がる可能性まで考慮できる指標ができあがる。つまりこの指標は単にゴールに繋がるか否かだけでなく、ボールの移動先のゾーンのチャンスの可能性まで想定して算出しており、「期待される脅威度合い=Expected Threat」を測るものなのだ。
xTの算出方法(編集部作成)
(訳注:図のように実際にA地点のxTを求めるにあたっては、移動先になり得る地点のxTの値が必要となる。これを筆者はまずxT(a)= 0と置き、収束まで計算プロセスの反復を行うことで解決している。なお1回目の反復計算では単なるxGの計算となり、2回目の反復計算では「ボールの移動」の選択肢の期待値が0ではなくなり「ボールの移動→シュート」の2アクションの可能性を考慮したモデルとなる。つまりn回反復を行えば、そのゾーンからn回以内のアクション後の得点可能性を算出できることになる。この反復は、データ次第だが経験上4~5回で十分だそうだ)
◇xTの実際の活用法
さて、この記事の初めに立ち返ってみると当初の目的は、ビルドアップ中のプレーの価値の測定、具体的にはピッチ上のいかなるアクションでも得点やチャンスへの貢献度合いを定量化できる指標をデザインすることだった。
そしてxTを用いればこれは簡単だ。もし選手がxT= 0.20の位置からxT= 0.25の位置にボールを動かすことに成功したとすれば、xTの差は0.25 - 0.20 = 0.05となる。つまり、そのアクションでxT= 0.05の脅威度期待値を創出したということだ。これはつまり、チームの行った5アクション以内(ここでは計算の反復回数が5回であるため)においての「得点可能性を0.05 = 5%増加させた」ということを意味する。これにもとづき、一番最初に取り上げたエジルのコラシナツへのパスを考えてみよう。
①エジルのパスはxT= 0.077のエリアから0.158へのエリアへとボールを動かしている。
その値の差: 0.158 - 0.077 = 0.081(8.1%チームの得点可能性を増加させた)
②コラシナツのパスはxT= 0.158のエリアからxT= 0.171へのエリアへとボールを動かした。
その値の差: 0.171 - 0.158 = 0.013(1.3%チームの得点可能性を増加させた)
この2人のパス両方を合わせて考えると、トータルでxTは0.094上昇しているが、そのうちの86%にエジルが貢献しており、コラシナツの貢献は残りの14%ということになる。
◇2017/18シーズンのxTクリエイターランキング
(訳注:この記事は2018年12月に公開されたものであるため、17/18シーズンのプレミアリーグのそれまでの期間中のランキングとなっている)
この指標が本当に機能しているかを確かめているか確認するという意味も込めて、2017/18シーズンでxTを上昇させている選手のランキングを見てみよう。以下がプレミアリーグの上位10人だ。
1. ケビン・デブライネ(マンチェスター・シティ):28.03
2. セスク・ファブレガス(チェルシー):20.54
3. ホセ・ホレバス(ワトフォード):18.49
4. アレクシス・サンチェス(アーセナル / マンチェスター・シティ):17.43
5. リヤド・マフレズ(レスター・シティ):16.76
6. グラニト・ジャカ(アーセナル):15.83
7. クリスティアン・エリクセン(トッテナム):15.78
8. セサル・アスピリクエタ(チェルシー):15.19
9. ジェルダン・シャキリ(ストーク・シティ):15.08
10. アシュリー・ヤング(マンチェスター・ユナイテッド):14.99
ホレバスが3位にランクインしているのは若干驚きかもしれない。彼は左サイドバックながら、ワトフォードの最も安定したチャンスクリエイターとしての地位を確立していた。
有料記事ではあるが、The Athleticにて2020-21シーズンのxT分析も確認することが可能だ。アストン・ヴィラ時代のジャック・グリーリッシュは優れた数値を示しており、彼は今季からマンチェスター・シティに加入した。
◇まとめ
今回のxTのフレームワークは、単純にビルドアップにおける各プレーの貢献度合いを測るだけにとどまらず、様々な活用方法が考えられる。例えば、各チームの差異を分析してみるのも面白いだろう。チームごとにピッチ上のどのエリアを優先的に活用しているか、などといった傾向の把握にも役立ちそうだ。
2017/18シーズンのプレミアリーグチームのデータ。全チームのデータが気になる方は元記事を参照されたい
上の図を見るとトッテナムとシティのxT分布図は形状的には似ているが、シティの方がゴール前でボールを持った時に得点につなげる力がより高い、ということが見て取れる。これらのデータを見れば、対戦相手がどのエリアからチャンスを作ろうとしているのかがわかるため、分析においても役立つはずだ。
もちろん、これらをさらに発展させて分析に活かすこともできる。特定のゾーンから特定のゾーンへとボールが動くパターンが多い場合、それが相手の得意とする攻撃の形だということがわかる。また、一連のプレーにおいてどの選手が起点となっているのか?といった評価に対しても有効だろう。
これらはxTの分析における活用案の一部にすぎない。xTはチーム単位でその変動を見ることもできるし、選手個人レベルでのスカウティングに用いることもできる。まだまだこの指標の特徴を生かした、様々な活用法が考えられそうだ。
(編集部補足:xTと似たコンセプトの指標は、シン氏の記事の公開以前から既に欧州トップクラブで用いられている。例えばリバプールでは “Goals probability added” や “OBSO”〈Off-ball scoring opportunity model〉と呼ばれる指標が用いられていた。
これはxTとは少し異なり、トラッキングデータをベースにしている。しかし、「ゴール期待値の高い状況を創出しやすいスペースを検出する」という目的においては共通している点が興味深いところだ。OBSOでは相手の密度やボールが浮いているかなども、データの数値化に影響を与える要因として扱われている)
文:カルン・シン(@karun1710)
シン氏のブログはこちら↓
訳:山中拓磨(@gern3137)
ディ アハト第33回「プレーごとの貢献度を定量化する~Expected Threat~」、お楽しみいただけましたか?
記事の感想については、TwitterなどのSNSでシェアいただけると励みになります。今後ともコンテンツの充実に努めますので、何卒よろしくお願い申し上げます。
また、ディ アハト公式Twitterでは、新着記事だけでなく次回予告や関連情報についてもつぶやいております。ぜひフォローくださいませ!
ディ アハト編集部
すでに登録済みの方は こちら