論理の流刑地

地獄の底を、爆笑しながら闊歩する

【データ検証】川崎フロンターレは「トータルフットボール」なのか?「キングダムサッカー」なのか?:ボールタッチ数の集中度から考える

fooball計量学シリーズ。ちょっとした思いつきによる分析。

問題提起:川崎フロンターレは「トータルフットボール」か?

2020年のJリーグは、川崎フロンターレの記録的な独走で終わった。
ベストイレブンの11人中の9人が川崎の選手で占められ、あるメディアの記事が「ベストイレブンの発表は、まるで川崎の先発メンバー紹介のような光景と化した」と評した通り、川崎の主力選手は漏れなく称賛の対象となったといってもよいだろう。

川崎の記録的優勝について、それが幾人かの強烈な個に牽引された結果でなく、組織力も含めたスカッド全体の貢献により生み出されたものとして評価されたと捉えられる選出である。

急に話は変わるが、サッカー少年だったときの私がハマっていた漫画の一つに大島司の『シュート』シリーズがある。

シュート! 新たなる伝説 1巻

シュート! 新たなる伝説 1巻

第一部~第三部では主人公田仲俊彦が所属する掛川高校が「トータルフットボール」を掲げ快進撃を繰り広げる。
最終章となる第四部ではもう一人の主人公伊東宏が登場し、彼を絶対的中心とする「キングダムサッカー」を標榜する久里浜学園高校が、掛川高校と鎬を削ることとなる。

「ファントムドリブル」や「アクセルシュート」といった(キャプテン翼の伝統を継ぐ)トンデモ必殺技も魅力的であった*1が、この『トータルフットボール vs キングダムサッカー』という対照的なスタイルどうしのアツいぶつかり合いこそが、当時のサッカー少年(私)の心を鷲掴みにした。
※スポーツ少年は漏れなくこういう「真反対スタイルどうしの真っ向勝負」モノに弱いのではないかと思います.....

今シーズンの川崎フロンターレは、記録にも記憶にも歴史上稀有なほどのインパクトを残すチームであったことは間違いがないだろう。
まさに漫画に出てくるような強烈な個性と力強さをもったチームであったのだ。

それでは、「漫画かよ」と言いたくなるような川崎のサッカーは、掛川高校のような「トータルフットボール」だったのか?それとも久里浜学園のような「キングダムサッカー」だったのか?
それを「タッチ数の平等度」という観点に焦点をあてたデータ分析から明らかにしていくのが、本記事の目的である。

データ検証の指針:タッチ数の不平等度からのアプローチ

さて、大見得を切ったは良いもの「トータルフットボール度合い」を測るための具体的な実証手段はどうすればよいのだろうか。
本稿では指標化のひとつのアプローチとして、所得や財の不平等度を測るために用いられるジニ係数を、各クラブの各試合における出場選手のボールタッチ数に適用することを試みる。
ジニ係数をfootballのデータに適用する、というアイディア自体は選手の出場機会の不平等度を計算した小中先生(@konakalab)をリスペクトしたものである。

ジニ係数Wikipedia)は、社会における所得不平等を測るために主に用いられる指標である。
均等分配線(45度線)といわゆるローレンツ曲線の間の領域の面積の二倍に等しく、完全平等状態のときには0、完全不平等=独占状態のときに1をとるような指標である。

本稿では、J1リーグ18クラブ×34試合の出場選手の(1分あたり)タッチ数から計算されたジニ係数を「タッチ数の集中係数」とする

タッチ数の集中係数が低ければ、より多くの選手が平等にボールに触っているサッカー(=「トータルフットボール」)であり、タッチ数の集中係数が高ければ、より一部の選手にボールタッチの機会が偏在したサッカー(=「キングダムサッカー」)である、という実証アプローチである。

Technical Notes:タッチ数の集中係数の計算方法

※ここは細かい方法論についての説明なので、結果だけ早めに知りたい人は次の「分析結果」まで読み飛ばすこと推奨

ジニ係数の計算方法

ジニ係数の計算ロジック自体は、以前の記事で書いたとおりである。
ronri-rukeichi.hatenablog.com

この記事から計算方法だけを再掲する。

ジニ係数を計算するには、
所得シェアを昇順にならべたベクトルをI 、対応する人数シェアをPとし、G-MatrixをGとすると
Gini=P′GI という計算を行えばよい(′は転置)

(G-Matirxとは、対角成分が0, 非対角成分の右上部分が1, 非対角成分の左下部分が-1の正方行列)

上述の記事にRのコードも掲載してあるが、この処理自体はとても簡単に実装できる。

タッチ数/パス数の取り扱い方について

分析上若干取扱いが難しいのは、途中出場・途中交代する選手のタッチ数を、どうやって90分フル出場している選手のタッチ数との比較の俎上に載せるか、である。
1分あたりの平均タッチ(パス)数 = 当該試合における総タッチ(パス)数/当試合における出場分数、を計算することで、出場時間が違う選手どうしでの比較を行う

タッチ数/パス本数(成功数ではなく出した総数を用いている)に関しては、sofascore.comの各試合のスタッツを、各選手の出場時間についてはJリーグ公式サイトを根拠としている。
また、タッチ数のデータはsofascoreから取得している(取得方法に関しては過去記事を参照のこと)。

分析結果

川崎はJ1で一番タッチ数が「不平等」に分布するクラブである

さて、上期の計算手続きによって各クラブについて34試合分の「タッチ数の集中係数」を算出した。
また、(補足的な指標として)パスを出した数についても同様の計算をおこない、「パス数の集中係数」を算出した。
各クラブごとに、その2020年のシーズン平均を計算してプロットしてみたのが以下の図である。

f:id:ronri_rukeichi:20201225222224p:plain
データ出所: sofascore.com

主たる結果は以下の通り。

  • タッチ数の集中係数のTop3は川崎(0.268)、横浜FC(0.259)、鳥栖(0.258)で、川崎フロンターレは2020年のJ1で最も「ボールタッチが一部の選手に偏っている傾向の高いクラブ」である。Bottom3は柏(0.211)、札幌(0.214)、横浜FM(0.215)である。
  • 当然だがタッチ数の集中係数とパス数の集中係数は高い相関(相関係数=0.878)にある。こちらの上位は横浜FC(0.306)、名古屋(0.301)、川崎(0.299)で、パス数の集中度合いにおいても川崎はTop3入りしている。

したがって、タッチ数やパス数のチーム内分布の偏在性の評価に基づくかぎり、川崎フロンターレはJのなかでも「キングダムサッカー」の極に位置するチームであることがわかる。
タッチ数が一部の選手に偏る傾向がJ1でもっとも高いのが、2020年の圧倒的覇者たる川崎フロンターレというクラブであるのだ。

「不平等」な川崎フロンターレにおけるタッチ数の稼ぎ手は誰か

それでは、(Jクラブのなかでは相対的に)不平等なボールタッチ分布を有する川崎のなかで、具体的に高いボールタッチ率を記録しているのは誰なのだろうか。
川崎における1分あたりのボールタッチ数の上位5傑は以下の通りである。川崎同様にタッチ数/パス数の集中係数がともに高く(それぞれ4位, 2位)、リーグ戦でも上位に位置しているクラブとして名古屋の上位選手も併置している。
ここで名古屋を併置しているのは、単に筆者が名古屋サポであるという理由も少しだけある*2

f:id:ronri_rukeichi:20201230183802p:plain
データ出所:Sofascore

川崎で多くボールタッチを記録しているのは、中村憲剛、守田英正、下田北斗、田中碧というボランチタイプの選手×4と左SBである登里である。
名古屋のほうは上位5傑にCB二枚が入っているのと比べると、ボールタッチの偏在性が高いという意味では同じでも、より重心を高めに設定できていることがわかる。
※図からは省略したが、タッチ数の集中度2-3位の横浜FC/鳥栖に関しても、チーム内タッチ数top5にCBの選手が入ってきている。

Embed from Getty Images
(本筋からは外れますが、中村憲剛選手現役生活お疲れ様でした。クラブの垣根を超えて愛される最高の選手でした)

補足:「タッチ数の集中指数」と他の変数の相関の確認

この記事では、ジニ係数に着想を得た「タッチ数の集中指数」を分析の主軸においているが、そもそもこの変数はfootballのデータの全体においてどういう位置づけを持っているのだろうか?
指標の相対的布置を理解するために、やや単純な方法ではあるが他の主要変数との相関を確認しよう*3
※指標の定義については以下を参照

f:id:ronri_rukeichi:20201230113534p:plain
データ出所: Football LAB, Sofascore

主たる知見は以下の通り。

  • タッチ数/パス数の集中係数はKAGIと(やや弱いが)正の相関がある。つまりボールタッチやパスが一部選手に偏っているチームほど、守備に転じたときには即時奪回できていたり自ゴールに近づけさせないことができている
  • パスの集中係数は、パス成功率やボール支配率と正の相関があり、パスの出し手の固定化傾向は「ボールを支配すること」自体には良い寄与を与えている可能性がある*4
  • ただしパスの集中係数は、AGIと弱い負の相関があることから、パスの出し手が固定化する傾向にあることは攻撃の効率性を低めている可能性がある。

一つめの知見が割と興味深い。
いろんな交絡要因を統制した多変量解析などまでは本稿ではふみこまないが、ひとつの仮説としてありうるのは、「タッチ数が偏在しているクラブ」というのは「困ったところの預けどころ」(=やり直しポイント)が確立しているクラブであり、パスを回しているうちにカウンターに備えた陣形整備ができているのでは?という可能性である*5

これは、「15本のパスを繋ぐことによって、相手の陣形を崩しながら自分たちの陣形を整えることが出来る」というペップ・グアルディオラの"15本のパス"理論(参考記事:ポジショナルプレー総論。現代サッカーを貫くプレー原則を読み解く | VICTORY)にも通ずるものがある(、とこじつけられなくもない)。

川崎の「不平等なボールタッチ」は効果的に機能しているか?

川崎フロンターレが「トータルフットボール」ではなく、「キングダムサッカー」寄りであると判明した(あくまでもタッチ数の平等配分度を基準とすれば、だが)。次に検証すべき課題は、川崎のボールタッチやパスの出し手の偏在性は彼らにとって効率性をあるものなのか、それでもボールの循環経路を限定された結果の不本意な帰結でしかないのか、をデータから明らかにすることにある。

そこで、各クラブごとの全34試合のデータを使って

  • ボールタッチ数の集中係数 × ゴール期待値
  • ボールタッチ数の集中係数 × ボール支配率

相関係数を計算し、プロットしてみよう。
この作業によって、「ボールタッチが一部の選手に集中するほどチャンスが増える(減る)クラブはどこか?」および「ボールタッチが一部の選手に集中するほどボールを持てる(持てなくなる)クラブはどこか?」ということが可視化される。

この二つの相関係数を描画したのが以下の図だ。

f:id:ronri_rukeichi:20201230220731p:plain
データ出所: Football LAB, Sofascore

上図から分かる通り、タッチ数の集中係数とゴール期待値の相関係数が最も高い(0.333)のは川崎である。いっぽうで、川崎にとってタッチ数の集中係数とボール支配率とはほぼ相関はない(-0.032)。
すなわち、川崎フロンターレは、2020年のJ1リーグの18クラブで「ボールを持つ選手が一部に偏るほどゴールの可能性が増える」傾向のもっとも高いクラブであったのだ
つまり、彼ら川崎フロンターレにとって「不平等なボールタッチ」戦略は効率的である、といえる。

※ちなみに我らが名古屋グランパスはJ1でもっとも「ボールタッチが一部の選手に偏るほどゴール期待値が減る」クラブであった。
同時に名古屋はJ1で四番目にボールタッチの集中係数が高い(0.249)クラブでもあるので、不本意な展開を強いられているといえる。

まとめと課題

川崎フロンターレは、2020年のJ1でもっともボールタッチが一部の選手に偏るサッカーを展開したチームであり、その意味で彼らは「トータルフットボール」というよりは「キングダムサッカー」寄りのチームであった。
そしてその戦略は彼らにとっての内部合理性も伴っており、彼らは「一部の選手がボールを持つ」展開であればあるほどチャンスが増えるチームでもあった。

無論、何度も文中で断っている通り、この分析は指標化の方法に大きく依存している。
「トータルフットボール」度や「キングダムサッカー」度を測るための指標は他にも色々考えることはできるだろう。パっと思いつくだけでも、

  • 決定機に絡んだ選手(シュートを打った選手、シュートにつながるパスを出した選手)の分散度合い
  • PAに侵入した選手の多様さ
  • 一回の攻撃に関わる選手の多さの平均値

など、色んな指標が考えられる。
それは各々の分析者がもつ、理論・概念の操作的指標化に関するアイディアや価値観に委ねられているのである*6

なので本論の分析はあくまでも一つの試論的なアプローチでしかないが、それでも「統計的にfootballを楽しむ」営みの一助となればと思う

Enjoy!!

*1:平松のダブルヒールリフトをめっちゃ練習して試合でも試して怒られてた

*2:嘘です。95%くらいはこれです

*3:単純な変数なので、第三の変数との交絡関係は統制できていない。一応ご留意を。

*4:当然だが単なる相関か因果かは識別不可

*5:「陣形整備」とひとことで言っても、川崎はどちらかといえば即時奪回=カウンタープレスへの備えであり、名古屋だと4-4ブロックの形成を意味する、という違いはあるだろうけど

*6:お互いに意見を出しながら、色んな指標や分析がどんどん蓄積されていけば良い