論理の流刑地

地獄の底を、爆笑しながら闊歩する

小中英嗣(2024)『科学で迫る勝敗の法則:スポーツデータの最前線』

名古屋サポーター、そしてJリーグファンにはおなじみの小中英嗣先生の新著。
発売日は年明けだが、都内大型書店には既に並んでるとのことだったので早めに入手した*1ら面白くて一気に読了。

すぐに内容を忘れる鳥頭なので、自分用の雑多なメモ

全体に関して

  • これはこの本が書かれた意図とは違うかもしれないのだけど、個人的にこの本の素晴らしいところは、「色々なスポーツを観てみたくなること」にあるのではないか、と思った。
    • 「あとがき」では著者自身の「飽きっぽい」性格が、雑食的に複数のスポーツを観るという趣味を通じて、この本の執筆につながったと回顧されている。が、私自身はサッカー以外ほとんど興味さえ湧き立たない(オリンピックやその競技の世界大会がメディアに多く取り上げられる時期でさえ)ため、「飽き」がくる段階にまで行かない人間であるので、そもそも色々と観ようとする好奇心があること自体がかなりすごいことに思える。別にこれは阿っているわけではなく、各スポーツの観戦に関して「つまみ食い」の段階にまで行かないような人間は私以外にもたくさんいるはずで、この本はそういった読者にも競技横断的な「データから楽しむ」視点をさまざまな切り口から提供することで、初観戦の第一歩を後押しするような深みがあるように思える。
    • 「はじめに」ではスポーツを「身体活動や物体の位置を数値に置き換える営み」と表現している。この本では、その数値への置き換え方のスポーツ間の違い、そしてその「数値への置き換え」をめぐって競技者/ルールの作成者/分析者がどのように振る舞ってきたのかを各スポーツの歴史とともに振り返ることで、観戦欲やさらなる知識欲を惹起することができている。
  • 文章がうまいのは当たり前(いやそんなこと私が評するのもおこがましいですが)だけど、構成がとても読みやすく飽きさせないので感心させられる
    • たとえば第三章では冒頭に1962年のバスケットボール選手の1試合100点の大記録を提示したあとに、「私はこの記述に含まれる重大の事実に気づくまでにかなりの時間を必要としました」と思わずページをめくってしまうような章のはじめ方をしていて、すげー!っとなった
  • 一般向けの入門書として書かれていることもあって、(第四章の後半を除いて)ほとんど数学の知識がなくても面白く読めるのがやさしい。
    • 第四章の各レーティング算出手法のところだけいきなり行列式が出てきてびっくりした(統計ちょっとかじってる人なら大丈夫ですが)が、これは入門書としてさらに勉強してもらうことを考えたときに、数式をプログラミングに落としていくための配慮としての意味合いが強いと思う(たぶん)。
      • 「イロ・レーティングは計算の手順がシンプルで、プログラミングの練習としてちょうどいい難しさです」(p.151)とあるように、実際レーティングの各手法はとっつきやすさから考えたときに「さらなる一歩」として、適切だと個人的にも思う。
      • そういやあんまりプログラミングに縁がない文系学生だった私が独学でプログラミングを始めたのも、教養課程で興味本位でとった数理工学の授業で習ったBradley-Terry Modelを試そうと試合データをScrapingしようと思ったのがきっかけだったので、確かに導入としておあつらえ向きな題材だと感じる
  • 結論:「はじめに」が「名古屋より、名古屋グランパスの優勝を願いながら 2023年12月 小中英嗣」で締められたこの本を、名古屋サポーターが買わない手はないのではないのでしょうか。

気になった/勉強になった部分+感想メモ

  • 第1章:野球とセイバーメトリクス
    • マネーボール」も「アメリカン・ベースボール革命」も観た・読んだので取り上げられていた題材自体はだいたい知っていたが、その結果、(観客目線で)野球が「面白く」なったかどうかというテーマは考えさせられる
      • 第3章では、物理計測やデータの蓄積がアメリカ野球にもたらした「合理的」な選択の顛末=「何も起きない」時間の増加が示されている(pp.97-100)
      • 現代の(プロ)スポーツは「それが興行コンテンツである」という制約から逃れられないので、競技性・ルール設定*2・興行的価値の三者関係の相互作用を抜きには語れない、という点をこの本全体を通じて改めて認識した
    • (野球優位文化の愛知で育ったのに)野球全然知らない人間なので、"「打たせて取る」技術"の存在自体がデータから否定される、という話はなかなか衝撃を受けた(p.14)
    • 「もっとシビアで重要とみなされたきた分野――例えば軍事技術――から、余ったコンピュータ資源がスポーツという「遊び」に到達した時代が21世紀初頭なのです」(p.31)がかなり印象に残る言葉だった。
    • 些末な話だけど「ピタゴラス勝率」って全然ピタゴラスっぽくなくね?と前から思っていたので著者も同じことを考えていて我が意を得たり感があった
    • p.39で、AIが人より強くなってしまった将棋・チェスなどに関して「人類が勝てなくなった前後では、そのゲームの特徴が「人間のみ実行できる複雑で知的な営み」から、「他の機械で代替できる営み」へと変わってしまったと感じています」とわりと立場がはっきり表明されていて、ここは個人的にはまだ判断が難しいところだと思っているので興味深く感じた
      • 自分は将棋ファンだということもあって、「AIが人間より強くなってしまうと競技の魅力も損なわれるのか」というテーマに関しては結構触れる機会が多い。たとえば大川慎太郎『不屈の棋士』を読むと棋士のなかでもその考えがかなり分かれていることがわかるし、たぶん将棋ファンのなかでも定見がない話題ではないだろうか。
      • いまではすっかり将棋中継でおなじみになってしまった「評価値グラフ」が、藤井ブームなどで近年増加したいわゆる「観る将」(=自分では指さない将棋ファン)に対して、リアルタイムでの臨場感の増幅装置としてある程度機能しているのは否定しがたいと思う
        • 私の両親も「将棋のルールは知っているが棋力とても低い(解説をきいてもあまりわからないくらい)」のにも関わらず将棋中継を楽しんでいたりするが、これは2010年代前半までの将棋中継では難しかったように思う。
        • いっぽうで「AIの推奨手と違う手を指すとすぐに"悪手"や"ミス"と判定する」みたいな観戦姿勢が定着してしまうことで、AIは将棋の奥深さや棋士の努力への正しい理解からむしろ遠ざける方向に作用している、という見方も根強くある。この主張も結構わかる。
        • 結局は、「AI > プレーヤー > 観客」という実力序列が明確になったときに、AIとの比較によるプレーヤーの相対化が行われてしまうこと自体は避けられないのだけど、その相対化がどれだけ容易に可視化されてしまうか/どのような形でなされるか、というところにポイントがある気がする。
      • 「AIやデータの蓄積の存在がプレーヤー視点での「合理的な選択」をいかにして変えるのか」という点に関しては、下の動画で渡辺九段(当時名人)が藤井聡太八冠の特異な強みとしての「記憶のパワープレー」について語っている動画が個人的に一番示唆深い(動画の33分くらいから)

www.youtube.com

        • AIが「答え」を示せるところまでは解明が進んだとして、状況-答えのセットの組み合わせがあまりにも多かったり、その分岐が複雑だったりする場合は、そのすべてを人間が記憶したり用意したりするのが難しいので、試合展開が必ずしも画一化するわけではない、というのが含意である(ひとりだけその組み合わせを網羅して「記憶のパワープレー」が繰り出せると八冠になれる)
        • スポーツの話に差し戻すと、野球は「状況」がわりと複雑化しない競技なので、この本で書かれているような画一化とその結果としての「何も起きない時間の増加」が起きたのではないかと思う。サッカーは「状況」の定義の仕方や分節化が幾様にもありうる側の競技なので、なかなか画一的影響は受けにくいとは暫定的には思う(せいぜいこの本にも挙げられているロングシュートが少なくなる、くらい)。でもさらにデータ活用が進むと違うことも起きるのかなぁ
    • セイバーメトリクスの「セイバー」が「アメリカ野球学会」の略語だってのを知らなかった
  • 第2章:サッカーのデータ分析
    • サッカーについての章だったので、ほぼ既知の内容だった。ので個人的なメモは割愛。
      • メモすることがないのは自分がオタクなのが悪いだけであって、一般向け入門書としては過不足ないトピックの選択とわかりやすい解説がありもちろん素晴らしい
    • 「はじめに」でも書かれている「サッカーの競技特性がデータ計測や分析を拒み続けきた」という部分は、本当に自分で色々分析しようとすると嫌なほど痛感するところではある(特にJリーグについては、詳しくは大昔に書いた以下の記事に詳しく述べている。いまもほとんど意見は変わらない)

ronri-rukeichi.hatenablog.com

  • 第3章:3ポイントシュートの革命
    • ルールの設定・変更とその帰結について各競技の事例や意図・帰結を紹介している章
    • NBAにおいて得点を増やすために3ptラインをゴール近めに設定したら、逆にDF側が守りやすくなって得点が減ったという話(p.83)が一番面白かった
      • スポーツに限らないけど、こういう制度設計・変更の「意図せざる帰結」みたいな話が読んでる側としては一番おもしろいみたいなところはある
    • ルールの妥当性やその改訂について議論するとき、競技性だけでなく、「疲労や怪我からの選手の保護」という観点が大事だ(でも我々は忘れがちだ)というのを、試合時間とルール変更の関連性について扱った節(p.92-p.97)を読んでいて改めて認識した。
  • 第4章:「順序をつける」巧みな方法
    • 小中先生自身の研究例も多く紹介されていて、個人的にとても面白かった&勉強になった章。
    • よりよいランキングをどう設計・評価するのか、ということを考える面白さがかなり伝わってくる
      • 特に複数種目のスコアを組み合わせて最終順位を決める場合の問題に関してはあまり考えたことがなかったで勉強になった
      • ひとつの物差しで測れない複数の結果を「合算」するときに、どの努力とどの努力を「等しい」とみなすのかの重みづけ判断には結局何らかの思想が介入するんだけど、その判断を見通しのよい形で行うためにこそちゃんと定式化・定量化することが重要である、という感想を持った
    • t時点でのランキング上の各プレイヤーの位置自体の情報がシードの作成や各大会自体のグレード評価につながって、t+1時点での試合結果やランキングにつながる..という再帰性は多くのスポーツにあるのだけれど、①総当たり制が難しく、②単純な(垂直的な)実力差以外にも大会↔選手や選手↔選手の「相性」が大きく結果に作用する、といった場合に特にランキングの妥当性が問われやすくなりそうだな、という感想をもった
      • そういった意味でランキングの重要性が高くなりそうなスポーツであるテニスについて、そのランキングやポイントのシステムの設計の丁寧さを解説しているpp.131-136あたりが本当に面白い。
      • ①総当たりが難しくて、②プレイヤー(キャラ)間の相性がめちゃめちゃ大事で、③シードを通してのランキング↔試合結果のフィードバック的影響が当事者からも強く認識されている、という領域として個人的にこの章を読んで思い出したのは「スマブラ」の競技シーンである。「シードを上げて事故を減らすために大会に出る」みたいなことがプレイヤーからも日常的に口にされるので、シードとその背後にあるランキングに関してのプレイヤー側の視線もわりと厳しいイメージがある。
        • スマブラでは数年前まで世界/日本で「最も権威のあるランキング」(PGR/JPR)が押しも押されぬ存在としてあったのだが、今は両方とも更新停止されたため、今は複数のランキングが並立していて、シード作成を行う大会運営側もどのランキングを参照するかは試行錯誤している状態である。各ランキングがどういう思想を持っていて、予測指標としてどれくらい有効性があるか、みたいのを比較評価する人がいると面白いと思った。


www.youtube.com
note.com
note.com
jak-amano.hatenablog.com

    • この章の最後でもランキング作成とテスト理論や製品評価(一対比較法)との類似性・共通性が軽く触れられているが、実務でそれらに触れた経験があるからこの章が特に面白く読めたのはあったかも。
    • 章の内容自体とは関係ないけど扉絵のページを見て日本ガイシって瑞穂区の企業だったんだ...っていうのを今更知った
  • 第5章:予測モデルの腕試し
    • ただただ読んでて面白い章。
    • 勝敗予測にあたって、疲労からの回復度を補正として用いるというアイディア(p.190)が面白いと思った。この疲労度の寄与みたいなものもスポーツ間で違うんだろうなぁ。
    • ワールドカップカタール大会をうまく予測しきれなかった要因として「異大陸間の試合の減少」が挙げられている(p.199の図がわかりやすい)が、これは分析者/予測者目線だけでなく、当事者目線でも結構大きい変化だったのじゃないかとふと思った。(それが実際に勝敗に作用したかはまた別の話だが)大陸「内」の試合が増えたUEFAに所属する大国であったドイツとスペインが、日本の実力を測り切れていなかった部分は少なからず2022W杯であったように思う。
    • 「サッカーマティクス」は自分も大好きな書で、実際にくじを買ってみる章が好きなのも小中先生と同じなので、その日本版(?)「続編」を読めるだけでめちゃめちゃ面白かった
    • 小中先生は過去の得失点だけを予測に使っているから、もしかしたら読者は「もっと多くの変数を使ってもっと複雑な手法を使えば的中率を上げられるのでは?」という反応もありそうだと思った。しかし、個人的な見立てとしては、モデルを複雑に洗練させていっても(多少の改善はあるかもしれないが)劇的には予測精度は向上しないだろう、という気はする。
      • 「サッカーマティクス」でもゴール期待値などをインプット情報として用いた予測モデルが賭けにおける判断基準として機能しなかったという話(pp.372-4)が出ていて、著者(D. Sumpter)はそういった細かいデータの利用は戦術理解には有用だが、予測に関して同じくらい有用かといえばそうでない、と結論づけていた。
      • 「ある要因が引き起こす結果」(Effects of Causes)に関心がある分析と「ある結果をもたらす要因」(Causes of Effects)に関心がある分析の違いは統計学の応用において近年よく議論されるトピックのひとつ(たとえばコレとか)だが、使用データの拡大や分析手法の洗練を進めていっても知見が増大するのはおそらく前者についての部分であって、「勝敗を規定する新たな決定的要因」みたいなのが急に見つかる可能性は(少なくともサッカーについては)低い、というのが個人的な暫定的見解である。

スポーツを愛している者、そしてこれから新たに愛する者にとって、本棚にあってまず損のない名著だと思われます。

Enjoy!!

*1:池袋のジュンク堂にありました

*2:競技のルールだけでなく、大会日程や各コンペティションのレギュレーションなど運営的な要素を含む広義の「ルール」