論理の流刑地

地獄の底を、爆笑しながら闊歩する

football

Masseyレーティングで各チームの前半↔後半のレーティング差を可視化してみる(小中本の実践)

気分転換でしかない記事 Introduction Massey Ratingとは(小中本より) データ・関数の準備 分析:前後半の得点差からRatingを算出して、くらべてみる Introduction 先日名著『科学で迫る勝敗の法則』のメモをとった ronri-rukeichi.hatenablog.com 感想は…

小中英嗣(2024)『科学で迫る勝敗の法則:スポーツデータの最前線』

名古屋サポーター、そしてJリーグファンにはおなじみの小中英嗣先生の新著。 発売日は年明けだが、都内大型書店には既に並んでるとのことだったので早めに入手した*1ら面白くて一気に読了。すぐに内容を忘れる鳥頭なので、自分用の雑多なメモ科学で迫る勝敗…

【データ分析】Jリーグでトランジション・ゲームを制するのはどのようなクラブか

データからみるJリーグシリーズふたたび はじめに:トランジションゲームになると得するのはどういうクラブか 分析の方法と仮説 データ&変数 分析アプローチ 分析 プレ分析:ハイトランジション志向のチームの優位性の確認 本分析:トランジション・ゲーム…

各選手の先発ポジションを取得する

ほしいもの How to 個別選手について クラブ単位での取得 ほしいもの 過去記事などで触れたようにSofaScoreから各選手の試合別スタッツは取得できる。 ronri-rukeichi.hatenablog.comだが、若干分析上不便であるのが、ポジションがGK/DF/FW/MFの4区分でしか…

【データ検証】2021夏、名古屋の守備に何が起きているのか(前編)

今は見守るしかできない最高のキャプテンに、責任や焦りを感じさせないクラブでありたい。 はじめに 使用データ 分析:各指標の変化の確認 守備指標の変化に関する解釈・仮説 次回にむけて はじめに 名古屋の「堅守」がいま、揺らいでいる。無失点記録がどこ…

【データ分析】Jリーグで「青天を衝け」るサッカーの条件を探る

久しぶりのサッカーの分析*1。 ちなみに今年の大河ドラマは視聴していないです*2。 Motivation データと方法 データと変数 分析手法 分析結果 晴天か否かにより効果が変わる変数は何か 結果の概要:晴れの日はロングボールは少なめ、ドリブルマシマシで まと…

J1の各試合のフォーメーションを自動取得する

ただの数字、されど数字。 それがフォーメーション。 Introduction Implementation scriptタグの内部を解析する フォーメーションを取得する 実装 実行する Introduction サッカーを戦術的に語るうえでの大きな要素としてフォーメーションがある。 Football …

一般ファン・サポーターがJリーグを統計的に楽しむうえで「できないこと」は何か

「制約はアイディアの母」*1とは言うけれど...という話 導入:Jのデータ分析の面白さと物足りなさ 最大制約としての「データにおける時空間情報の欠如」 Footballの統計的分析のふたつの役割 因果の同定に必要な情報の不足 詳細データが公開されないのは悪か…

Jリーグの各試合におけるシュート位置の座標を推定・取得する

いとマニアックな備忘録というかもはや作業メモでしかない系記事 Motivation 座標の指定方法をしらべる ピッチの広さに関する知識 座標変換のロジックをつくる 試合ページから取得できるようにする 集計結果(やっぱ川崎すげー) Conclusion Motivation Foot…

【データ検証】川崎フロンターレは「トータルフットボール」なのか?「キングダムサッカー」なのか?:ボールタッチ数の集中度から考える

fooball計量学シリーズ。ちょっとした思いつきによる分析。 問題提起:川崎フロンターレは「トータルフットボール」か? データ検証の指針:タッチ数の不平等度からのアプローチ Technical Notes:タッチ数の集中係数の計算方法 ジニ係数の計算方法 タッチ数…

StatsBombをRで遊ぶ

個人的な備忘録でしかないメモ。 Introduction Rでも実現したい処理工程の把握・書き出し データの取得・整形 大会情報の取得・整形 試合情報の取得・整形 ラインナップの取得 イベントデータの取得 イベントデータの基礎集計と可視化 チーム別集計(例:パ…

【追加データ検証】マッシモ名古屋(とロティーナセレッソ)が前半先行されると追いつけないのはなぜか

マッシモ名古屋をデータで追うシリーズpart2. 小中先生(@konakalab)が新たな武器を授けてくれたので。◆Outline 問題提起:あれから一か月経った現状と課題 セレッソと名古屋の共通点:一部選手への起用の集中化 アプローチ:HTがビハインドである場合の勝敗…

グラぽで掲載されていた出場時間集中係数の計算プログラム&分析結果再現をこころみる

仕事に疲れたので、休憩用に遊んでいたものをそのまま記事にするだけのやつ*1 車輪の再発明ってやつですね。 Motivation:コナカ先生の知的な試み ジニ係数(オリジナル)の計算方法について 集中係数へのアレンジ 再現できたかの検証 追記:Excelでやるには …

【分析準備】Jリーグの会見コメントからコーパスをつくる by rvest/RSelenium/RMeCab

Motivation 実装(データ取得) ①:取得対象のURLの取得 ②:監督コメントの取得 実装(取得したtextからのコーパス化) テキストを監督ごとに結合する RMeCab::docDF()でコーパスをつくる 次回予告 Motivation 最近、マッシモの会見が面白くなってきたともっ…

選手の個人スタッツのデータベースをつくる by rvest&RSelenium

鉄は熱いうちに打て、ということで分析基盤をやる気のあるうちにつくる。 テーマや領域にかぎらず、大抵の分析は「分析可能なデータをつくる」工程に大部分の時間・労力が費やされる説あります。 Introduction 目標の設定 実装(Rseleniumのとこだけ) 初期…

【データ検証】マッシモ名古屋は本当に「先行逃げ切り特化型」なのか?それはなぜか?

データから見るマッシモ名古屋シリーズ*1◆Outline Introduction: グラぽにおける問題提起 マッシモ名古屋=「先行逃げ切り特化型」説の提起 「先行逃げ切り特化型」説の検証の必要性 分析:マッシモ名古屋は「他チームと比較しても」先行逃げ切り特化型なの…

前後半のゴール数/シュート数/ボール支配率を取得する by rvest

Introduction どのページからとってくるか データ取得の方法:得点編 場合わけ(得点をとってない場合もあるよねという話) データ取得to整形 時間帯別のポゼッション/シュート数を取得する Possessionを取得する シュート数 Conclusion Introduction rvest…

Jリーグをデータから分析する準備

猫背、なかなか直らんすな.... Introduction Scrapingの流れ 欲しいデータの要件の定義 データ要件の定義が大事な理由 データの要件の定義@Football Lab rvestの使用手順を簡単におさらい 基本的な使い方 実行例 データをとっていく(クラブ編) 走査ルール…

最近印象に残った言葉

社会は人に一つの人格を望む。 人格が一貫していればしているほど誠実な人間だと捉えられる。 だから皆「表向きの自分」を演じてそこからはみ出る部分を隠したがる。 隠してきたものを消してやれば一貫した人生になる。 反対に暴き始めれば色んなものが壊れ…

He is a genius.

本棚の普段漁らない、奥の部分を見たら出てきた昔のNumberの特集本。目覚めよ蹴球力 for Footballers―Sports Graphic Number plus 2003 September出版社/メーカー: 文藝春秋発売日: 2003/08メディア: ムックこの商品を含むブログを見る発売時期は、2003年の…

ハリルホジッチの民主制と敏腕社長アンチェロッティ

監督はひとりじゃできない ハリルホジッチ体制を、「社長が部下の信頼を失った会社」と評した記事が書かれていてもやもやしていたところ、Number Webで良記事が上がっていた number.bunshun.jp (日本の報道では)一般に、サッカーの監督が評されるとき、 そ…

至言

◆Revolution 明治安田生命J2リーグ 第20節 長崎戦前々日 監督会見|ニュース|名古屋グランパス公式サイト ─青木選手、杉森選手はこれまでのシーズンで出場機会もなかなかありませんでしたが、どういう部分に成長の可能性を感じられるのでしょうか?1つは、…