論理の流刑地

地獄の底を、爆笑しながら闊歩する

2020-10-01から1ヶ月間の記事一覧

RIF回帰再訪

齢を重ねると物をすぐに忘れるために備忘録を多くとるようになるが、 さらに衰えが激しくなると、そのメモをみてもすぐに学んだ内容を想起できなくなるため、このような悲しい記憶の復元録を書くことに相成るのである。。。。 Introduction RIF(Recentered I…

【備忘】交互作用のparameterizationについて考えたこと

実務上の分析をするなかでふと思ったこと。 いちいち書き留めるほどのことでもないけど、そうしないと忘れちゃうので(老兵はつらい)。 何が問題か じゃあどうすればいいか Zが離散変数:ダミー変数のcodingを工夫 Zが連続変数の場合はどう考えるとよいか C…

グラぽで掲載されていた出場時間集中係数の計算プログラム&分析結果再現をこころみる

仕事に疲れたので、休憩用に遊んでいたものをそのまま記事にするだけのやつ*1 車輪の再発明ってやつですね。 Motivation:コナカ先生の知的な試み ジニ係数(オリジナル)の計算方法について 集中係数へのアレンジ 再現できたかの検証 追記:Excelでやるには …

【R備忘】既存のテキストファイルの文字コードをUTF8からShift-JISに変換する関数

R

備忘。たぶんすごい基礎的なことだと思うんだけど、あんまり日本語情報がない気がしたんで。 まぁテキストエディタで文字コード変更して保存しなおせばええやん、って話ではあるんだが、Rだけでなるべく処理は完結したい。以下みたいな関数をつくっておくと…

【分析準備】Jリーグの会見コメントからコーパスをつくる by rvest/RSelenium/RMeCab

Motivation 実装(データ取得) ①:取得対象のURLの取得 ②:監督コメントの取得 実装(取得したtextからのコーパス化) テキストを監督ごとに結合する RMeCab::docDF()でコーパスをつくる 次回予告 Motivation 最近、マッシモの会見が面白くなってきたともっ…

【R小ネタ】最終引数以外でも、複数の変数を非標準評価(NSE)形式で与えたい場合のやりかた。

R

なんか簡単そうで意外と思いつかなかったので簡易な備忘 Probrem Solution Probrem 関数内でdplyrの諸関数をつかうときに、NSEな感じでquotationをつけずに引数を複数指定したいときがある。 そんなとき、最終の引数であれば 「...」をquos()で受け取ってか…

選手の個人スタッツのデータベースをつくる by rvest&RSelenium

鉄は熱いうちに打て、ということで分析基盤をやる気のあるうちにつくる。 テーマや領域にかぎらず、大抵の分析は「分析可能なデータをつくる」工程に大部分の時間・労力が費やされる説あります。 Introduction 目標の設定 実装(Rseleniumのとこだけ) 初期…

【データ検証】マッシモ名古屋は本当に「先行逃げ切り特化型」なのか?それはなぜか?

データから見るマッシモ名古屋シリーズ*1◆Outline Introduction: グラぽにおける問題提起 マッシモ名古屋=「先行逃げ切り特化型」説の提起 「先行逃げ切り特化型」説の検証の必要性 分析:マッシモ名古屋は「他チームと比較しても」先行逃げ切り特化型なの…

前後半のゴール数/シュート数/ボール支配率を取得する by rvest

Introduction どのページからとってくるか データ取得の方法:得点編 場合わけ(得点をとってない場合もあるよねという話) データ取得to整形 時間帯別のポゼッション/シュート数を取得する Possessionを取得する シュート数 Conclusion Introduction rvest…