論理の流刑地

地獄の底を、爆笑しながら闊歩する

年末年始によんでいたもの(2022→2023)

師走も走り去りぬ。

例によって年末年始は(帰省や移動時間を利用して)読んでみようと当初思っていたものの2~3割ほども読めなかったが、読んだものについて超簡単な感想・備忘など。
記録をとらないと読んだことも忘れちゃうゆえ*1


(自分用)参考:秋に読んでいたもの
ronri-rukeichi.hatenablog.com

クリスチャンセン&チェイター『言語はこうして生まれる』

  • 「言語の天才まで一億光年」の高野さんがtwitterですすめていたので年末読んでいた。重厚過ぎて(ちっちゃい文字で350ページくらいある)読むのに一日かかった。
    • その割にあんまり中身覚えてなくてかなしい。「あとでまとめて」じゃなくて、読みながらメモとらないとだめなんだよな本来は。
    • 面白いトピックは結構あっただけに、末尾に索引がないのがめちゃ残念。「ヒラノ教授シリーズ」で出てきた過激な名言『索引のついていない本は読む価値がない』*2を久々に思い出した。
  • めっちゃざっくりいうと、トップダウンではなくて自生的な秩序としてボトムアップに出来上がっていくのが言語だぜ、という話。
    • 言語学は門外漢で土地勘はないんだけど、言語学にはチョムスキー先生の「普遍文法」パラダイムが一時期席巻していたことがあって(これはいわばトップダウンな考え方だ)、そこが背景にあったうえでより動的で局所的な言語の生成過程を重視する、という問題意識なのであるそうだ。
      • 普遍文法について(p.136)『チョムスキーからすると、その論理的な流れとして、子どもはいうなれば「普遍文法」を持って生まれてくるに違いない。人間の遺伝的青写真には、言語を支配する抽象的な数学的原理が内包されているのだ。特定の言語を支配するパターンを学習するというのは結局のところ、北京官話であれホビ語であれバスク語であれ、その言語の細部をとらえられるように普遍言語を微調整するだけのことなのだ』
      • この普遍文法パラダイムに対して、実際は(この本の副題にもある通り)、言語は即興的な「ジェスチャーゲーム」の蓄積の過程として動的に生成される、というのが筆者二人のいいたいところ。
      • 「この数十年間、言語学分野―あるいは少なくともその一部―では静かな革命が進行してきた。世界中の言語の当てはまる隠れた普遍的パターンなるものをとらえた「壮大な体系」をまとめようとするよりも、小さなことから始めたほうがいいと多くの言語学者が思うようになった」(p.139)
      • 子どもの言語の学習を、N学習(自然界についての学習)としてではなくC学習(文化的世界についての学習)として捉えられたほうが、「言語の習得がなぜ可能なのか」という問いに答えやすいこと&ある文化圏におけるジェスチャーの理解・模倣として言語学習を考えたほうが自然である、ということが、このような考え方の一つの支持根拠となっているらしい(pp.205-209)
      • 言語学習が可能なのは、人間と関係のない、誰もがその習得をめざす「真実」の言語があるからではない
    • 訳者あとがきの冒頭で触れられているとおり(p.321)、この本の特徴はさまざまなレベルでの「言語が生まれる」メカニズムを扱っているところにある。以下のようなトピックがすべて抑えられている
      • ほかの動物にはない人類特有の言語が生まれたのはどうしてなのか(人間の知能・特性の根幹としての言語)
      • 世界中にたくさんの異なる言語があるように、地域や民族ごとに独自の言語が生まれるのはどういうわけか(言語のバリエーションの生成)
      • 1人の人間のなかで言語がうまれるのはどのようにしてか(言語の習得プロセス)
  • 実験言語学?とでもいうのか、実験的環境ででたらめな新しい言葉をつくって伝言ゲームをさせると、秩序が徐々にできてくるという研究例がいくつか紹介されており興味深かった。われわれは既に世界に存在している言語秩序を学んでいくわけだが、そもそも言語にどう秩序が生まれてくるのかを観察しようという試みである(pp.210-219)
  • よく言語学や語学学習関連の本で出てくる話題で「学ぶのが難しい言語は何か」というのがある。この話をするときはたいてい母語ではなくて第二、第三の言語のことを想定していることが多いのだが、母語として学ぶ言語にも難易度があって、デンマーク語はその難解さゆえに母語として学ぶスピードが他の言語より遅い、という話が面白かった(p.255-264あたり)
    • デンマーク語には40種類(!)の母音があり、それがデンマーク人のこどもたちにとっての言語習得にハードルになっているとのこと。ほぼ同じ過去時制の体系をもつノルウェー語・スウェーデン語を学んでいる子どもに比べても、過去時制の習得が2年遅かったり、語彙の発達スピードが遅かったりするそうだ。
  • 数年前にtwitterで教えてもらって面白かった本に『魚だって考える』っていう本があって、色々な魚の観察・実験からさまざまな「知性」を読み取れることを教えてくれる良書なのだけど、わりとこの『言語はこうして生まれる』は人類の知能・知性が他の動物の知能・知性と明確に峻別されるという立場にたっていて、その境界線の核として言語がある、という考え方だった。ここらへんは人によっては少し抵抗があるかもしれない。
    • 最後の2-3章くらいはわりと壮大な話になっていて、「サルはジェスチャーゲームはしない」という話から、人間とその他の動物を分かつ「文化の進化」の基底にあるのが言語なのだ、というデカすぎるテーマが語られていた。「言語はまったく新しい種類の進化プロセスを生んだのだ――遺伝子の進化ではない、文化の進化というプロセスを」(p.286)




中川裕『アイヌ文化で読み解く「ゴールデンカムイ」』

  • 帰還兵とアイヌの少女がやっかいな脱ぎたがりの奴らと金塊を奪い合う国民的漫画/アニメである『ゴールデンカムイ』の監修をしたアイヌ文化の研究者さんの本。実家に帰省していて、父の書棚にあったのでなんとなく読んでみた
  • 「カムイ」は無理やり日本語で近い言葉を当てはめて”神"と訳されることが多いけど、「環境」と捉えたほうがいい(アニミズム的な)とのこと。動物も自然もカムイだし、現代にかつてのアイヌ文化があったら電子機器とかもカムイとして捉えられている可能性もあると。
    • 日本や欧州の神話における"神"的存在と違うのは、悪いことをしたカムイ側(例:人を襲った熊)に対してわりと人間側がカジュアルに罰を与えられること、というのが面白かった。
    • 「カムイ」は元々の世界(現世とは別の)では人の形をしていると考えられていて、たとえば熊も熊の毛皮をかぶった人間のようなものとして考えていて、猟で熊を獲ったあとに感謝をささげながら食べたり毛皮を利用することが、カムイに対しての敬意として捉えられている。
    • だから、ウェンカムイ(悪いカムイ)は元の世界に帰れないようにお仕置きをする。人を襲った熊は毛皮にも食事にもせず、ただ刻んだり燃やしたりして地獄に落とすことができる、という発想らしい。なるほどなー。
  • 著者の方は、フィールドワークがてら色々なアイヌ料理を食しているそうで(各動物の各部位も)、脳みそはガチでうまいと力説してあった。
  • フィクションにおける歴史や文化の考証につきものではあるのだが、「忠実に再現するなら本当はこうですよ」といっても、どうしてもストーリーや絵としての見栄えやわかりやすさが重視されてしまうこともあるそう。だから、書名も「ゴールデンカムイで読み解くアイヌ文化」ではなく、「アイヌ文化で読み解くゴールデンカムイ」にしていると。
    • たとえば江戸時代の女性を忠実にお歯黒にしてしまうと、見てる側の違和感がすごくてスッと入ってこないよね..みたいなのがわかりやすい例として出されていた。
    • 大学一年でとった教養課程の授業で、ちょうど前年の大河を監修した先生の中世史をとっていたことがあるのだが、同じ悩みを吐露していたのを思い出した。「こんなことはありえなくて、こうしているはずです」みたいなことを言っても、現代のわれわれからの違和感や消化しやすさに負けちゃうことが多々あると。
    • この本の著者も、ゴールデンカムイの作者はすごいアイヌ文化へのリスペクトがあると述べている。それでも、どれだけ愛や配慮があったとしても、フィクションのなかで再現される歴史や文化はあくまでもフィクションだということを、われわれも時折思い出して抑制的に解釈する必要があると感じた。もちろん、色んな興味の入り口としての意義は否定しようがないし、「ゴールデンカムイ」がアイヌへの関心に対してポジティブな貢献をしていることを著者も捉えているようですが。
  • 近年アイヌ語を保存・復興しようという試みがかなり盛んになっているらしく、去年読んだ「フィールド言語学者、巣ごもる」(これもかなり面白い本だった)でおびただしい数の言語がすごいスピードで消滅していくという話がされていたのを思い出した。




村上春樹柴田元幸『翻訳夜話』

  • 父の書棚にあったのでなんとなく読んでいた本その2。翻訳が好きで好きでしょうがないふたりが対談や講演での質疑応答、競訳の検討などを通して、翻訳についての意見を交換し合う本。
  • 自分は申し訳ないけど村上春樹の小説はあまり読んだことなくて(たぶん読み通したことがあるのは「色彩を持たない~」だけだ)、その割に彼のエッセイは結構読んでる変な読者なのだが、これも面白かった。
    • 学者と小説家というもう一つの軸足を各々に持っているので、その立場の違いやキャラクターの違いが翻訳に関する考え方に出てきて興味深かった(「自分より下手な小説を訳すのがつらい」とのたまう村上さん)。
  • 柴田さんが「すべての翻訳は誤訳」と言っていて、(もしかしたら使い古された表現なのかもしれないけど)翻訳という行為の本質的な困難を表していてインパクトがあった。それでも翻訳が好きでしょうがないって言えるのは強いすなぁ。
  • 翻訳学校*3の生徒さんからの「Q:訳する作品の時代背景や文化や精神性についての理解や勉強はどれくらい必要ですか」という質問に対して、もちろん背景知識があるにこしたことはないけど、基本的には「テキストで全て説明されている」というスタンスで訳すべきだと二人が答えていたのが印象的だった。
  • 主語を省略しない英語から省略しがちな日本語に直していくとき、("~, he said."が続くのをいちいち「彼が言った」と訳す感じで)忠実になおすとくどい感じになるんだけど、英語で読んでもくどいときはあえてそこに作風上の実験を読み取ってそのままにしておくか悩む、みたいな話が悩ましくも面白い話だな、と思った。
  • 村上春樹の初期の作品(まだ飲食業との兼業だった頃の作品)は、英語で書いてから日本語に直していくことで、独特のリズムやテンポをつくっていったというのは有名な話。だけど、そういう翻訳的文体が染みつきすぎて、逆に村上さんの日本語作品を英語になおすときに翻訳者(英語ネイティブ)から「英語にはなおせるけど、そもそも日本語にこんな表現はなくないか」みたいな問い合わせがくるらしく、結構面白かった。

Degitar & Rose,"A Review of Generalizability and Transportability"

Link ※23/1/11現在, 最終verではないので注意。

  • いつか読もうとブックマークだけしてて後回しにしてたもの。やれEBPMだEBMだと言われるなかで、分析から「データに基づいて」提出された知見がどれだけ求めるターゲット集団*4に対して一般化(generalize)・移転(transport)可能なのか、という点について扱った研究のレビュー。勉強になった。
    • 実務的な観点からうれしいのは、target populationとstudy populationの差異を検討するときに、個票がつかえず集計レベルでの各変数の分布情報(平均、標準偏差、中央値など)しかないときにとれるアプローチについて言及があること。
  • やれ交絡、やれ疑似相関だ、と我々は内的妥当性(internal validity)にばかり意識が向きがちだけど、知見の導出のもとになったstudy sampleと施策・処置を適用したときの効果が知りたいtarget sampleの差異から生ずるバイアスについての外的妥当性(external validity)にも注意を払え!とのこと。いやはや、おっしゃる通りでございます..
    • 考える対象となる領域が政策であれ研究であれマーケティングであれスポーツであれ、基本的には意思決定の参考にするような分析知見を導出するのに用いたデータと、意思決定や選択が影響を及ぼすデータは基本的に絶対にズレる*5ので
    • イマドキの時代的背景というか問題意識としては、RCTが結構causal effectsを求める手段として普及してきているのだけど、RCTのstudy sampleというのはわりと本当に「処置・施策を実行したときの効果」が知りたい想定集団と性質を異にすることが多いので、そこらへんが念頭にあるっぽい。
  • 外的妥当性にかかわる概念としてgenaralizabilityとtransportabilityが二つの中心概念として定義されている。この二つは似て非なるものなので注意してね、とのこと(p.3)
    • generalizability:study population(分析を行った対象データの背後に想定している母集団)が、target population(実際の処置効果を知りたい対象の背後に想定する母集団)の一部のときの知見の一般化をさす
    • transportability:study populationがtarget populationの外部にあるときの、知見の移転をさす
  • ちなみにstudy sampleとかtarget populationとかどういうことやねん、というのは以下の概念図(p.2)を参照されたい。
    • 一応この図だとanalysis sample/populationとstudy sample/populationは区別されてるけど、その後あまりその区別については触れられない。まぁ欠測データ分析についての色々なアプローチが膨大な量あるので、そっちはそっちでやってねということでしょうか
{tareget/study/analysis}×{sample/population}の概念図
  • 外的妥当性バイアスをもたらす要因として、以下の4つがあげられている(p3)。これらがtarget/studyのgroup間でちがうと考えられるとき、安易に因果効果に関する知識をgeneralize/transportしちゃいけないYO
    • a) subject characterstics, 対象の性質.
    • b) settings, 環境や実験の設定(例として、地理的要因やhealth centerのtypeなどがあげられている)
    • c) treatment, 処置(例として、処置タイミングや処方量、スタッフの習熟度などがあげれている。同じtreatment=1 に割り振られていてもtarget vs studyで「処置」の意味するものが違ってくる、みたいな話ですね)
    • d) outcome, アウトカムの測定(例:測定のタイミングやフォローアップ機関の違いなど)
  • そんでもって、上記のようなバイアスの誘因があるとき、以下の三つの経路のいずれかを通して外的妥当性biasが起きることになる
    • a) 研究・調査対象になりうる確率の差異
    • b) 因果効果の異質性(heterogeneity in treatment effects)
    • c) a とb の相関(RCTの実際の対象グループと、適用したい想定集団を比べてRCTの対象に選ばれやすいような性質をもつことが、因果効果の異質性と相関をもつとき)
      • たとえば街頭アンケートである商品があるアトリビュートをもつことの効果を推定して、それを見込顧客全体に対しての効果の類推につかうときそもそも街頭アンケートに答えるような人がそのアトリビュートの効果も高いとき、実際にその施策を打っても効果がうすくなっちゃう、みたいな話

  • 実際のgeneralize/transportのステップとして、以下があげられている。詳細は略
    1. estimand:推定値の確認
    2. assumption:必要な前提の充足状況の確認
      • 因果推論の議論で耳タコになるくらい聞いたexhangeablity/positivity/SUTVAの3点セットの外的妥当性verみたいなものを確認しろ、とのこと
    3. evaluate:①処置効果のmodificationの存在の有無、②effect modiferとなる変数の分布がstudy/target間で異なるかどうか、を精査することによって、外的妥当性バイアスの深刻度を評価する
    4. methods:外的妥当性の処理を組み込んだ手法によって、target populationにおける処置効果を推定する

  • ちなみに論文全体のまとめは6章のDiscussionの部分にすごい分かりやすい感じであるので、全体の論旨を思い出したい時はそこだけ読めばいい(自分用覚書)
    • でもたぶんこの論文の利用価値としては、estimand/assumption/evaluate/methodsの各々のフェーズに関して、色々な議論や分析アプローチについての文献を豊富に紹介していることが一番だと思う。generalization/transportationに関してのpaper listとしての価値だ。
  • 個人的にはevaluateのところが勉強になった(pp.18-19あたり)。External validity bias exists when study and target population differs in their distribution of effect modifiers"なので、そのバイアスの深刻度を評価するには、以下の三つをすればいいとのこと。各評価手法に関連して色々な論文が紹介されていて、いつか必要なときに読もうとおもった(読まないやつ)
    1. baseline charactersticsの非類似度の比較
    2. アウトカムに関する非類似性の比較(target sampleにおける処置グループごとのアウトカム平均を、study sampleからweighing/matchingなどで予測した処置グループごとのアウトカムと比較して、equivalenceを確かめるみたいなことをやるっぽい)
    3. 処置効果のheterogeneityの検出
  • 論文全体を通して感じられるメッセージとして「外的妥当性に対処するための考え方や分析アプローチには、内的妥当性に対処するために用いられてきたものが援用できるよ」というスタンスがある
    • 確かに、紹介されてるassumptionとmethodsの数式表現は、どこかで見たものばかりである(あと読んでて気づいたけどこの著者の人は、わりとpropensity score推しだ)
    • これは蛇足of蛇足だけど、数か月前によんだ吉野諒三(2022, 「未回収層のプロファイリング:「信頼感」で読み解く世論調査の標本バイアス」『行動計量学』vol.49(2))先生のありがたい文章で「バイアス評価の経験則」と題したありがたい提言があり、そのひとつに"ウェイト調整は「補正」ではなく、バイアスを見つめるために活用せよ"(キャリブレーションや傾向スコアなどで「補正」しようとするより、元のデータの比率と調整量の差が大きい項目を考察し、どのようなテーマにどのようなバイアスがあるかを解明せよ)と書かれていてハッとした。もちろんgeneralizationやtransportへの志向性はあっていいのだけど、どこかで「別データは別データ」とわりきってデータをみつめることも大事ですね


ほかにノンフィクションを1冊、専門書を1冊、フィクションも2冊くらい読んだけど、あんま刺さらなかったのでメモは割愛。
いやはや、普段(目の前に必要なもの以外の)インプットの時間があまり捻出できてないぶん、来年の年末年始こそは事前に読もうと思っていたもののせめて半分はよみたいと、そう決意したのでした。
読むスピードと頭の回転がせめて人並みの1/2くらいになれば...(かなわぬ願い)


www.youtube.com


Enjoy!

*1:20代後半以降、ほんとうに読んだものを読んだそばから忘れるようになってしまった気がする...加齢のせいにしてはいけないなー。

*2:さすがに言い過ぎだと思う

*3:そういうものがあるのをはじめて知った、現代社会はなんでも学校化される社会だ

*4:マーケティングだったら見込顧客、政策だったら対象市民とか

*5:追跡調査や生の顧客データなど、分析対象が同一個人のときもあるじゃん!と言われるかもだが過去の彼と未来の彼は同じデータとはいえないし、同じとみなすならそれはそれなりに強い仮定をおいているのである