計量・歴史・データ批判

(今日のエントリはここしばらく続いた一連のエントリ群の話題から少しそれて、研究者、それもごく一部の関心を共有する人にしか関係がない話です。書いておいてなんですが、ここに来られるそんなに多くはない皆さんのうちの多くの方にとっては読む時間的コストパフォーマンスの悪すぎるエントリですので、スキップしてどこか別のサイトに行かれるか、なにか別のことをされるようお勧めします。)

『教育と平等』雑感、と題したエントリはあるいは好事家がたいした生産性もない話題にぐだぐだと時間をかけた饒舌に映ったかもしれない。そんなことにかける時間があったら生産的な仕事をもっとしろ、という先達の叱咤はもちろん謹んで承るところであるが、その意図の一端ぐらいは記しておいて無駄でもないかと思いたい。

かつて数理社会学会の『理論と方法』という雑誌で「計量歴史社会学」という特集があった。日本の計量社会学で明瞭に一つの主流であったSSM調査がすでに50年の時を経て、それ自体有力な「歴史資料」(史料)と見なしうる状況がもたらされたことや、日本でも東大社会科学研究所のSSJDAをはじめとする調査データアーカイヴが整備されはじめていた背景に棹さしていた、と思う。

そのほとんどが「個人」を単位とするマイクロデータであって、したがって「計量歴史社会学」という名称があてられていたわけであるが、私は自分が当時かかわっていた共同研究の宛先を意識して、むしろ「数量社会史」という言い方のほうを好んでいた。(とはいえ、私がかかわれるのは、日本をフィールドにした近現代史――とりわけ現代史――ということになるので、それも「社会学」の精度でしか行えない水準のものなので、それを前提に話を進めたい。)

繰り返しになるが日本ではデータアーカイヴの整備が遅れたので、それらを利用した歴史の叙述という課題についての議論――「方法」に関する議論――もほとんど行われないままそのような事態を迎えていた、というのが当時の私の印象である。だから、この手の「方法」に関する考察には少しだけ周りのひとより時間をかけたかもしれない。

計量歴史社会学/数量社会史と一口にいってもいくつかタイプをわけておいたほうがいい。

【1】一つは、歴史学と同じようにアーカイヴ――文書を所蔵する場所という語本来の意味のそれ――に入り、個人(や世帯)の情報を記載した複数種類の文書資料を突き合わせ接続していくことで個人(あるいは世帯)票の集積を構築し、そのデータセットを対象に数量的な分析をかけていく、という方向性がある。いちばん「歴史(学)」に照準した方法である。私が経験したのは学校所蔵資料から「教育」の局面に軸足を置いた社会移動の復元・分析を可能とするデータセット構築の作業である。同様の手法はたとえば企業(事業所)所蔵資料などからも可能であろう(その手の古典的研究もある)。もう少し射程を延ばせば、プロソポグラフィ研究全般をここにカウントしてよいかもしれない。

『思想』誌上ですぐれたプロソポグラフィの小特集もあったかと記憶するが、残念なことにそこに挙げられていた重要なフランス史の先行研究群については、私の言語能力の問題とフランス史に関する背景知識量の問題との双方から、ほとんど読めていない。しかし、「教育の歴史社会学」の古典的な業績であるところの麻生誠先生が先鞭をつけたエリート研究などはすでにそのような研究であったと言えるだろうし、私に近いところでは同時代に同じ研究室で院生をしていた荒川英央氏の修論以降の研究(戦前期中等学校教科書執筆者のプロソポグラフィ)は明確に「プロソポグラフィ」と銘打った作業をすでに今から13年前に私のすぐそばで地道に遂行していたのであった。

自分(たち)の経験のみに即していえば、そのようなデータセットの構築作業自体にすでに圧倒的な研究上のオリジナリティが認められるので、ある意味、なんでもいいからなにかやればいい、というアドバンテージはあるが、他方でそれゆえに、何をやれば「歴史」を描いたことになるのかの問い返しが弱くなってしまった、と言わざるをえない。

その結果、共同研究の研究代表からじきじきに「事件なき趨勢の記述」という――厳しい――批判を受けることになった(念のため申し添えれば「事件なき趨勢の記述」がまったくの無意味だ、などとはこの批判者も言ってない。ただそれは「歴史」を描いたことになってるのか、と厳しく問いただされたわけである。「なってない」が答えだと私は思う)。

このような研究を実践する際には、一般的な文書資料にもとづいた歴史研究と同等か【それ以上に】、「その時代」に関する脳内「歴史地図」――研究代表の言葉を借りると「時代の土地勘」――を精密に構成してからデータに向き合わないと、数値の推移でしか「歴史」を語れないという「事件なき趨勢」の叙述に堕してしまう。それは言い換えると、自分が構築したそのデータセットが、その「時代」にとってなんなのか、という【データに対する批判的考察】が強く要請されるということである。と、いうことを、そのとき身にしみて理解した。そうした批判を踏まえた次の段階の研究では、一定程度「事件」の位相を埋め込んだ数量社会史が実践できたのではないか、と勝手に思っているが、そのように評価していただいた菅山真次先生の言をそのまま信じるならば。

おそらく、すでにその時代に関する先行研究での「通説」が堅固にできあがっている場合(必ずしも一つの通説に収斂している必要はない、複数説の対立図式であってよい)にプロソポグラフィの手法の威力は強烈となる。必ずしもそういう条件がそろっていない場合(テーマ的に)には、データ構築の膨大な作業ゆえに却って寄せられる so what? の素朴な――それゆえに残酷な――問いに応えるだけのフレームを持ち合わせている必要があって、それは具体的には(自分が作り上げた)データに対する批判的考察、をどこまで徹底できるか、ということと相関的であろうと思う。

【2】第二には、先に述べたようなデータアーカイヴの整備に伴って可能になった、過去のサーヴェイにもとづくマイクロデータを利用した計量分析、ということがある。必然的にこれは社会学プロパーの人間――それも、それまでは「歴史の叙述」という課題を内在的に問う必要に駆られなかった人間――の手によるものが多くなりがちである。

しかし、というか、それゆえに、というか、ここには若干考慮すべき問題がある。「過去に行われた調査のマイクロデータを利用する」とは言っても、ある時代を理解するための歴史資料としてそれを用いたい場合、データセット全体をそのまま素朴に分析対象とすることはほとんどなくて、なんらかの選定・限定をかけた分析にならざるをえないことが大半だ、ということに付随する。

社会調査は、その目的に合わせて調査デザインが行なわれる。たとえばSSM調査も例外ではない。その目的は、マスコミの世論調査程度の精度で、日本社会の全体としての社会移動のレベルを測定することで、それを可能とするサンプル数をきちんとしたランダム・サンプリングにより選定して実施してきた。大勢の調査員に必ずしも指示が徹底せず、部分的に奇妙な回答が混じってしまうことは避けられないが、世論調査程度の精度が目的であるから、それも許容範囲と考えることになる。

だが、データを特定の研究目的に合わせてブレイクダウンして集計することは、かなり一般的に行なわれるようになったとはいえ、厳密に言えばSSM調査のデザインに抵触する利用である。本来の調査目的に関する限りSSM調査自体には問題がないとしても、そのデータを限りなくブレイクダウンして、少ない偏っているかもしれないサンプルでたまたま得られた結論らしきものを誇るのは、誤解を招く可能性がある。とくに調査時点においてすでに「過去」に属する質問に対する回答の精度、信頼性は要検討である。問題は、利用する人がそれを明確に意識して集計・分析・解釈するかどうかにあるのだが、そのためにもやはり、【その(ブレイクダウンを重ねた)データでものを言うのはどうなのか】ということの批判的検討という作業が必須となる。言ってしまうと単純なことだが、同時代の他の社会調査や官庁統計と可能な限りの突き合わせを重ねる、ということである(それもおそらく、自分が扱ったデータ分析の結論らしきものを突き崩す方向での検討を加えたうえで、それでもなおその結論らしきものをディフェンスできるかどうかという検討になるだろう)。

そういう趣旨のことをかつて「計量歴史社会学におけるデータ批判の作法」として提起したことがあった。「データ批判」というのは歴史学における「史料批判」の語を意識したものである。その後、それが大事だということはまあ分からないでもないが、しかし、ではそれは具体的にはどのように実践することなのか、はたして一般的にその作業を遂行可能にするための体系化が可能なのか、という反批判(というか問いかけ)をうけて、それは(反)批判としては妥当なことこのうえないのもだったのだが、それゆえに、そこから先のことを述べることができなくなり、私はしばらく絶句することになる。「史料批判」がそれ固有の体系性を有しているのと同じ精度で「データ批判」の作業を体系化しうるのか。

当たり前のことだが、(そんなすぐには)無理だ。

だから、具体的な研究が生み出されるその度ごとに、その具体的な文脈に即して一つ一つ批判的に検討していくことを積み重ねていくしかない、というのがさしあたりの結論である。事はいまだ一般化しうる段階にない。

【3】さて、最後に、『教育と平等』がそうであったような、利用するデータが新たに構築したマイクロデータでも過去に実施された調査のマイクロデータでもなく、それゆえに分析単位が個人(や世帯)ではない、たとえば官庁統計の集計分類表などをもとに入力したデータを利用した、それゆにサンプルサイズの小さい、「地域」や「機関」が単位となるような計量分析にもとづいた歴史研究があるだろう。ある意味では「お手頃」な方途だが(誰にでもできる作業である)、そのぶん分析視角が研ぎ澄まされていないとどうにもならない類の試みにはなろう。この点において『教育と平等』の問題設定と分析視角はたいへんに鋭利なものであるので、計量的な手法にもとづいた社会学的現代史研究の試みとして、後続に資するための検討に値するといえるだろう。

それが背景である。

というわけで、この本を読むにあたってもデータ批判から説き起こさなければならないだろうと思うわけだが、その作業は先日の研究合宿までには間に合わなかった。そして件のエントリでは少しその作業のとば口に足を踏み入れてみた。

まず、本書と同様の問題関心など苅谷先生以外にもちようもない(ほど独創的なものな)ので、同様の分析を行っているのはいきおい苅谷先生がそれ以前に発表している論考となる。何本かにわたって公刊されているが、通覧すれば同様の(重)回帰分析の結果の数値が異なることにはすぐ気がつく。異なることにはなんら問題はない。むしろ、より妥当な分析を目指して変数化の手続きは改善を重ねていくべきなのだから。ただし問題は、なぜ数値が異なるのかが、論文に内在して判断できない点にある。

たぶん分析モデルに組み入れられた変数のデータ入力にあたって参照した数字が異なるのだろうと思う。一つの可能性は入力にあたって参照した統計数値の「該当年もしくは年度」が異なることである(一年(度)ずれている)。もう一つの可能性は、とりわけ要の変数であるところの「児童1人あたり教育費」が「消費支出」に限定して把握するとされているわけだが(その根拠は論文内で明言されているし、私もそれは妥当な判断だと思う)、その際にどの費目までを「消費支出」に組み込んで計算しているかが微妙に異なるのではないかと推測する(外からみた憶測だから、当然間違っている可能性は高い)。

どのように変数が作成されているかの記述は、通常の計量研究においても当然に重視される内容であるわけだが、この手の歴史研究の際にはいっそう分厚く記述されるべきではないか、というのが私の問題提起である。その記載が不十分な計量歴史研究は、言葉を換えると、【出どころの不明な文書資料】にもとづいた叙述に終始している歴史研究と同等の価値しかもちえない、ということである。オリジナルな歴史叙述の肝となる画期的な新史料にもとづいて叙述するなら、当然にその史料の信ぴょう性(というか、その史料にもとづいた叙述をすることの妥当性)についての検討に相応の紙幅を費やさなければならないのではないか。その程度のことである。

ふたたび言葉を換えていえば、通常の計量社会学にとって変数の内容・構成やデータの説明は「本番の分析の前段階をなす手続き」的な意味合いを帯びがちかもしれないが(そんなこともないかもしれないが)、計量歴史社会学/数量社会史にとっての「データ批判」とは、むしろ【それ自体がすでにデータ分析そのもの】であるという位置づけが与えられるべきものではないか、ということである。プロソポグラフィなどデータ構築作業のプロセス自体がもろデータ批判=データ分析のプロセスとなろう。

過去のデータをいじっていたら自ずと歴史研究になっている、というものではない。

その点でいうと、『教育と平等』はそのあたりの歴史研究としての視角(の独創性の高さ)とデータ分析(の妥当性)の《間》を問題化するに値する――というか、どうしても問題化したくなる先行研究であった。

このままこのテーマで議論を詰めていくとおそらく「計量研究とは何か」「歴史研究とは何か」という議論にまで積み上げていける気はするので、大学院レベルのゼミを一つ開講するぐらいの価値はあるのではないかと思う。

ところで。

最後に一つ、申し上げておきたいことがある。

論文でもそうだし、ここのブログでもそうだが、私が時間を割いて字数を費やし批判の対象に挙げるものはすべて、そのように扱う価値があると私が認めた研究(本/論文/議論...)だけである。およそ価値の認められない研究を批判するという営為の価値とはなんだろう? 批判という営為を支えているのは批判対象への敬意である、というのは私の考える研究者の世界の常識なのだが、違うのか?

苅谷先生の仕事は私にとってつねに批判の対象に値するものである。