中央調査報

トップページ  >  中央調査報   >  以前の調査  >  世論調査データの行方-データ・アーカイブの役割-
■「中央調査報(No.558)」より

 ■ 世論調査データの行方-データ・アーカイブの役割-

東京都立大学法学部助教授  前田 幸男

 内閣府大臣官房が編集する『世論調査年鑑』(平成14年版)によれば、日本国内では2001年4月から2002年3月までの間に507の機関により1455件の世論調査が行われている。その内、国の機関によるものが42件、都道府県によるもの246件、市町村によるもの901件と、行政による調査が全体の八割以上を占めている。残り二割弱の調査は報道機関、大学、専門調査機関により行われている。調査地域単位でみると全国調査が155件実施され、残りの調査の多くは都道府県あるいは市町村規模の調査であることがわかる。抽出台帳別では、住民基本台帳あるいは選挙人名簿から抽出したものが合計で869件となっている(内閣府大臣官房政府広報室、2003)。住民基本台帳や選挙人名簿から抽出された標本に基づく調査は十分統計的分析に耐え得ると思われる。

1. データの行方
 年間1500件近くの調査が行われ、多数の報告書が刊行されているようだが、報告書刊行後に世論調査データが如何に取り扱われているかについては、従来あまり注意が払われなかった。日本においては社会調査データを重要な社会的・学術的資源と考え保存・公開する努力が最近まで組織だっては行われていなかったからである。本稿では、社会調査データを保存し、かつ公開することの意義と、保存・公開関連の作業を行うデータ・アーカイブの役割について簡単に考察する。データ・アーカイブ(場合によりデータ・バンクあるいはデータ・ライブラリーという呼称も用いられる)の形態は様々であるが、「必ずしも統計調査に限らず、いわゆるアンケート調査として実施された社会調査などから得られたデータを保管し、将来における二次的な利用を可能とする機関」(財団法人統計研究会、11頁)と概括できよう。付言すれば、この「将来における二次的な利用を可能」にするためには、データの利用に不可欠な標本設計、調査概要、質問票等の諸文書(メタデータ)をデータと一緒に保存・公開する必要がある。
 欧米では世論調査データ、とりわけ学術的なものについては、研究および教育目的の再利用(二次分析)のためにデータ・アーカイブに寄託することが常識として確立している。また、行政目的で行われる調査であっても、データ・アーカイブを通じて公開されることが多い。米国ではセンサス・データも一般公開されている。アメリカ合衆国の場合、データ・アーカイブは商業目的で設立されたローパー・センターがその嚆矢であり、1946年に設立されている。学術目的では加盟大学の相互利用機関としてInter-University Consortiumfor Political and Social Research (ICPSR ただし当初はSocialがなくICPRであった)が1962年に設立されている。その後、ヨーロッパ諸国においても各国で徐々にデータ・アーカイブが組織された。日本においてもアーカイブの必要性は繰り返し議論されたが、諸般の事情で実現は容易でなかった。小規模ながらリヴァイアサン・データ・バンクが商業ベースでデータの提供を開始したのが1990年である。より強固な組織的基盤を持つデータ・アーカイブの設立は東京大学社会科学研究所(社研)のS S J データ・アーカイブ(以下SSJDA、1998年設立)を待たねばならなかった。
 比較的最近までデータ・アーカイブが存在しなかったことは、裏を返すと、戦後行われた社会調査データの多くが保存されることなく散逸してしまったことを意味している。大規模な学術調査については個々の研究者が保存のために尽力したことにより、現在では再利用のために供与されているものが多い。しかし、過去に研究者が独自に行った地方調査や、官公庁・自治体が行った意識調査等については、現在機械可読ファイルが失われたものが多々存在するのではないかと推察される。
 この点については、大阪府下の四十四市町村の市民意識調査の実態について検討した大谷の業績が参考になる(大谷、2002)。彼らの研究によれば、データを機械可読ファイルに保存して、再分析が可能な状態で維持していたのは全体の一割以下の四つの自治体に過ぎなかった。その背後には、自治体が依頼する調査の場合、従前は集計表あるいは報告書の納品だけが行われ、素データの納入が求められなかったことがあるように思われる。近年は、将来の再分析のために素データが機械可読形式で納入されることも増えてきたようである。しかし、調査会社に調査を依頼した顧客(官公庁、自治体、大学を含む)の側でデータおよびメタデータを保存する努力を行わなければ、長期的には社会調査データは利用不可能になるであろう。
 何故ならば、調査会社は一定の期間経過後にはまず間違いなく個票および磁気データを廃棄するからである。近年個人情報取り扱いに対する意識が非常に高まっていることは周知の通りであるが、この傾向は調査会社がデータを如何に扱うかにも影響を与えている。社団法人日本マーケッティング・リサーチ協会の綱領、および同協会が定める「マーケッティング・リサーチ実施のための品質管理基準」によれば、調査会社はデータおよびメタデータを一年間保管する義務を負う。そして調査を委託した顧客が費用を支出するならば、その複写を提供しなければならない。しかし、この一年間あるいは他に特別に定めた保存期間が経過すると、調査会社はデータを記録した機械可読ファイルおよびメタデータを廃棄することができる。そして、個人情報保護の観点からは正当かつ望ましいことであるが、実際、データは抹消されているようである。即ち、調査を依頼する顧客が自発的に保存の手続きを取らなければ、貴重な調査データは未来永劫失われる。無論、調査目的・対象によっては調査データが永久に利用できないように消去することが望ましい場合もあろう。しかしながら、多くの意識調査については、個人情報さえ厳重に保護されているのならば、政策課題の検討や、学術的のために再利用することが望ましいのではないか。その理由を次節で簡単に検討する。

2.データを保存・公開する意義
 社会調査データは、非常に重要な社会的・政策的資源である。しかし、データの保存・公開には一定の時間・労力が必要である以上、データ保存の意義をここで確認しておきたい。まず第一に、重要な政策課題の検討には過去の調査データの蓄積が不可欠なことがあげられよう。過去の調査データは単純に調査が実施された時点での母集団特性を横断的に示すのみならず、後の調査と質問項目および母集団が共通の場合は非常に有益な情報を提供し得る。例えば近年重要な政策課題となっている少子化の原因を検討する場合を考えて・みよう。この場合、「少子化」がある一定期間における変化を意味する以上、その原因を探ろうとすれば、最低二時点における調査データを用いて、男女の婚姻時期、妊娠・出産のパターン等を比較する必要がある。複数の時点で収集された調査データを用いることで、単純に一時点での横断的データを分析するよりも、少子化の原因についてより詳細な検討が可能になる。即ち、過去の調査データが利用可能な形式で保存・蓄積されることで、現在のデータの利用価値が何倍にも高まるのである。
 また、時系列での検討が不要な場合でも、過去のデータを用いることで対象についてより深い理解を得られる場合がある。例えば、一回の調査では特定の集団について十分な個体を得られない場合でも、諸条件が一定であれば、複数のデータを統合(プール)することで、統計的分析に必要な個体数を確保することができる。人種的・宗教的少数派や健康上特定のリスクを抱えた集団についての検討が必要な場合にはデータの統合は有益な方法であるが、データを統合するためにはデータが利用可能な形式で保存されている必要がある。しかし、喫緊の政策課題が眼前に現れてから過去のデータを利用しようとしても、機械可読ファイルがなければ、さらには標本設計や調査過程について記したメタデータが存在しなければ、データの分析は困難である(Collins 1996)。
 第二の意義は、調査回数の抑制および新規調査の質的改善である。社会調査に多くの費用がかかり、かつ、調査対象者にとって調査に答えることが時間的な負担ならば、同種の調査は少ない方が良い。また調査データは当初の研究課題とは別の問題を検討するために援用できることも多い。調査データが保存・公開されることで、新たな調査を行わずとも新しい分析視角からの研究が可能になるのである。また、仮に新しい調査を行う必然性があるとしても、過去のデータを分析することで、よりよい調査を設計することができるように思われる。例えば、質問文の改善のためには既存のデータを丹念に再分析する必要があるだろう。その場合、仮に特定の自治体で収集されたデータだとしても、測定の信頼性および妥当性を検討するには十分な役割を果たすであろう。
 第三は、純粋に学術的な利点であるが、既存データの二次分析で研究目的が十分達成される場合、研究者はデータ・アーカイブで公開されているデータを利用することで、データ収集・整理に必要な膨大な時間的負担および研究費獲得の必要性から解放される(Parcel, 1992)。また従来の社会調査教育は、学生に質問票の作成、面接、データの入力・整理、データ解析という膨大な作業を一貫して経験させるという負荷の大きいものであった。二次データが利用可能になることで、学部段階での社会調査教育の効率化、ひいては専門家の育成にも良い影響があり得る(稲葉、2000)。
 第四に、データの散逸を防止する意義がある。データを収集した段階での担当者が利用上適切な形式でデータを保存したとしても、同一組織で数年後にそのデータが利用可能であるという保証はない。単純に保存に利用した媒体が破損することもあり得るが、より深刻な問題は磁気保存媒体の変化・技術革新である。磁気テープは言うまでもなく、現段階では私が学部学生時代に一般的であった5インチのフロッピー・ディスクを簡単に読める環境は少ないであろう。また磁気媒体の技術革新の速度が速いほど、機械可読ファイルを維持するコストは高くなるのである。
 しかしながら、少数の大規模学術調査を除くと、多くの社会調査データはデータ・アーカイブに寄託・保存されることもないまま散逸しているのではないか。筆者の知る限り社会科学者(社会学者・社会心理学者・政治学者等)が行う学術調査についてはデータは保存・公開するものという認識が徐々に深まりつつあり、例えばSSJDAに寄託されるデータの数も増えつつある。しかしながら、行政により行われている市民意識調査や特定の政策課題についての調査は基本的に死蔵され、政策目的にすら利用されていないように思われる。貴重な社会的資源である社会調査データは、できるだけデータ・アーカイブに寄託し、将来における政策研究や教育上の利用に供されることが望ましい。

3.データの公開と個人情報の保護
 以上、データを保存・公開することの意義を述べたが、データの公開と個人情報保護との関係についても簡単に検討したい。データの公開・非公開に関する決定は、公開することの便益と非公開とすることの便益を比較衡量した上で行われるべきであろう。場合によっては、調査対象者の個人情報保護という利益は、データを保存・公開することの利益を上回るという判断が下されることもあり得る。しかしながら、公開された社会調査データから個人情報が漏洩する危険性は、殆どの場合、杞憂に過ぎない。データを公開用に準備する段階で、姓名、電話番号等の個人識別子は間違いなく除去される。また直接個人の特定ができなくとも、居住地域、年齢、職業等複数の変数を援用することで個人が特定されることも調査によってはあり得る。その場合は、居住地域や職業の詳細な分類を大きな分類に統合することで、十分に対応可能である。実際、筆者の個人的見聞の範囲内では、公開された社会調査データから面接対象者が特定された事例は皆無である。なお、イギリスでは国勢調査から2%の割合で抽出されたデータを公開するにあたり個人情報漏洩の危険性が検討されたが、その可能性は極めて低いと判断された(財団法人統計研究会、24頁)。
 実際のデータの保存・公開は一定の技術的修練が必要であるが、この点は例えば社研のSSJDAではデータを受け入れるに際して様々な技術的アドヴァイスを与えている。秘匿処理や、古い電子媒体からより新しい媒体への変換についてはアーカイブで行っているので、寄託者が公開データ準備に多くの労力を割くことはないであろう。また変数のコード化等はデータ収集段階から最終的な公開を念頭におけばかなり時間を節約できるはずである。公開用データの準備に興味のある方は拙稿を参照して頂きたい(前田、2002)。

4.最後に
 日本の社会科学は反権力的姿勢を持ち、政策志向型の研究を純粋な理論的研究よりも劣ると位置づけてきたと言われる。ただし、その一方で行政の側もデータの利用を制限することにより社会科学者を遠ざけてきたのではないであろうか。経済学、社会学、政治学といった専門分野の研究者は、多くの場合政策的にも有益な研究をなし得る。米国の例では、ウォルフィンガーとローゼンストーンが商務省の経常人口調査(Current PopulationSurvey)データを利用して行った投票参加の研究は、米国における各州の選挙法制の違いを分析に組み込むことで、法制度設計上にも有益な情報を提供した(Rosenstone and Wolfinger 1978:Wolfinger and Rosenstone 1980)。
 また、近年米国でも問題になっている投票率の低下については、マクドナルドとポプキンが、センサス・データ、経常人口調査、司法省の刑事データを組み合わせることで重要な反論を提出している(McDonald and Popkin 2001)。通常用いられている投票率は、センサスから投票年齢人口を割り出して、分母に使っている。彼らは、その数字が外国人、公民権停止者、投票できる在外市民などを除外した数字であることに疑念を抱き、センサス・データ、経常人口調査、司法省の刑事データを組み合わせることで、投票年齢人口ではなく投票可能人口を割り出し、投票率を1948以降再計算した。彼らの分析によると、一般的議論に反して、1960年代以降には明確な投票率低下の兆候はないのである。現在先進各国では投票率向上が重要な課題とされているが、実はその政策課題の前提となる事実認識が、社会調査データの二次分析で覆されうるのである。
 良質のデータが保存・公開されることは政策研究や教育に良い影響を与えるはずである。明るい選挙推進協会の調査はレヴァイアサン・データ・バンクを通じて公開され、日本の選挙行動・政治参加研究に不可欠のデータとなっている(蒲島1988)。第一生命経済研究所が行っている「今後の生活に関するアンケート調査」は学術目的の一般公開に供されているが、この調査データを利用した政策提言もなされている(財団法人産業研究所、2004)。統計法により利用が制限されている統計調査はやむを得ないとしても、官庁・自治体が継続的に行っている世論調査が保存・公開されるならば学術研究を大いに促進するのみならず、政策的な含意を持つ研究を促すことは間違いない。中央調査社および他の調査会社に委託された社会調査が、今後の政策目的に資する研究や学術研究のために積極的にデータ・アーカイブに寄託されるように願いたい。具体的には、社研のSSJDAで、データの寄託を呼びかけているのでホームページを参照して頂きたい。

東京大学社会科学研究所SSJDAのホームページ:http://ssjda.iss.u-tokyo.ac.jp/

[日本語文献]
稲葉昭英「公開データ利用型の調査教育の勧め」(佐藤博樹他編『社会調査の公開データ』所収)、2000年
大谷信介編著 『これでいいのか市民意識調査』 ミネルヴァ書房、2002年
蒲島郁男 『政治参加』 東京大学出版会、1988年
財団法人産業研究所 『日本人のライフスタイルおよび生活観等に関する調査研究』 2004年
財団法人統計研究会 『国の統計調査に係るデータ・アーカイブに関する研究報告書』 2003年
佐藤博樹・石田浩・池田謙一 『社会調査の公開データ』 東京大学出版会、2000年
内閣府大臣官房政府広報室編 『平成14年版 世論調査年鑑-全国世論調査の現況-』 財務省印刷局、2003年
前田幸男 『ICPSRにおけるデータの寄託から公開まで』 東京大学社会科学研究所SSJデータアーカイブ、2002年

[英語文献]
Collins, Patrick T. "Establishing Data and Documentation Standards for Investigators Who Are Required to Archive Research Data." IASSIST Quarterly 20, no. 3 (1996): 21-23.
McDonald, Michael P., and Samuel L. Popkin. "The Myth of the Vanishing Voter." American PoliticalScience Review 95, no. 4 (2001): 963-74.
Parcel, Toby L. "Secondary Data Analysis and Data Archives." In Encyclopedia of Sociology, edited byEdgar F. Borgatta and Marie L. Borgatta, 1720-28. New York: Macmillan, 1992.
Rosenstone, Steven J., and Raymond E. Wolfinger. "The Effect of Registration Laws on Voter Turnout."American Political Science Review 72, no. 1 (1978): 22-45.
Wolfinger, Raymond E., and Steven J. Rosenstone. Who Votes? New Haven: Yale University Press, 1980.