中央調査報

トップページ  >  中央調査報  >  「消費生活に関するパネル調査」の現状と課題
■「中央調査報(No.647)」より

 ■ 「消費生活に関するパネル調査」の現状と課題

坂口尚文(公益財団法人 家計経済研究所・次席研究員)


 「消費生活に関するパネル調査」は、公益財団法人 家計経済研究所が1993年に当時の若年女性(24歳から34歳)を対象として開始したパネル調査である。このコラムが掲載されている2011年9月は、ちょうど第19回目の調査を実施している。本調査の英語調査名は “The Japanese Panel Survey of Consumers” である。以下では、英語調査名の頭文字をとってJPSCと表記する。
 パネル調査とは、同一個人を複数回にわたって追跡する調査である。振り返ってみると、JPSCが始まった1990年代前半には、全国規模のパネル調査は日本にほとんど存在していなかった。当時は調査の概要や結果を紹介する際に、まずはパネル調査とは何であるかから事細かに説明する必要があった。そして、「この調査結果はパネル調査でしか分からない」とアピールできることこそがアドバンテージでもあった。しかし、2000年代に入り、多くの大学や研究機関もパネル調査を開始するようになった。パネル調査という調査を実施していることは、もはやJPSCだけの専売特許ではなくなっている。パネル調査実施の比較優位が薄れたことは少し残念ではあるが、JPSCが社会科学の分野においてパネル調査の意義・有用性が広く認知される礎の一つとなったこと、またJPSCと他のパネル調査との比較・検証の可能性が開かれたことは、調査実施機関として喜ぶべきことである。
 日本にパネル調査が普及した現状を考えると、筆者がここでパネル調査自体について改めて説明することは、このコラムを読んでいる多くの方々にとってもう聞き飽きた話なのかもしれない。調査実施の経緯から、多くの読者にとって有意義な情報となるものは何であろうか。JPSCの特徴として言えることは、日本では歴史が古く、現在も進行中のパネル調査ということである。調査を続けていく限り、この事実がJPSCの看板であることに揺るぎはないだろう。もちろん、単に「元祖」という名目的な価値だけではない。一般的に、パネル調査はデータの蓄積がすすむことで情報量に一層の価値が出てくる。そのため、20年近く毎年途切れることなく調査を続けられたことは、それ自体が一つの達成である。一方で、長年調査を継続してきたことにより、調査およびデータには様々な「疲労」が蓄積している。そこで、先行したパネル調査が直面する課題について示すことは、他のパネル調査実施機関や今後調査を検討している機関への一助にもなると考え、JPSCがどのような課題に現在直面しているかについて、ここでは3点ほど述べることにしたい。
 その前に、JPSC の概要について簡単に触れておく。調査の概要については、過去の「中央調査社報」にも、パネル調査の利点も交え紹介記事が掲載されているので、そちらも参考にして欲しい※。

坂本和靖, 2004,「消費生活に関するパネル調査の紹介と概要」中央調査報No.560

1.調査の概要
 JPSCの調査対象は、1993年に24~34歳の女性1,500人でスタートし、その後間隔をあけて3回ほど、対象者の年齢が連続するように若い女性を調査に追加している。現在は20歳代半ばから50歳代前半(1959~1984年生まれ)にわたる幅広い年齢層の、約2,000人の女性が対象となっている調査である。
 調査の主な目的は2つある。1つは、「消費生活に関する」という調査名が示すとおり、収入、支出などの家計についての情報収集である。調査の対象を女性にした理由は、多くの世帯で女性が家計の運営や家族生活の中心であろうと考え、世帯の状況を正確に把握できると予想したからである。よって、本人だけでなく配偶者や子ども、親などの情報も詳細に収集している。JPSCのもう1つの目的は、女性のライフコースを長期にわたり捕捉することである。JPSCでは女性を20歳代半ばから追跡調査している。若年女性の多くは転職・結婚・出産等の様々なライフイベントを経験する。これらのライフイベントに女性たちがどのように対処してきたかを、JPSCでは詳細に把握することができる。むしろ、調査開始時はこれらのイベントの把握に特化した調査であったといってもよく、結婚、出産、育児の設問の数と内容はかなり手厚いものとなっている。特に、調査開始の1990年代以降は、雇用形態の多様化や少子化、未婚化など日本の社会構造が大きく変化した時期といわれる。その期間に調査をオンゴーイングで実施し、変化する状況を観測していたことの意義は大きいだろう。
 人々がたどるライフコースのパターンは、各人の「選択」と「帰結」が積み合わさったものとして形を現す。ある「選択」の後、各人がどのような人生を歩んでいったか、その「帰結」が分かるまでは相当の時間を要する。調査から20年近くを経て、ようやく「帰結」の一端がうかがえるようになってきた。JPSCはパネル調査としての成熟期を迎え始めている。

2.調査の長期化により直面している課題
2.1.加齢への対応
 調査の長期化で、JPSCにはいくつかの問題が表れ始めている。その一つは対象者の加齢、つまりライフステージの変化に応じて適切な質問をどう組み替えるかである。JPSCでは対象者を順次、追加してきたため、20歳代後半から50歳代前半ばまでと、生産年齢人口の半分、かつその中核ともいえる層をカバーできる調査となっている。対象年齢の拡充は、JPSCの一つの主眼である、日本の家計の実態を捉える目的からは望ましいことである。また、幅広い年齢層が含まれていることで、世代間の比較も可能になっている。しかし、年齢層の広がりは、JPSCのもう一つ目的である女性のライフコースの軌跡を効率的に把握することを難しくもさせている。
 JPSCでは費用・管理の面から、現在どの年齢の対象者に対しても配偶状態別に同一の調査票を使用している。一定の条件分岐はあるものの、尋ねている設問は原則として全対象で同一のものである。当初は若い女性を対象にしていたことから、結婚、出産、育児に関する質問項目が多いが、初回から参加している、現在40歳代から50歳代の対象者は既に出産、育児期を終えている者が多い。ライフコース捕捉の観点から考えれば、中高年期に直面するライフイベントとして、子どもの教育・進学、親の介護、夫・本人の退職前後の状況も詳しく調査し始めるべきなのだろう。JPSCでは紙ベースの調査票を使用しているため、現実的には一回の調査で盛り込める項目数に上限がある。新規の項目を追加する場合には既存の質問をある程度カットしなければならない。このことがライフステージに合わせた対応へのネックになっている。対象者のライフステージに則した質問を行うには、対象の年齢等によって配布する調査票の内容を変えることは一案ではある。ライフコースが多様化している現在、結婚・出産の時期も分散している。40歳で20歳の子どもがいる対象者もいれば第1子を出産しようとしている対象者もいる。また、年の離れた男性と結婚する対象者もいれば、30歳代で親の介護に直面する対象者もいる。前回調査で捕捉した情報、例えば本人や子どもの年齢だけを用いて、各対象者が該当する設問をこちらが事前に選別することは難しい。コンピューターによる調査画面の活用を考えれば、対象者自身の回答に応じ、リアルタイムで適切な設問を適宜組み替えて対象者に提示することは可能であろう。調査票のページ数という物理的制約もある程度は回避できる。しかし、対象者全員がコンピューターを使えるのか(環境・能力)といった別の、しかも調査設計に関する根幹的な問題が発生する。現状では、中高年期に特有の項目は既存の設問の中に限られた項目を追加する形で対応しているが、よりよい対処法がないか常に模索している。

2.2.回答者の脱落
 調査の長期化による第2の課題は、対象者の調査からの脱落の問題である。諸外国を含め他調査の事例をみても、パネル調査では対象者の一定の脱落が避けられないものと考えられている。対象者が脱落することの大きなデメリットはサンプルサイズの縮小である。JPSCの回収率は、各年齢層とも調査2回目以降、毎回ほぼ95%と高い水準を維持している。調査員が直接、配布、回収する訪問留め置き法であること、相応の調査謝金を支払っていることの影響が大きいといえる。また対象が女性のみであることの効果も大きいだろう。対象に男性を含めた他のパネル調査では、回収率がほぼ8割台だからである。ただ毎回5%の脱落であっても、20回も調査が経過するとサンプルは初回の約半分になっている。調査期間が長期にわたるほど、わずか1%の違いもその後の残存数を大きく左右することになる。
 脱落の問題は、サンプルサイズの縮小だけにとどまらない。ある特定の層だけが調査から脱落し続けると、結果として調査に残っている層にも偏りが生じる。年収の増減など状態の変化は回答を継続している対象者の値しか観測できないため、一定の層のみが脱落し続ける状況が続くと、調査結果の信頼性を損なうことになる。JPSCでは学歴間での脱落率の相違は各調査年で若干あるものの、調査に残存している者の学歴構成比は調査期間を通して大きく変化していない。年収については脱落者と残存者で、調査年によって前年年収に大きな違いがある年がある。年収が高いから脱落、低いから脱落とどちらかの層が一方的に落ちているわけではないが、これまでの調査全体を通してみると所得の高い層が調査に残っているようである。
 脱落によるバイアスを事後的に補正する方法は、いくつか考案されている。ただ補正に際して様々な仮定をおかなければならないため、いずれの方法とも一長一短がある。そもそも年齢、学歴、年収、何に対してバイアスが生じているのか。原理的には尋ねている質問の数だけ考慮することができる。このような点から、バイアスの補正をするしないを含めて脱落への対応は分析者にゆだねている。調査実施者として対処できることの一つは、脱落そのものを抑制することである。JPSCでは回収率を維持するため、調査実施時以外にも年賀状を送付したり、調査結果を分かりやすく紹介したパンフレットを作成し送付したりするなど、定期的に回答者にコンタクトをとるようにしている。また主要変数については、脱落の傾向などを報告書等でまとめ情報を公開している。

2.3.データのユーザビリティについて
 最後は、調査の長期化に伴う最も大きな課題である。それは、有用な情報が膨大なデータの中に埋もれていくことである。パネルデータは時間という軸がある分、クロスセクションデータに比べて一般的に複雑な構造となっている。情報の蓄積が進みデータの有用性が高まれば高まるほど、分析者はデータの扱いに骨が折れるジレンマに陥ってくる。多額の費用と時間をかけデータを収集し保存しても、活用されないまま放置されたのでは何の意味もない。
 弊所ではJPSCのデータを学術関係者に公開している。確かに、ユーザーからは分析開始前のデータセットの作成が一苦労であるとの指摘を受ける。またユーザーの研究成果を見ていると、データセットの作成段階で力尽き、本来の分析計画まで手が回らなかったと思しきケースも多々ある。パネルデータの分析に用いる複雑な計算は統計パッケージの関数群が実行してくれても、読み込ませるデータセットは自分で作成しなければならない。パネル調査の分析では、往々にしてこのデータセットの作成に手を焼くのである。
 弊所では、原則、調査年毎にその年の調査からデータを作成し追加しているため、リリースデータでは一つのファイルに一調査年のデータだけが納められている。一つのファイルを開けばそれがすぐにパネルデータという構造にはなっていない。よって、パネル分析を行いたい分析者は各ファイルを縦なり横なりに結合し、自身の用途に合わせたデータセットを作成しなければならない。コンピューターのプログラミングにあまり慣れていないユーザーは、この段階で立ちすくんでしまう。2、3年のデータであれば力技での処理もできるだろうが、20年すべてのデータを活用するとなるとコンピューターの力を効率的に用いなければ多大な労力がいる。
 また、単年度のクロスセクションデータとして見た場合でもJPSCは相当な情報量を持った調査である。JPSCの調査票は毎年60ページを越える分量がある。同じボリュームで20年近くのデータが蓄積されたため、データセットに収録されている質問=変数の数は膨大なものとなっている。これまでに割り振ってきた変数の数は4,000を優に越え5,000に迫る勢いである。個々のユーザーが分析で実際に使いたい変数は、このうち1~2%であろう。多数の変数群の中から自分が使いたいと考える変数までのアクセスが大変である。JPSCは調査内容を変えた際は、変数のラベルを変えている。ある特定の調査年の調査票から設問に該当する変数のラベルまではたどれても、全調査期間中に設問にどのような変遷があったのか(なかったのか)を知ろうとすると、作業量は膨大にならざるを得ない。
 JPSCのデータが蓄積されたことによって、ライフコースを分析することへの関心が、今後より一層高まると思われる。しかし、JPSCにライフコースを表す変数が直接、用意されているわけではない。ユーザーは自分で必要な配列情報を抽出し、データを構築しなければならない。特にライフコースを分析する上では、調査開始以前の状態や対象者の家族の情報も必須なものとなる。JPSCでは最も若くて24歳から調査を開始する。調査期間内のデータだけを用いると、早く結婚、出産した人の状況が掴めない。調査が始まる前の状態に関しては、付随情報を用いる必要がある。就業状態であれば、各年齢時の就業状態を回顧調査で尋ねている。出産履歴などは子どもの年齢から逆算して個々の対象者の履歴情報を作成することが可能である。また、JPSCでは世帯員の情報も成員別にかつ詳細に把握している。世帯員情報も調査を重ねるごとに蓄積されていくため、あたかも対象者のパネル調査の中に世帯員のパネル調査を包含したような形になっている。このように、ライフコースを語る上で有用な履歴や世帯員の情報が確かにデータの中に存在している。だが、情報が存在することと実際にそれを抽出、分析することの困難さは全くの別問題である。履歴情報は調査年以前、世帯員情報は対象者以外のものであり、調査年と対象者を基準に構成したパネル調査の構造からは本来外れるデータなのである。ライフコースを分析する場合は、変数や対象者個々人によって長さの異なる配列を扱わねばならず、それにはデータに対する一定の知識や長年の経験が必要とされる。知識や経験はコンピューターの発達によって代替されるものではなく、むしろ発達により高度化してしまった感がある。
 データの価値は、データから有用な情報を引き出し、分析結果をどれだけ社会に還元できるかに比例する。調査回数が少ないうちは、情報の抽出はユーザー側の努力で対応できたのかもしれない。調査が長期化しデータが複雑化したことによって、JPSCから得られる有用な情報のいくつかは、JPSCに精通し、かつデータハンドリングに熟練していないともはや取り出せない状況になりつつある。一休さんの虎の話と逆で、「屏風から虎を出してあげますから、ぜひ捕まえてください」という環境を用意しないと、JPSCは(潜在)ユーザーからそっぽを向かれてしまうだろう。個々の分析者が自身の関心領域に集中できるよう、附属資料の整備を含め、蓄積されたデータのリファクタリング(再整理)を行うことが急務の課題である。

3.おわりに
 以上の3点は、調査の長期化に伴い面している課題の主なものであり、この他にも有象無象の問題がある。日本では、まだパネル調査実施の歴史が浅いことから、これらの諸問題について本格的に議論される機会は多くなかった。パネル調査は、一旦、調査を実施し始めたら、途中で大幅な変更を行うことが難しい。そろそろ、パネル調査独自の方法論が日本でも活発に議論されてしかるべきだろう。その際、JPSCが先行事例の一つとなれば幸いである。また、従来、社会調査を設計する場合は、何を尋ねるかといった調査内容ばかりに焦点が行きがちであった。ただ、調査が長期化すればデータは必ず複雑化する。現在、関心のあることを網羅的に尋ねるだけでなく、中長期的にみたデータの在り方を常に念頭においた調査設計もすべきである。データの構造および格納の形式、そしてユーザーのデータへのアクセスの仕方等、データをデザインする思想がなければ、長いスパンでみると大きな困難が待ち受けている。何に特化した調査であるかを認識して描かれた良いデザインは、調査の特性を十二分に引き出すことを可能にする。

 JPSCが調査回を重ね有用なデータとなっていること、そして高い回収率を維持できていることは、対象者の継続的な回答協力と調査員の働きかけ、並びに調査の実施を取りまとめている中央調査社のご尽力の賜物である。ここに記して感謝の意を表したい。