■「中央調査報(No.683)」より
■ 追跡パネル調査の改善に向けて -全国家族パネル調査の経験より-
西野 理子 (東洋大学社会学部・教授) 全国規模の家族に関するパネル調査(「全国家族調査パネルスタディNFRJ-08Panel」)を、2009年から5年間にわたって毎年実施し、データセットが完成した。本調査は、その名称の通り、全国規模のサンプルで実施された、家族に関するパネル調査である註1。日本家族社会学会の会員有志が時限的な実行委員会を組織して企画し、実査は中央調査社に委託した。本稿では、本調査の経験を手掛かりに、追跡パネル手法による調査の改善点を提起したい。調査法、標本抽出、クリーニング、運営主体の4点に着目している。 1.郵送と訪問留置という2つの調査法の併用 本調査では、郵送と訪問留置を組み合わせて使用した。第1波は訪問留置、第2波から第4波までは郵送、第5波は訪問留置である註2。 パネル調査では徐々に回収数が減っていく「脱落attrition」が課題の1つであり、調査回数を重ねるにつれ回収率は低下するのが一般的である。本調査でも、郵送で行われた第2波から第4波までは回収数の減少が認められる。初回応諾者の1,879名のうち、住所不明になった者や拒否者を除外した対象者全員に毎回協力を依頼したが、アタック数に対する回収率は86%から83%まで低下した。しかし、訪問留置で実施した第5波の回収率は、90%と郵送調査のそれを上回った(表1)。 出典:三輪2013、p.27 通常、郵送より訪問の方が回収率が高くなることが知られている一方で、プライバシー意識が高まっている近年では、逆に郵送の方が回収率が高い場合もあると指摘されている。本調査の経験では、旧来からの指摘通り、訪問の方が回収率が高かったことになる。実際に、66ケース(無効回収も含むと67ケース)は、郵送には1度も回答してもらえなかったが、訪問の最後の調査で回収ができた。これは有効回収標本の3.5%にあたり、無視しえない数である。ただし、本調査は、開始時点で調査への協力に応諾した者のみを対象としており、厳しいプライバシー意識や調査への警戒感がある対象者はあらかじめ抜け落ちているとも考えられる。それゆえ、忘却されやすい郵送より訪問の方が、協力をとりつけやすかったのであろう。 一方で、訪問留置といっても、郵送を併用せざるを得ないのが現状である。本調査でも、外国に転居した1ケースや、事前に対象者が電話で郵送法への切り替えを依頼してきたケースなど、計14ケース(有効回収標本の0.9%)は郵送配布・回収となっている。このなかには、訪問してみたところ、訪問は受け付けないが郵送なら回答するというケースもあった。また、本調査の開始時点になったN FRJ08ではポスティング註3を禁じていたが、本調査の第5波では、有効回収の1.9%にあたる31ケースでポスティングが行われた。ほかに79ケース(有効回収標本の4.9%)が訪問、郵送返却となった。1時点のみの調査であれば、予備標本を準備しポスティングはしないという方針も意味を持つが、パネル調査では他者に置き換えることができない限定した対象者の回答が必要であり、回収数を確保するために工夫を凝らさなければならない。 2.標本の代表性とデータ補正の問題 パネル調査の場合、途中の脱落による標本のゆがみを補正する方法が盛んに議論され開発されているが、標本選抜の時点の脱落も同様に問題となる註4。 近年では少なくない数のパネル調査が全国確率標本で抽出されている。表2に示したように、公益財団法人家計経済研究所の「消費生活に関するパネル調査」の初年度調査では、次年度以降の継続調査への依頼を含めた回答率は41.4%である。「慶應義塾家計パネル調査」(KHPS)は29.8%、東京大学社会科学研究所のパネル調査(JLPS)は、追跡調査であることを事前に伝えたうえで訪問回収し、若年パネル34.5%、壮年パネル40.4%という回収率であった。パネル調査の場合、継続的な調査参加を依頼している点で1時点のみの調査より回収率が低くなるのは当然であるが、3~4割という回収率は、それほど低くはないように思える。 本調査は、1時点の横断調査の回答者に、あらためて継続を依頼するという2段階の依頼を行った註5。最初の横断調査は、全国に居住する2008年末時点で28~72歳の男女の全国確率標本に対して実施された。調査票を訪問で回収する時点で対象者にハガキを渡し、継続調査に応じてくださる場合はサインをして返送いただいた。その結果、1,879名から継続調査に応諾いただき、この回答者標本を第1波として追跡を開始した註6。逆からいえば、本調査の対象とする1,879名は、横断調査に回答した5,203名中の36%であり、全国確率標本9,400名中の20.0%である。全国確率標本から、第1波調査の時点と応諾を確認した時点との2時点で大きな脱落が生じている(田中2014)。 パネル調査の有効回収が全国標本の2割である点は、既存の調査実績と比較して低いと言わざるを得ないが、2段階で依頼したことによる利点もある。回収標本の全国標本としての代表性は通常、基本属性変数を全国の値と比較することで検討される。性別、年齢等の分布を確かめ、ウエイティングなどの補正が必要かどうかが検討される。実際、第一段階の選抜となったNFRJ08は、性別年齢別回収標本数の分布を正規標本と照合し、さらに年齢層別に、配偶状態や同居家族人数、学歴、従業上の地位、住居形態を国勢調査と、世帯年収を総務省統計局の家計調査と比較して、代表性を吟味している(稲葉2010 、永井2010)。そして、本調査では、追跡開始段階での抜け落ちの効果を、第1波の非応諾者から推量することが可能である。「家族についての全国調査」のうち本調査に応諾しなかった3,324名と、本調査標本1,879名とはまったく同じ調査に回答しているので、両者の比較を通じて本調査の回収標本データのゆがみを検討し、具体的な補正方法を提案できる(三輪2012)。実際に、脱落がかなり大きくても、情報がそろえば補正の可能性は大きく開かれる(三輪2014)。 筆者の専門とする家族社会学の領域では、現時点ではデータ補正が普及しているとはいえない状況であるが、海外の調査では補正は当然のように行われており、今後、日本国内においてもウエイティングに関する検討がますます必要になってくるだろう。その際、回収データと非回収データの両方が備わっている本調査での検討は重要な意味をもつものと期待される。 3.データクリーニングの改善 本調査では、データクリーニングの改善を試みている註7。保田時男は、Fellegi and Houtの原則がクリーニングの一般哲学として有効だと指摘している(保田2012)。保田によれば、クリーニングは、異常を検出するeditingの段階と、異常値を別の値に修正するimputationの段階の2つに完全にわけ、それぞれ独立した作業とすべきである。そして、異常検出のルールを設定して適用した後、「データの修正はそれぞれのルールごとに考慮するのではなく、全ルールの適用結果を見てケース単位で修正を考慮しなければならない」(保田2012:92)。 実際に本調査では、なるべく調査票に回答されたままの状態を電子データ化して調査会社から納品してもらい、異常検出のルール設定を実践した。その結果適用したeditルールは最終的には4,419個に及んでいる(保田2013:221)。一見この数は多いかに思われるかもしれないが、第5波のクリーニング時に半数以上のケースは修正が不要であった。回収時点でのデータの質が低かったわけではない。むしろ、保田の提言の意図はクリーニング手法の改善にある。こうしたルールを調査会社等と共有していくことにより、とにかくその場に応じて人と時間と労力をかける作業ではなく、よりルーティン化による効率化が進む一歩になってほしい。そのために、本調査でも、クリーニング過程の記録を詳細に残している。 また、この原則は、論理エラーの修正が領域間で新たなエラーを引き起こすことを考慮しての提言であるが、時点間にも拡張されよう。パネル調査の場合、同じ対象者に対し数度にわたって調査が実施されるので、各時点(波)の調査ごとにデータを修正すると、前回の修正がかえって混乱を招くことがありうる。たとえば、第1波でA、第2波でBという回答があり、第3波以降はずっとBと整合的な回答があった場合、第2波の時点でAにあわせて修正していると、それ以降もずっとAに合わせた修正がなされることになり、全体をみて信頼性が高いBの回答は活かされないことになる。そこで、毎回の調査時点のクリーニングは適切な範囲にとどめ、調査期間終了後の2014年夏に中心メンバーが合宿を行い、検討が必要な全ケースを対象に総括的なクリーニングを行った。事前の第5波調査では、研究者メンバーが訪問調査を行い、必要な情報の確認にあたった。 この最終段階の修正がデータの精度をどの程度高めたかを確認しておこう。現在、東大SSJDAより一般公開・提供されているNFRJ08は、バージョン4.0である。これは、本調査NFRJ-08Panelの第2波のクリーニング過程で見つかった新たな問題点をふまえて、一括した修正が加えられている。この修正内容は保田(2011)に詳しく記されており、5,203ケース中最終的には1,751ケースに何らかの修正があった。この修正後のNFRJ08データのうち、本調査で1度でも回答した1,778名に限定したデータと、本調査で最終的な検討を経て修正後 の第1波の1,778名データとの主要な変数を照合した。 主要変数で不一致、すなわち、修正・更新されたケース数が多いものは、表3に示した通りである。初めて子どもが生まれた年(第1子の年齢)というのは、一般的には間違えずに覚えているように思われるが、実際には間違いが多かった。子どもの人数の間違いを反映しての修正もあるが、子どもの年齢を修正したケースが31あった。必ずしも子の生年を忘れたというわけではなく、調査時点で同居していない子を除外して1番目の子をとらえたり、離別して別居した子を場合によっては除外したりしなかったりしていたケースなどもあった。同じく子どもの人数も間違えるはずがないと思われがちだが、別居の子が抜けたり、再婚で同居した子を入れたり入れなかったりというケースが散見された。 同じく間違いが修正されることが多かったのが、親の健在・死亡の情報である。経験年齢の間違いはさらに多いが、健在・死亡の区別だけでも、単純な記入ミスが相当数あった。実の父母と義理の(配偶者の)父母が混乱しているケースも多かった。義父母と同居してその期間が長くなっている場合など、「親」というと義親の方が念頭にうかぶようである。 重要な修正として、本人の婚姻上の地位で4ケース、本人の就労状況で3ケースも修正された。これらの修正は、調査に必然的に伴う誤差の範囲としてそのまま許容する考え方もある。誤差には標本抽出にともなう誤差のほかに、ある程度の測定エラーが含まれるのは所与である。しかしながら、データを蓄積して精力的にクリーニングを施した場合に、これだけの幅の修正の余地があることは、今後研究の誤差の扱いにおいて考慮に入れておきたい。 4.研究者の関わり方 上記のクリーニングも、調査機関にまかせているところが多いのではないか。昨今では大規模な調査はほぼ専門調査会社に委託するのが一般的である。むしろ、委託しない大規模調査は不可能といっていいかもしれない。プライバシー保護の観点からも、実査は専門機関に委託して、データ分析にたずさわる研究者側に対象者の個人情報が秘匿される分割の方式は適しているといえよう。 実際に本調査でも、対象者の住所情報は調査会社が保管し、研究者側には開示されなかった。ただし、訪問留置の第5波を実施するにあたり、クリーニングの必要のために、情報貸与の正式な手続きを経て研究者側が少数の対象者宅を訪問した。調査会社の臨時調査員となり、住所情報を厳重に管理したうえでのことである。大学の規模や研究助成金の使用方法をみる限り、大学生を動員して全国調査を実施するのは現状では不可能に近い註8。しかしながら、調査の現場の経験が研究者にとって貴重であることはかわらない。また、前節で述べたように、本人の婚姻上の地位などのきわめて重要な点について確認が必要なケースが数十件あり、研究者がニーズを十分に理解したうえで訪問する必要もあった。 なお、本調査の運営主体は、ボランタリーな学術団体の会員のなかからさらにボランタリーに有志が集った組織である。家族の動態を分析するに適したパネルデータを構築すべきという共通の価値志向と熱意に支えられたために組織運営は円滑に進められたが、日本学術振興会の科学研究費助成金なくしては存立しえず、科研費の助成期間という時限が条件となった。また、研究所等の常設のハード組織ならびに常設の事務スタッフが欠けているゆえに、参加したメンバーの負担はどうしても大きくならざるを得なかった。実行委員会のみでなく、40名前後の研究会を組織してクリーニングなどに参加してもらったが、その研究会運営も実行委員メンバーが担った。たとえば調査票も、データクリーニングに多大な負荷がかかることがないよう意識して作成したものの、負担軽減には限りがある。学術的な成果を産出すべき研究者が、成果を得られない時間がかなりかかるデータ作成にかかわるのは、いわば矛盾である。現在の日本では、データ作成自体は研究として評価されず、分析結果を論文等のかたちで公表して初めて成果となる。今後は、かかわった研究者らがデータセットを活用して続々と成果を世に問うてくれることを願ってやまない。 【註】 (1) 調査の概要は、『全国家族調査パネルスタディ(NFRJ-08Panel)報告書』ならびにHP(http://nfrj.org/)を参照 (2) 実は、当初から組み合わせを計画していたわけではない。5年間で2度にわたる訪問留置調査(本調査の第1波と第5波にあたる)を実施することをねらいとし、その間、対象者の住所確認もかねて、毎年郵送で簡易的な調査を組み込んだ。 (3) 何度訪問しても対象者に会えない場合、封筒に入れた調査票と依頼書を郵便受けなどに投入してくること (4) 本調査の脱落の効果については、三輪2012;2013を参照。 (5) 依頼が2段階となったのは、「第3回家族についての全国調査」(NFRJ08)と本パネル調査とが、残念ながら当初から一体化して設計されたものではないからである。 (6) 正確には応諾者は1,881名であったが、第2波調査を開始する前に2名からお断りの連絡があり、追跡標本に入らなかった。 (7) 保田によれば、近年のデータクリーニング研究では、クリーニングcleaningという用語を用いることは少なくなっており、広 義の意味でのエディティングeditingと呼ばれるという(保田2012)。ここでは、保田と同じように、通用語として、データの異常を検出・修正する過程を総称してクリーニングと呼んでいる。 (8) かつて1980年代頃までは、大学に所属する研究者が行う調査は、訪問などの実査も含めてすべて学内で担っていた。学部学生が調査実習の授業で調査に出かけたり、大学院生が指導教員の研究プロジェクトで調査に携わったものである。社会学分野の代表的な全国調査であるSSMも、1955年調査と65年調査は、「調査員 大学」と記載されている(SRDQ:http://srdq.hus.osaka-u.ac.jp/)。その後、75年は「民間調査機関」となり、85年・95年は「民間調査機関・大学」、2005年は「民間調査機関」である。 【文献】 ○稲葉昭英、2010、「NFRJ08のデータ特性:予備標本・回収率・有配偶率」『家族社会学研究』Vol.22,No.2:226-231. ○田中重人、2014、「NFRJ-08Panel 第1波-第5波回収の状況」『家族社会学研究』Vol.26,No.2:印刷中 ○永井暁子、2010、「NFRJ08回答者の基本属性」『家族社会学研究』Vol.22,No.2:232-237. ○日本家族社会学会全国家族調査委員会、2014、『全国家族調査パネルスタディ(NFRJ-08Panel)報告書』 ○三輪哲、2014、「NFRJ-08Panelにおけるウェイトによる脱落への対処」『家族社会学研究』Vol.26,No.2:印刷中. ○三輪哲、2013、「NFRJ-08Panelにおける脱落」『全国家族調査パネルスタディ(NFRJ-08Panel)第一次報告書』:27-32. ○三輪哲、2012、「NFRJ-08Panelにおける脱落とデータ調整」『家族社会学研究』Vol.24,No.1:97-102. ○保田時男、2013、「クリーニングについて」『全国家族調査パネルスタディ(NFRJ-08Panel)第一次報告書』:217-229. ○保田時男、2012、「パネルデータの収集と管理をめぐる方法論的な課題」『理論と方法』Vol.27,No.1:85-98. ○保田時男、2011、「追加クリーニングの概況」『階層・ネットワーク:第3回家族についての全国調査(NFRJ08)第二次報告書』第4巻:161-169. |