中央調査報

トップページ  >  中央調査報   >  日本家計パネル調査における回答負担と回答率の関係について
■「中央調査報(No.820)」より

 ■日本家計パネル調査における回答負担と回答率の関係について


伊藤 翼(慶應義塾大学 経済学部附属経済研究所 パネルデータ設計・解析センター)


1.「日本家計パネル調査(JHPS/KHPS)」について
 慶應義塾大学経済学部付属経済研究所パネルデータ設計・解析センターでは、日本の就業・所得・資産・ウェルビーイングなどの状況とその変化を把握することを目的に、2004年より全国4,005人の成人男女と、その配偶者と世帯を対象に「慶應家計パネル調査(KHPS)」を開始した。その調査実績を活かし、2009年より新たに全国4,022人の男女を対象とした「(旧)日本家計パネル調査(JHPS)」をKHPSと同時並行的に実施した。その後、別々で実施・管理してきたKHPSとJHPSを統合し、「日本家計パネル調査(JHPS/KHPS)」と名称を変更し、今日まで毎年2月に定例調査として実施している。これまで、統合する以前も含め、2007年に1,419世帯、2012年に1,012世帯、2019年に2,203世帯、2023年に1,735世帯のサンプルを補充し、現在では5,143世帯に協力を得ている。
 パネル調査とは、個人や企業などの同一の経済主体を長期的に追跡調査するものである。長期的に同一の質問を繰り返すことによって、クロスセクション・データや時系列データでは把握することができない、その経済主体の変化をとらえることができる。こうした経済主体の変化をとらえることができるパネル調査は、因果関係の識別や政策効果の測定に欠かせないものであり、経済学に限らず、さまざまな学問分野で広く活用されている。日本において、JHPS/KHPSのような大規模な家計パネル調査は少なく、また、国際比較可能な家計パネルデータベースCross-National Equivalent File(CNEF)にデータを提供しているため、国内外問わず多く使用されている。
 JHPS/KHPSの最大の強みは、①大規模な家計調査、②多様な調査項目、③長期的な調査である。先述の通り、JHPS/KHPSでは2025年時点で5,143世帯からの回答からデータが構築されており、配偶者含め家族構成員に関するデータも含まれている。また、性別や年齢などのほかにも就業、所得、教育、健康・医療から社会保険への加入、介護状況、住宅などの多様な調査項目がある。そして、KHPSは2004年、JHPSは2009年から実施されており、基本的な調査項目は、最長で20年に及ぶ縦断データが蓄積されている。そのため、JHPS/KHPSは社会・地域・家族・個人の変化を継続的に把握できる点において、因果関係の識別や政策効果の測定に資するデータ基盤を提供している。
 ただし、パネル調査の実施・管理には実施・維持費用の大きさ、倫理・プライバシーなど、多くの重要な問題を抱えている。その中でも、回答者負担の問題がある。JHPS/KHPSは毎年2月に実施している。2024年度調査では、本体調査だけでも無配偶世帯には42ページ、有配偶世帯には64ページにも及ぶ調査票に回答していただいている。また、東日本大震災や新型コロナウイルス感染症などの災害が起きた際には特別調査を実施しているため、ときには年に3度の調査に協力をお願いしている。実際、1993年に家計経済研究所によって開始され、2017年に家計経済研究所の解散を受けて当センターが継承し、2021年度まで実施されていた「消費生活に関するパネル調査(JPSC)」での終了時における調査世帯へのアンケートでは、「毎年の調査協力の負担」「配偶者や家族への協力に関する負担」の声をいただいた。回答者負担は大規模パネル調査に内在する構造的課題である。回答者負担が大きすぎると、調査からの脱落者が多くなり、継続が可能な世帯のみが協力する形となり、データに偏りが生じてしまう。そのため、調査実施者としてはこうした回答者負担の軽減に積極的に取り組んでいく必要がある。本稿では、調査項目数および回答時間を指標として回答負担を捉え、それが回答率に与える影響を検討する。そのうえで、本センターでのこれまでの取り組みについて簡単に議論していく。

2.JHPS/KHPSの調査項目と回答世帯の特徴
 まず、JHPS/KHPSの調査項目数1と調査に協力してくれた世帯数についてみていく。図1は、KHPSが実施された2004年度から2024年度までの調査項目数と対象世帯数である。調査項目数のカウントには多少の誤差はあるものの、KHPSとJHPSが統合されるまでの間は800項目以下で推移していた。JHPS/KHPSと統合された2014年度調査以降、調査項目数は増加し、2019年度調査では1,400を超える項目数で調査が実施された2。パネル調査では、同じ質問を同一の対象者に複数年にわたり繰り返すことによって、その対象者・世帯の変化をとらえることができるようになるため、一定の項目は削ることがなく、継続的に掲載している。さらに、社会情勢の変化などを受けて、新たな質問項目を追加してきたことにより、1,000を超える調査項目数となった。それでも、調査対象世帯の負担を減らす目的で、2023年度あたりからある程度の調査項目削減を試みた結果、2024年度では1,200を下回る調査項目数となった。

図1 調査項目数と回答世帯の推移

 対象世帯数については、2009年度以降では4,000世帯以上を確保することができている。パネルデータを用いて因果関係の識別や政策効果の測定をするにあたり、サンプルサイズ(調査回答者数)の大きさは非常に重要である。調査に協力してくださる世帯数が少なく、サンプルサイズが小さいほど、正確な分析が難しくなる。そのため、JHPS/KHPSでは、サンプル補充をすることで、大規模なパネル調査を一定のサンプルサイズを確保しながら続けられてきた。また、調査対象世帯については、各コーホートで調査開始時からの約2年間では2割程度の世帯が調査から脱落してしまうものの、その後の調査票回収率はおおむね9割を超えており、多くの世帯に継続して調査協力をしていただけることがわかる。
 次に、表1から調査対象者の特徴について整理する。JHPS/KHPSの対象者は、層化2段無作為抽出法を用いた選定をしている。簡単に説明すると、第1段階では日本全体を人口構成に合わせて調査地域を選定し、第2段階では調査地域から無作為に調査対象適格者を抽出している。そのため、できる限り母集団である日本国民の人口分布や年齢構成などが反映されるように抽出されている。実際、表1の配偶者の有無では、KHPSが実施された2004年度の72.9%から最新の2024年度には64.4%に低下している。また、平均年齢についても20年間で約10歳だけ上がっている。これらもサンプル補充を繰り返すことにより、調査データに偏りが生じないようにした結果である。また、各コーホートの開始年度と最新年度での調査対象者の特徴を比較しても、大きな変化はなく、現時点で確認できる範囲では、特定の属性に偏った脱落が顕著に生じているとは言えない。

表1 調査協力者の特徴(第1回調査から最新回調査の比較)


3. 回答率の傾向
 JHPS/KHPSには、単一回答、記入回答、複数回答と大きく3つの回答形式がある3。そこで、回答形式ごとでの調査項目数と回答率の変化を見ていくことで、回答負担の影響について整理していく。
 まず、単一回答の回答率推移についてみていく(図2)。平均回答率は基本的に9割ほどあり、かなり高い水準となっている。それでも、2014年度から2016年度にかけて回答率が大きく変動していることがわかる。KHPSとJHPSが統合されたことにより、これまで継続的に回答していた質問に加えて、双方で行っていた別々の質問が追加されたことが負担となったことが考えられる。実際、KHPSでは住宅に関する質問が多かったのに対して、JHPSでは健康などに関する質問が多く含まれていた。2015年度は前年度の調査票からほとんど変化がなかったために、回答率が上昇しているが、2016年度調査以降は調査項目数が増加したこともあり、回答率が低下したと考えられる。さらに、この時期から一定の質問が毎年変動していたことも回答率の低下につながった可能性がある。その後、2020年度以降は、調査項目数が安定したこともあり、回答率はわずかであるが回復し、9割を維持している。

図2 単一回答における回答項目数と回答率の推移

 次に、図3の記入回答についてみていく。記入回答は、単一回答や複数回答とは異なり、数字などを記入する必要がある。支出や所得などについては、家計簿や源泉徴収票などを確認し、ときには計算するなどの負担がある。それでも、平均回答率はおおむね8割を超える高い水準となっている。しかし、こちらも単一回答と同じく、2016年度から調査項目数が増加したことに伴い回答率が低下している。また、調査項目数が500を超えた2019年度には、追加された質問の性質や、サンプル補充として新規対象者が加わったこともあり、回答率が2割も下落してしまった。それでも、2020年度からは調査項目数もわずかながら減少していったこともあり、回答率が8割に回復している。ただし、記入回答の性質上、長らく調査に協力して下さっている世帯と2019年度以降から調査に協力して下さっている世帯との間にほんのわずかではあるが回答率に差が出ている。これは、ある程度の「慣れ」というものが影響している可能性がある。

図3 記入回答における回答項目数と回答率の推移

 最後に、複数回答についてみていくが、この複数回答の回答率には多くの注意が必要である。単一回答や記入回答とは異なり、複数回答は質問に対して、該当項目を複数選択することが可能である。そのため、回答率の計算では、各質問に対して一つ以上選択をしていれば回答したこととみなしている。また、質問内容によっては、複数選択であっても該当項目などがなく、回答しないケースも多くみられるため、平均回答率はこれまでの回答形式よりも低く算出されてしまう。図4の平均回答率の推移は、これまでの回答形式と同じく、回答項目数の増加とともに低下している。特に2019年度には110もの調査項目数があったため、回答率は約5割にまで低下した。その後、わずかであるが回復し、回答率は約6割の水準を保っている。

図4 複数回答における回答項目数と回答率の推移

 以上から、調査項目数の増加と回答率の低下との間に関連が示唆された。そして、その影響については、調査への回答慣れが存在している可能性もあるため、データの偏りなどを生じさせないためには、今後、こうした回答負担を減らしてくようにしていかなければならない。

4. 回答時間と回答率の関係
 ここまで、KHPSが実施された2004年度から2024年度にかけての回答率の変遷を見てきた。ここでは、各調査対象者が本調査にどの程度の時間を要しているのか、そして、その時間によって回答率が変化するのか整理していく。
 2024年度調査には、各調査対象世帯に対して、それぞれ、「家族・本人編」「配偶者編」「世帯編」ごとの記入時間を回答してもった。表2は、そのデータを用いて、回答時間がどのように分布しているのか示している。大まかに、9割の対象者が2時間までの間に分布している。特に、30分以上40分未満と1時間以上1時間10分未満の方が多くいる。つまり、多くの方はたいてい30分から1時間程度かけて調査票に取り組んでもらっていることがわかる。これは、コーホート別でも変わらず、調査票に協力してからの年数によって回答時間が短くなったり、長くなったりするような傾向はそこまで見当たらなかった。

表2 2024年度調査における調査対象別の回答時間

 では、このような回答時間によって、回答率に変化があるのか見ていく。図5は、単一回答における調査対象別の回答時間ごとの平均回答率推移を図示している。ここから、10分以上から2時間30分未満では平均回答率が9割を超えて推移していることがわかる。回答時間10分未満では、世帯編での回答率が8割を下回っている。世帯編は調査票の終盤で回答する項目であるために、その負担から回答を避けてしまっている方も少なからずいることが考えられる。一方で、配偶者編では回答時間が10分未満で10割近い回答率となっている。これは、本人編と同じ質問であることから、調査対象者が回答する際に使用した情報などを共有するなどして、回答の効率化などを図っている可能性がある。全体的に、回答時間と回答率の関係はそこまで明確ではないが、回答に1時間以上を要すると、回答率が低下する傾向がみられる。

図5 2024年度調査における回答時間と単一回答の平均回答率

 次に、記入回答についてみていく(図6)。こちらでは、どの調査対象においても10分未満では回答率が低い傾向にある。それ以降は明確な回答時間と回答率の関係は見られないが、世帯編に関してだけは、回答時間が30分未満では明確に回答率が落ちているため、回答にはある程度の時間が求められている可能性がある。

図6 2024年度調査における回答時間と記入回答の平均回答率

 最後に、複数回答についてみていくが(図7)、世帯編の回答項目数は3つ程度しかなかったため、回答率が9割を超える結果となっている。家族・本人編と配偶者編では、5〜6割程度であり、回答時間と回答率との関係はそこまで見られなかった。

図7 2024年度調査における回答時間と複数回答の平均回答率

 以上の結果から、回答時間と回答率の間に一貫した関係は確認されなかった。この結果は、回答時間の長短が必ずしも回答の質や網羅性を直接的に規定していないことを示唆している。それでも、調査票の終盤にあたる世帯編では、回答時間の短さが、回答率の低下につながっている可能性がある。これは「回答疲れ」からくる、回答の簡略化などによるものであると考えられる。

5.まとめと本センターの取り組みについて
 本稿では、JHPS/KHPSの回答負担と回答の関係を整理した。ここから、調査項目数による回答負担の増加が、明確に回答率の低下を及ぼしていることがわかった。また、回答時間と回答率の関係は見られなかったものの、調査票の終盤である世帯編の回答率が低いことから、「回答疲れ」による回答率の低下がある可能性がある。大規模パネル調査において、毎年9割前後の回収率と8割超の平均回答率を維持している点は特筆に値する4。これほどまでに高い回収率と回答率には、調査対象者及びそのご家族の協力があってのことである。今後のこの規模でのパネル調査を維持していくためにも、回答負担の軽減には積極的に取り組んでいく必要がある。そこで、最後に、回答負担の軽減に向けてこれまで本センターが取り組んできたことについて、簡単に整理する。
 本センターでは、これまで回答負担の軽減に向けて、調査項目数が増加し続けないように、毎年センター会議を設置し、調査項目の整理をしている。ここ数年は、パネル調査として支障が出ない程度に調査項目数の削減に取り組んできた。また、その際には、調査項目ごとに回答率を計算することで、回答の難しさなどを把握し、質問や回答形式の設計を見直してきた。その他に、2020年度からはWeb調査票でも回答できるようにしている。Web調査では、選択肢における分岐を自動的にできる機能などがあるなどして、回答負担の軽減が可能となっている。
 今後のパネル調査設計においては、調査項目の取捨選択と安定性の確保の両立が重要な課題となる。そのため、回答負担の軽減に向けた取り組みは引き続き実施していく予定である。長年にわたり調査に協力していただいている方々に継続して参加していただくとともに、新たな対象者にも協力してくださるようなパネル調査の実現に向け、継続的に取り組んでいく所存である。

1 本稿での調査項目数は、設問数ではなく、対象者が実際に答える項目の数である。ただし、複数回答の場合は、複数回答の項目を1項目としてカウントしている。
2 調査票の設問には、隔年や数年ごとに実施されることもあることに留意が必要である。
3 同じ質問であっても回答形式が変更されていることがある。本稿では、そのような質問や調査項目は回答率の計算から除いている。
4 簡単に比較することはできないが、国勢調査の回収率は、インターネット調査も合わせることで8割ほどである。