抽出調査でできないことは全数調査でもできない

【主張】全国学力テスト 学力の向上につなげたい

http://www.chikumashobo.co.jp/new_chikuma/kariya/05_1.html
苅谷剛彦氏が指摘していることを引用しながらこの社説で主張されていることを考えてみたい。
 社説では

 相変わらず一部からは反対が出ている。しかし、全国学力テストでは全国平均と比べて各学校、クラス、自分の学力がどういう状況にあるのかなど、抽出方式では知ることができない点が把握できる。

と主張する。しかし、苅谷氏は、

 一般的に、全員が参加する、いわゆる悉皆調査のほうが、調査対象者の数が多い分だけ、正確な情報を得られると思われがちである。しかし、この検討委員会に出席した委員(発言内容から見てテスト理論の専門家と思われる)の意見は、この常識とは異なる。むしろ、悉皆調査の方が、正確で客観的なデータを取る上で、マイナス面が大きいというのである。ある委員は、こう言っている。
 「客観的なデータを取ることが重要である。悉皆調査で一番懸念されることは、成績の悪い子どもを休ませたり、学力調査の結果において高いパフォーマンスを得るための特別な努力をすることで、データが変質してしまうことである。取ったデータがすでに変質してしまっていれば、それをどれだけ分析しても意味がない」(第3回議事概要)。
 もしも、全国学力調査の目的が、「国の責務として果たすべき義務教育の機会均等や一定以上の教育水準が確保されているかを把握し、教育の成果と課題などの結果を検証する」(「全国的な学力調査の具体的な実施方法等について(報告)」)ことにあるとすれば、データが変質してしまう可能性をもった全員参加というデータ収集の方法は、実態把握をゆがめてしまう。とりわけ、「国は、義務教育における機会均等や全国的な教育水準の維持向上の観点から、すべての児童生徒の学習到達度を把握するための全国的な学力調査を実施することにより、各地域等における教育水準の達成状況をきめ細かく適切に把握する必要がある」(同報告)というのであれば、なおさらのことである。たとえ一般には公表されない――その危険性が全くないわけではないが――としても、学校ごとのテスト結果が教育委員会などに把握されるおそれを抱いた学校が、前述の委員が懸念するような行動を取れば、とくに学習に困難を来している生徒たちの情報は正確さを欠いたものになってしまうだろう。そうなれば、このテストの目的である、「教育の成果と課題などの結果を検証する」上での判断を読み誤ることにもなりかねない。
 「きめ細かく適切に把握する必要」を充たすには、全員参加のテストではなく、1〜10%抽出程度のサンプリング調査でも十分な精度が得られる。いや、むしろ、後述のテスト問題の多様性という問題と絡めても、費用の問題や、学校ごとの序列化を防ぐという意味合いから見ても、サンプル調査の方がゆがみも少ないし、問題点も少ないのである。

と指摘する。
 社説では、

 3年前に公表された経済協力開発機構OECD)の調査など国際比較調査では、世界トップレベルと信じられてきた日本の学力低下が裏付けられ教育界は大きなショックを受けた。

という。苅谷氏は、

 今回のテストでは、同一学年には同一の問題への解答が求められる。つまりは、全国の小6、中3のそれぞれ全員を、同一のテスト問題を使ってその学習達成度を評価しようという仕組みである。これも、一見すると「正しい」方法のように受け取られているが、専門家の意見は異なる。
 少ない時間で一斉にテストを行う場合には、どうしても出題できる問題の数が限られる。そのため、そこで出された問題で測定できる範囲や種類の「学力」しか評価できない。それに対し、近年、他の先進国で実施されているのは、異なる問題セットを用いたテストによる学力評価である。日本でも有名になったPISAや、TIMSSといった国際調査でも、あるいは、アメリカで行われている全米学力調査(NAEP)でも、複数の問題セットを用いることで、幅広い出題範囲をカバーする。と同時に、高度な統計手法を用いたテスト分析の手法を使うことで、異なる問題群に解答した集団に対しても、標準化した得点を算出できるようになっている。
 ある専門家は、検討会議の場で、その利点を次のように言う。
 「全米学力調査(NAEP)においては、数学の問題を12ブロックくらい作り、それらをうまく組み合わせて複数の問題冊子とすることにより、生徒の負担軽減を図ると同時に、最低限評価したいものをカバーするといった技術的な努力をしている。全国的な学力調査の目的に即して考えた時に、複数の問題冊子を取り入れることは有効と思う。技術的には、事後的に問題の難易度を等化することによって比較可能なものにするなどにより、検討の余地があるのではないか」(第 4回議事概要)。
 このような方法がすでに国際標準になっており、他の先進国では実際に用いられている。この発言にもあるように、生徒にとっても負担軽減になり、予算も少なくてすむ。しかも、全国すべての児童生徒たちを、同じ物差しで序列づける危険性を回避できる。このようなテストの方法があるのに、それを用いない。4月24日に実施される日本の全国学力テストは、こうしたテスト技術・テスト研究とは無縁の、旧態依然とした「全国学テ」の方法を踏襲している、と言わざるを得ないだろう。

と指摘する。
 社説では、

 東京都では独自の学力テストを行い、区市町村別の成績を公表し、小金井市など上位の学力向上策は他校の参考になっている。文科省は今回の結果の公表を都道府県別成績にとどめるが、成績の良い学校の取り組みなど大いに参考にすべきだろう。

 ペーパーテストと合わせて早寝早起きなど子供の生活や学習環境などの調査も行われ分析される。結果の評価を躊躇(ちゅうちょ)せずに行い、成績が悪ければ授業方法を見直すなど、各学校はこれを学力向上の好機とすべきだ。

と主張する。
 苅谷氏が、

 「すべての児童生徒の学習到達度を把握するための全国的な学力調査を実施することにより、各地域等における教育水準の達成状況をきめ細かく適切に把握する必要がある。これにより、国の責務として果たすべき義務教育の機会均等や一定以上の教育水準が各地域等において確保されているかどうかをきめ細かく適切に把握することが可能となる。
 これに加え、各学校等における教育条件の整備状況や、意識調査等の実施による児童生徒の学習意欲、生活の諸側面や学習環境等についての状況を把握するとともに、これらと学力との相関関係等を多面的に把握・分析することなどにより、これまでに実施されてきた教育及び教育施策の成果と課題などその結果の検証を国の責任で行う必要がある。
 さらに、その検証結果を活用してこれまで実施してきた施策の見直しや新たな教育施策の策定につなげることなど、国が実施している施策の改善などに結び付けることができる。」

という検討委員会の報告から引用しているように、全国学力テストは、
「これまでに実施されてきた教育及び教育施策の成果と課題などその結果の検証を国の責任で行」い、「その検証結果を活用してこれまで実施してきた施策の見直しや新たな教育施策の策定につなげることなど、国が実施している施策の改善などに結び付けること」を目的として行われる。
 学力テストは、単に「成績が悪ければ授業方法を見直す」ために行われるのではない。その程度のことは社説で「東京都では独自の学力テストを行い、区市町村別の成績を公表し、小金井市など上位の学力向上策は他校の参考になっている。」と指摘しているように、各自治体ごとの学力調査で十分に対応できる。
 これまでの抽出調査でも各地の学力テストでも国際的な調査でも解決すべき課題が何かは明確にされてきている。それでも未だにその課題克服する方向に向かっていない。全国学力テストでそれを変えるには、これまで実施されてきた学力テストではなぜ課題を克服できないかを検討し、改善を施すべきだろう。そういうことが全く行われていないのに、どうして、「学力向上の好機」とすることができるだろうか。