2014年9月4日木曜日

全国学力テスト(全国学力・学習状況調査)の結果から何を知ることができるのか-都道府県順位や学校順位への関心が高いようだが・・・

25日に、平成26年度の全国学力テスト-全国学力・学習状況調査-の結果が公表された。秋田県や福井県が連続してトップを占めたとか、どの県が昨年度より上がったとか下がったとか、各都道府県の成績の順位が注目されたり、各市町村や各学校の成績への関心が集まっているようだが、全国学力テストの目的は、都道府県や市町村、学校の順位付け(序列化)を目的にしているわけではない。

文科省は、この調査-全国学力・学習状況調査-の目的を次のように記している。

●義務教育の機会均等とその水準の維持向上の観点から、全国的な児童生徒の学力や学習状況を把握・分析し、教育施策の成果と課題を検証し、その改善を図る。
●そのような取組を通じて、教育に関する継続的な検証改善サイクルを確立する。
●学校における児童生徒への教育指導の充実や学習状況の改善等に役立てる。

そして、「全国学力・学習状況調査が実施され、その調査の結果が公表されたが、この公表に関し都道府県・市町村における公表・開示等について多くの議論が出てきている」として、全国学力・学習状況調査における実施方法、公表のあり方について(全国市町村教育委員会連合会)という一文で、この調査の本来の趣旨について説明している。そこでは、「文部科学省は、今回の学力調査を実施する以前から、市町村・学校の公表については慎重の上にも慎重を期するということである。文部科学省の方針どおり全国の教育委員会としては公表しないということで、合意されていると認識している」と言い、「結果を公表しないことを前提に悉皆調査を実施しているが、公表を前提とする実施では、参加しない自治体、学校が出ることも予想され、実施の意味が薄れる」として、「公表するときは、その趣旨や意義、見方などを国民に徹底させると同時に、それぞれの関係する団体・関係者に安心感を与えるものでなければならない」と述べている。

しかし、この調査の目的として述べられていることと、上の説明とは必ずしも整合しない。述べられているような調査の目的を達成しようとするのなら、悉皆調査(しっかいちょうさ)をする必要はない。標本調査で十分である。全国学力・学習状況調査と銘打っていて、あくまで調査であって優劣を判定するテストではないかのような印象を与えるが、悉皆調査をすれば、当然、各学校、各市町村、各都道府県の成績順位が出ることになる。そうであれば、自校や自市町村、自都道府県の成績順位が気になるだろうし、他校、他市町村、他都道府県の成績順位にも関心が及ぶことになろう。

今回の調査には、全国の国・公・私立学校30,643校(小学校 20,395校 中学校 10,248校)が参加している。このうち、公立学校が30,030校(小学校 20,218校-参加率100%、中学校 9,812校-参加率100%)、私立学校457校(小学校102校-参加率46.8%、中学校355校-参加率47.0%)であり、約112万3千人の小学校6年生、約111万8千人の中学校3年生が参加した。

これだけの大規模な調査をどのようにして行ったかというと、いまはやりのアウトソーシング(業務の外部委託)である。どのような業務を委託したかと言えば、以下のようなものである。

〇事業内容
1.事業の実施及び事業の実施に係る一連の計画・体制・仕組みの構築
2.調査資材の設計・作成・梱包・配送・回収・結果提供の実施 ◦調査に必要な情報の整備(各学校・教育委員会との連絡体制)
○調査に必要な資材の設計・作成
○調査に必要な資材の梱包・配送・回収
○調査結果の提供
3.採点・集計作業の実施 ◦採点会場の構築
○採点者の確保
○採点者の事前研修
○採点作業
○集計作業
4.セキュリティ ◦セキュリティポリシーの策定及び徹底
○情報漏えいの防止
5.事業全体の連携・マネジメント

委託先は入札で決められたが、応札(入札に参加)した業者は、小学校対象1件、中学校対象1件である。これで入札と言えるかどうか疑問だが、以下の業者と落札額が決まった。

小学校第6学年の児童を対象とした調査
-株式会社ベネッセコーポレーション 21億3千2百55万円(税込)
中学校第3学年の生徒を対象とした調査
-株式会社内田洋行 24億5千1百75万円(税込)
計45億8千4百30万円


事業内容から見ると、2社に丸投げしていることがわかる。目的とする調査のために約46億円の委託費用が果たして必要であったか疑問である。標本調査であれば、おそらく、その3分の1か、それよりもはるかに少ない費用で実施できたのではないかと思う。

結果の公表などは、国立教育政策研究所という、立派な名称ではあるが一般にあまり耳にしない機関が行っていて、「本研究所は、この調査のうち、教科に関する調査の問題やその解説資料の作成、調査結果の分析や報告書の作成等を担当しています」と同研究所の教育課程研究センターのページに記されているが、委託した事業内容には、「調査資材の設計・作成」も含まれているので、問題作成にも業者が深く関わっていることがうかがわれる。かつて問題になった業者テストのようなことが全国学力・学習状況調査として行われたような感じもするのは穿(うが)ち過ぎか。

国立教育政策研究所は、文科省が入っている霞ヶ関の中央合同庁舎の中にある。ふらっと行って入れるような所ではなく、警備員が入り口に常駐していているなど厳重な警戒がしかれている恐ろしげな所である。

所長1名、次長2名、研究官等59名、調査官等53名、事務職員34名の計148名の研究所で、25年度の年間予算は34億3千4百93万6千円である。しかし、同研究所のウェブの研究者紹介欄には、一般の研究所等と著しく異なっていて、名前(ふりがなは振ってあるが)だけしか掲載されていなくて、経歴や研究歴、研究内容などに関する情報は一切不明である。その理由は、おそらく、研究者紹介欄には名を連ねているが、文科省からの天下りや横滑りで“研究者”として入所した人間がけっこういるからだろう。国立教育政策研究所と堂々たる名称の機関にとって、全国学力・学習状況調査は最重要の業務であろうから、業者に丸投げなどせずに、研究所の総力を挙げて何から何まで自前で行えないものかと思ってしまう。何やら入札業者との結びつきもけっこう強そうな感じがするが、これも穿ち過ぎだろうか。

そんな研究所が公表している調査結果を暇に任せて(というわけではないが)色々といじってみた。

まずは、公表されている問題毎の正答数の分布(全国)を見てみよう。なぜ、そんなことをするかと言うと、平均で比較する場合には、分布が正規分布になっていることが条件だからである。別の言い方をすると、正規分布になっているときに、その集団の特徴や性格を平均というたった一つの数値で表すことができ、集団どうしの比較も意味をもつことになるということだ。そうなっていないときに平均を算出したり平均で比較することはあまり意味がない。正規分布というのは、右の図のように、左右対称のベル型をした分布のことである。ついでに言えば、後で取り上げるが、正規分布では、平均と中央値、最頻値が一致する。

公表された今回の調査結果の中には、下の図のように正答数の分布も含まれている。得点と言わずに正答数と言うところにも、この調査が優劣を判定するテストではないことを伝えようとしていることがうかがわれるが、正答数は、問題によって配点を変える(重み付けする)ことをしないで1問1点と配点したときの得点と見なせばよい。公表されているのは個別の図だが、それらを手間暇かけて寄せ集めて一括表示してみた。見ての通り、正規分布にはほど遠い分布の形をしている。この傾向は、都道府県ごとの集計結果でも同じである。ということは、都道府県間にしろ市町村間にしろ、学校間にしろ、平均正答数で比較して、やいのやいのと言っても、あまり意味がないということである。


学力などは一般に正規分布することが知られている。受験でおなじみの偏差値も、そのことを前提にしている。かつては、よく、大学入試センター試験の受験者の成績分布が新聞などに掲載されたことがあり、きれいな正規分布になっていることを目にした方も少なくないだろう。近年では、その種の情報が提供されていないようだが、大学入試センター法科大学院適性試験の結果だけは、なぜか、得点分布も含めて公表されている。右の図は、平成22年度の結果を1点刻みで私が手間暇かけて作成したものである。ちなみに、受験者数は7,876人で、平均点は53.82点、最高点は97点、最低点は10点、標準偏差は14.70点である。受験者が8,000人弱でも、成績の分布は、かなり正規分布に近いことがわかる。

今回の全国学力・学習状況調査に参加したのは、約112万3千人の小学校6年生、約111万8千人の中学校3年生だから、ふつうに考えれば、法科大学院適性試験の結果よりも、より正規分布に近い成績分布をするはずであるが、実際は、そうではなく、上の正答数分布グラフが示しているように、高得点に偏った分布をしている。この結果から言えることは、全国学力・学習状況調査のうちの教科に関する調査の問題が、入試などのように受験者を序列化するための問題ではなく、その学年に相応と考えられる学力が身についているか/身についていないかを調べるための問題であったということである。そうであれば、成績が高得点に偏った分布をしていることも当然のことであり、いたずらに都道府県間や市町村間、学校間を平均正答数や平均正答率で比較してもあまり意味がないということである。

とはいうものの、せっかく各都道府県のデータが公表されているので、ついでにというか、ちなみにというか、手間暇かけて、というよりは、自分でも呆れるほどに時間をかけてしまったが、試しに平均正答数や平均正答率を整理してみた(以下、最後まで、取り上げる数値は公立学校に関してのもので、私立学校に関する調査結果は含まれていない)。このように整理して何の意味があるかはわからないが、都道府県間の比較への関心に少しは参考になるかもしれない。平均正答率というのは、平均正答数を問題数で割った値である。例えば、10問出題されていて平均正答数が7問だとすると、7÷10=0.7で平均正答率は70%ということになる。

 
小学校の教科ごとの平均正答数と平均正答率の最大値と最小値、その差を見ると、それほど大きいものではないことがわかる。標準偏差は平均からのバラツキの程度を示す数値であり、これが小さいほど平均の近くに多くの都道府県が集まっていることになる。各教科の標準偏差の値は小さいから、都道府県間の差は小さいと言うことができる。
 
信頼区間90%というのは、その間に都道府県の90%が含まれるとみなせばよい。例えば、国語Aの正答数では、11.47~10.47の間に47都道府県の90%(42~43都道府県)が含まれるということである。信頼区間95%であれば、正答数が11.57~10.37のうちに44~45都道府県が含まれるということになる。差の欄は、信頼区間90%と95%のそれぞれの上限と下限の差を示している。正答数の差がわずか1の間にほとんどの都道府県が集まっているということである。国語Bは他教科に比べて正答率の都道府県間の差が大きいが、それでも、その差は10ポイント程度である。
 
 
中学校の教科ごとの平均正答数と平均正答率についても小学校の場合と同じように都道府県間の差は大きくはないと言えるだろう。 
 
正規分布になっていないときには平均で比較してもあまり意味がないといったが、では、何で比較したらよいかといえば、そういう場合には中央値が使われることが多い。中央値というのは、大きい順あるいは小さい順に並べたときに、全体のちょうど真ん中に位置する値である。所得の分布なども正規分布にならないので、国民の所得がどれくらいかを示すときには中央値が使われる。以下の図は、国民生活基礎調査から明らかにされた平成25年度の世帯所得の分布である。偏った分布をしていることがわかる。そして、平均所得では537万2千円だが、中央値では432万円で、その差は100万円以上になる。そして、平均所得金額以下の世帯が全体の60.8%を占めている。平均を押し上げているのは全体の1割程度を占める1,000万円以上の世帯の所得である。国民全体の世帯所得の実状を知るには、平均所得金額よりも中央値の金額の方が適切であり、実感としても納得できるのではないだろうか。
 
 
 全国学力・学習状況調査の結果には中央値も記載されている。実に時間がかかってしまったが、各都道府県ごとの集計結果から教科ごとの中央値を一つひとつ拾い出して都道府県別教科別の表を新たに作成してみた(下の図)。
 
 
平均正答数では細かい順位がつけられるが、中央値で見ると、どの都道府県も大差ないことがわかる。小学校の国語Aでは、11と12の2グループになる。国語Bでは、5と6の2グループ、算数Aでは13,14,15の3グループ、算数Bでは7,8,9の3グループに分けられる。中学では、国語Aでは、25,26,27,28の4グループに、国語Bでは、4と5の2グループに、数学Aでは、21,24,25,26,27、28、29の7グループに、算数Bでは、8,9,10の3グループに分けられる。この差をどう見るかは人によって異なるとは思うが、私には、47都道府県間の学力差は驚くほど小さいと思えるのである。この程度の差しかないというのは、すごいことではないかと思う。
 
では、もう少ししつこく、正答数の平均値と中央値ではどの程度の違いがあるかを両者の相関係数で見てみよう。表中の星印(アスタリスク)は有意水準を表していて、*は5%、**は1%を示す。何のこっちゃ、と言う人は、星印が付いていれば統計的に意味があるというくらいに思ってもらえればいい。 表側(表の最左欄)と表頭(表の最上欄)の各欄がぶつかるところに黄色で網掛けしてある。ここだけを見てもらえればいい。
 

積率相関係数は、正答数の平均値と中央値の数値をそのまま用いたときの関係の強さを示している。平均値と中央値の関係が1対1ならば、積率相関係数は1になる。この数値が大きいほど関係が密であることになり、0であれば全く関係がないことになる。積率相関係数の表の黄色で網掛けしたところを見ると、どれも大きな値になっている。平均正答数が大きいと中央値も大きいということである。でも、ピッタリ同じではない(1ではない)。小学校国語Bや算数A、中学校国語Bでは、他の教科に比べて平均正答数と中央値の関係が弱い。

順相関係数の表は、平均正答数と中央値でそれぞれ都道府県を順位付けしたときに、両者の順位にどの程度の関係があるかを示したものである。順位相関係数の値も大きいほど関係が密であることを示す。平均正答数と中央値での順位が同じであれば1になる。積率相関係数に比べて、順位相関係数の値が小さくなっている教科が多い。これらの教科では、平均正答数で都道府県を順位付けしたときと中央値で順位付けしたときとでは、だいぶ順位が異なることになる。このあたりのことも、よくよく考えて、安易に学力の地域差についてあれやこれやと議論をしない方がよいだろう。

それほど大きな違いがないにもかかわらず、学力の地域差を問題にしたり、順位の高い都道府県を必要以上に持ち上げたりするような風潮には首をかしげざるを得ない。

教育立国とか教育は国家百年の計と言われることが多い。途上国では、いまだに学校へ行きたくても行けない子どもたちが少なくない。そうした子どもたちを私はたくさん見てきた。持っている資質はきっと素晴らしいものがあるに違いないが、教育の機会が得られないままに、その資質を開花できずに終わってしまうことは本当に不幸である。子どもたちは、教えること、学ぶことによって、ビックリするほど成長する。学校で学ぶことがどれほど大事かを私は痛感している。

日本は、早くから初等教育が普及し、学校で学ぶことが当たり前のようになっている。今回の調査でも、学力の地域差は、ことさら取りたてて論じるほどには大きくはないと言ってよいであろう。もちろん、だからといって、教育の充実を図らなくてもよいというわけではない。義務教育段階では、地域の教育学習環境が児童・生徒の学習関心や学力を大きく左右することは言うまでもない。そのために、その地域の児童・生徒の学習関心や学力の向上を阻害している要因を明らかにすることは重要である。しかし、そのことと、全国の児童・生徒を対象に悉皆調査をすることとは別の問題であろう。そうした問題は、悉皆調査をしなくても、既に明らかになっていることの方が多いのではないだろうか。もし、自地域の教育行政関係者や政治家がそうした問題を悉皆調査の結果を見て初めて知ったり考えるようになったとすれば、怠慢の誹(そし)りを免れないだろう。

悉皆調査をすれば、教育政策上の課題が、より明確になるとは言えない。むしろ、弊害の方が多い/大きいのではないだろうか。一つには、悉皆調査の結果が、否応なしに学力における都道府県や市町村、学校の序列化につながることになることである。序列化が必ずしも悪いわけではないが、それまでどれほど真剣に自地域の教育学習環境の問題を考えていたかわからない連中が、教育問題の本質に迫るわけでもなく、教育現場や児童・生徒が抱えている問題の要因や解決のためには何が必要かを詳細に検討することなく、ひたすら学力の順位に拘泥(こうでい)して、無意味な施策を講じたり、そうした施策を闇雲に賞賛・支持するようになることである。

もう一つの弊害は、悉皆調査のための費用が莫大になることである。今回の全国学力・学習状況調査には業務委託費として45億8千4百30万円が使われた。これだけ多額の費用を費やしたにしては、調査内容がお粗末という印象を受ける。しかも毎年実施される。そして、業者に丸投げである。

平成19年度には8社の応札があったが、平成20年度以降は毎年2社(小学校担当1社、中学校担当1社)で、その2社のほとんどはベネッセコーポレーションと内田洋行である。下の表は、文科省の「全国的な学力調査(全国学力・学習状況調査等)」のページから年度ごとの「委託機関の決定等」の説明から拾い集めて一覧表に作成したものである。


平成19年度と27年度に関しては入札金額の記載がない。23年度は東日本大震災の影響等により調査の実施は見送られた。

20~26年度までの費用を合計すると、24,138,527,873円(241億3,852万7,873円)に上る。このうち、10,997,700,000円(109億9,777万円)がベネッセコーポレーションに、10,689,077,873円(106億8,907万7,873円)が内田洋行に支払われている。

全国学力・学習状況調査に最近7年間で241億円を超える費用が投入されてきたことはあまり知られていない。調査内容と調査結果が教育行政にどのくらいの効果をもたらしているのか、検証することが必要な時期に来ているのではないだろうか。さらに言えば、このような調査を毎年実施する必要があるのか疑問である。教育政策の効果が1年で出るとは思えないし、たった1年しかもたないようなデータを集めるのに多額の予算を使う必要はない。調査内容をじっくり検討して、詳細な調査項目を用意し、5年に一度、あるいは3年に一度、少なくとも5年は使えるデータを標本調査で収集することで、全国学力・学習状況調査の目的は十分に達せられるはずである。

<追記>
朝日新聞の朝刊に「ベネッセ、全国学力調査を落札 採点・集計の委託業務」という見出しの記事が載っているのを偶々見つけた。上の文章を書いてすぐだったので、おおっ、と思って目を通してみた。ベネッセが7月に顧客情報の大量流出問題を起こして問題になったからだが、私が着目したのは、すぐ上の表で27年度の入札価格を「記載なし」としていた部分に関して書かれていた次の一文である。

小学校の学力調査は国語と算数の2教科が基本だが、15年4月に実施される予定の来年度は、全員参加で国・算・理3教科と過去最大規模の調査になる見通し。落札価格は契約後に公表されるが、文科省は準備と実施にかかる費用として、今年度予算に前年度比約10億円増の約62億円を盛り込んでいる。

教科を1つ増やすので約10億円増の約62億円を盛り込んでいるというのである。おそらく26年度の調査結果はもとより前年度やそれ以前の調査結果も活かしきれているとは思えないのに、ただ事業実績の積み重ねのためだけに多額の予算を無駄に使っていることに憤りを感じる。文科省はそれだけの予算を調査につぎ込むことなどせずに、その分を一人でも多くの専任教員を増やすことや校舎環境の整備に投じるべきである。その方が、よっぽど教育環境と義務教育の水準向上に役立つであろう。