最初のチェックをすり抜けた「機械音」の解答。都教委の説明が事実なら、それらの解答の一つひとつを、2人の採点者が耳で聞き、並行採点をして結果を出したはずだ。複数の人間が、シャーという機械音に気づかないことなどあるのだろうか。
「問題のある解答の採点に関わった複数の採点者が、誰ひとり機械音の解答に気がつかないままで採点を終わらせたことも信じられません。本当に厳正な採点が行われたのかという疑いが生じてしまいます」(羽藤氏)
採点ミスが知らされたのは、願書提出締め切り前日の2月6日。14日に再提出ができるとはいえ、突然の採点ミスの連絡に受験生は戸惑ったはずだ。なぜこんなタイミングになったのか。
「解答音声を希望者全員に開示することになったからかもしれません。成績を出した後で、開示に備えて事業者が解答音声を確認した結果、ミスを公表せざるを得ない事例が見つかったのではないでしょうか」(同)
さらに、テストの等化が適正に行われたのかとの疑念も指摘されている。
本試験と追試で平均点が約9点も違う
今回のように本試験と追試・再試験が行われる予備日で「同じ仕様で異なる問題」が使われるテストでは、二つのテストの難易度や、採点の「あまさ・からさ」をそろえる統計処理(等化)が必要となる。受験者の能力を、「同じものさし」で比べるための作業だ。
本試験(平均60・77)と予備日(同52・16)の平均点が、8・61違うことに疑問をもったアオヤギ有希子議員(共産党)が、都議会文教委員会でこれら二つのテストを「等化したのか」「したならどのようにしたのか」を質問した。だが都教育庁の瀧沢氏は、「質問の趣旨が正確にわかりかねる」として答えなかった。羽藤氏は言う。
「ここははぐらかすのではなく、『等化している』と断言しなければならなかった場面です。本試験と予備日の間に生じた大きな平均点の差は、受験した生徒の能力の差を表すものであり、『問題の難易度や採点のあまさ・からさは影響していない』と都教委が断言できないようでは、異なるテスト版の成績を比べて合否を決めることはできません」
もし、予備日の問題の難易度が高かったために、平均点が大幅に下がったのならば、予備日の受験生が不利になる。
さらに羽藤氏は言う。
「等化された複数のテスト版を作るには高度な専門知識と入念な準備が必要です。今回のように全ての問題を公開しながら、たった3回のプレテストを行っただけでそれが可能とは常識的には考えにくい。このような状況で、本試験と予備日の平均点に大きな差が生じた場合は、事業者が行った等化がうまくいっていないことを疑ってみるべきです。しかし都教委には、事業者の仕事を検証しようという姿勢が見られず残念です」
試験後に保護者や専門家から湧き上がった平均点に関する疑問は、これだけではない。
今年度の平均点は、これまで3年間のプレテストに比べて、おおよそ7点アップしている。都教委は「教育の成果」と発表しているが、羽藤氏は首をかしげる。
「リーディングやリスニングならまだしも、スピーキングにおいて東京都の中学生全体の能力がたった1年間で跳ね上がったと見るのは非現実的。やはりここでも、異なるテスト版の等化がうまくいっていないことをまず疑ってみるべきだと思います」