早稲田大学教授 三枝 幸夫 著
TOEIC® L&R TEST は年々受験者が増加し,今では,2千数百社にのぼる日本の大企業や有名企業が採用試験や配属部署の参考のために採用したり,多くの大学が,学生に受験を促したり,受験対策講座を設けたりしているほどです。書店には,TOEIC 受験対策本や学習ソフトが溢れています。TOEIC 受験対策講座を設けている英語学校も数多く見られます。しかしながら,受験者や学習者の中には,TOEIC の試験内容や学習方法を誤解していると思われる人も,まだまだ多いようです。
このサイトでは,開発当初から TOEIC にかかわってこられた早稲田大学の 三枝 幸夫 教授に,TOEIC の持つ意味合いやその正しい利用法,学習法などをご執筆いただきます。お役立てください。* この記事は,弊社発行のメールマガジン 『目からうろこがボロボロ落ちる 《英語の正しい学び方》』 に掲載されたものです。
Copyright© 2000- SAEGUSA Yukio
TOEIC is a registered trademark of Educational Testing Service (ETS). This publication (or product) is not endorsed or approved by ETS or The Chauncey Group International Ltd. The TOEIC Program is administered by The Chauncey Group International Ltd., a subsidiary of Educational Testing Service.
言語学習をする場合には,学習項目は同じであっても,それぞれの学習レベルによって重要度が異なることは,だれでも経験的に知っている。たとえば,入門期に流暢に話そうと思ってもしょせんはできない相談であるし,上級レベルになって発音の基礎を学習しようとする人は,特殊な場合は除いて,まずいないであろうし,またその必要もない。このように,学習レベルと学習項目の間には密接な関係がある。
図は,学習レベルと各学習項目の貢献度の関係を示したもので参考になる。 1)
ここでは,学習に大きな影響を与える学習項目として,語彙(vocabulary),文法 (grammar),発音 (pronunciation),流暢さ (fluency),社会言語学的要素 (sociolinguistic) の5つの要素を挙げている。社会言語学的要素とは,たとえば,a truant officer(学校をずる休みして街を歩き回っている生徒を補導する補導係),a sign-out sheet(構内から退出する際に署名する退出簿)などのように,特定の社会環境で使われる言語表現の中に見られるものである。
図の横軸に示されている言語能力レベルはだいたい次の通りである。
Level 0 | 言語能力ゼロ |
Level 1 | 片言で何とか用が足せるレベル(高校レベル) |
Level 2 | かなり高い学習レベル(大学レベル) |
Level 3 | 実用レベル |
Level 4 | 最高実用レベル |
Level 5 | 教育ある native speaker のレベル |
縦軸の数字は,学習に対するそれぞれの学習項目の貢献度を比率(percentage)で示したものである。これは学習の絶対量を示したものではなく,学習の絶対量は低い能力レベルでは少なく,高い能力レベルではきわめて多くなる。
この図によると,各学習レベルにおける学習目標は次の通りである。
語彙の学習(45%)が最重要であり,これに次いで重要なのが文法の学習(30%),発音の学習(17%)である。このレベルでは,何はともあれ基本語彙を丸暗記しなければ一歩も先に進むことができない。文法は動詞・名詞・形容詞・副詞などの変化形・5文型などを含む基本文法である。
文法と語彙の学習の重要度が逆転し,文法(40%)が最重要学習事項になり,語彙(35%)がこれに続く。この段階では,より複雑な内容を理解したり,表現したりしなければならないため,単語の知識だけでは歯が立たなくなる。より複雑な構文の知識が必要である。発音(10%)はまだ不十分ではあるが,最低のコミュニケーションに利用できるレベルにはすでに達しているので,文法・語彙ほど重要ではなくなっている。注目すべきことは流暢さ(8%),つまりスピードの学習が重要さを増していることである。
文法(37%)・語彙(25%)の重要度は変わらないが,流暢さ(18%)・社会言語学的要素(14%)の急上昇はめざましい。それぞれの学習量は大幅に増えているが,比率的に見ると全体的にバランスがとれてきている。
ほとんど native speaker に近いレベルなので,すべての要素が均等に重要になってくる。ただしその中でも文法(25%)の比率が高いのは,複雑な内容としっかりした論理を示すため必要であるからである。この段階になると,流暢さと社会言語学的要素(ともに 20%)が目立って重要になる。社会言語学的要素は単なる言語学習だけではなかなか自由に使いこなすことはできない。そのコミュニティ内での生活習慣に感覚的に慣れ親しんでおく必要がある。これらの事実を体得するためには,直接経験または間接的な疑似経験を通じて行わなければならない。したがって,これらの学習をするためには必然的に多くの時間を必要とする。言語習得には長時間・長期間の学習が必要であるとよく言われるが,その理由はここにもあるのである。
教育ある native speaker のレベルである。この段階では,すべての学習項目が完全なバランスをとって完成されているので,それぞれ等しく20%の比率になっている。
これとは全く異なった立場から,千野栄一著『外国語上達法』(岩波新書,1994)も外国語学習をする際に何が重要であり,必要であるのかについて,自分の経験に基づいた示唆に富んだ意見を述べている。立場は違っても両者の間には共通点がかなりある。
千野氏は外国語学習に必要なものとして,次の8点を挙げている。
1.語 彙
2.文 法
1と2の関係についてはこう述べている。
「言語を人間に譬えれば骨や神経は文法であり,語彙は血であり肉である。骨や神経がだめならその人間はうまく動かないが,血や肉がなければ人間ではなく骸骨にすぎない。言語に於いて語彙がいかに大切であるかは,こんな譬え話を持ち出さなくてもお分かりいただけると思う。」(前掲書p.48)
さらに千野氏は,語彙の中で最も重要なのが使用頻度の高い最初の1,000語であるので,入門期では何が何でもこれを丸暗記せよ,と全く同じことを述べている。
3.学習書
4.教 師
5.辞 書
3~5は外国語学習をする際の手段であり,学習項目ではないので,前述の研究では取り扱われていない。
6.発 音
7.会 話
6と7は前述の発音・流暢さに相当する。
8.レアリア
英語で書くとrealiaであり,上述の社会言語学的要素に相当する。千野氏の説明は明快である。
「ことばそのものの中にも,直接伝達される以外の情報がある。普通の日本人であれば,更科・やぶ・松月庵と,来来軒・幸楽飯店・万珍楼ではどちらが日本そばでどちらが中華そばを扱っているか分からない人はいない。また,ポチ・チビ・タロと,ミケ・タマ・トラでは,これがそれぞれ何の動物か分からない人もいないと思われる。…英語を母語として話す人なら当然知っていることを,外国語として英語を使う人は知らないものがあるのもまた事実で,レアリアはこういう両者の差を補っていこうとするものなのである。」(前掲書p.187)
ある意味では,レアリア(社会言語学的要素)は直接の言語学習には関係ないが,これが欠けているとコミュニケーションとしての言語学習は完成されないとも言える重要な要素である。
これと流暢さは能力レベルが低い場合にはあまり問題にされないが,レベルが高くなるにつれて重要な学習目標になるという事実はもっと注目されてもいいことかもしれない。
英語の学び方については、今までに学者、英語教師、英語の達人、有識者などがそれぞれの意見を表明している。しかし、これまでのところ、いろいろな意見が述べられ、いろいろな試みはなされてきたものの、極端な言い方をすれば、いずれも試行錯誤の域を脱していない。これまでに数多くの英語学習理論が現れては消え、現れては消えといったことを繰り返してきた。英語の学び方に関するこれといった定説はひとつもない。しかし、これは考えてみれば妙な話である。なぜなら、一方では、現実社会において英語をマスターした例はかなり多いにもかかわらず、他方では、学校教育だけで英語をマスターしたという例はほとんど聞いたことがないからである。
これは、みなが口をそろえて言うように、今までの英語教育が間違っていることを示しているのであろうか。もしそうであるとすれば、どこが間違っているのだろうか。英語ができるようにならない原因はどこにあるのだろうか。まずこの辺の問題から考えてみよう。
英語ができるようにならない原因の一つは、学校の英語教育では、英語国民と直接英語でコミュニケーションを行う場がほとんどないということである。訓練しないものはできるわけがない。これには異論はないであろう。しかし、よく考えてみると、学校における英語教育とはコミュニケーションの疑似体験を学生に経験させるということであって、実社会で行われるような生活に根ざした実際のコミュニケーションを行う場ではない。学校教育は社会実習ではないのである.そうだとすれば、疑似体験と実際のコミュニケーションとの間には大きなギャップがあるのは当然であろう。したがって、コミュニケーション能力を身につけるためには、このギャップを埋めるための何らかの工夫がなされなければならない。
このような工夫は他の技術訓練の場合には見ることができる。特に社会的に重大な影響を与えると思われる技術、特に人命にかかわるような技術に関して認められる。たとえば、医師の養成の場合には、医学部で学んだ疑似医療体験と実際の医療活動との間のギャップを埋めるために、インターン制度というものを設けている。インターン制度により、理論と実際との落差を緩和し、スムーズに実際の医療に移行できる技術を習得できるように仕組んである。
学校の英語教育には、このようなギャップを埋めるためのインターン制度のようなものがない。そのため、英語学習と実際のコミュニケーションとの間には大きな落差が生じ、挫折するケースが多くなるのである。したがって、スムーズに実際のコミュニケーションへ移行するためには、英語教育におけるインターン制度のようなシステムを導入しなければならない。これをどのような形のものにするかが、英語教育を成功させるか、失敗させるかの分かれ目となる。
英語教育におけるインターン制度とは、学校で学習する疑似体験をさらに進めて、実際のコミュニケーションを部分的に学習させるためのシステムである。ここで扱う言語材料は教材臭さを完全に取り去ったものでなければならない。つまり、教材ではなく、実際のコミュニケーションに使われたものを利用しなければならない。このような言語材料を数多く経験することが実際のコミュニケーションへの移行をスムーズにするのである。
前号では,英語ができるようにならない原因のひとつとして,学校英語をそのまま実際のコミュニケーションに使おうとしていることを指摘した。学校英語はいわば骨組みであって,そのまわりにコミュニケーションに必要な肉づけをしなければならない。そうしないと,ギスギスした暗号のようなものになってしまう。スムーズなコミュニケーションを図るためには,実際のコミュニケーションに入るための準備期間と学習が必要である。
次に,もう一つの英語ができるようにならない原因と思われるものについて考えてみよう。それは英語学習に必要な学習時間である。おそらく大半の人は,学校の英語教育ではもっと多くの学習時間が必要であると直感的に感じているはずである。現在の日本の学校教育では,中学高校で約800時間の英語の授業を受けている。その推定方法は次のとおりである。
中学英語の総授業時間数 | = 時間×(クラス数/週)×(週の数/年)×年数 |
= 50/60×4×35×3 | |
= 350 | |
高校英語の総授業時間数 | = 時間×(クラス数/週)×(週の数/年)×年数 |
= 50/60×5×35×3 | |
= 437 |
また,大学での英語教育の総授業時間数は,1年次,2年次ともに2コマとすると次のようになる。
大学英語の総授業時間数 | = 時間×(クラス数/週)×(週の数/年)×年数 |
= 1.5×2×30×2 | |
= 180 |
したがって,中学,高校,大学とすべての英語の総授業時間数は,多く見積もっても1000時間ということになる。
1000時間の英語の授業というと非常に多いように思えるかもしれないが,子供が3歳半までに自国語に接触する時間は最低3000時間と推定されるので,これと比べるとけた違いに少ない。このことから考えても,学校教育では,いかに英語学習のために費やす時間が少ないかが分かる。このくらいの差がつくと,もう英語の教え方がどうのこうのといった単なる技術的な問題ではなく,それ以前の根本にかかわる制度上の問題があることが分かる。つまり,学習の絶対時間が慢性的に不足しているのである。
英語ができるようにならないのは当然であろう。
それでは,英語能力を実用レベルにまで伸ばすためには,具体的にどれくらいの学習時間が必要なのであろうか。アメリカ国務省の付属機関で,外国語研修を行っている Foreign Service Institute(以下 FSI と省略)という組織がある。この FSI が1973年に発表した外国語の研修成果と,それに要した研修時間に関する資料は,日本人が英語学習に必要な学習時間を推定するためにきわめて示唆に富む事実を提供している。
FSI はアメリカ人の国務省研修生に教える外国語を,その難易度によって4つのグループに分類している。
第1グループはフランス語,ドイツ語,スペイン語などで,英語と言語系統が最も近いので,英語国民であるアメリカ人にとっては最もやさしい言語である。
第2グループはこれよりも言語系統が異なった言語,つまりアメリカ人にとっては第1グループより難しい言語で,ギリシャ語,ヒンズー語,インドネシア語などがその中に含まれる。
第3グループはさらに難しい言語で,ロシア語,ヘブライ語,トルコ語などが含まれる。
第4グループはアメリカ人にとって最も難しい言語で,日本語,中国語,朝鮮語,アラビア語の四つの言語がこのグループに属している。
これらの諸言語の speaking 能力達成度と,それに要した研修時間を見ると,当然のことながら,アメリカ人にとってやさしい言語は必要研修時間が短く,難しい言語の研修時間は長い。
次に示した表は,各グループがレベル2+またはレベル3の speaking 能力に達するまでに要した研修時間の平均値である。
レベル2+またはレベル3の speaking 能力というのは,日常生活にはほとんど差し支えないレベルを示す。もちろん listening 能力にも問題はない。また,この研修は普通の研修とは違って,インテンシブ・コース(集中訓練)と呼ばれるものである。
1日6時間の研修は,月曜から金曜まで連続5日間続き,週当り30時間の猛特訓である。インテンシブ・コースは普通の研修より30%程度は効率がよいとされているが,それだけに厳しく,だれでも気楽に参加できるといったものではない。しかも,FSI の研修生は,数多くの就職希望者の中から,難関を突破して国務省に採用されたエリート官僚の卵,将来の外交官である。したがって,一般の学習者の場合には,これよりもかなり多くの学習時間がかかることが予想される。
第1グループ | レベル2+ | 720時間(24週) |
第2グループ | レベル2+/3 | 1320時間(44週) |
第3グループ | レベル2+ | 1320時間(44週) |
第4グループ | レベル3 | 2400-2760時間 (80-92週) |
ここでわれわれの英語学習に直接関係するのは,最後の第4グループである。時間的には2400時間から2760時間であるが,期間としては80週(1年7か月)から92週(1年10か月)もかかっている。普通の研修ならともかく,2年近くもインテンシブ・コースを受けるということは,その期間中はほかのことはほとんど何もできないということを意味するので,並大抵の努力でできるものではない。
もちろんこれはアメリカ人が日本語を学習する場合の例であり,日本人が英語を学習するものではないので,ここで示された数字はそのままでは通用しない。しかし,大きな意味では学習時間の目安にはなるはずである。これで見ると,日本人が英語のレベル2+以上の speaking 能力に達するためには少なくとも3000時間の学習時間が必要であろうと推測できる。10年間の中学,高校,大学で受けた英語教育の3倍の学習時間である。これからしても,従来の学校英語の学習時間ではまったく足りないことが分かる。これほどの格差がついてしまうと,なまじっかな対策ではまったく通用しない。
学習時間を大幅に増やす根本的な対策がなければ,レベル2+の speaking 能力には到底到達しないことは明白である。教授法を改善するといったレベルの問題ではない。では,どのようにしてその解決方法を見つけたらよいのだろうか。
前号では、学校における英語学習時間を大幅に増やす必要があることを述べた。10年間も続く中学、高校、大学の英語授業時間数が1000時間足らずであるのに対して、わずか3年半(3歳半の子供)の自国語習得時間数が3000時間にも達するというのでは、学習時間数の点だけで考えれば、3歳児の足元にも及ばないということである。事実、speaking と listening の点では、大学生の英語能力は英米人の3歳児と比べると、少なくとも流暢さに関しては、けた違いに下である。
問題はそれだけではない。さらに大きな問題は、英語学習者の目指す英語のレベルは3歳児の英語ではなく、成人の英語だという点にある。成人の英語ともなれば、話題も多岐にわたり、内容も複雑になるであろうから、語彙の点でも、文法の点でも、3歳児よりもはるかに上のレベルの英語を目指さなければならない。もしかりに目標レベルを20歳青年の知的レベルの英語能力に置いたとすると、3歳児の3000時間という目標学習時間はさらに多くなるはずである。20歳の青年が自国語に接する時間は、少なく見積もっても、おそらく4万時間は下らないであろう。幸い、学習動機の高い英語学習者の場合には、自国語習得者よりも短時間に学習できるという利点があるので、不便は感じながらもコミュニケーションはできるといったレベルを一応の目標とするのであれば、4万時間はかからないであろうと推定される。それにしても、最終的には1万時間程度は覚悟しておかなければならないだろう。しかも、言語は人間とともに成長することを考えれば、英語学習は一生つきまとうことになる。英語を日本語同様の立場に置いて、自分の現在の日本語能力と同程度の英語能力を最終目標として求めるとすると、コミュニケーション・レベルに達した後でも、英語と毎日付き合って行かなければならない運命にあるのはやむを得ないことであろう。
このように長期間にわたり長時間の英語学習を行わないと、実際のコミュニケーションの役に立たないことを考えると、市販の英語プログラムのほとんどがこの事実を無視して、短期間、短時間で英語学習を完成するかのような錯覚を与えてきたことが分かる。「毎日数分の学習で英語がペラペラになる」とか、「努力しないで見る見るうちにクラスのトップになる」とか、「わずか6ヶ月で英語雑誌がスラスラ読めるようになる」といった誇大宣伝が三大新聞にすら堂々と掲載されている。プログラムの利用者と称する人たちが、名前や写真入で、そのプログラムを絶賛した記事も載せたりすることもある。これは業界でテスティモニアル(testimonial)と称するもので、直販や通販で行う販売促進のための常套手段である。事実でない場合が多い。したがって偽物と本物を注意して見極めなければならない。
しかし、なぜこのように偽物が横行するかというと、ひとつの大きな理由は英語教育に定説がないということである。そのため、消費者の飛びつきそうな甘いことばを操って思いつきで英語プログラムを作ることになる。まさに何でもありといった有様である。そこにある程度のマーケットが見込めさえすれば、理論的な定説もないために、好きなように商売を作り上げているというのが現状である。英語教材販売は消費者団体に最も多く苦情を持ち込まれる商品のひとつであることもこの間の事情を物語っている。くれぐれも用心が肝要である。
これらの英語教材が本物であるかどうかを証明するものは客観的な事実である。それも出版社側の単なる宣伝文とか、テスティモニアルではなく、信頼できる方法による事実の提示が必要である。たとえば、信頼できる英語能力テスト TOEIC やTOEFL などによる数多くの実証例を示すことも考えられる。できればこれを裏付ける何らかの統計データも欲しい。これらの事実がなければ、学習効果があることを実証したとは言えない。学習効果が疑わしいばかりではない。それ以前に、膨大な学習時間に対応できる英語プログラム自体がない。中には長時間の学習に耐えうると称した英語プログラムも市販されていたりはするが、20~30本程度のテープを何度も繰り返して聞くようにと指示があるに過ぎない。これらのプログラムは、まずユーザーの気を引くキャッチフレーズを考えておいてから、その後で数のつじつま合わせをしたとしか考えられない。
短波放送 VOA(Voice of America)は世界中の人々が聞いているアメリカの国営放送である。日本では海外短波放送用ラジオを使えば聞くことができるが、音質を気にする向きには大阪有線に申し込めば、有料ではあるが、24時間聞くことができる。インターネットを利用する場合には、//www.voa.gov/ で直接聞くこともできる。VOA の中に、日本人の英語学習者には最適と思われる Special English (特別英語)という英語による放送がある。語彙数が約1500語と限られ、スピードも普通の英語の約3分の2の100~120語程度と遅い。毎日放送される VOA を聞いてlistening 力をつけることができれば、いわば無限の学習時間が可能になるので、これを利用するのが賢明な学習法である。しかし、Special English を聞くことが英語学習、特に日本人に不得意な listening 力を伸ばすことに通じるのであろうか。具体的にはどのような学習方法が考えられるのであろうか。また、その学習方法の信頼性はどのようにして実証できるのであろうか。これらのことについては、次号以降説明することにする。
コミュニケーション能力の習得を目標とするためには,膨大な英語学習時間を必要とすることは述べた。もしそうであるとすれば,時間の限られた学校の英語教育内で膨大な学習時間をまかなえられるはずがない。となると考えられる方法としては,他人の力を当てにしない自己学習しかない。この自己学習を支えるプログラムが自己学習プログラムである。市販プログラムの多くは,個人の力に依存する自己学習プログラムをねらったものであるが,それも大きく二種類に分けることができる。そのひとつはモチベーション作りに重点を置いた関心喚起型プログラムでありもうひとつは客観的な事実に基づいた自然科学的発想のプログラムである。
ほとんどの市販プログラムは第一の関心喚起型プログラムに属するもので,利用者の学習意欲を刺激することによって学習を継続させようという方法を採る。学習効果や効率を科学的に計算したり,証明したりする代わりに,学習者をいかにも成功しそうだという気にさせることによって学習させることを目的としている。この種のプログラムのことは,だれもがすでに経験的に知っていることと思われるのでここでは改めて説明はしない。ここで扱うのは,客観的な事実に基づいた自然科学的発想のプログラムの方法である。
科学的自己学習プログラムはいくつかの条件を備えていなければならない。次にその条件について述べてみよう。なお,ここで具体的に想定している科学的自己学習プログラムとは,VOA 放送の Special English によるニュース番組のディクテーション・プログラムである。
英語学習を完成させるためには,100時間,200時間などの短時間は言うまでもなく,1000時間,2000時間,3000時間,さらには4000時間であっても,ある能力レベルに到達するまでの学習に耐えるプログラムが必要である。いわば無限の学習時間に対応できる必要がある。この条件を満足する市販プログラムはひとつもない。市販プログラムの用意する数の限られたテープ,またはCDではとてもまかない切れない学習時間だからである。これは「1000時間分の学習に匹敵する」といったものではなく,額面どおりに1000時間なり,2000時間の学習に対応するプログラムでなければならない。こうなると,テープとか CD では到底対応することはできない。テープとか CD とかを買って学習するといった発想そのものから脱却しなければならないのである。
VOA 放送を利用する場合には,テープとか CD のことについて心配する必要はない。黙っていても毎日放送される無限の素材を利用することができるからである。しかも VOA には,学習者に優しい Special English による情報伝達を主体として考えられた番組がある。Special English にはニュース以外にもいろいろな番組があり,それぞれ興味に満ちた話題を提供してはいるが,多少慣れてくると,やはりニュースが一番味あるように思える。少なくとも私にはそう思える。これはちょうど,毎日の新聞を読んでいても,翌日になるとまた飽きもせずニュース記事を読みたくなるのと同じことなのかもしれない。英語教材として見る場合は,目先の興味とか面白さに気をとられ,そちらに目を奪われることがあるが,情報を得るための手段としての英語という観点からすると,毎日のニュースは平凡ではあるが,それだけに一番飽きない存在となり得る。いずれにせよ,VOA 放送はアメリカ合衆国が地球上に存在する限り,なくなることはないはずである。そして,VOA は無限の学習時間に対応できる学習材料を無尽蔵に提供してくれる貴重な存在である。
英語プログラムは,初級レベル,中級レベル,上級レベルなどといろいろなレベルを設けているのが普通である。また,それぞれのレベルに応じて異なった学習方法がとられるのも普通である。能力レベル別の学習方法があるというのは当然と言えば当然であるが,各レベル間であまり学習方法が異なると,それだけレベル間の共通事項が減り,学習が複雑になる嫌いがある。できればなるべく共通の学習方法をとるほうが,学習を分かりやすくする上からも望ましい。特に,指導者のいない自己学習プログラムの場合は,学習方法はできる限り単純でなければならない。よく,複雑な学習法を持ったプログラムのほうが優れているような錯覚に陥る傾向があるが,これは誤りである。学習方法は迷いがないように,できる限り単純にすることが自己学習の鉄則である。
ディクテーションという方法は昔からだれでも知っているために,VOA のディクテーション・プログラムには,学習方法で戸惑うということはない。それほど単純明快である。一般に,ディクテーションというと古めかしいという印象を受けるかもしれないが(実は私も最初そう思っていた),実験調査の結果は驚くべきものであった。たとえば,極端に英語能力の異なるTOEIC 875の受講者とTOEIC 220の受講者の二人が,まったく同一のディクテーション問題に取り組んだところ,それぞれの受講者がレベルに応じた成績を示したことである。普通であれば,これほど英語能力に差があると,同一プログラムは使用できないのが当然である。ところが,予想に反して,同一プログラムを使うことができたのである。
TOEIC 875の受講者が満点に近い成績をとったのは予想できた結果であった。ところが,同じ問題をTOEIC 220の受講者が解答し,低いながらある程度の成績を示すことができ得たことは,私にとって驚きであった。このレベルの受講者ではおそらくまるで歯が立たないだろうと予想していたからである。具体的に言うと,TOEIC875の受講者のディクテーション正答率は98.2%であり,TOEIC 220の受講者の正答率は9.3%であった。普通は,これだけの英語の能力差があると,同一問題では評価のしようのないほどの差となり,成績差がこのように接近した数字では現れないものである。両者の正答率には確かに大変な差はあるものの,それでも同一の問題に取り組んでそれぞれの結果を数字で評価できたということは,ディクテーションがどの能力レベルにも適応できるプログラムであることを証明しているからに他ならない。ディクテーションをばかにしてはいけない。ディクテーションは古くて新しい優れた自己学習方法なのである。昔から使われてきた学習方法には注目すべき事実が秘められていたということは,まさに再発見であった。
ここで注目すべきひとつの発見は,学習方法が単純であるために,英語能力が低くてもある程度の時間をかければ,ある程度の成果が挙げられるということである。英語能力が高ければ,さらにもっと効率よく,しかもはるかに正確にディクテーションの作業を進めることができる。しかし,英語能力が低くてもまったくディクテーションという作業ができないわけではない。効率は悪いが作業はできるということである。たとえば,同じ単語を何度も聞けば,聞いた単語のいくつかは正しくディクテーションをすることはできる。辞書を使うことも許されているので,スペリングも正しく書けるかもしれない。これらはいずれも正答率に寄与する。英語能力の高い受講者は1回さっと聞いただけで,5,6語ぐらいは軽く記憶でき,一気にディクテーションすることができる。となると両受講者の大きな違いは,時間の使い方にあることが分かる。別な言い方をすれば,英語のスピードに対する慣れの違いである。英語能力が高ければ一度で簡単に英語のスピードについて行くことができるが,英語能力が低ければ何度も何度も聞かなければ英語のスピードについて行くことができない。このスピードのついて行けるか行けないかが英語能力の差となって現れることが分かる。
VOA のディクテーションの実験調査では,121人の能力レベルを,一方ではTOEICで評価し,他方ではディクテーションの正答率で評価した。そして,その二つの評価の相関をとったところ,見事な相関関係を示した。
VOA のディクテーション・プログラムが優れた英語学習プログラムであるかどうかを検証するために,次のような実験を行った。
まず,いろいろな英語能力レベルの被験者 129 人に TOEIC を受けてもらい,例外的なパターンを示した8例を除いた 121 人に,Special English による10分間の VOA ニュースを 60 分かけてディクテーションをしてもらった。TOEIC スコアの結果は,最高点者が 890,最低点者が 220 であった。各被験者はそれぞれに支給されたテープレコーダーを用いて,何度でも繰り返してテープを聞き直すことができる。辞書を使って,スペリングと意味のチェックをすることもできる。60分間のディクテーションが終わると,次に 75分かけて浄書してもらった。この時はテープレコーダーと辞書を使うことは許されなかった。
この実験の目的は,被験者の TOEIC スコアとディクテーション正答率との間にどのような相関関係があるかを調査することである。もし TOEIC スコアとディクテーション正答率との間に高い相関があるとすれば,VOA ディクテーション・プログラムは,TOEIC 同様,英語能力を正確に評価測定できることが証明されたことになる。それと同時に,このプログラムを使って効果的に学習すれば,英語能力を伸ばすことができることが予測される。つまり,学習方法が簡単でもあるので,自己学習プログラムとして適していることが証明されることになる。これとは逆に,TOEIC スコアとディクテーション正答率との間の相関関係が低かったとすると,英語学習プログラムとしての価値は低いということになる。
実験結果の詳細については割愛するが,相関関係は次のとおりであった。
TOEIC-L(Listening)とディクテーション正答率との相関係数 | 0.830 |
TOEIC-R(Reading)とディクテーション正答率との相関係数 | 0.825 |
TOEIC-T(Total)とディクテーション正答率との相関係数 | 0.872 |
正直言うと,当初はこのような結果が出るとは思ってもみなかった。実験以前に何となく感じていたことは,ディクテーションというのは耳から聞いた英語を書き取るという作業を意味しているので,当然 Listening との相関が高く,Readingとの相関は無視できるくらいに低いのではないかと思っていた。ところが,予想に反して Reading との相関は高く,Listening との相関 0.830 とほぼ同じ 0.825 という高さを示した。その結果,Listening と Reading の二つの要素を包含したTotalとの相関係数は 0.872 という驚異的な高さを示したのである。つまり,VOAディクテーションは英語運用能力全体と最も高い相関関係にあることが分かったのである。別の言い方をすれば,VOA ディクテーションの学習をすれば,単にListening の学習だけではなく,もっと広く英語運用能力全体を引き上げるための学習に通じるということが分かったのである。これは大発見であった。
しかし,考えてみればこれは当然のこととも言える。なぜなら,ディクテーションとは,単に物理音としての言語音を聞いて書き取る作業ではなく,絶えず言語音と意味とを対比させながら英語を書き取る作業であるからである。この作業を正確にできる人は Listening スコアが高く,正確度が低い場合には Listening スコアが低くなるのは当然である。つまり,ディクテーションは単なる物理音の聞き取り作業ではないのである。たとえば,三単現のs,冠詞・前置詞などの弱音,弱音節の発音を聞き取るためには,単に物理音としての弱音を聞き分けようとしてもできるものではない。弱音を聞き分けるためには,他の強音との結合によって弱音識別が可能になるのであり,また文脈(意味)との関係によって弱音が特定でき得るのである。弱音だけ聞いて識別できるものではない。これは Reading とも共通している。むしろ Reading のほうがさらにはっきりした形で現れる。
ディクテーションの結果を最終的に浄書する段階では,絶えず語形と意味との関係を確かめながら作業を行っていく。語形と意味との結びつきは,英語を書くというディクテーション作業の場合には,さらに正確さが要求される。Listening であれば,意味が分かれば語形まで細かく要求されることはない。しかし,Reading の場合には,細部にわたって正確でなければならない。文法の知識ももちろん必要となる。いずれにせよ,耳で聞いたものをさらに目で見て,意味を文字英語で最終的に表現するので,ディクテーションの結果は Listening とも,Reading とも深く関係するのである。
前節では TOEIC の Total スコアと VOA ディクテーションの正答率との相関関係は0.87と非常に高いものであり,これは VOA ディクテーションが自己学習教材として非常に優れていることを証明するものであることを述べた。ここでは,この調査の過程で得たもうひとつの大きな発見について述べてみたい。
実験に用いた Special English News は10分間,11項目から成るニュース番組であり,ディクテーションのために与えられた時間は60分であるので,テープの6倍の時間内でのディクテーション作業が要求されるわけである。121人の被験者のVOA ディクテーション正答率を,高いものから低いものへと並べてみると,正答率の高い被験者の場合には,11項目すべてのニュース項目についてディクテーションを行っていた。具体的に言うと,90%以上の正答率を示した被験者7人は,すべての項目に手をつけていた。しかも,最後の11項目のニュースでも全員がほぼ90%の正答率を示している。しかし,当然のことながら,正答率が低くなるにつれて,ディクテーションを行ったニュース項目数は次第に減ってくる。そして全体の正答率が37.4%以下の被験者27人の場合には,11項目中6項目以上にまったく手をつけていないことが分かった。このレベルの英語能力では,何度も何度もテープを聞き直すために,60分という規定時間では作業時間が足りないということである。これは,英語能力の高い者は低い者より多くの英語を処理できるということを意味しているので,その限りでは当然のことである。何の不思議もない。
しかし,ちょっと視点を変えてみると,ここには大変重要な事実が隠されていることが分かる。それは「英語能力の高い者は英語のスピードに対応して適切に処理できるが,英語能力の低い者はスピーとについて行けないために正答率が低くなる」ということである。もっと分かりやすい言い方をすれば,英語を聞くにしろ読むにしろ,「英語理解にはスピードが重要である」ということである。
会話英語のスピードについていけないとか,英語を日本語のように速く読めないということは,経験的には誰もが知っている事実である。たとえば,入学試験とか期末試験などでは,英語を理解するための時間はたっぷり与えられるのが普通である。これは授業中でも同じで,時間に対しては相当寛容なのが従来の英語教育であった。これは,従来の英語教育では,正しく英語を理解することが重視され,多少間違っても速く理解することの重要さが軽視されたための結果である。ところが現実社会では,正確な理解は多少犠牲にしても,相手の話していることとか,ラジオ・テレビ・映画などの英語を大筋で理解することが要求される。つまり,スピードについて行くことが要求される。本を読んだり,新聞を読んだり,手紙やインターネットの英語を読む場合も同様である。
実社会では,学校では考えられないくらいのスピードで英語を理解することが要求される。フランク・スミスというアメリカの学者によれば,毎分200語以下のスピードで読んだのでは reading を楽しむことができないのである。そのくらいスピードというのは重要な要素であるということを忘れてはならない。スピードの遅い reading は reading ではなく,繰り返して聞かなければ理解できないlistening は listening ではないのである。つまり,従来の英語教育の「正確な理解」はむしろ誤りで,「スピードを伴った理解」へと学習目標を変更しなければならない。ところがこれはなかなかの難物で,一朝一夕で解決できることではない。
VOA ディクテーションの実験調査はこの点でも非常に興味ある結果を示している。「英語能力の高い者は自然な英語のスピードについて行くことができるが,英語能力の低い者は自然な英語のスピードについて行くことができない」という仮説に基づいて,VOAディクテーション正答率とディクテーションのできたニュース項目数との相関を測定してみた。その結果は0.89という驚くべき相関係数の高さを示した。つまり,「英語能力が高いか低いかは,スピードについて行けるかどうかによって決定される」という仮説が正しいことが証明された。逆に言えば,英語能力を高めるためには,英語の実用的なスピードを身につけなければならないということである。英語学習の観点からすれば,英語を理解するというだけの訓練ではなく,少なくともそれと同等,またはそれ以上の時間をかけて,実用英語のスピードに慣れる訓練をしなければならないことを示している。
TOEIC は Listening (以下L)と Reading (以下R)の2つのセクションから成り立っているが,普通の TOEIC 受験者のスコアは L>R,つまり L のほうがR より高い。たとえば,1999年度の大卒新入社員 44,324人の平均スコアは次のとおりであった。
L | R | T |
232 | 208 | 440 |
L232 は R208 よりも24点も高い。もうひとつの例を見てみよう。大卒新入社員よりもさらにネイティブ・スピカーに近いと思われる6ヶ月以上海外生活を経験した大学生 77,783人(累積)の平均スコアは,次のとおりである。
L | R | T |
413 | 333 | 746 |
この場合には,L>R の傾向がさらに強まり,L と R のスコア差は何と80点もある。これと正反対の現象もある。日本の学校英語教育の影響をきわめて強く受けた TOEIC 受験者は L>R ではなく,L<R のような逆転現象を起こす傾向がある。この傾向は,いわゆる偏差値の高い大学の学生,およびその出身者に多いようである。これは文字英語に偏った学習法であり,言語学習としては不自然な形である。ここでは仮に L>R のパターンを「ネイティブ・パターン」,L<R のパターンを「学習パターン」と呼ぶことにしよう。
企業内英語研修では,研修成果がどのようにあがったかを調べるために,TOEICを研修前後に実施する場合がある。TOEIC のスコアの伸びについてだけ考えると,学習パターン」の研修者のほうが「ネイティブ・パターン」の研修者よりも研修後の TOEIC スコアの上昇率が高くなる傾向がある。さらにその内訳を見ると,R はそれほど伸びないが,R の伸びに比べてLの伸びが際立っていることに気づく。一般的に言うと,R は短時間,短期間に伸びることはない。これに対して,L は比較的短い時間で伸びることがあり得る。これが L と R の伸びに関するひとつの特色である。その秘密は学校英語教育にある。
学校英語教育でがっちり英語を読む訓練-文字英語の訓練-をした場合には,たとえば文法知識も豊富で,語彙数も多く,慣用表現も数多く知っているのが普通である。しかし,口語英語の訓練はほとんど受けていないので,英語の音声に耳が慣れていないために聞き取ることは不得手で,英語の自然なスピードにもついて行けない。しかし,このようなタイプの学習者は,聞いて分からない英語を文字で示されると,ほとんどの場合,直ちに理解することができる。特に,口語英語は文字英語のように英文も複雑ではなく,しかも一つ一つの英文が文字英語とは問題にならないくらい短いために,かなりのスピードで理解することができる。
こうなると,問題は英語音の識別と話されるスピードに絞られる。英語自体の理解はほとんど問題ない。そうだとすれば,あとは耳を使って聞き取るための訓練と,スピードに対する慣れだけのこととなる。その他の問題としては,英語を頭から理解しなければならないことが考えられる。文字英語を読む場合には戻って読むことができるが,口語英語の場合には,すべて頭から理解しなければならない。もちろん戻ることはできない。しかしいずれにしても,基本的な理解の基盤はすでにできているので,ある程度の時間をかけ,訓練によって慣れれば,これらの技術を習得することはできる。したがって,英文を理解するための学習からすれば,問題にならないくらい楽な作業である。L のスコアが飛躍的に伸びるのは当然のことである。これに対して,R のスコアを伸ばすためには多大の努力と時間がかかる。
大手予備校の河合塾が大学入試問題の作成を代行するという記事が3月10日付の朝日新聞朝刊の一面トップに掲載されている。河合塾はかねがね国立を含めた10を超す大学から問題作成の依頼打診があったため,1科目100万円から200万円で,試験問題を代行作成するビジネスに進出することに決定したというものである。英語に関しては,どこの大学にも複数の専任教員がいるので,予備校に問題作成を委託することはまずないであろう。しかし,だからと言って,自前で作成している現在の大学英語入試に問題はないかというと,そうでもなさそうである。
現在の英語入試問題はマークシート方式の客観テスト形式をとる場合が多い。特に受験生の数の多い大学では,煩雑な採点の手間暇を避けるためにも,客観テストに頼らざるを得ないのが実情である。主観テストは採点に膨大な時間がかかるだけでなく,効率を上げるために採点者の数を増やすと,評価結果の信頼性が落ちるという欠陥がある。その点,客観テストの採点はコンピュータで短時間に行うことができ,採点上の誤りもない。ただし,最大の欠点は問題作成が大変で,細心の注意が要求されることである。
一般的に,良いテストを作るためには validity(妥当性)と reliability(信頼性)の2つを考慮しなければならないと言われている。客観テストの場合には,特にこのことに気をつけなければならない。
テストの妥当性というのは,そのテストがテスト作成の目的と合致しているかどうかということである。たとえば,全般的な英語運用能力を評価測定するために,特定教科書に基づいた期末試験を使うことはできない。両者のテスト作成の目的がまったく異なるからである。これは当たり前のことで間違えるはずがないと思われがちであるが,実際はそれほど簡単なことではない。たとえば,大学英語入試の目的が「高校までに学習した英語の基礎知識の有無を見る」のか,「一般的なコミュニケーション能力を見る」のか,「原書購読について行ける英語力があるかどうかを見る」のか,などによって試験問題の内容ががらりと変わってくる。しかし,実際には大学英語入試の目的が明確に示されることはまずない。どっちつかずの総花的出題になるのが普通である。これは,何の目的で入試問題を作るのか明確な目標がないために起こる現象としか考えられない。テストの妥当性がずれると問題作成の意味がまったくなくなってしまう。危険であり,要注意である。
テストの信頼性というのは,そのことばからも分かるように,テストが信頼できるかどうかということである。厳密には Cronbach's alpha(クローンバックのα係数)などの数値で示せばそれに越したことはないが,そこまで行かなくても簡単に信頼性を確かめる方法がある。一般的に言うと,客観テストの問題数が多いほどテストの信頼性は高まる。もちろん5問や10問では信頼できないことはだれでも直感で分かるが,それでは20問ではどうか,30問ではどうかと問い詰められると,その判断は難しい。統計学上は,信頼性は0~1の間の係数で表される。一般的には,問題数が 75問の場合には信頼係数は0.78になると言われている。ところが,75問以上問題数を増やしてもほとんど信頼係数は上がらない。この地点を境にしてカーブがほとんど平坦になる,いわゆる高原現象を呈するのである。TOEIC の問題数が Listening,Reading ともに各100問と75問以上あるのは,この間の事情を反映したものである。問題数を事実上の上限の75問から減らして50問とすると,信頼係数は0.7となる。この辺が信頼係数としては必要なレベルであろう。つまり,信頼できる客観テストを実施する場合には50問以上の問題を作成すべきであるということになる。50問以下の客観テストでは信頼性に問題を生じる恐れがあるので避けなければならない。
さらに注意すべき点は,同一種類の問題数は極端に少なくしないことである。たとえば,設問問題によく見られることであるが,発音問題を2問,作文問題を3題といったように細切れの出題はできる限り避けるべきである。これは信頼性を低下させる原因となるからである。
日本の学校教育の中では,おそらく英語が最も長期間にわたって教えられ,最も多くの時間が費やされているのではないだろうか。中学から高校までの6年間だけでなく,大学でも少なくともさらに2年間は英語が教えられている。合計8年間にわたる英語教育である。しかし,それですら期待されるような英語能力は身につかない。これはどこに問題があるのだろうか?それに対してどう対処したらよいのだろうか? 結論的に言うと,私は大学では,中学高校時代のようにがむしゃらに英語を教えるべきではないと思っている。それよりも,学生に生の英語に接触させる機会をできる限り与え,自己学習の仕方を指導すべきだと思っている。「習うより慣れろ」である。
以前,早稲田大学人間科学部で,新入生の中から無作為に 58 名を選び,TOEICを使って学生の英語運用能力の伸びを調査したことがある。被験者は第1回目の TOEIC を 1990 年4月 16 日に受験し,同年 12 月3日に第2回目の TOEIC を受験した。授業時間は2回の TOEIC 受験に挟まれた約 18 週間である。同学部では,1年次の英語教育は2クラスが必修である。ひとつのクラスは日本人教員が担当し,全員が英字新聞 The Japan Times を教材として使う。もうひとつは外国人教員によるクラスである。授業時間は1コマが 90 分であるので,計算上は2クラスで 54 時間となるはずであるが,諸種の事情を勘案すると,おそらく正味 45 時間程度であると考えられる。TOEIC の平均スコアは次のとおりであった。(Lは Listening,Rは Reading,Tは Total を示す)
第1回 TOEIC | 第2回 TOEIC | ||||
L | R | T | L | R | T |
205.17 | 219.40 | 424.57 | 245.52 | 210.17 | 455.69 |
スコアの伸びはLが 40.35,Rが -9.23 (つまり伸びはゼロ),Tが 31.12 であった。ただしTの測定誤差は ±25 であり,50 以内は誤差の範囲であるので,厳密な意味では,Tの伸びは0ということになる。つまり,英語運用能力は伸びていないということである。なぜこのように学習効果が現れないかというと,その理由は TOEIC というテストの特殊性にある。
普通われわれの知っているテストは,中学・高校時代の期末試験のように既習範囲から出題されるテスト(achievement test)である。これに対して,TOEIC は運用能力テスト(proficiency test),つまりすべて応用問題のテストである。したがって,一夜漬けで丸暗記して点数を稼ぐわけには行かない。当然スコアも思ったようには上がらない。
英語運用能力というのは簡単には伸びないのである。しかし,大学および大学卒業後の社会で求められている英語能力が,この簡単に伸びない英語運用能力である。となると,大学英語教育の最大の課題は,簡単に伸びない英語運用能力をどうしたら伸ばすことができるかという矛盾を解決することである。その答えは「習うより慣れろ」である。
英語運用能力とは,必要に応じて丸暗記したものを取り出して使うものではない。歩行動作のように無意識に,また自然に実行に移すことのできる能力である。そのためには,普段から生の英語に接して,豊富な経験を積んでおかなければならない。社会で求められている TOEIC スコアは最低 600,できれば 750 程度であるとされているが,実際の学生の TOEIC スコアは,上記の調査例から見ても,その目標値からあまりにもかけ離れている。これを高めるためには,大学での授業のみを通じての英語教育では到底実現不可能である。どうしても,そのほとんどは個々の学生の努力に負わなければならない。自己学習である。したがって,大学では学生の自己学習を勇気づけるためのあらゆる支援体制をとる必要がある。それが大学英語教育の目標であり,使命であると私は考える。
3月22日づけ朝日新聞の朝刊トップに「センター試験に英語リスニング」という見出しの記事が出ていた。続いて本文には『大学入試センター試験をめぐり、文部省は、英語に「リスニング」(聞き取り)の試験を導入する方針を固めた。......文部省は、実際に使える英語力を身につけてもらうには、60万人近くが出願するセンター試験で聞き取り試験を課し、勉強の動機付けをすることが有効と判断したという。近く大学審議会の中間報告に盛り込まれる方向で、早ければ2006年から導入される見通しだ』と記されている。確かにそのとおりで、このことに反対する者はまずいないであろう。しかし、だからと言って、まったく問題がないわけではない。私が気になるのは、リスニング能力と入学試験との組み合わせである。
この場合のリスニング能力というのは英語運用能力のことを指している。いわゆる「技能」である。知識ではない。一方、入学試験というのは「知識」を評価する方法として、一般的に理解されている。もちろん科目によっては技能検定的な要素を含んだ入学試験もないことはないが、それはどちらかというと例外的である。ほとんどの入学試験は知識評価のために利用されている。そのため、運用能力としてのリスニングを評価する方法として入学試験を使うのはどうかという躊躇がある。そうでなくとも、日本では、英語は、他の教科同様、知識だと考えられることが多いからである。
もうひとつの危惧は具体的な評価方法である。入学試験であれば、ふつうは、リスニングも0点から満点までの点数で評価される。今回のケースもそうなる可能性が高い。少なくともセンターで行われる評価は間違いなくそうなるはずである。しかし、すべてのリスニング能力を弁別し、点差をつけるためには、やさしい問題から難しい問題まで、いろいろなレベルに対応した問題を予めテストの中に入れておく必要がある。ここに問題作成上の無理が生じる原因がある。特にリスニング能力の上位者の間でも点差をつけようとすると、無理が生じることになる。ある程度以上のレベルの能力を弁別するためには、ひっかけ問題、または重箱の隅を突っつくような問題を出さざるを得ないようになるからである。そうなると、受験者に求められるのは必要以上の細心の注意である。運転免許取得のための学科試験のように、リスニング・テストには落とし穴が多くなり、受験対策が必要になる。ここまでくると、リスニング評価の本来の意味から大幅に後退することになり、リスニング能力弁別のための弁別テストと形骸化してしまう。その結果、予備校や、受験対策の出版社を喜ばせるだけのことになりかねない。
この弊害を防ぐひとつの方法は、何としてでも、試験問題をきわめて素直で、平易な内容の問題に止めておくことである。それと同時に、利用者側である大学も、評価方法に一工夫が必要である。それは、リスニング・テストの評価基準点を、60%とか70%といった正答率にレベル設定しておくことである。それ以上の点数を取っても加点することをしない。つまり一種の資格試験とする。ただし、基準点に達しないときも、直ちに不適格として足切りをすることなく、少ないながら点数評価をしておけば、他がよければ総合点で救済することもできる。いずれにせよ、各論は別として、リスニング・テストは評価基準点を設けるほうが、コミュニケーションのための技能評価をするという観点からも、理にかなっている。このような歯止めを作っておかないと、1点差を争うこれまでの受験競争をさらに煽り立てることになりかねない。それだけではない。言語活動としてのリスニングを「読み書きそろばん」的な基礎技能ではなく「知識」と誤解させることにもなる。英語学習の上でも危険である。
また、リスニング・テストを一種の資格試験にしても、文部省の目標である「勉強の動機付け」を達成することは十分可能である。むしろ,これこそリスニング・テストを入学試験に導入する最大の目的であるはずである。目的と手段を間違えてはならない。
英語の語彙数の数え方には、厳密に言うと、いろいろ厄介な問題が含まれているが、ここではあまりうるさいことは言わないで、常識的な範囲で話をすることにする。また、研究者によって推定語彙数には非常に幅があるが、そのうち比較的控え目な数字を引用することにした。
一般的に、語彙には理解語彙(passive vocabulary)と使用語彙(active vocabulary)の2種類があるとされている。理解語彙はリスニングとリーディングに使われ、使用語彙はスピーキングとライティングに使われる。習得過程から見ると、最初に理解語彙に出会ってその語の意味を理解するようになり、その状態がしばらく続き、十分理解するようになった段階で、それを使うようになる。つまり、使用語彙に転換する。このことからも分かるように、理解語彙は常に使用語彙に時間的に先行し、理解語彙数は常に使用語彙数よりその数が多いという関係がある。
『ケンブリッジ英語百科事典(the Cambridge Encyclopedia of the English Language, 1995, 123)』によると、成人の理解語彙数と使用語彙数との関係は次のとおりである。
理解語彙数 | 使用語彙数 | |
秘書 | 38,300 | 31,500 |
読書家 | 73,350 | 63,000 |
大学教師 | 76,250 | 56,250 |
これらの数字から、同百科事典は、理解語彙数は使用語彙数の平均 25%増になっている、と結論づけている。
『ギネスブック(Guinness Book of Records 1992, 396)』によると、IQ 148以上でないと入会できない the International Society of Philosophical Enquiry 会員の平均使用語彙数は 36,250 語であり、シェイクスピア(William Shakespeare)は 33,000 語を使用したそうである。また、個人で 60,000 語以上の語彙を使用することはない、とも述べている。
さらに、ギネスブックは使用語彙数を、口頭英語と文字英語との関係において比較している。それによると、16 年間の学校教育を受けたイギリス人のスピーキングとライティングに使う語彙数は次のとおりである。
スピーキング使用語彙数 | 約 5,000 |
ライティング使用語彙数 | 約10,000 |
ケンブリッジ英語百科事典とギネスブックの数字はかなり食い違っているが、ここではケンブリッジ英語百科事典の説をとることにする。ただし、ネイティブ・スピーカーの最低線として「秘書」の語彙数を採用し、それをさらにラウンドナンバー化して、理解語数を 40,000、使用語数を 30,000 とする。そしてギネスブックのスピーキングとライティングとの1対2の関係をそのまま保つと、次のような4技能間の語彙数の関係が考えられる。
口頭英語 | リスニング | スピーキング |
40,000 | 15,000 | |
文字英語 | リーディング | ライティング |
40,000 | 30,000 |
これは二つの資料を便宜的に一つにしただけのことで、何ら確たる根拠があってのことではない。たとえば、リスニングの語彙数はリーディングの語彙数より多少少ないと思われる。また、スピーキングとライティングの語彙数はギネスブックのそれよりもはるかに多いのも気になるところである。しかし、パターンという意味では、一つの目安にはなるであろう。
語彙の頻度に関する研究はこれまでいろいろ行われてきた。ある調査(Kucera & Francis 1967)によると,最も使用頻度の高い語彙数とその語彙によるカバー率との関係は次のとおりである。
最高頻度語彙数 | カバー率 |
135 | 50% |
2,500 | 78% |
5,000 | 86% |
10,000 | 92% |
英語の中での最高頻度語彙は定冠詞の the である。この1語だけで,実に全体の 6.9 %をカバーする。これに 24 語を加えた最高頻度語彙 25 語になると,全体の3分の1をカバーする。これがさらに増えて 135 語となると,上の表にあるように,全体の 50 %をカバーするという。さらに増えて 2,500 語になると 78%までカバーする。この程度の語彙数までは,だいたい,大学入試段階で暗記していると考えてよいであろう。しかし,問題なのはこれ以降である。
2,500 語の倍の 5,000 語となると,もうこれは一般大学生の領域を超えた語彙数である。ところが,その割にはカバー率の増加は意外に少なく,2,500 語の場合と比較して,わずか8%の増加にしか過ぎない。さらにこの 5,000 語が倍増して 10,000 語になっても,カバー率はさらに減り,わずか6%の増加にしか過ぎなくなる。いわゆる頭打ち状態である。上の表によれば,2,500 語を超えたあたりから,カバー率は急激に減少して平原状態になることが分かる。
全体の3分の1(33%)をカバーする最高頻度語彙 25 語,および 50 %をカバーする最高頻度語彙 135 語を品詞別に分類すると,その内訳は次のようになる。
最高頻度語彙 25 語 | 最高頻度語彙 135 語 | |
名詞 | 0( 0%) | 16(12.0%) |
代名詞 | 7(28%) | 11( 8.1%) |
動詞 | 2( 8%) | 23(17.0%) |
助動詞 | 0( 0%) | 8( 5.9%) |
形容詞 | 2( 8%) | 13( 9.6%) |
(決定詞,他) | 1( 4%) | 17(13.0%) |
副詞 | 1( 4%) | 21(16.0%) |
前置詞 | 9(36%) | 17(13.0%) |
接続詞 | 3(12%) | 9( 6.7%) |
※「決定詞,他」の中には each, more, other, same, some などの語が含まれる。
最高頻度語彙 25 語の場合には,機能語(代名詞,助動詞,決定詞,前置詞,接続詞)が多く(80%),内容語(名詞,動詞,形容詞,副詞)はきわめて少ない(20%)。これとは反対に,語彙数が増えて 135 語となると,機能語は少なくなり(46%),内容語が多くなる(54%)。この傾向は語彙数が増えるにしたがってますます顕著になる。つまり,語彙を増やせば増やすほど内容語が増える。これに対して,機能語はある線に達すると,頻度は高くなるが,もう増加はしなくなる。
ラドー(Robert Lado)によると,アメリカの大学で留学生がリーディングをこなして行くためには,最低 10,000 語近く知っておく必要がある,とのことである。この場合には,その語彙のほとんどは内容語となる。上に述べたように,10,000 語で全体の 92 %をカバーするわけであるが,これを 5,000 語の 86 %と比べると,パーセント的には,その差はわずかに6%であるが,実用的面から見ると,この6%は非常に大きな差となる。5,000 語では実用レベルのリーディングには役に立たないが,10,000 語あれば実用的レベルのリーディングに十分役立つ。
最高頻度語彙 5,000 語は全体の語彙の 86 %をカバーするが,これを2倍の10,000 語に増やしても,全体のカバー率はわずか6%増えて,92 %になるだけであるということを前回述べた。その原因は,語彙の増加につれて,機能語(代名詞,助動詞,決定詞,前置詞,接続詞)が増えず,内容語(名詞,動詞,形容詞,副詞)が増えるためであるということも述べた。このことについて,もう少し具体的に説明してみよう。
次の 28 語から成る英文は,英字新聞の記事の書き出しである。
Of the foreigners held in Immigration Bureau detention centers pending deportation for staying illegally in Japan, 558 were minors-300 boys and 258 girls, the government said Friday. |
この中から最高頻度語彙 5,000 語を超える語彙を省略して,その代わりに ..........を挿入してみると,次のようになる。
Of the foreigners held in .......... Bureau .......... centers ................... for staying .......... in Japan, 558 were .......... -300 boys and 258 girls, the government said Friday. |
このように,もし 5,000 語を超える語彙の意味がまったく分からない場合には,この英文の意味は理解できないであろう。5,000 語からはみ出した6語のうち,Immigration, detention, deportation, minors の4語は名詞,illegally は副詞で,いずれも内容語である。pending は機能的には前置詞であるが,この語独自の意味を内在しているので内容語に近い。
次の新聞記事の書き出しはどうであろうか。........に入るのは 5,000 語を超える語彙で,文末の( )内に示してある。
Russian authorities have charged a former U.S. Navy officer with ....... after holding him in a Moscow prison for more than a week, saying he had tried to obtain military secrets, officials said Thursday. (espionage) |
34 語の中のわずか1語であるが,espionage はキーワードであるので,この意味が分からないと記事全体を理解できない。このように,英語の理解は単に,語数だけの問題ではない。語彙の重要度が問題なのである。
以上のことからも推測できることは,意味の理解という点で最も重要なのは名詞である。政治,社会,経済,文化,制度,宗教,スポーツ,ファッション,趣味,製品名,病名,薬品名,動植物,その他ありとあらゆるものが名詞の中に含まれている。ものの名を知っていれば,何とか意思を通じさせることができるというのはこの間の事情を物語っている。
しかし,学習者にとって,これら名詞の厄介なことは,少数の基本語を除いて,名詞は使用頻度がきわめて低いということである。ただし,使用頻度の低さを補う形で,膨大な数の語彙が名詞の中に含まれている。同じことは,その他の内容語,つまり動詞,形容詞,副詞についても言えるが,名詞ほど極端ではない。
これを Merriam-Webster's Collegiate Dictionary (10th ed., 1998) の任意のページ(p.906)でサンプル検査をしてみると,見出し語の品詞の数は,次のとおりである。
名詞 | 56 語 |
動詞 | 7 語 |
形容詞 | 16 語 |
副詞 | 4 語 |
以上のことからも明白なように,「頻度の高い語彙を中心に学習するのは効率がよい」とまでは言えるとしても,「頻度の高い語彙だけを学習すればよい」とは言えないことが分かる。頻度は低くても重要な語彙の学習なくして意味は理解できない,のである。この「頻度は低くても重要な語彙」が内容語,特に名詞に相当する。その数はきわめて多く,最多頻度語彙数の例で言えば,学習レベル5,000 語と実用レベル 10,000 語との差の 5,000 語のほとんどすべてが内容語である。語彙の使用頻度だけに目を奪われてはならない。
外国人留学生がアメリカの大学で支障なく講義について行くためには,リーディングのために最低 10,000 語近くの語彙数が必要だろう,という言語教育者ラドーの説は以前紹介した。これと,これも以前紹介したネイティブ・スピーカーのリーディング用の最低語彙数 40,000 とをつき合わせてみると,日本人(実用レベル)とネイティブスピーカーとの語彙の関係が見えてくる。これらの数字をそのまま比較すると,1対4の関係になるが,日本人の実用レベルの 10,000 語は,実用レベル内でも多少上のレベルを示していると思われるので,これを低めに考えると,おそらく1対5程度の関係になるのではないかと想像される。つまり,日本人(実用レベル)の1に対して,ネイティブ・スピーカーの5くらいの関係である。しかし,日本人が英語学習者の場合には,両者の差はこれよりも大幅に広がることは当然である。
ここで観点をまったく変えて,市販の英語辞書の収録語彙数という点から,辞書使用者としての日本人とアメリカ人の相違について見てみよう。辞書出版社の最大の関心事は,いかに優れた辞書を出版するかということと,それから得られる収益によって企業の安定を図ることである。そのためには,競合他社よりいかに魅力的な特色のある辞書を制作するかが大きな問題となる。収録語彙数も重要な特色の一つである。競合他社を意識した場合,収録語彙数は増える方向に傾く。もし辞書使用者から語彙の不足について苦情が出るようなことになれば,市販辞書にとっては決定的なダメージを与えることになるからである。そのため,市販辞書から辞書使用者の語彙数を推測する場合には,安全策をとって増加した語彙の分を差し引いて考えなければならない。
次に示したのは,日本人を対象にした英和辞書と,アメリカ人を対象にした英語辞書の収録語彙数の概算リストである。
《日本人向け英和辞典》対象者 | 中学生 | 高校生 | 大学・一般 |
収録語彙数 | 10,000 | 50,000 | 80,000 |
対象者 | 小学生 | 中学生 | 高校生 | 大学生 |
収録語彙数 | 15,000 | 60,000 | 80,000 | 160,000 |
英語は日本人にとっては外国語であり,アメリカ人にとっては自国語であるので,両者の収録語彙数の差が大きいであろうことは容易に想像がつく。想像どおり,その差はかなりある。もちろん,これだけから語彙数を推測することはできないが,それでも日本人の辞書使用者とアメリカ人の辞書使用者との語彙数の差については,事実を反映していると考えて差し支えないであろう。このリストから分かることは,大雑把に言って,日本人中学生はアメリカ人小学生の語彙数に,日本人高校生はアメリカ人中学生に,日本人大学・一般はアメリカ人高校生に,それぞれ対応していることである。一つずつ対応レベルがずれているという感じで,面白い現象である。
リストに例として挙げたアメリカ人大学生対象の英語辞書は,Merriam-Webster's Collegiate Dictionary (10th ed., 1998)からの引用である。同辞書の収録語彙数は 160,000 語であるが,語彙数ではなく定義数で言うと,215,000定義が収録されているという。したがって,1語当りの定義数は 1.3 ということになる。このように,語形は同じでも,定義が違えばまったく違った語として取り扱われるのは,ある意味では当然であろう。ここに収録語彙数のカウント方法の難しさがある。辞書によっては,give 本来とは意味の違う give up を独立した見出し語としてカウントすることもある。また,重要でなく,意味も容易に推測できるので,語形のみを示して定義を省略する場合もある。規則変化をする動詞の変化形,名詞の複数形,形容詞の比較変化などは記載しないのが慣例である。したがって,これらを語彙数としてカウントするかどうかで,語彙数は大きく変化する。しかし,一般常識的には,話がややこしくなるので,それほど厳密な分類はしない。ここでの語彙数のカウントの仕方も同様で,一般常識の範囲内で行ったものである。
新学習指導要領の中に 「総合的な学習の時間」 が設けられ,公立小学校では2002 年度から英語教育を実施することになった。これに関連して,外国語指導助手 ALT (Assistant Language Teacher) を大量に導入する予定であるという。どの程度 「大量」 なのかは不明であるが,結構な話である。しかし,その実施方法については,まだ具体策は示されてはおらず,関係者の今後の検討結果に委ねられている。
神経学者ペンフィールド(Wilder Penfield)によれば,子供は,10 歳から12 歳くらいまでは,外国語学習最適期であり,複数の外国語を学習しても問題なく習得できるという。これに対する異論もないではないが,子供は少なくとも発音に関しては有利のようである。大人ならば四苦八苦してもできない発音をいとも簡単に真似ることができる。ネイティブ・スピーカー並みの発音に驚かされることもしばしばである。したがって,この時期に,ALT などネイティブスピーカーの話す英語を十分に聞かせることは,子供にとっては非常なプラスであり,後の学習に対する好影響も計り知れない。このように発音に敏感で,習得も速いこの時期の子供の特性を考えると,ネイティブスピーカーによる英語だけの指導が望ましい。日本人指導者は特に必要とはしない。指導内容は,遊びを中心とした生活英語にとどめるべきであろう。
小学校の英語教育導入の時期については2つ考えられる。1つは1年から3年までの前期であり,2つ目は4年から6年までの後期である。
小学校前期の学年では,文法などの言語構造を論理的に教えようとしても子供には理解できず,また関心も示さない。結果的に,この時期の英語教育の目標は,絶えず生きた英語のシャワーを子供に浴びさせることとなる。これに対して,後期の英語教育は,ペンフィールドによれば,言語学習最適期が過ぎた 10 歳以降-小学校4年以降-の英語教育に当たる。この時期には,生徒は言語学習を素直に受け止めることができないようになり,学校の勉強と考えるようになる。このような状態に合わせるためには,多少論理的な要素を加味した,より中学英語に近いアプローチのほうが適していると思われる。
小学校の英語教育を中学英語の前倒しではなく,独自の意義を持たせるためには,口頭英語をそのまま素直に受け入れることのできる学年,つまり小学校前期に英語教育を導入するのが効果的である。しかもできる限り早い時期のほうが,いっそう素直に英語を受け入れることができる。たとえば,1・2年生を対象にした英語教育であれば,放っておいても,文法などの論理を中心とした英語教育に流れる恐れはまずない。習う側も,教える側もその気にはならないし,たとえその気になったとしても,この年代では実行が難しいからである。ところが3年生になると,多少事情が変わってくる。人見知りが次第に激しくなり,以前のように学習に素直に溶け込めにくくなるからである。これよりさらに後の小学校後期に英語教育を導入した場合には,中学英語の先取り的な性格がかなり強くなる。したがって,中学英語の予備学習期間として導入するなら別であるが,小学校独自の英語教育としては疑問が残る。中途半端になりやすいので,この時期の導入は避けたほうが無難であろう。
最後に考慮しなければならない問題は評価である。そもそも言語教育は,原則的には,他の教科のように成績をつけて,だれが上で,だれが下だと序列を決めるべきものではない。特に,言語学習 (language learning) ではなく,言語習得 (language acquisition) を目指す場合には問題である。成績をつけることは生徒間の競争をあおり,自然な言語習得を妨げる原因ともなる。さらに,知識英語へ追いやることにもつながり,本来の目的からも大きく外れることとなる。小学校英語教育はコミュニケーションを中心としたものでなければならない。教えはするが,成績はつけない。英語は手段であり,道具だということを生徒に感覚的に理解させることが,この時期の英語教育の最重要課題である。
TOEIC についてはいろいろな出版物が出され,受験者も日本だけで 80 万人(2000年4月現在),全世界では 150 万人に達している。しかし,そこにはさまざまの誤解がある。その一つが,短期間で TOEIC スコアを上げられるかも知れないという誤解である。
テストは,分類の仕方によって, achievement test と proficiency test に分けることができる。achievement test というのは,既習事項に関するテストであって,学期末試験がその典型的な例である。これは学習範囲が限られているので,場合によっては,一夜漬けによる準備も可能である。学校で習ったことがそっくりそのまま出題されるのであれば,試験の後はすぐ忘れるが,丸暗記によって高点を取ることも可能である。先生の「ここは試験に出るぞ」といった警告により,または,それぞれの先生の癖から出題傾向を察知して高点を取ることも可能である。ところが,高校入試としての achievement test となると,出題範囲は中学校での既習範囲に限られるとはいえ,3学年分という長期間にわたるので,学期末試験とは比べものにならないくらい範囲が広く,すべてが応用問題なので,一夜漬けというわけには行かない。そのため,かなり長時間の学習が必要となる。
これが大学入試となると,さらに条件は厳しくなる。学習範囲はさらに広がり,高校での学習項目が中学のように規定されていないこともあり,高校教科書の学習範囲を超えることは普通となる。しかも,すべてが応用問題となると,高校入試の achievement test とは比べものにならない。少なくとも,文字英語に関しては英語力全般に及ぶテストである。このように英語力全般に関するテストのことを proficiency test という。その意味では,大学入試は proficiency test ではあるが,必ずしもすべての大学入試問題が適正な手順を経て作成されているとは言いにくいので,信頼できる proficiency test と断言することはできない。また,大学入試は各大学の事情を反映した選抜試験という性格を持っているので,本来の proficiency test とは異なる。
TOEIC はもちろん achievement test ではなくproficiency test である。このことはほとんどの人が知っているはずであるが,中にはどう見ても achievementtest と誤解していると思われる例に出くわすことがある。たとえば,「TOEIC 問題集,英語学校の TOEIC 準備コースで学習すれば,短期間にスコアが上がる」といった誤解である。
上に述べた学期末試験の例からも明らかなように,丸暗記で高点が取れるテストの場合には,実力とスコアが一致しない。実力よりスコアのほうが上回ることが多い。これに対して,大学入試の場合には,丸暗記は通用しない。大学により出題傾向はあるものの,前年の問題を見ればだれでも出題傾向は理解できるので,特定の受験者にとって有利には働くことはほとんどない。そのため,実力とスコアとの間のズレが少なくなる。この傾向は,優れた入試問題であればあるほど強まる。スコアは実力を正確に反映し,ごまかしの入り込む余地は少ない。
TOEIC はきわめて優れた大学入試だと思えば分かりやすいであろう。ただし,TOEIC は選抜試験ではないので,予め合格ラインを想定して問題作成することはなく,あらゆるレベルの英語能力に対しても評価測定できるように対処している。スコアで言えば,10~990 までの範囲で英語能力を識別することができるように仕組まれている。
このような性質を持ったテスト・プログラムが TOEIC だということを理解すれば,「TOEIC 問題集,英語学校の TOEIC 準備コースで学習すれば,短期間にスコアが上がる」と信じる者はいなくなるはずである。長期間の学習の結果スコアが上がるというならともかく,短期間にスコアが上がるわけがない。切羽詰ると耳を傾けたくなるが,安易なコマーシャリズムに迷わされてはならない。短期間に,または楽をして英語能力が身につくのであれば,これほど簡単なことはない。卑近な例で言えば,金儲けと同じで,うまい話にはどこかに落とし穴がある。くれぐれも用心が肝要である。
英語能力は目に見えず,手で触れることもできない。それほど英語能力の実体はとらえにくい。言わばアナログ的存在である。それを TOEIC という物差しを使って,スコアというデジタルの形で測定しようというのである。そのため,厳密な意味では,スコアと英語能力は1対1対応することはない。たとえば,450 のスコアに対応する英語能力と,わずか一段階上のスコア 455(TOEICスコアは5点刻みで変化する)に対応する英語能力とを識別することは不可能である。スコアは単純に5点単位で変化するが,英語能力はそれ自体が漠々として変化の境界があいまいなため,厳密なスコア区分に対応できないのである。したがって,英語能力は 450 とか 455 といった一つ一つのスコアと対応するではなく,450~480といった一定のスコア範囲と対応をすることになる。このスコア範囲が測定誤差と言われるものである。TOEIC の測定誤差は ±25 である。たとえば,450 を中心として考えると,450 とそれより上のスコア 500 までは同じ英語能力を示し,同様に 450 とそれより下のスコア 400 までは同じ英語能力を示していることになる。
そうだとすれば,TOEIC を何度も受けて,450 が 470 に上がったとか,420 に下がったからといって一喜一憂することはまったく意味がないことが分かる。いずれも,英語能力という点では同一レベルにあることを示しているからである。2人の英語能力を比較する場合も同じである。400 と 450 は同じ英語能力の持ち主であることを示している。450 と 500 も同じ英語能力を示す。つまり,スコア差が 50 以内の場合には同じ英語能力であることを示しているので,TOEIC を受けても意味がないことを示している。しかし,50 以上の差の 400 と 500 は異なった英語能力を示す。これは一見それほど重要でないように思われるかもしれないが,実はきわめて重要な事実を示している。
企業内研修の例で具体的に見てみよう。ここで述べるデータは,TOEIC 運営委員会編『活用実態報告』(2000,pp.36-37)に基づいている。
研修時間 | スコア伸び50以上の受講生 |
49 時間以下(平均 33 時間) | 47 % |
50~99 時間(平均 78 時間) | 45 % |
100~149 時間(平均 108 時間) | 62 % |
150~199 時間(平均 176 時間) | 67 % |
200 時間以上(平均 268 時間) | 72 % |
上の表のパーセンテージは「研修を受けて 50 以上スコアが伸びた,つまり英語能力が伸びた-研修成果があった-受講生の割合」を示している。逆に言うと,残りの受講生は研修成果がなかったということになる。これはショッキングな事実であるが,現実的にはよく起こることである。
これによると,100 時間未満の研修では,約 50%の受講生には研修成果があったが,残りの約 50%は研修効果がなかったことになる。歩留まりは 50%であり,研修成果としてはあまり成功とは言えない。これに対して,研修時間 100~199 時間では,歩留まりは 60%台となり,100 時間未満の約 50%よりはましなものの,あまり満足すべき数字ではない。研修時間 200 時間以上になると,歩留まりはさらに 10%増えて 70%台となるが,それでも 30%程度の受講生は研修成果ゼロである。厳しい現実と言えよう。
以上の事実から結論づけられることは,「英語能力を伸ばすためには,想像以上に多くの学習時間を必要とする」ということである。また,「一人一人の学習者によって英語能力の伸びは異なる」ということである。また,違った観点からすると,このようなバラツキが出るということは,全体的に研修時間がまだまだ不足していることを示している。自己研修を含めて一定時間以上の研修を行えば,自国語の場合のように,だれもがコミュニケーションレベルの英語には到達するはずである。悲観する必要はない。要するに時間をかけることである。ただし,その学習時間は想像以上に多い。
TOEIC は英語運用能力を測定するテストとしては優れているが,その評価測定をより正確にするために考えておかなければならないことが一つある。それは TOEIC のテスト問題形式に予め慣れておくということである。テスト問題に慣れているのと慣れていないのとでは,スコアの上で差が生じるからである。しかし,このことは常識的にも容易に想像できる。今まで経験したことのないテスト形式に遭遇すると,受験者は心理的動揺をきたして,普段の実力が発揮できないことが多い。つまり,実力以下の成績しか出せないことになる。TOEIC スコアの面から言えば,実際の英語能力よりもスコアが低くなることを意味する。これは受験者にとっては重大事である。
初めてのテストではスコアが低くなりがちであるということは,裏返して言えば,その対応策としては,予め問題に慣れておけばよいということである。そうすれば正当な評価を得ることができる。このように,予め練習することによってテストの結果が上がることを,練習効果(practice effect)と言う。練習すれば実力が適正に測定できるが,練習しなければ実力以下のスコアしか出ないということになれば,何が何でも実際の TOEIC テスト受験の前に TOEIC の問題形式に慣れておかなくてはならない。しかし,いったいどのくらい練習効果が現れるものであろうか。その実体を実例で見てみよう。
TOEIC に練習効果が起こり得るものかどうか,また起こり得るとすればどの程度の練習効果なのかを知るために,小規模ながら 1995 年に実験が行われた。その内容は,33 人の被験者に2週間以内に TOEIC を2回受けてもらったことである。テスト・スコアを調べた結果,33 人のうちの一人は,リスニング・スコアが異常な変化を示したので,データから省いた。同様に,他の一人もリーディング・スコアの面で異常な変化を示したので,これもデータから省いた。データを削除する基準としては,95 %信頼限界を採用し,この範囲を超えたものを削除することにした。残った 31 人の被験者の TOEIC トータル・スコアについて調べてみると,1回目テスト(T1)と2回目テスト(T2)との相関係数は 0.888 であった。T1の最高点は 915,最低点は 325,T2の最高点は 905,最低点は 365 であった。また,T1とT2との間には,次の回帰式が成り立つことが分かった。
T2 = 0.905 × T1+136.27 |
これはデータ数がわずか 31 であるので,予測は正確には行われないが,しかしある程度の推測をするための参考にはなり得る。この式をいくつかのスコアに当てはめてみると,次のようになる。
1回目のテスト(T1) | 2回目のテスト(T2) |
300 | 407 |
400 | 498 |
500 | 588 |
600 | 679 |
700 | 770 |
それぞれのスコアにわたってかなりのスコアの上昇と言える。31 人の被験者の平均スコア上昇は 80 であった。これは TOEIC の測定誤差±25をはるかに超えているので,普通であれば,明らかに英語能力が伸びたことを示している。しかし,わずか2週間以内に英語能力が伸びるわけもないので,このスコア上昇は練習効果の結果であると推測することができる。
この事実から得られる教訓は「TOEICを受ける場合には,何らかの形で,予め TOEIC問題に慣れておく必要がある」ということである。ただし,この練習効果は2回目のテストについてのみ言えることであって,2回目以降については,練習効果は期待できない。英語能力は簡単に伸びるものではないので,少なくとも1年以上の期間を経た後で再受験すべきである。それぞれのテストの特性を見極めた上でのテストの利用法を心得ておく必要がある。無駄を省くためにも,TOEIC は TOEIC なりの受験方法を知っておかなければならない。
「TOEIC は英語能力を Listening と Reading で評価するので,Speaking と Writing は評価できない」と言われることがよくある。答えは yes でもあり,no でもある。
まず yes について述べると,TOEIC は確かに Listening だけの測定を行い,Speaking の測定は行っていない。その意味では,Speaking の能力レベルを推測することはできても,直接評価はしていない。となると次に起こる疑問は,「Listening 測定に基づいた Speaking 推測は正確か,または不正確か」ということである。この当然の疑問に対する回答として,TOEIC を開発した Educational Testing Service(ETS)は,TOEIC を実施する前に,次のような信頼性の検証を行っている(TOEIC:Bulletin of Information, ETS, 1982)。
それぞれのレベルの英語能力を代表する 100 人の被験者に対して,まずこれらの人々に TOEIC を受けてもらい,その結果により5つの能力グループに分類する。その内訳は次のとおりである。
Group I | TOEIC Listening 5-100 |
Group II | TOEIC Listening 105-200 |
Group III | TOEIC Listening 205-300 |
Group IV | TOEIC Listening 305-400 |
Group V | TOEIC Listening 405-495 |
次に,これらの被験者一人一人にインタビューを実施し,その評価を行った。そして,TOEIC の Listening スコア(Speaking の間接評価)とインタビュー評価(Speaking の直接評価)との間の相関関係を調べた。その結果は 0.83 であった。この高い相関係数の結果,TOEIC は Listening により,Speaking 能力をかなり正確に推測できると判断した。つまり,Listening スコアにより,Speaking を含めた口頭英語(spoken English)全体の能力レベルを測定できると判断したのである。その意味では,「TOEIC は英語能力を Listening と Reading で評価するので,Speaking と Writing は評価できない」という疑問に対する答えは no,つまり「評価できる」となる。Listening から Speaking の評価はかなりの精度をもって推測できるからである。したがって,結論的には,「yes でもあり,no でもある」ということになる。
Speaking の評価方法については,実は,一つの問題がある。それは,一人一人の受験者に対して少なくとも 20 分程度の時間を費やして,Speaking 能力を測定しなくてはならないという点である。Speaking テストは,Listening テストのように客観テストをするわけには行かないので,どうしても時間がかかる。また,試験官も相当の熟練者でなければ務まらない。さらに,優れたインタビュー用の評価基準が作成できたとしても,これを実際に適応する際には,最終的には試験官個人の判断に依存せざるを得ないという欠点がある。そのため,評価結果にバラツキが生じやすくなる。つまり,評価測定の信頼性が低くなる傾向がある。特に,受験者が多くなったときは評価にバラツキが目立つようになる。これが主観テストの大きな弱点である。テストの重要な要因の一つに実用性(practicality)というのがあるが,Speaking テストは,その意味では,実用性に欠けるところがある。80 万人の TOEIC 受験者にインタビュー・テストを行うことは不可能である。したがって,Speaking 能力が Listening 能力から推測できるのであれば,そのほうが現実的であり,効率もよい。また,場合によっては,信頼性も高まる。
同様に,文字英語(written English)の Writing 能力は TOEIC の Reading スコアから推測できる。この場合の信頼性の検証は 306 人の被験者を使って同様の手順で行われ,TOEIC の Reading スコア(Writing の間接評価)と実際に英語を書かせて行った Writing 評価(Writing の直接評価)との相関係数は,口頭英語の場合と同じ 0.83 であった。したがって,Writing 能力は TOEIC のReading スコアから十分推測できると判断される。
以上の結果,英語能力,つまり英語の4技能は TOEIC の Listening スコアとReading スコアによって評価測定できることを示している。
「TOEICはマークシート方式だから,AならAだけをマークすれば,4択なら全体の4分の1は得点できる」 という話を聞いたことがある。これは推測効果 (guessing effect) と呼ばれるもので,たとえば4選択肢のマークシート方式テストが 100 問あった場合には,平均的には,25 問が正解となるという考えに基づいている。これを TOEIC に当てはめれば,最高点 990 点の4分の1として,約 250 点が取れるはずである。ただし,このような考え方は TOEIC に関しては通用しない。
たとえば,次の Form 3BIC の例を見ていただきたい。これは TOEIC 実施の初期のころに,実際に使用されたテスト・フォームの一つである。ここでは推測効果が現れるかどうかを見るために,Listening と Reading 各セクションの問題数100 問のうち,その4分の1に当たる 25 問までの正解に対するスコア換算方法を示してある。(換算方法はテスト・フォームによって異なる。)
TOEIC は Listening に 100 問, Reading に 100 問あり,それぞれ5~495 が配点されているので,平均すれば1問当たり5点ということになる。そうだとすると,素点(正解数)が 25 の場合には5×25=125 となるはずである。したがって,Total はその倍の 250 となるはずである。ところが表にあるように,Total はわずか 90 にしかならない。これはどういうことであろうか。
(Lは Listening,Rは Reading,Tは Total,T-素点は「5×素点」を示す。)
素点(正解数) | L | R | T | (T-素点) |
25 | 65 | 25 | 90 | 250 |
24 | 60 | 20 | 80 | 240 |
23 | 50 | 15 | 65 | 230 |
22 | 45 | 10 | 55 | 220 |
21 | 40 | 5 | 45 | 210 |
20 | 35 | 5 | 40 | 200 |
19 | 25 | 5 | 30 | 190 |
18 | 20 | 5 | 25 | 180 |
17 | 15 | 5 | 20 | 170 |
16 | 10 | 5 | 15 | 160 |
15 | 5 | 5 | 10 | 150 |
0 | 5 | 5 | 10 | 10 |
このスコア換算表から分かる重要なことは,Lについては,素点が 15 以下の場合はすべて最低点であり,Rについては,素点が 21 以下の場合はすべて最低点であるということである。ここで言う最低点とは具体的には5のことを意味するが,この場合の5というのは統計処理上の便宜的な数字にすぎず,実際には0と同じ意味を持つ。つまり,Lは 15 問正解であっても0点,Rは実に 21 問正解であっても0点であることを示している。こうなると推測効果はほとんど現れないことになる。つまり,TOEIC は素点をそのまま使わずに,換算点を使うことによって,推測効果が起こらないように仕組んであると言える。
でたらめに解答したとして,また,もし素点(正解数)が幸運にも 25 になったとしても,Tは全体の4分の1に相当する 250 点になるどころか,換算されるとわずか 90 点にしかならない。TOEIC は最高点が 990 であるので,90 というのは全体のわずか9%程度にしかすぎない。これは,AならAだけを無差別に解答しても最低のスコアしか取れないことを示している。安易な得点方法を考えることなく,平凡ながら,やはり地道に英語の実力をつけることが TOEIC スコアを上げるための最善の方法である。
「TOEIC スコアがどのような英語能力を示すのか知りたい」と思う人は,受験者のほとんどであろう。また,そう思うのも当然である。しかし,少し考えてみると,スコアは TOEIC テストの正答率を示したものなので,この正答率が英語能力を示していることに気がつく。つまり,「TOEIC 問題を何パーセントできたらどのレベルの英語能力を示しているのか」という質問に転換することができる。ただし,この場合には一つの前提が必要である。
TOEIC は,下は英語学習者から,上は英語のネイティブ・スピーカーに至るまで幅広い英語能力を評価測定することができる。上のネイティブ・スピーカーについては問題がないが,下の英語学習者はある程度限定される。なぜならば,ネイティブ・スピーカーにしろ,英語学習者にしろ,TOEIC の受験対象者は「英語を運用できる能力」という範囲に限定されるからである。したがって,英語を初めて習う中学生は,まったく TOEIC の対象とはならない。まだ学習レベルだからである。同じ理由で,高校生もかなり上位の英語力の持ち主でないと対象にはならない。大学生はどうかと言うと,これも一般的に言えば,果たしてすべての大学生が英語運用能力を持っているかどうかと問われると,躊躇せざるを得ない。おそらく運用能力のある大学生は数が限られているであろう。しかし,大学生であれば,有資格者もある程度の数は望めるであろう。ということは,ネイティブ・スピーカーから大学生までというのが,だいたい TOEIC 受験の対象者である。
前回にも紹介した TOEIC の初期のテスト・フォーム Form 3BIC を利用して,どの正答率(スコア)が TOEIC スコアに連動しているか,つまりどの英語能力を示しているのかを見てみよう。
素数(正解数) | L | R | T |
100 | 495 | 470 | 965 |
90 | 475 | 420 | 895 |
80 | 410 | 360 | 770 |
70 | 345 | 300 | 645 |
60 | 285 | 240 | 525 |
50 | 220 | 180 | 400 |
40 | 160 | 115 | 275 |
30 | 95 | 55 | 150 |
20 | 35 | 5 | 40 |
10 | 5 | 5 | 10 |
0 | 5 | 5 | 10 |
この表から分かることは,TOEIC の 200 問すべてに正解だった場合は 965 点であり,10 問正解だった場合には 10 点となることである。このことからも分かるように,TOEIC の理論上の最高点は 990 点であるが,これはいつも最高点が 990 点であることを示しているのではない。Form 3BIC の場合には,全問正解であっても 990 点ではなく 965 点が最高点となる。同時に,LとRがそれぞれ 10 問正解であっても,スコアは最低点の 10 点である。
英語運用能力を知るためには,違った観点からのアプローチも可能である。それは「TOEIC 問題を何パーセントできたら,どの英語能力があると判断できるか」という質問である。
表の素点を見ていただきたい。たまたま各セクションの全問が 100 問なので,素点はそのまま正答率に等しくなる。問題が適正であれば,正答率 100%およびその付近はネイティブ・スピーカー・レベルを示すことは間違いない。同様に,正答率ゼロは英語運用能力ゼロを示す。問題なのは,両者の中間である。正答率80%ならだいたい英語が理解できているはずだと判断した場合には,表により 770 点以上が「実用レベル」と考えられる。正答率 90%なら完璧だと判断した場合は,895 点以上が「完成レベル」ということになる。低いスコアでは,正答率50%以下ではまだ実用レベルに達していないと判断した場合には,表から 400 点は「実用レベル以下,つまり学習レベル」ということになる。このように,英語の理解度をパーセンテージで表現して各自が判断すれば,TOEIC を利用した自分なりの評価システムを作ることができる。一度試されてみてはいかが?
TOEIC には Listening と Speaking の2つのセクションがあり,それぞれのセクションの問題数は 100 問である。したがって,計 200 問ということになる。なぜこんなに問題数が多いのだろうか。受験者の負担を減らすために,もう少し問題数を減らすことはできないのだろうか。特にそれほど英語運用能力の高くない受験者の場合は,問題数が多くなると,それだけで圧倒されてしまう。もっと少なくなれば,心理的プレッシャーも低くなり,それだけ受験者もリラックスして普段の実力が出やすくなるので,英語運用能力がより正確に測定できるのではないだろうか。
一般的に言って,英語運用能力は listening,speaking,reading,writing の4技能に分けられる。このうち TOEIC で直接測定しているのは listening と reading の2つだけである。ただし,listening は speaking と,reading は writing と互いに密接に関係しており,両者の相関係数はともに 0.83 という高い数字を示していることは TOEIC 実施以前の検証でも証明されている。つまり,listening スコアから speaking 能力を,reading スコアから writing 能力をだいたい予測できるので,TOEIC で4技能を含めた全体的な英語運用能力を測定できることが証明されている。
このことを前提として TOEIC の問題数について考えてみよう。TOEIC では Listening と Speaking の2つのセクションを設け,この2つをそれぞれ別個に測定し,それを総合した Total スコアが最終的に英語運用能力を示すと判断している。この考えに従えば,Listening と Speaking はそれぞれ性質が異なるので,独立した測定基準を持たなければならない。これが Listening と Speaking の2つのセクションがそれぞれ互いに独立して 100 問の問題数を持っている理由である。では次に,100 問という問題数がはたして適正なのかどうかということについて考えてみよう。
言うまでもなく,テストはその結果が正確で信頼性が高くなければならない。たとえば,5分間のインタビューテストより 30 分のインタビューテストのほうがテスト結果は正確であり,信頼性も高い。また,reading 能力を測定する場合には,一つの英文 passage より 10 の英文 passage でテストしたほうがテスト結果は正確であり,信頼性も高いことは明白である。このことから結論できることは,「テスト問題数は多いほうが正確である」という事実である。しかし,無制限に問題数を増やすというのは現実的ではない。
統計的な調査によると,信頼性とテスト問題数との平均的な関係は,たとえば50 問の場合には信頼係数は 0.7 とされている。そして,これが 75 問に増えると,信頼係数は 0.78 とわずかながら上昇する。しかし,これ以上いくら問題数を増やしても信頼係数はほとんど変化しない。信頼係数 0.78 で実質上の頭打ちになる。そうであるとすれば,信頼性の高いテストを作るためには少なくとも問題数は 75 問にしなければならないことが分かる。しかし,これは平均的な信頼性であり,もし 75 問の問題の中に相当数の不適切な問題が含まれていたとなると,その信頼係数は著しく低下することになる。一般的に,信頼係数が 0.6 以下になると,そのテストは信頼できないとされている。したがって,信頼できるテストであるためには,75 問ぎりぎりではなく,それ以上の問題数を出題しなければならない。そうしておけば,たとえ不測の事態が起こっても,不適切な問題を削除することによって,信頼係数は損なわれないで済むことになる。
このような判断に基づいて決定されたのが TOEIC の問題数 100 問である。できれば問題数はなるべく少なくすることによって,受験者の心理的負担を少なくしたい。しかし,問題数をあまり少なくすると,テストの生命である信頼性に重大な影響を及ぼす。痛し痒しである。
しかし,最近の研究により,この問題は解決されつつある。それは項目分析の結果,過去のテストの中から各英語能力レベルに対応した良問を数多く蓄積し,それぞれの英語能力レベルに合った問題をコンピューターで選択して与えようという発想である。その一部はすでに実用化されている。こうなれば,英語能力の高い受験者は自分の英語能力に合った高いレベルの問題だけを解答すればよいことになる。同様に,英語能力の低い受験者は難しすぎる問題が出題されることもなく,自分の英語能力に合った低いレベルの問題だけを解答すればよい。その結果,受験者の解答する問題数も少なくなり,テスト時間も短縮化される。まだいろいろ解決しなければならない問題は抱えているにしても,より効率のよいテストが行われる時代が来つつあることだけは確かである。
同一の受験者が何度も何度も同じ TOEIC を受けると,まったく同じスコアをとるということはない。ある場合は高く,ある場合は低くなるというように,いろいろな要因によって,受験のたびにスコアが異なる。スコアに変動があるのはきわめて自然な現象である。このような測定値の変動のことを測定誤差という。
TOEIC スコアの測定誤差は ±25 と発表されている。この測定誤差の考え方を利用すると,いろいろ重要なことに気がつく。たとえば,ある受験者の Total スコアが 500 だとすると,測定誤差を考慮に入れると, TOEIC スコアの 500 は 475(500-25)から 525(500+25)のスコア範囲内にあることを示している。短期間に何べんも TOEIC を受験すると,±25 のスコア範囲内に収まるわけである。この範囲のことを信頼区間と言い,475≦信頼区間≦525 という式で表すことができる。そして,475 および 525 のことを信頼限界という。
このことは何を示しているかというと,英語運用能力は 500 なら 500 といった狭い1点のスコアで判断してはならないということである。そうではなく,信頼限界の範囲内,つまり 475 から 525 の信頼区間にあるスコアはすべて同一の英語運用能力を示していると判断しなければならない。スコアではなく,「スコア幅」で判断しなければならないのである。
受験者の側からすれば,毎回のように TOEIC を受験しても,そのスコア差が ±25 以内にとどまっているようであれば,スコアの変動に一喜一憂する必要はないということでもある。それと同時に,逆の言い方をすれば,毎回のように TOEIC を受験しても信頼区間内にとどまっているようであれば,それほど頻繁に受験すること自体意味がないと理解すべきである。特に,短期間内の複数受験はスコア変動が少ないことが予想されるので,まったく受験の意味がない。 TOEICを受験するタイミングについては,ムダのないようくれぐれも注意しなければならない。
スコア幅で考えるという発想により,2つの現象を説明することができる。第1の現象は,すでに述べたように,同一個人に起こった場合である。たとえば1回目の TOEIC 受験で 520 を取り,2か月後の2回目の受験で 480 とスコアが下がった場合でも,これは英語運用能力に差はないことを示している。つまり,スコアは下がっても,英語運用能力は下がっているわけではないことを銘記すべきである。第2の現象は,2人の異なった受験者の場合である。たとえば受験者Aが 480 であり,受験者Bが 445 であった場合には,ともに ±25 の信頼区間内にあるので,両者の英語運用能力は同じレベルにあると判断すべきである。よくあるように,480 のほうが英語運用能力は上であり,445 のほうがこれより下であると判断するのはまったくの誤りである。
ところで, TOEIC の測定誤差 ±25 についてはもう一つ考えるべきことがある。それは,この測定誤差 ±25 は,統計上 68% の確率で言えるということである。したがって,同じ英語運用能力であっても ±25 の範囲を超える場合もありうる。単純に数字上だけで言えば,±25 は 68% の確率で言えるということなので,それ以外の 32% は外れる可能性があるということを示している。それでは困る,もっと正確に推定できないかと不満に思う人もいるかもしれない。そのような場合には,68% 以上に確率を高めなければならない。たとえば 95% の確率に高めようとすると,約 ±50 の測定誤差を想定する必要がある。前に述べた 500 の例で言うと,500-50≦信頼区間≦500+50(450≦信頼区間≦550)ということになる。500 を中心として,前後 50 のスコア幅を考えなければならない。全体で言えば 100 の幅である。
これを具体的に現実に当てはめてみると,400 と 500,650 と 750 を同一英語運用能力と判断することである。しかし,これでは常識的に考えると,両者のスコア差が大きすぎると感じるであろう。そうだとすれば,そこまでの正確さを求めないで,現実的な処理の仕方をすることが考えられる。たとえば TOEIC 500 の人物Aと TOEIC 580 の人物B,2人の中から1人を選ばなければならないときには,英語運用能力に最重点を置く場合にはAを選び,その他の能力を含めた総合能力に重点を置く場合にはBを選ぶこともあり得るという考え方である。
いずれにしても,TOEIC によって英語運用能力を判断する場合には,1点を示すスコアで判断するのではなく,少なくとも ±25 のスコア幅,場合によってはそれ以上のスコア幅で判断するという態度が基本的に必要である。
TOEIC はビジネスマン対象の英語運用能力テストだと言われている。それ自体は決して間違いではない。しかし,一口にビジネスマンといっても,その職種はまさに千差万別である。総務,人事,経理,企画開発,営業,製造,技術等々,大学の専攻分野で言えば,文系あり理系ありで,すべての分野を網羅している。しかも技術一つを例にとってみても,機械,電子工学,遺伝子工学,薬品,コンピューター,鉄鋼,繊維等々,無限の分野がある。これらの分野一つ一つの業務で使われる専門英語の運用能力を評価することは,常識で考えても不可能である。なぜなら,そのためには,無限の特殊分野に対応した無限の種類の TOEIC を開発しなければならないからである。現実には,TOEIC は1種類しかない。となれば,TOEIC はビジネスマン対象ではあっても,ビジネスマン1人1人の専門分野で用いられる特殊な英語を評価するテストではない。これらビジネスマンすべてに共通した英語運用能力を評価するテストである。さらに突っ込んだ言い方をすれば,TOEICは一般人を対象とした英語運用能力テストであると言うことができる。
このことは Data and Analysis(第1回~第73回テスト総合結果, TOEIC 運営委員会発行)からも分かる。TOEIC 運営委員会では,公式テストに先立ってアンケート調査を行っているが,その1つに「主として英語を話す生活を送りながら,海外に通算6か月以上滞在したことがありますか」という質問がある。これに Yes と回答した若年層受験者の通学校と,その平均スコアは次のとおりである。通学校というのは「現在そこの学校に通っている生徒・学生」ということである。これらの生徒・学生のほぼ全員が帰国子女であると考えてまず間違いない。
通学校 | 受験者数 | L | R | T |
小学校 | 175 | 386 | 217 | 603 |
中学校 | 672 | 424 | 289 | 713 |
高校 | 4316 | 382 | 262 | 644 |
(参考: 1999年度大卒新入社員) | 232 | 208 | 440 |
これらの生徒・学生はもちろんビジネスマンではない。また,いわゆる成人でもない。すべて未成年である。しかし,かっこ内に示した 1999 年度大卒新入社員の平均スコアと比較しても分かるように,かなりの高点である。一般企業では,TOEIC600は海外出張レベルとされ, TOEIC 730は海外駐在レベルとされていることを考えれば,社員としても相当なレベルにあることが分かる。このように年齢の低い生徒・学生も TOEIC を受験できるということは,ビジネスマン以外の一般人もTOEIC の対象になり得ることを示している。
近年,大卒新入社員に TOEIC を受験させる企業の数が増えてきている。それにつれて,企業に学生を送り込む立場にある大学でも,実用的英語能力の重視という観点から,在学生に TOEIC を受験させる傾向が目立つようになってきた。この現象は,TOEICがビジネスマンだけではなく,一般人も対象になり得るという意味からすれば,きわめて自然な流れである。しかし,ここに一つだけ問題がある。それは大学で TOEIC を実施するほとんどの場合,大学が単なるテスト・センターの役割しか果していないことである。
そもそも大学というのは教育の場であり,研究の場でもある。そのような大学がただ単に TOEIC のテスト・センターにとどまっているというのは,どう見てももったいないことである。どうして TOEIC 受験によって得られた貴重なスコアの情報を,大学本来の場である教育に利用できないのであろうか。それを可能にするためには,まずスコア解釈(score interpretation)が必要となる。適切なスコア解釈が行われれば,それに基づいた効果的なカリキュラムの設定も可能になり,学生一人一人に対応した学習カウンセリングも可能となる。これからの大学はおそらくこの方向に向かって進んで行くであろう。
ただし,これらのことはすべての英語能力テストに当てはまるわけではない。TOEIC にそれが可能であるのは,次の理由による。
(1)評価を合格不合格ではなくスコアで行っている。
(2)評価測定の信頼性が統計的に証明されている。
一般的に言うと,英語能力テストとは英語学習の達成度を評価するために用いられるものである。入学試験は合格者を選抜するために用いられ,学期末試験・学年末試験は成績評価をするために用いられる。しかし,いったん合格が決まり,成績評価が行われれば,それで物事は完結する。それ以上テスト結果が問題にされることはない。留学生試験である TOEFL についても同じことが言える。志望大学の要求するスコアを取ることができれば,入学が許可され,それでテスト目的は達成される。入学後 TOEFL スコアが問題にされることはない。
しかし,TOEIC の場合は事情が異なるようである。なぜなら,TOEIC スコアはそれだけでは自己完結することがないからである。TOEIC には,入学試験のように合格不合格といった明確な基準がない。もちろん企業内の資格試験とか,ソウル・オリンピックで行われたように通訳選考試験として使われる場合には,他のテスト同様,選抜基準は明確である。しかし,TOEIC の場合には,そのようなケースはむしろまれである。普通 TOEIC が使われるのは英語運用能力の評価のためであって,合格不合格といった基準として使われることは少ない。実は,ここにTOEIC の特色,つまりマイナス面とプラス面とがある。
TOEIC のマイナス面は,TOEIC は合格不合格といった具体的な基準を示さないために,全体的に理解しにくい点があることである。受験者は英語運用能力をいくら詳細にわたって説明されても,英語運用能力とスコアとの関係が理解しにくい。それどころか,英語運用能力が詳細にわたって説明されればされるほど,話は抽象的になり,ますます理解しにくくなる。これに対して,スコアによる評価は行っても,TOEFL のように,それぞれの志望大学が 550,580 などのように具体的なスコアを示して,それを合格点とすれば,合格基準は明確になり理解しやすい。受験者が求めるのは具体的なスコアであることを考えれば,これは当然なことである。
面白いことに,TOEIC のプラス面は,まさにこの TOEIC のマイナス面そのものの中にある。TOEIC には他のテストとは違って,テスト結果を基にして将来の英語学習につなげようとする傾向がある。これが可能になるのは,それぞれのレベルの英語運用能力をスコアで示すことができるためである。合格不合格だけを示すテストではできることではない。たとえば,企業は 450 とか 490 を取った社員に対しては,目標として 600 を目指して学習させることができる。英語運用能力がスコアで示されるだけに,目標が具体的であり,それだけに研修もしやすい。TOEIC を利用すれば,TOEIC スコアによって研修レベルを設定し,最も効果的といわれる能力別クラス編成を組むことも可能である。さらに研修前とともに研修後にも TOEIC を実施すれば,研修成果が分かるだけではなく,どのタイプの研修がより効果的かを判断することもできる。この方法を系統的に繰り返していけば,最終的には最も効率のよい研修システムを開発することができる。経済・時間の効率化などの点で,その価値は計り知れない。これは TOEIC の統計的信頼性が高いからできることである。
このことからも分かるように,TOEIC の大きな特色は英語学習との関連が強いことにある。そのため,TOEIC 受験者は他のテストと違って,繰り返し受験する人の数が多い。これは自分の現在の英語運用能力レベルを知り,さらに高いレベルを目指して学習する受験者が多いことを示している。このことを察知して,書店には TOEIC 対策本が数多く並び,新聞広告にも TOEIC プログラムが宣伝され,英語学校でも TOEIC コースをうたったものが目立っている。それ自体は非常に結構であり,大いに歓迎すべきである。
しかし,残念ながら,これらのほとんどはあまり信用できない。自分に都合のいい単なる宣伝ではなく,学習前・学習後の TOEIC スコアを具体的に示す良心はないものであろうか。TOEIC スコアを示せば,うそは直ちに見破られる。私の今までのデータ調査の経験によれば,短期間で英語能力の伸びが TOEIC スコアに現れることはまずあり得ない。明らかな TOEIC スコアの伸びというのは,測定誤差±25 を考慮した 50 の伸びのことである。これを短期間に実行できれば,英語教育会で大きな話題となることは間違いない。もちろん日本だけではなく,全世界においての話である。
前回,「測定誤差を考慮した場合,短期間で英語能力の伸びが TOEIC スコアに現れることはまずあり得ない」という主旨のことを述べたが,これはすべてのTOEIC スコアについて言えることではなく,あるスコア以上についてのみ言えることである。この点,説明不足であったため,誤解を避けるために,ここで改めて詳しく述べてみることにする。
TOEIC が英語能力を測定するテストシステムであることはだれでも知っていることである。しかし,その英語能力もレベルによって大きく特徴が異なることは案外知られていない。低いレベルでは短時間の研修でも英語能力は伸びるが,レベルが上がるにしたがって長時間の研修をしなければ英語能力は伸びないようになる。このことを,英語能力予測プログラム CEPAC (Communicative English Proficiency Assessment and Counseling System) によって算出してみると,次のようになる。なお,CEPAC データベースのための企業内研修条件は,次の4項目である。
(1)研修生は大卒
(2)講師はネイティブ・スピーカー
(3)1回2時間単位
(4)クラス・サイズは 10 名程度
(例1) 30 時間の英語研修を施した場合の予測
条件 - 研修前スコア | 研修後予想スコア | スコア増加 |
300(L155/R145) | 355 | 55 |
350(L180/R170) | 399 | 49 |
400(L205/R195) | 444 | 44 |
(参考:1999年度大卒新入社員) 440(L225/R215) | 480 | 40 |
30 時間の研修で見ると,測定誤差 ±25 の範囲を超えている(つまり,英語能力が伸びたと判断される)ものは,研修前スコアが 350 未満の場合に限られる。350 以上の場合には,研修時間が足りないため,測定誤差内にとどまり,平均的には研修成果が現れないということが分かる。したがって,1999 年度大卒新入社員の場合には,30 時間の研修では英語能力を伸ばすことはできないことを示している。研修成果に過大な期待をかけず,学習の動機づけ程度に考えて実施する必要がある。
(例2) 50 時間の英語研修を施した場合の予測
条件 - 研修前スコア | 研修後予想スコア | スコア増加 |
350(L180/R170) | 405 | 55 |
400(L205/R195) | 449 | 49 |
500(L260/R240) | 537 | 37 |
例1より 20 時間増やして 50 時間の研修を行った場合には,研修前スコアが400 未満の時には測定誤差の範囲を超えているが,400 以上の英語能力レベルの場合には研修成果は現れないと判断すべきである。
(例3) 100 時間の英語研修を施した場合の予測
条件 - 研修前スコア | 研修後予想スコア | スコア増加 |
400(L205/R195) | 462 | 62 |
500(L260/R240) | 550 | 50 |
600(L310/R290) | 639 | 39 |
例2よりさらに 50 時間増やして 100 時間の研修を行った場合には,研修前スコアが 500 未満の時に測定誤差の範囲を超えることが分かる。600 以上の場合には,100 時間の研修でもはっきりした成果は現れないことが予測される。
このように,英語能力が低い場合には短時間の学習でも成果は現れるが,レベルが上がるにしたがって学習成果はなかなか現れない。これは常識で考えればだれでも分かることであるが,常識を無視して下手に数字にとりつかれると判断を誤ることになる。心すべきである。
achievement test と proficiency test の違いについてはすでに 18 号(2000年5月12日発行)で説明したが,実際には誤解されるケースが多いようである。その最たる例が「短時間の学習で TOEIC スコアを大幅に上げることができる」というものである。これは TOEIC の測定誤差 ±25 を超えたものを指すことがほとんどである。この中には明らかに誇大宣伝と思われるもの(市販商品は圧倒的にこの例が多い)と,まじめにデータを出した結果,そのようなスコア伸びを示した場合の2つのケースが考えられる。販売促進目的で意図的に TOEIC スコアを捏造した場合は論外としても,実際に「短時間の学習で測定誤差以上のスコア伸び」を記録した場合には,その結果をどう判断すべきか具体的な手順を述べてみよう。
(1) pretest が TOEIC 400 以下の場合は除外する
学習効果を調べる場合には,pretest(学習前テスト)と posttest(学習後テスト)を行って,両者のスコア差を比較することがよくある。もちろん使用するテストは,スコアで評価し,国際的な信用の高いものでなければならない。TOEIC はその資格を十分備えている。
TOEIC 400 以下の場合には,短時間の学習で 50(測定誤差)以上の伸びを示すことがあるので,調査対象からは除外することが望ましい。proficiency とは運用能力を示すが,400 以下のレベルでは,proficiency というよりはむしろachievement のレベルと考えるほうが自然である。いわゆる学習レベルである。この段階では学習内容がまだきわめて限られているので,わずかの学習でもスコア伸びとなって現れることがある。
ちなみに,測定誤差は正式には標準測定誤差と言われるもので,絶対的なものではない。68% はその範囲に入るが,例外も 32% あることを示している(25号参照)。
(2) サンプル数が少ない場合は,pretest を2回行う
サンプル数が少ないと,「体調が悪い」とか「テストに慣れていない」などの原因によって,pretest と posttest との間に不自然なスコア差が生じることがある(29号参照)。サンプル数が多ければその恐れはなくなる。サンプル数が,たとえば 30 以下の場合には,pretest を2週間以内に2回行って,テスト慣れをさせておく必要がある。テスト形式が被験者にとってまったく経験外の場合には,学習をまったくしなくても,2回目のテストでスコアが大きく伸びることがあるからである。特に proficiency レベルが低いときには,スコアの伸びは大きくなる。テスト慣れによってスコアが伸びるのである。反対に,proficiency レベルが高い場合には,テスト慣れによるスコアの伸びは少なくなる。外的要因によって影響されることが少ないからである。それだけに,そのスコアを上げるためには多大の学習を必要とする。
(3) 統計による検証を行う
ある学習法を行って,短時間,たとえば 20 時間で 100 のスコア伸びが認められると主張する場合には,それを具体的に数値で示す必要がある。たとえば,学習時間を 20 時間に設定して,各レベル別(たとえば,400~445,450~495,500~545,550~595)の pretest スコアと posttest スコアの変数間の回帰直線と回帰式を求めてみるのも一つの方法である。各レベル・グループに 20 人,計80 人の無差別抽出の被験者を利用できれば十分であろう。その回帰式が絶えず100 以上を示せば,その学習法が画期的であることが証明されたことになる。
理論的検証が行われていない場合でも,きわめて単純な方法で検証することができる。実はこのほうが,理論的検証より確実性がある。その方法は次のとおりである。「20 時間の学習で 100 スコアが伸びる」と称する学習法,または学習プログラムを使って,無差別抽出の 30 人程度の被験者を対象に実験し,20 時間後に pretest と posttest の結果を比較してみる。100 の伸びの達成率が 100%であれば完璧である。そこまで行かなくとも,70% 以上であれば,その方法は十分優れていると言える。
以上いずれの場合でも TOEIC フォームは違っていることが望ましい。もちろん学習の中で TOEIC 問題を取り扱うことは許されない。
TOEIC は 1979 年 12 月に第1回テストを実施して以来,現在では全世界で150 万人以上もの人々が毎年受験している。その信頼度は企業を中心として絶大なものがある。今さら改めて言うまでもないが,TOEIC は英語能力を測定する物差しである。しかも,きわめて正確に測定できる尺度であり,言わば「メートル原器」である。
最初 TOEIC が導入され,その評価が日本国内で定着し始めたころは,筆者も「これでようやく英語教育も科学になることができる」とか,「悪徳商法まがいの英語教材も淘汰される」と考えて,ひそかに新たな英語教育時代の幕開けを期待したものである。しかし,世の中はそれほど甘くはなかった。考えてみれば,世間にはこの種のきわどい商法は枚挙にいとまがない。必要以上に夢をあおる化粧品,実体のないエステサロン,かえって病状を悪化させるアトピー治療薬,金銭欲を利用したねずみ講--これらすべては人の弱みと関心を巧みについた商売である。英語教材も同様である。それどころか,英語教材が日本ほど売れているところは世界にも例がない。これは大げさに言えば,日本人すべてが「英語ができたら」という願望にとりつかれているためである。英語教育は日本では一大産業なのである。
正確な英語能力測定基準である TOEIC の出現によって,詐欺まがいの英語教材が下火になるとの期待は見事に裏切られた。それどころか,これらの英語教材は TOEIC を栄養素として,ウイルスのように自己増殖を始めたのである。TOEIC 対策と銘打ったさまざまの単行本,CD プログラム,英語クラス等々,その数はおびただしいものがある。これでは TOEIC 導入以前よりも,むしろ悪徳商法を助長している感すらある。
TOEIC 関連プログラムの中でも学習者を惑わすのは,「短時間で TOEIC スコアが 100 点上がる教材」といったように,販売促進目的で具体的な TOEIC スコアを持ち出す英語プログラムである。もしそのデータが捏造したものであるとすれば,その罪は重い。ちょうど,ダイエット商品販売で,使用前と称して太った写真を示し,使用後と称して痩せた写真を示して消費者の好奇心をそそるようなもので,英語教材販売の方法としては最低である。これは TOEIC が「メートル原器」であることを知らないことから起こる暴挙である。知っていてやったとなれば確信犯であるので,その罪はさらに重い。
しかし,TOEIC スコアを使って学習前と学習後の学習効果を示そうという,だれでも思いつく時系列的アプローチは,口で言うほど簡単ではない。TOEIC は proficiency test であり,言わば無数の achievement test の集大成のようなものであるので,その伸びの測定は achievement test のように単一学習項目の学習成果を測定するのとは違って簡単ではない。測定誤差(±25)を含んだ測定可能の proficiency の伸びを測定しようとなると,TOEIC 400 以上の場合には,おそらく 100 時間以上の学習が必要となることが予想される(CEPAC予測)。
proficiency を伸ばすために長時間の学習を可能にするためには,
(1)長時間に耐えられる教材の存在
(2)長時間にわたる被験者の管理方法
などの問題を解決しなければならない。これらを考え合わせると,TOEIC を利用したスコア伸びの時系列的アプローチは実行が難しい。実行のしやすさから見れば横断的アプローチのほうが,データも集めやすく,統計処理もしやすい。これが企業内研修の 2,000 名以上の各種データを収集して開発された画期的なコンピュータ・プログラム CEPAC である。これにより現在の企業内研修でどのくらいの研修時間を施せば,どのくらい TOEIC スコアが伸びるかが予測できる。
英語学習と TOEIC は表裏一体の関係にあるが,あえてどちらがより重要かというと,英語学習のほうが重要である。英語学習は英語能力を伸ばすことに直接関わっているからである。英語学習をマクロ的に見た場合,英語学習成功の最大要因は学習時間である。自国語は膨大な学習時間を掛けるために例外なく習得に成功する。これに対して,外国語習得は恵まれた環境と,自国語習得ほどではないが,豊富な学習時間に裏打ちされて初めて可能となる。したがって,成功者の数は限られる。この事実に基づけば,たとえば,理想とする TOEIC 900 に達するために必要な学習時間は 3,000 時間なのか,4,000 時間なのか,またはそれ以上なのかをまず見極めなければならない。最終目標を下げれば,必要学習時間も少なくなるであろう。いずれにせよ,マクロ的観点から自分の目標レベルをまず設定することである。目先のスコアの伸びに一喜一憂することはあまり意味がない。目標レベル以下の英語能力では役に立たないからである。
何か胡散臭そうな副題であるが,けっしてそうではない。立派に理論と事実に裏づけられた推論である。ただし,これは伝統的な学校英語教育を受けてきた日本人,しかも受験英語に強く影響された日本人にのみ通用するものである。国際的汎用性はない。皮肉なことに,非難の矢面に立っている日本の英語教育の特殊性が逆に役立っているのである。
ここで述べる「潜在能力」とは,表面に出てきていない英語能力のことを指す。端的に言えば,英語の授業で習った知識であり,特に大学受験時代に懸命になって勉強した英語の知識のことである。これらの知識は,コミュニケーションの即戦力としてあまり役に立たないが,活用次第によっては,短時間の訓練で立派な実践的英語能力に変身する。
今までに学校英語を相当勉強してきたと自負する人は,この潜在能力の高い人である。これに反して,英語の勉強をほとんどしなかった人は潜在能力が低い。これを検証する簡単な方法は,まずリスニング教材などで英語を聞いてみることである。耳で聞いて意味が分からなくても,テキストを見ればほとんど分かる場合には,潜在能力はかなり高い。きわめて有望である。チラッと見ただけで意味が分かるようであれば,潜在能力は最高レベルにある。また,時間を掛ければ大体の意味が推測できる場合でもかなり脈はある。しかし,文字を見ても全然意味が分からない人は潜在能力がないと判断すべきである。したがって,潜在能力を利用した学習法に期待することはできない。地道に学習を積み重ねるしかない。
TOEIC を受験したことのある人なら,L(Listening スコア)とR(Reading スコア)を比較することによって,潜在能力の有無を簡単に見分けることができる。LよりRのほうが高ければ高いほど,潜在能力があることを示している。つまり,L<R型の学習者のほうが短時間のリスニング学習で,Lが大幅に伸びるということである。ただし,その場合には,Rが 200 以上であることが望ましい。200 以下のRは,まだ応用できる英語能力レベルに達していないと判断されるからである。
この間の事情を,企業内研修 2,000 名以上のサンプルに基づいて開発したコンピューター予測プログラム CEPAC (Communicative English Proficiency Assessment and Counselling System) でシミュレーションしてみると,次のようになる。研修前のスコアは分かりやすいように,すべて同一の 450 とした。ただし,その内訳のスコア(LとR)は異なるように配分した。研修時間はわざと短時間の 30 時間としている。
スコア差 | T1( L1 R1 ) | T2( L2 R2 ) |
例1 (R1-L1=50) | 450 ( 200 250 ) | 502 ( 250 252 ) |
例2 (R1-L1=10) | 450 ( 220 230 ) | 494 ( 253 241 ) |
例3 (R1-L1= 0) | 450 ( 225 225 ) | 491 ( 253 238 ) |
例4 (R1-L1=-10) | 450 ( 230 220 ) | 489 ( 254 235 ) |
例5 (R1-L1=-50) | 450 ( 250 200 ) | 480 ( 257 223 ) |
例1~3がL<R型であり,例4と例5がL>R型を示している。このシミュレーションの結果からも明らかなように,L<R型のほうがスコアは伸びやすい。しかも,大幅に伸びるのはLである。Rではない。
このことは一見不思議に思われるかもしれないが,実は不思議でも何でもなく,常識を裏づけたものに過ぎない。この一連の流れは「文字英語は理解できるが,音声英語は理解できない」ということである。そして,文字英語が理解できるのであれば,音声英語の理解はそれほど難しくはない。文字と音声の伝達メディアの違いだけだからである。かなりのレベルの文字英語知識をすでに持っているのであれば,後は発音とスピ-ドに慣れさえすれば音声英語に強くなるのは当然である。不思議でも何でもない。したがって,音声中心の正常なネイティブスピーカーによる企業内研修を行えば,潜在能力は音声英語に簡単に転換し得る。そして,その結果はスコアの大幅な上昇として現れる。ただし,スコアの大幅な上昇は,異常なL<R型が正常なL>R型に転換した時点でストップする。L<R型が正常に戻れば,後は地道に学習するしかない。
海外で一定期間以上生活し,現地で英語を実際に使ってきた経験のある人は,いったいどのくらい英語能力が身につくものであろうか。このような人たちと学校で英語を勉強した普通の日本人とは,どのくらい英語能力の上で差が出るのであろうか。そんな疑問と関心を持っている人はかなり多いことが推測されるので,この点について説明してみよう。
TOEIC 公開テスト受験者には簡単なアンケート調査が行われているが,その中に「主として英語を話す生活を送りながら,海外に通算6か月以上滞在したことがありますか?」というのがある。この質問に対して yes と回答した受験者は,かなりの英語経験があるものと予想される。当然その TOEIC スコアは高いはずである。
次に示した表は,Data and Analysis(第1回~第 73 回テスト総合結果,TOEIC運営委員会発行)からの引用である。かっこ内は,上記質問に対して no と回答した受験者の TOEIC スコアで,参考のために示した。
受験時資格 | 受験者数 | L | R | T | (受験者数 L R T ) |
小学生 | 175 | 386 | 217 | 603 | ( 15 277 150 427 ) |
中学生 | 672 | 424 | 289 | 713 | ( 325 212 128 340 ) |
高校生 | 4316 | 382 | 262 | 644 | ( 9373 245 183 428 ) |
大学生 | 77783 | 413 | 333 | 746 | (481524 288 253 541 ) |
大学院生 | 3569 | 407 | 354 | 761 | ( 45050 283 265 548 ) |
海外生活経験者と未経験者のスコアを比較してみると,当然のことながら,すぐ気がつくのは両者のスコアの大きな差である。これを企業の場合に当てはめて調べてみよう。日本の企業では,社員の英語能力はできれば 730 以上,少なくとも 600 は欲しいと考えている場合が多い。その点からすると,年齢的に社員の対象になり得る大学生の海外生活経験者はその期待に十分応えていることが,上の表で分かる。しかし,これと比較すると,未経験者はすべて 600 以下であり,企業の期待にはまったく応えていないことになる。いわゆる,使える英語能力と使えない英語能力との差がここにはっきり現れている。
次に,注目すべきことはLとRのセクション・スコアである。結論から先に述べると,実用レベルに達していると思われるスコアは,LおよびRともに,350 以上であると思われる。実用レベルとなると,最低でも 300 は欲しいところである。この基準に照らし合わせると,海外生活経験者の場合は,Lはすべて実用レベルに達していることになる。しかし,Rとなると大学生以上のみがかろうじて有資格者であって,高校生以下は実用レベルに達していない。未経験者に至っては,L,Rいずれの場合にも実用レベルには達していない。ここにも,使える英語能力と使えない英語能力との差がはっきり現れている。
以上を総合してみると,海外生活経験者は特にリスニングの点で優れていることが分かる。小学生を含めて,すべてが 350 を超え,400 に近い 380 以上を示している。これならば実際のコミュニケーションの場に臨んでも,何の不自由も感じることはないであろう。
これと比較すると,リーディングには問題がありそうである。大学生であっても,そのスコア 333 ではまだ完全とは言えない。それ以下の高校生までの年齢では,リーディングにはまだ不安が残る。
もっともここで述べる基準スコアは,TOEIC 受験対象者である成人について適応されるものであって,対象外の高校生以下の年齢に対しては当てはまらない。したがって,年齢相当のリーディング能力については十分であるのかもしれない。 この点の検証は,テスト対象を高校生,中学生,小学生に分けて,個別にリーディング・テストを実施してみないと断言することはできない。しかし,逆に,その点を考慮すると,高校生以下のリスニング力はきわめて高いと言うことができる。
TOEIC の公開テスト(Secure Program,SP と略す)を受験すると,ETS(Educational Testing Service)からスコア・レポート(英語能力認定証)が郵送される。これの有効期限は2年であると言われている。有効期限というと,食品の賞味期限を思い出して,なんとも妙な気がするが,果たしてこれは何を意味しているのであろうか。このことを知るには,TOEIC の姉妹プログラムである英語留学生試験 TOEFL の説明を読むとその趣旨がよく分かる。それにはこう書いてある。
Because language proficiency can change considerably in a
relatively short period of time, scores more than two years old
cannot be reported or verified. Test scores are retained on a
database only for two years from the date of the test. If you
took the TOEFL and/or the TSE test more than two years ago, your
scores will no longer be on file. You will have to take the
test(s) again in order to have your scores reported.
(言語能力は比較的短期間でかなり変動するので,2年以上経ったスコアを通知したり,証明することはできません。テスト・スコアがデータベースに保存されるのは,テスト実施日以後わずか2年間です。TOEFL および/または TSE を2年以上前に受験された場合には,あなたのスコアは保存されていません。スコアの通知を希望される場合には,もう一度受験していただくことになります。) URL //toefl.org/toefl/tfladdcrpt.html |
この説明からも明らかなように,ETS の判断としては「英語能力は変動しやすく,長く見積もってもテスト実施から2年以上経ったものは保証できない」ということである。データベースから削除されるのであれば,再発行は物理的にも不可能である。ETS がアメリカの大学への留学生の英語能力テストを実施し,その結果を保証しなければならない立場にあることを考えると,これは無理からぬことである。毎年入学のための選抜がある場合には,できれば1年以内に受験してもらい,新しいデータを志望校へ提出してもらいたい,というのがおそらく本音であろう。 このことからも推測できるように,英語能力は変動するにはするが,最悪の条件として,まったく英語と接触しない場合を考えた場合,それが半年後に起こるのか,1年後に起こるのか,または2年後に起こるのかは,個々人による条件もそれぞれ異なるので,類型的に断定的な判断を下すことはできない。ただ常識的に,または経験的に言えることは,2年以上にわたらないほうが安全であろうということである。実際には,TOEIC を受験して,それ以後まったく英語と接触しないということは考えられないので,半年後に英語能力が急激に低下することはまずあり得ない。となると,無難な線は2年以上にはならず,できれば1年前後というのが考えられるところである。
ただし,ここで気をつけなければならないのは,この有効期間は入学試験,専門職資格試験などのように,厳密にその人物の英語能力を判断し,たとえばその人物を新規採用しようとする場合に限られることである。一般的に実社会で英語能力を云々する場合には,有効期間は2年前であろうと,3年前であろうと,または5年前であろうとほとんど関係ない。何年前であろうと,TOEIC スコアで示された英語能力が実社会で通用している限りは,その人の英語能力には何ら問題がない。むしろ英語能力よりは,実務を遂行するための知識と実績,および経験が必要とされるであろう。ちょうど入学試験に通ってしまえば,トップで合格しようと,ビリで合格しようと問題にならないのと似ている。むしろいつまでも入学試験の合格順位にこだわっているほうが問題である。いったん入学したら,入学後の努力と研鑚が重要になる。同様に,いったん実務につけば,その実務をいかに効率よく実行するかが重要になる。例外的職種を除いて,日本人は日本語にこだわることはない。英語も同様である。コミュニケーションの手段としての英語能力は重要だが,実用レベルに達したら,英語のことは忘れるように心掛けるのが本筋である。
最後に一言,「有効期限」はあくまで便宜的な一応の目安でしかない。英語能力の変化を科学的に測定した結果,2年と判断したわけではない。したがって,「TOEIC を何度も受験させるための商業上の謀略である」という風評を耳にしたことがあるが,これはまったくのナンセンスである。上記の考えは,すべての言語能力テストに当てはまるものである。
TOEIC は英語能力をトータル・スコア(Total Score)で示し,トータル・スコアはリスニングとリーディングの2つのセクション・スコア(Section Score)から成る。さらに,リスニングは4種類,リーディングは3種類,計7種類のパート(Part)から成り立っている。その関係は次のようになる。
トータル・スコア | リスニング・ スコア | 写真描写問題(one picture) | 10問 |
応答問題(question-response) | 30問 | ||
会話問題(short conversation) | 30問 | ||
説明文問題(short talks) | 30問 | ||
リーディング・スコア | 短文穴埋め問題(incomplete sentences) | 40問 | |
長文穴埋め問題(text completion) | 12問 | ||
読解問題(reading comprehension) | 48問 |
多くの場合,TOEIC で問題になるのはトータル・スコアである。これは TOEIC の姉妹プログラムである TOEFL の場合も同様である。と言うよりは,TOEFL はトータル・スコア以外が話題になることはない。なぜなら,受験者にとって必要なのは希望大学の要求する TOEFL 合格スコアだけだからである。しかし,TOEIC は TOEFL のように合格・不合格が目的となる場合は少ない。個人として受験するときは自分の英語能力を知るためであり,企業が社員に受験させるときは英語学習に対する動機づけが目的である場合が多い。ここに TOEIC の大きな特徴がある。TOEIC は英語能力テスト(proficiency test)としてだけでなく,英語学習に対するガイドラインとして利用される傾向がある。
受験者の弱点を指摘し,今後の学習のガイドラインにするというのは,TOEIC を診断テスト(diagnostic test)として使いたいという希望の現れでもある。診断テストとして使うためには,トータル・スコア,セクション・スコアだけでは物足りない。さらに下位区分であるパート・スコアが欲しくなる。それでは,パート・スコアを受験者に示せば,学習者にとって弱点が明確になり,今後の学習に非常に役に立つのであろうか?その答えはノーである。
診断テストというのは,何が長所で,何が弱点かを示すものである。しかし,問題なのは,上記の7種類のパートは何をテストしているかということである。リスニングについて言うと,前半の2種類の問題はやさしいリスニング総合問題であり,後半の2種類の問題は難しいリスニング総合問題である。リスニングの個別の特性を検査しているわけではない。たとえば,発音の識別,イントネーション,スピード,意味の理解などについては具体的に何も示していない。示しているのは能力レベル差だけである。これでは診断テストとしての機能を果たすことはできない。
リーディングの場合も同様である。文法語彙問題でも,問題形式は文法と語彙に関するものであるが,それでは読解問題は文法と語彙には無関係かというと,そうではない。両者の問題はお互いに密接に関係し合っている。あえて識別をすれば,誤文訂正問題は理解能力(comprehension)ではなく,表現能力(production),つまりライティングに傾いた問題であると言うことができよう。いずれにしても,受験者の長所・弱点を具体的に指摘する診断テストとして利用するには物足りない。
リスニングの場合でも,リーディングの場合でも,TOEIC の パート・スコアは,厳密な意味での診断テストにはなり得ない。TOEIC は英語能力テストであり,それを完成させるために,それぞれのパートは総合されて,それぞれのセクション・スコアとなるように仕組まれている。したがって,これ以上スコアの内容を細分化すると,かえってテストの信頼性を失うことになる。そのため,TOEIC はパート・スコアを公示しない。英語能力テストと診断テストは互いに異なったテストであることを理解しなければならない。
TOEIC は他のテストのように合格・不合格による評価を行わないので,今ひとつピンとこないところがあるはずである。TOEIC のように,スコアを使って英語能力評価を行うことは,評価の単純さという点では合格・不合格評価より劣るが,より複雑な評価を行う場合には,その威力を発揮する。TOEIC スコアの読み方,解釈の仕方に対する多少の知識が必要になるのはそのためである。ここで TOEIC スコアの読み方と,スコアを使っているために,さまざまの情報を得られることの1例を挙げてみよう。
次に示した表は,Data and Analysis(第1回~第 73 回テスト総合結果,TOEIC 運営委員会発行)と TOEIC Newsletter(2000's Newcomers,TOEIC 運営委員会発行)からの引用である。公開テスト(SP)とは Secure Program のことで,一般の人が受験する公式テストのことである。また,団体一括テスト(IP)とは Institutional Program のことで,企業・学校などの場で行われるテストである。IP のテスト問題は,過去の SP で用いられたテスト問題を再使用したものであるが,これらはすべて未公開であるので,普通に利用される場合には特に問題ない。TOEIC-SP 受験者は自らの意志で受験するので,自分の英語力にある程度自信があるか,関心を持っている場合が多い。したがって,自分の意志とは無関係に,受験を強制される TOEIC-IP 受験者よりもスコアが高くなる傾向がある。人数的に言うと,TOEIC-SP 受験者のうち 20 歳~39 歳の年齢層は,全体の累積受験者数 1,808,698 の 88 %に相当し,この層が圧倒的に多い。したがって,TOEIC スコアはこの年齢層の英語能力を強く反映している。その中でも,特に 20 歳~ 29 歳の 20 代は全体の 68 %を占めている。
表で示した順序は,全受験者のトータル・スコアを,受験者の条件に応じて,高い順から並べたものである。
受験者数 | L | R | T | |
公開テスト(SP) | ||||
海外生活経験者 | 295,040 | 393 | 319 | 712 |
海外生活未経験者 | 1,513,658 | 286 | 248 | 534 |
団体一括テスト(IP) | ||||
2000 年度大卒新入社員 | 36,985 | 239 | 211 | 450 |
受験者総数 | 4,022,461 | 233 | 200 | 433 |
海外生活経験者とは,この場合,6か月以上英語圏で英語を日常使って生活した経験のある人々を示す。そのような経歴を持っていることを考えると,この層が 700 以上の高スコアをとることは十分予想されることである。この人々が海外生活未経験者と比べると,200 近くのスコア差をつけていることは納得できるところである。しかし,これらの海外生活未経験受験者であっても,もともと自分の英語力にある程度自信のある TOEIC-SP 受験者は TOEIC-IP 受験者よりスコアが高い。データもこれを裏書して,100近くもスコアが上回っている。
これら4つのグループに共通して言えることは,すべての場合に L と R との間の関係は,L≧R の正常パターンを示していることである。これとまったく逆の L≦R パターンは,大学受験勉強に専念し過ぎたために起こることの多い文字英語中心タイプであり,文字英語の能力レベルが高いか,またはむしろ文字英語に対して,音声英語の能力レベルが異常に低いことを示している。L≧R の正常パターンに対して,異常パターンとでも言うべきものである。しかし,この異常パターンは,上表のいずれの場合にも見られない。これは一般的には,L≧R が主流であって,大学受験色の強い L≦R のパターンは少数派であることを示している。
この異常パターンを正常化するためには,大学受験科目にリスニングを導入することが有意義な方法であると思われる。これにより,音声英語と文字英語のバランスをとることができるからである。しかし,リスニング・テストを大学入試に導入する場合には,選抜試験ではなく,資格試験の性質を持たせるべきである。選抜試験にすると,奇をてらった,重箱の隅をつつくような無意味な問題が頻出するようになるからである。
TOEIC を大学で利用するのは学生の英語能力を測定するためであるが,ただそれだけのことであれば,何もあえて手間ひまかけて大学で TOEIC を実施することはない。テストをするだけのことであれば,テストセンターに任せれば済むことである。大学で TOEIC を実施する意味は,TOEIC の結果を大学英語教育にいかに関連づけるかということにある。
筆者の勤務校でも,今年7月に新入生全員に対して,初めて TOEIC を実施した。その目的は3つある。
第1の目的は,個々の学生に対する英語学習カウンセリング用データを作成すること (個人指導)。
第2の目的は,カリキュラム改定を含めて,大学における英語教育の効果を高めること (英語教育の効率化)。
そして,第3の目的は,さまざまの入試形態を通じて入学してきた学生の英語能力の実態を把握することである(入試制度点検)。
以上の3つの目的に共通して言えることは,これらの目的を達成するためには,信頼できる英語能力テストが絶対に必要であるということである。大学で行われている学期末試験とか学内一斉テストといった類いのテストでは,授業で習った学習成果(achievement)を調査するのがやっとで,一般英語能力(proficiency)を正確に評価することはできない。テストの信頼性に問題があるからである。TOEIC は妥当性,信頼性いずれの点においても,これらの要求を十分満足させることができる。
論を進めるに当たって,まず大学英語教育に関する2つの前提について述べておかなければならない。
第1の前提は,学生全員の一般英語能力を,大学卒業時までに,実用レベルに引き上げるべきだという理想主義的な立場をとらないことである。大学生の英語能力は中学・高校での英語教育の結果であるので個人差が激しく,その能力格差を大学段階で埋めることはきわめて困難である。不可能と言ってもよい。ましてや,すべての学生の英語能力を実用レベルに引き上げようとするのは現実的ではない。それよりも,個々の学生に学習のためのできるかぎりの機会を与えることによって,学習目標達成の可能性を高める努力をすべきである。個人指導の意義がここにある。
第2の前提は,一般英語能力(proficiency)は短時間の学習では簡単に伸びないことを十分認識することである。授業で習った学習成果(achievement)をテストする achievement test であれば,出題範囲も限られているので,場合によっては一夜漬けの「付け焼刃」でもかなりの得点を取ることは可能である。しかし,出題範囲が無制限の TOEIC のような proficiency test の場合には,短時間の学習では,明らかな実力の伸びを示すほどのスコアの大幅増は期待できない。スコアを大きく伸ばすためには,じっくり時間をかけて「実力」を身につけなければならない。もし実力を伸ばすためには,短時間ではなく,かなり長時間の学習が必要ということになれば,学習時間に制約のある学校英語教育では,学習目標の達成が難しいということになる。結果として,授業以外の自己学習に頼らざるを得なくなる。ここに自己学習と,それを支える個人指導の重要さがある。
さて,ここからいよいよ本題に入ることになる。一般英語能力を示す TOEIC スコアは,L(Listening)とR(Reading),およびLとRを総合したT(Total)の3種類から成り立っている。留学生試験 TOEFL のように,TOEIC スコアを合格不合格の基準として使う場合には,総合スコア,つまりTだけあれば事足りる。しかし,スコアに基づいて英語能力の判断をしようということになると,これだけでは情報不足である。ちょうど正確な物差しを手に入れ,あっちこっちいろいろな物を測ってみても,それが目的に適っているのか,適正な長さなのか,短すぎるのかが分からなければ何の意味もない。同様に,TOEIC が正確な物差しであっても,それだけでは何の役にも立たない。それが適正な長さなのかどうかを示す基準,つまり英語能力レベルの基準がなければならない。TOEIC スコアと英語能力レベルを対応させなければならないのである。これについては TOEIC 運営委員会も Proficiency Scale(TOEIC スコアとコミュニケーション能力レベルとの相関表)をすでに発表している。
次節ではこのことについて述べてみることにする。
TOEIC は他の英語能力テストと異なり,合格・不合格の形で使われることが少ない。そのため,TOEIC を受験しても,そのスコアをどのように解釈してよいか判断に迷う場合が多い。たとえば,TOEIC スコアと英語能力レベルの相関表を見せられても,そこに書かれていることのほとんどは受験者自身がすでに知っている事実であり,それだけでは物足りない気持ちが残る。受験者のニーズに応える情報が少ないためである。
TOEIC 受験者の知りたい情報とはいったい何なのであろうか。それは「自分の英語能力が実用レベルに達しているかどうか」ということであろう。しかも,自分の英語能力がまだ実用レベルに達していないことを知っている場合がほとんどであるので,受験者の求めている情報は次の2つであると思われる。
第2の点はここで扱うには大きすぎる問題であるので割愛することとし,第1の点に絞って話を進めることにする。次に示したのは,TOEIC スコアの絶対評価ではなく,「実用レベル」を中心に据えた相対評価である。相対評価でないと実体は浮かび上がってこない。
L | R | T | |
完成レベル | 495 | 495 | 990 |
| | |||
450 | 450 | 900 | |
(完成レベルへの移行期) | 445 | 445 | 895 |
| | |||
400 | 400 | 800 | |
実用レベル | 395 | 395 | 795 |
| | |||
300 | 300 | 600 | |
(実用レベルへの移行期) | 295 | 295 | 595 |
| | |||
250 | 250 | 500 | |
学習レベル | 245 | 245 | 495 |
| | |||
5 | 5 | 10 |
そもそも英語能力というのは,どこから始まってどこで終わるといった明確な線引きのできる性質のものではなく,また,線引きを強行すると誤解を招く恐れがあるので,「完成〔実用〕レベルへの移行期」というどちらのレベルとも考えられる緩衝地帯を設けてみた。
参考資料として,今までに分かっているいくつかの具体的な例を挙げてみると,次のようになる。SP(Secure Program)は公開テストを示している。SP の受験者は自分の意思で受験する人々であるため,TOEIC スコアは高くなる傾向がある。海外未経験大学生のほうが大卒新入社員よりスコアが高いのはそのためである。海外経験大学生のLは「完成レベルへの移行期」に属しているが,全体的には「実用レベル」に入れるのが順当であると判断した。
L | R | T | ||
実用レベル | 海外経験大学生(SP) | 413 | 333 | 746 |
実用レベルへの移行期 | 海外未経験大学生(SP) | 288 | 253 | 541 |
学習レベル | 大卒新入社員(2000年度) | 239 | 211 | 450 |
この表の利点は,目標値である「実用レベル」に対する位置関係がはっきりし,自分の英語能力に照らし合わせて見た場合,努力目標への距離がつかみやすいことである。
前節は,英語能力の全体像を把握しやすいように,「完成レベル」,「実用レベル」,「学習レベル」の3種類に分類し,緩衝地帯として「完成レベルへの移行期」と「実用レベルへの移行期」の2段階を設けた。ここでは,最も利用頻度が高いと思われる「学習レベル」について,もう少し述べることにする。
筆者のこれまでの調査によると,LとRが実用レベルとして使える最低限度はそれぞれ 300 程度であると判断される。Tで言えば 600 台というところである。この英語能力レベルが下がると緩衝地帯としての「実用レベルへの移行期」(Tは 500 台)となり,さらに下がると「学習レベル」へとつながる。
「学習レベル」をさらに利用しやすいように細分化すると次のようになる。
L | R | T | |
学習レベル(上級) | 245 | 245 | 495 |
200 | 200 | 400 | |
学習レベル(中級) | 195 | 195 | 395 |
| | |||
150 | 150 | 300 | |
学習レベル(初級) | 145 | 145 | 295 |
| | |||
5 | 5 | 10 |
LとRの 200~245(Tは 400 台)は「学習レベル」としては上位に属する能力レベル(学習レベル-上級)ではあるが,その英語能力は表現能力はもとより,理解能力も実用に役立てるには物足りない。しかし,運用能力をあまり重視していない現在の学校英語教育の枠内では,かなり努力をし,それなりの成果を収めてきている層であることは間違いない。具体的には,大卒新入社員の TOEIC 平均スコアがこのレベルである。
この層の特色の一つは,LよりもRのほうがスコアが高いパターンを示す受験者がかなりいるということである。つまり,L<Rパターンである。一般的に言うと,TOEIC 受験者のパターンはこれとは逆のL>Rであるのが普通なので,この現象はむしろ異常と言える。筆者の勤務校での調査結果によれば,L<Rパターンは 400 台で 45.5%,500 台で 41.2%を示している(ただし,Rは 200 以上に限る)。こうした現象は日本人受験者,特に大学受験に強い影響を受けた受験者に多く見られるものである。音声英語より文字英語を重視する現在の学校英語教育の反映と考えられる。したがって,学校英語教育が正常化し,諸外国のように,音声中心の教育が実施されるようになると,この大学受験パターンは自然消滅することが予想される。
LとRがさらに下がって 150~195(Tは 300 台)となると,限られた狭い範囲の英語でないと理解できない(学習レベル-中級)。英語で表現する訓練を短時間で行うためには,決り文句(routine)を丸暗記するか,一部分を差し替えて表現する文型(pattern)を学習する以外には方法がない。
LとRが最後の5~145(Tは 300 以下)まで下がると,英語の理解も表現もまったくと言ってよいほど役に立たない(学習レベル-初級)。これまで学校教育を受けてきた大学生および大卒社会人は,理由はいろいろあるとしても,従来の知識中心の英語教育をまったく受け付けなかったわけであるから,文法とか,英文和訳などの従来型英語教育の教え方は役に立たないと考えたほうがよい。むしろまったく違ったアプローチ,たとえば英米人教師による生活中心の英語を,音声英語を通じて,直接教えるようにしたらどうであろうか。英語教育は本来そうあるべきものである。学習者の性格に合わない一旦失敗した学校英語教育の方法を繰り返すのはあまり賢明な方法ではない。成功は期待できないからである。
英語学習のために役立つ情報は,TOEIC スコアの抽象的な絶対評価ではなく,学習目標の「実用レベル」に到達するためにはどのような努力をしなければならないかを示す具体的な相対評価であることは,前々節ですでに述べた。ここでは,個人指導用(カウンセリング用)データの作成について述べることにする。
個人指導用データ作成に必要な項目としては,次のようなものが考えられる。
1は個々の学生に関する TOEIC スコアの分析である。TOEIC スコアはL(Listening),R(Reading),T(Total)の3種類から成り立っているが,そのそれぞれのスコアについて,学内総受験者内のランク・パーセンタイル・レベル(実用レベルとの差)が分かると,カウンセリングがしやすい。たとえば,次のような形式が考えられる。
L | R | T | |
スコア | 225 | 325 | 550 |
ランク | 165 | 9 | 49 |
パーセンタイル | 66.9 | 98.1 | 90.5 |
レベル | 学習レベル | 実用レベル | 実用移行期 |
参考(実用レベル) | 300 | 300 | 600 |
「ランク」と「パーセンタイル」は学内における英語能力評価であるので,それだけでは学生のスコアがどの英語能力レベルを示しているのか分からない。それを知るためには「レベル」を利用する。この場合,学習目標は実用レベルであるので,実用レベルの最低スコアを「参考」として示してある。「ランク」は総受験者数内の順位であり,「パーセンタイル」は当該学生より下位のスコアを取った学生数をパーセンテージで示したものである。ちなみに,これらを算出するには,Excel の統計関数 Rank と Percentile を使えばよい。
2の「学内総受験者のスコア分布」は,当該学生の英語能力の学内における位置関係を知るための重要な情報を提供する。たとえば,990~900(完成レベル),895~800(完成移行期),795~700,695~600(以上,実用レベル),595~500(実用移行期),495~400,395~300,295~200,195~100,95~10(以上,学習レベル)のように全体を 10 分割して,それぞれのスコア範囲内の受験者数を表示すれば全体像が把握でき,カウンセリングの際に役に立つ。「専攻別・男女別・海外経験の有無のスコア分布」は,当該学生の英語能力の位置関係を知るだけではなく,学生全体の英語能力の現状を把握するためにも役に立つ。
3の「学外各種受験者データ」は,大学生・大卒新入社員・一般社員・海外経験(未経験)大学生(社員)などの TOEIC スコアのことで,学内を越えたさらに広い観点から,当該学生の位置関係を知るための貴重な情報となる。もちろん学生全体の位置関係を知るためにも役立つ。これらのデータは TOEIC 運営委員会に提供を依頼することができる。
TOEIC の実施は TOEIC 運営委員会に委託すれば簡単に行うことができる。テスト実施後,全受験者のデータは FD で提供されるので,これを基に,2で述べたように,それぞれの大学のデータを追加して整理すれば,その価値は計り知れない。
それと同時に,こうすることによって,大学は自らの英語教育の中に積極的にそのデータを組み込むことができる。現在 TOEIC を導入した大学はすでに数多くあるが,これまでは大学は単に TOEIC テストセンターだけの機能を果たすだけであった。今後は積極的に TOEIC の成果を大学英語教育の中に組み込むことによって,大学英語教育をデータに基づいて,科学的に改善する必要があると思われる。その意味では,英語能力をスコア表示する TOEIC は絶好のプログラムである。
前回は学生のための個人指導用に TOEIC をいかに利用するかについて述べたが今回は大学における英語教育の効率化を図るためにいかに TOEIC を利用することができるかについて述べることにする。
大学英語教育のカリキュラム作成上で一番問題になるのは,学生の英語能力に合った科目をいかに合理的な基準に基づいて設けるかということである。一般的に英語能力は listening,speaking,reading,writing の4種類の技能に分類されるので,これに基づいてクラス編成を行うことが合理的と思われる。しかし,実際には listening と speaking を別々に扱って,リスニング・クラス,スピーキング・クラスとすることはない。これらは1つにまとめて「英会話クラス」とするのが普通である。これに対して,reading は単独のクラスとして扱われている。いわゆる「読解クラス」であり,クラス数としてはこれが大学英語教育の主流を占めている。writing を扱うのは「英作文クラス」であり,「読解クラス」と比べるとクラス数ははるかに少ない。難しい科目と見なされているためである。以上の「英会話クラス」,「読解クラス」,「英作文クラス」の3種類が大学における英語教育の通常の分類である。
「英会話クラス」は,実際の教室では外国人教員がほとんど一人でしゃべり,学生は予め与えられた表現を発話する程度である。したがって,「英会話クラス」とうたってはいるものの,実際にはほとんど listening の練習であり,厳密な意味では speaking の練習は行われていない。speaking とは自分の考えを自分の英語で表現することであると定義した場合,「英会話クラス」では speaking を教えてはいないと言える。したがって,「英会話クラス」は実質的にリスニング・クラスであると考えてよい。スピーキング・クラスではない。
実はこれには十分な理由がある。speaking の学習は,listening がすでに相当高いレベルにないとスムーズに行うことができない。聞けないものは話せないからである。少なくとも外国人教員の話す英語が理解できなければ speaking の学習は導入できない。ところが実際には,教員の話す英語を楽に理解できる学生は少数であるため,speaking を教えること自体に無理がある。そのため,教員がいくら努力しても学生がついて行けないので,結果的に「英会話クラス」はリスニング・クラスの域を超えることができないのである。
この関係を TOEIC スコアとの関連で考えてみよう。教室で話す外国人教員の英語レベルは学生の英語能力を勘案してレベルを下げるのが普通なので,これを考慮すると,教員の英語を理解できる TOEIC スコアはLで 250 程度であろう。欲を言えば 300 程度は欲しいところである。これらはTで言うと,それぞれ 500 と 600 程度に相当する。しかし,これらのスコアを得点できる学生は実際にはきわめてわずかである。おそらく全体の数パーセントにとどまるであろう。つまり,speaking を効果的に指導するためには,わずか数パーセントの学生を対象にしなければならないことになる。残りの大部分の学生に対しては,意識して listening に重点を置いたリスニング・クラスにしたほうが理にかなっている。そしてこの場合には,学生の理解力を中心とした学習になるので,担当者は必ずしも外国人教員である必要はない。
「読解クラス」が圧倒的に多く,「英作文クラス」が少ないのも同じ理由による。従来の英語教育は文字英語中心であったため,reading と writing との英語レベルの区別は比較的明確に行われてきている。reading で扱う英語レベルは writing で扱う英語レベルと比べると,格段の差がある。reading の英語レベルのほうが writing よりはるかに高い。高等英作文と称する教科書の中には,読解用教科書とそれほど英語レベルの差のないものを導入することがあるが,そういった英作文教科書は現実には使いこなすことはできない。
「英作文クラス」に適した英語能力レベルを TOEIC スコアに換算すると,これも listening と speaking の関係に似ている。Rで 250~300 程度が「英作文クラス」に適している。Tでは 500~600 程度に相当する。したがって,これも学生の中には有資格者が少ないので,「英作文クラス」の数は「読解クラス」に比べると圧倒的に少なくなるはずである。それほど「英作文クラス」の数を減らさないのであれば,極端に英語能力レベルを下げなければ成り立たない。現実においても「英作文クラス」の性格はそのようになっている。
TOEIC スコアを利用したクラス編成のガイドラインについては前回で述べた。すなわち,500 を分岐点とし,それ以上をスピーキング・クラス,およびライティング・クラス(上級英作文,または自由英作文)とする案である。500 は実用レベル移行期の最低レベルであり,すでに学習レベルを越えた英語能力を示している。しかし,この 500 という分岐点は日本人大学生にとってはかなり高いハードルであり,大部分の大学でほとんどの学生が 500 以上のレベルには達しないことが予想される。
500 以上の学生に対しては,言語教育としては,外国人教員によるスピーキング・クラス,およびライティング・クラスを履修させるべきであり,また教室内での使用言語は英語のみとすべきである。英語を使って外国人教員の英語を理解し,それを当然のこととしながら,今度は英語による表現の方法を,理論ではなく,実践の中で練習しながら学ぶのである。要するに,自国人の行う言語習得方法と同じである。500 未満の学生に対しては,この方法はとることができない。外国人教員が英語で内容を説明しても,学生には容易に理解できないからである。
スピーキング・クラス,およびライティング・クラスではなく,たとえば異文化コミュニケーションとか英米事情などを英語で教えるのは,それ自体としては非常に重要であり,なくてはならないものではあるが,言語教育としての範囲は越えていると考えられるので,ここでは取り扱わない。これらのクラスは専門教科などの内容教科として学生に履修させるべきものである。これと他の内容教科との違いは,単に使用言語が日本語であるか,英語であるかだけである。
500 未満の学生に対しては,原則として英語の理解能力を強化することを主体に教えるべきである。このレベルの学生にスピーキング・クラス,およびライティング・クラスを履修させる場合には,listening または reading の延長として教えるべきである。まだ厳密な意味での speaking と writing を教えるべきレベルには達していないからである。
495~10 はすべて学習レベルであるが,その中でも 495~400 は学習レベルの上位に属するので,多少特別扱いをすることが望ましい。speaking 学習と writing 学習も,listening や reading の範囲を多少はみ出した程度のものであれば導入しても何ら差し支えない。教員は日本人でも外国人でもよいが,speaking は外国人のほうが無難かもしれない。その場合には,日本語ができたほうがクラス運営上からは便利であり,効率もよくなる。writing は日本人のほうが適している。教授法としては,できる限り多くの英語を書かせることに重点を置き,またできる限り訂正しないほうがよい。過度の訂正は学生を萎縮させ,英語を絶えず意識させ,間違いを極度に嫌うようにさせるからである。なるべく多くの英語を書かせ,それを通して writing の訓練をするのが好ましいからである。習うより慣れよ,の発想である。
しかし,この上位学習レベルで最も大切な学習目標は理解力を伸ばすことにある。つまり,listening と reading の訓練である。listening 学習のためには,たとえば VOA(Voice of America)のラジオ放送,特にスピードと語彙数を下げた Special English の番組を利用するとよい。視覚に訴えたものとしては,画面の下に英語の文字が入る closed caption を使った劇場フィルムのビデオを利用するとよい。これはもともとアメリカの難聴者向けのものであり,英語学習用教材ではない。しかし,きわめて多くのフィルムがビデオ化されているので,いろいろな題材を選択することができる。この closed caption を使うと,画面とともに文字も消えるので,速読用の教材にもなり得る。同様のことは VOA についても言える。スクリプトを見れば reading 学習をすることができる。reading 学習に最適なのは英字新聞である。話題が多岐にわたっており,国内ニュース,つまり三面記事などは特に分かりやすい。身近な英語に慣れるという意味でも教材に適している。値段も安い。
395~10 の学生は完全な学習レベルにある。原則的には英語の基礎知識を学習し直すことが重要であるが,もし学生がこのような知に働いた従来型のアプローチを受け入れないようであれば,外国人教員と絶えず接触させることによって,英語学習ではなく,自国人のように英語習得に重点を置いた学習のほうがよいかもしれない。この教授法は時間がかかり,それだけ効率の点では劣るが,実はこれが最も正統な言語学習方法なのである。
今日の大学,特に私立大学にはいろいろな形式の入試制度がある。一般入試,推薦入学,センター試験入試,AO 入試,一芸入試,社会人入試,卒業生子女の優先入学など,まさに何でもありの感がある。これは,最近の高校卒業生の激減により大学定員割れが 30 %にも及ぶと言われる今日の現象に対する,私立大学の対抗策であると思われる。いずれにせよ,これらの現象と相まって,私立大学の入試の多様化はますます加速されて行くであろう。
このような状況下では,私立大学にとっては,学生の質よりも定員充当のほうが焦眉の急であろうが,それでもできる限り学生の質は高く保ちたいというのが本心であろう。そうしなければ大学の評価は落ち,結局は大学の崩壊につながるからである。大学側としては,もし入学試験制度に問題があるとすればどこに問題があるかは知りたいところである。選抜試験制度の適不適の基準はいろいろ考えることができるが,かりにこの基準として英語を選んだとすると,TOEIC の利用はきわめて効果的である。TOEIC は英語能力試験としてはきわめて信頼度が高いからである。
上の例で言えば,一般入試とセンター試験入試を採用した場合には,TOEIC スコアとの乖離はあまりないと思われる。個々の入試問題は信頼度の点では多少問題があったにしても,それぞれ同一基準に基づいて作成され,評価されるので,それほどの違いが生じることはない。問題なのはその他の入試制度である。
たとえば,推薦入試の場合には,万が一にも推薦高校側で英語の成績に手心を加えるようなことがあった場合には,その結果は直ちに TOEIC スコアに反映され,内申書に示された成績より低いスコアとなって白日の下にさらされる。もしこのようなことが起これば,その学生を推薦した高校は将来の推薦枠をはずされることにもなるであろう。その他の入試の場合にも,同様のことが起こり得る。特に,英語の試験をまったく行わない,または行っても形式的に行うに過ぎない入試制度の場合には,英語能力は一般入試の学生に比べてはなはだしく劣ることが予想される。そこでまた新たな問題が生じることになる。それは入学後の英語教育である。
しかしこれはある意味では,入学後の英語教育のカリキュラムを見直すための建設的な第一歩を踏み出すための必要な手順とも言える。なぜなら,TOEIC を新入生に実施することによって,従来経験的に理解してきた学生間の英語能力差を数字によって,客観的に明確に示すことができるからである。これらの英語能力格差の事実を数字として突きつけられると,否応なしにある程度の能力別クラス編成をせざるを得なくなる。厳しい事実を認めるのはつらいことであるが,一旦認めてしまえば,その対応は反ってやりやすくなる利点がある。TOEIC の導入は,入学前の各種入学試験の評価に役立つだけでなく,入学後の英語教育の指針を決定し,カリキュラムを改革するための判断材料としても役に立つ。
入学後の問題としてはもう一つ最近耳にする問題がある。それは大学生の卒業資格試験として,信頼できる英語テストを実施すべきであるという案である。なかなかの案であると思われるが,ここには一つ落とし穴があるので注意しなければならない。たとえば,TOEIC を利用した場合のことを考えてみよう。2000 年度新入社員の TOEIC 平均スコアが 450 であったので,目標値という意味もこめて,これを卒業資格としたとすると大変なことになる。それはこの 450 は平均スコアであるので,もしスコアが正規分布していたとすると,450 以上のスコアを取ったのは 50% であり,残りの 50% は 450 以下であるからである。これでは半数の学生が卒業できないことになってしまう。現実的には大半の学生を卒業させなければならないので,450 といった高いスコアではなく,200 程度の低いスコアを資格レベルとして設定しなければならない。そうなると卒業資格試験制度を設ける意味がなくなってしまうかもしれない。TOEIC は achievement test ではなく,proficiency test であるので,飴細工のようにスコアを簡単に上げることができないことを忘れてはならない。
大学生にとって TOEIC はかなり難しい試験である。たとえば,2000 年度大卒新入社員の平均点は 450 であったが,もしこれが正規分布をしているとすると,半数は 450 以上であるが,半数は 450 以下であることを示している。しかも,この数字はいわゆる一流企業に就職した新入社員を示している。彼らの平均的英語能力は一般大学新卒の英語能力よりも上位にあることが予想される。したがって,すべての大学卒業生が TOEIC を受験したとすると,そのスコアは 450 よりも下がることが予測される。
一般的に言うと,低い英語能力は高い英語能力と比較すると不安定であるので,測定がしにくく,それだけ測定の信頼性が下がることになる。つまり,スコアが下がれば英語能力は測定しにくくなり,その測定値は信頼性が劣ることになる。では TOEIC はどのレベルまで,ある程度の信頼性を保って測定できるのであろうか。どのスコアまでは信頼できる測定値と言えるのであろうか。その点を探ってみよう。
TOEIC の最初のころに実施されたテスト・フォームに Form 3BIC というのがある。TOEIC は原則としてテスト・フォームを公開しないが,これは一般に公開された数少ないフォームの一つである。TOEIC は素点ではなく換算点でスコア表示を行い,Listening(L)スコアと Reading(R)スコアの合計を Total(T)スコアで示す。Form 3BIC スコア換算表の最後の部分は次のようになっている。この換算方式は Form 3BIC にのみ適応されるものであるが,一つの判断材料にはなり得る。
素点(正解数) | 換算点 | 素点(正解数) | 換算点 | ||
L | R | L | R | ||
22 | 45 | 10 | 10 | 5 | 5 |
21 | 40 | 5 | 9 | 5 | 5 |
20 | 35 | 5 | 8 | 5 | 5 |
19 | 25 | 5 | 7 | 5 | 5 |
18 | 20 | 5 | 6 | 5 | 5 |
17 | 15 | 5 | 5 | 5 | 5 |
16 | 10 | 5 | 4 | 5 | 5 |
15 | 5 | 5 | 3 | 5 | 5 |
14 | 5 | 5 | 2 | 5 | 5 |
13 | 5 | 5 | 1 | 5 | 5 |
12 | 5 | 5 | 0 | 5 | 5 |
11 | 5 | 5 |
この表のLの最低点は,正解 15 問以下は全問不正解であろうと何であろうと,すべて5(実質的には,リスニング能力ゼロ)である。Rの最低点はこれよりもさらに強烈で,正解 21 問以下はすべて5(リーディング能力ゼロ)である。つまり,Lの正解 14~0 問の範囲内にある計 15 問,Rの正解 20~0 問の範囲内にある計 21 問はスコアとしてはまったくカウントされないことになる。この範囲の素点はすべてゼロ能力と判断されている。
では TOEIC スコアは何点以下をもって信頼性が低いと見なすべきであろうか。結論的には,おそらくT200 程度であろうと思われる。これ以下のスコアの場合には,信頼性に問題があるのではないかと一応疑ってみる必要がある。したがって,200 以下の場合には,英語能力差を弁別することはできないと理解すべきである。たとえば入試などのように,英語能力によって選抜を行う場合には,200 以上の場合には TOEIC スコアで選抜を行うことはできるが,200 以下の場合には,TOEIC スコアで選抜を行うべきではないと考えたほうが無難である。形の上ではスコア差があったとしても,それは必ずしも英語能力差があることを意味してはいないからである。