教育心理学
早稲田大学大学院教育学研究科 修士課程
教育心理学
早稲田大学大学院教育学研究科 修士課程
この講義でのファイルのやりとりは,研究室のシステムを使います。
https://lab.educpsychol.com/app/pdf/
1 教育心理学のクラスへようこそ
1.1 このクラスの概要
- このクラスは,教育心理学を専攻としない院生であっても,学校教育の基盤としての教授・学習心理学の基本的概念,諸理論,研究知見を学べるように構成しています。
- 教育心理学の学習経験や知識を有無は問いません。様々な専門の院生が参加することで,参照する文献に示された知見をもとにしながら議論を深め,教室で教えることと学ぶことについて多面的に理解し,専門的な考え方が形成されるようにしたいと考えています。
- シラバスはこちらの通りですが,扱う文献は最新のものに差し替えます。
- 担当教員の Vita と,研究室 webpage。
- 2025年度の講義ノートを公開しています。
1.2 講読する文献
1.2.1 様々な学習方略の効果比較(Dunlosky et al., 2013)
この論文は,様々な学習方略の有効性に関する総括的レビューである。この講義の終盤にまとめとして用いる。この論文は教師をはじめとした教育にかかわる者として重要な示唆が多く含まれることため,院生が分担して逐語訳を作成し共有できるようにする。
- Dunlosky, J., Rawson, K. A., Marsh, E. J., Nathan, M. J., & Willingham, D. T. (2013). Improving students’ learning with effective learning techniques: Promising directions from cognitive and educational psychology. Psychological Science in the Public Interest, 14(1), 4–58. https://doi.org/10.1177/1529100612453266
1.2.2 系統的レビューとメタ分析について(Adesope et al., 2017)
いわゆる練習テストの効果が高いのは検索練習(retrieval practice)が起こるためと考えられている。この論文を用いて,系統的レビューとメタ分析について解説するとともに,その効果の背景を説明し,以後この講義で扱う論文を読み取れるようにする。この論文は担当教員が解説する。
- Adesope, O. O., Trevisan, D. A., & Sundararajan, N. (2017). Rethinking the use of tests: A meta-analysis of practice testing. Review of Educational Research, 87(3), 659–701. https://doi.org/10.3102/0034654316689306
1.2.3 効果的な教材の特徴
1.2.3.1 図の有無や種類,特徴による効果の違い(Lei et al., 2025)
テキストに図を追加することが理科の学習成果に与える影響を検討したメタ分析。図があることの学習成果に対する効果と,図の種類,特徴による効果の違いを検討している。注意,二重表象,認知負荷の観点からこれらの効果の背景を検討する。
- Lei, H., Chen, L., Chiu, M. M., Fang, L., & Ding, Y. (2025). Effects of Adding Illustrations to Texts on Students’ Science Achievement: A Meta-Analysis. Educational Psychology Review, 37(3), Article 71. https://doi.org/10.1007/s10648-025-10053-z
1.2.3.2 学習内容とは関係のない挿絵の効果(Cheng et al., 2026)
テキストや提示教材には学習者の注意を引くことを目的として学習内容そのものとは関係のない挿絵を入れることがあるが,これは本当に効果的なのか,メタ分析による研究知見を認知負荷理論の観点から検討する。
- Cheng, C., Wu, Y., Wang, R., & Wang, Z. (2026). Seductive details, cognitive load, and learning outcomes: A multi-level meta-analysis and MASEM. Educational Psychology Review, 38, 28.
1.2.4 学習者自身が用いる学習方略の効果
1.2.4.1 生成効果(Schindler & Richter, 2023)
学習者が学習すべきテキスト内容を受動的に受け取るのではなく,自ら生成する場合,学習はより効率的になることを生成効果という。この効果の平均的な大きさと調整変数効果に関する知見から,生成効果のメカニズムについて検討する。
- Schindler, J., & Richter, T. (2023). Text generation benefits learning: A meta-analytic review. Educational Psychology Review, 35(2), Article 44. https://doi.org/10.1007/s10648-023-09758-w
1.2.4.2 ノートテイキングの効果:手書きとデジタル(Flanigan et al., 2024)
ノートテイキングを手書きで行うか,タイピングで行うかのどちらが効果が高いかを検討したメタ分析。復習の有無や学習成果の種類による効果の違いも検討している。この効果の違いを処理水準仮説の観点から検討する。
- Flanigan, A. E., Wheeler, J., Colliot, T., Lu, J., & Kiewra, K. A. (2024). Typed versus handwritten lecture notes and college student achievement: A meta-analysis. Educational Psychology Review, 36(3), 78. https://doi.org/10.1007/s10648-024-09914-w
1.2.5 個人差要因の影響
1.2.5.1 個人差要因と数学学力の関連(Breit et al., 2025)
学力には様々な個人差要因が影響すると考えられているが,影響の大きさは様々である。言語能力・読解力,事前知識,教科関連語彙,知能,創造性,実行機能・ワーキングメモリ,空間認知能力,自己概念,ビッグファイブ性格特性などの数学学力に与える影響についてのメタ分析の結果から,個人差要因と学力との関係を包括的に検討する。
- Breit, M., Schneider, M., & Preckel, F. (2025). Mathematics achievement and learner characteristics: A systematic review of meta-analyses. Learning and Individual Differences, 118, Article 102621. https://doi.org/10.1016/j.lindif.2024.102621
1.2.5.2 学力の変わりにくさ(Scherrer et al., 2025)
学習をすればするほど,当然であるができることは増えていくので,能力としての学力は高まる。しかし,同一学年内での順位のようなものはどの程度入れ替わるのか。言い換えれば,相対的な学力はどの程度変化するのか。このような問いに応えようとしたメタ分析の結果を検討し,教育的介入のあり方と難しさを議論する。
- Scherrer, V., Breit, M., & Preckel, F. (2025). The stability of students’ academic achievement in school: A meta-analysis of longitudinal studies. Educational Research Review, 48, Article 100687. https://doi.org/10.1016/j.edurev.2025.100687
1.2.6 教室の中の他者の影響
1.2.6.1 ピアフィードバック(Lu et al., 2026)
Wisniewski et al. (2020) では学習者に対して教師が与えるフィードバック(\(d=0.47\))よりもピアフィードバック(\(d=0.85\))の方が効果が高いことが示されているように,教室で学習者どうしが与えるフィードバックの効果は一般に思われている以上に高いことが明らかとなっている。その効果の背景を,ピアフィードバックが学習者の情意要因に与える影響に関するメタ分析による知見から検討する。
- Lu, Z., Lei, H., Chiu, M. M., Mao, W., & Wang, S. (2026). Meta-analyses of peer assessment and affective outcomes: Motivation, self-efficacy, and anxiety. Educational Psychology Review, 38(1), Article 14. https://doi.org/10.1007/s10648-025-10098-0
1.2.6.2 子どもどうしの相互交渉を行う学習の効果(Tenenbaum et al., 2020)
子ども同士の相互交渉による学習は,構成主義的学習理論の枠組みにおいて重要視されており,とりわけピアジェおよびヴィゴツキーの理論的立場と深く関連している。ピアジェは,子ども同士の相互交渉の方が,子どもと大人の相互交渉よりも効果的であると考えた。これは,大人との相互交渉では子どもが受け身になりやすいためである。一方,ヴィゴツキーは,子どもと大人の相互交渉の方が学習をより促進すると考えた。また,相互交渉による学習では,子どもに合意形成を経た結論の導出を求める場合と,必ずしもそれを求めない場合がある。道徳性の発達に関する研究知見を敷衍すると,社会認知的葛藤場面では,合意形成を図る過程においてより努力的な思考が必要となり,その結果として均衡化が生じるため,認知能力の発達に寄与すると考えられる。ここでは,相互交渉による学習の効果を検討した62本の論文(71研究)のメタ分析の結果示された,子ども同士の相互交渉による学習の平均的な効果と調整変数効果を検討する。
- Tenenbaum, H. R., Winstone, N. E., Leman, P. J., & Avery, R. E. (2020). How effective is peer interaction in facilitating learning? A meta-analysis. Journal of Educational Psychology, 112(7), 1303–1319. https://doi.org/10.1037/edu0000436
1.2.6.3 子どもどうしの人間関係と学力(Wentzel et al., 2021)
子どもどうしがフィードバックを与え合ったり,相互交渉を行いながら学習をするには,人間関係が良好であることが求められるはずである。ここでは,仲間から社会的に受容されることと学力との関係についてのメタ分析の結果を検討し,多数の学習者がともに過ごす教室のありかたを議論する。
- Wentzel, K. R., Jablansky, S., & Scalise, N. R. (2021). Peer social acceptance and academic achievement: A meta-analytic study. Journal of Educational Psychology, 113(1), 157–180. https://doi.org/10.1037/edu0000468
2 講義予定
| 回 | 月日 | 内容 | 論文 | 担当 |
|---|---|---|---|---|
| 1 | 4月14日 | 講義の進め方の説明 教育心理学とは何か |
||
| 2 | 4月21日 | 系統的レビューとメタ分析について | Adesope et al. (2017) | 教員 |
| 3 | 4月28日 | 発表準備 Dunlosky et al. (2013) の逐語訳のアサイン |
||
| 4 | 5月12日 | 効果的な教材の特徴(1) | Lei et al. (2025) | |
| 5 | 5月19日 | 効果的な教材の特徴(2) | Cheng et al. (2026) | |
| 6 | 5月26日 | 学習者自身が用いる学習方略の効果(1) | Schindler & Richter (2023) | |
| 7 | 6月2日 | 学習者自身が用いる学習方略の効果(2) | Flanigan et al. (2024) | |
| 8 | 6月9日 | 個人差要因の影響(1) | Breit et al. (2025) | |
| 9 | 6月16日 | 個人差要因の影響(2) | Scherrer et al. (2025) | |
| 10 | 6月23日 | 教室の中の他者の影響(1) | Lu et al. (2026) | |
| 11 | 6月30日 | |||
| 何か (TBA) | ||||
| 12 | 7月7日 | 教室の中の他者の影響(2) | Tenenbaum et al. (2020) | |
| 7月7日 | ||||
| 13 | 7月14日 | 様々な学習方略の効果 4月にアサインした逐語訳を提出し内容を検討 |
Dunlosky et al. (2013) | |
| 14 | 7月21日 | まとめ |
3 教育心理学とは
3.1 教師の仕事における教育心理学の位置づけ
4段階教授法(明瞭・連合・系統・方法)や「教授のない教育というものの存在は求められないし,また教育のない教授も認められない」というフレーズで著名な Herbart は,1806年に著した Allgemeine Pädagogik aus dem Zweck der Erziehung abgeleitet1 で,「科学2としての教育学は,実践哲学と心理学を拠り所にする。前者は陶冶3の目的を示し,後者はその過程4,方法5,難しさ6を示す。」と述べているようである。もっとも,現在の心理学は Wundt が興した実験心理学から発展したものであること,心理学の起こりは Wundt が1875年にライプツィヒ大学に着任し心理学実験室を設け,1879年に大学の講義科目として心理学演習が設置されたあたりとされていることからも, Herbart の言う「心理学」と現在の「心理学」や,実験心理学からの流れを引き継ぐ教育心理学とは別物である7。
Herbart の「教育の方法を心理学に」という主張に見られる心理学とは,表象力学と言われるものであり,人の中に形成される表象は,表象どうしが互いに結びついたり打ち消しあったりするという動的な過程を経て体系として形成されるという考え方である。そして,学習とは新しい表象が既存の表象と結びつくことで成立するものであると考えた。このような考え方は,実験心理学の影響を受けて発展した行動主義的な学習研究とは深い関係は見られないものの,現在の認知主義的な学習研究の考え方に近いと考えられる。
上記の内容から導かれるのは,教育哲学と教育心理学は,教授が必ずともなう学校教育を構想し実践するために不可欠であり,教職科目の基幹科目であるということである。そして,教師の仕事の大半は教科指導であるが,その中で教師は生徒に,「学識で圧倒し,分からせることで振り向かせる」ことをし続けなければならない。この「分かる」仕組みや,その過程に対する働きかけ方を,実証的に記述し理論化するのが教育心理学である。
3.2 教育心理学の枠組み
教育心理学はおおむね,以下に示す2つのモデルを参照し,それぞれのモデルにおける変数を考慮し,また調整しながら学習成果を高めるメカニズムを明らかにしようとする研究領域と言える。
3.2.1 学習率(Carroll, 1963)
学習率は学習に必要な時間に対して実際に学習に費やした時間によって高低が生じるというモデルである。
\(Degree\ of\ learning = f(\frac{time\ actually\ spent}{time\ needed})\)
一般的には,学習に費やす時間を増やせば学習は成立しやすい(学習率が上がる)と考えられがちである。そのため,多くの学校では学習時間を増やそうとして,授業時数や持ち帰り学習の時間を多くするという手立てがとられることが多い。しかし,単に学習時間を増やせば学習成果が高まるのではなく,実質的な学習時間,すなわち,知識の付加と再構成につながる処理が行われる時間が確保されなければ,学習成果にはつながらない。課題従事行動8をうながしたり,浅い処理ではなく深い処理をうながしたりといったことが必要である。このようなことをうながす具体的な手立てを構想し実践するための理論的背景を,教師は知っていなければならない。
また,学校での学習では,限られた時間の中で多くのことを学ぶことが求められる。そのため,学習時間を増やそうとしても限界がある。そのため,このモデルの分母である「学習に必要な時間」を減じることで学習率を高める策をとる必要がある。そのためには新情報を与える際の提示の仕方や,認知負荷を軽減するための手立ての取り方といった教授方略を教師が用いるとともに,学習者自身が効率的に学習を進めるための学習方略を利用できるようにする必要がある。このような教授・学習方略が学習者の処理のありようを規定し学習成果につながる機序も教師は理解し,具体的な実践につなげる必要がある。
3.2.2 適性処遇交互作用(Cronbach & Snow, 1977)
適性とは所与の条件下での学習成果を予測しうる学習者の個人差を指し,処遇とは教授法,学習方法,時間などの操作可能な学習条件を指す。そして学習成果が適性と処遇の組み合わせによる効果として現われることを適性処遇交互作用(ATI)という。行動が引き起こされる条件を明らかにするために人為的に条件を設定し,条件と行動との因果関係や主効果を明らかにすることをめざす実験心理学のアプローチと,知能などの個人差要因の高低と学力検査得点の高低といった変数間の相関関係を明らかにすることをめざす相関研究のアプローチを統合したパラダイムである。
個人差によって適合する教授法は異なるにもかかわらず,教授法研究においては,すべての学習者に対して効果的な万能薬的教授法の開発がめざされ,学習成果に影響を与えうる適性は誤差としてしか扱われてこなかった。一方,適性研究においては一定の学習成果に到達するために必要な適性を明らかにすることに主眼がおかれ,処遇に対しては関心が十分に払われてこなかった。これらの研究のアプローチとは異なり,学習成果に影響を及ぼしうる適性と処遇の両方を研究の俎上に載せることで,個に応じた学習指導を検討する際の方針を提供しうる研究をめざすことが,ATIの教育的意義である。
ATIの典型的な例を示すと Figure 1 のようになる。横座標が適性Aの高低,縦座標が学習成果\(O\)の高低,2本の直線が処遇(\(T_1\),\(T_2\))ごとの\(O\)のAへの回帰直線,縦座標の曲線が処遇ごとの\(O\)の分布,横座標の曲線が適性Aの分布である。この場合,\(O_1\)より\(O_2\) の方が高いため,処遇の主効果が見られるといえる。また,いずれの直線も右肩上がりであることから,適性の主効果も見られるといえる。しかし,2本の回帰直線の交点を境にして,適性高群においては\(T_1\)の方が,低群においては\(T_2\)の方が\(O\)が高く,適性Aの高低によって処遇Tの効果が異なる。このように回帰直線の交差や非平行性が見られることを交互作用という。
このパラダイムに立つと,学習者の適性に関する情報を取得し,その適性にあわせた指導を行うといった最適化を行うとよいという示唆が導かれがちである。しかし,適性そのものが教育によって変化しうる可変的な特性であり,安定した個人差要因とは言えないという問題がある。このような不安定な個人差要因を前提として最適化を図ることは合理的とは言いがたい。さらに,実際の学習指導は単一の教授法によって行われるものではなく,複数の教授方略と,学習者が用いる学習方略とが組み合わされながら展開されるものである。このような考え方に立つと,重要なのは,様々な指導方略,学習方略が学習成果をもたらす機序と,その機序に与える個人差要因の影響を理解したうえで,これらを複数組み合わせた際にうながされる処理のありようを学術的かつ合理的に組み立てて構想する必要を指摘することができる。
4 系統的レビューメタ分析・練習テストの効果(Adesope et al., 2017)
- 以下の内容は録音データをAIで文字起こしと要約を行って作成したものであり,正確性は保証しない。
- Adesope, O. O., Trevisan, D. A., & Sundararajan, N. (2017). Rethinking the use of tests: A meta-analysis of practice testing. Review of Educational Research, 87(3), 659–701. https://doi.org/10.3102/0034654316689306
4.1 はじめに──論文のどこに注目するか
本日扱う論文には、冒頭に背景とリサーチクエスチョンが5つ並んでいるが、まずそれらをいったん読み飛ばし、669ページの Figure 1 に注目してほしい。この図は、系統的レビュー(システマティックレビュー)の手順を示した、いわゆる PRISMA 図と呼ばれるものである。この図が何を意味しているのかを理解することが、メタ分析研究を読み解く第一歩となる。
4.2 系統的レビュー(システマティックレビュー)の手順
4.2.1 メタ分析とは何か
メタ分析とは、研究知見の統計的な統合、すなわちリサーチシンセシスの一形態である。研究知見を集めて統合するという作業自体は、卒業論文のレビューを書く際にも皆が経験している。一般的には、PsycINFO や類似のデータベースでキーワードを検索し、中心となる論文から引用文献をさかのぼり、指導教員から推薦された代表的な論文を加えていく、という手順を取ることが多い。この方法は決して悪くはないが、自分でたどっていくだけでは抜け漏れが避けられない。
サイエンスにおいて重要なのは再現性である。したがって、レビューの方法も再現可能でなければならない。メタ分析の大きなポイントのひとつは、この再現性にある。再現性を高め、かつ的確な文献選定を担保するために、系統的な手続きが踏まれる。
4.2.2 データベースの決定
まず、検索対象とするデータベースを決める。この論文では668ページ中ほどに記載があるように、ERIC、PsycARTICLES、PsycINFO、Web of Science が用いられている。どのデータベースを使えるかは所属機関の契約状況に依存する面があり、早稲田大学のように契約が充実している機関ではここに挙げられたものはすべて利用可能である。
4.2.3 検索式(ブーリアン検索)の確定
次に検索式、すなわちキーワードの組み合わせを決定する。この論文では AND や OR といった演算子を用いた、いわゆるブーリアン検索の式が記述されている。重要なのは、この検索式を論文中に必ず残しておくことである。検索式を残すことにより、第三者が同じ手続きをたどれるようになる。
4.2.4 文献の抽出と絞り込み
検索式を用いて論文を抽出した結果、この研究ではおおむね1717本が得られ、これが次ページの Figure 1 の起点となる数字にほぼ対応している。ここから、以下の手順で文献を絞り込んでいく。第一に、複数のデータベースを使っているため必然的に生じる重複を除く。第二に、適格性基準(除外基準)に照らして、タイトルとアブストラクトのレベルで不適合のものを抜く。2017年当時はいきなり本文を読むのは困難だったため、アブストラクト段階での除外が行われ、1200本程度が除外され、388本が残った。第三に、契約している電子ジャーナルの都合等で入手できない50本程度が落ち、333本が全文精読された。最終的に、対象群を設けて量的に比較している研究という絞り込みを経て、118本が分析対象として残った。
ここで強調されるのは、どのデータベースを使い、どのような検索式を立て、どのような基準で除外したかが論文中にすべて明記されているという点である。これにより第三者が追試を行っても同じような手続きで同じ論文群が残る、すなわち同じデータが再現されることになる。こうしたレビューを系統的レビュー(システマティックレビュー)と呼ぶ。
4.2.5 系統的レビュー以前の文献収集
補足として、データベースが電子化される以前は、文献収集の様相はまったく異なっていた。分野ごとの研究論文目録(心理学、教育学、英語学などで文部省等が編集したもの)が毎年刊行されており、図書館でそれをめくりながら該当しそうな論文をメモし、次に図書館の目録カードで所蔵棚を調べ、ブックトラックを押して書庫を回り、該当雑誌を抜き出し、コピー機で複写して元に戻す、という手順が取られていた。こうした時代にも系統的な文献レビューに取り組んだ研究者はいたが、容易な作業ではなかった。ジャーナルの電子化とデータベースの整備があってはじめて広く可能になった研究手法である、という点を押さえておきたい。
4.3 統計的統合としてのメタ分析
4.3.1 なぜ共通尺度化が必要か
系統的に集めた文献群を、次に統計的に統合する。ここで問題となるのは、各研究の用いたテストや指標の尺度が一致しないことである。たとえばある研究では実験群の平均が15点(SD = 5)、統制群の平均が10点(SD = 4)だったとする。別の研究では実験群の平均が68点(SD = 20)、統制群が42点(SD = 18)だったとする。満点も幅も異なるため、そのまま平均差を足したり引いたりしても意味をなさない。物差しが違うからである。
4.3.2 効果量──標準偏差を単位とした共通尺度
そこで心理学では、平均差を標準偏差で割ることで単位を揃える。これが効果量 d の基本的な考え方である。標準偏差というのは、正規分布を仮定すれば平均から上下1 SD の範囲にデータの約68%が含まれるという、分布の幅を示す量である。この標準偏差を物差しとして用いれば、異なる研究の効果を共通の尺度に乗せることができる。論文の670ページには g の計算式が載っているが、g は d に補正係数をかけたもので、本質的な考え方は同じである。
日本の読者にとってとりわけ馴染みやすいのは、偏差値との関係である。偏差値は、個人の素点から平均点を引き、標準偏差で割り、10 を掛け、50 を足して求められる。効果量 d を10倍すれば、ちょうど平均偏差値差に相当することになる。したがって d = 0.5 は偏差値にして 5 ポイントの差、d = 0.85 は 8.5 ポイントの差と読み替えられる。
4.3.3 効果量の算出と平均化の例
たとえば先ほどの例で、差を取って SD で割ると、1本目の研究では (15−10)/5 = 1.00、2本目の研究では (68−42)/20 ≈ 1.30 となる(厳密には単純な SD ではなく、サンプルサイズで重みづけされたプールド SD を用いる)。これらを平均すれば、研究群全体の平均的な効果量が算出される。こうして算出された平均効果量が、たとえば d = 0.85 であれば、実験群と統制群の分布がおよそ0.85標準偏差ずれていることを意味し、これは分布として見るとそれなりに大きなずれということになる。
4.3.4 効果量の解釈──欧米と日本
この効果量の大きさをどう解釈するかについては、解釈基準をめぐる議論がある。英国などでは、1標準偏差のずれはおおむね学齢1年分(12か月分)の伸びに相当する、という解釈が提示されることがある。ただし、この解釈基準はそのまま信頼できるものではない。標準偏差単位の学力の伸びは学年によって異なり、低学年では大きく、学年が上がるにつれ小さくなる。また、短期間の実験用テストでは差が大きく出やすく、1年分のまとめのテストでは差は小さくなる、といった測定上の違いもある。したがって、一律に「1 SD = 1学年分」と扱うのは適切ではない。
日本の文脈では、偏差値というなじみのある尺度があるため解釈はむしろ容易になる。効果量 d = 0.85 は偏差値差にして 8.5 ポイントに相当する、と言えば受験経験のある学生には直感的に理解できる。少し頑張って伸びたと感じるのがおおむね偏差値 5 ポイント程度であり、学校で何もしなかった場合と丁寧に教わった場合を比べたときの平均的な効果量は d = 0.4 前後と言われる。こうした感覚的な目安を持つことで、効果量の大きさを具体的に読み取ることができる。
4.4 練習テストの効果──本論文の結果
4.4.1 平均効果量
以上の手順を踏まえて改めて本論文を見ると、118本の研究を集め、統計的に統合し、平均的な効果を算出したということになる。671ページの Figure 2 は、118本の研究それぞれの効果量の分布を示している。練習テストをやったほうが成績が悪くなったケースも一部あり、マイナス側にも値が存在するが、中央的な値としては M = 0.74 程度、重みづけを施した値では g = 0.61 程度となっている。要するに、練習テストを用いて学習した者は、何もしなかった者と比べて、平均で偏差値にして6ポイント程度高い成績を示した、ということである。先ほどの「頑張って伸びたと感じるのが偏差値5程度」という感覚と比べても、やや高めの値であり、練習テストにはそれなりの効果がありそうだ、と読み取れる。
4.4.2 メタ分析の価値──一本一本の研究では言えないこと
メタ分析の面白さは、一本一本の研究単体では大したことが言えないというところにある。個々の研究では効果の大きさもばらつき、対象も小学生・中学生・高校生・大学生とさまざまで、教科や国によっても条件は異なる。しかし、それらをならしてみるとおおむねこれくらいの効果がある、ということが言える。これは実は大きなことである。こうした平均的効果を教育的介入のさまざまなトピックについて一覧化したのが、John Hattie の Visible Learning である。
加えて、メタ分析の文献には副次的な利点もある。平均効果量を計算するためには、一本一本の研究の効果量が集計されており、引用文献リストも整っている。したがって、その分野におけるきちんと選ばれた実証研究のリストとしても活用でき、後続研究の出発点として有用である。
4.5 調整変数分析(モデレーター分析)
4.5.1 平均から「ずれ」へ
メタ分析の関心は、平均的な効果を求めることから、その平均がどのような要因によってどれだけ動くか、へと移ってきている。これが調整変数分析(モデレーター分析)である。結果は本論文の674ページ Table 2 に示されている。
各研究には、誰が実施したか、どのような形式の練習テストを用いたか、対象は小・中・高・大のいずれか、といった属性が付与されている。これらの属性をコーディングすると、118行からなる一つのデータセットになる。このデータに対して、目的変数を効果量、説明変数を各属性として分析を行えば、属性ごとの効果の違いを検討できる。
4.5.2 練習テストの形式による違い
本論文では、練習テストの形式(フリーリコール、キューリコール、多肢選択、短答)による違いが検討されている。フリーリコールは手がかりなしでの自由再生、キューリコールは手がかり付き再生、多肢選択肢(multiple-choice; MC)は選択式、短答式は空欄補充的な書き取り形式である。
結果を見ると、多肢選択形式で練習した場合の効果量はおおむね g = 0.70、短答形式では g = 0.48 となっている。Table 2 に示される95%信頼区間を見ると、多肢選択は0.6〜0.8程度、短答は0.38〜0.58程度であり、両者の信頼区間は重ならない。これは統計的に見て、5%水準で有意差があることを意味する。平均効果量は g ≈ 0.61 だが、その内訳としては、多肢選択のほうが短答よりも明確に効果が大きい、ということになる。
4.5.3 直感との対比
この結果は直感とやや反するように感じられるかもしれない。穴埋め・短答のほうが自分で思い出して書く必要があり、頭を使っているように思える。しかし、データは多肢選択のほうが効果が大きいことを示している。では、なぜそうなるのかを、次節で教育心理学的に検討する。
4.6 なぜ多肢選択のほうが効果が大きいのか──処理の深さ
4.6.1 多肢選択問題の構造
よく作られた多肢選択問題の構造を丁寧に見ていくと、問題文(設問文)があり、しばしば図表が添えられ、そのうえで選択肢 A〜D が並んでいる。きちんと作られた選択肢では、完全な正解が1つ、うろ覚えの受験者が引っかかってしまうような惜しい誤答(正解に近いが一部が誤っている選択肢)がいくつか、そしてうろ覚えではそこまでは正しく書かれているがその先が違う、といった選択肢が巧みに配置されている。
したがって受験者は、選択肢と設問文、設問中の図表、選択肢同士、を行ったり来たりしながら総当たりで比較し、どれが最も整合的かを判断しなければならない。再生型の短答問題で「徳川家康」と書いて終わるのとは、作業の質が異なっている。
4.6.2 エラボレーション(精緻化)という概念
学習における処理の深さ(depth of processing)には、深い処理(deep)と浅い処理(surface)の区別がある。多数の情報をつなぎ、比べ、選ぶ作業を繰り返す深い思考は、エラボレーション(elaboration、精緻化、あるいは「練り上げる思考」)と呼ばれる。精緻化された処理を経た情報のほうが、記憶として定着しやすい。多肢選択問題を解く過程は、うまく作られていればこのエラボレーションを自然に引き起こす。これが、練習テストとしての多肢選択が短答を上回る一因と考えられる。
4.6.3 良質な多肢選択問題の条件
もっとも、これは「多肢選択ならどれでも効果が高い」という意味ではない。良質な多肢選択問題には条件がある。たとえば、選択肢の長さを揃えることで、長さから正誤が透けて見える手がかりをなくす。うろ覚えの受験者が引っかかるような、内容的に練り上げられた誤答選択肢を用意する、といった点である。4択で偶然に正答する確率は一見25%だが、良問ではうろ覚えの受験者は引っかけ選択肢に誘導されるため、実際の当てずっぽうの正答率は25%より低くなる傾向がある。
反対に、選択肢を増やせば当てずっぽうの正答率は数字上は下がるが、良質な誤答選択肢を多数作るのは容易ではない。結局雑な選択肢が混ざり、機能しない選択肢を抜けば事実上の2〜3択になってしまい、かえって当てずっぽうで当たる確率が上がる、ということも起こる。したがって選択肢の数を増やせばよいという単純な話ではない。
4.7 練習テストはなぜ効くのか──検索練習(retrieval practice)
練習テストの効果を別の比較対象との関係で見ると、より広い含意が見えてくる。関連するメタ分析研究の多くは、練習テスト条件を再学習条件(restudy、教科書の読み直し)と比較している。その場合でも練習テストのほうが効果が大きく、効果量はおおむね0.5程度と報告されている。
教科書を読み直すだけの学習は、既知の情報に触れ「知っている、わかった」で終わりがちであるのに対し、練習テストは、自分の知識を一度ワーキングメモリに取り出す作業を伴う。自分が何を覚えているか、どこまで思い出せるかを自分自身で探索する、という検索(retrieval)の過程が、学習を深める。この過程を検索練習(retrieval practice)と呼ぶ。
短答・穴埋めは、外から与えられた刺激に対して自分の知識を呼び出すという意味で、処理としてはやや浅いかもしれない。しかし、それでも「思い出す」という検索の要素を含むため、単なる再読よりは効果が高い。多肢選択は、それに加えて比較・統合の作業を要するため、さらに深い処理を誘発する。
ここまでをまとめると、練習テストは効果があるが、それは頭を使うから効果がある、そして練習テスト形式の中でも頭をより使うものほど効果が大きい、ということになる。
4.8 メタ分析の三点セットと、その限界
4.8.1 メタ分析の構成要素
以上を整理すると、メタ分析研究は次の三点セットで構成されていることが分かる。第一に、系統的レビューによる文献の網羅的収集。第二に、効果量を介した統計的統合による平均効果量の算出。第三に、調整変数分析(モデレーター分析)による「平均からのずれ」の検討。この三つが揃うことで、分野全体の平均的知見と、その内部での体系的な違いの双方を論じることができる。
4.8.2 メタ分析という手法の意義と注意点
メタ分析は、パンデミック期に急増した手法でもある。対面での実験・調査が困難な時期にあっても、既存研究の統計的統合は実施可能だったためである。調査を行わずに理論化に近づけるという点で非常に有力な手法であり、院生が学位論文として取り組む方法としても、対面での協力依頼の負担を負わずに済むという実務的な利点がある。
一方で注意も必要である。メタ分析は既存研究の統合であるため、突拍子もない自由な発想による新規実験のような、イノベーションを生み出す力は相対的に弱い。また、ある領域を過度にメタ分析で食い尽くしてしまうと、そこから新しい研究が生まれにくくなる、という副作用も起こりうる。日本国内の研究は、研究間のオリジナリティの差が大きく、メタ分析の対象としてまとめにくいという事情もある。したがって、海外の文献にまで範囲を広げて取り組むことで、有用な展開が見える可能性がある。メタ分析は万能ではないが、使いどころをわきまえれば非常に強力な手法である、という位置づけで捉えたい。
4.9 まとめ
本日の講義では、系統的レビューとメタ分析の手順(データベース決定、検索式の設定、適格性基準による絞り込み、PRISMA 図の意味)、統計的統合の原理(効果量による共通尺度化とその解釈)、そして練習テスト(practice testing)に関するメタ分析を例に、平均効果量と調整変数分析から導かれる知見(練習テストは再読よりも効果的であり、形式の中でも多肢選択がより効果的である)、さらにその背景にある教育心理学的概念(処理の深さ、エラボレーション、検索練習)までを扱った。
次回以降は、各自にアサインされた文献を読み、その内容を報告・検討していく予定である。アサインされる候補文献はハンドアウトに掲載されているので、各自手元にダウンロードし、タイトルを見たうえで読んでみたい順に第一希望・第二希望を決めておいてほしい。来週その場でアサインを確定し、その後実際に読み始めることにする。