> 『数学的思考(?)エッセイ』 の試み

55. 何を評価するかが問題
 基礎数学についてのバーチャルレッスン(Internet Expolor のみ対応) なるものを作成した。受講者の履修状況や成績が記録できる。各人の成績はその人しか見られないが、総計ポイントによるランキングもあり、自分の成績順位が確認できる。やはり自分の成績が記録として残れば、それを上回る記録に挑戦しようという意欲が出てくる。
 成績ランキングを作成するためには、各人の総合点を出さなくてはならないが、この総合点の出し方に合理的な方法があるのだろうか、ということが今回の話題である。

*−*−*−*−*−*−*−*−*−*−*−*−*−*−*−*

 説明を簡単にするために、
  1.整式の乗法(20問) : 1問当たりの配点=5点
  2.因数分解  (50問) : 1問当たりの配点=2点
の2つの項目があるとする。各項目についての配点は同点とする。

 (I) 項目の評点
 まず最初に、各項目について100点満点で評点を付けなくてはならない。通常のペーパーによるテストの場合には
  通常の評点=(1問当たりの配点)×(正解した問題数)                … (1)
とするであろう。しかしながら、パソコンでの場合には、もし回答が不正解のときは何度でも入力をやり直せる。そこで、
  正解した問題数を t間違えた回数を f
とする。f は間違えた問題数ではなく、間違えた回数であることに注意していただきたい。そして、
  正答率=t/(t+f)                                       … (2)
を導入する。

 ところで、1問だけに挑戦し t=1、f=0 の場合、20問に挑戦し、t=20、f=0 の場合は、いずれも 正答率=1 となる。 したがって正答率でもってその評点にすることは妥当ではない。 正解した問題数 t も考慮しなくてはならない。
 そこで、
  ポイント=( 正解した問題数)×(正答率)=t×t/(t+f)               … (3)
および、
  評点=( 通常の評点)×(正答率)=(1問当たりの配点)×ポイント       … (4)
とすることにした。

 さて、A君、B君が挑戦し、次のような結果になったとしよう。

   A君  B君
1.整式の乗法t=13, f=53t=7, f=30
2.因数分解t=21, f=13t=28, f=35

 (2)、(3)、(4)によってそれぞれ正答率、ポイント、評点を出すと次のようになる。

 A君B君
正答率ポイント評点正答率ポイント評点
1.整式の乗法0.202.5613点0.191.327点
2.因数分解0.6212.9726点0.4412.4425点

 項目1、2とも、正答率、ポイント(評点)について A君の方がB君より高得点である。

 (II) 総合点
 以上の各項目の評点の結果より総合点を出したいのであるが、項目1と2で問題数が異なるので、それぞれの評点を加えて2で割る、いわゆる平均点は適当ではないような気がする。
 やはり、項目1と2の全問題数70問に対して正解した問題数間違えた回数 を用いるべきであろう。
  全問題数 70問 : 1問当たりの配点=100/70点
である。したがって、

 A君B君
正答率ポイント評点正答率ポイント評点
総合点0.3411.5616.5点0.3512.2517.5点

となる。  総合点では、正答率、ポイント(評点)について B君の方がA君より高得点になる。 項目1、2とも、正答率およびポイント(評点)について A君の方がB君より高得点であったにもかかわらず、である。

 これは、いわゆるシンプソンのパラドックスという現象である。
(参考)
  A君の正答率: 13/66=0.20 と 21/34=0.62 より 総合正答率=(13+21)/(66+34)=0.34
  B君の正答率:  7/37=0.19 と 28/63=0.44 より 総合正答率=( 7+28)/(37+63)=0.35
ポイント(評点)についても、同様の現象が起こっている。

 (※ シンプソンのパラドックスについては、例えば びいたまさん の 『シンプソンのパラドックス』 で分かりやすく紹介されています。)
*−*−*−*−*−*−*−*−*−*−*−*−*−*−*−*

 また、次のような状況は実際にあり得ることである。 例えば

   A君  B君
1.整式の乗法t=1, f=0t=20, f=20
2.因数分解t=1, f=0t=50, f=50

だったとすると、
 A君B君
正答率ポイント評点正答率ポイント評点
1.整式の乗法1.01.05点0.510.050点
2.因数分解1.01.02点0.525.050点
総合点1.02.02.86点0.535.050点

 今度は、項目ごとと総合点での逆転現象は起こらないが、正答率ではA君が良い、ポイント(評点)ではB君が良いという、現象がおこってしまう。

*−*−*−*−*−*−*−*−*−*−*−*−*−*−*−*

 要は、何を評価したいのか、ということであろう。 解いた問題の数はあまり問題にしなくて正確さを重要視するなら正答率を採用、間違ってもいいからとにかく正解を出した問題数が大切であるなら正解した問題数のみを、あるいは、間違ったことを少しは考慮して正解した問題数を評価したいなら、ポイント(評点)を採用、ということになろう。 さてさて、何が重要なのだろうか? あるいは、他に万能な点数化の方法があるのだろうか?

 なお、今回作成したバーチャルレッスン(Internet Expolor のみ対応) は、学生が自主的に学習することが目的である。したがって、少々間違ってもいいから解いた問題数を評価したい。 そこで、各項目については正答率、ポイント、評点を出したが、総合点としては、各項目のポイントの合計を採用した。 多くやればやるほど(もちろん間違いが少ない方が)総計ポイントは増し、高ランキングに位置する仕組みである。
(2003. 3.22)
 ▼
 【問】 プロ野球の投手の成績で、
  A投手 : 10勝 0敗
  B投手 : 20勝10敗
のとき、どちらの投手の働きが大きいと言えるだろうか。 一般には、B投手の方が評価されていると思われるが、それはなぜだろう?

**********************************************************************************
Copyright(C) Yokahiyokatoki