ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。
How Not To Sort By Average Rating
この計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、 投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮しています。以下数式
これはScoreの
信頼区間を表しています。
この信頼区間の下界をランキングのスコアにすれば良い事になります。
ここで、
は、
です。全体に占めるポジティブ投票数の割合ですね。
さて、五段階評価によるRatingに同様のテクニックを適用する場合はどうしたらいいでしょうか。
単純に、1回の投票を4度のpositive/n
を使えば良さそうです。
従って、最終的にこんな感じになります。
Rubyコードで表すとこんな感じですね。
1 require 'statistics2' 2 3 def score(ni, alpha) 4 n = ni.inject(&:+) 5 return 0 if n == 0 6 m = ni.size 7 z = Statistics 2.pnormaldis t(1-alpha/2) 8 phat = m.times.zip(ni).inject(0){|s,(i,j)| s + i*j}/((m - 1.0)*n) 9 (phat + z*z/(2*n) - z*Math.sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n) 10 end
posted by
genki
on Sun 10 May 2009
at 04:46
+%5Cfrac%7Bz%5E2_%7B%5Calpha/2%7D%7D%7B4N%7D%7D%7BN%7D%0A%7D%7D%7B1+%5Cfrac%7Bz%5E2_%7B%5Calpha/2%7D%7D%7BN%7D%7D%0A.png)


![\hat{p}'=\frac{\sum_{i\in{[1,5]}}(i-1)N_{i}}{4N}](http://formula.s21g.com/?%0A%5Chat%7Bp%7D'%3D%5Cfrac%7B%5Csum_%7Bi%5Cin%7B[1,5]%7D%7D(i-1)N_%7Bi%7D%7D%7B4N%7D%0A.png)
+%5Cfrac%7Bz%5E2_%7B%5Calpha/2%7D%7D%7B4N%7D%7D%7BN%7D%0A%7D%7D%7B1+%5Cfrac%7Bz%5E2_%7B%5Calpha/2%7D%7D%7BN%7D%7D%0A.png)


