Kill one bird with two stones.

情報推薦、情報抽出を研究している大学院生の基本的にやったことのメモとか

2.1章まで読んでみた

共立出版から出てる情報推薦システム入門理論と実践を読み進めてく

情報推薦システム入門 -理論と実践-

情報推薦システム入門 -理論と実践-

1章
推薦システムについて

そもそも推薦ってのは、ある本を推薦するって場合と膨大な情報の中から興味のある情報を推薦する(情報過多問題)を解決するためだよねって話。

・協調型推薦
ユーザーAとBが類似しててAが本Aを買ったならBに本Aを推薦するのは合理的だよね。って方法
膨大な本の集合の中から有望な本をフィルタリングして、ユーザーが暗黙的に協調してるから
collaborative filtering;CF 協調フィルタリングとも

・内容ベース
アイテムの説明とか、重要度から推薦する。

・知識ベース
推薦する物の技術的特徴を使用。
例えばPCは頻繁に、買い換えないから、ユーザーの個人情報とかから推測できずベストセラーのアイテムを推薦するしかない。
顧客の要望に応えて推薦する


2章
協調型推薦
2.1ユーザーベース
ユーザーが過去に似た嗜好を持っているならその思考は将来においても似ている
ユーザの好みは長い間一貫してる
との家庭のもと、ユーザーがつけた評価値を用いて予測する。

ピアソンの相関係数がよく用いられるみたい。式は略
2.2式の数字は
アリスの平均が4,ユーザー1の平均が2.25で数式通りに当てはめればOK

ユーザー2との類似度が0.70かどうかを確認する。
ユーザー2の平均は3.5なので

(5-4)*(4-3.5)+(3-4)*(3-3.5)+(4-4)*(4-3.5)+(4-4)*(3-3.5)/(\sqrt{(5-4)^2+(3-4)^2+0^2+0^2}*\sqrt{(4-3.5)^2+(3-3.5)^2+(4-3,5)^2+(3-3.5)^2})=0.7

で、アリスのアイテム5の評価値の予測を2.3式を使う。
2.4式は若干見づらいが、

アリスの平均値→4
アリスとユーザー1,2それぞれの類似度を足し合わせたもの(分母にあたる) (0.85+0.7)
分母にあたるため計算上は 1/(0.85+0.7)
アリスとユーザー1の類似度にユーザー1のアイテム5の評価値からユーザー1の平均値を引いたものを掛け合わせたもの→(0.85*(3-2,4))
アリスとユーザー2の類似度にユーザー2のアイテム5の評価値からユーザー2の平均値を引いたもの掛け合わせたもの→(0.70*(5-3.8))
なお、ここでの平均値はアリスとの類似度を求めるに使用したアイテム4までの平均ではなく、アイテム5までの平均なので注意

で計算をすると確かに4.87になる。」