2018-11-02 2018/10/29 今日も朝から研究室。今日は研究で、キーワード検索のスコア (Elasticsearch のデフォルトのもの) と、少数の正解データ (その文章に関連しているとわかっている文章) を起点に作成した kNN グラフの PageRank を線形和する、という古典的な手法を再現してみた。あまり PageRank の方は良い影響がないと勝手に憶測していたが、いざ Recall を計算してみると単なるキーワード検索よりも有意に向上している。 グラフベースのアプローチはあるかもしれない、という実感が湧いてくる。夕方からは演習。