いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018/10/29

今日も朝から研究室。

今日は研究で、キーワード検索のスコア (Elasticsearch のデフォルトのもの) と、少数の正解データ (その文章に関連しているとわかっている文章) を起点に作成した kNN グラフの PageRank を線形和する、という古典的な手法を再現してみた。あまり PageRank の方は良い影響がないと勝手に憶測していたが、いざ Recall を計算してみると単なるキーワード検索よりも有意に向上している。
グラフベースのアプローチはあるかもしれない、という実感が湧いてくる。

夕方からは演習。