いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018/11/02

今日も朝から研究室。

午前中は IR における Transductive learning について調べるために論文を調査。

Szummer, M., & Yilmaz, E. **Semi-supervised learning to rank with preference regularization.** CIKM. 2011.
一般的な Bradley-Terry Model を拡張した関数を最尤推定することで、少ないデータからでも効率的にランキング関数を最適化するというもの。具体的には、最尤推定に「類似度が高いデータはランキングも似ている」という仮定を敷いて
 C = \sum{\hat{q}_{ij}} \log (1- P(i\ \succ j)) (1-P(j \succ i))
という項を目的関数に追加している。

ちなみにこの手法ではランキング関数の関数形については設定する必要があり、論文では3層 NN を用いていた。ここらへんは自由度がある (論文でも例えばガウス仮定を使うこともできる、というか任意の関数を使える)、ので、この手法を応用するとするなら、次は今回の問題に適した関数を見つけないといけない。