いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018/07/26

朝9時に起きた。今日も朝から研究室。

今日は一日中研究。CLEF-IP のデータセットでいろいろ実験をしてみる。ちょうど今ロジカルシンキングの本を読んでいて、MECESo what? / Why so? を考えながらいろいろとパラメータをいじった。
ただあまり思わしい結果が得られず (既存研究の再現性が取れない) 苦労する。

昼は SIGIR 2018 に出ていた次の論文を読んでみる。

Shalaby, W., & Zadrozny, W. Toward an Interactive Patent Retrieval Framework based on Distributed Representations. SIGIR. 2018.

これは特許文章から concept を (ここでは concept = Wikipedia article title) 抽出して、Bag of Concept の形で文章を分散表現にした論文。単語ベースで検索する場合に比べ、同一の概念を指す異なる表現同士 (Solar cell と PV cell など) に強いという分散表現ならではの強みに加えて、それらの表現が複数単語で構成される場合にも robust であるという利点がある。

夕方からは梅田で、研究室の同期で飲み会。中国からの留学生に日本人 (rìběn rén) という単語の発音がうまいと褒められてうれしかった。