いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2019/07/15-2019/07/21

かなり忙しい一週間だった。作らなければならないスライドが3枚たまっていて (修士の中間報告、位相勉強会のスライド作成、輪講の課題) かなり忙しかった。忙しいと研究の進み具合が微妙になる、、と思っていたところで上保さんが下のような tweet をしていた。

中間報告は金曜日に無事終了。#先生から、特許というドメインなら未知語対応はどうなの? と聞かれ、そこは全文検索で補いますという最悪の回答をしてしまう (本質的な問題を従来研究で解こうとしていることになる)... とりあえず研究室に戻って fasttext で実験してみると BERT よりなかなか良い。

位相勉強会のスライドは、主に距離についての担当。解析学で言う  \epsilon - \delta 論法を位相的にといていて面白い。例えば
 \forall \epsilon\ \exists \delta\ d(x, a) < \delta \Rightarrow d'(f(x), f(a)) < \epsilon
はつまり、
 f(B(a; \delta)) \subset B'(f(a); \epsilon) (ただし  B は近傍)
と書き換えることができて、これを
 B(a, \delta) \subset f^{-1} (B'(f(a); \epsilon))
これはいわゆる「飛ばした先の近傍が基の近傍」ということで、これは実は  f が連続であることと同値となる。

輪講の課題はトランザクションについて発表することに。