いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018/07/24

朝10時に起きた。今日も朝から研究室。

午前中は進捗報告ミーティングの資料作り。そのあと午後一番でミーティング。

ミーティングでは、今の方針が今の実験設定ではかなりきついことがわかったんだけど、これがいわゆる教師ラベルの質の悪さゆえのものである可能性が高まってきたので、とりあえず他の実験データセット (CLEF-IP 2010) で実験してみる。

その後はバイオ情報工学入門。今日は C-Net の前田研究室でいろいろな装置を体験する。

ついでビッグデータ解析。今回はリクルートテクノロジーズの Kaggle Grandmaster の方の講演で、主に特定物体認識について。面白い内容だった。内容は大きく Pre-Deep Era / Deep Era で別れていて、それぞれについて簡単にまとめると

  • 従来は local descripter のを抽出して BoVW を特徴量とする手法が主流。local descripter の抽出に、これまでは SIFT と呼ばれる Laplacian of Gaussian (の亜種) が用いられていた。SIFT はアフィン変換に対して robust
  • 2012年以降は CNN が台頭、一番最後の Convolution layer を sum-pooling なんかをして global descripter を抽出

ということ。

夜は研究室の麻雀杯。