いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018-11-01から1ヶ月間の記事一覧

2018/11/27

今日も朝から研究室。昼前にミーティングがある。サーベイ論文を出したいという話をすると、TOD がちょうどその枠があっていいとおすすめされる。締切が 12/20 か 3/20 なので、一応 12/20 を目指そうかな。8ページだからなかなかきつそうだけど。。というこ…

2018/11/25

今日も朝から研究室。今日は学期末に提出するレポートを書いたりする。内容は関連研究のサーベイで、せっかくなのでこれをサーベイ論文としてどこかに出したいという気持ちが出てくる。明日先生に相談してみよう。夜は今日も走りに行こうと思ったけど、昨日…

2018/11/23

今日は AbemaTV の広告インプレッション数予測コンペ当日。朝から一日中モデルを回す。 方針としてはとりあえず MLP で回すとして、まずは離散的な特徴量を one hot vector に直したりするというった前処理関数を書く。今回は計算サーバーが用意されていない…

2018/11/22

今日は Abema の広告インプレッション予測のコンペ に参加するため東京へ。昼過ぎに東京について、まずは赤坂で % 社の方と面談する。ちょうど博士課程の進学と迷っているので、修士卒で採用された場合にどれだけサイエンスに関われるか、サイエンスに関わり…

2018/11/21

今日も朝から研究室。午前中は研究の実装。ベイズ最適化の目的関数について先生にアドバイスをもらったので、それも追加で実験してみる。今日は演習についても進捗を生む。API 通信で CORS Blocking が出てそれの解消に手間取った。これを調べてみるとブラウ…

2018/11/20

今日も朝から研究室。午前中は進捗報告。ベイズ最適化の話をして、これでいよいよ SIGIR を目指そうという話になる。

2018/11/19

今日も朝から研究室。なかなか結果が出ない。 今日はベイズ最適化に手を出してみた。少し精度は良くなるけど、時間がかなりかかって実験がなかなか進まない。

2018/11/15

今日も朝から研究室。今日は document embedding として SCDV を試してみた。 SCDV : Sparse Composite Document Vectors using soft clustering over distributional representations.** EMNLP. 2017. この手法は比較的簡単で、もととなる word embedding (…

2018/11/14

今日も朝から研究室。昼前、word embedding の手法について研究をしいてる $ さんに研究の相談に乗ってもらう。主な相談内容は、文章の embedding の「重心」のようなものが定義できたとして、その「重心」と各単語との類似度を評価できないか、というもの。…

2018/11/13

今日も朝から研究室。今日は午後にミーティング。主に少数のレファレンス文章をクエリの重み付けにどのように用いるかについて話し合う。先生より思いがけないアイデアを出していただいて、一気に研究が加速しそうな感じ。その後は # 社の社員さんとミーティ…

2018/11/12

今日も朝から研究室。なかなか結果が出ない。 普通の Learning to Rank で各特徴量の重みを静的に決めるのは今回のタスクには向いていないと思い、Online Learning to Rank を試してみたり、特徴量として BM25 や TFiDF を入れたりとかいろいろ試してはみた…

2018/11/09

今日も朝から研究室。午前中は演習のミーティング。今はニュースのトピックセンテンスから穴埋めクイズを作るというタスクをしていて、どの場所を抜けばクイズとして面白いか、という議論をする。午後はすぐ大津に戻って、パスポートを取る作業。まず本籍が…

2018/11/08

一日体調を崩していた、、咳が出たり喉が痛かったり。あと、応募していたインターンに受かってかなり嬉しかった。

2018/11/07

朝はまずインターンのコーディング面接があった。 自分が今解こうとしている方針を伝えきれずに、少し悔しい思いをする。昼からは研究室。 ただ今日は眠気が強くてそこまで成果を出せなかった。昼寝をしたあとは家でだらだら論文読み。改めて SIGIR の Paten…

2018/11/05

今日も朝から研究室。午前中はいくつか事務作業をして、昼イチでミーティング。 ミーティングは前回から%さんも加わることになって、より一層説得力のある説明が求められる。 研究自体は今週進めてきた方向のまま進めることに。

2018/11/02

今日も朝から研究室。午前中は IR における Transductive learning について調べるために論文を調査。Szummer, M., & Yilmaz, E. **Semi-supervised learning to rank with preference regularization.** CIKM. 2011. 一般的な Bradley-Terry Model を拡張し…

2018/11/01

今日も朝から研究室。今日は Document Embedding を特徴量とした kNN グラフを作ってみた。あまりにもグラフが巨大すぎるのでグラフの構築に時間がかかる。その間に transductive learning についてのサーベイを行う。Label Propagation みたいに Classifica…

2018/10/31

今日も朝から研究室。今日はハロウィンということで、$さんや@さんが仮装をしていた。昼過ぎからは全体進捗。そのあと少し作業をして、10月から新たに加わったメンバーの歓迎会。

2018/10/30

今日も朝から研究室。午前中は昨日の実験結果をもとに報告資料を Dropbox Paper で作成して、ミーティング前に参加者全員に配布した。昼からはミーティング。グラフベースで、semi-supervised learning とか transductive learning を組み合わせる方針で一致…

2018/10/29

今日も朝から研究室。今日は研究で、キーワード検索のスコア (Elasticsearch のデフォルトのもの) と、少数の正解データ (その文章に関連しているとわかっている文章) を起点に作成した kNN グラフの PageRank を線形和する、という古典的な手法を再現してみ…

2018/10/28

午前中は$の家に行って、$がバイトのまかないでもらってきた刺身を2人で食べる。かなり美味しい。まかないに一緒についてきただし巻き卵も絶品。昼は大阪に帰る。帰りしなに研究室によって、演習の作業を進める。今日は React を Typescript で書く作業の続…

2018/10/27

今日は昼過ぎに起きて、$の実家へ。 $の妹とお母さんと少し話をする。夕方は実家に帰って、家族で日本シリーズを見る。