いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2018/12/13

今日も朝から研究室。一応添削の修正は終わったので、夕方辺りに第2稿を投げる。 アブストの英語は % にチェックしてもらう。それにしても LaTeX の日本語スペルチェックのいい方法はないんだろうか。英語だと Aspell というのがあるらしいんだけど... PDF …

2018/12/12

今日も朝から研究室。今日も一日論文の修正作業。添削の意図を掴むのが難しくて四苦八苦する。昼からは阪大王の発表。いろいろツッコミをもらったり。 その後はもらったツッコミをもとにスライドを修正。

2018/12/11

今日も朝から研究室。午前中はミーティング。最終のスライドの確認と、プログラムの API の連携を行う。午後は研究ミーティング。きのう最適化関数が解析的に解ける (微分して最適解が求まる) 可能性があることが浮上したので、その結果も示したかったがまだ…

2018/12/10

今日も朝から研究室。午前中は B4 の卒論発表練習に参加。他の人がアドバスしているのを見るのも勉強になる。午後はまず共同研究先の方とアルゴリズムについてミーティング。ベイズ最適化を行っていた部分が実は解析的に解ける可能性があることが発覚した。…

2018/12/07

今日は研究室には行かず。午前中はアブストの添削をもらう。全体的に口語的という指摘が多い。ここらへんはあまり自分で意識していなかったので、アドバイスを貰えてよかった。昼前に大学を出て、髪を染めた。アッシュ系。だいぶ茶色はなくなった。その後は…

2018/12/06

今日も朝から研究室。午前中はアブストの添削を先生方にお願いする。今日は論文作業は一旦休んで、情報整理・情報収集の日にする。以下は気になった記事たち。 今日はメインは Lifehacker から。www.thefabulous.coFabulous という行動経済学に基づいた習慣…

2018/12/05

今日も朝から研究室。そろそろアブストを確定させないといけないので、今日はそれをメインに推敲する。昼過ぎからも章立て。今回の論文は MECE な切り口が 2 通りあるので、どちらを section にしてどちらを subsection にしようかいろいろ迷ったり。

2018/12/04

今日も朝から研究室。午前中は論文の推敲を進める。今日は Precision Recall 曲線の AUC について書こうとしたが、情報検索の場合あまり AUC で性能を評価した例がないのでやっぱり辞める。午後は一番にミーティング。論文の進捗を見せる。おそらく順調には…

2018/12/03

今日も朝から研究室。午前中はサーベイ論文の執筆。そろそろページ数もいい感じになってきたので、とにかく各フレーズから推敲フレーズに移ろうと思う。夕方、バドミントンに行こうと思ったけど、体がかなり疲れているので早めに寝ることにする。

2018/11/30

今日も朝から研究室。午前中はサーベイ論文の執筆。適所に図を入れたり表を入れたりすると、情報自体はダブってしまうけどかなり伝わりやすくなった気がする。午後、早めに大阪を出て大津の実家へ。国際免許の申請をしようと思ったがパスポートを持って帰る…

2018/11/29

午前中はサーベイ論文の作成。午後は授業。3コマ (=4時間30分) 連続はなかなか疲れる。今日は自然言語処理の話が最初にあって、その次に脳の話。

2018/11/28

今日も朝から研究室。午前中はサーベイ論文の編集作業。なかなかページ数が埋まず、そもそも調査自体が浅い気がしてきた。特に 2010 年移行の論文が少ない気がするので、いろいろクエリを変えながら既存研究を調べる。夕方、$社の方との面談をする。博士を取…

2018/11/27

今日も朝から研究室。昼前にミーティングがある。サーベイ論文を出したいという話をすると、TOD がちょうどその枠があっていいとおすすめされる。締切が 12/20 か 3/20 なので、一応 12/20 を目指そうかな。8ページだからなかなかきつそうだけど。。というこ…

2018/11/25

今日も朝から研究室。今日は学期末に提出するレポートを書いたりする。内容は関連研究のサーベイで、せっかくなのでこれをサーベイ論文としてどこかに出したいという気持ちが出てくる。明日先生に相談してみよう。夜は今日も走りに行こうと思ったけど、昨日…

2018/11/23

今日は AbemaTV の広告インプレッション数予測コンペ当日。朝から一日中モデルを回す。 方針としてはとりあえず MLP で回すとして、まずは離散的な特徴量を one hot vector に直したりするというった前処理関数を書く。今回は計算サーバーが用意されていない…

2018/11/22

今日は Abema の広告インプレッション予測のコンペ に参加するため東京へ。昼過ぎに東京について、まずは赤坂で % 社の方と面談する。ちょうど博士課程の進学と迷っているので、修士卒で採用された場合にどれだけサイエンスに関われるか、サイエンスに関わり…

2018/11/21

今日も朝から研究室。午前中は研究の実装。ベイズ最適化の目的関数について先生にアドバイスをもらったので、それも追加で実験してみる。今日は演習についても進捗を生む。API 通信で CORS Blocking が出てそれの解消に手間取った。これを調べてみるとブラウ…

2018/11/20

今日も朝から研究室。午前中は進捗報告。ベイズ最適化の話をして、これでいよいよ SIGIR を目指そうという話になる。

2018/11/19

今日も朝から研究室。なかなか結果が出ない。 今日はベイズ最適化に手を出してみた。少し精度は良くなるけど、時間がかなりかかって実験がなかなか進まない。

2018/11/15

今日も朝から研究室。今日は document embedding として SCDV を試してみた。 SCDV : Sparse Composite Document Vectors using soft clustering over distributional representations.** EMNLP. 2017. この手法は比較的簡単で、もととなる word embedding (…

2018/11/14

今日も朝から研究室。昼前、word embedding の手法について研究をしいてる $ さんに研究の相談に乗ってもらう。主な相談内容は、文章の embedding の「重心」のようなものが定義できたとして、その「重心」と各単語との類似度を評価できないか、というもの。…

2018/11/13

今日も朝から研究室。今日は午後にミーティング。主に少数のレファレンス文章をクエリの重み付けにどのように用いるかについて話し合う。先生より思いがけないアイデアを出していただいて、一気に研究が加速しそうな感じ。その後は # 社の社員さんとミーティ…

2018/11/12

今日も朝から研究室。なかなか結果が出ない。 普通の Learning to Rank で各特徴量の重みを静的に決めるのは今回のタスクには向いていないと思い、Online Learning to Rank を試してみたり、特徴量として BM25 や TFiDF を入れたりとかいろいろ試してはみた…

2018/11/09

今日も朝から研究室。午前中は演習のミーティング。今はニュースのトピックセンテンスから穴埋めクイズを作るというタスクをしていて、どの場所を抜けばクイズとして面白いか、という議論をする。午後はすぐ大津に戻って、パスポートを取る作業。まず本籍が…

2018/11/08

一日体調を崩していた、、咳が出たり喉が痛かったり。あと、応募していたインターンに受かってかなり嬉しかった。

2018/11/07

朝はまずインターンのコーディング面接があった。 自分が今解こうとしている方針を伝えきれずに、少し悔しい思いをする。昼からは研究室。 ただ今日は眠気が強くてそこまで成果を出せなかった。昼寝をしたあとは家でだらだら論文読み。改めて SIGIR の Paten…

2018/11/05

今日も朝から研究室。午前中はいくつか事務作業をして、昼イチでミーティング。 ミーティングは前回から%さんも加わることになって、より一層説得力のある説明が求められる。 研究自体は今週進めてきた方向のまま進めることに。

2018/11/02

今日も朝から研究室。午前中は IR における Transductive learning について調べるために論文を調査。Szummer, M., & Yilmaz, E. **Semi-supervised learning to rank with preference regularization.** CIKM. 2011. 一般的な Bradley-Terry Model を拡張し…

2018/11/01

今日も朝から研究室。今日は Document Embedding を特徴量とした kNN グラフを作ってみた。あまりにもグラフが巨大すぎるのでグラフの構築に時間がかかる。その間に transductive learning についてのサーベイを行う。Label Propagation みたいに Classifica…

2018/10/31

今日も朝から研究室。今日はハロウィンということで、$さんや@さんが仮装をしていた。昼過ぎからは全体進捗。そのあと少し作業をして、10月から新たに加わったメンバーの歓迎会。