いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2017/08/11

朝6時に起きた。散歩をして軽く朝食を食べたあと、論文読み。

今日は Model-based clustering and data transformations for gene expression data*1 という論文で、複数のモデル (具体的には複数の種類の共分散行列を持つガウス分布) からどれがそのデータをクラスタリングするのにベストか、をBICを基準として選ぶというアルゴリズム
この論文は特にアルゴリズムの検証部分が参考になった。様々な遺伝子発現のデータ (人工的なデータ、実データ、発現周期があるデータ、ガン or not のラベル付きデータ、など) が検証で使われていたり、またBICを用いることそのものの妥当性もジニ係数を用いてしっかり調べられていたりともれなく調べ尽くされていて、とても説得力があった。

昼食を食べた後も、だらだらしながらまた論文を読んだりする。

15時に京大の合格発表があった。受かった!高校生のころから京大は一つ大きな憧れだったので、その京大に合格できたというのは (行く行かないは後で考えるとして) 特別な思いがある。

ただそれもあって、進学先は阪大と腹を決めていた思いが少し揺らぐ。考えているうちに迷って落ち着かなくなってきたので、気分転換に#のバッティングセンターに行くことにした。左打席を多めに打った。大阪の方よりタイミングが取りやすいので、足を上げる打法でも打てる。

帰ってから、お風呂に入って夕食を食べて昨日のあまりのお酒を飲んで寝た。

*1:Yeung, Ka Yee, et al. "Model-based clustering and data transformations for gene expression data." Bioinformatics 17.10 (2001): 977-987.