いないち日記

大阪で Information Retrieval を勉強する大学生の日記。

2017/11/10

朝7時に起きた。今日も朝から研究室。

午前中は、おとといから出力しはじめたデータを解析した。予想していた相関とは異なる相関関係が見られた。
ここ最近はデータを可視化する作業が多く、そのためのオプション(色や配置 etc..) で悩まされることが多い。午前中も解析自体よりはその可視化に手間取った。

昼からは新たな既存ツールを使用して ARI を出した。かなり高い値が出た。すごい。
あと、ちょうど ARI を計算してる時に、クラスタリング結果と正解ラベルで ARI を取るとクラスタリング結果のラベル番号の付け方によって ARI の値が変わってしまうのではないかと思った (例えば階層型クラスタリングで木の左側のクラスタから 1, 2, 3 と番号をつけようが 2, 3, 1 とつけようがクラスタリングの精度の違いはないが、それによって ARI の値が変わってしまうのではないか、ということ)。 結局そんなことはなかったんだけど、それがそもそもその仮説が間違っているのか、あるいはその仮説は正しくて、かつ sklearn の方で上手く調整してくれているのか、についてはまだわかっていない。

夕方、家に帰って、奨学財団のパーティーのため新大阪へ。阪急千里線では関大前で人がたくさん乗ってきて大変だった。

今年は去年よりも話した人が少なかった。もっと積極的にいろいろな人と話せばよかった。

夜、パーティーで知り合ったタイ人の留学生2人と JR の駅まで帰った。