読者です 読者をやめる 読者になる 読者になる

(っ'ヮ'c)M1!ぶろぐ

えいこうのえむいち。備忘録兼電車内での暇つぶし。対話システムとか。雑記とか。間違ったこと書いてたらごめんなさい。

データセット

今週あまり調子が良くなかった。
暑いのもあるのだろうか?温度変化が体に与えるダメージは大きいとよく言うが…なんというか最近バランスが良くないので調整して生きていきたいところだ…

今日はデータセット作り。手をつけるまではすごいやりたくなかったが、1回やり始めると意外とスイスイ進む。
しかし、アノテーションとかは求められてる厳密性がよくわからない。アノテーションについてのスライドとか授業とか、どっかにないかな…

最近、研究相談に来てくれる後輩がいて少し嬉しい。でも役に立てることがそこまで言えなくて(´・_・`)となる(´・_・`)
結局、研究やら開発やらのクリエイティブなことは勉強と似て非なるもので、ハードルが全く異なるということなんだろう。
勉強の延長線上で研究も意外といけるんじゃないかなと思うと、違いすぎて面食らうということなのかなと思う。
いろんなことをいろんな視点で取り入れていくのがきっと大切なんだろうなぁ

もっと人と喋りたいと最近は感じてるが、なかなか話し相手がいない(´・_・`)
悲しい(´・_・`)

きょうのしんちょく

今日は結構評価実験面的に進んだ٩(。•ω•。)و
検証用データを回せたので、これでテストデータに使うエポックを決めたいと思う٩(。•ω•。)و
論文は関連研究をはよ書かねばな、筆が止まっている( ´・‿・`)笑

最近M1の同期皆さんすごい就活のためのインターンとかに力入れててすごいなぁと思う。
就職ってなんなんだろう、大企業もいいのかもしれないけど自分の意志がないと、なんか誇れないよなぁ…
自分はどんな進路を進みたいのか、そろそろ真剣に考え始める時期なのかもしれない。

就活なぁー、どうしようかなぁー。Dはぶっちゃけなくはないかもしれないけど、行くなら本気のところ(有名な研究室)に行くかとか、あとは行く前に1回トップカンファレンスに通したい。そうしないと覚悟決まらないと思うので。。。その二つを考えると、まだ現実的な選択肢ではないのかも。
今のところ、少なくとも就活と並行かなという気はする。

自分の学科の修士進路実績を見る限り、やはり有名企業が多い。個人的には企業名にはあまりこだわりが無いので、広く見て面白そうなところを探していきたい。

授業

異様に眠くて、12時間以上寝てから登校…睡眠は悪いことではないと思っているのでなるべく削らないようにしているが、寝すぎる…
天気が悪い時にとても眠いことが多いので、気圧とかが関係あるのかもしれない…つらい(´・_・`)
基本的に寝付きも寝起きの機嫌も悪いので、睡眠との付き合い方をしっかり考えないといけないよなぁ…
寝起きの機嫌は睡眠時間と関係ありそうなのだが、寝付きに関してはコントロールするのがなかなか難しい…疲れていれば比較的すぐ眠くなるが、精神的な疲労より肉体的な疲労の方が効くので、結局時間とのトレードオフという…(´・_・`)
しかも夜ふかしは得意(起きすぎて眠い、というのが深夜にならない)だから、本当に困ったものである、1回リズムずれるとなかなかなおらない(´・_・`)

今日は授業の課題をやっていたら一日終わってしまった…
まあ、paragraphvectorを回せたというのはあるのだが、もう少し進めたかった…

授業の課題はオントロジー構築とコンピュータビジョンの実装相談。CVに関しては割と有意義だったので満足。教授と相談するとここまでスムーズなんだなという感想。雑なプランだったのに親身になっていただいてありがたい。
画像系のSIFT特徴抽出をやってみてそれに対してdag-of-featuresを取り出す処理をしてSVMで分類してみようというタスクに落ち着きそうなのだが、BOFを取り出す際にSIFT特徴量から1回k-meansで次元圧縮をするらしく、ほほう?という感じ。教師なしで幾つかクラスタを作り、それによって次元削減をした方が精度が上がるみたいだ。
SVMならカーネルトリックを使えば一応分類はできるのでは?と思ったが、そのあたりは試してみたいところ。まあ圧縮した方が結果は良いのだろうが、そのへんはSVMの特徴というか、どのくらいのサイズのデータに使うのがより高精度なのか知りたかったので良い機会かもしれない。
そういうノウハウは結局手を動かさないとわからない気はするので、そういう意味では良い課題なのかもしれない。基本的に結構な負担を要求されている(気がする)ので、なんとか自分の知見増加に繋げたいw

あと、その課題を相談してる最中にSIFT特徴量に対してk-meansではなくLDAをかけて圧縮したらもっと意義のある特徴が見えてくるのでは?と思って、調べてみたらfei-feiらの既存研究があった。このfei-feiはあのfei-feiなのだろうか?ちゃんと読んでみたい。たぶんニューロが流行る前の論文っぽいので、やっぱ冬の時代はいろいろやってたのかな…などと勝手に想像している。
ただまあ、やっぱりディスカッションは重要だなと感じる。15分くらいのディスカッションでも割と楽しく色々アイデアを話せたのはなんとなく斬新だった。他分野の人と話すのはきっと大切なのだろう。

もうひとつ、オントロジー構築が割と大変だった。構築してて自分があんまりわかってないのも分かってくるし、自由なテーマで作ってみてください、というのがつらい。オントロジー構築した時に面白い挙動を示しそうなテーマを探すのが難しい。これが難しいのはオントロジーの挙動をきちんと捉えていないからなのだろうが、正直1回2回の演習でそこまで覚えてない…どちらかというとうまくいかない可能性が高い故に萎え、ストレスを感じるのがつらい(´・_・`)
まあただ、次もう1度ちゃんと勉強しようとした時にだいぶ全体像の掴み方は変わってくるのかなと思う。

大学の(特に大学院の)授業は「なんのため?」みたいなことがよくとりざたされるが、よく教える側から聞くのは「少しでも将来覚えてることがあってくれれば嬉しいです」みたいな話だ。まあ少しだけの理解のためにしてはかける時間なげーよと思わなくはないが、少なくともその「少しくらい」はちゃんと覚えられるようにしたい…
アメリカは修士くらいまでは授業中心とか、学生側からは研究したいから修士来とるんやで、とかいろいろ聞くが、まあ頑張るしかないんじゃないかなと思う。どんな無駄な勉強でも恐らく将来には役に立つと思うので…俺もちゃんと2限に出られるような生活にしよう( ´・‿・`)

疲れ

論文を書き始めた。論文デイズ1日目。
卒論以来なのでどんな風な文体なら違和感ないのかが定まらない。参考文献は英語も多いし、成長を感じるラインナップになってるんだけど日本語の論文はそもそもあんまり読まないので「普通こんな感じの文体だよね」ってのがイマイチ掴めないでいるのである…
あとイントロ書き始めた時点で「精度は確かに上がってるけど、これ応用研究に使えるレベルまでは精度向上してなくね…」ってのが地味につらい…まあうまくアンサンブルしていくのが地道なとこだし、言語処理が前処理で決まるってのもきっとそういうことなんだろうけど。
あとは、モデルも細かいパラメータで微妙に挙動に違いが出て「まだいける!まだいけるはず…!」って欲が出てきてなかなか…笑
前途は多難だが、論文を書いてる時間が一番成長タイムだって先輩も仰ってたのでがんばってこなしていきたい。ベースは1週間ぐらいでガガっと仕上げていきたい。自分で校生し直して実験二つ目も上げて、それで先生に添削出す感じかな。

やってて思うのは、ニューロはしんどい笑
なんでうまくいくのか、もちろん自分の中で仮定はあるけどそれの正しさがうまく目に見えにくい。
というか、流行ってるからこそそこの確信が欲しくなってくる。あんまり流行ってない分野だとそこを見る気が湧いてこないのかも。この手法でもうまくいくんだぞ!だけでストーリー作れるというか。うまく言えないけど。

確かに冬の時代にニューロやるのは楽しかろうと思う。大学ではそういうロステクを扱った方がいいってのはHinton先生も仰ってたし、次はニューロ以外をやってみるかもなぁ。

関係ないけどdeep learningとか人工知能って言葉があまり得意ではない。一般の人にはそう説明するけど、研究室内で話す時はあまり使いたくない意識がある。曖昧だし、専門で勉強してるのにその言葉を魔法として使い続けるのに抵抗がある。
多義性とか曖昧性のある言葉ということで自分の中では落ち着いているので、そこに関して深く議論するのは意味が無いと思ってるしむしろどちらかというと(笑)なくらいの方が心酔するよりはマシなのではと思う。
そういうところは組織として、この研究室大丈夫かな…と思うこともあるが組織の改善に自己を捧げるのは学部の時にサークルで嫌という程やった(実際かなりメンタル削れるからよほど思い入れがないとキツい)ので、あまりやりたくない…
今は技術者としての実力をつけることも兼ねて研究していると思っているので、まあ思う事はあっても特に気にしない方針でいる。

今日もブログ書く

変に意識しない方がブログ書けそうw

論文を書こうと思う、だいぶネタが仕上がってきて教授にも割とゴーサイン出してもらえた感あったので書いていこうと思う。
教授ってどの立場なんだろう、「指導」っていうほど指導はしてもらってないけど確かにお世話にはなっている。
共著とかも、なんか明確な定義がない。学術界隈っていろんなことがとても曖昧な気がする。査読の仕組みとかも。

まあ、あいまいなままちゃんと機能してるあたり学術っていうものの根の深さを感じる。でもインターネットとかはかなり有効に使って対応してると思うし、そのあたりは流石だなと思う。結局不満なところが目に付くだけなのだろうか。

とりあえず、強化学習について考えることが増えた。強化学習の本質というか、イマイチ一言で説明する感じに掴めてない。日本語の参考書が少ないのもあるからだろうが、なんとか掴みたいところ…

大学院 #とは

大学に行って帰宅中。
授業あると思って早めに行ったら休講だったので( ˘•ω•˘ )になりながら研究室で研究。
朝早起きは基本辛いけど、昼頃に心地よい覚醒がくる(よく考えたら高校の時とかも4限とかは謎に集中できてた)ので、早起きはすごいなと思った。

そういえば、高校の時行ってた塾の塾長が「大学生にもなって授業とか言うな、講義と言え」とFacebookに書いていたのを思い出す。その方は某バンカラな大学の卒業生の方だったので、「あーこういうのは校風なのかなー」と思った記憶。
確かに大学は「自分で通いたくて通ってる」みたいな意識がとても大事な気がする。漫然としてると割と即効で終わってしまうだろうし。
文系の同期で「大学は学歴を手に入れるために来てるようなもの、学費で学歴を買ってる」と割り切っている人がいたけど、そういうのって自己防衛や自己正当化の類なのかなぁ…と今になると思ったりする。漫然としている責任を被りたくない口実、みたいな?

まあでも確かに、大学院ってどんな立場なんだろうってとても思う。漫然と学校にきて、熱心に研究しなくても、ちゃんと就活して卒業できればそこそこいい会社に入れる、みたいな。
理系は大学院行くのが正統派ルートみたいな風潮があって、おそらく偏差値とか大学のレベルが上がれば上がるほどそういう空気感が強い(あくまでイメージだけど)。
なので、レベル高い大学だと逆に「とりあえず大学院来た」みたいな人が多いのではないだろうか。まあそれでもポテンシャルは高いし、社会では活躍できるんだろうけど。わかんないけど。
何をするのが正しいとかはもう二十歳超えたらあんまりないんだろうけど、大学院はどんな施設だったのか、これからどんな施設になっていくのかとても興味深い。
確かに理系は文系に比べて忙しいらしいので、理系の大学院まで込みの6年間で文系の4年間と同量のモラトリアム、という発想もあるんだろう。

まあそんな感じで。僕は「研究したいから大学院に来た。自分でやりたくて研究している」という意識を常に持つようにしている。今後もそこを常に意識していきたい。疑うことがあったら別に拘らなくてもいい訳だし。

大学院 #とは

大学に行って帰宅中。
授業あると思って早めに行ったら休講だったので( ˘•ω•˘ )になりながら研究室で研究。
朝早起きは基本辛いけど、昼頃に心地よい覚醒がくる(よく考えたら高校の時とかも4限とかは謎に集中できてた)ので、早起きはすごいなと思った。

そういえば、高校の時行ってた塾の塾長が「大学生にもなって授業とか言うな、講義と言え」とFacebookに書いていたのを思い出す。その方は某バンカラな大学の卒業生の方だったので、「あーこういうのは校風なのかなー」と思った記憶。
確かに大学は「自分で通いたくて通ってる」みたいな意識がとても大事な気がする。漫然としてると割と即効で終わってしまうだろうし。
文系の同期で「大学は学歴を手に入れるために来てるようなもの、学費で学歴を買ってる」と割り切っている人がいたけど、そういうのって自己防衛や自己正当化の類なのかなぁ…と今になると思ったりする。漫然としている責任を被りたくない口実、みたいな?

まあでも確かに、大学院ってどんな立場なんだろうってとても思う。漫然と学校にきて、熱心に研究しなくても、ちゃんと就活して卒業できればそこそこいい会社に入れる、みたいな。
理系は大学院行くのが正統派ルートみたいな風潮があって、おそらく偏差値とか大学のレベルが上がれば上がるほどそういう空気感が強い(あくまでイメージだけど)。
なので、レベル高い大学だと逆に「とりあえず大学院来た」みたいな人が多いのではないだろうか。まあそれでもポテンシャルは高いし、社会では活躍できるんだろうけど。わかんないけど。
何をするのが正しいとかはもう二十歳超えたらあんまりないんだろうけど、大学院はどんな施設だったのか、これからどんな施設になっていくのかとても興味深い。
確かに理系は文系に比べて忙しいらしいので、理系の大学院まで込みの6年間で文系の4年間と同量のモラトリアム、という発想もあるんだろう。

まあそんな感じで。僕は「研究したいから大学院に来た。自分でやりたくて研究している」という意識を常に持つようにしている。今後もそこを常に意識していきたい。疑うことがあったら別に拘らなくてもいい訳だし。