読者です 読者をやめる 読者になる 読者になる

(っ'ヮ'c)M1!ぶろぐ

えいこうのえむいち。備忘録兼電車内での暇つぶし。対話システムとか。雑記とか。間違ったこと書いてたらごめんなさい。

くそひさびさに日記書く

気づいたら4年生でもなんでもねぇww
えむいちになりました。タイトル変えないとなぁ笑
匿名でやった方が楽しそうなので、匿名でやろうと思う(っ'ヮ'c)ウゥッヒョオアアァアアアァ

最近思ったのだけど、はてなブログって実は結構一世を風靡していた時期があったのでは。僕はモバゲーmixiTwitterLINE世代に青春を駆け抜けた世代だが、僕らの一つ上の世代ははてブロとかでいろいろ活動していたのかなーと思った。
個人としてはてなブログとかアメーバブログとかライブドア(なんかブログサービスあったよね?)とかぜんぶどんぐりかと思ってたけど、はてなはもしかしてその中でも強かったのかなと。個人的にブログ文化はあんまり浸透してないけれど、もしかして少し上の世代にとっては、僕が思うより浸透していた文化なのかもしれない。

よく考えるとどんどん匿名性は低くなってきている気がする。

そういえば関係ないけど僕は昔(中学くらいのとき)ザ掲示板というところでブログ的なものを細細かいてた。まだあるのかな。ググればわかるんだろうけど怖くてぐぐれない笑

最近久々にmixiやり直したりTwitterもまだやってるけど、なんとなく息苦しいのでしばらく息を潜めようと思う。存在を匂わせない為にmixiFacebookはログインもしないで、ラインも個人以外はスルーで。
特に意味はないんだけどね、なんとなく見つめ直しということで。
その代わりにはてなブログでも書こうかとw

関係ないけど「つらい」とか「息苦しい」とかって耳にするだけでほんとうにそんな気持ちになってくるから不思議な力を持った言葉だなと思う。

久々に研究室に行った

しばらく研究室に行ってなかったが、久しぶりに行った。卒論が終わって中だるみ...だったのだろうか?まああんまり卒業旅行とか行かない予定なので、少し休息を頂いたということで...(^_^;)

授業の課題で、computer vision系の論文を探す。しかし探し方がなかなか難しい...
自分が今少し構想を練っているものと近い論文を探すのがとても大変。何でも良いなら見つかるのだが、統一的にまとめてあるサイトも分からないし国際会議の分野分けもピンと来ないし...英語の壁を感じる。

可視化という視点で考えると、情報の可視化はどの情報からどのようなビジュアルを構成するかが鍵になるように感じている。
その為、データ可視化について論文を探していたのだがこれがなかなか...SIGGRAPHは国際会議なんだか何なんだかよくわからないくらい多岐に渡っているし、ほかの国際会議も有名なところは可視化以外も扱っていて、選べる程たくさんの論文はない。
やっぱりそういう意味では、IEEEのまとめは初学者にはとても探しやすいんだなぁと感じた。

また、特定の分野に強くなってもほかの分野まで強くなった錯覚に陥らないように、自分の自力がとてつもなく強くなったわけではないことを、ちゃんと意識したいなと思った。

情報の可視化は学習と相性が良さそう。人間が無意識下で考慮に入れている情報を特徴として機械学習で抽出して、その結果を可視化してあげればユーザにとって有益になりそうだなーと思った。

てか、研究のアイデアってどこまで書いていいんだろう?Twitterで某高レベル大学院の博士課程の方がアイデアは簡単に晒すものではないと言っていたが、うーん...
書くことで整理にはなるだろうから書きたいけど、書かない方がいいのかなぁ?
しかし改めて研究の界隈は矛盾を孕んでいる業界だなぁと思う。世界がより良くなるように研究をする一方で、特許的な自分がよりよい生活をできるようにする工夫とか欲がある訳で。その両立はある程度偉くなった先生方ならできるかもしれないけど、就職するかも分からない学生には難しい気がする...
なにか明文化された規律や思想が必要なのかな、と思わなくもない

朝帰り

電車に乗って帰宅中なう。夜12時に研究室に来て朝7時に帰る、7時間は研究出来てるからあと3時間くらい確保したい。
本当はこういう生活リズムはよくないんだろうけど、これだと確実に時間を確保できる&この時間の過ごし方がナチュラルなので...どうしたものか...

今日は論文読み3時間と言語処理の為の機械学習1.5時間と実装2時間。
論文はSIGDIAL2015のテーマを知るくらいの読みを6本と、精読ELIZA。英語力やばいなーと思うので春休み中に英語の勉強もしたい...
SIGDIALで読んだのはPOMDPによる強化学習を用いた対話制御が3本と、実世界のインタラクション1本、教育用対話システムの言い換え表現の影響、音声対話の話者交代タイミング1本。いろんなタスクがあるなーと思うと同時に自分の興味とは少し違う方向だなとも感じる。強化学習と部分観測マルコフ過程はやはり一度ちゃんと勉強しないとついていけなさそう。
ELIZAはイントロだけ精読。ここはあまりにも理解が遅くてヤバさを感じる...しかししっかり読んでいきたい。3日くらいでクリアしたい...

言語処理の為の機械学習は最初をさらりと。わかりやすいがヘッセ行列の理解が足りない。大学1年の時の数学を復習しないとダメ。コツコツいこう...あと例題もちゃんとやっていきたい。

実装はdoc2vecの再実装から。なんとなく「これでうまくいってるのか?」と思ってた部分がやっぱり上手くいってなかったみたいで、うーんという感じ。windowsだとPython2.7のメモリ、2GB縛りがあるというのは本当なのだろうか...メモリが沢山使えればたぶん解決する問題だけど、それ以前にこの学習機構はあってるのか?という部分があってなんとも...
Paragraph  vectorはword2vecで生成したそれぞれの単語ベクトルを用いて文のベクトルを生成、学習してたと思っていたんだけど、それにあたる機構がgensimのdoc2vecでは見当たらなくて?になってる。平文から同時に学習してるとしたらそれでいいんだけれども、そんなことは可能なのか?という...
しかも学習済みのword2vecからもモデル生成可能と書いてあるが、それだと平文いらない?みたいになっててうーん...もしかしたら自分の理解がどこか大きなところで間違っているのかも...
同じ研究室でちゃんとdoc2vecを使ってる人がいないので、こういうときノウハウがない.のはすこしつらい...まあ皆そうなんだけども。゚(゚∩´﹏`∩゚)゚。

自己紹介

頑張って書いた下書きが消えて萎えている...
あっさり目にかきます...

この間卒論が終わった学部四年生です。
大学院は同校に進学予定。
情報工学科で、対話システムが専門です。
卒論ではparagraph vectorとRecurrent Neural Networkを用いて対話コーパスから対話システムを構築しました。
うちの大学には(自分の研究室の教授も含めて)対話システムの専門家がいないので、卒論の質疑は特に何事もなく済みました。が、実際はPVの生成もRNNの学習もまだまだ粗が目立つし、システム自体ももっと精錬出来たのではないかなと反省点ばかり...

研究と開発で違うところというのは、どのようにして「評価」するかというところにあるのかなーと今のところ感じている。開発は作りっぱなしでもいいし、そのあとバージョンアップさせていけばまあ、問題ないのかなと思う。
ただ研究は、そのもの自体の質は特に問われていないように感じる。どんなにつまらないタスクや手法を用いても、それで精度が上がる&その精度向上を厳密に観測することがむしろ重要であるように思える。
そういう意味では、大学院に来た以上どれだけきっちりと作ったものと向き合えるかというのが重要であると思える。
なので、卒論はアイデアは結構悪くなかったかなーと自分では思ってたけど、研究としてはまだまだ甘いなと思っています。

もっと厳密にいろいろなことを議論していく&知識をつけることが大切かなと思い、卒論の区切りもあってブログを始めました。
世の中にはいろいろな技術系のブログがあって、環境設定やらプログラミングやらでわからないことがあるとだいたいそのあたりを参照すれば色んなことが出てくる。
それらを目指してるわけではないんですが、まあ備忘録通学時間の暇つぶしとして色々書ければなーと思っています。


2/2の進捗

ELIZAの原著を原著を読もうと思ったんだけど、眠くなるわ英語が古めだわ印刷が薄いわであまり進まず..でも有名な対話例は出てきた。きっと上手くいったやつだけ抽出してるんだろうけども、英語は返答文がニュアンスに依存しないなーと読んでて思った。日本語だと語尾だとか敬語だとかイチイチ気にするけど、英語だとそういうのあんまりないな、
と。
明日くらいまでには読み終わって、まとめたい。

あとは、次のテーマについて悩む。対話にRNNを使おうと思うと、よく考えると情報を保存するのは中間層ではダメなのではないか?通常のRNNだと中間層には入力の情報しか貯まらないが、対話におけるcontextにはたぶん応答文の影響も色濃く反映されるはず。
と、考えると一つ前の応答文を過去情報として反映させれば問題ないのかな...?
それより場の空気をベクトル的な何かで表現してそれ+αの方が良いのかもしれない。

あとは、対話補助的な何があるととても役に立つのではないだろうか。美少女ゲーム含むシミュレーションゲームをやっていると「ここでこんな選択肢が!思いつかねーよ( ¯•ω•¯ )」みたいなことはよくある。そして得てしてそれが正解だったりする。
しかし、対話において正解を示唆するような選択肢候補を表示することのハードルの高さは感じる...(´・_・`)
対話破綻検出が一つの研究分野になるのに、正しい方向性を提示するのは可能なのか...?まあでも、ユーザーが思いつかない方向を提示してあげてユーザーが勝手にハッとなればいいんだから、もしかしたら対話破綻検出よりはハードルが低いのかもしれない。

このことを考える上で、やっぱりシミュレーションゲームをやらないといけないのだろうか...(´・_・`)最近、「俺の彼女が浮気するはずがない」みたいなタイトルのスマホゲームをダウンロードしたんだけれども、怖くてやる勇気が出ない...
浮気してるかもしれない彼女の真実をあばいていく?みたいな感じのゲームなのだが、友達と一緒にちょっとやってみたら選択肢のエグイのなんの...10分くらいやっただけで既に問い詰め過ぎて彼女泣かせてしまったし...(´・_・`)

テキスト対話に対する若者のニーズは、ある種恋愛に集約されるような気もする。恋愛の不文律はホントに初見では厳しいような気がする...

とりあえず、ひとつ人に見せられるものを作ろうと思う。キーワードスポッティングとかトピックモデルも使えるようになりたい。

このブログのはじめには明日書こうっと(っ'ヮ'c)ウゥッヒョオアアァアアアァ