大学生 → 社会人の雑記

統計学や機械学習について気紛れにメモメモするブログです。ゆるふわな感じでやっています。

大学生活を簡単に振り返る

国立の合格発表も終わって、いよいよ大学生という人もいれば、大学生活はまた来年にお預けという人もいるでしょう。

ひとまずお疲れ様でした。

さて、上記いずれの人にも大学生活がどんなものであったか参考になればなと思い、この記事を書くことにしました。

いたって普通の、少しだけ意欲のあった大学生の記録とでも思ってくれればいいです。
細かいことまで書き出すと果てしない分量になりそうなので簡潔に書いていこうと思います。

1年生


まず、入学した当初はあまり意欲的ではありませんでした。

いや、遊ぼうとかそういうのではなく、ちゃんと(?)経営システム工学が楽しそうだから大学に入ったのですが、楽しければいいやという感じでした。なんとなく経営システム工学の考え方の一端に触れられれば御の字かなと考えていたのが正直なところです。

嫌いな講義はよくサボっていましたし、嫌いじゃない授業も講義こそちゃんと聞いていましたが、復習もしなければテスト勉強もしませんでした。
1年時の授業は基礎科目が多くてすごく退屈しました。もちろんこの先あらゆる応用で必要になるからなのですが、それを痛感するのは2年時以降で、僕は勉強し直すことになるのでした。

それでもフル単(49単位でGPAは2.6ぐらい※GPAはmax 4の評定平均だと思ってokです)で、まあこんなもんだろと思っていました。

1年生を終えての純粋な感想は「数学の授業多すぎね?」でした。経営システム工学科に入る人は頑張りましょう。思っているよりも数学の授業がずっと多いです。


ところで大学にはサークルというものが存在するのですが、僕はそれには入りませんでした。しかし、草野球を地元で毎週いろんなチームでやっていたため(今も続けてます)、まあサークル活動をしていたようなものですかね。少し違うのは幅広い年齢層(中には80歳超えの人もいる)と幅広い職の人と一緒にやったということぐらいでしょうか。だから草野球の方がいいぜという意味ではなく、まあそういう世界もあるんだな程度に思っていただければ嬉しいです。

また、成人式の実行委員を市の方からお願いされたため、これを務めていました。これも楽しかったですね。これについては機会があれば書きたいと思います。


たくさん書いてもあれなのでここで1年時をまとめると

『授業だけ真面目に聞いていただけの、あとはそこらへんにいる量産型』

というような感じになるんじゃないかな。



2年生


1年生を終えてなんとなく「短くない時間と高いお金を払ってるのに得たものが少ないのは、なんだかとっても虚しいな」という気持ちになりました。

幅広い分野をカバーする経営システム工学の中でも、1つぐらいは高い専門性を身につけておくかということで、1年生の時の講義でなんとなく面白かった『統計学』をちゃんと勉強することにしました。

ちゃんと勉強するといっても、当時はテスト勉強もしない有様だったので、授業を受けて復習もするという、ただそれだけの事を「ちゃんと勉強する」ということだと思っていました(ちょっと読みにくくてすみません)。


すると不思議なもんで、他の科目もちゃんと勉強しようという気持ちになるんですね。

1年生のときと違って専門科目の割合が高くなったのも一因だと思われますが(そもそもは経営システム工学に興味があって大学に入学したので)、別に適当でいいかというようなものもなんとなくちゃんと勉強していました。

また、経営システム工学の諸分野では統計的手法があちこちで出て来るので、そういう統計的な部分はちゃんとやろうという気持ちになったのも一因だと思います。


ところが授業をちゃんと聞いているのにあまりついていけなくなっていました。

やる気はそこそこあるのに付いていけない。

所々でよくわからない変形をする式が、何でその形になったのかを調べてるうちに授業は次へ〜次へ〜と進んでいきました。

もうどうにもならんということで1年生の復習をしてやっと授業中に「うんうん」と話がわかるようになりました。


そんなこんなで2年生時のGPAは3.4と、1年生の時よりも大きく向上しました。

2年次をまとめると

『授業で教わったことは理解している、いわゆる量産機の高機動型』

といったところでしょうか。






3年生


「大学での勉強だけでいいのかな?自分が理解できるということは世の中の大半もできそうだしなあ…大学でしかできないことってなんだろう?遊ぶってのは社会人になってからもできそうだし…そうだ!大学でしかできないことといえば、なんにも気にしないでいつまでも寝ていられることと、なんにも気にしないで勉強できることだ」

という気持ちになり、最も興味のあった統計学については、授業外の範囲についても自分で勉強してみようということにしました。


ただ、何をやっていいのかさっぱりわからなかったので、統計検定というものを受けることにしました。

何でもいいからある程度勉強に方向性を持たせてくれるものが欲しかったというだけで、別に合否はあまり気にしないでいこうと考えていました。このあたりの話は

mark-n.hatenablog.com

にも書いたので割愛します。


また自然科学の統計学(いわゆる青本です)を読んで、線形代数が全くわからないと感じたため、線形代数を再び勉強し直したりもしました。

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

それと測度論に挑戦して木端微塵になったり、カーネル法の勉強して木端微塵とまではいかなくてもわけがわならなかったり、ベイズ統計というものがあるとしったりもしました。


この1年は統計学というより、好きなことを好きに自学習するという、それ自体のやり方を学んだ1年だったと思います。

これはどうでも良いことのように見えて、とても難しいことだったと思います。それまでは与えられたことを自由なやり方(人にやり方を縛られるのが嫌いだったので…)で勉強してきましたが、

何を勉強するのか?
なんで勉強するのか?
どのレベルまで持っていくのか?
どこまで掘り下げる?
前提知識は大丈夫?
どの参考書を使うの?
信頼できる情報源は?
どうやって正しいと判断するの?
飛ばしてもいいページは?
絶対にスルーできない項目は?
わからなかったときどうする?
質問する相手は?
質問の仕方は?

パッと思いつくだけでもこれだけの要素が出てきます。細かく考えればもっともっと出てくると思いますが、とにかく真に自分で勉強するというのは実は難しいことなんだなと知りました。



授業はというと年次を重ねるごとに「簡単だなあ〜」と感じるようになり、授業に対する負荷がどんどん減っていきました。

経営システム工学のような応用科学では、基礎がある程度固まっていれば、授業でやる程度のレベルのことを理解すること自体はそれほど難しいことではないというのが4年間での印象です。

ほとんどの科目の基本にある考え方は、言われてみればどれも当たり前のことです。
また方法こそ科学的ですが、適用対象は社会なのでイメージもつけやすいです。

ちなみに3年時のGPAは3.8でした。
まあこの数字は裏を返せば、それほど難しいことはやらないということなのですが、それでも有効なことをたくさん学びます。きっと就職してからの強力な武器になるでしょう。なってほしい。なってくれ。


また、就活は爆速で終わりました。
2月に内定2社、3月に内定3社の合計5社(落ちたのは0)内定を頂きました。また、向こうからアポとってきたりと不思議な体験もしました。
ちなみに内定を頂いたのは大手4の中小1です。アポとってきたのは大手です。さらにちなむといずれの大手も誰もが知っている会社です。


なんかいろんな人に食事やお酒の席に連れて行ってもらったな〜
就活自体は結構楽しかったですよ。
あと経営システム工学は就活最強だなと思いましたね。今世間が注目しているキーワードのてんこ盛り学科ですからね。クソポンコツでも○✕センチ◯アとかnmr◯研とかです(伏せ過ぎか?)。


例にならって3年次をまとめると

『学問というものに興味を持ちはじめて、それなりにちゃんとした訓練を積み始めた、将来有望そうな(そうなってのが大事)意欲ある学生』

という感じでしょうか。




4年生


希望通り応用統計学研究室に配属されました。
授業はほとんどなく、ほぼ毎日研究室にいました。最初の方は研究テーマを探しつつ、機械学習の勉強をしていました。

mark-n.hatenablog.com

他にもMCMC(これも機械学習か?)とか確率過程とかも勉強していました。

少しずつ論文も読めるようになってきたのもこの時期かな。カステラ本でよくわからなかったところを論文で確かめるということをやっていたら、少しずつ読めるようになってきたんだった気がします。


自分の話じゃないけど就活に関して少し言うと、普通の人は3年の3月から就活を始めて、だいたい5,6月には内定がばーっと出ていた感じだったかな。この先どうなるかわからないけど、他の人を見て焦る必要はないなと思いましたね。


話を戻します。

結局、研究テーマは機械学習じゃなくてロバスト統計学になったんだけれども、これが先生に上手く乗せられてしまい、理論研究になってしまった…

理論研究は難しいのです。経営システム工学のような応用を扱う分野の学生にとっては、特に難しいとかんじられました。
定理を作っても証明があってるかいつまでたっても自信が持てないし(たぶん3,40回は検討し直して書き直してる)、しかも自分の作った推定量は望ましい性質を持っていなくて、(こういう書き方は良くないかもしれないけど)修正法まで考えなきゃいけないハメになりました。

研究というものの難しさや、楽しさ、研究者はどういった発想をしているのか、どのようにストーリーを組み立てたり論文をまとめたりしているのか、いろんな定石等々…
私は他の人に比べて割と手厚い指導を受けられたので、色々なことを学ぶことができました。

とても難しかったけど、ちょこっと苦労したに見合った相応の力が付いたと思います。

学校にも何回か泊まったりして、意外といい思い出になっています。

ちなみに4年時のGPAは4でした。

そんなわけで卒業も確定して、今は布団の中で過ごしている毎日です。




最後に

社会人から「遊べるのは大学生のうちだけ、今のうちに遊んでおくのが一番いいと思うよ」とよく言われると思います。僕はよく言われました。

挙句の果には、遊ぶだけの毎日の比喩として「大学生は人生の夏休み」とまで言う人もいる始末です。

実際は社会人になってからの方が遊べるというのが事実だろうと思います。なんせお金がたくさんもらえますから。とはいうものの家庭を持ったら話は変わってきますが(両親を見て)…

じゃあ大学生のうちにしかできないことってなんだろう?という話になります。

先にも述べましたが、私は主に次の2つだと思っています。

ひとつ目は、いつまでもたっぷり布団で寝ていられること。これはたしかに社会人になってからはできませんよね。なんにも考えないで布団の中でぬくぬくと眠る。こんな幸せがありますか!?

そしてふたつ目は、勉学に好きなだけ励むこと。好きなだけというのは0も含めるし、限界までというのも含める、文字通りの好きなだけです。
大学には個人では到底整えられない環境が整っています。高価で最新の設備が何種類もあり、図書室は使い放題でそのへんにはない本が揃っているし、ジャーナルにはアクセスし放題だし、最先端の研究をしている先生達がたくさんいらっしゃいます。

勉学に全く打ち込まないのも悪くないと思います。否定するつもりは毛頭ありません。しかし、僕個人としては勉学に励んだ方が賢い選択をしていると思うのです。


僕はアルバイトで塾講師を勤めていたのですが、生徒に大学がどんな場所かを例える時に、よくバイキングのようなものという表現をしていました。

バイキングに行って何も食べずにおしゃべりだけして帰るというのも悪くないし、限界まで食べて気持ち悪くなったり苦しい思いをするのも悪くないです。ただし人が食べているのを邪魔するのは、度を越えた礼儀知らずだというものでしょう。

私なら満足するまで適度に、ちょこっとだけ欲張って食べるでしょう。おしゃべりも楽しむと思います。

制限時間が来て会計をする時に満足していることが何より大切だと思います。





そういえば

そういえば私は4年間塾講師のアルバイトをしていたと言いましたが、そこで面白い体験をしました。

中学3年生の時から教えていた生徒が大学生になり、なんとアルバイトとして入ってきたのです。しかも2人も。

教え子、しかもJCの時から知っている生徒が同僚になったんですよ?

とても不思議な感覚でした。

と同時に私が教えていた子が、私と同じことをやろうと思ってくれたことがとても嬉しかったですね。

大袈裟な表現ですが、なんだか報われた気がしました。

機械学習を初めて勉強した人が読んだ本(2018年に勉強した本)

2018年も残り僅かとなりました。

 

1年の振り返りという意味も込めて、今年1年間に読んだ本を紹介していきたいと思います。

今年は主に、というかほぼずっと機械学習の勉強をしていました。これから勉強を始めたいという人の助けになれば幸いです。

 

 

1.統計的学習の基礎

 

統計的学習の基礎 ―データマイニング・推論・予測―

統計的学習の基礎 ―データマイニング・推論・予測―

  • 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
  • 出版社/メーカー: 共立出版
  • 発売日: 2014/06/25
  • メディア: 単行本
  • この商品を含むブログ (6件) を見る
 

 

言わずと知れた名著です。

正直結構しんどかったです。しかし、そのキツさに見合うだけの力はしっかりと付いてくれました。

読み終えての感想はここにまとめていますので、参考程度にどうぞ。

 

mark-n.hatenablog.com

 

機械学習について全く知識がなかった僕にとって、1冊やり終えた時の力は、始める前に比べて桁違いに上がりました(もともとの力がなさすぎたというのもありますが…)

大学教養程度の数学ができれば(単位が取れていれば)、あとはわからない所が出てくるたびに随時勉強することで、なんとか読み終えることができるので屈せずに頑張りましょう。

 

上の記事にも書いてありますが、おおよそ

7h/day × 90day = 630 h

ほどで完了しましたかね(もう少しかかったかも)。

これが長いのか短いのかはわかりませんが、誰かの参考になればなと思います。

 

 

 

 

 

2.PRML

 

 

パターン認識と機械学習 上

パターン認識と機械学習 上

 
パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

 

 

こちらも言わずと知れた名著です。

読んだといっても全部読んだわけではなく、カステラ本(統計的学習の基礎)でわかりにくかったところを参考にした程度で、本格的には卒論が書き終わってから読もうと思っています。

 

カステラ本、PRML共にストーリーがわかりやすいのが特徴です。

(個人的にカステラ本のランダムフォレストを導入するところが好きです。)

 

カステラ本の参考としてPRMLを使ったのは、主にEMアルゴリズムの章です。これはストーリーがめちゃくちゃわかりやすく、読んでいてとてもワクワクします。PRML全体を読まないにしても、EMアルゴリズムの章だけは読んでみてください。きっと私の言っている意味がわかると思います。

 

また、ついでにグラフィカルとか隠れマルコフとかも読みましたが、長くなるのでここでは割愛します(内容はとても面白いですよ!)。

 

また、上巻も線形モデルの章までは読んでいますが、卒業研究に専念することにしたため、現在停止中です。

 

途中まで読んでみた感想は、いやね、もうね、ベイベイベイズですわ。これぞベイズの威力を知るのに探し求めていた本だと思いましたね。

 

しかし、読むのはとてもツライです。何がツラいのかというと、まるで呼吸をするかのようにベクトルや行列で微分を始めるんですね。

1年時に授業でやる線形代数程度の知識しかなかった私にはとてもとてもツラい。必要に応じて一生懸命行列の微分も勉強しているという感じです。

(一度ちゃんと勉強した方がいいね)

 

ただ、インターネットで検索すれば、過去に頑張って読んだ人達の資料がヒットするので、サポートと言ったら変ですが、このあたりはとても充実しています。これはカステラ本との大きな違いですね!

ちなみにこんなのもあります。めっちゃわかりやすい。めっちゃ安い。(無料でpdf版も拾えるようです。むしろpdf版の方が本物なのかな?)

 

パターン認識と機械学習の学習―ベイズ理論に負けないための数学
 

 

 

 

 

 

3.Rで楽しむベイズ統計入門

 

Rで楽しむベイズ統計入門[しくみから理解するベイズ推定の基礎] (Data Science Library)
 

 

ベイズというのを勉強してみたいなあと思っていた頃に発売されたので購入しました。

あまり他では見ない説明の仕方をしていて面白かったです。しかもわかりやすい!

難しいことは書いてありませんが、基本的なことがわかりやすい語り口とストーリーで書かれているのでベイズの1冊目、あるいは2冊目としてオススメです。

 

 

 

 

 

4.StanとRでベイズ統計モデリング

 

StanとRでベイズ統計モデリング (Wonderful R)
 

 

これは言わずもがなですかね。手元に置いて何度でも確認したい1冊です。モデリングについて、これでもか!ってぐらい書いてあります。

読んでからしばらく経ってしまった&モデリングをする機会がなかったのでもう1回読み直さないとですね。これについては他の方がもっと良い紹介をしているのでこのあたりに留めます。

 

 

 

 

 

5.Robust Statistics:Theory and Methods

 

Robust Statistics: Theory and Methods (Wiley Series in Probability and Statistics)

Robust Statistics: Theory and Methods (Wiley Series in Probability and Statistics)

 

 

現在、ロバスト統計学を勉強している真っ只中なため読んでいる本です。洋書ですがわかりやすいです。(なぜ日本語訳されないのか…)

いまいちわからない場合は、元の論文を読んでみることもオススメです。元の論文を読んだのはMM推定とかS推定(これは論文じゃなくて解説だったかも)とかであまりたくさんは読んでいませんが、Yohaiの論文は読みやすい気がします。

 

ロバスト統計は言われれば「まあそりゃそうだろ」となりますが、じゃあって自分で考えると何も思い浮かばないとても不思議な印象です。

簡単なことにもとても複雑なことをやったりします。煩わしいなという印象を抱く人も多いんじゃないですかね〜。

 

 

 

 

 

6.ロバスト統計

 

ロバスト統計: 外れ値への対処の仕方 (ISMシリーズ:進化する統計数理)
 

 

半分程度は上の「Robust Statistics:Theory and Methods」をわかりやすくした感じです。

難しいことを適当に誤魔化したり、はぐらかしたりしないで、ちゃんと一言入れてから省略したりするので好印象です。

発想等がとてもわかりやすいのでオススメです。

 

 

 

 

 

7.その他

 

他にも読んだのはあるのですが、つまみ食いしているものが多く、とてもじゃないけど〇〇読みましたと言えるほどではありません。紹介だけしますね。

 

 

これからの強化学習

これからの強化学習

  • 作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉本徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森本淳,保田俊行,吉本潤一郎
  • 出版社/メーカー: 森北出版
  • 発売日: 2016/10/27
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (3件) を見る
 

 

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

 

 

 

数理統計学の基礎

数理統計学の基礎

 

 

 

 

 

頑健回帰推定 (統計ライブラリー)

頑健回帰推定 (統計ライブラリー)

 

 

 

 

 

まとめ

 

こうしてみると機械学習に関するものがほとんどですね。勉強したもの自体は他にもあるのですが(例えばMCMCたくさんとか)、今年1年の成果は概してこんな感じですね。

 

本当は「カステラ本さえ読み終えれば御の字かな」と思っていたので大健闘です。就活が早く終わって4月から丸々使えたのが大きかったですかね。

 

昨年とは見違えるほど力がついたので結構満足しています。でもやり残したことはないかと問われればそんなこともないです。夏ぐらいにやりたくなったものがたくさん湧いてきたので(後半に紹介したやつとか)、それは来年のお楽しみですかね。まあとりあえず、今年に入ってからの目標はクリアしたということで!