大学生 → 社会人の雑記

統計学や機械学習について気紛れにメモメモするブログです。ゆるふわな感じでやっています。

機械学習を初めて勉強した人が読んだ本(2018年に勉強した本)

2018年も残り僅かとなりました。

 

1年の振り返りという意味も込めて、今年1年間に読んだ本を紹介していきたいと思います。

今年は主に、というかほぼずっと機械学習の勉強をしていました。これから勉強を始めたいという人の助けになれば幸いです。

 

 

1.統計的学習の基礎

 

統計的学習の基礎 ―データマイニング・推論・予測―

統計的学習の基礎 ―データマイニング・推論・予測―

  • 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
  • 出版社/メーカー: 共立出版
  • 発売日: 2014/06/25
  • メディア: 単行本
  • この商品を含むブログ (6件) を見る
 

 

言わずと知れた名著です。

正直結構しんどかったです。しかし、そのキツさに見合うだけの力はしっかりと付いてくれました。

読み終えての感想はここにまとめていますので、参考程度にどうぞ。

 

mark-n.hatenablog.com

 

機械学習について全く知識がなかった僕にとって、1冊やり終えた時の力は、始める前に比べて桁違いに上がりました(もともとの力がなさすぎたというのもありますが…)

大学教養程度の数学ができれば(単位が取れていれば)、あとはわからない所が出てくるたびに随時勉強することで、なんとか読み終えることができるので屈せずに頑張りましょう。

 

上の記事にも書いてありますが、おおよそ

7h/day × 90day = 630 h

ほどで完了しましたかね(もう少しかかったかも)。

これが長いのか短いのかはわかりませんが、誰かの参考になればなと思います。

 

 

 

 

 

2.PRML

 

 

パターン認識と機械学習 上

パターン認識と機械学習 上

 
パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

 

 

こちらも言わずと知れた名著です。

読んだといっても全部読んだわけではなく、カステラ本(統計的学習の基礎)でわかりにくかったところを参考にした程度で、本格的には卒論が書き終わってから読もうと思っています。

 

カステラ本、PRML共にストーリーがわかりやすいのが特徴です。

(個人的にカステラ本のランダムフォレストを導入するところが好きです。)

 

カステラ本の参考としてPRMLを使ったのは、主にEMアルゴリズムの章です。これはストーリーがめちゃくちゃわかりやすく、読んでいてとてもワクワクします。PRML全体を読まないにしても、EMアルゴリズムの章だけは読んでみてください。きっと私の言っている意味がわかると思います。

 

また、ついでにグラフィカルとか隠れマルコフとかも読みましたが、長くなるのでここでは割愛します(内容はとても面白いですよ!)。

 

また、上巻も線形モデルの章までは読んでいますが、卒業研究に専念することにしたため、現在停止中です。

 

途中まで読んでみた感想は、いやね、もうね、ベイベイベイズですわ。これぞベイズの威力を知るのに探し求めていた本だと思いましたね。

 

しかし、読むのはとてもツライです。何がツラいのかというと、まるで呼吸をするかのようにベクトルや行列で微分を始めるんですね。

1年時に授業でやる線形代数程度の知識しかなかった私にはとてもとてもツラい。必要に応じて一生懸命行列の微分も勉強しているという感じです。

(一度ちゃんと勉強した方がいいね)

 

ただ、インターネットで検索すれば、過去に頑張って読んだ人達の資料がヒットするので、サポートと言ったら変ですが、このあたりはとても充実しています。これはカステラ本との大きな違いですね!

ちなみにこんなのもあります。めっちゃわかりやすい。めっちゃ安い。(無料でpdf版も拾えるようです。むしろpdf版の方が本物なのかな?)

 

パターン認識と機械学習の学習―ベイズ理論に負けないための数学
 

 

 

 

 

 

3.Rで楽しむベイズ統計入門

 

Rで楽しむベイズ統計入門[しくみから理解するベイズ推定の基礎] (Data Science Library)
 

 

ベイズというのを勉強してみたいなあと思っていた頃に発売されたので購入しました。

あまり他では見ない説明の仕方をしていて面白かったです。しかもわかりやすい!

難しいことは書いてありませんが、基本的なことがわかりやすい語り口とストーリーで書かれているのでベイズの1冊目、あるいは2冊目としてオススメです。

 

 

 

 

 

4.StanとRでベイズ統計モデリング

 

StanとRでベイズ統計モデリング (Wonderful R)
 

 

これは言わずもがなですかね。手元に置いて何度でも確認したい1冊です。モデリングについて、これでもか!ってぐらい書いてあります。

読んでからしばらく経ってしまった&モデリングをする機会がなかったのでもう1回読み直さないとですね。これについては他の方がもっと良い紹介をしているのでこのあたりに留めます。

 

 

 

 

 

5.Robust Statistics:Theory and Methods

 

Robust Statistics: Theory and Methods (Wiley Series in Probability and Statistics)

Robust Statistics: Theory and Methods (Wiley Series in Probability and Statistics)

 

 

現在、ロバスト統計学を勉強している真っ只中なため読んでいる本です。洋書ですがわかりやすいです。(なぜ日本語訳されないのか…)

いまいちわからない場合は、元の論文を読んでみることもオススメです。元の論文を読んだのはMM推定とかS推定(これは論文じゃなくて解説だったかも)とかであまりたくさんは読んでいませんが、Yohaiの論文は読みやすい気がします。

 

ロバスト統計は言われれば「まあそりゃそうだろ」となりますが、じゃあって自分で考えると何も思い浮かばないとても不思議な印象です。

簡単なことにもとても複雑なことをやったりします。煩わしいなという印象を抱く人も多いんじゃないですかね〜。

 

 

 

 

 

6.ロバスト統計

 

ロバスト統計: 外れ値への対処の仕方 (ISMシリーズ:進化する統計数理)
 

 

半分程度は上の「Robust Statistics:Theory and Methods」をわかりやすくした感じです。

難しいことを適当に誤魔化したり、はぐらかしたりしないで、ちゃんと一言入れてから省略したりするので好印象です。

発想等がとてもわかりやすいのでオススメです。

 

 

 

 

 

7.その他

 

他にも読んだのはあるのですが、つまみ食いしているものが多く、とてもじゃないけど〇〇読みましたと言えるほどではありません。紹介だけしますね。

 

 

これからの強化学習

これからの強化学習

  • 作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉本徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森本淳,保田俊行,吉本潤一郎
  • 出版社/メーカー: 森北出版
  • 発売日: 2016/10/27
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (3件) を見る
 

 

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

 

 

 

数理統計学の基礎

数理統計学の基礎

 

 

 

 

 

頑健回帰推定 (統計ライブラリー)

頑健回帰推定 (統計ライブラリー)

 

 

 

 

 

まとめ

 

こうしてみると機械学習に関するものがほとんどですね。勉強したもの自体は他にもあるのですが(例えばMCMCたくさんとか)、今年1年の成果は概してこんな感じですね。

 

本当は「カステラ本さえ読み終えれば御の字かな」と思っていたので大健闘です。就活が早く終わって4月から丸々使えたのが大きかったですかね。

 

昨年とは見違えるほど力がついたので結構満足しています。でもやり残したことはないかと問われればそんなこともないです。夏ぐらいにやりたくなったものがたくさん湧いてきたので(後半に紹介したやつとか)、それは来年のお楽しみですかね。まあとりあえず、今年に入ってからの目標はクリアしたということで!