(かつてここにAmazonアフィがあったけど該当の本が検索できなくなったため削除した)
PythonのNumPy,SciPyライブラリを使って機械学習を実際に動かしてみるという本。理論よりも実践に重点を置いていて、Pythonの実コードを載せていて、実データを取ってきたりノイズを除去したり特徴量抽出に苦労してみたり結果をすぐにグラフにしてみたり、といった内容になっている。
いわゆる機械学習の理論本はいくつか出ているけど、この本では細かいことはおいておき実際に動かしてみるのが最大の特徴と思う。その反面、Numpy,SciPyに全面的に依存しているので、処理速度を改善したり新しいアルゴリズムを実装したり、といったことまでは期待できない。比較的簡単とはいえ、ライブラリのBindingを最大限使うのでPythonに慣れている人向け。とはいえ、これの類似本もなかなかないと思うので、慣れてない人がPythonに我慢しながら読むのもあり。
扱っている内容は比較的幅広く、最近傍法・TFIDF・K-Means・LDA(Latent Dirichlet Allocation)・k近傍法・ロジスティック回帰・ナイーブベイズ・アソシエーションルール・FFT(音楽の周波数分析)などとなっている。コンピュータビジョンや次元削減の話もあるけどさすがに内容が不足しすぎに思う。最後の12章の「ビッグデータ」なんて、著者が作ってるjugの紹介とAmazon EC2を試してみる、だけの内容でさすがにそれだけなのはどうなんよと・・・
実際に動かしてみるところまでフォローしているので、コンピュータサイエンス方面の学生が試してみるにはちょうどよい本。反面、この手の話のバックグラウンドが全くない人が読むにはちょっとつらいかなぁ。あと、NumPy,SciPyに全面的に頼っているので、あまり将来にわたって読まれる本という感じにはならないと思う。