アマゾンで本を探していたら、この本が出てきました。即効で購入!!集合知プログラミング
自然言語処理に限らず、データマイニングやテキストマイニングのことを色々学べそうです。
内容紹介 本書は現在注目を集めている「集合知(collective intelligence)」をテーマにした書籍です。機械学習のアルゴリズムと統計を使ってウェブのユーザが生み出した膨大なデータを分析、解釈する方法を、基礎から分かりやすく解説します。本書で紹介するのは「購入・レンタルした商品の情報を利用した推薦システム」、「膨大なデータから類似したアイテムを発見し、クラスタリングする方法」、「数多くの解決策の中から最適なものを探し出す方法」、「オークションの最終価格を予想する方法」、「カップルになりそうなペアを探す方法」、「遺伝的プログラミング」など。del.icio.us、eBayなどが公開しているWeb APIを使用した解説も本書の大きな特徴です。本書のサンプルコードは可読性に優れたPythonを使用していますが、他の言語のプログラマでも理解しやすいようにアルゴリズムを解説しています。日本語版ではYahoo!日本語形態素解析Webサービスを利用した日本語テキスト処理について加筆しました。
サンプルはPythonだそうですが、アルゴリズムが解れば問題なしです。これを機会にPythonを覚えるのも吉かもしれません。最近、サンプルコードにPythonが増えてきましたしね。本が届いたら、またエントリー書きます。楽しみだなぁ。