30分で理解する自然言語処理　まとめ

今まで何本か日本語処理のエントリーを書いてきました。後で振り返り易いように、ここらで一覧にまとめておきます。

　　コーパスとして、wikipediaの存在はありがたいです。まずはここから始めるのが良いですね。併せて紹介しているxml2sqlも秀逸です。

　　あれこれと言いつつ形態素解析とYahoo APIを使った特徴語抽出のみを紹介しています。手軽に出来るのが魅力です。

　　Algorithm::NaiveBayesの使い方を簡単なサンプルで紹介いたしました。割と好評です。ベイジアンフィルターの人気の高さを垣間みれますね。

　　TermExtractという専門語抽出モジュールの紹介です。TermExtractはもっと評価されても良いモジュールだと思います。

　　万能形態素解析器MeCabを使ってキーワード抽出です。

　　お手軽要約です。ぜひ、ソースコードを読んでみましょう

　　Version 0.60-pre2を入れてみました。

MeCabの内部の世界です。

書籍紹介

　　読み始め30分のメモ

これからもっと勉強して試したい分野です。リストには随時追加していきます。

プログラマでありたい