読者です 読者をやめる 読者になる 読者になる

プログラマでありたい

おっさんになっても、プログラマでありつづけたい

Mahoutのセットアップ

データ分析

 Mahoutを使う場合のEclipseの設定メモです。mahout-core.jarが配布されていないため、自前でビルドする必要があります。

coreプロジェクトの設定

Eclipseでプロジェクト作成
SVN->SVNからのプロジェクト
http://svn.apache.org/repos/asf/lucene/mahout/
trunk/core
 チェックアウト後に、Javaプロジェクトと構築すればおっけいです。 JDKは、1.6以上を選ぶ必要があります。
プロジェクトの用意が出来たら、まずpom.xmlを編集します。元々の構成だと、親プロジェクトがある前提になっております。これでも良いのですが、欲しいのはcore部分だけなので以下の部分をさくっと消してしまいます。併せて、参照ライブラリのバージョン指定を追加します。

<!--
  <parent>
    <groupId>org.apache.mahout</groupId>
    <artifactId>mahout-parent</artifactId>
    <version>1.0</version>
    <relativePath>../maven</relativePath>
  </parent>
-->
  <properties>
  	  <hadoop.version>0.20.0</hadoop.version>
  	  <watchmaker.version>0.5.0</watchmaker.version>
  	  <kfs.version>0.2.2</kfs.version>
  	  <jets3t.version>0.6.1</jets3t.version>
  	  <xmlenc.version>0.52</xmlenc.version>
  </properties>

その後Mavenの管理下において、Maven Updateを行いましょう。そうすると必要なモジュールのダウンロードが始まると同時に、ビルドパスの設定も行われます。下記、4つのパスが設定されるはずです。

src/main/java/
src/main/resources
src/test/java/
src/test/resources

参照プロジェクトの設定

 次はMahoutを呼び出して、自分のプログラムを動かすプロジェクトを作りましょう。
これは、動的Webプロジェクトでも単なるJavaプロジェクトでも何でも良いです。作りたい物を作りましょう。
プロジェクト作成後に参照プロジェクトとして、先ほど作成したcoreを追加すればおっけいです。
(まぁ、単純にmahout-core.jarとして配布して貰えれば楽なんですが、見つからないので)


後は、mahoutのクラスを呼び出してお好きな物を作って下さい。 enjoy!!