Hadoop開発準備のためのEclipseインストール

前回までで、Hadoopの実行環境の準備ができました。
第一回:Ubuntu10.04でHadoop環境構築(疑似分散編)
第二回:HadoopのHDFS確認とサンプルプログラムの実行
第三回:Pigのインストール


これからいよいよMapReduceを記述して行くのですが、
そのための開発環境を作成していきます。
一番慣れているのでEclipseの設定を行いますが、
もちろんTextEditorでプログラム作成してantでbuildでも問題ありません。

Eclipseのインストール

Synapticでインストール

Eclipseの日本語化

Pleiadeshttp://sourceforge.jp/projects/mergedoc/releases/
上記サイトからD/Lし、適当な場所に解凍しておく
解凍したディレクトリに移動し、以下のコマンド実行

# cp -R features/* /usr/lib/eclipse/features/
# cp -R plugins/* /usr/lib/eclipse/plugins/

/usr/lib/eclipse/eclipse.ini ファイルの修正

 -javaagent:/usr/lib/eclipse/plugins/jp.sourceforge.mergedoc.pleiades/pleiades.jar

の追記

#-showsplash
#org.eclipse.platform

上記二行をコメントアウト

$ eclipse -clean

これで無事日本語化

Eclipseのpluginsを追加

追加するpluginは以下

subversiveのインストールは過去のエントリを参考

hadoop pluginは以下のディレクトリのものを使用
Cloudera’s Distributionには入ってないので、hadoopプロジェクト配布のパッケージから展開
hadoop-0.20.2/contrib/eclipse-plugin
これをplugins配下にコピーした後、Eclipse再起動

$ eclipse -clean

これでpluginが認識され、MapReduceなどのメニューが追加される
Hadoopインストールディレクトリの指定


以上でMapReduce作成とデバッグ環境が揃いました。
実際にデバッグするにはもう少し設定などが必要になります。
次回は、実際にこの環境を使って実装していきます。


私は、Hadoop本と呼ばれるHadoopやってるエンジニア必携の本を食い入るように読み、勉強しました。
このブログを読んで頂いている方から、どのように「習得したら良いか?」と聞かれた時には
この本をお薦めしています。
Hadoop本


この記事を書いた当時には出ていませんでしたが、非常に分かりやすい入門書も出ています。
Hadoop徹底入門




Ubuntuのアップデート・マネージャでEclipseのアップデートを行うのはさけた方が良いようです。
自動アップデートしたためにEclipseのpluginが読み込まれなくなる現象に見舞われました。
eclipse -clean やConfiglationsを削除しても解決せず、
再作成した方が早いと判断してEclipseの再インストールしました。
解決方法をご存知の方、良かったら情報教えてください。