読者です 読者をやめる 読者になる 読者になる

プログラマでありたい

おっさんになっても、プログラマでありつづけたい

ヤフー「つぶやき感情分析」で、衆議院議員の人気度を見る

ネットを見てると、面白いサービスが出ていました。 ヤフー株式会社は12日、ソーシャルメディア上の投稿を検索できるYahoo!検索の「リアルタイム検索」において、「つぶやき感情分析」の正式版を公開した。 つぶやき感情分析は、Twitter上の投稿を分析し、検…

普通の人の為のパスワード運用の話

ID,Passwordの漏洩・アカウントハッキングなど、インターネットの世界も物騒になってきました。Yahooを始め身近なサービスの利用者も被害が出ているので、一般の方々でもID,Passwordの運用を考える必要が出て来ました。ここで言う一般の方々は、GmailやYahoo…

Macのディスク使用状況を可視化するユーティリティ GrandPerspective

以前、Windowsのディスク使用状況を可視化するユーティリティを紹介しました。Mac版もないかなぁと探してみたら、ほぼ同一のモノがありました。その名もGrandPerspective。使い方は簡単で、ダウンロード後にFile -> Scan Folderを押して、調べたい所を指定す…

Pivotal Tracker cloneのFulcrumを、Herokuにインストールする話

Pivotal Trackerというアジャイル開発を手助けしてくれるツールがあります。シンプルかつ軽快なUIで、気持よくタスク管理が出来る優れたツールです。(詳しくはここをご参照ください。) SaaS形式で提供されていて、クレジットカード一つですぐ始められると…

MongoDBを入れてみた

必要に迫られて、CentOS 5.4にMongoDBを入れてみました。 # yum install mongodb-server mongodb-devel # /etc/init.d/mongod start Starting mongod:[ OK ] 接続してみると、エラー。 #mongo Sun Jun 26 21:53:49 *** warning: spider monkey build without…

必ずスパムと判定されるメールと、ウィルスの作り方

メール本文中に下記の文字列をいれると、対応しているスパムフィルターはそのメールをスパムとして判定されます。このコードは、GTUBE(Generic Test for Unsolicited Bulk Email)と呼ばれ、テスト用のコードです。 XJS*C4JDBQADN1.NSBN3*2IDNEN*GTUBE-STANDA…

アプリ開発者から見たAndroidとiPhone

未来の自分へのメモがてらに、アプリ開発者目線から見たAndroidプラットフォームとiOSプラットフォームについて。私の両プラットフォームの経験は次のとおりです。 同等の開発経験をしていないので、多分に憶測も含まれます。 ・iOSアプリについては何点か開…

Webのフロントエンドのボトルネックを探るなら、FireBug+YSlowで決まり

WEB+DB PRESS Vol.59を読んでいたら、Webサイトのフロントエンドの高速化の特集でした。なるほどと思うことも多々あるので、Webサイトの制作に携わる人は一度は読んでおいたほうが良いといえる内容です。特にJavaScriptの遅延ロードやCSSの呼ばれ方などを考…

RubyとCassandraの連携のサンプルプログラム

先日インストールしたCassandraを、Rubyから使ってみようと思います。 gemで用意されているのかなと期待したら、やっぱりありました。幸せ インストール # gem install cassandra 中略 Installing RDoc documentation for thrift_client-0.4.2... Installing…

Apache Cassandraのインストール

ちょこちょこっとCouchDBを触ってみたことがあるのですが、どうやらオープンソースの分散DBはCassandra中心で回りそうなのでそっちを使ってみることにしました。ということで、お約束のインストールメモです。 環境 Cent-OS5.4 (Amazon EC2上のrightscale-us…

週末プログラマにお薦め!!Subversion+DropBoxで似非分散型バージョン管理

※Git版も書いています。 Git+DropBoxで、プライベートリポジトリ作成。或いはGitをAmazon S3でバックアップ 週末プログラマの悩みに、バージョン管理のリポジトリをどこに置くかというのがあります。理想を言えばどこかのサーバーにおいて、HTTP経由でどこか…

PHPの警告で見る、にわかPHPプログラマの不遇

環境の都合でちろっとPHPのプログラムを書きました。私のPHPの記述レベルは素人に毛が生えた程度なので、ググリながらやっています。で、ある値をGETで受け取って処理するというよくあるパターンの記述をしていると、下記のような警告が出ました。GETのパラ…

位置参照情報データと郵便番号データのマッチング

以前、郵便番号データに緯度経度を付加する手順を書きました。Google Mapsと郵便番号データを利用することで生成してたのですが、別のアプローチで作る方法がありました。ずばり位置参照情報データというのがあったので、それと郵便番号データをマッチングす…

TortoiseGitのインストールと日本語化

WindowsでGitを使いたかったのでTortoiseGitを入れてみました。 特に悩む所はないですが、メモがてらのエントリーです。 まず最初にmsysgitのインストール。 exeをダウンロードして、起動するだけの簡単なお仕事です。 インストール完了後に、パスを通します…

CouchDBのインストールと簡単な使い方

インストール MacPortの準備をしていれば、簡単にインストール出来ます。 sudo port selfupdate sudo port install spidermonkey sudo port install icu sudo port install erlang sudo port install couchdb +server sudo chown -R couchdb:couchdb /opt/lo…

中島聡さんの珠玉のアーキテクチャ論まとめ

サービスのアーキテクチャを考える上で、スケーラビリティを考えることは必須となります。いつも参考にさせて貰っているのが中島聡さんのアーキテクチャ論。まだ自分が作る上で実践出来ていない部分も多いですが、今後も取り入れていこうと思います。自分用…

無料でVMware Playerのイメージを作る方法

Windowsの開発環境が必要になったので、VMWare上に作ることにしました。VMWare Playerは無料で配布されているのですが、ゲストOSを作るにはVMWare Workstationが必要になります。しかし、実はツールを使ってVMWareのディスクイメージを作ってしまえば、VMWar…

サイボウズの予定を、Googleカレンダーを使ってiPhoneのカレンダーと同期する

仕事のスケジュール管理は、サイボウズを使用しています。またプライベートのスケジュールはGoogleカレンダーを使っています。そして普段持ち歩いているのはiPhoneです。スケジュールをiPhoneで一本化して見たいなぁと思って試行錯誤してみました。幾つか方…

アジャイルな開発を支えるツールとマシンパワー

最近、現場レベルだと当たり前のようにアジャイルな開発が導入されてきていると思います。要因としては色々あると思いますが、開発ツールの進化と個々人のマシンパワーが強力になってきたのも見過ごせないと思います。 JavaでのWeb開発を例にすると、一昔前…

これ作りたい

iPhoneでバックエンドアプリが許可されるようになったらGPSロガーを作りたいなぁ。定期的に位置情報を取得して、サーバに送り続けるだけ。その情報があれば、後は色々なサービスに応用出来るかと。

Google App Engineの始め方

八角研究所 : 誰でも簡単にできる Twitter ボット作成入門を読んでいて、Twitter botを作ってみたいなぁと思いました。Twitter API仕様書の日本語訳を読んでいたのですが、やり取りは全てHTTPなので簡単そうです。空いているサーバにボットをしこめば簡単に…

郵便番号データに緯度経度を付加する手順

一昔前に、GoogleMapsから郵便番号に経度緯度情報に変換するプログラムを書きました。そのデータを使おうと思ったのですが、見当たりません。確かブログにコード書いていたなぁと思って、過去の記事「郵便番号から緯度経度情報を取得する」を見たのですが、…

memchachedをWindowsにインストール

ローカルでのユニットテストの為にWindows用のmemcachedをインストール。 ほぼ下記のサイトからダウンロードするするだけなので、凄い簡単です。 memcached for Windows zipファイルを解凍して、memcached.exeを実行するだけで立ち上がります。 サービスとし…

OpenCMSをインストールしてみた

いろいろとオープンソースのCMSは出ていますが、エンタープライズで使う上でこれがぴったりというのにはまだ出会っていません。 求めているのは、 ・スケールし易い。 WebサーバとDBサーバに別けられ易い ・モジュールとして、機能を追加できる。(本体のソ…

updatedbよもやま話

職場や自宅サーバ、ローカル開発機、Amazon EC2の仮想環境と色々使っているとプラットフォームがmac,gentoo,centOS,fedora coreと色々別れてきます。入れているアプリケーションは、Apache,mysql,java,railsと共通なので特に問題はありません。ただし、アプ…

statsvnで特定ファイル、ディレクトリを集計対象外にする

地味に便利なstatsvn。コミットログを元に活動を可視化してくれます。ただ一点問題がありまして、デフォルトの設定のままだとソースもデータもドキュメントもいっしょくたんにカウントされます。純粋にコードの記述量を知りたいという場合も多いので、どうや…

MacにMySQLをインストールする

MacにMySQLを入れていたと思ったのですが、どうやら入っていなかったのでインストール。MacPortsを使っていれば、簡単にインストール出来ます。インストール&初期化 % sudo port install mysql5 +server % sudo -u mysql mysql_install_db5起動&終了 % sud…

やっぱり便利、Synergy。

複数台でキーボードやマウスを共有するツール、Synergy かなり便利です。 Windows同士では以前から使っていたのですが、何気にMacとも共有できることを今日知りました。(どの紹介サイトでも、Macでの使い方書いていますね。何で目に入らなかったのだろう。…

cdコマンドのちょっと便利なオプション

ちょっと便利なオプション(?) $pwd /home/dkfj cd /usr/local/src $pwd /usr/local/src $cd - $pwd /home/dkfj 直前のディレクトリに移動します。最小の入力で使えるので、割と使えます。何気に書籍やWeb上で紹介されているのを見たことがないんですよね。単…

CPUの気持ちになってプログラムを書くということ Kansai.pm#11 参加記その1

この前の日曜日にKansai.pmに参加してきました。 Perlの人でもないし参加しても良いのかなぁと悩みましたが、HTML::ExtractContentを作った人の話が聞けるので行ってみました。正直、Hatenaを見たいのと生id:naoyaさんを見たかったというのもありますw 一番…

TimeCapsule以外のNASで、TimeMachineを使う

appleのTimeCapsule素晴らしい発想の商品だと思います。NASに無線を付けるという考え方、最初にした人は凄い。しかも、Leopardの売りの一つであるTimeMachineの母艦となるように作られているので、欲しくなってきます。しかし、私には3つの理由で購入を見送…

郵便番号から緯度経度情報を取得するには?

郵便番号マップを作ってみた ビジュアライジング・データ ―Processingによる情報視覚化手法 を読んでたら「アメリカの郵便番号を地図上に図示する」という例が出てきたので、これの日本版を作ってみました。 面白いエントリーが挙がっていました。続編が楽し…

これって、なんてSQL

たまに使うけど、下記のような構文のSQLって何て呼ぶのでしょう?副問い合わせではないですよね。ほのかな疑問。 select * from (select * from dual)

maven local repository directory is not foundと出たら

Eclipseで、Doltengプロジェクトを作ったり消したりしていたら、下記のように"maven local repository directory is not found"とエラーが出て新規にプロジェクトが出来なくなりました。 原因は、プロジェクトを消しても、Doltengの設定が残っている為のよう…

Open source Cluster 3とJava TreeViewを使ってみた

「livedoor clipsのデータを少しだけ眺めてみた。」と「livedoor clipsのタグ情報をクラスタリングしてみる」の続き。 livedoor clipsのデータを視覚化してみました。方法は、Cluster 3とJava TreeViewを使うことにしました。(両方ともここから落とせます。…

livedoor clipsのタグ情報をクラスタリングしてみる

「livedoor clipsのデータを少しだけ眺めてみた。」の続き。 データをインポートが終わったので、次はそのデータの活用をしようと思います。まずは何からかなぁと考えていたのですが、タグ同士でクラスタリング出来ないかと考えました。つまりグループ化。意…

livedoor clipsのデータを少しだけ眺めてみた。

データ貰うだけもらって、放置していたlivedoor clipsのデータを覗いてみました。 クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット) ダウンロードと一緒に取り扱い説明がついています。そのままだとtagが文字列データとし…

Eclipseの改行コード

久々にWindowsでEclipseを使った。改行コードがCRLFになるので、どこで設定するんだろうと思いちょっと調べてみた。Eclipse3.2の場合、ウィンドウ->設定->一般->ワークスペースで新規テキスト・ファイルの行区切り文字をその他Unixを選択する。プロジェクト…

Windowsでディスクの使用量が可視化できるツール WinDirStat

Windowsでファイルやフォルダのディスクの使用率や占有率を調べたくて何か良いツールがないか探してみました。 WinDirStatが中々グッドです。調べた上で、可視化までしてくれます。欠点として結構時間が掛かるというのはありますが、常時使うものでもないの…

gemでzlib起因のエラー

fedora coreの環境にもRuby on Railsを入れようとしました。先日の、「CentOS 5にRuby On Railsをインストールする」とほぼ同じ作業をして、gemからrailsをインストールしようとすると下記のようなエラーが出ました。 # /usr/bin/gem install rails /usr/lib…

着眼点が凄い! この人も好きかも!

最近流行りのリコメンドサービス。また面白いサービスが出てきました。「この人も好きかも!」 サービスの内容は、以下の通り。人名からリコメンドしてくれます。 好きな作家、漫画家、ミュージシャンなどの人名を入力すると、他に好きになれそうな人物をラ…

集合知サイト

これはすごい」と思う集合知のサイトを教えてください。 集合知を使ったサービスの一覧。質問者がかなり知識のある方のようで、紹介されたサイトに一つ一つちゃんとコメントを付けてくれているので、かなり解り易くなっています。

mecabで文章中のURLを抽出する

mecabでURLをTokenizeすると、個々の要素に分解されてしまいます。 $ mecab http://d.hatena.ne.jp/dkfj/20081219/1229648643 http 名詞,固有名詞,組織,*,*,*,* :// 名詞,サ変接続,*,*,*,*,* d 名詞,一般,*,*,*,*,* . 名詞,サ変接続,*,*,*,*,* hatena 名詞,…

コードも視覚化!!

最近、少しずつビジュアライジング・データを読み始めています。今まで割と視覚情報については苦手意識もあって避けていた部分があるのですが、改めて重要だなと思い始めました。 そんな中で、久々に正規表現を多用するコードを書く必要があって四苦八苦して…

iPhone開発の記事

目指せ!iPhoneアプリ開発エキスパート 楽しみな連載が始まりました。

大量データの処理方法 はてなさんの場合

KOF 2008 の発表資料 大量データの処理の実際の話。特に気になるのが、ドキュメントのベクトル化。確かにベクトルの方向で類似文章を見つけることは出来ると思うのですが、id:naoyaさん自身が言う通り辞書の単語数×ドキュメント数の計算をしないといけません…

mod_cluster

mod_cluster登場、mod_jkやmod_proxyよりも優れたロードバランシング mod_jkやmod_proxyより優れたとの触れ込みのmod_cluster。特徴として、APサーバ側からのフィードバックを取れるそうです。確かに利点ですね。ただこの辺のモジュールは、信頼性が大切なの…

オープンソースのレコメンドエンジン Taste

Netflix Prize 外野席というエントリーを読んでいるら、オープンソースのリコメンドエンジン Tasteが紹介されていました。Javaベースの協調フィルタリングのレコメンドエンジンです。こんなのがあるのは、全然知りませんでした。 まだ詳しく見ていないのです…

Oracle TimesTenとCoherenceとオープンソースと

先日、「Oracle涙目。memcachedの使い方」というエントリーを書いたら、それって、Oracle TimesTenとCoherenceというコメントを頂けた。こういった情報を頂けるのは、非常にありがたいです。ざっと資料を読んだだけですが、確かに信頼性が高そうです。実際に…

Seasar2でmemcachedを使う

WEB+DB PRESS Vol.47を読んでいて、Seasar2で使う方法を考えていました。Java用のmemcachedのクライアント、"memcached client for java"を呼べば、面倒くさい処理をほとんど書かずに使えそうです。logic層からDAO層にデータの呼び出しに行く所に分岐を書い…