プログラマでありたい

おっさんになっても、プログラマでありつづけたい

2008-11-13から1日間の記事一覧

大量データの処理方法 はてなさんの場合

KOF 2008 の発表資料 大量データの処理の実際の話。特に気になるのが、ドキュメントのベクトル化。確かにベクトルの方向で類似文章を見つけることは出来ると思うのですが、id:naoyaさん自身が言う通り辞書の単語数×ドキュメント数の計算をしないといけません…

スパムメールが無くなる時は、人類が滅ぶ時?

スパムメールの収益性が明らかに 同チームのデータと分析は、さまざまな「男性機能強化」製品の平均支払額100ドル前後の販売を28件行うのに、350万通のスパムメールが必要だったことを示している。この比率から推測すると、Stormボットネットによる医薬品の…