読書記録ChangeLog / 2005-05-10

日記内を検索  前の日 / 次の日 / 最新 / ランダム RSS

2005-05-10 Tue

このままじゃおれはラーメン大好き人間だと思われてしまう。 --- yto

NETWORKWORLD Online - ネットマークス、東工大キャンパスで公衆無線LANを構築

http://www.networkworld.jp/news/-/16118.html

PSPファミコンエミュレーター

http://www.tom-style.net/mt/archives/003263.php

アマゾン輸入文具ストアオープン!

http://nais.to/~yto/clog/2005-05-10-2.html

世界を見る目が変わる50の事実 [][購入]

画像
http://www.amazon.co.jp/exec/obidos/ASIN/4794214049/dkiroku-22
p55

南アフリカ防衛軍のメンバーは、強制的に「転換療法」を受けさせられたという。
男性に同姓のヌード写真を見せて電気ショックを与え、次に女性のヌード写真を
見せて電流を止める仕組みである。

ウホッ!

ブラジルで毒入りピザ事件 動機は恋愛絡みか

http://www.excite.co.jp/News/odd/00081115732468.html
毒入りコーヒーじゃないのかよ。

クラックされました

http://bbs.zhost.sytes.net/59/

あるアカウントでユーザ名をかなり一般的な名称で設定ししかもパスワードも
それと同じだったのがよくなかったようです。

┌──┐
│= = └───────┐
│ l    ドンマイ
│ -. ┌───────┘
└┐┌┘
  ││
  ┘└
via http://tokuhirom.dnsalias.org/~tokuhirom/inamode4/

cl.itemlist版kwnmz

似たアイテムの抽出機能の準備としてkwnmzのcl.itemlist版みたいのを作
成しました。予想していたよりまともな出力な希ガし増す。キーワードを抜き
出すのは簡単なのですが似てるエントリとなると計算量が大きなやり方しか
思いつきません。どげんしょ。
<a href="2005-05-09-4.html">[2005-05-09-4]</a> start
スチールユニットシェルフ/37.8448195419321
無印良品/29.4227547757594
棚/26.1241477551067
包装/24.0599546931792
段/20.3110164573468
<a href="2005-05-09-3.html">[2005-05-09-3]</a> start
バター/60.1798640795376
炒め/49.5725006458482
醤油/33.4680493354686
料理/13.8850290106785
かけただけ/12.6149398473107
<a href="2005-05-09-2.html">[2005-05-09-2]</a> start
会話/46.8350616693358
ウケ/31.8448195419321
技術/22.0444599198475
る/15.5822041054746
ボケ/12.6149398473107
<a href="2005-05-09-1.html">[2005-05-09-1]</a> start
はてな/48.0013800191732
ダイアリー/39.6580005166786
リスト/23.346149499438
[Blog][ChangeLogMemo]/23.2298796946214
記事/21.515989054386
[...]
<a href="2005-05-07-2.html">[2005-05-07-2]</a> start
三分/55.149886732948
構図/50.4597593892428
割/42.8527286397614
法/35.4402093805891
撮る/30.8790352572702

kakasi -w < cl.itemlist > cl.wakati
perl idf.pl < cl.wakati > idf.txt
ruby tf.rb > tf-idf.txt

#すでに作ってあるidf.txtからidfを読み込み
# {word,idf}のハッシュidfを作成
idf = Hash.new
idf_file = open("idf.txt")
while idf_file.gets
  w,t,i = chomp.split(/ /)
  idf[w]=i
end
#cl.itemlistを分かち書きしたcl.wakatiを読み込んでtf*idfを計算する。
wakati = open("cl.wakati")
while wakati.gets
  tf_idf = Hash.new
  id,subject,body = chomp.split(/\t/)
  #エントリ単位のハッシュを作成(サブジェクト)
  #サブジェクトに含まれるワードの重みを5倍にする。
  subject.split(/ /).each do |i|
    idf[i] = 0.0 unless idf[i]
    tf_idf[i] = 0.0 unless tf_idf[i]
    tf_idf[i] = Float(tf_idf[i]) + 5 * Float(idf[i])
  end
  #エントリ単位のハッシュを作成(本文)
  body.split(/ /).each do |i|
    idf[i] = 0.0 unless idf[i]
    tf_idf[i] = 0.0 unless tf_idf[i]
    tf_idf[i] = Float(tf_idf[i]) + Float(idf[i])
  end
  tf_idf = tf_idf.sort{|a,b| Float(b[1]) <=> Float(a[1])}
  print "#{id} start\n"
  #tf*idfトップの5ワードを取り出す。
  for i in [1,2,3,4,5]
    key,val = tf_idf.shift
    print "#{key}/#{val}\n"
  end
end

wema2qwikWebの開発者etoさんインタビュー

http://jp.rubyist.net/magazine/?0006-Hotlinks
あいかわらず全然編集されてなくてなげー。

(後編へ続く)

TheBrain Technologies Corporation

http://www.thebrain.com/LPS/PBMM/

10天皇陵の指定、昭和10〜30年代に見直しを検討

http://headlines.yahoo.co.jp/hl?a=20050508-00000001-yom-soci&kz=soci

福知山線事故 マスコミ報道のウソを晒すスレ 第4報

http://hobby7.2ch.net/test/read.cgi/train/1115557686/
ヒゲブーム。

ナポレオン死因は胃がんとあらためて結論できた“証拠”

http://www.zakzak.co.jp/top/2005_05/t2005050904.html

書物としての新約聖書 []

画像
http://www.amazon.co.jp/exec/obidos/ASIN/432610113X/dkiroku-22
むー。高い脳。

2005-05 / 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

uzoyoto@dkiroku.com

これまでの訪問者は 人です。