hns - 日記自動生成システム - Version 2.19.9

先月 2007年10月 来月
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい
検索式:

2007年10月02日(火) 旧暦 [n年日記] [更新:"2007/10/05 09:33:52"]

#1 [Namazu] .namazurc の LANG 指示

ずうっと長いこと、日記の上の方の todo に書いてあった
365 Namazu の文字が一部化けている件 (dot.emacs 等)
が解決した。右の画面の写しは、その問題が出ている時のもの (クリックで拡大)。 .namazurc に
LANG ja
と書いてあったが、これが良くなかった。
LANG ja_JP.eucJP
と書けば良かった。その下には、
ContentType "text/html; charset=euc-jp"
これも書いてある。 現在の様子は (多分これで読めると思うけれど) → 「別に分けて見た」で検索

自分の日記を「Namazu の文字化け」で検索したら、 2004/10/03 に、問題の症状と、(同じ)解決方法が書いてあった、何ていうこと ...

--html-split と 外部フィルタ:

で実は、何をやっていたかと言うと、 jeedosaquin の画面用の HTML に <a name="HOGE"></a> を書いた時で、 当然のように --html-split の指定をしている訳だけれど、 それが最近うまく動いていなくて、それを やっと直した、 ということ。(実際には、やっとの思いで動いたので、もう少しきれいにした方がいい かも知れない)
  1. 一行目におまじないを書いて、単なる html とは別の処理をするようにしている
  2. しかし --html-split を効かせる時には、その一行目が有効なのは分割した一つ目だけで 次の部分には継承されない
  3. その他 URL を生成する必要があるけれど、その情報も伝わるように引数を増やしている が、それが全ての ::filter の呼出しの時の引数の数を変更する必要があり、結構面倒
というような事情があった。

同じような話をちょうど 6 年も前に書いている ( 2001/09/24/ ) が、(それを忘れていたのは) かなり衝撃 ... (つまり 6 年越の問題だったのかな ..)

390 jeedosaquin + namazu + htmlsplit がうまく動作していない
これが直ったので、他の文字化けの問題もやっと解決する気になったということ。

#2 [Namazu] 大きな索引 147 万通。

TeraStation を NFS サーバにして BE 2350 で: (ただし最初の方は clock が 1GHz だった)、しかも実は二つある CPU のうち片側しか使っていない。
1476194/1476194 - /amd/tera/home/makoto/Mail/webcount/2475 [message/rfc822]
索引を書き出しています...
[基本]
日付:                Wed Oct  3 01:26:11 2007
追加された文書数:    1,476,194
大きさ (bytes):      9,227,364,831
合計の文書数:        1,476,194
追加検索語数:        37,305,431
合計検索語数:        37,305,431
わかち書き:          module_kakasi -ieuc -oeuc -w
経過時間 (秒):       200,346
譜/秒:               7.37
系:                  netbsd
Perl:                5.008008
Namazu:              2.0.17

186389.126u 2965.013s 55:39:18.94 94.5% 0+0k 2784+98000io 435350pf+0w
ttyp3:makoto@catania 1:26:24/071003(...home/makoto)> 
55 時間で 147 万通。 こんな大きな索引 (9GB) で検索出来るのかな ?
とりあえず、~/.namazurc に次のように書いておけば、Wanderlust から 検索は出来ると思う
Replace /amd/tera/home/makoto/Mail Mail

#3 [URL] 一般利用者向けIPAフォントのダウンロード

というのが出来るようになったらしい → IPA Font つまり pkgsrc に出来るということかな、まだないよね ? 許諾画面があるとだめなのかな ? 契約書を添付すればいいと書いてあるが、日本語だけかな ? 日本語のものを添付しておけばいいのか。



最近の日記
2024年03月10日
停電 (瞬電)
2024年03月03日
the second try on bare-metal
useradd
2024年02月29日
opendkim and senmail
2024年01月24日
chat/iam 0.0.8
2024年01月21日
uselocale vs setlocale (textproc/R-readxl)
以上、1 日分です。
タイトル一覧
カテゴリ分類
Powered by hns-2.19.9, HyperNikkiSystem Project

Count.cgi (since 2000/02/05)