Namazu/ variables in ~/.mknmzrc

ここに書いてある変数は /usr/local/share/namazu/pl/conf.pl に設定されていて、mknmz の動作を制御する。 またそれらの意味は、その中に英語で書いてある。

自分の環境や条件に合せて変更する場合、 ~/.mknmzrc (など) に設定し直すことで、内容を上書き出来る。 ただし、その時には

package conf;

と最初に書き、Perl の言葉で設定する。 また mknmz の起動時に 操作行で選択を指定 することによって上書きすることも出来る。

変数名に (*) の付いているものの初期値は、./configure 時に決定される

(その事情は pl/conf.pl.in を見れば分る)

variables at conf.pl
変数名 初期値(例)説明

(関係)操作行選択

$NKF (*) "module_nkf"NKF 起動法
$KAKASI (*) "/usr/local/bin/kakasi -ieuc -oeuc -w" kakasi 起動法
$CHASEN (*) "module_chasen1 -j -F '\%m '" chasen 起動法
$CHASEN_NOUN (*) "module_chasen1 -j -F '\%m %H\\n'"
$WAKATI (*) $KAKASIわかち書きに kakase を 使うか chasen を使うか-c, -k
$LANGUAGE "ja"処理言語 (日本語・英語) # language of messages
$ADMIN (*)
# admin's email address (config 時に設定される)
$DIRECTORY_INDEX "index.html" URL が / で 終っている時の意味。(実際には、表示の時に取除く)
$ALLOW_FILE '.*\.html?|.*\.txt|.*_default| .*\.pdf|.*\.doc'対象譜 (正規表現)(注 1)-a, --allow=PATTERN
$DENY_FILE '.*\.gif|.*\.(jpg|jpeg)|.*\.tar\.gz| core|.*\.bak|.*~|\..*|\x23.*|NMZ\..*'除外譜 (正規表現)(注2)--deny=PATTERN
$EXCLUDE_PATH undef除外 path (正規表現)--exclude=PATTERN
$HTML_SUFFIX 'html?|[ps]html|html\.[a-z]{2}|asp|cgi'この接尾語を持もの だけ処理する
$CGI_DIR '/(cgi-bin|htbin)/'
$MHONARC_HEADER '<\!-- MHonArc v\d\.\d\.\d -->'
$MHONARC_MESSAGE_FILE 'msg\d{5}\.html(?:\.gz)?'
$REMAIN_HEADER "From|Date|Message-ID" RFC 822 Header などのうち表示に残すもの
$SEARCH_FIELD "message-id|subject|from|date| uri|newsgroups|to|summary|size"検索対象見出部分
$META_TAGS 'keywords|description'<META の中で見るもの
$TEXT_TITLE " (Text File) "; # text file 文字形式表示
$NO_TITLE "No title in original"; # document has no title<TITLE> がない時に表示する文字列
$ON_MEMORY_MAX 5000000 この大きさまで、文書は一度に記憶域に覚えている。 (読んだ文書の大きさの合計が、 これを越えると索引を書き出して記憶域が増加しないようにする) (注3)
$TEXT_SIZE_MAX 600000これ以上の大きさの譜は無視する
$WORD_LENG_MAX 128これ以上の長さの単語は処理しない(bytes)
$NON_SEPARATION_ELEMENTS 'A|TT|CODE|SAMP|KBD|VAR |B|STRONG|I|EM|CITE|FONT|U|'.これらがあっても単語は切らない
$INVALID_LENG 128 これ以上の長さの文字は重み付けから外す。 <Hn> .. </Hn> を書体の大小指定だと思っている人がいるため
$SUMMARY_LENGTH 200(NMZ.field.summary に保存する)要約の大きさ (bytes)
%FIELD_ALIASES ('title' => 'subject', 'author' => 'from')メール見出名の置換法
%Weight (長いので省略) HTML 素子による重み付け点数
robot 関係
$HTDOCUMENT_ROOT "/usr/local/apache/share/htdocs"この下の $ROBOTS_TXT を探す
$HTDOCUMENT_ROOT_URI_PREFIX "http://www.foo.domain.jp/" $ROBOTS_TXT の中を解釈する時に、この URI を前に付ける
$ROBOTS_TXT "$HTDOCUMENT_ROOT/robots.txt"
$ROBOTS_EXCLUDE_URIS ""
(注1)
$ALLOW_FILE などについては語頭・語尾の ^ $ はつける必要はなく、そう解釈する。
(注2)
$DENY_FILE は -a と同時に使うと便利かも知れない。 ( .. を除く全てというような指定が出来る)
(注3)
limit という操作をすると表示される中の datasize が適切でないと、こ の指定は意味を持たない。 (datasize 制限が来るよりも $ON_MEMORY_MAX が小さい必要がある。 ただし単位は同じではない。5M の文書を覚えておくには 64M 以上の記憶 域が必要となる(はず)) 安易には unlimit datasize としておく。

Last Update
19:53:40 03/12/08
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
Apache/2.0.65 (Unix) mod_ssl/2.0.65 OpenSSL/1.0.1g DAV/2 PHP/5.4.26
Count.cgi (since 2000/01/17)