|
Namazu for hns による簡易全文検索 詳しくは 詳細指定/ヘルプを参照して下さい |
||||||||||||||||||||||||||||||||||||||||||||||||||
2001年09月24日(月) 旧暦 [n年日記]#1 [Emacs] w3 の日本語が読めないのは Content-Type: 見出し (header) が
正しくない画面だった。つまり w3 のせいではない。
これは、
Dave Love <d.love at dl.ac.uk> さんに手紙を出してしまって、
言われたこと。
もしその情報がない時には w3.el の次の部分で iso-8859-1 に決め打ちしている。 (defun w3-decode-charset (handle) .. (let* ((encoding (mm-handle-encoding handle)) (charset (or (mail-content-type-get (mm-handle-type handle) 'charset) "iso-8859-1"))ここを iso-2022-jp にすれば、決打を変更出来るが、 今はそういう画面ばかりではない。 ( つっこみ )
#2 [Namazu] filter と --html-split
僕がやろうとしていることがおかしいのは分っているが、
基本的に HTML なんだけれど、text/html; x-type=jdsq
のような場合で、<a name="xxxx"> を使って --html-split
すると、filter 無の取扱いになってしまう。
sub main { my ($cfile_size, $num) = process_file($cfile, $docid_count, $docid_base, sub process_file ($$$$$$) { if ($var::Opt{'htmlsplit'} && $cfile =~ $conf::HTML_SUFFIX) { my @parts = htmlsplit::split($cfile, "NMZ.partial"); my $result = namazu_core($fname, my $uri = generate_uri($cfile, $fragment); } my $result = namazu_core($cfile, $docid_count, $docid_base, sub namazu_core ($$$$$$$$$$) { load_document(\$cfile, \$content, \$weighted_str, \$headings, \%fields); sub load_document ($$$$\%) { .... # Filtering process eval '$err = ' . $var::REQUIRE_ACTIONS{$mtype} . '::filter($orig_cfile, $contref, $weighted_str, $headings, $fields);';そうか、僕の問題だった。僕の filter は一行目を見て <!-- jeedosaquin --> だと x-type=jdsq にするが、--html-split すると、それは見つからない。 --debug すると // tmpnam: /home6/namazu/cf2/NMZ.partial.2.tmp // decide_type: name: application/octet-stream, cont: text/htmlと言っていて、cont: の内容が(僕の期待と)違う。それは sub load_document ($$$$\%) { の中の my $mtype_c = $Magic->checktype_data($$contref);が効いているはず。--html-split で切出したものを見たら、 次のようになっている。--> pl/htmlsplit.pl <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html> <head> <link rev=made href="mailto:unknown"> <title>no title</title> </head> <body> <hr> <!-- jeedosaquin --> <h3>FEATURE 定義 </h3>html-split する前に MediaType が分っているから、 それを継承するのが正しい ? それは別として mknmz -f /dev/null -O /home6/namazu/cf2 --html-split \ --media-type "text/html; x-type=jdsq" .cf ... 2/4 - /amd/ki.nu./export/home/htdocs/software/.cf/ 170.feature.html.ja#mailertable [text/html; x-type=jdsq]ってやれば、一つ前進 (という程でもないか)。 ただし、名前がおかしい。これは $cfile が一時名になっているのが原因。 @@ Processing jeedosaquin,jdsq, file cfile(/home6/namazu/cf2/NMZ.partial.4.tmp)... ( つっこみ )
#3 [墓参] 6:50 に出かけて 10:30 に帰って来た。
久し振りに長い時間運転したせいか、ちょっと気分が悪くなってしまった。
(それとも単に空腹のせいか)
(大宮台で給油) 63.5 litre x (70 + 2) = 4,565円, 640km ( つっこみ )
#4 [auto-index] 新しい方の jeedosaquin は Accept-Language: が必要
ないと、左側の選択を表示しない。
makoto@u ■21:27:21/010924(~)> ls -l i/namazu/tutorial.cgi i/cf.cgi e/MacOS.cgi \ ? i/auto-index.cgi n/iBook2.cgi 18814 Feb 20 2001 e/MacOS.cgi* 18814 Feb 12 2001 i/auto-index.cgi* 18914 Sep 24 12:20 i/cf.cgi* 11506 Oct 21 2000 i/namazu/tutorial.cgi* 18673 Feb 10 2001 n/iBook2.cgi*古い namazu だけは、表示する。 ( つっこみ )
|
最近の日記 2025年01月15日 ・今更 advent calendar 2025年01月12日 ・金柑収穫 2025年01月07日 ・sh: 1: not found ・sh: 1: not found 2025年01月02日 ・geography/R-s2 | ||