hns - 日記自動生成システム - Version 2.19.9

先月 2001年09月 来月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい
検索式:

2001年09月24日(月) 旧暦 [n年日記]

#1 [Emacs] w3 の日本語が読めないのは Content-Type: 見出し (header) が

正しくない画面だった。つまり w3 のせいではない。 これは、 Dave Love <d.love at dl.ac.uk> さんに手紙を出してしまって、 言われたこと。
もしその情報がない時には w3.el の次の部分で iso-8859-1 に決め打ちしている。
(defun w3-decode-charset (handle)
..
  (let* ((encoding (mm-handle-encoding handle)) 
         (charset (or (mail-content-type-get (mm-handle-type handle)
                                             'charset)
                     "iso-8859-1"))
ここを iso-2022-jp にすれば、決打を変更出来るが、 今はそういう画面ばかりではない。

#2 [Namazu] filter と --html-split

僕がやろうとしていることがおかしいのは分っているが、 基本的に HTML なんだけれど、text/html; x-type=jdsq のような場合で、<a name="xxxx"> を使って --html-split すると、filter 無の取扱いになってしまう。
sub main {
            my ($cfile_size, $num) = 
                process_file($cfile, $docid_count, $docid_base, 

sub process_file ($$$$$$) {
    if ($var::Opt{'htmlsplit'} && $cfile =~ $conf::HTML_SUFFIX) {
        my @parts = htmlsplit::split($cfile, "NMZ.partial");

                my $result = namazu_core($fname, 

                my $uri   = generate_uri($cfile, $fragment);

    }
    my $result = namazu_core($cfile, $docid_count, $docid_base, 

sub namazu_core ($$$$$$$$$$) {
        load_document(\$cfile, \$content, \$weighted_str,
                      \$headings, \%fields);

sub load_document ($$$$\%) {
   ....
   # Filtering process
            eval '$err = ' . $var::REQUIRE_ACTIONS{$mtype} .
              '::filter($orig_cfile, $contref, 
                      $weighted_str, $headings, $fields);';
そうか、僕の問題だった。僕の filter は一行目を見て <!-- jeedosaquin --> だと x-type=jdsq にするが、--html-split すると、それは見つからない。 --debug すると
// tmpnam: /home6/namazu/cf2/NMZ.partial.2.tmp
// decide_type: name: application/octet-stream, cont: text/html
と言っていて、cont: の内容が(僕の期待と)違う。それは
sub load_document ($$$$\%) {
     の中の
     my $mtype_c = $Magic->checktype_data($$contref);
が効いているはず。--html-split で切出したものを見たら、 次のようになっている。--> pl/htmlsplit.pl
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
        "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<link rev=made href="mailto:unknown">
<title>no title</title>
</head>
<body>
<hr>
<!-- jeedosaquin -->
<h3>FEATURE 定義 </h3>
html-split する前に MediaType が分っているから、 それを継承するのが正しい ?
それは別として
 mknmz -f /dev/null -O /home6/namazu/cf2 --html-split \
  --media-type "text/html; x-type=jdsq"  .cf
...
2/4 - /amd/ki.nu./export/home/htdocs/software/.cf/
     170.feature.html.ja#mailertable [text/html; x-type=jdsq]
ってやれば、一つ前進 (という程でもないか)。 ただし、名前がおかしい。これは $cfile が一時名になっているのが原因。
@@ Processing jeedosaquin,jdsq, file cfile(/home6/namazu/cf2/NMZ.partial.4.tmp)...

#3 [墓参] 6:50 に出かけて 10:30 に帰って来た。

久し振りに長い時間運転したせいか、ちょっと気分が悪くなってしまった。 (それとも単に空腹のせいか)
(大宮台で給油) 63.5 litre x (70 + 2) = 4,565円, 640km

#4 [auto-index] 新しい方の jeedosaquin は Accept-Language: が必要

ないと、左側の選択を表示しない。
makoto@u ■21:27:21/010924(~)> 
ls -l i/namazu/tutorial.cgi i/cf.cgi e/MacOS.cgi  \
? i/auto-index.cgi n/iBook2.cgi

  18814 Feb 20  2001 e/MacOS.cgi*
  18814 Feb 12  2001 i/auto-index.cgi*
  18914 Sep 24 12:20 i/cf.cgi*
  11506 Oct 21  2000 i/namazu/tutorial.cgi*
  18673 Feb 10  2001 n/iBook2.cgi*
古い namazu だけは、表示する。



最近の日記
2024年05月08日
comparison on ./buildsh tools
2024年05月06日
py-setuptools (python 3.11.9)
make release took 1 hours and 10 min
qemu invocation for 10.99.10
2024年05月05日
Windows 10 version
serial connection
bc bench
2024年05月04日
Trial on 10.99.10
another version (later trial) to succeed
2024年04月29日
dkim
以上、1 日分です。
タイトル一覧
カテゴリ分類
Powered by hns-2.19.9, HyperNikkiSystem Project

Count.cgi (since 2000/02/05)