hns - 日記自動生成システム - Version 2.19.9

先月 2001年09月 来月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい
検索式:

2001年09月24日(月) 旧暦 [n年日記]

#1 [Emacs] w3 の日本語が読めないのは Content-Type: 見出し (header) が

正しくない画面だった。つまり w3 のせいではない。 これは、 Dave Love <d.love at dl.ac.uk> さんに手紙を出してしまって、 言われたこと。
もしその情報がない時には w3.el の次の部分で iso-8859-1 に決め打ちしている。
(defun w3-decode-charset (handle)
..
  (let* ((encoding (mm-handle-encoding handle)) 
         (charset (or (mail-content-type-get (mm-handle-type handle)
                                             'charset)
                     "iso-8859-1"))
ここを iso-2022-jp にすれば、決打を変更出来るが、 今はそういう画面ばかりではない。

#2 [Namazu] filter と --html-split

僕がやろうとしていることがおかしいのは分っているが、 基本的に HTML なんだけれど、text/html; x-type=jdsq のような場合で、<a name="xxxx"> を使って --html-split すると、filter 無の取扱いになってしまう。
sub main {
            my ($cfile_size, $num) = 
                process_file($cfile, $docid_count, $docid_base, 

sub process_file ($$$$$$) {
    if ($var::Opt{'htmlsplit'} && $cfile =~ $conf::HTML_SUFFIX) {
        my @parts = htmlsplit::split($cfile, "NMZ.partial");

                my $result = namazu_core($fname, 

                my $uri   = generate_uri($cfile, $fragment);

    }
    my $result = namazu_core($cfile, $docid_count, $docid_base, 

sub namazu_core ($$$$$$$$$$) {
        load_document(\$cfile, \$content, \$weighted_str,
                      \$headings, \%fields);

sub load_document ($$$$\%) {
   ....
   # Filtering process
            eval '$err = ' . $var::REQUIRE_ACTIONS{$mtype} .
              '::filter($orig_cfile, $contref, 
                      $weighted_str, $headings, $fields);';
そうか、僕の問題だった。僕の filter は一行目を見て <!-- jeedosaquin --> だと x-type=jdsq にするが、--html-split すると、それは見つからない。 --debug すると
// tmpnam: /home6/namazu/cf2/NMZ.partial.2.tmp
// decide_type: name: application/octet-stream, cont: text/html
と言っていて、cont: の内容が(僕の期待と)違う。それは
sub load_document ($$$$\%) {
     の中の
     my $mtype_c = $Magic->checktype_data($$contref);
が効いているはず。--html-split で切出したものを見たら、 次のようになっている。--> pl/htmlsplit.pl
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
        "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<link rev=made href="mailto:unknown">
<title>no title</title>
</head>
<body>
<hr>
<!-- jeedosaquin -->
<h3>FEATURE 定義 </h3>
html-split する前に MediaType が分っているから、 それを継承するのが正しい ?
それは別として
 mknmz -f /dev/null -O /home6/namazu/cf2 --html-split \
  --media-type "text/html; x-type=jdsq"  .cf
...
2/4 - /amd/ki.nu./export/home/htdocs/software/.cf/
     170.feature.html.ja#mailertable [text/html; x-type=jdsq]
ってやれば、一つ前進 (という程でもないか)。 ただし、名前がおかしい。これは $cfile が一時名になっているのが原因。
@@ Processing jeedosaquin,jdsq, file cfile(/home6/namazu/cf2/NMZ.partial.4.tmp)...

#3 [墓参] 6:50 に出かけて 10:30 に帰って来た。

久し振りに長い時間運転したせいか、ちょっと気分が悪くなってしまった。 (それとも単に空腹のせいか)
(大宮台で給油) 63.5 litre x (70 + 2) = 4,565円, 640km

#4 [auto-index] 新しい方の jeedosaquin は Accept-Language: が必要

ないと、左側の選択を表示しない。
makoto@u ■21:27:21/010924(~)> 
ls -l i/namazu/tutorial.cgi i/cf.cgi e/MacOS.cgi  \
? i/auto-index.cgi n/iBook2.cgi

  18814 Feb 20  2001 e/MacOS.cgi*
  18814 Feb 12  2001 i/auto-index.cgi*
  18914 Sep 24 12:20 i/cf.cgi*
  11506 Oct 21  2000 i/namazu/tutorial.cgi*
  18673 Feb 10  2001 n/iBook2.cgi*
古い namazu だけは、表示する。



最近の日記
2024年03月10日
停電 (瞬電)
2024年03月03日
the second try on bare-metal
useradd
2024年02月29日
opendkim and senmail
2024年01月24日
chat/iam 0.0.8
2024年01月21日
uselocale vs setlocale (textproc/R-readxl)
以上、1 日分です。
タイトル一覧
カテゴリ分類
Powered by hns-2.19.9, HyperNikkiSystem Project

Count.cgi (since 2000/02/05)