hns - 日記自動生成システム - Version 2.19.9

先月 2001年02月 来月
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28
Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい
検索式:

2001年02月16日(金) 旧暦 [n年日記]

#1 [機械] ki.nu 止っていた

朝 5:00 に起きて、いつもは朝はメールを確めない家人が、 メールサーバにつながらないし、www.ki.nu も見えないと言っている。

しょうがないので、www.ki.nu の卓を見ると、 「NMB CLUSTER が足りないから増やせ」というようなことを言っている。

機械別状況 (OS は全て NetBSD):

A server SS/10 (1.4M)
画面が埋っていて良く分らない。「NMB CLUSTER が足りないから増やせ」というのは見える。 強制再起動。が ypbind で止ってしまう。^C すれば先には行くが。
B yp master SS/2 (1.4.1)
様子を見ようとしたが、何も応答がない。 二回くらい電源 OFF/ON。 しかし実は卓の(直列口の)速度が合っていないので、何が起きている か分らないだけだった。速度を合せて break を送ったら
  >b (boot) c (cont) n (new mode)
で止っていたので b したら正常に戻った。
C new server StarMax 4000/160 (1.4E)
卓の表示を A の方に転送していたため、A の方で画面をうめ てしまって操作を難しくしていた。 Ethernet 線を抜いて対応。
D 常用 client StarMax 3000/240 (1.5K)
電源を入れるが、ypbind が動かない。これは ^C すれば先に行く。 root で login。 ping を router にしても返事がないので、router がおかし いのかと思ってしまった。実は ping -n する必要があった。 (DNS が利用出来ない状態になっていた)
iBook (1.5_ALPHA + 1.5K)
mknmz が途中で止っていた

ypbind 無で mail server が動いてしまうと makoto@ki.nu が User Unknown:

になってしまう。ので、router を落としたら、直列口の通信が出来なくなってし まう。TA の電源を落して外からつながらないようにする。

iBook /mknmz が止っていた:

namazu (mknmz) を前の日から走らせていて、3:35 分に止っていた。
85683/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3084 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85684/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3085 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85685/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3086 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85686/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3087 [message/rfc822]
mknmz: /amd/ki.nu./export/home/makoto/Mail/ml/namazu-dev/3088: No such file or directory
makoto@nazuha ■3:35:54/010216(~/Mail)> ypwhich
^C
makoto@nazuha ■5:25:05/010216(~/Mail)> 
今までは
$ON_MEMORY_MAX = 10,000,000;
していたが(実際にはカンマ無)、今回は
$ON_MEMORY_MAX = 20,000,000; していた。
これが原因で NFS server に負荷がかかってしまったのではないかと思う。

普通だと client より server の方が速い機械だと思うが、僕の場合はいつも逆 なのも、問題になる原因

と思ったが、本当にその譜がなくて、:

namazu-devel-ja/1228 の修正をしていなかっただけで、今回の停止の件と namazu は何も関係ない。 (という結論)

いつも乗る 6:17 本千葉 には間に合わなかったが、6:25 には間に合って、:

6:32 の千葉駅・久里浜行には何とか座れる。(会社にはいつも通り行けた)

帰って来てから ki.nu:/var/log/messages* を見るが、:

makoto@milano ■8:53:06/010217(/var/log)> ls -lt mes*
-rw-r--r--  1 root  wheel  60910 Feb 17 08:53 messages
-rw-r--r--  1 root  wheel   4602 Feb 17 08:00 messages.0.gz
-rw-r--r--  1 root  wheel   4403 Feb 17 07:00 messages.1.gz
-rw-r--r--  1 root  wheel   4825 Feb 17 06:00 messages.2.gz
-rw-r--r--  1 root  wheel   4609 Feb 17 05:00 messages.3.gz
-rw-r--r--  1 root  wheel   4565 Feb 17 04:00 messages.4.gz
-rw-r--r--  1 root  wheel   4823 Feb 17 03:00 messages.5.gz
のように 一時間毎に転回されていて、過去の記録は見えなかった。 (これってどこに設定されているのかな)
crontab -l より
# rotate log files every hour, if necessary
0       *       *       *       *       /usr/bin/newsyslog

-rw------- 1 root wheel 36956 Feb 16 01:00 maillog.1.gz を見たら:

問題が起きたのはもっと早い時刻。
makoto@milano  9:46:57/010217(/var/log)# zcat maillog.1.gz | grep '<makoto@ki.nu>... User unknown'
Feb 15 23:39:21 milano sendmail[5329]: XAA05329: <makoto@ki.nu>... User unknown
Feb 15 23:39:24 milano sendmail[4703]: XAA04703: <makoto@ki.nu>... User unknown
少なくとも 111 通が失われている
makoto@milano  9:47:53/010217(/var/log)# zcat maillog.[01].gz | grep '<makoto@ki.nu>... User unknown' | wc
     111     999    8951

(2/15/2001) 23:35 頃に ypserver が使えなくなった。(原因不明):

ypserver が二つ動いているが不充分 ?
ypserv だけが反応しなくなっても、その機械が ping に応答するような状態だと 他の機械に聞きに行かない ?

機械 C の記録から

makoto@komekome  11:00:46/010217(/var/log)# zcat messages.5.gz | grep ypbind | head -2
Feb 15 23:39:21 komekome ypbind[118]: broadcast: sendto: Host is down
Feb 15 23:40:04 komekome ypbind[118]: broadcast: sendto: Host is down

全然関係ないけれど OCN NTP server:

(この辺 2/17 日に書いている) http://www.ocn.ad.jp/ocnuser/ntp.html これって stratum 3。何だかけちっぽいと思ってしまう。
makoto@milano  10:28:42/010217(/var/log)# ntpq -c peers
     remote           refid      st t when poll reach   delay   offset    disp
==============================================================================
+jh1ynw.jn1lfd.g .GPS.            1 u   29  128  377    54.08    0.099   16.68
*clock.nc.fukuok .GPS.            1 u   20  128  377    66.19   -4.392   14.22
 202.234.233.104 0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 ki.nu           0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
xkomekome.ki.nu  jh1ynw.jn1lfd.g  2 u  303  512  376     1.71   60.700    8.12
+ml.ki.nu        cesium.mtk.nao.  2 u   75   64  376     1.83   -0.505    0.61
 i.ki.nu         0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 nazuha.ki.nu    0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
-cesium.mtk.nao. .ATOM.           1 u  190  512  377   120.00  -42.490  107.54
 ntp-tk01.ocn.ad 202.234.233.104  3 u  126 1024  377   115.75   43.570   39.54
 ntp-tk02.ocn.ad 202.234.233.104  3 u  135 1024  377    23.16    0.234    3.13
 ntp-os01.ocn.ad 202.234.233.105  3 u  126 1024  377   123.41   46.202   38.41
さすがに ocn の stratum 2 の 202.234.233.104 の機械は通信出来ないようになっているようだ。
makoto@tateyama  10:07:18/010217(/var/log)# ntpq -c peers
     remote           refid      st t when poll reach   delay   offset    disp
==============================================================================
*jh1ynw.jn1lfd.g .GPS.            1 u   28   64  377    56.49    0.236   10.24
+clock.nc.fukuok .GPS.            1 u   38   64  377    58.59   -0.064   16.39
+ki.nu           clock.nc.fukuok  2 u   16   64  377     2.11    0.227    0.85
xkomekome.ki.nu  jh1ynw.jn1lfd.g  2 u  401  512  376     2.04   60.209    7.32
 ml.ki.nu        0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 i.ki.nu         0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 nazuha.ki.nu    0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
-cesium.mtk.nao. .ATOM.           1 u   26   64  377    36.50    0.429    6.61
 ntp-tk01.ocn.ad 202.234.233.104  3 u  266 1024  377    24.34   -0.106    5.69
 ntp-tk02.ocn.ad 202.234.233.104  3 u  258 1024  377    38.44   -7.155   17.27
 ntp-os01.ocn.ad 202.234.233.105  3 u  267 1024  377   228.96  -94.907   98.65
makoto@tateyama  10:32:30/010217(/var/log)# 
実はこの表示の読み方を良く知らないので、man ntpq
x designated falseticker by the intersection algorithm;
.  culled from the end of the candidate list;
- discarded by the clustering algorithm;
+ included in the final selection set;
# selected for synchronization but distance exceeds maximum;
* selected for synchronization; and
o selected for synchronization, PPS signal in use.



最近の日記
2024年05月06日
py-setuptools (python 3.11.9)
make release took 1 hours and 10 min
qemu invocation for 10.99.10
2024年05月05日
Windows 10 version
serial connection
bc bench
2024年05月04日
Trial on 10.99.10
another version (later trial) to succeed
2024年04月29日
dkim
2024年03月10日
停電 (瞬電)
以上、1 日分です。
タイトル一覧
カテゴリ分類
Powered by hns-2.19.9, HyperNikkiSystem Project

Count.cgi (since 2000/02/05)