hns - 日記自動生成システム - Version 2.19.9

先月 2001年02月 来月
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28
Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい
検索式:

2001年02月16日(金) 旧暦 [n年日記]

#1 [機械] ki.nu 止っていた

朝 5:00 に起きて、いつもは朝はメールを確めない家人が、 メールサーバにつながらないし、www.ki.nu も見えないと言っている。

しょうがないので、www.ki.nu の卓を見ると、 「NMB CLUSTER が足りないから増やせ」というようなことを言っている。

機械別状況 (OS は全て NetBSD):

A server SS/10 (1.4M)
画面が埋っていて良く分らない。「NMB CLUSTER が足りないから増やせ」というのは見える。 強制再起動。が ypbind で止ってしまう。^C すれば先には行くが。
B yp master SS/2 (1.4.1)
様子を見ようとしたが、何も応答がない。 二回くらい電源 OFF/ON。 しかし実は卓の(直列口の)速度が合っていないので、何が起きている か分らないだけだった。速度を合せて break を送ったら
  >b (boot) c (cont) n (new mode)
で止っていたので b したら正常に戻った。
C new server StarMax 4000/160 (1.4E)
卓の表示を A の方に転送していたため、A の方で画面をうめ てしまって操作を難しくしていた。 Ethernet 線を抜いて対応。
D 常用 client StarMax 3000/240 (1.5K)
電源を入れるが、ypbind が動かない。これは ^C すれば先に行く。 root で login。 ping を router にしても返事がないので、router がおかし いのかと思ってしまった。実は ping -n する必要があった。 (DNS が利用出来ない状態になっていた)
iBook (1.5_ALPHA + 1.5K)
mknmz が途中で止っていた

ypbind 無で mail server が動いてしまうと makoto@ki.nu が User Unknown:

になってしまう。ので、router を落としたら、直列口の通信が出来なくなってし まう。TA の電源を落して外からつながらないようにする。

iBook /mknmz が止っていた:

namazu (mknmz) を前の日から走らせていて、3:35 分に止っていた。
85683/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3084 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85684/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3085 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85685/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3086 [message/rfc822]
@@ 部品: mailnews.pl
@@ Processing mail/news file ...
85686/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3087 [message/rfc822]
mknmz: /amd/ki.nu./export/home/makoto/Mail/ml/namazu-dev/3088: No such file or directory
makoto@nazuha ■3:35:54/010216(~/Mail)> ypwhich
^C
makoto@nazuha ■5:25:05/010216(~/Mail)> 
今までは
$ON_MEMORY_MAX = 10,000,000;
していたが(実際にはカンマ無)、今回は
$ON_MEMORY_MAX = 20,000,000; していた。
これが原因で NFS server に負荷がかかってしまったのではないかと思う。

普通だと client より server の方が速い機械だと思うが、僕の場合はいつも逆 なのも、問題になる原因

と思ったが、本当にその譜がなくて、:

namazu-devel-ja/1228 の修正をしていなかっただけで、今回の停止の件と namazu は何も関係ない。 (という結論)

いつも乗る 6:17 本千葉 には間に合わなかったが、6:25 には間に合って、:

6:32 の千葉駅・久里浜行には何とか座れる。(会社にはいつも通り行けた)

帰って来てから ki.nu:/var/log/messages* を見るが、:

makoto@milano ■8:53:06/010217(/var/log)> ls -lt mes*
-rw-r--r--  1 root  wheel  60910 Feb 17 08:53 messages
-rw-r--r--  1 root  wheel   4602 Feb 17 08:00 messages.0.gz
-rw-r--r--  1 root  wheel   4403 Feb 17 07:00 messages.1.gz
-rw-r--r--  1 root  wheel   4825 Feb 17 06:00 messages.2.gz
-rw-r--r--  1 root  wheel   4609 Feb 17 05:00 messages.3.gz
-rw-r--r--  1 root  wheel   4565 Feb 17 04:00 messages.4.gz
-rw-r--r--  1 root  wheel   4823 Feb 17 03:00 messages.5.gz
のように 一時間毎に転回されていて、過去の記録は見えなかった。 (これってどこに設定されているのかな)
crontab -l より
# rotate log files every hour, if necessary
0       *       *       *       *       /usr/bin/newsyslog

-rw------- 1 root wheel 36956 Feb 16 01:00 maillog.1.gz を見たら:

問題が起きたのはもっと早い時刻。
makoto@milano  9:46:57/010217(/var/log)# zcat maillog.1.gz | grep '<makoto@ki.nu>... User unknown'
Feb 15 23:39:21 milano sendmail[5329]: XAA05329: <makoto@ki.nu>... User unknown
Feb 15 23:39:24 milano sendmail[4703]: XAA04703: <makoto@ki.nu>... User unknown
少なくとも 111 通が失われている
makoto@milano  9:47:53/010217(/var/log)# zcat maillog.[01].gz | grep '<makoto@ki.nu>... User unknown' | wc
     111     999    8951

(2/15/2001) 23:35 頃に ypserver が使えなくなった。(原因不明):

ypserver が二つ動いているが不充分 ?
ypserv だけが反応しなくなっても、その機械が ping に応答するような状態だと 他の機械に聞きに行かない ?

機械 C の記録から

makoto@komekome  11:00:46/010217(/var/log)# zcat messages.5.gz | grep ypbind | head -2
Feb 15 23:39:21 komekome ypbind[118]: broadcast: sendto: Host is down
Feb 15 23:40:04 komekome ypbind[118]: broadcast: sendto: Host is down

全然関係ないけれど OCN NTP server:

(この辺 2/17 日に書いている) http://www.ocn.ad.jp/ocnuser/ntp.html これって stratum 3。何だかけちっぽいと思ってしまう。
makoto@milano  10:28:42/010217(/var/log)# ntpq -c peers
     remote           refid      st t when poll reach   delay   offset    disp
==============================================================================
+jh1ynw.jn1lfd.g .GPS.            1 u   29  128  377    54.08    0.099   16.68
*clock.nc.fukuok .GPS.            1 u   20  128  377    66.19   -4.392   14.22
 202.234.233.104 0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 ki.nu           0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
xkomekome.ki.nu  jh1ynw.jn1lfd.g  2 u  303  512  376     1.71   60.700    8.12
+ml.ki.nu        cesium.mtk.nao.  2 u   75   64  376     1.83   -0.505    0.61
 i.ki.nu         0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 nazuha.ki.nu    0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
-cesium.mtk.nao. .ATOM.           1 u  190  512  377   120.00  -42.490  107.54
 ntp-tk01.ocn.ad 202.234.233.104  3 u  126 1024  377   115.75   43.570   39.54
 ntp-tk02.ocn.ad 202.234.233.104  3 u  135 1024  377    23.16    0.234    3.13
 ntp-os01.ocn.ad 202.234.233.105  3 u  126 1024  377   123.41   46.202   38.41
さすがに ocn の stratum 2 の 202.234.233.104 の機械は通信出来ないようになっているようだ。
makoto@tateyama  10:07:18/010217(/var/log)# ntpq -c peers
     remote           refid      st t when poll reach   delay   offset    disp
==============================================================================
*jh1ynw.jn1lfd.g .GPS.            1 u   28   64  377    56.49    0.236   10.24
+clock.nc.fukuok .GPS.            1 u   38   64  377    58.59   -0.064   16.39
+ki.nu           clock.nc.fukuok  2 u   16   64  377     2.11    0.227    0.85
xkomekome.ki.nu  jh1ynw.jn1lfd.g  2 u  401  512  376     2.04   60.209    7.32
 ml.ki.nu        0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 i.ki.nu         0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
 nazuha.ki.nu    0.0.0.0         16 -    -  512    0     0.00    0.000 16000.0
-cesium.mtk.nao. .ATOM.           1 u   26   64  377    36.50    0.429    6.61
 ntp-tk01.ocn.ad 202.234.233.104  3 u  266 1024  377    24.34   -0.106    5.69
 ntp-tk02.ocn.ad 202.234.233.104  3 u  258 1024  377    38.44   -7.155   17.27
 ntp-os01.ocn.ad 202.234.233.105  3 u  267 1024  377   228.96  -94.907   98.65
makoto@tateyama  10:32:30/010217(/var/log)# 
実はこの表示の読み方を良く知らないので、man ntpq
x designated falseticker by the intersection algorithm;
.  culled from the end of the candidate list;
- discarded by the clustering algorithm;
+ included in the final selection set;
# selected for synchronization but distance exceeds maximum;
* selected for synchronization; and
o selected for synchronization, PPS signal in use.



最近の日記
2024年03月10日
停電 (瞬電)
2024年03月03日
the second try on bare-metal
useradd
2024年02月29日
opendkim and senmail
2024年01月24日
chat/iam 0.0.8
2024年01月21日
uselocale vs setlocale (textproc/R-readxl)
以上、1 日分です。
タイトル一覧
カテゴリ分類
Powered by hns-2.19.9, HyperNikkiSystem Project

Count.cgi (since 2000/02/05)