|
Namazu for hns による簡易全文検索 詳しくは 詳細指定/ヘルプを参照して下さい |
||||||||||||||||||||||||||||||||||||||||||||||
2001年02月16日(金) 旧暦 [n年日記]#1 [機械] ki.nu 止っていた
朝 5:00 に起きて、いつもは朝はメールを確めない家人が、
メールサーバにつながらないし、www.ki.nu も見えないと言っている。
しょうがないので、www.ki.nu の卓を見ると、 「NMB CLUSTER が足りないから増やせ」というようなことを言っている。 @ 機械別状況 (OS は全て NetBSD):
@ ypbind 無で mail server が動いてしまうと makoto@ki.nu が User Unknown:
になってしまう。ので、router を落としたら、直列口の通信が出来なくなってし
まう。TA の電源を落して外からつながらないようにする。
@ iBook /mknmz が止っていた:
namazu (mknmz) を前の日から走らせていて、3:35 分に止っていた。
85683/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3084 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85684/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3085 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85685/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3086 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85686/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3087 [message/rfc822] mknmz: /amd/ki.nu./export/home/makoto/Mail/ml/namazu-dev/3088: No such file or directory makoto@nazuha ■3:35:54/010216(~/Mail)> ypwhich ^C makoto@nazuha ■5:25:05/010216(~/Mail)>今までは $ON_MEMORY_MAX = 10,000,000; していたが(実際にはカンマ無)、今回は $ON_MEMORY_MAX = 20,000,000; していた。 これが原因で NFS server に負荷がかかってしまったのではないかと思う。 普通だと client より server の方が速い機械だと思うが、僕の場合はいつも逆 なのも、問題になる原因 @ と思ったが、本当にその譜がなくて、:
namazu-devel-ja/1228
の修正をしていなかっただけで、今回の停止の件と namazu は何も関係ない。
(という結論)
@ いつも乗る 6:17 本千葉 には間に合わなかったが、6:25 には間に合って、:
6:32 の千葉駅・久里浜行には何とか座れる。(会社にはいつも通り行けた)
@ 帰って来てから ki.nu:/var/log/messages* を見るが、:makoto@milano ■8:53:06/010217(/var/log)> ls -lt mes* -rw-r--r-- 1 root wheel 60910 Feb 17 08:53 messages -rw-r--r-- 1 root wheel 4602 Feb 17 08:00 messages.0.gz -rw-r--r-- 1 root wheel 4403 Feb 17 07:00 messages.1.gz -rw-r--r-- 1 root wheel 4825 Feb 17 06:00 messages.2.gz -rw-r--r-- 1 root wheel 4609 Feb 17 05:00 messages.3.gz -rw-r--r-- 1 root wheel 4565 Feb 17 04:00 messages.4.gz -rw-r--r-- 1 root wheel 4823 Feb 17 03:00 messages.5.gzのように 一時間毎に転回されていて、過去の記録は見えなかった。 (これってどこに設定されているのかな) crontab -l より # rotate log files every hour, if necessary 0 * * * * /usr/bin/newsyslog @ -rw------- 1 root wheel 36956 Feb 16 01:00 maillog.1.gz を見たら:
問題が起きたのはもっと早い時刻。
makoto@milano 9:46:57/010217(/var/log)# zcat maillog.1.gz | grep '<makoto@ki.nu>... User unknown' Feb 15 23:39:21 milano sendmail[5329]: XAA05329: <makoto@ki.nu>... User unknown Feb 15 23:39:24 milano sendmail[4703]: XAA04703: <makoto@ki.nu>... User unknown少なくとも 111 通が失われている makoto@milano 9:47:53/010217(/var/log)# zcat maillog.[01].gz | grep '<makoto@ki.nu>... User unknown' | wc 111 999 8951 @ (2/15/2001) 23:35 頃に ypserver が使えなくなった。(原因不明):
ypserver が二つ動いているが不充分 ?
ypserv だけが反応しなくなっても、その機械が ping に応答するような状態だと 他の機械に聞きに行かない ? 機械 C の記録から makoto@komekome 11:00:46/010217(/var/log)# zcat messages.5.gz | grep ypbind | head -2 Feb 15 23:39:21 komekome ypbind[118]: broadcast: sendto: Host is down Feb 15 23:40:04 komekome ypbind[118]: broadcast: sendto: Host is down @ 全然関係ないけれど OCN NTP server:
(この辺 2/17 日に書いている)
http://www.ocn.ad.jp/ocnuser/ntp.html
これって stratum 3。何だかけちっぽいと思ってしまう。
makoto@milano 10:28:42/010217(/var/log)# ntpq -c peers remote refid st t when poll reach delay offset disp ============================================================================== +jh1ynw.jn1lfd.g .GPS. 1 u 29 128 377 54.08 0.099 16.68 *clock.nc.fukuok .GPS. 1 u 20 128 377 66.19 -4.392 14.22 202.234.233.104 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 xkomekome.ki.nu jh1ynw.jn1lfd.g 2 u 303 512 376 1.71 60.700 8.12 +ml.ki.nu cesium.mtk.nao. 2 u 75 64 376 1.83 -0.505 0.61 i.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 nazuha.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 -cesium.mtk.nao. .ATOM. 1 u 190 512 377 120.00 -42.490 107.54 ntp-tk01.ocn.ad 202.234.233.104 3 u 126 1024 377 115.75 43.570 39.54 ntp-tk02.ocn.ad 202.234.233.104 3 u 135 1024 377 23.16 0.234 3.13 ntp-os01.ocn.ad 202.234.233.105 3 u 126 1024 377 123.41 46.202 38.41さすがに ocn の stratum 2 の 202.234.233.104 の機械は通信出来ないようになっているようだ。 makoto@tateyama 10:07:18/010217(/var/log)# ntpq -c peers remote refid st t when poll reach delay offset disp ============================================================================== *jh1ynw.jn1lfd.g .GPS. 1 u 28 64 377 56.49 0.236 10.24 +clock.nc.fukuok .GPS. 1 u 38 64 377 58.59 -0.064 16.39 +ki.nu clock.nc.fukuok 2 u 16 64 377 2.11 0.227 0.85 xkomekome.ki.nu jh1ynw.jn1lfd.g 2 u 401 512 376 2.04 60.209 7.32 ml.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 i.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 nazuha.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 -cesium.mtk.nao. .ATOM. 1 u 26 64 377 36.50 0.429 6.61 ntp-tk01.ocn.ad 202.234.233.104 3 u 266 1024 377 24.34 -0.106 5.69 ntp-tk02.ocn.ad 202.234.233.104 3 u 258 1024 377 38.44 -7.155 17.27 ntp-os01.ocn.ad 202.234.233.105 3 u 267 1024 377 228.96 -94.907 98.65 makoto@tateyama 10:32:30/010217(/var/log)#実はこの表示の読み方を良く知らないので、man ntpq x designated falseticker by the intersection algorithm; . culled from the end of the candidate list; - discarded by the clustering algorithm; + included in the final selection set; # selected for synchronization but distance exceeds maximum; * selected for synchronization; and o selected for synchronization, PPS signal in use. ( つっこみ )
|
最近の日記 2024年05月06日 ・py-setuptools (python 3.11.1) ・make release took 1 hours and 10 min ・qemu invocation for 10.99.10 2024年05月05日 ・Windows 10 version ・serial connection ・bc bench 2024年05月04日 ・Trial on 10.99.10 ・another version (later trial) to succeed 2024年04月29日 ・dkim 2024年03月10日 ・停電 (瞬電) | ||