|
Namazu for hns による簡易全文検索 詳しくは 詳細指定/ヘルプを参照して下さい |
||||||||||||||||||||||||||||||||||||||||||||||
2001年02月16日(金) 旧暦 [n年日記]#1 [機械] ki.nu 止っていた
朝 5:00 に起きて、いつもは朝はメールを確めない家人が、
メールサーバにつながらないし、www.ki.nu も見えないと言っている。
しょうがないので、www.ki.nu の卓を見ると、 「NMB CLUSTER が足りないから増やせ」というようなことを言っている。 @ 機械別状況 (OS は全て NetBSD):
@ ypbind 無で mail server が動いてしまうと makoto@ki.nu が User Unknown:
になってしまう。ので、router を落としたら、直列口の通信が出来なくなってし
まう。TA の電源を落して外からつながらないようにする。
@ iBook /mknmz が止っていた:
namazu (mknmz) を前の日から走らせていて、3:35 分に止っていた。
85683/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3084 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85684/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3085 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85685/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3086 [message/rfc822] @@ 部品: mailnews.pl @@ Processing mail/news file ... 85686/181641 - /amd/host/export/home/makoto/Mail/ml/namazu-dev/3087 [message/rfc822] mknmz: /amd/ki.nu./export/home/makoto/Mail/ml/namazu-dev/3088: No such file or directory makoto@nazuha ■3:35:54/010216(~/Mail)> ypwhich ^C makoto@nazuha ■5:25:05/010216(~/Mail)>今までは $ON_MEMORY_MAX = 10,000,000; していたが(実際にはカンマ無)、今回は $ON_MEMORY_MAX = 20,000,000; していた。 これが原因で NFS server に負荷がかかってしまったのではないかと思う。 普通だと client より server の方が速い機械だと思うが、僕の場合はいつも逆 なのも、問題になる原因 @ と思ったが、本当にその譜がなくて、:
namazu-devel-ja/1228
の修正をしていなかっただけで、今回の停止の件と namazu は何も関係ない。
(という結論)
@ いつも乗る 6:17 本千葉 には間に合わなかったが、6:25 には間に合って、:
6:32 の千葉駅・久里浜行には何とか座れる。(会社にはいつも通り行けた)
@ 帰って来てから ki.nu:/var/log/messages* を見るが、:makoto@milano ■8:53:06/010217(/var/log)> ls -lt mes* -rw-r--r-- 1 root wheel 60910 Feb 17 08:53 messages -rw-r--r-- 1 root wheel 4602 Feb 17 08:00 messages.0.gz -rw-r--r-- 1 root wheel 4403 Feb 17 07:00 messages.1.gz -rw-r--r-- 1 root wheel 4825 Feb 17 06:00 messages.2.gz -rw-r--r-- 1 root wheel 4609 Feb 17 05:00 messages.3.gz -rw-r--r-- 1 root wheel 4565 Feb 17 04:00 messages.4.gz -rw-r--r-- 1 root wheel 4823 Feb 17 03:00 messages.5.gzのように 一時間毎に転回されていて、過去の記録は見えなかった。 (これってどこに設定されているのかな) crontab -l より # rotate log files every hour, if necessary 0 * * * * /usr/bin/newsyslog @ -rw------- 1 root wheel 36956 Feb 16 01:00 maillog.1.gz を見たら:
問題が起きたのはもっと早い時刻。
makoto@milano 9:46:57/010217(/var/log)# zcat maillog.1.gz | grep '<makoto@ki.nu>... User unknown' Feb 15 23:39:21 milano sendmail[5329]: XAA05329: <makoto@ki.nu>... User unknown Feb 15 23:39:24 milano sendmail[4703]: XAA04703: <makoto@ki.nu>... User unknown少なくとも 111 通が失われている makoto@milano 9:47:53/010217(/var/log)# zcat maillog.[01].gz | grep '<makoto@ki.nu>... User unknown' | wc 111 999 8951 @ (2/15/2001) 23:35 頃に ypserver が使えなくなった。(原因不明):
ypserver が二つ動いているが不充分 ?
ypserv だけが反応しなくなっても、その機械が ping に応答するような状態だと 他の機械に聞きに行かない ? 機械 C の記録から makoto@komekome 11:00:46/010217(/var/log)# zcat messages.5.gz | grep ypbind | head -2 Feb 15 23:39:21 komekome ypbind[118]: broadcast: sendto: Host is down Feb 15 23:40:04 komekome ypbind[118]: broadcast: sendto: Host is down @ 全然関係ないけれど OCN NTP server:
(この辺 2/17 日に書いている)
http://www.ocn.ad.jp/ocnuser/ntp.html
これって stratum 3。何だかけちっぽいと思ってしまう。
makoto@milano 10:28:42/010217(/var/log)# ntpq -c peers remote refid st t when poll reach delay offset disp ============================================================================== +jh1ynw.jn1lfd.g .GPS. 1 u 29 128 377 54.08 0.099 16.68 *clock.nc.fukuok .GPS. 1 u 20 128 377 66.19 -4.392 14.22 202.234.233.104 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 xkomekome.ki.nu jh1ynw.jn1lfd.g 2 u 303 512 376 1.71 60.700 8.12 +ml.ki.nu cesium.mtk.nao. 2 u 75 64 376 1.83 -0.505 0.61 i.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 nazuha.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 -cesium.mtk.nao. .ATOM. 1 u 190 512 377 120.00 -42.490 107.54 ntp-tk01.ocn.ad 202.234.233.104 3 u 126 1024 377 115.75 43.570 39.54 ntp-tk02.ocn.ad 202.234.233.104 3 u 135 1024 377 23.16 0.234 3.13 ntp-os01.ocn.ad 202.234.233.105 3 u 126 1024 377 123.41 46.202 38.41さすがに ocn の stratum 2 の 202.234.233.104 の機械は通信出来ないようになっているようだ。 makoto@tateyama 10:07:18/010217(/var/log)# ntpq -c peers remote refid st t when poll reach delay offset disp ============================================================================== *jh1ynw.jn1lfd.g .GPS. 1 u 28 64 377 56.49 0.236 10.24 +clock.nc.fukuok .GPS. 1 u 38 64 377 58.59 -0.064 16.39 +ki.nu clock.nc.fukuok 2 u 16 64 377 2.11 0.227 0.85 xkomekome.ki.nu jh1ynw.jn1lfd.g 2 u 401 512 376 2.04 60.209 7.32 ml.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 i.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 nazuha.ki.nu 0.0.0.0 16 - - 512 0 0.00 0.000 16000.0 -cesium.mtk.nao. .ATOM. 1 u 26 64 377 36.50 0.429 6.61 ntp-tk01.ocn.ad 202.234.233.104 3 u 266 1024 377 24.34 -0.106 5.69 ntp-tk02.ocn.ad 202.234.233.104 3 u 258 1024 377 38.44 -7.155 17.27 ntp-os01.ocn.ad 202.234.233.105 3 u 267 1024 377 228.96 -94.907 98.65 makoto@tateyama 10:32:30/010217(/var/log)#実はこの表示の読み方を良く知らないので、man ntpq x designated falseticker by the intersection algorithm; . culled from the end of the candidate list; - discarded by the clustering algorithm; + included in the final selection set; # selected for synchronization but distance exceeds maximum; * selected for synchronization; and o selected for synchronization, PPS signal in use. ( つっこみ )
|
最近の日記 2025年02月13日 ・dvipdfmx ICC profile format spec. version 4.3.0 2025年01月29日 ・ham/wsjtx 2025年01月27日 ・wip/wsjtx 5.4.2 2025年01月25日 ・ham/wsjtx 2025年01月15日 ・今更 advent calendar | ||