Salut,
Je suis un peu perdu avec les perfs catastrophiques d'un de nos serveurs NFS (serveur DELL, Linux CentOS 5.1, Xeon 3GHz, RAID5 SCSI PERC). Après avoir regardé un
peu partout, je suis tombé sur quelquechose qui ne m'avait pas frappé auparavant, la fluctuation du Load Average (qui fait des pointes à 8, voire 9).
Dans le même temps, sur les postes clients, on observe de façon régulière des :
nfs: server XXX not responding, still trying
nfs: server XXX OK
Est-ce lié? est-ce le problème de connexion qui fait augmenter le Load Average ou plus vraisemblablement l'inverse?
Voici l'état de la machine :
[root@XXX ~]# uptime
16:41:06 up 3:30, 1 user, load average: 7.46, 5.53, 3.66
[root@XXX ~]# vmstat
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 2 0 383904 413352 2596632 0 0 53 272 166 1129 0 3 65 32 0
[root@XXX ~]# top
top - 16:41:23 up 3:30, 1 user, load average: 6.84, 5.52, 3.70
Tasks: 124 total, 1 running, 123 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.3%us, 1.5%sy, 0.0%ni, 64.7%id, 32.1%wa, 0.0%hi, 1.4%si, 0.0%st
Mem: 3631900k total, 3247856k used, 384044k free, 413368k buffers
Swap: 2096440k total, 0k used, 2096440k free, 2596828k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
2501 root 15 0 0 0 0 S 2 0.0 0:56.58 nfsd
2505 root 15 0 0 0 0 S 2 0.0 0:56.86 nfsd
Beaucoup de temps à l'air de passer en attente d'I/O mais je n'arrive pas à analyser plus finement la situation (en tout cas le CPU n'a rien à faire à priori). Mais
normalement un processus en attente n'est pas comptabilisé par le Load Average ?? (puisque le CPU est inactif?)
Des idées?
Merci d'avance
Poste le Friday 10 October 2008 17:20:58