Sur mon serveur@home, j'ai constaté plusieurs fois depuis 1 an des reboots qui avaient l'air totalement aléatoires, la fréquence très faible (< 1 par mois) ne m'a pas aidé à trouver l'origine du problème. Mes tentatives de pseudo "stress-tests" ne donnaient rien...

Aujourd'hui par hasard j'ai compris, et j'ai une recette reproductible à 100%

Sur une station 'puissante' (ici un PIII@866)
tar -cf /mnt/nfs/hang.tar /home (avec un peu plus de 2Go à copier)
Il ne finit jamais le tar, le serveur reboot systèmatiquement avant.
La meme chose sur un PII@233 fonctionne.

Les tests ou modifs effectués jusqu'ici:
- activé le NFS sur TCP coté serveur et client: reboot idem
- gros transfert de disque à disque, de /dev/zero à disque, de disque à /dev/null pour générer un max d'IO, ras, machine stable
- gros transfert réseau (du serveur vers les stations et des stations vers le serveur) avec des ping -f et/ou tcpspray, ras stable

Les chose que je penses faire:
- tester avec un 2.6
- tester avec un autre protocole que nfs (ftp?)

Une recherche m'a sorti un cas similaire causé par les drivers binaires nvidia, mais mon serveur est un headless, je n'ai pas de nvidia dedans,et d'ailleurs le noyau est très allégé de ce coté là..

La config du serveur:
Debian stable
noyau perso 2.4.26, patché cryptoloop (mais le problème existe depuis au moins le 2.4.22)
Bi-PII@400Mhz
Raid1+Raid5 soft
Chipset:
00:00.0 Host bridge: Intel Corp. 440BX/ZX - 82443BX/ZX Host bridge (rev 03)
Controleurs IDE:
00:04.1 IDE interface: Intel Corp. 82371AB PIIX4 IDE (rev 01)02:01.0
Unknown mass storage controller: Promise Technology, Inc. 20268 (rev 02)

Vala, je continuerais à fouiller, mais si vous avez liens/idées/suggestions/solutions, n'hésitez pas.