OVH Community, your new community space.

Warning net/sched/sch_generic.c:226 - pravděpodobný bug v driveru síťovky?


lubos
07-27-2009, 03:09 PM
Citace Původně publikováno Kenji
Server reinstallován na FreeBSD 7.1 a tam je to v pořádku. Takže to je jen Linuxová záležitost.
Zkusili jsme to i s defaulním OVH kernelem (jen s přidaným NFS serverem) a stejný problém.
Pěkné. Ale nestačí. Potřebuji od vás název serveru(ů) a NIC-Handle. Prosím pošlete e-mailem na podporu. Ď.

(a zároveň prosím popište HW situaci - vaší větě "Několik dní po nahození NFS serveru na Kimsufi, používaném na RPS V klientu jsem narazil na pravděpodobný bug v driveru síťové karty, používané v Kimsufi L." nerozumím...)

Kenji
07-25-2009, 09:20 PM
Server reinstallován na FreeBSD 7.1 a tam je to v pořádku. Takže to je jen Linuxová záležitost.
Zkusili jsme to i s defaulním OVH kernelem (jen s přidaným NFS serverem) a stejný problém.

Kenji
07-25-2009, 12:46 AM
Několik dní po nahození NFS serveru na Kimsufi, používaném na RPS V klientu jsem narazil na pravděpodobný bug v driveru síťové karty, používané v Kimsufi L.
Při velké zátěži se v dmesg objeví výpis a rozhraní spadne, pomůže jen reboot přes managera.

Call trace:
Kód:
Jul 24 21:10:39 shiva kernel: WARNING: at net/sched/sch_generic.c:226 dev_watchdog+0x1f1/0x200()
Jul 24 21:10:39 shiva kernel: NETDEV WATCHDOG: eth0 (sis900): transmit timed out
Jul 24 21:10:39 shiva kernel: Modules linked in: nfs
Jul 24 21:10:39 shiva kernel: Pid: 0, comm: swapper Not tainted 2.6.28.4-shiva #3
Jul 24 21:10:39 shiva kernel: Call Trace:
Jul 24 21:10:39 shiva kernel:   [] warn_slowpath+0xcd/0x110
Jul 24 21:10:39 shiva kernel: [] rt_intern_hash+0x332/0x340
Jul 24 21:10:39 shiva kernel: [] ip_route_input+0x4c4/0x1060
Jul 24 21:10:39 shiva kernel: [] enqueue_task_fair+0x166/0x1a0
Jul 24 21:10:39 shiva kernel: [] activate_task+0x56/0x70
Jul 24 21:10:39 shiva kernel: [] send_signal+0x117/0x2c0
Jul 24 21:10:39 shiva kernel: [] strlcpy+0x41/0x50
Jul 24 21:10:39 shiva kernel: [] dev_watchdog+0x0/0x200
Jul 24 21:10:39 shiva kernel: [] dev_watchdog+0x1f1/0x200
Jul 24 21:10:39 shiva kernel: [] activate_task+0x56/0x70
Jul 24 21:10:39 shiva kernel: [] sis900_timer+0x99/0x300
Jul 24 21:10:39 shiva kernel: [] run_timer_softirq+0x118/0x1d0
Jul 24 21:10:39 shiva kernel: [] __do_softirq+0x73/0x120
Jul 24 21:10:39 shiva kernel: [] call_softirq+0x1c/0x30
Jul 24 21:10:39 shiva kernel: [] do_softirq+0x35/0x70
Jul 24 21:10:39 shiva kernel: [] irq_exit+0x95/0xa0
Jul 24 21:10:39 shiva kernel: [] smp_apic_timer_interrupt+0x4d/0x80
Jul 24 21:10:39 shiva kernel: [] apic_timer_interrupt+0x6b/0x70
Jul 24 21:10:39 shiva kernel:   [] mwait_idle+0x39/0x50
Jul 24 21:10:39 shiva kernel: [] cpu_idle+0x49/0x90
Dále se objeví ještě tyto výpisy před call trace:
Kód:
Jul 24 20:50:57 shiva kernel: eth0: Transmit error, Tx status 06000042.
a po ní:
Kód:
Jul 24 21:42:31 shiva kernel: eth0: Transmit timeout, status 00000005 00000000
Testováno na kernelu 2.6.28.4, 2.6.30.1, 2.6.30.2 a i na starém 2.6.26, který je v Debianu jako stabilní.

Nikde jsem nenašel žádné řešení, bug jsem postnul s přiloženým kernel configem na bugzillu kernelu a čekám na vyjádření vývojářů.
Neřešil to už někdo od OVH?

Zatím zkoušíme dělat další testy a odhalit chybu.