[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[Bug 7614] New: - NEC 5800/320La-R Kernel Panic with Qlogic QLA1216x



http://bugzilla.conectiva.com.br/show_bug.cgi?id=7614

           Summary: NEC 5800/320La-R Kernel Panic with Qlogic QLA1216x
           Product: Linux kernel MM
           Version: 2.4 (stable)
          Platform: i386
        OS/Version: Linux
            Status: UNCONFIRMED
          Severity: blocker
          Priority: P3
         Component: linux mm
        AssignedTo: linux-mm-bugs@nl.linux.org
        ReportedBy: jfguarda@componente.cl
                CC: jfguarda@componente.cl


El servidor tiene las siguientes características: 
 
- Fault Tolerant 
- Dual Processor Intel Pentium III 
- 2 GB RAM 
- HD SCSI de 36 GB x 5 
- SCSI Controller QLogic QLA1216x 
- Redundant Power Supply 
- Redundant Fast Ethernet Controller Intel EtherExpress Pro 100 
- Redundant Gigabit Ethernet Controller Intel EtherExpress Pro 1000 
 
El esquema de Particiones es el siguiente: 
 
Filesystem           1k-blocks      Used Available Use% Mounted on 
/dev/sda6             27822252    252404  26156524   1% / 
/dev/sda1               126915     10899    109464  10% /boot 
/dev/sda5              5039600   1395936   3387668  30% /usr 
/dev/nb0              35007104     88088  33140744   1% /mirror 
 
Donde /dev/nb0 es un dispositivo DRBD formado por un RAID 5 
 
El RAID 5 esta compuesto por dos discos SCSI como se indica a continuación: 
 
raiddev /dev/md0 
	raid-level		5 
	nr-raid-disk		3 
	persistent-superblock	1 
	chunk-size		8 
 
	device			/dev/sdc1 
	raid-disk		0 
	device			/dev/sdd1 
	raid-disk		1 
 
Se instaló Conectiva Linux 8.0, quedando Lilo con las siguientes entradas: 
 
boot=/dev/sda 
map=/boot/map 
install=/boot/boot.b 
prompt 
timeout=50 
message=/boot/message 
default=linux 
image=/boot/vmlinuz-2.4.18-2clsmp 
        label=linux 
        root=/dev/sda3 
        initrd=/boot/initrd-2.4.18-2clsmp.img 
        read-only 
image=/boot/vmlinuz-2.4.18-2cl 
        label=linux-up 
        root=/dev/sda3 
        initrd=/boot/initrd-2.4.18-2cl.img 
        read-only 
image=/boot/memtest86 
        label=memtest 
 
Cuando se inicia la máquina con la opción "linux", correspondiente al kernel 
2.4.18-2cl-smp, el servidor simplemente queda congelado. Se aplicó el upgrade 
de kernel para Conectiva 8.0, quedando instalada la versión 
kernel-smp-2.4.19-1U80_8cl, pero el efecto fue el mismo. La máquina congelada. 
 
Luego se instaló kernel-source-2.4.19-1U80_8cl.i386.rpm, y se agregaron las 
opciones de SMP y Bigmem (4GB), se compiló sin problemas y al iniciar el 
servidor se obtuvo el siguiente error. 
 
Unable to handle kernel paging request at virtual address 245c8b57 
  printing eip: 
c0123565 
*pde = 00000000 
Oops : 0002 
CPU : 1 
EIP : 0010:[<c0123565>]  Not tainted 
EFLAGS: 00010083 
eax: f783f600  ebx: c0350704  ecx: c01bb6f8  edx: c0350744 
esi: 245c8b53  edi: c0350520  ebp: 00000000  esp: c7fe7ed0 
ds: 0018    es: 0018    ss: 0018 
Process Swapper (pid: 0, stackpage=c7fe7000) 
Stack: 00000000 00000020 00000000 c034f6a0 0011bc00 00000000 0011bc00 00000004 
       00000001 c7fe7ef4 c7fe7ef4 c011fb5e c034faa0 c011fa33 00000000 c03285e0 
       00000001 fffffffe 00000020 c011f7bf c03285e0 c034f6a0 c0324800 00000000 
Call Trace: [<c011fb5e>] [<c011fa33>] [<c011f7bf>] [<c010a2cb>] [<c010c808>] 
  [<c019d463>] [<c019d354>] [<c0106d50>] [<c0106d50>] [<c0106de2>] 
[<c011b4db>] 
[<c011b3ed>] 
 
Code: 89 46 04 89 30 8b 41 08 89 c2 2b 54 24 18 85 ed 74 09 89 e8 
 <0> Kernel panic: Aiee. killing interrupt handler! 
In interrupt handler - not syncing 
 
Se ejecutó ksymoops -v vmlinux -m System.map -K -L -O < panic.txt obteniendose 
el siguiente backtrace 
ksymoops 2.4.3 on i686 2.4.18-2cl.  Options used 
     -v /boot/componente (specified) 
     -K (specified) 
     -L (specified) 
     -O (specified) 
     -m /boot/System.map.componente (specified) 
 
Error (pclose_local): read_nm_symbols pclose failed 0x100 
Warning (read_vmlinux): no kernel symbols in vmlinux, is /boot/componente a 
valid vmlinux file? 
Unable to handle kernel paging request at virtual address 245c8b57 
c0123565 
*pde = 00000000 
EFLAGS: 00010083 
eax: f783f600  ebx: c0350704  ecx: c01bb6f8  edx: c0350744 
esi: 245c8b53  edi: c0350520  ebp: 00000000  esp: c7fe7ed0 
ds: 0018    es: 0018    ss: 0018 
Process Swapper (pid: 0, stackpage=c7fe7000) 
Stack: 00000000 00000020 00000000 c034f6a0 0011bc00 00000000 0011bc00 00000004 
       00000001 c7fe7ef4 c7fe7ef4 c011fb5e c034faa0 c011fa33 00000000 c03285e0 
       00000001 fffffffe 00000020 c011f7bf c03285e0 c034f6a0 c0324800 00000000 
Call Trace: [<c011fb5e>] [<c011fa33>] [<c011f7bf>] [<c010a2cb>] [<c010c808>] 
  [<c019d463>] [<c019d354>] [<c0106d50>] [<c0106d50>] [<c0106de2>] 
[<c011b4db>] 
[<c011b3ed>] 
Code: 89 46 04 89 30 8b 41 08 89 c2 2b 54 24 18 85 ed 74 09 89 e8 
Using defaults from ksymoops -t elf32-i386 -a i386 
 
Trace; c011fb5e <bh_action+4a/80> 
Trace; c011fa32 <tasklet_hi_action+66/a0> 
Trace; c011f7be <do_softirq+6e/cc> 
Trace; c010a2ca <do_IRQ+da/ec> 
Trace; c010c808 <call_do_IRQ+6/e> 
Trace; c019d462 <pr_power_idle+10e/274> 
Trace; c019d354 <pr_power_idle+0/274> 
Trace; c0106d50 <default_idle+0/34> 
Trace; c0106d50 <default_idle+0/34> 
Trace; c0106de2 <cpu_idle+3e/54> 
Trace; c011b4da <release_console_sem+8e/98> 
Trace; c011b3ec <printk+124/140> 
Code;  00000000 Before first symbol 
00000000 <_EIP>: 
Code;  00000000 Before first symbol 
   0:   89 46 04                  mov    %eax,0x4(%esi) 
Code;  00000002 Before first symbol 
   3:   89 30                     mov    %esi,(%eax) 
Code;  00000004 Before first symbol 
   5:   8b 41 08                  mov    0x8(%ecx),%eax 
Code;  00000008 Before first symbol 
   8:   89 c2                     mov    %eax,%edx 
Code;  0000000a Before first symbol 
   a:   2b 54 24 18               sub    0x18(%esp,1),%edx 
Code;  0000000e Before first symbol 
   e:   85 ed                     test   %ebp,%ebp 
Code;  00000010 Before first symbol 
  10:   74 09                     je     1b <_EIP+0x1b> 0000001a Before first 
symbol 
Code;  00000012 Before first symbol 
  12:   89 e8                     mov    %ebp,%eax 
 
 <0> Kernel panic: Aiee. killing interrupt handler! 
 
1 warning and 1 error issued.  Results may not be reliable. 
 
Lo raro es que la máquina inicia normalmente con la opción "linux-up" del 
kernel, reconociendo hasta 900MB de RAM y un solo procesador, tal como se 
indica a continuación: 
 
#free 
             total       used       free     shared    buffers     cached 
Mem:        900644     343388     557256          0      57820     130280 
-/+ buffers/cache:     155288     745356 
Swap:      2047992          0    2047992 
 
... y solo una CPU... 
 
#cat /proc/cpuinfo 
processor       : 0 
vendor_id       : GenuineIntel 
cpu family      : 6 
model           : 8 
model name      : Pentium III (Coppermine) 
stepping        : 6 
cpu MHz         : 800.071 
cache size      : 256 KB 
fdiv_bug        : no 
hlt_bug         : no 
f00f_bug        : no 
coma_bug        : no 
fpu             : yes 
fpu_exception   : yes 
cpuid level     : 2 
wp              : yes 
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca 
cmov pat pse36 mmx fxsr sse 
bogomips        : 1595.80 
 
Las tarjetas Gigabit y SCSI no son bien reconocida por el sistema operativo.. 
 
#lspci 
 
00:00.0 Host bridge: Relience Computer CNB20HE (rev 06) 
00:00.1 Host bridge: Relience Computer CNB20HE (rev 06) 
00:05.0 PCI bridge: Stratus Computer Systems: Unknown device 1000 
00:06.0 PCI bridge: Stratus Computer Systems: Unknown device 1000 
00:07.0 ISA bridge: NEC Corporation: Unknown device 00de (rev f4) 
01:00.0 VGA compatible controller: Chips and Technologies F69000 HiQVideo (rev 
64) 
01:02.0 Ethernet controller: Intel Corporation: Unknown device 1004 (rev 02) 
01:05.0 SCSI storage controller: Q Logic: Unknown device 1216 (rev 06) 
01:06.0 Ethernet controller: Intel Corporation 82557 [Ethernet Pro 100] (rev 
08) 
01:0f.0 ISA bridge: Relience Computer: Unknown device 0200 (rev 4f) 
01:0f.1 IDE interface: Relience Computer: Unknown device 0211 
01:0f.2 USB Controller: Relience Computer: Unknown device 0220 (rev 04) 
 
La urgencia en este momento es habilitar las características SMP y BigMem del 
servidor, además de trabajar con el DRBD del RAID 5 que contendrá toda la 
información. 
 
Agradezco cualquier ayuda... 
 
Atentos saludos 
 
=========================================================== 
Juan Francisco Guarda Ramírez | Avda. 11 de Septiembre 1881 
Gerente de Operaciones        | Oficina 813 
Componente IT Solutions Ltda. | Providencia 
jfguarda@componente.cl        | http://www.componente.cl 
===========================================================
--
Linux-mm-bugs:  bugzilla list for the Linux-MM subsystem
Archive:        http://mail.nl.linux.org/linux-mm-bugs/
Web site:       http://linux-mm.org/
Development:    linux-mm@kvack.org