Linux kernel v4.15-rc4 and rdma_rxe

* Linux kernel v4.15-rc4 and rdma_rxe
@ 2017-12-20  1:10 Bart Van Assche
       [not found] ` <1513732236.2535.25.camel-Sjgp3cTcYWE@public.gmane.org>
  0 siblings, 1 reply; 10+ messages in thread
From: Bart Van Assche @ 2017-12-20  1:10 UTC (permalink / raw)
  To: linux-rdma-u79uwXL29TY76Z2rM5mHXA

[-- Warning: decoded text below may be mangled, UTF-8 assumed --]
[-- Attachment #1: Type: text/plain; charset="utf-8", Size: 4798 bytes --]

Hello,

Can anyone who is reading this list tell me whether or not the rdma_rxe
driver undergoes regular testing? It was a few months ago that I tried to
run the SRP protocol over that driver. When I tried again today I ran into
the call trace shown below. I can share the details of the test I ran in
case anyone would be interested.

watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [kworker/1:0:2110]
Modules linked in: ib_srp libcrc32c scsi_transport_srp crc32c_generic target_core_pscsi target_core_file ib_srpt target_core_iblock target_core_mod rdma_rxe ip6_udp_tunnel udp_tunnel ib_umad
ib_uverbs scsi_debug brd mq_deadline deadline_iosched cfq_iosched crct10dif_pclmul crc32_pclmul ghash_clmulni_intel pcbc aesni_intel aes_x86_64 crypto_simd cryptd glue_helper sg serio_raw
virtio_balloon virtio_console button i2c_piix4 af_packet dm_multipath dm_mod dax scsi_dh_rdac scsi_dh_emc scsi_dh_alua ib_iser rdma_cm iw_cm ib_cm ib_core configfs iscsi_tcp libiscsi_tcp libiscsi
scsi_transport_iscsi ip_tables x_tables ipv6 autofs4 ext4 crc16 mbcache jbd2 sd_mod virtio_blk virtio_scsi sr_mod cdrom virtio_net ata_generic pata_acpi ata_piix uhci_hcd psmouse libata i2c_core
crc32c_intel atkbd virtio_pci
ehci_hcd virtio_ring virtio intel_agp usbcore intel_gtt scsi_mod usb_common agpgart unix [last unloaded: scsi_transport_srp]
irq event stamp: 57031930
hardirqs last  enabled at (57031929): [<000000002d4feb01>] _raw_spin_unlock_irqrestore+0x5a/0x70
hardirqs last disabled at (57031930): [<00000000ec2d6096>] apic_timer_interrupt+0x98/0xb0
softirqs last  enabled at (165802): [<0000000034ea4c57>] __do_softirq+0x3af/0x52c
softirqs last disabled at (165701): [<000000008110c584>] irq_exit+0xb6/0xc0
CPU: 1 PID: 2110 Comm: kworker/1:0 Not tainted 4.15.0-rc4-dbg+ #1
Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS 1.0.0-prebuilt.qemu-project.org 04/01/2014
Workqueue: events_freezable_power_ disk_events_workfn
RIP: 0010:_raw_spin_unlock_irqrestore+0x5f/0x70
RSP: 0018:ffffa6a7cf9933f8 EFLAGS: 00000246 ORIG_RAX: ffffffffffffff11
RAX: ffff8dea7c1ed0c0 RBX: 0000000000000246 RCX: 0000000000000006
RDX: 0000000000000007 RSI: ffff8dea7c1ed9d0 RDI: 0000000000000246
RBP: ffffa6a7cf993408 R08: 0000000000000000 R09: 0000000000000000
R10: 0000000000000000 R11: 0000000000000000 R12: ffff8dea7fc91080
R13: 0000000000000001 R14: 000000000000008f R15: ffff8dea680ca170
FS:  0000000000000000(0000) GS:ffff8dea7fc80000(0000) knlGS:0000000000000000
CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 00007ffc75667cd0 CR3: 0000000058a0f002 CR4: 00000000003606e0
DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400
Call Trace:
mod_timer+0x1b9/0x4b0
? _raw_spin_unlock_irqrestore+0x45/0x70
rxe_completer+0xa07/0xbf0 [rdma_rxe]
rxe_do_task+0x7c/0x100 [rdma_rxe]
rxe_run_task+0x16/0x30 [rdma_rxe]
rxe_comp_queue_pkt+0x42/0x50 [rdma_rxe]
rxe_rcv+0x2f1/0x8b0 [rdma_rxe]
rxe_loopback+0x9/0x10 [rdma_rxe]
? rxe_loopback+0x9/0x10 [rdma_rxe]
send_ack+0x9a/0x190 [rdma_rxe]
rxe_responder+0x1637/0x1db0 [rdma_rxe]
? _raw_spin_unlock_irqrestore+0x5a/0x70
? trace_hardirqs_on_caller+0xf4/0x190
rxe_do_task+0x7c/0x100 [rdma_rxe]
rxe_run_task+0x16/0x30 [rdma_rxe]
rxe_resp_queue_pkt+0x42/0x50 [rdma_rxe]
rxe_rcv+0x364/0x8b0 [rdma_rxe]
rxe_loopback+0x9/0x10 [rdma_rxe]
? rxe_loopback+0x9/0x10 [rdma_rxe]
rxe_requester+0x6ea/0x1160 [rdma_rxe]
rxe_do_task+0x7c/0x100 [rdma_rxe]
rxe_run_task+0x16/0x30 [rdma_rxe]
rxe_post_send+0x2f0/0x550 [rdma_rxe]
srp_queuecommand+0x29f/0x430 [ib_srp]
? __lock_is_held+0x5a/0xa0
scsi_dispatch_cmd+0xfd/0x400 [scsi_mod]
scsi_queue_rq+0x4ed/0x640 [scsi_mod]
blk_mq_dispatch_rq_list+0x71/0x420
? blk_mq_dequeue_from_ctx+0x128/0x1b0
blk_mq_do_dispatch_ctx+0xd2/0x120
blk_mq_sched_dispatch_requests+0x14e/0x1a0
__blk_mq_run_hw_queue+0x12a/0x1d0
__blk_mq_delay_run_hw_queue+0x9f/0xf0
blk_mq_run_hw_queue+0xb9/0x1e0
blk_mq_sched_insert_request+0x9d/0x190
? __lockdep_init_map+0x52/0x1d0
blk_execute_rq_nowait+0x7c/0x100
blk_execute_rq+0x5f/0xb0
scsi_execute+0xd6/0x1f0 [scsi_mod]
scsi_test_unit_ready+0x4c/0xc0 [scsi_mod]
sd_check_events+0xc9/0x170 [sd_mod]
disk_check_events+0x4e/0x120
disk_events_workfn+0x17/0x20
process_one_work+0x211/0x6a0
worker_thread+0x38/0x3b0
kthread+0x124/0x140
? process_one_work+0x6a0/0x6a0
? kthread_create_worker_on_cpu+0x40/0x40
ret_from_fork+0x24/0x30
Code: 00 00 e8 25 c7 b3 ff bf 01 00 00 00 e8 fb f8 b0 ff 65 8b 05 f4 f3 a8 4c 85 c0 74 16 5b 41 5c 5d c3 e8 f6 f2 b3 ff 48 89 df 57 9d <0f> 1f 44 00 00 eb d5 e8 7d 40 a8 ff 5b 41 5c 5d c3 55 48 89
e5 N‹§²æìr¸›yúèšØb²X¬¶Ç§vØ^–)Þº{.nÇ+‰·¥Š{±ÙšŠ{ayº\x1dÊ‡Ú™ë,j\a¢f£¢·hš‹»öì\x17/oSc¾™Ú³9˜uÀ¦æå‰È&jw¨®\x03(éšŽŠÝ¢j"ú\x1a¶^[m§ÿïêäz¹Þ–Šàþf£¢·hšˆ§~ˆmš

^ permalink raw reply	[flat|nested] 10+ messages in thread