WARNING: CPU: 5 PID: 25802 at fs/xfs/libxfs/xfs_bmap.c:4530 xfs_bmapi_convert_delalloc+0x434/0x4a0 [xfs]

* WARNING: CPU: 5 PID: 25802 at fs/xfs/libxfs/xfs_bmap.c:4530 xfs_bmapi_convert_delalloc+0x434/0x4a0 [xfs]
@ 2019-11-08  6:01 Arkadiusz Miśkiewicz
  2019-11-08  6:56 ` Christoph Hellwig
  2019-11-09 22:38 ` Dave Chinner
  0 siblings, 2 replies; 16+ messages in thread
From: Arkadiusz Miśkiewicz @ 2019-11-08  6:01 UTC (permalink / raw)
  To: linux-xfs

Hello.

I have two servers:

backup4 - one with Adaptec ASR8885Q (that's the one which breaks so
often but this time adaptes works)

backup3 - other with software raid only

Both are now running 5.3.8 kernels and both end up like this log below.
It takes ~ up to day to reproduce.

Here are more complete logs and kernel configs:

https://ixion.pld-linux.org/~arekm/p2/xfs/

Any ideas what is happening and what can I do to help debug the problem?

> Nov  8 00:55:19 backup4 kernel: WARNING: CPU: 5 PID: 25802 at fs/xfs/libxfs/xfs_bmap.c:4530 xfs_bmapi_convert_delalloc+0x434/0x4a0 [xfs]
> Nov  8 00:55:19 backup4 kernel: Modules linked in: nfsd auth_rpcgss nfs_acl lockd grace sunrpc sch_sfq nfnetlink_log nfnetlink xt_NFLOG xt_comment xt_tcpudp xt_conntrack nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 iptable_filter ip_tables x_tables bpfilter xfs mlx4_ib ib_uverbs ib_core mlx4_en ses enclosure scsi_transport_sas joydev input_leds hid_generic usbhid hid coretemp intel_rapl_msr intel_rapl_common sb_edac x86_pkg_temp_thermal intel_powerclamp kvm_intel kvm iTCO_wdt iTCO_vendor_support mxm_wmi ipmi_ssif irqbypass crct10dif_pclmul crc32_pclmul ghash_clmulni_intel aesni_intel aes_x86_64 crypto_simd cryptd glue_helper xhci_pci mlx4_core intel_cstate xhci_hcd intel_uncore ehci_pci ehci_hcd igb intel_rapl_perf pcspkr ipmi_si usbcore i2c_i801 mei_me ioatdma acpi_power_meter aacraid i2c_algo_bit ipmi_devintf mei dca lpc_ich i2c_core evdev ipmi_msghandler wmi hwmon acpi_pad button sch_fq_codel ext4 libcrc32c crc32c_generic crc32c_intel crc16 mbcache jbd2 sd_mod raid1 md_mod ahci libahci libata
> Nov  8 00:55:19 backup4 kernel:  scsi_mod
> Nov  8 00:55:19 backup4 kernel: CPU: 5 PID: 25802 Comm: kworker/u65:3 Tainted: G                T 5.3.8-1 #1
> Nov  8 00:55:19 backup4 kernel: Hardware name: Supermicro X10DRi/X10DRi, BIOS 3.0a 02/06/2018
> Nov  8 00:55:19 backup4 kernel: Workqueue: writeback wb_workfn (flush-8:48)
> Nov  8 00:55:19 backup4 kernel: RIP: 0010:xfs_bmapi_convert_delalloc+0x434/0x4a0 [xfs]
> Nov  8 00:55:19 backup4 kernel: Code: b7 c0 83 c0 01 e9 9c fd ff ff 41 80 bc 24 e9 00 00 00 03 49 8d 44 24 48 74 d9 c7 84 24 c0 00 00 00 01 00 00 00 e9 94 fd ff ff <0f> 0b 41 be e4 ff ff ff 48 8d 7c 24 30 44 89 f2 44 89 ee e8 84 6f
> Nov  8 00:55:19 backup4 kernel: RSP: 0018:ffffac6346a5b838 EFLAGS: 00010246
> Nov  8 00:55:19 backup4 kernel: RAX: 0000000000000000 RBX: ffff95c8f972a000 RCX: 0000000000000022
> Nov  8 00:55:19 backup4 kernel: RDX: 0000000000001fda RSI: ffffffffffffffff RDI: ffff95c8f93b0600
> Nov  8 00:55:19 backup4 kernel: RBP: ffffac6346a5b938 R08: 0000000000000000 R09: 0000000000000001
> Nov  8 00:55:19 backup4 kernel: R10: ffff95c33e6f41d8 R11: 0000000000000026 R12: ffff95be37512a80
> Nov  8 00:55:19 backup4 kernel: R13: 0000000000000000 R14: 0000000000000000 R15: ffff95be37512ac8
> Nov  8 00:55:19 backup4 kernel: FS:  0000000000000000(0000) GS:ffff95c8ff940000(0000) knlGS:0000000000000000
> Nov  8 00:55:19 backup4 kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
> Nov  8 00:55:19 backup4 kernel: CR2: 00007ff938389000 CR3: 000000048720a001 CR4: 00000000003606e0
> Nov  8 00:55:19 backup4 kernel: DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
> Nov  8 00:55:19 backup4 kernel: DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400
> Nov  8 00:55:19 backup4 kernel: Call Trace:
> Nov  8 00:55:19 backup4 kernel:  xfs_map_blocks+0x18e/0x420 [xfs]
> Nov  8 00:55:19 backup4 kernel:  xfs_do_writepage+0x11c/0x440 [xfs]
> Nov  8 00:55:19 backup4 kernel:  write_cache_pages+0x185/0x430
> Nov  8 00:55:19 backup4 kernel:  ? xfs_vm_writepages+0x90/0x90 [xfs]
> Nov  8 00:55:19 backup4 kernel:  xfs_vm_writepages+0x5e/0x90 [xfs]
> Nov  8 00:55:19 backup4 kernel:  do_writepages+0x1c/0x60
> Nov  8 00:55:19 backup4 kernel:  __writeback_single_inode+0x41/0x360
> Nov  8 00:55:19 backup4 kernel:  writeback_sb_inodes+0x20c/0x490
> Nov  8 00:55:19 backup4 kernel:  wb_writeback+0x12a/0x320
> Nov  8 00:55:19 backup4 kernel:  wb_workfn+0xdd/0x4a0
> Nov  8 00:55:19 backup4 kernel:  process_one_work+0x1d5/0x370
> Nov  8 00:55:19 backup4 kernel:  worker_thread+0x4d/0x3d0
> Nov  8 00:55:19 backup4 kernel:  kthread+0xfb/0x140
> Nov  8 00:55:19 backup4 kernel:  ? process_one_work+0x370/0x370
> Nov  8 00:55:19 backup4 kernel:  ? kthread_park+0x80/0x80
> Nov  8 00:55:19 backup4 kernel:  ret_from_fork+0x35/0x40
> Nov  8 00:55:19 backup4 kernel: ---[ end trace a08de0c8c2851936 ]---
> Nov  8 00:55:19 backup4 kernel: XFS (sdd1): page discard on page 00000000e56e0621, inode 0x7a17f4206, offset 10354688.
> Nov  8 00:55:19 backup4 kernel: XFS (sdd1): page discard on page 000000004edc1753, inode 0x7a17f4206, offset 10358784.
> Nov  8 00:55:19 backup4 kernel: XFS (sdd1): page discard on page 0000000092e61276, inode 0x7a17f4206, offset 10362880.
> [...]
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000088af1abd, inode 0x48c3f52e0, offset 692224.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000068aea27c, inode 0x48c3f52e0, offset 696320.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): Internal error xfs_trans_cancel at line 1048 of file fs/xfs/xfs_trans.c.  Caller xfs_create+0x568/0x5d0 [xfs]
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000a3687c66, inode 0x48c3f52e0, offset 700416.
> Nov  8 00:55:24 backup4 kernel: CPU: 3 PID: 17761 Comm: cp Tainted: G        W       T 5.3.8-1 #1
> Nov  8 00:55:24 backup4 kernel: Hardware name: Supermicro X10DRi/X10DRi, BIOS 3.0a 02/06/2018
> Nov  8 00:55:24 backup4 kernel: Call Trace:
> Nov  8 00:55:24 backup4 kernel:  dump_stack+0x5c/0x78
> Nov  8 00:55:24 backup4 kernel:  xfs_trans_cancel+0x12e/0x150 [xfs]
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000005fdfc7a, inode 0x48c3f52e0, offset 704512.
> Nov  8 00:55:24 backup4 kernel:  xfs_create+0x568/0x5d0 [xfs]
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000d6f25163, inode 0x48c3f52e0, offset 708608.
> Nov  8 00:55:24 backup4 kernel:  xfs_generic_create+0x262/0x300 [xfs]
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000007856c43, inode 0x48c3f52e0, offset 712704.
> Nov  8 00:55:24 backup4 kernel:  vfs_mkdir+0x115/0x1b0
> Nov  8 00:55:24 backup4 kernel:  do_mkdirat+0x102/0x130
> Nov  8 00:55:24 backup4 kernel:  do_syscall_64+0x5b/0x120
> Nov  8 00:55:24 backup4 kernel:  entry_SYSCALL_64_after_hwframe+0x44/0xa9
> Nov  8 00:55:24 backup4 kernel: RIP: 0033:0x7f3821a6328b
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000011df7484, inode 0x48c3f52e0, offset 716800.
> Nov  8 00:55:24 backup4 kernel: Code: 48 8b 05 f8 1b 0d 00 c7 04 02 5f 00 00 00 b8 ff ff ff ff c3 66 2e 0f 1f 84 00 00 00 00 00 90 f3 0f 1e fa b8 53 00 00 00 0f 05 <48> 3d 01 f0 ff ff 73 01 c3 48 8b 0d c5 1b 0d 00 f7 d8 64 89 01 48
> Nov  8 00:55:24 backup4 kernel: RSP: 002b:00007ffefbc114e8 EFLAGS: 00000206 ORIG_RAX: 0000000000000053
> Nov  8 00:55:24 backup4 kernel: RAX: ffffffffffffffda RBX: 00007ffefbc11a10 RCX: 00007f3821a6328b
> Nov  8 00:55:24 backup4 kernel: RDX: 000000119df48827 RSI: 00000000000005c0 RDI: 00000000023d5cd0
> Nov  8 00:55:24 backup4 kernel: RBP: 00007ffefbc118e0 R08: 00007ffefbc11a10 R09: 00007ffefbc11a10
> Nov  8 00:55:24 backup4 kernel: R10: 00007ffefbc11660 R11: 0000000000000206 R12: 00000000000005c0
> Nov  8 00:55:24 backup4 kernel: R13: 0000000000000000 R14: 0000000000004000 R15: 0000000000000000
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000494ee2cb, inode 0x48c3f52e0, offset 720896.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 000000009616eed4, inode 0x48c3f52e0, offset 724992.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000ce3b6c81, inode 0x48c3f52e0, offset 729088.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 000000002768ed9c, inode 0x48c3f52e0, offset 733184.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000a136fe98, inode 0x48c3f52e0, offset 737280.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 00000000507c1fd1, inode 0x48c3f52e0, offset 741376.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 000000001ddec55a, inode 0x48c3f52e0, offset 745472.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 0000000031cb158d, inode 0x48c3f52e0, offset 749568.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 000000004bf2c3b1, inode 0x48c3f52e0, offset 753664.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): page discard on page 000000005ad5b5e3, inode 0x48c3f52e0, offset 757760.
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): xfs_do_force_shutdown(0x8) called from line 1049 of file fs/xfs/xfs_trans.c. Return address = 00000000d9b29010
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): Corruption of in-memory data detected.  Shutting down filesystem
> Nov  8 00:55:24 backup4 kernel: XFS (sdd1): Please unmount the filesystem and rectify the problem(s)

-- 
Arkadiusz Miśkiewicz, arekm / ( maven.pl | pld-linux.org )

-- 
Arkadiusz Miśkiewicz, arekm / ( maven.pl | pld-linux.org )

^ permalink raw reply	[flat|nested] 16+ messages in thread