Greeting, FYI, we noticed a -47.5% regression of filebench.sum_bytes_mb/s due to commit: commit: 22d05173fcdcccc1560de717b4b0b02d25a9ca75 ("xfs: deferred inode inactivation") https://git.kernel.org/cgit/linux/kernel/git/djwong/xfs-linux.git repair-hard-problems in testcase: filebench on test machine: 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory with following parameters: disk: 1HDD fs: xfs test: fileserver.f cpufreq_governor: performance ucode: 0x27 In addition to that, the commit also has significant impact on the following tests: +------------------+------------------------------------------------------------------+ | testcase: change | filebench: filebench.sum_bytes_mb/s -67.7% regression | | test machine | 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory | | test parameters | cpufreq_governor=performance | | | disk=1HDD | | | fs=xfs | | | test=webproxy.f | | | ucode=0x27 | +------------------+------------------------------------------------------------------+ If you fix the issue, kindly add following tag Reported-by: kernel test robot Details are as below: --------------------------------------------------------------------------------------------------> To reproduce: git clone https://github.com/intel/lkp-tests.git cd lkp-tests bin/lkp install job.yaml # job file is attached in this email bin/lkp run job.yaml ========================================================================================= compiler/cpufreq_governor/disk/fs/kconfig/rootfs/tbox_group/test/testcase/ucode: gcc-7/performance/1HDD/xfs/x86_64-rhel-7.6/debian-x86_64-20191114.cgz/lkp-hsw-d01/fileserver.f/filebench/0x27 commit: 1ef4da0e32 ("xfs: pass around xfs_inode_ag_walk iget/irele helper functions") 22d05173fc ("xfs: deferred inode inactivation") 1ef4da0e32ff780d 22d05173fcdcccc1560de717b4b ---------------- --------------------------- %stddev %change %stddev \ | \ 160.20 -47.5% 84.05 ± 2% filebench.sum_bytes_mb/s 403786 -47.1% 213611 ± 2% filebench.sum_operations 6729 -47.1% 3559 ± 2% filebench.sum_operations/s 611.75 -47.1% 323.50 ± 2% filebench.sum_reads/s 7.39 +89.3% 14.00 ± 2% filebench.sum_time_ms/op 1223 -47.1% 647.50 ± 2% filebench.sum_writes/s 12115404 -39.2% 7366800 filebench.time.file_system_outputs 3948 ± 9% -35.6% 2544 ± 13% filebench.time.involuntary_context_switches 18.25 ± 2% -45.2% 10.00 filebench.time.percent_of_cpu_this_job_got 10.49 -45.6% 5.71 filebench.time.system_time 126690 -61.7% 48539 filebench.time.voluntary_context_switches 247153 -23.2% 189712 meminfo.Active(file) 2.36 ± 3% -0.8 1.57 mpstat.cpu.all.sys% 21.25 ± 2% +5.9% 22.50 ± 2% vmstat.cpu.wa 10401 ± 2% -10.3% 9333 vmstat.io.bo 33204 -5.3% 31452 vmstat.system.cs 284071 ± 46% -62.0% 107819 ± 18% cpuidle.C1.usage 1011674 ± 11% +13.0% 1143214 ± 9% cpuidle.C1E.usage 919405 ±123% -93.8% 57392 ± 8% cpuidle.POLL.time 296046 ±120% -92.7% 21599 ± 9% cpuidle.POLL.usage 546.75 ± 11% -54.5% 248.50 ± 2% interrupts.CPU0.RES:Rescheduling_interrupts 596.25 ± 4% -53.0% 280.00 ± 20% interrupts.CPU1.RES:Rescheduling_interrupts 540.75 ± 3% -34.1% 356.50 ± 16% interrupts.CPU7.RES:Rescheduling_interrupts 4673 ± 6% -30.8% 3233 ± 9% interrupts.RES:Rescheduling_interrupts 226.50 ± 3% -16.6% 189.00 turbostat.Avg_MHz 6.34 ± 3% -1.0 5.31 turbostat.Busy% 283487 ± 46% -62.2% 107234 ± 19% turbostat.C1 1011472 ± 11% +13.0% 1143059 ± 9% turbostat.C1E 21.74 +4.3% 22.68 iostat.cpu.iowait 2.43 ± 3% -32.9% 1.63 iostat.cpu.system 1.85 +1.7% 1.88 iostat.sda.avgqu-sz 99.47 ± 2% -4.8% 94.70 iostat.sda.w/s 10499 ± 2% -10.1% 9435 iostat.sda.wkB/s 11.90 ± 4% +26.3% 15.02 iostat.sda.wrqm/s 12931 ± 5% -9.8% 11659 ± 3% softirqs.CPU0.SCHED 11605 ± 8% -17.2% 9603 softirqs.CPU1.SCHED 12912 ± 4% -24.7% 9720 softirqs.CPU3.RCU 13604 ± 13% -25.3% 10161 ± 9% softirqs.CPU5.RCU 31877 ± 4% +8.2% 34483 ± 3% softirqs.CPU5.TIMER 13733 ± 24% -29.5% 9681 softirqs.CPU6.RCU 10669 ± 3% +8.7% 11602 softirqs.CPU7.SCHED 101349 ± 4% -13.4% 87749 softirqs.RCU 62061 ± 2% -23.0% 47813 proc-vmstat.nr_active_file 1514459 -39.2% 920832 proc-vmstat.nr_dirtied 235594 -5.8% 221816 proc-vmstat.nr_dirty 201158 +5.7% 212562 proc-vmstat.nr_inactive_file 15298 +4.1% 15918 proc-vmstat.nr_slab_reclaimable 11173 +6.6% 11912 proc-vmstat.nr_slab_unreclaimable 151300 ± 3% -13.4% 131050 proc-vmstat.nr_written 62053 ± 2% -23.0% 47804 proc-vmstat.nr_zone_active_file 201160 +5.7% 212569 proc-vmstat.nr_zone_inactive_file 235667 -5.9% 221873 proc-vmstat.nr_zone_write_pending 1636228 -36.4% 1039894 proc-vmstat.numa_hit 1636228 -36.4% 1039894 proc-vmstat.numa_local 310142 -48.1% 160887 ± 3% proc-vmstat.pgactivate 1769727 -33.1% 1183472 proc-vmstat.pgalloc_normal 117343 ± 2% +3.9% 121929 ± 2% proc-vmstat.pgfault 1542491 ± 9% -38.2% 953722 ± 23% proc-vmstat.pgfree 674632 ± 3% -10.7% 602501 proc-vmstat.pgpgout 1475 -19.2% 1191 sched_debug.cfs_rq:/.exec_clock.avg 2506 ± 4% -12.9% 2182 sched_debug.cfs_rq:/.exec_clock.max 997.85 ± 4% -27.5% 723.81 ± 3% sched_debug.cfs_rq:/.exec_clock.min 823218 ± 28% -45.7% 447205 ± 26% sched_debug.cfs_rq:/.load.max 5745 ± 10% +17.3% 6737 ± 5% sched_debug.cfs_rq:/.min_vruntime.stddev 127161 ± 16% -16.4% 106361 sched_debug.cfs_rq:/.runnable_weight.avg 698350 ± 24% -46.2% 375891 ± 31% sched_debug.cfs_rq:/.runnable_weight.max 238605 ± 23% -40.0% 143103 ± 22% sched_debug.cfs_rq:/.runnable_weight.stddev 5745 ± 10% +17.3% 6738 ± 5% sched_debug.cfs_rq:/.spread0.stddev 551.38 ± 3% +11.8% 616.19 ± 5% sched_debug.cfs_rq:/.util_avg.avg 320.88 ± 11% +40.0% 449.25 ± 8% sched_debug.cfs_rq:/.util_avg.min 346751 ± 3% -24.2% 262826 ± 21% sched_debug.cpu.avg_idle.stddev 22049 ± 17% +38.5% 30534 ± 21% sched_debug.cpu.nr_switches.stddev 178.00 ± 3% -13.1% 154.75 sched_debug.cpu.nr_uninterruptible.max 20430 ± 21% +39.8% 28562 ± 19% sched_debug.cpu.sched_count.stddev 10306 ± 21% +39.7% 14402 ± 18% sched_debug.cpu.sched_goidle.stddev 10073 ± 24% +38.9% 13988 ± 18% sched_debug.cpu.ttwu_count.stddev 74552 ± 2% +8.0% 80492 ± 5% sched_debug.cpu.ttwu_local.max 10234 ± 23% +37.8% 14107 ± 19% sched_debug.cpu.ttwu_local.stddev 1153 ± 3% +21.4% 1400 ± 9% slabinfo.kmalloc-128.active_objs 1153 ± 3% +26.5% 1459 ± 5% slabinfo.kmalloc-128.num_objs 1717 +10.6% 1899 ± 2% slabinfo.kmalloc-1k.active_objs 2209 ± 2% +17.5% 2597 slabinfo.kmalloc-1k.num_objs 1183 +9.6% 1297 slabinfo.kmalloc-2k.active_objs 1205 +14.0% 1374 slabinfo.kmalloc-2k.num_objs 262.00 +65.1% 432.50 ± 5% slabinfo.kmalloc-4k.active_objs 280.00 +81.8% 509.00 ± 2% slabinfo.kmalloc-4k.num_objs 4600 ± 3% +27.7% 5874 slabinfo.kmalloc-512.active_objs 6324 ± 3% +10.9% 7016 slabinfo.kmalloc-64.active_objs 6324 ± 3% +10.9% 7016 slabinfo.kmalloc-64.num_objs 1624 ± 3% +9.6% 1779 ± 3% slabinfo.kmalloc-96.active_objs 1624 ± 3% +9.6% 1779 ± 3% slabinfo.kmalloc-96.num_objs 630.00 ± 4% -23.3% 483.00 ± 4% slabinfo.kmalloc-rcl-96.active_objs 630.00 ± 4% -23.3% 483.00 ± 4% slabinfo.kmalloc-rcl-96.num_objs 8655 +27.6% 11041 slabinfo.skbuff_ext_cache.active_objs 412.00 +27.7% 526.00 ± 2% slabinfo.skbuff_ext_cache.active_slabs 8659 +27.6% 11052 ± 2% slabinfo.skbuff_ext_cache.num_objs 412.00 +27.7% 526.00 ± 2% slabinfo.skbuff_ext_cache.num_slabs 318.25 ± 12% +72.7% 549.50 slabinfo.xfs_efd_item.active_objs 318.25 ± 12% +88.2% 599.00 slabinfo.xfs_efd_item.num_objs 8583 +28.6% 11036 slabinfo.xfs_inode.active_objs 8602 +28.5% 11055 slabinfo.xfs_inode.num_objs 22.21 ± 5% -13.3% 19.27 ± 5% perf-stat.i.MPKI 2.496e+08 ± 3% -12.6% 2.181e+08 perf-stat.i.branch-instructions 2.39 ± 2% +0.1 2.52 ± 2% perf-stat.i.branch-miss-rate% 9930634 -4.5% 9487896 perf-stat.i.branch-misses 2415298 -31.6% 1651795 perf-stat.i.cache-misses 16700712 ± 2% -33.7% 11064760 ± 3% perf-stat.i.cache-references 34650 -5.3% 32814 perf-stat.i.context-switches 1.799e+09 ± 2% -17.7% 1.48e+09 perf-stat.i.cpu-cycles 1062 ± 2% -59.1% 434.58 perf-stat.i.cpu-migrations 781.36 ± 3% +8.9% 851.10 perf-stat.i.cycles-between-cache-misses 2.842e+08 ± 4% -15.3% 2.406e+08 ± 2% perf-stat.i.dTLB-loads 1.64e+08 ± 2% -15.4% 1.388e+08 ± 2% perf-stat.i.dTLB-stores 518395 ± 4% -20.5% 412050 ± 7% perf-stat.i.iTLB-loads 1.209e+09 ± 2% -13.2% 1.05e+09 perf-stat.i.instructions 1783955 -36.7% 1129530 ± 2% perf-stat.i.node-loads 257062 -35.6% 165448 perf-stat.i.node-stores 13.80 ± 3% -23.7% 10.53 ± 3% perf-stat.overall.MPKI 3.98 ± 2% +0.4 4.35 perf-stat.overall.branch-miss-rate% 14.47 +0.5 14.94 perf-stat.overall.cache-miss-rate% 1.49 -5.2% 1.41 perf-stat.overall.cpi 745.61 ± 2% +20.3% 897.18 perf-stat.overall.cycles-between-cache-misses 0.67 +5.5% 0.71 perf-stat.overall.ipc 2.461e+08 ± 3% -12.6% 2.15e+08 perf-stat.ps.branch-instructions 9797186 -4.5% 9358157 perf-stat.ps.branch-misses 2377698 -31.6% 1626092 perf-stat.ps.cache-misses 16439477 ± 2% -33.7% 10891402 ± 3% perf-stat.ps.cache-references 34107 -5.3% 32297 perf-stat.ps.context-switches 1.773e+09 ± 2% -17.7% 1.459e+09 perf-stat.ps.cpu-cycles 1046 ± 2% -59.1% 427.69 perf-stat.ps.cpu-migrations 2.801e+08 ± 4% -15.4% 2.371e+08 ± 2% perf-stat.ps.dTLB-loads 1.615e+08 ± 2% -15.4% 1.367e+08 ± 2% perf-stat.ps.dTLB-stores 510282 ± 4% -20.5% 405584 ± 7% perf-stat.ps.iTLB-loads 1.192e+09 ± 2% -13.2% 1.035e+09 perf-stat.ps.instructions 1756149 -36.7% 1112013 ± 2% perf-stat.ps.node-loads 253049 -35.6% 162873 perf-stat.ps.node-stores 7.694e+10 ± 2% -13.9% 6.629e+10 perf-stat.total.instructions filebench.time.percent_of_cpu_this_job_got 20 +----------------------------------------------------------------------+ 18 |-+ +.+ +.+.+ + + +.+ +.+ +.+ +.+ +.+.+ + ++.+.+.| | : : : : : : : : : : : : : : : : : : | 16 |-+ : : : : : : : : : : : : : : : : : : | 14 |-+ : : : : : : : : : : : : : : : : : : | | : : : : : : :: : : : : : : : : : : : : : | 12 |-+: : : : : : :: : : : : : : : : : : : : : | 10 |-O: : :O O : :O: ::O:O :O :O :O: : : O: : : : : : | 8 |-+: :: O:O: :O: :: : : :: O: :O :: : : : : | | : :: : : : : :: : : :: : : :: : : : : | 6 |-+: :: : : : : :: : : :: : : :: : : : : | 4 |-: : : : : : : : : : : : : : | | : : : : : : : : : : : : : : | 2 |-: : : : : : : : : : : : : : | 0 +----------------------------------------------------------------------+ filebench.time.voluntary_context_switches 140000 +------------------------------------------------------------------+ | + +.++ + + +. +. +.+ +. ++.+ +.+ .+.| 120000 |-+ :+ : : : : : + : + : : : + : : + : + | | :: : : : : : : : : : : : : : : : : | 100000 |-+ :: : : : : : : : : : : : : : : : : | | : : : : : : :: : : : : : : : : : : : : | 80000 |-+: : : : : : :: : : : : : : : : : : :: : | | : : : : : : :: : : : : : : : : : : :: : | 60000 |-+: : : : : :: : : : : :: : : : : : : : : | | O: O:O:O OO:O:O:: :O:O : :O ::O O: :O O: :O : : : : | 40000 |-+: : : : : :: : : : : :: : : : : : : : : | | : : : : : : : : : : : :: : : | 20000 |-: : : : : : : : : : : : : : | | : : : : : : : : : : : : : : | 0 +------------------------------------------------------------------+ filebench.time.file_system_outputs 1.4e+07 +-----------------------------------------------------------------+ | | 1.2e+07 |-++.+ ++.+ + + ++ ++ ++ ++ +.++ + +.+.++.| | : : : : : : :: :: :: :: : : : : | 1e+07 |-+: : : : : : :: :: :: :: : : : : | | : : : : : :: : : : : : : : : : : :: : | 8e+06 |-+: : :O : :: : : : :O :O : : : : : : : : : : | | O: O:O: O O:O::O: :O:O : : :O:OO: :OO: :O : : : : | 6e+06 |-+: : : : : :: : : : : : : : : : : : : : : | | : : : : : :: : : : : : : : : : : : : : : | 4e+06 |-: : : : : :: : : : : : : : : : : : : : : | | : :: :: :: :: : : :: : : :: :: : : | 2e+06 |-: : : : : : : : : : : : :: | | : : : : : : : : : : : : :: | 0 +-----------------------------------------------------------------+ filebench.sum_operations 450000 +------------------------------------------------------------------+ | + .++ + +. +. .+ +. +.+ +.+ .+.| 400000 |-+ :+ + : : + : + : + + : : + + : + : + | 350000 |-+ :: : : : : : : : : : : : : : : : : | | :: : : : : : : : : : : : : : : : : | 300000 |-+: : : : : : :: : : : : : : : : : : : : | 250000 |-+: : : : : : :: : : : : : : : : : : :: : | | O: O:O:O O :O:O:O:: :O :O :O : : : : : :O : :: : | 200000 |-+: : : O: : : ::O: : : :O: O: : O: : : : : : | 150000 |-+: : : : : :: : : : : :: : : : : : : : : | | : : : : : :: : : : : :: : : : : : : : : | 100000 |-: :: : : : : : : : : :: :: : : | 50000 |-: : : : : : : : : : : : : : | | : : : : : : : : : : : : : : | 0 +------------------------------------------------------------------+ filebench.sum_operations_s 7000 +--------------------------------------------------------------------+ | ++ + : : + ++ +.+ + : ++ + + + : ++.+ | 6000 |-+ :: : : : : :: : : : : :: : : : : | | :: : : : : :: : : : : :: : : : : | 5000 |-+ :: : : :: : :: : : : : :: : : : : | | : : : : :: : : : : : : : : : : : : : : : | 4000 |-+: : : : :: : : : : : : : : : : : : : : : | | O: O:O:O O O:O::O: :O:O :O :O :O: O: :OO: :O : : : : | 3000 |-+: : : :: : : : : : : :: : : : : :: : : | | : : : :: : : : : : : :: : : : : :: : : | 2000 |-+: : : :: : : : : : : :: : : : : :: : : | | : : : : : : : : : : : : : : | 1000 |-: : : : : : : : : : : : : : | | : : : : : : : : : : : : : : | 0 +--------------------------------------------------------------------+ filebench.sum_reads_s 700 +---------------------------------------------------------------------+ | .+ + | 600 |-+ +.+ +.+ : : + +.+ +.+ +.+ +.+ +.++ + ++.+.+.| | : : : : : : : : : : : : : : : : : : | 500 |-+ : : : : : : : : : : : : : : : : : : | | : : : : :: :: : : : : : : : : : : :: : | 400 |-+: : : : :: : : : : : : : : : : : : : : : | | : : :O O : :: : : :O :O :O : : : : : :O : : : : | 300 |-O: O:: O:O: :: :O: : : :O:O O: :O O: : : : : : | | : :: : : :: : : : : : : : : : : : : : : | 200 |-+: :: : : :: : : : : : : : : : : : : : : | | : :: : :: :: : : :: : : :: :: : : | 100 |-: : : : : :: : :: : : : : | | : : : : : :: : :: : : : : | 0 +---------------------------------------------------------------------+ filebench.sum_writes_s 1400 +--------------------------------------------------------------------+ | .+ + | 1200 |-+ ++ +.+ : : + ++ +.+ +.+ ++ +.+.+ + +.++.+.| | :: : : : : :: : : : : :: : : : : | 1000 |-+ :: : : : : :: : : : : :: : : : : | | : : : : :: :: : : : : : : : : : : :: : | 800 |-+: : : : :: : : : : : : : : : : : : : : : | | : : :O O : :: : : :O :O :O : : : : : :O : : : : | 600 |-O: O:O: O:: :O: :O: : : :O: O: :OO: : :: : : | | : : : :: : : : : : : :: : : : : :: : : | 400 |-+: : : :: : : : : : : :: : : : : :: : : | | : :: : :: :: : : : : : :: :: : : | 200 |-: : : : : : : : : : : : : : | | : : : : : : : : : : : : : : | 0 +--------------------------------------------------------------------+ filebench.sum_bytes_mb_s 180 +---------------------------------------------------------------------+ | .+.+ + +. .+ .+ + .| 160 |-+ +.+ + : : + : + +.+ + : +.+ + + + :+.+.+ | 140 |-+ : : : : : : : : : : : : : : : : : : | | : : : : : : : : : : : : : : : : : : | 120 |-+ : : : : :: :: : : : : : : : : : : :: : | 100 |-+: : : : :: : : : : : : : : : : : : : : : | | : : :O O : :: : : :O :O :O : : : : : :O : : : : | 80 |-O: O:: O:O: :: :O: : : :O:O O: :O O: : : : : : | 60 |-+: :: : : :: : : : : : : : : : : : : : : | | : :: : : :: : : : : : : : : : : : : : : | 40 |-+: :: : :: : : : :: : : :: :: : : | 20 |-: : : : : :: : :: : : : : | | : : : : : :: : :: : : : : | 0 +---------------------------------------------------------------------+ filebench.sum_time_ms_op 16 +----------------------------------------------------------------------+ | O O O O O O O | 14 |-O OO O O O O O O O O O | 12 |-+ | | | 10 |-+ | | | 8 |-+ .+ +. + .+ .+ +. .+ +. + .+.+.| | + : : +.+ + : + : + : : + + : : +.+ : ++ | 6 |-+ : : : : : :: : : : : : : : : : : : : : | 4 |-+: : : : : : :: : : : : : : : : : : : : : | | : :: : : : : :: : : :: : : :: : : : : | 2 |-+: :: : : : : :: : : :: : : :: : : : : | | : : : : : : : : : : : : : : | 0 +----------------------------------------------------------------------+ [*] bisect-good sample [O] bisect-bad sample *************************************************************************************************** lkp-hsw-d01: 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory ========================================================================================= compiler/cpufreq_governor/disk/fs/kconfig/rootfs/tbox_group/test/testcase/ucode: gcc-7/performance/1HDD/xfs/x86_64-rhel-7.6/debian-x86_64-20191114.cgz/lkp-hsw-d01/webproxy.f/filebench/0x27 commit: 1ef4da0e32 ("xfs: pass around xfs_inode_ag_walk iget/irele helper functions") 22d05173fc ("xfs: deferred inode inactivation") 1ef4da0e32ff780d 22d05173fcdcccc1560de717b4b ---------------- --------------------------- fail:runs %reproduction fail:runs | | | 1:4 -25% :4 kmsg.snd_hda_intel#:#:#:HSW/BDW_HD-audio_HDMI/DP_requires_binding_with_gfx_driver %stddev %change %stddev \ | \ 220.53 ± 3% -67.7% 71.13 ± 3% filebench.sum_bytes_mb/s 5234961 ± 3% -69.4% 1603647 ± 3% filebench.sum_operations 87244 ± 3% -69.4% 26724 ± 3% filebench.sum_operations/s 22958 ± 3% -69.4% 7032 ± 3% filebench.sum_reads/s 1.14 ± 3% +223.2% 3.70 ± 3% filebench.sum_time_ms/op 4591 ± 3% -69.4% 1406 ± 3% filebench.sum_writes/s 5767261 ± 2% -66.3% 1941944 ± 3% filebench.time.file_system_outputs 541.67 ± 5% +180.2% 1517 ± 3% filebench.time.involuntary_context_switches 128.67 ± 2% -61.7% 49.33 ± 11% filebench.time.percent_of_cpu_this_job_got 72.98 ± 2% -56.0% 32.10 ± 4% filebench.time.system_time 918981 ± 2% -82.3% 162595 ± 8% filebench.time.voluntary_context_switches 30009458 ± 20% -49.3% 15224931 ± 44% cpuidle.C1.time 1.3e+08 ± 7% -41.8% 75606650 ± 25% cpuidle.C1E.time 1704699 ± 5% -37.5% 1065467 ± 15% cpuidle.C1E.usage 5.80 +5.2 10.97 ± 3% mpstat.cpu.all.iowait% 0.03 ± 31% +0.0 0.04 ± 17% mpstat.cpu.all.soft% 14.48 ± 3% -7.9 6.55 ± 10% mpstat.cpu.all.sys% 2.95 -1.3 1.60 ± 7% mpstat.cpu.all.usr% 76.67 +4.8% 80.33 vmstat.cpu.id 5.00 +113.3% 10.67 ± 4% vmstat.cpu.wa 2232 +65.0% 3683 ± 4% vmstat.io.bo 57533 -43.4% 32567 ± 5% vmstat.system.cs 28797 -9.1% 26174 ± 6% vmstat.system.in 77.23 +4.9% 81.02 iostat.cpu.idle 5.64 +91.7% 10.82 ± 3% iostat.cpu.iowait 14.15 ± 3% -54.2% 6.48 ± 10% iostat.cpu.system 2.98 -43.6% 1.68 ± 7% iostat.cpu.user 0.97 ± 2% +75.1% 1.70 iostat.sda.avgqu-sz 59.95 +64.2% 98.45 iostat.sda.w/s 2330 +62.0% 3775 ± 4% iostat.sda.wkB/s 23.83 ± 5% +104.6% 48.75 ± 28% iostat.sda.wrqm/s 683.67 ± 2% -46.6% 365.33 ± 8% turbostat.Avg_MHz 19.60 ± 2% -9.4 10.17 ± 7% turbostat.Busy% 5.83 ± 20% -3.2 2.64 ± 41% turbostat.C1% 1704492 ± 5% -37.5% 1065307 ± 15% turbostat.C1E 25.27 ± 7% -11.8 13.49 ± 33% turbostat.C1E% 43.92 ± 2% -31.0% 30.30 ± 16% turbostat.CPU%c1 14.06 ± 2% -46.0% 7.59 ± 6% turbostat.CorWatt 2.73 ± 10% +289.6% 10.62 ± 52% turbostat.Pkg%pc2 43.33 ± 2% -8.5% 39.67 ± 3% turbostat.PkgTmp 23.38 -28.2% 16.78 ± 5% turbostat.PkgWatt 1277941 -7.6% 1180539 ± 5% meminfo.Active 1219006 -7.7% 1125199 ± 5% meminfo.Active(anon) 987534 -7.9% 909405 ± 5% meminfo.AnonHugePages 1217898 -7.7% 1124115 ± 5% meminfo.AnonPages 1539544 -7.6% 1422961 ± 5% meminfo.Committed_AS 77430 -8.7% 70692 ± 5% meminfo.Dirty 52261 -7.6% 48276 ± 5% meminfo.Inactive(anon) 59050 +24.6% 73569 meminfo.KReclaimable 59050 +24.6% 73569 meminfo.SReclaimable 46030 +41.9% 65297 meminfo.SUnreclaim 53507 -7.4% 49572 ± 5% meminfo.Shmem 105080 +32.2% 138866 meminfo.Slab 7922 +75.8% 13923 ± 7% interrupts.19:IR-IO-APIC.19-fasteoi.ata_piix 8665 ± 65% -93.5% 565.33 ± 22% interrupts.28:IR-PCI-MSI.409600-edge.eth0 228064 ± 6% +18.6% 270405 ± 5% interrupts.CPU1.LOC:Local_timer_interrupts 1693 ± 7% -74.6% 430.67 ± 21% interrupts.CPU1.RES:Rescheduling_interrupts 1688 ± 7% -71.2% 486.33 ± 11% interrupts.CPU2.RES:Rescheduling_interrupts 225190 ± 6% -15.5% 190223 ± 7% interrupts.CPU3.LOC:Local_timer_interrupts 1677 ± 5% -68.4% 529.67 ± 9% interrupts.CPU3.RES:Rescheduling_interrupts 8665 ± 65% -93.5% 565.33 ± 22% interrupts.CPU4.28:IR-PCI-MSI.409600-edge.eth0 1874 ± 6% -78.7% 399.33 ± 22% interrupts.CPU4.RES:Rescheduling_interrupts 2582 ±141% +439.1% 13923 ± 7% interrupts.CPU6.19:IR-IO-APIC.19-fasteoi.ata_piix 121.00 ± 6% -8.8% 110.33 ± 2% interrupts.CPU6.CAL:Function_call_interrupts 1612 ± 3% -79.1% 337.33 ± 12% interrupts.CPU6.RES:Rescheduling_interrupts 1636 ± 3% -70.5% 483.00 ± 20% interrupts.CPU7.RES:Rescheduling_interrupts 13397 ± 3% -56.3% 5854 ± 13% interrupts.RES:Rescheduling_interrupts 37218 ± 20% -57.8% 15693 ± 3% softirqs.CPU0.RCU 15232 ± 11% -19.1% 12320 softirqs.CPU0.SCHED 38659 ± 21% -56.7% 16757 ± 15% softirqs.CPU1.RCU 12250 ± 9% +11.6% 13670 ± 3% softirqs.CPU1.SCHED 39022 ± 22% -55.7% 17302 ± 12% softirqs.CPU2.RCU 36960 ± 20% -50.4% 18342 ± 15% softirqs.CPU3.RCU 45511 ± 26% -68.0% 14565 ± 5% softirqs.CPU4.RCU 14445 ± 13% -23.9% 10986 ± 8% softirqs.CPU4.SCHED 37848 ± 14% -22.8% 29212 ± 3% softirqs.CPU4.TIMER 36155 ± 20% -57.9% 15227 softirqs.CPU5.RCU 27973 ± 2% +25.6% 35126 ± 6% softirqs.CPU5.TIMER 42201 ± 17% -65.8% 14431 ± 6% softirqs.CPU6.RCU 37116 ± 20% -58.3% 15468 ± 4% softirqs.CPU7.RCU 312846 ± 21% -59.2% 127790 ± 3% softirqs.RCU 304801 -7.4% 282277 ± 5% proc-vmstat.nr_active_anon 14706 -5.7% 13875 ± 4% proc-vmstat.nr_active_file 304523 -7.4% 282004 ± 5% proc-vmstat.nr_anon_pages 481.67 -7.5% 445.33 ± 5% proc-vmstat.nr_anon_transparent_hugepages 720938 ± 2% -66.3% 242773 ± 3% proc-vmstat.nr_dirtied 19357 -8.3% 17742 ± 5% proc-vmstat.nr_dirty 14762 +24.6% 18392 proc-vmstat.nr_slab_reclaimable 11506 +41.7% 16310 proc-vmstat.nr_slab_unreclaimable 4609 ± 9% +142.7% 11185 ± 27% proc-vmstat.nr_written 304803 -7.4% 282279 ± 5% proc-vmstat.nr_zone_active_anon 14707 -5.7% 13873 ± 4% proc-vmstat.nr_zone_active_file 19357 -8.3% 17742 ± 5% proc-vmstat.nr_zone_write_pending 861354 ± 2% -53.6% 399352 ± 3% proc-vmstat.numa_hit 861354 ± 2% -53.6% 399352 ± 3% proc-vmstat.numa_local 497744 ± 2% -66.9% 164797 ± 3% proc-vmstat.pgactivate 1122497 -39.2% 682223 ± 2% proc-vmstat.pgalloc_normal 133031 ± 3% +5.0% 139706 ± 3% proc-vmstat.pgfault 1103704 -40.9% 652470 ± 2% proc-vmstat.pgfree 146393 +81.2% 265334 ± 10% proc-vmstat.pgpgout 450.33 +94.1% 874.00 slabinfo.intel_context.active_objs 450.33 +97.4% 889.00 slabinfo.intel_context.num_objs 21075 ± 5% +40.6% 29626 ± 5% slabinfo.kmalloc-16.active_objs 21075 ± 5% +102.3% 42635 slabinfo.kmalloc-16.num_objs 1289 ± 9% +42.1% 1832 ± 5% slabinfo.kmalloc-1k.active_objs 1448 ± 8% +61.4% 2338 ± 13% slabinfo.kmalloc-1k.num_objs 1097 ± 3% +20.8% 1325 ± 4% slabinfo.kmalloc-2k.active_objs 1113 ± 2% +22.2% 1360 ± 4% slabinfo.kmalloc-2k.num_objs 209.67 +105.1% 430.00 ± 2% slabinfo.kmalloc-4k.active_objs 219.33 ± 2% +116.3% 474.33 ± 3% slabinfo.kmalloc-4k.num_objs 8972 ± 2% +110.3% 18870 ± 5% slabinfo.kmalloc-512.active_objs 397.33 +97.7% 785.67 ± 7% slabinfo.kmalloc-512.active_slabs 12730 +97.7% 25165 ± 7% slabinfo.kmalloc-512.num_objs 397.33 +97.7% 785.67 ± 7% slabinfo.kmalloc-512.num_slabs 200.67 +389.2% 981.67 ± 3% slabinfo.kmalloc-8k.active_objs 50.67 +427.6% 267.33 ± 2% slabinfo.kmalloc-8k.active_slabs 204.00 +424.8% 1070 ± 2% slabinfo.kmalloc-8k.num_objs 50.67 +427.6% 267.33 ± 2% slabinfo.kmalloc-8k.num_slabs 421.00 ± 7% +48.6% 625.67 ± 11% slabinfo.pool_workqueue.active_objs 8065 +166.4% 21484 slabinfo.skbuff_ext_cache.active_objs 383.67 +173.7% 1050 slabinfo.skbuff_ext_cache.active_slabs 8065 +173.6% 22065 slabinfo.skbuff_ext_cache.num_objs 383.67 +173.7% 1050 slabinfo.skbuff_ext_cache.num_slabs 549.00 ± 2% +59.8% 877.33 slabinfo.xfs_buf_item.active_objs 589.67 +61.7% 953.67 ± 2% slabinfo.xfs_buf_item.num_objs 7821 +173.4% 21381 slabinfo.xfs_inode.active_objs 243.67 +183.2% 690.00 slabinfo.xfs_inode.active_slabs 7821 +182.4% 22088 slabinfo.xfs_inode.num_objs 243.67 +183.2% 690.00 slabinfo.xfs_inode.num_slabs 5669 ± 2% -46.8% 3018 ± 3% sched_debug.cfs_rq:/.exec_clock.avg 6627 ± 5% -44.2% 3697 ± 4% sched_debug.cfs_rq:/.exec_clock.max 5087 ± 2% -50.8% 2501 ± 4% sched_debug.cfs_rq:/.exec_clock.min 135621 ± 15% +41.9% 192447 ± 13% sched_debug.cfs_rq:/.load.avg 729.31 ± 10% +29.0% 940.75 ± 13% sched_debug.cfs_rq:/.load_avg.avg 26.83 ± 55% -55.3% 12.00 ± 10% sched_debug.cfs_rq:/.load_avg.min 28620 ± 3% -18.5% 23318 sched_debug.cfs_rq:/.min_vruntime.avg 38368 ± 2% -13.2% 33315 ± 2% sched_debug.cfs_rq:/.min_vruntime.max 21593 ± 6% -26.6% 15847 ± 4% sched_debug.cfs_rq:/.min_vruntime.min 58.27 ± 11% +44.5% 84.23 ± 3% sched_debug.cfs_rq:/.runnable_load_avg.avg 253.17 ± 37% +80.6% 457.17 ± 26% sched_debug.cfs_rq:/.runnable_load_avg.max 78.89 ± 39% +91.7% 151.23 ± 23% sched_debug.cfs_rq:/.runnable_load_avg.stddev 104396 ± 17% +47.3% 153799 ± 15% sched_debug.cfs_rq:/.runnable_weight.avg 1214 ±323% -560.0% -5584 sched_debug.cfs_rq:/.spread0.avg 10960 ± 34% -59.7% 4419 ± 62% sched_debug.cfs_rq:/.spread0.max -5813 +124.6% -13055 sched_debug.cfs_rq:/.spread0.min 512.33 ± 13% -26.3% 377.50 ± 8% sched_debug.cfs_rq:/.util_avg.min 570654 +49.9% 855390 ± 23% sched_debug.cpu.avg_idle.max 238825 -36.8% 150911 ± 2% sched_debug.cpu.nr_switches.avg 212251 -55.9% 93574 ± 6% sched_debug.cpu.nr_switches.min 20271 ± 11% +189.3% 58649 ± 8% sched_debug.cpu.nr_switches.stddev 26.83 ± 28% +107.5% 55.67 ± 18% sched_debug.cpu.nr_uninterruptible.max -14.83 +86.5% -27.67 sched_debug.cpu.nr_uninterruptible.min 12.83 ± 25% +99.4% 25.57 ± 13% sched_debug.cpu.nr_uninterruptible.stddev 231363 -37.7% 144046 ± 2% sched_debug.cpu.sched_count.avg 208314 -57.6% 88228 ± 6% sched_debug.cpu.sched_count.min 17715 ± 15% +224.7% 57525 ± 10% sched_debug.cpu.sched_count.stddev 115029 -38.5% 70798 ± 2% sched_debug.cpu.sched_goidle.avg 103568 -57.8% 43658 ± 7% sched_debug.cpu.sched_goidle.min 8858 ± 15% +206.1% 27114 ± 8% sched_debug.cpu.sched_goidle.stddev 128312 -43.3% 72796 ± 2% sched_debug.cpu.ttwu_count.avg 116741 -62.3% 44015 ± 9% sched_debug.cpu.ttwu_count.min 8708 ± 11% +233.6% 29047 ± 10% sched_debug.cpu.ttwu_count.stddev 71598 ± 3% +43.4% 102690 ± 10% sched_debug.cpu.ttwu_local.max 43212 ± 3% -29.2% 30589 ± 10% sched_debug.cpu.ttwu_local.min 9247 ± 18% +153.3% 23425 ± 5% sched_debug.cpu.ttwu_local.stddev 1.044e+09 ± 2% -57.9% 4.401e+08 ± 7% perf-stat.i.branch-instructions 1.42 +0.5 1.89 ± 13% perf-stat.i.branch-miss-rate% 17681401 -43.2% 10036731 ± 8% perf-stat.i.branch-misses 7.03 ± 2% +1.9 8.89 ± 2% perf-stat.i.cache-miss-rate% 4759033 ± 4% -59.7% 1918035 ± 3% perf-stat.i.cache-misses 70368951 ± 3% -69.2% 21652549 ± 2% perf-stat.i.cache-references 60146 -43.6% 33924 ± 5% perf-stat.i.context-switches 1.08 +54.7% 1.68 ± 2% perf-stat.i.cpi 5.468e+09 ± 2% -46.0% 2.951e+09 ± 7% perf-stat.i.cpu-cycles 2036 ± 2% -88.8% 229.03 ± 5% perf-stat.i.cpu-migrations 1179 ± 3% +29.4% 1526 ± 8% perf-stat.i.cycles-between-cache-misses 0.14 ± 10% +0.1 0.21 ± 16% perf-stat.i.dTLB-load-miss-rate% 1790400 ± 13% -65.1% 625279 ± 4% perf-stat.i.dTLB-load-misses 1.338e+09 ± 2% -58.1% 5.612e+08 ± 9% perf-stat.i.dTLB-loads 0.05 ± 4% +0.0 0.07 ± 5% perf-stat.i.dTLB-store-miss-rate% 291442 ± 7% -56.8% 125839 ± 3% perf-stat.i.dTLB-store-misses 5.897e+08 ± 3% -63.0% 2.181e+08 ± 4% perf-stat.i.dTLB-stores 989867 ± 10% -63.3% 363230 ± 2% perf-stat.i.iTLB-load-misses 1704951 ± 2% -61.7% 653048 ± 6% perf-stat.i.iTLB-loads 5.117e+09 ± 2% -57.5% 2.177e+09 ± 7% perf-stat.i.instructions 0.93 -30.2% 0.65 perf-stat.i.ipc 3838963 ± 4% -65.4% 1326517 ± 4% perf-stat.i.node-loads 559056 ± 3% -62.4% 210435 ± 3% perf-stat.i.node-stores 13.75 -27.4% 9.98 ± 5% perf-stat.overall.MPKI 1.70 ± 2% +0.6 2.28 ± 2% perf-stat.overall.branch-miss-rate% 6.76 ± 2% +2.1 8.86 perf-stat.overall.cache-miss-rate% 1.07 +26.8% 1.36 perf-stat.overall.cpi 1151 ± 3% +33.6% 1537 ± 4% perf-stat.overall.cycles-between-cache-misses 0.05 ± 4% +0.0 0.06 ± 6% perf-stat.overall.dTLB-store-miss-rate% 5215 ± 8% +15.0% 5999 ± 7% perf-stat.overall.instructions-per-iTLB-miss 0.94 -21.2% 0.74 perf-stat.overall.ipc 1.028e+09 ± 2% -57.8% 4.344e+08 ± 7% perf-stat.ps.branch-instructions 17423573 -43.0% 9924230 ± 8% perf-stat.ps.branch-misses 4683939 ± 4% -59.6% 1890940 ± 3% perf-stat.ps.cache-misses 69252966 ± 3% -69.2% 21340939 ± 2% perf-stat.ps.cache-references 59194 -43.5% 33432 ± 5% perf-stat.ps.context-switches 5.383e+09 ± 2% -45.9% 2.912e+09 ± 7% perf-stat.ps.cpu-cycles 2003 ± 2% -88.7% 225.68 ± 5% perf-stat.ps.cpu-migrations 1762081 ± 13% -65.0% 616342 ± 4% perf-stat.ps.dTLB-load-misses 1.317e+09 ± 2% -58.0% 5.536e+08 ± 9% perf-stat.ps.dTLB-loads 286859 ± 7% -56.7% 124083 ± 3% perf-stat.ps.dTLB-store-misses 5.805e+08 ± 3% -62.9% 2.151e+08 ± 4% perf-stat.ps.dTLB-stores 974196 ± 10% -63.2% 358026 ± 2% perf-stat.ps.iTLB-load-misses 1677930 ± 2% -61.6% 643616 ± 6% perf-stat.ps.iTLB-loads 5.037e+09 ± 2% -57.3% 2.149e+09 ± 7% perf-stat.ps.instructions 3778335 ± 4% -65.4% 1307677 ± 4% perf-stat.ps.node-loads 550210 ± 3% -62.3% 207414 ± 3% perf-stat.ps.node-stores 3.226e+11 ± 2% -52.9% 1.52e+11 ± 3% perf-stat.total.instructions Disclaimer: Results have been estimated based on internal Intel analysis and are provided for informational purposes only. Any difference in system hardware or software design or configuration may affect actual performance. Thanks, Rong Chen