Greeting, FYI, we noticed a -21% regression of apachebench.requests_per_second due to commit: commit: bc0d3d0639a29546708657c1666a474c0af19316 ("udp: try to avoid 2 cache miss on dequeue") url: https://github.com/0day-ci/linux/commits/Paolo-Abeni/udp-reduce-cache-pressure/20170529-234944 in testcase: apachebench on test machine: 16 threads Intel(R) Atom(R) CPU 3958 @ 2.00GHz with 64G memory with following parameters: runtime: 300s concurrency: 1000 cluster: cs-localhost cpufreq_governor: performance test-description: apachebench is a tool for benchmarking your Apache Hypertext Transfer Protocol (HTTP) server. test-url: https://httpd.apache.org/docs/2.4/programs/ab.html Details are as below: --------------------------------------------------------------------------------------------------> To reproduce: git clone https://github.com/01org/lkp-tests.git cd lkp-tests bin/lkp install job.yaml # job file is attached in this email bin/lkp run job.yaml testcase/path_params/tbox_group/run: apachebench/300s-1000-cs-localhost-performance/lkp-denverton2 85f4454bfd01c363 bc0d3d0639a29546708657c166 ---------------- -------------------------- %stddev change %stddev \ | \ 62.90 26% 79.18 apachebench.time_per_request 15899 -21% 12628 apachebench.requests_per_second 170764 -21% 135638 apachebench.transfer_rate 60098 23% 74166 apachebench.connection_time.total.max 60098 23% 74166 apachebench.max_latency.100% 64.91 56% 101.13 apachebench.time.elapsed_time 64.91 56% 101.13 apachebench.time.elapsed_time.max 69 -37% 43 apachebench.time.percent_of_cpu_this_job_got 41225 20% 49376 interrupts.CAL:Function_call_interrupts 570 -33% 381 turbostat.Avg_MHz 28.59 -33% 19.07 turbostat.%Busy 75381 -43% 42629 vmstat.system.in 142204 -52% 67789 vmstat.system.cs 13095 ± 26% 9e+05 960405 ±171% latency_stats.avg.max 13095 ± 26% 1e+06 994807 ±171% latency_stats.max.max 13879 ± 67% -8e+03 6306 ± 19% latency_stats.sum.ep_poll.SyS_epoll_wait.do_syscall_64.return_from_SYSCALL_64 9834 ± 63% -1e+04 0 latency_stats.sum.vm_unmap_aliases.change_page_attr_set_clr.set_memory_ro.bpf_prog_select_runtime.bpf_prepare_filter.bpf_prog_create_from_user.do_seccomp.prctl_set_seccomp.SyS_prctl.entry_SYSCALL_64_fastpath 7.43 ± 4% 11% 8.23 ± 3% perf-stat.branch-miss-rate% 3.309e+09 3% 3.413e+09 perf-stat.branch-misses 1224211 3% 1261383 perf-stat.page-faults 1224211 3% 1261382 perf-stat.minor-faults 2.258e+11 ± 4% -7% 2.111e+11 perf-stat.instructions 4.463e+10 ± 5% -7% 4.148e+10 perf-stat.branch-instructions 0.36 -8% 0.33 perf-stat.ipc 9533387 -26% 7020637 perf-stat.context-switches perf-stat.page-faults 1.28e+06 ++------------O--------------------------------------------------+ | | 1.27e+06 ++ O O O | | OO O OO OO O O | 1.26e+06 O+ OO O O O O OO OO O | | | 1.25e+06 ++ | | | 1.24e+06 *+ .* | | * * * * * * : | 1.23e+06 ++ : + : : :+ + :+ : : | | *.* *.**.* .* *. .* : * * *.: * *. .**. .**.**. *.* 1.22e+06 ++ *.* * ** * *.* * * ** * | | | 1.21e+06 ++---------------------------------------------------------------+ perf-stat.context-switches 1e+07 ++----------------------------------------------------------------+ | *. .**.*.**.**. *.* .* .*. | 9.5e+06 *+* ** **.*.**.* *.*.**.** * **.**.**.*.**.**.**.* | | 9e+06 ++ | | | 8.5e+06 ++ | | | 8e+06 ++ | | | 7.5e+06 ++ | | O O | 7e+06 O+OO O OO OO OO OO O OO OO OO O OO O | | | 6.5e+06 ++----------------------------------------------------------------+ perf-stat.minor-faults 1.28e+06 ++------------O--------------------------------------------------+ | | 1.27e+06 ++ O O O | | OO O OO OO O O | 1.26e+06 O+ OO O O O O OO OO O | | | 1.25e+06 ++ | | | 1.24e+06 *+ .* | | * * * * * * : | 1.23e+06 ++ : + : : :+ + :+ : : | | *.* *.**.* .* *. .* : * * *.: * *. .**. .**.**. *.* 1.22e+06 ++ *.* * ** * *.* * * ** * | | | 1.21e+06 ++---------------------------------------------------------------+ turbostat.Avg_MHz 600 ++--------------------------------------------------------------------+ | *. .*. **. *.* * .* .* .*. .*. | | : *.**.*.** ** : *.** * : *.*.* : * *.* * ** **.* 550 ++ : : : : : : : :: : | | : : : : : : : : : : | | : : : : :: : : : : : | 500 ++: : : : : :: :: : : | | : : : : : :: :: : : | 450 ++: : :: : : : : | *.* O : : : : *: | | * * * * * | 400 O+ O O OO O OO O | | O O O O OO OO O OO O OO O | | | 350 ++--------------------------------------------------------------------+ turbostat._Busy 30 ++---------------------------------------------------------------------+ | *. *. *.* **. * *. *. .*. .*. | 28 ++ : *.**.*.*.* *.* : *.*.* * : *.** : * *.* * ** **.* | : : : : : : : : : | | : : : : :: : : :: : | 26 ++ : : : : : : : : :: : | | : :: :: : : : : : : | 24 ++: :: :: : : : : : : | | : : :: : : : : | 22 ++: O : : : : : : | *.* * * * * *.* | | O O O | 20 O+OO O OO O O O O O O O | | OO O O OO O O | 18 ++---------------------------------------------------------------------+ apachebench.time.percent_of_cpu_this_job_got 75 ++---------------------------------------------------------------------+ | *.*. .* *. | 70 ++ *.*. *. .*.* * * *.*.* * * *.** * **.*.**. .*.**.*.* .* | : * * : : : : : : : : * * | 65 ++ : : : : : : : : : | | : : : : : : : : :: : | 60 ++ : : : : : : : : : : : | | : :: :: : : : : : : | 55 ++: :: :: : : : : : : | | : O : : : : : : | 50 ++: : : : : *.: | *.* * * * * * | 45 O+OO O OO O O O O OO O OO O O O O O O O | | O O | 40 ++---------------------------------------------------------------------+ apachebench.time.elapsed_time 105 ++--------------------------------------------------------------------+ O OO O OO O OO OO O OO O OO O OO O OO O | 100 ++ | 95 ++ | *.* * * * * ** | 90 ++: : : : : :: | 85 ++: O : : : :: :: | | : : : : : :: :: : : | 80 ++ : : : : : :: :: : : | 75 ++ : : : : :: : : : : : | | : : : : :: : : :: : | 70 ++ : : : : : : : : : | 65 ++ *.*. .*.* .*: :*. : : :.* : * : *. .*. *.*.**.* | ** *.* * * *.** * * *.*.* *.* *.** * | 60 ++--------------------------------------------------------------------+ apachebench.time.elapsed_time.max 105 ++--------------------------------------------------------------------+ O OO O OO O OO OO O OO O OO O OO O OO O | 100 ++ | 95 ++ | *.* * * * * ** | 90 ++: : : : : :: | 85 ++: O : : : :: :: | | : : : : : :: :: : : | 80 ++ : : : : : :: :: : : | 75 ++ : : : : :: : : : : : | | : : : : :: : : :: : | 70 ++ : : : : : : : : : | 65 ++ *.*. .*.* .*: :*. : : :.* : * : *. .*. *.*.**.* | ** *.* * * *.** * * *.*.* *.* *.** * | 60 ++--------------------------------------------------------------------+ apachebench.connection_time.connect.max 16000 ++OO-O--O--O------OO------O-OO----O-O-------------------------------+ O O O O OO O OO OO O O | 14000 ++ | 12000 ++ | | | 10000 ++ | | | 8000 ++ | | | 6000 ++ | 4000 ++ | | *.* * * * * *.* * * ** * * * * | 2000 ++ : :+ + :+ +: + :+ : :: + :+ : :: + : :+ + : | | : * * *.** :.* * :: :.* * : : : .** *.*.* *.** *.* 0 *+*----------------*---------*--*---------*--*-*--------------------+ vmstat.system.in 80000 ++------------------------------------------------------------------+ | *.* .*.**.*.**.* *.**.*.* * *.**.** .*. *.| 75000 ++ : * : : : : : : * **.**.*.** **.* * 70000 ++ : : : : :: : : : : | | : : : ::: : : :: : | 65000 ++: :: :: :: : : : : | | : :: : :: : : : | 60000 ++: : * : * *.: | *.* * * * | 55000 ++ | 50000 ++ | | O | 45000 ++ O | O OO O O OO O O OO O OO O OO OO O OO O | 40000 ++------------------------------------------------------------------+ vmstat.system.cs 150000 ++------*----------------------------------------------------------+ | *.** **.**.*.* **.*.** * **.**.* * **.*.**.**.*. .**.* 140000 ++ : : : : : : : : : ** | 130000 ++ : : : : :: : : : : : | | : : : : :: : :: : : | 120000 ++: :: :: : : :: : : | 110000 ++: :: : : : : : : | | : : * : * *: | 100000 *+* * * * | 90000 ++ | | | 80000 ++ O | 70000 ++ | O OO OO O OO O O OO OO O OO OO O OO OO | 60000 ++-----------------------------------------------------------------+ [*] bisect-good sample [O] bisect-bad sample Disclaimer: Results have been estimated based on internal Intel analysis and are provided for informational purposes only. Any difference in system hardware or software design or configuration may affect actual performance. Thanks, Xiaolong