Pull perf/core improvements and fixes from Arnaldo:
User visible:
  * Add several futex 'perf bench' microbenchmarks (Davidlohr Bueso)
  * Speed up thread map generation (Don Zickus)
  * Fix synthesizing mmaps for threads (Don Zickus)
  * Fix invalid output on event group stdio report  (Namhyung Kim)
  * Introduce 'perf kvm --list-cmds' command line option for use by
    scripts (Ramkumar Ramachandra)
Documentation:
  * Clarify load-latency information in the 'perf mem' docs (Andi Kleen)
  * Clarify x86 register naming in 'perf probe' docs (Andi Kleen)
Refactorings:
  * hists browser refactorings to reuse code accross UIs (Namhyung Kim)
Signed-off-by: Arnaldo Carvalho de Melo <acme@redhat.com>
Signed-off-by: Ingo Molnar <mingo@kernel.org>