Pull perf/core improvements and fixes from Arnaldo Carvalho de Melo:
User visible changes:
 - Do event name substring search as last resort in 'perf list'.
   (Arnaldo Carvalho de Melo)
   E.g.:
    # perf list clock
    List of pre-defined events (to be used in -e):
     cpu-clock                                          [Software event]
     task-clock                                         [Software event]
     uncore_cbox_0/clockticks/                          [Kernel PMU event]
     uncore_cbox_1/clockticks/                          [Kernel PMU event]
     kvm:kvm_pvclock_update                             [Tracepoint event]
     kvm:kvm_update_master_clock                        [Tracepoint event]
     power:clock_disable                                [Tracepoint event]
     power:clock_enable                                 [Tracepoint event]
     power:clock_set_rate                               [Tracepoint event]
     syscalls:sys_enter_clock_adjtime                   [Tracepoint event]
     syscalls:sys_enter_clock_getres                    [Tracepoint event]
     syscalls:sys_enter_clock_gettime                   [Tracepoint event]
     syscalls:sys_enter_clock_nanosleep                 [Tracepoint event]
     syscalls:sys_enter_clock_settime                   [Tracepoint event]
     syscalls:sys_exit_clock_adjtime                    [Tracepoint event]
     syscalls:sys_exit_clock_getres                     [Tracepoint event]
     syscalls:sys_exit_clock_gettime                    [Tracepoint event]
     syscalls:sys_exit_clock_nanosleep                  [Tracepoint event]
     syscalls:sys_exit_clock_settime                    [Tracepoint event]
 - Reduce min 'perf stat --interval-print/-I' to 10ms. (Kan Liang)
   perf stat --interval in action:
   # perf stat -e cycles -I 50 -a usleep $((200 * 1000))
   print interval < 100ms. The overhead percentage could be high in some cases. Please proceed with caution.
   #   time                    counts unit events
      0.
050233636         48,240,396      cycles
      0.
100557098         35,492,594      cycles
      0.
150804687         39,295,112      cycles
      0.
201032269         33,101,961      cycles
      0.
201980732            786,379      cycles
  #
 - Allow for max_stack greater than PERF_MAX_STACK_DEPTH, as when
   synthesizing callchains from Intel PT data. (Adrian Hunter)
 - Allow probing on kmodules without DWARF. (Masami Hiramatsu)
 - Fix a segfault when processing a perf.data file with callchains using
   "perf report --call-graph none". (Namhyung Kim)
 - Fix unresolved COMMs in 'perf top' when -s comm is used. (Namhyung Kim)
 - Register idle thread in 'perf top'. (Namhyung Kim)
 - Change 'record.samples' type to unsigned long long, fixing output of
   number of samples in 32-bit architectures. (Yang Shi)
Signed-off-by: Arnaldo Carvalho de Melo <acme@redhat.com>
Signed-off-by: Ingo Molnar <mingo@kernel.org>