perf.data转换为文本或csv

我正在使用“ perf record”命令在1毫秒内对硬件计数器进行采样。它为我提供了一个“ perf.data”作为输出文件,但是我不知道有什么工具/命令可以帮助我将“ perf.data”二进制文件中的计数器数据读取为文本或CSV文件。或者简单地说,我需要每隔1毫秒从“ perf.data”文件中读取硬件计数器事件数据。

更多详细信息:

  1. 我已经使用“ perf stat”命令在10ms处获取硬件计数器事件数据,但是它不允许以小于10ms的采样间隔进行采样。因此,我使用“性能记录”而不是性能统计来进行1ms采样。一些有用的链接使我诱使我使用性能记录: Perf Stat vs Perf Record,并 每1毫秒从PMU收集一个partiulcar进程的数据

  2. 我也尝试过“性能脚本”,但它仅提供对某些硬件事件的支持。例如:perf脚本不支持缓存事件。链接:无法使用linux perf采样硬件缓存事件

有人可以帮我吗?请假设我知道如何使用perf record命令,并且已经有perf.data文件(从perf record生成)


泛舟湖上清波郎朗
浏览 770回答 1
1回答

素胚勾勒不出你

您应该perf record -e <event-name> ...每隔1毫秒对事件进行一次采样。看来您正在尝试读取perf.data文件并将其组织为人类可读的数据。perf report如果您不知道,则应使用。该perf report命令读取perf.data文件并生成简明的执行配置文件。以下链接应为您提供帮助-性能报告样本分析您可以根据需要修改perf report输出。您也可以使用perf report -Fcsv格式指定多个列。但是,此外,perf stat它确实具有一种使用perf stat -x命令以csv格式收集信息的机制。编辑#1:(我正在使用Linux-Kernel 4.14.3进行评估。)由于您希望获取每个样本的事件数,因此需要注意以下几点。要计算每个样本的事件数,您需要知道采样周期。采样周期为您提供事件数量,在此事件之后性能计数器将溢出,内核将记录一个采样。因此,就您而言,sampling period = number of events per sample现在有两种指定此采样周期的方法。您可以指定它,也可以不指定它。如果在执行时perf record,则指定采样周期..类似这样的东西:-perf record -e <some_event_name> -c 1000 ...此处-c 1000表示采样周期为1000。在这种情况下,由于采样周期是由您确定的,因此您有意强制系统记录每个采样1000个事件。另一方面,如果您未指定采样周期,则系统将尝试以默认的1000个样本/秒的频率记录事件。这意味着,如果需要,系统将自动更改采样周期,以保持1000个样本/秒的频率。在这种情况下,要确定采样周期,您需要观察perf.data文件。具体来说,您需要perf.data使用以下命令打开文件:perf script -D输出将非常像这样:0 0 0x108 [0x38]: PERF_RECORD_FORK(1:1):(0:0)0x140 [0x30]: event: 3.. ... raw event: size 48 bytes.&nbsp; 0000:&nbsp; 03 00 00 00 00 00 30 00 01 00 00 00 01 00 00 00&nbsp; ......0..........&nbsp; 0010:&nbsp; 73 79 73 74 65 6d 64 00 00 00 00 00 00 00 00 00&nbsp; systemd..........&nbsp; 0020:&nbsp; 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00&nbsp; ................0 0 0x140 [0x30]: PERF_RECORD_COMM: systemd:1/10x170 [0x38]: event: 7.. ... raw event: size 56 bytes.&nbsp; 0000:&nbsp; 07 00 00 00 00 00 38 00 02 00 00 00 00 00 00 00&nbsp; ......8..........&nbsp; 0010:&nbsp; 02 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00&nbsp; .................&nbsp; 0020:&nbsp; 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00&nbsp; .................&nbsp; 0030:&nbsp; 00 00 00 00 00 00 00 00&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ........&nbsp;你可以看到这样不同类型的记录PERF_RECORD_FORK和PERF_RECORD_COMM甚至PERF_RECORD_MMAP。您需要特别注意文件中以PERF_RECORD_SAMPLE开头的记录。像这样:14 173826354106096 0x10d40 [0x28]: PERF_RECORD_SAMPLE(IP, 0x1): 28179/28179: 0xffffffffa500d3b5 period: 3000 addr: 0&nbsp;... thread: perf:28179&nbsp;...... dso: [kernel.kallsyms]&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; perf 28179 [014] 173826.354106: cache-misses:&nbsp; ffffffffa500d3b5 [unknown] ([kernel.kallsyms])如您所见,在这种情况下,周期为3000,即在上一次采样事件与该采样事件之间收集的事件数为3000。(即,每个采样的事件数为3000)请注意,正如我在上文中提到的,调优。因此,您需要从文件中收集所有PERF_RECORD_SAMPLE记录perf.data。
打开App,查看更多内容
随时随地看视频慕课网APP