您的位置:

深入剖析calltrace

一、calltrace介绍

Calltrace是Linux内核中实现函数调用跟踪的一种方法。作为Linux内核调试的一项重要工具之一,其主要功能是自动记录Linux内核中每个函数调用路径,便于初步定位内核崩溃和性能问题等。

实现原理:当函数A调用函数B时,内核会自动将函数A的地址和函数B的地址记录在一个缓冲区中,并将缓冲区的指针(虚拟地址)存储在一个特殊寄存器中。当函数B返回时,这个缓冲区的指针就会被取出,记录当前函数调用路径的数据就会被写入trace内核日志文件中。

二、调用流程探究

调用流程可以分为三个主要部分:trace日志输出驱动、trace日志记录与写入、trace日志分析工具。

1、trace日志输出驱动

trace日志输出驱动是负责将trace日志输出到用户空间的核心代码,该代码位于drivers/trace目录下。在启用CONFIG_TRACEPOINTS和CONFIG_EVENT_TRACING支持的情况下,内核将会编译该模块,并在内核启动时自动加载。

void trace_printk_init(struct trace_array *tr)
{
    tr->trace_printk = __trace_printk;
}

void trace_printk(void *ignore, const char *fmt, ...)
{
    struct trace_array *tr = get_trace_kern(current);
    va_list args;

    if (!tr || !tr->trace_printk)
        return;

    va_start(args, fmt);
    vprintk(fmt, args);
    va_end(args);
}

2、trace日志记录与写入

当trace日志输出驱动输出trace日志到用户空间后,trace日志记录与写入模块将负责将trace日志记录到缓冲区并将缓冲区中的数据写入trace内核日志文件中。该模块位于kernel/trace目录下。

static inline
void trace_call_function_enqueue(struct trace_array *tr,
                 unsigned long ip, int depth, int idx)
{
    struct trace_event_call_template *call;
    unsigned long flags;
    unsigned long long parent, current, local_ts;

    parent = local_irq_save(flags);
    current = tr->trace_buffer.buffer->data[tr->trace_buffer.buffer->data_size - 1];

    if (depth >= CALLCHAIN_MAX_DEPTH || current == TRACE_SYSTEM_EVENT)
        goto out;

    local_ts = tr->timestamp_fn(tr);
    call = trace_event_buffer_reserve(&tr->trace_buffer, sizeof(*call), 0, local_ts);

    if (!call)
        goto out;

    call->parent_ip = current;
    call->ip = ip;
    call->depth = depth;
    call->call_idx = idx;
    trace_event_buffer_commit(&tr->trace_buffer);
out:
    local_irq_restore(flags);
}

3、trace日志分析工具

最后一部分是trace日志分析工具,在Linux中提供了多种分析trace日志的工具,包括trace-cmd、perf、ftrace等。其中,trace-cmd是一个比较实用的工具,包含了trace日志收集、解析和分析等功能,可以较方便地定位系统问题。

三、calltrace使用技巧

1、配置内核选项

首先需要在内核编译配置中选择CONFIG_TRACEPOINTS和CONFIG_EVENT_TRACING选项,以及选择具体的tracepoints模块。

CONFIG_TRACEPOINTS=y
CONFIG_EVENT_TRACING=y
# Select a tracepoints module
# CONFIG_FTRACE_SYSCALLS is not set
# CONFIG_FTRACE_MCOUNT_RECORD is not set
CONFIG_FTRACE_LATENCY_TRACKING=y
CONFIG_HAVE_DYNAMIC_FTRACE=y
CONFIG_DYNAMIC_FTRACE=y

2、开启calltrace

可以通过sysfs接口来开启或关闭calltrace。将tracer设置为function_graph,即可开启calltrace。

echo function_graph > /sys/kernel/debug/tracing/current_tracer

3、查看calltrace日志

使用trace-cmd工具可以查看calltrace日志。下面是一个简单的例子:

# 启动trace-cmd
trace-cmd start
# 运行测试程序
./test_program
# 结束跟踪
trace-cmd stop
# 查看trace日志
trace-cmd report

四、总结

通过对calltrace的介绍和调用流程探究,我们可以了解到calltrace的重要性和使用方法。在Linux内核调试和性能优化中,这是一个不可缺少的工具。同时,我们也需要注意合理使用calltrace以及其他trace日志工具,以保证系统性能。