您的位置:

PCM文件详解

一、PCM文件格式

1、PCM文件指的是一种无损音频文件格式,是由音频采样数值序列直接表示波形的一种编码方式。

2、PCM文件有多种采样格式,包括带符号/无符号的8位、16位、24位和32位等。

3、PCM文件采样率也有多种选择,常见的包括44.1kHz和48kHz等。

4、每个采样点的大小根据采样格式而定,例如8位PCM每个采样点大小为1字节,16位PCM每个采样点大小为2字节。

二、PCM文件读取

1、使用C++语言读取PCM文件可以借助标准库中的文件流,例如:

std::ifstream pcmFile("audio.pcm", std::ios::binary | std::ios::in);
if (pcmFile.is_open()) {
    char* buffer = new char[pcmFileSize];
    pcmFile.read(buffer, pcmFileSize);
    pcmFile.close();
}

2、读取的PCM数据可以直接交给音频处理器进行处理或保存为WAV文件等其他格式。

三、PCM文件处理

1、PCM文件的处理包括音频剪辑、降噪、增益调整等多种功能,以下是对其中一种功能的实现:

2、音频增量调整的实现可以通过简单的乘法运算来实现,例如将音频增益调整为原来的2倍:

for (int i = 0; i < pcmDataSize; i += 2) {
    int16_t pcmData = buffer[i] | buffer[i + 1] << 8;
    pcmData *= 2;
    buffer[i] = pcmData & 0xff;
    buffer[i + 1] = (pcmData >> 8) & 0xff;
}

3、以上代码中,每个采样点通过位运算和数据类型转换得到16位有符号整数,再进行乘法运算调整增益,最后再将结果转换回字节流储存。

四、PCM文件播放

1、使用C++语言进行PCM数据的播放可以借助第三方库,例如OpenAL和SDL等。

2、以下是使用SDL库播放PCM数据的示例代码:

SDL_AudioSpec spec;
spec.freq = 44100;
spec.format = AUDIO_S16SYS;
spec.channels = 2;
spec.samples = 1024;
spec.callback = pcmPlayerCallback;
spec.userdata = buffer;
if (SDL_OpenAudio(&spec, NULL) < 0) {
    // error handling
}
SDL_PauseAudio(0);

3、以上代码中,设置了音频参数,并在回调函数pcmPlayerCallback中将PCM数据写入音频流。

五、PCM文件转换

1、PCM文件可以转换为其他音频格式,例如WAV、MP3等,常见的方法是使用FFmpeg等第三方库。

2、以下是使用FFmpeg库将PCM文件转换为WAV格式的示例代码:

AVFormatContext* fmt_ctx = NULL;
AVCodecContext* enc_ctx = NULL;
AVCodec* codec = NULL;
AVPacket pkt = { 0 };
AVFrame* frame = NULL;
int ret = 0;

// initialize demuxer and output format
ret = avformat_open_input(&fmt_ctx, pcmFileName.c_str(), NULL, NULL);
// error handling
ret = avformat_find_stream_info(fmt_ctx, NULL);
// error handling
AVOutputFormat* output_format = av_guess_format("wav", NULL, NULL);
AVFormatContext* out_fmt_ctx = NULL;
ret = avformat_alloc_output_context2(&out_fmt_ctx, output_format, NULL, NULL);
// error handling

// initialize encoder
codec = avcodec_find_encoder_by_name("pcm_s16le");
enc_ctx = avcodec_alloc_context3(codec);
// set encoder parameters
enc_ctx->bit_rate = 1411200;
enc_ctx->sample_rate = 44100;
enc_ctx->sample_fmt = AV_SAMPLE_FMT_S16;
enc_ctx->channels = 2;

// add audio stream to output format
AVStream* audio_stream = avformat_new_stream(out_fmt_ctx, NULL);
// error handling
audio_stream->id = out_fmt_ctx->nb_streams - 1;
audio_stream->time_base = { 1, enc_ctx->sample_rate };
// copy encoder parameters to output stream
avcodec_parameters_from_context(audio_stream->codecpar, enc_ctx);

// initialize encoder
ret = avcodec_open2(enc_ctx, codec, NULL);
// error handling
frame = av_frame_alloc();
// error handling
frame->format = enc_ctx->sample_fmt;
frame->nb_samples = enc_ctx->frame_size;
frame->channels = enc_ctx->channels;
ret = av_frame_get_buffer(frame, 0);
// error handling

// initialize muxer
avio_open(&out_fmt_ctx->pb, wavFileName.c_str(), AVIO_FLAG_WRITE);
// error handling
ret = avformat_write_header(out_fmt_ctx, NULL);
// error handling

// read PCM data and encode to output format
while (av_read_frame(fmt_ctx, &pkt) == 0) {
    AVPacket out_pkt = { 0 };
    ret = avcodec_send_packet(enc_ctx, &pkt);
    // error handling
    while (ret >= 0) {
        ret = avcodec_receive_frame(enc_ctx, frame);
        if (ret == AVERROR_EOF || ret == AVERROR(EAGAIN)) {
            break;
        }
        // error handling
        ret = avcodec_send_frame(enc_ctx, frame);
        // error handling
        while (ret >= 0) {
            ret = avcodec_receive_packet(enc_ctx, &out_pkt);
            if (ret == AVERROR_EOF || ret == AVERROR(EAGAIN)) {
                break;
            }
            // error handling
            av_packet_rescale_ts(&out_pkt, enc_ctx->time_base, audio_stream->time_base);
            out_pkt.stream_index = audio_stream->index;
            av_interleaved_write_frame(out_fmt_ctx, &out_pkt);
            av_packet_unref(&out_pkt);
        }
    }
    av_packet_unref(&pkt);
}

// write trailer
av_write_trailer(out_fmt_ctx);

// free resources
av_frame_free(&frame);
avcodec_free_context(&enc_ctx);
avformat_close_input(&fmt_ctx);
avio_close(out_fmt_ctx->pb);
avformat_free_context(out_fmt_ctx);

3、以上代码中,使用FFmpeg库进行音频编码和封装,其中使用PCM_S16LE编码格式进行编码,最终将PCM文件转换成WAV格式。