JitterBuffer详解

发布时间:2023-05-18

JitterBuffer介绍

JitterBuffer是一个软件缓冲区,通常用于接收音频或视频数据流时,帮助网络平滑传输并保持数据质量。由于网络的波动和不可预测性,接收到的数据可能会出现间隔、延迟和丢失等情况。JitterBuffer可以在网络不稳定时暂时缓存一定数量的数据,并在接收到足够多的数据后进行播放,从而提供一个更稳定的媒体流,保证了数据的连续性和稳定性。 在VoIP和视频会议等应用场景中,JitterBuffer可以根据当前网络状态和数据包丢失情况进行动态调整,在一定程度上避免了使用固定缓冲区导致的延迟过大或者播放卡顿的情况。由于JitterBuffer需要对网络传输的数据进行处理和分析,因此实现JitterBuffer需要一定的编程技能。

JitterBuffer的工作原理

当音频或视频数据进入JitterBuffer时,JitterBuffer首先会对数据进行时间戳排序。在此基础上,JitterBuffer还需要维护时间戳和数据包序列号之间的映射关系,以便在接收到足够多的数据时合并数据包进行播放。如果JitetrBuffer接收到的数据包丢失了,它需要通过重传、错过或者替代策略来解决这些缺失的数据。 如果JitterBuffer的缓冲区已满,并且继续接收到新的数据,那么JitterBuffer将会丢弃最早的数据包,以便腾出空间来存储新的数据包。为了避免JitterBuffer由于过长的缓冲时间而导致的音频或视频一个阶段不能真正表现其准确性,缓冲区的长度应该根据应用程序的要求进行适当调整。

JitterBuffer的实现

我们可以使用一些流行的媒体服务器,如Asterisk、Kamai IO、Softswitch等,来实现JitterBuffer。以下是一个使用JitterBuffer的示例程序,用于从UDP套接字接收音频数据,将其保存在JitterBuffer中,并在JitterBuffer缓冲区中有足够数量的数据时进行音频播放:

#include <cstdlib> 
#include <cstring>
#include <cstdio>
#include <ctime>
#include <fcntl.h>
#include <sys/socket.h>
#include <sys/uio.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <pthread.h>
#include <sdl/sdl.h>
#define BUFSIZE 512 // 每个数据包的大小
#define max(a,b) ((a) > (b) ? (a) : (b))
typedef struct {
    struct sockaddr_in server_addr; // 服务器地址数据结构
    int sock_fd; // udp套接字fd
} udp_client;
const char *ip = "127.0.0.1"; // ip地址
int port = 1901; // 端口号
typedef struct {
    char databuf[BUFSIZE];
    int len;
} AACData;
int main(int argc, char *argv[]) {
    udp_client udp;
    memset(&udp, 0, sizeof udp);
    if ((udp.sock_fd = socket(AF_INET, SOCK_DGRAM, 0)) < 0) {
        perror("socket error");
        return -1;
    }
    memset(&udp.server_addr, 0, sizeof udp.server_addr);
    udp.server_addr.sin_family = AF_INET;
    udp.server_addr.sin_port = htons(port);
    inet_pton(AF_INET, ip, &udp.server_addr.sin_addr);
    if (bind(udp.sock_fd, (struct sockaddr *)&udp.server_addr, sizeof udp.server_addr)) {
        perror("bind error");
        return -1;
    }
    // 创建SDL音频设备
    SDL_AudioSpec spec;
    spec.freq = 44100;
    spec.channels = 1;
    spec.samples = BUFSIZE / 2;
    spec.format = AUDIO_S16;
    spec.callback = NULL;
    if (SDL_OpenAudio(&spec, NULL) < 0) {
        perror("SDL_OpenAudio");
        exit(-1);
    }
    // 创建并初始化JitterBuffer
    QVector<AACData> buffer;
    int maximum = 0, minimum = 0;
    SDL_PauseAudio(0);
    // 接收音频数据并缓存至JitterBuffer
    while (UDP_Recv(udp.sock_fd, buffer) > 0) {
        AACData pcm = buffer.front();
        buffer.pop_front(); // 添加pcm至JitterBuffer
        if (!pcm.len) {
            break;
        }
        if (!buffer.empty() && pcm.len < BUFSIZE) {
            while (!buffer.empty() && pcm.len < BUFSIZE) {
                AACData tmp = buffer.front();
                buffer.pop_front();
                memcpy(pcm.databuf+pcm.len, tmp.databuf, tmp.len);
                pcm.len += tmp.len;
            }
        }
        buffer.push_front(pcm);
        while ((int)buffer.size() > 50) {
            buffer.pop_back();
        }
        // 每次往JitterBuffer中添加数据,都需要根据JitterBuffer中已有数据的长度,实时调整缓冲时间
        maximum = max(maximum, (int)buffer.size()-1);
        minimum = min(minimum, (int)buffer.size()-1);
        if (maximum - minimum > 10) {
            sleep(1);
        }
    }
    SDL_Delay(2000);
    SDL_CloseAudio();
    close(udp.sock_fd);
    return 0;
}
int UDP_Recv(int fd, QVector<AACData> &buffer) {
    uint8_t data[BUFSIZE];
    int len;
    while ((len = recv(fd, data, BUFSIZE, 0)) > 0) {
        AACData pcm;
        pcm.len = len;
        memcpy(pcm.databuf, data, len);
        buffer.push_back(pcm);
        if (len < BUFSIZE) {
            buffer.push_back(AACData());
        }
    }
    return len;
}

小结

JitterBuffer是VoIP和视频会议等应用场景中常用的技术,它可以缓存一定数量的音视频数据,并在网络不稳定或者出现数据包丢失时进行动态调整,以保证数据的连续性和稳定性。理解并熟练掌握JitterBuffer的工作原理和实现方式可以为我们今后的工作提供一定的帮助。