噪声抑制
噪声抑制是语音处理中非常古老的话题,它主要的思想是在保证我们感兴趣的语音部分尽可能不被扭曲的前提下,将混合信号中的噪声尽可能消除。
今天我们主要介绍下AI降噪比较,AI降噪目前效果比较好的就属RNNoise算法模型了,我在实际应用过程中,对比过webrtc的降噪算法,在某些背景噪音比较大的情况下,webrtc的降噪算法效果就不是很好了,但是RNNnoise降噪效果还是比较不错的。
RNNoise
主要包括训练部分和降噪部分,它会先从语音和噪音语料里提取特征数据,再用这些数据训练,得到一个能把语音信号和噪声信号区分开来的模型,然后用得到的模型对输入的音频信号进行处理,在很多情况下都能得到良好的降噪效果。
RNNoise缺点:
虽然AI降噪比较牛,在某些情况下也降噪效果比普通降噪算法要好,但是缺点也比较明显,就是在噪音比较大的时候,有时会有损伤正常的音频,会有吞字的现象,这个就需要对算法进行针对性优化了。
以下是官网的代码,可做参考,亲测效果还可以,目前可以支持8k、16k、48k采样率的pcm数据。
int main(int argc, char **argv) { int i; int first = 1; float x[FRAME_SIZE]; FILE *f1, *fout; DenoiseState *st; st = rnnoise_create(NULL); if (argc!=3) { fprintf(stderr, "usage: %s \n", argv[0]); return 1; } f1 = fopen(argv[1], "rb"); fout = fopen(argv[2], "wb"); while (1) { short tmp[FRAME_SIZE]; fread(tmp, sizeof(short), FRAME_SIZE, f1); if (feof(f1)) break; for (i=0;i