音频采样的原理以及怎么避免采样过程中的混叠

📅 2026/6/29 17:49:31
音频采样的原理以及怎么避免采样过程中的混叠
音频采样的原理以及怎么避免采样过程中的混叠简单来说采样本质上就是把连续变化的声音变成计算机能处理的一串数字。我们平时听到的声音在现实世界里是连续变化的空气振动但电脑、手机、声卡并不认识“连续变化”这件事它们只能在一个个离散时刻上“看一眼”记下那一刻的数值。这就像你在给一辆高速经过的车拍照如果拍得很少信息就不完整如果拍得足够密运动轨迹就能大致还原出来音频采样也是一样的道理。采样 按固定时间间隔对连续信号做测量并记录。比如常见的44.1kHz意思就是1 秒钟取样 44100 次。48kHz则是 1 秒钟取样 48000 次。采样率高就意味着**单位时间里“看得更密”。但是采样不是无限高越好而是“够用就行”。**因为只要采样率足够高高到可以覆盖原始信号里你关心的频率范围原始波形就可以被很好地重建出来。根据奈奎斯特采样定律如果一个信号的最高频率是f那采样率至少要大于2f。这也是为什么音频里会出现像44.1kHz、48kHz这样的数字因为人耳正常能听到的大致上限在20kHz左右所以44.1kHz足够覆盖音乐播放48kHz也足够覆盖大多数录音、视频、广播场景也就是说常见音频系统的采样率设计是围绕“人耳能听到什么”来的。另外这其中还有一个很重要的问题采样率太低会出现混叠。原本一个变化很快的高频信号如果你取样取得太稀疏最后记录下来的点可能会“伪装成”另一个更低频、更慢的波形。这就像你看电影里车轮高速转动时有时会觉得车轮像在倒转一样不是它真的倒转了而是你看到的“采样结果”骗了你。音频里也是同样的道理原始信号频率很高采样率不够系统误判成另一个错误频率最终出现失真。因此工程上通常会在采样前先做低通滤波也叫抗混叠滤波在正式采样之前先把那些“超过系统处理能力的过高频率成分”滤掉避免它们在采样后误识别成错误的低频信息。