打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
​线上科普栏 | 何谓“泛音”?
userphoto

2023.03.04 广东

关注

何谓“泛音”?

欢迎阅读上海市南洋模范中学线上科普栏。

科技部敬上。

 前言——你所认识的声音

     众所周知,声音以波的形式在介质中传递。

     频率高的声音音调就高,振幅大的声音听上去比较响,不同的发声物体能够产生不同的音色。

     音调可以用频率衡量,振幅也易于理解,但是音色的差别就有些模糊。人们对音色的直观感受都是什么明亮一点什么沉闷一点,而缺乏一套量化的标准。

     为了理解音色的产生到底是因为什么,我们需要从声音本身开始重新理解一切。

Part 1 频谱——熟悉又陌生的波

     这是一段正弦波。

    我们都知道做简谐运动的物体其x-t图像即为正弦函数的图像,因此可以说正弦波是最基础的一种波。

   我们赋予它一个频率,让其f=440Hz,它听起来是这样的。

     在听感上,你也会发现正弦波是非常单调的,没有任何佐料。

     也许你会捕捉到一些其它频段的杂音,但那多半是人耳的缺陷或者是播放设备的问题。

      那么既然我们都很熟悉正弦波了,这里就不多赘述了。这里有另一个音频。

      有没有听出区别?

     你可能会说比刚才听上去更亮了,或者是音调变高了,又或者是变轻了变响了,每个人直观的感受可能都会有些区别。

     但是这些都不重要,重要的是这个音频文件到底是什么。

    正确答案是——振幅相同的f=440Hz和f=880Hz的叠加。

     具体为什么会选这些数值,之后会更详细地说明,这里你只需要理解有一个频率更高的音叠加到了之前的音频中,就得到了现在的音频。

(上述音频的波形图)

     很明显它还是个周期函数,但是一个周期内的函数图像远没有正弦波易于理解。

     实际上这个函数的解析式很容易计算即        f(x)=sinx+sin2x=2sin(3x/2)cos(x/2)

让我们画一下它的图像。

     太好了,你认识了这个由两个不同频率的波叠加出来的波的图像。但是假如多叠加几个...

     这种多个周期不同的正弦波叠加出来的函数,其解析式就没有那么易于计算,因此无法从函数图像的角度理解这一波形。

      那么该如何理解呢?我们不妨把这个过程反过来。

     这时候我们就该请出我们的傅里叶了。也许你听过这个名字,也许你没听过,但这都不要紧,因为我们不是来讲傅里叶的生平事迹的。

(让·巴普蒂斯·约瑟夫·傅里叶)

     傅里叶著名的(线性积分)变换——傅里叶变换,正是能将这种来路不明的波拆开来,拆成一个个正弦波的利器,极大地方便了我们查询其成分。傅里叶变换的公式是这样的:

(傅里叶变换)

     其中f(x)是波形,ξ是正弦波的频率。其推导虽然并不复杂,但需要用高中知识之外的内容,所以具体怎么得出的就不要深究了。

    通过傅里叶变换,我们可以得出上面不明觉厉的波形图其实是由振幅相同的f=440,f=554.37,f=659.26这几个波叠起来的。

     所以为什么它的波形图如此混乱,说到底为什么我们要看三个正弦波叠出来的奇形怪状的波?

     就像上面的音频,直观的听感是三个频率的音合在一起,而肯定不会在听的时候脑中浮现那个迷之波形。

      所以,是时候变换一下思路了。

     归功于傅里叶变换,我们可以对音频进行拆分,得到许多正弦波的组合。所以自然而然就会想到,只记录这些正弦波的组合不也能反向表示这个音频吗?就算会丢失相位之类的信息,这么记也比波形图要好太多了吧。

     于是人们开始使用“频谱”描述音频。

(上述音频的频谱)

     不考虑相位,正弦波的特征除了频率还有振幅,因此在频谱中纵轴表示f,A由颜色的深浅表示,或在一些三维频谱中用频谱的高度表示。

     当然毕竟频率的可能是无穷多的,因此受限于算力和时间采样点的精确度,并不能对所有频率都尝试进行傅里叶变换,也就是说频谱也是有精度的,取样越精细频谱就越准确,计算耗时也越久。

     那么频谱的概念暂时就讲到这里,接下来先铺垫一些基础乐理。

Part 2 音名——有力的记录工具

     相信同学们不说小学,初中应该都上过音乐课。

     让我们在这里放一个钢琴。

     首先一个循环(也就是从标了C的键开始数七个白键和五个黑键合在一起)被称作一个八度,等下会用到这个概念。

     然后先不管上面灰色的C2C3,先来回忆一下几年前理应学过的东西。

     对于音高的记录,有很多种方式。

(简谱和唱名对音高的标记)

     基本上就是这样,不知道同学们尘封的记忆有没有恢复。

     我们这里要介绍的是一个叫做音名的东西,它和上面两种都一样,是属于一种记音高的方式。

(音名)

     至于为什么是从C开始而不从A开始,这都是记录的习惯,没什么特别的意义。

     那么问题就是,上面的黑键是什么,实际上可以理解为在夹在两个白键之间的音。

      一般使用升降记号(升#、降b)来表示。

      黑键的记法大概是这样,一个黑键至少可以用这两种方法记。

     可能有人会问,为什么没有E#这种音?

      其实也是有的,E#其实就是F。那么为什么会有这种神奇的关系呢?

      重点就在于,白键之间所谓“音高差”并非完全相同,两个白键之间如果有黑键,那就称它们差了一个“全音”,如果没有黑键则称差了一个“半音”。

     更奇妙的是两个半音就是一个全音。

     那么只要稍微发散思维联想一下,不难发现其实一个八度内的十二个键之间都相差一个半音,也就是全部这十二个键一起才能算是“等间距”的。

     除此之外在字母后面加个数字表示它在第几个八度里面,也就是原来图上的C2C3C4什么的。

      接下来要引入频率了。国际标准音高规定A4=440Hz,这是全世界统一的。

     是不是有点熟悉?刚开始用的音频样例就是这个频率。

     那么再想到第二个音频样例中是由440Hz和880Hz组成的,在听感上非常相似。一般的叠加是不会有这种相似的感觉的。

(合起来不突兀仅仅是因为正弦波很单调,相性比较好,只需关注听感是否相似)

(关于正弦波相性为何较好,看完本次科普栏便可理解)

     这种相似其实是同一个音名在两个八度内产生的效果,其实也就是880Hz对应的音是A5,以此类推可以得到A6=1760Hz,A7=3520Hz等等。

      应用一下十二个音相差都是半音的概念,不难得出差一个半音频率即为2^(1/12)倍,这一定义即“十二平均律”。

  比如A#4的频率就是440*2^(1/12)=466.16Hz。

      让我们再次回顾第三个音频样例,554.37Hz对应的是440Hz*2^(4/12),即C#5,659.26Hz对应的是440Hz*2^(7/12),即E5,所以它其实就是一个以A为根音的大三和弦。

     为了更精细地描述音高,我们引入了“音分”的概念。一个半音被拆分为了100音分,即每差一音分频率为2^(1/1200)倍,先前的1145.14Hz约为D6低44音分,即D6-44,基本上是在Db6和D6中间了。

     对于音名的介绍就到这里,接下来回到正题,讲一下什么是泛音。

Part 3 泛音——深入理解音色

  先来个例子,看一下钢琴的音色。

     首先这个音是A4,也就是它的频率应该是440Hz。但是非常明显能看到除了f=440Hz,在更高的地方还存在很多的音。它们的颜色比较浅,也就是说响度比440Hz的波要小。

    并且稍作观察就会发现,如果设a=440Hz,那么上面很多的音的频率大约是2a、3a...

     要说明为什么是这样,就需要画一张图。

      假设横着的是一根弦,两侧的端点不动,中间的黄线代表其上的波。所以能够穿过两个端点的波会比较容易出现在这跟弦上。

     于是就会有这样子的一张图。上面的波频率分别为黄线的两倍、三倍和四倍,这些波都比较容易出现在这根弦上。

     类推可得任何黄线整数倍频率的波都容易出现在这根弦上。

     实际上,黄线就是能够被兼容的波中频率最低的一个,在大多数情况下就是物体的固有频率,而其它频率较高的波,由于会与黄线产生叠加,一般振幅较低。

    我们将黄线所代表的声音称为“基音”,其频率为“基频”,其它波称为“泛音”。

     回到上面的频谱,440Hz即为该音的基频,再上面的880Hz、1320Hz等即为该音的泛音。

     以A4为例,看看泛音列能给我们哪些音:

A4 A5 E6+2 A6 C#7-14 E7+2 G7-31 A7 B7+4 C#8-14 ...

     可以看到泛音列中还是以A为主,也有很多熟悉的音程关系。

    那么现在各位应该能大约猜到音色究竟是由什么决定的了。如果没有也没关系,这里再给出一张钢琴与吉他频谱的对比图。

     这张图中应该就能很明显地看出来,虽然泛音列的乘数是一样的,但是每个泛音的振幅都是有区别的。

     所以决定音色的是泛音列每个基频乘数上泛音的振幅(发声瞬间产生的敲击音有时也被认为是音色的一部分)。

     值得一提的是,有些音色的泛音列乘数并非2,3,4...而是3,5,7...,这两种乘数都是较为常见的,不太常见的可能会有更混乱的泛音列。

     这是乘数3,5,7...的波示例。

    乘数3,5,7...的一个比较常见的例子就是三角波

     不仅仅是乐器,人声的泛音规律也遵从乘数2,3,4...的泛音列,分辨不同人的说话声音也是通过泛音振幅的区别(一般由声带结构和共鸣腔决定,除此之外还包括送气大小、发声习惯等因素)。

    而在一些乐器的演奏中会提到“泛音”,这里的泛音通常是指由一定演奏技巧使乐器的高频泛音更强更持久的过程,与决定音色的泛音并非同一事物,不过其内核都是一样的。

Part 4 音律——泛音挑明的不和谐音

     我们刚才解释了十二平均律的音程关系,后一个音的频率是前一个音的2^(1/12)倍。

    然而在泛音列里的频率乘数是整数,那些不能表示成2^n乘数的泛音对应音高总会相对于平均律偏移若干音分。将这个过程反过来,例如纯五度即7个半音的音程,频率为1.4983倍,十分接近1.5却存在一小点的偏差,便会导致十二平均律下的纯五度实际上并没有那么“纯”。

     于是逆向思维,通过有理数倍频率定义音程,即将纯五度的频率关系定为1.5,再通过八度频率增倍或减半的方法定义十二个音的频率,即所谓“五度相生律”。

     但五度相生律的定义并非完美无瑕,若对音向两侧各做六次纯五度再回归同一八度,理论上会回到同一个音,而实际频率乘数分别为729/512=1.424和1024/729=1.405,也会导致很强烈的不和谐。

     另一种不仅使用1.5定义纯五度,还使用了1.25定义大三度(4个半音),用这两个音程得出各个音的频率,是谓“纯律”。

     与五度相生律类似,纯律由于全半音音程倍数的不统一,也没有得到广泛使用。

     事实上,历史上最先出现的是五度相生律,随后是纯律、十二平均律。平均律使用十二个音很大部分的原因便是五度相生律总体大致符合一个八度内十二个音(1.5^12=129.75≈2^7)。与之类似的关系要在第五十三个五度才会再次出现(1.5^53=2.152*10^9≈2^31),显然音程量化到这个精度是不现实的。

     有关于音律历史的部分并不在本次讲解范围内,感兴趣可自行搜索。

Part 5 后记——你能做的事

     音乐中有一个概念叫“扒(bā)谱”,指把乐曲转写成乐谱的过程。

     利用频谱和泛音等概念和工具,你就可以在对乐理一无所知(或者说是知道一点但不多)的情况下完成扒谱,有机会的话或许会在之后专门讲解如何借助频谱扒谱。

     除此之外,了解泛音与否其实并不能对同学们的生活产生什么影响。

     或许在你敲金属杯子的时候,你可以更专注地分辨谁的金属杯子高频泛音最强,这都是后话了。

      本次线上科普栏就到这里。


微南苑

供稿,供图:科技部

编辑:媒体部 张俊炜

“不一样的我们,一样的梦想!” 

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
一些声音小常识
印度音乐与西方音乐
音乐基本乐理知识归纳
泛音的形成
人声的混缩处理(上)【转载】
教你调出最美的人声
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服